【免费下载】Elasticsearch大数据搜索引擎 PDF

  • 内容
  • 评论
  • 相关

免密码下载连接:https://pan.baidu.com/s/1Pz8Q-YMe6-w8Tg8wJKx6nA

 

目录

1章使用Elasticsearch1
1.1
基本概念1
1.2
安装2
1.3
搜索集群5
1.4
创建索引6
1.5
使用Java客户端接口9
1.5.1
创建索引11
1.5.2
增加、删除与修改数据14
1.5.3
分析器16
1.5.4
数据导入17
1.5.5
通过摄取快速导入数据17
1.5.6
索引库结构17
1.5.7
查询18
1.5.8
区间查询22
1.5.9
排序23
1.5.10
分布式搜索23
1.5.11
过滤器24
1.5.12
高亮显示24
1.5.13
分页25
1.5.14
通过聚合实现分组查询26
1.5.15
文本列的聚合27
1.5.16
遍历数据28
1.5.17
索引文档29
1.5.18Percolate29
1.6RESTClient30
1.6.1
使用摄取31
1.6.2
代码实现摄取33
1.7
使用Jest33
1.8Python
客户端37
1.9Scala
客户端40
1.10PHP
客户端43
1.11SQL
支持44
1.12
本章小结48
2章开发插件49
2.1
搜索中文49
2.1.1
中文分词原理49
2.1.2
中文分词插件原理51
2.1.3
开发中文分词插件53
2.1.4
中文AnalyzerProvider55
2.1.5
字词混合索引57
2.2
搜索英文60
2.2.1
句子切分60
2.2.2
标注词性62
2.3
使用测试套件64
2.4
本章小结68
3章管理搜索集群69
3.1
节点类型69
3.2
管理集群69
3.3
写入权限控制70
3.4
使用X—Pack71
3.5
快照72
3.6Zen
发现机制73
3.7
联合搜索74
3.8
缓存74
3.9
本章小结75
4章源码分析76
4.1Lucene
源码分析76
4.1.1Ivy
管理依赖项76
4.1.2
源码结构介绍76
4.2Gradle77
4.3Guice77
4.4Joda—Time79
4.5Transport80
4.6
线程池80
4.7
模块80
4.8Netty81
4.9
分布式81
4.10
本章小结82
5章搜索相关性83
5.1BM25
检索模型83
5.1.1
使用BM25检索模型86
5.1.2
参数调优86
5.2
学习评分86
5.2.1
基本原理87
5.2.2
准备数据87
5.2.3Elasticsearch
学习排名89
5.3
本章小结91
6章搜索引擎用户界面92
6.1JSP
实现搜索界面92
6.1.1
用于显示搜索结果的自定义标签93
6.1.2
使用Listlib98
6.1.3
实现翻页100
6.2
使用Spring实现的搜索界面102
6.2.1
实现REST搜索界面102
6.2.2RESTAPI
中的HTTPPUT104
6.2.3Spring—data—elasticsearch106
6.2.4SpringHATEOAS112
6.3
实现搜索接口113
6.3.1
编码识别113
6.3.2
布尔搜索116
6.3.3
搜索结果排序116
6.4
实现相似文档搜索117
6.5
实现AJAX搜索联想词119
6.5.1
估计查询词的文档频率119
6.5.2
搜索联想词总体结构119
6.5.3
服务器端处理120
6.5.4
浏览器端处理125
6.5.5
拼音提示127
6.5.6
部署总结127
6.5.7Suggester128
6.6
推荐搜索词129
6.6.1
挖掘相关搜索词130
6.6.2
使用多线程计算相关搜索词132
6.7
查询意图理解133
6.7.1
拼音搜索133
6.7.2
无结果处理133
6.8
集成其他功能134
6.8.1
拼写检查134
6.8.2
分类统计135
6.8.3
相关搜索141
6.8.4
再次查找144
6.8.5
搜索日志144
6.9
查询分析146
6.9.1
历史搜索词记录146
6.9.2
日志信息过滤147
6.9.3
信息统计148
6.9.4
挖掘日志信息150
6.9.5
查询词意图分析150
6.10
部署网站150
6.10.1
部署到Web服务器151
6.10.2
防止攻击152
6.11
本章小结156
7 OCR文字识别157
7.1Tesseract157
7.2
使用TensorFlow识别文字161
7.3OpenCV164
7.3.1
预处理166
7.3.2
文字区域提取169
7.3.3
纠正偏斜171
7.3.4Linux
环境支持172
7.4JavaCV172
7.5
本章小结174
8
问答式搜索176
8.1
生成表示语义的代码176
8.2
信息整合181
8.2.1
实体对齐181
8.2.2
编辑距离181
8.2.3Jaro—Winkler
距离187
8.2.4
比较器189
8.2.5Cleaner189
8.2.6
运行过程190
8.2.7
遗传算法调整参数192
8.3
自动问答193
8.3.1
问句处理器193
8.3.2
自动发现答案198
8.4
本章小结199
9 Elastic系统监控201
9.1Logstash201
9.1.1
使用Logstash201
9.1.2
插件203
9.1.3
数据库输入插件206
9.2Filebeat207
9.3
消息过期208
9.4Kibana208
9.5Flume209
9.6Kafka210
9.7Graylog211
9.8
物联网数据215
9.9
本章小结216