




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
功能概念 系统原理 系统的使用 概念解释 1 ElastichSearch ES 以及组成 第一章概念解释 1 1 第一章概念解释 1 2 第一章概念解释 1 3 第一章概念解释 1 4 1N 第一章概念解释 1 5 分片 primary shards 复制分片 primary shards 索引文件 sgment 复制分片 primary shards 实时分析 Es可以根据业务要求 发挥分布式的优点 尽最大性能实时分析 解析出业务需要的数据文档 分布集群 实时存储 Elastic某个主结点保存数据时候 只有当复制分片保存成功 才能认为是实时保存成功 并可以并发支持批量数据保存 文档以分片的形式 保存在不同的机器上 快速搜索 Elastic并发从N台机器中的复制节点或主节点取出数据 通过查询负载机来进行组合数据 最终响应请求 10亿的数据 可以最快1 2秒内搜索出结果 根据业务需求及当前的搜索量 Elastic可以横向扩展 支持最大PB级的分布数据 可以提高索引的搜索速度 第一章概念解释 1 6 第一章概念解释 1 6 系统原理 2 ElastichSearch ES 查询为什么能实时 第二章系统原理 2 1 集群中有很多结点 结点与结点之间可以进行配置 比如 Node1主结点 非数据结点 协调创建索引 查询请求 Node2非主结点 数据结点 Node3非主结点 非数据 负载均衡 组装返回的数据给客户端 第二章系统原理 2 2 搜索 一当一个客户端请求查询某条数据时 通常用如下几个步骤完成搜索 1 客户端给NODE1发请求 查询名字叫张三的数据 2 P1节点接收到请求 判断出当前数据 ID对应的分片0 且分片P1中的数据对应的复制分片R0 R1f都有 会将请求转发到R0处理 3 取出文档数据返回给P1 最终返回给客户端 注意 这里的请求 其实会并发查询所有复制分片中的名字叫张三的数据 所以这里会非常快的返回数据 第二章系统原理 2 3 更新 一当一个客户端请求更新某条数据时 通常用如下几个步骤完成更新 1 客户端给Node1发送更新请求 2 它转发请求到主分片所在节点Node3 3 Node3从主分片检索出文档 修改 source字段的JSON 然后在主分片上重建索引 如果有其他进程修改了文档 它以retry on conflict设置的次数重复步骤3 都未成功则放弃 4 如果Node3成功更新文档 它同时转发文档的新版本到Node1和Node2上的复制节点以重建索引 当所有复制节点报告成功 Node3返回成功给请求节点 然后返回给客户端 第二章系统原理 2 4 创建 一当一个客户端请求创建或更新某条数据时 通常用如下几个步骤完成创建 删除索引 1 客户端给P1发送创建 删除请求 2 根据文档ID 将它转发请求到主分片所在节点Node3 3 Node3在主分片上执行请求 如果成功 它将会转发请求到NODE1和NODE2的复制分片上 当所有复制分片成功 则NODE3返回成功信息给请求结点 在将信息返回给客户端 第二章系统原理 倒排索引2 5 倒排索引 Elasticsearch使用一种叫做倒排索引 invertedindex 的结构来做快速的全文搜索 倒排索引由在文档中出现的唯一的单词列表 以及对于每个单词在文档中的位置组成 例如 金服集团大数据中心应用开发部 会被拆成很中文分词在索引表中 第二章系统原理 倒排索引2 6 当我们查询 金服大数据 这一个中文分词时 只需要知道他在哪个文档即可 两个文档都匹配 但是DOC2比其它的有更多的匹配项 相关度评分为 2 如果我们加入简单的相似度算法 similarityAndlgorithm 计算匹配单词的数目 这样我们就可以说DOC2这个文档比其它的匹配度更高 这对于我们的查询结果具有更多相关性 也可按照此排序 安装部署 3 ElastichSearch ES 如何在部署在Linux上 第三章安装部署 3 1安装 第三章安装部署 3 1安装 下载与解压 https artifacts elastic co downloads elasticsearch elasticsearch 5 1 1 tar gztar zxvfelasticsearch 5 1 1 tar gz 注意不要使用root解压 root是无法启动es的 目前采用5 0 1版本进行演示 JDK版本JDK1 8环境虚拟机ubuntu15 01 第三章安装部署 3 2安装演示 第三章安装部署 3 2 功能展示Demo 4 ElastichSearch ES 查询 搜索 第四章功能展示 4 1 插件说明 5 ElastichSearch ES 插件如何使用 第五章插件说明 5 1 IK分词是国内著名的IK中文分词 在elasticsearch中 当有字段是text或是string时 elasticsearch会其进行倒排索引 会进行数据分词 比如 中华人民共和国 会分成 中华 人民 共和国 等 当数据进行查询 人民 时 会进行倒排索引 从而完成对中文的分词操作 第五章插件说明 Head 第五章插件说明 Head 第五章插件说明 Kopf 第五章插件说明 Kopf 第五章插件说明 Kopf 第五章插件说明 5 2 Es hadoop插件elasticsearch hadoop是一个深度集成Hadoop和ElasticSearch的项目 也是ES官方来维护的一个子项目 通过实现H
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- CAR-T细胞应用-洞察及研究
- 简易船舶租赁合同5篇
- 重庆八中宏帆初级中学校2025年统编版六年级下册小升初考试语文试卷(无答案)
- 山东省济宁市第七中学2024-2025学年六年级上学期第二次学情检测生物试题(含答案)
- 吉林省名校调研2024-2025学年八年级下学期历史期中测试题(无答案)
- 石墨烯瓷砖导电实验-洞察及研究
- 医疗物联网应用研究-洞察及研究
- 避孕套培训课件
- 车险业务员知识课件
- 基于分子印迹技术的2-巯基噻唑靶向递送体系构建难点突破
- 标准件供货协议合同范本
- 2025广东茂名信宜市总工会招聘社会化工会工作者4人笔试备考试题及答案解析
- 纳税申报流程课件
- 2025年在线少儿英语培训行业当前发展趋势与投资机遇洞察报告
- 石油管道保护施工方案
- 2025新疆维吾尔自治区人民检察院招聘聘用制书记员(14人)笔试参考题库附答案解析
- 循环水泵设备安装方案详细指导
- 华中数控车床课件
- 行政会议接待分工方案(3篇)
- 《水力学》课件-第4章 水动力学基础(二)
- 智慧零碳园区综合解决方案
评论
0/150
提交评论