




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精选,1,功能概念、系统原理、系统的使用,精选,2,精选,3,概念解释,1,ElastichSearch(ES)以及组成,精选,4,第一章概念解释1.1,精选,5,第一章概念解释1.2,精选,6,第一章概念解释1.3,精选,7,第一章概念解释1.4,1N,精选,8,第一章概念解释1.5,分片(primary_shards),复制分片(primary_shards),索引文件(sgment),复制分片(primary_shards),精选,9,实时分析,Es可以根据业务要求,发挥分布式的优点,尽最大性能实时分析、解析出业务需要的数据文档。,分布集群,实时存储,Elastic某个主结点保存数据时候,只有当复制分片保存成功,才能认为是实时保存成功。并可以并发支持批量数据保存。文档以分片的形式,保存在不同的机器上。,快速搜索,Elastic并发从N台机器中的复制节点或主节点取出数据,通过查询负载机来进行组合数据,最终响应请求。10亿的数据,可以最快1-2秒内搜索出结果,根据业务需求及当前的搜索量,Elastic可以横向扩展,支持最大PB级的分布数据,可以提高索引的搜索速度。,第一章概念解释1.6,精选,10,第一章概念解释1.6,精选,11,系统原理,2,ElastichSearch(ES)查询为什么能实时?,精选,12,第二章系统原理2.1,集群中有很多结点,结点与结点之间可以进行配置。比如:Node1主结点,非数据结点。(协调创建索引、查询请求)Node2非主结点,数据结点。Node3非主结点,非数据(负载均衡,组装返回的数据给客户端。),精选,13,第二章系统原理2.2,搜索:一当一个客户端请求查询某条数据时,通常用如下几个步骤完成搜索。1)客户端给NODE1发请求,查询名字叫张三的数据。2)P1节点接收到请求,判断出当前数据_ID对应的分片0,且分片P1中的数据对应的复制分片R0,R1f都有,会将请求转发到R0处理。3)取出文档数据返回给P1,最终返回给客户端。,注意,这里的请求,其实会并发查询所有复制分片中的名字叫张三的数据。所以这里会非常快的返回数据。,精选,14,第二章系统原理2.3,更新:一当一个客户端请求更新某条数据时,通常用如下几个步骤完成更新。1)客户端给Node1发送更新请求。2)它转发请求到主分片所在节点Node3。3)Node3从主分片检索出文档,修改_source字段的JSON,然后在主分片上重建索引。如果有其他进程修改了文档,它以retry_on_conflict设置的次数重复步骤3,都未成功则放弃。4)如果Node3成功更新文档,它同时转发文档的新版本到Node1和Node2上的复制节点以重建索引。当所有复制节点报告成功,Node3返回成功给请求节点,然后返回给客户端。,精选,15,第二章系统原理2.4,创建:一当一个客户端请求创建或更新某条数据时,通常用如下几个步骤完成创建、删除索引。1)客户端给P1发送创建、删除请求。2)根据文档ID,将它转发请求到主分片所在节点Node3。3)Node3在主分片上执行请求,如果成功,它将会转发请求到NODE1和NODE2的复制分片上,当所有复制分片成功,则NODE3返回成功信息给请求结点。在将信息返回给客户端。,精选,16,第二章系统原理倒排索引2.5,倒排索引:Elasticsearch使用一种叫做倒排索引(invertedindex)的结构来做快速的全文搜索。倒排索引由在文档中出现的唯一的单词列表,以及对于每个单词在文档中的位置组成。例如:“金服集团大数据中心应用开发部”,会被拆成很中文分词在索引表中。,精选,17,第二章系统原理倒排索引2.6,当我们查询“金服大数据”这一个中文分词时,只需要知道他在哪个文档即可。,两个文档都匹配,但是DOC2比其它的有更多的匹配项。相关度评分为【2】,如果我们加入简单的相似度算法(similarityAndlgorithm),计算匹配单词的数目,这样我们就可以说DOC2这个文档比其它的匹配度更高,这对于我们的查询结果具有更多相关性。也可按照此排序。,精选,18,安装部署,3,ElastichSearch(ES)如何在部署在Linux上,精选,19,第三章安装部署3.1安装,精选,20,第三章安装部署3.1安装,下载与解压:https:/artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.1.1.tar.gztar-zxvfelasticsearch-5.1.1.tar.gz(注意不要使用root解压,root是无法启动es的)。目前采用5.0.1版本进行演示。JDK版本JDK1.8环境虚拟机ubuntu15.01,精选,21,第三章安装部署3.2安装演示,精选,22,第三章安装部署3.2,精选,23,功能展示Demo,4,ElastichSearch(ES)查询、搜索?,精选,24,第四章功能展示4.1,精选,25,插件说明,5,ElastichSearch(ES)插件如何使用,精选,26,第五章插件说明5.1,IK分词是国内著名的IK中文分词。在elasticsearch中,当有字段是text或是string时,elasticsearch会其进行倒排索引,会进行数据分词,比如“中华人民共和国”会分成“中华”、“人民”、“共和国”等。当数据进行查询“人民”时,会进行倒排索引,从而完成对中文的分词操作。,精选,27,第五章插件说明Head,精选,28,第五章插件说明Head,精选,29,第五章插件说明Kopf,精选,30,第五章插件说明Kopf,精选,31,第五章插件说明Kopf,精选,32,第五章插件说明5.2,Es-hadoop插件elasticsearch-hadoop是一个深度集成Hadoop和ElasticSearch的项目,也是ES官方来维护的一个子项目,通过实现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 24.3正多边形和圆课件-人教版九年级数学上册
- 2025人力资源专员招聘真题及答案
- MSH-TP15e-生命科学试剂-MCE
- Foramsulfuron-d6-1-生命科学试剂-MCE
- 工厂考试铆工试题及答案
- 2025年街道“三定”方案工作情况汇报(工作总结汇报报告)
- 2025年农村土地整治与宅基地使用权优化配置合作协议
- 2025年绿色环保写字楼车位租赁及智能管理系统合同
- 2025年度IT项目外包终止协议及知识产权归属合同
- 2025年企业财务管理系统全面升级与优化服务合同
- 《组织行为学》(MBA)课件
- 儿科常见疾病双向转诊指南
- 中国传媒大学-电视播音员主持人形象设计与造型(第2版)-课件
- 脑卒中二级预防的指南
- 中铁XXXX局城轨道交通工程劳务分包指导价2017版
- 德国申克振动筛
- 常用危险化学品储存禁忌物配存表
- 钻机电气控制系统操作手册
- 现浇剪力墙结构模板安装与拆除技术交底
- 电力服务收费项目及标准
- 最新农贸综合市场项目可行性报告
评论
0/150
提交评论