




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、ElasticSearch与Solr搜索引擎特性对比1、关键特性对比对比项Solr 5.xElasticSearch 2.x开发人员开发人员少,官方提供功能比ElasticSearch多开发人员多,官方功能少,但是第三方插件很丰富,扩展能力更强建立索引和查询效率建立索引的速度和ElasticSearch差不多,当索引完全建立好了之后搜索会很快,但是一边建立索引一边搜索就会非常慢。经过详细对比测试后发现,Solr在建索引时的查询性能非常之差,因为Solr在建索引时会产生io的阻塞,造成搜索性能的下降。建立索引的速度和Solr差不多,第一次搜索速度比Solr慢一些,但之后会缓存结果,第二次搜索就会
2、很快。另外ElasticSearch边建立索引边搜索速度没有太大变化,因为它是先把索引的内容保存到内存之中,当内存不够时再把索引持久化到硬盘中,同时它还有一个队列,是在系统空闲时自动把索引写到硬盘中。Sharding没有自动shard rebalancing的功能shard 必须一次设置好,之后不能修改,如果要修改则需要重新建立索引Schema模式需要 Schema (但是4.3版本之后有schemaless模式)无需Schema,创建索引更加灵活高级查询没有Query DSL有Query DSL,能够支持更加高级和复杂的查询语法,而且还可以以此扩展实现类SQL语法的查询实时性传统搜索应用实时
3、搜索应用(这个是ElasticSearch作者说的)可扩展性不支持插件开发模式支持插件开发模式,提供丰富的开源插件库社区社区活跃社区活跃并有大数据公司支持Hadoop集成 支持支持,v2.3.0提供Graph图结构数据存储存储Solr暂不支持ElasticSearch支持多盘存储2、基于ElasticSearch数据交叉模型功能测试2.1、环境情况1.测试环境(市局环境)IP43/slave77/slave35CPU16* Intel(R) Xeon(R) CPU E5-2650 v2 2.60GHzMEM64G(ElasticSearch独享16G)OS
4、CentOS release 6.5 (Final)2.测试数据数据来源省厅数据:VW_SHARE_ST_JJ_KKXX(交警_卡口信息)时间范围2015100120160331数据量kettle清洗,数据量为11.1亿测试数据查询地址43:8200/_plugin/head/ 3.测试地址url41:18099/swagger-ui.html2.2、测试结果场景一:一个车牌交叉满足N个条件序号交叉条件个数测试用例预期结果实际结果3次测试耗时(s)备注13datestart: 2016-01-05T08:40:59, location
5、: 犍为县, dateend: 2016-01-05T08:53:59, querystr: 犍为外滩, datestart: 2016-02-03 09:48:00, location: 乐山市, dateend: 2016-02-03 19:48:00, querystr: 月卡口, datestart: 2016-01-07 19:47:18, location: 南充市, dateend: 2016-01-07 19:57:18, querystr: 绿心路 川LFC550 3 川LFC550 3 10在之前的测试时,曾出现结果为川LFC550 2的情况,经定位是对“犍为县”的分词不完
6、善,修改代码后,结果正确2223datestart: 2016-01-15T07:08:00, location: 成华区, dateend: 2016-01-15T07:18:22, querystr: 双桥子, datestart: 2016-01-05T06:39:44, location: 锦江区, dateend: 2016-01-05T06:41:44, querystr: 老成仁路口, datestart: 2016-01-25T20:40:46, location: 武侯区, dateend: 2016-01-25T20:44:46, querystr: 科华北路 川AW7D1
7、6 3 川AW7D16 3 1在之前测试中,曾出现结果为川AW7D16 0 的情况,经定位,是分词不够完善,修改代码后,结果正确1133datestart: 2016-02-06T17:48:41, location: 四川省, dateend: 2016-02-06T17:49:41, querystr: 海棠路, datestart: 2016-02-04T10:36:43, location: 富顺县, dateend: 2016-02-04T10:36:44, querystr: 钟秀街东段, datestart: 2016-02-04T13:10:50, location: 富顺县,
8、 dateend: 2016-02-04T13:10:53, querystr: 吉安庄路 贵JL7321 3 贵JL7321 3112144datestart: 2016-02-16T15:06:57, location: 泸定县, dateend: 2016-02-16T15:06:57, querystr: 石油路, datestart: 2015-12-09T16:10:58, location: 新龙县, dateend: 2015-12-09T16:10:58, querystr: 卡口抓拍机, datestart: 2016-01-07T10:46:17, location: 泸
9、定县, dateend: 2016-01-07T10:46:17, querystr: 船头, datestart: 2016-02-16T18:10:20, location: 雅安市, dateend: 2016-02-16T18:10:20, querystr: 名山红星 川AE15F8 4 川AE15F8 425352datestart: 2015-11-05T13:39:46, location: 内江市, dateend: 2015-11-05T13:39:46, querystr: 兰桂, datestart: 2015-11-21T11:24:24, location: 内江市
10、, dateend: 2015-11-21T11:24:24, querystr: 牌楼路 川K0103学 2 川K0103学 2119165datestart: 2015-12-01T15:06:39, location: 广安市华蓥市, dateend: 2015-12-01T15:06:39, querystr: 古桥职中, datestart: 2015-09-30T15:13:34, location: 广安市, dateend: 2015-09-30T15:16:34, querystr: 会展街, datestart: 2016-02-12T12:15:10, location:
11、 广安市, dateend: 2016-02-12T12:15:10, querystr: 高速, datestart: 2016-02-10T08:11:49, location: 广安市, dateend: 2016-02-10T08:11:59, querystr: 前华段出城, datestart: 2016-02-05T12:36:06, location: 广安市, dateend: 2016-02-05T12:39:06, querystr: 马石梯 渝B18D02 5 渝B18D02 5 46376datestart: 2016-01-01T22:06:37, location
12、: 青羊区, dateend: 2016-01-01T22:06:37, querystr: 苏坡立交, datestart: 2016-01-22T21:17:18, location: 武侯区, dateend: 2016-01-22T21:17:18, querystr: 人民南路三段, datestart: 2016-02-14T00:01:26, location: 金牛区, dateend: 2016-02-14T00:01:26, querystr: 营门口, datestart: 2016-02-08T11:47:08, location: 成华区, dateend: 2016
13、-02-08T11:47:08, querystr: 桃溪路, datestart: 2015-11-02T15:00:22, location: 锦江区, dateend: 2015-11-02T15:00:22, querystr: 琉璃, datestart: 2015-10-13T09:34:12, location: 武侯区, dateend: 2015-10-13T09:34:12, querystr: 双楠路内侧 川ATS958 6 川ATS958 6 206186datestart: 2016-01-01T22:06:37, location: 市青羊, dateend: 20
14、16-01-01T22:06:37, querystr: 苏坡立交, datestart: 2016-01-22T21:17:18, location: 武侯区, dateend: 2016-01-22T21:17:18, querystr: 人民南路三段, datestart: 2016-02-14T00:01:26, location: 金牛区, dateend: 2016-02-14T00:01:26, querystr: 营门口, datestart: 2016-02-08T11:47:08, location: 成华区, dateend: 2016-02-08T11:47:08, q
15、uerystr: 桃溪路, datestart: 2015-11-02T15:00:22, location: 锦江区, dateend: 2015-11-02T15:00:22, querystr: 琉璃, datestart: 2015-10-13T09:34:12, location: 武侯区, dateend: 2015-10-13T09:34:12, querystr: 双楠路内侧 川ATS958 5川ATS958 532291datestart: 2016-01-05T08:40:59, location: 犍为县, dateend: 2016-01-05T08:53:59, qu
16、erystr: 犍为外滩 川LFC550 1 川LFC550 1 121场景二:关注时间和地点,多个车牌满足其中1N个条件序号交叉条件个数测试用例预期结果实际结果3次测试耗时(s)备注13datestart: 2016-02-07T16:44:10, location: 广安市, dateend: 2016-02-07T16:44:20, querystr: 人民南路, datestart: 2016-02-10T11:08:08, location: 广安市, dateend: 2016-02-10T11:09:09, querystr: 民族小学, datestart: 2016-01-1
17、4T19:53:10, location: 武胜县, dateend: 2016-01-14T19:53:12, querystr: 58KM 粤YQJ221 2川XW6238 2 粤YQJ221 2川XW6238 1 84924datestart: 2016-01-01T00:00:00, location: 德阳市, dateend: 2016-01-04T00:00:00, querystr: 西山, datestart: 2016-02-22T08:10:55, location: 德阳市, dateend: 2016-02-22T08:10:55, querystr: 108国道,
18、datestart: 2015-11-16T06:17:58, location: 罗江县, dateend: 2015-11-16T06:17:58, querystr: 学校, datestart: 2016-01-03T16:53:16, location: 绵阳市, dateend: 2016-01-03T16:53:16, querystr: 东路 川FAH567 2川FL1930 2川A9EB55 2 川FAH567 2川FL1930 2川A9EB55 23163、ElasticSearch与Solr的压力测试对比3.1、测试环境1.集群环境此次用于测试Solr的集群包括4个节点:
19、0(master),13(slave1slave3)。用于测试ElasticSearch的集群包括4个节点:0(datanode,不可选举为masternode),13(datanode、可选举为masternode)。测试集群信息:IP03CPU8* Intel(R) Xeon(R) CPU E5-2609 0 2.40GHzMemSolr:4G, ElasticSearch:4G(sys32G)OSCentOS re
20、lease 6.5测试客户机(临时使用slave3):IP3CPU8* Intel(R) Xeon(R) CPU E5-2609 0 2.40GHzMemSolr4G ElasticSearch4G(sys32G)OSCentOS release 6.52.数据环境Solr中单索引库中索引条数为5000W,ElasticSearch中单索引库中索引条数为1亿。3.2、测试工具工具名称http_load输入参数说明http_load -p 5 -f 1000 train_hc.txt-parallel简写-p:并发的用户进程数-fetches简写-f:总计的访问次数-rat
21、e简写-r:每秒的访问频率-seconds简写-s:总计的访问时间输出参数说明1000 fetches, 5 max parallel, 1.13104e+06 bytes, in 4.50961 seconds运行的请求数、最大的并发进程数、总计传输的数据、运行的时间1131.04 mean bytes/connection平均每个请求连接传输的数据量221.748 fetches/sec, 250807 bytes/sec每秒响应请求数、每秒传输数据量msecs/connect: 0.485064 mean, 1.337 max, 0.384 min连接平均响应时间、最大响应时间、最小响应
22、时间msecs/first-response: 21.7613 mean, 436.541 max, 13.468 min连接平均返回时间321 bad byte countsHTTP response codes:请求响应码返回个数code 200 - 10003.3、测试结果注:每组测试均重复进行三次。场景一:模糊数字查询查询条件:q:31997统计测试结果如下:并发数总访问次数搜索引擎平均每秒响应请求数(fetches/s)总消耗时间(s)连接平均响应时间(ms)连接平均返回时间(ms)平均成功次数平均失败次数1010000Solr239.66441.7250.16340.4671000
23、00ElasticSearch552.47118.1010.13017.6411000002510000Solr530.81918.8390.77744.675100000ElasticSearch677.38514.7630.12836.4281000005010000Solr664.68015.0450.20573.096100000ElasticSearch686.34014.5700.13072.28710000010010000Solr718.75113.9130.243136.493100000ElasticSearch699.83814.2890.440141.773100000
24、20010000Solr631.86915.8260.289310.823100000ElasticSearch632.78915.8034.370310.03010000050010000Solr38.925256.9081.9711848.6906479353ElasticSearch680.43214.6974.941716.01010000080010000Solr166.50360.0592.433278.3741139887ElasticSearch521.34919.18139.6641425.5809782218100010000Solr166.12360.1967.80238
25、6.7981489852ElasticSearch692.36114.44381.5321276.0009848152120010000Solr41.609240.33192.813407.1501019899ElasticSearch164.70560.715187.910841.63715528448场景二:精确中文查询查询条件:q:人民南路统计测试结果如下:并发数总访问次数搜索引擎平均每秒响应请求数(fetches/s)总消耗时间(s)连接平均响应时间(ms)连接平均返回时间(ms)平均成功次数平均失败次数1010000Solr274.66536.4080.15935.091100000
26、ElasticSearch606.13516.4980.13316.0401000002510000Solr496.52420.1400.17348.379100000ElasticSearch832.06612.0180.12229.5811000005010000Solr528.96718.9050.39291.614100000ElasticSearch822.15112.1630.13260.28210000010010000Solr499.61420.0160.313196.558100000ElasticSearch848.29911.7881.236115.98910000020
27、010000Solr463.91021.5560.358422.760100000ElasticSearch785.50912.7312.071249.89810000050010000Solr155.62664.25610.400183.3117989202ElasticSearch827.33112.0879.174576.56710000080010000Solr166.10660.2037.612343.5382209780ElasticSearch814.86012.27230.071912.044100000100010000Solr166.01860.2342.354451.48
28、92289772ElasticSearch867.41811.52946.7301026.2909859141120010000Solr165.70260.35079.148428.1622789722ElasticSearch165.51660.417185.596734.681159984013.4、总结 在本次测试中,每次测试总的访问次数为10000,从以上图表中可以看出随着并发数的增加,Solr和ElasticSearch的每秒响应请求数都是先增加,然后稳定在一定数值,在超过某个阈值之后极速下降; 从平均每秒响应请求次数来看,ElasticSearch性能指标优于Solr;在不同的并发数下,ElasticSearch的每秒响应请求数在500800之间,而Solr的每秒响应请求数在300600之间,ElasticSearch采用默认分词进行中文模糊搜索时速度非常慢,经分析更换ik中文分词后性能有明显提高; 从连接平均返回时间来看,在低并发时,ElasticSearch和Solr相差不大,但是随着并发数量的增加,ElasticSearch返回时间的增长速度大于Solr; 从不同的并发数下的成功次数来看,ElasticSearch性能指标优于Solr,Solr在并发数达到500的时候出现大面积错误;ElasticSear
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Wells 静脉血栓评分应用试卷及答案
- AB801-生命科学试剂-MCE
- 2025秋九年级上册历史上课课件 第11课 古代日本
- 2025年毛概题库及答案
- DB61T 322.5-2011 核桃坚果丰产指标
- 吉林省长春九台市师范高级中学2025年数学高三第一学期期末教学质量检测模拟试题
- 上海市重点名校2025-2026学年高三数学第一学期期末质量检测模拟试题
- 江苏省连云港市海庆中学2025-2026学年数学高三第一学期期末经典试题
- 禁毒知识培训会通知课件
- 八年级下册物理试卷及答案
- 基于人工智能的复合材料结构性能预测及分析方法研究
- 村镇建筑工匠培训课件
- 欧盟委员会人工智能白皮书
- 电气车间送电试车方案
- 神经外科常见疾病护理常规
- 急性脑梗塞护理课件
- EPP发泡聚丙烯项目可行性研究报告参考范文
- 手机短拍摄制作培训
- 《电气安全之接地保护》课件
- 2025年湖南省中考英语试卷真题(含答案解析)
- 绵阳市医学会招聘笔试真题2024
评论
0/150
提交评论