搜索引擎检索性能评价实验报告.doc_第1页
搜索引擎检索性能评价实验报告.doc_第2页
搜索引擎检索性能评价实验报告.doc_第3页
搜索引擎检索性能评价实验报告.doc_第4页
搜索引擎检索性能评价实验报告.doc_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉大学信息管理学院实验报告计算机网络实验报告实验名称:检索性能评价姓名:xxx学号:xxxx专业:信息管理与信息系统班级:xxx指导教师:实验成绩:批阅教师签字:一、 实验目的通过绘制P-R图、11点插值图和计算MAP比较百度和谷歌的检索性能,加强对单个查询检索性能评价方法的应用能力,进一步巩固和理解课堂中所学的信息检索性能评价方法。二、 实验内容与实验步骤(一) 实验内容 以百度、谷歌为例,在两个搜索引擎中输入同一个Query,并设定该Query的相关文档总数为24篇。查看前20条返回的记过的相关性,对检索性能进行评价,并绘制P-R图、11点插值图,分别计算百度和谷歌的MAP。(二) 实验步骤1. 复习信息检索评价方法原理及P-R图、11点插值图绘制方法,学习并掌握使用Excel绘制图表方法;2. 在百度、谷歌中分别输入相同的检索词,统计 前20个结果hit情况并计算对应的precision、recall值及11点对应的precision值;3. 绘制P-R图、11点插值图,计算MAP;4. 评价并比较谷歌和百度的检索性能。三、实验环境1.操作系统:windows 72.软件:Excel2007四、实验过程与分析1.在百度和谷歌中输入检索词:信息检索评价P-R图,得到检索结果部分如下图1所示:图1 谷歌(左)和百度(右)部分检索结果截图2.用Excel分别统计百度和谷歌前20个结果的hits、presicion、recall、和11点对应的值。如图所示:3.绘制百度、谷歌P-R图并比较。百度、谷歌P-R图从上图可以看出,相同的recall,当recall0.125时,谷歌的precision高于百度的precision。这个图中,百度和谷歌P-R的差距很明显,可以初步判定当query为“信息检索评价P-R图”时,谷歌的检索性能优于百度。5. 绘制百度、谷歌的11点插值图并比较检索性能。百度、谷歌11点插值图从插值图,可以看出,在插值点为0和0.1时,百度和谷歌的precision相同,其余的插值点,谷歌的precision明显高于百度的precision,可以看出当query为“信息检索评价P-R图”,谷歌的检索性能优于百度。6. 分别计算百度和谷歌的MAP。(1) 百度MAP=(1+1+1+4/7+5/8+2/3+7/10+8/17+9/20)/20=(2) 谷歌MAP=(1+1+1+4/5+5/6+6/7+7/8+8/9+9/11+5/6+11/15+3/5)/20=五、实验结果总结与思考 通过本次实验,深入理解和掌握了信息检索性能评价单个查询的评价指标precision、recall的计算方法以及P-R图、插值图的绘制方法,并通过比较P-R曲线和插值图来比较谷歌和百度的单个查询的检索性能,完成了实验内容,达到了实验目的。 在实验中,也发现了P-R曲线评价单个查询的检索性能存在一些缺点。一方面,对于像搜索引擎这样有着大规模文档的数据库,每个查询词的相关文档数难以确定,检索结果是否与查询词相关也难以确定,不同的人有不同的看法,所以难以准确计算召回率和正确率。另一方面,因为系统的数据集合是动态的,一个查询词的P-R不能反映搜索引擎的检索性能,P-R只能反映某一时间系统针对某一个查询词的检索性能。另外,了解到目前针对大规模语料集合召回率难以计算问题解决的的方法是缓冲池(Pooling)方法:对多个检索系统的Top N个结果组成的集合进行标注,标注出的相关文档集合作为整个相关文档集合。实验中也发现,虽然准确率和召回率没有明显的相关关系,但是两者难以两全其美,检索系统应该从用户的角度考虑更加注重正确率还是召回率,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论