版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
相关反馈技术在数字图书馆信息检索中的应用研究经典的信息检索理论认为,信息需求决定信息检索的效率。网络环境下,信息需求的提出及表达都是由用户决定的,因而可以说,用户表达是检索效率关键性因素。实践中,以下两个原因会影响检索效率。用户检索需求的不确定性。一般认为,用户的检索需求总是处于不确定的状态,在检索过程中会由于检索结果发生变化或进行修正。用户构造检索表达式的模糊性。在信息系统中精确的构造用户查询是非常困难的,因为绝大多数检索系统的标引和检索过程是不透明的,用户很可能不熟悉检索语言或检索式的表达,另外,用户需求与查询表达的对应转换也可能存在不一致的地方,所以,准确无误的构造反映用户真正需求的检索式并不是一件很容易的事情。在信息检索中,为改善用户的检索效率,往往采取各种调节方法和反馈途径对检索策略进行修改、扩展和完善。查询扩展就是为了满足信息需求来修正检索表达式的一系列技术。相关反馈就是其中备受关注的一种自动扩展查询方法。相关反馈技术概述1相关反馈的研究历史相关反馈技术的主要思想是:检索系统在初始查询到一组样本文档的基础上,根据用户在样本文档中的相关性选择,构造出改进的查询表达式,据此再次进行检索。这种通过调整检索策略来增强对相关文献的响应抑制非相关文献的查询扩展技术就是相关反馈。20世纪60年代初,Maron和Kubns指出与原始查询相近的特征可加到查询中以检出更多的相关文献。1971年Rocchio在基于SMART系统的向量空间模型中进行相关反馈实验,显示出在比较小的测试集中检索性能有显著改进。此后,相关反馈得到了广泛的重视,被扩展到了概率模型以及布尔模型中。最近几届的TREC实验也反映出应用相关反馈技术能给检索性能带来极大的改进。目前,在知识检索、Web智能检索、图像检索中,相关反馈是一种被普遍采用的改进检索效率的方法。2相关反馈的处理过程用户向信息检索系统提交代表着其信息需求的查询表达式,系统进行初始的查询,返回的检索结果集根据文献与查询的相关性排列,然后,用户进行相关判断,指出其哪些文献是有用的。系统基于前一次查询检索到的文献的相关判断,进行相关反馈,自动重新构建查询表达式,目前主要采用的方法有两种,即检索词加权,提高在相关文献中出现的检索词的权值,降低在非相关文献中出现的检索词的权值;查询扩展:将相关文献中新的有用的检索词用于扩展查询。在形成新查询表达式时,可以同时使用检索词加权和检索词选择这两种方法,也可以任选其一。新的“反馈查询请求”再与文献集进行匹配,从其中检索出更多的相关文献和更少的不相关文献。该过程可以循环进行,直到用户最终获得较为精确的查询,并据此得到较为满意的检索结果。带相关反馈机制的信息系统3相关反馈的核心技术从相关反馈的处理过程可以看出,检索词加权和查询扩展中的新检索词的选择是相关反馈中的核心技术。检索词重新加权是根据查询结果文档中的相关文档和无关文档的分布,重新计算查询和文档的特征权重,在相关文档中的查询特征在后来的检索中相应的增加权重,在无关文档中的特征相应减少权重。查询扩展中新检索词的选择依赖于用户的相关性判断,在原始查询的基础上,构造一个新的查询。MakotoIwrdyana通过试验证明用户相关反馈的数量在10~30之间最为合适。数字图书馆环境下的相关反馈技术1数字图书馆环境对检索提出的要求数字图书馆不仅仅是馆藏资源的数字化,而是一个海量的信息应用系统,是网络社会人们学习,工作和生活的重要平台。它使信息检索的方式发生了根本的变化,主要表现在以下几方面。检索操作的实时性:由于用户要直接参与检索并即时得到检索结果,因而对信息获取的实时性要求很高。检索服务的个性化针对不同的用户,要设计出适应不同需求、友好的、交互式的多种用户界面,提供一些实用的用户小工具。检索效率的精确性:通过对数字资源的整合,数字图书馆提供给用户海量的信息,信息资源的充分比以往任何时代都表现得突出。这种信息应用环境下,用户对信息检索的准确性要求大大加强了。2相关反馈在数字图书馆环境下的应用意义数据库技术,网络技术及知识管理的方法给数字图书馆的发展带来了全新的发展契机,取得了很大的成效,但纵观数字图书馆发展的现状,仍存在不少问题,研究的当务之急不在于如何建立一个数字图书馆,而在于如何满足数字图书馆对检索提出的新需求,从而使用户轻松地从数字图书馆中获得所需的资源,实现真正的资源共享。因此,以用户为中心,研究用户的需求,提供用户真正需要的信息是当前研究者关注的重点和热点。现阶段的用户研究内容多侧重于用户行为,特点、偏好等理论内容,相关反馈技术则从解决用户与计算机的”隔阂”入手,将用户行为、特点。偏好对信息需求的影响从理论研究转化为检索技术应用。这一全新变革在手工环境和联机很难得到应用。只有在交互式的实时检索机制中才能实现。而在交互式的用户环境中,高效的检索性能必定依赖于正确的用户反馈。3相关反馈在数字图书馆的应用现状相关反馈作为一种日益成熟的检索技术,已逐步应用在大型数据库系统,并走入数字图书馆。但从目前现状看,相关反馈技术还没有在数字图书馆系统中得到广泛应用。这主要有两方面的原因。系统设计人员对交互式的实时检索中用户参与对检索准确性的认识不够。传统的检索系统提供的是以信息资源为中心的服务模式,在数字图书馆环境下沿用这一服务模式无疑是不适用的。因而,很多数字图书馆系统的检索子系统中没有相应的相关反馈功能。用户对相关反馈的重要性认识不够,认识不到单靠用户构造的检索式往往得不到最优的检索性能。因此,即使有的数字图书馆系统本身带有相关反馈功能,但用户应用相关反馈对自己构造的检索式进行再修正的意识却不够强。建议与思考综上所述,针对相关反馈技术在数字图书馆环境中应用的现状,提出以下构思。1在数字图书馆检索系统中引入用户相关反馈模块未来的数字图书馆信息服务模式应该是一种“用户中心”服务模式。它生存于一个聚合化数字信息空间环境里,基于并全程跟踪用户信息活动,强调服务者与用户主体双方的主观能动性,克服了基于信息资源的服务模式中将信息系统与用户信息利用过程相对隔绝的局限的问题。在数字图书馆检索系统中引入相关反馈技术将有利于促进用户在信息利用过程中对数字信息对象的灵活处理,知识提炼和协作交流,从而更直接,深入、有效地支持用户自助检索、处理,利用信息来解决现实问题的全过程,最终达到用户满意,从而增进用户利益超越用户期望。2搭建相关反馈界面与检索结果的友好结口用户接口的智能化、友好化是未来信息系统的发展趋势。因而,良好的用户接口将是数字图书馆提供给用户信息服务的重要保证。智能化用户接口就应帮助用户摆脱繁杂的对操作方法的记忆,高效地利用数字图书馆中的各类信息,使用户在发生信息行为时不会因使用方法、方便程度的不适而影响功能使用。应而一个接口不友好的用户界面,无论其检索功能如何强大,其系统性能也会大打折扣。同样,如果用户相关反馈界面不友好,再加上用户对这一检索扩展的功能不熟悉不了解,即使引入了相关反馈功能也是形同虚设。3加强用户培训传统图书馆的用户培训大都很侧重信息资源的利用,在数字环境下用户对图书馆数字信息资源的检索和利用已经变成了现实。数字信息资源形式的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026山东大众报业(集团)有限公司公开招聘笔试参考题库及答案解析
- 2026年中国铁路投资集团有限公司应届高校毕业生招聘25名考试备考题库及答案解析
- 2026万里运业股份有限公司招聘16人考试备考题库及答案解析
- 2026四川广安市农业农村局遴选3人考试备考题库及答案解析
- 2026年广西柳州市壶西实验中学初三中考信息卷(一)英语试题含解析
- 温州市达标名校2026届初三年级三月考英语试题含解析
- 2025-2026学年重庆市十八中学初三下学期第一次半月考语文试题含解析
- 2026届湖北省麻城思源实验校初三下学期校内第一次质量检测试题英语试题含解析
- 人力资源管理招聘与配置流程模板
- 湖北省随州市随县2026年初三语文试题中考模拟试题含解析
- 2026年青海省海南藏族自治州单招职业适应性测试题库附参考答案详解(模拟题)
- 广告制作公司奖惩制度
- 2026春牛津译林版英语八年级下册Unit+8+Reading+(同步课件)
- 第一单元(单元测试 基础夯实)-高二语文人教统编版选择性必修下册
- 2025山西中煤一局集团有限公司应届高校毕业生招聘20人笔试历年典型考点题库附带答案详解2套试卷
- 2026年安克创新行测笔试题库
- 违反无菌技术操作
- AI养鱼:智慧渔业新模式
- 2025年《三级公共营养师》考试练习题库及答案
- 煤矿调度专项培训课件
- 2026年时事政治测试题库100道含完整答案(考点梳理)
评论
0/150
提交评论