




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 上下文信息研究综述 何秀丁丰摘 要 上下文信息是指用户在检索过程中产生的一切与检索活动相关的信息的总和,该类信息具有高可靠性、针对性、完整性等特征,有利于信息检索模型准确理解用户兴趣偏好。文中阐述了上下文信息的产生、特征,以及捕获方式,并针对不同的运用对上下文信息进行分类。【关键词】下文信息 上下文检索 搜索引擎 信息检索用户的搜索行为是处在一定地上下文环境下,目前的查询系统因利用上下文信息,改善了原有搜索结果重复率高的现象,为用户提供了更具人性化、个性化的高质量服务。上下文信息对搜索引擎具有非常重要的价值,在对上下文信息研究中发现,不同的
2、上下文信息对用户检索行为产生的影响不一样,即在不同的环境下,某些上下文信息具有较高的使用价值,而某些上下文信息则可以忽略。因此,有必要分析各种上下文信息对用户查询行为的影响,有针对性地利用上下文信息资源。1 上下文信息的分类在不同的应用场景(context)下,对上下文信息的定义各具特点,lawrence认为web搜索上下文是指与用户检索意图和表达相关的一切信息。brown 将上下文定义为与用户所处的环境、当前查询时间、季节、温度等相关的信息。anind 定义:“上下文是指在特定的环境下,能够标识实体特征的相关信息,其中相关信息可以包括某人、物、时间、地点、应用系统等,只要所涉及的实体与用户的
3、交互环境相关联”。在信息检索领域,现广泛接受的是将上下文信息划分为:用户上下文、资源上下文、系统上下文等。1.1 用户上下文分为用户静态上下文和用户动态上下文,静态上下文信息包括年龄、学历、专业、工作性质、爱好、生活经验和习惯等与用户个体相联系的其它特征;用户动态上下文指检索过程中产生的所有信息总和,例如:查询词、查询发生时间、用户的ip地址、当前查询浏览所用时间、用户的反馈检查信息等信息;1.2 资源上下文web页面之间的超链接信息、页面本身的结构信息等。1.3 系统上下文查询系统本身的某些特征,例如:系统采用的搜引机制、检查模型、排序机制、检索界面的布局等。2 上下文信息的获取在信息检索中
4、,从用户参与的方式考虑,可将信息收集的方式分为显式收集、隐式收集、推理获取。2.1 显式收集显式收集(或称显式反馈)是指用户根据系统设计的表单内容,自主提交个人基本信息或参与系统的交互信息,用户静态上下文的挖掘则可以采用此方式。2.2 隐式收集隐式收集(又称隐式反馈)是指系统在不影响为用户提供检索服务的前提下,“悄无声息”地收集用户的检索信息,用户动态上下文及资源上下文则可采取该方法;该方法常用的技术有:web信息抽取、基于模板的方法、桌面代理、利用浏览器插件等。2.3 推理获取即借助数学中的统计学理论和数据挖掘的相关知识,进行归纳演绎和推断用户的某些信息。3 上下文信息的研究应用上下文信息的
5、获取、表示、组织所采用的方法直接影响着系统的搜索质量。如图3-1所示,阐述了用户检索过程产生的上下文信息在信息检索系统中的具体应用。如图3-1所示,对信息检索中常见应用进行了归类,用户检索中产生的上下文信息可帮助检索系统理解用户需求、用户查询、文档信息以及检查用户查询与文档是否匹配。4 结束与展望上下文信息有利于提高搜索引擎质量,有着重要的使用价值。在利用上下文信息时,不仅需考虑其表示方式,由于各类上下文信息对用户检索行为产生的权重不同,还应综合考虑其带来的影响因子,从而构建合理高效地检索模型。参考文献1lawrence s. context in web searchj.ieee date
6、engineering bulletin,2000, 23(3):5-32.2brown p j,bovey j d,chen x.context-aware applications:from the laboratory to the marketplacej.ieee personal communications,1997, 4(5):58-64.3anind k d.understanding and using context j.personal and ubiquitous computing, 2001.4田萱,李冬梅.上下文信息检索研究综述j.计算机科学.2010,38(9
7、):18-24.5jiang d x,pei j,li h.enhancing web search by mining search and browse logsc.new york:acm press,2011:1-185.6何秀,牛之贤,孙静宇.上下文对用户搜索行为的影响j.情报杂志.2012,10(31):122-125.作者简介何秀(1988-),女,现为广东科技学院计算机系硕士研究生在读,主要研究方向为信息检索。丁丰(1988-),女,现为广东科技学院计算机系硕士研究生在读,主要研究方向软件工程。作者单位广东科技学院计算机系 广东省东莞市 523083endprint摘 要 上下
8、文信息是指用户在检索过程中产生的一切与检索活动相关的信息的总和,该类信息具有高可靠性、针对性、完整性等特征,有利于信息检索模型准确理解用户兴趣偏好。文中阐述了上下文信息的产生、特征,以及捕获方式,并针对不同的运用对上下文信息进行分类。【关键词】下文信息 上下文检索 搜索引擎 信息检索用户的搜索行为是处在一定地上下文环境下,目前的查询系统因利用上下文信息,改善了原有搜索结果重复率高的现象,为用户提供了更具人性化、个性化的高质量服务。上下文信息对搜索引擎具有非常重要的价值,在对上下文信息研究中发现,不同的上下文信息对用户检索行为产生的影响不一样,即在不同的环境下,某些上下文信息具有较高的使用价值,
9、而某些上下文信息则可以忽略。因此,有必要分析各种上下文信息对用户查询行为的影响,有针对性地利用上下文信息资源。1 上下文信息的分类在不同的应用场景(context)下,对上下文信息的定义各具特点,lawrence认为web搜索上下文是指与用户检索意图和表达相关的一切信息。brown 将上下文定义为与用户所处的环境、当前查询时间、季节、温度等相关的信息。anind 定义:“上下文是指在特定的环境下,能够标识实体特征的相关信息,其中相关信息可以包括某人、物、时间、地点、应用系统等,只要所涉及的实体与用户的交互环境相关联”。在信息检索领域,现广泛接受的是将上下文信息划分为:用户上下文、资源上下文、系
10、统上下文等。1.1 用户上下文分为用户静态上下文和用户动态上下文,静态上下文信息包括年龄、学历、专业、工作性质、爱好、生活经验和习惯等与用户个体相联系的其它特征;用户动态上下文指检索过程中产生的所有信息总和,例如:查询词、查询发生时间、用户的ip地址、当前查询浏览所用时间、用户的反馈检查信息等信息;1.2 资源上下文web页面之间的超链接信息、页面本身的结构信息等。1.3 系统上下文查询系统本身的某些特征,例如:系统采用的搜引机制、检查模型、排序机制、检索界面的布局等。2 上下文信息的获取在信息检索中,从用户参与的方式考虑,可将信息收集的方式分为显式收集、隐式收集、推理获取。2.1 显式收集显
11、式收集(或称显式反馈)是指用户根据系统设计的表单内容,自主提交个人基本信息或参与系统的交互信息,用户静态上下文的挖掘则可以采用此方式。2.2 隐式收集隐式收集(又称隐式反馈)是指系统在不影响为用户提供检索服务的前提下,“悄无声息”地收集用户的检索信息,用户动态上下文及资源上下文则可采取该方法;该方法常用的技术有:web信息抽取、基于模板的方法、桌面代理、利用浏览器插件等。2.3 推理获取即借助数学中的统计学理论和数据挖掘的相关知识,进行归纳演绎和推断用户的某些信息。3 上下文信息的研究应用上下文信息的获取、表示、组织所采用的方法直接影响着系统的搜索质量。如图3-1所示,阐述了用户检索过程产生的
12、上下文信息在信息检索系统中的具体应用。如图3-1所示,对信息检索中常见应用进行了归类,用户检索中产生的上下文信息可帮助检索系统理解用户需求、用户查询、文档信息以及检查用户查询与文档是否匹配。4 结束与展望上下文信息有利于提高搜索引擎质量,有着重要的使用价值。在利用上下文信息时,不仅需考虑其表示方式,由于各类上下文信息对用户检索行为产生的权重不同,还应综合考虑其带来的影响因子,从而构建合理高效地检索模型。参考文献1lawrence s. context in web searchj.ieee date engineering bulletin,2000, 23(3):5-32.2brown p
13、j,bovey j d,chen x.context-aware applications:from the laboratory to the marketplacej.ieee personal communications,1997, 4(5):58-64.3anind k d.understanding and using context j.personal and ubiquitous computing, 2001.4田萱,李冬梅.上下文信息检索研究综述j.计算机科学.2010,38(9):18-24.5jiang d x,pei j,li h.enhancing web sea
14、rch by mining search and browse logsc.new york:acm press,2011:1-185.6何秀,牛之贤,孙静宇.上下文对用户搜索行为的影响j.情报杂志.2012,10(31):122-125.作者简介何秀(1988-),女,现为广东科技学院计算机系硕士研究生在读,主要研究方向为信息检索。丁丰(1988-),女,现为广东科技学院计算机系硕士研究生在读,主要研究方向软件工程。作者单位广东科技学院计算机系 广东省东莞市 523083endprint摘 要 上下文信息是指用户在检索过程中产生的一切与检索活动相关的信息的总和,该类信息具有高可靠性、针对性、
15、完整性等特征,有利于信息检索模型准确理解用户兴趣偏好。文中阐述了上下文信息的产生、特征,以及捕获方式,并针对不同的运用对上下文信息进行分类。【关键词】下文信息 上下文检索 搜索引擎 信息检索用户的搜索行为是处在一定地上下文环境下,目前的查询系统因利用上下文信息,改善了原有搜索结果重复率高的现象,为用户提供了更具人性化、个性化的高质量服务。上下文信息对搜索引擎具有非常重要的价值,在对上下文信息研究中发现,不同的上下文信息对用户检索行为产生的影响不一样,即在不同的环境下,某些上下文信息具有较高的使用价值,而某些上下文信息则可以忽略。因此,有必要分析各种上下文信息对用户查询行为的影响,有针对性地利用
16、上下文信息资源。1 上下文信息的分类在不同的应用场景(context)下,对上下文信息的定义各具特点,lawrence认为web搜索上下文是指与用户检索意图和表达相关的一切信息。brown 将上下文定义为与用户所处的环境、当前查询时间、季节、温度等相关的信息。anind 定义:“上下文是指在特定的环境下,能够标识实体特征的相关信息,其中相关信息可以包括某人、物、时间、地点、应用系统等,只要所涉及的实体与用户的交互环境相关联”。在信息检索领域,现广泛接受的是将上下文信息划分为:用户上下文、资源上下文、系统上下文等。1.1 用户上下文分为用户静态上下文和用户动态上下文,静态上下文信息包括年龄、学历
17、、专业、工作性质、爱好、生活经验和习惯等与用户个体相联系的其它特征;用户动态上下文指检索过程中产生的所有信息总和,例如:查询词、查询发生时间、用户的ip地址、当前查询浏览所用时间、用户的反馈检查信息等信息;1.2 资源上下文web页面之间的超链接信息、页面本身的结构信息等。1.3 系统上下文查询系统本身的某些特征,例如:系统采用的搜引机制、检查模型、排序机制、检索界面的布局等。2 上下文信息的获取在信息检索中,从用户参与的方式考虑,可将信息收集的方式分为显式收集、隐式收集、推理获取。2.1 显式收集显式收集(或称显式反馈)是指用户根据系统设计的表单内容,自主提交个人基本信息或参与系统的交互信息
18、,用户静态上下文的挖掘则可以采用此方式。2.2 隐式收集隐式收集(又称隐式反馈)是指系统在不影响为用户提供检索服务的前提下,“悄无声息”地收集用户的检索信息,用户动态上下文及资源上下文则可采取该方法;该方法常用的技术有:web信息抽取、基于模板的方法、桌面代理、利用浏览器插件等。2.3 推理获取即借助数学中的统计学理论和数据挖掘的相关知识,进行归纳演绎和推断用户的某些信息。3 上下文信息的研究应用上下文信息的获取、表示、组织所采用的方法直接影响着系统的搜索质量。如图3-1所示,阐述了用户检索过程产生的上下文信息在信息检索系统中的具体应用。如图3-1所示,对信息检索中常见应用进行了归类,用户检索中产生的上下文信息可帮助检索系统理解用户需求、用户查询、文档信息以及检查用户查询与文档是否匹配。4 结束与展望上下文信息有利于提高搜索引擎质量,有着重要的使用价值。在利用上下文信息时,不仅需考虑其表示方式,由于各类上下文信息对用户检索行为产生的权重不同,还应综合考虑其带来的影响因子,从而构建合理高效地检索模型。参考文献1lawrence s. context in web sea
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天津城市建设管理职业技术学院《环境工程安全生产》2023-2024学年第二学期期末试卷
- 河北司法警官职业学院《创新创业理论与实务》2023-2024学年第二学期期末试卷
- 江西师范大学科学技术学院《材料科学基础应用研究》2023-2024学年第二学期期末试卷
- 伊犁师范大学《工程制图II》2023-2024学年第二学期期末试卷
- 衡阳师范学院南岳学院《环境与化学》2023-2024学年第二学期期末试卷
- 西安医学高等专科学校《会展概论》2023-2024学年第二学期期末试卷
- 中国传媒大学《大众传播调查方法与写作实训》2023-2024学年第二学期期末试卷
- 2024年CO2气体保护药芯焊丝资金申请报告代可行性研究报告
- 劳动技术教育实施途径
- 2024年玉米酒精糟回收蛋白饲料成套设备(DDGS)项目资金筹措计划书代可行性研究报告
- 2025年江苏高处安装、维护、拆除作业-特种作业证考试复习题库(含答案)
- 2025年湖北省黄冈市中考数学调研试卷(4月份)
- 2024年江苏常州中考满分作文《那么旧那样新》8
- 全国各气象台站区站号及经纬度
- 经典话剧剧本《雷雨》
- 巩汉林小品《最后一堂课》台词剧本手稿
- 机房加固设计方案(承重)(共7页)
- 管理系统中计算机应用PPT课件
- 璧山区5G+智慧农业项目商业计划书-模板范文
- 事业单位个人简历表格(模板)
- 寿力空压机操作面板说明书
评论
0/150
提交评论