情报检索系统中的信息组织课件_第1页
情报检索系统中的信息组织课件_第2页
情报检索系统中的信息组织课件_第3页
情报检索系统中的信息组织课件_第4页
情报检索系统中的信息组织课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

情报检索系统中的

信息组织情报检索系统中的

信息组织1目标情报检索定义:信息单元的表示、存储、组织和存取旨在满足用户的信息需求用户的信息需求例如:找到关于姚明在休斯敦火箭队的所有文献,包含(1)他与其他几位中国球员的交往

或(2)他与女友的交往;重点在查找相关信息,而不是数据目标情报检索定义:信息单元的表示、存储、组织和存取2数据检索DataRetrieval文献包含的关键词是数据含义固定一点小错误会造成查找失败情报检索Informationretrieval关于一个主题或话题的信息含义常常比较宽松,有一定范围允许一些错误,不影响查到相关内容情报检索系统IRsystem:对信息对象内容的解释排序反映了相关性相关性是最重要的概念数据检索DataRetrieval3情报检索时代的来临情报检索已不是图书情报领域关心的课题,随着万维网的来临,一跃成为受人关注的关键技术之一。情报检索时代的来临4基本模型用户目标检索信息或数据有目的地浏览随意冲浪F1;cars,LeMans,France,tourismRetrievalBrowsingDatabase基本模型用户目标RetrievalBrowsingDatab5基本概念文件的逻辑视图数字化文本可以用全文进行索引,而不必只取“关键词”或“分类号”结构分词禁用词名词

词组词干/同义词人工标引文件结构提取全文索引词基本概念结构分词禁用词名词

词组词干/同义词人工标引文件结构6用户界面文本操作提问式操作标引检索排序索引文本提问用户需求用户反馈经过排序文件获取文件逻辑视图逻辑视图倒排档数据库管理模块4,106,75828文本数据库文本情报检索流程用户界面文本操作提问式操作标引检索排序索引文本提问用户需求用7简介情报检索系统采用索引词处理提问(匹配)索引词:关键词或者规范词任意词用到切分或截词:connect:connecting,connection,connections倒排档用于查检操作简介情报检索系统采用索引词处理提问(匹配)8Introduction文件信息需求索引词文件提问排序匹配Introduction文件信息需求索引词文件提问排序匹配9简介排序是检出文献对于用户提问的相关程度的顺序以下原因造成问题:索引词的匹配不太精确用户常常会不满足由于用户没有经过提问式编写的培训,检索效果会更糟Web上的情报检索更是如此相关性的测度成为匹配与排序的关键问题简介排序是检出文献对于用户提问的相关程度的顺序10情报检索模型非重叠列表最近节点结构化模型

检索:

实际上是信息过滤浏览

用户目的传统模型

布尔模型矢量模型概率模型集合论

模糊理论

扩展的布尔逻辑概率论

推理网络

信任网络代数论

普通矢量

语义索引神经网络浏览

平面结构结构指南超文本情报检索模型非重叠列表结构化模型检索:浏览用户目的传11情报检索模型情报检索模型,文件的逻辑视图,以及检索任务是情报检索的三个不同方面情报检索模型情报检索模型,文件的逻辑视图,以及检索任务是12经典模型–基本概念每篇文献用关键词或索引词来代表索引词是特定文献中有意义的或代表文献主题的词通常索引词为名词,因为只有名词自身才有意义然而搜索引擎将所有词都进行索引,成为全文索引经典模型–基本概念每篇文献用关键词或索引词来代表13但是并不是所有词对于特定文献都具有相等的代表性:低频词更能区分文献(具有更小的命中文献集合)索引词的重要性由赋予它的权重决定如

ki为一索引词dj为一文献

wij为(ki,dj)的权重权重wij

代表了索引词ki在文献dj中的重要性经典模型–基本概念但是并不是所有词对于特定文献都具有相等的代表性:低频词更能区14ki为一索引词dj为一文献

t是检索系统中文献的总数K=(k1,k2,…,kt)索引词集合wij>=0是与(ki,dj)相关的权重wij=0表示该词不在某篇文献dj中vec(dj)=(w1j,w2j,…,wtj)是关于文献dj的权重矢量gi(vec(dj))=wijis是返回关于(ki,dj)权重的函数经典模型–基本概念ki为一索引词经典模型–基本概念15数字图书馆中的情报检索一般认为数字图书馆是:数字对象的集合所构成的资源库;描述这些数字对象的元数据库;实用这些数字对象的目标用户;提供各种服务(捕捉、标引、编目、查询、浏览、检索、传递、存档、长期保存等)的系统数字图书馆中的情报检索一般认为数字图书馆是:16数字图书馆与情报检索情报检索对于数字图书馆是至关重要的,可以使数字图书馆更为高效而且易于使用情报检索同时是数字图书馆的一个很重要的研究领域和核心技术之一数字图书馆与情报检索情报检索对于数字图书馆是至关重要的,可以17情报检索系统中的

信息组织情报检索系统中的

信息组织18目标情报检索定义:信息单元的表示、存储、组织和存取旨在满足用户的信息需求用户的信息需求例如:找到关于姚明在休斯敦火箭队的所有文献,包含(1)他与其他几位中国球员的交往

或(2)他与女友的交往;重点在查找相关信息,而不是数据目标情报检索定义:信息单元的表示、存储、组织和存取19数据检索DataRetrieval文献包含的关键词是数据含义固定一点小错误会造成查找失败情报检索Informationretrieval关于一个主题或话题的信息含义常常比较宽松,有一定范围允许一些错误,不影响查到相关内容情报检索系统IRsystem:对信息对象内容的解释排序反映了相关性相关性是最重要的概念数据检索DataRetrieval20情报检索时代的来临情报检索已不是图书情报领域关心的课题,随着万维网的来临,一跃成为受人关注的关键技术之一。情报检索时代的来临21基本模型用户目标检索信息或数据有目的地浏览随意冲浪F1;cars,LeMans,France,tourismRetrievalBrowsingDatabase基本模型用户目标RetrievalBrowsingDatab22基本概念文件的逻辑视图数字化文本可以用全文进行索引,而不必只取“关键词”或“分类号”结构分词禁用词名词

词组词干/同义词人工标引文件结构提取全文索引词基本概念结构分词禁用词名词

词组词干/同义词人工标引文件结构23用户界面文本操作提问式操作标引检索排序索引文本提问用户需求用户反馈经过排序文件获取文件逻辑视图逻辑视图倒排档数据库管理模块4,106,75828文本数据库文本情报检索流程用户界面文本操作提问式操作标引检索排序索引文本提问用户需求用24简介情报检索系统采用索引词处理提问(匹配)索引词:关键词或者规范词任意词用到切分或截词:connect:connecting,connection,connections倒排档用于查检操作简介情报检索系统采用索引词处理提问(匹配)25Introduction文件信息需求索引词文件提问排序匹配Introduction文件信息需求索引词文件提问排序匹配26简介排序是检出文献对于用户提问的相关程度的顺序以下原因造成问题:索引词的匹配不太精确用户常常会不满足由于用户没有经过提问式编写的培训,检索效果会更糟Web上的情报检索更是如此相关性的测度成为匹配与排序的关键问题简介排序是检出文献对于用户提问的相关程度的顺序27情报检索模型非重叠列表最近节点结构化模型

检索:

实际上是信息过滤浏览

用户目的传统模型

布尔模型矢量模型概率模型集合论

模糊理论

扩展的布尔逻辑概率论

推理网络

信任网络代数论

普通矢量

语义索引神经网络浏览

平面结构结构指南超文本情报检索模型非重叠列表结构化模型检索:浏览用户目的传28情报检索模型情报检索模型,文件的逻辑视图,以及检索任务是情报检索的三个不同方面情报检索模型情报检索模型,文件的逻辑视图,以及检索任务是29经典模型–基本概念每篇文献用关键词或索引词来代表索引词是特定文献中有意义的或代表文献主题的词通常索引词为名词,因为只有名词自身才有意义然而搜索引擎将所有词都进行索引,成为全文索引经典模型–基本概念每篇文献用关键词或索引词来代表30但是并不是所有词对于特定文献都具有相等的代表性:低频词更能区分文献(具有更小的命中文献集合)索引词的重要性由赋予它的权重决定如

ki为一索引词dj为一文献

wij为(ki,dj)的权重权重wij

代表了索引词ki在文献dj中的重要性经典模型–基本概念但是并不是所有词对于特定文献都具有相等的代表性:低频词更能区31ki为一索引词dj为一文献

t是检索系统中文献的总数K=(k1,k2,…,kt)索引词集合wij>=0是与(ki,dj)相关的权重wij=0表示该词不在某篇文献dj中vec(dj)=(w1j,w2j,…,wtj)是关于文献dj的权重矢量gi(vec(dj))=wijis是返回关于(ki,dj)权重的函数经典模型–基本概念ki为一索引词经典模型–基本概念32数字图书馆中的情报检索一般认为数字图书馆是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论