文献检索与利用课件.ppt_第1页
文献检索与利用课件.ppt_第2页
文献检索与利用课件.ppt_第3页
文献检索与利用课件.ppt_第4页
文献检索与利用课件.ppt_第5页
免费预览已结束,剩余129页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文献检索与利用,管理学院选修课,推荐教材及参考书,1。信息检索,张海涛等编著,机械工业出版社2.信息检索,黄如花主编,武汉大学出版社3信息检索与利用,邹广严等编著,科学出版社4.信息检索系统导论,刘挺等编著,机械工业出版社,教学目的与意义,Why-为什么要学习信息检索What-什么是信息检索(概念、原理、类型等等)了解相关知识How-怎样实施信息检索(方法、途径、步骤等)恰当运用方法Where-在哪里实施信息检索(检索系统介绍)熟悉检索工具How-to-better-如何提高检索效率和效果(策略、技巧等)掌握相关技能,教学内容(理论与应用相结合),第一篇信息检索理论基础第一章信息检索概述第二章信息检索途径与检索策略第三章计算机信息检索概述第二篇科技文献检索篇第四章事实和数据信息检索第五章科技期刊及其检索第六章特种文献及其检索,第三篇计算机信息检索篇第七章国内重要的综合性信息检索系统第八章国外重要的综合性信息检索系统第九章光盘信息检索第四篇网络信息检索篇第十章网络信息检索概述第十一章网络信息检索工具的使用介绍,补充内容:,信息资源的集中与分散规律:(1)马太效应-富集与贫集(2)布拉德福定律-论文在期刊中的离散分布(3)洛特卡定律-信息生产者分布规律(4)普赖斯定律-核心生产者的平方根定律文献的增长与老化规律:(1)指数增长律(文献累计数)(2)逐渐过时律-半衰期和普赖斯指数,信息资源分布的马太效应马太效应是美国学者R。默顿引用圣经新约全书马太福音中的一段话:“凡有的,还要加给她,叫他有余;凡没有的,连他所有的也要夺去”。信息分布的“富集”与“贫集”现象信息富集分布表现为核心趋势和集中取向,例如:核心期刊、核心作者、核心网站、核心检索系统、核心机构等等作用:选择核心信息源,吉林大学哲学社会科学A类期刊目录注:SSCI为国外社会科学索引;ATaxi+Cab,增加限义词。许多词具有多重含义,即“一词多义”。一词多义常常导致误检。为了解决由于检索词一词多义而造成误检的问题,可以采用增加“限义词”的手段来对检索词进行限义。增加“限义词”的方法有两种,一种是逻辑“与”,一种是逻辑非。例如,“勘探”一词,既可以指石油勘探、也可以指煤田勘探等。组合。一个检索课题在经过上述六个步骤之后,该课题涉及到哪几个概念组面、每个组面内应包含哪几个检索词已经确定,下面的工作就是将它们“组合”成合乎需要的检索式。检索词的组合是通过布尔逻辑算符来进行连接的。,练习(写出检索表达式),1.知识供应链运行模式研究2.东北三省科技成果转化与产业化互动研究3.制造业企业信息化技术选择与建设模式研究4.企业隐性知识转化模型构建与转化环境优化研究5.机构知识库运行机制与评价体系研究,5计算机信息检索的策略模式美国人鲍纳提出的五种供计算机信息检索用的检索策略:(1)先用最专指面(最专指面优先)的策略所谓先用最专指面(Mostspecificfacetfirst)的策略,是指检索时首先查找所有概念组面中最专指的一个概念组面。然后,再依据用户需求以及初步检索结果,决定是否需要加入其他的概念组面,以及怎样加入其他的概念组面。,(2)先用最小登录数面(最低登录量的面优先)的策略所谓先用最小登录数面(Lowestpostingsfacetfirst),是指检索时首先查找所有概念组面中登录数最小一个概念织面。然后,再依据用户需求以及初步检索结果,决定是否需要加入其他的概念组面,以及怎样加人其他的概念组面。,(3)积木式策略所谓积木式(Buildingblock)策略,是指检索时首先逐个查找各个概念组面,然后再把各个组面组配起来,得到最终的检索结果。积木式策略模式的好处,是与检索提问概念化的过程相一致,在理解和执行上都比较容易掌握。然而,因为各概念组面不是逐个加人检索,而是“一次性”组配得到检索结果的,所以,一旦出现检索问题,时常很难确定导致问题的原因在哪里,也就难以迅速有效地作出有针对性的改进。,(4)引文珠形增长策略所谓引文珠形增长(Citationpearl-growing)策略,是首先以一个较为核心的概念组面进行试检,并仔细浏览初步的检索结果,尤其是特别符合用户需要的文献记录,从中选择更多、更合适的检索词补充到检索式中,然后,再浏览命中的文献记录,再从中选择检索词补充到检索式中。如此反复操作,直至得到理想的最终检索结果。,(5)连续分割(逐次分馏)策略所谓连续分割(Successivefractions)策略,是指检索时首先建立较大的初始文献集,然后利用各种检索的限制或限定措施,逐步缩小检索范围,直至符合用户需要为止。连续分割策略模式有利于保证检索全面性,如能在适当的条件下加以利用,可取得相当有效的作用。,6计算机信息检索策略的调整在信息检索中,需要经过多个检索步骤,通过不断的随机调整,才能最终取得所需的检索结果。(1)对检索失误的分析在信息检索中,所有的检索失误归根到底都只有两种失误,即误检和漏检。造成误检和漏检的原因很多,需要在每次检索中具体问题具体分析。只有找出导致检索失误的真正原因,才能作出有针对性的调整。,误检和漏检的主要表现和成因,(2)随机调整的措施在随机调整的措施中,依据其重点是在于检索效率还是命中数量,可分为概念型对策和操作型对策两类措施。概念型对策的重点在于,通过扩大或缩小检索的主题范围,从而达到提高检索全面性或准确性的主要目的。操作型对策的重点在于,通过扩大或缩小检索的查找范围,从而实现增加或减少命中数量的主要目的。与此同时,检索的全面性和准确性也可能有所提高或降低。,3.6计算机信息检索的运行步骤,(1)主机检索算法的处理运行数据库的检索算法可分为顺序检索和倒排文档检索两种。顺序检索将检索提问标识依次与文档中的各条记录进行比较,必须检索整个文档后才能得到检索结果。这种算法在逻辑和执行上都较为简单,但每次检索都需要查找整个文档中的所有记录,查找量大而速度慢。脱机信息检索系统就采用这种算法,为提高检索工作效率,每次操作都处理一批提问,因此也被称为批处理系统。显然,这样的检索速度无法满足联机信息检索的需要。,倒排文档检索首先从词典文档中查找和对比检索提问标识,获得含有该标识的记录数量,再根据关联指针,得到有关记录的存取号及其字段位置,然后按检索提问式的逻辑关系进行运算,得到命中的记录存取号的集合,最终根据存取号从主文档中调取有关的记录进行输出。这种算法虽然在逻辑和执行上较为复杂,但与联机数据库的文档结构相适应,可以显著地减少要查找的记录数,极大地提高主机的响应速度,满足实时(RealTime)检索的联机需要(见图)。,第一篇内容小结,信息检索的概念与类型信息检索的原理信息检索语言信息检索的方法与途径信息检索的过程与策略信息检索的发展趋势计算机信息检索的检索技术计算机信息检索的步骤(检索式的构造)计算机信息检索策略及策略模式计算机信息检索的运行步骤,为什么要学习信息检索返回,信息爆炸、信息泛滥信息的海量性无限性与人的时间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论