信息检索与服务-信息管理概论-柯平_第1页
信息检索与服务-信息管理概论-柯平_第2页
信息检索与服务-信息管理概论-柯平_第3页
信息检索与服务-信息管理概论-柯平_第4页
信息检索与服务-信息管理概论-柯平_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8信息检索和服务信息检索是获取信息最重要、最有效的手段。它的功能是节省搜索者的时间和精力,避免科研工作的重复,并指导阅读和学术研究。信息服务是与信息和信息工作密切相关的特定劳动领域。它像其他商品一样具有特殊的使用价值,给社会带来财富。本章概述了信息检索和服务的基本原则和方法,作为信息过程管理的重要组成部分。8.1信息检索8.1.1信息检索基础理论1.信息检索概述(1)信息检索的含义:狭义的检索是指按照一定的方法从大量有组织的相关文献信息集中搜索和获取特定相关文献信息的过程。广义检索包括信息存储和检索两个过程:(1)信息存储是指工作人员收集大量无序的信息,根据信息源的外观特征和内容特征进行整理、分类、浓缩、索引等处理,使之系统化、有序化,并根据一定的技术要求建立一个具有检索功能的工具或检索系统,供人们检索和使用。(2)检索是指使用汇编的检索工具或检索系统,找出满足用户要求的具体信息。(2)信息检索的类型:(1)数据检索数据检索:将文档中的数据作为对象的检索。存储的信息是数据。搜索时,搜索数据文件并输出问题的答案。数据检索是从文件、数据库或存储设备中搜索和选择所需数据的操作或过程,包括数字形式和非数字形式的数据。根据查询问题的要求,分为简单检索(即单因素检索)和综合检索(即综合条件检索)。例如,找到各种物质的物理和化学常数,各种统计数据和工程数据等。(“新卡车的载重量是多少?每百公里的油耗是多少?”)(2)事实检索事实检索以文献中的事实为对象,检索事件的时间、地点或过程。储存的信息是各种各样的事实。搜索时,你可以进行一些逻辑推理,比较和分析搜索到的事实,然后输出关于某件事情的具体答案。找鲁迅生于某一年?世界上最长的斜拉桥是哪一座?这座桥位于哪里?什么时候完成?事实检索要求检索系统不仅能够从数据(事实)集合中找出最初存储的数据或事实,而且能够从现有的基本数据或事实中推导出新的数据或事实。例如,以下事实存储在系统中:李明是学校a的学生。(2)学校a的所有学生都学习外语。如果这个系统是一个事实检索系统,它应该能够回答“李明学外语了吗?”这种问题。事实检索是最复杂的信息检索类型。它要求系统中的数据和事实以自然语言或接近自然语言的方式存储。不仅应该存储各种数据或事实单元,而且应该存储单元之间的语义关系、句法关系和各种相关背景知识。用户可以用自然语言提问和回答问题。更重要的是,系统必须具有一定的逻辑推理能力和自然语言理解功能。目前,事实检索通常是手工完成的。(3)信息检索文献检索:一种以原始文献为检索对象的检索。存储的信息是由文章标题、描述项和关键词组成的文档单元。在检索过程中,根据查询搜索词搜索文档文件,并输出文档标题和摘要。例如,“设计人行桥有什么参考?”文献信息检索是一种关联检索。检索结果是文献线索,需要进一步的搜索来检索相关的主要信息。数据和事实信息检索是一种确定性检索,检索结果是用户可以直接使用的信息。一般来说,文献信息检索是通过二级信息实现的,而数据和事实信息检索是通过三级信息完成的。2.信息检索原理信息检索系统通过信息存储和信息检索两个相互作用的过程来实现系统的功能。工作原理如下图所示。一个完整的信息检索系统由两部分组成:存储子系统和检索子系统。(1)存储过程对大量无序的信息资源进行索引,使之有序,并按照科学的方法进行存储,形成检索工具或文档,即组织检索系统的过程或生成检索工具库。(2)检索过程分析用户的信息需求,使用有组织的检索系统,按照系统提供的方法和途径检索相关信息,即检索系统的应用过程。(3)信息存储和检索是相互依存的由于职业、知识水平、个人素质甚至习惯的不同,信息存储人员(索引器)和信息检索用户(检索器)对同一信息的分析和理解也会不同。例如,对于文章计算机在生物化学中的应用,索引器可以将其分类为“生物化学”,而检索器可以在“计算机”类别中搜索文章。这样,索引错位发生在索引器和检索器之间,并且存储的信息不能被检索。我们如何确保信息可以存储和检索?也就是说,存储和检索所基于的规则必须一致,也就是说,索引器和检索器必须遵守相同的索引规则。这样,无论什么样的索引器,同一文档的索引结果都是一致的,无论谁搜索,都可以找到这个文档。信息存储和检索遵循的通用规则称为信息检索语言(详见8.1.3)。只要索引器和搜索者使用相同的搜索语言来索引要存储的信息特征和要搜索的搜索问题,使得它们成为一致的识别形式,信息存储过程和搜索过程就是一致的。因此,存储的文档也可以通过信息检索工具(系统)检索。如果搜索失败,那么有必要分析搜索问题是否准确地描述了要搜索的主题的主题概念。使用检索语言进行索引时是否有任何错误,从而导致检索问题的错误识别?只有当检索问号与信息特征标记一致时,才能检索相关文档。信息检索是基于信息存储和检索之间的对应关系。如果这两个过程不匹配,信息检索将失去其基础。如果无法检索到所需的信息,存储就变得毫无意义。3.信息检索方法(1)常用方法也称为直接方法和工具方法,它是指直接使用检索系统(工具)检索文档信息的方法。这种方法的优点是能够清楚地判断文档中包含的信息内容是否满足要求,缺点是难以获得全面的文档,并且需要时间和精力。如果检索主题单一,文献相对集中,熟悉书刊检索,可以使用这种检索方法,但对于主题多、文献分散性大的主题,很难获得理想的检索结果。由于这种方法不依赖于检索工具,因此不是严格意义上的文献信息检索方法。可分为顺序检验、反向检验和随机检验。(1)顺序搜索法经过分析,确定检索文献信息的起始日期,然后使用所选的检索工具或系统逐年从远到近进行检索。该方法搜索效果显著,但耗时费力,工作量相对较大。例如,信息论的数据可以从1948年找到。(2)反向检查法使用所选的检索工具或系统,逐年从近到远搜索当一门学科处于繁荣时期时,这种方法在检索几年的文献和信息时是有效和高效的。然而,使用这种方法的前提是要熟悉学科的发展过程和特点。(2)回溯法追踪法是指利用文献后面所列的参考文献,而不是利用一般的检索系统,对原始文献(引用文献)进行逐一追踪,然后从这些原始文献后面所列的参考文献列表中逐一扩展文献信息的范围,并逐一追踪的方法。根据文献之间的引用关系,可以滚雪球式地获得更好的检索结果。(3)循环法循环法又称分段法或综合法。分阶段、分阶段交替使用直接法和回溯法,取长补短,相互配合,取得更好的检索效果。4.信息检索方法检索方法取决于文献信息的特征。文学有两个特征:外在特征和内容特征。文件的外部特征主要是指在文件载体上标记和容易看到的项目,包括标题、负责人、序号、出版人、出版地点、出版年份等。文件的内容和特点包括主题和主题。因此,根据文档的外部特征和内容特征,信息检索方法分为两类。(1)内容特征方法(1)分类方法分类方法是指根据文献内容的学科分类体系寻找文献信息的方法。一般来说,检索工具的编制必须按照学科建立自己的分类体系,检索工具中包含的文档按照分类目录中的排序进行排列,这样排列的结果可以集中同一学科的文档,便于按照学科进行文档检索。分类目录和分类索引是常用的分类检索工具。分类方法的缺点是不方便找到难以分类的新学科和边缘学科。在搜索时,必须首先理解反映学科体系的分类表,然后将概念转换成分类号,然后按分类号搜索。由于在将概念转化为分类编号的过程中容易出现错误,因此也会出现遗漏和误检。然而,许多搜索者希望从熟悉的分类系统和主题概念的上下左右关系中了解事物的派生、从属、平行等关系,以满足民族搜索的需要。分类方法能更好地满足这一要求。(2)主题方法主题是文献表达的中心思想,讨论的基本问题和研究对象。主题方法指的是根据表达文学主题内容的关键词和从这些关键词派生出来的关键词来寻找文学信息的方法。主题方法的主要检索工具有主题目录和主题索引,或主题词索引、关键词索引、叙利亚词索引等。主题目录是根据文件内容的主题标题组织的,通过直接检索文件中讨论的主题,可以找到分散在不同学科中的同一主题的文件。主题索引是工具书的辅助索引之一,可以揭示包含主题的文档信息在文档正文中的位置。基于主题的文献信息检索的优点是以主题术语作为标签,准确、灵活、高特异性地表达概念,可以将同一主题的文献集中起来,检索效率高。此外,随着科学技术的发展,可以增加或更新主题词,因此可以方便地找到新兴学科的文献信息。目前,随着学科及其分支之间交叉渗透的增加,学科方法更好地适应了这一要求。用主题方法检索文献信息的缺点是主题索引缺乏主题系统的完整性和层次性,难以达到较高的查全率。(3)主题方法的分类分类主题方法是第一类和第二类的结合作者方法,通常称为负责任的方法。作者是指对文档内容负责或做出重大贡献的个人或团体,包括作者姓名、审阅者、编辑等。作者法是一种根据作者(译者和编辑)的姓名查找文献信息的方法,也是外语检索工具中一种更为重要和常用的方法。根据作者的姓氏和名字,它很容易使用,安排和机器。通过作者途径的搜索,可以找到特定学者和专家的最新作品,系统地发现和掌握他们的研究方向和进展。当使用作者方法检索文献时,有必要注意不同国家的作者索引的编制和作者姓名的拼写规则。外国更注重工人搜索的方式,但是在我们国家很少有人记得名字,所以作者名单很少。序列号法使用文档的代码和编号进行搜索。它的标志是序列号、专利号、标准号等。例如:国际标准书号7(国家)-5001(出版社编号)-0016(序列号)-7(奇偶校验位)国际标准书号由10位数字组成,分为四个部分:(一)组号:代表出版商的国家、地理区域、语言等。中国的组号是“7”。出版商编号:特定的出版商(出版社、出版公司等)属于代表组。由国家或地区的国际标准书号中心设置和分发,可以是1-7位数字。标题:出版商给每份出版物的编号。验证号:国际标准书号的最后一位数字,可以验证国际标准书号是否正确。例如:武汉大学出版社出版的图书馆学导论,其中文标准书号为ISBN7-307-00211-6/G 53。其中,“7”是我国的组号,“307”是武汉大学出版社的代号,“00211”是书名,表示该书是出版社出版的第211本书,“6”是校验码,而G是分类号。“53”是物种的数量,即第53本书的G类例如,美国专利索引化学文摘、美国合同/授权号索引政府报告通报和索引和美国NTIS订单/报告号索引0103010。(3)命名法它也被称为标题法和标题法。标题是表达、象征和隐喻文档内容和特征的单词或短语。它们是文件的标题或名称,包括标题、期刊标题、文章标题等。文档标题包括主题标题、辅助标题和辅助标题。标题检索方法是指根据文档标题查找文档信息的方法。它将文档的标题按照词序排列成索引,其排列方法简单,易于检查。然而,书籍和文章的标题太长,不能用作搜索标记,并且由于不同的字符在主体结构和语法结构方面有其自身的特征,并且结尾变化复杂,因此很难将相同含义的文档集中在一个地方。实际使用价值已不再被人们所重视,并逐渐失去其重要性。5.信息检索步骤信息检索是一项实践性和经验性的工作。对于不同的被检对象,将采用不同的检索程序,即文献信息检索的具体步骤和方法应是针对具体对象的,便于人们使用。但是,在实际的检索工作中,可以根据信息检索的基本原理,总结出文献信息检索的一般程序和步骤,从而使检索工作有序进行,取得更好的检索效果。一般来说,信息检索遵循以下步骤:(1)分析主题并确定检索范围所谓检索主题是根据寻找文献信息或寻找科学研究问题的需要而提出的问题。在搜索之前,我们必须首先对要检查的主题进行仔细分析,明确搜索的目的和具体要求,使用户的搜索问题符合搜索工作的要求,使搜索与问题一致,避免盲目搜索。在分析主题的基础上,还需要确定检索主题的类型,是否要搜索文档、事实或数据,以及搜索文档信息所需的时间范围和主题范围,以便对检索主题有一个总体的了解。(2)选择适当的主要考虑的是在这一领域有什么样的工具,出版时间和范围是否能包括要审查的问题,工具的质量和权威,是否有各种搜索渠道等。检索工具的总体要求是:专业范围广、类型全、数量大、报告速度快、摘要详细、索引多样。在搜索时,我们不仅要选择专业的搜索工具,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论