第04章信息检索与管理方法陈庄_第1页
第04章信息检索与管理方法陈庄_第2页
第04章信息检索与管理方法陈庄_第3页
第04章信息检索与管理方法陈庄_第4页
第04章信息检索与管理方法陈庄_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索与管理方法信息检索与管理方法信息资源组织与管理信息资源组织与管理 之第之第 4章章陈庄 博士 教授重庆市经委企业信息化专家组专家重庆市科委制造业信息化专家组专家重庆市软件协会理事; 2005/03/24 第 4章 信息检索与管理方法4.1 信息检索的内涵4.1.1 信息检索的定义 (掌握)(掌握)4.1.2 信息检索的分类 (掌握)(掌握)4.1.3 信息检索的作用 (了解)(了解)4.2 信息检索的原理与流程4.2.1 信息检索的原理 (了解)(了解)4.2.2 信息检索的流程 (掌握)(掌握)4.2.3 信息检索案例 (了解)(了解)4.3 信息检索的方法和技术 4.3.1 信息检索方法 (掌握)(掌握)4.3.2 信息检索技术 (了解)(了解)4.4 信息检索的效果及其评价4.4.1 信息检索效果的评价指标 (难点,基本掌握)(难点,基本掌握)4.4.2 提高检索效果的方法 (了解)(了解)4.4.3 工程技术学术资源检索实例评价 (了解)(了解)作业 ( )4.1.1 信息检索的定义 信息检索信息检索 (Information Retrieval)又 称为情报检索,产生于图书馆的情报咨询工作,是信息组织的逆过程。 信息组织信息组织 是将分散的信息组织成一个有序的、有具体目标的体系,而 信息检索信息检索 则是迅速地从这个体系中搜寻满足用户需求的信息。 信息检索信息检索 是从大量相关信息中利用人 -机系统等各种方法加以有序识别与组织,以便及时找出用户所需部分信息的过程 信息检索信息检索 “ 行业行业 ” 案例介绍案例介绍 :美国美国 的 EI、 SCI;北京北京 超星、电子书生、万方;重庆重庆 的维普(聚合公司)。4.1.2 信息检索的分类 (1/2)1、按检索内容的分类( 3类)1)数据信息检索数据信息检索数据信息检索 (Data Information Retrieval)是将经过收集、整理、加工的数值型数据存入检索数据库中,然后根据用户需求检索出可回答某一问题数据的过程 。 2)事实信息检索事实信息检索事实信息检索 (Fact Information Retrieval)是将存储于检索数据库中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。3)文献信息检索文献信息检索文献信息检索 (Document Information Retrieval)是将存储于检索数据库中的关于某一主题文献的信息查找出来的检索。 ( 最多!检索案例最多!检索案例:科技成果检索、论文文献综述;:科技成果检索、论文文献综述; 检索工具案例检索工具案例 : 重庆聚合维普、超星重庆聚合维普、超星、 goole等等 )4.1.2 信息检索的分类 (2/2)2、按组织方式分类1)全文检索全文检索 : 全文检索全文检索 (Full Text Retrieval)是将存储于检索数据库中整是将存储于检索数据库中整本书、整篇文章中的任意内容查找出来的检索。(本书、整篇文章中的任意内容查找出来的检索。( 维普、超星维普、超星 ) 2)超文本检索超文本检索 : 超文本检索超文本检索 (Hyper Text Retrieval)是对每个结点中所是对每个结点中所存信息以及信息链构成的网络中信息的检索。(存信息以及信息链构成的网络中信息的检索。( goole、 百度百度 ) 3)超媒体检索超媒体检索 : 超媒体检索超媒体检索 (Hyper Media Retrieval)是对存储的文本是对存储的文本、图像、声音等多种媒体信息的检索,它是多维存储结构。(、图像、声音等多种媒体信息的检索,它是多维存储结构。( 数字图数字图书馆书馆 ) 3、按检索设备分类1)人工检索人工检索 : 是人直接用手、眼、脑组织、查找印刷型文献的检索。是人直接用手、眼、脑组织、查找印刷型文献的检索。 2)自动检索自动检索 : 又称计算机检索,是通过计算机对已数字化的信息,按照又称计算机检索,是通过计算机对已数字化的信息,按照设计好的程序进行查找和输出的过程。设计好的程序进行查找和输出的过程。按按 处理方式处理方式 ,自动检索又分为:,自动检索又分为: 脱机检索脱机检索 和和 联机检索联机检索 ;按按 存储方式存储方式 ,自动检索又分为:,自动检索又分为: 光盘检索光盘检索 和和 网络检索网络检索 。4.1.3 信息检索的作用1、较全面地掌握有关的必要信息2、提高信息利用的效率,节省时间与费用3、提高信息素质,加快人才的培养。( 信息素质信息素质 (Information Literacy): 是指具有信息获得的强烈意识,掌握信息检索的技术和方法,拥有信息鉴别和利用的能力。 )4.2.1 信息检索的原理 (1/2)文献检索过程的系统表述 4.2.1 信息检索的原理 (2/2)文献检索简化流程 相关性评估层次示意图4.2.2 信息检索的流程 (1/2)图 4.3 信息检索步骤流程图4.2.2 信息检索的流程 (2/2)0、明确信息需求、明确信息需求 : 1)普查型:)普查型: 需要全面收集有关某一检索需求的文献资料 ; 2)攻关型:)攻关型: 需要收集有关某一检索需求的某一特定方面的文献资料,其目的在于解决生产管理中的关键问题; 3)探索型:)探索型: 需要了解和掌握某一领域最新研究动向或研究成果的检索需求, 1、选择检索系统:、选择检索系统: DIALOG、 万方万方 、 SCI、 EI、 超星超星 2、 确定检索词:确定检索词: 1)是表示主题的检索词)是表示主题的检索词 ,如标题词、单元词 (最基本的词汇 )、叙词、关键词 (指从题目、正文或摘要中抽出的能表征信息主题的词语); 2)表示作者的检索词,表示作者的检索词, 如作者姓名、机构名等; 3)表示分类的检索词,)表示分类的检索词, 如分类号等; 4)表示特殊意义的检索词表示特殊意义的检索词 。如 ISBN号、 ISSN号、引文标引词等。 3、构造检索表达式:、构造检索表达式: 构造一个既能表达检索需求,又能为计算机识别的检索表达式,主要使用布尔逻辑运算符、位置运算符、截词运算符、限制符等,将检索词进行组合。 4、实施检索策略:、实施检索策略: 扩检、缩检、索取原始信息。5、修改检索策略:、修改检索策略: 检索需求差别检索需求差别 、 检索系统的性能各不同检索系统的性能各不同 ,加上 检索检索人员水平不一人员水平不一 ,所以,构造的检索词往往具有较大的局限性、随机性和盲目性,有可能导致检索的失败,这就要求在检索时不断了解反馈信息,及时修改检索策略。 4.2.3 信息检索案例: 造纸黑液废水的治理技术 1、信息需求分析: 属于 环境科学 领域,所查 文献类型 应包括 书目文摘 、 事实 和 全文性 信息。 2、确定检索词: paper pulp,paper making,waste water,treatment, treat 3、 拟定检索表达式 (“ w” 表位置算符 , paper w making 表找 paper making 记录 )(paper w making or paper w pulp) and waste water and (treatment or treat) 4、 进入检索系统 : OCLC的主页 (http: /) 5、 选择主题范畴: 根据 OCLC的 13个主题及课题领域,选主题 General Science 6、 选择检索数据库: OCLC WorldCat, OCLC ArticleFirst, OCLC ContentsFirst, OCLC PapersFirst 7、 输入检索表达式: 输入第 3步的检索表达式8、提交检索式: 单击 “ StartSearch” 按钮完成了提交。 9、显示结果: 系统将返回检索结果:共 119条记录,以每屏 10个记录格式显示。 10、优化结果: 返回记录太多,所以需要对检索式进一步限定,用高级检索将检索词进行不同字段的组合。Pulp :使 化成纸浆 (vt); 变成纸浆(vi)4.3.1 信息检索方法1、常规检索法1)直接检索法:直接检索法: 直接利用检索工具进行信息检索的方法。直接利用检索工具进行信息检索的方法。 2)间接检索法:间接检索法: 利用检索工具间接检索信息资源的方法。包利用检索工具间接检索信息资源的方法。包含含 检索课题的分析检索课题的分析 、 检索策略的制定检索策略的制定 、 检索技术的应用检索技术的应用 等方面。等方面。 3)顺查法:顺查法: 按年限顺序查找。按年限顺序查找。4)倒查法:倒查法: 与顺查法相反。与顺查法相反。5)抽查法:抽查法: 一种利用检索工具进行重点抽查检索的方法。一种利用检索工具进行重点抽查检索的方法。 2、回溯检索法: 以文献后面所附的参考文献为线索,逐以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。一追溯查找相关文献的方法。 ( 参考文献的重要性!参考文献的重要性! )3、循环检索法: 交替使用回溯法和常规法来进行文献检交替使用回溯法和常规法来进行文献检索的综合检索方法。索的综合检索方法。 4.3.2 信息检索技术1、信息检索技术的概念 信息检索技术是应用于检索提问与文献表示的匹配比较的技术。2、信息检索技术的类型( 1) 准确匹配 (exact match): 要求文献 (标识 )中包含的需求模式必须与检索提问式所表达的模式完全匹配 ,才能作为命中文献输出,目前大型实用系统采用的布尔逻辑检索、原文检索和字符串检索技术均属于准确匹配技术。 ( 2) 局部匹配 (partial match): 只 要求文献 (标识 )中包含的需求模式与检索提问式表达的模式部分匹配 ,即为命中文献输出。它又可分为个体匹配和网络匹配两种类型。( 3) 其他综合技术 ( 聚合公司 ):数据库技术、分布异构资源导入技术、输出技术等4.4.1 信息检索效果的评价指标 (1/3)一、信息检索效果的评价指标应包含的指标内容1)数据库的规模和内容:)数据库的规模和内容: 覆盖范围、索引组成、 更新周期 ;2)索引方法:)索引方法: 自动索引、人工索引、用户登录;3)检索功能:)检索功能: 布尔查找、复杂布尔、相邻和相邻 AND OR查询、截词查找、字段查找、大小写有别、概念检索、词语加权、词语限定、特定字段限定、默认值、中断退出、重复辨别、上下文关键词、查询集操作等;4)检索结果:)检索结果: 相关性排序、显示内容、输出数量选择、显示格式选择;5)用户界面:)用户界面: 帮助界面、数据库和检索功能说明、查询举例;6)用户负担:)用户负担: 用户界面、相关文献和信息过滤功能等。 7)其他:)其他: 查准率和响应时间。二、有关指标的描述以下介绍: 信息检索查全率信息检索查全率 、 信息检索查准率信息检索查准率 、 信息检索漏检率信息检索漏检率 、 信息检索误检率信息检索误检率 、 信息检索响应时间。信息检索响应时间。4.4.1 信息检索效果的评价指标 (2/3)1、信息检索查全率、信息检索查全率查全率 =相对查全率 =式中,式中, a为 相关的文献 的 命中 数; c相关文献 的 遗漏 数。 2、信息检索查准率、信息检索查准率查准率 = 相对查准率 =式中,式中, b为不 相关的文献 数(噪声)。 4.4.1 信息检索效果的评价指标 (3/3)3、信息检索漏检率、信息检索漏检率漏检率 =4、信息检索误检率、信息检索误检率误检率 = 5、信息检索响应时间及其他指标、信息检索响应时间及其他指标传统的评价指标还有:1)收录范围 : 一个系统收录的文献是否齐全,包括专业范围、语种、年份与文献类型等,这是提高查全率的物质基础;2)工作量 : 从系统获得相关文献,必需消耗的精力和工作时间;3)可用性 : 按可靠性、年代与全面性的因素看检出文献的价值;4)外观 : 检索结果的输出形式。4.4.2 提高检索效果的方法 (1/2) 1、提高检索人员素质1)提高检索人员的知识素质2)提高检索人员的思想素质2、优选检索工具和数据库3、优化检索策略与步骤4、精选检索词1)不使用常用词 2)避免使用多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论