信息检索原理与技术-2010.ppt_第1页
信息检索原理与技术-2010.ppt_第2页
信息检索原理与技术-2010.ppt_第3页
信息检索原理与技术-2010.ppt_第4页
信息检索原理与技术-2010.ppt_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/7/28,1,2. 信息检索原理及技术,2019/7/28,2,2.1 信息检索概述 2.2 信息检索原理 2.3 信息检索方法 2.4 信息检索技术,2019/7/28,3,2.1 信息检索概述,2.1.1信息检索的含义 2.1.2信息检索的实质 2.1.3信息检索的类型和特点,2019/7/28,4,2.1.1 信息检索的含义,信息检索通常是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。因此,完整的信息检索应包括以下两个方面: . 信息标引和存储过程 . 信息的检索过程,2019/7/28,5,2.1.2 文献检索的基本原理,将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。提问特征是指从欲检索课题中选择出能代表信息需求的主题词、关键词或分类号等。,2019/7/28,6,出版物本身的特征 1、出版物的外表特征:出版物名称(书名、刊名、专利名称等等)出版者、出版地、出版时间、国际标准刊号()、标准书号.等。 出版物的内容特征:学科属性。许多的数据库多提供从学科分类和字顺途径对文献信息进行查找获取。 出版物内论文/引文的特征 2. 论文/引文外表特征:题名、作者、合著者等 论文/引文内容特征:一般有学科分类与关键词两种途径,2019/7/28,7,示 例,吕蔚.中国古代文学在对外汉语中的跨文化教学 .华南师范大学学报(社会科学版) ,2010,03 提问特征 : 1.作者:吕蔚; 2.题名:中国古代文学在对外汉语中的跨文化教学 ; 3.期刊信息:华南师范大学学报(社会科学版) ,2010,03; 4.关键词:古代文学、对外汉语教学、跨文化教学,2019/7/28,8,2.1.3 信息检索的类型和特点,.文献检索 2. 数据信息检索 3. 事实信息检索,2019/7/28,9,文献检索,从一个文献集合中找出专门文献的活动。一般以目录、索引、文摘数据库和原文数据库为检索工具。 例如:查找有关“网络传播”方面的国内信息有那些? 检索工具: 中国期刊网、中文科技期刊数据库、万方数据资源系统等。,2019/7/28,10,数据信息检索,以具有数量性质并以数值形式表示的数据为检索对象,是一种确定性检索。检索的结果是经过测试和评价过的各种数据,可用于比较分析和定量分析。它一般以数据大全、手册、年鉴等为检索工具,以三次文献为检索工具。 例如:乙二胺登记号? 登记号: 107-15-3 检索工具:化工产品手册、搜索引擎,2019/7/28,11,事实信息检索,以事项为检索对象,检索结果是有关某一事物的具体答案,也是一种确定性检索。一般利用字词典、年鉴、百科全书、手册等为检索工具。,2019/7/28,12,信息检索系统,1.手工信息检索系统 检索工具:书目、索引、文摘。二次文献,为读者提供文献的出处和线索。全国总书目、全国新书目、全国报刊索引、新华文摘等等。 2.计算机信息检索系统 a、参考数据库:书目数据库(联机公共检索目录、化学文摘等)、指南数据库(机构名录数据库、产品数据库等) b、源数据库:电子图书(超星电子图书、大英百科全书电子版.)、电子期刊(中国期刊全文数据库、万方数字化期刊、数字图书馆杂志电子版、科学电子版.,2019/7/28,13,2.2.3 信息检索语言,检索语言又称标引语言,是系统存储和检索时共同使用的一种约定语言,以达到信息存储和检索的一致性,提高检索效率。,2019/7/28,14,检索语言的类型,体系分类语言 分类语言 组配分类语言 混合分类语言 标题词语言 主题语言 关键词语言 叙词语言 单元词语言,2019/7/28,15,体系分类语言,体系分类语言是按学科逻辑分类的原理,运用概念划分的方法,按知识门类从总到分,从上到下,层层划分,逐级展开组成分类表,并以分类表来标引、存储信息和检索信息。特点是体现学科的系统性,反映事物的平行、隶属和派生关系,有利于从学科的角度进行族性检索,达到较高的查全率。,2019/7/28,16,中图法第四版分类体系组成及结构,2019/7/28,17,中国图书馆分类法(中图法),2019/7/28,18,关键词语言,关键词语言是一种主题语言(采用表达某一事物或概念的名词术语标引、存储和检索的一种语言)。它是直接从原文的标题、摘要或全文中抽选出来的具有实质意义的、未经规范化处理的自然语言词汇作为存储和检索依据的一种检索语言。,2019/7/28,19,示 例,数字技术在影视艺术中的展现 关键词: 1.数字 2.影视 3艺术,2019/7/28,20,2.2 信息检索方法,2.2.1信息检索效率 2.2.2 信息检索的方法和步骤 信息需求分析 制定检索策略 实施检索策略,2019/7/28,2.2.1 信息检索效率,信息检索效率是评价一个检索系统性能优劣的质量标准,它贯穿于信息的存储和检索的全过程。其评价标准包括很多方面:收录范围、查全率、查准率、漏检率、误检率、响应时间、用户负担及输出形式。其评价指标主要是: 查全率 查准率,2019/7/28,22,查全率:检出的相关文献数与系统内相关文献总数之比。 查准率:检出的相关文献与检出的文献总数之比。,2019/7/28,23,2.2.1信息检索的方法和步骤,1.信息需求分析:信息需求是人们在客观或主观上就课题所需信息的要求,是人们检索信息的基本出发点,也是评价检索效果的依据。它包括两个方面: 1. 明确检索的目的和要求 2. 对主题进行分析,2019/7/28,24,示例 课题名称:中国影视分级制度研究,一、检索目的和要求: 目的:申报课题 要求:国内在此方面的研究进展,2019/7/28,25,二、主题分析,中国影视、影视分级、分级制度,2019/7/28,26,检索策略,检索策略是为了达到检索目标而制定的具体检索方案。包括选择检索系统、确定检索途径或检索词、拟定检索程序。,2019/7/28,27,1.确定检索工具:包括检索系统,比如利用那些数据库和搜索引擎等等) 2.确定检索途径:主题、分类或作者 3.实施检索:反复检索 4索取原始文献。,2019/7/28,28,课题名称:中国影视分级制度研究,因为是目前国内的最新进展 确定数据库:中国知网、维普科技期刊数据库、万方期刊数据库 检索途径:关键词:影视、分级、制度(反复检索,其中报告修改检索词和检索字段) 索取原始文献,2019/7/28,29,获取信息线索: (1):著作的区分标志。著作一般以图书形式出版,在来源处著录有出版社、出版地、国际标准书号(ISBN) (2)论文的区分标志。论文一般以期刊的形式发表,在来源处著录有期刊刊名、卷、期、年代、国际标准刊号、语种等;会议论文:有会议名称、主办单位、会议召开地点、时间等,西文:Proceedings 、 Conference、Meeting等;学位论文:有学位名称(如Ph.D)授予学位的校名、导师姓名、论文编号(order number DN9121891) (3)专利说明书。来源出处著录有专利国别、专利号、批准公告日期 (4)技术标准。来源出处著录有standard、spctification、字样及标准机构代号,如ISO 、IEC 、GB.,2019/7/28,30,.3 信息检索技术及其应用,信息检索技术是指利用现代信息检索系统,如联机数据库、光盘数据库和网络数据库检索有关信息而采用的相关技术,主要有布尔检索、词位检索、截词检索和限制检索。,2019/7/28,31,2.3.1 布尔检索,布尔检索技术使用的逻辑算符及含义 (1)逻辑与 (2)逻辑或 (3)逻辑非,2019/7/28,32,逻辑“与”,1. 概念:逻辑与是一种具有概念交叉或概念限定关系的组配。 2. 算符:“ * ” 或 “ AND ” 3. 特点:增强专指度,提高查准率。 4.举例:文学 AND 新闻 ,表示两个概念应同时包含在一条记录中。,2019/7/28,33,逻辑“或”,1. 概念:逻辑或是一种具有概念相同、概念相关或概念并列关系的组配。 2. 算符: “ + ” 或 “ OR ” 3. 特点:扩大检索范围,提高了查全率。 4.举例: 历史 OR 文化 ,表示这两个相关概念分别在一条记录中出现或同时在一条记录中出现。同义词、近义词之间常用or连接。,2019/7/28,34,逻辑非,1. 概念:逻辑非是一种具有概念排除关系的组配。 2. 算符: “ - ” 或 “ NOT ” 3. 特点:提高查准率,影响查全率。 4. 举例: 文学 NOT 新闻,表示检索出的记录中要排除含有“新闻 ”的记录。,2019/7/28,35,2.3.2 截词检索,截词检索是防止漏检,提高查全率的一种常用检索技术,大多数数据库都提供了截词检索的功能。用或?表示。 截词是在检索词的适当位置进行截断,节省输入的字符,达到较高的查全率,常用的有后截词方式。 例如:book?: ?表示截一个字符,为有限截词符。可以检索出book和books的记录。“*”: Comput* 表示截无限个字符,为无限截词符。Compute、Computing、Computer 常用的是“*”。,2019/7/28,36,2.3.3 字段检索,为了确定检索词在数据库记录中出现的字段位置,可采用字段限制查找的范围。常用的字段代码有 标题(TI)、文摘(AB)、作者(AU)、 语种(LA)、刊名(JN)等。 字段检索在网络数据库中一般使用下拉菜单进行选择限制。,2019/7/28,37,实习-1,1.熟悉图书馆主页 2. 检索与所学专业相关的参考图书和期刊论文,并给出标准的题录格式(图书和期刊至少一篇)。 3.自拟一个课题,通过图书馆主页(图书馆的馆藏查询系统和数据库),查找一些相关资料,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论