版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、YCF正版可修改PPT(本科)信息检索与利用NO2教学课件信息检索与利用第2章 信息检索的基本原理与方法2.12.22.3信息检索语言信息检索原理和手段信息检索研究范围与对象2.4信息检索方法和程序2.5信息检索策略2.6信息检索结果的评价方法了解信息检索语言。掌握信息检索的原理和手段。了解信息检索的研究对象和范围。了解信息检索程序、策略和效果评价。第2章 信息检索的基本原理与方法2.1 信息检索语言 检索语言在信息检索中的作用2.1.1 检索语言是根据检索的需要而发明的一种专门的人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 检索语言与检索效果之间有着密切的关
2、系,它在检索过程中起着极其重要的作用。信息检索的全过程包括信息的存储过程和检索过程。当存储信息时,文献标引人员首先要对各种文献进行主题分析,通过分析选出若干能代表文献主题的概念,并用信息检索语言把这些概念标引出来,然后纳入信息检索系统中。当检索信息时,信息检索人员也首先要对检索课题进行分析,并且通过分析明确其检索范围,选出若干能代表信息需要的概念,并把这些概念转换成信息检索语言,然后从信息检索系统中查找用该检索语言标引的文献,从而找到用户所需的信息。 信息检索语言的组成、特点和功能2.1.2信息检索语言的组成1) 实质上信息检索语言是表达、概括文献信息内容的概念及相互关系的概念标识系统。 信息
3、检索语言是由词汇和语法组成的。在这里词汇指的是登录在分类表、词表中的全部标识,一个标识(分类号、检索词、代码)就是它的一个语词,而分类表及词表则是它的词典;语法是指如何创造和运用那些标识(单个标识或几个标识的组合)来正确表达文献内容和信息需要,以有效地实现信息检索的一整套规则。2.1 信息检索语言信息检索语言的特点2) 检索语言不同于自然语言,它所表述的概念只有一种解释,不允许一词多义、多词一义,而使概念的表述模棱两可。检索语言的这种单一性保证了表述概念的唯一性和标引与检索的一致性,从而使信息检索人员全面、准确、快速地检索到含有所需信息的文献。2.1 信息检索语言信息检索语言的功能3) 通过检
4、索语言标引文献的主题概念,不仅能简明地提示文献包含的信息内容及其外表特征,而且还能将同一主题概念的文献集中在一起,使文献的存储集中化、系统化、组织化,便于进行有规律的检索。2.1 信息检索语言 检索语言的分类2.1.3 体系分类语言1)(1) 体系分类语言的定义 体系分类语言是一种直接体现知识分类的等级结构的标识系统。它根据一定的观点,以科学分类为基础,以文献内容的科学性质为对象,运用概念划分与概括的方法,按照知识门类的逻辑次序,从一般到具体,从简单到复杂,进行层层划分,每划分一次就产生许多类目,逐级划分就产生许多不同级别的类目。2.1 信息检索语言(2) 体系分类语言的特点 体系分类法具有按
5、学科或专业集中地、系统地提示文献信息内容的功能,有利于从学科或专业角度进行全面的检索。 体系分类法按结构逐级划分,具有等级结构,便于扩检和缩检。 体系分类法用分类号作为检索标识,不能直接表达概念;检索时,首先要将检索的主题内容转换为分类号,然后进行检索。2.1 信息检索语言 分类法不宜经常修订,列举在分类表中的类目不能随时改变,因而分类法不能及时反映新的科学技术。 分类法是按直线或序列编制类目,遇到跨学科的课题时,与课题相关的文献只能标引在一门学科的类目之下,因此检索时可能漏检。 体系分类语言是一种先组式检索语言,因此,不能按检索课题的需要进行组配检索。2.1 信息检索语言 标题词语言2)(1
6、) 标题词语言的定义 标题词语言是规范化了的自然语言。它以经过标准化处理的名词术语作为标识,来直接表达文献所论及或涉及的事物之间的相互关系(这种关系是借助于参照系统来间接显示的)。2.1 信息检索语言(2) 标题词语言的结构及类型副标题说明语主标题标题词语言结构2.1 信息检索语言混合标题单级标题带说明语的单级标题多级标题倒置标题带限定词的标题标题词语言类型2.1 信息检索语言(3)标题词的书写格式正序式倒序式并列式2.1 信息检索语言(4) 标题词表 标题词表是把标题词按一定方式组织与展示的词汇表。它由编制说明、主表、副表3部分组成。2.1 信息检索语言(5) 标题词语言的特点标题词在词表中
7、按字顺排列,无字级性。标题词语言标引文献,是以事物为中心,从有关该事物出发便于进行特性检索。标题词语言只能通过参照系统进行扩检和缩检,因此,查全率较低。2.1 信息检索语言关键词语言3)(1) 关键词语言的定义 关键词语言是为适应主题目录、主题索引编制自动化的需要而产生的一种主题语言型检索语言,是文献量迅猛增长、信息传播速度加快的必然产物。 关键词是指在文献的标题、摘要或正文中出现的,对表达文献内容具有实质意义,能作为检索入口的,起关键性描述作用的词汇。 关键词语言,就是针对文献中的关键词选定或抽出,不做或极少做词汇控制,按字顺排列,从而提供检索途径的一种检索语言。2.1 信息检索语言(2)
8、关键词语言的特点 关键词语言可实现检索工具编制过程的计算机化,因而降低对编目人员知识和业务水平的要求,降低标引难度,节约人力。利用计算机自动标引文献,编制关键词索引非常迅速,从而大大缩短检索刊物的报道时差。由于这些优点,关键词语言在国外被普遍应用。 说明:关键词语言直接使用自然语言,因此用它作为信息检索语言,质量较差。2.1 信息检索语言单元词语言4) 单元词又称为元词,它是从文献中抽取出来并经过控制处理的,能表达文献主题的最小、最基本的词汇单位。它可以是一个单纯词,也可以是一个合成词。这些词具有一个共同的特点:它们在概念上不能再进一步分解,如再分解,就再也不能表达原来所代表的特定概念,从而失
9、去检索本意。 单元词语言就是经过词汇控制的,能表达文献主题的元词集合。 元词的灵活组配性使它处理文献的能力很强,但在检索中也产生了相当的误检,因此,这种语言现在很少用,它被叙词语言所代替。2.1 信息检索语言叙词语言5) 叙词是经过词汇控制的,在标引中用来显示文献主题,在检索中用来构成提问式的一种检索词汇。 叙词语言采用科技术语作为标识文献主题概念的标目。叙词语言可谓是博采各种信息检索语言之长,吸取了多种信息检索语言的原理和方法。叙词语言是一种采用规范化的单词或词组,由标引人员或读者自行组配,来表达文献(或课题)主题概念的一种后组式索引语言,或者叫做后组式的检索语言。(1) 叙词语言的定义2.
10、1 信息检索语言(2) 叙词的组配原则概念相交概念并列概念限定2.1 信息检索语言图2-2 概念组配示意图2.1 信息检索语言(3) 叙词表 主表。主表即叙词字顺表,包括全部的叙词和非叙词;叙词条目下列有与该词有关的所有上位词、下位词、被代替词和相关词,从而可以详细了解到这类词的组成情况,同时也可以得到相关文献的“参见”项,以便扩大检索,提高查全率。 辅表。辅表包括叙词等级索引、叙词分类索引、叙词轮排索引。叙词等级索引按概念的等级关系排列,即将有上下从属关系的词按等级集中在一起,这样的一组词称为词族,最上位的一级词称为族首词,全部款目按族首词的字顺排列。2.1 信息检索语言(4) 叙词语言的特
11、点 叙词语言有一套较完整的参照系统,能显示叙词之间的相互关系,可供扩检或缩检用。 利用叙词的词族索引和范畴索引,还可以按学科分类进行族性检索。 叙词语言直接用叙词作为检索标识,不必转换,具有语言的直接性。 叙词语言是后组式检索语言 叙词表的等级结构,便于增删、修订叙词。科学技术有了新的进展,增添相应的叙词后,就能标引和检索这些新科技的文献。2.1 信息检索语言2.2 信息检索原理和手段 信息检索原理与类型2.2.1信息检索原理1) 人类的信息检索行为总是从特定的信息需求开始,并在特定环境和信息检索系统中完成,这里所说的环境包括产生需求的环境、信息检索系统的运行环境和其他制约因素。 广义的信息检
12、索包括信息的存储和检索两个过程。信息的存储就是将搜索到的一次信息,经过著录其特征(如题名、著者、主题词、分类号等)而形成款目,并将这些款目组织起来成为二次信息的过程。信息的检索是针对已存储好的二次信息库进行的,是存储的逆过程。存储是为了检索,而为了快速而有效的检索,就必须存储。没有存储,检索就无从谈起。这是存储与检索相辅相成、相互依存的辩证关系。信息检索类型2)(1) 依检索内容划分数据信息检索事实信息检索文献信息检索2.2 信息检索原理和手段(2) 按照信息存储和检索的方式和技术划分 手工检索。手工检索是指人们通过手工的方式来存储和检索信息。 计算机检索。计算机检索是指人们利用数据库、计算机
13、软件技术、计算机网络以及通信系统进行的信息存储和检索,其检索过程是在人机协同作用下完成的。2.2 信息检索原理和手段 信息检索手段2.2.2 传统信息检索1)优点可以参阅检索工具中的附图。可对不同的检索工具同时进行对比,从而提高检索质量。在检索过程中可以随时获取反馈信息,及时调整检索策略。检索条件简单,成本低。2.2 信息检索原理和手段缺点手工检索工具提供的检索点有限,很难进行多元检索。速度慢、效率低,检出的文献款目必须抄录。难以找到涉及几个概念组合的多主题的文献。2.2 信息检索原理和手段现代信息检索2) (1) 单机检索。单机检索是计算机检索的最初形式,随着计算机存储介质的发展变化,也在不
14、断发生变化。目前主要有计算机磁盘检索、计算机磁带检索和计算机光盘检索3种形式。 (2) 网络检索。网络检索是近十几年发展起来的,它目前主要有图书馆局域网的检索、联机检索及Internet信息检索3种形式。2.2 信息检索原理和手段传统信息检索与现代信息检索的比较3)(1) 检索语言方面(2) 概念的组配方面(3) 检索入口方面 (4) 检索 结果方面2.2 信息检索原理和手段2.3 信息检索研究范围与对象 信息检索的研究范围2.3.1 信息检索的研究范围包括一切与信息存储与检索有关的系统、过程、理论和方法。一切可供存储和检索利用的信息类型,如文献、数据、事实、知识、声音、图形等;各种信息检索系
15、统及其运行过程,如信息采集、标引、组织、存储、处理、匹配、传送等各种过程中使用的方法;以及在信息检索实践和研究的基础上形成的各种理论和假设,均包括在这个范围内。信息类型侧重于文献,其次是数据和事实。 信息检索的研究对象2.3.2(1) 信息检索理论 它主要包括检索语言与标引理论、信息检索的数学模型、知识表示理论、相关性理论,以及有关的哲学问题。2.3 信息检索研究范围与对象(2) 信息检索系统 它是实现信息检索的物质基础,是现实的研究对象,主要研究其结构、功能、演变,其设计开发技术、管理维护技术和评价技术,还研究它与其他信息系统乃至整个外部世界的关系。其中,数据库是信息检索系统的核心部分之一。
16、数据库的建造和维护是非常重要的信息技术。数据库的质量直接影响信息检索系统的功能和效率。2.3 信息检索研究范围与对象(3) 计算机信息检索 它涉及许多计算机设备、软件技术、存储技术革新、检索技术、系统管理和经营知识、市场营销技术等,是一门综合性很强的技术。2.3 信息检索研究范围与对象(4) 检索策略与方法 它是用户从信息检索系统中获取有关信息所必需的。好的检索策略是检索成功的必要前提,计算机的应用为检索策略和方法的发展提供了有力的支持。近30年来,涌现了许多新颖而有效的检索技术和方法,如布尔检索、位置检索、截词检索、加权检索、聚类检索等,人们利用、研究、评价和完善现有的各种检索策略和方法,研
17、究开发新的更有效的策略和方法。2.3 信息检索研究范围与对象(5) 用户研究与培训 用户是信息检索系统的生命,无论是系统的研制开发、管理维护、功能和服务的扩展,还是系统评价,都离不开用户研究工作。用户培训是用户研究的继续,是与用户建立紧密联系和发展新用户的一种非常有效的措施。此外,还有自动标引、自动分类和自动摘录,以及相关设备等研究领域。2.3 信息检索研究范围与对象2.4 信息检索方法与程序 信息检索方法2.4.1 追溯法是指在没有检索工具的情况下,人们利用书、刊之后的引用或参考文献查找资料的方法追溯法1) 常用法这是指利用各种类型检索工具,通过技巧查找资料的方法。常用法又可分为顺查和倒查两
18、种。 顺查法:即由远而近的查找方法。如已知某研究课题的起始年代,需要了解它的全面发展情况时,可从最初研究的年代开始,由远及近地进行查找。 倒查法:也称为叫逆查法。和顺查法相反,倒查法是由近及远的查找方法,这种方法常用于正在研究课题的过程中。常用法2)2.4 信息检索方法与程序循环法3) 循环法又称为分段法,这是前两种方法的结合,即首先利用检索工具查找一部分资料以后,为了了解其前因后果,再利用这部分资料的引用文继续追查的方法,利用这种方法能够保证所查的资料较全面、系统。2.4 信息检索方法与程序 信息检索程序2.4.2 信息检索之际,首先要对课题进行充分的了解,掌握课题有关的基本知识,详细摸清课
19、题所需资料范围及要求,以及弄清课题有关的名词、术语等。分析课题1)2.4 信息检索方法与程序 根据检索人员已掌握的资料情况,确定采用何种检索方法。如果是新立的课题,一般采用顺查法和追溯法结合查找,正在进行中的课题一般用倒查法。选择检索方法2)2.4 信息检索方法与程序 在检索过程中,根据所掌握的有关课题的资料,确定检索途径。一般情况下,所研究的课题较专深、单一时,常用主题途径;课题所涉及的内容较复杂时,常用分类法。确定检索途径3)2.4 信息检索方法与程序 在确定检索途径之后,根据检索标识,通过有关索引进行信息检索,查找信息线索。查找信息线索4)2.4 信息检索方法与程序 通过检索获得信息线索
20、后,确认有一定的参考价值,需要详细查阅信息的全文时,即可根据文摘指出的信息出处,向有关部门索取原始信息。索取原始信息5)2.4 信息检索方法与程序 首先利用国内检索工具或用中文编辑的报道外文的检索工具入手检索。这样,检索者从自己熟悉的文字可以很容易地掌握课题的概况,并可以从中选择出切题的关键词、主题词,为进一步查找外文检索工具提供方便。 先国内后国外1)2.5 信息检索策略 信息语言复杂多变,作者使用的语词不尽相同,为了避免漏检,检索时尽量多选几个同义词、近义词作为检索词。检索时多选几个同义词、近义词2)2.5 信息检索策略 当要求查全率高而不计查准率时,可利用上、下位词进行检索。巧妙地利用上、下位词的关系3)2.5 信息检索策略 在检索时,尽量从内容上选词,以避免有关问题因选词不当被漏检。尽量避免从字面出发选择检索词4)2.5 信息检索策略 某些课题,在检索中反复查找而没有结论时,应考虑倒置词序的可能。检索词序的准确与否是检索成败的关键。变换检索词的词序5)2.5 信息检索策略 检索工具中的参见(see also)项,把内容有关的主题联为一体,以便族性检索。 例如,CA中每一大类末尾均列有与该类有关的全部相关大类和具体相关文摘。绝大多数检索工具中的主题词表、主题索引或文摘部分中均没有参见项,检索时分别
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 绿色金融政策与企业可持续发展
- 影视产业发展现状及市场分析
- 新兴应用领域中锂电池的应用趋势分析
- 人力资源管理信息化趋势探讨
- 农业产品质量检测技术与方法
- 博物馆展陈空间规划与照明设计
- 中医推拿在康复医学中的应用
- 商业计划书制作与市场分析
- 健康饮食菜谱与营养搭配技巧
- 中国绿色建筑设计与节能技术发展报告
- 精神科病人口服药护理
- 2025上海市宝山区青年储备人才公开招聘30人高频重点提升(共500题)附带答案详解
- 2025年四川巴中市南江县考试招聘事业单位人员49人管理单位笔试遴选500模拟题附带答案详解
- 《艾滋病教学课件》课件
- 15《制作塔台模型》课件科学六年级下册教科版
- 防范遏制矿山领域重特大生产安全事故硬措施解读
- 高压氧舱培训
- 胰十二指肠切除术后并发症
- (高清版)DB14∕T 2920-2023 公路桥梁基桩桩底岩溶检测技术规程
- 《路遥人生》读书分享课件
- GB/T 44111-2024电化学储能电站检修试验规程
评论
0/150
提交评论