《文献检索》课件-2 文献与文献检索_第1页
《文献检索》课件-2 文献与文献检索_第2页
《文献检索》课件-2 文献与文献检索_第3页
《文献检索》课件-2 文献与文献检索_第4页
《文献检索》课件-2 文献与文献检索_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2

文献与文献检索2.1文献及其特征2.2文献检索2.3相关性匹配2.4检索语言2.1文献及其特征文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切载体,不同类型的文献在科学研究和技术创新中发挥着十分重要的作用内容特征:是指与文献内容所表述的主题、观点相关的特征,如主题词、关键词、摘要、分类等外部特征:是指文献内容以外的文献其他相关特征,如篇名、作者、出版者、出版物名称、作者单位、出版日期、文献类型等。思考:不同类型文献的内容特征和外部特征一样吗?2.1文献及其特征拓展知识:检索入口与检索字段文献检索就是文献标引者与检索者依据文献的内容特征和外部特征作相关性匹配的过程,文献的内容特征与外部特征共同组成文献的检索入口,满足用户的文献需求。检索字段是检索工具中反映文献特征,作为检索入口的特定标识,通用的检索字段包括主题词、题名、摘要、关键词、作者、机构、出版物名称、出版日期等。特定的检索字段包括专利文献的申请人、发明人、专利号和IPC号、图书的ISBN号、标准文献的标准号、学位论文的学科或导师等。2.2文献检索文献检索(InformationRetrieval)是指运用一定的策略和技术获取文献的过程,具体来讲就是用户以满足特定检索条件的文献为目的,运用一定的检索技术,借助检索工具通过信息线索查找文献的过程。文献检索基本原理2.3相关性匹配文献检索的实现过程就是用户的检索条件(检索词)与检索工具中的文献特征标识进行相关性匹配的过程,特征标识与检索条件一致的文献就是检索的命中结果,即检出文献。按照匹配方式可分为形式匹配和语义匹配。形式匹配一般不考虑检索词的语义,只要求目标文献包含与检索词形式上一致的特征;可以分为精确匹配和模糊匹配,精确匹配是指目标文献满足“被检索字段的内容和形式与检索词完全相同”,模糊匹配则包括截词符匹配、自动分割匹配、邻近匹配及词频匹配等多种类型2.3相关性匹配语义匹配更强调在理解词语意义的基础上进行相关性匹配,以现代搜索引擎为代表的检索工具纷纷建立知识图谱并引入检索系统,语义检索成为真正理解检索意图的信息搜索过程2.3相关性匹配形式匹配:精确匹配形式匹配:模糊匹配语义匹配形式匹配一般不考虑检索词的语义,只要求目标文献包含与检索词形式上一致的特征语义匹配更强调在理解词语意义的基础上进行相关性匹配思考:形式匹配和语义匹配对检索结果有什么影响?2.4检索语言检索语言是指文献存储与检索过程中用于描述文献特征和用户检索需求的一种专门的人工语言,其实质是检索和标引之间的约定语言。可分为分类检索语言、主题检索语言和代码检索语言分类检索语言是将表示各种知识领域的类目按知识分类原理进行系统排列,并以代表类目的数字或字母符号作为文献主题标识的一类检索语言。可分为体系分类语言、组配分类语言和体系组配分类语言三种形式。面向图书文献的分类法主要有:《中国图书馆分类法》(简称“中图分类法”,CLC)、《美国国会图书馆分类法》(简称LCC,LibraryofCongressClassification)、《杜威十进制分类法》(简称DDC,DeweyDecimalClassification)面向专利文献的分类法主要有:《国际专利分类表》(简称IPC,InternationalPatentClassification)、《联合专利分类体系》(简称CPC,CooperativePatentClassification)《理想国》的中图分类名称(/)2.4检索语言主题检索语言是直接以表达主题内容的语词作为检索标识,以字顺为主要排列方式,并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。按照主题法的选词方式,可以分为标题词语言、单元词语言、叙词语言和关键词语言。①

标题词语言(标题法):是用规范化之后的自然语言,即经过标准化处理的名词术语作为标识来直接表达文献主题的文献标引与检索方法。②

单元词语言(单元词法):是在标题词语言的基础上发展起来的,一种基于单元词字面分解与组配后形成的后组式语言,目的是为了克服标题词语言先组式标识的不足。③

叙词语言(主题词法):是指以自然语言词汇为基础、以规范化的叙词(主题词)作为检索标识的文献标引与检索方法。具有严密的语义关系,在词汇选择和控制、组配技术、利用参照系统显示词间关系技术等方面有很多优势,广泛用于各种主题索引和信息检索系统中。④

关键词语言(关键词法):是指将文献原来使用、能描述其主题概念的那些具有关键性意义的词抽出,不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途径的文献标引与检索方法。2.4检索语言代码检索语言是指利用文献中的一些特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论