文献信息检索基础知识.ppt_第1页
文献信息检索基础知识.ppt_第2页
文献信息检索基础知识.ppt_第3页
文献信息检索基础知识.ppt_第4页
文献信息检索基础知识.ppt_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 文献信息检索基础知识,一、文献检索课的意义 (一)学会获取各类信息的方法,减少大脑记忆的负担 (二)培养高素质复合型人才,是终身教育的基础 (五种能力的培养:自学、研究、思维、表达和组织管理)+创新能力 (三)获取知识的捷径 (四)科学研究的向导 (举例) 避免重复研究,节省查找文献的时间,二、基本概念: 1、信息(information)的概念:信息是事物的存在的形式和运动状态的表征 。,信息的基本属性,知识性或客观性 记录和传播性,2、情报(information)的概念:信息或知识的有效传递。,3、文献(document)的概念:记录 知识的一切载体。 4、文献检索的含义,信息存储 信息检出,三、文献的分类,(一)按加工程度分,(二)按文献载体类型,(三)按文献出版形式,图书:常用文献信息数据库检索指南 ISBN 7-5025-8655-5 国际标准书号 国别语种代码 出版社代码 顺序号 校验号,期刊:政法论坛 ISSN 1000-0208 国际标准刊号 (国际标准连续出版物编号) 国内统一刊号 CN 11-1314 邮发代号 82-121,特种文献:出版形式较特殊,无规律,多不公开发行。,科技报告(technical report) 会议论文(conference paper) 专利文献(patent document) 学位论文( dissertation) 标准文献(standard) 政府出版物(government document) 产品资料(product literature) 技术档案(technical records),四、文献检索原理,(一)文献检索原理(文献存储与检索原理图) 存储过程 检索过程,文献内容,主题概念,主题分析,文献描述,检索需要,主题概念,主题分析,文献描述,检 索 语 言,检索标识,提问标识,检索工具,结 果,(二)检索语言 1、概念:用于描述文献的外部及内部特征所用的语言。 2、分类:,检索语言,3、分类语言:以号码为基本字符,用分类号 表达文献主题概念的检索语言。 (中图法、人大法) (1)中图法结构体系如下: 共分5大部类,22个大类,每个大类下又细分为2 级、3级 类目,按照学科之间的内在联系从总 到分,从一般到具体逐级展开。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。另外还用一些辅助符号,如:F251.2 .为分段标记。,中图法(第三版)主表展开示例(简表) 基本部类 大类 二级类 三级类 马列、 毛泽东思想 哲学 社会科学,A,C,D,E,F,:,:,:,K,自然科学,N,X,综合性图书,Z,马列、 毛泽东思想,哲学,经济,F0 政治经济学 F1 世界各国经 济概况等 F2 经济计划与 管理 F3 农业经济 F4 工业经济,F20 国民经济 F21 经济计划 F22 经济计算 F23 会计 F24 劳动经济 F25 物资经济 F27 企业经济 F28 基本建设 经济,B,中图法(第三版)主表展开示例(祥表) 三级类 四级类 五级类,F20 国民经济 F21 经济计划 F22 经济计算 F23 会计 F24 劳动经济 F25 物资经济 F27 企业经济 F28 基本建设 经济,F250 物资经济理论 F251 物资管理 F252 物资流通 F253 物资企业 经营与管理 F259 世界各国 物资经济,F251.1 物资管理 体制 F251.2 物资计划 F251.3 物资统计,分类号,类名,+,类目,F251.3 /1 或F251.3 “1”种次号,索书号,1,=,4、主题语言:用自然语言中的名词、词组、句子描述文 献主题概念的检索语言。 主题词:表达文献主题概念的词叫主题词 。当使用主题词来表达文献内容特征时叫主题标引(标识)。 主题语言的优点: 1)直观 符合人的辩识习惯 2)专指性强 主题词标识经过严格的规范化处 理,查准率高。 3)灵活 词与词的概念组配揭示文献中各种主题。 4)集中性 将不同学科的同一主题文献集中在一起。 例如有关“鲁迅”的文献资料,分类法将其 分散在文学、艺术、文化、历史各个门类 查找费时,而主题法在“鲁迅”标题下,直接 反映出全部有关“鲁迅”的文献资料。,几种主题语言的比较,汉语主题词表的组成结构,世界各国政区名称,自然地理区划名称,组 织 机 构,人 物 名 称,附 表,字 顺 主 表,辅 助 索 引,词族索引,范畴索引,轮排索引,英汉对照索引,汉表 主表的著录格式(例1) 汉拼 Guding zichan 主题词 固定资产 05HB 范畴类号 英文 Fixed assets “代” 项 D 财产目录 “分”项 F 非生产用固定资产 生产用固定资产 无形固定资产 新增固定资产 “属”项 S 国民财产 “族”项 Z 国民财富 * “参”项 C 国家资金、基本建设,汉表 主表的著录格式(例2) Tian zhu ren 天竺人 Sindus; Sindhus “用”项 Y 古印度人 词族索引(例3) 族首词 法(法律) * 一级下位词 . 国际法 04LA 二级下位词 . .国际公法 三级下位词 . . .海洋法,五、计算机检索的基本知识 1、计算机检索系统的构成 由硬件、软件、数据库组成 2、数据库 概念:存储在计算机中,可按通常方法 进行检索的一系列相互关联的数 据集合(有序排列)。,类型 参考数据库 源数据库 混合型数据库,书目数据库 (文献型) 指南数据库,目录数据库 文摘、索引数据库,人物传记数据库 机构名录数据库 产品数据库,数值数据库 文本数值数据库 术语数据库 全文数据库 图象数据库,书目数据库(文档)的结构: 书目数据库主要用于联机检索服务,通常称文挡。 文档(file):若干逻辑记录组成的信息集合,是数据库的基本形式。 记录(record):数据库中一个独立的信息单元,是文挡的构成单位,相当于一篇文献的款目(条目)。 字段(field):在一个记录中的独立的著录项,是记录的构成单位,相当于一篇文献的著录项目。 字段包括:文摘字段、题名字段、著者字段、主题词字段等 子字段(subfield):字段的构成单位,如著者字段中第一作者为子字段1,第二作者为子字段2。,3、计算机检索的类型 计算机信息检索起源于20世纪50年代,经过半个多世纪的发展,目前,常用的检索形式有联机检索、光盘检索、网络检索等。 (1) 联机检索(online search) 指用户借助于计算机终端和通信线路与计算机数据库中心直接进行对话的一种检索方式。用户使用终端设备与远程中央计算机相连,运用规定的指令操作,如:Dialog联机检索,3、计算机检索的类型 (2)光盘检索(CDROM search) 光盘单机检索最终还是网络、联机检索。 光盘联机检索,微机,光驱,检索终端,微机,局域网,服务器,光驱,检索终端,3、计算机检索的类型 (3)网络检索(networked search ),全球性的分布式结构 开放式的信息环境 跨国界的信息流 正式与非正式信息交流渠道共存 信息缺乏有效的组织管理,4、各种机检的比较,检索系统的构成,内容,组成,手工检索系统 (印刷出版物),计算机检索系统 (机读数据库),主体部分,正文部分 条目(记录) 著录项,主文挡 记录 字段,索引,辅助索引,倒排文挡 主题词索引 分类码索引,主题表 分类表,主题词表 分类表,使用指南,说明、样例,Help, F1,其它,资料来源索引,系统,5、计算机检索方式 (1)命令检索(command search) 使用一些特定的操作命令(包括指令和检索式) 来实施检索。适用于有经验的专业检索人员, 联机检索用得多。 (2)菜单检索(menu search) 是常用、方便、易掌握的检索方式。只需根据 菜单的的指引,通过提示、选项、填空便能一步 一步地完成检索,常用于光盘及网络检索。缺点是 步骤多,时间长,检索功能及精度不如命令检索。 (3)超文本检索(hypertext search) 操作时用鼠标点击相关的知识单元,检索便追踪下去, 进入下面各层菜单,常用于多媒体光盘及网络检索。,6、计算机检索手段(检索方法、技术、方案等) 目的是为了编制一种机器可识别和执行的检索式。 机检中检索式是检索策略的具体表述,而检索策略是 检索步骤的科学安排。 下面以 DIALOG 检索系统为例,讨论检索的基本 组配方式及操作指令。 (1)常用算符 逻辑算符:在各种检索方式中常用,也称布尔 (Boolean) 算符,用来表示两个检索词之间的逻 辑关系,常用的有三种:,3种逻辑关系的区别,A,B,A,B,A,B,3种逻辑关系的区别,例:检索题:跨国公司经营管理研究 (营销、质量、财务) 检索提问式: (跨国公司+跨国企业+跨国经营)* 管理, 位置算符:表示两个检索词之间的位置邻近关系, 能避免布尔逻辑算符不考虑检索词位置关系而引起的 某些检索误差。 常用的位置算符主要有: (W)或() “With”表示两个检索词必须紧挨着,词序不能颠倒,中间不能插任何词,但中间可有一个“ ”“”“,”。 A(W)B 或 A()B 例:building(W)construction 命中:“building construction” 或 “ buildingconstruction” (nw)它联结的检索词在记录中词序不能变,但可插入0n个 词,如: building(1W)construction . 命中记录除前面,可能会有“ building and construction ” “ building under construction”等形式 如:building(2W)construction 除前面形式外, 可能会出现“building in composite construction” “building design and construction” “building code and construction”等 (N)“ Near”的缩写,表示两侧的检索词词序 可颠倒,但在两词之间不能插词(两词必须紧挨着) (nN)表示两词之间最多可插入n个词,词序可变。,如:information(1N)retrieval 可检出:information retrieval retrieval of information 等形式。 (F)“Field”的缩写,表示必须在记录中的同一字段(如题名字段、文摘字段)中出现,词序可变。 如:Pollution(f)control 可检出:control and management of industrial pollution (S)“subfield”,两词必须在记录的同一句子或同 一子字段中出现,词序可变 (L)“ Link”,表示两词必须在同一规范词单元内出现,词序可变。, 截词符(提高查全率): DIALOG 用“?”号表示, 但有些系统用“”等表示。(如美国专利网上检索) 有限截词 “ ? ?”表示词干后最多允许加一个字符, 如:cat?可检出 cat, cats等。 “?” “?” “?”词干后允许加一个以上字符。 如:comput? 可检出 compute, computer, computed, computing, 等词。 无限截词 “?”词干后可加任意数量的字符,但词干不能太短。 如:comput? 可检出compute, computed, computer, computing, computable, computerization等相关词。,中间截词 “?”在一个检索词中间插入一个或多个截词 符,表示一个或多个字符存在。用于解决单复数及美英不同拼法的问题。 如: wom?n 可检出woman, women 检索字段符 根据文献的描述特征分为,基本索引字段 辅助索引字段,/ TI (Title 篇名) /AB (abstract 文摘) /DE (descriptor 规范词) /ID(identifier 专用词),AU= (Author 著者) JN= (Journal 刊名) PY= (Publishing Year 出版年) SO= (Source 出处) CO= (coden 代码),例:S (heat or thermal)/TI and PY=1999,基本索引字段,辅助索引字段, 检索字段符,检索式举例 例:S (air + water)( )pollut? S (smoking or tobacco) and heart(w) disease? 混合组配时运算次序为: 先括号内,后括号外 位置算符(W) (N) (S) (F) 布尔逻辑算符,其优先级为NOT,AND,OR,7、计算机检索的基本步骤,检索课题,主题分析,选择检索系统,选择数据库,确定检索词或检索点,制定检索式,计算机处理,索取原文,词表,结果检验,分析,例:跨国公司经营管理研究,六、国外主要联机检索系统 “DIALOG”联机检索系统 “STN”(国际科技信息网络系统) “O

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论