




已阅读5页,还剩101页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章文献检索基础知识 文献检索的基本原理检索语言opac联机公共检索系统文献检索的方法 检索途径和检索步骤计算机检索技术 文献检索定义 从广义的角度 文献检索是指把文献按一定方式组织和存储起来 并针对用户的需求找出所需文献的过程 亦称信息检索 信息组织和信息检索 从狭义的角度 信息检索 文献的查找过程 第一节文献检索基本原理 信息用户 检索者 根据自己的需求将检索提问标识与存贮在检索系统中的文献 信息 特征标识 又叫检索标识 进行比较 比较结果凡是检索提问标识与文献 信息 特征标识相一致 或者文献 信息 特征标识包含了检索提问标识 即两者完全相符或部分相符 那么具有这些特征标识的文献就从检索系统中输出 即为命中文献 见示意图 检索提问标识 信息检索时对信息用户的特定信息需求进行分析 分析课题 从中找出代表其中心内容的词或符号 文献特征标识 文献存贮时对文献的内容进行分析 从中找出代表其文献内容特征的词汇或符号 实例 例如 查找课题为 计算机在工业生产自动控制中的应用 可以从中抽出 计算机 工业生产 生产过程自动化 自动控制 等词作为检索该文献的提问特征 即检索词或主题词 检索时 将提问特征和存贮在文献中的检索标识进行比较 如两者完全相符或部分相符 即可检出用户需要的有关文献 原始文献 分析 文献特征 待查课题 检索提问 文献特征标识 检索提问标识 检索结果 文献存储 标引 过程 文献输出 检索 过程 分析 标引 标引 输出 从图中可以看出 必须用同样的检索标识系统 检索语言 来标引文献特征和检索提问 这是文献检索成败的关键 这就要求信息标引人员和信息用户应当具有必要的检索语言的基本知识 信息检索的类型 按照检索对象的不同 分为文献检索 数据检索和事实检索 文献检索文献检索是以文献为检索对象 目的是从检索系统中找出需要的文献全文 如 为撰写论文所需的参考文献 申报研究课题所需要的相关研究等 数据检索数据检索是以数据为检索对象 是一种确定性检索 检索结果是用户所需要的确切的数据 如 中国的人口有多少 事实检索事实检索以特定客观事实为检索对象 检索结果是某一具体的 客观存在的事实 如 查找 前事不忘 后事之师 最早的出处 信息检索的类型 按照检索方式的不同 分为手工检索和计算机检索 手工检索 用人工来处理和查找所需信息的检索过程 主要依靠印刷型的二次文献 如文摘 目录等 计算机检索 利用计算机和一定的通信设备查找所需的信息 如联机检索和网络检索 信息检索系统的分类 检索是通过检索系统来实现的 按信息的存贮媒体和技术手段来分 检索系统有 手工检索系统和计算机检索系统 手工检索 使用的是印刷型的检索工具 检索过程是由人脑和手工操作的配合来完成的 匹配是人脑的思考 比较和选择 目录 索引 文摘等二次文献 计算机检索 使用的是计算机检索系统 检索过程是在人和机器的协同作用下完成的 匹配是由机器执行的 而人则是整个检索方案的设计者和操纵者 第二节检索语言1 检索语言的定义从上节 检索原理 可以看出 必须有同样的检索标识系统 即检索语言 来标引文献特征和检索提问 这是文献检索成败的关键 这就要求信息标引人员和信息用户应当具有必要的检索语言的基本知识 检索语言是文献检索中用来描述文献特征和表达信息提问内容的一种专门化的人工语言 是信息组织和文献检索共同使用的语言 2 检索语言的种类按结构划分 分类语言和主题语言 1 分类语言分类是人类思维的一种最基本的形式 分类语言 又叫分类法 是以学科分类为基础 按照概念划分的原理 将知识概念从一般到具体 从简单到复杂 从低级到高级的逐级划分 分类语言在我国的发展史西汉刘向和刘歆 别录 和 七略 七分法 宋代郑樵 通志艺文略 清代 四库全书 经 史 子 集 近代皮高品 中国十进分类法 建国后一系列综合性分类法 中国人民大学图书馆图书分类法 人大法 1952年 中小型图书馆图书分类表草案 中小型法 针对性强 中国科学院图书馆图书分类法 科图法 内部文献 国外著名的分类法及其分类思想和体系 杜威十进分类法 ddc 国际十进分类法 udc 美国国会图书馆图书分类法 lccddc1876年美国学者麦维尔 杜威出版设计10个大类 每个基本大类再设置成9个二级类和一个总类 分类语言就是用分类号和类目名称表达学科体系的各种概念 将各种概念按学科性质进行分类和系统排列 体现这种分类体系的就是各种图书分类法 表 例如在我国广泛使用的 中国图书馆分类法 简称 中图法 就是其典型代表 中国图书馆分类法 原称 中国图书馆图书分类法 是我国建国后编制出版的一部具有代表性的大型综合性分类法 是当今国内图书馆使用最广泛的分类法体系 简称 中图法 中图法 初版于1975年 1980年出版的第二版 1990年出版的第三版 1999年出版的第四版 2010年9月出版了第五版 中图法 是以科学分类和知识分类为基础 并结合文献内容特点及形式特征进行逻辑划分和系统排列的类目表 它是类分文献 文献分类排架与分类检索 编制分类检索工具的工具 目前 它在全国图书信息资料组织等方面应用最为广泛 中国图书馆分类法 中图法 第四版 简介 中图法 类目体系是一个层层展开的分类系统 它以科学分类为基础 结合文献分类的需要 在五大部类的基础上展开 组成22个基本大类 即一级类目 这五大部类及其展开的22个基本大类是 马克思主义 列宁主义 毛泽东思想 哲学 社会科学 扩充为9个基本大类c k 自然科学 扩充为10个基本大类 综合性图书 a 马克思主义 列宁主义 毛泽东思想 邓小平理论b 哲学 宗教c 社会科学总论d 政治 法律e 军事f 经济g 文化 科学 教育 体育h 语言 文字i 文学j 艺术k 历史 地理 n 自然科学总论o 数理科学和化学p 天文学 地球科学q 生物科学r 医药 卫生s 农业科学t 工业技术u 交通运输v 航空 航天x 环境科学 安全科学z 综合性图书 o数理科学和化学 一级类目 o1数学 二级类目 o3力学o4物理学o6化学o61无机化学 三级类目 o611化学元素与无机化合物 四级类目 图书馆图书的排架与查询 图书是按索书号排列在书架上的图书查询先确定索书号索书号 由图书分类号和书次号组成 分类号在上 书次号在下 给下列图书标出正确的分类号 只要一级类目 1 windowsxp电脑能手 2 明朝那些事 3 化学应用 4 篮球运动教程 5 会计基础与实务 2 主题语言主题语言 又叫主题法 又按主题词性质不同分为下面三种 标题词语言叙词语言关键词语言 a 标题词语言它是以标题词作为文献内容标识和检索依据的一种主题语言 所谓标题词 是从文献的题目 摘要或正文中抽选出来 经过规范化处理 用以描述文献内容特征的词或词组 标题词受词表控制 标题词一般具有从属关系 如 主标题词和副标题词 或称一级标题词和二级标题词 b 叙词语言它是以叙词作为文献内容标识和检索依据的一种主题语言 叙词是从文献的题目 摘要或正文中抽取出来 用以表达文献基本内容的概念单元 叙词受词表控制 词表中词与词之间无从属关系 都是相互独立的概念单元 检索时 利用这些概念单元组配起来 表达一个复杂的概念 叙词语言特别适用于计算机检索 c 关键词语言它是以关键词作为文献内容标识和检索依据的一种主题语言 关键词是从文献的题目 正文或摘要中直接抽取出来 未经规范化处理的自由词汇 关键词不受词表控制 标引文献时根据文献内容选择恰当的词汇进行组配 以表达文献的内容特征 例如 甘蓝 卷心菜 圆白菜 洋白菜 包心菜 作为关键词时都可以用 但作为标题词或叙词时则只能用甘蓝 取决于词表中的规定 第三节opac联机公共检索系统 opac联机公共检索系统 利用计算机终端来查询基于图书馆局域网内的馆藏数据资源的一种现代化检索方式 通过联机查找为读者提供馆藏文献的检索 opac功能介绍 藏书查询 书刊馆藏查询 馆藏地点 借阅状态等 读者查询 借书情况和借阅历史等网上预约与续借新书推荐信息发布读者留言 馆藏检索系统登录方式 山东英才学院网站 图书馆首页 入馆指南 书目检索 读者登录 超期公告 书目查询 遇见未知的自己 点击题名可看到详细信息 超期公告 新书通报 读者登录 账号为一卡通卡号密码为空 第四节文献检索的方法 检索途径和检索步骤 1 文献检索的方法 1 顺查法根据检索课题的起始年代 利用检索工具 按照从旧到新 由远及近 由过去到现在的顺时序 逐年查找文献信息的方法 特点 查全率高 适用于围绕某一主题普查一定时期内的全部文献信息 或者说适用于那些主题较复杂 研究范围较大 研究时间较久的科研课题 2 倒查法根据检索课题的起始年代 利用检索工具 按照从新到旧 由近及远 由现在到过去的逆时序逐年前推查找文献信息的方法 特点 查得的信息新颖性强 查全率不高 多用于新课题 新观点 新理论 新技术的检索 检索的重点在近期信息上 3 抽查法利用检索工具 针对某一学科的发展重点 文献信息量较大的阶段 选定一定时间范围进行逐年检索的方法 特点 必须熟悉学科的发展特点 把握学科发展的高峰期和低谷期 如 检索 克隆羊多莉 的相关信息 4 回溯法也称引文法 是一种跟踪查找的方法 即以文献后面所附的参考文献为线索 逐一追溯查找文献的方法 适用于检索课题的背景和立论依据等方面的文献 如 科学引文索引 sci 中国科学引文索引 cssci 2 文献的检索途径文献检索是根据文献信息的某一特征 从各种不同的角度进行检索 即为文献的检索途径 检索途径有以下几种 以文献内容特征进行检索以文献外部特征进行检索 分类途径主题途径检索途径著者 作者 途径题名途径序号途径其他途径 按内容特征 按外部特征 1 分类途径按照学科分类体系来编排和检索文献的一种途径 常用的工具有 分类目录 分类索引 等 2 主题途径从文献中抽选出来的 代表文献内容实质词汇 主题词 包括关键词 标题词 叙词等作为检索标识 进行文献检索的一种途径 3 著者途径根据已知文献著者 作者 的姓名来查找文献的途径 4 名称途径根据文献的名称来查找文献的途径 如 书名目录 刊名目录 5 序号途径以文献的编号为特征编排和检索文献的途径 如 专利号索引 报告号索引 等 6 其他途径有些检索工具还附有一些特殊索引 可提供从特殊途径查找所需文献的线索 如 ca 中的分子式途径 环结构式途径等 3 文献的检索步骤 1 分析研究待查课题检索的目的是什么 课题属于什么学科专业 需要什么类型的文献 中文 外文文献 所需文献的年代范围等另外 还需要了解与检索课题相关的专业背景知识 有关的专业名词 术语等 2 选择检索系统 检索工具 这就需要了解有关检索工具的收录范围和所收录的文献类型等 再结合检索课题来考虑 选择最能满足检索要求的检索工具 或计算机检索系统 3 选择检索途径 即检索入口 找出检索标识选用什么检索途径为好 可从以下几方面考虑 从检索课题的要求选择检索途径 从检索工具的编排以及检索工具中所提供的索引种类来选择检索途径 计算机检索还包括了构造检索表达式 用于表达用户检索提问 检索途径决定检索标识例如 分类途径 分类号和类目名称主题途径 主题词 包括标题词 叙词 关键词等 著者途径 著者 作者 姓名 4 查找文献线索 索取原文应用检索工具实施检索后 获得的检索结果即为文献线索 对文献线索进行整理 分析其相关程度 根据需要 利用文献线索中提供的文献出处 索取原文 检索效果的评价 在实际检索时 我们总是希望将检索系统中与所需信息相关的全部记录都检出来 同时这些记录均是我们所需要的 这就涉及到检索效果的问题 检索效果 是指检索系统检索的有效程度 它反映检索系统的能力 检索效果的技术评价指标 常用技术指标 查全率和查准率查全率 recallratio 反映系统检出相关信息资源的能力 查准率 precisionratio 则反映系统排除与检索提问无关信息资源的能力 查全率与查准率之间存在互逆关系 即提高系统的查全率 会使查准率下降 反之亦然 如何计算 查全率 检出的相关信息资源量r 100 系统相关信息资源总量查准率 检出的相关信息资源量p 100 检出信息总量 例如 要利用某个检索系统查某课题 假设在该系统文献库中共有文献4000篇 其中含有 参考咨询 的文献为400篇 对该系统进行检索 检出文献600篇 其中与主题相关的为300篇 那么这次检索的查全率和查准率分别是 计算机检索技术 布尔逻辑算符 与 或 非位置算符 w n截词符 无限截词符 有限截词符制定计算机信息检索策略 b a a b a b aandb 交集a b与and 属于集合a且属于集合b的元素组成的集合 布尔逻辑运算 与 举例 查找 计算机控制啤酒生产过程 课题的相关信息 检索的文献记录中必须同时含有a 计算机 b 控制 c 啤酒 才算命中 其检索式为 a b c或 aandbandc cnki高级检索 逻辑 与 演示 cnki高级检索 逻辑 与 演示 a b a b a b aorb a b 并集a b或or 属于集合a或者属于集合b的元素组成的集合 布尔逻辑运算 或 举例 查找国外有关电视机的资料则检索式为 television tv televisionortv 文献记录中只要有television或tv 或者二者兼有 均符合检索条件 nstl 逻辑 或 检索演示 nstl 逻辑 或 检索演示 b a a b anotb 差集a b非not 属于集合a而不属于集合b的元素组成的集合 布尔逻辑运算 非 举例 查找 除蛋白酶外的各类酶制剂 的资料 检索的文献记录中必须含有a 酶 而不含有b 蛋白酶 才算命中其检索式为a b anotb nstl 逻辑 非 检索演示 nstl 逻辑 非 检索演示 逻辑运算符优先次序 利用布尔逻辑三种算符检索时 有时会同时用上 计算机会按优先顺序自动完成算符运算 其中not优先级最高 and次之 or的最低改变优先级可在检索式中添加括号 例 计算机or电脑 and控制and啤酒 位置算符检索与位置算符 位置算符 是在检索式中用于表示检索词之间位置关系的符号 包括在记录中的顺序和相对位置 布尔逻辑检索考虑的是 检索词在命中记录中是否出现 而不考虑其位置关系 它能避免布尔逻辑算符不考虑检索词位置关系而引起的检索误差 位置运算符 例如 要查找 食品添加剂的制备 的相关文献用逻辑算符与列出检索式为 食品and添加剂and制备 命中记录中既有 食品添加剂制备 的文献 也有 含有添加剂食品的制备 的文献 结果2与检索要求不附 如果通过与位置算符配合使用 可以减少检索误差 请注意 不同的联机检索系统所使用的位置算符的种类和功能有时不完全相同 常用的位置运算符有以下几种 w 算符 with 表示两词相邻 词序不能颠倒 中间不得插入其他词 字母或代码 但允许有空格或标点符号 nw 算符 nword 表示两词中间可插入n个词 但它们之间的顺序不可颠倒 n 算符 near 表示两词相邻 不得插入其他词 但词序可以颠倒 nn 算符 nnear 表示两词中间可以插入n个词 且词序可以颠倒 例如 computer w aided w design可检索出含有computeraideddesign的文献记录laser 1w printer可检索出含有laserprinter和lasercolorprinter的文献记录computer n network可检索出含有computernetwork networkcomputer形式的文献记录 截词符检索与截词算符 截词符检索 计算机检索外文数据库时 运用检索词的词干或不完整词形进行查找的过程称为截词检索 在英文词汇中 只要在词干上加上不同的前缀或后缀 就可以派生出许多相近或不同的词汇 检索者将词干相同 意思相近的词全部输入计算机 既麻烦又容易出错 计算机检索系统采用了截词检索功能 即在检索词的词干上加一个截词符号 以表示对该词干的各种词性的一系列词进行检索 截词方式 按截断字符数量分 有限截词无限截词按截断部位分 前方一致后方一致中间一致中间不一致 有限截词符 有限截词用 作截词符 将n个截词符 放在检索词的词干中或词尾可能变化的位置上 n个 表示截词的位数为0 n个字符 例如 stud 则检出有study等的记录 stud 则检出有studio等的记录 stud 则检出有student studied等的记录 无限截词 无限截词 在检索词干后加一个 也有的数据库用 表示该词词尾允许变化的字符数不受任何限制 例如 comput 则可检出有computer computing computers computeriation等词的记录 液化 liquefactionliquefyliquescence液体 liquit liqu 计算机检索策略 难点和重点 计算机检索策略 是指利用计算机进行检索时 为实现检索目标而制订的检索方案或对策 手工检索过程是由人们用手查 眼看 脑子作判断而完成的 它往往只存在于检索者的脑子里 所以不必写成书面的表达语句 并且可以边查找边考虑 灵活地改变检索策略 计算机检索策略 计算机检索信息时 检索提问与文献标识之间的对比匹配工作是机器进行的 必须拟定周密的检索策略 用计算机能够理解和运算的形式加以表达 然后交计算机执行 因此机检时检索策略的正确与否就显得尤为重要 例如 吸铁石 磁石 磁铁 磁铁 实施计算机检索过程 1 认真分析课题 明确课题含义 2 选择数据库 3 确定检索途径和检索词 4 组配各检索词 认真分析课题 明确课题含义 明确课题含义例如 电子垃圾的处理回收 指的是废弃电脑 手机的处理 不是 垃圾电子邮件的处理 明确自己的情报需求和检索目的即明确自己研究的课题是攻关型的还是探索型的 对信息查找的指标要求是查准 查全还是查新 同时还要弄清所需文献信息的类型 文种 时间范围等 选择数据库 根据上述分析 结合各数据库的收录数年代范围 标引质量 有无全文等情况 选择适合的一个或多个数据库 在检索词相同的条件下 选择不同检索途径的结果差异很大 因此在要求尽可能多的查出文献的情况下 往往需要同时使用多种检索途径 确定检索途径 一般数据库都提供多种检索途径 例如 文章篇名 标题 摘要 关键词 主题词 全文 作者 作者单位 文献类型等 检索某一课题的文献 应当根据数据库的具体情况和检索目的确定检索途径 中文一般选择 篇名 或 关键词 外文一般选择 摘要 数据库提供多个检索项 入口 检索途径 检索词的选择 检索词的选择 原则上要选择能代表课题含义的检索词 必要时可以先查阅有关工具书理解课题含义或手检几篇相关文献作为机检选词的参考 对一个课题 不应该只从现成的课题名称中抽取检索词或词组 应对课题名称进行切分 删除 替换 补充 确定真正能代表课题意义的检索词 从而达到最佳检索效果 切分 1 切分 是对检索课题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民爆物品安全培训系统课件
- 初级电焊考试题库及答案
- 宝玉石基础考试题及答案
- 中式婚礼设计理念策划方案
- 民族舞蹈课件封面设计
- 新质生产力与海洋经济的联系
- 企业网络安全方案活动
- 民族理论常识说课课件
- 民族教育多彩的服饰课件
- 2025年口腔科常见口腔疾病处理技巧模拟考试卷答案及解析
- 染织工艺知识培训课件
- 全屋定制家具安装规范
- 教师在线教学能力提升学习总结
- 交通安全培训(摩托车电动车)
- 医院培训课件:《胰岛素规范化注射》
- 木材加工质量控制与验收考核试卷
- 《布病防控知识》课件
- 低空经济产业标准体系规划研究
- 保育员应掌握的工作技能(完整版)
- 贵州省遵义市(2024年-2025年小学六年级语文)部编版小升初模拟((上下)学期)试卷及答案
- 路灯安装工程项目实施的重点、难点和解决方案
评论
0/150
提交评论