检索基础知识教学PPT.ppt_第1页
检索基础知识教学PPT.ppt_第2页
检索基础知识教学PPT.ppt_第3页
检索基础知识教学PPT.ppt_第4页
检索基础知识教学PPT.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 3文献检索技术 一 文献检索概述二 文献经典检索技术三 文献检索步骤 一 文献检索概述 在德国柏林大学图书馆的大门上刻着这样的一名言 这里是人类的知识宝库 如果你掌握了它的钥匙的话 那么全部知识都是你的 这把金钥匙就是文献检索方法 现代信息社会 科技文献数量急剧增长 不仅数量庞大 而且增长的速度也令人惊叹 据统计 非科技内容的文献每30 50年才增长1倍 科技文献平均每7 8年增长1倍 如计算机科学的文献 每2 3年就翻一番 科技文献内容交叉重复 文献失效加快 文献出版分散等都给文献的利用带来不便 但是 现代信息传播技术的进步 使文献检索 电子原文传递等现代化信息传播方式得以实现 人们可以利用互联网多途径 多选择 多层次地检索所需文献信息 催生了文献检索技术 一 文献检索定义 文献检索 literatureretrieval 是利用计算机对文献进存储与检索过程 存储过程 将大量的数据按一定的格式输入并存储在计算机中 并以一定的结构有序地存放在数据库中的过程 存储的目的是为了方便检索 检索过程 把用户的需求输入到计算机中 并与存储在计算机中的信息进行查询与匹配 输出满足条件的检索结果 所以文献检索的全称是文献的存储与检索 literaturestorageandretrieval 这是广义的文献检索定义 狭义的文献检索则仅指后半部分 即从数据库中找出所需要文献的过程 文献检索 literaturesearch 是文献查找的含义 二 文献检索原理 文献检索的全称是文献信息存储与检索 原理示意图如下图所示 1 存储过程是把描述 一次文献 特征信息按照检索语言规则 进行规范标引形成 二次文献 并存储在 文献检索系统 中 这就是对一次文献组织加工和记录的过程 即建立 文献检索系统 的存储过程 2 检索过程是读者根据 检索课题 分析出检索提问词与数据库文献记录中的标引词进行对比 当提问词与标引词匹配一致时 即为命中 检索成功 三 文献检索工具及分类文献检索工具概述 1 检索工具的定义检索工具是人们用来存储 报道和查找文献的工具 它具有存储和检索的功能 是附有检索标识的某一范围文献条目的集合 是二次文献 2 检索工具应具备的条件 详细著录文献的外部特征和内容特征 每条文献条目中含多个有检索意义的文献特征标识 如 书名 作者 出版社 isbn等 全部文献必须科学地排列成为一个有机地整体 方便检索 有索引部分 能够提供多种检索途经 3 检索工具的作用 文献高度集中 提高检索速度 提供有规律的检索 消除语言障碍 检索工具的分类按存储内容划分 有目录型 题录型 文摘型 全文型 索引型5种 1 目录型目录型检索工具是以整本图书或期刊的外部特征为报道对象 一般著录文献的名称 著者 文献出处等 目录的种类很多 如国家书目 联合目录 馆藏目录等 报道内容 图书目录 书名 著者 出版社 出版地 出版时间 期刊目录 刊名 编著 出版地 出版者 创刊年 2 题录型题录型检索工具是以书刊中的某篇文献 或章节 的外部特征为报道对象 报道内容 文献篇名 著者 刊名 出版年 月 卷 期 页码 3 文摘型 文摘有与正文等量的信息 报道对象与题录相同 但对文献内容揭示的程度较题录更深入更具体 增加了文献的摘要 文摘按其内容特征可分 指示性文摘 报道性文摘 指示 报道性文摘 示例 题名 论政府招标采购图书的质量控制 作者 饶宗政 王刚 骆瑛 余敏 机构 成都电子机械高等专科学校 刊名 大学图书馆学报 2012 1 51 54 issn号 1002 1027 cn号 11 2952 g2 关键词 政府招标 采购图书 质量控制 文摘 政府招标采购图书的质量控制 一直是图书馆界关心的焦点问题 在实践中 图书馆要认真拟定招标文件 把政府招标 签订合同 图书采购 加工和验收等各个环节的质量控制指标都写进招标文件中 使之成为合同双方共同遵守的法律文件 以此实现对政府招标采购图书的有效质量控制 4 全文型报道对象与题录相同 但增加了文献的全文 按载体不同 全文数据库 中文 外文 期刊等印刷型 5 索引型索引型检索工具有索引 参考工具书 搜索引擎 索引 揭示具有重要检索意义的内容特征标识或外部特征标识 按照一定顺序 如书名 刊名 人名 地名 语词等 按照一定的方法编排 并指明出处 为用户提供文献线索的一种检索工具 常用的索引类型有 分类索引 主题索引 关键词索引 著者索引等 参考工具书 是分析和著录大量具体常用的科学数据与事实 以备查找使用的各种常用工具书的总称 搜索引擎 通过网络机器人建立网络数据库 按存储载体划分 1 印刷型 书本式 卡片式 2 缩微型3 电子型 4 联机型 磁性载体 计算机及通信网络 5 光盘型 光盘 计算机及光驱 6 网络型 internet 网络数据库 检索工具组成 主题部分 索引 目次表 说明 其他 附录 形式 手工检索工具 计算机检索工具 按检索手段分类 发展过程 1 手工检索 是用人工方式查找所需信息的检索方式 2 机械检索 是利用某种机械装置来处理和查找文献的检索方式 1 穿孔卡片检索 2 缩微品检索 3 计算机检索 把信息及其检索标识转换成电子计算机可以阅读的二进制编码 存储在磁性载体上 由计算机根据程序进行查找和输出 单机检索 联机检索 光盘检索 包括单机光盘检索和光盘网络检索两种类型 网络检索 在internet等网络上进行信息存取的行为 手工检索查准率较高 查全率较低 效率低 现已经少用 计算机检索查全率较高 查准率较低 检索速度快 按检索结果分类 文献检索是指将文献按一定的方式存贮起来 然后根据需要从中查出有关课题或主题文献的过程 1 书目检索书目检索是以文献线索为检索对象 换言之 检索系统存贮的是书目 专题书目 索引和文摘等二次文献 此类数据库有 图书馆的书目数据库 全国报刊索引 中国专利公报 中文期刊数据库 世界著名的有 sci 科学引文索引 ei 工程索引 istp 科技会议录索引 等 2 全文检索全文检索是以文献所含的全部信息作为检索内容 即检索系统存贮的是整篇文章或整部图书 如中国知网cnki 文献检索新分法 目前信息检索类型出现一种新的三分法 即文本检索 数值检索 声频与视频检索 1 文本检索文本检索 textretrieval 是文献信息检索的一部分 是指根据文本内容 如关键字 语意等对文本集合进行检索 分类 过滤等 如 doc pdf ppt xls txt等格式 2 数值 数据 检索狭义的数值检索仅指从某数据集合中查出所需要的数据 回答 世界上茶叶产量和茶园面积是多少 之类的问题 3 事实检索事实检索是以文献中抽取的事项为检索内容的检索 或称 事项检索 回答 世界上茶叶产量最大是哪个国家 之类的问题 4 声频与视频检索1 对于音频信息来说 其基于内容检索的主要类型有 语音检索 音乐检索 其他音频检索 2 其基于内容检索的主要类型有 基于颜色特征的检索 基于形状特征的检索 基于纹理特征的检索 忌与视频动态特征的检索 其他检索 四 文献检索方法 文献检索方法归纳为 检索工具法 引文追溯法 分段法和浏览法 一 检索工具法1 顺查法 以课题研究的起始年代为起点 由远而近按时间顺序逐年查找的方法 2 倒查法 与顺查相反 由近而远按时间顺序逐年查找的方法 3 抽查法 针对学科发展的高峰期 选取一定时间段进行查找的方法 二 引文追溯法追溯法是指利用已知文献后所附的参考文献入手 逐一追查原文 再从此原文后所附的参考文献逐一查找下去 直到获得满意的结果 cnki等的引文追溯做得较好 知点节 三 分段法又称循环法 交替法 综合法 即利用检索工具法和追溯法交替使用的一种方法 四 浏览法指直接在一次文献中查找所需的文献 也称直接检索法 该方法带有盲目性 一般只作为对上述各种检索方法的补充 主要用于查找新近发表的文献 数据库一般都设置有 分类浏览导航 查询途径 二 文献经典检索技术 在文献检索过程中 为了保证检索结果的快 全 准 仅靠一个检索词 关键词 主题词 难以满足检索的需要 有时需要用各种算符将若干个检索词组成检索式进行检索 主要有布尔逻辑算符 位置算符 截词符和限制符等经典检索技术 一 布尔逻辑检索 booleanlogic 是当今检索理论中最成熟的理论之一 也是构造检索表达式最基本 最简单的匹配模式 布尔逻辑检索是通过布尔逻辑算符 把一些简单概念的检索词组配成为一个具有复杂概念的检索式 用以表达用户的检索要求 布尔逻辑运算 布尔逻辑检索 即运用布尔逻辑算符对检索词进行逻辑组配 表达两个概念之间的逻辑关系 有三种 逻辑与 逻辑或 逻辑非 布尔逻辑用在何处 布尔逻辑用在何处 布尔逻辑 检索词之间的逻辑关系 布尔逻辑and or not cnk高级检索界面 ebsco高级检索界面 a b 4 布尔逻辑算符的运算及次序 1 and 逻辑与 如 carandindustry 检中结果中必须同时含有car和industry才符合要求 运算符为and 表示 检索时 命中信息同时含有两个概念 专指性强 可以缩小检索范围 提高查准率 same 规定其前后连接的两个词在检索记录中出现在同一句中 或同一个词组中 keyword字段 2 or 逻辑或 如 collegeoruniversity 检中结果中含有college或university任一个就符合检索要求 运算符为or 或 表示 检索时 命中信息包含所有关于逻辑a或逻辑b或同时有a和b的 可以扩大检索范围 提高查全率 3 not 逻辑非 如televisionnotcable 检中结果中出现television但不能出现cable电缆 运算符 not 或 表示 命中信息包含逻辑a 不包含逻辑b 可以排除不必要的信息 提高查准率 4 优先级运算 not and or ebsco规则 二 截词检索 在西文数据库中广泛用 截词检索是用截断词的一个局部进行的检索 凡是满足这个截词所有字符 串 的记录 系统都为命中 均可以表示截词的截断符号 各检索系统有不同的规定 没有统一标准 分为 有限截词 即一个截词符只代表一个字符 无限截词 即一个截词符可代表多个字符 按截词的位置划分为 前截 中截 后截 1 前截断 左截 前截断 后方一致 又称左截断 截词符在词的左边 例将截词符 置于词干的左边 如 computer 其含义为 computer microcomputers等词皆为命中词 2 中截断 中截断 通配符或屏蔽 是把截断符号置于一个检索词的中间 只替代一个字符 ebsco规则 例如 输入ne t 可检索出neat nest next 3 后截断 右截 后截断是前方一致检索 又称右截断 截词符放在被截词的右边 是最常用的检索技术 例如 可以替代一个以上字符串 ebsco规则 例如 输入comput 可检出computer computing等等 4 其它截断 限制截断 是在检索词词干后面加若干个截词符 表示限制可变化的字符数 例 educat 相当于educated教育 educator教育家 根据截断的数量不同可分为 无限截断 不限制被截断的字符数量 有限截断 限制被截断的字符数量 例如educat 可以检索educator educated 各检索系统有不同的规定 没有统一标准 使用时要注意看系统使用说明或示例 三 位置检索 位置算符检索在西文数据库中广泛使用 能提高检索的准确性 当要求两个检索词在记录中位置相邻 相连时 可使用位置算符 下面介绍几种数据库经常使用的位置运算符 1 w withw算符是with的缩写 表示在此算符两侧的检索词必须按输入时的前后顺序排列 不能颠倒 例 intelligent w robot 智能机器人 eicompendexplus wn 或nw 表示在此算符两侧的检索词必须按输入时的前后顺序排列 不能颠倒 但允许在连接的两个词之间最多插入n个单元词 例 intelligentw1robot oclcfirstsearch 2 n nearn算符是near的缩写 表示此算符两侧的检索词必须紧密相连 所连接的词之间不允许插入任何其他单词或字母 但词序可以颠倒 例 intelligentnearrobot eicpxweb 位置检索 nn 或nn 表示在两个检索词之间最多可插入n个单词 且两词的词序任意 例 intelligentn1robot oclcfirstsearch 3 adj adjacency 邻接算符表示在此算符两侧的检索词必须按所列词序排列 不能颠倒 两词之间不允许有其他的词或字母 相当于短语检索 例 intelligentadjrobot 4 f field 同字段邻接这个算符表示其两侧的检索词必须在同一字段 例如同在题目字段或文摘字段 中出现 词序不限 中间可插任意检索词项 例 environment f protection 环境的保护 5 p paragraph 同自然段邻接检索式为a p b 表示它关联的两个概念a b必须同时在同一自然段中出现 例 environment p protection 环境保护 6 s sentence 同句邻接词序可以颠倒 两词必须出现在同一句子 子字段 中 例 environment s protection 四 限定字段检索 是指在限定的字段范围检索 rangesearching 达到优化检索结果的方法 特别在使用自由词进行全文检索时 需要用字段限制检索的范围 被指定的字段也称检索入口 检索时 系统只对指定字段进行匹配运算 提高了效率和查准率 字段检索常用代码来表示 常用的字段代码如下表所示 三文献检索步骤 在进行资料检索之前 必须分析研究课题 制定检索需求描述 索取原始文献 学习了解新知识 调整检索策略 一 分析检索课题1 分析检索课题 明确以下问题 分析课题 课题的主要内容以及所涉及的知识点 明确需要的文献特征 即需要的文献种类 语种 年代以及文献量 明确查询的侧重点 对查新 查准 查全的指标要求 确定所需的文献应该具备的外部特征 确定所需的文献应该具备的内部特征 2 一般课题检索分析 1 是找具体问题的准确答案 使用目的是解决问题 或作为论据和引证 查找事实或数值型信息大多属于此类 2 是查找特定文献 根据某一篇文献的线索查找原文 或报考某导师的研究生 查询其所有发表的文章 对这种检索课题 类型很简单 只要正确选择了检索工具和参考资源 便可以一步到位查到所需要的信息 很快地达到检索目的 3 是对某一问题的大致了解 对于这种类型的检索课题 只需要浏览一些简短的摘要或者参考几篇概论性文章就可以了 有的课题则需要搜集各种翔实 深入的信息 才能圆满完成 3 研究课题检索分析 研究课题通常是学术水平较高 专业较深的课题 撰写综述 研究报告 查全撰写综述或研究报告 讲求系统全面 必须以时间为轴做纵向 深度的考察 对课题做全面的调查研究 了解整个发展过程 包括书籍 期刊 报纸 报告 政府出版物 撰写研究报告 学术论文 查准撰写研究报告 学术论文 需要在具体细微的专业问题做深入的专题研究 在充分掌握材料和该领域重要研究成果的基础上 提出创新性的观点或论断 这是基本要求 做新技术 新理论的研究 动态在做新技术 新理论的研究时 需要查阅某一专题的最前沿和最新资料 了解研究动态 发展趋势 做同类研究项目比较 查新在做同类研究项目比较时 或做创新性的课题项目 研究成果或要求较高的学位论文 必须保证取材的数量和学术质量达到一定的深度和广度 重点参考各种学术品质较高的期刊论文 会议论文 研究报告 学位论文 重要专著等 4 明确课题对文献的需求量 在确定了检索课题的类型之后 在此基础上 还要考虑下面几个问题 1 该课题需要的文献量 2 该课题查检文献的广度与深度如何 3 该课题对时效性有什么要求 4 该课题对文献资料的数据类型是否有所限定或侧重 二 选择检索工具或数据库 目前 常用文献类型及选择检索的数据库如下 1 数字图书馆 1 超星数字图书馆 三 确定检索途径 1 以文献的内容特征为检索途径 分类检索途径 是从学科分类角度来查找文献的一种途径 特点 族性检索 会检索到一批相关文献 主题检索途径 是从文献主题内容角度来检索文献的一种途径 特点 特性检索 适合比较具体专深的课题以及新兴学科 交叉学科 边缘学科的课题的检索 2 以文献的外部特征为检索途径 题名途径 是指依据文献的题名 书名 刊名 篇名等 途径去检索文献 用于查找图书 期刊 单篇文献 常用的工具有书名索引 书目索引 刊名索引 责任者途径 是指依据文献作者名称来查找文献的一种途径 如作者 编者 译者 专利权人 出版机构等 号码途径 是根据文献出版时所编的号码顺序来检索文献 如标准号 专利号 报告号 索取号等 其它途径还有 分子式途径等 四 选择检索词 1 关键词关键词的内容可以是 人名 网站 新闻 小说 软件 游戏 星座 工作 购物 论文等 关键词还可以是任何中文 英文 数字 或中文英文数字的混合体 2 从课题名称确定主要概念选词可以从确定主要概念入手 在多数情况下 题名一般能反映检索的主题内容和所涉及的概念 3 收集检索词 1 从初步检索结果中选择词 2 从综述文章中选择词 文献综述有 关于文献的文献 之说 3 从主题词表中选择词 汉语主题词表 3卷10册 收词11万条 4 选择词的要点 5 掌握缩写与全称转换 利用google搜索缩写与全称转换 了解含义之后再利用全名重新搜索 五 检索式的编制与调整 1 检索式的编制是否合理 1 逻辑与 and 表示 缩小检索范围 如 计算机and文献检索 检中结果中必须同时含有计算机和文献检索才符合要求 2 逻辑或 or 扩大检索范围 如 计算机or文献检索 检中结果中含有计算机或文献检索任一个 以及两词都包含的文献就符合检索要求 3 逻辑非 not 缩小检索范围 如 计算机not文献检索 检中结果中出现计算机但不能出现文献检索 2 检索式的调整 1 扩大检索途径的方法扩大检索是指开始的检索范围太小 命中文献不多 或查全率太低 需要扩大检索范围 提高查全率 即采取概念扩大 范围扩大等 检索结果由严变松等措施 如 少用逻辑 与 多用逻辑或 扩大检索途径的方法 降低检索词的专指度 选用上位词或相关词检索 选全同义词与相关词并用逻辑 或 将它们连接起来 增加网罗度 减少逻辑 与 的运算 丢掉一些次要的或者太专指的概念 去除某些字段限制 调整位置算符 由严变松 去除文献类型 年份 文种等文献外表特征的限定 选择更合适的数据库 缩小检索途径的方法 2 缩小检索范围是指开始的检索范围太大 命中文献太多 或查准率太低 需要增加查准率的一个方法 即概念的缩小 范围的限定 年代的减少 检索结果由松变严等 缩小检索途径的方法 进行加权检索 提高检索词的专指度 选用下位词或专指性较强的自由词检索 减少同义词与同族相关词 增加限制概念 采用逻辑 与 连接检索词 使用字段限定 将检索词限定在某个或某些字段范围 使用逻辑 非 算符 排除无关概念 调整位置算符 由松变严 浏览部分中间检索结果 从检出的记录中选取新的检索词对中间结果进行限制 六 获取全文途径 全文 是通常指一次文献 获取全文从易到难 有以下途径 1 利用图书馆数字资源获取全文在校园ip内 利用图书馆数字资源 直接获取文献全文 2 利用文献传递服务在读秀 百链学术搜索平台上找到文献 得到文献可利用填写email 多数文献由后台的服务器自动为你传递文件 少量由云服务系统传递 中文文献满足率达到96 外文文献满足率达到90 3 去图书馆借书获取全文利用图书馆的馆藏目录 公共查询系统查询馆藏信息 去书库借书 4 利用馆际互借获取全文利用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论