信息检索策略与实例分析ppt课件.ppt_第1页
信息检索策略与实例分析ppt课件.ppt_第2页
信息检索策略与实例分析ppt课件.ppt_第3页
信息检索策略与实例分析ppt课件.ppt_第4页
信息检索策略与实例分析ppt课件.ppt_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章信息检索策略与实例分析 1 主要内容 10 1漏检误检的原因分析及对策10 2检索策略的调整10 3信息检索综合利用案例 2 10 1漏检误检的原因分析及对策 3 4 10 1 1课题分析不透 课题分析是一切后续检索的基础 分析课题首选手册 百科全书 专著等三次文献作为分析手段 它们是该领域的学术专家和权威对以往研究的总结 既有高度又有深度和广度 让人对该领域的研究有一种全局的了解和把握 同时可以对背景知识和相关名词术语作全面的了解 在此基础上去查询新的文献 站得就比较高 既能见到树木又能见到森林 5 对新课题的了解越多 所走的弯路越少 课题内涵的透彻分析 例1 检索 乙醇的分离 文献检索策略1 乙醇AND分离 漏检检索策略2 乙醇AND 分离OR提纯OR纯化 更全 6 例2 检索 垃圾处理方面 文献 处理 一词隐含着 回收 再生 等具体的处理方法 7 提示与技巧 检索词没有表达出课题的隐含概念 是造成漏检的重要原因 要透过表面的 显性的表达词 找出隐含概念的表达词是需要相当专业知识的 而有些专业知识又需要通过文献检索和阅读后才能获得 这就是检索策略不能一蹴而就的根本原因 8 10 1 2检索词概念过大或过小 课题内容的准确定位 概念不能太大也不能太小 主题概念的范畴太大造成大量没用的文献被误检 太小造成重要的的文献被漏检 9 例1 煤脱硫的最新工艺与技术 若用 煤脱硫 作为主题概念 有1000多篇 概念太大 选择更具体的概念 微波煤脱硫 有10多篇 概念定位恰当 10 例2 论企业生产线的优化 检索词 企业生产线 与 优化 检索到的文献很少 分析 概念定位太小 所谓企业生产线的优化 实际上是有关运用计算机系统管理生产线的问题 答案 企业生产线OR生产线 与 计算机系统 11 提示与技巧 概念是太大还是太小要视检索结果而定 不断调整的 概念太大可以利用逻辑运算加以限制 比较容易 而概念太小要变大 需要较多的专业知识 上下位概念的替换是调整检索策略的一种好方法 12 10 1 3选择的检索词过多 多主题概念的选词以 简 为主 一课题是由A B C D E多个主题组合而成 若A B C D E其中之一的检索结果为零 则检索结果A B C D E 0 解决办法 以必须使用的关键词为核心词 例1 课题 利用基因工程的手段提高植物中淀粉的含量 检索策略 基因工程 AND 植物 AND 淀粉 AND 含量 检索结果为零 13 分析 主题词过多 答案 首先抓住最能反映课题主题概念的词作为检索词 其他各词视检索结果决定取舍 对于本课题 只有2个主题概念最为关键 基因 AND 淀粉 最专指面优先 原则 MostSpecificFaceFirst 14 10 1 4布尔逻辑运算符使用不当 逻辑检索式的正确使用 课题 城际列车振动对周围环境的影响对此课题进行分析 确定关键词为 铁路 列车 轨道 交通 振动 动力 15 采用的检索词如下 铁路 Railway轨道 Rail Track交通 Traffic Traffical列车 Train振动 Vibration Vibrations动力 dynamic dynamical 检索式如下 Rail or Train or Traffic or Track and Vibrat or dynamic 检索字段 Title or Keywords or Abstract 16 先组合第一和第二个检索框的检索词 后再与第三个检索框进行组合 先组合第一和第二个检索框的检索词 后再与第三个检索框进行组合 17 先组合 vibrat 和 traffic 进行检索 然后与 rail 进行检索 把同义词 traffic 和 rail 的检索隔开了 不符合检索策略 18 将给出的检索式在QuickSearch中实现 小建议 当遇到多于三个检索词的多种组配检索时 可以采用专家检索 在QuickSearch检索中 注意三个检索框的检索组合顺序 先组合第一检索框和第二检索框的检索词 然后再与第三检索框的检索词 在同义词或相关词组合检索 并有多个主题进行组配检索时 尤其要注意检索框的输入顺序 19 10 1 5人机 语言 不一致 自由语言与数据库标引语言的对应 自由语言A 检索者所用的词 往往较随意 想当然 数据库标引语言B 已固定存储于计算机中 一般较规范 若A B 对话 不成功 检索结果为0 20 自由词 维生素C vitaminC 标引词 抗坏血酸 ASCORBICACID 超分子 自由词 直译 supermolecular 标引词 macromolecular 例如 检索 六行程发动机 的资料 把 六行程 作主题词时 就不能找到相关资料 而用六冲程作为主题词就可以找到 21 标引词 是用以描述文献内容特征的词和词组 由专业标引人员抽选出的 经过规范处理 可以避免漏检 自由词 检索方便 但会导致漏检 需要把所有同义词考虑齐全 才能避免漏检 22 10 1 6没有选择合适的检索途径 正确选择检索途径 对检索途径的选择 遵循 宽进严出 的原则 并根据检索结果的多少来调整途径 注意题名 关键词 文摘等字段在检索结果中的差异 若检索结果多了 可使用篇名途径 少了 则使用全文途径 灵活运用 文献类型 字段 23 10 1 7对数据库不熟悉 正确选择检索系统 检索工具种类繁多 各具特色 它们收录的文献学科 类型 国别 语种范围均各有侧重 应根据课题的特点选择检索工具 Ei偏重工程 不报道纯理论 会议论文收录得多 是世界四大文献索引之一 SCI则收录涵盖所有学科 侧重基础理论研究方面的文章 它的文献品位高 可信度大 并可以对文章的水平 著者的学术水平作出评价 寻找热点课题等等 24 不同数据库有各自的规则 姓名 分子式 各种符号的写法 检索框的检索顺序均不尽相同 如果不了解就会造成很大的漏检误检 如逗号 括号 连字符 应该用半角 俗称英文符号 若用了全角 俗称中文符号 就会检索不到 注意 PQDD是国外博硕士论文数据库 检索词用 英文 而非 中文 25 10 2检索策略的调整 26 检索策略与文献检索和阅读的关系 27 制定检索策略 查全查准的关键 好的检索策略不是一蹴而就的 而是 与时俱进 的 变 是检索策略永恒的主题 它会随着对课题理解的深入而改变 检索 阅读 策略修改 再检索 不断调整 不断完善 28 查找和筛选文献线索 提高查全查准率 当经历了前面一系列检索得到结果时 通过阅读文摘 往往会发现检索结果并不尽如人意 或相关性较差 或检索结果太多或太少 这时需要进一步调整检索策略了 29 10 2 1检索结果相关性差 解决方案 重新分析课题 找出隐含在课题题名后面的相关检索词 方法 先从检索结果中选出你认为相关性高的几篇文献线索 得到它们的原文 然后研读 找出它们所表达的关键词 然后再用这些关键词去检索 30 10 2 2检索结果太多 原因1 主题 检索词 检索入口过于宽泛导致误检 例如直接用 金属玻璃 燃料电池 微波陶瓷 等宽泛的概念查文献 解决方法是进一步了解课题背景 明确研究定位 原因2 主题词本身的多义性导致误检 例如 使用邻苯二甲酸二壬酯的缩写 DNP 作为检索词检索 结果找出的文献含有 DNP邻苯二甲酸二壬酯 DNP动态核极化 DNP糖尿病患者 DNP防老剂 和 DNP表面活性剂 等多种内容 31 原因3 检索词的截词过短造成 例如 使用 Cata 检索 Catalyst 使用 Prep 检索 Preparation 都会造成误检 截词的原则是截到词根 如Catalyst Catalys Preparation Prepar 32 原因4 词组没有用精确检索造成 利用双引号 实现对词组的精确检索 例检索solarenergy这个主题 没有加双引号 则代表是普通检索 只要检索字段中出现solar和energy便符合检索要求 不管这两个词出现的次序怎样 若加双引号 则表示solar必须在前 energy必须紧跟其后才符合 33 检索结果太多 细化检索 缩小检索范围 提高检索词的专指度 选用下位词或专指性较强的自由词检索 将检索词的检索范围限定在篇名 主题词 关键词字段 或进行出版时间 语种 文献类型等的限定 用NOT算符排除无关的术语和词组 把增加的概念 用AND算符加入检索式中 浏览部分中间检索结果 从检出的记录中选取新的检索词对中间结果进行限制 34 10 2 3检索结果太少 原因1 选用了不规范的主题词或某些产品的俗称 商品名作为检索词 例如 没有使用 表面活性剂 而使用了商品名称 迪恩普 都会造成漏检 原因2 同义词不全例如 查找 品牌 时 没有考虑到 名牌 牌号 以及 商标 等检索词 35 原因3 没有综合考虑检索词的上位概念或下位概念 例如 燃料 是上位概念 下位概念可以有 固体燃料 液体燃料 气体燃料 甚至还有 煤 油 煤气 天然气 等 这些概念在查找 燃料 时 都应该加以考虑 36 检索结果为零 原因1 对数据库的检索规则运用错误 譬如逻辑算符 通配符 中英文符号 半角全角 等问题 每个数据库有不同的要求 在欧洲专利中 检索不出带逗号和短横的分子式如1 3 Propanediol 但在Ei中却能将其检索出来 37 原因2 确实没有相关文献 但不能因为检索篇数为零而放弃对相关内容的查找 必要时可以将课题拆分 各自查找 例如 课题是关于 膜乳化 但在超星图书馆中检索不到 膜乳化 的书籍 于是将 膜乳化 拆成 膜 和 乳化 分别检索 发现有很多有用的三次文献 38 检索结果太少 扩展检索范围 对已确定的检索词进行其同义词 同义的相关词 缩写和全称检索 保证文献的查全率 防止漏检 利用系统的助检手段和功能 有的系统提供树形词表浏览 使我们可以用规范词 相关词 更广义的上位词进行扩展 降低检索词的专指度 选用上位词或相关词检索 选用在所有字段或文摘字段中检索 去除文献类型 年份 文种等文献外表特征的限定 删除检索策略中某一次要概念 用OR算符把增加的同义词或相关词连接起来 利用截词 选择更合适的数据库进行查找 39 10 3信息检索综合利用案例 40 例 某同学在实验中要求利用气相燃烧合成的方法在陶瓷膜衬底上涂一层膜 但苦于不知道如何确定实验条件 解决办法 到别人的研究工作中去寻找答案 通过对国内外文献的检索 得到两篇比较有价值的文献 一是丹麦研究者ThyboS于2004年4月发表在 JournalofCatalysis 上的 Flamespraydepositionofporouscatalystsonsurfacesandinmicrosystems 简称文章1 另一篇为发表在某大学学报上的 SnO2薄膜的喷涂法制备 简称文章2 这两篇文章采用的涂膜方法十分类似 都是一种热喷涂的方法 其中都有关于衬底温度控制的论述 而两个作者却有两种完全不同的看法 文章1的作者认为 衬底的温度高一些较好 喷涂前最好对衬底进行一下加热 文章

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论