




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第10章信息检索策略与实例分析,1,主要内容,10.1漏检误检的原因分析及对策10.2检索策略的调整10.3信息检索综合利用案例,2,10.1漏检误检的原因分析及对策,3,4,10.1.1课题分析不透,课题分析是一切后续检索的基础。分析课题首选手册、百科全书、专著等三次文献作为分析手段。它们是该领域的学术专家和权威对以往研究的总结,既有高度又有深度和广度,让人对该领域的研究有一种全局的了解和把握,同时可以对背景知识和相关名词术语作全面的了解。在此基础上去查询新的文献,站得就比较高,既能见到树木又能见到森林。,5,对新课题的了解越多,所走的弯路越少。课题内涵的透彻分析例1:检索“乙醇的分离”文献检索策略1:“乙醇AND分离”漏检检索策略2:“乙醇AND(分离OR提纯OR纯化)”更全,6,例2:检索“垃圾处理方面”文献“处理”一词隐含着“回收”、“再生”等具体的处理方法。,7,提示与技巧检索词没有表达出课题的隐含概念,是造成漏检的重要原因。要透过表面的、显性的表达词,找出隐含概念的表达词是需要相当专业知识的,而有些专业知识又需要通过文献检索和阅读后才能获得,这就是检索策略不能一蹴而就的根本原因。,8,10.1.2检索词概念过大或过小,课题内容的准确定位概念不能太大也不能太小主题概念的范畴太大造成大量没用的文献被误检。太小造成重要的的文献被漏检。,9,例1:“煤脱硫的最新工艺与技术”若用“煤脱硫”作为主题概念,有1000多篇概念太大。选择更具体的概念“微波煤脱硫”,有10多篇概念定位恰当。,10,例2:“论企业生产线的优化”检索词:“企业生产线”与“优化”,检索到的文献很少分析:概念定位太小,所谓企业生产线的优化,实际上是有关运用计算机系统管理生产线的问题。答案:“企业生产线OR生产线”与“计算机系统”,11,提示与技巧概念是太大还是太小要视检索结果而定,不断调整的。概念太大可以利用逻辑运算加以限制,比较容易。而概念太小要变大,需要较多的专业知识。上下位概念的替换是调整检索策略的一种好方法。,12,10.1.3选择的检索词过多,多主题概念的选词以“简”为主一课题是由A、B、C、D、E多个主题组合而成。若A、B、C、D、E其中之一的检索结果为零,则检索结果A*B*C*D*E=0。解决办法:以必须使用的关键词为核心词例1:课题“利用基因工程的手段提高植物中淀粉的含量”检索策略:“基因工程”AND“植物”AND“淀粉”AND“含量”检索结果为零,13,分析:主题词过多答案:首先抓住最能反映课题主题概念的词作为检索词,其他各词视检索结果决定取舍,对于本课题,只有2个主题概念最为关键-“基因”AND“淀粉”。“最专指面优先”原则(MostSpecificFaceFirst),14,10.1.4布尔逻辑运算符使用不当,逻辑检索式的正确使用:课题:城际列车振动对周围环境的影响对此课题进行分析,确定关键词为:“铁路”/“列车”/“轨道”/“交通”、“振动”/“动力”。,15,采用的检索词如下:铁路:Railway轨道:Rail、Track交通:Traffic、Traffical列车:Train振动:Vibration、Vibrations动力:dynamic、dynamical,检索式如下:(Rail*orTrain*orTraffic*orTrack*)and(Vibrat*ordynamic*)检索字段:“Title”or“Keywords”or“Abstract”,16,先组合第一和第二个检索框的检索词,后再与第三个检索框进行组合。,先组合第一和第二个检索框的检索词,后再与第三个检索框进行组合。,17,先组合“vibrat*”和“traffic*”进行检索,然后与“rail*”进行检索,把同义词“traffic*”和“rail*”的检索隔开了,不符合检索策略。,18,将给出的检索式在QuickSearch中实现:,小建议:当遇到多于三个检索词的多种组配检索时,可以采用专家检索。,在QuickSearch检索中,注意三个检索框的检索组合顺序:先组合第一检索框和第二检索框的检索词,然后再与第三检索框的检索词。在同义词或相关词组合检索、并有多个主题进行组配检索时,尤其要注意检索框的输入顺序。,19,10.1.5人机“语言”不一致,自由语言与数据库标引语言的对应自由语言A-检索者所用的词,往往较随意,“想当然”数据库标引语言B-已固定存储于计算机中,一般较规范若AB,“对话”不成功,检索结果为0,20,自由词:维生素C(vitaminC);标引词:抗坏血酸(ASCORBICACID)“超分子”自由词(直译):supermolecular;标引词:macromolecular例如:检索“六行程发动机”的资料,把“六行程”作主题词时,就不能找到相关资料,而用六冲程作为主题词就可以找到。,21,“标引词”是用以描述文献内容特征的词和词组,由专业标引人员抽选出的,经过规范处理,可以避免漏检。“自由词”检索方便,但会导致漏检,需要把所有同义词考虑齐全,才能避免漏检。,22,10.1.6没有选择合适的检索途径,正确选择检索途径对检索途径的选择,遵循“宽进严出”的原则,并根据检索结果的多少来调整途径。注意题名、关键词、文摘等字段在检索结果中的差异。若检索结果多了,可使用篇名途径;少了,则使用全文途径。灵活运用“文献类型”字段,23,10.1.7对数据库不熟悉,正确选择检索系统检索工具种类繁多,各具特色,它们收录的文献学科、类型、国别、语种范围均各有侧重。应根据课题的特点选择检索工具。Ei偏重工程,不报道纯理论,会议论文收录得多,是世界四大文献索引之一。SCI则收录涵盖所有学科、侧重基础理论研究方面的文章,它的文献品位高,可信度大,并可以对文章的水平、著者的学术水平作出评价,寻找热点课题等等。,24,不同数据库有各自的规则,姓名、分子式、各种符号的写法,检索框的检索顺序均不尽相同,如果不了解就会造成很大的漏检误检。如逗号,括号,连字符“-”应该用半角(俗称英文符号),若用了全角(俗称中文符号),就会检索不到。注意:PQDD是国外博硕士论文数据库,检索词用“英文”,而非“中文”。,25,10.2检索策略的调整,26,检索策略与文献检索和阅读的关系,27,制定检索策略-查全查准的关键好的检索策略不是一蹴而就的,而是“与时俱进”的!“变”是检索策略永恒的主题。它会随着对课题理解的深入而改变,“检索阅读策略修改再检索”,不断调整,不断完善。,28,查找和筛选文献线索-提高查全查准率当经历了前面一系列检索得到结果时,通过阅读文摘,往往会发现检索结果并不尽如人意,或相关性较差,或检索结果太多或太少,这时需要进一步调整检索策略了。,29,10.2.1检索结果相关性差解决方案:重新分析课题,找出隐含在课题题名后面的相关检索词。方法:先从检索结果中选出你认为相关性高的几篇文献线索,得到它们的原文,然后研读,找出它们所表达的关键词,然后再用这些关键词去检索。,30,10.2.2检索结果太多原因1:主题、检索词、检索入口过于宽泛导致误检,例如直接用“金属玻璃”、“燃料电池”、“微波陶瓷”等宽泛的概念查文献,解决方法是进一步了解课题背景,明确研究定位;原因2:主题词本身的多义性导致误检,例如,使用邻苯二甲酸二壬酯的缩写“DNP”作为检索词检索,结果找出的文献含有“DNP邻苯二甲酸二壬酯”、“DNP动态核极化”、“DNP糖尿病患者”、“DNP防老剂”和“DNP表面活性剂”等多种内容;,31,原因3:检索词的截词过短造成。例如,使用“Cata*”检索“Catalyst,使用“Prep*”检索“Preparation”,都会造成误检。(截词的原则是截到词根,如CatalystCatalys*;PreparationPrepar*)。,32,原因4:词组没有用精确检索造成。利用双引号“”实现对词组的精确检索。例检索solarenergy这个主题,没有加双引号“”,则代表是普通检索,只要检索字段中出现solar和energy便符合检索要求,不管这两个词出现的次序怎样;若加双引号“”则表示solar必须在前,energy必须紧跟其后才符合。,33,检索结果太多细化检索,缩小检索范围提高检索词的专指度,选用下位词或专指性较强的自由词检索。将检索词的检索范围限定在篇名、主题词、关键词字段,或进行出版时间、语种、文献类型等的限定。用NOT算符排除无关的术语和词组。把增加的概念,用AND算符加入检索式中。浏览部分中间检索结果,从检出的记录中选取新的检索词对中间结果进行限制。,34,10.2.3检索结果太少原因1:选用了不规范的主题词或某些产品的俗称、商品名作为检索词。例如:没有使用“表面活性剂”而使用了商品名称“迪恩普”,都会造成漏检。原因2:同义词不全例如,查找“品牌”时,没有考虑到“名牌”、“牌号”以及“商标”等检索词。,35,原因3:没有综合考虑检索词的上位概念或下位概念。例如,“燃料”是上位概念,下位概念可以有“固体燃料”,“液体燃料”,“气体燃料”,甚至还有“煤”,“油”,“煤气”,“天然气”等,这些概念在查找“燃料”时,都应该加以考虑。,36,检索结果为零原因1:对数据库的检索规则运用错误。譬如逻辑算符、通配符、中英文符号(半角全角)等问题,每个数据库有不同的要求。在欧洲专利中,检索不出带逗号和短横的分子式如1,3-Propanediol,但在Ei中却能将其检索出来。,37,原因2:确实没有相关文献。但不能因为检索篇数为零而放弃对相关内容的查找。必要时可以将课题拆分,各自查找。例如,课题是关于“膜乳化”,但在超星图书馆中检索不到“膜乳化”的书籍,于是将“膜乳化”拆成“膜”和“乳化”分别检索,发现有很多有用的三次文献。,38,检索结果太少扩展检索范围对已确定的检索词进行其同义词、同义的相关词、缩写和全称检索,保证文献的查全率,防止漏检。利用系统的助检手段和功能。有的系统提供树形词表浏览,使我们可以用规范词、相关词、更广义的上位词进行扩展。降低检索词的专指度,选用上位词或相关词检索。选用在所有字段或文摘字段中检索。去除文献类型、年份、文种等文献外表特征的限定。删除检索策略中某一次要概念。用OR算符把增加的同义词或相关词连接起来。利用截词。选择更合适的数据库进行查找。,39,10.3信息检索综合利用案例,40,例:某同学在实验中要求利用气相燃烧合成的方法在陶瓷膜衬底上涂一层膜,但苦于不知道如何确定实验条件,解决办法:到别人的研究工作中去寻找答案。通过对国内外文献的检索,得到两篇比较有价值的文献,一是丹麦研究者ThyboS于2004年4月发表在JournalofCatalysis上的Flamespraydepositionofporouscatalystsonsurfacesandinmicrosystems(简称文章1),另一篇为发表在某大学学报上的SnO2薄膜的喷涂法制备(简称文章2)。这两篇文章采用的涂膜方法十分类似,都是一种热喷涂的方法,其中都有关于衬底温度控制的论述。而两个作者却有两种完全不同的看法,文章1的作者认为:“衬底的温度高一些较好,喷涂前最好对衬底进行一下加热”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新疆维吾尔自治区和田地区皮山县2024-2025学年七年级下学期7月期末历史试题(含答案)
- 物联网技术在酒店管理中的应用-洞察及研究
- 宗教管理创新研究-洞察及研究
- 技术赋能体验升级-洞察及研究
- 气候数据同化方法-第1篇-洞察及研究
- 基于增材制造的分离杆总成复杂曲面成型技术瓶颈
- 国际贸易壁垒倒逼下染料红FB产业链的供应链韧性提升与区域协同策略
- 国际标准体系与苦丁茶出口认证的博弈困境
- 合成刷丝与天然刷丝性能衰减机理对比及替代阈值研究
- 可降解助剂添加对电子元件绝缘性能的潜在干扰机制
- 北京京剧院劳动合同制职工招考聘用(必考题)模拟卷
- 教学课件:《新能源材料技术》朱继平
- 专业技术职称与职业(工种)技能人才评价对应表(试行)
- DB37∕T 4328-2021 建筑消防设施维护保养技术规程
- 银行信贷实务与管理课件
- 实习任务书(标准模版)
- 钢结构加工制造方案(60页)
- 大连石化“3.14”亡人事故
- NFPA12-二氧化碳灭火系统标准(2005版)
- 学生体质健康调查表
- 井下变电所高压开关整定计算
评论
0/150
提交评论