




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章文献信息检索技术,1,第一节文献信息检索技术,(一)检索方式1、命令式检索:用逻辑运算符、位置算符及其他检索符号,把不同的检索词连接起来进行检索的一个种方式,如数据库中的专业检索。适用于专业人员。2、菜单式检索:一种通过窗口菜单进行检索的简单、易操作的检索方式。现各数据库的高级检索、初级检索都属于菜单式检索,是最常用的检索方式,适用于一般读者检索。3、导航检索:点击检索界面上的超链接进行检索,也叫超链接检索。,2,3,4,5,分类途径主题途径关键词途径题名途径责任者途径引文途径,第二节检索途径与检索语言P25-26,6,、检索语言:用来描述检索提问主题、学科分类等内容的语言,它和检索途径是相对应的。(P27)常见的检索语言有主题语言和分类语言。,7,主题词是规范化的检索语言,主题词检索途径的检索系统都有相应的主题词词表,利用主题词途径标引或检索文献时,一定要先查对词表,再进行标引或检索。国内中文主题词表一般采用中国主题词表或中国图书馆图书分类主题词表,英文文献检索系统一般采用美国国会图书馆标题表。,8,根据分类语言进行检索的途径,它是一种按学科范畴和体系来划分事物的检索语言,以分类表的形式体现。国内文献分类一般使用中国图书馆图书分类法(简称中图法).(P30)专利使用国际专利分类法(IPC)分类。国外分类法很多,比较常见的有美国国会图书馆分类法(LC)、国际十进分类法等。,9,中图法分类体系,返回,10,以关键词进行检索的方式,关键词又称自由词,是从文献的题名、摘要和正文中抽出的具有实际意义的非规范化自然语言。其优点是:A、简捷,降低对检索人员的要求;B、易用,易于计算机编制和检索;C、及时,能及时更新词汇。,11,缺点:1、不规范,有大量的同义词、近义词,影响查全率和查准率。如“高速公路”有”highway”“autoroute”,“freeway”,“speedway”,“thruway”等,“图形图像”和“图形图象”同义,检索时如果不能全部记住,会出现漏检;而“cell”既指细胞又指电池,检索时会出现误检。2、词汇量大,给存取带来困难。由于关键词是未经人工干预的自然语言,符合大众的检索习惯,大多数检索系统都有关键词检索。,12,题名途径:根据文献名称包括书名、刊名、论文篇名等来检索文献的途径。责任者途径:指根据已知文献著者来查找文献的途径,包括个人著者和机关团体。引文途径:从被引文献去检索引用文献的检索途径。,13,第三节计算机信息检索技术,(一)逻辑运算符逻辑运算符又称布尔算符,是用来表达各检索词之间的逻辑关系的符号。逻辑运算符有“与”、“或”、“非”三种,分别用“and”、“or”、“not”来表示,也可以用“*”“+”“-”来表示。,14,1、逻辑“或”,用符号“or”或“+”表示,其逻辑表达式为:AorB或A+B其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。例:,15,2、逻辑“与”,用符号“and”或“*”表示,其逻辑表达式为:A*B或AandB其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。例,16,3、逻辑“非”,用符号“not”或“-”,其逻辑表达式为:AnotB或A-B其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。例,17,逻辑提问式(布尔逻辑组配):计算机检索的基本技术,主要通过逻辑运算符(布尔算符)“与(and,*)”、“或(or,+)”、“非(not,-)”等将检索词连接的提问式。注意:优先级为not,and,or,用括号保证优先权;运算符两侧必须各有一个空格(半角)。,18,实例:膜法提取甘露醇中的微生物污染控制(膜法+膜集成)*甘露醇*(细菌污染+微生物污染),写出以下检索词,并用上述布尔逻辑符写出检索式:固氮和固碳的生化机理或基因机制,19,在检索词之间使用,规定算符两边的检索词出现在记录中的的位置,以提高检准率。比如:如果不用with位置算符,则词组可能被系统识别为逻辑运算,proteindisulfideisomerase(蛋白质二硫键异构酶)可能被识别成“proteinANDdisulfideANDisomerase”。尤其是出现数字等符号时不易识别成词组。,(二)、位置算符,20,常见的位置算符如下:,21,(三)、通配符(截词检索),截词检索,就是将截词符如“*”、“?”等等,放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。多用于外文检索,因为西文语言的特点是构词灵活,在词干上前缀或后缀就可以派生出许多新的词汇。检索词的词干后(前)加一个“?”(有的系统为加*),表示词干后(前)可以有任意个字符。如“apple?”可代替(apple+apples+apple-pie+applesauce);,22,由于文字结构方面的原因,中文检索系统极少使用通配符进行截词。椰壳制备高比表面积活性炭,椰壳可能表达为椰子壳,可以用“(椰子壳十椰壳)*高比表面积活性炭”,或直接用“椰*高比表面积活性炭”,23,(四)、禁用词,在绝大多数的检索系统中,介词、代词、等单独使用无实际意义的词以及使用频率很高的词不能作为检索词,被称为禁用词,如an,and,by,for,from,of,the,to,with等等。,24,(五)、限制检索(检索途径),在命令式检索中,通常要用字段代码来限定检索的字段,不同的数据库使用的字段代码略有不同。,25,六加权检索,是一种定量检索技术:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时先查找这些词在记录中是否存在,然后计算存在的权值总和,权值之和达到或超过给定阈值,该记录即为命中记录。,26,七聚类检索,把相似度较高的文献集中在一起形成一个个的文献类的检索技术。,27,八、匹配方式P37-38,前方一致:检出文献的相关字段前方和检索词一致,如:检索词为“世界贸易组织”,可检出世界贸易组织概论,检不出大学世界贸易组织教程精确检索:表示检索词和检出文献的相关字段完全一致,如检索词为“世界贸易组织”,可检出世界贸易组织,检不出大学世界贸易组织教程和世界贸易组织概论模糊检索:包含关系,检索词可以在相关字段的任何位置。这是最常见的匹配方式。,28,在许多检索系统中(CNKI、万方、搜索引擎),精确检索表示包含关系,即检索词不被切分,包含在相关字段的任何位置,与前述的模糊检索相同。模糊检索表示自动分词检索。,29,否,不满意,是,满意,第四节检索步骤,30,普查型:需要全面收集有关某一主题的文献资料,如以课题开题、教材编写等。具有普查、回溯的特点,要求尽可能高的查全率。攻关型:需要收集有关某一主题某一特定方面的文献,其目的在于解决科研、生产中的关键问题,这类需求不强调查询的文献数量,但需要查得的文献具有较强的专指性。学习型:需要了解掌握某一领域的研究动向、研究成果或相关知识,要求查到的文献具有新颖及时的特点,而对查全率和查准率不一定有很高的要求。,1、课题分析,31,32,提取检索词时要注意切分句子或词组、删除多余词、替换模糊词、补充合理逻辑。选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。例:土豆马铃薯,世界贸易组织WorldTradeOrganization、WTO,33,根据检索目的选词。如“个性化推荐系统”,我们要弄清是电子商务中的推荐系统,还是其他方面的个性化推荐系统。合理切分句子或词组,切不可用句子作为检索词,尽量不用短语作检索词。一些非规范的词组也要进行合理切分。如:红辣椒,可切分为红*辣椒,因为可能会检出红色辣椒。但活性炭则不可切分为活性*炭,因为这是不可分的规范词。考虑相应的同义词。对同一事物,人们对其有不同的称呼和表达,如“计算机”又称“电脑”、“图形图像与图形图象”要用逻辑或进行检索。,34,上位词、下位词:检索词有上位词下位词之分,一般来说,如果检索上位词,要同时检索下位词,如在EBSCO中,我们检索“芭蕾舞服装(balletcostume)”,必须同时检索“芭蕾舞裙(balletskirt)”、“芭蕾舞鞋(toeshoe)”,才能得到满意的查全率。当然,如果下位词太多,则不能全部选择。如果下位词检索效果不理想,也可以在上位词中检索。海南黄花梨病虫害防治,没有专门的书,但在景观植物病虫害防治一书中有一节专门论述。不同外来词译法的变化:如:“欧几里德”、“欧几里得”、“欧基里德”、“欧几理德”、“Euclid”。“aspirin”、“阿斯匹林”,“阿司匹林”,“乙酰水杨酸”。,35,例:苯胺的烷基化反应催化剂研究检索式:苯胺*烷基化*催化剂(37篇)词表烷基化F甲基化乙基化修订后检索式:苯胺*(烷基化+甲基化+乙基化)*催化剂(61篇),36,37,检索式:又称检索策略,由检索词和各种布尔逻辑算符、位置算符、截词算符等组成。在命令式检索中可根据检索式进行高级组配检索。检索式可一次完成,也可分步完成,检索式的表达对一个课题不是唯一的,有多种选择、组配、限定。,38,例1:查找“科技英语写作”的文献(1)分析课题,确定学科范围;(2)选择数据库:CNKI(3)确定关键词:科技、英语、写作(4)检索式:科技*英语*写作例2:化妆品检测方面的文献(1)分析课题,确定学科范围;(2)选择数据库:CNKI(3)确定主题词:化妆品、分析、检测、测定等。(4)检索式:化妆品*(分析+检测+测定),39,例1:查找“造纸废水处理技术”的外文文献A、抽词:造纸(papermaking,paperpulp)废水(wastewater)处理(treat,treatment)B、检索式(paper()makingorpaper()pulp)andwaste()waterand(treatortreatment),40,写出检索策略:硫、磷对金属延性和金属冲击强度的影响二氧化锰纳米材料的制备,41,显示:一般检索工具有目录、文摘和全文格式;选择显示结果:首先显示题录,选择较相关文献,然后显示文摘格式,选择要获取原文的文献。判断检索结果:检索结果是否满意,可以通过查全率、查准率、误检率和漏检率进行判断。,42,(1)直接下载:本馆有电子原文的文献;(2)本馆借阅:对本馆有纸质馆藏的,用借书证到书库借阅;(3)原文传递:本馆无馆藏文献,通过本馆原文传递服务系统,请求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八中自主招生考试题及答案
- 解析卷公务员考试《常识》同步练习试题(含答案及解析)
- 护理查对制度试题(含答案)
- 贵州企业招聘:2025贵州黔晨综合发展有限公司招聘15人考前自测高频考点模拟试题及完整答案详解1套
- 2025年在线职业技能认证平台投资风险评估分析报告
- 2025年文化娱乐产业产业链重构与协同发展报告
- 2025年婴幼儿配方食品营养配方研究进展与挑战分析报告
- 2025年城市慢行系统建设与城市交通拥堵治理创新策略可行性研究报告
- 2025年教育行业质量评估与认证体系在学校特色教育中的应用报告
- 2025年海洋生态修复政策与海洋生物保护研究报告
- 香港公司章程范本中文
- 数据治理与合规性试题及答案
- 人教版高中地理选择性必修一-4.2洋流(第1课时)(教学设计)
- 2024年公安机关理论考试题库500道附参考答案【基础题】
- 阿尔茨海默病药物治疗指南(2025)解读
- 心脏永久起搏器植入术病人护理查房
- 粮油保管员(高级)职业技能鉴定参考试题(附答案)
- GB/T 196-2025普通螺纹基本尺寸
- 新课标下初高中数学教学的衔接研究
- 2024-2025学年人教版二年级体育下册全册教案
- 2025年初升高高中自主招生考试化学试卷试题(含答案详解)
评论
0/150
提交评论