版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章第二章文献信息检索技术文献信息检索技术第一节文献信息检索技术第一节文献信息检索技术(一)检索方式(一)检索方式1 1、命令式检索:命令式检索:用逻辑运算符、位置算符及其他检索符号,用逻辑运算符、位置算符及其他检索符号,把不同的检索词连接起来进行检索的一个种方式,如数据库把不同的检索词连接起来进行检索的一个种方式,如数据库中的专业检索。适用于专业人员。中的专业检索。适用于专业人员。2 2、菜单式检索:菜单式检索:一种通过窗口菜单进行检索的简单、易操作一种通过窗口菜单进行检索的简单、易操作的检索方式。现各数据库的高级检索、初级检索都属于菜单的检索方式。现各数据库的高级检索、初级检索都属于菜单
2、式检索,是最常用的检索方式,适用于一般读者检索。式检索,是最常用的检索方式,适用于一般读者检索。3 3、导航检索:导航检索:点击检索界面上的超链接进行检索,也叫超链点击检索界面上的超链接进行检索,也叫超链接检索。接检索。分类途径分类途径主题途径主题途径关键词途径关键词途径题名途径题名途径责任者途径责任者途径引文途径引文途径第二节检索途径与检索语言第二节检索途径与检索语言 P25-26 检索途径检索途径 (检索项,检索点、检索入口(检索项,检索点、检索入口) 1v、检索语言:、检索语言:用来描述检索提问主题、学用来描述检索提问主题、学科分类等内容的语言,它和检索途径是相对科分类等内容的语言,它和
3、检索途径是相对应的。应的。(P27) 常见的检索语言有常见的检索语言有主题语言主题语言和和分类语言分类语言。检索语言的类型检索语言的类型表述文献外表表述文献外表特征的语言特征的语言表述文献内容表述文献内容特征的语言特征的语言题名题名责任者责任者代码代码引文引文分类法分类法主题法主题法 主题词是规范化的检索语言,主题词检索途径的主题词是规范化的检索语言,主题词检索途径的检索系统都有相应的主题词词表,利用主题词途检索系统都有相应的主题词词表,利用主题词途径标引或检索文献时,一定要先查对词表,再进径标引或检索文献时,一定要先查对词表,再进行标引或检索。国内中文主题词表一般采用行标引或检索。国内中文主
4、题词表一般采用中中国主题词表国主题词表或或中国图书馆图书分类主题词中国图书馆图书分类主题词表表,英文文献检索系统一般采用,英文文献检索系统一般采用美国国会图美国国会图书馆标题表书馆标题表 。 主题途径主题途径 根据分类语言进行检索的途径,它是一种按学科范根据分类语言进行检索的途径,它是一种按学科范畴和体系来划分事物的检索语言,以分类表的形畴和体系来划分事物的检索语言,以分类表的形式体现。国内文献分类一般使用式体现。国内文献分类一般使用中国图书馆图中国图书馆图书分类法书分类法(简称(简称中图法中图法).(P30) 专利使用专利使用国际专利分类法国际专利分类法(IPC)分类。国外)分类。国外分类法
5、很多,比较常见的有分类法很多,比较常见的有美国国会图书馆分美国国会图书馆分类法类法(LC)、)、国际十进分类法国际十进分类法等等。分类途径分类途径马克思主义、列宁主义、毛泽东思想哲学社会科学总论政治、法律军事经济文化、科学、教育 、体育语言、文字文学艺术历史、地理自然科学总论数理科学和化学天文学,地球科学生物科学医药、卫生农业、林业工业技术总论一般工业技术矿业工程石油、天然气工业治金工业金属学、金属工艺机械、仪表工业武器工业动力工程原子能技术电工技术无线电电子学、 电讯技术自动化技术、计 算技术化学工业轻工业、手工业建筑科学水利工程交通运输航空、宇宙飞行环境科学综合性图书中图法分类体系中图法分
6、类体系返回返回分类途径分类途径v 以关键词进行检索的方式,关键词又称以关键词进行检索的方式,关键词又称自由词,是从文献的题名、摘要和正文自由词,是从文献的题名、摘要和正文中抽出的具有实际意义的非规范化自然中抽出的具有实际意义的非规范化自然语言。语言。v其优点是:其优点是:A、简捷,降低对检索人员的要求;、简捷,降低对检索人员的要求;B、易用,易于计算机编制和检索;、易用,易于计算机编制和检索;C、及时,能及时更新词汇。、及时,能及时更新词汇。关键词途径关键词途径缺点:缺点:1、不规范,有大量的同义词、近义词,影响查、不规范,有大量的同义词、近义词,影响查全率和查准率。如全率和查准率。如“高速公
7、路高速公路”有有”highway”“autoroute”,“freeway”,“speedway”,“thruway”等,等,“图形图像图形图像”和和“图形图象图形图象”同义,检索时如果不能全部记同义,检索时如果不能全部记住,会出现漏检;而住,会出现漏检;而“cell”既指细胞又指电既指细胞又指电池,检索时会出现误检。池,检索时会出现误检。2、词汇量大,给存取带来困难。、词汇量大,给存取带来困难。由于关键词是未经人工干预的自然语言,符合由于关键词是未经人工干预的自然语言,符合大众的检索习惯,大多数检索系统都有关键词大众的检索习惯,大多数检索系统都有关键词检索。检索。 题名途径:题名途径:根据文
8、献名称包括书名、刊名、根据文献名称包括书名、刊名、论文篇名等来检索文献的途径。论文篇名等来检索文献的途径。 责任者途径:责任者途径:指根据已知文献著者来查找文指根据已知文献著者来查找文献的途径,献的途径, 包括个人著者和机关团体。包括个人著者和机关团体。 引文途径:引文途径:从被引文献去检索引用文献的检从被引文献去检索引用文献的检索途径。索途径。第三节计算机信息检索技术第三节计算机信息检索技术(一)逻辑运算符(一)逻辑运算符v逻辑运算符又称布尔算符,是用来表达各检逻辑运算符又称布尔算符,是用来表达各检索词之间的逻辑关系的符号。索词之间的逻辑关系的符号。v逻辑运算符有逻辑运算符有“与与”、“或或
9、”、“非非”三种,三种,分别用分别用“and” 、“or”、 “not”来表示,来表示,也可以用也可以用 “*” “+” “-”来表示。来表示。 1、逻辑、逻辑“或或”AB用符号用符号“or”或或“+”表示,其逻辑表达式为:表示,其逻辑表达式为: A or B 或或 A+B 其意义为检索记录中凡含有检索词其意义为检索记录中凡含有检索词A或检索词或检索词B,或同时含有检索词或同时含有检索词A和和B的,均为命中文献。的,均为命中文献。 例例: 2、逻辑、逻辑“与与”AB用符号用符号“and”或或“*”表示,其逻辑表达式为:表示,其逻辑表达式为: A * B 或或 A and B 其意义为检索记录中
10、必须同时含有检索词其意义为检索记录中必须同时含有检索词A和和B的文献,才算命中文献。的文献,才算命中文献。 例例 3、逻辑逻辑“非非” AB用符号用符号“not”或或“-”,其逻辑表达式为:,其逻辑表达式为: A not B 或或 A-B 其意义为:检索记录中含有检索词其意义为:检索记录中含有检索词A,但不能,但不能含有检索词含有检索词B的文献,才算命中文献。的文献,才算命中文献。例例 逻辑提问式(布尔逻辑组配):逻辑提问式(布尔逻辑组配):v计算机检索的基本技术,主要通过逻辑运算计算机检索的基本技术,主要通过逻辑运算符(布尔算符)符(布尔算符)“与与(and,*)”、“或或(or,+)”、
11、“非非(not,-)”等将检索词连接的提问式。等将检索词连接的提问式。v注意:优先级为注意:优先级为not,and,or,用括号保证优先,用括号保证优先权;运算符两侧必须各有一个空格(半角)。权;运算符两侧必须各有一个空格(半角)。v实例:实例:v膜法提取甘露醇中的微生物污染控制膜法提取甘露醇中的微生物污染控制(膜法(膜法+膜集成)膜集成)*甘露醇甘露醇*(细菌污染(细菌污染+微生物污微生物污染)染)写出以下检索词,并用上述布尔逻辑符写出检写出以下检索词,并用上述布尔逻辑符写出检索式:索式:固氮和固碳的生化机理或基因机制固氮和固碳的生化机理或基因机制 在检索词之间使用,规定算符两边的检索词出现
12、在在检索词之间使用,规定算符两边的检索词出现在记录中的的位置,以提高检准率。比如:如果不记录中的的位置,以提高检准率。比如:如果不用用with位置算符位置算符,则词组可能被系统识别为逻辑运则词组可能被系统识别为逻辑运算,算,protein disulfide isomerase(蛋白质二硫键(蛋白质二硫键异构酶)可能被识别成异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等符号时不易。尤其是出现数字等符号时不易识别成词组。识别成词组。 (二)、位置算符(二)、位置算符常见的位置算符如下:常见的位置算符如下:位置算符位置算符表示方法表
13、示方法说明说明with(W)或或()两个词在命中结果中相邻(可有空格、标点和连字两个词在命中结果中相邻(可有空格、标点和连字符),词序不得颠倒。符),词序不得颠倒。(nW)两个词之间最多可夹入两个词之间最多可夹入n个词,词序不得颠倒。个词,词序不得颠倒。near(N)两个词在命中结果中相邻,词序可颠倒。两个词在命中结果中相邻,词序可颠倒。(nN)两个词之间最多可夹入两个词之间最多可夹入n个词,词序可颠倒。个词,词序可颠倒。field(F)两个词在同一字段出现,位置不固定。两个词在同一字段出现,位置不固定。subfield(S)两个词在同一子字段出现,位置不固定。两个词在同一子字段出现,位置不固
14、定。link(L)两个词在同一规范词单元内出现,位置不固定。两个词在同一规范词单元内出现,位置不固定。(三)、通配符(截词检索)(三)、通配符(截词检索) 截词检索,就是将截词检索,就是将截词符如截词符如“* *”、“?” 等等,等等,放在检索词中检索者认为合适的地方截断,用截断放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符部中的所有字符( (串串) )的文献,都为命中文献。多用的文献,都为命中文献。多用于外文检索,因为西文语言的特点是构词灵活,在于外文检索,因为西文语言的特点是构词灵活,在词干
15、上前缀或后缀就可以派生出许多新的词汇。词干上前缀或后缀就可以派生出许多新的词汇。 v检索词的词干后(前)加一个检索词的词干后(前)加一个“?”(有的系统(有的系统为加为加*),表示词干后(前)可以有任意个字符。表示词干后(前)可以有任意个字符。如如“apple?”可代替可代替(apple + apples + apple-pie + applesauce);v由于文字结构方面的原因,中文检索系统极由于文字结构方面的原因,中文检索系统极少使用通配符进行截词。少使用通配符进行截词。v椰壳制备高比表面积活性炭椰壳制备高比表面积活性炭 ,椰壳可能表达椰壳可能表达为椰子壳,可以用为椰子壳,可以用“(椰子
16、壳十椰壳)(椰子壳十椰壳)* *高比高比表面积活性炭表面积活性炭 ”,或直接用或直接用“椰椰* *高比表面高比表面积活性炭积活性炭 ”(四)、禁用词(四)、禁用词v在绝大多数的检索系统中,介词、代在绝大多数的检索系统中,介词、代词、等单独使用无实际意义的词以及词、等单独使用无实际意义的词以及使用频率很高的词不能作为检索词,使用频率很高的词不能作为检索词,被称为禁用词,如被称为禁用词,如an,and,by,for,from,of,the,to,with等等。等等。(五)、限制检索(检索途径)(五)、限制检索(检索途径)在命令式检索中,通常要用字段代码来在命令式检索中,通常要用字段代码来限定检索的
17、字段,不同的数据库使用的字段限定检索的字段,不同的数据库使用的字段代码略有不同。代码略有不同。六六 加权检索加权检索v是一种定量检索技术:在每个提问词后面给是一种定量检索技术:在每个提问词后面给定一个数值表示其重要程度,这个数值称为定一个数值表示其重要程度,这个数值称为权,在检索时先查找这些词在记录中是否存权,在检索时先查找这些词在记录中是否存在,然后计算存在的权值总和,权值之和达在,然后计算存在的权值总和,权值之和达到或超过给定阈值,该记录即为命中记录。到或超过给定阈值,该记录即为命中记录。七七 聚类检索聚类检索 v把相似度较高的文献集中在一起形成一个个的文献类的检索技术。八、匹配方式八、匹
18、配方式 P37-38v前方一致:检出文献的相关字段前方和检索前方一致:检出文献的相关字段前方和检索词一致,如:检索词为词一致,如:检索词为“世界贸易组织世界贸易组织”,可检出可检出 世界贸易组织概论世界贸易组织概论 ,检不出,检不出 大学世界贸易组织教程大学世界贸易组织教程 v精确检索:精确检索:表示检索词和检出文献的相关字表示检索词和检出文献的相关字段完全一致,如检索词为段完全一致,如检索词为“世界贸易组织世界贸易组织”,可检出可检出 世界贸易组织世界贸易组织,检不出,检不出 大学世大学世界贸易组织教程界贸易组织教程 和和 世界贸易组织概论世界贸易组织概论 v模糊检索:模糊检索:包含关系,检
19、索词可以在相关字包含关系,检索词可以在相关字段的任何位置。这是最常见的匹配方式。段的任何位置。这是最常见的匹配方式。v在许多检索系统中(在许多检索系统中(CNKI 、万方、搜索引、万方、搜索引擎),擎),精确检索精确检索表示包含关系,即检索词不表示包含关系,即检索词不被切分,包含在相关字段的任何位置,与前被切分,包含在相关字段的任何位置,与前述的模糊检索相同。述的模糊检索相同。模糊检索模糊检索表示自动分词表示自动分词检索。检索。分分析析检检索索课课题题选选择择工工具具确确定定检检索索词词编编制制检检索索式式显显示示及及判判断断检检索索结结果果获获取取原原始始文文献献文文献献阅阅读读和和分分析析
20、评评价价输输出出检检索索结结果果否否不满意不满意是是满意满意第四节检索步骤第四节检索步骤 普查型:普查型:需要全面收集有关某一主题的文献资料,如需要全面收集有关某一主题的文献资料,如以课题开题、教材编写等。具有普查、回溯的特点,要以课题开题、教材编写等。具有普查、回溯的特点,要求尽可能高的查全率。求尽可能高的查全率。 攻关型:攻关型:需要收集有关某一主题某一特定方面的文献,需要收集有关某一主题某一特定方面的文献,其目的在于解决科研、生产中的关键问题,这类需求不其目的在于解决科研、生产中的关键问题,这类需求不强调查询的文献数量,但需要查得的文献具有较强的专强调查询的文献数量,但需要查得的文献具有
21、较强的专指性。指性。 学习型学习型:需要了解掌握某一领域的研究动向、研究成需要了解掌握某一领域的研究动向、研究成果或相关知识,要求查到的文献具有新颖及时的特点,果或相关知识,要求查到的文献具有新颖及时的特点,而对查全率和查准率不一定有很高的要求。而对查全率和查准率不一定有很高的要求。 1 1、课题分析、课题分析2 2、选择检索工具、选择检索工具全面性:全面性:即是否与课题相关的内容都要检索,包括的工具有即是否与课题相关的内容都要检索,包括的工具有一次文献和二次文献数据库,以及网上相关资源等。一次文献和二次文献数据库,以及网上相关资源等。针对性针对性:保证选择的检索工具与检索课题的学科一致保证选
22、择的检索工具与检索课题的学科一致专业性专业性:即选择与学科专业相关的工具,特别注意跨学科领域内容即选择与学科专业相关的工具,特别注意跨学科领域内容权威性权威性:尽量选用该学科的权威性检索工具尽量选用该学科的权威性检索工具v提取提取检索词时要注意切分句子或词组、删除多余词、替换检索词时要注意切分句子或词组、删除多余词、替换模糊词、补充合理逻辑模糊词、补充合理逻辑 。选择规范化的检索词;使用各学。选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概找出课题涉及的隐性主题概念
23、作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。不同拼法;联机方式确定检索词。 例:土豆例:土豆马铃薯,世界贸易组织马铃薯,世界贸易组织World Trade World Trade OrganizationOrganization、 WTOWTO3 3、确定检索词、确定检索词v根据检索目的选词根据检索目的选词。如。如“个性化推荐系统个性化推荐系统”,我们,我们要弄清是电子商务中的推荐系统,还是其他方面的要弄清是电子商务中的推荐系统,还是其他方面的个性化推荐系统。个性化推荐系统。v合理切分
24、句子或词组,合理切分句子或词组,切不可用句子作为检索词切不可用句子作为检索词,尽量不用短语作检索词。尽量不用短语作检索词。一些非规范的词组也要进一些非规范的词组也要进行合理切分。如:红辣椒,可切分为红行合理切分。如:红辣椒,可切分为红*辣椒,因为辣椒,因为可能会检出红色辣椒。但活性炭则不可切分为活性可能会检出红色辣椒。但活性炭则不可切分为活性*炭炭,因为这是不可分的规范词。因为这是不可分的规范词。 v考虑相应的同义词考虑相应的同义词。对同一事物,人们对其有不同。对同一事物,人们对其有不同的称呼和表达,如的称呼和表达,如“计算机计算机”又称又称“电脑电脑”、“图图形图像与图形图象形图像与图形图象
25、”要用逻辑或进行检索。要用逻辑或进行检索。v上位词、下位词上位词、下位词:检索词有上位词下位词之分,一般来说,:检索词有上位词下位词之分,一般来说,如果检索上位词,要同时检索下位词,如在如果检索上位词,要同时检索下位词,如在EBSCOEBSCO中,我中,我们检索们检索“芭蕾舞服装(芭蕾舞服装(ballet costume)”,必须同时,必须同时检索检索“芭蕾舞裙芭蕾舞裙( (ballet skirt)”)”、“芭蕾舞鞋芭蕾舞鞋( (toe shoe)”)”,才能得到满意的查全率。当然,如果下位词太,才能得到满意的查全率。当然,如果下位词太多,则不能全部选择。如果下位词检索效果不理想,也可多,则
26、不能全部选择。如果下位词检索效果不理想,也可以在上位词中检索。海南黄花梨病虫害防治,没有专门的以在上位词中检索。海南黄花梨病虫害防治,没有专门的书,但在书,但在景观植物病虫害防治景观植物病虫害防治 一书中有一节专门论述。一书中有一节专门论述。v不同外来词译法的变化不同外来词译法的变化:如:如:“欧几里德欧几里德”、“欧几里欧几里得得”、“欧基里德欧基里德”、“欧几理德欧几理德 ” ”、“Euclid”Euclid”。 “aspirin”aspirin”、“阿斯匹林阿斯匹林”, “, “阿司匹林阿司匹林”, “, “乙酰水乙酰水杨酸杨酸”。例:例: 苯胺的烷基化反应催化剂研究苯胺的烷基化反应催化
27、剂研究 检索式:检索式:苯胺苯胺* *烷基化烷基化* *催化剂催化剂 (3737篇)篇) 词表词表烷基化烷基化 F F 甲基化甲基化 乙基化乙基化 修订后检索式:修订后检索式: 苯胺苯胺* *( (烷基化烷基化+ +甲基化甲基化+ +乙基化乙基化) )* *催化剂催化剂 (6161篇)篇) 4 4选选择择检检索索途途径径 检索检索式:式:又称检索策略又称检索策略,由检索词和各种布由检索词和各种布尔逻辑算符、位置算符、截词算符等组成。在尔逻辑算符、位置算符、截词算符等组成。在命令式检索中可根据检索式进行高级组配检索。命令式检索中可根据检索式进行高级组配检索。v检索式可一次完成,也可分步完成,检索
28、检索式可一次完成,也可分步完成,检索式的表达对一个课题不是唯一的,有多种式的表达对一个课题不是唯一的,有多种选择、组配、限定。选择、组配、限定。 5 5、制定检索式、制定检索式例例1:查找:查找“科技英语写作科技英语写作”的文献的文献(1)分析课题,确定学科范围;分析课题,确定学科范围;(2)选择数据库:选择数据库:CNKI (3)确定关键词:科技、英语、写作确定关键词:科技、英语、写作(4)检索式:科技检索式:科技*英语英语*写作写作例例2: 化妆品检测方面的文献化妆品检测方面的文献(1)分析课题,确定学科范围;分析课题,确定学科范围;(2)选择数据库:选择数据库:CNKI(3)确定主题词:确定主题词:化妆品、分析、检测、测定化妆品、分析、检测、测定 等。等。(4)检索式:化妆品检索式:化妆品*(分析分析+检测检测+测定测定) v例例1:查找:查找“造纸废水处理技术造纸废水处理技术”的外文文献的外文文献A、抽词:造纸(、抽词:造纸(paper making, paper pulp ) 废水(废水(waste water) 处理(处理(treat, treatment) B、检索式、检索式(paper () making or
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教 八年级 语文 下册 第5单元《18.在长江源头各拉丹冬 第1课时》课件
- 2025 网络基础中物流网络的网络冷链物流监控案例课件
- 钢料仓拆除项目可行性研究报告
- 小学音乐课堂教学培训【课件文档】
- 2026年及未来5年市场数据中国轻质改性石膏隔墙板行业发展前景预测及投资战略咨询报告
- 刑事诉讼法的基本概念和任务
- 2025 高中信息技术数据与计算之计算思维在湿地生态数据监测分析中的应用课件
- 2025 高中信息技术数据与计算之算法的禁忌搜索算法课件
- 2026年及未来5年市场数据中国礼品定制行业发展监测及市场发展潜力预测报告
- 2026小红书博主全解析
- 23G409先张法预应力混凝土管桩
- 机器人技术及其应用课件
- 《从零开始玩转活动策划(升级版)》读书笔记模板
- (198)-秦可卿课件2红楼梦人物艺术鉴赏
- 严重精神障碍患者宣传与教育
- 截面的形心静矩
- GB/T 18883-2022室内空气质量标准
- GB/T 4458.6-2002机械制图图样画法剖视图和断面图
- 半命题作文指导-课件
- 2023年江苏海事职业技术学院单招考试面试模拟试题及答案解析
- 美世-宝钢国际职位评估系统
评论
0/150
提交评论