检索策略与主题标引(2012研)_第1页
检索策略与主题标引(2012研)_第2页
检索策略与主题标引(2012研)_第3页
检索策略与主题标引(2012研)_第4页
检索策略与主题标引(2012研)_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、图书馆图书馆 冯勤冯勤 2012.09主要内容主要内容:一、一、检索语言检索语言二、检索途径二、检索途径三、检索程序(步骤)三、检索程序(步骤)四、四、检索功能检索功能五、五、主题词表与主题标引主题词表与主题标引六、检索策略调整六、检索策略调整一、检索语言一、检索语言 检索语言是文献中用来描述文献检索语言是文献中用来描述文献外表特征外表特征和和内容特征内容特征和表达检索提问内容的一种专门人工语和表达检索提问内容的一种专门人工语言,又称情报语言、标引语言、索引语言等。言,又称情报语言、标引语言、索引语言等。文献外表特征:书文献外表特征:书/ /刊刊/ /篇名、著者、出版事项等。篇名、著者、出版事

2、项等。 分类检索语言分类检索语言文献内容特征:文献内容特征: 主题检索语言主题检索语言 分类检索语言分类检索语言以学科分类为基础,结合信息内容特征以学科分类为基础,结合信息内容特征的一种直接体现知识分类概念的检索语的一种直接体现知识分类概念的检索语言。言。以树状结构的形式,采用概念逻辑分类以树状结构的形式,采用概念逻辑分类的原理,层层划分,构成具有上下类的原理,层层划分,构成具有上下类(隶属关系)、同位类(并列关系)的(隶属关系)、同位类(并列关系)的概念等级体系。概念等级体系。用用分类号、类目名称分类号、类目名称来表达各种概念。来表达各种概念。中国图书馆分类法中国图书馆分类法(中图法)简表(

3、中图法)简表A马列、毛泽东思想马列、毛泽东思想B哲学、宗教哲学、宗教C社会科学总论社会科学总论D政治、法律政治、法律E军事军事F经济经济G文教、科学、体育文教、科学、体育H语言、文字语言、文字I文学文学J艺术艺术K历史、地理历史、地理N自然科学总论自然科学总论O数学、物理、化学数学、物理、化学P天文学、地球科学天文学、地球科学Q生物科学生物科学R医药、卫生医药、卫生S农业科学农业科学T工业科学工业科学U交通运输交通运输V航空、航天航空、航天X环境科学环境科学Z综合性图书综合性图书R R医药、卫生医药、卫生R1 预防医学、卫生学R2中国医学R3基础医学R4临床医学R5内科学-R6外科学R71妇产

4、科学R72儿科学R73肿瘤学.R8特种医学R9药学R51传染病R52结核病R53寄生虫病R54心脏、血管疾病R55血液及淋巴系疾病R56呼吸系及胸部疾病R57消化系及腹部疾病R58内分泌腺疾病及代谢病R59全身性疾病体系分类法的优缺点体系分类法的优缺点优点:系统性强,族性检索,便于按学科、优点:系统性强,族性检索,便于按学科、专业直接检索比较广泛的课题。查全率较专业直接检索比较广泛的课题。查全率较高。高。缺点:缺乏专指性,查准率不高,不能满缺点:缺乏专指性,查准率不高,不能满足专深课题以及新兴学科、交叉学科和边足专深课题以及新兴学科、交叉学科和边缘学科知识的检索。对于分类体系不熟悉缘学科知识的

5、检索。对于分类体系不熟悉容易误检和漏检。容易误检和漏检。 主题检索语言主题检索语言以文献的主题内容为依据,用以文献的主题内容为依据,用词语词语作为概作为概念标识,并按一定的顺序排列而成的一种念标识,并按一定的顺序排列而成的一种检索语言。检索语言。优点:直接性、专指性强,比较适合专深优点:直接性、专指性强,比较适合专深课题的检索。课题的检索。主题检索语言:主题词、关键词主题检索语言:主题词、关键词主题词(主题词(subject heading) 又称叙词(又称叙词(Discriptor),是),是 经过规经过规范化处理的具有实质性意义的词或词组。范化处理的具有实质性意义的词或词组。 “ 规范规范

6、”:是对一个概念的同义词、:是对一个概念的同义词、近义词和拼法变异词适当归并,采用参照近义词和拼法变异词适当归并,采用参照系统,并有主题词的范畴表和树状结构。系统,并有主题词的范畴表和树状结构。形成专门的主题词表。形成专门的主题词表。 主题词表主题词表语词规范化所使用的工具。语词规范化所使用的工具。 国内医学检索工具:国内医学检索工具:中国中医药学主题词表中国中医药学主题词表、医学主题词注释字顺医学主题词注释字顺表表。 国外医学检索工具:国外医学检索工具:Medical Subject Headings ( MeSH,医学主题词表),医学主题词表)主题词的特点主题词的特点 规范错综复杂的名词概

7、念,对规范错综复杂的名词概念,对同义词、同义词、近义词、多义词近义词、多义词 进行规范和控制进行规范和控制 ,使标引,使标引人员与检索人员在检索时有共同语言。人员与检索人员在检索时有共同语言。 主题词具有主题集中、学科分散的特点,主题词具有主题集中、学科分散的特点,故能提高文献检索的查全率和查准率。故能提高文献检索的查全率和查准率。关键词(关键词(keyword)未经严格规范化处理的检索词或词组(自未经严格规范化处理的检索词或词组(自然语言)。然语言)。通常是从文献的通常是从文献的题目、摘要、正文题目、摘要、正文中选取中选取出来。标引出的关键词在文献中起关键性出来。标引出的关键词在文献中起关键

8、性作用,通常是由名词、形容词等实质性词作用,通常是由名词、形容词等实质性词构成。构成。关键词的特点关键词的特点 优点:可不用优点:可不用主题词表主题词表,自由选词,不,自由选词,不受限制。受限制。 缺点:同一主题的文献可能分散在不同的词缺点:同一主题的文献可能分散在不同的词下,可能造成漏检。要提高查全率,就必下,可能造成漏检。要提高查全率,就必须分别检索同一主题的同义词和近义词等。须分别检索同一主题的同义词和近义词等。 一体化医学语言系统一体化医学语言系统(Unified Medical Language System, UMLS)由美国由美国NLM自自1986年起研究和开发的生物年起研究和开

9、发的生物医学信息检索语言的集成系统和机读信息资医学信息检索语言的集成系统和机读信息资源指南系统。源指南系统。UMLS通过将大量的检索词(包括规范词和通过将大量的检索词(包括规范词和自由词)累积输入系统中,进行检索词自由词)累积输入系统中,进行检索词自动自动转换转换处理,使用户能够不必考虑检索词的规处理,使用户能够不必考虑检索词的规范性或知识分类属性,不受人工语言和自然范性或知识分类属性,不受人工语言和自然语言的限制。语言的限制。具有智能检索功能的系统:具有智能检索功能的系统:PUBMED/CBMPUBMED/CBM二、检索途径二、检索途径是检索工具提供的检索入口。通常检索工具都是检索工具提供的

10、检索入口。通常检索工具都按照文献的特征进行标引,形成不同的索引,按照文献的特征进行标引,形成不同的索引,如分类索引、主题索引、作者索引、代码索引、如分类索引、主题索引、作者索引、代码索引、引文索引等,一种索引就是相应的检索途径。引文索引等,一种索引就是相应的检索途径。计算机检索提供的途径几乎包括文献所有的外计算机检索提供的途径几乎包括文献所有的外部特征和内容特征,如标题、作者、作者单位、部特征和内容特征,如标题、作者、作者单位、出处、文摘、关键词、主题词、分类号、出处、文摘、关键词、主题词、分类号、ISSNISSN等。等。分类途径分类途径分类途径:按照文献的主题内容所属的学科分类体分类途径:按

11、照文献的主题内容所属的学科分类体系,利用分类目录进行文献检索。系,利用分类目录进行文献检索。举例:查小儿白血病,应选:举例:查小儿白血病,应选:AR55血液及淋巴系疾病血液及淋巴系疾病BR725.5小儿血液及淋巴系疾病小儿血液及淋巴系疾病CR733.7白血病白血病DR54心脏、血管疾病心脏、血管疾病答案:答案:C注意:分类途径检索关键在于对分类法的熟悉和理解注意:分类途径检索关键在于对分类法的熟悉和理解。CBM分类检索维普分类检索-查看分类表主题途径主题途径主题词途径:利用主题索引或主题词字段主题词途径:利用主题索引或主题词字段检索。关键在于主题词的选取和确定。检索。关键在于主题词的选取和确定

12、。关键词途径:利用关键词索引和关键词字关键词途径:利用关键词索引和关键词字段检索。选词比较自由,但注意漏检率较段检索。选词比较自由,但注意漏检率较高。高。主题词途径-查看主题词表在主题词表中选正确的主题词关键词途径-直接输入关键词关键词与主题词字段的显示【分类号分类号】:R449;:R449;* *R725.5;R733.7;R977;R978.7;R979.12R725.5;R733.7;R977;R978.7;R979.12【标题标题】: :小儿急性非淋巴细胞白血病的诊治现状与展望小儿急性非淋巴细胞白血病的诊治现状与展望【作者作者】: :吴梓梁吴梓梁【作者单位作者单位】: :广州医学院第一

13、附属医院儿科广州医学院第一附属医院儿科, ,广州广州 510120510120【摘要摘要】: :目前非淋巴细胞白血病目前非淋巴细胞白血病(ANLL)(ANLL)(除除M3M3型外型外) )的疗效尚未令人满意的疗效尚未令人满意, ,无论是化疗无论是化疗, ,还是造血干细胞移植还是造血干细胞移植, ,其最好的其最好的5a5a无病生存率无病生存率(EFS)(EFS)为为55%55%一一65%65%。理想的治疗方案仍在探索中。理想的治疗方案仍在探索中, ,根据作者有限的经验根据作者有限的经验, ,以超大剂量阿糖胞苷以超大剂量阿糖胞苷(SHD-(SHD-AraAra-C)-C)为主的诱导后化疗方案有可能

14、是治疗小儿为主的诱导后化疗方案有可能是治疗小儿ANLLANLL最有效的化疗方最有效的化疗方案之一。案之一。.【出处出处】: :实用儿科临床杂志实用儿科临床杂志 2012;27(3) 153-1552012;27(3) 153-155【关键词关键词】: :急性非淋巴细胞白血病急性非淋巴细胞白血病; ;治疗治疗; ;超大剂量化疗超大剂量化疗; ;阿糖胞苷阿糖胞苷【主题词主题词】: :阿糖胞苷阿糖胞苷/ /* *投药和剂量投药和剂量; ;* *白血病白血病, , 淋巴样淋巴样; ;存活率存活率; ;急性病急性病; ;* *无无病生存病生存; ;造血干细胞移植造血干细胞移植【特征词特征词】: :儿童儿

15、童; ;儿童儿童, , 学龄前学龄前; ;人类人类著者途径著者途径 按照著者姓名、学术团体及机构名称作为检索标识,通过著者索引或著者字段检索。 注意姓名的缩写形式,数据库中著者著录规则一般是:姓前名后,姓是全称,名为缩写的首字母。如:Smith J, Li XH 区别同名同姓的著者,利用单位名称、地址或研究课题的不同加以区分。作者检索途径三、检索程序(步骤)三、检索程序(步骤)分析检索需求分析检索需求选择检索工具或选择检索工具或数据库数据库确定检索途径确定检索途径编制编制检索提问式检索提问式获得文献线索(题录、文摘)获得文献线索(题录、文摘)索取原文索取原文常用中外文数据库中国生物医学文献数据

16、库(中国生物医学文献数据库(CBM)维普中文科技维普中文科技期刊期刊数据库(数据库(VIP)中国知网数据库(中国知网数据库(CNKI)万方数据库万方数据库超星数字图书馆超星数字图书馆读秀读秀MEDLINE/PubMed(美国生物医学数据库)EBSCOOVID检索词输入框检索词输入框数据库提供多种途径检索要点要点:检索提问式:检索提问式v在计算机检索过程中,用户的检索需求是通过检在计算机检索过程中,用户的检索需求是通过检索提问式表达的。即通过计算机检索系统提供的索提问式表达的。即通过计算机检索系统提供的组配、限定、加权、扩展、截词等多种组配、限定、加权、扩展、截词等多种检索功能检索功能,运用一定

17、的算符,将表达检索要求的运用一定的算符,将表达检索要求的检索词检索词构造构造成提问式,提交系统进行检索。成提问式,提交系统进行检索。 四、检索功能四、检索功能布尔逻辑检索(组配检索)布尔逻辑检索(组配检索)限定检索限定检索截词检索截词检索位置算符检索位置算符检索加权检索加权检索布尔逻辑检索(组配检索)布尔逻辑检索(组配检索)逻辑与(逻辑与(AND ,*):): A AND B ,A*B表示被检索的文献记录中必须同时含有表示被检索的文献记录中必须同时含有A和和B两个概念。两个概念。例:小儿例:小儿 AND 白血病白血病小儿小儿白血病白血病布尔逻辑检索(组配检索)布尔逻辑检索(组配检索)逻辑或(逻

18、辑或(OR ,+) A OR B ,A+B表示文献中含有其中任何一个概念就会被检出。表示文献中含有其中任何一个概念就会被检出。例:小儿例:小儿 or 儿童儿童小儿儿童布尔逻辑检索(组配检索)布尔逻辑检索(组配检索)逻辑非(逻辑非(NOT, ) A NOT B,AB表示排除检索范围中不需要的概念。表示排除检索范围中不需要的概念。例:微量元素例:微量元素 NOT 锌锌微量元素微量元素锌锌限定检索限定检索常见的可限定检索字段有:常见的可限定检索字段有: 题目、作者、语种、文摘、出版物类型、题目、作者、语种、文摘、出版物类型、期刊、年代、出版国等字段。期刊、年代、出版国等字段。限定检索可缩小检索范围。

19、限定检索可缩小检索范围。 字段限定截词检索截词检索截词符号有截词符号有“?、?、* ”等等,用于提高查全率。,用于提高查全率。 例:例: CBM检索词可使用单字通配符检索词可使用单字通配符“?”?”、任意通、任意通配符配符“%”%”。如:胃。如:胃? ?癌、肝癌、肝% %疫苗。疫苗。 Pubmed使用使用“*”作为截词符号作为截词符号 ,如,如physi*,可检索出可检索出physics, physical, physiology等,如等,如果果physi*超过超过600个词,会提示延长词根查找。个词,会提示延长词根查找。截词检索示例:查胃胃? ?癌癌位置算符检索位置算符检索A NEAR B

20、:表示:表示A 、B两个词语必须同时出现在同一句子两个词语必须同时出现在同一句子中。中。例:例: high near2 chromatography可检出:可检出:high pressure liquid chromatography,和和high performance liquid chromatography等文献等文献 A WITH B :表示:表示A、B必须同时出现在同一字段。(词间必须同时出现在同一字段。(词间位置位置 的要求比的要求比NEAR宽松些)宽松些)加权检索加权检索加权检索是对每个检索词赋予一个数值,即加权检索是对每个检索词赋予一个数值,即“权权”,权值越大,检索出的文献

21、命中程度越,权值越大,检索出的文献命中程度越高。高。不同的检索系统对加权有不同的定义,也并非不同的检索系统对加权有不同的定义,也并非所有计算机检索系统都具备加权检索功能。所有计算机检索系统都具备加权检索功能。MEDLINE和和CBM 中对中对主要主题词主要主题词打打“*”号号。PUBMED主题词字段的显示五、主题词表与主题标引五、主题词表与主题标引通过文献(相关课题)的分析,提炼出主通过文献(相关课题)的分析,提炼出主题概念转换成题概念转换成主题词、关键词主题词、关键词等等检索语言检索语言,并以此作为文献检索标识。这一过程就称并以此作为文献检索标识。这一过程就称为主题标引。为主题标引。 主题标

22、引也即检索词的表达、选择、主题标引也即检索词的表达、选择、确定的过程。确定的过程。依据依据主题词表主题词表选择最相匹配的主题词进行标引选择最相匹配的主题词进行标引上位类与下位类主题词的使用上位类与下位类主题词的使用主题词主题词/副主题词组配副主题词组配原则原则主题词靠词标引主题词靠词标引1.主题词标引 医学主题词表 (Medical Subject Headings(Medical Subject Headings,MeSH)MeSH)是美国国立医学图书馆是美国国立医学图书馆(NLM)(NLM)编制的权威性编制的权威性主题词表。它是一部规范化的可扩充的动态主题词表。它是一部规范化的可扩充的动态

23、性叙词表。性叙词表。NLMNLM以它作为生物医学标引的依据,编制以它作为生物医学标引的依据,编制医学索引医学索引及及MEDLINEMEDLINE数据库。数据库。MeSHMeSH汇集约汇集约18,00018,000多个医学主题词。多个医学主题词。MeSH Browser(医学主题词浏览器)MeSH Browser不直接和不直接和medline或其他数据库链接,不能替代或其他数据库链接,不能替代PUBMED系统系统。主题词表主题词表-字顺表字顺表 (1)规范检索词规范检索词:使标引和检索之间用语一致。使标引和检索之间用语一致。 参照系统参照系统:用代参照、相关参照:用代参照、相关参照 (2)确定主

24、题词确定主题词/副主题词副主题词。 (3)确定相关主题词,扩大检索范围确定相关主题词,扩大检索范围例例: Exercise X(替代)(替代) Exercise, Physical 同义词同义词 见见/用用 主题词主题词相关的逆参照相关的逆参照:例例: 运动,体育运动,体育 参见参见 运动运动 Exercise, Physical see Exercise第一组第一组 用代参照用代参照 揭示等同关系,规范词意作用。揭示等同关系,规范词意作用。用于一组同义词中选一个科学通用的名称作为主题词。用于一组同义词中选一个科学通用的名称作为主题词。第二组第二组 相关参照相关参照 揭示相关关系,起到扩大检索

25、范围的作用。用于揭示相关关系,起到扩大检索范围的作用。用于 主题词见主题词主题词见主题词。例例1:1:运动运动 相关参见相关参见 用力、身体素质用力、身体素质 ExerciseExercise see related ExertionExertion、 Physical FitnessPhysical Fitness 反参:反参: Exertion XR Exercise、Fatigue(疲劳疲劳)、 Sports(体育运动体育运动)、Work(工作工作) 参照系统参照系统CBM:CBM:参照系统示例参照系统示例 副主题词又称限定词副主题词又称限定词(Qualifiers)(Qualifier

26、s),与主题词进行组配,对某一主题词的概念与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专进行限定或复分,使主题词具有更高的专指性。指性。 副主题词目前是副主题词目前是9292个。个。 在进行检索时,用户输入一个主题在进行检索时,用户输入一个主题词后,系统会自动显示该主题词所能组配词后,系统会自动显示该主题词所能组配的副主题词。的副主题词。 副主题词 (Subheadings)副主题词副主题词CBMCBM副主题词使用副主题词使用举例举例主题词/副主题词组配的原则-1检索有专指的副主题词,勿用泛指的副主题词;(参照预检索有专指的副主题词,勿用泛指的副主题词;(参照预扩展检

27、索副主题词表)扩展检索副主题词表)v例:诊断例:诊断 治疗治疗 病理学病理学 膳食疗法膳食疗法 放射摄影术放射摄影术 药物疗法药物疗法 放射性核素显像放射性核素显像 护理护理 超声检查超声检查 预防和控制预防和控制 放射疗法放射疗法 康复康复 外科学外科学 移植移植注意:副主题扩展检索是指包括该副主题词所有下位词都一并检索。注意:副主题扩展检索是指包括该副主题词所有下位词都一并检索。用于查全。用于查全。组配的原则-2能用主题词/副主题词组配的,不用与副主题词等义的主题词。v 例:乙型肝炎的免疫学研究标引为:肝炎,乙型/免疫学 不用:肝炎,乙型 AND 免疫学组配的原则-3NLM对同一主题词进行

28、复分所用的副主题词不超过3个,如需3个以上,一般不与副主题词组配。利用主题词途径检索,注意选用 ALL(全部副主题词) NONE(不带副主题词) 分析(具体的副主题词) 血液 范畴表又称树状结构表范畴表又称树状结构表是主题词的分类体系。是主题词的分类体系。 MESH将主题词按学科属性归入将主题词按学科属性归入1616大类大类, , 每每个大类按等级缩格排列,最多可达个大类按等级缩格排列,最多可达11级。如级。如: Nervous System Nervous System A8A8 Central Nervous System Central Nervous System A8.186A8.1

29、86 Brain Brain A8.186.211A8.186.211 Prosencephalon Prosencephalon A8.186.211.730A8.186.211.730主题词表主题词表-范畴表范畴表(Tree structure) A A 解剖学解剖学 B B 生物体生物体 C C 疾病疾病 D D化学品和药物化学品和药物树状结构树状结构/范范畴表畴表CBM:CBM:范畴表示例范畴表示例树状结构号树状结构号上下位的选择首先选用专指的下位类主题词主题词较泛指时,应用扩展检索(机检时通过主题途径能自动扩检,手检则不能)根据课题要求和检索结果调整检索策略,用于扩大或缩小检索范围。

30、树状结构表的功能树状结构表的功能(1)便于按学科体系选词便于按学科体系选词(2)通过范畴号确定所选词的学科范围通过范畴号确定所选词的学科范围(3)对广义概念(上位概念)检索时要使对广义概念(上位概念)检索时要使用该表,以便用该表,以便扩展下位检索扩展下位检索(4)有专指的有专指的下位概念要用专指下位概念要用专指概念概念靠词标引某些主题概念在词表中没有相应的主题词进行标引时,可以采用靠词标引:靠最直接的上位类主题词v例:病毒性心肌炎 病毒性疾病 AND 心肌炎2.关键词标引及检索式编写1.关键词标引查准率高,但查全率低,应尽可能多的标引出同义词、近义词,并使用逻辑或构建检索式。包括其不同的拼写形

31、式、单复数、全称与简称、学名与俗名等。例如:l黄苓苷or 黄芩甙 or 黄苓苷元 or 黄苓素 l白细胞介素1(白介素1 、IL1 、IL-1)l斑点追踪(超声二维斑点追踪技术、斑点追踪成像技术、二维斑点追踪显像技术) 2.对一些词语不应做关键词标引,如影响、患者、研究、观察等。检索式:心血管疾病心血管疾病 AND 微量元素 AND 代谢不同表达:不同表达:心血管病、心脑血管病、心血管病、心脑血管病、某一类疾病(范畴词),包含很多下位概念:心脏病、某一类疾病(范畴词),包含很多下位概念:心脏病、高血压高血压解决:同义词用解决:同义词用OR;用分类途径;用分类途径R54;主题词扩展检索;主题词扩展检索关键词标引示例1:标引出:心血管疾病、 微量元素、 代谢查找:心血管疾病微量元素的代谢的相关文献关键词标引示例2:查找:丹参与维拉帕米对大鼠肝纤维化、肝硬化防治作用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论