医学文献检索概论ppt课件_第1页
医学文献检索概论ppt课件_第2页
医学文献检索概论ppt课件_第3页
医学文献检索概论ppt课件_第4页
医学文献检索概论ppt课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学文献检索,1,为什么要学习文献检索?,科学研究的一般工作流程:,检索相关的研究分析现有的研究结果发现问题提出假说,制订试验方案定义试验步骤试验数据汇总,数据可视化数据验证调整试验重新校验假说,写作研究论文发表研究论文,研究活动:反复、重复、动态、以人为中心依赖于各种不同的资源,2,为什么要学习文献检索?,据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。由上述统计数字可以看出,科研人员花费在科技出版物上的时间为全部科研时间的60%。,3,基础知识,一.文献及其类型1.文献(documents,literature):是记录有知识的一切载体。四要素:(1)记录知识的具体内容(2)记录知识的手段,如文字、图像、符号、声频、视频等(3)记录知识的物质载体,如纸张、光盘、录像带等(4)记录知识的表现形态,如图书、期刊、专利说明书等,4,基础知识,2.文献的类型:(按载体类型、出版形式、内容加工深度、获取难易程度等进行分类)A.文献按内容加工深度可分四类:(1)一次文献(PrimaryDocument):指作者以其本人的研究成果(如实验、观察、调查研究等结果)为基本素材写成的原始创作。所记录的是作者的最新发现或发明,以及新的见解、新的理论、新的方法等新颖、具体而详尽的知识,因而成为科学研究等工作的最主要信息来源,尤其是期刊论文,已成为科技文献的主体,但由于其量大、分散而无序,给读者的查找和利用带来了极大的不便。(2)二次文献(SecondaryDocument):即检索工具,是指将大量无序、分散的一次文献收集、整理、加工、著录其特征如著者、篇名、分类、主题、出处等,并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式。包括索引、文摘、目录及相应的数据库。,5,基础知识,(3)三次文献(TertiaryDocument):科技人员围绕某一主题,利用二次文献的检索,在吸取一次文献内容的基础上,即经过阅读、分析、归纳、概括,撰写而成的新的文献,或综述已取得的成果进展,或加评论、或预测发展趋势。形如综述(review)、述评(comment)、进展(advance;progress)、现状(update)、发展趋势(trend)等期刊文献和百科全书、年鉴、手册等参考工具书。(4)零次文献(ZeroDocument):指未经信息加工,直接记录在载体上的原始信息,如实验数据、观测记录、调查材料等。,6,研究活动(实验、观察、思考),信息的直接记录或传递,零次文献(创造知识的素材),将知识以文字等形式固化,一次文献(初始的知识产品),将分散的文献序列化,二次文献(一次文献的替代品),将知识重新组合,使知识序列化,三次文献(浓缩的新的信息产品),各级文献的形成及相互关系,7,基础知识,B.文献按获取的难易程度可分三类:(1)白色文献:完全公开(2)黑色文献:完全不公开(3)灰色文献:内部交流,8,基础知识,3.文献信息的特点(1)数量庞大,增长迅速(2)文种繁多,但呈明显的英文化趋势(3)内容交叉重复(4)文献形式呈现多样化(5)文献分布既集中又分散,但呈专题化或专集化趋势(6)知识老化加快,文献寿命(半衰期)缩短(7)交流传播及变化速度加快,9,基础知识,4.文献信息的社会功能(作用)(1)是科学的表现形式,是汇集人类财富的主要场所(2)是衡量科学技术水平的重要依据(3)是传播科学知识的最基本、最主要的手段(4)是确认科学发现与技术发明优先权的认证记录,10,基础知识,5.医学文献的结构(1)图书的结构:主要包括封面、封底、书脊、书名页、出版说明、前言(序)、目次、附录、后记等。参考文献的格式(NLM采用的ANSI标准格式)NormanIJ,RedfernSJ,editors.Mentalhealthcareforelderlypeople.NewYork:ChurchillLivingstone;1996,11,基础知识,书中的章节:PhilipsSJ,WhisnantJP.Hypertensionandstroke.In:LaraghJH,BrennerBM,editors.Hypertension:pathophysiology,diagnosis,andmanagement.2nded.NewYork:RavenPress;1995.p.465-78.,12,基础知识,(2)期刊论文结构:期刊论文包括文章题目、作者、摘要、关键词、(分类号)、正文、参考文献。参考文献格式:1)VegaKJ,PinaI,KrevskyB.Hearttransplantationisassociatedwithanincreasedriskforpancreatobiliarydisease.AmInternMed1996Jun1;124(11):980-3,13,基础知识,2)SeminOncol1996;23(1Suppl2):80-973)ClinOrthop1995;(320):110-4,14,基础知识,6.参考工具书的类型与使用参考工具书(referencebooks,referencetools)是汇集某一学科范围的知识信息,按照一定的体例和检索方法编排而成的专供查考资料或资料线索的特种图书。类型:词典、百科全书、年鉴、手册、名录、医学图谱、药典等。,15,基础知识,参考工具书特点:查考性:参考工具书编写的目的是综合某一方面的知识,供人们查询考证解决特定问题;而普通图书提供比较系统的知识和观点、供人们系统学习和阅读。概括性:参考工具书内容取材广泛,提供的信息完整翔实又高度概括,具有一定的权威性;而普通图书围绕某一特定问题或学科做深入、系统地阐述,内容比较连贯完整。易检性:参考工具书在编制上具有严谨的结构、详细的体例和多种检索途径,便于迅速查找;而普通图书一般按照学科或问题本身系统分章节叙述。,16,基础知识,二.检索语言检索语言是用于描述信息系统中信息的内容特征或外表特征和表达用户信息提问的专门语言,是人与信息系统对话的媒介。在各种信息检索系统中,信息都必须被标引或赋予某种简洁的,大多数还具有唯一性、科学性、实用性及一定权威性和标准化的标识或编码,即便于计算机处理,又有利于信息的广泛交流与共享。,17,检索语言,检索语言主要包括:文献外表特征检索语言和文献内容特征检索语言。前者是以文献的外表特征作为标识和检索点而设计的检索语言,主要应用有:文献题名索引系统、著者索引系统、文献序号索引系统和引文索引系统后者是以文献的内容特征作为标识和检索点而设计的检索语言,主要有分类检索语言和主题描述语言两大类。,18,分类检索语言,分类检索语言是将各种知识领域(学科及其研究问题)的类目按知识分类原理进行系统排列,以代表类目的分类号(如字母符号、数字等)作为文献标识的一类检索语言。,19,分类检索语言,文献分类法是根据文献所反映的学科知识内容及其他特征,分门别类地、系统地揭示和组织文献的一种方法。其主要目的是为了满足人们按学科知识体系检索文献的要求。文献分类法通常分为等级体系分类法(亦称等级列举式分类法或体系分类法)、分面组配分类法两种基本类型,也有将两者结合编制而成的等级组配分类法。其中以体系分类法最为常用,重点介绍中国图书馆分类法,20,中国图书馆分类法,中国图书馆分类法(简称中图法)是我国各类图书馆应用最广泛的分类法,图书馆使用它进行馆藏文献的分类排架和编制分类目录。同时中图法在我国的图书发行、数据库的科学论文标引、以及网络信息资源组织与检索等多个领域也有广泛应用。目前中图法的最新版是2010年出版的第五版。,21,中国图书馆分类法,1.层累标记制中图法的分类号采用字母与阿拉伯数字相结合的混合制编码,用一个字母标志一个大类,以字母的顺序反映大类的序列,在字母后用数字表示大类下的类目的划分。数字的编号制度,使用小数制,即首先顺序字母后第一位数字,然后顺序第二位,以下类推。数字的位置,基本上遵从层累制原则,即尽可能使号码的位数代表类目的等级数,当一个分类号的数字超过三位时,为了醒目而加上小圆点“.”,并无其他意义。,22,中国图书馆分类法,类目按概念间的逻辑隶属关系,由上至下逐级展开,划分出更专指、更具体的类目。如“R323.123静脉”的上下级类目从上至下依次是:,23,中国图书馆分类法,2.复分号复分是增强类目的细分化程度,提高类目专指度的分类措施,是图书馆分类法的重要组成部分。中图法的复分表主要有通用复分表和专类复分表两种,这些复分表的号码不能单独使用,只能加在主分类号后面作为共性区分的标识。中图法通用复分表有8个,如总论、地理、时代、民族复分表。,24,中国图书馆分类法,总论复分表中的描述图书的外部特征如教材、工具书等的复分号及其含义举例如下表:图书分类号举例:R28中药学R28-61中药学辞典R28-64中药学图谱,25,中国图书馆分类法,专类复分表专供某些类目的进一步细分之用。例如,专供R5-R8(临床医学各类)的复分表如上:例如:R581甲状腺疾病R512.6病毒性肝炎R581.04甲状腺疾病诊断R512.603病毒性肝炎免疫学,26,中国图书馆分类法,3.基本大类(22个),27,中国图书馆分类法,4.R医药、卫生大类下设17个二级类目,28,主题描述语言,主题描述语言是用于表达文献主题内容的词语标识系统,应用较多的是主题词法和关键词法。1.主题词法:主题词(SubjectHeadings)又称叙词(Dscriptor),其主要特点是:(1)采用指定的词语“主题词”,来专指或网罗相应的概念,也就是适当归并某个概念的同义词、近义词、拼法变异词及缩写等,以保证这个“主题词”与这个概念唯一对应;(2)采用参照系统将某些非主题词指向主题词或者显示相关主题词间的词义相关关系;(3)采用类似分类的方法编制主题词分类索引(范畴表)和等级索引(树状结构),采用类似关键词法编制主题词(词素)轮排索引,以从多方面显示词间关系并便于查找主题词;(4)以上内容和规则构成一部主题词表,其中的主题词还随着科学的发展及文献中用词的变化而不断有增删修订定期更新。,29,主题描述语言,2.关键词法:关键词法是为适应计算机自动编制索引的需要而产生的。所谓关键词(Key-word)是指出现在文献或网页的标题(篇名、章节名)或文摘、全文中,能表达文献实质内容的,并且能被人们作为检索入口的关键性名词术语。关键词法的最大优点是由于语词直接采用出现在最新文献或网页中的专业自然语言,一些在科学发展中最新出现的专业名词术语能及时进入索引系统;同时计算机编制关键词索引还具有成本低、速度快、时差短等优点。但关键词法也有很多缺点:(1)同一概念存在同义词、近义词、拼法变异词等,容易造成漏检;(2)若平均每篇文献标引的关键词较多,虽然减少漏检,但是误检增加;(3)关键词法不对文献的实质主题内容进行分析,关键词难以准确揭示文献实质内容,检索的准确性较差。,30,医学主题词表,医学主题词表(MedicalSubjectHeadings,简称MeSH表),美国国立医学图书馆(NLM)研制的用于标引、编目和检索生物医学文献的英文受控词表。MeSH表汇集了由著名的医学专家、医学编辑和医学图书馆专家推荐的、在生物医学领域里使用频繁且使用者认可的主题词2.5万多个,副主题词83个。,31,NLM提供4种方式联机免费获取其电子版及相关信息:一是MeSHBrowser;二是UMLSMetathesaurus(超级叙词表);三是MeSH网站(/mesh);四是MeSHdatabases,应用及获取,32,概念体系,MeSH表的概念体系是由主题词、限定词、补充概念和款目词组成。1主题词(mainheadings)主题词又称叙词(Descriptors),是用于描述主题事物或内容的规范化词汇。,33,(1)主题词的形式:MeSH表的词汇以名词为主,可数名词多采用复数形式,如BloodCells;不可数名词或表示抽象概念的名词采用单数形式,如BrainStem;主题词可以是单个词,也可以是词组,词组形式的主题词一般按自然语序采用顺置形,如LungAbscess(肺脓肿)、HepaticComa(肝昏迷)等。,概念体系,34,概念体系,但是,为了使概念相近的族性主题词集中在一起,有些复合主题词采用倒置形式,将复合主题目词中被修饰的名词放在前面,起修饰限定的形容词放在名词之后,并用“,”分开。例如:Shock,Cardiogenic(心源性休克)Shock,Hemorrhagic(出血性休克)Shock,Septic(败血性休克)倒置后,凡有关休克的文献都相应集中在“Shock”这个主题词下,为检索者提供了族性选词的方便。,35,概念体系,(2)主题词的单一性:一个词语只表达一个概念,一个概念只用一个词语表达,有利于提高文献的查全率。(3)主题词的动态性:MeSH表是医学常用规范化词汇的浓缩,必然随着医学科学的不断发展而不断的增删、调整,以便及时反映医学科学的最新发展、新主题和新事物,有一定的动态性。,36,概念体系,2.树状结构号:根据每个主题词的词义范畴和学科属性,可将全部主题词归入16个大类(以大写字母A-N,V,Z表示),每个大类又细分为100多个二级类目,二级类目再层层划分,逐级展开,使同一概念范围的主题词成族展示它们之间的并列、隶属等相互关系,每一个主题词均给予一个相应的树状结构号,最多可达11级,形成主题词的状结构体系,少数主题词按其属性须跨两个或多个类,这样的主题词被同时给予多个树状结构号。,37,概念体系,38,概念体系,39,3限定词(qualifiers)又称副主题词(subheadings),是对文献主题起限定作用,构成主题的一些通用性概念,本身无独立检索意义。限定词的数量及其可组配的主题词的范围均有严格规定。到2009年,MeSH表规定使用的限定词有83个,概念体系,40,4补充概念(supplementconcept)补充概念又称补充化学物质名称,用于标引MEDLINE中出现的化学物质和毒品等并在PubMed中可用化学物质名称字段NM进行检索的概念。目前MeSH表收录有455000多个补充概念。,概念体系,41,5款目词(entryterms)款目词又称见参照(seereferences),是主题词的同义词或相关词,作用是将自由词引见到主题词,概念体系,42,MeSHBrowser,MeSHBrowser(医学主题词浏览器,/mesh/mbrowser.html)是MeSH表的网络版,旨在帮助用户迅速查询相关主题词并显示主题词的等级结构体系。,43,MeSHBrowser提供了2种查询方式:输词查询(Entertermorthebeginningofanyrootfragments树形结构导航查询(Navigatefromtreetop),44,MeSHBrowser检索界面,45,基础知识,三.文献检索1.定义:根据用户需要,利用检索工具和检索系统,查找出符合用户特定需要文献的过程。2.方法:(1)常用法(工具法):顺查法,倒查法,抽查法(2)追溯法(3)分段法(4)浏览法,46,基础知识,3.文献检索的意义和作用:(1)获取科学知识的最佳捷径(2)避免科研工作重复、少走弯路。(3)提高科研、生产效率,节省时间。(4)提高信息素养。,47,基础知识,4.文献信息检索系统定义:是指根据人类社会对知识信息的普遍性需要,由一定的硬件设备和软件条件所构成的,具有选择、整理、加工、存储和检索文献信息功能的有序化信息资源集合体。,48,基础知识,文献信息检索系统的构成(1)文献信息资源(2)硬件设备(3)软件条件(4)人力资源,49,基础知识,文献信息检索系统的功能(1)汇集文献信息(2)组织文献信息(3)检索文献信息,50,基础知识,文献信息数据库的结构(1)记录(record):构成文献信息数据库的基本单元,它揭示了文献的内容特征和外表特征。(2)字段(field):比记录更小的单位,是组成记录的基本单元,在数据库检索时,也是一个检索点或检索入口。(3)文档(document):两重含义:一是指数据库中一部分记录的集合二是从数据库的组成方式分:顺排文档(按记录的顺序号排列)、倒排文档(按主题词或作者排列),51,基础知识,上述数据库的结构,可用英文单词的单复数形式更直观地表述为:,recordFields(记录),databaseflies(数据库),FileRecords(文档),fieldsearchingentry(字段)(检索入口),52,基础知识,数据库的类型:按其收录内容和功能的不同可分为如下类型:(1)书目型数据库(BibliographicDatabase)(2)事实数值型数据库(Fact-DataDatabase)(3)全文数据库(Full-textDatabase),53,基础知识,5.文献信息检索途径:(1)主题词检索:推荐!医学主题词表MeSH(2)自由词(文本词)检索:包括标题词、关键词、文摘词、全文词,注意同义词!(3)分类检索:中国图书馆分类法(中图法)(4)著者检索:姓前用全称,名后用首字,注意东西方人名书写习惯。,54,基础知识,(5)题名检索途径:(书名,刊名,篇名)(6)序号检索:文献特有序号(ISSN、ISBN、专利号、公开号、报告号、合同号、化学物质登记号等)(7)机构检索:文章发表时作者所任职的单位(8)引文检索:被引文献引用文献(9)缺省检索:预先设定的多字段组合检索(10)其他途径:分子式索引、生物体索引等,55,基础知识,7.文献检索步骤:,56,文献检索技术,57,布尔逻辑检索技术,最常用的方法;用户的信息需求通过检索提问式表达;采用布尔代数中的逻辑符AND、OR和NOT作为逻辑组配算符;计算机根据表达式确定命中文献的基本条件与查找途径,同文档中各篇文献的标识进行匹配。凡符合条件的文献即为命中文献,予以输出。,58,布尔逻辑检索技术,布尔运算符AND、OR、NOT,分别表示逻辑与、逻辑或、逻辑非三种逻辑运算关系,如下图所示。,布尔逻辑运算示意图,AANDB,AORB,ANOTB,59,布尔逻辑检索技术,布尔逻辑运算一览表,60,布尔逻辑检索技术,逻辑“与”,检索表达式为“AandB”。数据库中同时含有检索同A和B的文献为命中文献;作用是缩小检索范围,提高查准率;例如,查找“胰岛素治疗糖尿病”的文献,检索式为insulin(胰岛素)anddiabetes(糖尿病)。,61,布尔逻辑检索技术,逻辑“或”,检索表达式为“AorB”。数据库中的文献中含有检索词A或B的文献为命中文献;作用是扩大检索范围;例如,查找“肿瘤”的文献,检索式为cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)。,62,布尔逻辑检索技术,逻辑“非”,检索表达式为“AnotB”。数据库中凡含有检索词A而不含B的文献为命中文献;作用是缩小检索范围,提高查准率;例如,查“动物的乙肝病毒(不要人的)”的文献,检索式为hepatitisBvirus(乙肝病毒)nothuman(人类)。,63,布尔逻辑检索技术,布尔逻辑运算的优先顺序当一个检索表达式含有多个布尔算符时,执行的顺序为not优先运算,and其次,or最后。可用圆括号改变运算顺序,将需要优先运算者置于圆括号中。例如,查找“维生素C或维生素E对糖尿病患者肾脏的保护作用”,检索式为:(维生素Cor维生素E)and糖尿病and肾。,64,截词检索,截词检索,利用截断的词的一个局部即截词,进行检索的技术;自动地对同一概念检索词的不同词尾变化、词根相同等一类提问词进行检索,并自动用OR连接各词的检出结果,避免文献的漏检和逐词键入的麻烦,提高查全率;常用的截词符号有“*”、“?”。,65,66,截词检索,分类按是否采用截词符号分为,采用截词符号、不用截词符号;按截断位置的不同分为,右截词、左截词、中间截词;按截断的字符数量的不同分为,无限截词、有限截词。,67,邻近检索,邻近检索(proximitysearching)是用来表示检索词与检索词之间位置关系的检索技术,通常用位置算符来实现;采用的位置算符有near,with。“near”,表示检索词位置相邻,检索词出现的顺序可前可后,如geneNEARapoptosis;“with”,表示检索词位置相邻,且两词出现的顺序与输入顺序一致,如liverWITHcancer。,68,限定检索,限定检索(limitSearching)又称限定字段检索(limitFieldSearching),是利用检索词出现的字段进行的检索;用户可以指定检索某一字段或某几个字段以使检索结果更为准确,减少误检;检索系统的限定检索会采用缩写形式的字段标识符;如TI表示Title,AD表示Address。,69,70,扩展检索,扩展检索(expandsearching)是同时对多个相关检索词执行逻辑或检索的技术;即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检出与该检索词同属于一个概念的同义词或下位词的文献,如PubMed中主题词的扩展检索。,71,加权检索,加权检索(weighingsearching)不仅检索提问词是否存在,而且计算提问词的权值,当权值之和超过阈值的记录才能在数据库中被检出来。在某些数据库中表现为仅检索主要概念主题词,如MEDLINE;而有些数据库表现为词频检索,如中国学术期刊全文数据库。,72,精确检索和模糊检索,精确检索(exactsearching)是指所检信息与输入的词组完全一致的匹配检索技术;在许多系统中用引号来表示,如检索“AcutePancreatitis”;模糊检索(fuzzysearching)允许所检信息与检索提问之间存在一定的差异。如检索Ac

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论