生物医学信息学课件_第1页
生物医学信息学课件_第2页
生物医学信息学课件_第3页
生物医学信息学课件_第4页
生物医学信息学课件_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物医学信息学温州医学院图书馆吴爱民2010-04-071第一章 生物医学信息学导论第五章 信息检索技术的综合应用 P168(重点)第六章 生物医学信息分析 P192-225生物医学信息学概论2第一章生物医学信息学导论第一节 生物医学信息学定义、内容与范围 p2一、生物医学信息学定义二、内容与范围 第二节 理论基础 P3一、分析信息学二、生物医学信息层析说第三节 研究方法 p12一、方法论原理二、方法体系3生物医学信息学的生成示意图生物学医学信息学4第一节 生物医学信息学定义、内容与范围 p2一、生物医学信息学:应用信息科学与计算机科学的理论与技术及其他相关学科的研究方法对生物医学和临床医学的

2、数据与信息资源进行创新性研究与应用生物医学信息学是一门有关处理生物医学(和人类健康)相关的信息、数据以及如何解决问题和作出决定的科学,它几乎涉及生物医学科学的所有基础和应用的领域,并与现代信息技术尤其是计算机和通信技术紧密结合。第一章 生物医学信息学导论5第二节 理论基础 P3一、分析信息学 浙江大学叶鹰教授与北京邮电大学钟义信教授基于一般信息论建立的 对计算机数字信息系统、通讯波谱信息系统、文献信息系统进行统一处理的信息学基础理论一般信息系统的定性模式第一章 生物医学信息学导论7一般信息系统的定性模式信息生产A信息处理1B信息传播C信息处理2D信息利用E信息吸收再生产F提交发送接收增殖信息还

3、原信息变换81.生物信息学:它以基因组研究数据为主要对象,以数学、信息学、计算机科学为主要手段,以计算机硬件、软件和计算机网络为主要工具,对原始数据和资料进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。2.神经信息学:利用现代化信息工具,将不同层次有关脑的研究数年进行检索、比较、分析、整合、建模和仿真,绘制出脑功能、脑结构和神经网络的图谱,从而解决目前神经科学所面临的海量数据问题,从基因到行为的各个水平加深人类对大脑的理解,达到认识脑、保护脑和创造脑的目标。第一章 生物医学信息学导论103. 药物信息学:运用数学、计算机科学和分析信息学等手段,对药物作用机制与分子生物学之间的内

4、在联系进行相关信息的收集、加工、存储、传播、分析和解析的科学。4.医学信息学:利用现代信息技术对各类不同的医学信息源进行收集、加工处理、存取、研究的过程。5.口腔信息学:其核心是以口腔医学实践中的各种信息为主要研究对象,以口腔医学信息的运用规律和应用方法为主要研究内容,以计算机科学、信息科学的先进技术为手段,以提高和扩展口腔医学工作者在口腔医学临床、教学及科研等方面的智能与技术为主要研究目的。第一章 生物医学信息学导论116.护理信息学:利用计算机信息技术和智能医用通讯对临床护理过程中的病案信息获取、病情监护、急诊处理、危重病人抢救、住院信息等进行分析处理以辅助护理决策及其方案实施的护理信息管

5、理系统。7.循征医学:其核心是将信息分析的证据应用于临床医学实践,强调从系统研究中获取依据,以使研究结论建立在具有说服力的、充足的证据基础上、从而使诊疗手段、方法更具有效性和安全性。第一章 生物医学信息学导论122 .二维信息(符号-波谱信息):由人类交流和生物医学分析技术产生的信息。二维文献数据库:由文献型数据库构成,是主流数据库,包括参考数据库和源数据库。参考数据库提供文献线索。如书目、文摘、索引数据库、指南数据库。源数据库提供事实、数据、全文。如数值、图像、术语数据库,全文、文本-数值数据库。第一章 生物医学信息学导论143 .三维信息(立体-多媒体信息):计算机虚拟现实技术和多媒体技术

6、发展产生的信息。三维结构数据库:计算机虚拟现实技术和多媒体技术与生物医学研究相结合而发展的产物。如生物大分子三维空间结构数据库。许多关于蛋白质分子的数据库:第一章 生物医学信息学导论15(1)http:/www.ebi.ac.uk/pdbsum/1718(2) 如OWL混合蛋白质系列数据库 http:/www.biochem.ucl.ac.uk/bsm/ 19Dbmwser 拉滚条到Useful Sites20单击“DbBmwser”链接21单击“OWL”链接22(3) /PubMed 24点击“about Entrez”链接25第三节 研究方法 p12一、方法论原理1.选择原理:广泛查询选择

7、和普遍消化吸收信息.2.信息保真原理:提取和交换信息不失真.3.合成原理:提交时应综合所有信息,突出重点.二、方法体系1.逻辑方法-逻辑分析法2.数学方法-数学分析法3.计算机软件方法-软件分析法 生物医学信息处理的三类主要方法 The end第一章 生物医学信息学导论27第五章 信息检索技术的综合应用 P168 重点 第一节 信息需求分析 一、主题分析 二、信息类型的分析 三、查找年代分析 四、地域范围分析 第二节 检索策略及其调控 一、检索策略制定 二、检索策略调控 第三节 原文获取 一、文献类型识别 二、缩写刊名还原 三、音译刊名转换 四、原文获取途径28一、信息(Information

8、)信息是自然界、人类社会以及人类思维活动中普遍存在的,泛指一切事物(包括物质的或精神的)运动的状态和运动方式。简而言之,是指事物存在和运动状态及其特征的反映。根据来源分类:信息可分为自然信息、生物信息、电子信息和社会信息。特点:可扩充性、可压缩性、可替代性、可传输性、可扩散性及可分享性。 29二、知识(Knowledge)源于信息,是人类对大量信息进行思维分析,加工提炼,并加以系统和深化而形成的结果。简而言之,理性化、优化和系统化了的信息即为知识。信息与知识的关系犹如原料与产品的关系理性化:人类不断地接受客观事物发出的信息(原料),通过大脑的思维加工,获得了对事物本质及其运动规律的认识认识世界

9、,是理性化的过程优化:人类在认识世界的过程中,将信息去粗取精,去伪存真,总结经验教训,这是优化为知识(产品)的过程;系统化:人们从获得的经验中找出规律,进行总结归纳,形成全面系统的认识,这是系统化的过程30三、情报(Information、Intelligence)情报最初用于战争,“战时关于敌情之报告,曰情报 ”后来应用领域越来越广,如经济情报、科技情报等等。国内图书情报界对情报的解释常不同,我们把情报定义为“针对一定的对象的需要而传递有参考价值的新信息和新的知识。”简单的说是经传递的有用的新知识和新信息。三种基本属性:知识性 、传递性 和效用性。 31信息、知识和情报的关系信息知识情报32

10、四、文献(Literature、Document)文献是指记录有信息、知识、情报的一切载体(或媒体)。 三个要素 :要有一定的知识内容;要有用以保存和传递知识的记录方式,如文字、图形符号、视频、声频等技术手段;要有记录知识的物质载体,如纸张、感光材料、磁性材料等。33信息、知识和文献信息:事物发出的体现它存在和运动状态的信号和消息知识:人类在改造客观世界实践中所获得的认识和经验的总和文献:记录有知识的一切载体。事物发生发出信息;信息经人脑加工变为知识;知识被记录形成文献;文献经传递、应用于理论与实践产生新的信息34信息检索(情报检索)是指将信息按一定的方式组织和贮存起来,并按照信息用户的需要查

11、找出有关信息的过程。广义的信息检索包括信息存贮和信息检索两个过程。狭义的信息检索即指从信息集合中找出所需要的信息的过程(Information Search)。还包括任何解决实际应用中遇到的各类需求,即获取有效信息的能力。第五章 信息检索技术的综合应用35第一节 信息需求分析课题检索前的分析:主题分析、信息类型分析、查找年代分析及地域范围分析。一、主题分析(一)文献主题特征及其标引1.文献特征及其分类(1)文献外表特征:题名(书刊名)、著者姓名、著者工作单位、文献序号(专利号和报告号)及类型、出版事项等;根据文献外表特征,可编制文献题名索引、著者索引、文献序号索引、引文索引。第五章 信息检索技

12、术的综合应用36(2)文献内容特征:分类号、类名、关键词、叙词、主题词等。根据文献内容特征,可分为分类检索语言、主题检索语言和代码检索语言三大类。可编制分类目次、主题索引、关键词索引等。这些描述文献内容特征、外表特征的(用于各种途径检索文献的)词语或符号,称为检索标识。检索标识的作用:编制分类目次、主题索引、关键词索引、著者索引等。这些检索标识通常都用来作为各种索引的检索标目。第五章 信息检索技术的综合应用37检索标目:是指各种检索标识在各种索引中用明显的字体、突出的位置作为首要的检索入口词语。其中主题检索语言是最有效的检索语言。检索语言:是指用来标引文献的检索标识用语或符号的人工语言。为了使

13、文献存贮得进去,检索得出来,文献标引和检索必须使用相同的语言标准。我们将这种统一的标引用语和检索用语的人工语言称为检索语言。第五章 信息检索技术的综合应用382.主题特征及其检索语言主题检索语言又称为描述语言,它是用词语表达各种概念,包括主题词语言、叙词语言和关键词语言。(1)主题词语言:是用规范化的名词术语标引文献的主题概念。 主题词副主题词组配。主题词(Subject Headings )如白血病副主题词(Subheadings)是对主题词作进一步限定的词。提高专指性,如治疗主副主题词组配可以加强对文献的专指性,提高查准率。第五章 信息检索技术的综合应用39(2)关键词语言:直接选用文献中

14、具有实质意义的词标引文献的主题概念。属非规范化的名词术语。关键词( Keywords)之间没有语法关系。(3)叙词语言。它是用规范化的名词术语标引文献的主题概念。(4)叙词语言与主题词语言的异同。第五章 信息检索技术的综合应用40同属于以自然语言为基础的人工语言。两者的区别在于:主题词属于先组式检索语言(即采用一些固定组配的词组表达概念含义),对文献主题的揭示深度和适应性都受到限制。叙词是具有组配性能的后组式检索语言,可以灵活组配。很多专深的跨学科的和新兴学科领域的文献内容主题,都可以用叙词通过概念组配(而不是字面组配。)来表达和描述。叙词之间的组配不是无限制的,只有符合逻辑的才能组配。叙词语

15、言主要用于计算机检索。第五章 信息检索技术的综合应用41是概念组配,而不是字面组配字面组配: 血小板功能 血小板+功能 与主题概念不一致 概念组配: 血小板+止血+凝血+血凝集因素+功能 与主题概念一致第五章 信息检索技术的综合应用42 3.Mesh ( Medical subject headings)及其功能P170 (肯定要考)由美国国立医学图书馆(NLM)编辑出版.美国医学索引有Index MedicusIM, MEDLINE, PubMed 三个版本. (1)Index MedicusIM:美国医学索引,印刷版。(2)MEDLINE CD-ROM:1964年起,其电子计算机的存储库称

16、为MEDLARS系统(Medical literature analysis retrieve system,医学文献分析存贮及检索系统),其联机检索系统 MEDLARS on line 称为MEDLINE。光盘版。(3)PUBMED为Web版本。第五章 信息检索技术的综合应用43Mesh 医学主题词表(/mesh/meshhome.html)可以在线浏览。*医学主题词表的作用:是标引规范化主题词的依据,是沟通主题词标引者与检索者的桥梁。*医学主题词表的结构:包括字母顺序表;树状结构表;主题词变更表;另附副主题词表四个部分。第五章 信息检索技术的综合应用44/mesh/meshhome.htm

17、l 45数据库的首页第五章 信息检索技术的综合应用46默认的检索界面:关键词检索界面47主题词检索:点击Thesaurus按钮并在输入框里输入AIDS48 点击Look up按钮,可见主题词表。 AIDS see Acquired Immunodeficiency Syndrome 49点击term information按钮,可见树状结构表。50点击Search Now按钮,可见副主题词表。副主题词选择窗口51(1)字母顺序表;2002版收录20742个主题词,21927个款目词(非主题词),两者混在一起按字母顺序编排。主题词之间无关系。通过主题词下的树状结构号、各种注释(词、年代)及参照关

18、系来揭示主题词之间的关系。字母顺序表中设计5种参照关系:第五章 信息检索技术的综合应用52Mesh 字顺表参照系统名称语义关系参照符号及含义参照符号及含义用代关系同义关系See见或用“X” 代相关关系相关关系See related参照XR “反参照”属分关系属分关系See under属XU “分”第五章 信息检索技术的综合应用531)用代参照:表示同义关系, see后和X 前是主题词。正参照: Cancer(款目词) see Neoplasms (主题词) 逆参照: Neoplasms (主题词) X Cancer (款目词) 2)相关参照:表示相关关系,前后的词都是主题词。正参照: LUNG

19、See relatedPULMONARY CIRCULATION(肺循环)逆参照: PULMONARY CIRCULATIONXR LUNG第五章 信息检索技术的综合应用543)属分关系:表示隶属关系 19631990年间分主要主题词和次要主题词。主要主题词指上位主题词,次要主题词指下位主题词.正参照: Cephradine see under CEPHALOSPORINS (头孢菌素类)逆参照:CEPHALOSPORINS XU Cerphradine4)主题词/副主题词组配(see)参照: 1992年开始 Liver/transplantation see Liver transplant

20、ation see后面的词为正确的主题词/副主题词组配。第五章 信息检索技术的综合应用555)也须考虑参照(consider also terms at ):1991开始,主要用来提示关于解剖学的主题词。例:Liver consider also terms at HEPAT-此例表示对Liver书写形式关注的用户,还应考虑以HEPAT-为词根的一组词。第五章 信息检索技术的综合应用56词表在设计上采取一系列有效措施:倒置形式:例如欲查“再生障碍性贫血”的有关文献,对于一个不熟悉“医学主题词表”的检索者来说,他将很自然地选用正常的书写形式“aplastic anemia”到主题索引中进行查找,

21、而不会考虑到词表对该概念采用的倒置形式“anemia, plastic”。顺置与倒置虽然概念相同,但在以字母为序的主题索引中所处位置不同,所以就查不到所需文献。历史注释:说明主题词起始年分,及演变过程.第五章 信息检索技术的综合应用57(2)树状结构表(Tree Structure )包括类目表和树状结构表。1)类目表,包括主类目和次类目。 2)树状结构表(tree structure)也称范畴表。全部主题词按分类编排。15个大类。P171. 树状结构表实质上是主题分类表,它将全部主题词按照每个词的词义范围及学科属性,分别归入15个大类之中,用从A到N,加上Z共有15个字母表示。每个大类下又可

22、划分出下属的一级类目,一级类目再可划分下属的二级类目最多达九级。所有主题词就是这样按等级,依次从上位词到下位词逐级编队排列下去,而同级主题词按字母顺序排列,这样形成一个隶属关系清晰,横向关系清楚的树状结构。每个主题词后列出的树状结构号是字顺表和树状结构表相互联系的桥梁。特别适合专业人员按学科体系进行选词。第五章 信息检索技术的综合应用58树状结构表第五章 信息检索技术的综合应用59(3)主题词变更表:说明每年增加的主题词和删除的主题词。(4)副主题词表(subheadings) P171-176副主题词又称限定词,用来限定主题词。医学索引有82个副主题词。副主题词必须与主题词有必然的逻辑关系才

23、能组配,为此在副主题词表中规定了每个副主题词的使用范围和组配限定的主题词类目。一个副主题词并不能与所有主题词相组配.如何选准主题词和副主题词,要广开思路。如在Medline中大肠癌是不作为主题词,要在肠肿瘤的词信息Term informationan中找直肠癌。第五章 信息检索技术的综合应用60副主题词的选择准确与否直接影响检索策略的编制和检索结果。如检索有关疾病鉴别诊断的文献。如单用diagnosis会导致漏检,还应考虑放射成像,病理学、血液生化指标等。PubMed数据库中,Mesh的副主题词选项增设了副主题词扩展检索功能,对扩大思路和合理使用副主题词非常有效。见P177 表5-3第五章 信

24、息检索技术的综合应用61(二)检索过程中的主题分析 P178以上我们已经介绍了对课题进行主题分析的必要知识:A、文献主题特征及其相关的基本原理;B、主题词、副主题、关键词、叙词的概念和检索功能。C、如何利用Mesh词表选择主题词及其副主题词。第五章 信息检索技术的综合应用621.分析课题的内容实质:即有几个主题.需要注意的要点:(1) 特种疾病及物质;(2)明确的解剖定位 ;(3) 采用的技术方法及工艺路线;(4)研究对象及其内涵与外延。例:老年性阻塞性小气道病变患者手术前后通气量及气道阻力的变化。通过分析: 其一,“小气道病变”实属肺部阻塞性疾病下必然的病理状态;其二,“小气道”非医学术语也

25、非俗称,此处属于误用概念。课题的内容实质应是:老年性肺部阻塞性疾病患者手术前后通气量及气道阻力的变化。主题框架:肺疾病,阻塞性/外科,通气量,气道阻力,老年人。第五章 信息检索技术的综合应用632.析出误假主题概念所表征的真实概念例:药物对心脏传导的作用,“药物“并非特指某种药。真实概念:心脏传导系统/药物影响3.析出主要概念、排除无关概念和重复概念例:应用营养计算机指导糖尿病病人饮食及其药物治疗的对比研究。词库中无“营养计算机”真实概念:糖尿病/饮食疗法、药物疗法、计算机辅助系统第五章 信息检索技术的综合应用644.析出被隐匿的主题概念例:尿的成分异常。主题概念应该是:尿/分析5 .少用主题

26、概念宽泛而检索概念意义不大的主题词例:门脉高压食道静脉曲张破裂出血的防治。此处“防治”概念太宽泛。65二、信息类型的分析(一)情报源类型及其特点 P179十大情报源 (掌握): 科技图书、科技期刊、科技报告、会议文献、专利文献、标准文献、学位论文、产品资料、技术档案、科技报纸。2.各类情报源的特点。第五章 信息检索技术的综合应用66(二)数据库类型及特点 P180按检索内容和应用功能分:书目型数据库、事实数值数据库、全文数据库、研究型数据库、实验数据库和再生数据库。1.书目型数据库:包括各种机读版的题录、文摘、目录等形式的数据库,仅提供原始文献的线索或简要的内容,指引用户去查原始文献。如 ME

27、DLINE、PubMED、Springer LINK等。2.事实数值数据库:数据库内容为一定专业范围内科学事实和数据。在美国国立医学图书馆TOXNET 数据库中有好几个事实数据库。如HSDB(hazardous substances data bank)数据库主要内容为有害化学物质的毒理学;IRIS数据库有500多种化学物资的记录。其中包括有关人类健康风险评定方面的数据。第五章 信息检索技术的综合应用673.全文数据库:通常与检索工具连在一起。中国有:中国学术期刊全文数据库、维普中文期刊全文数据库等;外国有:UMI PQDD、UMI ARL、 SDOS、Springer、EBSCO、UMI M

28、edical Library、OVID等。4.研究数据库:以明确的专业研究为目的,收集专业领域内相关资料,利用特有的专业分析软件,对数据库中的基础数据、事实、数值及其文献重组与分析。如基因序列分析数据库BLAST、循证医学的疗效综述文摘数据库(Database of Abstracts of Reviews of Effectiveness,DARE)、引文分析与评价数据库(Science Citation Index,SCI)和期刊引文分析报告数据库(Journal Citation Reports,JCR)等。第五章 信息检索技术的综合应用685.实验数据库:收集专业领域某些特征性的研究数

29、据。如序列数据库、核酸数据库、蛋白结构数据库、细胞数据库等。6.再生数据库:由于某种目的需要对已有的数据库中的记录和基础数据进行再次分析形成的新的数据库。如真核生物基因调控转录因子数据库TransFac、蛋白质序列二次数据库PROSITE等。第五章 信息检索技术的综合应用69三、查找年代分析1.根据课题需要,确定查找年代1)课题复杂、研究范围大 10年2)新兴学科采用倒查法3)专利从1920年查起2.根据学科发展的研究高峰期确定上海爆发肝炎,1987-88四、地域范围分析 The end第五章 信息检索技术的综合应用70第二节 检索策略及其调控(重点)P182检索策略是对检索的全面策划,指对数

30、据库的选择和检索式的编制。一、检索策略制定专家检索( Expert Search-一次性运算)的程序A、确定检索词和截、位关系;B、组配成式并优化C、实检和反馈调节第五章 信息检索技术的综合应用71(一)信息检索的通用技术包括布尔逻辑组配、截词技术、限定技术等。 1.布尔逻辑运算 就是要求在命中的文献 只要含有A或含有B 指检出A的文献中不含有B中既含有A 又含有B的 或 含有A 和 B 的文献 的内容,即凡 A 的文献中, 一种检索技术; 都是命中的文献; 含有 B 者都被排除,不再检出。1)逻辑与(AND),也可以写作“*”。A and B2)逻辑或(OR), 也可以写作“十”。A or

31、B3)逻辑非(NOT),也可以写作“”。A not B 第五章 信息检索技术的综合应用72需要注意的是:有的检索工具直接把布尔逻辑隐含在菜单中。例如,Lycos以“match a11 terms”表示逻辑与,以“match any term”表示逻辑或。有的检索工具部分支持布尔关系,例如Yahoo!尚不支持逻辑非。第五章 信息检索技术的综合应用732.截词技术(1)截词检索:是在词中运用截词符“*”进行扩大检索范围的一种检索技术。截词符“*”:用以代表任何字符串或空格。后截词 Digest*:可检出digest、digestive、 digestion等词的文献中截词 wom*n:可检出wom

32、an、women等词的文献左截词 较少如*physics第五章 信息检索技术的综合应用74(2)通配符“?”:用以代表任一字符或空格。(代替0-1个字符)通配符替代一词中某一字母的变化形式。一般放在词中或词后。 例:M?N:可检出mn、man、men、min等词的文献。Go?d:可检出good、gold、GORD等。Computer?:可以查到computer, computeric但查不到computerization第五章 信息检索技术的综合应用753.限定技术在检索系统中,使用缩小和限定检索范围的方法称为限定检索。网络信息检索中的限定技术包括词与词之间的位置限定算符、检域限制、前缀代码、

33、后缀代码和关系算符。第五章 信息检索技术的综合应用76(1)词位限定是在同一句中相邻若干词。不同的网络检索系统有各自规定的位置算符。 A W/N B形式例如在 UMI Medical Library(University Microfilms Internation)数据库中,用“ A W/N B”(within)表示两词相邻,相隔最多不超过n个词,前后顺序可以颠倒。如information W/3 technology,表示两词相邻相隔最多不超过3个词。第五章 信息检索技术的综合应用77 A PRE/N B形式 用A PRE/N B(precede by)表示两词相邻,相隔最多不超过n个词,

34、前后顺序不能颠倒。如:information PRE/3 severce。 A near B形式即在两个词之间用near连接的一种检索技术。SDOS(Science Direct OnSite)检索系统用此形式,两词之间最多允许插入10个字符。例如:cough near asthma 表示要求检出cough与asthma出现在同一句子中,在两词之间可能有1个或多个其他词,前后顺序可以颠倒。第五章 信息检索技术的综合应用78 A nearN B形式同句相邻词检索:即在两个词之间用用near加数字连接的一种检索技术。A nearN B表示 A与B之间可以插入0N个单词,前后顺序可以颠倒。如 Aid

35、s near5 therapy,就是凡在同一句子中有Aids 与therapy 之间相隔5个词以内的文献即为命中文献。如aids related infections drug therapy。第五章 信息检索技术的综合应用79A adj B 形式用A adj B表示两词紧密相邻,前后顺序不能颠倒。A with B 形式同字段检索:即在两个词之间用with的一种检索技术。凡文献中,只要所要求的两个词在同一字段中即为命中文献。 cough with asthma 表示cough和asthma出现在同一字段中即为命中文献,前后顺序可以颠倒。第五章 信息检索技术的综合应用80(2)检域限制(字段设定

36、)特定年代、特定类别、特定检索点,前缀代码、后缀代码。检索词+ in(限制符)+字段标识符 或 字段标识符=检索词 如:Chinese in LA La=French 郑树 in au AU=限查特定作者 胃癌 in ti/TI限在题目中查,/AB限在文摘中查,/KW限在关键词中查(3)关系算符:包括、=、=、= py=1998、 py1998第五章 信息检索技术的综合应用81优先检索加括号为优先检索不加括号检索顺序依次为 Not、 and、 near、 with、 or82(二)检索策略编制 P183步骤:1.选择数据库:考虑数据库收录的文献范围、文献类型、年限;2.确定检索途径; 3.拟定

37、检索策略:编制合理的检索式;4.检索实践;5.根据检索结果调整检索策略。第五章 信息检索技术的综合应用83例1:人绒毛膜促性腺激素的反义核酸技术反义核酸内涵为反义DNA和反义RNA检索策略为:(antisense DNA OR antisense RNA)AND(human chorionic gonadotropin OR HCG)人绒毛膜促性腺激素检索策略优化为:(进行字段限定或采用Mesh主题词/副主题词组配检索)第五章 信息检索技术的综合应用841)(antisense DNA OR antisense RNA)AND(human chorionic gonadotropin OR H

38、CG)/TI,AB 字段限定在标题或文摘2) 采用Mesh主题词/副主题词组配检索#1 chorionic gonadotropin/diagnostic use Mesh OR chorionic gonadotropin/genetic Mesh#2 DNA,antisense/diagnostic use Mesh OR DNA,antisense/genetics Mesh#3 RNA,antisense/diagnostic use Mesh OR DNA,antisense/genetics Mesh#4 #1 and #2 and #3第五章 信息检索技术的综合应用85例2:妇女

39、与英国人口发展。考虑到词的各种可能表达:wom?n AND (populated OR population OR populous) NEAR2 develop* AND (England OR English OR UK OR British OR Britain*)检索策略优化为:1) wom?n AND (populated OR population OR populous) NEAR2 develop* AND (England OR English OR UK OR British OR Britain*)/ TI,AB第五章 信息检索技术的综合应用862)#1 Populati

40、on Density/trends Mesh 密度#2 “England/ethnology Mesh (泛指)英国/人种学#3 wom?n#4 #1 and #2 and #3 第五章 信息检索技术的综合应用87二、检索策略调控 P184(一) 表达检索效果的参数R查全率、P 查准率、M漏检率 、N误检率R查全率、P 查准率之间存在相反的相互依赖关系。第五章 信息检索技术的综合应用88(二)查全率的调整 1.利用上位词检索或采用Explode(扩展)指令对下位词扩展检索。2.采用“or”连接同一概念的不同表达方式如新生儿:可用newbore or neonatal or neonatus检索

41、。3.采用截词符“*” 检索具有不同后缀的同一概念如Comput*:可检出computer、computeror、computed、computerize等。4.采用通配符“?” 替代一词中某一字母的变化形式。如colo?r:可检出color或colour等。5.利用Index进行同类、同义词检索。6.从显示记录中选词并检索即进行文中词检索(横向检索)。7.采用多途径检索,如关键词途径与主题词途径结合检索。第五章 信息检索技术的综合应用89(三)查准率的调整1.采用主题词及主要主题词检索。2.采用副主题词限制检索。3.采用in把某个检索词限制在某个字段,即进行限制字段检索。4.采用and、no

42、t、with、near缩小检索范围。5.采用双引号“”和等号=实施精确匹配检索。6.可用以下字段直接检索:著者姓名、化学物质名、酶命名号、化学物质登记号、基因符号。7.采用多途径组配检索。 The end第五章 信息检索技术的综合应用90第三节 原文获取一、文献类型识别(考点)P1851.科技图书:包括ISBN号、出版地、出版商、总页码等。2.科技期刊:包括ISSN号、刊名、年、卷、期、起止页码。刊名中常有。3. 专利文献:包括国别代码及专利号(US0256368)、国际专利分类号(CL.A0246052)、专利申请日期Appl等。4.会议文献:包括英文会议的多种写法,meeting、cong

43、ress 、Conference、symposium、Proceeding、transaction等。5.标准文献:包括国际标准组织代码、GB代码等。6.技术报告:包括PB代码、AD代码、NASA代码、DE代码等。7.学位论文:带有PHD.DISSERTATION、Master Dissertation等标识。第五章 信息检索技术的综合应用91二、缩写刊名还原1. 根据外文缩写规律直接辨认。2. 利用数据库中的Source List进行辨认转换。3. 利用有关工具书,如美国盖尔公司出版的Periodical Title Abbreviation;及检索工具的刊名缩写与全称对照表IM、EM、CA

44、的引用期刊一览表(List of Journals Index)4.利用Internet 查找。第五章 信息检索技术的综合应用92三、音译刊名转换非拉丁语系的出版物的名称和著者一律用音译法拉丁语转换成拉丁字母。1.中文刊名的转换:按汉语拼音字母读音直接用拉丁字母音译成中文刊名。2.日文刊名的转换:3.俄文刊名的转换:第五章 信息检索技术的综合应用93四、原文获取途径1.查找全文数据库1)中国全文数据库:维普中文期刊全文数据库;万方医药全文数据库;中国期刊全文数据库。2)国外全文数据库:SDOS、Springer、EBSCO、UMI Medical Library、OVID、Kluwer online等。免费全文期刊网站如BioMed Central、Freemedicaljouranl、Highwire文摘型网络数据库:PubMed,Embase、Web

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论