医学信息检索概论_第1页
医学信息检索概论_第2页
医学信息检索概论_第3页
医学信息检索概论_第4页
医学信息检索概论_第5页
已阅读5页,还剩122页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/5/15,1,本演示文稿可能包含观众讨论和即席反应。使用 PowerPoint 可以跟踪演示时的即席反应, 在幻灯片放映中,右键单击鼠标 请选择“会议记录” 选择“即席反应”选项卡 必要时输入即席反应 单击“确定”撤消此框 此动作将自动在演示文稿末尾创建一张即席反应幻灯片,包括您的观点。,医学信息检索,信息社会,信息资源日益庞大 出版速度加快 据国外报导,2006年全世界出版 科技文献2000印张/秒 4-5种新书/小时 新增3种刊物/小时 载体形式多样化 网络信息的大量涌现,信息检索需要解决的问题,我们被信息的海洋包围着, 但是确被知识饿死了!,这门课的目的(Purpose)是: 面对日益增长的信息资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息 这就是信息检索所要解决的问题,学习信息检索,培养自学能力 培养信息素养 进行知识更新 进行循证医学实践 培养科研能力和创新能力,文献资源在科研工作中的时间比重,据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。由上述统计数字可以看出,科研人员花费在科技出版物上的时间为全部科研时间的60%。 -美国科学基金会 NSF(National Science Foundation),课程的发展过程,20世纪60-70年代,发达国家开设 80年代以后,我国开始在高等学校开始普及 我校从1986年开始研究生教学(1984年4月,国家教育部(84)教高一司字004号文件) 90年代,转变为“信息检索与利用课”并引入现代信息技术如网络 21世纪,与信息素养能力培养结合,基本要求,1、掌握文献和信息检索的基础知识 2、掌握计算机检索的基本技能 3、具有有效利用信息技术的素质 4、有较高的信息意识和信息能力,信息检索基础理论 计算机信息检索基础 网络信息检索 常用医学数据库 检索引擎、医学网站 网络全文数据库 循证医学信息检索 特种文献检索 医学信息分析与利用,学习内容(48学时),参考教材,杨克虎 人民卫生出版社,郭继军 人民卫生出版社,第一章 绪论(基础理论),第一节 重要概念 第二节 图书馆利用 第三节 信息类型 第四节 信息检索语言 第五节 信息检索基础 第六节 计算机检索,第一节 重要概念,一.信息(information) 反映事物本质特征的一切外在表现统称为信息。如物质存在方式及其运动规律特点等 普遍性、差异性、特征性 可传递性、可存储性,生物信息,自然信息,机器信息,社会信息,二、知识(knowledge),知识是人们通过信息对自然界,人类社会以及思维活动规律的认识与掌握,是人脑通过思维重新组合的系统化信息的集合。信息知识 人们利用获取的知识创造新信息。知识信息 经济合作与发展组织(OECD),按内容分: Know-what(指记载事实的数据 ) Know-why(指记载自然和社会的原理与规律方面的 理论 ) Know-how(指某类工作的实际技巧和经 验 ) Know-who(指谁知道是什么,谁知道为什么和谁知 道怎么做的信息 ),解决特定问题所需要的知识或信息 知识性:情报来源于知识,任何情报都具有一定的知识性 传递性:动态接受与利用 效用性:启迪思维、增进见识、改变知识结构、提高认识能力,发挥实用的、社会的、经济的价值 。,三、情报(Information),记录已有知识的一切载体 载体是知识的外在表现形式 文献记录的知识形式可以是文字、图像、符号、声频、视频等,四、文献 (Literature, Document),医学文献的现状与特点,1. 文献数量激增 医学期刊:17世纪10种 20世纪初1600种 20世纪末21000种 医学文献:21世纪2百万/年 2. 文种繁多 MEDLINE(43种文字) 3. 发表分散 4. 老化加快,医学文献信息的作用,记录、保存、传递医学信息 科研和临床实践借鉴、交流的重要载体 评价科研水平与成果的主要依据 推动促进科研发展的资源动力,五、信息意识,信息观念,是人们对信息需求的自觉反映。包括对信息的捕捉、分析、判断和吸收的敏感性、主动性和积极性,六、信息素养,主要体现在信息意识、信息能力和信息道德三个方面。有效地定位、获取、评价和利用信息的一系列能力的总和,信息素养,信息素养概念是从图书馆检索技能演变而来。美国将图书馆检索技能和计算机技能结合成为一种综合的能力、素质,即信息素养。 1989年,美国图书馆协会下属的“信息素养总统委员会”在其研究的终结报告中给信息素养下了这样一个定义:要成为一个有信息素养的人,就必须能够确定何时需要信息,并具有检索、评价和有效使用信息的能力。 包括 信息意识、信息能力、信息道德,信息素养培养目标,*确定所需信息的范围 *有效地获取所需的信息 *鉴别信息及其来源、将检出的信息融入自己的知识基础 *有效地利用信息去完成一个具体的任务 *了解利用信息所涉及的经济、法律和社会问题,合理、合法地获取和利用信息,第二节 图书馆利用,2019/5/15,24,(08),2019/5/15,25,保存医学文献 订购文献信息数据库 中/外文医学、药学、生物学等领域光盘/网络文献数据库 期刊、图书的借阅 电子文献制作 获取外部科技论文,一、图书馆的主要功能,2019/5/15,26,联机公共书目信息 文献信息数据库 中/外文医学、药学、生物学等领域光盘/网络文献数据库 电子期刊 电子图书 电子学位论文 多媒体课件 声视频资料,二、图书馆的信息资源,2019/5/15,27,联机公共书目 OPAC (Online Public Access Catalogue,)联机公共书目查询是图书馆提供的一项最基本的网络信息服务。 书目信息是对图书馆馆藏纸本书刊及其它资源的揭示。通过远程网络检索,读者可以了解有关书刊的馆藏情况。,1、联机公共书目信息,2019/5/15,28,1馆藏联机公共书目查询:对本馆资源的揭示。可预约书刊。 2书刊联合目录查询:对多个图书馆馆藏资源的共同揭示,开展馆际互借、资源共享。如:全国西文生物医学期刊联合目录等。 3读者借阅信息查询:读者在网上自己查询借阅情况。可自己办理续借手续。 4新书通报:报道图书馆新近采集的信息资源。联机公共书目信息,2、文献数据库,国内文献 数据库 中国生物医学文献数据库(CBM) CNKI:中国学术期刊网络出版总库 VIP:中文科技期刊全文数据库 国外文献数据库 Medline(医学文献联机数据库) PubMed(公共医学文献联机数据库) IPA(国际药学文摘数据库) DIF(药学全文数据库),2019/5/15,29,三、电子期刊,2019/5/15,30,四、电子图书,2019/5/15,31,5、电子学位论文,2019/5/15,32,6、课件、视频等,2019/5/15,33,一、按载体形式 二、按出版类型 三、按使用级别 四、网络信息资源,第三节. 信息资源类型,一、按载体类型,印刷型,缩微型,视听型,机读型,纸张-图书、期刊、专利文献等,感光材料-缩微胶片、平片、胶卷,磁带等-录音带、录像带、电影胶片,磁、光盘-电子期刊、图书、数据库,印刷型文献,纸 张,阅读方便,存储密度低 不易保存,缩微型文献,胶片、平片,存储密度较高 易复制,不宜阅读,视听型文献,磁带、录像带,载 体,特 点,形象、直观,机读型文献,硬盘、光盘,存储密度高、可控性好、形象、易复制、易交流,文献类型,不方便,磁盘(Magnetic Disc) 光盘(CD; Compact Disc) 网络(network)资源 网络检索工具:搜索引擎、网络目录等 电子出版物:电子图书、电子期刊 专业网站:以提供专业信息为主的站点 网络数据库:1万种,内容涉及不同领域和专业,机读(电子型)文献,文本型 txt doc pdf 超文本/多媒体型 html xhtml jpg 流媒体型 vod视频点播,机读文献类型,二、按出版类型,图书,期刊,特种文献,内容比较成熟、系统、可靠的出 版物,是学习和参考的主要信息源 International Standard Book Number,有固定名称和连续卷号、期号的定 期出版物。所含信息量大、新颖, 是科研工作主要信息源(ISSN),其它文献资料出版物的总称,信息 全面、密度高,一般图书馆不做重 点收藏,文献出版类型,电子图书,电子期刊,三、按使用级别,一次文献,二次文献,三次文献,原始创作:记录科研活动,报道新技 术、新发明、新见解的文献,书目文献:收集整理一次文献而形成的 索引、目录、摘要等,高级信息产物:综合分析研究大量一次 文献,浓缩提炼而成的文献,零次文献,未经记录、未形成文字材料的非文献型 情报信息,一次文献(原始信息类),原始学术信息 是指原始的创造,首次记录科研成果,包括新技术,新知识,新发明,新见解等 如期刊论文、学位论文、科研报告、专利文献、会议文献等,二次文献,记录内容包括书名、期刊名、文献中的题名、著者、以及主题、原文的出处(刊登的期刊名称、年、卷期页、网址等) 是按一定规律和方法编制成的查找原始文献的检索工具。如目录、索引、文摘等 OPAC(联机公共目录检索系统)、CBMDisc(中国生物医学文献光盘数据库)等,书目文献数据库,CBMDisc题录格式 标 题:红细胞葡萄糖6磷酸脱氢酶缺陷与 糖尿病关系的研究 著 者:朱易萍; 陶元 ;陈莉农 出 处:四川医学 1996.06.15; 17(3): 152-154,三次文献,在阅读一次文献的基础上,分析综合归纳信息后,组织形成具有资料性、查考性、阅读性的文献。如教科书、综述、百科全书、事实性数据库等 综述(Survey , Review)是指综合分析和描述一定时间范围内,某一学科或专业科研发展、现状、并预测未来的一类文献。,四、网络信息资源,“通过计算机网络可以利用的各种信息资源的总和” 网络中存在着大量的生物学和医药学信息资源,它连接着世界上许多著名的医学研究机构、医科大学和医院,成为一个集生物医学信息资源为一体的数据资源网 在数量、结构、分布和传播的范围、载体形态、内涵和传递手段等方面都显示出了新的特点,网络资源类型,网络搜索引擎:Google, Medscape 联机馆藏目录:OPAC(联机公共目录检索系统) 数据库资源:CBM, cnki, Medline,PubMed 电子出版物: 电子期刊,电子图书 参考工具:牛津大词典,网际金典 网络动态信息:E-Mail, BBS, News Group,网络资源特点,数量巨大,增长迅速 内容丰富,形式多样 时效性强,变化迅速 交互性好,可以共享 分布广泛, 无序化 信息冗余, 缺乏管理 商业性强, 多数收费,第四节 信息检索语言,用以描述文献信息特征,表达检索需求的一种专门的人工语言,是联系信息生产者、管理者与使用者之间的桥梁。,一、检索原理,信息检索(information retrieval)是指将信息按一定的方式组织存储起来,并根据信息用户的需要找出相关信息的过程 信息检索是由信息的存储和信息的查寻两个不可分割的过程所组成,一、检索原理,大量信息,信息存贮,信息检索,信息特征,存贮标识,不同索引,分析,检索,转化,分析,排序,转化,选择途径,检索标识,提问标识,检索需求,检 索 工 具,检索语言,检 索 工 具,关键:检索标识与存贮标识相一致,匹 配,二、检索语言的种类,规范性 非规范性:标题、关键词、文本词 规范性:分类、叙词(主题词) 描述信息特征 外部特征:标题、著者、序号、引文 内部特征:分类、主题、代码(分子式),检索语言的类型,外部特征的检索语言,著者索引 题名索引 文献序号索引 引文索引,以文献著者姓名字顺为标识的检索语言。 著者包括译者、编者、文摘人、专利权人、学会和机关团体名、学术会议名等。,著者索引 题名索引 文献序号索引 引文索引,以文献发表时的题目(篇名)、刊名或书名字顺为标识的检索语言。 包括书名目录(索引)、刊名目录(索引)、篇名索引等。,外部特征的检索语言,外部特征的检索语言,著者索引 题名索引 文献序号索引 引文索引,以文献所特有的序号为检索标识的检索语言。 专利号索引、科技报告序号索引、技术标准号、国际标准书号(ISSN)索引等。,外部特征的检索语言,著者索引 题名索引 文献序号索引 引文索引,以文献所附注的参考文献为检索标识的检索语言。利用文献的引用和被引用关系建立起来的文献检索系统称为引文索引。 参考文献指著者在文献末尾附加的用来表明论据或数据来源出处的文献资料。,分类检索语言 主题检索语言,内部特征的检索语言,以分类号和类目名称作为标识 符号,按学科、专业集中文献。 典型代表:中图法,以名词术语为标识符号, 从主题概念的角度来集中文献。 典型代表:MeSH,三、分类检索语言,按学科、专业集中文献,从知识分类的角度揭示不同文献在内容上的区别和联系 以分类号为标识符号 体系分类语言(学科分类语言) 中国图书分类法 美国医学主题词表(MeSH) 树状结构表( Tree Structure),分类语言的特点,体现学科系统性 反映事物间的从属、派生、平行等隶属关系 分类号使用数字/字母有序排列 从上到下,从总体到局部,等级分明 分类语言的类型 学科分类法 组配分类法,中国图书分类法 (中图法),是我国目前统一使用的分类法 其分类号由字母与数字组成 共分为22个大类 R类为医药卫生类,共有17个二级类目 按概念间的隶属关系进行排列,R 医药、卫生 R1 预防医学、卫生学 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学 R73 肿瘤学 R74 神经病与精神病学 R75 皮肤病学与性病学 R76 耳鼻咽喉科学 R77 眼科学 R78 口腔科学 R79 外国民族医学 R8 特种医学 R9 药学,R73 肿瘤学 R733 造血器及淋巴系肿瘤 R733.1 网状内皮系统肿瘤 R733.2 脾脏肿瘤 R733.3 骨髓肿瘤 R733.4 淋巴结肿瘤 R733.7 白血病 R733.71 急性白血病 R733.72 慢性白血病 R733.73 其他类型白血病,分类语言的缺点,不易分类 文献分散 不能反映新概念 检索不够灵活,四、主题检索语言,以语词作为检索标识来表达各种概念、并按字顺组织起来的一种检索语言。 具有专指性、直接性的特点 根据表达概念的不同分为: 标题词语言(篇名词) 关键词语言 叙词语言(主题词) 单元词语言(自由词、文本词),主题语言的特点,直接揭示文献的内容特征 按照字顺编排,检索方便 文献集中 表达新概念 叙词语言最具代表性,主题语言的类型,文本词(自由词) 摘要词 关键词 标题词 叙词(主题词),主题词: 能表达文献的实质内容,经过规范化处理的名词术语。 关键词:能表达文献主要内容的词汇或术语,未经过规范化处理。,关键词与主题词的关系 : 关键词 (自由词): cancer , carcinoma, tumor, neoplasm 用医学主题词表进行规范化处理 主题词 neoplasm,叙词(主题词)的特点:,词语与概念唯一对应 可组配副主题词增加专指性 采用参照系统揭示词间关系 有主题词分类索引(Tree Structure) 内容与规则构成一部主题词表(MeSH),医学主题词表MeSH (Medical Subject Headings),美国NLM出版,相当于一部医学检索词典,用于指导医学检索工具的主题标引和检索,是规范标引用词和检索用词的工具。 目前,MeSH 使用的主题词约22000个,副主题词83个。,16个主要类目,疾病主要类目,医学主题词表 (MeSH),前言/介绍 (包括副主题词表、主题词变更表) 主题词字顺表 (包括主题词,副主题词,常用非主题词) 树状结构表(分类表,分16个大类) A Anatomy 解剖学 B Organisms 生物体 C Diseases 疾病 D Chemicals&Drugs 化学物质与药物 E Analytical 诊断治疗技术与设备 F Psychiatry 精神病与心理学 作用 规范主题词,结构,疾病主要类目,Hemic and Immume(Non MeSH) A15 Blood A15.145 Blood Cells A15.145.229 Blood Platelets A88 Erythrocytes A13 Erythrocytes Membrane A13.270 Erythrocytes ,Abnormal A13.330 Leukocytes A37 Leukocytes, Mononuclear A37.555 Lymphocytes A37.555.567 Killer Cells A37.555.567.532 B-Lymphocytes A37.555.567.562 T-Lymphocytes A37.555.567.569 CD4-Positive T-LymA37.555.567.569.200 CD8-Positive T-ym.A37.555.567.569.220,CD4阳性T淋巴细胞 CD4-Positive Lymphocytes,第五节 信息检索基础, ,一、检索工具,检索工具的作用 存储作用 检索作用 报道作用 检索工具的特点 收录内容的有限性 报道信息的时滞性 标引深度的有限性 检索工具的要求 收录全面,标引准确,检索途径多,更新迅速,下载方便,一、检索工具,检索工具的类型 印刷型:目录、索引、文摘 电子型:书目型、事实型、全文型、多媒体型 检索工具的结构 印刷型:说明、正文、辅助索引、附录 电子型:文档、记录、字段,常用工具-书目型检索工具,书目型检索工具一般只提供文献的题录,如文献的篇名、著者、原文登载的期刊刊名及其卷、期、页和文摘。 印刷型:中目、IM、EM、CA、BA、SCI 光盘数据库: CBM disc、Medline, IPA(国际药学文摘) 网络数据库: CBM、NSTL, CNKI,PubMed, BIOSIS Previews 、EMBASE、SciFinder Scholar、 Web of Knowledge,常用工具- 全文型检索工具,中国学术期刊库 (CNKI清华同方公司) 中国科技期刊库(重庆维普公司) 万方全文数据库(万方资讯) Ovid JournalFulltext (美) Springer Link(德) Science Direct(荷兰) Freemedicaljournals(法) Highwire Press(美),检索途径(检索入口) 是指检索文献信息的出发点和路线,是在使用不同检索语言有序存储信息的同时形成 检索标识(检索词) 是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,它与检索途径相对应,是检索途径的具体化。包括主题词、关键词、分类号、专利号等,二、检索途径与检索标识,篇名途径:文献篇名中的名词术语 主题途径:规范化的主题词 分类途径:学科分类号或类目名称 关键词途径:文献的关键词 著者途径:著者姓名或机构名称 引文途径:被引文献 著者地址:著者地址或机构名称 刊名途径:期刊全称或简称中的词汇 序号途径:文献的各种代码,如专利号、ISSN号、化学物质登记号等 其他检索途径:如分子式、药物名称等,二、检索途径与检索标识,三、检索步骤,分析拟检课题,明确检索要求 选择检索工具,确定检索方法 确定检索途径和检索标识 构建检索策略 修正检索策略 获取原始文献,四、检索效率,检索效率: 检索结果的有效程度,是对检索结果好坏的评价 评价指标: 查全率=检出相关文献量/相关文献总量*100% 查准率=检出相关文献量/检出文献总量*100% 影响因素: 检索策略制定、检索系统和工具、检索途径和标识、检索技能等,第六节 计算机检索,一 概述 二 信息数据库 三 计算机检索技术,计算机检索的概念 计算机检索的特点 计算机信息检索系统的构成 计算机检索类型,一 计算机信息检索概述,计算机检索就是将大量的文献资料或数据进行加工整理,按一定格式存贮在机读载体上,建成机读数据库,利用计算机对机读型数据库进行检索的信息检索方式。 对于信息用户来讲,计算机检索也就是利用电子计算机对机读型的数据库进行检索。,1、计算机信息检索概念,2、计算机检索的特点,检索速度快: 检索途径多: 更新快: 资源共享: 检索更方便灵活: 检索结果可以直接输出,1. 硬件设备 2. 软件系统 3. 信息资源,3、计算机信息检索系统构成,国际联机信息检索 (60-70年代) 光盘信息检索 (80年代中) 网络信息检索 (90年代),4、计算机信息检索类型,由计算机处理的一定数量同类信息的有序集合。 包含书目及与文献有关数据的机读记录的有序集合。 是一定专业范围内的信息记录及其索引的集合体,由大量的文献记录构成,是检索的对象。,概 念,二、计算机检索数据库,文档(file)按所属学科专业或年代时间范围不同划分。 记录(record)是数据库的基本信息单元,描述了一个原始信息的内容特征和形式特征。一条记录代表一篇文献。 字段(field)每个记录由若干个描述性字段所组成,每一字段反映一篇文献的具体特征,即数据项。,结 构,字段 1,字段 2,字段 3,字段1,字段2,字段3,记录1,记录2,记录3,文档1,文档2,文档3,数据库结构,书目数据库(bibliographic database) 数值数据库(numeric database) 全文数据库(full text database) 事实数据库(fact database) 超文本型数据库(hypertext database),二、计算机信息检索数据库,类型,检索数据库的功能,功能 汇集文献信息 组织文献信息 检索文献信息,特点 收录内容的有限性 报道信息的时滞性 标引深度的有限性,自由词(Text,Key Word) 主题词(Subject Headings, Descrptor) 分类(Classification) 著者(Author) 机构及地址( Institution, Address) 刊名 (Journal Name) 其它 引文,ISSN,记录号,二、计算机信息检索数据库,检索途径,如何选择检索系统和数据库,收录范围:年代、学科、文献类型 检索途径:常用途径、特殊途径、必要途径 工具质量:标引深度、准确性、著录格式 更新速度:更新及时、时差短、信息新 使用方便:网络、免费、下载,2019/5/15,112,1 布尔逻辑检索 2 截词检索 3 限定检索 4 加权检索 5 扩展检索,三、 计算机检索技术,1、布尔逻辑检索 (Boolean searching) 逻辑或 OR + 逻辑与 AND * 逻辑非 NOT - 运算顺序: NOTANDOR 加括号优先,2019/5/15,115,Boolean Operator 布尔逻辑算符,布尔逻辑检索示意图,肝硬化 and 腹水,鼻咽肿瘤 OR 肺肿瘤,肝硬化 or 腹水,鼻咽肿瘤 OR 肺肿瘤,肝硬化 not 腹水,(A or B )and C,A and B and C,肝硬化或肝癌出现腹水,肝硬化并发肝癌出现腹水,B,A,C,B,A,C,2、截词检索 (truncation searching),截词符:可代替一个或多个不同的字符。大多为后截。 Immun? immune, immunize, immunology Child* children, childhood, childlike 林玉? 林玉海,林玉明,3 限定检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论