




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,文献信息检索基础,中南大学刘雁书liuyanshu2011年9月,.,2,大纲,文献信息检索技术文献信息检索途径文献信息检索策略文献信息检索语言,.,3,.,4,.,5,(一)文本信息检索技术,3.邻近检索(proximitysearching)是用来表示检索词之间位置关系的检索技术,通过用位置算符来实现,常用的位置算符有near,with等“near”:表示两个检索词位置相邻,出现顺序可前可后,如genenearapoptois“with”:表示两个检索词位置相邻,且两词出现顺序与输入顺序一致,如liverwithcancer,.,6,(一)文本信息检索技术,4.限定检索(limitsearching):又称限定字段检索,利用检索词出现的字段进行的检索。,PubmedLimits检索界面,.,7,(一)文本信息检索技术,扩展检索(expandsearch)加权检索(weighingsearching),.,8,(一)文本信息检索技术,7.精确检索与模糊检索精确检索(exactsearching)模糊检索(fuzzysearching),.,9,8.跨库检索,中国知网跨库检索界面,.,10,9.相关信息反馈检索,中国知网相关信息反馈检索界面,.,11,10.智能检索,原提问词”birthdefect”,系统转换后的检索策略,.,12,(二)、多媒体信息检索技术,基于文本描述的检索基于内容的图像检索颜色特征提取纹理特征提取形状提取相关反馈技术,.,13,百度图片高级检索界面,“搜索结果”、“搜索结果类型”:基于文本的检索,“图片大小”:基于内容的检索,形状特征提取,“选择颜色”:基于内容的检索,颜色特征提取,“图片格式”、“站内图片”:基于文本的检索,.,14,(三)、可视化信息检索技术,可视化检索(Visualretrieval)检索过程透明化检索结果输出高效化更为有效的检索结果排序机制有效的用户反馈机制,对近二十年能量医学文献可视化检索发现目前能量医学有两个主要研究领域:1.病人(尤指女性)的饮食和运动与疾病的关系;2.医学影像学。,.,15,二、文献信息检索途径,.,16,二、文献信息检索途径,检索途径为检索系统的检索入口,即检索系统所提供的、用以查寻获取资源的各种标识,在计算机检索中通常表现为字段检索。,.,17,二、文献信息检索途径,1.主题词检索途径是利用主题词(SubjectHeadings)作为检索入口查找文献的途径。主题词是经过优选和规范化处理的词汇,由主题词表来控制,常见的医学主题词表有美国国立医学图书馆编制的MedicalSubjectHeadings及中医药学主题词表主题词途径有助于提高查全率与查准率,但维护成本高。目前支持主题词检索的检索系统主要有CBMDisc和Pubmed.,.,18,二、文献信息检索途径,2.自由词检索途径自由词途径是利用自由词(TextWord)作为检索入口查找文献的途径.自由词是检索工具中所出现的任意词汇(通常除开无实质意义的词汇),主要包括题名词、关键词、文摘词和全文词等有实质意义的词。自由词检索用词灵活、自由、直观、符合用户习惯,因而应用广泛。但自由词不能反映概念间的一一对应关系,也不能反映概念间的等级从属关系,因而自由词检索时应同时考虑使用所选自由词的同义词、近义词、专指词等相关词进行检索,避免漏检文献。,.,19,二、文献信息检索途径,3.分类检索途径分类途径是利用文献在分类体系中的位置(类目名称或分类号)作为检索入口查找文献的途径,可满足用户从学科、专业等内容出发获取文献的需要。常见的分类标准主要有中国图书馆分类法,.,20,二、文献信息检索途径,4.著者检索途径是利用文献上署名的作者、编者或机关团体名称作为检索入口查找文献的途径。查外文数据库时,须注意外文数据库对著者姓名的特殊处理方式。,.,21,个人著者的处理方法常规姓名:姓在前用全称,名在后用缩写如:SusanAnnWebsterWebsterSA复姓时所有的姓以全称的形式保留,放于名之前。JulieC.Fanbury-Smith如何处理?带前缀(如De,Des,Du,La,Dal,La,Von,Van,den,der)的姓名,多数将前缀作为姓名的一个组成部分,并参与排序KinderVonWerder如何处理?(VonWerderK)作者姓名中的头衔(如Lord、PhD、MD)在著者索引中常略去。,.,22,西文检索工具对中国人名的处理较混乱如XiaJia-hui文献可能被分散在“XiaJH”及“XiaJ”下面,检索时需综合考虑,尽可能查全。由中华人民共和国新闻出版署印发、1999年2月试行的“中国学术期刊(光盘版)检索与评价数据规范”中相关规定为:“中国作者姓名的汉语拼音采用如下写法:姓前名后,中间为空格.姓氏的全部字母均大写,复姓应连写.名字的首字母大写,双名中间加连字符;名字不缩写.如:ZHANGYing(张颖),WANGXi-lian(王锡联),ZHUGEHua(诸葛华).”,.,23,二、文献信息检索途径,5.题名检索途径利用题名(如书名、刊名、篇名)作为检索入口的查找文献的途径。计算机检索系统都提供题名检索途径,题名是文章内容的高度浓缩,将提问词限制在题名中可以提高查准率,.,24,6.序号检索途径利用文献特有序号查找文献的途径.常见序号有专利号、报告号、化学物质登记号等提供从信息本身的序号入手查找信息的途径由于序号通常具有唯一性、专指性和实用性等特点,因此利用文献序号来查找相关信息能提高查准率,并有效提高检索速度。,.,25,二、文献信息检索途径,7.机构检索途径是以机构名称为检索入口查找文献的途径。不少数据库将机构名并入地址字段8.引文途径从参考文献入手查找文献的途径。代表:美国科学引文索引SCI,.,26,二、文献信息检索途径,9.缺省检索途径指自动在检索系统预先设定的多个字段中同时进行检索。如CBMDisc的缺省字段包括“中文题名”、“关键词”、“主题词”、“文摘”、“刊名”、“特征词”等字段10.其他途径化学文摘的分子式索引生物学文摘的生物体索引,.,27,.,28,分析课题,明确实质需求,选择合适的检索工具或数据库,概念分析并转换成系统检索词,拟定检索提问式和检索途径,检索,修正调整检索策略,获取原文,完成,检索结果是否满意,NO,YES,流程图,.,29,(二)检索策略的构建,1.分析检索课题,明确检索要求分析课题的主题内容确定课题的文献类型确定检索时间范围分析用户的检索评价要求,.,30,(二)检索策略的构建,2.选择检索系统,确定检索方法数据库选择“4C”原则Content(内容)Coverage(覆盖范围)Currency(更新)Cost(成本),.,31,(二)检索策略的构建,3.确定检索途径,编写检索策略表达式4.评价检索结果,修正检索策略,.,32,四、信息检索语言,.,33,Q:文献检索就是从一定的文献集合(即检索系统)中查找出符合特定需要的文献,检索系统中收集了许多文献线索,这些线索是按什么方式组织的呢?,.,34,文献组织方式,形式特征:文献题名、作者等内容特征:主题词、分类号等,.,35,(一)检索语言概述,1.定义:文献信息检索语言简称检索语言(retrievallanguage),是在文献检索领域内用来描述文献特征和表达检索提问一种专用语言,即根据信息检索需要而创建的统一文献标引用语和检索用语的一种人工语言。,.,36,(一)检索语言概述,2.检索语言作用使文献成为有序的集合体提供检索入口揭示文献实质内容。如主题标引,.,37,(一)检索语言概述,3.种类文献形式特征检索语言题名索引著者索引文献序号索引引文索引,文献内容特征检索语言分类检索语言主题检索语言代码检索语言本体语言,.,38,(二)文献分类法,文献分类法是根据文献知识内容所属的学科性质,分门别类地、系统地揭示和组织文献的一种方法。常用文献分类法中国图书馆分类法图书馆藏书组织检索系统重要检索途径,.,39,图书馆藏书是按什么方法组织的?,医学文献信息检索/罗爱静G252.7-43/LAJ.3索书号分类号+书次号(+辅助区分号)=索书号分类标准:中国图书馆分类法,简称中图法,1999年第四版,.,40,中国图书馆分类法,中图法将所有的学科体系分为22大类,每个大类用一个字母表示,中图法基本大类表详见教材P38提问:代表医药卫生大类的字母是哪一个?,.,41,中国图书分类法,“R医药卫生”的主要类目:详见教材P39,.,42,中图法体系结构,R医药卫生R5内科学R52结核病R521肺结核R521.1原发综合征R521.2支气管淋巴结核,.,43,R78口腔科学下位类目,R78口腔科学R780.1口腔疾病的预防与卫生R780.2口腔病理学R781口腔内科学R782口腔颌面部外科学R783口腔矫形学R787老年口腔疾病R788儿童口腔疾病,.,44,中图法,复分号:用于区分某一类图书-43教材-44习题、试题及题解-53论文集-6参考工具书-61术语、辞典、百科全书-62手册、名录、指南-64图解、数据、地图,.,45,问题:“R243”分类号代表何种图书?,.,46,图书排架,排序题:F735C913.5R47R714R6,.,47,(三)国际疾病分类法,国际疾病分类法(InternationalClassificationofDiseases,ICD),起源于1853年,1948年世界卫生组织接管了国际疾病分类工作,现最新版本为1993年的第十次修订版本(ICD-10),改称为疾病及有关健康问题国际分类统计分类(TheInternationalStatisticalClassificationofDiseasesandRelatedHealthProblems,为保持其连续性,简称仍沿用“国际疾病分类”(ICD),但其使用范围不仅局限于疾病和损伤分类的范畴,还扩展到对其他健康问题进行分类。,.,48,学习国际疾病分类法的意义:在WHO倡导与推动下,ICD现已成为世界性的疾病、损伤和死亡原因分类的统一标准化工具。我国于1987年起正式使用ICD进行疾病和死亡原因的统计分类。我国卫生部要求县级及以上医院采用ICD编制医院出院病人疾病分类统计报告,并颁发了全国统一使用的、注有ICD编码的医院病案首页,首页中很多内容(如各种诊断、手术名称、损伤、根本死因等)都需要临床医生参照ICD来正确书写。,.,49,医院信息系统中的病案首页,.,50,ICD的分类体系,ICD是一个可变轴心的分类,其结构按照流行性疾病、全身性疾病、局部疾病(按部位排列)、发育性疾病、损伤等排列。ICD的基本分类:三位数类目表(listofthree-charactercategories),三位数类目表:将所有疾病分为21大类(章),每一大类类目编号为一组三位数(第一位是英文字母,第二三位是数字),如第九大类“循环系统疾病“类目编码为I00-J99,见教材P43,“表2-2ICD-10三位数类目表”三位数类目表是ICD的核心,是向世界卫生组织死亡率数据库提交报告和一般国际比较用的强制性编码水平。,.,51,ICD的详细类目表:内容类目表和四位数亚目(Tabularlistofinclusionsandfourcharactersubcategories),是三位数类目表的详细类目表,类目编号包括一个字母、三位数字和一个小数点。举例:I15继发性高血压I15.0肾血管高血压I15.1继发于其他肾疾患的高血压I15.2继发于内分泌疾患的高血压I15.8其他继发性高血压I15.9继发性高血压,未特指,.,52,ICD-10的主体结构,第一卷:类目表第二卷指导手册第三卷字母顺序索引,.,53,(四)医学主题词表,医学主题词表(MedicalSubjectHeadings,Mesh)印刷本电子版MeshBrowserUMLSMetathesaurusMesh网站(/mesh)Meshdatabases:Pubmed提供的一种检索服务,.,54,&主题词特性:单一性,例如:肿瘤抑制基因tumorsuppressorgenes,Tumorsuppressorgenesgenes,tumorsuppressorantioncogenescancersuppressorgenesgrowthsuppressorgenes,Genes,tumorsuppressor,Entryterm,MeshHeading,.,55,主题词的动态性,如:H1N1病毒2005年以前没有单独主题词,是归于”Influenz
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水博园研学活动方案
- 棋艺比赛活动方案
- 桓台部门团建活动方案
- 横溪街道宣讲活动方案
- 法宣传活动方案
- 桂林沙发活动策划方案
- 水果拼盘新年活动方案
- 汉服设计课间活动方案
- 民生实事大比拼活动方案
- 植树节民警活动方案
- 对公客户经理培训课件
- 社会文物鉴定质检服务机构执业能力认可管理体系(公开征求意见稿)
- 高标准农田建设监理规范与实施策略
- 钢丝绳编接作业知识培训
- 人教版八年级道德与法治下册教学设计:4.1公民基本义务
- 接触网电连接压接工艺及压接质量检查课件
- 2025北京朝阳六年级(上)期末数学试卷(含答案)
- 肝硬化门静脉高压症食管、胃底静脉曲张破裂出血诊治专家共识(2025版)解读
- 青少年心理健康发展调研报告
- 交警交通安全培训
- 现场管理四大指标:安全、品质、成本、交期
评论
0/150
提交评论