




已阅读5页,还剩59页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学信息检索 1 该课的内涵 什么是医学信息检索 信息检索 一词出现于20世纪50年代 又称信息存贮与检索 是指将信息按一定的方式组织和存储起来 并根据用户的需要找出有关信息的过程和技术 广义上说 信息检索 包括 存 和 取 两个环节和内容 狭义的信息检索就是信息检索过程的后半部分 即从信息集合中找出所需要的信息的过程 也就是我们常说的信息查询 医学信息检索 即为如何 存 和 取 医学信息 2 开设此课的意义 信息是当今社会最重要的资源之一 信息素质已成为评价人才综合素质的一项重要指标 是信息化社会人们生存与发展的基本素质之一 1992年由美国学者杜尔对信息素质的阐述 较好地概括了信息素质的内涵 一个具有信息素质的人 能够认识到精确的和完整的信息是作出合理决策的基础 能够确定对信息的需求 形成基于信息需求的问题 确定潜在的信息源 采用成功的检索方式 从包括计算机和其他信息源获取信息 评价信息 组织信息并应用于实际 将新信息与原有的知识体系进行配合以及在批判性思维和问题解决的过程中使用信息 3 信息素质的诠释可以看出 信息素质包括信息获取的意识 评价 判断信息的能力 查找 收集 组织信息的能力 信息决策及处理能力 4 学校的信息素质教育 开设的主要课程包括计算机基础和文献检索课 前者主要培养学生的信息技能 后者作为信息素质教育的主要课程 应全方位地从信息知识 信息意识 信息能力和信息道德四方面系统开展 5 第一章信息检索基础 6 一 信息 知识 情报 文献 1 信息 information 在自然界 人类社会以及人类思维活动中普遍存在 是物质的一种基本属性 是物质存在方式及其运动的规律 特点的外在表现 2 知识 knowledge 人们通过信息对自然界 人类社会以及思维活动规律的认识与掌握 是人的大脑通过思维重新组合的系统化信息的集合 3 文献 literature 以文字 图形 符号 声频 视频等手段记录和传播知识的载体就是文献 4 情报 information 传递着的有特定效用的知识 7 信息 知识 情报 信息 知识 情报的联系与区别 情报 知识 信息 8 信息源是个人为满足其信息需要而获得信息的来源 1 3 1信息源的类型信息源的类型可依不同的标准划分如下 二 信息源 9 1 3 1 5按信息的产生次序和加工整理的程度不同 可将信息源划分为四个层次结构 1 零次信息指未经正式发表或不宜公开和大范围内交流的比较原始的素材 底稿 手稿 书信 工作文稿 工程图纸 考察记录 实验记录 调查稿 原始统计数字 以及各种口头交流的知识 经验或意见论点等 这类文献在较小的范围内交流 使用 参考 其传播渠道少 或常保密 或限制使用以及因珍稀的原因 不为人们知晓 其形式多是抄件 打字件 油印件以及内部录音 录像等等 其特点是信息来源直接 真实 内容新颖 因特网的普及 为广大网民提供了跨越空间的口头交流便利 如各种聊天工具 10 2 一次信息又称原始文献 也称原始信息源 它是作者依据本人的科研和工作成果而形成的文献 这类文献是脑力劳动的正式产品 是科研成果的一种主要表述方式 代表新知识 组成了可供交流的系统性信息 此类文献主要包括 专著 期刊和报纸 科学考察报告 研究报告 会议论文 学位论文 专利说明书 技术标准 政府出版物 产品样本等 11 3 二次信息指根据实际需要 按照一定的科学方法 将特定范围内的分散的一次信息进行加工整理使之简化和有序化而形成的文献信息 它能较为全面地系统地反映某学科某专业文献的线索 是检索一次信息的工具 这类文献有 书目 题录 索引和文摘等 12 4 三次信息指通过二次信息提供的线索 选用一次信息的内容 进行分析 综合 研究后而编成的信息 一般包括专题述评 动态综述 系统评价 进展报告 学科年度总结 年鉴 指南和百科全书等 13 1 3 1 4按信息的出版类型划分 可分为以下十种类型 1 图书大多是对已发表的成果和经验 或某一知识领域的系统论述或总结 它往往以期刊论文 会议论文 研究报告等一次文献为基本素材 经作者的分析 归纳 重新组织而成 图书提供的知识一般比较系统 全面 可靠 起着综合 积累和传递知识的重要作用 从时间上看 图书报道的知识比期刊和特种文献晚 且出版周期较长 14 2 期刊论文指采用统一名称 定期或不定期出版的连续出版物 其特点是出版周期短 报道速度快 数量大 内容多 发行面广 期刊的内容一般是一次文献 即原始文献 许多新的研究成果大多首先在期刊上发表 因此 期刊论文是获取新信息的主要来源 是极其重要的信息源 15 3 科技报告是关于某项科学研究和革新成果的报告或研究过程中的阶段进展情况的实际记录 它反映的科学研究和技术革新成果比期刊论文快 内容高度专门化 且具有一定的保密性 一般以单行本的形式出版 16 4 专利文献专利是国家对发明创造的法律保护 广义的专利文献应该是一切与专利有关的文献 包括专利说明书 专利公告 专利分类表 专利文摘等 狭义的专利文献一般指专利说明书 它是专利文献的主体 专利文献是极其重要的信息源 蕴藏着丰富的科技信息 17 5 会议文献一般是各种科技会议上的论文或书面发言 随着科学技术的发展 各种科技会议日益增多 已成为科技交流的一种重要渠道 许多学科中的重要发现有很大一部分是在会议文献中公开的 加上一些会议论文不在其它刊物或出版物上发表 或者即使发表 也要经过较长一段时间 因此 会议文献越来越受到科技界的重视 它已成为科技人员了解本专业的发展水平和最新研究成果的有效工具 18 6 政府出版物指各国政府部门及所属机构发表 出版的文件 大体上可分为行政性文件 如法令 方针政策 规章制度 统计资料等 和科技文献两大类 科技文献中包括政府各部门的科研报告 技术政策等 对了解某一国家的科学技术和经济政策及其演变等情况有一定的参考价值 19 7 学位论文是为了取得某一级学位而提交的论文 包括学士论文 硕士论文和博士论文 它们的特点是 论文的水平和质量差别较大 论题比较专一 阐述系统 具体 有一定的独创性观点 且经过一定的审查 故有一定的参考价值 20 8 标准文献是对工农业产品和工程建设的质量 规格及检验方法等方面做出的技术规定 它是从事生产 建设的共同技术依据 是一种规章性的文献 有一定的法律约束力 标准文献属于三次文献 其反映的信息传达了当时的技术标准和技术水平 因此 其技术新颖性和及时性低于专利等文献 21 9 产品样本是厂商为推销产品而印发的一种宣传性出版物 包括产品的性能 规格 尺寸 重量 构造 用途 使用方法等 产品样本的特点是技术上比较新颖 参数比较可靠 能给人以直观形象 利用它可了解国内外技术水平及有关技术的演变和发展动向 可获得设计 制造 使用中所需要的数据和方法 也可以为判断产品的价值提供依据 22 10 科技档案是在科研生产活动中形成的有一定具体工程对象的技术文件 图样 照片 原始记录的原本或复制本 内容包括任务书 技术指标 研究方案 实验记录 设计图纸等 它是科技活动的真实记录 内容一般真实 准确可靠 23 三 信息交流和信息素养 信息交流 个体之间借助于共同的符号系统所进行的信息传播 交换和分享 信息需要 就是指人们在从事各项实践活动的过程中 为解决所遇到的各种问题而产生的对信息的需求 信息动机 指激励和推进个体发动并维持其信息行为导向某一目标的心理过程 信息行为 人们满足自己信息需要的社会活动的过程 用户的信息行为主要有信息检索行为 信息的选择行为和信息利用行为 信息需要是信息行为发生的根本基础 而信息动机则是信息行为发生的根本动力 24 信息需要 信息需要的层次 未知的信息需要有些现实问题过于复杂和隐蔽 或个人的认知能力有限或缺乏信息意识 因此没有 或没有意识到自己处于信息需要的状态 属客观信息需要 潜在信息需要有些人可能认识到了自己的信息需要 但却没有表达出来 致使信息需求无法用信息符号表达出来而处于 意会 的状态 人们认识到而未表达出来的信息需要称为潜在信息需要 现实的信息需要当人们意识到信息需要 而且明确表达出来的 称之为现实信息需要 用户在表达出来后 向信息服务机构提出具体的信息要求的称之为信息提问 用户自己动手寻找信息的称之为信息自问 25 信息素养 包括信息获取的意识 评价 判断信息的能力 查找 收集 组织信息的能力 信息决策及处理能力 标准 2000年1月18日 美国大学与研究图书馆协会 ACRL 通过了 美国高等教育信息素养能力标准 26 标准一能够确认信息需求的特性与范围 标准二能有效而又高效地获取所需要的信息 标准三能评判性地评价信息及其来源 并能把所筛选出的信息融入自己的知识基础 标准四能有效地利用信息去完成一个具体任务 标准五了解利用信息过程中所涉及的经济 法律和社会问题 合理 合法地检索 搜集和利用信息 27 四 信息检索 信息检索 是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略 广义的信息检索包括信息的存储和信息的检索 所以又称为 信息存储与检索 28 信息检索按存储和检索的内容划分 文献信息检索数据信息检索事实信息检索 29 1 文献信息检索文献信息检索是以文献为检索对象 将存储于数据库中的关于某一主题文献查找出来的检索 它通常以原始文献的出处为检索目的 通过对目录 索引 文摘等二次文献的检索 向用户提供有关原一次文献的信息 30 2 数据信息检索是将经过选择 整理 鉴定的数值数据存入数据库中 根据需要查出可回答某一问题的数据的检索 这些数值型数据各种各样 包括物理性能常数 统计数据 人口数据 国民生产总值 气象数据等 31 3 事实信息检索事实信息检索是将存储于事实数据库中的关于某一事件发生的时间 地点 过程等情况查找出来的检索 一般先从系统中检索出所需信息后 加以逻辑推理得出结论 例如 HIS数据库包括大量医院管理中有关人员 工资 病床周转率 药房销售统计等信息 这类信息主要是用于管理决策 事实信息检索比数据信息复杂 32 五 信息检索系统 信息检索系统是为了信息检索而建立的 可以根据某种 或某些 文献特征信息从其中查检出含有特定信息 知识和情报 的文献的文献特征信息逻辑系统 是对巨大的不断增长的文献流进行控制的手段 所谓文献特征信息 是指文献所固有的 可找出某一或某些文献并将其从其他文献中识别出来的特征信息 如文献的题名 著者 出版者和出版年份 发表文献的刊物名称和期号 文献原始编号 如专利号 文献主题内容等等 将某一文献的各种特征信息加以记载 成为一条文献记录 再将属于一定范围的全部文献记录按一定规则组织起来 就成为一个信息检索系统 33 六 信息检索语言 1 自然语言 指文献作者或文摘提要的作者原来使用的语言 即出现在文献题名 摘要或正文中的语词 自然语言检索不足 1 不能简单明了而又专指地表达文献及检索课题的主题概念 2 不能够语词与概念一一对应 不能够排除多词一义 一词多义和词义含糊现象 例如 艾滋病 爱滋病 aids获得性免疫缺陷综合症 3 不能显示出概念之间的关系 4 不能将概念进行系统排列 5 不能够在检索时便于将标引用语和检索用语进行相符性比较 34 自然语言检索应注意的问题 35 为了弥补自然语言的不足 人们对自然语言的进行人为控制 依据一定的规则对其进行事先规范 于是诞生了人工语言 情报检索语言 36 2 人工语言 情报检索语言 情报检索语言是根据情报检索的需要而创制的人工语言 专门用于各种手工的和计算机化的情报检索系统 表达文献主题概念和检索课题概念 其实质是一系列概括文献情报内容的概念及其相互关系的概念标示系统 情报检索语言可分为分类检索语言 主题检索语言和代码检索语言三大语系 举例 37 如何运用人工语言 在存储文献时 文献标引人员首先要对各种文献进行主题分析 即把它所包含的情报内容分析出来 使之形成若干能代表文献主题的概念 并用情报检索语言的语词 标识 把这些概念标示出来 然后纳入检索系统 在检索文献时 检索人员首先要对检索课题进行主题分析 即把它所涉及的检索范围明确起来 使之形成若干能代表情报需要的概念 并把这些概念转换成情报检索语言的语词 然后从检索系统中查找用该语词标引的文献 从而找到含有所需情报的文献 人工语言的具体表现形式 医学主题词表 38 什么是医学主题词表 主题词又称叙词 在标引和检索中用以表达文献主题的规范化的词或词组 主题词是规范化的检索语言 它对文献中出现的同义词 近义词 多义词以及同一概念的不同书写形式等进行严格的控制和规范 使每个主题词都含义明确 以便准确检索 防止误检 漏检 如 白介素2 白细胞介素2 IL2 IL 2等表达同一概念的不同书写形式规范为 白细胞介素2 主题词表是对主题词进行规范化处理的依据 也是文献处理者和检索者共同参照的依据 39 医学主题词表 美国医学主题词表 mesh 荷兰医学文摘的主题词表 EMTree 中国中医药学主题词表 pubmed 主题词表 40 考察检索效率的常用指标 检全率与漏检率检全率与漏检率是可以说是同一问题的两个相对的概念 检全率高则漏检率就低 而漏检率高则检全率就低 如果检全率为65 则漏检率就是35 检全率是情报检索质量的主要标志 因为漏检率高表明重要情报被遗漏的危险性大 所以在情报检索中 总是力求提高检全率 或者说力求降低漏检率 检准率与误检率检准率也是文献检索质量的重要标志 因为误检率高表明用于甄别所检出文献是否真正有用的劳动的增加利时间的延误 虽不如遗漏重要文献那样严重 但对检索效率也有重大影响 所以在文献检索中 总是力求提高检准率 或者说力求降低误检率 41 七 文献数据库 文献数据库是指记录各种文献信息的数据库 它是计算机可读的 有组织的相关文献信息的集合 在文献数据库中 文献信息以数字化方式 按一定的数据结构 有组织地存储在计算机中 使计算机能够识别和处理 42 文献数据库的结构 文献数据库一般由记录 字段 文档组成 文档在数据库中有顺排文档和倒排文档之分 顺排文档是数据库的主体 又称主文档 它按每条记录的顺序号排列 数据库中得到的检索结果都来自于顺排文档 倒排文档是供检索顺排文档的工具 在一个数据库中可能有若干个倒排文档 如主题词索引 著者索引 刊名索引等 它按索引的字顺排列 检索时 计算机按输入检索词的字顺先从指定的倒排文档 索引 中找到匹配的索引词 然后根据索引词后的记录顺序号到主文档中调出记录 记录是构成文献数据库的一个完整的信息单元 每条记录描述了一原始信息的外部特征和内部特征 例如 书目数据库中的一条记录通常代表一篇文献 其他类型数据库中的记录可能是一种治疗方案 一组理化指数 字段是组成记录的数据项目 例如 在MEDLINE中一条记录代表一篇书目文献 在这条记录中有题名 著者 来源 文摘 主题词等字段 每个字段都有自己的字段标识符 Fieldtag 如TI 篇名 AU 著者 SO 文献出处 AB 文摘 AD 著者所在结构 AN 记录顺序号 等 将记录细划成字段作用是 帮助识别记录内容 方便检索结果输出时格式的选择 便于进行字段检索 43 文献数据库的类型 1 按文献数据库的记录内容划分 书目数据库全文数据库混合数据库 p31页 44 2 按文献数据库的运行方式划分 光盘数据库联机数据库网络数据库 45 几种主要的文献数据库 1 题录数据库 论文结构 题录 是指文献的基本信息 也称为目录 包括题名 作者 关键词 作者机构 文献来源 摘要等 题录数据库是用各种索引方法制作的二次文献数据库 又称题录数据库或篇名数据库 以简略的形式向用户提供文献的信息 如 中国生物医学文献服务系统 Sinomed 2 文摘数据库 3 图书馆馆藏目录数据库 联合目录p32 4 全文数据库 5 光盘数据库 6 多媒体数据库 7 网络数据库 46 文献检索方式 手工检索 人工查找文献信息的检索方式 检索过程主要是利用各种印刷型检索工具 计算机检索 根据信息特定的需求 利用计算机从相关数据库中识别并提取所需要的信息过程 网络信息检索 通过互联网上提供的网络信息查询工具 从网上获取和享用电子信息服务 47 八 计算机检索技术 1 计算机检索的基本原理当有检索提问式输入计算机时 计算机将提问标识和数据库文档中的特征标识按照一定的运算规则进行比较 如果基本相同 就将该记录存取号保存下来 即为命中信息 如果找不到相同的字符 则检索结果为零 这种匹配是字面上的匹配过程 而不是概念匹配检索提问字符串数据库中特征标识字符串 48 2 计算机检索特点 检索速度快 效益高检索功能强 数量大检索途径多 手段灵活检索范围广服务方式多更新速度快文献套录方便用户使用方便 49 3 计算机检索方法1布尔逻辑检索2位置逻辑检索3截词检索4字段检索5范围运算6精确检索7加权检索 50 1布尔逻辑检索布尔逻辑基本运算形式共有三种 逻辑 与 逻辑 或 逻辑 非 51 1 逻辑 与 逻辑 与 一般用AND或 号表示 设提问集A和B 如果文献C同时满足A和B中的每一个提问项 则为命中文献 否则为不命中 用数学模型来表示 则C为A和B的交集 如检索 流行性感冒引起咳嗽 应写成 流行性感冒and咳嗽 C 52 2 逻辑 或 逻辑 或 一般用OR或 号表示 设提问集A和B 如果文献C满足A或者满足B 即为命中文献 否则为不命中 用数学模型来表示 则C为A和B的并集 如检索 流行性感冒或者咳嗽 应写成 流行性感冒or咳嗽 C 53 3 逻辑 非 逻辑 非 一般用NOT或 号表示 设提问集A和B 如果文献C满足A 且不包含B为命中 否则为不命中 逻辑 非 实际上反映了A集合对B集合的差运算 如检索 流行性感冒不带咳嗽 应写成 流行性感冒not咳嗽 C 54 布尔运算符的优先级为 使用括号可改变运算顺序 如果含两个或两个以上的逻辑算符 应先算NOT 然后算AND 最后算OR 也可以用 来改变计算次序 因为 里的部分可最先算 例如 T 大学生 T 信息素养 T 大学生 T 检索能力 55 2位置逻辑检索位置逻辑检索 又称邻近检索 相邻度检索 它是基于文献中或文献记录中语词之间的相对次序或位置不同 它们所表达的意思可能不同 相应地 一个检索提问中语词之间的相对次序和位置不同 其表达的检索意图也不一样 因此 可以使用一些特定曲位置逻辑算符来限定检索词之间的位置关系 使检索提问式尽可能表达检索者真正的检索意图 从而既提高检准率 又提高见检全率 举例p43 56 3截词检索截词检索是指在检索词中保留相同的部分 用截词符号代替可变化的部分 它是为了部分解决由于检索式中对同义词列举不全造成的漏检现象而提出的 相当于用逻辑 或 扩展检索范围 截词符号一般用 或 等 代表零或一个字母 代表两个或两个以上字母举例 Child 可代表child children childly childhoodColo r可检索出color colourDra t可检索出drat draft draught截词检索主要用于年代
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年老年病科考试题及答案
- 2025年公路检验工程师桥梁隧道工程章节试题及答案
- 桃子类培训知识课件
- 公务员甄选面试题及答案
- 2025年残疾人专职委员招聘考试复习策略与建议
- 2025年经济师高级考试必-备微观经济学模拟题解析
- 2025年城市规划与管理专业公务员考试冲刺题库
- 2025年VR初级笔试工程师答案
- 2025年贸促会政府会计实操模拟题及答案
- 福建省莆田市七中2026届高二化学第一学期期中质量跟踪监视模拟试题含解析
- 湖北省武汉市武昌区重点名校2026届中考语文全真模拟试题含解析
- 2.4抽象函数的周期性与对称性-讲义(原卷版)
- 喷粉挂钩管理办法
- 2025手机维修服务合同范本
- 风电场安全规程考试题库(附答案)
- 肠内营养患者护理质量提升措施
- DB11∕T 1205-2024 用能单位能源审计报告编制与审核技术规范
- 苯职业病防护课件
- (高清版)DB11∕T 2442-2025 学校食堂异物管控规范
- 扬尘污染矿山管理办法
- 母乳喂养教学课件
评论
0/150
提交评论