




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题二文献检索基础知识 2020 3 27 1 1文献检索的基本原理 一 信息检索的含义广义上 文献检索是指把文献按一定方式组织和存储起来 并针对用户的需求找出所需文献的过程 狭义上 信息检索指用户利用检索工具和检索系统从有序的信息源中 查询所需信息的检索过程 即文献检索就是文献的查找过程 2020 3 27 2 二 信息检索原理概述 广义的信息检索包括信息的存储和检索两个过程 信息的存储就是将搜集到的一次信息 经过著录其特征 如题名 著者 主题词 分类号等 而形成款目 并将这些款目组织起来成为二次信息的过程 2020 3 27 3 信息的检索是针对已存储好的二次信息库进行的 是存储的逆过程 存储是为了检索 而为了快速而有效地检索 就必须存储 没有存储检索就无从谈起 存储与检索是相辅相成 相互依存的辩证关系 2020 3 27 4 图1信息检索原理图 2020 3 27 5 2信息检索分类 一 按检索内容划分1 文献检索文献检索 DocumentRetrieval 即从一个文献集合中查找出专门包含所需信息内容的文献 是以文献为检索对象的信息检索类型 文献检索根据所检索内容的不同分为书目检索和全文检索 2020 3 27 6 2 数据检索数据检索 DataRetrieval 以特定数据为检索对象和检索目的的信息检索类型称为数据检索 包括数据图表 某物质材料成分 性能 图谱 市场行情 物质的物理与化学特性 设备的型号与规格等 是一种确定性检索 2020 3 27 7 3 事实检索事实检索 FactRetrieval 是获取以事物的实际情况为基础而集合生成新的分析结果的一类信息检索 以从文献中抽取的事项为检索内容 包括事物的基本概念 基本情况 事物发生的时间 地点 相关事实与过程等 2020 3 27 8 二 按信息检索的方式划分 根据信息检索的基本原理 实现信息检索的基本方式可分为传统信息检索和现代信息检索 传统信息检索 简称 手检 现代信息检索 简称 机检 按照检索的操作方式 信息检索分为手工检索和计算机机器检索 2020 3 27 9 1 传统信息检索 传统信息检索 即手检 手工检索是检索人员利用手工检索工具手翻 眼看 大脑思维判别 索取原始文献的一种方式 2020 3 27 10 优点是 检索条件简单 成本低 在检索过程中可以随时获取反馈信息 及时调整检索策略 可对不同的检索工具同时进行对比 从而提高检索质量 可以参阅检索工具中的附图 缺点是 速度慢 效率低 检出的文献款目必须抄录 手工检索工具提供的检索点有限 很难进行多元检索 难以找到涉及几个概念组合的多主题文献 2020 3 27 11 2 现代信息检索 现代信息检索即机检 是检索人员利用计算机检索系统查找文献的一种检索方式 所谓计算机检索系统包括数据库技术 计算机技术和通信技术等 计算机检索已从单机检索 联机检索发展到今天的网络检索 并正向着智能化的方向发展 2020 3 27 12 3检索语言 2020 3 27 13 一 检索语言分类 外表特征语言 内容特征语言 题名 书名 刊名 篇名 著者 号码 如专利号 报告号等 引文 分类语言 主题词语言 代码语言 分子式 结构式 检索语言 文献类型 文献出版事项 2020 3 27 14 二 两种常用检索语言 两种常用的检索语言 按检索语言结构原理划分 1 分类语言 2 主题词语言 体系分类语言组配分类语言混合分类语言 标题词语言单元词语言关键词语言叙词语言 2020 3 27 15 一 分类语言 分类语言是根据一定的观点 以科学分类为基础 文献内容的科学性质为对象 按照知识门类的逻辑顺序来组织和检索文献的一种语言工具 按学科体系的层次 从上到下 从总到分 逐级展开 各级类目一一列举 2020 3 27 16 中国图书馆分类法简表 基本部类 将图书分为社会科学 自然科学 综合三大类 社科 自然科学 自然科学 2020 3 27 17 O数理科学和化学 O1数学O11古典数学O119中国数学O12初等数学O13高等数学O14数理逻辑 数学基础O15代数 数论 组合理论O17数学分析O171分析基础O172微积分O172 1微分学O172 2积分学 O173无穷级数论 级数论 O174函数论O175微分方程 积分方程O176变分法O177泛函O178不等式及其他 O3力学O4物理学O6化学O7晶体学 分类标识即分类号由字母和数字组成 采用等级列举表达从属关系 上位类目一定能包含其各个下位类目 下位类目一定带有上位类目的属性 2020 3 27 18 F2经济计划与管理TQ03化学反应过程 F27企业经济TQ031一般化学反应过程 TQ031 2合成F276各种企业经济TQ031 3分解 裂化F276 4联合企业经济 F276 41部门间经济综合体TQ032催化反应过程F276 42科研生产联合企业TQ033生物化学过程F276 43合资经营企业 分类号越长 表示的学科范围越窄 2020 3 27 19 类 类目共同属性的集合一类事物的概念 TG44焊接工艺441一般方法442熔焊443电焊444电弧焊445埋弧焊 焊剂层下焊 446气焊447电铆焊 下位类 同位类 上位类 2020 3 27 20 2020 3 27 21 二 主题语言 1 主题法主题法是一种从文献内容角度标引和检索信息资源的方法 以主题语言来描述和表达信息内容的信息处理方法称为主题法 主题语言又可分为标题语言 元词语言 叙词语言和关键词语言 2020 3 27 22 2 主题检索语言 标题语言标题法是一种以标题词作为主题标识来反映文献信息内容的一种主题法 标题词必须统一和规范 美国国会标题表 2020 3 27 23 单元词语言单元词法 也叫元词法 是以元词为主题标识 通过字面组配的方式表达信息资源主题的主题法 所谓元词是用来标引信息资源主题的 最基本的 字面上不可再分的语词 2020 3 27 24 叙词语言叙词 国内亦称主题词 是经过规范化处理的 以基本概念为基础的表达文献主题的词和词组 叙词语言就是以叙词作为文献检索标识和查找依据的一种检索语言 2020 3 27 25 关键词语言关键词语言是直接选用文献中的自然语言作基本词汇 并将那些能够揭示文献题名或主要意旨的关键性自然语词作为关键词进行标引的一种检索语言 2020 3 27 26 4信息检索的方法和途径 一 信息检索方法的类型1 常用法 工具法 1 顺查法 2 倒查法 3 抽查法 2020 3 27 27 2 回溯法 引文法 回溯法 也称为引文法 是利用文献末尾所附的参考文献或引用文献 由近及远 由现在到过去 地进行追踪检索 2020 3 27 28 3 循环法 分段法 循环法 是综合常用法和回溯法的检索方法 即在检索文献信息时 既利用成套的检索工具检索 又利用原始文献后所附的参考引用文献进行回溯 分阶段按周期地交替使用 也称为分段法 2020 3 27 29 循环法的具体操作可以采用两种方式 1 首先使用常用法 然后使用回溯法 不断循环交替 2 首先使用回溯法 然后使用常用法 不断循环交替 2020 3 27 30 二 文献检索途径 文献的检索途径是根据文献的描述内容来确定的 检索路径主要包括以文献的外部特征进行检索的基本途径 如文献的名称 作者 出版信息等 和以文献的内容特征进行检索的主流检索途径 即分类法和主题法 2020 3 27 31 1 外部特征途径 文献的外部特征 是从文献检索载体的外表上标记的可见的特征 如题名 书名 刊名 篇名 责任者 作者 编者 译者 专利权人 出版机构等 号码 文献原有序号 标准号 专利号 报告号 索书号等 2020 3 27 32 1 外部特征途径 文献名称途径 书 刊 杂志 文章名 著者途径 代码检索途径代码检索途径是以某些文献所具有的特指或特定的代码为线索开展检索的途径 2020 3 27 33 2 内容特征途径 文献的内容特征 是从文献所载的知识信息中隐含的 潜在的特征 如分类 主题等 以文献的内容特征作为检索途径适用于检索未知线索的文献 2020 3 27 34 2 内容特征途径 分类途径分类途径是以文献所反映的内容所属学科的分类体系为线索开展检索的途径 2020 3 27 35 2 内容特征途径 主题途径主题途径是以文献所反映的主题内容为线索开展检索的途径 是把每一个文献 一本书 一篇论文 一件专利等 中的能够体现文献主题概念 事物特征 具有实际意义的词语抽取出来 作为检索标识供大家检索 从而使得用户可以从不同学科背景 不同检索需求出发 检索到同一主题的所有文献 2020 3 27 36 3 其他检索途径 还有一种根据引证关系建立起来的检索途径 即引文途径 见下面引文法 在进行文献检索时 检索途径的最终选择既受课题已知条件和课题检索深度的影响 同时更取决于检索系统已经为我们提供的各种检索入口 要取得既完善又准确的检索结果 正确地选择检索途径是很关键的 同时 用户所具有的数据库知识 检索技能以及对检索目标的把握情况也是非常重要的 2020 3 27 37 1 分析待查项目 明确主题概念2 选择检索工具3 确定检索途径和检索标识4 查找文献线索 索取原文 5信息检索的步骤 2020 3 27 38 6检索结果的评价 检索效果指利用检索系统或工具检索信息资源的有效程度 直接反映了检索系统的检索性能及能力 是评价一个检索系统性能和用户检索策略的质量标准 2020 3 27 39 一 信息检索的基本要求 信息检索的基本要求就是要用最少的时间和精力 快速获取所需的文献信息 同时检出的文献要全面 准确 全面 是根据课题需要 将有关文献尽可能地全面检索出来 尽量做到系统 完整 无重大遗漏 也就是要提高查全率 准确 要对检出的文献进行严格筛选 信息内容要准确可靠 使其符合课题需要 力求避免查出与课题无关的文献 也就是要提高查准率 2020 3 27 40 二 检索结果的评价 信息获取后 要认真分析 比较 概括和综合 以保证信息的真实性 准确性 当检索结果显现太多和研究课题不相关的记录 显现太少和研究课题相关的记录或没有和课题相关记录时 必须重新思考并建立检索命题 对检索策略进行优化 缩检或扩检 然后对检索结果进行组织整理 检出的资料是否与研究主题相关 是学术性文章 还是通俗性文章 是否新颖 资料是否具有权威性 是否可信 2020 3 27 41 二 检索结果的评价 衡量检索效果有两个主要指标 即查全率和查准率分别用字母R和P表示 1 查全率查全率指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比 表示为 查全率 R 检出有关信息资源量 系统中有关信息资源总量 100 2020 3 27 42 2 查准率 查准率也称检准率 相关率 检索精度 指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比 表示为 查准率 P 检出有关信息资源量 检出信息总量 100 2020 3 27 43 2 查准率 查准率是反映检索系统排除与检索提问无关信息资源的能力 研究表明 世界上最好的搜索引擎其查全率也只有45 查准率更低 对于一个检索系统来讲 查全率和查准率往往不可能两全其美 查全率高时 查准率低 查准率高时 查全率低 2020 3 27 44 3 查全率和查准率的局限性 查全率的局限性主要表现在 它是检索出的相关信息量与检索系统中的全部相关信息量之比 但系统中相关信息量究竟有多少一般是不确知的 只能估计 另外 查全率或多或少具有 假设 的局限性 这种 假设 是指检索出的相关信息对用户具有同等价值 但实际并非如此 信息的相关程度在某种意义上比它的数量重要得多 2020 3 27 45 3 查全率和查准率的局限性 查准率的局限性主要表现在 如果检索结果是题录式而非全文式 由于题录的内容简单 用户很难判断出检索到的信息是否与课题密切相关 必须找到该题录的全文才能正确判断出该信息是否符合检索课题的需要 同时 查准率中所讲的相关信息也具有 假设 的局限性 202
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论