




已阅读5页,还剩104页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章文献信息检索基础 第一章文献信息检索基础 第一节文献信息资源及其检索概述第二节文献信息检索系统第三节文献信息检索技术第四节文献信息检索策略 一 文献信息的概念 1 文献2 知识3 信息 第一节信息检索概述 一 信息 知识 情报 文献 一 定义信息 Information 是物质存在的一种方式 形态或运动状态 是事物的一种普遍属性 知识 Knowledge 是人们在认识和改造客观世界的实践中所获得的认识和经验的总和 是人们对客观事物的本质和规律的认识 情报 intelligence 是满足一定需求的 激活了的知识 文献 Literature Document 是记录有知识的一切载体 记录知识的具体内容 记录知识的手段 如文字 图像 符号 声频 视频等 记录知识的物质载体 如纸张 光盘 录像带等 记录知识的表现形态 如图书 期刊 专利说明书等 二 关系 信息 知识 情报 文献 二 文献信息的类型 按载体的不同 常将文献划分为 1 印刷型2 电子型3 声像型按出版类型 又常将文献划分为 1 图书2 期刊3 会议文献4 学位论文5 科技报告6 专利文献7 WHO出版物教科书 参考书 专著 综述 期刊论文论文 综述 专著 教科书 图书 图书 通常被认为是由正式出版社出版的出版物 其范围很广 包括专著 文集 教科书 普及读物 百科全书 年鉴 手册 词典等 特征为出版社名称 Publication Press ISBN号等分为阅读型和工具型 特点 成熟 全面 可靠 时效性差用途 初步了解一般性问题实例 作者 胡鞍钢著出版社 北京大学出版社出版时间 2007 1 1字数 297000版次 1页数 395印刷时间 2007 01 01开本 印次 纸张 胶版纸ISBN 9787301115367包装 平装 期刊 期刊 俗称杂志 是定期或不定期周期性出的连续出版物 特征为刊名 卷Vol 期No 国际标准刊号ISSN期刊分为 学术性 Journal 情报型 工具型 Abstracts Index 报导型 News 综合型 Review 特点 数量大 品种多 内容丰富 出版周期短用途 获取最新研究成果和动态实例 主管 中国科学技术协会主办 中华医学会编辑 中华医学杂志编辑委员会总主编 巴德年编辑部主任 陈新石出版 中华医学会杂志社ISSN0376 2491CN11 2137 R 特种文献 特种文献 形式比较独特 一般是单独成册 主要出版特征是号码 主要特种文献有以下八种类型 学位论文 学位论文 是高等院校硕士 Ms D 或博士 Ph D 毕业生为申请学位而提交的毕业论文 特征 学校名称及学位 科技报告 科技报告 研究机构关于某项科研成果的正式报告 或者是对研究过程中阶段进展情况的实际记录 国防与航空航天方面居多 特征 报告号 例如 NASA20050082846 美国宇航局科技报告 ADA207606 美国国防系统研究报告 DE91011930 美国能源系统研究报告 PB90226341 美国民用系统研究报告 AGARDR775 北大西洋公约组织研究报告 HY93007 航空信息研究报告 实例 中国核科技报告ChinaNuclearScienceandTechnologyReport主办 中国核科技报告 编辑部周期 半年出版地 北京市语种 中英开本 16开ISSN1671 7430CN11 9253 TL创刊年 1985 会议论文 会议文献 主要是学术会议上宣读的论文或交流的书面论文 形式有单行本 会议预印本preprint 和会议论文集 特征为 会议名称 时间 地点 会议论文 特点 文献论题集中 内容新颖 丰富 专 深 学术性强 能反映出一个国家 一个地区或国际上当前某一科学技术领域的最新成就 最高水平和发展趋势 实例 专利 专利 发明人申请专利时呈交的申请说明书 一般包括 发明人 发明的详细说明 专利权范围 插图等 特征 专利号 实例 输液自动呼叫器福建省大田星海科技开发有限公司程开海1 输液过程中瓶内药液将要滴尽时能提前自动发出声响信号 提醒护理人员注意 2 旋动呼叫器上的旋钮可直接选择用于各种规格容量药瓶 袋 输液终了的自动呼叫 3 自动呼叫后病人躺在床上可直接拉动拉线控制停呼 政府出版物 政府出版物 这是各国政府部门及其设立的专门机构发表 出版的文件 分为行政性文件 如法令 统计等 和科技文献 30 40 标准 标准 主要是对工农业产品和工程建设的质量 规格及其检验方法等方面所作的技术规定 是从事生产 建设的一种共同技术依据 特征为 标准号 产品资料 产品资料 产品资料是制造厂商为了推销产品而发出的 以介绍产品性能为主的出版物 实例 科技档案 科技档案 科技档案是科学技术研究和生产建设部门 在科学技术研究和生产建设活动中形成的 有具体工程对象的技术文件 图样 图表 图片 原始记录的原本或代替原本的复制本等 28 2 认识不同内容层次的文献 文献整理 知识重组知识浓缩 1 零次文献 ZeroDocument 零次文献指未经正式发表或未进入学术交流的最原始的文献 2 一次文献 PrimaryDocument 是指作者以其本人的研究成果 如实验 观察 调查研究等的结果 为基本素材写成的原始创作 如专著 期刊论文 科技报告 学位论文等 3 二次文献 SecondaryDocument 是将大量无序 分散的一次文献收集 整理 加工 著录其特征 如著者 篇名 分类 主题 出处等 并按一定的顺序加以编排 形成供读者检索所需一次文献线索的新的文献形式 如索引 文摘 目录以及其相应的数据库等 因其具有的检索功能而称之为检索工具或检索系统 4 三次文献 TertiaryDocument 是科技人员围绕某一专题 借助于二次文献 在充分研究与利用大量一次文献的基础上 经过阅读 分析 归纳 概括 撰写而成的新的文献 表现形式主要有 综述 Review 述评 Comment 进展 Progress Advance 现状 Update 发展趋势 Trend 等期刊文献和百科全书 年鉴 手册等参考工具书 文献级别举例 一次文献二次文献 文献级别举例 三次文献零次文献 科技文献层次结构 知识产生 记录 原始文献 知识重组 知识浓缩 词典名录指南手册年鉴书目等 述评专著教科书论文丛集百科全书等 三次文献 期刊论文会议论文科技报告学位论文专利说明书 文献整理 目录索引文摘新书通报等 二次文献 一次文献 零次文献 研究活动 实验 观察 思考 信息的直接记录或传递 零次文献 创造知识的素材 将知识以文字等形式固化 一次文献 初始的知识产品 将分散的文献序列化 二次文献 一次文献的替代品 将知识重新组合 使知识序列化 三次文献 浓缩的新的信息产品 3 认识不同载体的文献 印刷型文献 纸质电子型文献 缩微型文献声像型文献机读型文献 电子文献 多媒体型文献 四 文献信息的特点 1 数量庞大 增长迅速2 文种繁多 但呈明显的英文化趋势3 内容交叉重复4 文献形式呈现多样化5 文献分布既集中又分散 但呈专题化或专集化趋势6 知识老化加快 文献寿命 半衰期 缩短7 交流传播及变化速度加快 五 文献信息的社会功能 1 科技文献是科学表现的存在形式 是汇集人类财富的主要场所 2 科技文献是衡量科学技术水平的重要依据 3 科技文献是传播科学知识的最基本 最主要的手段4 科技文献是确认科学发现与技术发明优先权的认证记录 六 检索基本原理 经选择的信息 主题分析 标引语言表达 文献特征标识 经确立的课题 主题分析 检索语言表达 文献需求标识 信息集合 词表 存储 检索 检索结果 什么样的文献信息能够得以输出呢 匹配 检索时匹配的究竟是什么 第二节文献信息检索系统 一 文献信息检索系统的构成二 数据库的结构三 文献信息检索系统的分类四 文献信息检索系统的功能 一 文献信息检索系统的构成 1 信息资源2 硬件设备3 软件条件4 人力资源上述四方面内容构成了文献信息检索系统的空间结构 是系统运行的最基本前提 42 二 类型 手工检索 检索手段 计算机检联机检索光盘检索网络检索 43 二 类型 文本信息检索 数据格式和检索技术 多媒体信息检索 超媒体和超文本检索 三 数据库的结构 一 从数据库组成的层次来划分1 文档 File 2 记录 Record 3 字段 Field 二 从数据库组成的方式来划分1 顺排文档2 倒排文档 字段1 字段2 字段3 记录1 记录2 记录3 文档1 文档2 文档3 数据库结构 上述数据库的结构 可用英文单词的单复数形式更直观地表述为 RecordFields 记录 DatabaseFlies 数据库 FileRecords 文档 Fieldsearchingentry 字段 检索入口 主文档 序号 N5 序号 N4 序号 N3 序号 N2 序号 N1主题词 S1著者 Au1标题 t1 S1 N1 N3S2 N2 N3S3 N1 N4 Au1 N1 N4Au2 N3Au3 N4 主题词倒排档 著者倒排档 主题词检索途径 著者检索途径 其它检索途径 主文档和倒排文档的关系示意图 四 文献信息检索系统的分类 1 书目型数据库2 事实数值型数据库3 全文型数据库 49 书目型数据库 bibliographicdatabase 是二次文献数据库 主要存贮相关主题领域的各类文献资料的书目信息 包括机读版的文摘 题录 目录 索引等 用户可从大量文献记录中筛选出有参考价值的文献源 并依据记录提供的来源指示获取一次文献 举例 中国生物医学文献数据库 PubMed P84 EMBASE P93 等 1 书目型数据库 全文型数据库 Full textDatabase 收录有原始文献全文的数据库 以期刊论文 会议论文 政府出版物 研究报告 法律条文和案例 商业信息等为主 优点 能直接获取文献原文 集文献检索和全文提供于一体 提供全文字段检索 举例 中国学术期刊网络出版总库 CNKI 万方数据资源的数字化期刊 OVID全文数据库 ElsevierScience的SDOS等 全文型数据库 事实型数据库 事实型数据库 FactDatabase 提供有关事物 人物 机构等方面的事实性信息 举例 ClinicalTrials 临床试验数据库 是通过对自愿接受试验患者的临床研究 观测药物 诊断方法 疫苗和其他治疗方法对某一种疾病或症状是否安全和有效 数据型数据库 NumericDatabase 提供数值性信息 包括各种统计数据 科学实验数据 各种测量数据等 举例 WHOSIS 可以获取以下统计数据和资料 疾病负担统计 死亡原因统计 世界卫生报告年度统计 卫生从业人员统计 人口统计 HIV AIDS信息与数据 精神病死亡率统计 免疫接种统计等统计数据 以及疾病负担计划 国际疾病分类法及WHO术语信息系统 卫生系统成就 全球酒精数据库 GlobalAlcoholDatabase 等与卫生和卫生统计有关的资料 P264 美国疾病控制与预防中心 CDC 的DataandStatistics等 P266 数据型数据库 四 文献信息检索系统的功能 1 汇集文献信息2 组织文献信息3 检索文献信息上述三者之间的关系如何 理解这个问题对于整个文献检索课学习的意义何在 思考题 1 信息 知识 情报三者的联系与区别 2 分别用抽象文字与具体图示表达上述三者关系的意义 3 文献级别演化的本质及意义 4 文献信息综合应用中 综合 二字的含义 5 科技图书与科技期刊之与学术生涯 6 信息检索系统中 系统 二字的含义 7 信息检索系统构成与信息检索原理的关系 8 如何理解信息检索系统的诸多功能 第三节文献信息检索技术 一 信息检索技术 概念广义的包括信息组织 数据库建设在内的涉及信息科学 情报学 计算机科学等诸多学科领域的技术方法 狭义仅指从现有的信息资源中提取相关信息的技术方法 信息检索技术 发展阶段手工检索方式 包括纸质文献的检索和缩微式检索 脱机检索方式 包括机读磁带 磁盘检索 光盘数据库检索等 计算机联机检索方式 网络化信息检索方式 如 SCI EI SpringerLink数据库 EBSCO数据库等 布尔逻辑检索技术 最常用的方法 用户的信息需求通过检索提问式表达 采用布尔代数中的逻辑符AND OR和NOT作为逻辑组配算符 计算机根据表达式确定命中文献的基本条件与查找途径 同文档中各篇文献的标识进行匹配 凡符合条件的文献即为命中文献 予以输出 布尔逻辑检索技术 布尔运算符AND OR NOT 分别表示逻辑与 逻辑或 逻辑非三种逻辑运算关系 如图1 3 1所示 AandBAorBAnotB 图1 3 1布尔逻辑运算示意图 布尔逻辑检索技术 布尔逻辑运算一览表 布尔逻辑检索技术 逻辑 与 检索表达式为 AandB 数据库中同时含有检索同A和B的文献为命中文献 作用是缩小检索范围 提高查准率 例如 查找 胰岛素治疗糖尿病 的文献 检索式为insulin 胰岛素 anddiabetes 糖尿病 布尔逻辑检索技术 逻辑 或 检索表达式为 AorB 数据库中的文献中含有检索词A或B的文献为命中文献 作用是扩大检索范围 例如 查找 肿瘤 的文献 检索式为cancer 癌 ortumor 瘤 orcarcinoma 癌 orneoplasm 新生物 布尔逻辑检索技术 逻辑 非 检索表达式为 AnotB 数据库中凡含有检索词A而不含B的文献为命中文献 作用是缩小检索范围 提高查准率 例如 查 动物的乙肝病毒 不要人的 的文献 检索式为hepatitisBvirus 乙肝病毒 nothuman 人类 布尔逻辑检索技术 布尔逻辑运算的优先顺序当一个检索表达式含有多个布尔算符时 执行的顺序为not优先运算 and其次 or最后 可用圆括号改变运算顺序 将需要优先运算者置于圆括号中 例如 查找 维生素C或维生素E对糖尿病患者肾脏的保护作用 检索式为 维生素Cor维生素E and糖尿病and肾 截词检索 截词检索 利用截断的词的一个局部即截词 进行检索的技术 自动地对同一概念检索词的不同词尾变化 词根相同等一类提问词进行检索 并自动用OR连接各词的检出结果 避免文献的漏检和逐词键入的麻烦 提高查全率 常用的截词符号有 截词检索 分类按是否采用截词符号分为 采用截词符号 不用截词符号 按截断位置的不同分为 右截词 左截词 中间截词 按截断的字符数量的不同分为 无限截词 有限截词 邻近检索 邻近检索 ProximitySearching 是用来表示检索词与检索词之间位置关系的检索技术 通常用位置算符来实现 采用的位置算符有near with near 表示检索词位置相邻 检索词出现的顺序可前可后 如geneNEARapoptosis with 表示检索词位置相邻 且两词出现的顺序与输入顺序一致 如liverWITHcancer 限定检索 限定检索 limitSearching 又称限定字段检索 limitFieldSearching 是利用检索词出现的字段进行的检索 用户可以指定检索某一字段或某几个字段以使检索结果更为准确 减少误检 检索系统的限定检索会采用缩写形式的字段标识符 如TI表示Title AD表示Address 扩展检索 扩展检索 ExpandSearching 是同时对多个相关检索词执行逻辑或检索的技术 即当用户输入一个检索词后 系统不仅能检出该检索词的文献 还能检出与该检索词同属于一个概念的同义词或下位词的文献 如PubMed中主题词的扩展检索 加权检索 加权检索 weighingsearching 不仅检索提问词是否存在 而且计算提问词的权值 当权值之和超过阈值的记录才能在数据库中被检出来 在某些数据库中表现为仅检索主要概念主题词 如MEDLINE 而有些数据库表现为词频检索 如中国学术期刊全文数据库 精确检索和模糊检索 精确检索 ExactSearching 是指所检信息与输入的词组完全一致的匹配检索技术 在许多系统中用引号来表示 如检索 AcutePancreatitis 模糊检索 FuzzySearching 允许所检信息与检索提问之间存在一定的差异 如检索AcutePancreatitis 可检索出AcutenecrotizingPancreatitis AcutegallstonePancreatitis等 跨库检索 跨库检索 Crossdatabasesearching One stopsearching 是一次对多个数据库同时进行检索的技术 跨库检索能为用户提供统一的检索接口 将用户检索需求转化为不同数据库的检索表达式 并发地检索本地和广域网上的多个分布式异构数据库 并对检索结果加以整合 以统一的格式将结果呈现给用户 跨库检索 相关信息反馈检索 相关信息反馈检索 是将与已检结果存在某种程度相关的信息检索出来的检索技术 多由检索系统自动进行检索 如Google 的 类似网页 PubMed的 RelatedArticles 相关信息反馈检索 智能检索 自动实现检索词 检索词对应主题词及该主题词所含下位词的同步检索 如中国生物医学文献服务系统 SinoMed 的智能检索 PubMed的 自动词语匹配检索 属于智能检索 二 多媒体信息检索技术 基于内容的检索基于内容的检索 ContentBasedRetrieval CBR 主要是对多媒体对象的语义 媒体的视觉特征或听觉特征进行检索 基于内容的图像检索基于内容的图像检索 ContentBasedImageRetrieval CBIR 使用了可以直接从图像中获得的客观的视觉内容特征 如颜色 纹理 形状等来判断图像之间的相似性 基于内容的图像检索 现有图像检索技术研究的主流 与传统数据库技术相结合 可以方便地实现海量多媒体数据的存储和管理 与传统Web搜索引擎技术相结合 可以用来检索html网页中丰富的多媒体信息 还可以广泛应用在多媒体数据库 知识产权保护 数字图书馆 网络多媒体搜索引擎 交互电视 艺术收藏和博物馆管理 遥感和地球资源管理等许多领域中 三 可视化信息检索技术 信息可视化 Informationvisualization 是将抽象数据用可视的形式表示出来 以利于分析数据 发现规律和决策制定 可实现对信息数据的分析和提取 以图形 图像 虚拟现实等易为人们所认识 可视的方式 展示数据间的复杂关系 潜在信息和发展趋势 以便更好地掌握和利用信息资源 可视化检索 可视化检索 VisualRetrieval 是信息可视化的一种 是指把文献信息 用户提问 各类情报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形 在一个二维或三维的可视化空间中显示出来 可视化检索的特点 检索过程透明化检索结果输出高效性更为有效的检索结果排序机制有效的用户反馈机制 第一章文献信息检索基础 第四节文献信息检索策略 一 文献信息检索途径 检索途径为检索系统的检索入口 即检索系统所提供的 用以查询获取资源的各种标识 在计算机检索系统中通常表现为字段检索 主题词检索 主题词检索途径 是利用主题词 SubjectHeadings 作为检索入口来查找文献 主题词是经过优选和规范化处理的词汇 由主题词表来控制 目前支持主题词途径的检索系统主要有 CBMDisc和PubMed 自由词检索 通过从文献篇名 正文或文摘中抽取出来的能表达文献主要内容的单词或词组查找文献的检索途径 自由词途径 灵活 自由 直观 符合用户习惯 为目前检索系统中应用最为广泛的一种检索途径 但自由词因未经规范化处理 检索时必须同时考虑到与检索词相关的同义词 近义词等 容易造成漏检 分类检索 分类检索途径是利用文献在分类体系中的位置 类目名称或分类号 作为检索入口查找文献的途径 可满足用户从学科 专业等内容出发获取文献的需要 例如 CBMDisc提供的分类途径 即以文献在 中国图书馆分类法 中的分类号作为检索入口来查找文献 引文检索 引文检索途径 是利用引文 citation 即文章末尾所附参考文献 这一特征作为检索入口查找文献的途径 许多检索工具提供的引文检索途径允许以引文中出现的任何信息 如作者 题名 出处 等作为检索入口 如WebofScience的CitedReferenceSearch 引文检索 缺省检索 缺省检索是指自动在脊索系统预先设定的多个字段中同时进行检索 例如 在CBMDisc的基本检索界面直接输入检索词 系统默认在缺省字段中进行检索即同时在中文题名 关键词 主题词 文摘 刊名 特征词等字段进行检索 其它途径 著者检索利用文献上署名的作者 编者或机关团体名称作为检索入口查找文献的途径 题名检索利用题名 Title 如书名 刊名 篇名等 作为检索入口查找文献的途径 序号检索机构检索 二 文献信息检索策略 检索策略的含义广义的检索策略是指用户根据检索需求选择相应的数据库 确定检索方式 检索途径及相应检索表达式进行检索的一系列操作或方案 是用户检索目标的体现 狭义的检索策略仅指用户确定检索表达式进行检索的系列操作 检索策略的构建 1 分析研究课题 明确检索要求 分析课题要解决的问题 即它所包含的概念和具体要求及它们之间的关系 是制定检索策略的根本出发点 也是检索效率高低或成败的关键 分析课题的主题内容确定课题的文献类型确定检索时间范围分析用户的检索评价要求 检索策略的构建 2 选择检索系统 确定检索方法 根据检索课题的要求 选择最能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国甲鱼项目创业计划书
- 中国激光光纤光缆传输项目创业计划书
- 中国烤烟育种项目创业计划书
- 中国酒类电商平台项目创业计划书
- 中国牛养殖项目创业计划书
- 中国高端大米项目创业计划书
- 中国电子商务物联网应用项目创业计划书
- 安全教育试题题库及答案
- 乐理初级试题及答案
- 2025年度供货协议 精密仪器配套产品订购合同
- 麻醉科PDCA持续改进麻醉术后镇痛
- 火字旁教学讲解课件
- 租车公司疫情防控应急预案
- 2023-2025年初中学业水平考试体育与健康考试体育中考理论考试题库
- 补缴社保转移需法律文书(社保法律文书怎么写有效)-靓文网
- SMT失效模式分析PFMEA
- 融媒体中心安全播出管理相关各项制度
- JJF 1105-2018触针式表面粗糙度测量仪校准规范
- GB/T 29602-2013固体饮料
- 建筑工程招标控制价编制说明审
- GB/T 12469-1990焊接质量保证钢熔化焊接头的要求和缺陷分级
评论
0/150
提交评论