文献数据库检索与利用.ppt_第1页
文献数据库检索与利用.ppt_第2页
文献数据库检索与利用.ppt_第3页
文献数据库检索与利用.ppt_第4页
文献数据库检索与利用.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文献数据库检索与利用 数据库系列讲座 课程纲要 第1章文献数据库概述 本章内容1 文献数据库概念及构成2 文献数据库种类3 文献数据库功能 提供的检索方式 4 信息检索语言5 信息检索技术 第1章文献数据库概述 1 文献数据库概念及构成文献数据库就是在计算机存储设备上按一定方式储存的文献数据集合 是检索系统的信息源 也是用户检索的对象 文献数据库的构成文档 记录 字段 第1章文献数据库概述 记录是构成数据库文档的基本单元 一个数据库往往由几十万条甚至几千万条记录组成 在期刊论文数据库中 每条记录就是指每篇期刊论文 在图书全文数据库中 每条记录就是指每一本完整的图书 字段是构成记录的最小单元 一条记录包括若干个字段如 篇名字段 著者字段 关键词字段 文献出处 作者机构 摘要 出版时间 分类号等等 第1章文献数据库概述 2 文献数据库种类按语种划分 中文数据库 外文 区别于中文的其它语种 数据库按收录文献类型划分 图书数据库 期刊数据库 报纸数据库 学位论文数据库 会议论文数据库 专利数据库 标准数据库 多媒体数据库 工具书数据库等按所收文献提供完整程度划分 文摘 索引数据库 参考数据库 全文数据库 事实数据库 第1章文献数据库概述 参考数据库指包含各种数据 信息或知识的原始来源和属性的数据库 数据库中的记录是通过对数据 信息或知识的再加工和过滤如编目 索引 文摘等形成的 一般来说 参考数据库主要是针对印刷型出版物而开发的 目的是指引用户能够快速 全面地鉴别和找到相关信息 参考数据库主要包括 书目数据库 文摘 索引数据库 第1章文献数据库概述 参考数据库最重要的用途是用于搜集文献线索 快速和全面地查询某个学科 领域或主题的文献信息 其次 参考数据库还常常被用来进行统计和评估工作 如著名的三大索引数据库就常被一些高校或科研院所选用作为统计个人论文成果 机构科研水平等的评价工具 常用的参考数据库 ISIWebofKnowledge SCI INSPEC BIOSISPreviews ISIProceedings CAPQDD博硕论文文摘数据库CSSCI等 第1章文献数据库概述 全文数据库收录有原始文献全文的数据库 如国内著名的全文数据库有超星数字图书馆 APABI电子图书 CNKI中国期刊全文数据库 重庆维普的中文科技期刊数据库 国外有ProQuest系统 EBSCOhost系统 以及ElsevierScience IEEE IET系统 SpringerLink等等 第1章文献数据库概述 全文数据库的特点 直接性 即用户可以直接检索出原始文献 学术性 实用性较强 以期刊论文 会议论文 政府出版物 研究报告 法律条文和案例 商业信息等为主 检索功能完善 基于互联网的检索系统 一般都具备简单检索 复杂检索 二次检索 浏览 索引等多种检索功能 并提供多个检索入口 提供检索结果的多种处理方式 可以浏览并标记记录 以打印 存盘 E MAIL发送等方式输出 第1章文献数据库概述 事实数据库指包含大量数据 事实 直接提供原始资料的数据库 又分为数值数据库 事实型数据库 数值型型数据库 以数值为主要内容的数据库 如ChinaInfoBank 贝尔斯坦 盖墨林化学数据库等 事实型数据库 直接提供可用的事实为目的 事实既可以是既有数字又有文字的统计资料 也可以是纯文字的知识资料或信息资料 也可以是一篇叙述性文献 如公司名录 百科知识数据库 网络词典 人物传记数据库等 第1章文献数据库概述 事实和数值数据库的作用就是提供对特定的事实或数据的检索与利用 直接面向问题以特定的事实或数字回答用户的查询 事实和数值型数据库的主要特点 检索速度快 范围广 针对性强 检索结果往往只是单元的值 一组数据或某一个事实 第1章文献数据库概述 3 数据库 检索系统 的功能指数据库 检索系统 在检索界面上提供给用户的基本功能 它与系统的检索技术是紧密结合的 比较通用的检索功能有浏览 索引 简单检索 复杂检索 二次检索 或进阶检索 命令检索等 第1章文献数据库概述 1 浏览 Browse 由系统提供一个树状结构的概念等级体系 分层次按其属性及相互从属关系对知识进行并行或树状排列 逐级展开到最小知识单元 第1章文献数据库概述 第1章文献数据库概述 2 索引 Index 索引是一个线性表单 可以将任何一个标引字段中的概念按字母顺序不分级地线性排列起来 索引的种类很多 如人名索引 出版物索引 地名索引 主题索引 机构索引 分子式索引等 第1章文献数据库概述 第1章文献数据库概述 3 简单检索 SimpleSearch BasicSearch QuickSearch 即为用户提供一个简单的检索界面 帮助非专业或初入门用户方便地提交检索式 第1章文献数据库概述 4 复杂检索 AdvancedSearch GuidedSearch ExpertSearch 为专业用户 资深用户提供比较复杂的检索界面 可以构造比较细致的检索式 帮助用户进行精确检索 第1章文献数据库概述 5 二次检索 进阶检索 在检索结果内进一步检索 使结果更精炼 准确 第1章文献数据库概述 4 信息检索语言检索语言 是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言 是为了沟通文献标引与文献检索而编制的人工语言 检索语言的作用 检索语言的主要作用就是对文献的外部特征和内容进行多层次描述 提供多种检索途径 以方便用户从不同角度检索查找文献 获得较高的查全率和查准率 第1章文献数据库概述 检索语言的类型 检索语言的类型 自然语言 人工语言 题名文摘责任者关键词引文全文 分类法 主题法 第1章文献数据库概述 分类检索语言按学科范畴及知识之间的关系列出类目 并用数字 字母符号对类目进行标识的一种语言体系 也称分类法 分类语言类目之间具有上下隶属 同位并列的概念等级体系 例 中国图书馆分类法美国国会图书馆分类法杜威十进位分类法IPC国际专利分类表 第1章文献数据库概述 中图法 分类语言举例 中图法 按学科体系 划分为二十二个大类 每个大类都用一个英文字母表示 如下所示 A马克思主义 列宁主义 毛泽东思想 邓小平理论B哲学宗教C社会科学总论D政治法律E军事F经济G文化科学教育体育H语言文字I文学J艺术 第1章文献数据库概述 中图法 分类语言举例K历史地理N自然科学总论O数理科学化学P天文学地球科学Q生物科学R医药卫生S农业科学T工业技术U交通运输V航空航天X环境科学劳动保护Z综合性图书 第1章文献数据库概述 中图法 分类语言举例Q生物科学Q1普通生物学Q2细胞生物学Q21细胞的形成与演化Q23细胞遗传学Q24细胞形态学Q25细胞生理学Q26细胞生物化学Q27细胞生物物理学Q3遗传学Q4生理学Q5生物化学 第1章文献数据库概述 主题检索语言由主题词汇构成 即将自然语言中的名词术语经过规范化后直接作为标识 按字母顺序排列 通过参照系统揭示主题概念之间的关系 也称主题法 主题检索语言常用的是叙词语言 descriptor 主题检索语言一般都有主题词表或叙词表 以下为EBSCO ASP 中的主题词表 第1章文献数据库概述 第1章文献数据库概述 自然语言自然语言是直接从文献信息本身抽取的 用于揭示信息内容的自由词 主要依赖于计算机自动抽词技术 包括关键词语言 题名 责任者 摘要 引文 全文等等 其中 关键词直接从信息资源名称 正文或文摘中抽出的代表信息主要内容的重要语词 第1章文献数据库概述 5 信息检索技术布尔逻辑检索截词检索字段限制检索位置算符检索短语检索嵌套检索 第1章文献数据库概述 3 1布尔逻辑检索 booleanoperator 布尔逻辑检索是采用布尔代数中的逻辑 与 逻辑 或 逻辑 非 等算符 对检索词进行组配 表达概念间的逻辑关系 限定检索词在记录中必须存在的条件或不能出现的条件 凡符合布尔逻辑所规定的条件的文献 即为命中文献 第1章文献数据库概述 布尔逻辑运算符 1 逻辑 或 OR2 逻辑 与 AND3 逻辑 非 NOT 第1章文献数据库概述 1 逻辑 或 用符号 or 或 表示 其逻辑表达式为 AorB或A B其意义为检索记录中凡含有检索词A或检索词B 或同时含有检索词A和B的 均为命中文献 如 subprimecrisisorfinancecrisis 第1章文献数据库概述 2 逻辑 与 用符号 and 或 表示 其逻辑表达式为 A B或AandB其意义为检索记录中必须同时含有检索词A和B的文献 才算命中文献 第1章文献数据库概述 3 逻辑 非 用符号 not 或 其逻辑表达式为 AnotB或A B其意义为 检索记录中含有检索词A 但不能含有检索词B的文献 才算命中文献 第1章文献数据库概述 检索实例 1 检索有关克隆人立法方面的文章 humancloning ANDlegislat 2 检索文昌鱼遗传多样性方面的文献 文昌鱼OR头索动物 AND 遗传多样性OR基因ORDNA 如百度 文昌鱼 头索动物 遗传多样性 基因 DNA 3 检索生物基因工程技术方面的报道而排除生物基因工程公司方面的信息 生物基因工程技术 NOT公司或 生物基因工程技术 公司一般为NOT最先执行 AND其次进行 OR最后执行 但是可以用括号改变他们之间的运算顺序 例如 AORC ANDB 第1章文献数据库概述 截词检索 truncationsearch 截词检索是指在检索标识中保留相同的部分 用截词符代替可变化的部分 截词检索有时也称为通配符 wildcard 检索 一般情况下 代替任意一个或多个字符 代表一个字符 截词检索类型截词方式根据截词的位置不同 分为前截断 后截断 中截断 根据截断的数量不同 分为有限截断和无限截断 注 截词检索在不同的计算机检索系统中规定不同 第1章文献数据库概述 截词检索类型1根据截断的数量不同 分为有限截断和无限截断 无限截断 不限制被截断的字符数量 例如输入educat 可以检索出 educatoreducatorseducated educating education educational 等等 有限截断 限制被截断的字符数量 例如输入educat 表示被截断的字符只有两个 可以检索educator educated两个词 第1章文献数据库概述 截词检索的类型2根据截词的位置不同 分为前截断 后截断 中间截断 前截断是将截词符号置放在一个字符串左方 是后方一致检索 如 在网站中 ology可检索出 geologysociologypsychologyarchaeologybiology 等等词汇 又如 查找 library可查找到不同应用领域图书馆方面的短语 第1章文献数据库概述 截词检索的类型2后截断是最常用的截词检索技术 它是将截词符放在一串字符的右面 如 Comput 可检出词汇computecomputercomputingcomputabilitycomputablecomputationcomputational 如 system 可检出词汇systemsystemssystemic 第1章文献数据库概述 截词检索的类型2中间截断又称为中间屏蔽 是一种用截词符屏蔽词中不同字符的方法 例如 wom nwomanwomen defen edefencedefense 第1章文献数据库概述 有些检索系统不支持使用截词符的截词检索技术 系统默认的是词根检索 即输入一个词 系统会自动检索出同一词根的一组词 例如输入gene 可以检索出gene genic genome等 这是一种智能检索方式 但要求系统内必须预先配置词根表 IEE IEEE全文数据库默认词根检索有些数据库需要加入词根运算符如 才进行词根检索 第1章文献数据库概述 字段限定检索 FieldLimitedSearch 字段限制检索即指定检索词出现的字段 被指定的字段也称检索入口 检索时 系统只对指定字段进行匹配运算 提高了效率和查准率 在西文数据库中 字段检索有时是用代码来表示 数据库不同 字段名称和代码也有所不同 范例 ABdigitallibraryANDTImetadataANDAUWiley EBSCO数据库 在网络数据库中 字段名称通常放置在下拉菜单中 用户只需要选择就可以了 第1章文献数据库概述 尽管网上信息检索不分字段 但大多数网络工具 搜索引擎都具有类似于字段限定检索功能 依此功能 可以将检索范围限定在特定的范围中 文献类型的限定检索词filetype ppt docpdfxlsswf 范例保护生物学filetype ppt关键词出现的位置限定如 intitle检索词范例保护生物学intitle 研究所把搜索范围限定在某个站点中 提高查询效率 范例姚明site 把搜索范围限定在url链接中 inurl网页url中的某些信息 常常有某种有价值的含义 因此对搜索结果的url做某种限定 就可以获得良好的效果 范例photoshopinurl jiqiao 第1章文献数据库概述 位置算符检索 positionoperatorssearch 又称邻近检索 proximitysearch 即运用位置算符表示两个检索词间的位置邻近关系 这种检索技术通常只出现在西文数据库中 在全文检索中应用较多 如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话 位置算符表示的是两个概念在信息中的物理位置关系 第1章文献数据库概述 W With表示在此算符两侧的检索词必须按此前后的顺序排列 顺序不许颠倒 而且两个检索词之间不许有其它的词或字母 但允许有空格或标点符号 例如 information W retrieval可检索出informationretrieval或information retrieval Wn nWords表示在此算符两侧的检索词之间允许插入n个实词或虚词 两个检索词的词序不许颠倒 例如 electronic W1 resources可检索出electronicresource或electronicinformationresources 第1章文献数据库概述 N Near由 N 连接的检索词在记录中出现的顺序可以调换 即查找两个连在一起的单词 但两词之间不能插入任何词 有的系统用ADJ adjacent 表示 例如 Junior N high可检索出juniorhighhighjunior Nn nNear Nn 表示两个词位置可以颠倒 两个词之间插入词的最多数目是n个 例如 information 3N retrieval可检索出 informationretrieval或retrievalinformation或retrievalofinformation或retrievaloflawinformation或retrievalofChineselawinformation 第1章文献数据库概述 F Field F 表示在此运算符两侧的检索词必须同时出现在文献记录的同一字段内 如出现在篇名字段 文摘字段 叙词字段 关键词字段 但两个词的前后顺序不限 夹在两个词之间的词的个数也不限 S Subfield S 表示在此运算符两侧的检索词只要出现在文献记录的同一个子字段内 例如在文摘中的一个句子就是一个子字段 此文献即被命中 两个词词序不限 且两个词中间可间隔若干个词 第1章文献数据库概述 第1章文献数据库概述 第1章文献数据库概述 嵌套检索 优先检索nestingsearch 很多数据库在default条件下 逻辑运算的优先级次序是not and or 如果要改变优先级次序 则要使用括号将优先检索的检索式括起来 系统会首先检索括号中的概念 如 在 digitalORelectronic ANDinformationresource 这个检索式中 系统会首先检索 digitalORelectronic 然后再将结果与informationresource 匹配 第1章文献数据库概述 短语检索 phrasesearch 也称为词组检索 或字符串检索 它是将一个词组或短语用双引号 括起作为一个独立运算单元 进行严格匹配 以提高检索准确度的一种方法 如 用 GeorgeW Washington 另外 杂志名或专有名称使用短语检索可获得比较精确的检索结果 如 图书馆学报 第1章文献数据库概述 在实际检索中 往往将上述多种检索技术混合使用 如要查找标题中含有 网络营销 的资料 可以运用布尔逻辑运算符AND OR和截词检索 并将检索结果限制在题名字段 例 TIWebORTIInternetORTIWWW ANDTImarket 小结 第1章文献数据库概述 数据库检索时应注意的几

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论