




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
国内三大中文期刊全文数据库的比较研究国内三大中文期刊全文数据库的比较研究 建议新手查阅建议新手查阅 中国期刊网全文数据库 维普中文科技期刊数据库 和 万方数据库资源系统数字 化期刊 是国内影响力和利用率很高的综合性中文电子期刊全文数据库 这三个数据库已 经成为大多数高等院校 公共图书馆和科研机构文献信息保障系统的重要组成部分 在互 联网中 这三大数据库也成为中文学术信息的重要代表 体现了我国现有的中文电子文献 数据库的建设水平 笔者结合工作和学习中的实践 就上述三大数据库的收录情况 检索功能 检索结果 检 索界面 用户服务等方面进行全面的比较 并通过检索实践举例进行比较分析 以供参考 1 收录情况 数据较早 甚至不是 2004 年的数据 感觉更像 2002 年左右的数据 后面将 尽可能给出最新的数据值 1 1 收录范围与数量 中国期刊网全文数据库 本文中简称 清华 是由清华同方光盘股份有限公司 光盘 国家工程研究中心和中国学术期刊 光盘版 电子杂志社共同研制出版的综合性全文数据库 该数据库收录自从 1994 年来公开出版发行的 6600 余种国内核心期刊和一些具有专业特色 的中英文期刊全文 累积全文文献 618 万多篇 题录 1500 万余条 按学科分为理工 A 数 理科学 理工 B 化学化工能源与材料 理工 C 工业技术 农业 医药卫生 文史哲 经济政 治与法律 教育与社会科学 电子技术与信息科学九大类 126 个专题文献数据库 中文科技期刊数据库 本文中简称 维普 由科技部西南信息中心主办 重庆维普资 讯有限公司制作 其前身为 中文科技期刊篇名数据库 该数据库收录了自 1989 年以 来国内出版发行的 12000 种期刊 其中全文收录 8000 余种 按学科分为经济管理 教育 科学 图书情报 自然科学 农业科学 医药卫生 工程技术等 7 大类 27 个专辑 200 个专题 按 中图法 编制了树型分类导航和刊名导航系统 基本覆盖了国内公开出版的 具有学术价值的期刊 同时还收录了中国港台地区出版的 108 种学术期刊 积累 700 余万 篇全文文献 数据量以每年 100 万篇的速度递增 万方数据资源系统数字化期刊 本文中简称 万方 是万方数据库资源系统三大组成 部分之一 由中国科技信息研究所属下的北京万方数据股份有限公司创办 万方期刊收录 了我国自然科学的大量期刊以及社会科学的部分期刊 范围包括基础科学 医药卫生 农 业科学 工业技术 人文科学等 5 大类 以及英文版期刊 中国科学系列杂志 共 2500 多种期刊 1 2 期刊收录情况 通过对三个期刊数据库收录情况进行统计分析 得到以下结果 1 2 1 根据 中文核心期刊要目总览 2004 年版 统计 我国核心期刊共 1800 种 由这 三个数据库收录的期刊统计结果显示 清华 收录核心期刊 1391 种 维普 收录 1490 种 万方 收录 1300 种核心期刊 从绝对数量来看 三者的核心期刊收录量相差 不大 但从以上三大数据库核心期刊收录量分别占期刊总数的百分比来看 分别为 21 08 清华 18 63 维普 和 52 万方 万方 数据库占有绝对优势 1 2 2 文史哲类期刊收录情况 维普 收录了 5 种 占此类期刊总量的 0 055 清华 收录了 451 种 占此类期刊总量的 4 995 而 万方 收录了 500 种 占此类期刊总量的 5 5 说明 维普 在收录文史哲类期刊中所占比例很低 也比较符合它 中文科技期刊 数据库 的名称 1 2 3 医药卫生类期刊收录情况 维普 收录 1153 种 占此类期刊总量的 12 77 清华 收录 809 种 占此类期刊总数的 8 96 万方 收录 588 种 占此类 期刊总数的 6 51 农业类期刊 维普 收录 756 种 占此类期刊总数的 8 37 清华 收录 531 种 占此类期刊总数的 5 869 万方 收录了 246 种 占此类期刊总数的 2 72 另外 在自然科学与工业技术 教育与社会科学 政 治经济与法律等类目中 维普 的收录量都是排名第一 1 2 4 通过比较 清华 和 维普 收录期刊名录 得知两数据库期刊收录重复率约为 50 说明两数据库互补性很强 相互不可替代 而 万方 收录期刊与这两个数据库的 重复率较高 在 80 以上 从上述分析看 这三个数据库基本覆盖了科学技术和社会科学的各个领域 其中 维普 期刊的收藏量占有绝对优势 几乎覆盖了中国出版的所有中文期刊 并且收录了大量内部 发行期刊 收录的年限最长 其中收录自然科学和工程技术方面的期刊量比 清华 多出 近 50 但在文史哲类方面则几乎是空白 因此 维普 适合用户进行科技文献的回溯 性检索 清华 重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊 综 合性上做得较好 而 万方 收录期刊数量为三者中最少 但核心期刊比率很高 收录文 献的质量最高 2 检索功能 2 1 检索入口比较 通过对三个数据库的使用 检索及测试 笔者得出以下结论 1 三个全文数据库都配备了强大的检索系统 提供了导航检索 简单检索和复合检索等 三种检索方式 其中导航检索都包括了学科分类导航和期刊名称导航两项功能 读者不需 要输入具体的检索词 就可按照分类或期刊名称 通过层层递进的方式 检索到某一专题 下的论文 并按题录链接浏览全文 检索方法简单易学 数据库检索选择范围灵活 可以 选择一个或多个专辑进行检索 在同一专辑下 可选择一个或多个专题进行检索 2 三个数据库都提供了关键词 篇名 刊名 作者 机构 文摘等 6 个的检索入口 同 时根据各自系统的特点 清华 的检索入口最多 还提供了引文 基金 全文 ISSN 主题词 年 期等 7 个特有的检索入口 维普 则提供了第一作者 分类号 任意字段 等 3 个特有的检索入口 而 万方 没有提供其他检索入口 3 通过 清华 的 全文检索 和 维普 的 任意字段检索 在对相同检索词进行 检索时发现 前者的命中率较高 在一定程度上弥补了主题标引缺乏规范化所带来的漏查 有利于提高文献的查全率 但往往检出的文献太多 用户难以挑选到合适的文章 该检索 方式对于检索前沿性课题文献信息或文献量较少的冷门课题较为适用 而后者 维普 的 任意字段检索 是在文章中除正文以外的其他任何部分进行检索 检出率虽然低于 全文检索 但相对比较实用 2 2 检索策略比较 2 2 1 简单检索 清华 和 万方 的简单检索只有一个检索框 不支持同时输入多个运算符 就是说一 次只能输入一个检索词 而 维普 的简单检索支持同一检索框内同时输入多个运算符组 配的词 2 2 2 高级检索 清华 有四个检索框 提供多个检索项目进行逻辑组合检索 有检索结果排序方式和检 索年限设定和专辑的选择 万方 提供有两个检索框 提供多个检索项目进行逻辑组合 检索 可以限定检索内容的大类和检索期刊的所在地区 维普 提供四个检索框 可以 实现检索条件的组配 还可以限定检索期刊范围 提供了检索年限的设定 2 3 检索特殊功能比较 2 3 1 清华 在每个检索入口提供了检索词字典 通过使用它可以规范所输入的检索词 有利于更全更准地检索文献信息 2 3 2 维普 在主题标引用词的基础上 编制了同义词库 有助于相关文献的检索 提 高文献的查全率 而在进行作者字段检索时 可以通过调用同名作者库实现作者单位的限 定 提高查准率 另外进行了期刊类型的划分 分为全部期刊 重要期刊和核心期刊 使 检索可根据需要灵活选择 同时 维普 还提供了中图法分类号的检索功能 对于关键词 不规范的学科和领域 通过分类号检索 能提高某一学科文献的查准率 2 3 3 万方数据资源系统数字化期刊 在检索时 可以对期刊所分布的地域进行限定 但笔者认为这一功能实用性不强 3 检索结果 3 1 检索效果的比较 对于三大数据库 在设定相同检索条件的情况下 检索入口和检索限定一致 分别选择 题名 关键词 著者 和 分类 等四个检索入口进行检索 得出的结果见表 1 表 1 检索结果数量统计表 原表见 通过检索返回数量统计表中的数据分析 可以得出这三种数据库的自身特点 收录的范围 和学科类别的情况 比如通过著者字段的检索 张安将教授是从事化学研究的 他所发表的论文是科技方面的 在上表中 清华 收录了 16 篇 万方 收录了 5 篇 而 维普 收录了 24 篇 张靖龙 教授是从事文学研究的 在上表中 清华 收录了 9 篇 万方 收录了 0 篇 维普 收录了 1 篇 从这个对比中可以看出 三个数据库中综合性最强的是 清华 收录理工 科科技信息文献最多的是 维普 3 2 全文浏览的比较 三个数据库中的文献都可以浏览原版的图像全文 也可以用文献浏览器上提供的 OCR 识别 系统进行文字识别处理文献 其中 清华 的全文要用 CAJ 全文浏览器或 Acrobat Reader 浏览器 维普 的全文需要用 VIP 浏览器打开 已改为 Acrobat Reader 浏览器 而 万方 使用 Acrobat Reader 浏览器打开 有些文献可以在 IE 中直接打开 单从数字化水平来说 笔者认为 万方 的数字化技术在三者中是最好的 它所用的是全 球通用的 PDF 格式全文 方便交流 从打开的页面上看 制作得也比较精细 其他两个所 用的是自己公司生产的浏览器 文献页面存在一定的缺陷 特别是 维普 的全文甚至出 现手写文字 当然数据库数字化的水平也在不断进步中 比如 清华 也推出了 PDF 的 下载方式 自身的 CAJ 浏览器也在不断完善 维普 页面数字化水平也在不断提高 同 时从最新的信息来看 维普 也将推出 PDF 格式的全文 可以说未来的趋势就是三大全 文数据库都会提供通用的 PDF 格式的全文 并最终过渡到统一的格式 3 3 显示 排序与去重功能比较 清华 的检索结果是按照主题的相关度和文献的日期排序输出 可以设定每页显示文献 的数量 维普 的检索结果是按照时间的倒序排列 同时间段按期刊顺序排列 用户不用翻页就 可以浏览最新的文献 万方 在初次检索时不能设定检索结果显示的顺序 但在二次检索中可以设定是通过 升序 或 降序 排列 数据库的去重功能做得都不够好 有待于进一步完善技术 不是很理解这句话的意思 倒是希望有进一步分析 3 4 文摘结果显示比较 通过文献的文摘就可以了解一篇文章的基本情况 而不用浏览全文 这样科研人员就可以 通过浏览文摘了解是不是自己找的文章 可以节约大量的时间 清华 的文摘显示内容有 篇名 作者 刊名 机构 引用链接 被引用链接 聚类检 索 摘要 光盘号 维普 的文摘显示内容有 标题 刊名 作者 关键词和摘要 万方 的文摘显示内容有 光盘号 题名 作者 机构 刊名 ISSN 号 CN 号 藏号 关键词 分类号和摘要 三个数据库中文摘做得最好的是 清华 不仅可以从中获得文献的基本情况 而且能通 过超级链接的方式 找到更多与查找主题相关的内容 4 界面友好性 一个数据库的特点和优越性可通过它的检索界面表达出来的 界面友好 使用简单的数据 库可以很快地让读者接受 读者也能比较容易地从海量文献中检索出自己要找的文献信息 反之 一个数据库收录了很多优秀的文献信息 数字化水平也很高 但是检索界面比较复 杂 缺乏人性化 这样就会使数据库的使用大打折扣 清华 配备了功能强大的网络数据库全文检索系统 从它的检索界面中可以看出 该数 据库检索方法简单 灵活 即使不具有专业检索知识的用户也很容易掌握 维普 通过分类和导航实现文献的浏览 还能通过初级和高级检索进行检索 页面之间 衔接的比较清楚 从单个页面上看 也一目了然 万方 通过多种途径检索文献 但是页面过于复杂 繁琐 很难让初次接触的读者顺利 地检索到文献 或达到很高的查准率和查全率 同时在页面的组织 导航的实现上也有待 完善 但是和外文全文数据库相比 国内这三大数据库都没有开发相应的个性化检索功能 智能 服务程度不高 不能不说是一个遗憾 5 用户服务 在服务方式上 三个数据库都提供了检索服务卡 光盘 局域网等检索方式 同时还提供 了建立镜象站点 包库 流量计费等服务方式 从订购价格上看 维普 最为便宜 且使用和维护比较方便 万方 则价格相对较高 从用户角度上看 在选择数据库时可根据本单位具体特点及需求进行选择 对大型综合性 图书馆 在经费许可的前提下 可考虑购置以上三种全文数据库或根据需要选择相应专辑 进行补充选购 对一些专业性图书馆 可采用购置本专业的光盘 包库 流量计价等方式 来降低费用 对于检索量小的综合性图书馆或单位 可通过建立镜像站点 并控制用户数 这比购买光盘价格更优惠 对个人读者 可考虑购买检索阅读卡 通过互联网进行检索 当从网上获得全文时 从直接下载速度看 清华 和 万方 快于 维普 并且 每 一篇文献都能从题名及题录直接链接到全文进行下载 而 维普 却有许多文献要通过 E mail 方式才能获得 全文型文献数据库的评价全文型文献数据库的评价 标准标准 郁笑春 胡芒谷 内容提要 本文在对全文型文献数据库的新特点进行 阐述的基础上 强调对全文型文献数据库的评价标准 必须坚持科学性 整体性 可行性 动态性和针对性 的原则 定义了评价标准的 4 个要素 即内容 界面 设计 检索功能和可获得性 并展开了详细讨论和分 析 关键词 全文 文献数据库 特点 评价标准 全文型文献数据库是当前图书馆和情报所对外提供文献服务的重要文献资源 具有集成度高 信息量大而全 可获得性强等特点 在国内 万方 维普 清华同方 书生和超星等机构都有自己成熟的全文型文献数据库产品 在国 外 Elisever EBSCO Blackwell 等公司也有各自的全文型文献数据库对外 提供服务 本文拟在阐述当前全文文献数据库新的特点的基础上 对全文型 文献数据库的评价标准进行讨论和分析 1 全文型文献数据库的新特点 全文型文献数据库经过多年的发展和完善 在现阶段呈现了以下新特点 1 强大的检索性能 检索结果处理多样化 全文型文献数据库已不是简单意义上提供关键词检索和外部特征字段检 索并提供全文即完成任务的传统数据库 事实上 随着其检索入口和手段的 不断丰富 各类索引技术 包括基于形态的字索引技术 基于语义的词索引技 术 基于内容的主题索引技术完全匹配的高效串索引技术以及字词混合索引 技术 的开发 全面提高了全文型文献数据库的检索速度 查准率和查全率 检索功能不断加强 如 EBSCO 的图片检索 索引词检索和引文检索 清华同 方期刊全文数据库的引文检索 维普全文数据库的同义词词典等 均大大加 强了全文型文献数据库的检索功能 同时 许多数据库在检索结果的显示方 式上灵活多样 更加人性化 主要表现为 显示记录数的限定 排序方式的 多样化 可按相关度 出版时间 文献标题 著者 来源 语言 出版国等 多种方式升序或降序排列 显示格式的多样化 可提供题录 题录 文摘 全记录或选择字段等多种格式显示 2 类型多 收录文献全 数据库质量高 如 Elsevier 收录的 270 种医学类期刊中 有 171 种被 SCI 收录 20 种被 SSCI 收录 部分期刊从创始年开始收录 回溯检索与印刷型期刊同步发行与 更新 数据标准 规范 多元 都支持 IE Netseape 等通用浏览器 且支持 功能强 数据更新及时 大多为日更新 网络型期刊通常使用 PDF 格式文档 的标准阅读器 Acrobat Reader 等 许多全文型数据库提供了多种形式的链接 用户通过检索不但能看到全文 也为读者提供了其他服务线索 3 用户界面友好方便 易于理解 便于使用 数据库的用户界面设计通常直观清晰 图文并茂 如不同的文献类型用 不同的图形符号表示 数据库往往设有专门的功能帮助键 帮助信息详略适 当 清晰 便于查阅 4 增加了个性化服务内容 任何文献用户都有其特殊的文献需求 越来越多的全文型文献数据库开 始为用户提供强大的个性化服务内容 例如 EBSCO 的 host 文件夹就是一个 强大的个性化服务工具 其功能包括保存结果列表 Resuh List Items 网 络链接保存 Persistent Links to Searches 检索历史保存与定制提醒 savedSearches Search Alerts 期刊提醒 Journal Alerts 资料整理 网页 Web Pages 等 2 全文型文献数据库的评价原则 对于用户和图书情报机构来说 如何选择全文型文献数据库 对于相同 类型的全文型文献数据库如何进行评价和选择 是一个很重要也很现实的问 题 一般来说需遵循以下原则 1 科学性原则 全文型文献数据库既是网络资源 也是科技文献的一种 要求指标的定 义 计算方法等应符合网络资源评价分析和一般文献评价的基本理论 在考 虑应用的同时需要与此相互协调 2 整体性原则 建立数据库评价指标体系是一项系统性的工作 应该使评价指标全面反 映评价对象多方面的主要特性 因此 评价指标体系应体现主客观相结合 定性与定量相结合的特点 整体性原则还要求各指标间相互独立 指标间的 相关性 不仅增加了评价工作量 而且直接影响评价的有效性和可靠性 使 评价结果出现偏向性 因此 在建立指标体系时要考虑各指标反映的信息是 否与其他指标存在重叠 并尽量减少这种相关性 3 可行性原则 评价指标应力求简便 实用 指标涵义明确 数据便于获取 同时 数 据在时间和空间上要具有可比性 4 动态性原则 指标应能够反映系统动态变化的特点 即反映全文型文献数据库内容变 更 软件升级 软件服务变化等动态特性 5 针对性原则 指标体系应该符合读者使用需求的特点 表征全文型文献数据库的指标 很多 如果选取的指标太多 一方面难以突出影响数据库品质的主要因素 另一方面太多的指标也增加了指标间相关的可能性 同时 评价体系以满足 文献用户的一段时间的特定需求为目的 没有必要采用太多的指标 3 全文型文献数据库的评价要素 根据以上评价标准设定的原则 综合分析国内外诸多全文型文献数据库 我们认为 可由内容 界面设计 检索功能和可获得性 4 个要素作为全文型 文献数据库的评价标准 3 1 内容 Content 内容代表了一个数据库的真正价值 内容的质量又可由权威性 覆盖面 和收录时间 3 个方面来体现 1 权威性 Authority 全文型文献数据库的权威性体现在出版者 审查制度和收录文献 3 个方 面 例如 ScienceDirect 是 Elisever 公司出版的全文型文献数据库 该公 司是国际知名的科学和工程技术文献提供商 历史悠久 并且在业内享有很 高的声誉和口碑 用户普遍有认同感 该数据库收录的文献都是特定专业领 域的高质量论文 有非常严格的审查制度 保障了数据库的权威性 2 覆盖范围 Coverage 覆盖范围包含覆盖内容和覆盖时间两个方面的含义 全文型文献数据库 根据覆盖内容和领域分为综合性和专业性两类全文型文献数据库 如 ScienceDirect 是世界上最大的科学 技术和医学文献数据库 而 Emerald 则 是管理学和图书馆学情报学专业类数据库 其建设目标都是给文献用户一个 彻底的全文解决方案 因此数据库覆盖本文原文的广度 提供内容的多少等 是至关重要的 对于时间上的覆盖范围来说 文献数字化的浪潮出现在上世 纪 90 年代末和本世纪初 文献全文数字化程度与其加工能力有很大提高 因 此全文型文献数据库收录文章一般都是从上世纪 90 年代开始的 这也是我们 判断全文型文献数据库好坏的重要依据 3 时间性 Timeline 全文型文献数据库与纸质型文献相比在出版上要滞后一个时间差 这个 时间差如果过长 读者就会转而去查阅纸质型文献或者其他数据库产品 随 着读者需求的进一步提高 许多数据库生产商正在努力减少甚至消除这种时 间差 有的数据库产品与纸质型文献做到了零时差 有的数据库生产商能够 提供预印本期刊全文 有效地消除了时间差 3 2 界面设计 Interface De sign 因为读者对数据的浏览和检索都要通过人机界面来实现 优秀的人机界 面会对用户起到良好的引导作用 而不好的人机界面常常会有误导 出错等 情况产生 因此界面的设计也是评价数据库系统的重要指标 有的数据库系 统界面除了有很多类信息外 还提供了很多使用工具和选择项 但同时也产 生了负面影响 就是界面过于纷乱复杂 而有些数据库界面就比较简洁直观 读者也比较容易上手 类似于搜索引擎的 Google 和 Baidu 因此 特定需求 下的一些功能和界面的设计是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课件密码设置
- 2025年公安基础知识考试试题及答案
- 2025年工会知识竞赛简答题库及答案
- 课件在线学习app
- 无锡政策咨询方案
- 常熟安全管理培训模式课件
- 工业机器人2025年市场风险与挑战应对策略报告
- 2025四川广安市岳池县中小企业服务中心第四次接收见习生3人考试备考试卷【附答案】
- 2024年江西省国有资产监督管理委员会下属事业单位考试真题
- 湖南电力招聘考试真题2024
- 教科版四年级上册科学全册教案
- 水稻螟虫绿色防控
- 2024版2025秋新版小学道德与法治三年级上册全册教案教学设计含反思
- 家电合伙合同(标准版)
- 特种设备(锅炉、压力容器)培训考试试题及答案
- 新版苏教版四年级上册科学(全册教案及教学计划及进度表)
- 国际压力性损伤-溃疡预防和治疗临床指南(2025年版)解读课件
- 慢性乙型肝炎防治指南(2022年版)
- 出售废旧物资证明 出售废料证明 回收证明
- 《色彩基础知识》PPT课件(详解)
- 美术作品的艺术语言
评论
0/150
提交评论