




已阅读5页,还剩86页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
管理资料 三个中文医学数字图书馆功能客观评价初探 的回复 医药事业部孟红胜2006 8 5 目录 前言第一部分期刊库比较第二部分其他主要数据库比较第三部分给用户的总结 前言 2006年2月 辽宁的张秉哲先生撰写了 三个中文医学数字图书馆功能客观评价初探 下面简称 初探 一文 该文章实际上没有做到 客观评价 而是歪曲或者掩盖事实 得出的结论明显偏向于清华同方 而且对我们万方数据极端不利 张先生在文中写到 本文所涉及的问题既复杂又敏感 虽然笔者决心站在客观 公平 公正的立场来进行比较和评论 但由于本人能力所限 所提出的观点难免有片面性 甚至是错误的 诚恳地欢迎批评指正 更希望广大有识之士来讨论这个话题 只有比较才能更好的鉴别 我相信这样的客观评价 对我国数字图书馆事业的完善和快速健康发展是有促进作用的 从这里我们可以猜测 张先生的本意是好的 希望通过他的客观初探来促进我国医药信息内容服务产业的发展 实际的情况是 几年来由于竞争 万方数据 清华同方以及重庆维普在各自的医药信息产品上都做了很大的改进来更好满足医药用户的需求 从而使我国医药信息内容服务产业出现欣欣向荣的发展势头 这对广大用户来说也是一大福音 因为产品多了 服务更到位了 价格更便宜了 用户有更多的选择余地和能得到更多的实惠 从 初探 一文内容来看 我们不否认张先生下了一番工夫来研究 很多地方也列举了实际的例子 我们仅想与张先生探讨 既然是站在 客观 公平 公正的立场来进行比较和评论 那么我们就要以严谨的学术态度 真正做到这些原则 然后再得出 客户的选择 也不迟 我们下文的分析将展示张先生的分析并不很全面 客观 公平 公正 得出的结论也未必正确 而清华同方的营销人员拿着张先生的这篇文章 在自己的CHKD推广会上和客户中到处散发 显然有掩盖部分实际真相 误导用户之嫌 这是我们要指出的 同时 我们与张先生通过电话 张先生明确告诉我们该文只是他个人的学术探讨 并没有与清华同方有任何关系 也并不同意清华同方将他的文章及其中的个人观点用于商业推广目的 如无特殊说明 下文的检索验证时间为2006年5月29日 由于此时万方医药信息系统新版还未推出 因此主要以旧版进行比对 这也与张先生的比对版本一致 第一部分期刊库比较 一 期刊查全率比较二 检索的查准率三 关于精确检索与模糊检索四 中文期刊库的其他比较五 外文生物医学期刊库比较六 期刊库小结 一 期刊查全率比较 可以说张先生列出的该部分内容基本上是对的 我们在2006年5月23日进行验证时 基本上符合客观事实 而检查的结果记录多数是有所增加或一致 有所增加可以理解 张先生写作此文时的落款时间是2006年2月 到2006年5月 这3个月时间里各家将以前没有收齐的刊 期 补充上 数据量相应增加是理所当然的 但有疑问的地方是 同方的 篇名 糖尿病 的检索记录数由文中的33684篇变为33217篇 篇名 消渴病 的检索记录数由文中的165篇变为163篇 我们的检索时间比张先生的在后面 检索内容和控制项不变 检索结果反而变少了 说明张先生当时的检索结果不正确 还是同方的后台资源不稳定 抑或因为版权等问题将一些期刊撤下了 这我们就不得而知了 精确检索同方CHKD1998年 2005年篇名中含 30 的文献 得出的记录数为0 但我们从他们的文献记录中找到篇名中含 30 的期刊文献 也就是说CHKD在此处漏检了 查全率较低 虽然在实际使用中这么查询的意义并不太大 但作为三家知名的全文库之一 对外也一直宣称查全率高的系统 CHKD在这方面恐怕解释不通 而万方数据是不存在这一问题的 CHKD如下 查出的结果为0条记录 而这是不可能的 因为我们在查 颈椎病 的期刊文献时 CHKD里有这样的期刊文献 如下截图 再看万方数据医药信息系统 出来的检索结果为10220条记录 类似例子 在同方CHKD中精确检索1998年 2005年篇名中含西腊字母 的文献 得出的记录数为0 这同样也是不正确的 查全率降低 说明CHKD系统检索功能有缺陷 而万方数据不存在这一问题 CHKD如下 结果为0条记录 看万方数据医药信息系统 查出的结果为 CHKD专业词组相关的漏检 检索 小梁切除 与 小梁切除术 CHKD 1998 2005年 篇名字段 精确检索 在正常检索中 篇名 小梁切除 的文献命中数应大于或者等于 小梁切除术 而在清华同方CHKD系统中 检索结果恰恰相反 检索篇名 小梁切除 命中200条 而检索篇名 小梁切除术 却命中803条 即一个词组与该词组的一部分检索结果没有包含性关联 而在万方数据医药信息系统中同样检索 小梁切除 命中767条 小梁切除术 命中604条 万方数据检索结果用户更容易接受 三家期刊全文库期刊收集年代不同 万方数据收集的开始年代最晚 从1998年开始收集 所以万方数据的医药期刊文献的总记录数最少 万方数据期刊收集原则是先从核心刊收起 然后再兼顾普通医药期刊 这与另两家有所不同 由于万方数据持续的努力 万方数据收集的医药期刊数稳步增长 国内5大权威中文生物医学期刊数据库文献收录比较研究 报告中指出万方数据医药信息系统在国内三家中文全文期刊数据库中 现刊收齐率最高 70 52 核心期刊收齐率也最高 93 24 摘自解放军医学图书馆原馆长杜云祥研究员领导的研究小组在2005年5月份研究的课题 由于核心刊的收集难度比起普通刊要大 所以万方数据早期的医药期刊文献会少一些 但随着年代的推移 最近年代的文献记录数就相应逐步多起来 有的甚至超过了清华同方CHKD 如下图例子 我们来比对 2005年的关键词含 纤维蛋白原 的期刊文献 在CHKD中 检索结果如下 检出234条记录 看万方数据医药信息系统 检索出的结果如下 检出235条记录 中华医学会是国内医学领域最高学会组织 其出版的中华医学系列期刊久负盛名 他们挑选合作伙伴的时候非常严格 他们的医学网站 中华医学网 就由我们万方数据提供技术支持 该网上的中华医学期刊是我们为其电子化的 上面有我们万方数据的LOGO 足见中华医学会对我们万方数据的认可 也足以证明我们万方数据的实力 对于期刊中的每期目录 万方数据对有些不重要的消息一类的报道 如书讯等 则不予收录 这也是造成万方记录数相对较少的原因之一 但从另一角度来说 万方数据的这种数据加工原则可以提高检索时的查准率 期刊查全率比较小结 以上分析可以看出 在中文期刊文献的查全率方面 同方CHKD和万方数据医药信息系统各有所长 也各有不足 这与两家收录的期刊不完全一样有关 也与各家系统的检索功能设计有关 由图书情报学理论中的文献半衰期知识我们知道 现有的三家全文期刊库 在文献的收录年代和期刊数量上都可以满足一般用户的学习和使用要求 如果进行查全率要求极高的科研立项查新 则现有的三家全文数据库年代及期刊收录数均显不足 需要查询中国医学科学院医学信息研究所的CBMDISC或者解放军医学图书馆的CMCC 他们的文摘库收录更全 二 检索的查准率 张先生的 初探 文章在这方面没有做比较 但既然没有做比较就得出最后所谓的 用户的选择 中的结论 就显得不那么严谨和有说服力 1 CHKD 1998 2005年 全文字段 检索 小梁切除 模糊检索 出来的结果为 在上述检索中 检索 小梁切除 却出来了 性传播疾病 这篇文献 下载后查阅也没有发现与 小梁切除 有关的内容 很明显此处查出了无用的多余信息 降低了检索的查准率 CHKD这样的全文检索和模糊检索就没有多少实际意义了 2 按照张先生的 初探 文中解释 同方的精确检索概念是 检索词整体在检索项如篇名中出现 就能找到 那我们来看下面的例子 请大家看第4条记录 干扰素也有副作用 则完全是属于多检出来的 降低了CHKD精确检索的查准率 检索的查准率小结 从上文分析我们可以看到 同方CHKD的中文期刊文献查准率相比于万方数据医药信息系统是较低的 上文已经谈到 由于万方数据的收刊原则和期刊文献加工原则 以及万方数据的检索系统设计 万方数据医药信息系统的期刊文献查准率还是很高的 三 关于精确检索与模糊检索 张先生在 初探 文中写到 同方的精确检索概念是 检索词整体在检索项如篇名中出现 就能找到 其模糊检索的概念是 只要检索词中的成分在检索项中出现 就能找到 维普与万方的模糊检索的概念与同方的精确检索的概念完全相同 维普与万方的精确检索概念是检索词整体与检索项如篇名完全相同 才能找到 例如 检索项为篇名 检索词为糖尿病 论文的篇名必须是 糖尿病 才能找到 如果篇名为 二型糖尿病的中药治疗 就不能找到 实际上 只要我们细加比较同方与万方的检索概念 就会发现张先生的分析并不全对 以下是我们的分析 万方数据的检索系统中 模糊检索的概念是 只要检索词整体是检索项中的一部分或者全部 则该条记录就作为检索结果出现 精确检索的概念是 检索词整体必须是检索项中的全部 与检索项完全一致 则该条记录才会在检索结果中出现 系统默认的是 模糊检索 需要进行精确检索时 只需要在检索词前后加上双引号即可 默认的模糊检索中如作者字段输入 王旭 则检索结果中 有关名叫 王旭X 的作者的文章记录也会出现 这符合医生群体的日常思维习惯 比如有时候只记住了名字中的前两个字 就可以用模糊检索来检索 如要精确检索名叫王旭的作者的文献 则在检索框中输入 王旭 出来的结果就很精确 如果需要精确检索篇名为 糖尿病学 的文献 选择万方数据的精确检索方式 出来的结果很准确 清华同方的模糊检索的概念是 该检索词的成分要在检索项中出现 但这些成分可以不相连 实际上 大多数时候这样做的意义很小 因为一般来说 输入的词的概念本身就很明确了 如我们想检索糖尿病学的相关文献 用CHKD的模糊检索出现的结果如下 现在在CHKD期刊全文数据库中 题名 字段模糊匹配检索 干扰素 如下图 出来的检索结果为 请看检索结果的第三条和第四条 题名中没有 的记录也出现了 按照行业内的常规理解 CHKD模糊检索时输入的检索词都要在选定的字段出现 只是该检索词中的字可以不连续出现 如果只是检索词中的部分在所选字段中出现就检索出来 那就更没有什么实际意义了 查准率将极差 清华同方的精确检索的概念是 在篇名等检索项时 检索词整体作为检索项中的一部分或者全部出现 则这条记录就出现在检索结果中 实际上这样的精确检索概念与一般用户的理解还是有所不同的 在CHKD中 如我们想精确检索篇名为 糖尿病学 的文献 则出来的结果如下 出来的记录中有部分就不是用户预想中要的了 用户预想中的文献篇名就是 糖尿病学 而不是含有 糖尿病学 的 第13次全国中青年医学 糖尿病学 学术交流会 等文献了 CHKD在作者检索中 精确检索则为检索词整体必须是检索项的全部 这样的记录才出现在检索结果中 如要精确检索作者为 王旭 的文献 则出来的记录中就不会出现 王旭X 等人的文献 评价 同样是CHKD的精确检索 不同的检索字段的实际概念却不一样 这在专业人士看来应该觉得有所欠缺 也与张先生分析的不一样 张先生没有确切搞明白三家的特点 就加以分析显得不是很严谨 四 中文期刊库的其他比较 1 期刊检索项的确如张先生所言 同方检索项较多 维普与万方少一些 但常用检索项三者都有 也就是说 都基本够用 2 期刊库的文献链接 同方 维普的比万方的要多一些 同方CHKD可能出现的 相关文献链接 较多 但实际上 很多链接项意义不大 如相关研究机构 相关文献作者 相关期刊 读者推荐文章等 有的相关研究机构根本不起作用 见下图的 相关研究机构 中的江苏南京 相关期刊 读者推荐文章等在很多文摘记录中根本就没有 张先生在文章中也提到 酮症起病的糖尿病 相关文献链接 同方查出 相似文献 近两千条 维普查出 主题相关 文献两万7千多条 其中大部分是与该文章主题无关的 这样庞大的 相似文献 连接与 主题相关 连接对读者究竟能有多大帮助 可见CHKD不少链接功能华而不实 再看CHKD的机构链接 上图例子 点击机构字段的 南京中医药大学 弹出的新窗口如上图说示 点击 知识元数据库 出来的结果如下 既然没有此词条 实际上只能说明CHKD多增加的 知识元数据库 还很不完善 同样看CHKD中上述 中西医结合提高恶性肿瘤患者生活质量的研究进展 这篇文献 机构中标注了 江苏南京 且与 南京中医药大学 江苏省南京市鼓楼医院 并列排放 令人很是费解 它是机构还是地方 印刷版的期刊文献里作者单位 机构 肯定不是这样表示的 在此举这样的例子并不是想刻意贬低CHKD 而是表明实际上CHKD的数据加工和功能上也有不少的缺陷 只是他们自己不会去披露 用户一般也不会自己去研究 真正用起来时才觉得有问题 万方数据医药信息系统新版于2006年6月中旬推出 在新版中 也实现 关键词 的著录链接和 本文引用的文献 的链接 公司的知识链接产品版本 而且 新版中的作者和关键词的链接功能 Hotlink 热链服务 比CHKD的要强大得多 不仅对期刊数据库有所链接 而且对系统中的学位论文数据库 会议论文数据库等也有所链接 这对用户的实际使用作用就很大了 见下图 中西医结合疗法 的热链示意 万方数据认为 相关链接不在于多而要在于实用 实用是检验这方面的最好标准 3 检索控制项 同方和维普比万方数据多一些 万方数据医药信息系统在6月份新版中也将实现 每页显示 记录数的控制 万方数据在开发医药信息系统时 一个总的开发原则就是简单易用 因为一般的用户 医生 护士等 并没有受过专业的数据库和检索培训 也没有那么多时间花在这方面的学习上 万方数据的系统设计 无论是页面还是功能 都秉承简单适用原则 不求技术先进和表现复杂 而追求普通用户使用后容易上手的效果 对于广大医生和专业人士普遍的新需求 要求 万方数据也会积极听取 吸收后加入医药系统的改进中 万方数据医药信息系统新版于2006年6月下旬推出 大家可以从中发现一些新的设计 五 外文生物医学期刊库比较 张先生在 初探 文中写到 同方自己没有建立外文医学期刊库 但在网站首页设立了 国外医学期刊网 Medline资源检索 国外医学全文文献 等11个类目 提供了大量优秀外文医学专业网站链接 查找题录一般都是免费的 其中部分网站查看或下载文献全文也是免费的 同方建立了11个分类栏目的外文医学专业网站链接 每个栏目都收集了一些国外著名的相同种类文献检索网站 外文医学文献数据库建立较早 种类齐全 许多网站还允许免费下载全文 维普重要中文医学全文库只有期刊库 外文期刊库是摘要库 题录与文摘都是英文的 对万方数据可以提供的外文产品却没有明确说明 对此 万方数据的分析如下 外文期刊文献的价值大家都知道 我们在此不必细说 在三家外文期刊库或指南方面 清华同方建立了网上资源指南 这对广大医药用户有一定的作用 但是大家都知道 互联网上绝大部分参考价值大的医学期刊内容都是要收费的 而且价格不菲 一般的国内用户无法承受 免费的期刊一方面参考价值相对较小 另一方面 可查阅的内容的滞后性也很大 几个月到一 两年不等 另外 一个个简单的链接到相应的网址的指南 用户查找起所需要的文献来还是很麻烦的 重庆维普有外文期刊摘要库 但只是摘要 作者要获得全文是比较麻烦 万方数据则不同 万方数据已经于2005年底推出了两个新产品 外文生物医学文献数据库 和 跨平台全文库检索系统 国外医学资源整合服务系统 国外医学资源整合服务系统中文界面 国外医学资源整合服务系统英文界面 六 期刊库小结 目前万方数据已经实现了中外文期刊资源一体化服务 可以提供全方位的期刊资源解决方案 同方和维普都还实现不了 目前万方数据的中文医药全文期刊已经为三家医药期刊全文服务商中现刊最多 核心期刊最多 外文期刊库除了与国家科技图书文献中心合作的外文生物医学文献数据库 还有我公司最新开发的国外医学资源整合服务系统 万方数据的外文医学期刊资源优势是远胜于国内其他同行的 第二部分其他主要数据库比较 一 其他主要数据库概况 二 会议论文全文数据库检索功能比较 1 精确检索分类号为R4的会议文献 出来的结果为空 这是不可思意义的 模糊检索分类号为R4的会议文献 出来的结果仍旧为空 说明同方CHKD的会议论文检索功能有缺陷和问题 再看万方数据医药信息系统 出来的结果如下 也就是说 万方数据的医药系统会议论文库检索没有问题 对于镜像用户 我们的会议论文全文数据是装给客户端服务器上的 2 精确检索CHKD会议论文库主题词 肿瘤 出来的一页结果中 其序号9084的文献 下肢截肢后不良残肢的临床分析和处理 序号9086的文献 腕尺管综合症1例报告 摘要 序号9087的文献 脊髓损伤并发症处理与康复对策 的文摘的主题词字段中均可以找到肿瘤相关的标引词 但这些文献均与 肿瘤 关联不密切 说明主题词检索造成查准率降低 3 CHKD会议论文全文库文摘字段中 有的记录有关键词和主题词两个字段 有的记录则只有主题词字段 作为会议论文 一般都会对作者有提交关键词的要求 而CHKD中部分会议论文文献没有关键词字段 会造成查准率降低 特别是在文献记录总数很大的时候 前面已经说过 主题词检索可以提高查全率 但有时候会降低查准率 下条记录只有主题词字段而无关键词字段 万方数据的字段为关键词 可以得到很好的查准率 从以上分析可以看出 同方CHKD的医药会议论文全文数据库在检索功能及其查准率方面有所欠缺 而万方数据医药信息系统中还没有发现同类问题 另一方面 在会议论文数据库中 万方数据实现了分类号的知识链接 CH
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宁夏教育数学试卷
- 淘宝店铺直播活动策划方案(3篇)
- 河道栏杆基础施工方案(3篇)
- 澳门废气处理施工方案(3篇)
- 临时保安考试题库及答案
- 北京市门头沟区2023-2024学年八年级下学期第一次月考语文考点及答案
- 安徽省宿州市灵璧县2024-2025学年高一上学期期末考试历史试卷及答案
- 放鞭炮初一作文700字14篇
- 客户服务热线接听规范及问题解决流程模板
- 时政知识培训方案策划课件
- GB/T 45607-2025船舶与海上技术船舶系泊和拖带设备系泊导缆孔底座
- 外墙高空蜘蛛人作业施工方案
- 新常态下的中国消费-麦肯锡
- 酒店楼层分租协议书
- 血液肿瘤科知识培训课件
- 网络安全产品代理销售合同
- 单位对个人教育教学情况定性综合分析
- 《2025年CSCO HR阳性晚期乳腺癌治疗指南》解读
- 广播工程系统施工方案
- 新能源汽车概论 课件 5.1新能源汽车高压安全与防护
- 浙江省温州市鹿城区2025年小升初总复习数学测试卷含解析
评论
0/150
提交评论