版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、外文发现系统find+与summon对比分析随着我校电子资源建设工作的不断开展,图书馆拥有的各类引进和自建数字资源日益增多。但是,目前图书馆的数字资源的检索系统相对分散、复杂,数据库利用情况并不理想。为了对数字资源进行整合,帮助师生简单、高效地对数字资源进行检索和获取,充分利用我校购买的数据库,并发现更多有价值的资源,我校拟购买发现平台。以下为国内外影响力较大、系统相对成熟、目前大陆高校使用较多的两个外文发现系统find+(eds本土化产品)和summon的对比分析。1.系统介绍find+发现系统:ebsco公司在2010年1月推出eds系统,find+知识发现平台是由美国ebsco公司和南京
2、大学数图实验室联合研发,利用eds平台授权提供的国外出版商合法元数据的外文多语种搜索技术,结合本地化服务功能,搭建的资源发现系统,是eds平台的中国本土化产品。summon发现系统:summon是proquest旗下的serial solution公司于2009年7月推出的国际上第一款网络级资源发现系统。summon利用授权提供的国外出版商合法元数据,将不同来源的学术资源和摘要集中索引成一个索引数据库,并提供开放的api数据接口供其他系统调用。find+和summon均集成hathitrust资源。hathitrust成立于2008年10月,是由美国结构合作委员会图书馆联盟和加州大学图书馆联盟
3、共同创建的数字仓储项目,该项目将成员馆所收藏的印刷性文献进行数字化并同意保存,从而建立共享的数字仓储。截至目前,共用1334万多册,46亿多页,其中500多万册是oa资源。2.对比高校find+:武汉大学,网址:/summon:西安交通大学,网址:/3.资源种类find+包含的资源种类有:新闻、杂志、学术期刊、书籍专著、评论文章、会议资料、报告、电子资源、传记、音频、专题及学术论文、非印刷资源、原始文档、乐谱、电子书籍、视频、有声读物。summon包含的资源种类有:专利、
4、乐谱、书籍/电子书、书籍章节、书评、人工制品、会议录、光盘、出版物、出版物文章、参考文献、口语音乐唱片、商业出版物、商业出版物文章、图书馆馆藏、图像、地图、学位论文、小册子、市场研究、手稿、技术报告、抄本、报告、报纸、报纸文章、政府文献、数据库、数据集、文章、期刊/电子期刊、期刊文章、杂志、标准、档案材料、活页乐谱、海报、演示文稿、照片、特藏、电子资源、简讯、绘图、缩微材料、缩微胶卷、网络资源、艺术、视频记录、计算机文件、论文、诗歌、音乐录音、音乐记录等。从资源种类看,summon发现相较于find+资源种类更加丰富,数据来源更加广泛。4. 检索方式summon提供便捷的学术资源“一站式”检索
5、服务,检索方便快捷。快速检索全面揭示馆藏,包括图书馆馆藏目录、电子期刊数据库、电子书数据库、图书馆数字特藏资源以及oa资源等。find+在进行快速检索时首先需要对检索范围限定是“电子资源”还是“馆藏资源”,不能同时对所有资源进行检索,降低了检索效率。5.检索资源量find+系统覆盖全球9万多家期刊和图书出版社的资源总量达到15.5亿条,学术期刊超过17.7万,全文资源近7千万,学术资源的语言种类有近200种,非英语的出版社资源超过3000家,中文资源总量达到近2亿条,期刊论文篇目数据达到8000万,书目信息资源800万,电子书资源300万;图书超过1200万种。find+已于维普、apabi签
6、约,典型中文库95%覆盖。summon包括超过10,000出版商的内容,包含150,000种期刊、20多亿条数据、100多种资源类型,元数据每天更新。独享资源包括pqdt、csa、ebrary等。同时summon与calis达成协议,可利用56万篇学术论文;且分别与重庆维普、apabi达成相关数据使用协议,实现cnki检索90%,万方98%,维普100%覆盖。5.1 空检结果find+、summon两个发现系统均支持空检。find+:875,804,632个结果。(其中,46.16%的内容为新闻,20.73%的内容为杂志,15.96%内容为学术期刊。期刊量为139,774,066篇,学位论文的
7、数量为1,325,184篇。)summon:1,296,372,812个结果。(其中,59.89%的内容为报纸,15.74%的内容为期刊文章。期刊量为776,351,779篇,学位论文的数量为10,214,848篇。)从空检结果数据上看,summon在空检资源总量、期刊量、学位论文数量上都远高于find+数据库。find+内容的70%是新闻和杂志。5.2 关键字检索考虑到我校是一所综合性院校,根据我校学科设置特点,分别从科技和人文社科选择当今社会热点词汇对find+和summon的检索结果进行分析比较。中文检索词选取“3d打印”以及“群众路线”两个关键词,英文检索词选择“hadoop”、“gr
8、aphene”以及“economic”三个关键词,检索结果分别如表1和表2所示。表1. find+和summon对于中文检索词的检索结果检索词发现系统搜索结果期刊学位论文会议论文图书杂志政府文献3d打印find+1,209 1,207 0 0 2 0 summon1,922 1,582 0 0 13 325 2 群众路线find+25,666 25,453 11 40 162 0 summon83,013 72,190 113 0 123 5,393 5,148 summon与calis达成协议,可利用56万篇学术论文;且分别与重庆维普、apabi达成相关数据使用协议,实现cnki检索90%,
9、万方98%,维普100%覆盖。find+已于维普、apabi签约,典型中文库95%覆盖。从表1检索结果中发现,对于中文检索词,summon具有更好的发现能力,搜索的总量和期刊量均远远高于find+检索量。表2. find+和summon对于英文检索词的检索结果检索词发现系统搜索结果期刊学位论文会议论文图书杂志新闻/报纸hadoopfind+56,605 3,383 36 2,926 1,578 6,866 22,185 summon43,080 7,833 800 5,888 1,618 1,852 18,798 graphenefind+297,670 141,941 181 7,318 1
10、1,598 44,762 40,270 summon317,730 133,983 13,425 6,316 34,729 3,915 60,340 economicfind+100,993,195 11,268,374 39,242 469,797 6,751,579 11,476,312 34,478,637 summon81,284,179 14,166,054 983,562 326,793 3,491,862 9,157,133 42,703,834 从表2检索结果中发现,对于英文检索词,summon在对热点词汇的发现能力上高于find+。由于summon属于proquest旗下产品
11、,独享proquest学位论文版权,虽然find+可通过联邦检索获得部分proquest数据,但是数据量较少且准确度不高。因此,在学位论文数量上summon较find+有较大优势。6.元数据来源summon系统的元数据来源是从内容提供商处获取,所有签约出版商的列表、覆盖的期刊、数据库的内容公开透明,元数据的质量高。同时对元数据进行统一格式清洗。find+系统将已与出版社签约的元数据收录在eds仓储中实现元数据检索;对于“图书馆馆藏”可采用导入eds元数据仓实现元数据检索以及联邦检索两种方式;对于不提供元数据的少部分出版社以及事实型数据通过联邦检索或插件实现整合。7.检索精度find+系统将不同
12、来源的同一资源分多条显示,造成检索结果中存在大量重复数据(见图1所示)。相比之下,summon数据库中对于数据库商和集成商的资源只出现一次,对不同来源以360link的不同链接展示,避免了重复数据的产生。图1. find+发现系统中检索出现的重复数据8.检索方式与检索结果分类两种外文发现系统均支持基本检索、二次检索、高级检索,find+系统还支持精确检索。发现系统对发现的结果进行分类,其中find+对于所有的资源类型显示相同的分面,而summon针对资源种类的不同显示不同的分面,更具有针对性。9. 检索结果相关度排序summon的排序规则是动态排名和静态排名相结合,动态排名的依据是词语的出现频
13、率、字段权重、术语词干等;静态排名的依据是文献类型、出版日期、本地资源、被引用次数等。find+是eds的本土化系统,它依据主题词表及内容提供商提供的原始内容(如题名、关键词等),排序遵循主题词为主要权重的相关度排序。summon针对所有的记录采用单一、统一的标引,对所有的记录采用了相同的相关性排序算法,且summon排序不倾向于任何内容出版商。而find+检索结果排序时更倾向于优先显示同一公司旗下ebsco host数据。因此,summon发现结果的相关度排序结果更准确。10. 检索速度find+采用联邦检索模式,即向多个数据库同时进行检索,将各库返回结果进行相似度排序后呈现。summon完
14、全依靠联合索引来实现资源揭示,不需要联邦搜索的支持,是全部基于元数据和全文数据的仓储。通过采用单一和统一的标引体系的联合索引方式,summon可以明显增强资源可定制、资源完整性以及稳定可靠性,提升检索速度。因此从检索效率上看,summon发现系统要明显优于find+系统。11. 服务模式summon的服务模式是saas模式,即完全的托管方式,图书馆不需要安装任何软件,只需要将各个系统之间的接口配置好就能使用。find+的服务模式为混合模式,图书馆需要在本地服务器安装系统,对本地馆藏opac数据、本馆机构仓储、特藏书籍等进行索引、管理并提供检索。saas模式的优势是整个系统的部署、配置和调试可以
15、在短时间内完成,图书馆无需在软件以及专业技术人员方面进行投入,省去了图书馆的重复建设、加强共享。对于本馆特藏资源,图书馆可以自己决定是否对其他summon用户公开,可保证特藏资源的安全性。12. 移动客户端服务find+每一项检索结果中包含“手机二维码”功能,可因通过扫描二维码在手机客户端访问。summon支持移动客户端,可在手机、pad上使用,且移动客户端的检索量与电脑用户端的检索量同步。13. opac链接find+能够对接opac、机构一卡通或读者身份认证系统。summon通过插件、网页抓取可以实现与opac的对接。14. 后台统计分析功能find+和summon均提供详尽的后台统计分析
16、报告,深层次地检索用户行为,从多种角度,通过饼图、柱状图、趋势图等多种方式呈现出用户与发现服务之间的交互行为,评估图书馆对发现系统的使用情况。15. 我国高校使用情况从国内高校用户数看,find+在国内拥有的985高校用户8所,211高校用户18所。summon目前在中国大陆用户33所,其中包括985高校13所,211高校16所从国外高校使用情况看,find+的用户有美国麻省理工学院、美国芝加哥大学、美国佐治亚理工学院、澳大利亚墨尔本大学、美国北卡罗来纳州大学、英国爱丁堡大学、英国利物浦大学、日本大阪大学等。summon的用户有美国哥伦比亚大学、耶鲁大学、美国普林斯顿大学、美国米歇尔大学、美国
17、康奈尔大学、美国休斯敦大学、英国剑桥大学、国立新加坡大学、日本东京大学等。从国内使用情况看,find+在211用户数比summon用户数略多,但是整体用户数和985高校用户数都不及summon。*小结summon提供便捷的“一站式”检索服务,发现系统资源种类繁多,且在期刊数量和学位论文数量上较find+具有较大优势,更能满足我校师生对资源检索的需求。同时,summon元数据质量高,检索采用的联合索引方式较find+的联邦检索方式在检索速度、检索精度以及检索结果相关性排序的准确性上有很大提升,summon采用的saas模式无需在软件以及专业技术人员方面进行投入,安装便捷。此外,summon提供移
18、动客户端服务以及后台统计分析报告。summon在我国大陆高校用户数以及985院校用户数都要高于find+。总体来看,结合我校院系设置以及师生的检索需求,从对发现系统性能以及检索结果准确度上进行分析的结果看,建议我校采购summon发现平台。附件1. find+与summon功能对比表 产品 模块eds(find+)summon数据总量875,804,6321,296,372,812期刊数据量139,774,066776,351,779学位论文数据量1,325,84810,214,848资源种类17种100种左右快速检索方式需首先限定检索资源范围一站式检索中文检索词检索量较少。find+已于维普、apabi签约,典型中文库95%覆盖。检索量较大。summon与calis达成协议,可利用56万篇学术论文;且分别与重庆维普、apabi达成相关数据使用协议,实现cnki检索90%,万方98%,维普100%覆盖。英文检索词期刊、学位论文数量少期刊、学位论文数量大(独享proquest版权)元数据来源部分没有版权,质量略低全部从内容提供商获得版权,质量高检索精度较低,存在重复数据较高检索类型快速检索、二次检索、高级检索快速检索、二次检索、高级检索、精确检索检索方法联邦检索联合索引检索结果分类所有资源类型显示相同分面按照资源类型不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 审计日志档案管理制度
- 审计机关自收自支制度
- 审计流水双向核查制度
- 审计统计工作制度
- 审计联席会议制度实施细则
- 2025-2026学年甜甜的世界教案
- 2023东台护士考编面试冷门考点题库及应对答案
- 2026内蒙人事考试行测高频错题集附纠错答案解析
- 2020江苏建筑安全员C1证考试高频考点速刷题库及配套答案
- 滑雪五级2026年理论考试冷门考点习题及标准答案
- 预毕业证明模板 (2025年)
- 2025年辽宁卷历史高考试卷(原卷+答案)
- 2025年大兴机场准入考试题库
- 2025年税务局上海面试题及答案
- 二方审核管理办法
- 工厂能耗管理办法
- 2025年城市燃气项目立项申请报告模板
- 北京政务云管理办法
- 残疾等级评定培训课件
- 瑜伽康复墙培训课件
- 学堂在线 雨课堂 学堂云 工程伦理2.0 章节测试答案
评论
0/150
提交评论