中国历代典籍总目分析系统介绍_第1页
中国历代典籍总目分析系统介绍_第2页
中国历代典籍总目分析系统介绍_第3页
中国历代典籍总目分析系统介绍_第4页
中国历代典籍总目分析系统介绍_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国历代典籍总目分析系统(HBCC v1.0)产品说明中国国际图书贸易集团有限公司北京大学数据分析研究中心北京欣诺格科技有限公司2010年8月设计理念和定位1、产品设计理念“中国历代典籍总目分析系统”是由国家图书馆出版社出资建设、国家图书馆古籍馆和北京大学数据分析研究中心强强联合,历时两年研制的大型古籍文献目录知识服务系统,其设计理念是基于知识本体构建综合性古籍文献知识库。国家图书馆和北京大学相关专家在对知识本体和国际图书馆协会联合会书目记录的功能需求标准展开深入研究的基础上,首次在文献领域采用实体关系分层描述古籍书目并构建古籍文献知识本体。按照古籍文献知识本体结构和时代分布情况,“中国历代典

2、籍总目”综合分析存世文献著录数据和历史文献著录数据,避免了同类系统只针对存世文献进行检索分析的缺点,为实现“辨章学术,考镜源流”的目标奠定了基础。2、产品定位“中国历代典籍总目分析系统”全面汇总中国历代书目,全方位展现华夏五千年文明成果,堪称当代“历史艺文志”,也是全球首个“华夏历史e文志”。目前,本产品形成了包含总计240万条古籍文献书目信息的综合性古籍文献知识库,是全球收录最广、数据最全的权威汉籍目录数据库。并且,在古籍文献知识库的支持下,“中国历代典籍总目”除实现了基本的目录检索功能外,还能够通过在古籍文献中分析责任者、责任时间、责任行为、版本特征,以及装帧特征等多种维度的相关性,进一步

3、揭示数据背后隐藏的丰富知识。是目前世界上具有划时代意义的古籍文献目录知识服务系统。3、应用领域为普通读者提供基础文献知识服务,是古籍数字图书馆的重要组成部分;为专业研究人员提供深层知识挖掘和知识重组等高级服务;为全国古籍普查工作提供业务工具,提高普查工作效率;为文化事业和商业经济提供有效的知识咨询服务。产品简介数据来源该系统数据内容详细,数据关系完整,囊括了各类经典的汉籍目录,并且还在不断的扩充中。目录包括史志目录、官修目录、私藏目录、知见目录、公藏目录、专科目录、丛书目录、珍贵古籍名录等。书目内容包含品种信息、版本信息、印次信息和藏本信息等,每一条书目数据都处在由这些信息组成的多维知识数据空

4、间中。功能特点:“中国历代典籍总目分析系统”拥有强大的全文检索和高级检索功能。除支持繁简通检外,还支持以书名、书目范围、书目分类、书目层级、版本类型、版本时代、责任者、责任行为为条件,进行全文范围的书目信息检索。“中国历代典籍总目分析系统”与其它系统的显著区别在于其具有强大的多维分析功能,其中最主要的多维分析功能之一即责任者相关性多维分析。同一书目著录的责任者之间通常具有很复杂的社会关系,在品种、版本、印次和藏本层次上,通过对这些责任者著录信息进行定量分析可以获得较多的学术传承、交游往来甚至姻亲关系的知识。同时,在海量数据的基础上,“中国历代典籍总目”还可以对书籍的成书年代、品种、藏地等进行多

5、维分析,以获得定量的学术发展和研究重点的历史分布情况。产品功能介绍1、采用自然语言处理技术抽取古籍书目信息本系统采用自然语言处理技术,先由计算机完成目录原数据的自动标注和切分,并在此基础上完成信息抽取工作和数据语义规范;然后,计算机通过专家知识自动分析结果中的问题,并以“纵向校对”方式组织数据提交人工审校。经过反复自动分析和人工校对,有效保证数据的质量。截止2009年10月,共对27部目录书进行处理,完成近210万条书目数据的处理。 图:中国历代典籍总目书目信息表格页面(局部)2、基于语义的数据检索为提高古籍书目检索的准确率和召回率(查全率),在数据处理语义规范的基础上,本系统实现了书名条件的

6、语义检索。此外,为解决古籍分类法体系种类繁多、内容结构复杂、现代人难于掌握的难题,本系统完成了各种古籍分类法语义映射建设,实现了分类扩展检索功能。图:高级检索页面 3、实现专家知识固化与共享系统首先根据专家知识,按照书目文献的知识体系结构,从不同知识维度组织数据,提供多种导航功能;在此之上,系统提供了检索方法保存共享机制,为进一步方便专家知识的共享与传播提供了保障,使该系统成为不仅是专家学者的学术研究工具,而且也是文献书目等专业的教育教学平台。4、古籍文献责任者相关性分析古籍目录中的责任者信息是研究责任者之间学术和社会关系的重要线索。系统以书目数据著录为桥梁建立了责任者之间的联系。在对责任行为

7、分类的基础上,分组研究责任者间的学术和社会关系。图:责任者相关性分析结果如图,以罗振玉为例,系统通过多维分析,发现他与王国维关系度极高,通过进一步研究发现,其关系多为互校、互序等,显示出他们是学术水平相当的师友关系。5、古籍文献成书年代分布统计分析本系统能够通过按层次描述古籍文献本体,自动统计分析古籍文献成书年代;通过同类文献的年代分布情况,可以进一步考察学术的发展沿革情况,首次实现了人工无法高质量完成的统计分析任务。以经部易类文献分析为例:如图,在汉代至晋代、南北朝以及唐宋元明清时期,有关易学的文献较多,因而从文献计量学的角度印证了学术史的发展脉络。6、古籍书目层次聚类分析图:本草纲目相关书

8、籍的品种聚类分析结果本系统参照国际图联FRBR标准,在基于层次的古籍文献本体上完成品种、版本、印次、藏本聚类分析,建立各层次内部以及之间的关系,对于学术发展和书籍史的研究具有重要的作用。通过比对不同学术研究文献品种的版本数量,可以分析学术的发展状况。同时,古籍书目层次聚类分析为文献辑佚提供了重要的数据源线索。7、古汉语知识支持,实现简繁通检本系统采用了北京大学数据分析研究中心的最新研究成果汉字本体知识库,拥有四字节汉字多媒体显示以及四字节汉字全文检索引擎功能,直接支持七万余汉字的检索和分析。8、用户交流平台与研习平台为增强用户体验,提高用户交流水准,本系统为用户提供了可选的评论交流模组。用户可

9、以通过该功能交流阅读知识、评价书目信息。此外还提供了书目收藏夹。用户可以保存对自己有用的书目信息。在二期建设中,本系统将完成全部历史上的书目及全球馆藏古籍书目、国家古籍保护计划新著录的书目的入库工作;将建设完善的“中国古籍文献本体”,使之与北京大学研发的“历史人物本体库”“时间本体”“地名本体”“职官本体”和“机构本体”融合为一体,形成中国古代文化史研究的神经网络,为现代图书馆从检索服务向咨询服务的转型提供保障;实现“超越原数据”的知识服务,实现“知识主动推送”服务,实现“多学科自动整合”知识服务。系统配置1、服务器中央处理器:Intel Celeron Dual-Core 2.4GHz(或以

10、上)内存:2GB DDR3(或以上)硬盘:200GB(或以上)网络带宽:1Mbps(或以上)操作系统:Windows 2003(或以上)Java运行环境:JDK1.6(或以上)数据库运行环境:MySQL 5.0(或以上)2、客户机中央处理器:Intel Celeron 2GHz(或以上)内存:512MB DDR2(或以上)网络带宽:512Kbps(或以上)显示器分辨率:1024×768(或以上)操作系统:Windows XP(或以上)/ Windows 2003(或以上)、 浏览器:IE 6.0(或以上)/ FireFox 3.5(或以上),须开启 Javascript 功能字体库:Sun-ExtA、Sun-ExtB、宋体-方正超大字

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论