基于cnmarc的frbr化opac系统开发初探

上传人：Q*** IP属地：浙江上传时间：2019-08-03 格式：PDF 页数：5 大小：474.37KB 积分：30 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

书书书现代图书情报技术版权所有，欢迎下载引用！请注明引用地址：基于的化系统开发初探现代图书情报技术，（）：基于的化系统开发初探王泽贤（广州大学图书馆广州）【摘要】主要介绍一个用现有书目记录实现基于模型的系统。首先介绍系统的功能，实现该系统的数据库结构及详细说明，然后分析系统的实现过程，并详细说明书目记录聚合成对象的聚合算法。【关键词】【分类号】（，，）【】，，【】收稿日期：收修改稿日期：本文系广州市属高校科技计划项目“ 在我国的实现及其模型研究” （项目编号：）的研究成果之一。自的书目记录的功能需求（，）最终研究报告出版以来，国外的理论研究已相当深入，一些化或类应用系统，例如美国的系统和等，已开发成功并已提供服务。国内的理论探讨虽然日益升温，但相应的实践探讨就颇为欠缺。为了验证理念在中应用的可行性，笔者尝试开发了一个小型系统，在书目记录转换为模式的基础上，初步实现了以作品聚集书目的理念，成功构建了一个两层聚集、三层显示的结构化书目检索系统。系统功能及体系结构系统功能该系统功能就是将独立存在的记录，通过系统返回查询结果时，将互相关联的记录以模型分层方式反映出来，用户通过一次检索即可发现所有相关信息。要实现该功能的关键和难点是将各条独立的记录聚合成相互关联的模型对象。本系统目前已生成了第一组实体中的作品（）、内容表达（）、载体表现（）这几个最核心的对象，在此基础上要进一步实现总第期年第期现代图书情报技术其他对象及属性是较为容易的事情。在引入记录的同时，还要生成相关索引，以供检索。在聚合生成模型对象的基础上，较容易实现检索并将相关结果以树型方式显示；系统提供责任者、题名、主题这几种检索条件，可以单一或以多种条件组合方式进行检索，检索结果以作品内容表达载体表现的树型方式分层逐级显示。系统体系结构为了提高系统的可缩放性和灵活性，该系统采用了分层的体系架构，主要分为数据库层、持久层、业务层和表现层，如图所示。所有对数据库的操作都是通过用框架实现的持久层实现，通过该层实现了系统的数据库无关性，可以方便地切换到其他数据库系统。数据标准化、索引、聚合等业务逻辑都集中在业务层。表现层是用户与系统交互的接口，主要包括了检索显示、后台处理两部分：后台处理主要完成了数据引入、索引、聚合成对象等功能；系统使用技术框架以方式实现检索、显示功能。图系统体系结构图数据库设计领域模型及其关系分析从系统功能首先可以分析出书目记录、作品、内容表达、载体表现这几种对象。在书目记录化的过程中还要用到名称规范库、题名规范库及语种这些对象，名称规范库又可分为个人及团体名称规范库两种子类。要实现检索还需对书目记录建立责任者索引、题名索引、主题索引，这些索引都是记录字段索引的子类。这些对象间的关系如图所示。各表字段组成及说明根据所分析的领域模型，可以进行数据库的结构图领域模型关系图设计。采用每个类层次结构一张表的模式，名称规范库及其子类个人名称规范库和团体名称规范库生成一张名称规范表；记录字段索引及其子类责任者、题名、主题索引生成一张字段索引表；其他每一种对象对应一张表。所生成的主要表结构的语句及详细说明如下：（名称规范库主键（）规范名称类型。个人名称：，团体名称：标目主键。参照记录的对应标目记录主键，当为标目记录时值为（）款目要素。中文个人名称，外国人中译名称，家族名称，团体名称等（）名称的其它部分。对于外国人中译名称中用中译姓作为款目要素时，姓以外其余部分的字母缩写；团体名称的则从属标目（）年代以外的名称附加。例如：性别、职业等（）罗马数字。对应子段（）会议地址。对应子段（）年代（包括朝代）。生卒年：生年卒年，例如：（）首字母的展开型式。对于外国人中译名称：原文姓，原文名。例如：，（）款目要素汉语拼音。全部小写（）说明优先权。当有相同符合条件的记录时，取优先权大的记录（）；（题名规范库主键主要责任者主键标目主键。参照记录的应用实践对应标目记录主键，当为标目记录时值为（）责任者（）题名（）题名汉语拼音（）说明（）；（书目记录数据主键（）字符集。记录的字符集编码，如：，等记录数据建立日期（）；（记录字段索引。用于查询主键主键（）索引类型。：责任者，：题名，：主题（）字段子字段名（）字段值（）；（作品主键规范题名主键（）责任者（）题名（）类型代码。取书目记录的的第、位，位编码内容：小说，戏剧，散文，幽默、讽刺作品，书信，短篇故事，诗词，演说词，非文学作品，多种或其他文学体裁；位编码内容：自传，个人传记，合传，含传记资料（）说明（）；（内容表达主键作品主键（）类型代码。取书目记录头标第位，编码内容：文字资料，乐谱，测绘制图资料，录像制品、投影制品、电影制品，录音制品，录音制品（音乐），二维图形（图画、设计图等），电子资源，多载体，三维制品和教具，拓片（）语种代码（）次要责任者主键，用于比较。对应书目记录、、、字段，次要责任者规范记录的主键，用，分隔（）次要责任者。用于显示（）说明（）；（载体表现主键内容表达主键书目记录主键（）类型。保留未使用（）版本。格式：，（）题名。格式：：，（）主要是（）所有责任者。对应，，，字段，用；分隔（）出版发行。格式：：，，，（）载体形态。格式：：：（）（）由的位和组成（）说明（））；书目记录引入、聚合操作过程（）提取测试数据为了便于测试，该系统只用少量数据进行测试。首先对国家图书馆早期的万多条格式的中文书目数据，按分类号（字段首字母）是、类，并且责任者（、、字段）是曹雪芹、高鹗、米切尔、施耐庵、罗贯中、吴承恩、谢尔顿其中之一的条件，对符合条件的记录输出到一新的纯文本文件中，每条记录一行。由此提取出来的测试数据共条。接下来对中的记录进行处理。先把中的每一记录进行分解、格式化，生成每一字段一行的便于查看的格式，输出到纯文本文件。总第期年第期现代图书情报技术然后通过文件对这些记录逐条检查，去除没有题名、责任者等必需字段的记录及数据有明显错误的记录。编写程序去除重复的记录，判别重复记录的条件是：字段、、、、、的各子字段值都相同。处理后的数据保存在文件中。这样经过以上处理后共剩下条记录。（）名称规范库与题名规范库初始化根据提取的记录内容，初始化生成相关的主要名称规范记录，它们是：（清）曹雪芹（）；（清）高鹗（约）；等等。在此基础上再生成初始的题名规范记录，它们是：（清）曹雪芹著红楼梦；（明）施耐庵撰水浒传等。（）引入记录并生成索引记录从逐条读入记录进行处理，先根据数据生成书目记录对象，并保存到表中；然后对该记录进行分解，建立责任者索引、题名索引、主题索引，保存到表中，以供书目检索用。责任者索引的键值对应的字段及子字段是：，，，，，等；题名索引的键值对应的字段及子字段是：，，，，，，，，，等；主题索引的键值对应的字段及子字段是：，，，，，等。（）聚合记录对引入的每一条记录进行处理，聚合生成对象、对象、对象，然后对由计算机自动生成的这些对象进行检查，对不能完全自动聚合的记录进行手工调整。引入聚合的最终结果如表所示：表引入聚合结果项目引入、聚合前引入、聚合后手工调整后名称规范库标目参照题名规范库标目参照记录聚合算法（）抽取名称规范记录逐个处理该记录的责任者字段（，，，，，），如果此责任者不存在名称规范记录，则以此字段数据在名称规范库中插入新记录。（）查找或生成题名规范记录取该记录的所有主要责任者字段（或）对应的名称规范对象生成责任者数组；取该记录的所有题名字段（，，，，，，）生成题名数组。将中的每一个名称规范记录与中的每一个题名组成查询条件在题名规范库中查找，如果存在符合条件的题名规范记录则保存在中，并停止查找，转（）；如果所有的和都查找完，且不存在对应的题名规范记录，则取中的第个对象与该记录中的题名部分（如果存在则取，反之取）生成一条新的题名规范记录，并保存到责任者题名规范库中，转（）。（）查找或生成记录将与该记录的作品类型（字段的第、位）组成查询条件，在表中查找，查找成功则保存到对象中；如果查找失败，则根据与该记录的作品类型生成一个新的对象，并保存在表中。（）查找或生成记录以、该书目的语种（字段值）、记录类型（头标第位，，，分别为同一类）、次要责任者（或、、字段，除中责任者外的责任者，并要转换成名称规范对象形式）为条件在中查找，查找成功则保存在对象中；如果查找失败，则根据、语种、记录类型、次要责任者生成新的对象，并保存在表中。（）生成记录分解出该记录对应的类型、版本、题名、责任者、出版发行、载体形态、等内容，并结合、生成新的对象，保存在表中。检索、显示功能的实现检索功能的实现系统提供了责任者、题名、主题这几种检索条件，应用实践匹配方式包括完全相等或部分相等两种方式，可以单一或多种条件以、方式组合进行检索。系统先按用户的设定生成检索条件及排序条件，然后组合成完整的语句返回检索结果。的主要部分代码为：显示功能的实现符合检索条件的作品信息首先以列表方式显示，选中作品的详细信息以树型方式分级显示：作品内容表达载体表现简单信息载体表现详细信息。显示效果如图所示，采用树型控件实现。为了提高显示效率，采用智能化延迟加载技术：初始时生成作品及所有内容表达节点内容；用户选择展开内容表达节点时，再生成该内容表达节点的所有载体表现简单信息节点；如果该内容表达节点的载体表现节点小于，则同时生成载体表现节点的详细信息，反之，用户选择展开载体表现节点时，才生成该载体表现节点的详细信息。图作品详细信息结语书目记录要实现基于模型的，最大的困难就是：将各条独立的记录聚合成相互关联的模型对象，也就是聚合的过程。经过实验可知，从技术上讲，用书目记录实现模型的是完全可能的，但对于大规模数据的全整实现还具有一定难度。因为聚合的基础是名称规范库和题名规范库，我国目前还缺乏较为完善、统一的规范库，并且要构建这些规范库不能只借助计算机自动完成，还需要大量的人工参与。此外，聚合过程虽然可由计算机自动完成，但此项任务实现的基础是高质量的数据，现存的书目数据不够规范统一，需要花费大量的人力进行审核、调整。此系统基本实现了所需的功能，但还存在一些有待改进的地方：没有完整实现模型的所有对象，并且对于已实现的作品、内容表达、载体表现这些对象也只实现了部分属性；所使用的聚合算法并

人人文库> 全部分类> 专业文献 > 工业制造

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于cnmarc的frbr化opac系统开发初探

文档简介

温馨提示

最新文档

评论

基于cnmarc的frbr化opac系统开发初探

文档简介

温馨提示

最新文档

评论

相关文档