




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
元数据抽象模型与新加坡框架,刘炜 上海图书馆,2007数字图书馆建设与应用研讨会*深圳,主要内容,DC元数据标准规范体系 DC元数据抽象模型 DC元数据新加坡框架:应用纲要的规范形式,说明:Google图片搜索对此slide亦有贡献,DC元数据标准规范体系,Element | DCMES, DCQ,Element |DCAMDCAP (DCTerms+),DC1.0,DC2.0,DC1.0,Elements元素 Qualifiers修饰词 Element Refinements元素修饰词(子元素) Encoding Schemes编码体系修饰词 Vocabulary Encoding Schemes词表编码体系 Syntax Encoding Schemes语法编码体系,参见:/usage/documents/principles/#element,DC应用纲要1.0,CWA14855定义 指南性文档 没有对于元数据编码的任何规定 不支持DCAM 不支持Description Set (描述集),DC眼中的世界(DCAM),任何事物都是资源 资源有类型 任何资源都可以以URI标识 任何资源都有属性 属性词即元数据 属性词表即元数据方案 元数据方案可有多种形式:不/半/规范的 应用纲要是一种正在成型的半/规范形式 任何属性都有属性值 属性值有领域和范围(domain & range) 属性值可以是另一个资源,可以是文字(literal) 取值的规范控制,即各类KOS,也是元数据,DCMI类型词表(DCTYPE),DC元数据描述的资源对象可能存在的类型: Collection Dataset Event Image MovingImage StillImage InteractiveResource PhysicalObject Service Software Text,“资源”的唯一必备属性:URI,URI:Uniform Resource Identifier (RFC3986定义) 唯一必备功能:标识资源(无论是物理的还是抽象的); 包含三部分: 访问资源的命名机制 存放资源的主机名 资源自身的名称,由路径表示 两种类型: URL 如: /rfc/rfc3986.txt mailto: news:comp.lang.java URN 如: urn:isbn:096139210x urn:doi:10.1045/november2007-kaufman URI是抽象类,并不规定解析,进一步说明,元数据是一种人工语言(消除歧义、明确定义、人机共读); 元数据元素集是描述资源各个方面的属性词表; 元数据取值如果规定只能从某些词表中选取,这些词表就属于受控的规范词表;这属于元素取值的domain和range; 元数据应用纲要是为了领域应用而制订的元数据方案的一种表达形式,目前正在成为规范的,叫做“DC元数据应用纲要”,核心是符合DC抽象模型的元数据形式化表述(也就是一种机读形式),通常可以以RDF形式表达; 应用模型(规定应用领域的各类实体及其相互关系)、著录规则等文档,也可以成为元数据应用纲要的组成部分; 元数据注册系统可以作为元数据元素的命名域管理体系而存在,但命名域并非一定需要注册系统进行管理; 元数据元素词表,包括规定元数据取值的规范词表,都可以看成是一种人工语言,每个术语都应该被赋予唯一的URI,都可以通过注册系统进行管理; 元数据形式化的表达必须采用基于XML的RDF或OWL等的Schema,著录工作单当然可以通过完整表达元数据方案各种关系和约束的schema来自动生成,并进行校验。当然这需要一定的环境和软件工具来实现,Resource,has,property,DC:Creator DC:Title DC:Subject DC:Date.,X,主语,谓词,属性词,属性值,optional qualifier,optional qualifier,修饰/限定词,来自(from):Stuart Weibel,Resource,has,Date,“2000-06-13“,Revised,ISO8601,Resource,has,Subject,“Languages - Grammar“,LCSH,来自(from):Stuart Weibel,DC属性元素的“领域和范围(Domain and Range)” 见:/documents/domain-range/index.shtml,Record (encoded as html, XML, or RDF/XML,Description set,Resource Description (URI),Resource Description (URI),Resource Description (URI),Statement,Statement,Statement,language (pt-BR),DCAM图示(来自Andy Powell),value URI,property (URI),syntax encoding scheme,Vocabulary encoding scheme,新加坡框架进一步定义了DC应用纲要,符合DC抽象模型(DCAM)的应用纲要 (“DC应用纲要”) 包含如下一系列文档: 功能需求说明(必须desirable) 领域模型 (应有mandatory) 元素集描述 (DSP) (应有mandatory) 应用指南 (可选) 编码句法指南(可选),应用指南,功能需求,领域模型,元素集 描述,编码指南 与数据格式,社区领域 模型,元素词表,DCMI 抽象模型,DCMI 句法指南,RDF/S,RDF,标注 Annotate,建立基础,建立基础,建立基础,使用,使用,建立基础,建立基础,建立基础,建立基础,建立基础,建立基础,基础标准,领域标准,DC应用纲要,新加坡框架图示(来自Tom Baker),描述集纲要(DSP),定义了描述集在结构方面的约束: 允许出现怎样的描述 允许采用怎样的属性 怎样的属性值聚合方式 以XML表达(RDF当然是XML) 忽略元素的定义(通过URI参考) 忽略版本控制 不要求应用指南著录规范等给人读的文档,翻译、修改自Mikael Nelsson的演讲稿,参见:/architecturewiki/DescriptionSetProfile,当前元数据研究和应用中的问题,人读而非机读 语义的模糊性 模型的完整性(两类模型:FRBR和DCAM) 执行的一致性 数据的独立性 基本上无法编码实现(包括数据库系统开发) 我们目前的元数据方案可以说只完成了MARC数据格式的定义,还没有2709格式使其真正机器可读 从这一点来说,目前各类元数据著作、方案中值得推敲的地方还是比较多的,一些建议,建立本地化扩展术语的命名域参考 建立元数据应用纲要(词表)及编码的登记注册体系 修订目前的领域应用元数据应用纲要 推进元数据集成开发系统(IDE)软件和工具的开发 建立数字图书馆标准规范的开放讨论维护机制 “机读版”元数据方案的推广、培训 随着元数据应用的开展和普及,一致性问题越来越严重。现在如果不重视,将后患无穷!,问题讨论,元素名是否应该翻译?,dc:creator,Server in Germany,Server in CAS,DCMI Server,(上图改编自Stuart Weibel有关演示文稿),元素名只是一个机器识别的符号(Token)而已 一个符号(token),多种翻译(labels) 如果翻译了,就不是DC了 (“盗版DC“?),元数据“记录”是怎样的结构?,过去称为记录的,多为现在所称的描述 平面化(MARC中的记录) “虚拟记录” 传统结构:数据库记录-文件系统 描述/描述集 1:1原则是针对描述而言,而非记录 描述/描述集可以通过不同的记录形式/格式来实现,DCAM打散了资源描述,在具体应用中如何实现?,DCAM是一个抽象模型,不考虑具体实现(如记录的统一、聚类等); DCAM提供需求分析、功能设计的思路和方法,应用系统可以采用任何方式实现功能; 目前URI是一切Web资源描述的基础,包括URL和URN两类。URN(eg:DOI/ISBN,甚至各类词表)如何实现全局解析,不是Web的事情,是行业应用的事情; URI不是完美的资源标识方法,新的方法正在研讨中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年自考专业(小学教育)测试卷附参考答案(基础题)
- 2025年期货从业资格之《期货法律法规》考前冲刺测试卷包及参考答案详解(黄金题型)
- 2025年法院司法辅助人员模拟题库附参考答案详解【轻巧夺冠】
- 农发行昭通市威信县2025秋招笔试综合模拟题库及答案
- 农发行南阳市社旗县2025秋招群面模拟题及高分话术
- 农发行娄底市新化县2025秋招数据分析师笔试题及答案
- 紫金县2025广东河源紫金县残疾人康复中心招聘编外人员1人笔试历年参考题库附带答案详解
- 职业技能培训企业实践报告
- 心理健康促进管理规定报告制定
- 创新交流规定制度
- 2025贵州民航产业集团有限公司社会招聘考试参考试题及答案解析
- 2025年江西省高考物理试卷真题(含答案及解析)
- 高三励志课件
- 河南省人民医院2025年护士规范化培训招生考试参考题库及答案解析
- 防消联勤课件
- 绿色交通系统无人驾驶车辆示范项目可行性研究报告
- 2025年领导干部政治理论知识竞赛题库及答案
- 2025国庆中秋节前安全教育
- 东北三省2025~2026学年度上学期高考单元检测示范卷 数学(选择性必修第一册 人教版 第1章)(含答案)
- 读书的力量课件
- 输电线路工程冬季施工方案
评论
0/150
提交评论