




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
包结构规范22 / 24 包结构规范目 录 元数据记录和数字对象定义 复杂对象之间的关系 复杂对象的收割 按包含关系进行分类 复合对象的定义 复合对象类型 资源类型 包类型 型复合对象包结构 型复合对象包结构 型包的结构 不含简单对象的包附注一附注二 元数据记录和数字对象定义作为包规范的基础,本节将给出五种概念,即元数据记录()、数字对象、文件对象、简单对象和复杂对象。(1) 元数据记录()元数据记录独立存在,独立显示、存储和交换。在体系中: 元数据记录不具有; 元数据记录遵循专门数字对象描述型元数据规范; 元数据记录不包含或引用其他元数据记录,也不被任何其他的元数据记录包含或引用。(2) 数字对象数字对象可以是一个物理文件,可以是逻辑上的对象;后者可以包含或引用一个或多个其他数字对象。数字对象可以具有全局性的唯一标识符。数字对象可以包含描述型元数据和管理性元数据。数字对象分为三类:文件对象、简单对象和复杂对象。在体系中,若数字对象需被引用或包含在其他数字对象中,则数字对象应具有。(3) 文件对象文件对象是指物理上存在的某一文件实体,如某一个图片文件、文件、文件等。(4) 简单对象简单对象是指一种逻辑上的对象,至少包含一个或多个文件对象,也可以引用一个或多个文件对象。例如: 作为简单对象的某一篇学位论文,可以具有“全文”和“前页”两个文件对象; 作为简单对象的某一古籍图片,可以具有“高精度图片”、“中精度图片”和“低精度图片”三个文件对象; 作为简单对象的某一本电子书,可以由目录、某若干章、全文等几个文件对象组成。(5) 复杂对象满足以下两项条件其一的元数据记录、数字对象和关系(包含或引用关系)的组合体即被定义为复杂对象,在体系中,复杂对象由复杂对象唯一标识; 某一元数据记录具有相应的数字对象 某一元数据记录具有包含、被包含、引用或被引用关系(注:该包含和引用关系在后面的章节中将详细论述)复杂对象存在以下四种构成形式:(a) 被包含或被引用的元数据记录图:被包含或被引用的元数据记录(b) 元数据记录和数字对象的组合图:元数据记录和数字对象的组合(c) 元数据记录和关系(包含或引用关系)的组合图:元数据记录和关系的组合(d) 元数据记录、数字对象和关系(包含或引用关系)的任意组合图:元数据记录、数字对象和关系的组合图所示的组合方式即()()和()三种情况的组合。以上各种情况的复杂对象,都具有复杂对象。图:复杂对象、简单对象、文件对象和元数据记录()的关系对于一条元数据记录,若存在以下需求,则应为其分配一个对应的复杂对象: 对应一个或多个数字对象; 需要包含或引用其他或数字对象; 需要被其他或数字对象包含或引用。 复杂对象之间的关系前一章给出了复杂对象的定义,同时提及了元数据与元数据之间的包含与引用关系。该章将主要说明复杂对象与复杂对象之间的包含和引用关系。复杂对象的包含关系:为了说明复杂对象的包含关系,这里先给出一个元数据间具有包含关系的实例。例如某一种元数据是描述会议论文集的,我们称为会议论文集元数据。另一种元数据是描述会议论文的,我们称为会议论文元数据。这里会议论文是包含在会议论文集中的,所以元数据之间的关系为包含关系。从而扩展到复杂对象关系层次,得到复杂对象的包含关系,如图所示。图:复杂对象的包含关系包含关系使得复杂对象构成了一棵树,这里规定,在包含关系下,复杂对象可以包含多个孩子(为复杂对象),但至多只能被包含于一个父亲(为复杂对象)。复杂对象的引用关系:同样给出一个实例。例如古籍资源元数据中“合刻书名”项表示了元数据间的相互引用关系,该“合刻书名”可以理解为两条或两条以上元数据对应的对象,例如两本古籍书被装订在一起,共用一个索书号等。所以两条元数据间的关系是一个相互引用的关系,而不是包含关系。当然这种引用关系可以扩展到对系统以外的资源的引用,例如一篇学位论文可以引用一篇会议论文。上升到复杂对象的层次,即为复杂对象之间的引用关系。如图所示。图:复杂对象的引用关系引用关系使得复杂对象构成了一个图,即在引用关系下,复杂对象可以引用多个复杂对象,同时可以被多个复杂对象所引用。例如,一篇学位论文,它可以引用多篇学位论文和会议论文。同样地,两篇或多篇学位论文,可以引用同一篇会议论文。注:这里提到的包含和引用关系的定义都是不表示在元数据中的,而必须在本地资源库中利用本地实现机制来辅助完成的。对于在元数据内容中可以表示出来的关系,不是这里定义的“复杂对象的包含和引用”关系。 复杂对象的收割根据第一章中的定义,复杂对象包含四部分:元数据、简单对象、文件对象、包含或引用关系。对于以上四部分信息的收割,提出了相关的收割规范,其中,对于元数据本身的收割,则采用了协议进行收割;对于简单对象、文件对象和包含或引用关系,则采用进行收割。对于元数据记录(),其只由元数据本身构成,不包含任何对象和关系,所以该类元数据记录的收割,是通过收割来完成的。对于复杂对象的收割,则需要利用和收割共同完成。 按包含关系进行分类 复合对象的定义在第二节“复杂对象之间的关系”中,提到了复杂对象之间可能存在包含关系,而在这种包含关系下,复杂对象可以形成一棵包含树。我们把复杂对象的包含树定义为复合对象,即复合对象为一至多个复杂对象以及它们之间的包含关系所组成的对象实体。(注:复合对象与复杂对象是不同的两种定义,复杂对象是复合对象中的元素)接下来,本节将按包含关系分别对复合对象、资源、包进行以下分类: 对于复合对象,分为型、()型、 ()型; 对于资源,分为型、()型、()型; 对于包,分为型、型、型和型。 复合对象类型以下是按包含关系对复合对象进行分类: 型复合对象型复合对象是一种基本型复杂对象,并且不包含于其他数字对象中。它可以被其他数字对象引用。型复合对象如图所示:图:型复合对象 ()型复合对象型复合对象是一种复合型复杂对象,具有两层的包含与被包含关系;如图所示:图:型复合对象 ()型复合对象型复合对象是一种复合型复杂对象,具有三层或三层以上的包含关系;如图所示:图:型复合对象 资源类型为了说明资源的类型,先来讨论一下学位论文、古籍和拓片三种资源的不同点。图为三种资源各自的代表性复杂对象。图:三种资源各自的代表性复杂对象由此可以看出,学位论文与古籍资源具有的复杂对象通常不具备包含与被包含关系,即复杂对象只包含元数据、简单对象和文件对象;而对于拓片资源,其存在两种情况,即一部分复杂对象单独存在,另一部分复杂对象为版刻与复本的关系,在实现中,可以将该关系理解为包含或引用关系。如果将其实现为包含关系,则拓片资源中存在一类复杂对象,其包含元数据、简单对象、文件对象和包含关系。以下是几种资源类型的定义: 型资源:型资源只包含型复合对象和元数据记录(),且不包含型复合对象和型复合对象。 ()型资源:型资源至少包含型复合对象,还可以包含型复合对象和元数据记录(),但不包含型复合对象。 ()型资源:型资源至少包含型复合对象,还可以包含型复合对象、型复合对象和元数据记录()。由此可见,学位论文和古籍资源通常都属于型资源,而拓片既属于型资源,也可以是型资源。这里需要强调的是,资源与资源的类型是一对一或一对多的关系,即某一资源可以具有一种或多种资源类型。 包类型由图和图可以得到图和图。图:型资源的包结构图:型资源的包结构图和图中曲线封闭的部分表示一个包。从复杂对象的角度来看,包中包含了复杂对象中的简单对象、文件对象、包含和引用关系。由此,可以定义四种包: 型包:不包含任何包,且不被包含于任何包的独立的包。 型包:不被包含于任何包,但包含至少一个子包的包。 型包:既被包含于唯一父包,又包含至少一个子包的包。 型包:被包含于唯一父包,但不包含任何子包的包。需要说明的是,只从包含关系的角度来说,任何包至多只有一个父包。也就是说,在包含关系下,可以存在独立的型包,也可以存在一棵包树。对于复合对象,包封装方式如下: 对于一个型复合对象,按一个型包进行封装; 对于一个()型复合对象,按一个型包和若干个型包进行封装; 对于一个()型复合对象,按一个型包、若干个型包以及若干个型包进行封装。 型复合对象包结构图:型包举例型复合对象所对应的包必然是型包。为了收割的数据足以在中心系统中进行呈现,一些相关的信息需要包含到包中。型包的主要信息包括: 对应元数据的; 包的类型; 对应的复合对象; 其包含的简单对象的、对象名称和呈现顺序等。下图为图所示的包的具体内容,结合该实例,将详细阐述各元素值、子元素值和属性值的含义。图:型包片断首先,每个包都会具有一个元素。元素的所需属性有: (可选):用于保存包的说明信息,可以是元数据的简单说明,也可以是元数据内容中的题名。 (必备):存放相应元数据的;必须符合的命名方式。具体的命名格式请参见元数据命名规范 (必备):用于存放相应复杂对象。样例中的“000000”代表馆代码,“”代表集合名,而“7”代表中的。由于中心系统需要获得收割到的包的相应数字对象的时间戳,所以在包中需要具有表示当前数字对象时间戳的元素。采用元素的属性来表示数字对象时间戳。元素的属性: (可选):用于存放当前包所对应的数字对象的时间戳,该时间戳与收割中的段中的数字对象时间戳相同。当前包如果含有简单对象,则必须存在该元素及属性,如果当前包不含简单对象,则不出现该元素及属性。因为元数据存在相应的一个简单对象(该简单对象具有两个文件对象),所以一个简单对象需要用包结构中的一个( )元素来存储,而一个文件对象需要用包结构中的一个元素来存储。和元素都不需要在属性中存储任何信息。 有以下属性需要填写信息: (必备):用于表示当前呈现实体的格式,对应其中的部分。形式为“”等(注:具体列表请参见附注一) (必备):用于存放当前文件对象的内部标识号部分。 (当存在子元素且包含其下的时,该属性必备):当前呈现实体的大小。该尺寸值可用于对收割到的内容的校验。如果及其下的不存在,该属性值为。 (可选):用于存放对当前文件对象的中文描述信息,例如“全文”、“前页”、“低精度图片”、“中精度图片”和“高精度图片”等描速信息。也可以理解为对中的中文描述。(注:具体的各种资源的中文描述信息列表请参见附注二)每个元素都可以具有两个子元素,即和。可用于存储文件对象的和,它是一个可重复元素: (必备):其值可以为“”或“”。如果为“”,则必须指明属性的值,如果为“”则 中存储内容为访问当前文件对象的。对于该属性为“”的情况不是必备的,而是可选的。 (可选):如果为“”,则该属性的值为“”,此时中存储内容为当前文件对象的。对于该属性为“”的情况是必备的。 (必备):当为“”时,该属性值中存放当前文件对象的,即通过该,本地系统认证过的用户可以访问到具体的文件对象。如果的值为“”,同时的值为“”,则该属性值中存放当前文件对象对应的为可选子元素,即对于配置为可收割的所对应的实体,可以在中存储实体的二进制数据,而对于配置为不可收割的类型,则不存在元素。这里简单地举一个例子,假如本地资源系统具有三种文件对象类型(),分别为、和。如果配置和的所有文件对象都需要收割,而所对应的文件对象不收割。则在相应的包中,如果对应的元素为或,则其包含子元素,如果对应的元素为,则其不包含子元素。中没有用到任何属性,但需要具有子元素,其内容为对应文件对象的二进制数据串。需要说明的是该二进制数据需要采用编码方式。另外,不允许出现仅存在而不存在的情况,即如果不提交数字对象的二进制数据,整个元素都不能出现。在图中,元素的另一个子元素为。中需要用到的属性有: (必备):其内容为当前包的类型即、或四种类型。所以的类型就是包的类型。是包的核心元素。一个包可以不包含元素,但必须具备元素。其描述了整个包的结构。在规范体系中,将包的控制在两层。即当前元数据层和孩子层。如果元数据具有对应的简单对象(含至少一个文件对象),孩子层就包含指向文件对象的指针,称为。如果存在另一条被包含的元数据,即当前包类型为或类型,则孩子层就还应该包含指向另一包的指针,称为。对于存在的情况,将在后面的例子中进行说明。如图所示,包含两层。第一层用于表示元数据本身,所以其中的内容为当前元数据的说明信息,也可以为当前元数据对应的题名等。对于第二层的元素,其表示的为孩子层。对于类包,就只包含指向的指针。对于第二层的元素,属性值有一些特殊的要求。 (必备):用于存放当前数字对象的名称(注:)或包的说明信息(注:或),该信息在中心系统中将作为呈现项目。 (必备):用于存放当前数字对象或包在中心呈现时的呈现顺序。 (必备):其值可以为、或。其中当时,该包含指向文件对象()的指针,当 或时,该包含指向包的指针。样例中,由于包类型为,所以其只包含指向的指针,即。图中,第二层包含有两个,表示指向两个文件对象的指针。中需要用到的属性有: (必备):该为当前包在段中定义的元素的。 型复合对象包结构图:多层树的通用样例()型复合对象可以认为是复合对象的一个通用结构,即如果树的层数为,则退化为型复合对象。如果树的层数为,则退化为()型复合对象。如果树的层数为或大于,则对应的对象就是正常的()型复合对象。因此,图所示的树具有通用性。如前所述,一个()型复合对象,由一个型包、若干个型包以及若干个型包组成。对于型和型包,它们除了要包含元数据所对应的简单对象(含至少一个文件对象)外,还需要包含复杂对象与复杂对象之间的关系,这种关系有两种,即包含关系和引用关系。在图中,红色的箭头表示复杂对象与复杂对象之间的“包含”关系,而点划线箭头表示了复杂对象与复杂对象之间的“引用”关系。 型包的结构在本规范第章中对型包的结构进行了详细的说明。对于型和型包来说,它们除了要收割元数据所包含的简单对象(含至少一个文件对象)外,还需要收割复杂对象与复杂对象之间的关系,这种关系有两种,即包含关系和引用关系。在图中,红色的箭头表示复杂对象与复杂对象之间的包含关系,而点划线箭头表示了复杂对象与复杂对象之间的引用关系。图中的“元数据”所对应的包类型为,其具有三条指向其他包的箭头,其中两条为包含关系,一条为引用关系。“元数据”这个复杂对象所对应的型包的结构中的元素描述如下:图:“元数据”这个复杂对象对应的包片断与型包不同的是,上述型包中的元素的属性为“”。同理,对于型包类型,该属性为“”;对于型包类型,则属性为“”。图中的第二个层(孩子层)中有个子元素。其中前两个包含指向“元数据2”和“元数据3”的(包的指针),第个包含了指向“元数据7”的。这三个的区别在于,前两个是包含关系,第个是引用关系。为了区别这两种情况,的属性分别取值为:和。此处区分包含与引用关系只有语义意义。元素的属性有: :固定取值为“”; :固定取值为“”,说明采用复杂对象的来标识包。 :具体的的值。例如图中的“ 2”、“3”和“ 7”。型包的结构与型包的结构是相似的,而型包的结构与型包的结构也是相似的。因此,在这里就不具体的分析该两类包的结构了。 不含简单对象的包这里需要特别指出的是:并不是所有的包都含有简单对象。在收割过程中,除了收割简单对象(至少含一个文件对象)外,还需要收割复杂对象之间的关系。所以,当某一复杂对象自身不包含任何简单对象,但又从属于某一个包含关系(即对应的包处于树中)时,为了收割到复杂对象之间的关系,必须对其也生成一个包。例如图中的“元数据”,其包表示如下:图:不含简单对象的包结构由于没有任何简单对象,所以该包文件中没有出现元素。同时在中也没有出现(指向的指针)。这里只有指向包的指针,即。所以收割该包,就收割到了复杂对象“元数据”对“元数据”和“元数据”的包含关系。图所示的情况为图中复杂对象对应的包,而对于图中所示的复杂对象的情况,其肯定为型或型的包,但其既不包含数字对象,也不包含关系。这种情况的包结构表示如下:图:不含简单对象也不含关系的包结构可见,元素中,第一层子元素是必备的,而第二层层不是必备的。附注一的内容见下表中“”列:文件对象后缀* * * * * * * * * * * * * * * * * * * * * * * * * * * * *
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农发行济宁市金乡县2025秋招信息科技岗笔试题及答案
- 农发行昆明市官渡区2025秋招笔试综合模拟题库及答案
- 农发行平凉市崆峒区2025秋招无领导小组面试案例库
- 农发行蚌埠市龙子湖区2025秋招笔试专业知识题专练及答案
- 农发行曲靖市富源县2025秋招小语种岗笔试题及答案
- 国家能源郴州市苏仙区2025秋招心理测评常考题型与答题技巧
- 国家能源菏泽市巨野县2025秋招写作案例分析万能模板可套用
- 国家能源北海市海城区2025秋招笔试资料分析题专练及答案
- 2025年河北雄安新区新建片区学校公开选聘教职人员102名考前自测高频考点模拟试题及完整答案详解
- 办公室文员工作总结集合15篇
- 鄂托克高新技术产业开发区固废处理场建设项目环评报告书
- 老年焦虑障碍课件
- 产科护理个案分享案例
- 结肠癌根治术后护理
- 《婚姻家庭辅导》课件
- 2024年共青团入团考试题【附答案】
- 新统计法培训
- 养老院有限空间环境安全管理制度
- 保证食品安全的规章制度清单
- GB/T 30661.10-2024轮椅车座椅第10部分:体位支撑装置的阻燃性要求和试验方法
- 《环境保护法讲座》课件
评论
0/150
提交评论