DB50∕T 1096.2-2021 畜牧兽医大数据应用与管理 第2部分:元数据_第1页
DB50∕T 1096.2-2021 畜牧兽医大数据应用与管理 第2部分:元数据_第2页
DB50∕T 1096.2-2021 畜牧兽医大数据应用与管理 第2部分:元数据_第3页
DB50∕T 1096.2-2021 畜牧兽医大数据应用与管理 第2部分:元数据_第4页
DB50∕T 1096.2-2021 畜牧兽医大数据应用与管理 第2部分:元数据_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS65.020.30

CCSB40

DB50

重庆市地方标准

DB50/T1096.2—2021

畜牧兽医大数据应用与管理

第2部分:元数据

2021-03-30发布2021-07-01实施

重庆市市场监督管理局发布

DB50/T1096.2—2021

前  言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

本文件是DB50/T1096的第2部分。DB50/T1096已发布了以下部分:

----第1部分:总则

----第2部分:元数据

----第3部分:信息分类与编码

----第4部分:数据接口

----第5部分:共享交换技术要求

----第6部分:信息资源目录

----第7部分:管理要求

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由重庆市农业农村委员会提出并归口。

本文件起草单位:重庆市畜牧技术推广总站、重庆大学、广州中科易德科技有限公司、西南大学、

广州中国科学院软件应用技术研究所。

本文件主要起草人:李晓波、古平、李引、陈红跃、夏云霓、樊莉、张科、何道领、黄文明、朱燕、

赖鑫、高敏、陈雷。

I

DB50/T1096.2—2021

畜牧兽医大数据应用与管理

第2部分:元数据

1范围

本文件规定了畜牧兽医行业大数据应用与管理的元数据。

本文件适用于畜牧兽医行业有关数据集属性的统一规范化描述。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T7408数据元和交换格式信息交换日期和时间表示方法

GB/T18391.1—2009信息技术元数据注册系统(MDR)第1部分框架

GB/T19710—2005地理信息元数据

3术语和定义

下列术语和定义适用于本文件。

3.1

元数据metadata

定义和描述其他数据的数据。

[来源:GB/T18391.1—2009,3.2.16]

3.2

数据集dataset

可以识别的数据集合。

[来源:GB/T19710—2005,4.2]

4畜牧兽医数据集的元数据

4.1元数据组成

畜牧兽医行业数据集的元数据包括核心元数据与参考元数据。参考元数据与核心元数据的包含关系

见图1,其中数据集按照GB/T19710的要求进行。

1

DB50/T1096.2—2021

图1参考元数据与核心元数据的包含关系

4.2元数据框架

畜牧兽医行业数据集的元数据规定了7个元数据子集,详见4.5、4.6:

a)元数据标识信息:包含元数据本身的基本信息。

b)数据集标识信息:包含元数据所描述的数据集的基本信息。

c)内容信息:包含数据内容特征的描述信息。

d)分发信息:包含数据分发的信息以及用户获得数据的途径。

e)数据质量信息:包含数据集数据质量信息的说明。

f)限制信息:包含对元数据或数据集进行访问和使用的限制信息。

g)维护信息:包含元数据或数据集的更新频率及更新范围的信息。

畜牧兽医行业数据集参考元数据的聚集关系与依赖关系见图2。

图2畜牧兽医行业数据集参考元数据的聚集关系与依赖关系

4.3元数据的结构层次

按照GB/T18391.1的要求,元数据的结构包含元数据元素、元数据实体和元数据子集三个层次:

a)元数据元素:最基本的信息单元。例如:数据集名称、数据集标识符、元数据创建日期等。

b)元数据实体:同类元数据元素的集合。例如“数据集提交和发布方”这一元数据实体需要“单

位名称”、“联系人”、“联系电话”等若干个元数据元素来说明。

c)元数据子集:元数据的子集合,由元数据元素与元数据实体组成。例如标识信息、内容信息、

分发信息等。

4.4元数据摘要描述

2

DB50/T1096.2—2021

元数据摘要描述定义畜牧兽医行业数据集的元数据内容。表1给出了元数据的元素、实体与子集的

定义。表2给出了元数据元素表达式符号的含义。

表1元数据摘要描述符

描述符约束性说明

中文名称必选元数据子集、元数据实体或元数据元素的中文名称。

元数据子集、元数据实体或元数据元素的英文名称,一般使用英文全称。英文名称的要求如

英文名称必选下:词汇均采用无缝连写,元数据子集与元数据实体英文名称的每个词汇的首字母均为大写,

元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写。

描述元数据子集、元数据实体或元数据元素的基本内容,是畜牧兽医大数据信息数据集某个

定义必选

属性和特征的概念与说明。

表示对元数据的有效值域和允许对该值域内的值进行有效操作的规定。数据类型遵循如下规

定:元数据子集与元数据实体的数据类型为复合型,元数据元素的数据类型包括数值型、布

尔型、字符串、日期型和复合型等;当元数据元素的数据类型为复合型的时候,表明该元数

据元素使用了引用信息中的引用数据类型;引用数据类型是由一组元素组成、能被重复引用

数据类型必选

的元素集合。例如,“数据集提交和发布方”和“元数据维护方”两个属性,要共同用到

“单位名称”、“联系人”、“联系电话”、“通讯地址”、“邮政编码”和“电子邮件地

址”这一组子元素来表示,为了表达的方便,畜牧兽医大数据信息元数据定义了一个叫做“负

责方”的数据类型,供“数据集提交和发布方”和“元数据维护方”进行引用。

元数据子集、元数据实体或元数据元素的英文缩写名称,具体缩写规则如下:短名在本标准

范围内必须唯一;对存在国际或行业惯用英文缩写词汇的元数据元素、实体或子集,采用惯

用英文缩写作短名;对于根据英文名称或自定义的短名,在可以保证其(本标准范围中的所

有短名范围内)唯一性的情况下取每个词汇的前3位字母作为其短名,当如此取词时发现

短名必选

不能够保证短名标识的唯一性时,应当延展取词的位数,通常增加1位,如果仍然不能满

足唯一性要求,则照此顺延;元数据元素、实体或子集的短名中,词汇均采用无缝连写。元

数据子集与实体短名中每个词汇的首字母均为大写;元数据元素短名的首词汇全部小写,其

余词汇的首字母采用大写。

对元数据子集、元数据实体或元数据元素的含义的进一步解释,包括该元数据的约束/条件

注解必选

(必选、可选)和最大出现次数。当该元数据为可选时,应注明其约束条件。

元数据元素、元数据实体或元数据子集取值方式的说明。描述元数据元素时必选,描述元数

取值规则可选

据实体、子集时不选。

子元素是通过一定的表示规则以确定一个元数据实体中包含的下一级的元数据实体或元数

子元素可选据元素。表示规则为:“标识符=表达式”。描述元数据实体、子集时必选,描述元数据元

素时不选。具体定义方式见表2。

表2元数据元素表达式符号含义

符号含义

=“=”左侧由“=”右侧内容替换、生成、组成,补充举例

+与,“+”左侧与右侧的两项都要选择

|或(选择),在由“|”分开的两项之中选择其一

a表示元数据元素a为必选项,且最大出现次数为1

3

DB50/T1096.2—2021

表2(续)

符号含义

0{a}1表示{}中的元数据元素a为可选项,且最大出现次数为1或参见其注解

0{a}n表示{}中的元数据元素a为可选项,且最大出现次数为N或参见其注解

1{a}n表示{}中的元数据元素a为必选项,且最大出现次数为N

4.5畜牧兽医行业数据集核心元数据

畜牧兽医行业数据集的核心元数据包括8个必选元数据元素或实体,10个可选元数据元素或实

体。畜牧兽医行业数据集的核心元数据内容见表3。

表3畜牧兽医行业数据集核心元数据内容

核心元数据内容元素或实体约束性在参考元数据中的位置

数据集名称元素必选数据集标识信息

数据集标识符元素必选数据集标识信息

数据集摘要元素必选内容信息

数据集提交或发布方元素必选数据集标识信息

关键词实体必选数据集标识信息

数据集语种元素必选数据集标识信息

元数据创建日期元素必选元数据标识信息

元数据标识符元素必选元数据标识信息

数据集特征数据元元素可选内容信息

数据集发布日期元素可选发布信息

数据集发布格式实体可选发布信息

在线访问地址元素可选发布信息

数据集分类实体可选数据集标识信息

相关环境说明元素可选数据集标识信息

元数据负责方元素可选元数据标识信息

元数据标准名称元素可选元数据标识信息

元数据标准版本元素可选元数据标识信息

元数据更新日期元素可选元数据标识信息

具体核心元数据内容说明见表4。

表4畜牧兽医行业数据集核心元数据具体说明

核心元数据内容定义英文名称数据类型取值规则/子元素短名约束性

简要描述数据集必选项,最

datasetTitdataTi

数据集名称主题与内容的标字符串自由文本大出现次数

letle

题为1

4

DB50/T1096.2—2021

表4(续)

核心元数据内容定义英文名称数据类型取值规则/子元素短名约束性

按照“提交机构-编号-

版本号”的命名规则进行

必选项,最

数据集的唯一标datasetIde赋值。提交机构使用机构

数据集标识符字符串dataID大出现次数

识符ntifier标准名称,版本号用1位

为1

整数加2位小数的表示方

式,例如“2.10”(版本)

必选项,最

数据集内容的简abstra

数据集摘要abstract字符串自由文本大出现次数

单说明ct

为1

提交或发布数据

集,并对数据集的必选项,最

数据集提交或发布datasetCondataCo

真实性、正确性、复合型自由文本大出现次数

方tactntact

可靠性负责的单为1

位或部门

用于描述数据集必选项,最

keywor

关键词主题的通用词、形keywords字符串自由文本大出现次数

d

式化词或短语为N

必选项,最

数据集采用的语datasetLandataLa

数据集语种字符串语种代码大出现次数

言guageng

为N

必选项,最

创建、采集元数据metadataDa按照GB/T7408规定,mdDate

元数据创建日期日期型大出现次数

的日期teStart格式应当为YYYY-MM-DDStart

为1

必选项,最

元数据的唯一标metadataId

元数据标识符字符串自由文本mdID大出现次数

识entifier

为1

数据集中能够表

characteri可选项,最

达数据集核心内charaD

数据集特征数据元sticDataEl字符串自由文本大出现次数

容与特征资源的ataEle

ement为1

数据元列举

datasetPub可选项,最

数据集进行提交按照GB/T7408规定,dataPu

数据集发布日期licationDa日期型大出现次数

或发布的日期格式应当为YYYY-MM-DDbDate

te为1

可选项,最

分发数据的格式distributi分发格式=分发格式名称distFo

数据集发布格式复合型大出现次数

说明onFormat+0{版本}1rmat

为N

可以对数据集进可选项,最

在线访问地址,按照RFC

在线访问地址行在线访问或获online字符串online大出现次数

2396规定填写

取的信息为N

5

DB50/T1096.2—2021

表4(续)

核心元数据内容定义英文名称数据类型取值规则/子元素短名约束性

数据集分类=类目名可选项,最

datasetCdataCa

数据集分类数据集的分类信息复合型称+类目编码+分类大出现次数

ategoryt

标准为N

说明数据集产生的处

environm可选项,最

理环境,包括软件、计envDes

相关环境说明entDescr字符串自由文本大出现次数

算机操作系统、文件名c

iption为1

和数据量等

可选项,最

提交元数据并对元数metadatamdCont

元数据负责方复合型自由文本大出现次数

据负责的部门和单位Contactact

为N

metadata可选项,最

执行的元数据标准名mdStdN

元数据标准名称Standard字符串自由文本大出现次数

称ame

Name为1

metadata可选项,最

执行的元数据标准版mdStdV

元数据标准版本Standard字符串自由文本大出现次数

本er

Version为1

metadata按照GB/T7408规可选项,最

mdDate

元数据更新日期更新元数据的日期DateUpda日期型定,格式应当为大出现次数

Upd

taYYYY-MM-DD为1

4.6畜牧兽医行业数据集参考元数据

畜牧兽医行业数据集的参考元数据由7个元数据子集构成:

a)中文名称:根实体元数据

b)定义:畜牧兽医行业数据集参考元数据的根实体

c)英文名称:metaData

d)数据类型:复合型

e)短名:metaData

f)子元素:元数据=

元数据标识信息+

数据集标识信息+

内容信息+

0{分发信息}1+

0{数据质量信息}n+

0{限制信息}n+

0{维护信息}1

每个参考元数据子集的说明见表5。

6

DB50/T1096.2—2021

表5畜牧兽医行业数据集的参考元数据子集说明

参考元数据子集定义英文名称数据类型子元素短名约束性

元数据标识信息关于元数据本metaDataId复合型元数据标识信息=mDIdI必选项,最

身的基本信息entificati元数据创建日期+nfo大出现次数

onInfo数据集标识符+为1

0{元数据负责方}n+

0{元数据更新日期}1+

0{元数据标准名称}1+

0{元数据标准版本}1+

数据集标识信息元数据所描述datasetIde复合型数据集标识信息=dataI必选项,最

的数据集的基ntificatio数据集名称+dInfo大出现次数

本信息nInfo数据集标识符+为1

0{目的}1+

0{可信度}n+

1{数据集提交或发布

方}n+

1{关键词说明}n+

1{数据集语种}n+

1{数据集分类}n+

0{相关环境说明}1

内容信息数据集内容特content复合型内容信息=cont必选项,最

征的描述信息数据集摘要+大出现次数

0{数据集特征数据元}1+为1

0{数据获取手段}1+

0{数据描述对象}n+

分发信息提供数据集的distributi复合型分发信息子集=distI可选项,最

分发格式和分onInfo0{数据集发布格式}n+nfo大出现次数

发方式的信息0{数据集发布日期}n+为1

0{在线访问地址}n+

0{离线发布介质}n

数据质量信息提供数据集质dataQualit复合型数据质量信息=数据志说明dataQ可选项,最

量的总体评价yInfouaInf大出现次数

信息o为N

限制信息对数据集和元dataConstr复合型限制信息=dataC可选项,最

数据进行访问aints0{数据集限制信息}n+onst大出现次数

和使用的限制0{元数据限制信息}n+为N

信息

维护信息对数据集或元maintenanc复合型维护信息=maint可选项,最

数据进行更新eInfo0{数据集维护信息}n+Infot大出现次数

与维护的有关0{元数据维护信息}n+为1

信息

7

DB50/T1096.2—2021

4.7元数据著录

用户针

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论