DB32T4040.1-2021政务大数据 数据元规范 第1部分:总则_第1页
DB32T4040.1-2021政务大数据 数据元规范 第1部分:总则_第2页
DB32T4040.1-2021政务大数据 数据元规范 第1部分:总则_第3页
DB32T4040.1-2021政务大数据 数据元规范 第1部分:总则_第4页
DB32T4040.1-2021政务大数据 数据元规范 第1部分:总则_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.020

CCSL72

DB32

江苏省地方标准

DB32/T4040.1—2021

政务大数据数据元规范

第1部分:总则

BigDataofAdministrative—SpecificationforDataElements—

Part1:General

2021-05-14发布2021-06-14实施

江苏省市场监督管理局发布

DB32/T4040.1-2021

前  言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规

定起草。

DB32/T4040《政务大数据数据元规范》分为7个部分:

——第1部分:总则;

——第2部分:公共数据元;

——第3部分:综合人口数据元;

——第4部分:综合法人数据元;

——第5部分:社会信用数据元;

——第6部分:电子证照数据元;

——第7部分:自然资源和空间地理数据元。

本文件为《政务大数据数据元规范》的第1部分。

本文件由江苏省大数据管理中心提出。

本文件由江苏省政务服务管理办公室归口。

本文件起草单位:江苏省政务服务管理办公室、江苏省大数据管理中心。

本文件主要起草人:赵明、陈俊、宋裕官、何正庆、王旭、徐建荣、刘瑛、韩骉、邱玉婷、杨坤、

尤慧、朱小燕、朱珠、姚丹、刘伟、王子文、刘晓红、纪雅莉、张献彬、张永丽、张媛媛、张树楠。

II

DB32/T4040.1-2021

政务大数据数据元规范第1部分:总则

1范围

本文件规定了政务数据元(以下简称数据元)的概念和组成、数据元和代码集的表示规范、数据元

的设计方法、数据元的维护和扩展方法、数据元的使用方法。

本文件适用于政务数据元的编制、使用和扩展。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T18391.1—2009信息技术元数据注册系统(MDR)第一部分:框架

GB/T19488.1—2004电子政务数据元第1部分:设计和管理规范

GB/T35295—2017信息技术大数据术语

3术语和定义

下列术语和定义适用于本文件。

3.1

数据data

信息的可再解释的形式化表示,以适应于通信、解释或处理。

注:数据可以由人工或自动的方式加工、处理。

[来源:GB/T18391.1—2009,3.2.6]

3.2

大数据bigdata

具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含

大量数据集的数据。

注:国际上,大数据的4个特征普遍不加修饰地直接用volume、variety、velocity和variability予以表述,并

分别赋予了它们在大数据语境下的定义:

a)体量volume:构成大数据的数据集的规模;

b)多样性variety:数据可能来自多个数据仓库、数据领域或多种数据类型;

c)速度velocity:单位时间的数据流量;

d)多变性variability:大数据其他特征,即体量、速度和多样性等特征都处于多变状态。

[来源:GB/T35295—2017,2.1.1]

3.3

数据元dataelement

由一组属性规定其定义、标识、表示和允许值的数据单元。

注:数据元在特定的语义环境中被认为是不可再分的最小数据单元。数据元一般来说由对象类、特性和表示三部分

组成:

1

DB32/T4040.1-2021

a)对象类:思想、概念或真实世界中的事物的集合,它们具有清晰的边界和含义,其特征和行为遵循同样的

规则。对象类是人们希望研究、搜集和存储它们的相关数据的事物;

示例1:汽车、人、房屋、订单等。

b)特性:对象类中的所有成员共同具有的有别于其他的、显著的特征。特性是用来区分和描述对象的手段;

示例2:颜色、性别、年龄、收入、地址等。

c)表示:描述了数据被表达的方式,表示与数据元的值域关系密切。一个数据元的值域指数据元的所有允许

值的集合。

示例3:对于“个人所得税金额”这个数据元,它的值域可以是一系列非负整数(带有货币单位),这是一种

非枚举型的值域,而“个人所得税比率”对收入进行分段划分,并给每一段赋予一个比率,它的值域就

是这些比率的集合,此时称它的值域为枚举型值域。

[来源:GB/T18391.1—2009,3.3.8,有修改]

3.4

元数据metadata

定义和描述其他数据的数据。

[来源:GB/T18391.1—2009,3.2.16]

3.5

属性attribute

某个对象或实体的一种特性。

[来源:GB/T18391.1—2009,3.1.1]

3.6

值域valuedomain

允许值的集合。

[来源:GB/T18391.1—2009,3.3.38]

3.7

注册registration

一个管理项与其管理部门的关系。

[来源:GB/T18391.1—2009,3.3.31]

3.8

政务部门administrativeorganization

政府部门及法律法规授权具有行政职能的事业单位和社会组织。

3.9

管理部门responsibleorganization

标准化行政主管部门授权对政务数据元实施注册、维护和管理功能的组织。

3.10

应用部门applicationsorganization

因履行职责需要使用其他政务部门(3.8)的政务信息资源和为其他政务部门(3.8)提供政务信

息资源的政务部门(3.8)。

4数据元和代码集的表示规范

4.1数据元的属性概述

数据元的表示规范是通过对其一系列属性的描述来实现的,这些属性即是数据元的元数据。表1

给出了数据元的六大类属性。

2

DB32/T4040.1-2021

表1数据元的六大类属性

属性类别属性名称说明

内部标识符

中文名称

中文全拼

标识类属性中文首拼标识类属性是用于标识数据元的一类属性。

英文名称

版本

同义名称

定义

定义类属性对象类词定义类属性是描述数据元语义方面的一类属性。

特性词

分类方案

关系类属性分类方案值关系类属性是描述数据元之间相互关系的一类属性。

关系

表示词

数据类型

表示类属性数据格式表示类属性是描述数据元表示方面的一类属性。

值域

计量单位

状态

来源部门

管理类属性管理类属性是描述数据元管理与控制方面的属性。

管理部门

批准日期

附加类属性备注附加类属性是描述上述属性以外的其他属性。

4.2数据元属性的描述方法

下面的描述符是对数据元属性的描述:

a)名称

赋予数据元属性的标记,名称是唯一的,名称以字符型表示。

b)定义

属性的描述,可使一种属性与其他属性清晰地区别开来,定义以字符型表示。

c)约束

显示一个属性是始终还是有时出现的描述符,该描述符有必选和可选两个取值,前者表示该属性必

须出现,后者表示该属性是否出现可选。

d)出现次数

显示一个属性出现多少次的描述符,该描述符有以下四种情况:0∶1(表示不出现或出现1次),

0∶n(表示不出现或出现多次),1∶1(表示出现且仅出现1次),1∶n(表示出现1次或多次)。

e)类型

描述属性的所有取值的类型。

示例:字符、数值、日期、时间、日期时间和二进制。

f)规则

3

DB32/T4040.1-2021

数据元属性的命名和分配规则。

g)备注

与属性应用有关的注释。

4.3数据元标识类属性

4.3.1名称:内部标识符

定义:在一个管理部门内由管理部门自行分配的,与语言无关的数据元的唯一标识符。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:

内部标识符由14位阿拉伯数字分4个部分组成,规则如下:

a)第一部分为信息资源分类码,用从01开始递增的两位阿拉伯数字表示,分为公共、综合人口、

综合法人、社会信用、电子证照、自然资源和空间地理6大类,表2给出了信息资源分类码;

表2信息资源分类码

序号信息资源分类代码

1公共01

2综合人口02

3综合法人03

4社会信用04

5电子证照05

6自然资源和空间地理06

b)第二部分为政务信息资源数据元的一级分类,用从01开始递增的2位阿拉伯数字表示;

c)第三部分为政务信息资源数据元的二级分类,用从00001开始递增的5位阿拉伯数字表示;

d)第四部分为二级分类下数据元的顺序码,用从00001开始递增的5位阿拉伯数字表示。图1给

出了内部标识符结构的表示方式;

图1内部标识符表示方式

e)内部标识符一旦赋予,将不被复用。

备注:无。

4.3.2名称:中文名称

定义:赋予数据元的单个或多个中文字词的指称。

4

DB32/T4040.1-2021

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:

a)在一定语境下数据元的名称应唯一;

中文名称由一个对象类词、一个特性词和一个表示词组成,其顺序为:中文名称=对象类词+

特性词+表示词;

b)中文名称中应只有一个对象类词、特性词和表示词;

c)当表示词与特性词有重复或部分重复时,可将名称中冗余词省略;

d)中文名称尽量与权威名称保持一致。

备注:无。

4.3.3名称:中文全拼

定义:数据元中文名称的汉语拼音。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:数据元的中文全拼是用“-”连接中文名称中的每一个汉字的拼音,全部用小写。

备注:无。

4.3.4名称:中文首拼

定义:数据元中文名称的汉语拼音的首字母。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:中文首拼全部使用大写字母。

备注:无。

4.3.5名称:英文名称

定义:赋予数据元的单个或多个英文字词的指称。

约束:可选。

出现次数:0∶1。

类型:字符型。

规则:英文名称优先采用权威来源。

备注:无。

4.3.6名称:版本

定义:用于本文件在正式发布后和下次修订发布期间,数据元应用部门和管理部门内部版本管理的

标识。

约束:可选。

出现次数:0∶1。

类型:字符型。

规则:

a)版本是由阿拉伯数字字符和小数点字符组成的字符型,本文件实施后,版本定为1.0。

5

DB32/T4040.1-2021

b)版本号变更的原则为:

1)数据元的必选属性发生变化时,无论非必选属性是否变化,则小数点字符前的数字字符加

1,小数点字符后的数字归0;

2)数据元的必选属性不变而非必选属性发生变化时,则小数点字符前的数字字符不变,小数

点字符后的数字加1。

示例:某数据元的版本号为1.0,当数据元第一次修订时,其必选属性发生变化而非必选属性不变,则该数据元的

版本为2.0;当该数据元第二次修订时,其必选属性不变而非必选属性发生变化,则该数据元的版本为2.1;

当数据元第三次修订时,其必选属性和非必选属性同时发生变化,则该数据元的版本为3.0。

备注:无。

4.3.7名称:同义名称

定义:一个数据元在不同应用环境下的不同称谓。

约束:必选。

出现次数:0∶n。

类型:字符型。

规则:无。

备注:一个数据元可以有多个同义名称。

4.4数据元定义类属性

4.4.1名称:定义

定义:是用描述性的短语或句子对一个数据元所作的解释。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:无。

备注:无。

4.4.2名称:对象类词

定义:数据元名称成分之一,表达了该数据元所属事物或概念的集合。

约束:可选。

出现次数:0∶1。

类型:字符型。

规则:无。

备注:标识出数据元的对象类词,有助于实现对数据元的规范化命名、分析、类比和查询等功能。

4.4.3名称:特性词

定义:用以表达数据元所属的对象类的某个显著的、有区别的特征。

约束:可选。

出现次数:0∶1。

类型:字符型。

规则:无。

备注:标识出数据元的特性词有助于对数据元的规范化命名、分析、类比和查询。

4.5数据元关系类属性

6

DB32/T4040.1-2021

4.5.1名称:分类方案

定义:根据数据元的来源、组成、结构、应用、功能等共同特性,将数据元排列或划分成组的模式。

约束:可选。

出现次数:0∶n。

类型:字符型。

规则:本文件中的数据元的“分类方案”均遵照4.3.1给出的分类方案。

备注:数据元可使用多种分类方案进行描述,以便于使用者从不同的角度进行查询和使用。每种分

类方案有一个标识符,不同的标识符代表不同的分类方案;数据元的分类原则和方法见GB/T7027。

4.5.2名称:分类方案值

定义:某个数据元在一个分类方案中所处的位置,用该数据元在此分类方案中的分类代码表示。

约束:可选。

出现次数:0∶n。

类型:字符型。

规则:本文件中的数据元的“分类方案值”均遵照4.3.1给出的分类方案值。

备注:分类方案和分类方案值之间存在一一对应关系。

4.5.3名称:关系

定义:关系用以描述当前数据元与其他相关数据元之间的关系。

约束:必选。

出现次数:0∶n。

类型:字符型。

规则:无。

备注:表3给出了数据元之间基本关系的数据格式,为更加通俗准确表示数据元的基本关系,其关

系数据格式采用中文描述和表3中的关系表示符共同表示。

表3数据元基本关系的数据格式

关系关系表示符关系描述示例

描述了数据元之间的继承关系,一个“Derive-fromB”(B是数据元的标识符,下同),

派生关系Derive-from较为专用的数据元是由一个较为通用表明当前数据元由数据元B派生而来。数据元“参

的数据元加上某些限定词派生而来。保人姓名”派生自数据元“姓名”。

“Compose-ofB,C,D”,表示当前数据元是由数

描述了整体和部分的关系,一个数据据元B,C,D共同组成。数据元“籍贯区划内详细地

组成关系Compose-of

元由另外若干个数据元组成。址”由数据元“籍贯区划”和数据元“详细地址”

组成。

“Replace-ofB”表明当前数据元替代了数据元B。

替代关系Replace-of描述了数据元之间的替代关系。

数据元“学历”替代了数据元“文化水平”。

“Link-withB,C,D”,表明当前数据元需要和数据

描述了一个数据元与另外若干数据元

连用关系Link-with元B,C,D一起使用。数据元“护照号码”与数据元

一起使用的情况。

“护照类型”连用。

4.6数据元表示类属性

4.6.1名称:表示词

7

DB32/T4040.1-2021

定义:表示词用于描述数据元值域的表示形式,表示词是数据元名称的组成成分之一。

约束:可选。

出现次数:0∶1。

类型:字符型。

规则:无。

备注:标识出数据元的表示词有助于实现数据元的规范化命名、分析、类比和查询。国际范围内认

可的表示词见表4。

表4国际范围内认可的表示词

表示词含义

金额货币单位的数量,通常与货币类型有关。

日期特定的年月日,格式参照GB/T7408。

日期时间特定的年月日中的特定时间点,格式参照GB/T7408。

代码表示一组值中的一个值的字符型(字母、数字、符号)。

表示一个人、客体、地点、事件或概念一系列句子,即可用于定义(通常用一两个句

描述子),也可用于较长文本。在数据元的中文名称中通常使用“说明”、“备注”、“意见”

等词。

表示一个人、客体、地点、事件或概念指定的一个词或短语。该词或短语是该人、客

名称

体、地点、事件或概念的称谓。

号码一个特定的值的数字表示,它通常暗示了顺序或一系列中的一个。

百分比具有相同计量单位的两个值之间的百分数形式的比率。

量非货币单位数量,通常与计量单位有关。

比率一个计量的量或金额与另一个计量的量或金额的比值。

指示符两个且只有两个表明条件的值,如on/off、true/false,又称标志。

4.6.2名称:数据类型

定义:用于表示数据元的符号、字符或其他表示的类型。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:无。

备注:表5包括了数据类型的可能取值列表,但不限于下表中所列。

表5数据类型的取值

数据类型说明

字符型(string)以字符包括字母、数字、汉字和其他字符形式表达的数据元值的类型。

数值型(numeric)用任意实数表达的数据元值的类型。

年(year)通过YYYY的形式表达的值的类型,符合GB/T7408。

年月(month)通过YYYY-MM的形式表达的值的类型,符合GB/T7408。

日期型(date)通过YYYY-MM-DD的形式表达的值的类型,符合GB/T7408。

日期时间型(datetime)通过YYYY-MM-DDhh:mm:ss的形式表达的值的类型,符合GB/T7408。

8

DB32/T4040.1-2021

表5数据类型的取值(续)

数据类型说明

时间型(time)通过hh:mm:ss的形式表达的值的类型,符合GB/T7408。

时间间隔型(timeinterval)通过nYnMnDnTnHnMns的形式表达的值的类型,符合GB/T7408。

布尔型(boolean)两个且只有两个表明条件的值,如on/off、true/false。

二进制型(binary)上述无法表示的其他数据类型,比如图像、音频等。

注:字符型采用GB13000中规定的字符,其中每个汉字用2个字节表示,其余每个字符用1个字节表示。

4.6.3名称:数据格式

定义:从业务的角度规定的数据元值的格式需求,包括所允许的最大和/或最小字符长度,数据元

值的表示格式等。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:无。

备注:政务数据元推荐使用的数据格式如表6,数据格式示例说明见表7。

表6数据格式字符和含义说明

数据格式字符符号含义

a英文字符(A-Z,a-z)。

c包含英文字符、数字字符、中文字符和特殊字符四种字符类型。

n数字字符(0-9)。

z中文字符。

t除了英文字符、数字字符、中文字符以外的特殊字符。

an英文字符(A-Z,a-z)和数字字符(0-9)。

m(m为自然数)表示长度为m个字符(字符集默认为GB/T2312)。

..ul长度不确定的文本。

..p,q(p,q均为自然数)最长p个数字字符,小数点后q位。

..从最小长度到最大长度,前面附加最小长度,后面附加最大长度。

”YYYY““MM”“DD”“YYYY”表示年份,“MM”表示月份,“DD”表示日期,“hh”表示小时,“mm”表

“hh”“mm”“ss”示分钟,“ss”表示秒,可视实际情况组合使用。

B布尔型,是/否,on/off,true/false。

BY二进制,图像、音频、WAN、RM、AVI、MPEG等二进制流文件格式。

Short短整数型。

Double双精度浮点型。

注:在系统建设中遇到数据格式为“..”时建议按最大值使用。

9

DB32/T4040.1-2021

表7数据格式示例说明

示例示例说明

a3固定长度为3位的英文字符。

n3固定长度为3位的数字字符。

c3固定长度为3位的任意字符。

z3固定长度为3位的中文字符。

an3固定长度为3位的英文数字字符。

a..3最多为3位的英文字符。

n..3最多为3位的数字字符。

c..3最多为3位的任意字符。

an..3最多为3位的英文数字字符。

an3..8表示最大长度为8,最小长度为3的不定长的字母数字字符。

数值型,小数点前最多为5位数字,小数点后保留2位数字,总长度最多为8位的数

n..5,2

字字符。

a..ul长度不确定的英文字符。

YYYY-MM-DDhh:mm:ss日期时间的某种表示方式。

4.6.4名称:值域

定义:值域是根据相应属性中规定的数据类型、数据格式而决定的数据元的允许值的集合。

约束:必选。

出现次数:0∶n。

类型:字符型。

规则:该集合可通过以下方式给出:

a)通过名称给出,即直接指出值域的名称,比如数据元“两字母国家代码”的值域是GB/T2659

中的全部两字母代码;

b)通过参考资料给出,比如数据元“产品条码”的值域是已经在物品编码中心注册的所有产品的

条形码;

c)通过一一列举的方式给出所有可能的取值以及每一个值对应的实例或含义;

d)通过数据元之间的逻辑关系给出值域范围,比如“结婚日期”的取值范围应大于“出生日期”

小于“死亡日期”;

e)通过真实世界的正常逻辑给出,比如“年龄”的取值范围应为0-150;

f)无要求。

备注:无。

4.6.5名称:计量单位

定义:属于数值型的数据元值的计量单位。

约束:必选。

出现次数:0∶1。

类型:字符型。

规则:无。

备注:计量单位的名称应符合GB/T17295《国际贸易用计量单位代码》中的计量单位名称。

4.7数据元管理类属性

10

DB32/T4040.1-2021

4.7.1名称:状态

定义:状态指数据元在其注册的全生存期(即生命周期)内所处状态的标示。

约束:可选。

出现次数:0∶1。

类型:字符型。

规则:本文件中的数据元的“状态”为其注册的全部生存期内所处的阶段。

备注:数据元在其注册的全部生存期内包括四种阶段:

a)草案:该数据元的内容处在草案阶段,相关单位和部门可以广泛提出意见和建议;

b)试用:该数据元的内容经过一定的技术程序,可以在一定范围内进行试用,并反馈实验意见;

c)标准:该数据元的所有内容已经成为各方应当遵守的标准;

d)废止:该数据元的内容即将从标准中删去。

4.7.2名称:来源部门

定义:产生或管理该数据元的机构或所属部门。

约束:必选。

出现次数:1∶n。

类型:字符型。

规则:无。

备注:无。

4.7.3名称:管理部门

定义:标准化行政主管部门授权对政务数据元实施注册、维护和管理功能的组织。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:管理部门应使用全称,本文件中的数据元的“管理部门”均为标准归口单位。

备注:无。

4.7.4名称:批准日期

定义:批准日期指数据元进入“标准”状态的日期。

约束:必选。

出现次数:1∶1。

类型:字符型。

规则:无。

备注:当数据元进入“标准”阶段时,该属性必选。日期的表示采用YYYY-MM-DD的格式。

4.8数据元附加类属性

名称:备注。

定义:备注用以描述数据元的附加注释。

约束:必选。

出现次数:0∶1。

类型:字符型。

规则:无。

备注:即上述属性未能描述的其他注释。

11

DB32/T4040.1-2021

4.9代码集标识符

代码集标识符由3个部分组成,规则如下:

a)第一部分:用“DM”表示代码集;

b)第二部分:信息资源分类码,用从01开始递增的2位数字表示,表1给出了信息资源分类码;

c)第三部分:顺序码,用从001开始递增的3位数字表示。

图2给出了代码集标识符的表示方式。

图2代码集标识符表示方式

5数据元的设计方法

5.1数据元和数据元属性的提取

5.1.1数据元的提取

数据元提取应采用面向对象的方法,通过业务功能建模、业务流程建模、信息建模、数据元的提取

和数据元的提交等步骤,分析研究各领域的业务流程,建立相应的信息模型,从信息模型中提取其对象

类和特性,再结合实际业务需求细化其表示,以构成完整的数据元。详细的提取步骤见GB/T19488.1

—2004中6.1.1。

5.1.2数据元属性的提取

对于需新增加的数据元,数据元提交者需要提交的数据元属性包括中文名称、英文名称、中文全拼、

中文首拼、同义名称、定义、关系、数据类型、数据格式、值域、计量单位、来源部门和备注等。详细

的提取步骤见GB/T19488.1—2004中6.1.2。

5.2数据元的分类规则

数据元常用的分类方法有以下几种:

a)按数据元本身的结构:对象类、特性和表示来划分;

b)按数据元使用的政府职能部门来划分:如教育、海关、公安、工商、税务等;

c)按数据元的应用分类:如基础公共类数据元、日常办公类数据元、人口管理类数据元、法人管

理类数据元、资源管理类数据元、信用管理类数据元等;

d)按电子政务服务的主体进行分类:如政府对政府、政府对企业、政府对公民、企业对政府、公

民对政府等。

5.3数据元的命名规则

5.3.1唯一性规则

12

DB32/T4040.1-2021

在一定语境下数据元名称应该唯一,名称中一般包括对象类词、特性词、表示词和限定词。

示例:在数据元“资格状态代码”中,“资格”为对象词,“状态”是该数据元的特性词,“代码”是该数据元的

表示词。

5.3.2语义规则

对象词表示数据元所属的事物或概念,它表示某一语境下一个活动或对象,它是数据元中占支配地

位的部分:

a)数据元名称中应有一个且仅有一个对象词;

b)特性词是表示数据元的对象类的显著的、有区别的特征;

c)数据元名称中应有一个且仅有一个特性词;

d)表示词是数据元名称中描述数据元表示形成的一个成分,它描述了数据元有效值集合的格式;

e)数据元名称中应有一个且仅有一个表示词;

f)当需要描述一个数据元并使其在特定的语境中唯一时,可以使用限定词对对象类词、特性词或

表示词进行限定,限定词是可选的。

示例:数据元“资格状态代码”和“标准名称”中,“资格”和“标准”是对象词,“状态”和“名称”是特性词。

5.3.3语法规则

语法规则如下:

a)对象词应处于名称的第一(最左)位置;

b)特性词应处于第二位置;

c)表示词应处于最后位置;

d)限定词可以附加到对象类词、特性词和表示词上,限定词应位于被限定成分的前面,限定词的

顺序的不同不能用于区别不同的数据元;

e)当表示词与特定词有重复或部分重复时,可以从名称中将冗余词删除。

示例:数据元“资格状态代码”和“标准名称”中,“代码”是“资格状态代码”的表示词,“名称”是“标准名

称”的表示词,由于表示词“名称”与特性词“名称”语义重复,因此删去一个冗余词“名称”。

6数据元的维护和扩展方法

6.1数据元维护策略

本文件兼容已经引用的国家和行业标准,同时定期跟踪国家和行业标准的最新版本。应用部门结合

实际的应用和数据需求引用本文件,并根据需求及时修订相应内容。

6.2新增数据元

将新获取的数据元与现有数据元进行比对,若没有对应的数据元,将新获取的数据元作为新增数据

元加入到数据元标准中,新增的方法和要求如下:

a)对于每一个新增加的数据元,应按照本文件第4章给出的属性规范方法和要求,至少规范其内

部标识符、中文名称、中文首拼、定义、数据类型、数据格式、值域(如有)、计量单位(如

有)、备注(如有)等属性;

b)对于在原数据元上派生(具体解释见4.5.3)的新增加的数据元,除内部标识符、名称、定义、

来源部门外,其他属性应于其原数据元保持一致;

c)对于在原数据元上组成(具体解释见4.5.3)的新增加的数据元,数据元的各属性应根据情况

编制并遵循6.2中a)的要求;

d)发布新增后的数据元标准。

13

DB32/T4040.1-2021

6.3变更数据元

数据元标准宜定期或根据应用的需要对数据元各属性进行变更,变更的内容、方法和要求包括但不

限于:

a)当新获取的数据元在已有的数据元标准中,找到与其定义相同的数据元,但数据元的称谓不同

时,将新获取的数据元的中文名称作为与它定义相同的数据元的同义名称加到属性描述中;

b)数据元的名称(包括中文名称和英文名称)、定义、来源部门等属性需定期根据权威的变更做

相应的调整;

c)需定期根据业务的变更,对值域为代码表的数据元的值域进行修订或扩充;

d)对可建立代码表的数据元的值域建立代码表,代替值域为自由文本的内容,对于新建的代码表,

应说明取值代码及其涵义;

e)对现有数据元实施更严格的可选性限制;

示例:增加新的属性限制。

f)发布变更后的数据元标准。

6.4废止数据元

当数据元发生变更时,将变更前的数据元定义为废止数据元,将废止数据元作为历史版本保存到数

据元历史库中。

7数据元的使用方法

政务部门在使用数据元时,有如下两种方式:

a)直接使用

政务部门可以直接使用数据元来开展数据库或信息交换格式的设计。

示例1:“联系电话”、“公民身份号码”等数据元可以直接使用。

示例2:

表8人口基本信息

列名中文描述数据类型(精度范围)空/非空是否主键说明

ID主键VARCHAR(36)非空是

直接引用公共数据元“公民

GMSFHM公民身份号码VARCHAR2(18)非空否

身份号码”

XM姓名VARCHAR2(100)非空否

XB性别VARCHAR2(12)非空否

直接引用公共数据元“联系

LXDH联系电话VARCHAR2(50)非空否

电话”

………………

注:表中的“公民身份号码”和“联系电话”为直接使用。

b)派生使用

不同政务部门根据自身的业务特点,对数据元中的对象类词或特性词进行限定,生成新的数据元。

示例1:对于公共数据元“年”,财政部门可以将其扩展为“财政年度”;对于公共数据元“姓名”,社会保障部门

可以将其扩展为“参保人姓名”。需要注意的是,派生后的数据元与原数据元相比,在定义、数据类型、

数据格式、值域等属性上不能出现矛盾的现象。

示例2:

14

DB32/T4040.1-2021

表9参保人信息

列名中文描述数据类型(精度范围)空/非空是否主键说明

ID主键VARCHAR(36)非空是

直接引用公共数据元“社会保

SHBZHM社会保障号码VARCHAR2(18)非空否

障号码”

CBRXM参保人姓名NVARCHAR2(100)非空否派生自公共数据元“姓名”

XB性别VARCHAR2(12)非空否

MZ民族VARCHAR2(10)非空否

………………

15

DB32/T4040.1-2021

参 考 文 献

[1]《国务院关于印发促进大数据发展行动纲要》(国发〔2015〕50号)

[2]《国务院关于印发政务信息资源共享管理暂行办法》(国发〔2016〕51号)

[3]《省政府关于印发江苏省政务信息资源共享管理暂行办法的通知》(苏政发〔2017〕133号)

[4]GB/T19488.2—2008电子政务数据元第2部分:公共数据元目录

_________________________________

16

DB32/T4040.1-2021

目  次

前  言...............................................................................................................................................................II

1范围...................................................................................................................................................................1

2规范性引用文件...............................................................................................................................................1

3术语和定义.......................................................................................................................................................1

4数据元和代码集的表示规范...........................................................................................................................2

4.1数据元的属性概述....................................................................................................................................2

4.2数据元属性的描述方法............................................................................................................................3

4.3数据元标识类属性....................................................................................................................................4

4.4数据元定义类属性....................................................................................................................................6

4.5数据元关系类属性....................................................................................................................................6

4.6数据元表示类属性....................................................................................................................................7

4.7数据元管理类属性..................................................................................................................................10

4.8数据元附加类属性..................................................................................................................................11

4.9代码集标识符..........................................................................................................................................12

5数据元的设计方法.........................................................................................................................................12

5.1数据元和数据元属性的提取..................................................................................................................12

5.2数据元的分类规则..................................................................................................................................12

5.3数据元的命名规则..................................................................................................................................12

6数据元的维护和扩展方法.............................................................................................................................13

6.1数据元维护策略......................................................................................................................................13

6.2新增数据元..............................................................................................................................................13

6.3变更数据元..............................................................................................................................................14

6.4废止数据元..............................................................................................................................................14

7数据元的使用方法.........................................................................................................................................14

参考文献.............................................................................................................................................................16

I

DB32/T4040.1-2021

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论