T-CESA《基于区块链的生态环境数据共享交换 第2部分:数据要求》_第1页
T-CESA《基于区块链的生态环境数据共享交换 第2部分:数据要求》_第2页
T-CESA《基于区块链的生态环境数据共享交换 第2部分:数据要求》_第3页
T-CESA《基于区块链的生态环境数据共享交换 第2部分:数据要求》_第4页
T-CESA《基于区块链的生态环境数据共享交换 第2部分:数据要求》_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240.01

CCSL70

团体标准

T/CESAXXX.2—202X

基于区块链的生态环境数据共享交换

第2部分:数据要求

Blockchain-basedecologicalenvironmentdatasharingandexchange-

Part2:Datarequirements

征求意见稿

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申请

证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利申请

号和申请日期。

发布

202X-XX-XX202X-XX-XX实施

中国电子工业标准化技术协会发布

T/CESAXXX.2—202X

目次

前言.................................................................................III

引言..................................................................................IV

1范围.................................................................................5

2规范性引用文件.......................................................................5

3术语和定义...........................................................................5

4缩略语...............................................................................6

5数据质量要求.........................................................................6

5.1数据属性和功能要求...............................................................6

5.2数据信息描述要求.................................................................6

6数据目录编制要求.....................................................................7

6.1目录编制流程要求.................................................................7

6.2数据目录梳理要求.................................................................8

6.3数据目录分类要求.................................................................8

6.4数据目录发布和更新...............................................................9

附录A(规范性)......................................................错误!未定义书签。

参考文献..............................................................错误!未定义书签。

II

T/CESAXXX.2—202X

基于区块链的生态环境数据共享交换第2部分:数据要求

1范围

本文件规定了用于区块链的多源数据共享交换的数据存储形式、数据格式、数据目录编制、数据汇

集、数据完整性和安全性等数据处理规范。

本文件适用于设计、研发、实施、应用、评估生态环境数据共享交换的机构的环境信息数据共享交

换活动。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T18391.3—2009信息技术元数据注册系统(MDR)第3部分:注册系统公共设施元模型

GB/T35274—2023信息安全技术大数据服务安全能力要求

HJ720—2017环境信息元数据规范

3术语和定义

GB/T18391.3—2009、GB/T35274—2023界定的以及下列术语和定义适用于本文件。

3.1

公共数据publicdata

国家机关、法律法规规章授权的具有管理公共事务职能的组织,在依法履行职责和提供公共服务过

程中,所获取和产生的数据资源以及法律、法规规定纳入公共数据管理范围的其他数据资源。

3.2

元数据metadata

又称中介数据、中继数据,为描述数据的数据(dataaboutdata),主要是描述数据属性(property)

的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。

3.3

数据目录datacatalog

以核心元数据为主要描述方式,按照资源分类体系对公共数据进行有序排列的一组信息,用以描述

公共数据的特征,以便对公共数据进行检索、定位与获取。

[来源:GB/T18391.3—2009,3.2.18]

3.4

数据安全datasecurity

5

T/CESAXXX.2—202X

通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。

[来源:GB/T35274—2023,3.17]

3.5

数据格式dataformat

数据保存在文件或记录中的编排格式。可为数值、字符或二进制数等形式。由数据类型及数据长度

来描述。

3.6

专题库/数据表thematicdatabase/table

对治理后的数据进行专项分类形成可应用的库/表。

4缩略语

下列缩略语适用于本文件。

DBMS:数据库管理系统(DatabaseManagementSystem)

ETL:提取,转换和加载(Extract,Transform,andLoad)

JSON:JavaScript对象表示法(JavaScriptObjectNotation)

XML:可扩展标记语言(ExtensibleMarkupLanguage)

5数据质量要求

5.1数据属性和功能要求

a)数据类型:每个字段的数据类型,如字符串、数字、日期等;

b)数据格式:每个字段的数据格式,如字符串的最大长度,数字的单位、精度、小数位、最大值,

日期的格式等;

c)数据范围:每个字段的数据范围,比如字符串的可能值、数字的可能值、日期的可能值等;

d)数据完整性:每个字段是否必填、是否可以为空等;

e)数据一致性:每个字段的数据是否需要和其他字段的数据保持一致;

f)数据安全性:每个字段的数据是否需要加密或者做其他安全处理;

g)数据可追溯性:每个字段的数据是否需要记录更改历史以便追溯;

h)数据可查询性:每个字段的数据是否需要支持查询,比如按日期范围查询等;

i)数据可统计性:每个字段的数据是否需要支持统计,比如按日期范围统计等。

5.2数据信息描述要求

5.2.1数据来源说明

a)数据的形式方式是否部门自建的数据信息系统;

b)数据是否来自行业主管部门统建的数据信息系统;

c)数据是否由边缘终端设备采集。

5.2.2数据存放形式要求

a)数据库存储:数据存储的具体类型MySQL,PostgreSQL,Oracle,SqlServer等;

6

T/CESAXXX.2—202X

b)大数据存储:数据存储形式分为分布式文件系统,列式存储数据库,图形数据库,内存数据库,

对象存储等;

c)数据云存储:数据存放的云名称,地址等;数据存放的方式:文件存储、块存储、列式存储等。

5.2.3数据记录内容说明

数据系统内容说明应明确反映信息的全面性、及时性和准确性。说明内容包含以下要素:

a)数据系统名称;

b)系统所属部门;

c)系统所用数据库类型,容量,数据量等情况;

d)系统功能、服务简介;

e)系统所属项目信息;

f)系统启用日期;

g)系统状态,包括建设中、运行中、停用等;

h)系统类型,包括办公运行系统、业务应用系统、门户网站、宣传微博/微信公众号等;

i)系统归口业务处室情况;

j)系统部署情况,包括自建机房、租用机房、政务云和第三方云等;

k)网络环境,包括政务内网、政务外网、互联网、业务专网等;

l)系统使用范围,包括国家、省、市、县(区)、企业、机构等;

m)系统访问地址;

n)建设层级,包括国家、省、市、县(区)、企业、机构等;

o)系统数据情况;

p)系统等级保护情况。

6数据目录编制要求

6.1目录编制流程要求

6.1.1数据目录编制流程

数据目录的编制流程依次为数据信息系统普查、数据目录梳理、数据目录审核以及数据目录管理。

首先进行数据的安全性审查,开展本部门非涉密信息系统普查,普查内容包括信息系统的数量、名称、属性等;

其次进行数据目录梳理,涵盖来自自建信息系统、统建信息系统以及未建信息系统的公共数据;接着由大数据

主管部门进行数据目录审核;最后进行数据目录管理,包括数据目录分类、发布和更新。具体见图1。

图1数据目录编制流程图

6.1.2数据信息系统普查

7

T/CESAXXX.2—202X

a)数据的密级设定;

b)数据的来源;

c)数据操作权限;

d)数据的公开权限;

e)数据是否进行目录编制;

f)数据目录的公开范围。

6.2数据目录梳理要求

开展本部门数据目录梳理,梳理内容包括数据名称、数据项、共享属性、开放属性等。

6.2.1梳理范围

数据目录梳理范围包括行业主管部门统建的信息系统、本部门自建的信息系统和未建信息系统的公共数据。

6.2.2梳理内容

数据目录梳理应保证数据目录要素完整、内容规范准确。数据目录梳理内容包含以下要素:

a)数据资源标识符;

b)数据名称;

c)数源单位;

d)数据摘要;

e)数据格式;

f)重点领域分类;

g)所属信息系统名称;

h)更新频率;

i)数据项描述:数据项名称,数据类型,数据长度,字段描述,共享属性,共享条件,开放属性,

是否主键,是否可为空,是否字典项;

j)创建日期;

k)修改日期。

6.2.3梳理内容

数据目录梳理模板和填写说明见附录A。

6.2.4梳理要求

a)涉及行业主管部门统建的信息系统,本部门应将行业主管部门已编制的数据目录直接纳入;

b)涉及本部门自建的信息系统,应结合信息系统开发过程中产生的规范性文档辅助进行梳理,根

据数据信息需求清单和数据库设计使用说明等材料重新整理数据库内容;

c)涉及未建信息系统的公共数据,应结合业务涉及的材料、表单等进行数据目录梳理。

6.3数据目录分类要求

6.3.1应用场景分类

根据数据应用场景分类形成基础库目录、专题库目录和重点领域目录等,具体分类和说明应符合表

1要求。

8

T/CESAXXX.2—202X

表1应用场景分类

分类说明

基础库目录包括环境法规目录、企业行为目录、登记信息库目录、环境监测记录目录等。

包括水资源监测目录、土壤监测目录、大气监测目录、固体废物和化学品处理信息目录、声

专题库目录

和辐射环境质量信息目录、执法信息目录、生活排放信息目录、交通排放信息目录等。

包括资源能源、生态环境、工业农业、生活服务、气象服务、预警发布、地理空间、机构

重点领域目录

团体、应急管理等。

6.3.2目录层级分类

根据目录层级分类形成主目录和子目录,具体分类和说明应符合表2要求。

表2目录层级分类

分类说明

包括政务、法规、登记信息、观测信息、执法信息、监测信息、数据分析信息、发展规划等机

主目录

构主要数据目录。

子目录包括下属机构的数据目录。

6.3.3共享属性分类

根据目录共享属性分类形成受限共享类目录、非共享类目录和无条件共享类目录,具体分类和说明应符合表

3要求。

表3共享属性分类

分类说明

列入受限共享类公共数据范围的,应说明理由,并提供有关法律、法规、规章依据。要求

使用受限共享类公共数据的,由同级公共数据和电子政务工作机构会同提供公共数据的机

受限共享类

构进行审核;审核同意的,开通相应访问权限。受限共享类公共数据可以经脱敏等处理后

向公共管理和服务机构提供,法律、法规另有规定的除外。

列入非共享类公共数据范围的,应说明理由,并提供有关法律、法规、规章依据。非共享类

非共享类

公共数据可以经脱敏等处理后向公共管理和服务机构提供,法律、法规另有规定的除外。

无条件共享类除受限共享类和非共享类之外的数据。

6.3.4开放属性分类

根据目录开放属性分类形成无条件开放类目录、受限开放类目录和禁止开放类目录,具体分类和说明应符合

表4要求。

表4开放属性分类

分类说明

无条件开放类数据是指法律、法规明确可以开放,以及除受限开放类和禁止开放类之外的数

无条件开放类

据。

受限开放类数据指涉及公民、法人和非法人组织,经过脱敏、授权后可以开放的数据,或无

受限开放类

条件开放将严重挤占基础设施资源,影响公共数据处理运行效率的数据。

禁止开放类禁止开放类数据指开放后损害国家安全、商业秘密、个人隐私的数据。

6.4数据目录发布和更新

9

T/CESAXXX.2—202X

6.4.1数据目录发布

将分类后的数据目录及时发布,数据目录上传至区块链。

6.4.2数据目录更新

本部门数据目录的更新与维护,更新记录会上传到数据存证区块链。

10

T/CESAXXX.2—202X

附录A

(规范性)

数据目录梳理表

A.1数据目录梳理模板

数据目录梳理模板见表A.1。

表A.1数据目录梳理模板

数数据项描述

重所

点属数是是

资数数数数更创修

领系据数数字共共开是否否

源据源据据新建改

域统项据据段享享放否可字

标名单摘格频日日

分名名类长描属条属主为典

识称位要式率期期

类称称型度述性件性键空项

A.2数据目录梳理模板填写说明

数据目录梳理模板填写说明见表A.2。

表A.2数据目录梳理模板填写说明

填写要素名称说明

定义数据目录的唯一且不变的标识字符。

数据类型字符型。

1.数据资源标识符

必选项;参照《政务信息资源目录编制指南(试行)》确定的代码结构规则,代

建议

码结构由前段码、后段码组成。

定义缩略描述数据目录内容的标题。

数据类型字符型。

2.数据名称

必选项;业务类数据目录命名为XXX信息,该类数据含系统、数据库、报表、业

建议

务办理记录、业务情况等业务信息;测控信息类数据命名为XXX空气监测信息,该

11

T/CESAXXX.2—202X

类数据为监测信息;其他类命名规则如数据名称涉及主表、子表、附表、X月、

正本、副本等在数据名称后添加括号表示,同部门同名数据若内容确实为不同数据,且

需要加以区分的,在前面加上系统名称简称作为前缀,用“-”连接系统名称与

数据名称。

定义提供数据的部门。

3.数源单位数据类型字符型。

建议必选项;该数据部门的规范简称。

定义对公共数据内容(或关键字段)的概要描述。

4.数据摘要数据类型字符型。

建议必选项;不少于20个字。

公共数据存在方式(可多选)。数源单位应尽可能提供可机读的电子格式及相关软件

版本信息,如只有纸质介质,应尽量提供电子扫描格式。数据格式,可采用但不限于:电

子文件的存储格式为OFD、wps、xml、txt、doc、docx、html、pdf、ppt等;电

子表格的存储格式为et、xls、xlsx等;数据库类的存储格式为Dm、

定义

KingbaseES、access、dbf、dbase、sysbase、oracle、sqlserver、db2等,同时

5.数据格式

应明确具体的数据库表结构定义(可细化至“数据项描述”元数据中);图形图像类

的存储格式为jpg、gif、bmp等;流媒体类的存储格式为swf、rm、mpg等;自描述格

式,由提供方提出其特殊行业领域的通用格式,如气象部门采用的“表格驱动码”格式。

数据类型字符型。

建议必选项;按定义的多种格式选择确定。

定义说明公共数据重点领域分类的信息。

6.重点领域分类数据类型字符型。

建议必选项;按定义的重点领域分类进行选择确定。

描述结构化数据中具体数据项的标题。适用于格式为数据库、电子表格类等的公

定义共

数据。

数据类型字符型。

12

T/CESAXXX.2—202X

7.1数据必选项;描述电子表格、数据库,以及具有结构化数据内容资源中的各数据项(字段)

项名称标题,采用中文表示,一般较为常用的像ID、IP这样的英文专有名词可采用英文表达,

7.数据项英文字母应使用大写,其他情况下不应出现英文表达。名称应简洁明了,不应超

描述过20个字符长度,数据项中涉及的字典项或特殊说明可在字段描述中进行描述。根据数据

建议

属性,关键数据项不应缺失,如涉及人员的信息应提供相对应的证件类型、身份证据号码

等数据项;涉及法人主体的信息应提供相对应的统一社会信用代码、企业名称等数据项;涉

及电子证照数据应按照国家证照目录规范要求提供相应数据项;全省范围的数据,应有

地区字段。

标明该数据项的数据类型,包括:字符型C、数值型N、货币型Y、日期型D、

7.2数据定义日期时间型T、逻辑型L、备注型M、通用型G、双精度型B、整型I、浮点型

类型F等。

数据类型字符型。

建议必选项;对应“数据项名称”逐一描述其数据类型。

标明该数据项在计算机中存储时占用的字节数,适用于结构化数据(数据库类、电

定义子表格类)。属于数据库类的,数据长度即该数据项对应的字段在数据库中的指定长度

7.3数据或默认长度;属于电子表格类的,估算该数据项内容字数的上限,并折算成字节数,

长度该字节数即为数据长度。

数据类型字符型。

建议可选项;对应“数据项名称”逐一描述其数据长度。

定义对重要数据项的含义进行解释、描述。

7.4字段数据类型字符型。

描述建议可选项。

定义标明公共数据的共享属性,包括无条件共享类、受限共享类、非共享类三类。

7.5共享数据类型字符型。

属性建议必选项;对每个数据项按定义的共享属性进行选择确定。

定义描述不同共享类型公共数据的共享条件。

数据类型字符型。

13

T/CESAXXX.2—202X

7.数据项7.6共享必选项;无条件共享类和受限共享类的公共数据,应注明使用要求,包括作为行政依据、

描述条件工作参考,用于数据校核、业务协同等;受限共享类的公共数据,应注明共享条件和共享

建议范围;对于非共享类的公共数据,应注明相关的法律、行政法规或党中央、国务院政

策依据。

定义标明公共数据的开放属性,包括无条件开放类、受限开放类、禁止开放类三类。

7.7开放数据类型字符型。

属性建议必选项;涉及个人、企业隐私的数据项不应对外开放,如身份证号码、联系电话等。

标明该数据项是否为数据表的主键,包括“是”和“否”,主键是数据表中的一

定义

7.8是否个或多个字段,用于唯一地标识表中的某一条记录。

主键数据类型字符型。

可选项;一条数据目录应有一个及以上主键,主键的数据长度不应大于255,已

建议

归集公共数据不应更换主键、增加主键和删除主键。

定义标明该数据项是否可以为空,即该字段是否为必填。包括“是”和“否”。

7.9是否数据类型字符型。

可为空可选项;按该类数据的业务理解,关键数据项不应为空,涉及自然人的应有姓名

建议和身份证号,且不应为空;涉及法人的应有名称和统一社会信用代码,且不应为

空。

定义标明该数据项是否为字典项,包括“是”和“否”。

7.10是否数据类型字符型。

字典项建议可选项;若该数据项预设填写内容选项,应填“是”。

定义公共数据所在的信息系统名称。

8.所属系统名称数据类型字符型。

建议必选项;若该公共数据无信息系统管理产生,应填“无”。

标明公共数据归集的频率,包括分钟级、小时级、每日、每周、每月、每季度、

定义

每半年、每年、不定期等。

9.更新频率

数据类型字符型。

建议必选项。

10.创建日期定义数源单位创建该数据目录的日期。

14

T/CESAXXX.2—202X

数据类型日期型,格式为CCYY-MM-DD。

建议必选项。

定义数源单位最新修改该数据目录的日期。

11.修改日期数据类型日期型,格式为CCYY-MM-DD。

建议必选项;数据目录首次创建时,修改时间默认等同于创建时间。

15

中国电子工业标准化技术协会

团体标准《基于区块链的生态环境数据共享交换第2部分:

数据要求》(征求意见稿)编制说明

一、工作简况

1、项目背景

2022年,《国务院关于加强数字政府建设的指导意见》明确提出创新数据管

理机制、深化数据高效共享、促进数据有序开发利用的新任务;2024年1月,国

家数据局联合十七部门印发《数据要素×”三年行动计划(2024—2026年)》,

将数据要素×绿色低碳列为重点行动之一,并提出“要提升生态环境治理精细化

水平,推进气象、水利、交通、电力等数据融合应用”以及“加强生态环境公共

数据融合创新,支持企业融合应用自有数据、生态环境公共数据等”。其中的关

键是做好跨部门、跨机构、跨地域的数据共享交换。习近平总书记特别指出,要

深化数字技术应用,构建美丽中国数字化治理体系,建设绿色智慧的数字生态文

明;同时,国家也先后出台了多项政策文件,确立了以生态环境数据为核心的生

态环境数字化建设思路。

区块链作为新一代信息技术的重要组成部分,因其去中心化、防篡改、可追

溯、多方互信等特性,为破除“数据孤岛”与“价值孤岛”,促进数据跨部门、

跨机构共同维护和利用提供了新的思路和模式。通过建立去中心化账本,实现分

布式记账、节点数据存储和不可篡改的分布信任机制,区块链成为多方协作、多

主体创建可信的共享数据账本的重要工具。近年来区块链技术在金融、政务、能

源、运输等领域的应用不断涌现,然而在生态环境领域区块链技术的应用仍不充

分,由于数据分散在不同部门和不同行业,数据标准不统一,质量不高,不利于

数据的整合、利用与挖掘。

制定基于区块链的生态环境数据共享交换数据要求具有重要意义,通过区块

链的分布式可信架构,可以保证数据所有权的追溯,使得对提供数据的质量更有

保证,后续数据产生收益的归属和分配更加明确有依据,激发用户提供更有价值

数据的动力,实现对数据开放共享规模不断扩展,类型不断丰富的正向推动。同

时,区块链对数据的严格记录与保护,保证数据操作的可信。综上,区块链与分

中国电子工业标准化技术协会

布式记账技术是开展数据共享交换的有效手段,通过建立、实施统一的数据共享

交换规范,能够有力的解决生态环境领域数据跨层级、跨部门、跨机构分散孤立

的问题。

基于此北京微芯区块链与边缘计算研究院联合多家国内机构在中国电子工

业标准化技术协会立项了《基于区块链的生态环境数据共享交换第2部分:数据

要求》,按照中国电子工业标准化技术协会2024年第六批团体标准制修订项目的

通知(中电标通〔2024〕017),北京微芯区块链与边缘计算研究院启动了《基

于区块链的生态环境数据共享交换第2部分:数据要求》(项目号CESA-2024-108)

的编制工作。

2、项目基本信息

本标准发起单位:北京微芯区块链与边缘计算研究院

本标准联合发起单位:北京生态环境监测中心、联通数字科技有限公司、北

京环丁环保大数据研究院、北京微芯感知科技有限公司、清华大学、生态环境部

环境规划院、北京工业大学

3.、编制过程

北京微芯区块链与边缘计算研究院于2023年3月成立了标准编制工作起草

小组,组织标准编制组织工作。标准编制工作起草小组在2023年5月积极组织筹

备和征集标准起草单位。经过近一个月的征集、评审和筛选,最终确定了标准起

草工作组的成员单位,成立了标准起草工作组。

标准起草工作组制定了标准编制工作计划、编写大纲,明确任务分工及各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论