DB52∕T 1541.3-2020 政务数据平台 第3部分:数据存储规范_第1页
DB52∕T 1541.3-2020 政务数据平台 第3部分:数据存储规范_第2页
DB52∕T 1541.3-2020 政务数据平台 第3部分:数据存储规范_第3页
DB52∕T 1541.3-2020 政务数据平台 第3部分:数据存储规范_第4页
DB52∕T 1541.3-2020 政务数据平台 第3部分:数据存储规范_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.020

CCSL70

DB52

贵州省地方标准

DB52/T1541.3—2020

政务数据平台第3部分:数据存储规范

Governmentdataplatform—Part3:Datastoragespecification

2020-11-20发布2020-12-20实施

贵州省市场监督管理局发布

DB52/T1541.3—2020

目次

前言................................................................................II

1范围..............................................................................1

2规范性引用文件....................................................................1

3术语和定义........................................................................1

4数据分类和类型....................................................................2

5数据命名规则......................................................................2

6存储要求..........................................................................3

7数据入库..........................................................................4

8存储备份..........................................................................4

9存储安全..........................................................................5

I

DB52/T1541.3—2020

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起

草。

本文将是DB52/T1541的第3部分。DB52/T1541已经发布了以下部分:

——第2部分:数据归集规范;

——第3部分:数据存储规范。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由贵州省大数据发展管理局提出。

本文件由贵州省大数据标准化技术委员会归口。

本文件起草单位:贵州省机械电子产品质量检验检测院、贵州中软云上数据技术服务有限公司、云

上贵州大数据产业发展有限公司、信通达智能科技有限公司。

本文件主要起草人:唐昶、田野、宿睿智、肖然、王嘉卉、关艳梅、秦晓东、杨建国、叶海曦、

蒋朋兵、黄明峰、杨鹏、韦超、徐凯琳、郑如顺、杨建雄、邵建平、戚玉峰、赵飞、张洋、孙瑾。

II

DB52/T1541.3—2020

政务数据平台第3部分:数据存储规范

1范围

本文件给出了政务数据平台数据存储的数据分类和类型、数据命名规则,规定了数据的存储、入库、

备份和安全等要求。

本文件适用于政务数据平台数据的存储管理。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T22239-2019信息安全技术网络安全等级保护基本要求

3术语和定义

下列术语和定义适用于本文件。

3.1

政务数据平台governmentdataplatform

依托政务云计算平台搭建,承载政务数据并支撑数据统筹存储、统筹治理、统筹应用和统筹安全的

基础信息技术平台。

3.2

政务数据governmentdata

各级政务部门及其技术支撑单位在履行职责过程中依法采集、生成、存储、管理的各类数据资源。

注:根据可传播范围,政务数据一般包括可共享政务数据、可开放公共数据及不宜开放共享政务数据。

[来源:GB/T38664.1-2020,3.1]

3.3

结构化数据structureddata

一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用

关系模型予以有效描述。

[来源:GB/T35295-2017,2.2.13]

1

DB52/T1541.3—2020

3.4

半结构化数据semi-structureddata

具有结构性,但结构变化大,且难以用结构化数据的处理方法将其放进二维表的数据。

示例:XML文档内容,每项都被一对标记封起来,如<title></title>,表面上看是结构化数据,但<title></title>

之间的数据却是千变万化,这是典型的半结构化数据。

[来源:DA/T82-2019,2.8]

3.5

非结构化数据unstructureddata

不具有预定义模型或未以预定义方式组织的数据。

[来源:GB/T35295-2017,2.1.25]

3.6

对象存储服务objectstorageservice

政务云计算平台提供的可存放任意类型的海量、安全和高可靠的文件云存储服务。

4数据分类和类型

4.1数据分类

数据按其结构化程度及特征,分为结构化数据、半结构化数据、非结构化数据。

4.2数据类型

4.2.1结构化数据类型

结构化数据类型包括字符串类型数据,整数、浮点数、定点数类型数据,二进制数类型数据,日期

与时间类型数据,布尔型数据。

4.2.2半结构化数据类型

半结构化数据类型包括XML类型数据、JSON类型数据、HTML类型数据等。

4.2.3非结构化数据类型

非结构化数据类型包括所有格式的办公文档,各种文本、报表、图片、音频、视频等。

5数据命名规则

5.1基本要求

5.1.1具有唯一性,能单独成立。

5.1.2字段名称的字符采用26字母、0~9的自然数及下划线‘_’组成。

5.1.3不使用数据库关键字命名,如select、table、show、time、password等。

5.1.4宜使用普遍理解的英文单词,应尽量准确、简练。

2

DB52/T1541.3—2020

5.2结构化数据命名规则

5.2.1表命名

表命名结构见图1。命名规则如下:

a)表命名结构由提供数据部门简称首字母、“_”下划线、数据命名词组成;

b)数据命名词由英文单词组成,数量、长度不限。

图1表命名结构

5.2.2字段命名

5.2.2.1命名全部采用小写字母和数字组成,应以字母开头,长度不超过20个字符。

5.2.2.2应填写字段描述信息。

5.2.2.3不应重复表的名称。

5.3非结构化数据命名规则

非结构化数据以文件形式存储,命名组成:数据部门简称_文件命名词_日期.文件后缀。

示例:Sgat_Proposal_20200712.doc。

6存储要求

6.1基本要求

6.1.1应为单个机构提供独立逻辑存储空间。

6.1.2应具备可弹性伸缩、高可用的分布式对象存储服务的能力。

6.1.3应满足政务数据不同类型的服务使用需求,能为结构化、半结构化和非结构化类型数据提供不

同级别的存放策略。

6.1.4应创建不同类型的字段,根据用途和需求变化对字段进行增加、删除和修改操作,并提供数据

导入/导出和数据迁移功能。

6.2存储方式

6.2.1结构化数据统一存入数据库中,如存入MySQL、PGsql等。

6.2.2半结构化数据应转换成结构化数据统一存入数据库中。

6.2.3非结构化数据采用文件形式存储至对象存储服务中,并将文件基本属性、存储路径等描述信息

以结构化数据存入数据库中。

6.3存储格式

6.3.1应支持多种格式的内容数据存储。

6.3.2同一条记录可容纳一个或多个内容数据。

3

DB52/T1541.3—2020

6.4存储介质

6.4.1政务数据平台云存储介质包括云磁盘、高效磁盘、对象存储等。

6.4.2政务数据平台数据可在不同存储介质间转移。

7数据入库

7.1入库方式

7.1.1文件导入

通过政务数据平台在线文件上传功能,可将结构化数据文件导入到数据库中,一次导入可批量入库

多条记录;半结构化数据文件需转为结构化数据文件入库;非结构化数据文件仅将文件基本属性、存储

路径等描述信息以结构化数据文件入库。

7.1.2数据库同步

将关系型数据库中的数据,通过数据库采集功能同步至政务数据平台数据库中。一次可批量同步多

条记录。

7.2入库记录管理

7.2.1对入库数据的文件格式或数据库类型进行检查,对不支持的文件格式或数据库类型显示提示信

息。

7.2.2记录入库数据的数量、时间、处理人员等处理过程相关信息。

7.2.3监测和过滤错误数据,并记录数据入库产生的错误日志。

7.3数据检查

7.3.1入库前后数据类型、长度、数据量、数据信息项等应保持一致。

7.3.2应符合数据库规定的编码类型。

8存储备份

8.1备份内容

8.1.1应对数据库数据、数据库结构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论