下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS35.240.20
CCSL67
DB23
黑龙江省地方标准
DB23/T3211—2022
“互联网+监管”系统大数据中心
数据质量规范
2022-05-09发布2022-06-08实施
黑龙江省市场监督管理局发布
Ⅰ
DB23/T3211—2022
前言
本文件按照GB/T1.1-2020给出的规则起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。
本文件由黑龙江省营商环境建设监督局提出并归口。
本文件主要起草单位:黑龙江省营商环境建设监督局、黑龙江省政务大数据中心、黑龙江省标准化
研究院、天阳宏业科技股份有限公司。
本文件主要起草人:王艳、阚洪锦、姜虹、景艳馥、彭雪松、刘晓华、刘晨鑫、王增仁、赵成立、
郑辉、陈要武、杨大志、吕猛、王磊、李严、王艳君、刘思妤、张敬。
Ⅰ
DB23/T3211—2022
“互联网+监管”系统大数据中心数据质量规范
1范围
本文件规范了黑龙江省“互联网+监管”系统的数据汇聚过程中对数据质量要求与非标准数据的反
馈流程。
本文件适用于黑龙江省“互联网+监管”系统大数据中心的数据质量工作。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
DB23/T2832-2021“互联网+监管”系统监管数据规范第1部分:监管基础数据
DB23/T2833-2021“互联网+监管”系统监管数据规范第2部分:监管行为数据
DB23/T2834-2021“互联网+监管”系统监管数据规范第3部分:监管辅助数据
3术语和定义
下列术语和定义适用于本文件。
3.1
“互联网+监管”系统大数据中心
按照国家“互联网+监管”系统相关数据标准,汇聚本省监管数据,建设监管数据中心,形成各类
监管数据库,建立数据动态更新机制,不断提高数据质量,满足数据上报、共享、分析等需要。
3.2
数据质量
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度,确保数据的及时性、完整性、
准确性。
3.3
数据安全
数据的安全性、完整性和可用性。
4数据质量
4.1目标与范围
按照DB23/T2832-2021、DB23/T2833-2021和DB23/T2834-2021的规定执行。对汇聚上报的数据进
行抽取、清洗、去重、比对、校核、标准化转换、关联整合等处理并且依据治理规则进行数据治理,提
升并入省“互联网+监管”系统大数据中心基础库的数据质量。
1
DB23/T3211—2022
4.1.1质量目标
保证数据安全,实现数据资源在省“互联网+监管”系统的各应用系统应用以及在各市(地)的数
据共享。
4.1.2数据范围
从中省直部门、各市(地)汇聚的监管对象、监管行为、执法人员、信用信息、投诉举报、互联网
及第三方机构数据、双随机一公开计划等监管相关数据。
4.2工作说明
数据质量的主要工作是针对接入的数据启动数据治理,对于发现的数据质量问题,要启动错误数据
反馈流程,协同中省直部门和各市(地)的数据源方共同处理。
为了中省直部门、各市(地)上报的数据完整、可用,通过数据治理处理过的数据问题,能够自动
并及时反馈给中省直部门、各市(地),中省直部门、各市(地)获取到数据质量报告后及时重新把相
应数据完善再进行上报。
4.3工作流程
4.3.1工作流程图
“互联网+监管”系统数据汇聚工作流程,见图1。
图1数据汇聚工作流程示意图
4.3.2数据采集入库
2
DB23/T3211—2022
汇入省“互联网+监管”系统大数据中心的数据,纳入数据治理的范畴。中省直部门、各市(地)
通过省政务信息共享交换平台实现监管数据发布,省“互联网+监管”系统通过订阅获取监管数据,然
后将中省直部门、各市(地)的监管数据加载进入省“互联网+监管”系统的汇聚库。
4.3.3数据质量核查
监管数据进入监管数据汇聚库后,对每类数据配置治理规则,对于接入的数据,启动质量核查流程。
将通过质量检核的监管数据进入大数据中心主题库和专题库,并将数据质量检核的过程及结果生成检核
结果记录表留存至省“互联网+监管”系统上;对于质量检核未通过的错误数据进行标识并生成错误数
据表,在汇聚库进行数据治理后的错误数据进入数据治理错误库。
4.3.4数据治理核查规则
监管数据从监管数据汇聚库进入监管大数据专题库和主题库时,按照DB23/T2832-2021、DB23/T
2833-2021和DB23/T2834-2021规定执行。
4.3.5错误数据反馈
治理后的的错误数据标识针对中省直部门、各市(地)通过服务注册进行数据服务发布,由相应的
中省直部门、各市(地)进行订阅。中省直部门、各市(地)订阅接收到该错误数据后,进行核对处理,
并及时再汇聚上报正确的监管数据。
4.3.6错误数据订阅
4.3.6.1中省直部门、各市(地)都有一张对应的数据治理错误库表,在省政务信息共享平台订阅该
数据资源目录,获取到错误数据反馈情况。监管数据治理错误表(见表1)。生成需要治理的数据记录
后,及时完成这些错误数据的修订并再次汇聚上报到省“互联网+监管”系统。
表1监管数据治理错误表
序号字段名中文名称数据格式必填项备注
1cd_lsh自增流水号N20是自行插入
2table_name数据表名C255是存在错误数据的数据表名
错误数据原来的主键编码(原值),方便各部门查询到
3cd_id原数据主键编码C64是
原数据
4org_code部门编码C50是数据来源部门编码
5cd_source数据来源系统编码C64是数据来源的系统编码
6cd_batch数据批次号C32是批次号
7cd_time数据增量时间DateTime是错误数据入库时间
8error_detail错误原因Text是错误数据描述信息
9create_time错误数据治理时间DateTime是错误数据治理时间
省“互联网+监管”系统应每天统计数据治理错误库表,统计每天有多少条不符合治理规则的数据,
按照数据来源系统、部门、数据增量时间分组将统计结果存入省“互联网+监管”市(地)工作进展情
况统计表。不合格监管数据统计表(见表2)。
3
DB23/T3211—2022
表2不合格监管数据统计表
序号字段名中文名称数据格式必填项备注
1area_number区划编码C6是数据来源部门所属区划编码
2area_name区划名称C150是数据来源部门所属区划名称
3org_code部门编码C50是数据来源部门编码
4org_name部门名称C150是数据来源部门名称
5cd_source数据来源系统编码C64是原数据中字段
6invalid_count不合格数据条数N10是所有数据类型的不合格
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年师德师风知识问答测试题及答案
- 2026年山东招远期末测试题及答案
- 2024年消防文员考试公基专项试题及答案 快速提分神器
- 2023年河南中招考试各科试题及答案刷完稳进重点高中
- 2022护理规培结业考伤口换药必刷试题及答案
- 全是考点2024年电工电子专业高频错题题库及答案解析
- 2023年燃气用户检修工零基础备考模拟题及逐题答案详解
- 2025年高级水暖工资格证考试必刷真题附详细答案
- 2025年幼师同工同酬笔试高分答题模板+配套真题答案
- 拒绝签署债权协议书的情形
- 小学生道德与法治评价方案+评价表
- 2019年湖南省长沙市中考历史试题及答案
- 天津机电职业技术学院教师招聘考试历年真题
- 林教头风雪山神庙 全国优质课一等奖
- 湘版(2017秋)4年级下册实验报告单
- 内部审计如何为管理者服务(一)
- 领导干部的法治思维与法治方式
- 七年级劳动技术-变废为宝课件
- 《纸的发明》优秀课件4
- 组合与组合数课件
- 县委、县政府法律顾问合同
评论
0/150
提交评论