版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS35.240.01CCSL67江苏省地方标准DB32/T4608.4—2026公共数据管理规范Specificationforthemanagementofpublicdata—Part4:Datagovernance2026‑02‑06发布2026‑03‑06实施江苏省市场监督管理局发布学兔兔提醒您此doc文档为同文件夹的pdf文档批量转换而来,未具体核查doc文档内容.内容以pdf为准.仅供有doc格式用户参考.如您不需要word版本的文档.下载后删除即可.ⅠDB32/T4608.4—2026前言 Ⅲ引言 Ⅳ1范围 12规范性引用文件 13术语和定义 14缩略语 25总则 26架构体系 37组织管理 48方法流程 59运行管理 910风险防控 11附录A(资料性)数据治理目标和内容示例 13附录B(资料性)数据模型命名与编码示例 14附录C(资料性)数据质量检查规则示例 17附录D(资料性)数据修正方法示例 18附录E(资料性)数据转换规则示例 19附录F(资料性)数据治理评价指标示例 20参考文献 21DB32/T4608.4—2026Ⅲ本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。本文件是DB32/T4608《公共数据管理规范》的第4部分。DB32/T4608已经发布了以下部分:——第1部分:数据分类分级;——第2部分:数据共享交换;——第3部分:数据开放;——第4部分:数据治理;——第5部分:数据异议处理。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由江苏省数据局提出并组织实施。本文件由江苏省数据标准化技术委员会归口。本文件起草单位:江苏省大数据管理中心、江苏省人力资源和社会保障厅、扬州市大数据管理中心。ⅣDB32/T4608.4—2026引言公共数据是公共管理和服务机构为履行法定职责、提供公共服务收集、产生的,以电子或者其他方式记录、保存的具有公共使用价值的信息记录。规范公共数据管理、保障公共数据安全,对推动数字政府建设、提升政府治理能力和公共服务水平具有重要意义。DB32/T4608《公共数据管理规范》旨在确立公共数据管理活动准则,由以下5部分组成。——第1部分:数据分类分级。目的在于确立公共数据分类分级的规则、方法、流程等,为数据应用和保护寻找平衡点提供指导。——第2部分:数据共享交换。目的在于指导开展省、市公共数据共享交换平台建设、管理和对接,规范各级公共管理和服务机构的数据接入、归集、交换共享等工作,建立健全全省一体化公共数据共享交换体系,促进全省数据高效共享和安全交换。——第3部分:数据开放。目的在于规范公共数据开放的原则、过程、安全等管理要求,为全省公共数据开放工作提供参考指导。流程、运行管理、风险防控等内容,为全省公共数据治理提供参考指导。——第5部分:数据异议处理。目的在于指导建立完善公共数据异议的“提出、受理、核实、处理、反馈、评价”的全流程闭环处理机制,实现异议数据的高效处理,在数据使用过程中不断提升数据质量和服务水平。DB32/T4608.4—20261公共数据管理规范本文件给出了公共数据治理的总则,规定了架构体系、组织管理、方法流程、运行管理、风险防控等内容与要求。本文件适用于公共管理和服务机构、数据主管部门、公共数据运行管理机构、从事公共数据治理的相关单位或个人开展数据治理工作。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。DB32/T4608.5公共数据管理规范第5部分:数据异议处理3术语和定义下列术语和定义适用于本文件。数据治理datagovernance提升数据的质量、安全、合规性,推动数据有效利用的过程。注1:数据治理是数据和数据系统管理的基本要素。注2:数据治理涉及数据全生存周期管理,无论数据是处于静态、动态、未完成状态还是应用状态。将原始数据转化为可用于行动的知识的一组过程。注:包含数据获取、存储、整合、分析、应用、呈现、归档和销毁等各种生存形态演变。[来源:GB/T35295—2017,2.1.2;GB/T34960.5—2018,3.7,有修改]数据架构dataarchitecture数据要素、结构和接口等抽象及其相互关系的框架。[来源:GB/T34960.5—2018,3.5]数据模型datamodel数据的图形或文字表示,指明其特性、结构和相互间关系。[来源:GB/T18391.1—2009,3.2.7]DB32/T4608.4—20262数据元dataelement由一组属性规定其定义、标识、表示和允许值的数据单元。[来源:GB/T18391.1—2009,3.3.8]数据质量dataquality在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。[来源:GB/T25000.12—2017,4.3]元数据metadata[来源:GB/T18391.1—2009,3.2.16,有修改]数据处理dataprocessing[来源:GB/T5271.1—2000,01.01.06,有修改]主数据masterdata组织中需要跨系统、跨部门进行共享的核心业务实体数据。[来源:GB/T36073—2018,3.12]参考数据referencedata对其他数据进行分类和规范的数据。[来源:GB/T36073—2018,3.13]4缩略语下列缩略语适用于本文件。ADS:数据应用层(ApplicationDataStore)ODS:原始数据层(OperationalDataStore)DM:数据集市层(DataMart)DWD:数据明细层(DataWarehouseDetail)DWM:数据中间层(DataWarehouseMiddle)DWS:数据服务层(DataWarehouseService)5总则数据治理的整体目标是实现对数据生存周期的有效管理和控制,具体目标包括:a)价值实现:以实现数据价值或解决业务问题为目标,赋能数据共享、开放、授权运营等数据开发利用领域;b)运行持续:健全完善数据治理机制、流程、方法、规则等要素,保障数据治理常态化开展,数据资源底数清晰、管理有序,持续优化完善,逐步提高治理效能;DB32/T4608.4—20263c)合规可信:数据治理各项行为要符合国家法律法规及相关组织管理规定,业务流程和操作行为合规,数据治理实施环境安全可信,风险可预期可管控。数据治理要为业务的需求与创新发展提供支撑,主要原则如下:a)业务驱动:以业务为核心动力,按照业务目标和需求,在数据生命周期各阶段开展数据治理活动,数据赋能业务发展;b)客观合理:调研分析业务和数据的现状,相关信息客观真实,结合未来目标、当前条件(制度、资金、人员等因素)等情况开展数据治理工作;c)多方协同:数据治理涉及管理、业务、技术多方面主体或者不同层级的主体,各参与方职责明确,权责一致,协同配合共同开展数据治理工作;d)互联互通:治理形成的数据资源应互联互通,相关元数据、质量管理、异议处理等标准宜保持统一,能够支持数据共享、开放、授权运营等业务发展需求。6架构体系公共数据治理架构体系包括组织管理、方法流程、运行管理、风险防控等部分(见图1具体如下:a)组织管理包含组织架构、制度规范等,是数据治理实施的基础前提;b)方法流程包含调研分析、规划设计、实施执行等,具体明确现状、目标、工作内容等,并落地执行,是数据治理的具体方法措施、流程和规则;c)运行管理包含元数据管理、质量管理、运行监测、评价改进等,是保障数据治理的常态化运行和持续提升的手段;d)风险防控包含人员管理、业务管理、技术管理等,为数据治理提供底线防护。……图1公共数据治理架构体系图DB32/T4608.4—202647组织管理7.1数据治理组织架构参考GB/T44109—2024附录A,宜采用集中式治理组织架构,由决策层、管理层、执行层等组成,各岗位人员工作内容如下:a)决策层:本部门主要负责人、首席数据官等组成,统筹本部门数据治理工作,决策数据治理的组b)管理层:本部门数据共享、数据开放、数据授权运营等工作机构的负责人、联络人等组成,承担数据治理日常管理工作,如人员组织、制度规范编制、调研分析、规划设计、运行监测、评估评价等工作;c)执行层:数据治理实施操作人员组成,具体开展目录编制、数据采集、数据传输、数据存储、加工参考GB/T44109—2024附录A,宜采用混合式治理组织架构,同一层级部门间跨部门数据治理组织架构按照行业主管部门、数据主管部门、公共数据运行管理机构划分,工作内容如下:a)行业主管部门统筹制定本行业公共数据治理制度规范,推动本行业公共数据源头治理,明确本行业数据质量标准,做好常态化数据资源更新维护,确保数据准确、完整、及时、有效,汇聚数据资源至公共数据运行管理机构,及时处理本部门数据异议;b)数据主管部门统筹制定本区域内数据治理制度规范,统筹数据资源整合共享和开发利用,监督评价行业主管部门数据质量,以及数据共享、开放、授权运营工作开展成效;c)公共数据运行管理机构建设跨层级、跨地域、跨部门、跨业务、跨系统的数据互联互通机制和能力,协同行业主管部门开展数据综合治理、数据共享开放、数据异议处理等运行管理工作,监测行业主管部门源头数据治理、数据应用服务情况;d)行业主管部门和数据主管部门、公共数据运行管理机构协同构建沟通协调机制,共同推动数据全生命周期管理;e)同一层级行业主管部门之间数据治理、互联互通通过本层级公共数据运行管理机构实现。参考GB/T44109—2024附录A,跨层级的治理组织架构如下:a)行业主管部门:宜采用集中式治理组织或混合式治理组织,行业主管部门应统筹本行业数据治理制度规范,同一行业不同层级间数据可垂直流转或通过本层级公共数据运行管理机构流转;b)数据主管部门:宜采用混合式治理组织,上级数据主管部门统筹本区域内数据治理政策和制度规范,指导下一层级数据主管部门开展数据治理工作;c)公用数据运行管理机构:宜采用混合式治理组织,不同层级公共数据运行管理机构之间构建跨层级数据交互能力(如公共数据平台实现不同层级间公共数据的互联互通。7.2制度规范7.2.1参考GB/T44109—2024附录B,结合实际工作,制定相适应的管理制度和标准规范,并在其基础之上进一步细化制定数据建模、数据采集、数据传输、数据存储、数据归档、数据异议处理等活动的标准DB32/T4608.4—20265规范。7.2.2应定期检查、跟踪制度规范的执行情况,对发现存在的问题和不足,针对性地进行优化完善。8方法流程8.1调研分析开展数据治理调研分析,了解现状,明确数据治理目标和内容,确定实施路线,不同情况下的数据治理,其治理目标和内容、实施路线有所差异,典型示例见附录A。8.2规划设计8.2.1数据架构设计数据架构设计包括业务域及流程梳理、数据实体识别、数据分布确定、数据集成流向梳理、数据模型设计及应用等。各部分含义及具体内容详见GB/T44109,数据架构应能够对数据分层分域管理(数据分层和分域具有交叉性质实现流程控制、标准管理、血缘追溯、简化开发、提升质量等效果,典型的数据架构示例如图2所示。(数据应用层)(数据集市层)(数据服务层)(数据中间层)(数据明细层)(数据源层)图2典型数据架构图DB32/T4608.4—20266典型数据架构如下。a)数据源层(ODS也称为数据贴源层、原始数据层或数据准备区,提供原始数据存档、追溯等能力,通常包含多个数据源,汇聚多类业务领域、多个业务系统的数据,这些数据源通常具有不同的数据格式、结构、语义和质量,因此需要按照一系列规则进行去重、清洗、转换等处理后方可使用。DWD对原始数据进行去重、清洗、转换等处理,形成标准化的数据,符合业务应用需要;在该层级,要明确数据治理标准和规则,并做数据质量的监测和评估,通过质检的数据进入下一处理环节,未通过质检的数据视为异议数据,需反馈至数源部门核实处理。DWM该层级根据业务需要可选择性地构建,在DWD层的数据基础上,对数据做一些轻微的集成聚合操作,生成一些中间结果表,提升公共指标的复用性,减少重复加工的工作量或者减少计算资源消耗。d)数据服务层(DWS在DWD层(或DWM层)的基础上进行聚合、汇总和计算等加工处理,以满足各种业务需求和分析场景,是数据架构中的核心组成部分。在该层级,数据模型以业务应用为中心,根据业务流程和业务需求进行建模,以支持各种复杂的查询和分析操作,可以采用星型模型、雪花模型、多维模型、标签模型等多种建模方式。e)数据集市层(DM根据不同的需求,实现对数据的深加工,从DWS层中取出相关数据,按需加工处理,形成更贴近使用场景的数据子集。f)数据应用层(ADS面向业务应用和最终用户,为应用服务和业务系统提供数据接口和数据访数据资源分域可按照数据来源渠道、业务主题、需求方、应用服务等方式进行划分:a)按照数据来源渠道分域:根据数据来源的部门、地区或者信息系统等进行分域处理,每一个来源渠道划分一个数据域;b)按照业务主题分域:根据数据反映的业务内容、描述对象等特征划分,每一类主题划分出一个数据域,例如关于自然人的数据划分到“人口库”、关于组织机构的数据划分到“法人库”、关于时空物体的数据划分到“空间地理库”、关于困难群众民生关怀的数据划分到“困难群众帮扶专题c)按照需求方分域:根据数据资源的需求方进行分域,每一个需求方划分一个数据域;d)按照应用服务分域:根据数据应用服务渠道、服务领域等方式分域,例如可划分为数据共享、数据开放、授权运营等业务域;e)按照风险防控等级分域:按照数据安全保护需求,参考GB/T43697、DB32/T310030、DB32/T4608.1等标准,对数据划分“核心数据域、重要数据域、一般数据域”等级别,进行分域管理。数据模型基本要素数据模型描述的基本要素有以下:a)数据结构:描述数据的类型、内容、性质,以及数据之间的联系;b)数据操作:描述相应数据结构上的操作类型、操作规则、操作方式等;c)数据约束:描述数据结构之间的语法、词义联系,以及彼此之间的约束关系、约束条件,数据动态DB32/T4608.4—20267变化的规则。数据模型管理包含但不限于以下内容:a)数据模型命名:宜使用中文命名(可包含国际通用的外文单词或缩略语对应的数据库、数据表宜使用英文和数字混合命名,数据模型名称、数据表名称应保持唯一不重复;数据模型命名示例见附录B中B.1,数据库命名示例见B.2,数据表命名示例见B.3;b)数据模型编号:可采用合理位数的数字、字母混合编码,数据模型的编号应唯一;数据模型编码示例见B.4;c)数据模型描述:应准确说明数据模型的用途、适用范围等内容,并使其区别于其他数据模型,以便准确与应用场景匹配;d)数据模型维护:根据业务和数据变化实时对数据模型动态维护,实现数据模型的新增、变更、实施、消亡等全周期管理。数据建模流程包含但不限于:a)需求分析:分析业务流程、执行实体、业务规则、关联关系等信息,构建业务与数据之间的映射关系,确保数据模型与业务场景适配;b)概念模型:对业务逻辑、业务规则进行抽象和定义,描述实体(如学生、教师)、属性(如学号、地址)及关系(如张三是李四的数学老师实现现实世界到信息世界的映射转换;常见的概念模型有E-R模型、面向对象模型及谓词模型等;c)逻辑模型:在概念数据模型基础上进一步细化和精炼,根据需求对业务逻辑、业务规则进行更加清晰明确的定义和表示,描述数据的逻辑结构;常见的有层次逻辑模型、网状逻辑模型、关系逻辑模型、维度逻辑模型、面向对象模型等;d)物理模型:数据建模的最后一个阶段,具体实现数据模型,将逻辑数据模型转换为实现细节和物理存储结构的数据库表。应准确定义数据模型内的各数据元,数据元的定义和描述参照GB/T19488.1、GB/T19488.2、DB32/T4040.1、DB32/T4040.2等标准执行。8.3实施执行根据业务目标和内容,在获得合规授权的前提下,进一步确定数据采集的范围、内容、频率、数据类a)采集范围:数据覆盖的地域范围、时间范围等情况,数据采集范围不应超出业务需求;b)采集内容:被采集信息的主体的唯一标识(例如身份证号、统一社会信用代码)、地址、联系方式、日期时间等,采集数据内容不应超出业务需求,避免过度采集信息;能、技术方案有一定影响;e)采集方式:包括在线采集、离线采集、全量采集、增量采集等方式。DB32/T4608.4—20268根据业务分析情况,综合考虑采集数据的范围、内容、时效等要求,选择或建设符合业务需求的信息公共管理和服务机构应提供标准格式的、可访问的数据资源。执行数据采集任务应保持稳定运行,保证数据采集完整、准确、及时等基本数据质量。数据的发送端和接收端宜建立数据传输对账机制,及时比对传输的数据量、内容等基本要素,保证数据的完整、一致。传输过程中,对于需要进行保护的数据可采取完整性校验、加密等手段保障数据传输的完整性和安全性。根据业务需求,数据存储考虑数据量、数据类型、访问频次、读写性能、业务并发量、存储时长等要素,采用不同的存储机制和策略。对于需要保护的数据宜采取权限控制、数据加密、容灾备份等手段,保障数据合规操作,降低数据丢失、泄露等风险。数据做加工处理之前,宜先进行数据探查,了解数据结构、数据量、主数据、参考数据、数据关系等情况,确保实际数据与需求符合,如存在数据不符合需求的情况(如部分数据项缺失、数据量明显少于应有的规模、数据项与业务情况不一致等应及时处置后再进行下一步工作。8.3.5数据加工处理参考GB/T36344、GB/T19488.1、GB/T19488.2、DB32/T4040.1、DB32/T4040.2等标准,结合具体业务需要,从数据时效性、完整性、有效性、准确性、一致性、唯一性等维度制定数据质量检查规则。常见数据质量检查规则示例见附录C。根据数据质量检查规则,逐一检查数据。数据质量检查可能存在多次迭代情况,宜定期对数据质量检查规则合理性进行评估分析,及时调整和改进不符合实际情况的质量检查规则。相关数据若出现缺失、违规、重复、冲突等情况,应对问题数据进行修正。常见数据修正方法示例见附录D。相关数据若不符合数据处理、应用主体的现用标准,应对数据进行转换映射(例如格式、代码等使其符合需要。常见数据转换规则示例见附录E。根据业务需求、数据关系、主数据、参考数据情况进行数据关联融合、校核比对,形成符合业务需求的数据资源。注:该环节尤其注意对多源数据的校核比对,分析获得符合业务需求的数据。示例:离婚状态信息,应结合民政部门提供的结/离婚登记数据、法院提供的离婚判决数据,进行自然人离婚情况的比对关联,获得准确的离婚状态信息。DB32/T4608.4—202698.3.6公共数据开发利用按服务渠道划分按服务渠道可划分为数据共享、数据开放、授权运营等类型。按业务领域划分开发利用基于不同行业的业务需求、数据类型和应用场景进行分类,包括但不限于政治领域、经济领按功能目标划分按功能目标可划分为数据查询、数据核验、数据统计、数据分析、数据挖掘、机器学习等。8.3.7数据异议处理宜建立数据异议处理流程和协作机制,及时处理数据质检、应用等过程中发现的不符合预期的数据执行。对历史数据宜定期归档保存,所归档保存数据资源应明确说明覆盖的时间范围,保证数据完整、连续。对于超过保存期需要或者已无使用价值的数据应按照管理要求进行删除处理,明确删除方式、操作人员、监督人员、操作时间等必要要素,执行删除后宜进行复核,确保数据删除彻底,不可恢复。9运行管理9.1元数据管理9.1.1元数据分类元数据可分为以下几种类型:a)业务元数据:描述业务领域相关概念、关系和规则的数据,包括但不限于:数据(含数据集、数据口径等;b)技术元数据:描述技术领域相关概念、关系和规则的数据,包括物理模型的表与字段、ETL规则、集成关系、数据访问权限等;c)操作元数据:描述数据处理及运营情况的数据,包括数据处理日志、访问记录、调度任务记录、数据归档文件、数据备份等。9.1.2元数据管理内容元数据管理内容包含但不限于:a)元数据识别:识别并确定元数据及管理范围,包括技术元数据、业务元数据、管理元数据等;b)元数据创建整合:建立审核流程以验证元数据创建、维护的结果;根据元数据的特点进行多种方式采集和存储,并对不同来源、不同类型的元数据进行整合;c)元数据变更管理:建立元数据变更流程,以提升元数据的完整性、准确性和时效性,保障元数据DB32/T4608.4—2026的质量;元数据变更流程一般包括申请、审核、维护和发布四个阶段;d)元数据应用:依托采集整合的元数据,通过去重、冲突处理、关系还原等方式,开展链路分析、差异分析、热度分析、数据地图展示、数据资产发布等应用建设。9.2质量管理数据质量管理贯穿数据全周期各个环节,参考GB/T36344,常见数据质量评价维度有数据及时性、需要;b)完整性:指数据信息是否存在缺失,数据缺失的情况可能是整个数据记载缺失,也可能是数据中某个数据项(字段信息)的记载缺失;c)有效性:也称为规范性,指数据的值、格式和展现形式(数据的命名、长度、取值范围等)符合数据定义和业务定义的程度;d)准确性:指数据应真实、准确地记录客观世界信息,无虚假、错误的数据及信息;e)唯一性:指同一数据只能有唯一的标识符,度量数据是否重复,体现在一个数据集中,每个唯一实体有一个键值且该键值只指向该实体;f)一致性:指同一个数据在不同系统、不同库中的描述和相关属性应一致,不应存在差异或矛盾。9.3运行监测9.3.1数据业务运行监测数据业务运行监测侧重于数据全流程状态的跟踪,关注业务成效、数据质量、资源利用、合规性、连续a)某一数据生存周期运行情况监测:构建数据血缘关系,跟踪数据从采集到开发利用的全流程运行情况。例如,数据A在某天数据采集量、数据质检合格情况、应用服务量、业务成效等。b)数据治理某一环节全量数据运行情况监测:根据数据治理环节划分,了解某一环节上全量数据运行情况。例如监测数据采集情况,某一统计周期内数据汇聚总量。9.3.2信息系统运行监测信息系统运行监测侧重于工具平台本身运行状态监控,以便及时了解各工具平台是否正常运行,关注于某一个工作环节,主要内容如下:a)访问用户量:某一统计周期内,登录或操作信息系统的用户量;b)数据传输量:某一统计周期内,数据传输数量;c)调度任务执行状态:数据治理任务是否正常执行,完成既定任务;d)资源消耗量:信息系统所使用的主机CPU、内存、存储消耗情况;e)接口调用量:调用信息系统服务接口的次数。9.4评价改进参考GB/T44109、GB/T34960.3,结合数据治理目标、内容和工作实际,编制数据治理评价方案,从数据治理组织、制度、活动及成效等方面设计数据治理评价指标体系,评价指标示例见附录F。定期开展数据治理评价,宜每年不少于1次。可采用差异分析方式对制定的数据治理目标与实际执行取得的治理结果进行比较,分析两者之间是否存在差距;若存在差距,则根据评估结果逐项开展差异原因分析,制定合理的数据治理改进方案,执行数据治理相关改进活动。DB32/T4608.4—202610风险防控10.1人员管理10.1.1明确不同职能部门、安全岗位人员的权责、资质、工作内容等要求。宜设立数据操作员、数据权限管理员、数据操作审计员等角色,其职责分别为:a)数据操作员:具体执行数据治理各个环节操作的人员;间等;c)数据操作审计员:监督数据操作员、数据权限管理员等人员的数据操作行为合规性,定期开展数据操作合规性检查。承诺。10.1.3建立人员调整管理机制,岗位人员发生变化时,及时调整其账号权限。10.1.4应建立针对人员操作数据的日志记录,对高权限账号实行全量日志记录,开展异常行为检查,日志保存时长要符合相关管理要求。10.2业务管理业务管理应符合下列要求:a)建立数据使用申请授权机制,数据使用者应向数据管理者、数据提供者提出申请,经审核后授权数据使用者对数据资源开发利用;b)根据业务需求,明确数据范围、具体数据项、应用场景等必要信息,按照最小必须原则,实施数据c)保存数据操作记录,包括操作账号、操作时间、操作动作、被操作数据资源等必要信息,日志保存时长要符合相关管理要求;d)保存数据使用者相关记录,包括使用者及所在区域、传输机制、信息类型、处理目的、协议条款、数据申请、审核授权等相关记录,日志保存时长要符合相关管理要求。10.3技术管理应通过身份鉴别、访问控制等开展鉴权校验,确保数据操作访问主体身份合规,鉴权覆盖范围应包括数据生存周期的所有操作,鉴权校验包含但不限于账号、密码、动态验证码(或口令)、IP地址、MAC地址、访问时间等方面。数据传输、存储等活动,宜按照GB/T38625等采用数据加密处理,常见加密方法包括哈希、对称加密、非对称加密等。数据开发利用、应用服务等活动,可根据业务场景需求采用数据脱敏方式处理,常见脱敏方法包括静态数据脱敏和动态数据脱敏。DB32/T4608.4—2026数据溯源类型可分为数据衍生关系溯源、数据流转路径溯源,溯源信息记录基本构件包括:创建时间、创建账号、创建时使用的参考数据表、来源数据表等;据集等;c)执行实体:应包括操作账号或操作人、操作接口、操作IP地址等;使用系统、使用方IP等信息。数据审计定期检查数据操作账号赋权、数据操作行为等合规性,审计检查内容包含不限于:a)操作行为与岗位角色符合程度;b)操作行为与业务需求符合程度;c)操作行为对信息系统、数据库等影响程度。10.4其他管理要求数据风险防控方面的其他工作按照国家和江苏省相关法律法规、规章制度、标准规范等要求执行。DB32/T4608.4—2026附录A(资料性)数据治理目标和内容示例数据治理目标和内容示例见表A.1。表A.1数据治理目标和内容示例数据治理现状治理内容目标:构建整体数据治理体系目标:应对专题业务需求目标:解决具体数据问题组织内缺少专门的数据治理内部机构,业务分散、数据分散,数据管理制度规范不完善,没有构建数据架构和建设数据管理系统(或平台未构建数据风险防控体系组建组织架构,健全完善制度规范,整理分析业务和数据关系,构建数据架构,实施数据治理,构建数据风险防控体系组建临时团队,分析业务逻辑和流程,设计数据模型和数据流程,实施数据治理;制定常态化运行管理机制;根据业务和数据情况设定具体风险防控内容组建临时团队;根据业务流程和规则、数据流程和规则,分析定位具体数据问题所在环节,反向溯源问题根源,制定解决方案,实施数据治理动作;制定常态化运行管理机制组织内已组建专门的数据治理机构,初步形成一系列数据制度规范,已建设形成数据资源体系,具备一定的数据风险防控能力在现有基础上,进一步强化业务导向,支撑多种业务场景数据需求分析业务逻辑和流程,设计数据模型和数据流程,实施数据治理;根据业务和数据情况设定具体风险防控内容根据业务流程和规则、数据流程和规则,分析定位具体数据问题所在环节,反向溯源问题根源,制定解决方案,实施数据治理动作组织内已组建专门的数据治理机构,初步形成一系列数据制度规范,已建设形成数据资源体系,具备一定的数据风险防控能力。数据已赋能具体业务正常运行已初步具备数据治理体系,持续迭代完善分析业务逻辑和流程,设计数据模型和数据流程,实施数据治理,根据业务和数据情况设定具体风险防控内容根据业务流程和规则、数据流程和规则,分析定位具体数据问题所在环节,反向溯源问题根源,制定解决方案,实施数据治理动作DB32/T4608.4—2026附录B(资料性)数据模型命名与编码示例B.1数据模型命名数据模型命名总体要求如下:息等;b)非必要不使用外文字母(国际通用的外文单词或缩略语除外c)模型名应唯一;d)命名不应包含特殊字符,例如%,$等。B.2数据库命名B.2.1数据库命名总体要求如下:a)数据库名应唯一;b)命名采用分层、分域的名称首字母,体现分层分域结构;c)采用首字母命名出现重复时,例如主题库与专题库,库名中引入一个区分字母;d)命名不应包含特殊字符,例如%、$等。B.2.2数据库命名示例见表B.1。表B.1数据库命名示例序号数据分层分域名称数据库命名1前置库qzk2原始数据层(贴源层)ods3数据明细层(标准层)dwd或std4数据中间层dwm5数据服务层综合人口信息资源库dws.zhrkk6综合法人信息资源库7社会信用信息资源库dws.shxyk8电子证照信息资源库dws.dzzzk9自然资源和空间地理信息资源库10专题库/主题库dws.zatk/dws.zutk11数据集市层专题库/主题库dm.zatk/dm.zutk12公共数据共享域dm.zwgxk13公共数据开放域dm.zwkfkDB32/T4608.4—2026表B.1数据库命名示例(续)序号数据分层分域名称数据库命名14数据集市层公共数据授权管理域dm.zwsqk15数据应用层B.3数据表命名B.3.1数据表命名总体要求如下:a)数据服务层(例如五大基础库)之前的数据库表命名中应包含源表的表名,以表征数据血缘联系,保持数据的溯源能力;b)宜采用名词进行命名;c)命名不应包含特殊字符,例如%、$等。B.3.2数据表名的构成示例见图B.1。后缀名:小写英文字母,用于标记【文件解析获得的库表】或者其他备注说明表名:小写英文字母或数字,标识业务含义,不超过30字符。前置库、原始数据层、数据明细层采用【源表名】表类型前缀:2位小写英文字母归属标识:5位小写英文字母前置库、原始数据层、数据明细层采用【省/设区市拼音缩写+部门拼音缩写】,互联网数据采用“hlwsj”基础库采用【数据库名】专题/主题库采用【专题/主题名拼音缩写】分域前缀:小写英文字母分层前缀:小写英文字母图B.1数据表名命名规则B.4数据模型编码B.4.1数据模型编码总体要求如下:a)编码应使用阿拉伯数字,编码唯一;DB32/T4608.4—2026b)编码应体现数据模型创建单位信息、业务属性、创建时间等关键信息。B.4.2数据模型编码示例见图B.2。××××××××××××××××××××4位顺序码,按照数据模型当天生成的顺序依次排序8位日期(格式YYYYMMDD)2位业务代码本单位18位统一社会信用代码图B.2数据模型编码规则DB32/T4608.4—2026附录C(资料性)数据质量检查规则示例数据质量检查规则示例见表C.1。表C.1数据质量检查规则示例规则名称规则项目规则说明及时性(时效性)业务维度上数据更新时效性对照业务对数据时效性的需求检查数据更新情况。如:某审批业务办理后,间隔多长时间给出审批结果,对应时间范围内,相关数据应与审批结果同步产生技术维度上数据更新时效性对照设定的数据更新频率检查数据更新情况。如:两个系统间约定数据更新频率为每日,则数据接收方根据此时间检查数据发送方是否按照约定时间传输数据完整性数据项完整性数据项是否符合业务要求,数据非空约束、默认值填充、格式校验、跨字段依赖、状态完整等内容,确保关键数据无缺失且符合业务逻辑。如:某项业务约定所需数据字段(数据项)为10个,数据提供方提供的字段为9个,则数据不完整数据记录完整性数据规模是否符合实际业务体量。如:江苏户籍人口8000余万,对应的户籍数据体量不应少于上述数据量有效性(规范性)数据格式规范性数据的格式、编码、命名、类型等是否符合要求,如:身份证件号码应该是长度为18位的阿拉伯数字或者字母X,且编码应符合国家标准要求数据值域规范性数据是否在有效的值域范围内,如:人的寿命通常在(0,150]范围内元数据规范性元数据的命名、结构、必填属性等是否符合要求。如:典型的元数据管理为公共数据目录管理系统,其中数据共享、开放属性为必填项,则数据目录内相关属性必须按照规则填写业务逻辑规范性数据是否存在业务逻辑或常识性错误。如:幼儿园入学年龄一般在6岁之前准确性数据反映其描述的客观实体特征的准确性数据是否真实、准确地记录客观世界信息,无虚假数据及信息。如:某群众,实际上已结婚,但是某数据显示其为未婚,则数据不准确唯一性数据标识符唯一性数据的主键规则、主数据、辅助数据等是否满足数据唯一不重复的要求。如:一个人只能有唯一的身份证号码一致性同一数据在不同数据处理阶段的一致性同一数据在采集、传输、加工、存储、应用等不同的治理阶段,其承载的信息应保持一致,不应存在差异或矛盾。如:张三为18岁,但是在数据经一系列处理后,数据应用时显示其年龄为28岁,则不满足数据一致性规则要求同一数据在不同业务、系统内的一致性同一个数据在不同系统、不同库中的描述和相关属性应一致,不应存在差异或矛盾。如:同一工号对应的不同系统中的员工姓名应一致DB32/T4608.4—2026附录D(资料性)数据修正方法示例数据修正方法示例见表D.1。表D.1数据修正方法示例问题数据方法名称方法说明失数据删除处理如某条记录的一个或多个关键字段空缺,可将该记录删除人工校验填充如某缺失字段重要性高,可通过人工校验获取数据进行填充统计填充如某缺失字段为数值型,可使用该字段中非空缺值的平均值、众数等进行填充条件填充如某缺失字段为年龄,可通过身份证号推导数据进行填充误数据删除处理时可删除记录字符替换处理如字符为“&”,可替换为“和”字典匹配处理如行政区划名称“江苏”,可匹配替换为“江苏省”字段、记录等重复数据字段排重如某质量要求高的字段重复,可依据数据质量检查结果,保留数据质量问题最少的字段依关键字段的记录排重如某关键字段重复,可按日期型或日期时间型字段保留离当前日期最近的记录依重复度的记录排重如某字段不完全重复,可设置对比字段的值,保留一条和对比字段的值完全一致的记录字段、记录等冲突数据字段推导方法如身份证件号码、年龄及性别字段具有强约束关系,以身份证件号码作为标准字段,与年龄或性别字段冲突时,通过身份证件号码推导出正确的值并修改错误值权威来源方法如“身份证件号码”以公安部门提供的数据为准新鲜度方法其学位信息DB32/T4608.4—2026附录E(资料性)数据转换规则示例数据转换规则示例见表E.1。表E.1数据转换规则示例规则类型规则名称规则说明格式转换日期型统一格式转换将各类日期型数据统一转换为符合GB/T7408.1的日期型数据,如YYYYM-MDD格式时间型统一格式转换将各类时间型数据统一转换为符合GB/T7408.1的时间型数据,如hhmmss格式日期时间型统一格式转换将各类日期时间型数据统一转换为符合GB/T7408.1的格式,如YYYYM-MDDhhmmss代码转换性别数据统一代码转换按照GB/T2261.1中“性别代码”进行统一转换民族数据统一代码转换按照GB/T3304中“民族数字代码”进行统一转换婚姻状况数据统一代码转换按照GB/T2261.2中“婚姻状况代码”进行统一转换机构性质数据统一代码转换按照GB/T36104中“登记业务类型”进行统一转换DB32/T4608.4—202620(资料性)数据治理评价指标示例数据治理评价指标如表F.1所示。表F.1数据治理评价指标示例指标类型指标名称指标说明组织架构治理组织架构完备性设置数据治理部门、机构情况,以及职责分工情况岗位设置完备性设置具体人员岗位情况及各职责分工情况数据治理过程管控归集数据量采集传输的数据总量数据及时率及时更新的数据占总量的比率数据完整率规模、内容完整的数据占总量的比率数据质量合格率质量符合要求的数据量占总量的比率异议数据处理率及时处理的异议数据占总量的比率元数据规范率元数据编制规范程度(例如数据目录规范程度规范编制元数据的数据类数占总量的比率数据应用服务成效共享数据量提供共享的数据总量共享满足率满足共享需求的次数占总申请
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年贵州食品工程职业学院单招职业倾向性测试题库附答案解析
- 2025年沾化县招教考试备考题库附答案解析(必刷)
- 2025年山西警察学院马克思主义基本原理概论期末考试模拟题及答案解析(必刷)
- 2025年丹棱县招教考试备考题库附答案解析(必刷)
- 2024年辽宁兵器工业职工大学马克思主义基本原理概论期末考试题带答案解析
- 2025年广河县幼儿园教师招教考试备考题库附答案解析
- 2025年平顶山工业职业技术学院单招职业技能考试模拟测试卷附答案解析
- 2025年通许县招教考试备考题库含答案解析(必刷)
- 2025年河北大学工商学院马克思主义基本原理概论期末考试模拟题带答案解析(夺冠)
- 2026年武汉民政职业学院单招职业技能考试题库带答案解析
- 2024年6月GESP编程能力认证Scratch图形化等级考试四级真题(含答案)
- 2025年水空调市场分析报告
- T/GFPU 1007-2022中小学幼儿园供餐潮汕牛肉丸
- 货运险培训课件
- 新收入准则税会差异课件
- 比亚迪股份有限公司盈利能力分析及提升对策研究
- 车辆资产闲置管理办法
- PICC管感染病例分析与管理要点
- 超声波成像技术突破-全面剖析
- 水电与新能源典型事故案例
- QC/T 822-2024汽车用压力传感器
评论
0/150
提交评论