企业数据治理体系建设方案_第1页
企业数据治理体系建设方案_第2页
企业数据治理体系建设方案_第3页
企业数据治理体系建设方案_第4页
企业数据治理体系建设方案_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

资料解读:企业数据治理体系建设方案

在数字化时代,企业数据不仅成为企业的重要资产,更是企业决策和运营的关键支撑。因此,

构建一个科学、系统的数据治理体系显得尤为关键。本文将对《企业数据治理体系建设方案》

进行详细解读,以期为企业数据治理提供参考和指导。

数据治理概述

数据治理是一种体系,它通过整合IT与业务部门的知识和意见,对企业的信息化建设进行

全方位的监管。其核心目标是确保数据的有效性、可访问性、高质量、一致性、可审计和安

全性。

数据治理背景需求

随着大数据时代的到来,企业面临着数据量大、速度快的6V难题,同时,数据质量管理成

为企业亟需解决的问题。数据治理体系的建设,能够解决数据分散、数据质量问题、数据责

任不明确等问题。

数据治理战略

数据治理战略强调数据的重要性,将其比作企业信息系统的血液。数据治理能够提升数据的

业务价值,促进数据的灵活运用和创新,保障企业在数据驱动的商业环境中保持竞争刁。

数据治理组织结构

数据治理组织结构包括数据生产者、数据使用者、数据管理者和数据拥有者,每个角色都有

其明确的职责和任务,以确保数据治理体系的有效运行。

数据治理架构设计

数据治理架构设计涵盖了数据源、数据治理平台、数据应用等关键环节,通过数据质量管控、

数据清洗融合、数据集成管理等手段,实现数据的优化和价值提升。

数据治理解决方案

数据治理解决方案包括数据集成管理、数据探索稽查、数据清洗融合、数据质量提升和数据

质量管控等多个方面。这些解决方案共同构成了一个全面的治理体系,以应对数据治理过程

中的各种挑战。

数据集成管理

数据集成管理关注数据的抽取、加载、存储和同步,通过建立数据源间的连接,实现数据的

集成和统一管理。

数据探索稽查

数据探索稽查通过将数据标准转换为技术规则,对数据进行定期稽查,及时发现并整改数据

问题。

数据清洗融合

数据清洗融合旨在解决数据不一致、重复、缺失、未更新和无法关联等问题,通过一系列修

复规则,优化数据质量。

数据质量提升

数据质量提升通过标准化处理、智能修复等手段,提升关键数据的质量,确保数据的准确性

和可靠性。

数据质量管控

数据质量管控通过组织管理和技术保障,确保数据生产者、使用者、管理者和拥有者能够协

同工作,形成有效的数据质量保障体系。

数据安全管控

数据安全管控涵盖了用户管理、访问控制、数据保护、监控等方面,确保数据的安全性和保

密性。

详细资料请看本解读文章的最后内容。

在本解读的最后,我们将提供《企业数据治理体系建设方案》文件的详细资料,以便读者能

够获得更深入的理解。这些资料包括了企业数据治理的各个方面,从基础概念到具体的实施

策略,为企业数据治理提供了全面的指导。

接下来请您阅读下面的详细资料吧。

③数据治理成果应用

Parti数据治理体系方案

®

①数据治理概述®数据治理组织管控

@数据治理背景需求©数据治理架构设计

@数据治理建设战略数据治理解决方案

数据治理体系方案

1、数据治理概述

数据治理概述

什么是数据治理

定义:数据治理其实是一种体系,是一个关注于信息系统执行层面的体系,

这一体系的目的是整合IT与业务部门的知识和意见,通过将流程、策略、标

准和组织的有效组合,对企业的信息化建设进行全方位的监管,需要企业

高层的授权和业务部门与IT部门的密切协作。

目标:保证数据的有效性、可访问性、高质量、一致性、可审计和安全性。

P5

数据治理概述

数据治理体系的建立是促进企业数据管理体系建设和执行体系落地的有力支撑平台,将分散、

多样化的核心数据等通过标准化、质量探查、清洗、集成及监空等技术手段进行优化,形成企业内

的数据治理体系,并结合企业组织结构,形成数据管控执行体系,在企业持续运行,提升、挖掘主

数据的应用价值.

解决企业如下的数据管控问题:

•数据分做且多样化问题。

•做曜的数据质量问题.厂、

•遇到问题,数据生产者和管理者互翻轨绩任的问题.

•数嵯质也低下,利用塞低的问厥./■、

•数据管理,善实不利的问题.仁)仁)

•数据使用者次成怒琼襁翎的问题.

数据治理概述

数据治理成果展现

数据整合汇总

数据采集数据治理过程

组织管理体系

数据治理体系方案

2、数据治理背景需求

数据治理背景需求一大数据数据角度

大数据的6V难题

数据治理背景需求—数据质量角度

有量无质:

市场上的大部分数据管理系统

自动化低、不支持大数据

质量!

P12

数据治理战略

企业信息系统的血液:数据

就像汽车的汽油,槽宿的油质,将导致汽车的抛锚就像身体内流动的血液,血液坏掉,人类将会如何?

企业数据的重要性

数据治理战略

"我收到了很多相互矛盾的报告,我们对这些报告的讨论

变成了哪个是正确的,而不是怎么去根据报告做决策?”

原因:数宪不一致

"我总是会收到很多份一样的

业绩报表,不能快速分析数据,

"分析师的时间主要花在数据收集上,

来支撑各种工作"

而不是在分析上.

原因:数据重复,在利用数据

原因:数据质■差,需要进行大♦的

之前需要做大・清洗和确认工

收集和清;先工作

作数据信息

DataAnalyst

“姆系统完全全面的信息酬.消费者困惑

决策太难了!""进行运营管理时主要是靠感觉,搜集

ra:m完整性存在问题匚7.到的数据不敢肯定是否还有效~

原因:数据时效性不明确

CIOCOO

1•我在做市场关键决策时总是对我们的数

据信心不足”

原因:数据不准确、不精确

数据治理战略

缺乏数据贵任人制度

数据质■叵题没有人承担出任

伍阳管理和数据说方面的网贝有限

团队孤立的工作

'蹴业打价值水平

优质海量数据19需而变

脱顾而出

基于优痍数据的创新

数据帮助业务关注数据变化和报表

运作

数据资源治理水平

PU

数据治理体系方案

4、数据治理组织结构

P17

数据治理组织结构

数据使用者

数据使用

数据统i份析

旌质・绩行

数据拥有者数据管理者

数据owner数据管理

数据挖掘数据安全保护

数据质■绩效评估数据质量绿砌亍

P18

数据治理组织结构

职能主要职责

•制定审核企业信息管理策略

•确定数据治理的重要决策,发布重要标准和规范

•指导企业信息整合

•负责起草数据治理相关的规划、计划和方案

•负责组织实施数据治理的有关具体工作

•协调数据治理的工作迸度

•制定数据治理考核方奈

•负责日常具体工作

•蛔g、推动数幅修皿作

•执行数据治理的考核工作

•参与数据应用及其他业务系统的设计和开发工作

•对主体域内的数据质量、规范、标准全权负责

数据负责人数据负责人

•对录入系统的数据进行质量检查和纠错

•强化业务人员对数据治理和数据质量的培训和管理

P19

数据治理体系方案

5、数据治理架构设计

P20

数据治理架构设计逻辑架构

数据治理平台数据应用

RMDBS

据洗菜

HDFS管

管切菜

Kafka

软硬件■础设施、网络环境

数据治理解决方案

P22

数据治理解决方案

数据数据

解决全生命周期数

规划解决全生命周期数标准

据认责的问我

管理据标准化的问题管理

数据全生命周期管理

产生修改组织使用发现提升归档

数据数

数据发现数据问题

质量管

采集数据清解决数据如何清解决质量问期

提升

洗融合J洗和整合的问题

解决数据来源及解决历史数据处理、

如何获取的问即存储和访问的问题

数据治理解决方案

01数据集成管理

P24

数据集成管理功能封装

基于元数据驱动的健生产,保证元数据与实际系统一致,通过集成管理提供对外的数据服务

P26

数据集成管理_数据集成功能

数据数据集成运维管理支持大数据

•建立各数据源司连接•作照行监控•预装大数据环境

•设计管理作业•作业出错报警•数据处理

•调度执行作业•机器负载监控

功能

集成数据

数据治理解决方案

02数据探索稽查

数据探索稽查(剖析)稽查过程

将数据标准转换为技术规则,对数据进行定期稽查,督促数据负责人整改数据,

及时掌握数据的情况

数据探索稽查一稽查功能

整体统计细节探索关联分析

探.概况认知•深入分析.数据依赖分析

直♦通用探查需求•多堆度统计•全面数据诊断

数据源政地探索相营报告

P30

03数据清洗融合

P32

数据清洗融合

数据清洗是指发现并纠正数据文

件中可识别的错误的最后一道程序,

包括检查数据一致性,处理无效值和

缺失值等.

数据清洗过程会通过一系列的修

复规则等来进行优化解决。

也叫数据冲突、数据I1架

选择不同的策略修复数据

•按更新日期

•按数据来源

•按信息长度

・按出现频率

冲突率

身份证430**7672430**7672430**7672430**7672\

姓名运张山拿三住50%

但别男男男0

深圳市南山区软件软件产jlkM地卫福田区新洲路

住址南山区卫星大厦100175%

产业卫星加星大1H号

数据清洗融合_数据问题分析

2、数据重复

易造成数据重复,也就是数据

人口信息

冗余,即对异构系统或不同数

据源系统间身份证、姓名读音

匚短而宿息1相似,存在近形字等以冗

管理系统

余信息进行选择性处理,并导

出正确信息.

针对中、英文字符、数值及不同行业

领域信息提供不同算法.

数据清洗融合_数据问题分析

3.数据缺失

有字段无字段值)缺少必要字段J

•某县:很多法人数据注册•卫计局:采集上来的信息

号为空;缺项漏项。

•人口信息一般要包括身份•劳动局:劳资纠纷隐患数

证、姓名、性别、生日等,据,企业自己报的数据不全,

很多为空值。街道和社区也不愿意多报。

•系统自动补全部分为空数据,如根据身份证号补充生日;

•通过多表关联比对补全缺失数据。

P36

数据清洗融合数据问题分析

4、数据没有更新

某教育局:

目前1+5政策下,学位申请审核需要比对6个

职能部门的数据,但这些数据很多未能及时更新,

如工商执照过户后的数据.

学籍管理系统修学后的数据也没有及时更新

•通过时间舐记录数据获取时间

•四种策略解决数据时效性问题:

•按更新日期•按信息长度

•按数据来源•按出现频率

(可信数据源)

P37

数据治理解决方案

04数据质量提升

P38

数据质量提升提升过程

口务

«

封工作流平台

收据看出

P39

数据质量提升数据标准处理

数数据所有者数据生产者数据爸理者数据使用者

・数据规则诠释.雌m・数据菅理核验•数据使用

•数据需求确认II•数据需求满足•数据需求落实•数据需求提出

•自动引用参考标准

计全败据

览证数据•自动验证和标准化

标准化数据

审核标准化

行业标准

•参考数据符合规范完整

的优质数据

P40

数据质量提升.标准处理依赖规则

依赖的六大规则:函数依赖、字典规则、正则规则、值域规则、包含规则、SQL规则

数据特性数据规则

函或依赖规则

局部冗余字典规则

数据的格式规律止则表达式规则

数据的有效值值域规则

表间关系包含、依赖规则

表或表间宜杂关系SQL规则

P41

整合标准数据,自动、及时的提升关键数据质量

问题数据/

i优质触■P

融合数据发现问题提升关键数据

O。匹配和融合

自动学习问题识别和数据修

标准化处理

复规则,将各场景融入智能

数据修复的流程中流式智能修复

交互式修短

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论