版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.:.; PAGE VI数据治理体系目录 TOC o 1-3 h z u HYPERLINK l _Toc430099616 1.范围 PAGEREF _Toc430099616 h 1 HYPERLINK l _Toc430099617 2.规范性援用文件 PAGEREF _Toc430099617 h 1 HYPERLINK l _Toc430099618 3.术语、定义和缩略语 PAGEREF _Toc430099618 h 5 HYPERLINK l _Toc430099619 4.总体阐明 PAGEREF _Toc430099619 h 8 HYPERLINK l _Toc43009
2、9620 4.1.概述 PAGEREF _Toc430099620 h 8 HYPERLINK l _Toc430099621 4.2.目的 PAGEREF _Toc430099621 h 9 HYPERLINK l _Toc430099622 4.3.原那么 PAGEREF _Toc430099622 h 9 HYPERLINK l _Toc430099623 5.数据治理体系 PAGEREF _Toc430099623 h 10 HYPERLINK l _Toc430099624 5.1.总体框架 PAGEREF _Toc430099624 h 10 HYPERLINK l _Toc430
3、099625 5.2.组织架构 PAGEREF _Toc430099625 h 11 HYPERLINK l _Toc430099626 5.2.1.组织构成 PAGEREF _Toc430099626 h 11 HYPERLINK l _Toc430099627 5.2.2.角色职责 PAGEREF _Toc430099627 h 12 HYPERLINK l _Toc430099628 5.3.系统架构 PAGEREF _Toc430099628 h 12 HYPERLINK l _Toc430099629 5.3.1.系统功能框架 PAGEREF _Toc430099629 h 12 H
4、YPERLINK l _Toc430099630 5.3.2.系统模块流程 PAGEREF _Toc430099630 h 14 HYPERLINK l _Toc430099631 5.4.系统边境 PAGEREF _Toc430099631 h 15 HYPERLINK l _Toc430099632 5.4.1.与企业级省大数据平台关系 PAGEREF _Toc430099632 h 16 HYPERLINK l _Toc430099633 5.4.2.与对外才干开放平台关系 PAGEREF _Toc430099633 h 16 HYPERLINK l _Toc430099634 5.4.
5、3.与平台运维系统关系 PAGEREF _Toc430099634 h 16 HYPERLINK l _Toc430099635 6.数据治理中心模块 PAGEREF _Toc430099635 h 17 HYPERLINK l _Toc430099636 6.1.数据规范管理 PAGEREF _Toc430099636 h 17 HYPERLINK l _Toc430099637 6.1.1.背景 PAGEREF _Toc430099637 h 17 HYPERLINK l _Toc430099638 6.1.2. PAGEREF _Toc430099638 h 18 HYPERLINK l
6、 _Toc430099639 6.1.3.目的及原那么 PAGEREF _Toc430099639 h 19 HYPERLINK l _Toc430099640 6.1.4.业务分类和定义 PAGEREF _Toc430099640 h 19 HYPERLINK l _Toc430099641 6.1.5.技术功能要求 PAGEREF _Toc430099641 h 23 HYPERLINK l _Toc430099642 6.1.6.本期建立范围及内容 PAGEREF _Toc430099642 h 26 HYPERLINK l _Toc430099643 6.1.7.实施要求 PAGERE
7、F _Toc430099643 h 27 HYPERLINK l _Toc430099644 6.2.元数据管理 PAGEREF _Toc430099644 h 27 HYPERLINK l _Toc430099645 6.2.1.背景和定义 PAGEREF _Toc430099645 h 27 HYPERLINK l _Toc430099646 6.2.2.元数据运营方式 PAGEREF _Toc430099646 h 29 HYPERLINK l _Toc430099647 6.2.3.元模型规范 PAGEREF _Toc430099647 h 29 HYPERLINK l _Toc430
8、099648 6.2.4.元数据运维 PAGEREF _Toc430099648 h 33 HYPERLINK l _Toc430099649 6.2.5.本期重点建立内容 PAGEREF _Toc430099649 h 34 HYPERLINK l _Toc430099650 6.3.数据质量管理 PAGEREF _Toc430099650 h 34 HYPERLINK l _Toc430099651 6.3.1.与传统运营分析系统的区别 PAGEREF _Toc430099651 h 34 HYPERLINK l _Toc430099652 6.3.2.范围和原那么 PAGEREF _To
9、c430099652 h 35 HYPERLINK l _Toc430099653 6.3.3.与其它功能模块的关系 PAGEREF _Toc430099653 h 36 HYPERLINK l _Toc430099654 6.3.4.本期数据质量功能需求 PAGEREF _Toc430099654 h 38 HYPERLINK l _Toc430099655 6.3.5.本期数据质量运维要求 PAGEREF _Toc430099655 h 39 HYPERLINK l _Toc430099656 6.4.数据资产管理 PAGEREF _Toc430099656 h 40 HYPERLINK
10、l _Toc430099657 6.4.1.数据资产概述 PAGEREF _Toc430099657 h 40 HYPERLINK l _Toc430099658 6.4.2.数据资产范围 PAGEREF _Toc430099658 h 41 HYPERLINK l _Toc430099659 6.4.3.与其它功能模块的关系 PAGEREF _Toc430099659 h 42 HYPERLINK l _Toc430099660 6.4.4.本期数据资产功能需求 PAGEREF _Toc430099660 h 42 HYPERLINK l _Toc430099661 6.4.5.本期建立内容
11、 PAGEREF _Toc430099661 h 45 HYPERLINK l _Toc430099662 6.5.数据平安管理 PAGEREF _Toc430099662 h 45 HYPERLINK l _Toc430099663 6.5.1.数据平安概述 PAGEREF _Toc430099663 h 45 HYPERLINK l _Toc430099664 6.5.2.建立原那么 PAGEREF _Toc430099664 h 46 HYPERLINK l _Toc430099665 6.5.3.建立内容 PAGEREF _Toc430099665 h 46 HYPERLINK l _
12、Toc430099666 6.5.4.边境关系 PAGEREF _Toc430099666 h 46 HYPERLINK l _Toc430099667 6.5.5.技术功能 PAGEREF _Toc430099667 h 47 HYPERLINK l _Toc430099668 6.5.6.管理要求 PAGEREF _Toc430099668 h 48 HYPERLINK l _Toc430099669 7.数据治理场景 PAGEREF _Toc430099669 h 52 HYPERLINK l _Toc430099670 7.1.背景描画 PAGEREF _Toc430099670 h
13、52 HYPERLINK l _Toc430099671 7.2.场景一:银行伪卡买卖判别 PAGEREF _Toc430099671 h 52 HYPERLINK l _Toc430099672 7.2.1.背景引见 PAGEREF _Toc430099672 h 52 HYPERLINK l _Toc430099673 7.2.2.场景描画 PAGEREF _Toc430099673 h 53 HYPERLINK l _Toc430099674 7.3.场景二:银行手机贷业务 PAGEREF _Toc430099674 h 54 HYPERLINK l _Toc430099675 7.3.
14、1.背景引见 PAGEREF _Toc430099675 h 54 HYPERLINK l _Toc430099676 7.3.2.场景描画 PAGEREF _Toc430099676 h 54 HYPERLINK l _Toc430099677 8.附录 PAGEREF _Toc430099677 h 55 HYPERLINK l _Toc430099678 附录一:数据规范框架 PAGEREF _Toc430099678 h 55 HYPERLINK l _Toc430099679 附录二:数据规范体系定义内容例如 PAGEREF _Toc430099679 h 56前言本规范的制定是为了
15、更好地实现中国挪动企业级省大数据平台数据治理子系统的建立和管理,为省大数据平台上的各类根底技术和运用提供支撑,加强省大数据平台上数据的管控力度,加强数据治理子系统本身管理才干。本规范主要包括以下几方面的内容:总体阐明、数据治理体系、数据治理中心模块、数据治理场景等。本规范是中国挪动企业级大数据平台系列规范之一。该系列规范的构造、称号或估计的称号如下:序号规范编号规范称号1QB-Y-*-2021中国挪动企业级大数据平台目的架构2QB-Y-*-2021中国挪动企业级省大数据平台技术规范总册3QB-Y-*-2021中国挪动企业级省大数据平台技术规范分册4QB-Y-*-2021中国挪动企业级省大数据平
16、台技术规范技术方案分册5QB-Y-*-2021中国挪动企业级省大数据平台技术规范数据模型分册6QB-Y-*-2021中国挪动企业级省大数据平台技术规范外部接口分册7QB-Y-*-2021中国挪动企业级省大数据平台技术规范效力开放分册8QB-Y-*-2021中国挪动企业级省大数据平台技术规范效力开放技术方案分册9QB-Y-*-2021中国挪动企业级省大数据平台技术规范数据治理分册10QB-Y-*-2021中国挪动企业级省大数据平台技术规范数据治理技术方案分册11QB-Y-*-2021中国挪动企业级省大数据平台技术规范运营维护分册12QB-Y-*-2021中国挪动企业级省大数据平台技术规范平安管理
17、技术方案本规范由中移技印发。本规范由中国挪动通讯集团公司业务支撑系统部提出,集团公司技术部归口。本规范起草单位:中国挪动通讯集团公司业务支撑系统部。本规范主要起草人:段云峰、汪新勇、赵静、周立、任怡健、王保强、潘刚、刘童桐、王金金、陶涛、刘虹、张红星、魏春辉。 PAGE 58范围本规范规定了中国挪动企业级省大数据平台数据治理子系统的建立内容,适用于中国挪动各省直辖市、自治区公司企业级省大数据平台数据治理子系统的建立。规范性援用文件以下文件中的条款经过本规范的援用而成为本规范的条款。凡是标注日期的援用文件,其随后一切的修正单不包括订正的内容或修订版均不适用于本规范。然而,鼓励根据本规范达成协议的
18、各方对能否运用这些文件的最新版本进展研讨。凡是不标注日期的援用文件,其最新版本适用于本规范。1中国挪动通讯2中国挪动通讯3QB-J-010-2006中国挪动通讯4QB-J-006-2006中国挪动通讯5QB-J-007-2006中国挪动通讯6QB-J-008-2006中国挪动通讯7QB-J-009-2006中国挪动通讯8QB-J-003-2006中国挪动通讯9QB-J-004-2006中国挪动通讯10QB-J-005-2006中国挪动通讯11QB-J-001-2006中国挪动通讯12QB-J-001-2006中国挪动通讯13QB-J-001-2006中国挪动通讯14QB-J-021-2007中
19、国挪动通讯15QB-J-020-2007中国挪动通讯16QB-J-022-2007中国挪动通讯17QB-J-019-2007中国挪动通讯18QB-J-018-2007中国挪动通讯19QB-J-017-2007中国挪动通讯20QB-J-016-2007中国挪动通讯21中国挪动通讯22中国挪动通讯23中国挪动通讯24中国挪动通讯25中国挪动通讯26中国挪动通讯27中国挪动通讯28QB-J-002-2021中国挪动通讯集团公司29QB-J-003-2021中国挪动通讯集团公司30QB-J-004-2021中国挪动通讯集团公司31QB-J-005-2021中国挪动通讯集团公司32QB-J-006-20
20、21中国挪动通讯集团公司33QB-J-007-2021中国挪动通讯集团公司34QB-J-008-2021中国挪动通讯集团公司35QB-J-001-2021中国挪动通讯集团公司36QB-Y-003-2021中国挪动通讯集团公司37QB-Y-004-2021中国挪动通讯集团公司38QB-Y-005-2021中国挪动通讯集团公司39QB-Y-006-2021中国挪动通讯集团公司40QB-Y-007-2021中国挪动通讯集团公司41QB-Y-008-2021中国挪动通讯集团公司42QB-Y-002-2021中国挪动通讯集团公司43QB-Y-052-2021中国挪动通讯集团公司44QB-Y-053-20
21、21中国挪动通讯集团公司45QB-Y-054-2021中国挪动通讯集团公司46QB-Y-055-2021中国挪动通讯集团公司47QB-Y-056-2021中国挪动通讯集团公司48QB-Y-057-2021中国挪动通讯集团公司49QB-Y-058-2021中国挪动通讯集团公司50QB-Y-059-2021中国挪动通讯集团公司51QB-Y-060-2021中国挪动通讯集团公司52QB-Y-061-2021中国挪动通讯集团公司53QB-Y-062-2021中国挪动通讯集团公司54QB-Y-063-2021中国挪动通讯集团公司55QB-Y-039-2021中国挪动通讯集团公司56QB-Y-038-20
22、21中国挪动通讯集团公司57QB-Y-040-2021中国挪动通讯集团公司58QB-Y-041-2021中国挪动通讯集团公司59QB-Y-042-2021中国挪动通讯集团公司60QB-Y-043-2021中国挪动通讯集团公司61QB-Y-044-2021中国挪动通讯集团公司62QB-Y-045-2021中国挪动通讯集团公司63QB-Y-046-2021中国挪动通讯集团公司64QB-Y-047-2021中国挪动通讯集团公司65QB-Y-048-2021中国挪动通讯集团公司66QB-Y-044-2021中国挪动通讯集团公司67QB-Y-045-2021中国挪动通讯集团公司68QB-Y-045.1-
23、2021中国挪动通讯集团公司69QB-Y-045.2-2021中国挪动通讯集团公司70QB-Y-045.3-2021中国挪动通讯集团公司72QB-Y-045.4-2021中国挪动通讯集团公司73QB-Y-045.5-2021中国挪动通讯集团公司74QB-Y-046-2021中国挪动通讯集团公司75QB-Y-047-2021中国挪动通讯集团公司76QB-Y-047.1-2021中国挪动通讯集团公司77QB-Y-044-2021中国挪动通讯集团公司78QB-Y-045-2021中国挪动通讯集团公司79QB-Y-045.1-2021中国挪动通讯集团公司80QB-Y-045.2-2021中国挪动通讯集
24、团公司81QB-Y-045.3-2021中国挪动通讯集团公司82QB-Y-045.4-2021中国挪动通讯集团公司83QB-Y-045.5-2021中国挪动通讯集团公司84QB-Y-045.6-2021中国挪动通讯集团公司85QB-Y-046-2021中国挪动通讯集团公司86QB-Y-047-2021中国挪动通讯集团公司87QB-Y-047.1-2021中国挪动通讯集团公司术语、定义和缩略语以下术语、定义适用于本规范:字母名词解释CCWMCWM规范是OMG组织定义的数据仓库和相关系统的国际元数据规范,给出了各种元数据构造的规范定义。CWM规范的目的在于:使数据仓库和商业智能软件的元数据在异构的
25、数据分析工具、数据仓库平台、元数据存储库等系统之间进展交互。EETL特指从数据源系统到大数据平台的数据抽取、转换和加载。G管理元数据描画大数据平台中管理领域相关概念、关系、规那么的数据,主要包括人员角色、岗位职责、管理流程等信息。H中心元模型大数据平台中心元模型是以CWM为根底扩展构成的,针对大数据平台的物理模型、逻辑模型、数据处置过程、接口单元、目的和维度编码等主要实体进展准确定义,并要求各省大数据平台一致遵照的元模型。定义中心元模型的目的是建立大数据平台的一致元数据管理规范,为元数据管理的功能层与运用层解耦、为企业级总部大数据平台和企业级省大数据平台的元数据交换和相互了解提供一致的语义根底
26、。H中心元模型参照表中心元模型参照表是对中心元模型中的枚举类型属性进展枚举值定义的编码表。参照表为枚举类型属性的每个枚举值定义了独一的编码,并明确该编码的语义,是中心元模型规范化定义的重要组成部分。J技术元数据描画大数据平台中技术领域相关概念、关系、规那么的数据。主要包括对数据构造、数据处置方面的特征描画,覆盖大数据平台数据源接口、数据仓库、ETL、OLAP、数据发掘、前端展现等全部数据处置环节。S数据处置过程数据从数据源系统到大数据平台前端运用的整个处置过程,包含大数据平台数据仓库内部的数据抽取、转换和加载。S数据采集点覆盖大数据平台数据处置环节的、获取每个环节运转形状的实体。该实体可以是程
27、序实体也可以是义务虚体S数据质量报告数据质量报告是对数据质量日常监控以及质量评价等过程累积的各种信息进展汇总、梳理、统计和分析,构成的统计报告S数据质量监控经过获取大数据平台各环节的数据质量监控信息,结合元数据库中的有关检查规那么,对各个环节的数据质量情况进展判别,并及时向数据质量监控人员报告。S数据质量规那么库数据质量规那么库是对数据质量管理活动所用到的各种判别及校验规那么进展归类和存放的存储构造,存储的内容包括采集规那么、监控规那么、告警规那么和审计规那么等S数据质量信息库数据质量管理子系统存储层上的存储构造,用于存储数据质量信息采集程序采集的数据质量信息、质量评价信息、问题处理方案和问题
28、处置流程信息等S省公司中国挪动通讯集团各省直辖市、自治区挪动通讯。SSQL脚本自动解析SQL脚本自动解析指经过对SQL脚本的词法、语法和语义进展分析,自动生成满足CWM规范要求的数据处置过程的技术元数据的功能。Y业务元数据描画大数据平台中业务领域相关概念、关系、规那么的数据。主要包括业务术语、信息分类、目的定义目的口径、业务规那么等信息。Y元模型元模型是描画元数据的根底模型构造,用于阐明元数据对象的各种属性、构造和关系。Y元数据元数据是描画数据间关系的数据。大数据平台中元数据泛指描画数据概念Concepts、数据间关系Roles、数据处置规那么Rules的数据,其中,领域语义Semantics
29、和知识Knowledge也属于元数据的范畴。D数据规范指在中国挪动台企业级省大数据平台下为了使企业内外部运用和交换的数据是一致和准确的,经协商一致制定并由大数据治理委员会主管机构同意,具有行业特点且共同运用和反复运用的一种规范性约束。D数据规范体系指数据规范按照中国挪动企业级省大数据平台需求对数据进展规范化的划分归类。D数据规范内容按照数据规范体系划分的要求分别给出各数据规范制定的规范内容。D行业参考模型实体中国挪动规范中原定义或新添加的逻辑数据模型LDM实体。D公共代码规范需求援用外部公共规范机构的规范。如:世界各国和地域称号代码等。以下略缩语适用于本规范:缩写英文描画中文描画ASTAbst
30、ract Syntax Tree笼统语法树BOSSBusiness Operation Support System业务运营支撑系统CWMCommon Warehouse Metamodel公共仓库元模型ETLExtraction Transformation Loading抽取、转换和加载OLAPOn-line Analysis Process在线分析处置XMIXML Metadata InterchangeXML元数据交换BIBusiness Intelligence商务智能RESTRepresentational State Transfer表述性形状转移总体阐明概述本规范用于指点企业级
31、省大数据平台数据治理子系统建立,规定了省大数据平台数据治理的范围和要求,明确了数据治理子系统的体系构造,制定了数据治理子系统的功能和处置流程。数据治理子系统包含数据规范管理、元数据管理、数据质量管理、数据资产管理、数据平安管理等功能模块。本方案自创资产管理的方法实际来管理数据,将数据作为一种特殊的资产,对进入平台的数据进展规范化的规范约束,并以元数据作为驱动,衔接数据的规范管理、数据质量管理、数据数据平安管理的各个阶段,构成一致、完善的数据治理体系,以处理实践业务问题为导向,加强数据治理子系统对业务开展的支撑才干。目的数据治理子系统的建立为数据治理任务提供强有力的系统支撑。本期规范建立目的是以
32、元数据为驱动,建立省大数据平台完好的数据治理体系。从组织架构、系统功能等方面加强数据宏观管控,并实现精细化管理,详细包括:数据治理组织架构管理:定义数据治理所需人员组织上的岗位和职责,从管理角度支撑数据治理任务的落地和执行。数据规范管理:建立企业级省大数据平台数据规范体系,并制定数据规范运维管控制度和流程。元数据管理:降低元数据运用难度、提升用户体验,使大数据平台各类用户均能参与到元数据运营维护当中。数据质量管理:为内、外部用户提供平台化的数据质量监控;经过扩展和优化公共规那么库、保证数据的完好性、一致性、准确性、及时性、合法性,提升用户运用感知;并提供数据质量运用满足个性化需求。数据资产管理
33、:重点建立从规划、注册、运维到注销的全流程管理体系,使数据资产管理系统化、可视化。数据平安管理:建立体系化的数据平安管控战略,经过用户平安管理、数据平安管理实现全方位数据平安管控机制,经过技术手段与管理措施相结合的方式落实数据平安,做到事前可管、事中可控、事后可查。原那么企业级省大数据平台数据治理子系统建立应遵照以下根本原那么:有效性原那么表达大数据平台数据治理过程中数据的规范、质量、价值、管控的有效性、高效性。价值化原那么表达数据治理过程中以数据资产为价值中心,最大化大数据平台的数据价值。一致性原那么表达大数据平台架构一致、规范一致、元数据一致、质量流程一致、资产价值一致的一体化管控平台体系
34、。开放性原那么表达平台化、开放性运维思想,实现人人参与数据治理、人人参与数据运维。产品化原那么表达大数据平台数据治理才干的显性化,经过产品化互联网思想效力大数据平台数据生态圈用户。平安性原那么表达平安的重要性、必要性,保证大数据平台数据平安和数据治理过程中数据的平安可控。数据治理体系总体框架数据治理总体框架包括组织架构、数据治理模块、数据运维三部分。经过组织架构建立管理方法,制定任务流程,确定角色职责。数据治理模块主要包括数据规范管理、元数据管理、数据质量管理、数据资产管理、数据平安管理,各模块协同运营,确保大数据平台的数据一致、平安、有效。数据运维贯穿整个数据治理体系的流程中,实现平台化的运
35、维管理思绪。数据治理总体框架如 REF _Ref428626279 h 图51所示:中心领域大数据平台数据治理工具数据平安管理数据资产管理元数据管理数据质量管理数据规范管理组织架构组织架构定义角色与职责规划和战略管理方法数据运维质量运维管控运维资产运维组织架构适宜吗图 STYLEREF 1 s 5 SEQ 图 * ARABIC s 1 1数据治理体系框架组织架构能否模糊化,简要说一下数据治理需求由专人、专职担任,不明说建立专业机构。数据治理组织的构建旨在经过建立数据治理组织架构明确各级角色和职责,保证数据治理的各项管理方法、任务流程的实施,推送数据治理任务的有序开展。 组织构成数据治理组织架构
36、主要由数据治理委员会、数据治理中心和各业务部门构成。组织架构划分和角色设定如 REF _Ref428626402 h 图52所示:图 STYLEREF 1 s 5 SEQ 图 * ARABIC s 1 2 数据治理组织架构图角色职责组织责任体系是数据治理责任落地的保证,数据治理组织架构经过明确各角色职责,实行认责制度,让数据治理任务更好的融入到数据日常运用和相关的任务中,从而推进数据运维自治的实现,如 REF OLE_LINK11 h 表5-1。表5-1数据治理组织架构角色职责定义内容组织构造角色角色描画角色主要职责数据治理委员会数据管理决策者由公司主管指点和各业务部门指点组成担任牵头数据治理
37、任务;制定数据治理的政策、规范、规那么、流程,协调认责冲突;对数据现实治理,保证数据的质量和隐私;在数据出现质量问题时担任仲裁任务。数据治理中心数据平台运营者数据管理中心机构的平台运营人员担任提交数据规范的要求及数据质量规那么和业务规范,解释数据的业务规那么和含义;监视各项数据规那么和规范的约束的落实情况;担任数据治理平台中整体数据的管控流程制定和平台功能系统支撑的实施;担任平台的整体运营、组织、协调。各业务部门数据提供者相关数据开发提供人员担任数据及相关系统的开发,有责任执行数据规范和数据质量内容;担任从技术角度处理数据质量问题;作为数据出现质量问题时的主要责任者。数据维护者数据维护人员制定
38、相关数据规范、数据制度和规那么;遵守和执行数据规范管控相关的流程,根据数据规范要求提供相关数据规范;作为数据出现质量问题时的次要责任者。数据消费者数据运用人员,包含内部用户和外部用户作为数据治理平台数据管控流程的最后参与运用者;是数据资产价值的获益人;作为数据治理平台数据闭环流程的发起人。系统架构系统功能框架数据治理功能框架明确了数据治理在企业级省大数据平台中的定位,并以合理的功能层次划分指点数据治理系统相关功能建立。系统功能框架如 REF OLE_LINK12 h * MERGEFORMAT 图53所示。 图 STYLEREF 1 s 5 SEQ 图 * ARABIC s 1 3数据治理功能
39、框架图企业级省大数据平台门户:企业级省大数据平台一致的访问接口,供企业内、外部用户、第三方独立开发者访问及运用数据治理相关产品或功能,并担任一致访问认证及日志记录。才干开放平台:企业级省大数据平台一致的对外效力层,数据治理相关的产品及运用均经过这个层次进展注册、发布,并对内、外部开放。数据治理系统:数据规范:在数据规范管理组织架构推进和指点下,遵照协商一致制定的数据规范规范,借助规范化管控流程得以实施数据规范化的整个过程。元数据:采用集中式管理方式进展元数据管理,全公司元数据逻辑集中,即元数据管理模块作为公司元数据的一致发布源,集中管理元数据,提供元数据集中创建、维护、查询功能。数据质量:对数
40、据从方案、获取、存储、共享、维护、运用、消亡生命周期的每个阶段里能够引发的各类数据质量问题,进展识别、度量、监控、预警等一系列管理活动,并经过改善和提高组织的管理程度使得数据质量获得进一步提高。数据资产:规划、控制、提供数据及信息资产的一组业务职能,包括开发、执行和监视有关数据的方案、政策、方案、工程、流程、方法和程序,从而控制、维护、提高数据资产的价值。数据平安:经过方案、制定、执行数据平安政策和平安战略措施,为企业级大数据平台的数据和信息提供行之有效的认证、授权、访问和审计。数据运维在左侧目录里短少一个模块:包括数据资产运维、数据质量运维,自创互联网思想,经过产品化运维工具来整体提升企业级
41、大数据平台数据运维效率。企业级省大数据平台:大数据根底平台,担任数据的接入、存储、管理、运用及相关根底功能支撑。系统模块流程图 STYLEREF 1 s 5 SEQ 图 * ARABIC s 1 4数据治理系统功能各模块关系图如 REF _Ref428627623 h * MERGEFORMAT 图54所示,数据治理系统各模块之间,根据数据操作的流程产生相互关联,各模块业务流程关系阐明如下:L1:数据规范管理模块将规范定义映射到元数据信息上,实现数据规范的规范要求落地。L2:元数据管理模块为数据资产管理模块提供存储模型、属性信息查询效力。L3:元数据管理模块为数据质量管理模块提供元数据相关属性
42、信息。L4:用户经过元数据定义大数据平台的数据构造。L5:数据质量管理模块根据采集需求从大数据平台采集数据。L6:数据质量管理模块将数据质量问题反响给大数据平台。L7:数据质量管理模块向资产模块提交数据质量评价结果。L8:元数据管理模块为数据平安管理模块提供隐私级别定义效力。L9:数据资产管理模块发起资产访问恳求,由数据平安管理模块控制用户访问权限,控制数据资产的添加、删除、变卦操作权限,对访问的数据内容、数据属性等操作进展管控。L10:数据平安管理模块为大数据平台提供数据访问权限战略。系统边境企业级省大数据平台数据治理子系统与其它子系统之间存在数据交互、功能调用、流程交叉等关联。数据治理子系
43、统与大数据平台系统内其它子系统的关系表示如 REF OLE_LINK13 h 图55所示:数据治理元数据管理数据规范管理数据质量管理数据资产管理数据平安管理数据效力平台企业级省大数据平台平台运维图 STYLEREF 1 s 5 SEQ 图 * ARABIC s 1 5数据治理子系统与各子系统边境图与企业级省大数据平台关系企业级省大数据平台上的数据资产是数据治理的主要对象;数据治理为企业级省大数据平台提供数据规范指点、元数据定义、数据质量监控、数据平安等方面的全面支撑,使大数据平台上的数据资产明晰、有序、平安、可控。与对外才干开放平台关系数据治理为对外才干开放平台提供元数据查询、数据平安管理支持
44、;对外才干开放平台为数据治理提供一致的数据治理产品及功能注册、发布、运用效力。与平台运维系统关系数据治理子系统支撑大数据平台的数据管控流程,并与平台运维交互协调,共同支撑大数据平台整体的平安运维、数据运维和管理运维。数据治理中心模块数据规范管理背景中国挪动企业级省大数据平台数据规范是在运营分析系统数据管控要求根底之上,自创互联网企业数据治理的阅历而提出的。数据规范是指在中国挪动企业级省大数据平台下,保证企业内外部运用和交换数据的一致性和准确性,具有行业特点且共同运用的一种规范性约束。数据规范是企业级省大数据平台数据治理的根底性任务,是数据治理建立中的首要环节。首先,数据规范为企业级省大数据平台
45、提供一致的数据规范定义和平台逻辑模型。其次,数据规范是企业级省大数据平台进展数据治理的根据和根本。再次,数据规范是衡量企业级省大数据平台数据资产运营和管理的评价根据。最后,中国挪动经过数据规范管理的实施,实现对企业级省大数据平台全网数据的一致运营管理。企业级省大数据平台数据治理体系中数据规范管理如 REF _Ref428627723 h * MERGEFORMAT 图61所示,包括制定数据规范的规范性文件、进展数据规范化管控及数据规范管理组织。图 STYLEREF 1 s 6 SEQ 图 * ARABIC s 1 1数据规范管理内容企业级省大数据平台数据规范管理与原运营分析系统数据管控的区别如
46、下 REF _Ref428627768 h 表61所示:表 STYLEREF 1 s 6 SEQ 表 * ARABIC s 1 1企业级省大数据平台数据规范管理与原运营分析系统数据管控区别企业级省大数据平台数据规范管理原运营分析系统数据管控数据范围涉及企业内外部数据运营相关的数据,包含BOM三域数据、外部数据。数据仅限于市场运营活动的B域和部分O,M域数据。业务运用方式以数据规范为根底的数据治理体系,实现数据的资产化,贯穿整个数据运营的全流程,构成以中国挪动大数据平台为中心的大数据生态圈,效力于企业内外部客户。以支撑企业内部运营分析为主。效力对象效力于整个大数据生态圈。原运营分析系统运用人员。
47、目的及原那么数据规范管理的总体目的:经过一致的数据规范制定和发布,结合制度约束、系统控制等手段,实现中国挪动企业级省大数据平台数据的完好性、有效性、一致性、规范性、开放性和共享性管理,提高企业级省大数据平台数据治理程度。数据规范制定的原那么:开放性:规范制定人人参与。共享性:数据规范化信息在大数据生态圈共享运用。完好性:涵盖客户、产品、效力、帐务、资源、网络等全部重要数据信息。有效性:信息准确度高、了解上不存在歧义。一致性:做到“五一致,定义一致、口径一致、称号一致、来源一致、参照一致。规范性:制度规范、流程控制、系统管理等。业务分类和定义数据规范体系分类数据规范制定如 REF OLE_LIN
48、K14 h 图62所示,包括数据规范体系划分和数据规范内容制定,数据规范体系可分为根底类数据规范和目的类数据规范。图 STYLEREF 1 s 62数据规范体系划分数据规范内容制定数据规范内容的制定按照数据规范体系分类的要求分别给出数据规范制定的规范要求。1、根底类数据规范根底类数据规范是经过各种业务处置产生或各类渠道采集的根底性数据,在全国范围内必需是独一定义的,如“用户品牌、“归属地市。根底类数据规范分为行业参考模型实体规范和公共代码规范。行业参考模型实体规范指按照行业需求和中国挪动省级数据逻辑模型实体规范要求,承继以往数据逻辑模型实体规范,将各域的逻辑模型实体定义笼统为模型实体规范要求。
49、行业参考模型实体数据规范体系定义内容如 REF _Ref428627873 h * MERGEFORMAT 表62所示。表 STYLEREF 1 s 6 SEQ 表 * ARABIC s 1 2行业参考模型实体数据规范体系定义内容行业参考模型实体规范规范体系属性阐明数据规范编码根据数据规范编码命名规那么进展编写。规范主题数据规范归属主题规范子类数据规范归属类型中文称号数据规范中文称号。英文称号数据规范英文称号。实体编号根据行业参考模型实体编号命名规那么进展编写。实体称号根据行业参考模型实体称号命名规那么进展编写。数据版本该数据规范的版本信息。数据体系分类根据数据分类规那么对数据进展分类,以保证
50、数据体系的易用性,以及符合用户查找习惯。重要级别集团规范定义的数据为一级,省公司定义的数据为二级,其它常用的数据为三级。数据提供部门该数据规范定义数据的提供部门。数据提供部门担任人该数据规范定义数据提供担任人。数据维护部门该数据规范定义数据维护部门。数据维护部门担任人该数据规范定义数据维护担任人。业务主管部门该数据规范定义数据业务主管部门,该部门对数据口径、编码取值和相关专业术语有决议权。业务主管部门担任人该数据规范定义数据业务担任人。数据来源系统如:BOSS,CRM,ERP等主要根据关于目的的解释和描画文件。如集团规范、省公司规范、业务部门制定等等。业务定义目的的业务描画口径,普通由业务部门
51、运用业务言语制定。详细行业参考模型实体数据规范体系定义内容例如参见。公共代码规范,指对于一些共享程度较高、内容相对比较稳定的编码,通常可以组织力量一次性地编制出来,其中有一些需求援用外部公共规范机构的规范,比如:世界各国和地域称号代码等。公共代码规范体系定义内容如 REF _Ref428627884 h * MERGEFORMAT 表63所示。表 STYLEREF 1 s 6 SEQ 表 * ARABIC s 1 3公共代码规范体系定义内容公共代码规范规范体系属性阐明数据规范编码根据数据规范编码命名规那么进展编写。公共规范号引入外部公共规范号中文规范称号数据规范中文称号英文规范称号数据规范英文
52、称号。规范形状该规范的形状,如现行、停顿。公共规范机构称号引入该公共规范的机构称号。数据规范体系根据数据分类规那么对数据进展分类,以保证数据体系的易用性,以及符合用户查找习惯。重要级别集团规范定义的数据为一级,省公司定义的数据为二级,其它常用的数据为三级。数据规范引入部门该数据规范引入和维护部门。数据规范引入部门担任人该数据规范引入和数据维护担任人。数据上报系统最终对数据进展计算和发布的系统,也是各部门独一获取目的数据的来源系统。详细行业参考模型实体数据规范体系定义内容例如参见。2、目的类数据规范目的类数据规范是数据根底上按照一定业务规那么加工汇总的数据,如KPI目的数据。目的类数据又可分为根
53、底目的和计算目的。根底目的普通不含维度信息,且具有特定业务和经济含义。计算目的通常由两个以上根底目的计算出。目的类数据规范体系定义内容如 REF _Ref428627895 h * MERGEFORMAT 表64所示。表 STYLEREF 1 s 6 SEQ 表 * ARABIC s 1 4目的类数据规范体系定义内容目的类规范阐明根底属性数据规范编码根据数据规范编码命名规那么进展编写。中文称号数据规范中文称号。英文称号数据规范英文称号。运用场景该目的适用于什么场景。数据版本该数据规范的版本信息。数据体系分类根据数据分类规那么对数据进展分类,以保证数据体系的易用性,以及符合用户查找习惯。重要级别
54、集团规范定义的数据为一级,省公司定义的数据为二级,其它常用的数据为三级。管理属性数据提供部门该数据规范定义数据的提供部门。数据提供部门担任人该数据规范定义数据提供担任人。数据维护部门该数据规范定义数据维护部门。数据维护部门担任人该数据规范定义数据维护担任人。业务主管部门该数据规范定义数据业务主管部门,该部门对数据口径、编码取值和相关专业术语有决议权。业务主管部门担任人该数据规范定义数据业务担任人。数据上报系统最终对数据进展计算和发布的系统,也是各部门独一获取目的数据的来源系统。数据生成系统生成数据所需的数据所在的来源系统,如BOSS系统。数据上游系统数据生成后上报给哪个系统,如ERP系统。业务
55、属性主要根据关于目的的解释和描画文件。如集团规范、省公司规范、业务部门制定等等。业务定义目的的业务描画口径,普通由业务部门运用业务言语制定。计算流程/算法用来描画目的详细的计算过程。目的类型根据管理需求可以将目的分为根底目的、计算目的两类。计算目的公式用于描画相关目的间的平衡关系,可用于目的数据审核过程中,能有效地保证目的数据质量。技术属性计量单位数据运用单位如:“户、“分钟、“MB、“元、“次、“%等等。统计精度目的统计数值准确到小数还是整数。数据值域数据的合理取值范围。统计周期数据统计周期如“日、“周、“月、“季度、“半年、“年等等。统计粒度数据统计粒度如:“用户级、“区县级、“地市级等。
56、统计维度数据统计维度如:“地域、“品牌、“在网时长、“客户等级等。目的出数表目的数据来源于哪张物理表。目的出数代码目的数据来源于物理表的哪个。详细行业参考模型实体数据规范体系定义内容例如参见。技术功能要求数据规范制定数据规范的制定按照本册中数据规范管理的业务分类和定义规范指点要求,基于各企业级省大数据平台的数据管控需求进展数据规范规范的制定。其制定的数据规范规范内容在全省进展发布和告知,要求企业级省大数据平台系统按照该规范规范进展一致的数据管理。数据规范制定包括数据规范的编制、数据规范的审查、数据规范的发布。数据规范化管理组织将数据规范以正式发文的方式在全公司范围内进展发布,并在发布后将数据规
57、范、版本阐明保管备案。最终将发布的数据规范更新至数据规范管理模块中,如 REF OLE_LINK22 h 图63所示。图 STYLEREF 1 s 63改为图6-4数据规范管理的编制、审查、发布流程图数据规范的编制、审查和发布经过数据规范管理模块开发实现,其流程如 REF OLE_LINK15 h * MERGEFORMAT 图63示:1、数据规范管理组织协调者组织数据提供者和执行者参与数据规范属性的搜集和整理任务,并按照协商一致的原那么构成数据规范初稿。2、数据规范初稿进展多次的讨论和丰富后,构成数据规范送审稿提交给数据规范管理决策者。3、经过数据规范管理决策者的讨论审核后,由数据规范管理组
58、织协调者再次进展数据规范的修正完善,并完成数据规范的发布。数据规范执行数省公司和各部门、分公司一致按照所制定的数据规范实施数据规范管理,数据规范的执行流程如 REF _Ref428627939 h 图64所示。图 STYLEREF 1 s 6 SEQ 图 * ARABIC s 1 4数据规范管理的执行流程图 数据规范执行的流程步骤如下:1、数据规范制定发布后,将数据规范录入到数据规范管理模块。2、数据规范管理执行者按照发布的数据规范,制定和发布数据规范接口。3、数据规范管理模块将规范要求提供应数据质量管理根据已录入系统的数据规范构成稽查规那么,对数据规范管理执行者制定和发布的数据规范接口中的内
59、容进展相关的规范稽核监控。4、将规范稽核结果发送给数据规范管理模块,并反响给数据规范管理决策者和数据规范管理执行者。数据规范维护数据规范的维护指数据规范建立后,根据业务需求的开展变化或外部数据规范要求不一致时,对数据规范的内容进展变卦和版本管理,如 REF OLE_LINK23 h 图65所示。图 STYLEREF 1 s 65数据规范管理的变卦流程图数据规范管理的变卦经过数据规范管理系统开发实现落地,其流程如 REF OLE_LINK16 h 图65所示:1、对执行的相关数据规范进展变卦恳求的恳求,组织该数据规范相关执行层和各数据运维者进展讨论和变卦需求汇总。2、由数据规范管理组织协调机构进
60、展规范变卦的审核。3、讨论审议数据规范项的变卦内容,并构成规范变卦需求审批表提交给数据规范管理决策层进展审批。4、决策层将审批结果反响给规范管理组织协调者,并由其进展数据规范发布及版本维护。数据规范监控数据规范监控实现对数据规范执行过程的监控,包括对数据规范的执行、效果、问题进展监控管理,为后期数据规范维护管理提供根据。数据规范的监控经过数据规范管理和元数据管理、数据质量管理协同实现落地,监控流程如 REF OLE_LINK17 h 图66所示:图 STYLEREF 1 s 66数据规范管理监控流程图数据规范管理监控流程如下:数据管理者录入数据规范和元数据信息。根据数据规范制定数据规范接口。根
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 考试题及答案
- 2026春招:广州农商银行笔试题及答案
- 临床心理评估
- 外科学总论下肢静脉曲张手术皮肤切口设计要点课件
- 内科学临床技能缺铁性贫血的铁调素作用课件
- 外科学总论破伤风患者康复心理教学要点课件
- 2024年息烽县辅警招聘考试备考题库附答案
- 消化内科核心疾病食管裂孔疝护理课件
- 外科学总论肝移植课件
- 2024年贡嘎县辅警招聘考试真题及答案1套
- 小糖人课件:糖尿病患者儿童糖尿病的护理
- 2026年哈尔滨职业技术学院单招职业适应性考试题库参考答案详解
- 2025云南昆明巫家坝建设发展有限责任公司及下属公司第四季度社会招聘31人历年真题汇编带答案解析
- 66kV及以下架空电力线路设计标准
- 生鲜联营合同范本
- 2025重庆川仪自动化股份有限公司招聘56人笔试参考题库附带答案详解(3卷合一版)
- 2025年浙江乍浦经济开发区(嘉兴港区)区属国有公司公开招聘28人笔试考试备考试题及答案解析
- 论文发表合同协议
- 《SJT 11319-2005锡焊料动态条件氧化渣量定量试验方法》(2025年)实施指南
- 2025年长者教育与培训项目可行性研究报告
- 全国园林绿化养护概算定额(2018版)
评论
0/150
提交评论