




免费预览已结束,剩余9页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 目录目录 1 现状分析 1 1 1 目前的困境 2 1 2 什么是元数据管理 2 2 目标分析 3 2 1 建立完善的指标解释体系 3 2 2 建立规范的元数据管理体系 3 2 3 建立有效的数据稽核体系 4 3 功能概述 4 3 1 元数据管理 4 3 1 1 业务元数据 4 3 2 2 技术元数据 5 3 3 元数据分析 7 3 3 1 血统分析 8 3 3 2 影响分析 8 3 3 3 重要性分析 8 3 3 4 无关性分析 8 3 4 数据稽核 9 3 4 1 稽核规则管理 9 3 4 2 稽核任务调度 9 3 4 3 稽核结果分析 10 3 4 4 数据质量评估 10 3 4 5 数据问题管理 10 2 元数据管理系统概述元数据管理系统概述 1 现状分析现状分析 随着经营分析系统规模不断扩大 系统所积累数据量也越来越大 收集到 的海量数据背后隐藏着大量珍贵重要的信息 但也同时提高了系统的数据管理 难度 一方面难以对这些数据进行有效解释 缺乏对业务流程执行的实时监控 和管理 另一方面各部门数据与数据整合的难度也不断加大 影响到了经营分 析系统中的数据质量 如何对现有数据进行深层发掘 并揭示出埋藏在元数据中的趋势 因果关 系 关联模式等核心信息 这是下一步深化经营分析系统应用的电信运营商需 要解决的头等大事 构建 BI 首先要保证的是数据质量 元数据管理解决的问 题就是如何把业务系统中的数据分门别类地进行管理 并建立数据与数据之间 的关系 为数据仓库的数据质量监控提供基础素材 1 1 目前的困境目前的困境 使用者使用者 决策层 业务分析人员决策层 业务分析人员 1 经营分析系统中存在有很多报表 不同报表中存在一些相同的指标 这 些指标往往不一致 给业务分析和决策工作造成很多困惑 必须花费很大 的精力去检查核实 2 对于很多指标 不清楚其具体含义 不清楚其反映的问题 不清楚其具 体算法和来龙去脉 数据仓库项目开发维护者 数据仓库项目开发维护者 1 不同报表中的同一指标不一致 必须花费很大的精力去检查 目前基本 上是通过手工检查表和存储过程的方式 效率较低 2 没有完善的开发 维护规范 比如 新增一张分析报表 开发人员根据 业务人员的需求制作完成之后 往往没有整理完善相应的数据指标解释和 元数据管理 造成日后检查困难 3 开发 维护规范的执行力较低 没有行之有效的管控手段 不严格按照 3 规范执行 随着项目的发展和时间的推移 导致数据仓库项目的健壮性和 可维护性呈几何级数下降 给数据仓库的建设带来大量的重复工作 1 2 什么是元数据管理什么是元数据管理 元数据最本质 最抽象的定义为 data about data 关于数据的数据 而对于经营分析数据仓库而言 形象的定义为 元数据就是数据仓库的规元数据就是数据仓库的规 范范 这些规范包括对各种指标的定义 解释 包括对各表中数据的来龙去 脉 数据的大小和格式的定义 元数据管理 就是要建立一套行之有效的规范以及该规范的管控体系 实现从管理到查询到综合分析的全面管控 管理层次从接口到 ETL 处理 业务逻辑处理 结果展现处理和指标分析的方方面面 构成数据仓库应用 系统的核心和基础 做到开发者能严格遵守规范 维护者和使用者有规范 可查 有力的保障数据仓库项目的健壮性和可维护性 2 目标分析目标分析 要走出目前的困境 有下面三个方面的问题急待解决 2 1 建立完善的指标解释体系建立完善的指标解释体系 满足用户对业务和数据理解的需求 建立标准的企业内部知识传承的 信息承载平台 建立业务分析知识库 实现知识共享 能够回答诸如以下 问题 什么是出帐用户数 在网用户数和网上用户数有何区别 什么是套餐的生命周期 竞争对手新发展用户数是怎么得来的 这个数据还叫什么名字 4 2 2 建立规范的元数据管理体系建立规范的元数据管理体系 让用户能够清晰的了解数据仓库中数据流的来龙去脉 业务处理规则 发展情况等 提高系统的可维护性 适应性和集成性 支持数据仓库 集市 的成长需求 减少因员工换岗造成的影响 具体来讲 主要是对数据仓库建设 运行和维护的规范的管理 能够 回答诸如以下的问题 哪张表是从业务系统抽取过来的原始话单表 竞争对手新发展用户事实表中的数据 是从哪些表汇总计算出来的 DW 用户下的 P XXX 这个存储过程是谁写的 现在还有用吗 我是新手 要生成套餐生命周期演化分析事实表 我该怎么做 表空间不够了 哪些表的数据可以删掉 2 3 建立有效的数据稽核体系建立有效的数据稽核体系 促进数据仓库的数据质量建设 为提高整个系统的数据质量奠定坚实 的基础 建立报警 监控机制 出现故障 能及时发现问题 提供整体系 统运营的情况分析 能够回答诸如以下问题 今天的出帐用户数过高 是怎么回事 数据集市层中的 DM XXX 表中数据为空 什么原因 A 报表中的全省 ARPU 值和 B 报表中的 ARPU 值为什么不同 3 功能概述功能概述 3 1 元数据管理元数据管理 对数据仓库的层次结构 主题域划分 各层的各种对象 如表 存储 过程 索引 数据链 函数和包等的管理 能够清晰的展现各层次结构之 间的数据流程 图形化展现各对象之间的关系 展现表中数据的来龙去脉 5 3 1 1 业务元数据业务元数据 业务元数据包括以下信息 使用者的业务术语所表达的数据模型 对 象名和属性名 访问数据的原则和数据来源 系统所提供的分析方法及公 式 报表信息 业务元数据管理除了管理上述信息外 还提供对业务元数据来源的管 理和差异性对比功能 使用户能够方便的查询 比较和追溯 包括两个子模块 指标管理指标管理和指标解释接口指标解释接口 指标管理指标管理 主要实现对所有指标的维护功能 维护指标的基本信息 业务规则和技术算法等 能够展现各个主题分析中的指标 以及指标间的 区别等信息 指标解释接口指标解释接口 提供统一的接口 使用户能够在经营分析系统或 CRM 系统中 点击任一指标名称 即可查看该指标的详细描述和解释说明 6 3 2 2 技术元数据技术元数据 技术元数据是存储关于数据仓库系统技术细节的数据 是用于开发和 管理数据仓库的数据 主要包括数据仓库结构的描述 各个主题的定义 星型模式或雪花型模式的描述定义等 ODS 层 操作数据存储 ODS Operation Data Storage 的企业数据模型描述 以描述关系表及其关联关 系为形式 对数据稽核规则的定义 数据集市定义描述与装载描述 包括 Cube 的维度 层次 度量以及相应事实表 概要表的抽取规则 系统除了维护技术员数据的基本信息外 更以图形的方式展现和管理 各技术元数据之间的关联关系和来源 技术元数据管理主要包括以下几个功能模块 元数据查询元数据查询 按关键字 分类 主题域名称等维度进行查询 展现该 元数据的基本信息 如业务描述 技术描述 计量单位 所属分类等信息 元数据维护元数据维护 对元数据的基本信息进行维护 包括增 删 改 7 元数据关系查询元数据关系查询 展现元数据之间的关系 如 按经营分析数据仓库 的各个层次进行展现 按元数据之间的映射关系展现 按元数据的处理流 程进行展现等等 8 元数据关系管理元数据关系管理 对元数据关系进行维护 包括增加 删除和修改 如上图所示 鼠标右键点击某个节点 对该节点进行增 删 改操作 9 3 3 元数据分析元数据分析 血统分析 影响分析 表重要程度分析 表无关程度分析等等 通过 上述分析 让用户对整个数据仓库总体上有清晰的认识和理解 解决数据 孤岛的问题 3 3 1 血统分析血统分析 数据血统 Data Lineage 通过数据血统分析 用户可以知道数据何 时更新 如何计算以及从何处而来 所有这些手段帮助用户追溯报表中数 据产生的来源 这种深入洞查数据来龙去脉的能力对于帮助用户更加信赖 他们的信息来说 具有至关重要的作用 10 移动大客户信息展现移移动动新新入入网网用用户户信信息息展展现现 数数据据集集市市 DM 层层 数数据据仓仓库库 DW 层层 ODS 层层 源源数数据据 SRC 层层 业业务务生生产产系系统统 营营帐帐系系统统话话单单表表 ETL抽取话单 联通用户通话详单 从详单中抽取与移动用户的通话记录 移动用户通话详单表 与移动在网用户比较沉淀话务指标 移动用户话务表移动新入网用户表 汇总产生大客户信息汇总产生新入网用户信息 3 3 2 影响分析影响分析 影响分析关注的重点是数据的流向 提供端对端影响分析 使您能够 看见源系统发生变化时 BI 报表受到的影响 而因此可以轻松地处理 BI 环境中的变化 11 移动大客户信息表 竞竞争争专专题题 用用户户分分析析 竞竞争争专专题题 策策反反 高高层层决决策策 市市场场分分析析 移动用户话务信息表 处理大客户信息 竞竞争争专专题题 大大客客户户明明细细 高高层层决决策策 竞竞争争对对手手 3 3 3 重要性分析重要性分析 分析 BI 系统中 用户最关心的分析主题 报表和指标 追溯这些分析 主题 报表和指标涉及到的元数据 这对于 BI 系统和数据仓库开发团队具 有重要的指导意义 分析各元数据对象之间的关联密集度 分析数据仓库中各层次的包 表等对象的重要程度 指导数据仓库开发和维护团队对重点元数据进行重 点关注和质量监控 目标元数据对象 前端展现专题分析模块 12 移动用户通话详单 处理新入网信息 沉淀话务信息 移动用户话务 移动新入网用户 处理策反用户 策反用户信息 处理移动大客户 移动大客户 汇总话务信息 互通话务信息 分析联通用户话务 与移动互通用户话务信息 3 3 4 无关性分析无关性分析 与重要性分析相反 随着数据仓库系统的规模不断扩大 业务需求的 日益变化 会产生一定数量的无关数据 信息和报表 找出这些无关的内 容 结合业务需求分析其产生的根源 从而为用户简化工作负载 降低项 目总拥有成本 为用户提供可信赖的数据和分析能力 3 4 数据稽核数据稽核 根据预先配置的规则 算法和质量检查度量 对数据的准确性 合理 性等多角度的检查 以及时发现问题 解决问题 对于稽核结果 进行统计分析 形成结果报告 为以后的数据仓库建 设 实施和维护的改进打下坚实的基础 13 3 4 1 稽核规则管理稽核规则管理 接口数据检验接口数据检验 对接口数据的过程进行稽核和校验 分为文件接口 DB LINK 接口 其他异构数据库接口 处理过程检验处理过程检验 对数据处理过程进行监控和稽核 分为 JOB 稽核 工 作流稽核 其他处理方式稽核等 处理环境检验处理环境检验 对数据处理环境进行检查 针对不同的应用环境 主 要分为数据库系统检查 主机系统检查 接口机检查 应用服务器检查 日志监控日志监控 在 ETL 自动运行的过程中可能出现各种各样的错误 比如 ETL 过程申请的资源超过硬件的物理限制 存储不足或者排序空间不足 通过检测 ETL 过程的日志可以判断出该过程输出的目标表数据是否完整 提供选择日志监控的各种信息供选择 如 过程名 所属模块 营业数据 计费数据 维表数据等 执行时间 完成时间 执行时长 执行用户 执 行结果 预警等 维度检验维度检验 如 所属模块 营业数据 计费数据 维表数据等 日期 表名 维度名称 纬度格式 纬度说明 纬度关联编码表 各纬度记录分 布情况 是否有空值 空值记录数 空值率 预警区间等指标 指标值检验指标值检验 包括数据量校验 单指标校验 交叉校验等 3 4 2 稽核任务调度稽核任务调度 在设定数据稽核的模板后 可以对稽核任务实行自动化处理 也可以 通过定制方式来完成 可以定时调用或触发 由不同类型数据检验确定 比如 前序数据 计费营帐数据 可以使用定时调度任务检查数据完 整性 后序数据 DW 层数据直到数据集市展示层的汇总数据 的调用可 以通过日志记录触发开始 每个表记录完成后如果日志检测执行正确 则 进行进一步的数据稽核检测 14 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临沂城管考试题库及答案
- 拜城工地考试题库及答案
- 消防院校考试题库及答案
- 放射考试题库及答案内镜室
- 工厂普工面试考试题库及答案
- 2025年新材料研发合伙合同范本
- 2025年广西专业技术人员继续教育公需科目科目考试题库及答案
- 煤矿安管证考试题及答案
- 救生员急救考试题及答案
- 高新技术企业资质保证承诺书6篇
- 四年级数学上册试题 一课一练2.3《平移与平行》习题1-北师大版(含答案)
- 小学英语外研版5A Unit2 They sell many different things Module 2部优课件
- 中国文学史概述
- 9.10.11有机、酸碱一般排-盛剑
- 完整版:美制螺纹尺寸对照表(牙数、牙高、螺距、小径、中径外径、钻孔)
- 毕业设计-太平哨水利枢纽引水式水电站设计
- 农村与区域发展概论样题 2
- 陈氏太极56式拳谱
- 小井眼套管开窗侧钻技术
- 机电技术应用专业岗位任务分析表
- 2019法考主观题考前聚焦2小时商法曹新川案例题参考答案
评论
0/150
提交评论