付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、商业智能实施方案,2020年9月23日,1、实施方法,2、实施步骤,数据仓库管理,物理数据模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,项目具体实施步骤,项目前期准备,业务探索,信息探索,逻辑数据 模型,1. 项目前期准备 2. 业务探索(Business Discovery) 3. 信息探索(Information Discovery) 4. 逻辑数据模型设计 5. 系统体系结构设计 6. 物理数据库设计 7. 数据转换加载ETL 8. 前端应用开发 9. 数据挖掘服务 10.元数据管理 11.数据仓库管理(处理流程与操作) 12.解决方案集成(测试验
2、收与试运行),2.1 项目前期准备,主要任务: 项目启动会议(Kick-off Meeting) 确认项目范围和主要目标 确认项目阶段性验收及总体验收标准 确认项目实施计划 成立项目组 确定各项目小组的成员及各自的工作职责 确定各项目小组的阶段性工作目标 确定教育训练计划 确定服务流程及方式 交付项目: 项目组织机构 项目人员组成,项目前期准备,业务探索,信息探索,逻辑数据 模型,2.2 业务探索(Business Discovery),主要任务: 确定重点用户与数据源 用户需求调研与确认 数据源确认 用户需求和数据源的筛选和分析 交付项目: 业务需求说明书BRL ( Business Req
3、uirement List ) 概念数据模型CDM ( Conceptual Data Model ),项目前期准备,业务探索,信息探索,逻辑数据 模型,2.3 信息探索(Information Discovery),主要任务: 分析用户需求 数据源分析 进行工具评估 系统安全性设计 系统命名规范设计 交付项目: 功能需求列表FRL ( Function Requirement List ) 系统安全性设计说明书 系统命名规范说明书 数据质量分析,项目前期准备,业务探索,信息探索,逻辑数据 模型,2.4 逻辑数据模型设计,主要任务: 进行原始数据分析 建立实体模型 建立实体间依赖关系 完善并填
4、入所有属性 建立数据库逻辑模型 利用工具: Erwin/Power Designer 交付项目: 数据仓库逻辑数据模型LDM 逻辑数据模型说明书,项目前期准备,业务探索,信息探索,逻辑数据 模型,2.4 逻辑数据模型概念,逻辑数据模型是用来发现、记录和沟通业务的详细“蓝图”,基于概念数据模型(CDM) 由一系列表和实体详细描述组成 通用的业务语言 便于业务与业务之间的功能理解 集成当前和未来数据的蓝图 独立于技术 为物理数据库设计作准备 是IT人员和业务人员沟通的工具,2.4 逻辑数据模型(LDM)示例,2.5 系统体系结构设计,主要任务: 对业务、技术环境及企业文化的充分了解,从技术、组织、
5、教育和支持等方面对系统进行全面评估 定义业务驱动力 定义数据仓库成功的关键因素 定义数据仓库的实施原则 对系统体系结构各个组件进行详细设计 交付项目: 系统体系结构设计说明书,数据仓库管理,物理数据 模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,2.5 体系结构设计组件,用户类型 拓扑结构 网络存取与互连 组织机构 安全性 数据体系结构 逻辑数据模型 元数据 数据质量 命名规范 数据采集与转换 用户存取及工具 备份系统 操作管理,2.6 物理数据库设计,主要任务: 转换逻辑数据模型(LDM)为物理数据模型 定义主索引、次索引 非正则化处理 数据库建立 设
6、计优化 数据库功能测试 使用工具: ERWwin 交付项目: 物理数据模型(LDM) 物理数据模型说明书 数据库描述语言DDL,建模方法: 第三范式 3NF 星型结构 雪花状结构,数据仓库管理,物理数据 模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,2.6 数据模型的演变,概念数据模型( CDM Conceptual Data Model ) 主要实体和它们的关系 (Major Entities and Their Relationships) 逻辑数据模型 ( LDM - Logical Data Model ) 业务模型加(CDM Plus) : 所
7、有的表及简单的数据(All Tables with Sample Data) 辅助的表及简单的数据( Minor Tables with Sample Data ) 主键与外键的关系( PK & FK Relationships ) 数据约束( Constraints ) 属性( Attributes ) 扩展逻辑数据模型 (ELDM - Extended Logical Data Model ) 逻辑数据模型加(LDM Plus) : 存取详细描述(Access Demographics) 数据详细描述(Data Demographics) 物理数据模型 ( PDM - Physical D
8、ata Model ) 扩张逻辑数据模型(ELDM Plus): 索引 (Indices) 非正则化 (Denormalization),2.6 非正则化处理 ( Denormalization ),非正则化的两种类型: 物理非正则化 派生数据 (Derived Data) 汇总表 (Summary Tables) 重复的Groups ( Repeating Groups) 多物理表 (Multiple Physical Tables) 预连接 (Pre-joins) 子实体 (Sub-entities) 逻辑非正则化 视图 (Views) 逻辑星型结构 (Logical Star Schem
9、as) 物理非正则化对模型的灵活性会有影响 逻辑非正则化是一个优选的方法(OLAP实现),2.6 物理数据模型(PDM),2.7 数据转换与加载(ETL),主要任务: 数据源及其特性定义 数据析取、转换和加载策略设计 构建和测试初始加载的程序和处理流程 构建和测试日常加载的程序和处理流程 40%的工作量在数据转换与加载上 使用工具: Sagent或Datastage、Informatic 交付项目: 数据转换加载设计说明书 数据映射 (Data Mapping)说明书 数据转换加载脚本 ( ETL Scripts) 加载流程控制( ETL Process Control),数据仓库管理,物理数
10、据 模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,2.7 数据清洗方法,在源系统上进行清洗(数据析取前) 在加载服务器上进行清洗(数据析取后、加载前) 在数据仓库里进行清洗(数据加载后),源系统,ETL服务器,数据仓库,2.7 数据转换常用手段,析取 Extracting 条件 Conditioning 剔除 Scrubbing 合并 Merging 浓缩 Enrichment 确认 Validating 加载 Loading 评分 Scoring 关系识别 House holding,2.8 前端应用开发,主要任务: 前端应用体系结构设计 OLAP应用
11、设计(Summary/Fact表及Cub的产生) 前端应用开发(随机查询、预定义报表、 OLAP应用) 撰写用户使用手册 用户测试验收 使用工具: 查询报表工具(Hyperion performance suit) OLAP工具(Essbase) 基于Web的开发工具(J2EE) 其他开发工具,如: Portal 交付项目: 前端应用体系结构设计说明书 应用模块设计说明书 用户使用手册 ,数据仓库管理,物理数据 模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,2.10 元数据管理,元数据(Metadata) 是指关于数据的数据,即用来描述数据的类型、来源、
12、定义、存储位置,使得业务用户可以正确地使用数据仓库。,主要任务: 定义元数据使用功能 设计元数据环境逻辑结构 设计元数据环境物理结构 选择合适的元数据管理工具 建立元数据仓库(Metadata Repository) 建立和测试元数据接口 使用工具: ETL TOOLS 交付项目: 元数据管理说明书,数据仓库管理,物理数据 模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,2.10 元数据开发,元数据的开发应该包含在数据仓库实施过程的每一步骤中,下图是元数据各部分内容与数据仓库开发过程的对应关系:,2.11 数据仓库管理,主要任务: 设计和开发数据仓库支持体
13、系结构 开发和测试数据仓库日常运作流程 开发和测试性能监视程序 开发和测试数据备份与恢复程序 开发和测试安全系统 设计和开发操作人员/最终用户培训计划 建立用户支持和培训材料 使用工具: 系统监控工具和管理工具 交付项目: 数据仓库管理过程说明书 数据备份过程设计说明书 安全管理模块设计说明书 用户培训计划及用户使用手册,数据仓库管理,物理数据 模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,2.12 解决方案集成,主要任务: 建立并执行集成测试计划 建立并执行数据仓库平台测试计划 建立并执行系统验收测试计划 移植开发系统到生产系统 执行用户培训计划 实施
14、数据仓库管理基础设施 项目实施完成 回顾项目状态 交付项目: 数据转换管理系统测试报告 数据访问和信息发布系统测试报告 数据仓库平台测试报告 数据仓库管理过程测试报告 系统回顾报告,数据仓库管理,物理数据 模型,数据转换,应用开发,数据挖掘 服务,系统体系结构设计,元数据管理,解决方案集成,总结:主要步骤及文档间关系,Business Discovery (业务探索) 业务需求说明书(BRL) 概念数据模型(CDM),物理数据库设计 物理数据模型 (PDM) 数据库描述语言(DDL) 数据转换加载(ETL) 数据加载设计说明书 数据映射 (Data Mapping) 转换加载脚本 ( ETL Scripts) 加载流程控制( ETL Control) 前端应用设计 前端应用体系结构 前端应用设计说明书 Summary / Fa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医保基金规范使用方案
- 2026年医院廉政建设试题及答案
- 2026年安徽体育运动职业技术学院单招综合素质考试题库附答案详解(预热题)
- 2026年宁夏葡萄酒与防沙治沙职业技术学院单招职业倾向性考试题库带答案详解(典型题)
- 2026年天津交通职业学院单招综合素质考试题库带答案详解(能力提升)
- 2026年天津艺术职业学院单招职业倾向性考试题库带答案详解(培优)
- 2026年宁夏吴忠市单招职业倾向性测试题库及完整答案详解一套
- 2026年天津工艺美术职业学院单招职业适应性考试题库带答案详解(a卷)
- 公共卫生及社会责任承担承诺书(3篇)
- 市场分析报告答复函(5篇)
- 2026延安志丹县人力资源和社会保障局公益性岗位招聘(50人)笔试备考题库及答案解析
- 2026年山东省立第三医院初级岗位公开招聘人员(27人)笔试参考题库及答案解析
- 2026湖北武汉市江汉城市更新有限公司及其下属子公司招聘11人笔试备考题库及答案解析
- 2025-2026学年地质版(新教材)小学体育与健康二年级全一册第二学期教学计划及进度表
- 2026年部编版新教材道德与法治小学三年级下册教学计划(含进度表)
- 学校洗衣机卫生消毒制度
- 《机械制图》电子教材
- 硬笔书法格子纸(A4彩色打印版横版竖版)
- 道路交通事故认定书模板
- 绵竹电力公司志愿者服务队章程
- 清产核资基础报表(模板)
评论
0/150
提交评论