




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库解决方案探讨,基于开放和标准 业已优化, 集成的和可延展的 更好的性能, 可靠性, 安全性 更短的部署时间 更简便的管理与升级 更低的拥有成本 极大降低变更管理的风险 整体支持,Complete, Open, Integrated,Oracle 产品体系架构平台产品及技术映射,Oracle 电子商务应用套件 EBS,Oracle 融合中间件SOA Suite OSB BEPL BAM Web Service Management,Oracle 网格基础架构层 Oracle10g/11g/RAC WebLogic Server,Oracle 展现 Oracle WebCenter BI
2、EE+ RUEI,Oracle 用户和安全管理 Oracle Identity Management,Oracle 企业管理 Oracle Enterprise Manager,Oracle 数据仓库 Partitioning Hyperion Essbase Data Mining,Oracle 高性能计算 TimesTen Coherence,Oracle 内容管理 Enterprise Content Management,业务流程层,信息访问层,商务智能,门户,数据库,应用服务器,存储,网格基础架构层,数据平台层,流程管理,企业服务总线,规则引擎,应用1,应用2,应用3,应用4,应用5
3、,安 全 管 理,拓 扑 管 理,系统的监控和调优,产品生命周期管理,企 业 管 理,单点登陆,用户管理,目录集成,联盟身份,应用6,业务监控,其它,操作型数据库,数据仓库,批量数据加载,实时/准实时更新,数据获取层,人工流程,Oracle 数据获取层 GoldenGate ELT(Oracle Data Integrator ),Oracle BPM Suite流程管理,Oracle Exadata一体机,Oracle 人力资源 PeopleSoft,Oracle 项目管理 P6,Oracle 客户关系管理 Siebel,Oracle 供应链 JDE,Oracle 绩效管理 Hyperion
4、,Oracle 数据仓库解决方案 数据仓库系统实施规划 总结,日程,绩效可见性是投资时最优先考虑的事项, Gartner, Inc.,什么是数据仓库,数据仓库概念的提出者、美国著名信息工程专家William Inmon博士在90年代初提出了数据仓库概念的一个表述: “一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于对管理决策过程的支持。”,数据仓库术语 类比,数据挖掘,架构设计,数据仓库和商务智能解决方案,CRM,IVR,Supply Chain,Financial,HR,Web,CTI,用户交互系统,业务系统,其他业务和分析数据源,发现和预警,交互
5、式仪表板,报表,数据仓库平台,企业领导,经理,一线员工,上下游企业,业务分析数据仓库,移动分析,实时分析,即时查询,商务智能分析,销售分析,服务分析,市场分析,供应链分析,财务分析,劳动力分析,商务智能分析 预制的客户和业务分析 行业化和基于规则 针对Siebel, SAP, PeopleSoft, Oracle, 和其他数据源 快速实施、低成本,数据仓库平台 为所有用户服务 极高的扩展性和性能 完整的、即时的数据提供 提供更强的BI和分析能力,数据仓库逻辑结构,元数据,数据分析,Business Modeling,数据挖掘,查询及报表,门户,数据仓库管理,数据源,OLAP,数据仓库构建,数据
6、仓库, 模型,分段数据存储,抽取, 转换, 加载,知识工人,用户,决策人员,数据仓库及商务智能系统逻辑架构图,单点登录 和 统一身份管理,数据仓库数据加载 Oracle Data Integrator,高级的分析往往涵盖异构数据源,Oracle Data Integrator(ODI) 是一个 SOA-Ready 的数据集成工具,Oracle Data Integrator,支持多种数据源和目标 高性能 ODI可以方便地调用数据库存储过程、函数、操作系统可执行脚本 ODI支持增量数据捕获 ODI支持BLOB/CLOB数据类型的完全处理 ODI支持将数据库数据转换为XML,包括BLOB/CLOB
7、数据类型 图形化界面,易于使用,E-LT 架构-数据加载高性能,在单独ETL服务器上进行转换 私有的引擎 性能差 高成本 在已有的关系数据库上进行转换 充分利用资源 效率高 高性能 好处 最佳的高性能、可扩展性 易管理、低成本,ODI的易用性,ODI提供图形化方式实现异构数据复制、异构数据的抽取加载以及转换,数据仓库逻辑结构,数据仓库数据管理 Oracle DB,大型数据仓库特性排序,Source: Oracle ST Survey,数据分区技术提高大数据量的访问速度,数据分区层次的管理 范围、 hash、列表、复合分区 查询时自动分区忽略,减少对不相关数据的访问 查询语句可以在分区间并行,提
8、高CPU和IO并发 增强的数据有效性 数据故障隔离在分区而不是表上,备份、恢复更灵活,查询的自动分区忽略、其它分区数据不受影响,数据分区的益处:,显著提高访问大表时的性能 只访问相关的分区 优化器知道或查找相关的分区 预先用已知的值进行静态修剪 使用内部递归 SQL 查找相关的分区来进行动态修剪使 I/O 操作最小化,分区忽略 系统自动根据分区情况优化数据访问,忽略无关的数据分区,1998,1999,2000,register Table,select sum(register_amt) from register where reg_date between 1998 and 1999,表分
9、区使用情况?,Oracle数据库的真正应用集群技术,高可用性 保证节点故障时连续访问,用户连接自动重定向(24*7) 高伸缩性 自动负载均衡,当负载增加时可增加节点来提高处理能力。,共享磁盘技术 高速内存通道技术 可支持多节点配置,11g 中新的高级压缩技术,压缩大的应用表 9i只在数据加载时用,因此只适用数据仓库系统 11g适合所有命令,可用于业务处理系统 压缩各种数据类型 结构化数据和非结构化数据 典型压缩比 2-3 X 大量节省磁盘空间消耗2x-3x 可减少IO, 加强了缓存的效率 比正常读取要快2倍 压缩的成本 能节省一半的存储空间 会增加5%的CPU使用率,Up To 3X Comp
10、ression,Sun Oracle Database Machine,网格就是未来 高性能, 低成本, 冗余, 线性扩展 Sun Oracle Database Machine 为所有数据管理需求交付第一个也是唯一一个完整的网格架构,Exadata Storage Server Grid 14 x高性能低成本存储服务器 100 TB raw SAS disk storage or 336 TB raw SATA disk storage 5TB+ 闪存(flash storage)!,RAC Database Server Grid 8 x 高性能低成本服务器 每个服务器包括2 Intel
11、quad-core Xeons InfiniBand Network 40 Gb/sec fault-tolerant unified server and storage network,26,Exadata Flash 解决随机I/O瓶颈,Sun Oracle Database Machine有5+ TB 的闪存存储 Exadata Smart Cache技术缓存热点访问的数据 Allows optimization by application table 极大地降低成本 同样的I/O能力,超过10 x倍的磁盘节省 低能耗,Oracle 是第一个闪存优化的数据库系统,New,5X Mor
12、e I/Os than 1000 Disk Enterprise Storage Array, 2009 Oracle Corporation - Confidential,27,50X,Up To,Only on Exadata,Exadata Hybrid Columnar Compression,数据以字段形式存储并压缩 查询模式 针对data warehousing 最优的速度 典型的可达到10X的压缩率 按压缩比率改进扫描 Archival Mode 针对频繁的数据访问 减少空间 典型的可达到15X的压缩率 有些可达到50X,数据仓库逻辑结构,多维数据集市 Essbase,Oracl
13、e Essbase,近十年内最具影响力的 10 大科技创新之一 全球第一的多维数据库 What-if 计算 多维分配 多用户读/写 写回建模 BI 财务智能,维度和度量,稀疏维,销售额度量,Dimension维度 地区 时间 商品,Measure度量销售额,成员,卓越的计算能力,最广泛的功能: 简单汇总到复杂的跨维分配 根据检索存储或计算的结果 关系识别 条件或程序逻辑,Hyperion Essbase 可提高数据仓库性能,1,000 个并发查询 1,400 万客户帐户,具有 Q&R 工具的数据仓库,Hyperion Essbase,1% 完成,仍需要 7个 小时,100% 完成,共计 .2
14、秒,大数据量、多用户支持,数据可伸缩性,安大略省交通部 超过100GB的39 维数据库提供14年的历史记录 230,000次事故 250,000段公路 450,000辆车(22个属性) 185,000名受伤人员(18个属性) 通过提高对意外事件影响因素的洞察力降低死亡率,数据仓库逻辑结构,数据挖掘 Data Mining,Oracle Data Mining,Oracle 数据挖掘 Oracle in-Database 挖掘引擎,数据挖掘功能 (Server) PL/SQL & Java APIs 开发 & 部署预测分析应用 大量的 DM 算法 (12) 分类 回归 聚类 异常检测 关联规则
15、(购物篮分析) 结构化 & 非结构化数据 (文本挖掘) Oracle 数据挖掘器 (GUI) 简易化的, 直观的数据挖掘 预测分析 从电子表格中“1-click data mining”,数据库内的数据挖掘优势,ODM 架构提供了更强大的性能,可扩展性和数据安全性 数据一直还留在数据库里一直在适当的读取安全机制的控制下更少的移动部分 分析结果可以直接在应用流程里得到应用,不用经过“落地”、转储等耗费资源的物化过程 性能和可扩展性: 快速评分: 250万个记录在单CPU系统中只需6秒 实时评分: 在单CPU中100 个模型只需: 0.085 秒,Oracle BI EE 管理员可以看到Oracl
16、e 数据挖掘结果,Oracle BI EE 定义了最终用户展现的结果,ODM和Oracle BI EE的整合,预测分析Oracle 数据挖掘 & Oracle BI EE,了解更多! 大量的数据挖掘算法 和(免费的) 统计功能 挖掘数据, 探索更全面的隐含信息, 进行预测 做的更多! 挖掘新的信息用Oracle BI EE 做部署 构建的应用可以帮助你 “胜在分析上” 花的更少! 排除冗余的数据管理和数据分析系统 利用Oracle 数据库技术的投资,您可以 :,产业案例,银行业 对新的银行产品最有兴趣的目标客户 (家庭实体融资, 教育储蓄计划, 保险等) 花旗银行 识别 “忠实” 客户和可能流
17、失的客户 识别信用卡欺诈行为的模式 根据人口统计和与银行相关的活动识别相似客户分隔 零售 / 市场 预测那些客户会对特定邮寄方式有反应 识别每一个客户 “下一个可能的购买目标” 找到产品系列 (e.g. 电池 + 玩具, 羊毛衫 + 龟领裙等. 对仓库存货进行网站促销) ABC Stores,产业案例,保险 & 政府 识别欺诈行为(交税情况) 美国内部收入署 (IRS) 预测那些客户会遵守新规 识别危险客户的行为模式 药业 & 保健行业 识别对不同病情和病人的成功的药物疗法 Walter Reed Medical Center 识别与疾病有关的因素 (基因, 综合症等),数据仓库逻辑结构,数据
18、仓库展现 BIEE,Oracle BI EE Plus,KPI 指标 可以钻取到明细,动态警告,简报下载便于离线分析,视图选择,动态改变分析方式,轻松在仪表盘,即席查询,高级报表等功能间切换,图形钻取,追寻问题根源,指标选择,快速切换关注焦点,Oracle BI EE Plus,直观的维度展示和选取,轻松进行钻取、旋转、切片等复杂分析,快速添加各种数据视图,数据仓库扩展 动静相宜,数据仓库和商务智能系统的发展趋势从静态走向动态,更实时,更主动,更有效,更直观,扩展的数据仓库分析平台Oracle能提供什么产品,扩展功能,Oracle 数据仓库和商务智能产品,Oracle 扩展功能产品,扩展的数据
19、仓库分析平台,Closed Loop Analytics,Src2,Src3,Src4,Src1,Message Queues,CDC,Bulk Data, Events, Changed Data Capture and Data Services,Fusion Middleware Integration Infrastructure,Hourly, minute CDC, Real-time,SEED,miniSEED,Daily, Monthly,BAM, BI, DM and BPA Infrastructure,Monitor Events,Analyze Data,Oracle
20、BAM,Mining Data,Monthly,+RAC +Partitioning +Spatial +Data Mining,User Access Infrastructure,Take Action Write Back,Monitor Present Analyze the Past Predict for the Future,Oracle Portal,Oracle 数据仓库解决方案 数据仓库系统实施规划 总结,日程,通过传统决策分析工具从头开始建立,Oracle 决策分析应用,针对 Oracle, PeopleSoft, Siebel, SAP 等的预建业务适配器,预建的数据仓
21、库设计,适合您的 EDW,基于角色的指示板和数千个预定义的衡量标准,方便使用和部署,数周或数月,后台 ETL 和映射,数据仓库设计,定义衡量标准和指示板,后台 ETL 和映射,数据仓库设计,定义衡量标准和指示板,培训 / 推广,培训 / 推广,数月或数年,资料来源:Patricia Seybold 调查, Gartner, Merrill Lynch, Oracle 分析,快速实现价值并降低总拥有成本,数据仓库和商务智能系统实施5个关键因素,为什么? 开始阶段树立信用度和信心 怎么做? 确认谁对DW/BI 最感兴趣 实施难度评估,为什么? 在开始阶段取得成果 怎么做? 高价值和ROI 较高的数
22、据可用性 更好的数据质量 更好的数据组织,R eturn O n I nvestment,数据仓库和商务智能系统实施5个关键因素,为什么? 确定下一阶段的目标 怎么做? 评估当前使用的频率 评估当前的ROI 评估用户需求,数据仓库和商务智能系统实施5个关键因素,为什么? 在内部和外部推广 怎么做? 使用经验推广 ETL Report Operation Capability 提升最终用户分析能力 分析数据,数据仓库和商务智能系统实施5个关键因素,为什么? 高层领导的参与程度直接决定了数据仓库的建设效率 “一把手工程” 业务用户的参与能保证项目不偏离业务目标,最终用户对系统的评价是数据仓库是否成功的标准 怎么做? 尽量让高层领导了解实施的每个阶段才能充分协调各类资源 业务用户充分参与到项目每一个实施的步骤,特别是测试的工作,数据仓库和商务智能系统实施5个关键因素,DW/BI 系统实施方法论,需求分析,信息收集,模型设计,数据仓库架构设计,商务智能应用开发,运行维护,数据抽取,RA 需求分析,IC 信息收集,AD 数据仓库架构设计,Oracle DW KM 38 Key Factors,1 启动 2 问题准备 3 用户培训 4 用户访谈 5 需求分析,1 业务系统培训 2 材料收集 3 系统级分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 消化系统笔记护理
- 保护动物的英语说课课件
- 压疮预警教育
- 阳光成长心理健康教育
- 设计初步方案汇报
- 门诊患者心理特点及护理
- 依法执业促进健康课件
- 二零二五暗股合作协议-新能源汽车产业链投资
- 二零二五年度新能源项目设备安装承包协议
- 二零二五年度大型活动临时设施安装制作合同
- 2022年干部基础理论知识应知必会试题-脱贫攻坚与乡村振兴有效衔接专题100题
- 心律失常患者护理
- 新生儿肺动脉高压
- 计算机硬件购销合同
- 2019年GJB9001C-2017组织内外部环境因素风险和机遇识别评价分析及应对措施一览表备用
- 防错清单及验证计划
- 全文解读2022新修订的《医疗器械经营监督管理办法》ppt
- 企业负责人施工现场带班检查整改回复表(含附表)GDAQ10305
- 氩气安全周知卡
- 《印染行业定型机废气排放限量》DB330621T059-2022
- 太钢不锈钢产品介绍
评论
0/150
提交评论