成功地管理数据仓库的实施_第1页
成功地管理数据仓库的实施_第2页
成功地管理数据仓库的实施_第3页
成功地管理数据仓库的实施_第4页
成功地管理数据仓库的实施_第5页
已阅读5页,还剩61页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成功地管理数据仓库的实施如何成功地实施数据仓库项目我们将从以下几个方面来看:为什么许多的数据仓库项目会失败?导致失败的因素是什么?你如何才能成功地实施?详细的实施步骤常听到人们说:

让我们建一个数据仓库吧数据仓库将解决我们所有的决策支持的问题建一个数据仓库不会花很长的时间某个数据仓库的厂商说:我们只要买他们的一个“数据集市套件”就可以了,不需要很大的工作量我们不必把它看成是一个实际的项目,毕竟它就是一些报表我们只要把“所有”的数据都扔进一个数据库就行了!!但是,超过60%的数据仓库项目是失败的为什么数据仓库项目有这么大的风险?典型的一个情况,指派的员工,顾问咨询和项目经理:没有数据仓库经验不懂数据仓库的方法和技术不使用结构化的实施方法“快速原型开发”只是当成另一个数据库!!!失败的最主要原因是什么?对要建立的数据仓库没有清晰的定义如果你没有一个明确的,确定的目标要完成,你怎么能够成功呢?低估了实施数据抽取和转换的时间/工作量即使考虑到,也是很不充分的允许范围不断增加,超出了可以做到的范围但是,超过60%的数据仓库项目是失败的失败的最主要原因是什么?但是很可能,导致失败的最主要原因是“用户”没有参与进来没有与用户会面交谈或咨询用户系统建设不是针对使用者的需求闭门造车的方式建立系统系统的建设不是针对解决任何特定的问题但是,超过60%的数据仓库项目是失败的导致的结果:以上种种最终导致精神上的崩溃太多的工作太少的时间事情变化太快不知道目的是什么漫无目的地徘徊,这样领导项目很难跟随但是,超过60%的数据仓库项目是失败的很有可能,项目/计划的管理者根本没有了解或考虑一些关键的方面:哪些方面………但是,超过60%的数据仓库项目是失败的用户谁是“用户”?他们需要一个数据仓库吗?他们的需求到底是什么?更快的报表?新的报表?他们什么时候需要一个系统?他们愿意付钱或提供资金开发吗?哪些关键的方面?哪些关键的方面?功能是要建一个“报表服务器”还是“数据仓库”?有“即席(AD-HOC)”访问吗?是否已有一些报表存在?新的系统将会替代现有的/遗留的系统吗?报表有没有清清楚地详详细说明明报表的的定义?是已有的的报表吗吗?还是希望望有的报报表清单单?列出的报报表,是是否有优优先顺序序?与所有用用户就报报表的定定义和内内容达成成一致了了吗?哪些关键键的方面面?数据需要什么么数据?数据从哪哪里来?谁“拥拥有”数数据?你能访问问到这些些数据吗吗?有多少数数据是必必需的是否有足足够的带带宽获得得这些数数据?数据刷新新/传递递的需求求是什么么?哪些关键键的方面面?谁也不能能担保成成功。但但是通过过以下的的努力,,你可以以有最大大的机会会得到一一个有用用的系统统:以一种仔仔细地、、有系统统地和结结构化的的方式实实施数据据仓库.制定出一一个计划划严格按计计划执行行不要超越越范围不要超越越需求如何能够够成功??如何能够够成功??机会不要匆忙忙实施不要忘记记测试质量保证证系统交付付用户和操操作培训训而最重要要的是:所有的阶阶段都要要求用户户参与如何能够够成功??最后,数数据仓仓库的实实施要当当作一个个大的软软件项目目来考虑虑和管理理。以恰当的的方式实实施也许这种种恰当的的实施方方式会花花更长的的时间和和更多的的精力,,但却能能使你更更有可能能:成功交付一个个有用的的系统提交你所所承诺的的保住你的的工作.如何能够够成功??我应该做做什么?不要忘记记,你的的目标不不是建一一个“数数据的仓仓库”你的目标标是要建建成一个个对你的的“用户户”有相相当价值值的系统统如果“用户”不不喜欢这这个系统统,或者者对他们们来说系系统太难难用或太太麻烦,,那么他们不会会去用它它系统也就就失败了了这个系统统就会被被拆除你的职业业生涯也也会遭受受挫折我能做什什么?让我们来来看一下下你应该该如何行行动,才才能使你你成功的的把握最最大。认识并了了解““用户””进行彻底底的需求求分析设计对数数据的分分析制订项目目计划我能做什什么?确保充分分的资源源人员硬件/软软件时间制订一个个详细的的计划制定界面面的规格格说明文文档,描描述:数据源访问控制制数据的转转换/修修正我能做什什么?实施过程程中进行行标准的的质量保保证检查查对等复审审单元测试试进行详细细和完整整的系统统测试制订系统统版本发发布的配配置管理理和质量量保证程程序总结起来来理想的实实施情况况:收集需求理解业务设计模式ETL模板构造分析查询实现测试

用户反馈

提炼

测试资源时间详细的实实施步骤骤认识并了了解用户户用户访谈谈发现““问题或或捆绕””所在收集现有有报表的的拷贝索取报表表清单((期望的的新报表表或修改改报表))建立原型型/虚构构的报表表,让用用户复审审尽可能多多的了解解用户日日常的工工作职责责决定你所所要建立立的是什什么企业级数数据仓库库?即席查询询服务器器?常规的报报表服务务器?单独专注注的数据据集市?根据用户户的需要要做出你你的决定定实施范围围要限定定在你能能实际做做到的范范围内!!!!!!详细的实实施步骤骤定义系统统需求基于用户户的需要要正式的文文档,准准确地描描述最终终的系统统所能完完成的功功能与用户一一起复审审需求,即.进行正式式的系统统需求复复审不要让范范围扩大大–瞄瞄准最最初的目目标/规规划提交一个个系统需需求规格格说明书书详细的实实施步骤骤定义系统统需求不要陷入入需求的的“分析析怪圈”决定你能能做到什什么锁定那些些需求,,舍弃其其他,放放到未来来的阶段段确保向用用户概述述了你能能够实施施的内容容这样也许许不能使使所有的的用户都都满意,,但是,,成功地地实现了了用户需需要的一一部分((子集))比试图图建立一一个超级级系统却却以失败败而告终终,什么么都不能能交付好好的多。。详细的实施施步骤投入和费用用要实际基于系统需需求分析确定完成需需求所必需需的资源人员时间/进度度硬件/软件件不要乐观地地估计会发生意外外的问题计划赶不上上变化错误不可避避免!详细的实施施步骤制订一个正正式的项目目计划基于系统需求分分析成本估计进度估计可用资源将范围局限限在你能够够做到的范范围之内提交正式的的项目计划划详细的实施施步骤制订一个正正式的项目目计划切记:正式的项目目计划可以以确保每一一个人(管管理者和开开发人员))及时了解解开发的最最新情况,,及时发现现开发中出出现的问题题。详细的实施施步骤制订一个正正式的项目目计划最后,记记住:承诺少一点点,然后交交付多一点点要比承诺太多,,令人失望望更好详细的实施施步骤进行详细的的数据分析析基于用户的的需要和报报表找到提供报报表所需数数据的遗留留/现有的的系统获得任何/所有关于于现有数据据的文档获得对所有有数据源的的访问和使使用权决定是否需需要有抽取取程序详细的实施施步骤进行详细的的数据分析析确定必需的的转换数据的清洗洗?查找Lookup/确认?合并?你想要这个个过程自动动执行吗?抽取,转转换,装装载(ETL)工具?定制代码和和/或脚本本?详细的实施施步骤进行详细的的数据分析析确定必需的的数据更新新频度需要多长时时间刷新一一次数据?如何更新数数据?自动化的过过程复制ETL工具定制的代码码和/或手手工的脚本本详细的实施施步骤进行详细的的数据分析析数据分析应应获得以下下结果数据字典,包含遗留(Legacy)的数据定义义及其分布布位置新的数据仓仓库的数据据定义数据规模,,类型,单单位,例外外,等等。。这还不是数数据模型,,此时你还还没有足够够的信息来来建立系统统的模型。。详细的实施施步骤进行详细的的数据分析析数据分析应应获得以下下结果接口文档,包含:将数据从现现有系统迁迁移到数据据仓库的ETL过程转换规则/标准准刷新/实时时性需求和和详细规格格说明详细的实施施步骤下一步?系统需求分分析和数据据分析是详详细系统设设计的基础础记住:基础不好,,设计也不不会好且非非常局限稳固的基础础将为设计计奠定一个个坚实、可可扩的基础础详细的实施施步骤详细系统设设计再次强调,,这项工作作乃至所有有的工作都都应该立足足于已整理理完成的用用户需求。。让我们看一一下在进行行详细的系系统设计时时考虑的一一些具体的的工作项目目。详细的实施施步骤详细的系统统设计设计首要考考虑的是满满足用户的的需求数据和数据据类型必须须通过“数数据分析””得到数据字典接口文档详细的实施施步骤详细的系统统设计必需由专业业的数据建建模人员设设计“模式式-Schema”是复制/修修改现有的的设计吗???还需要一个个新的设计计?你需要什么么类型的模模式?StarRelationalFlat详细的实施施步骤详细的系统统设计在设计数据据模型时,考虑以以下两者之之间可能的的折中方案案:使用户报表表获得最高高性能使即席Ad-HOC查询获得最最大灵活性性在进行用户户界面设计计时,考虑虑:开发所有报报表的原形形或样板构建/虚拟拟用户界面面邀请用户复复审和评判判详细的实施施步骤详细的系统统设计特别注意数数据抽取,,转换和装装载过程的的设计这是很多项项目失败的的原因你准备怎样样迁移数据据迁移数据的的频度如何何如何更新完整、全面面地记录这这些文档。。以后的系系统维护人人员会感谢谢你的。详细的实施施步骤详细的系统统设计最后,也许许是最重要要的:你的设计/硬件/软软件必须实实现系统需需求,并确确保足够的的性能。如果性能很很差,即使使产生了所所需要的报报表,用户户一样会抛抛弃的。不要让范围围不断扩大大–维持最初的的需求详细的实施施步骤详细的系统统设计此时才是最最终确定选选择的最佳佳时机:存放数据仓仓库的硬件件Unix,NT?硬件平台厂厂商(是否有选择择余地)磁盘阵列支支持(快快速的、共共享的磁盘盘阵列)详细的实施施步骤详细的系统统设计选择实施数据仓仓库的软件件ETL工具DataModeling工具数据库通用的数据据库-SybaseASE等专门的数据据仓库数据据库SybaseIQ详细的实施施步骤详细的系统统设计选择Query工具/报报表生成成工具定制开发?商业软件包包?详细的实施施步骤详细的系统统设计选择记住在订购购设备和软软件时考虑虑交货时间间不要忘记安安装时间不要忘记安安装过程中中可能会碰碰到一些小小故障,也也会影响到到你的时间间进度。详细的实施施步骤详细系统设设计的结果果设计工作应应该获得以以下成果硬件规格说说明软件规格说说明详细的数据据模型最新的详细细的数据字字典源系统的数数据规格说说明新数据仓库库的数据规规格说明详细的实施施步骤详细系统设设计的结果果设计成果最新的接口口文档包含详细的的ETL设计/定义义用户界面规规格说明固定报表的的设计Ad-Hoc即席查询界界面设计详细的实施施步骤详细系统设设计的复审审此时,你应应该做一下下详细设计计的复审正式复审:数据库的设设计接口的设计计ETL模板/定定制代码和和脚本报表示例(邀请用用户参与)详细的实施施步骤记住!!!!NotRDBMSengineNotfront-endtoolNotdataextracttoolNotdataloadingutilitiesNotmoreprocessorsNotthebusinessvisionNottechnicalingenuityNotevenconsultants…….如果物理设设计没有做做好,没有有什么可以以弥补的:现在可以开开始实施了了你应该有几几个实施组组数据获取/ETL组数据库/模型实实施组用户界面/查询询开发组详细的实施施步骤实施在界面开发发时要求用用户参与尤其是开发发屏幕、报报表和/或或原型能够更快地地获得用户户的反馈、、实施/修修正详细的实施施步骤实施在实施过程程中,尽尽可能多地地做增量/单元测试试尽早地发现现问题识别无法预预料的风险险在问题/风风险威胁整整个项目之之前解决或或规避详细的实施施步骤正式的系统统测试一旦实施接接近尾声,,就要开始始考虑正式式的测试。。不要跳过过,取消,,缩短或忽忽略正式测测试的重要要性。这是让用户户确信你已已经为他们们建立了一一些可以实实际工作或或运行的系系统的主要要方法。详细的实施施步骤正式的系统统测试应该由实施施组之外的的人完成测试系统需需求规格说说明中的所所有需求制订正式的的测试程序序和计划要求用户参参与复审测试计计划和程序序帮助测试用用户界面/报表模块块详细的实施施步骤正式的系统统测试邀请生产系系统的员工工参与部分分系统测试试系统的日常常操作无法法由开发人人员完成生产系统的的控制人员员将获得宝宝贵的认识识和体验此时体验将将减少交接接时间和对对使用人员员培训的时时间详细的实施施步骤正式的系统统测试成功地进行行了完整的的系统测试试,你就能能够很有信信心地交付付系统给用用户,并确确信这个系系统对用户户来说是一一个有用的的、有价值值的系统。。此外,用户户也会有信信心,这个个系统将出出色地运行行并在工作作中提供帮帮助,发挥挥作用。详细的实施施步骤配置管理如果公司没没有专门的的配置管理理组/部门门/计划,,那么你应应该执行一一套配置管管理计划捕获,锁定定,备份和和控制所有的文档档,规格格说明书,以及设设计文档任何的ETL模板和/或或定制代码码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论