数据仓库在电信企业中的应用_第1页
数据仓库在电信企业中的应用_第2页
数据仓库在电信企业中的应用_第3页
数据仓库在电信企业中的应用_第4页
数据仓库在电信企业中的应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据仓库在电信企业中的应用     摘要:本文主要介绍数据仓库的概念、建设过程、以及在电信行业的应用。 关键词:数据仓库   业务系统 随着国内电信市场将逐渐趋于饱和、竞争形式将不断严峻,如何抓住市场脉搏、不断提高市场反应能力,对于公司的生存和壮大将起到关键性的作用,这就要求公司决策人员能够做到高瞻远瞩先人一步。因此,如何适应市场的快速变化、向竞争对手争夺最大限度的客源、不断提高服务水平、科学配置公司资源、降低经营管理成本等课题就直接摆在了公司决策者的面前。激烈的竞争使得任何决策都要尽可能地准确

2、及时,以往那种通过报表和层层总结的方式不仅时效性差,而且不能排除主观因素造成的错误累积。一个全面实时的在线决策支持系统的建设就迫在眉睫了,数据仓库系统就成为国内外电信企业关注和集中的焦点。一、            数据仓库概述在业务系统完成以后,作为最重要的一个开发方向:以数据仓库为基础的决策支持系统建设就自然变得十分现实。这是本文所讨论的焦点,也是目前包括电信系统在内的国内众多行业信息系统建设的重要课题。对电信行业而言,如何系统有序地管理资源的调度、争夺客户资源、在适当的

3、季节采取合适的促销策略、降低管理和运营成本是决策者最关心的课题。在这样的背景下,统计和分析生产经营活动中的各项指标数据是信息人员越来越要着重考虑的问题。现有的电信系统主要是一个业务系统,其数据具有一定的分散性和短期性,不可能为整个公司的决策支持提供完整有效的帮助,如何将现有的杂乱无章的操作数据充分利用起来,变成可为公司领导决策提供真实依据的信息?如何将管理这些信息并且最快最直观地发布给有关的决策人?如何进一步分析这些数据?这种需求就使得以决策支持为主要目的的数据仓库系统的建设在电信运输系统中变得刻不容缓。在二十世纪八十年代中期,Bill Inmon首次提出“数据仓库”这一名词。它最初

4、被设计为一个商业数据库,具有稳定性(主要成分不变)、历史性(包含历史信息)和面向主题(信息由客户、产品和市场等组成)等特点。这些最初的“数据仓库”根据对客户、经营产品或服务项目、资金情况和财务状况等信息的分析,得到对企业活动的整体认识,经过多年的理论研究和实践积累,数据仓库在国外已经在各重要行业开始建设或正在表现出其巨大的应用价值。计算机在我国电信行业的应用经历了一个快速发展过程:从最原始的日常事物管理到某些地方独立运行的管理系统、直到最终实现的某些全国电信系统、相关的财务处理系统等等。今天,电信行业信息系统正面临又一次充实和升华的过程:数据仓库应用。数据仓库的目的主要是为决策支持提供服务,其

5、前提是要有精心准备的真实的数据(我们有时有别于原始数据而称其为信息的一部分),并且这些数据的内容足够丰富,能够为决策提供全方位的支持。 上图是一个典型的企业信息系统数据表示,业务系统主要是为底层业务人员操作使用,系统将会完成大量的事务处理并生成大量数据;在业务系统之上是一个公共操作型数据存储(ODS),该系统通过与底层业务系统的同步和处理,可以完成一定的事务处理工作,同时又可完成一些战术决策需求,这部分的使用者主要是中层管理人员(有时也会有操作型用户);在ODS系统之上,信息经过收集、加工和汇总之后生成了有决策支持价值的信息,这些信息的使用者是公司各部门的高层决策人员。上图的三角模型

6、表示随着数据向信息的迁移,数据的粒度越来越大(即有一定的汇总倾向),其包含的信息越来越宏观。需要特别强调的是,由于数据和信息有一个时间长度和地域跨度的问题,一般意义上讲,最高层决策支持所涉及的数据量往往要远远大于底层操作系统的数据量。因此人们通常用一个倒三角来表示从OLTP、ODS直至DW系统所容纳的数据量的关系。从前面的描述可以看出,数据仓库不是一个独立创建的系统,它能够建设好的前提是必须有完善的业务系统。经过多年高速发展,我国电信业务系统经过了充分的实际考验,有关的数据采集系统和其他必须的数据处理辅助系统如今都建设成型,建立一个数据仓库系统所必须的条件完全具备了,在经过了长期的运行之后,业

7、务系统保存了大量的业务数据,将这些数据转化成信息供高层决策者使用是数据仓库建设的最基本的原动力。二数据仓库在电信行业的应用1、 数据仓库的建设事务处理系统的设计目标在于加快数据录入和检索速度,以及校验数据之间的相关性和一致性,着重对于少量记录的频繁操作。但是对于复杂的分析型查询操作来说,要对大量的数据进行汇总和分类,传统的数据库结构就显得力不从心了。在电信行业系统中,通常是以各地区中心为单位,数据保存的时间一般不可能太长,这样对查询历史数据或者需要综合数据时,在现有的业务系统上是做不到的。数据仓库要解决大量数据的存储和快速方便访问,因而其设计者们致力于数据被用户访问和连接的方法研究。

8、为了达到这一目标,数据仓库的设计者们必须真正理解用户是如何工作的以及他们想做些什么事情,需要一个与用于事务处理系统有很大不同的数据库组织结构。数据仓库的实施主要包括4个部分的内容:数据仓库的设计建模、数据集成、数据存储与管理、数据的分析和展现。数据仓库的设计、建模现有的电信行业业务系统记录了每次通话的有关信息,但不同地区中心的数据不能简单地整合在一起,其数据的粒度太细、汇总的方向不够全面,因此必然要进行数据结构的再设计,提炼出和决策支持有关的信息并且内容尽可能的丰富。数据仓库的设计工作对于决策支持系统起着至关重要的作用,它需要根据决策需求确定主题,从数据源到数据提交,对数据仓库的数据组织进行逻

9、辑结构的设计,还要按照业务用户最能理解的方式组织和提供信息,方便最终用户的使用。数据集成数据仓库中的数据来源于联机事务处理系统,这些系统由于建立时间不同,系统选型不同,开发人员不同等原因,使得各个业务系统的硬件环境和软件环境各不相同,数据结构不统一,要将这些系统中的有用数据提取出来,进行清洗、整理、综合、概括,去掉没用的数据项,转换成统一格式加载到数据仓库中,这就是数据集成所要完成的工作。数据集成的算法和描述应当作为重要文档保存,因为数据仓库在使用一段时间后,业务系统可能有变化,这时相应的集成算法应当作相应的调整。数据存储与管理数据仓库的存储可以选用多维数据库,也可以选用关系型数据库或其它特殊

10、的存储方式。必须明白的是,目前多维数据库都是使用在直接面向最终用户的高度汇总级,因为多维数据库在大数据量存储时性能和灵活性不能保证,因此企业级的数据仓库和数据集市一般存储在关系数据库或后关系型数据库中(如Sybase IQ)。数据仓库的引擎要保证数据的安全性、完整性、一致性,同时关键是要具有复杂的分析查询的高效性。也就是说,数据仓库的存储要兼顾数据量和查询效率。除了正常意义上的信息数据外,元数据是关于数据的数据,能够表示、定义数据的意义及系统各组成部件之间的关系的数据,它包括关键字、属性、数据描述、物理数据结构、源数据结构、映射及转换规则、综合算法、代码、缺省值、安全要求及数据时限等

11、。管理好元数据是管理数据仓库的关键。数据分析和展现联机分析处理(OLAP)是一个分析处理技术,它从企业的数据集合中收集信息,并运用数学运算和数据处理技术,灵活、交互式地提供统计、趋势分析和预测报告。通过多种OLAP工具对数据仓库中的数据进行多维分析、汇总,形成图表或报表的形式,使决策者可以清晰、直观地看到分析结果,这正是数据仓库系统所要达到的目的。数据分析和展现可大致分为几个不同类型:固定报表、灵活报表、多维分析、数据挖掘等。2、 数据仓库的实施方法在数据仓库解决方案中有两种方式:一种是集中的方式,以集中式数据仓库为代表,设计这种数据仓库用来处理公司的所有需要;另外一种方式是不集中的

12、方式,反映在数据集市中,这主要针对一些特殊领域。l        集中式数据仓库,可以跨越公司收集可操作数据,把它们集中在一个数据库中。这些数据将覆盖许多不同的领域,经常是为许多行业服务的。集中式数据仓库实施难度一般要大一些,因为它涉及公司各部门的协调或行政管理问题,集中式数据仓库的优越性在于其所提供的可控制性、数据精确度和可依赖性。l        数据集市是一种致力于单一的某个领域并且通常为某些用户服务的数据仓库。它包含某一特殊应用

13、范围(例如市场、销售系统或财务)。在某些公司里,商业部门自己建立数据集市,而其他一些公司依靠一个中心的IT部门来规划和设计数据集市。数据集市有着很大的灵活性,因为你可以根据商业具体问题、部门的机遇和行业或应用不同而定制一个适合自己的数据集市。集中的数据仓库和数据集市之间的主要差别不是尺寸大小问题,而是涉及领域的范围不同。这种区域上的差别导致了不同的框架结构。然而,一个数据集市应当拥有可扩展性,因为它通常需要在以后向更大规模发展。数据集市的优点在于它与集中式数据仓库相比,使一个公司能够快速、以相对低廉的成本并且较容易地建立一个数据仓库。通常情况下,一个公司将建立一系列的数据集市用来处理一定范畴里

14、的问题,快速决策意味着一个公司可以对市场机会做出快速反映。3、 数据仓库在电信行业中的应用目标    数据仓库在电信运营管理系统的应用大体可分为三个阶段:1、解决日常决策支持查询,这一层次主要产生各种固定报表、灵活报表,通过Client/Server和Internet/Intranet等多种途径展现。这部分的应用将比以前的报表系统提供更方便直接、信息量更丰富的查询手段和应用类型2、进行各种多维分析,比如:不同时间段、不同中心、不同通话距离的客源流动变化统计图等3、数据挖掘,进行相关性分析,研究时间、不同线路、不同费率等之间的关联关系等等根据在其他行业和用户实践经验,如果跨过第一步而将目标定得过高,会造成系统应用面变窄,项目启动困难,失去数据仓库对决策支持普遍支持的重要意义,人为增加项目开发的风险。分三个阶段实施还可以使数据仓库边开发边见效,降低项目决策者的疑虑,通过使用不断检验和完善系统设计。总之,我们认为数据仓库在我国各行业首先解决的重要课题是完成数据的集中和信息整理,提升企业的信息管理水平和业务决策管理水平,加强公司领导对其营业状况、客户资源分布、人力和线路资源等的全面了解,从而提高决策的科学性和快速的市场反应能力,这是最迫切和切实可行的近期目标。随着应用开发和研究的不断深入,数据仓库系统将逐渐从被动回答问题逐渐转化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论