(计算机软件与理论专业论文)电信增值业务数据仓库信息模型的研究与设计.pdf_第1页
(计算机软件与理论专业论文)电信增值业务数据仓库信息模型的研究与设计.pdf_第2页
(计算机软件与理论专业论文)电信增值业务数据仓库信息模型的研究与设计.pdf_第3页
(计算机软件与理论专业论文)电信增值业务数据仓库信息模型的研究与设计.pdf_第4页
(计算机软件与理论专业论文)电信增值业务数据仓库信息模型的研究与设计.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(计算机软件与理论专业论文)电信增值业务数据仓库信息模型的研究与设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电信增值业务数据仓库信息模型的研究与设计 电信增值业务数据仓库信息模型的研究与设计 摘要 随着电信市场的开放和新通信技术的发展,各种类型的电信增值 业务不断的涌现。电信企业要将电信增值业务的发展作为企业新的经 济增长点,需要及时获取增值业务的经营信息,构建电信增值业务的 决策支撑系统。目前,各个电信运营商都已经构建了自己的决策支撑 系统,但现有系统的信息模型主要是以基础语音业务为主设计的,虽 然也有对部分电信增值业务的考虑,但并没有从全局的角度对增值业 务进行分析,对一些新业务的支撑也存在不足。在这样的背景下,本 文针对现有的电信增值业务,对增值业务的数据仓库信息模型进行了 研究和设计。 本文研究了数据仓库的相关理论和新一代运营支撑系统 ( n g o s s ) 中的共享信息数据模型( s i d ) ,并结合对现有的电信增 值业务的分析,提出了电信增值业务数据仓库信息模型的设计方法。 在提出信息模型设计方法的基础上,本文根据中国联通电信增值 业务的运营情况,结合中国联通现有统一经营信息服务系统的建设, 设计了基于中国联通电信增值业务的数据仓库应用信息模型。 关键词:数据仓库 电信增值业务 共享信息数据模型( s i d ) 信息模型 北京邮电大学硕士学位论文 电信增值业务数据仓库信息模型韵研究与设计 t h er e s e a r c ha n d d e s i g no f d a r a a r e h o u s em o d e l f o rt e l e c o mv a l u e a d d e ds e r v l c e s a b s t r a c t w i t ht h eo p e n i n go f t h et e l e c o mm a r k e ta n dt h ed e v e l o p m e n to fn e w t e l e c o m m u n i c a t i o nt e c h n o l o g y , a l lk i n d so f t e l e c o mv a l u e a d d e ds e r v i c e s a p p e a r t e l e c o ms e r v i c ep r o v i d e r s w i l lm a k et h ed e v e l o p m e n to ft h e t e l e c o mv a l u e a d d e ds e r v i c e sa sn e we c o n o m i c p r o g r e s sp o i n t t h e y n e e d t oa c h i e v eb u s i n e s si n f o r m a t i o na b o u tt h ev a l u e a d d e ds e r v i c e sa n db u i l d b u s i n e s ss u p p o r t s y s t e m o ft e l e c o mv a l u e a d d e ds e r v i c e s a t p r e s e n t ,a l l t e l e c o ms e r v i c ep r o v i d e r sh a v e a c c o m p l i s h e d t h e i ro v 、r f lb u s i n e s ss u p p o r t s y s t e m s b u tt h ed a t aw a r e h o u s e m o d e l so f t h e s e s y s t e m s a r e m a i n l y d e s i g n e d o nt h e , b a s i cv o i g es e r v i c e a l t h o u g h t h e yc o n s i d e r e do f s o m e t e l e c o mv a l u e a d d e ds e r v i c e s ,t h e r ei sa l s os o m el i m i t a t i o nt ot h e s u p p o r t o f n e wv a l u e a d d e ds e r v i c e s o nt h i sk i n do f b a c k g r o u n d ,t h ea r t i c l ei s m a i n l yr e s e a r c h i n ga n dd e s i g n i n g a b o u tt h ed a t aw a r e h o u s em o d e lf o r v a l u e a d d e ds e r v i c e sb a s e do n e x i s t i n gt e l e c o m v a l u e a d d e ds e r v i c e s t h ea l x i c l er e s e a r c h e sa b o u tt h et h e o r yo f d a t aw a r e h o u s ea n ds h a r e d i n f o r m a t i o n d a t a m o d e l ( s i d ) i n n e wg e n e r a t i o n o p e r a t i o ns y s t e m s a n d s o f t w a r e ( n g o s s ) c o m b i n i n g w i t ht h e a n a l y s i so f t h ee x i s t i n g t e l e c o mv a l u e a d d e ds e r v i c e s ,t h ea r t i c l ea l s ob r i n g sf o r w a r dt h e d e s i g n i n gm e t h o d o ft e l e c o mv a l u e - a d d e ds e r v i c e sd a t aw a r e h o u s e m o d e l _ o nt h eb a s eo ft h ed e s i g n i n gm e t h o do fd a t aw a r e h o u s e m o d e l ,t h e a r t i c l eb a s e do nt h eb u s i n e s sc i r c u i n s t a n c e so f c h i n au n i c o r n st e l e c o m v a l u e a d d e ds e r y i c e s ,c o m b i n e dw i t ht h eb u i l d i n go f c h i n au n i c o r n s u n i f i e db u s i n e s si n f o r m a t i o ns e r v i c e s y s t e m ,d e s i g n s t h ea p p l i c a t i o n m o d e lo f d a t aw a r e h o u s eb a s e do nc h i n au n i c o mt e l e c o mv a l u e - a d d e d s e r v i c e s 北京邮电大学顿士学位论文 电信增值业务数据仓库信息模型的研究与设计 k e yw o r d :d a t aw a r e h o u s ed a t am o d e l t e l e c o mv a l u e a d d e ds e r v i c e s h a r e di n f o r m a t i o n d a t am o d e l ( s i d ) 北京邮电大学硬士学位论文 电信增值业务数据仓库信息模型的研究与设计 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。爆我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均己在论文中作了明确的说明并表示了谢意。 中请学位论文与资料若有不实之处, 本人签名:l 盈甄 本人承担一切相关责任。 日期:趔堑墨:丝 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅:学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位 本人签名: 导师签名: 适用本授权书。 日期:生堕i :! 里 日期:o 叫毒h 忙 北京邮电大学硬士学位论文 电信增值业务数据仓库信息模型的研究与设计 1 1 论文背景及目的 第1 章绪论 中国加入w t o 后,世界经济的全球化以及市场的国际化使得中国的电信业 打破了垄断,国内各电信运营企业的竞争日益加剧,所面临的经营管理上的难题 也越来越多。面对复杂多变和闷趋激烈的竞争压力,各电信企业纷纷建设决策支 持系统,沉淀企业经营信息,构建企业级数据仓库,以保证科学、快速和准确的 决策。目前,国内的运营商如中国移动、中国联通等都已经建立了独立的“经营 分析系统”,对现有的电信经营管理提供准确的运营信息。 在经过了较长一段时删的发展后,电信企业原有的基础话音业务的发展已经 逐渐趋向于缓和。为了能够保持和提高现有的a k p u 值,运营企业需要开发多 种新业务来吸引用户,增大业务量。同时,随着3 g 技术的不断成熟,建立在宽 带多媒体移动通信技术上的各种电信增值业务也将不断涌现。因此,在将来的电 信企业的发展中,电信增值业务的发展将成为主旋律。 电信增值业务的快速发展是电信运营市场的加速开发带来的。通信技术的发 展、互联网的普及和人们需求的多样化,使得电信的传统产业链不断的延伸和发 展。在这样的背景下,再由一个基础电信运营商跨越整个价值链条,并将每个环 节做得很好已经不可能。这必然要求电信运营商改变过去的经营模式,由传统的 封闭式运营模式逐步走向开放,建立能够吸引足够多有实力的电信增值服务商参 与价值链服务提供的运营新机制。 电信运营企业原有的各个经营分析系统主要是根据原有的电信业务系统和 运营支撑系统建设的。随着新的业务、新的运营模式和新的支撑体系的引入,原 有的经营分析系统对各种新需求韵分析出现了一些不足之处,尤其是对新增的电 信增值业务的经营、业务分析。因此,在电信行业的数据仓库建设中,需要考虑 对不断出现的增值业务的信息模型的处理,构建新的电信企业数据仓库系统。 本文的主要思路是:针对目前电信企业数据仓库系统设计的不足,根据现有 的电信增值业务的业务特征和经营模式以及增值业务平台的建设情况,提出适应 新的电信运营模式的电信增值业务数据仓库建设思路,使其充分体现符合新的价 值方式的企业业务知识。同时,以新一代运营支撑系统( n g o s s ,n e wg e n e r a t i o n o p e r a t i o ns y s t e m s a n ds o f t w a r e ) 中的共享信息,数据模型( s i d ,s h a r e d i n f o r m a t i o n d a t a m o d e l ) 为基础,提出设计电信增值业务数据仓库信息模型的方 北京邮电大学硕士学位论文第l 页 电信增值业务数据仓库信息模型的研究与设计 法,最后以一个电信领域大型数据仓库系统为实际应用,设计电信增值业务数据 仓库信息模型应用模型,对方法进行检验。 1 2 工作内容及研究成果 本论文主要做了一下几方面的工作: 调研:包括现有的电信企业的数据仓库体系结构、电信企业业务运营支撑系 统、电信企业经营模式、电信增值业务经营分析需求、电信企业业务流程和数据 结构等。 理论研究:主要是对数据仓库基本理论、共享信息数据模型( s i d ,s h a r e d i n f o r m a t i o n d a t am o d e l ) 、增强电信运营图( e t o m ,e n h a n c e dt e l e c o m o p e r a t i o n s m a p ) 及电信运营理论的研究。 实践:将电信增值业务数据仓库信息模型的研究成果应用于电信企业统一经 营信息服务系统( u n i t e db u s i n e s si n f o r m a t i o ns e r v i c es y s t e m ,简称u b i s ) ,设计 系统对于增值业务的数据仓库的应用模型。 在完成上述工作内容的情况下,获得的主要成果是:将n g o s s 中共享信息 数据模型s i d 分析电信领域中信息数据的方法与数据奁库信息模型的设计方法 结合起来,对电信增值业务进行分析建模。一 1 3 论文结构 第二章介绍了数据仓库的一些基本理论。首先介绍了数据仓库的定义和特 点、数据仓库的系统体系结构和数据组织结构,然后讨论了数据仓库的开发生命 周期与传统软件开发生命周期的区别,最后介绍了数据仓库设计的三级模型:概 念模型、逻辑模型和物理模型,以及三级模型设计中的一些基本内容。 第三章是对共享信息,数据模型( s l d ) 的研究。首先介绍了新一代运营支撑 系统( n g o s s ) 及其对电信运营支撑系统的研究方法,然后对n g o s s 中的共享 信息,数据模型( s i d ) 进行介绍,并分析了s i d 模型研究、描述电信运营支撑系 统中信息数据的方法。最后,从s i d 框架、商务实体和u m l 模型对s i d 进行了 进一步的说明。 第四章是对现有的电信增值业务的分析。首先介绍了电信增值业务的定义、 分类,以及传统增值业务和新代增值业务,并分析了目前增值业务的些新的 特征。然后,对电信产业价值链的变化进行了分析,讨论了符合目前增值业务的 产业价值链,并介绍了现有的几种增值业务运营模式。晟后分析了现有的增值业 第2 页北京邮电大学硕士学位论文 电信增值业务数据仓库信息模型的研究与设计 务平台的体系结构。 第五章提出了增值业务的信息模型设计方法。首先从数据仓库信息模型的结 构进行讨论,选择了适合电信增值业务的数据仓库结构,然后从d w 模型和o d s 模型两方丽对设计方法进行详细说明。 第六章在第五章提出的方法的基础上,设计了增值业务数据仓库的应用模 型。介绍了中国联通统一经营信息服务系统的体系结构,并讨论了系统的建设情 况和对增值业务的支撑情况。然后对中国联通现有的增值业务进行分析,最后分 别详细的描述d w 模型和o d s 模型。 文章最后总结了本文成果和不足,及面临的主要问题和困难,并对今后工作 进行了展望。 北京邮电大学硬士学位论窭簿3 甄 电信增值业务数据仓库信息模型的研究与设计 第2 章数据仓库相关理论 本章主要介绍了数据仓库的一些基本理论,包括数据仓库的定义和特点、数 据仓库的系统体系结构和数据组织结构,然后讨论了数据仓库的开发生命周期与 传统软件开发生命周期的区别,最后介绍了数据仓库设计的三级模型:概念模型、 逻辑模型和物理模型,以及三级模型设计中的一些基本内容。 2 ,1 数据仓库基本概念 一 2 1 1 数据仓库的定义 对于数据仓库定义,数据仓库创始人w h i n m o n 在其著作( b u i l d i n gt h ed a t a w a r e h o u s e ) ) 一书中对数据仓库给出如下定义山:数据仓库是一个面向主题的 ( s u b j e c to r i e n t e d ) 、集成的( i n t e g r a t e ) 、相对稳定的( n o n - v o l a t i l e ) 、随时问变 化( t i m e v a r i a n t ) 的数据集合,用于支持管理决策制定过程。对于数据仓库的 概念我们可以从两个层次进行理解,首先,数据仓库用于支持决策,面向分析型 数据处理,它不同于企业现有的操作型数据库:其次,数据仓库是对多个异构的 数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数 据仓库中的数据一般不再修改。 2 1 2 数据仓库的特点 根据数据仓库定义的含义,数据仓库具有以下四个特点,它们也是数据仓库 与传统操作型信息系统的主要区别: 1 面向主题。 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离, 而数据仓库中的数据是按照定的主题域进行组织。主题是个抽象的概念,是 指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型 信息系统相关。例如电信业务支撑系统中的操作型信息系统有营业系统、帐务系 统、结算系统、客服等系统,而数据仓库中包含的主题会是业务收入、业务发展、 业务使用等内容,业务收入主题涉及营业系统中的客户信息、帐务系统和结算系 统中业务收入信息。 2 集成的。 第4 贞北京邮电大学硕士学位论文 也倍增值业务数据仓库信息模型的研究与设计 面向事务处p j j 的操作型数据库通常与某些特定的应用相关,数据库之间相互 独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数掘库数据抽 耿、清理的基础卜经过系统加工、汇总和整理得到的,必须消除源数据中的不一 致性,以保i :数据仓库内的信息是关于整个企业的一致的全局信息。 3 相删稳定的。 操作型数择库中的数据通常实时更新,数据根据需要及时发生变化。数据仓 库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某 个数据进入数掘仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有 大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。 4 反映历史变化。 操作型数据库主要关心当前某一个时问段内的数据,而数据仓库中的数据通 常包含历史信息,系统记录了企业从过去某一时点( 如开始应用数据仓库的时点】 到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做 出定量分析和预测。 2 2 数据仓库系统体系结构 企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基 础。数据仓库不是静念的概念,只有把信息及时交给需要这些信息的使用者,供 他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息 加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任 务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。 整个数据仓库系统是一个包含四个层次的体系结构,具体由下图表示。 e e 巴 e 】 嚣艘j | 酗磊 o 3 菇冀童市强濞p 麓蒉拦 粕继工 堡蛰戳臻 媲衰工墨 野强 占譬一揪基 銎j 图2 - i 数据仓库系统体系结构 1 数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企 北京邮电大学硕士学位论妻第5 页 乜信增值业务数据仓库信息模型的研究与设计 业内部信息和外部信息。内部信息包括存放于r d b m s 中的各种业务处 理数据和各类文档数据。外部信息包括各类市场信息、竞争对手信息和 各种手工收集的信息等等。 2数据的存储与管理:是整个数据仓库系统的核心。针对现有各业务系统 的数据,进行抽耿、清理,并有效集成,按照主题进行组织。数据仓库 按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库( 通常 称为数据集市) 。 3 o l a p 服务器:对分析需要的数据进行有效集成,按多维模型予以组织, 以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为: r o l a p 、m o l a p 和h o l a p 。r o l a p 基本数据和聚合数据均存放在 r d b i v l s 之中:m o l a p 基本数据和聚合数据均存放于多维数据库中; h o l a p 基本数据存放于r d b m s 之中,聚合数据存放于多维数据库中。 4 前端 = :具:主要包括各种报表工具、查询工具、数据分析工具、数据挖 掘工具以及各种基于数据仓库或数据集市的应用开发工具。 2 3 数据仓库的数据组织结构 一个典型的数据仓库的数据组织结构如下图所示: 图2 - 2 数据仓库数据组织结构 数据仓库中的数据存在着不同的细节级:早期细节级( 通常是存储在备用海 量存储器上) 、当前细节级、轻度综合级( 数据集市级) 、高度综合级。源数据经 过综合后,首先进入当前细节级,并根据具体需要进行进一步的综合,从而进入 第6 负北京邮电大学硕士学位论文 电信增值业务数据仓库信息模型的研究与设计 轻度综合级乃至高度综合级,老化的数据将进入早期细节级由此可见,数据仓库 中存在着小同的综合级别,一般称之为“粒度”。粒度越大,表示细节程度越低, 综合程度越高。 数据仓库中还有一部分重要数据是元数据( m e t a d a t a ) 。元数据是“关于数 掘的数据”,知传统数据库中的数据字典就是一种元数据。在数据仓库系统中, 元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所 关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按 用途的不同分为两类:技术元数据( t e c h n i c a lm e t a d a t a ) 和业务元数据( b u s i n e s s m e t a d a t a ) 。 2 4 数据仓库的开发生命周期 从_ j 二面的分析,我们已经看出操作型数据通常是面向应用,因此是非集成的, 而数据仓库数掘必须是集成的,对操作型数据的处理与数据仓库数据的处理还存 在着其他的一些重要区别,这些区别使的数据仓库系统的开发和操作型业务系统 的开发有着较大的不同。 如图2 - 3 所示,在操作型环境中使用的是传统的系统开发生命周期s d l c 。 在生命周期中的每一项活动都是确定的,并且只有一共活动结束后,下一个活动 才会被触发。 与传统的操作型业务系统的开发不同,在数据仓库开发过程中,最终用户对 数据仓库系统的概念和决策支持系统没有感性的认识,同时用户的需求还会在系 统丌发期问发生一定的变化。因此,数据仓库的开发不能按照传统的s d l c 进行, 它有着一种完全不同的丌发生命周期,这种周期被称为c l d s ( 与s d l c 顺序相 反) 。 北京邮电丈学硕士学位论文第7 页 电信增值业务数据仓库信息模型的研究与设计 传统开发生命周期 数据仓库开发生命周期 图2 - 3 两种开发生命周期 如图2 - 3 所示,传统的s d l c 是由需求驱动的,为建立系统,首先需要理解 需求,然后进入到设计和开发阶段。c l d s 几乎刚好相反,它是典型的数据驱动 歼发生命周期。c l d s 从数据开始,得到数据后,将数据进行集成,然后,如果 数据有偏差,就检验看看数据存在什么偏差。之后针对数据进行编程,分析程序 执行的结果,并提交给用户。获取用户反馈需求,这样系统需求才得到了理解。 在获取用户新的需求后,需要根据需求对数据仓库进行新的调整、设计、编程, 然后再次提交给用户进行反馈。这样,经过不断的循环、反馈,使数据仓库系统 不断的增长与完善,因此c l d s 常被称为“螺旋式”开发方法。 2 5 数据仓库数据模型 所谓数据模型,就是对现实世界进行抽象的工具,抽象的程度不同,也就形 成不同抽象级别层次上的数据模型。数据仓的数据模型与操作型数据库的三级数 据模型又有一定的区别,主要表现在: 臻8 负 北京邮电大学硕士学位论文 电信增值业务数据仓库信息模型的研究与设计 1 ) 数据仓库的数据模型中不包含纯操作型的数据。 2 ) 数据仓库的数据模型扩充了码结构,增加了时问属性作为码的一部分。 3 ) 数据仓库的数据模型中增加了一些导出数据。 可以看出,上述三点差别也就是操作型环境中的数据与数据仓库中的数据之 间的差别,同样事数据仓库为面向数据分析处理所要求的。虽然存在着这样的差 别,在数据仓库设计中,仍然存在着三级数据模型,即概念模型、逻辑模型和物 理模型山。 下面根据上述的数据仓库三级数据模型,分别介绍各级模型及其设计中的基 本内容。 2 5 1 概念模型 概念模型是主观与客观之间的桥梁,它是用于我们为一定的目标设计系统、 收集信息而服务的一个概念性的工具。可以说,概念模型是客观世界到机器世界 的一个中间层次。概念模型最常用的表示方法是e r 模型法,这种方法通过e r 图( e n t i t y - r e l a tj i o n s h i pd i a g r a m ) 作为它的描述工具。 进行概念模型设计所要完成的工作是: 1 ) 界定系统边界 2 ) 确定主要的主题域及其内容 概念模型设汁的成果是,在原有的数据库的基础上建立了一个较为稳固的概 念模型。因为数据仓库是对原有数据库系统中的数据进行集成和重组而形成的数 据集合,所以数据仓库的概念模型设计,首先要对原有数据库系统加以分析理解, 看在原有的数据库系统中“有什么”、“怎样组织的”和“如何分布的”等,然后 再来考虑应当如何建立数据仓库系统的概念模型。一方面,通过原有的数据库的 设计文档以及在数据字典中的数据库关系模式,可以对企业现有的数据库中的内 容有一个完整而清晰的认识;另一方面,数据仓库韵概念模型是面向企业全局建 立的,它为集成来自各个面向应用的数据库的数据提供了统一的概念视图。 概念模型的设计是在较高的抽象层次上的设计,因此建立概念模型时不用考 虑具体技术条件的限制。 2 5 2 逻辑模型 数据仓库的逻辑模型描述了数据仓库的主题的逻辑实现,即每个主题所对应 的表的关系模式的定义。逻辑建模是数据仓库实施中的重要一环,因为它能直接 北京邮电大学硕士学位论叟 篇9 丽 电缩增值业务数据仓库信息模型的研究与设计 反映出业务部门的需求,同时对系统的物理实施有着重要的指导作用。 在逻辑模型设计中需要进行的工作主要有: 1 ) 分析主题域,确定当前耍装载的主题 在概念模j 型设计中,我们确定了几个基本的主题域,但是,数据仓库的设计 方法是一个逐步求精的过程,在进行设计时,一般是一次一个主题或一次若干个 主题地逐步完成的。所以,我们必须对概念模型设计步骤中确定的几个基本主题 域进行分析,并选择首先要实施的主题域。选择第一个主题域所要考虑的是它要 足够大,以便使得该主题域能建设成为一个可应用的系统;它还要足够小,以便 于丌发和较快地实施。如果所选择的主题域很大并且很复杂,我们甚至可以针对 它的一个有意义的子集来j 莲行开发。在每一次的反馈过程中,都要进行主题域的 分析。 2 ) 确定粒度层次划分 数据仓库逻辑设计中要解决的一个重要问题是决定数据仓库的粒度划分层 次,粒度层次划分适当与否直接影响到数据仓库中的数据量和所适合的查询类 型。确定数据仓库的粒度划分,通过估算数据行数和所需的d a s d 数,来确定 是采用单一粒度还是多重粒度,以及粒度划分的层次。 3 ) 确定数据分割策略 在这一步罩,要选择适当的数据分割的标准,一般要考虑以下几方面因素: 数据量( 而非记录行数) 、数据分析处理的实际情况、简单易行以及粒度划分策略 等。数据量的大小是决定是否进行数据分割和如何分剖的主要因素;数据分析处 理的要求是选择数据分割标准的个主要依据,因为数据分割是跟数据分析处理 的对象紧密联系的;我们还要考虑到所选择的数据分割标准应是自然的、易于实 施的,同时也要考虑数据分割的标准与粒度划分层次是适应的。 4 ) 关系模式定义 数据仓库的每个主题都是由多个表来实现的,这些表之间依靠主题的公共码 键联系在一起,形成一个完整的主题。在概念模型设计时,我们就确定了数据仓 库的基本主题,并对每个主题的公共码键、基本内容等做了描述。在这步里, 我们将要对选定的当前实施的主题进行模式划分,形成多个表,并确定各个表的 关系模式。用关系型数据库来实现数据仓库信息模型时,目前较常用的两积t 建模 方法是所谓的第三三范式( 3 n f , e i 7t h i r dn o r m a lf o r m ) 和星型模式( s t a r - s c h e m a ) 。 逻辑模型设计的成果是,对每个当前要装载的主题的逻辑实现进行定义,并 将相关内容记录在数据仓库的元数据中,包括: 适当的粒度划分 第1 0 页北京邮电大学硕士学位论文 电信增值业务数据仓库信息模型的研究与设计 合理的数据分割策略 适当的表划分 定义合适的数据来源等 2 53 物理模型 所谓数据仓库的物理模型就是逻辑模型在数据仓库中的具体实现,如物理存 取方式、数据存储结构、数据存放位置以及存储分配等等。物理模型是在逻辑模 型的基础上实现的,在进行物理模型设计实现时,所考虑的主要因素有:i o 存 取时间、空间利用率和维护代价;在进行数据仓库的物理模型设计时,考虑到数 据仓库的数据量大但操作单一的特点,可采取其他的一些提高数据仓库性能的技 术,如:合并表、建立数据序列、引入冗余、进一步细分数据、生成导出数据、 建立广义索引等等。 北京邮电大学硬士学位论文第1 1 页 电f 言增值业务数据仓库信息模型的研究与设计 第3 章共享信息数据模型( s i d ) 共享信息数据模型( s i d ) 是电信管理论坛( t m f ) 提出的为新代运营支 撑系统建1 茳共享信息模型的通用框架。 在本章中,首先介绍了新一代运营支撑系统( n g o s s ) 及其对电信运营支 撑系统的研究方法,然后对n g o s s 中的共享信息数据模型( s i d ) 进行介绍, 并通过u m l 中类圈的抽象方法分析了s i d 模型研究、描述电信运营支撑系统中 信息数据的方法。最后,从s i d 框架、商务实体和u m l 模型对s i d 进行了进一 步的说明。 3 1n g o s s 3 1 1n g o s s 概述 随着全球电信市场逐步走向开放,市场竞争也日趋激烈,电信运营商需要不 断地提高业务开展能力和服务水平,提高企业核心竞争力。目前国内的电信运营 商正在经历着从以资源营销为主、以单项业务为中心,向以客户为主、以业务集 成和大包服务为中心、以市场为导向的经营模式过渡。在这种情况下,通过先进 的技术手段增强业务提供能力,迸一步细化用户市场提供更有针对性的业务,充 分满足不同层次的用户需求,已经成为运营商关注的核心内容。 电信管理论坛( t m f ,t e l e m a n a g e m e n tf o r u m ) 是一个由电信业务提供商及 供应商等所组成的国际性非盈利组织,其目标是研究和定义电信运营管理框架、 规范及标准,为信息和通信行业提供战略指导和实际的解决方案,指导电信运营 商和供应商的商务运营活动。电信管理论坛协会致力于o s s 。行业的标准化,希 望能通过o s s 软件的即插即用,并结合商业与客户服务驱动的方法,从而有效 的实现端到端业务流程的自动化。 新一代运营支撑系统( n g o s s ,n e wg e n e r a t i o no p e r a t i o ns y s t e m sa n d s o f t w a r e ) 是电信管理论坛( t m f ) 提出的新一代o s s 体系。n g o s s 从系统 即 插即用规则) 、过程( 企业事务过程模型) 、信息( 关联处理公用数据) 、产品四 个方面傈证o s s 体系具各标准化、能够逐步演化、保证互连互操作( 开放) 、实 现端到端的管理和高度自动化的特点。 n g o s s 相对于原有的运营支撑系统,具有高度的系统集成化,它把各式各 样的分离业务系统融合串联起来,形成同的整体,实现内部业务流程和外部业 第1 2 页北京邮电大学硕士学位论文 电信增值业务数据仓库信息摸型的研究与设计 务流程的顺畅通达和同一协调,从而整理提升企业管理水平、运营效率和服务能 力。目前,在现行的运营支撑系统的基础上,结合国际电信管理论坛组织提出的 功能和实现模型,正在形成一一个融合同一的业务和运营支撑系统,同时通过广泛 引入新的计算机网络技术和软件技术,如分布式技术、面向对象技术、构件技术 等,逐渐实现即插即用的系统平台,使得业务运营支撑系统在扩展西能和模块的 重用性能等方面满足企业运营的需求。 3 1 2n g o s s 的研究方法 为了有效地协调和组织n g o s s 的各种活动,需要有一个先进的研究方法, 因此,t m f 也提出了一种研究电信运营支撑系统的方法与思路,如图3 - 1 所示。 图3 - 1n g o s s 计划框架“ 框架提供了:分析n g o s s 的四个视图,同时也决定了知识库围绕这四个视图 角度进行组织,与此相对应的n g o s s 标准规范也是围绕这四个方面的内容展开。 商业视图( b u s i n e s sv i e w ) 由增强电信运营图( e t o m ,e 1 1 l l a n c e dt e l e c o mo p e r a t i o n s m a p ) 表示,对企业b s s 和o s s 建设需求分析进行规范,涵盖电信运营企业的 各种企业活动和管理活动,规范了b s s 和o s s 中涉及到企业流程模型;系统视 图( s y s t e mv i e w ) 由系统集成图( s i m ,s y s t e mi n t e g r a t i o nm a p ) 表示,描述了 可部署的企业组件框架,并且提出如何使用组件构建b s s 和o s s :实现视图 ( i m p l e m e n t a t i o nv i e w ) 通过t m f 的示范项目“催化剂项目”( c a t a l y s tp r o j e c t ) 完成,c a t a l y s t 通过开发实际的企业应用案例,解决b s s 和o s s 在实现中遇到 北京邮电大学硕士学位论文 电信增值业务数据仓库信息模型的研究与设计 的各种问题;运行视图( r u n - t i m e v i e w ) 通过建立完整的系统一致性测试( c o m p ) 方案,保证b s s 和o s s 产品和组件符合n g o s s 的体系架构和总体原则的要求。 n g o s s 的中心是知识库( k n o w l e d g e b a s e ) ,负责收集和发布来自于业务、 系统、实现和运营等方面的经验。由共享信息数据模型( s i d ,s h a r e d i n f o r m a t i o n d a t am o d e l ) 表示,s i d 进一步将s i m 中定义的组件一逻辑商务组 件( l b c ,l o g i c a lb u s i n e s sc o m p o n e n t ) 细分成商务实体( b e ,b u s i n e s se n t i t y ) , 并且将它们有组织的集合在一起,分别映射于e t o m 中定义的功能模块中,通 过统一建模语言( u m l ,u n i f i e dm o d e l i n gl a n g u a g e ) 建立实体的数据描述模型, 提供了通用的信息数据语言,明确了各实体问的相互关系。因此,s i d 在n g o s s 中的作用是将e t o m 、s i m 、和c a t a l y s t 三种视图粘合在一起,确保商业需求驱 动系统的设计和实现。 3 2 s i d n g o s s 提供了一整套的方法论来指导o s s b s s 的设计与建立,它的核心设 计思想是利用“流程驱动”,系统设计时首先从流程分析开始,分析自己企业的 核心业务流程;然后通过分析流程,提炼出所有关键的数据,利用共享信息模型 将数据进行抽象,划分为不同的管理域建立共享的数据模型;最后根据共享的数 据模型组建实际:的o s s b s s 系统。数据是o s s b s s 设计中最重要的特性,成功 建立o s s b s s 系统关键是有一个好的共享信息模型。因此,n g o s s 提出了共享 信息模型的通用框架s i d 。 s i d 是n g o s s 中建立共享信息模型的通用框架,s i d 分别从业务和系统两 方面描述了共享信息模型。一方面,从业务出发,以e t o ml e v e l0 定义的业务 处理模型为基础,依据对业务过程汇总设计的各种业务信息的抽象和分析,定义 了各种聚合商务实体( a b e ,a g g r e g a t e b u s i n e s s e n t i t y ) 以及各种商务实体( b e , b u s i n e s se n t i t y ) ,并将它们划分为不同的管理域( d o m a i n ) ,形成了系统信息图 s i m ,从而最大限度地实现信息和数据共享;另一方面,从组件b s s 和o s s 的 系统出发,对各种商务实体的属性进行定义,将它们有机地组合在一起,形成 u m l 模型,作为实现b s s 和o s s 系统共享数据的参考模型。因此,s i d 是业务 和系统的实体定义和u m l 模型的有组织的集合,其主要组成部分包括: s i d 框架 商务实体及其属性 u m l 模型 北京邮电大学硕士学位论文 乜信增值业务数据仓库信息模型的研究1 i 设计 3 2is i d 信息数据描述方法 s i d 从域( d o m a i n ) 、聚合商务实体( a b e ,a g g r e g a t eb u s i n e s se n t i t y ) 、商 务实体( b e ,b u s i n e s s e n t i t y ) 、属性( a t t r i b u t e ) 、关系( r e l a t i o n s h i p ) 这儿个 概念刈整个s i d 模型进行了定义。 1 域 域是根据不同的管理范围划分的可聚合商务实体( a b e ) 的集合。根据e t o m l e v e l0 定义的业务处理模型,整个s l d 框架由不同的域组成。由于域的划分是 来源于业务流程分析和信息框架,所良每个域都具有下列的属性: 包含了封装了操作和企业信息的商务实体( b e ) 。 是一个相对稳定的相关联的操作和企业信息的集合。 提供了企业数据格式的强健性。 提供了清晰的责任和所属关系。 2 可聚合商务实体a b e 可聚合商务实体是一套定义好的信息和操作,这些信息和操作用来描述一系 列高内聚、低耦合的商务实体。 3 商务实体b e 商务实体描述了业务相关的事务,包括具体的实物( 如一个客户) 、活动( 如 客户订单) 、概念( 如帐户) ,商务实体通过属性和与其他商务实体的关系来描述 这些事务。同时,每个商务实体的实例都有其定义好的生命周期。 4 属性 属性是用来黯述商务实体的性质的一个概念,如用来描述客户b e 的属性有 客户i d 、客户状态、客户等级等等。 5 关系 关系是指两个商务实体之间或者是商务实体与其自身的业务交互。 上述几个概念的有机组合,构成了s i d 描述数据信息的方法,对电信运营支 撑系统的数据进行统一的信息描述定义,从而使得系统中各个模块之间能够基于 共同的信息语言交流和沟通。将这个方法用u m l 类图进行描述,其结构如图3 - 2 所示。 北京邮电丈学硕士学拉论文第1 5 页 电信增值业务数据仓库信息模型韵研究与设计 l 奎j3 2s i d 信息数据描述结构 图3 2 描述了s i d 对数掘信息的描述结构:s i d 将电信运营支撑系统中的数 据划分成不同的域,每个域由不同的聚合商务实体组成,聚合商务实体是一系列 高内聚、低耦合的商务实体的定义,每个商务实体由三个结构组成:商务实体名、 属性和关系。通过以上的组织结构,s i d 完备清晰的描述了电信运营支撑系统中 的信息和数据。 3 2 2s 1 d 框架 s i d 框架把整个企业的数据分为市场,销售、产品、客户、服务、资源、供 应商合作伙伴、企业管理、公共商务等八个数据域,这些连续致的企业数据 称之为企业信息,如图3 - 3 所示。各个域的内容如下: 市场,销售域 市场销售域主要包括为了实现以赢得客户或潜在客户为目的而进行的销售 和市场活动所需要的各种数据和合同操作。在销售方面,包括销售合同丹l 导1 前 景、销售渠道、销售统计。在市场方面,包括战略和计划、市场细分、竞争者、 市场竞争活动。 产品域 产品域主要描述了各种产品的声明周期信息以及与产品声明周期相关的合 同操作信息。产品域共定义了6 个a b e :产品、战略产品计划、产品规范、产 品提供、产品使用统计和产品性能。 第1 6 负北京邮电大学硕士学位论文 i 乜信增值业务数据仓库倚息模型的研究与设计 图3 - 3s i d 框架蛆 客户域 客户域主要包括向企业( 服务提供商) 订购产品的个人或组织的信息及他们 获取产品时进行的合同操作,以及客户订购产品对同帐务有关的数据和合同操 作。客户域定义了9 个a b e :客户、客户交互、客户订购、客户统计、客户问 题、客户s l a 、客户账单、用于客户账单的资费、客户账单收集和客户账单查 询。 服务域 服务域主要定义了同服务规范和服务实例有关的a b e 。服务域体现了产品 的实现,将各种产品进行组合,形成为客户提供的各种服务。服务域共包括9 个 a b e :服务、服务计划、服务规范、服务订购、服务故障、服务中止、服务测试、 服务质量和服务使用。 资源域 资源域定义了各种用于管理网络和各层网络技术的a b e 。资源域的目的是 确保各种网络技术能实现各种服务的传送。资源域有三个重要的方面:第一个是 与产品和服务相关的资源;第二个是保证能够支持和传送企业提供的服务

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论