(机械设计及理论专业论文)小型电信经营分析系统的研究与应用.pdf_第1页
(机械设计及理论专业论文)小型电信经营分析系统的研究与应用.pdf_第2页
(机械设计及理论专业论文)小型电信经营分析系统的研究与应用.pdf_第3页
(机械设计及理论专业论文)小型电信经营分析系统的研究与应用.pdf_第4页
(机械设计及理论专业论文)小型电信经营分析系统的研究与应用.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京邮电犬学工学硕士学位论文 小型电信经营分析系统的研究与应用 摘要 电信经营系统是一个数据分析与决策支持系统,它可以对市场及用户的各类 消费情况、各类新业务的开展情况、各种销售渠道的经营情况等一系列问题进行 快速、有效、可靠的分析。从而了解用户需求,把握市场动态,寻找投资与回报 的最佳结合点,提高企业的管理水平和竞争优势。 竞争促使电信运营企业的运营模式发生变化,同时也对电信业务经营分析系 统提出了许多新的需求。在这种新需求驱动下,本文对一种小型企业经营分析系 统的产生背景以及其设计开发过程进行展开论述。 文章概要论述了我国电信经营分析系统的建设情况,对当前运营商建立电信 运营分析系统的过程、方法以及存在的问题进行了分析。在此基础上,文章结合 廊坊和保定两个运营商市级分公司的小型经营分析系统的建设项目对小型电信 经营分析系统的应用领域和功能进行了描述,并对数据提取、主题分析及表示层 实现这三个核心步骤作了比较详细地阐述。尤其是在系统建立的具体过程中。定 义了一种在数据库技术基础之上建立的“规则”,利用这种“规则”可以很好的 起到数据仓库和o l a p 工具所起的分析作用,使系统成本大大降低。另外,文 巍中应用链式排序法和h a s h 表方法对系统的性能进行了优化,解决了大多数统 计分析类系统最让人头疼的分析效率低的问题。 在将来的小型电信经营分析系统中,决策支持的功能是系统很重要的一个组 成部分。因此,文章又一个实例对电信经营分析系统中引入决策支持功能的方法 给与了介绍,为将来系统的发展提供了参考建议。 关键词经营分析系统投资回报数据挖掘数据库统计技术 2 北京邮电大学工学碗士学位论文 t h es t u d ya n da p p l ic a tio no fs m a l l - s o l et e l e c o i qb u sin e s s m i a l y $ iss y $ i e m a b s t i 弧c t b us i l 3 ess a r i a l y s is s y s t e misad a t aa n a l ys isa n dd s s s y s t e m i tc a ng e ta l lk i r l ds0 fc o n s u m p t i 0 1 3s i t u a t i o i l s0 ft h e m a r k e tn i l du s er n e wd e v e l 0 p m e n ts i t u a t i o n d i f f e r e n tm a r k e t i n gc h a l l n e l s 0 p e r a t i 0 1 3 e t c a s e r i es0 fiss u t e0 fb us i n e sst o c a r r y 0 1 3f a s t ,e f f e c t i v e ,r e l i a b lea n a l y s is t ou 1 1 d er s t a n d1 1 s er s t i e e d s ,gr a s pt h em a r k e ltr e n d ,1 0 0 k f o rt h eb es tc o m b i l 3 a t i 0 1 3 i n v e s t i n ga n dr e c i pr o c a t i n g a n di m p r o v et h em a l l a g e m e r l t1 e v e l o fe n t e r pr is e sa n dc o m p e t i t i 0 1 3a d v a n t a g e c o m p e t i t i o nm a k et e l e c o m m u n i c a t i o no p e r a t i 0 1 3m o d ec h a - t l g e a n di t m a k ea1 0 t0 fr l e wd e m a l l dsi ;0s3 7 s t er r lt h es a met i m e f o rt h isd e m a r l d t h ep a p e rp u t sf o r w a r das m a l l 一s c a l et e le c o m b u s i l 3 es sa n a l ys is s ys t e r n ,a n d1 a u n c hd e s c r i b i r l g t 0t h et h i n g t h a ti t s d ”,e l o p i n g c 0 u r s e t h ep a p e l e x p o u n dst h ef a c t0 fo u rc o u n t r yd e a li nt h e c o ns t r t t c t i o ns i t u a t i o r lo ft h et e le c o mb u s i n e ss a n a l y s is s y s t e m a n da n a l y s ish o wt 0s e tu ps y s t e ma tp r es e n t w ec a nu n d e rs l a n d f r o mi t t h a tt h ew h 0 1 ef r a me w or k0 ft h e s y s t e m a n dk n o 、 :i ts p 1 u s e sa n dm i n us es o nt h i sb a s i s p a p e rd es cr i b e da p p l ic a t i o n a n df u n c t i o no fs m a l l 一s c a l e s y s t e mc o m b i l 3 e dw i t ht h e r e a l p r o j e c t es p e c i a l l y ,a u t h o rp u t f o r w a r dak i l 1 do f “r u l e ”w l a i c h b eu s e dt o r e p l a c e0 l a p1 0 0 1 s ,a n di n t r o d u c et w oa l g o r i t h m s w h i c hc a ni m p r o v et h ep e r f o f i n a n c eo ft h es ys t e m i nt h ef u t u r e t h ef u n c t i 0 1 3o fd e c is i o ns u p p o r ti sa v e r y i m p o r t a n tc o m p o r l e r l t o f s y s t e m s 0t h ew r i t er g i v - e s ab as ic i n t r o d u c t i o i lt ot h e c 0 1 3 c e p t 0 fd e c is i o i l s u p p o r t a n d p r o p o s es 3 北京邮电大学工学硕士学位论文 s o m em e t h o dst h a th o wt ous ed e c is i o r l s u p p o r tf u n c t i 0 1 1i nt h e s m a l l 一s c a l es ys t e m k e yw o r d s( b o s s ) b u s i r l e s s0 p e r a t i o n a ls u p p o r ts ) s t e ms ( r o i ) r e t u r n0 fi n v e s t m e n t d a t am i n i n gd a t a b a s e s t a tt ec h n 0 1 0 9 y d 北束邮电大学工学硕士学位论文 声明 独创性( 或创新性) 声明 本人声明所呈交的论文是本入在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均己在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:趣叠日期 2 一笃拜,写1 鱼 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅; 学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制 手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围,适用本授权书。 本人签名: 导师签名: 日期:! ! 堕1 91 里: 日期: ! 些si i ! 丝 北京邮电大学工学硬士学位论文 第一章课题背景 1 1 电信企业引入电信经营分析系统的意义 2 0 0 2 年,中国电信行业的“5 + t ”的新电信竞争格局形成,中国电信、中国 网通、中国移动、中国联通、中国卫星和铁通公司六家基础电信企业和4 0 0 0 多 家增值电信、无线寻呼企业不仅在争夺客户方面相互竞争。经过几年的发展,中 国电信市场已经形成了综合实力相对均衡的几大竞争实体之间既相互对立又相 互依存的局面。同时,2 0 0 1 年年底,我国正式加入w t o 。根据w t o 的服务 贸易总协定,从事国际电信服务贸易一般分为跨境提供服务、跨境消费服务、 商业存在和自然人移动等四种类型,其主要形式是外企进入国内市场。我国己经 宣布了电信业从增值服务到基础网络对外开放的日程表,允许外商进行投资,这 样在原有国内的激烈竞争环境当中叉引入了国外的竞争者。这就给国内各大运营 两提出了在竞争中求发展的课题。 对运营商而言,他们已经深刻的认识到,现在电信业已经进入新一阶段的竞 争。要获得坚实向上的未来,要找到下一个利润增长点,唯有扎扎实实把业务和 管理做好;经营理念必须由以前的“面向政府面向公众”转为“面向市场面向客 户”。对于习惯了等着客户排队交费,靠政府纵容和社会喂养而过着幸福生活的 运营商来说,转型当然不容易;但他们同样也很清楚,比转型更不容易的还有“活 下去”和“活得不错”。于是,缓慢却是不可逆转地,一场为争夺用户、增加收入 而改革管理体制、提高服务质量,进而增强企业竞争力的角逐已经在国内各电信 运营商之间悄然拉开了事幕i l 】。 参照国外的先进经验,国内的运营商们就以上问题都注意到了同一个发展方 向:建立新一代电信经营分析系统。电信经营分析系统是一种通过对数据的分析 来对市场及客户的消费、经营、网络等多种情况进行观察,使决策者能够通过统 计分析得到的数据来更合理的对不断变换的市场做出及时准确的反应。 当前,电信相关企业都迫切需要采用经营分析系统来得到财务部门,市场经 营,运行维护,服务管理等方面的信息反馈,然后利用科学的方法研究企业的经 营活动过程,客观的评价企业完成营销目标的情况,找出影响电信业务和市场销 售的因素,揭示企业经济活动的发展趋势,总结生产管理和市场营销工作的经验, 不断提高企业的经营效益。 北京邮电大学工学硕士学位论文 1 2 国外的应用情况 目前,国外各大电信公司都在利用基于数据仓库的技术建立自己的经营分析 系统来提升利润空间。世界最大的无线通信服务公司之a t & t 、无线电话服务公 司,采用n c rt e n d a t a 的数据仓库解决方案,实现了业务量分析、客户群体分析 等,并取得良好效果:比利时国家电信使用数据仓库建立顾客信息系统,其数据 仓库拥有超过1 万亿字节的数据。通过欺骗检测功能,能很快发现反常电话以2 乏 欺骗性的打电话方式,避免大量经济损失。此外,英国电信公司采用数据仓库应 用系统保证了关键性业务的处理。发达国家的电信业企业都在积极提供自己的经 营分析系统的解决方案,使得现今电信领域经营分析系统的应用正成为一个非常 热门的课题吲。 1 3 小型电信经营分析系统的意义 本文论述的是一种小型电信经营分析系统,它主要是针对一些运营商的地市 级分公司建立的,具体上说它是一种网间话务经营分析系统。它与其他电信经营 分析系统最大的不问点是分析的侧重面不同,目前国内建立的电信经营分析系统 主要是针对自身的发展情况进行观狈4 的,而本课题讨论的小型电信经营分析系统 主要是地市级运营商需要的针对其他运营商的经营情况进行分析的系统。 这类系统的特点是主要针对单模式的数据类型进行统计分析,并不需要建 立庞大的数据仓库,只需在良好的需求分析基础上建立普通的关系型数据库,并 运用些编程语言来完成经营分析系统的统计分析工作。总的来说建立这种小型 电信经营分析系统有以下几方面的好处: 1 能够分析竞争对手的经营信息 由于目前国内的主要电信经营分析系统的主要功用为分析自身经营情况而 本文论述的新型电信经营系统的分析对象为竞争对手的经营信息。主要方式:现 在国内各运营商已经完成互联互通,话单数据在关口局以全话单的形式存在,系 统通过对这些话单信息分析来了解竞争对手的经营情况。 2 系统建立周期短,成本低 由于不必建立庞大的数据仓库,这样可以省去数据的综合转换等复杂的操 作,所以系统的建立周期将大大的缩短,并可以为企业节约大量的人力、物力。 3 ,系统精确性高、灵活性好 由于系统是针对通话纪录数据建立的分析系统,数据的单一特点可以减少在 大型系统中数据提取、转换过程中丢失或错读的可能性,因此准确性将大大提高。 2 北京邮电九学工学硕士学位论文 4 成为大型经营分析系统的有力补充 由于小型系统具有上述特点,所以它能够成为大型分析系统的有力补充,可 以用来验证大型经营分析系统的分析结果是否和该系统产生的结果大致一致,如 果不一致则可以提早发现隐患问题,确保系统分析结果的准确性,为领导层能够 做出正确的决策提供有力保障。 经过我们的实际市场调研,目前我们国内对该类系统的市场需求还是很大 的,许多地市级公司都对小型经营分析系统表现出浓厚的兴趣,由于目前国内的 电信运营商都在摸索一条适合中国国情的发展道路,所以他们很关注任何好的建 议和新的尝试,所以我们在这样的市场背景下做,j 、型经营分析系统的研究是很有 社会效益和经济效益的。 1 4 论文研究的主要内容 论文主要以保定网通和廊坊联通为研究对象,完成小型电信经营分析系统的 分析、设计与实现,从而为运营商的领导层正确决策提供有力保证。 具体内容为:分析小型电信经营分析系统的功能目标,基础数据,对系统的 软硬件总体架构进行设计:对具体的数据提取和主体分析功能的整体程序及具体 算法进行设计;实现系统的各个模块功能。重点对如何降低小型系统的系统成本, 增加系统灵活性,改善系统性能等方面进行分析与研究。 北京邮电大学工学硕士学位论文 第二章电信经营系统的建设方法 2 1 移动公司的经营分析系统建设情况 在我国的六家电信运营商里,中国移动以其雄厚的实力位于行业的龙头地 位,因此我们可以从它的自身发展来从侧面看出我国电信行业的整体发展情况。 中国移动自2 0 0 2 年起,经过近一年的筹备,投下数十亿的巨资,在全国范围内 展开了经营分析系统的建设。这是继业务支撑系统( b o s s ) 之后的又一个大手笔。 经营分析系统是以数据仓库技术为基础,它所覆盖的技术范围广泛,同时也几乎 涉及到企业的各个业务范围,加之数据仓库技术在国内仍然属于比较新的技术, 在国内成功的案例并不多见。所以中国移动经营分析系统的建设成为去年中国 i t 行业一个值得关注的焦点。 移动经营分析系统环境的支撑网络采用三级模式:集团公司系统( 一级,简 称集团中一心) 、省级支撑系统中心( 二级,简称省中心) 、地市级支撑系统( 三级, 简称地市中心) 。 三级应用系统分别对应三级管理中心的职能,三级互连系统实现三级系统间 的互连互通。 其总体支撑网络示意图如图2 1 所示: ! 一一一、1 l 一一一一螋苎! 墅堡要j 图2 - 1 系统环境的支撑网络图 北京邮电丈学工学硕士学位论文 般具体来说,市地州级公司主要处于整个经营分析系统的数据源部分,它 为整个系统提供数据来源。目前,各地市都已经具有大量的,各种类型的事务处 理系统,每个系统中都存在了大量的数据。已经建立好的综合业务支撑系统正好 可以将之很好的汇总起来,上传至省公司。 而省中心的经营分析系统是整个运营商运营分析系统的核心,一般来说,运 营商的各个省公司会根据自身情况建立各自的运营分析系统,它主要完成如下功 能: 1 定时接收各地市、州分公司的数据; 2 通过数据仓库技术对各地市、州分公司的经营情况进行统计;进行全省的 综合分析、决策支持等功能。 3 实时监测各地市、州局服务质量情况; 4 ,按集团公司的要求定期上报各类统计分析数据。 集团公司处于整个体系的最顶层,他根据各个省公司的上报的数据进行分析 决策,来制定公司的发展策略。 目前,中国移动各个省市的经营分析系统建设的一期工程基本结束。一期工 程建设的主要内容体现在几个方面。第个方面是对经营分析系统整体架构的搭 建。第二方面是把b o s s 系统的报表分析工作逐步向经营分析系统转移,同时增 加联机分析处理( o l a p ) 功能。在这个方面,经营分析系统的三个层面( 数据获 取、数据存储、前端展现) 都已经成型h j 。 2 2 经营分析系统的主要应用技术 2 2 1 数据仓库技术 数据仓库是一个用以更好地支持企业或组织的决策分析处理,面向主题的、 集成的、稳定的、包含历史数据的、随时间不断变化的数据集合。 所谓主题,指用户使用数据仓库进行决策时所关一心的重点方面,如销售情况, 用户构成、公司的利润状况等;所谓面向主题,是指数据仓库中的信息是按主题 进行组织的,为按主题进行决策的过程提供信息。所谓集成,是指数据仓库中的 信息从各个业务处理系统中经过系统加工、汇总和整理,保证数据仓库内的信息 是关于整体和致的全局信息。所谓稳定,是指一旦某个数据进入数据仓库以后 一般情况下将长期保留。所谓包含历史数据,是指系统记录了企业过去菜一时点 到目前的一系列信息,通过这些信息,可以对企业的发展里程和未来趋势做出定 量分析和预测。 数据仓库技术在决策信息系统中主要提供三个方面的作用: 北京邮电大学工学硕士学位论文 ( 1 ) 、报表功能。提供标准的报表和图表功能,其中的数据源于各个本地分 公司的业务系统,因此,省级数据仓库的报表和图表是关于全省业务信息的报表 和图表。 ( 2 ) 、支持多维联机分析。多维分析是通过把一个实体的多项重要属性定义 为多个维度( 对信息的不同理解角度,如时间维度、地理维度、产品维度等) , 将日常的业务处理数据按所定义的维度汇总成数据集存放在数据仓库中,以使用 户在分析、查询中方便的对不同用途的数据进行纵向和横向的比较。 ( 3 ) 、支持预测分析。预测分析是在已有数据中识别数据的模式,帮助用户 理解已有的信息,并在已有信息的基础上,对未来的状况做出预测。 2 2 2o l a p 技术 联机分析处理( o l a p ) 的概念最早是由关系数据库之父e f c o d d 于1 9 9 3 年提出的,当时,c o d d 认为联机事务处理( 0 l t p ) 已不能满足终端用户对数据库 查询分析的需要,s o l 对大数据库进行的简单查询也不能满足用户分析的需求, 用户的决策分析需要对关系数据库进行大量计算才能得到结果,因此c o d d 提出 了多维数据库和多维分析的概念,即o l a p 。同时他提出了关于0 l a p 的1 2 条准 则。0 l a p 的提出引起了很大的反响,o l a p 作为一类产品同联机事务处理( 0 l t p ) 明显区分开来。 当今的数据处理大致可以分成两大类:联机事务处理o l t p ( o n i l n e t r a n s a c t i o np r o c e s s i n g ) 和联机分析处理0 l a p ( o n l i n e a n a l y t i c a p r o c e s s i n g ) 。o l t p 是传统的关系型数据库的主要应用,它针对的是基本的、日 常的事务处理,例如银行交易,电信的日常业务等。0 l a p 是数据仓库系统的主 要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 下表列出了0 l t p 与o l a p 之间的比较。0 1 一葺 一 一 一, 一 磊二丽挈| 蚴一一 ;|一一|一一 一 生l一一!撅。 匹丢一。 唧一一一一一 北京邮电天学工学硕士学位论文 -m。 存取 j 读写数十条记录 工作单位 用户数 d b 大小 简单的事务 上千个 1o o m b g b 读上百万条记录 复杂的查询 上百个 1o o g b - t b 表2 - 1o l t p 与o l a p 的区别 联机分析处理( o l a p ) 是以海量数据为基础亡勺复杂分析技术。它支持各级 管理决策人员从不同的角度、快速灵活地对数据库中的数据进行复杂查询和多维 分析处理,并且能以直观易懂的形式将查询和分析结果展现给狭策人员。o l a p 技术核心是”维”这个概念,它使用的逻辑数据模型为多维数据模型。 “维”是人们观察客观世界的角度,是一种高层次的类型划分。“维”一般 包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的 属性定义为多个维( d i m e n s i o n ) ,使用户能对不同维上的数据进行比较。例如, 一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入 观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和 所考察的度量指标构成的多维数组则是o l a p 分析的基础,可将不同的度量指标 形式化表示为( 维1 ,维2 ,维n ) ,如( 地区、时间、产品、销售额) 。 多维分析是指对以多维形式组织起来的数据采取切片( s 1 i c e ) 、切块( d i c e ) 、 钻取( d r i1 】一d o w n 和r o l 卜u p ) 、旋转( p i v o t ) 等各种分析动作,咀求剖析数 据,使用户能从多角度、多侧面地观察数据库中的数据,从而深入理解包含在数 据中的信息。 常用的o l a p 多维分析操作有上卷、下钻、切片、切块、旋转等。多维数据 模型在物理实现时,主要有三种方式:r o l a p 结构、l r t o l a p 结构和h o l a p 结构。 其中r o l a p 是基于关系数据库的o l a p 实现,m o l a p 是基于多维数据组织的o l a p 实现,h o l a p 是基于混合数据组织的o l a p 实现。 就o l a p 本身来说,它是独立于数据仓库技术出现和存在的,普通数据库中 也可以应用o l a p 进行分析。但就目前应用而言,数据仓库的搭建都使用了o l a p 技术,而o l a p 技术在数据仓库当中才能更好的发挥其本来的作用。因此可以说 o l a p 技术和数据仓库是密不可分的。在我们现在的大型电信经营分析系统中, 这两种技术是构建系统的核心技术。 2 3 系统的组成结构 一般而言,大型电信运营分析系统的实体组成部分有:数据源部分,数据提 取部分,数据仓库部分,前端显示部分。其对应的系统模块如下图2 2 所示。 北京邮电大学工学硕士学位论立 图的最下端部分是数据源,它是由业务数据库和其他数据源组成。业务数据 库是指由各本地分公司的计费、营销,客服等多釉事务处理数据库,它为省级数 据仓库提供当前和历史的详尽业务数据;其他数据源是指根据需要选择省级业务 系统的部分数据或其他的行业数据。 第二部分模块。是由数据的抽取、转化、加载工具组成,即图中的数据采集 前置机,它们的主要作用就是将原始的数据源部分的数据抽取、转化并最终加载 我们需要在其中进行统计分析的特殊数据库当中,也就是我们的第三部分模块, 数据仓库。 数据仓库:数据仓库中数据范围覆盖了各个分公司的所有当前的以及历史的 业务数据,根据公司运作的架构( 即企业关心的销售、财务、用户等主题) 和信 息分析的需求进行统一的定义和组织,构建多维模型的逻辑结构,以关系数据库 进行存储。同时,数据仓库中建有重要的元数据,管理和控制进入数据仓库的数 据,描述数据仓库中源数据和目标数据本身的信息以及它们的转换过程,保证数 据的实效性和一致性。 当数据在数据仓库中得到分析处理之后,我们就可以根据系统的前端显示工 具如o a 系统,报表系统,o l a p 分析等系统进行观测,来了解业务的当前情况以 及发展趋势等问题。”1 图2 - 2 系统工作模决图 北京邮电,:学工学硕上学位论文 z 4 系统的建立过程 从上图系统的结构可以看出,建立经营分析系统过程中最核心的三个主要操 作步骤是:数据抽取、转化、加载过程和统计分析过程以及最终的前端显示过程: 图2 - 3 核心建立过程说明圈 t 一) 抽取、转化和加载过程主要是指从数据源中抽取数据,由于各个业务数据 库系统都各自比较完整地管理着企业某一部分的信息,众多的客户数据、市场营 销数据、帐务数据以不同的数据格式和访问方式分散在不同的系统中,形成众多 的信息孤岛,在各个信息孤岛中存在着冗余和不一致,不能满足数据仓库中数据 必须具有单一视图的要求。因此必须对数据进行检验整理,并根据数据仓库的设 计,对数据进行重耨组织和加工,装载到数据仓库中,并且可以周期性地进行数 据的追加,以反映数据源的变化。 ( 二) 统计分析过程一般是由查询统计、联机分析、预测分析三个具体部分组成, 下面我们来分别说明”。: 一、查询统计:提供一般的数据访问功能,对数据仓库中的当前和历史数据 进行查询、统计和汇总,并实现动态报表功能,使用户能够根据自己的需求定制 报表。二、联机分析:使用o l a p 服务器和联机分析工具i 支持和操作多维数据 结构,使用多种分析方法,对数据采取切片、钻取、旋转等各种分析动作剖析数 据,使最终用户能多角度、多侧面、多层次的观察数据。三、预测分析:在建立 完成企业级的客户信息数据仓库之后,可以基于这个数据仓库平台进行数据挖掘 工作,或使用其他数据挖掘工具及多种算法( 如决策树、回归分析、神经元网络 等) ,高度自动化地分析当前、历史的细节和汇总数据,从中挖掘出数据内在的 规律,从而预测客户行为、市场发展趋势等电信企业决策人员所关心的专题。 ( 三) 前端统计分析结果的显示: 一般来说,系统的最终用户希望得到的数据是经过分析处理之后存储在数据 库当中的,所以要想让这些数据直观的显示在决策者面前,就必须使用一些工具 来将数据展现出来,目前比较流行的是用v s n e t 技术体系下的a s p 技术或是 1 2 e e 体系结构下的j s p 技术。利用这些技术可将最终结果以报表,图形等多种 方式在浏览器页面中展现在使用者面前。 9 北京邮电大学工学硕士学位论文 2 5 需要解决的关键问题 以上内容介绍了当前电信经营分析系统建设的情况以构建的部分技术。但就 目自t 已经建立的情况而言,经营分析系统面临着以下些问题需要解决。【9 i 问题一:如何建立完整统一的数据视图 经营分析系统应完全整合以业务支撑系统为主的多种数据源,形成统一的经 营分析数据视图;具备灵活的存储和组织数据,并能根据需要进行主题内部要素 的扩充、主题的新增以及跨主题的重构。 问题二:数据质量的保证问题 实际上,这也是数据仓库从一开始就应该最为重视的问题。但是目前普遍的 问题是:在经营分析系统建设的初期,各个集成商和运营商都是以赶进度为中心, 主要任务是把b o s s 系统中的报表分析部分转移到经营分析系统,重点是对系统 的架构设计,这样就不可避免地出现了系统修复数据以提高数据质量的能力并不 是很强的现象。俗话说的好,“巧妇难为无米之炊”,没有好的数据,不会分析 出合理正确的结果的。所以在数据质量问题上,以后系统的目标应该是做到数据 的正确性( c o r r e c t n e s s ) 、致性( c o n s i s t e n c y ) 、完整性( c o m - p l e t e n e s s ) 和可 靠性( r e 】a b i t y ) 问题三:如何向专题分析倾斜突如数据挖掘 我们知道,经营分析系统主要包括四个方面的内容:预定义报表、即席查询、 o l a p 分析和数据挖掘。在前期的工作中,重点是在数据仓库架构设计以及报表 和o l a p 分析上。所以数据挖掘将是今后系统建设中的一个重点,虽然部分省市 的前期工作中有一部分是数据挖掘,但只是为数据挖掘作了一个前期准备工作, 为今后工作的顺利展开提供了基础。 问题四:经营分析系统与其它系统的互动问题 一个信息化系统必须和其它系统产生良性的互动,方便实用,才能产生良好 的效益。经营分析系统不应该也不会是独立的。所以要实现经营分析系统与其它 系统的互动,将分析的结果应用于客户服务和主动营销,同时可以对业务系统的 流程等提出改进。这也是经营分析的终极目的。通过一些技术的整合,使经营分 析系统成为一个分析信息全面、可被其它系统实时共享的数据平台,从而使企业 北京邮电大学工学硕士学位论文 各个系统相互之间可以产生实时互动,使信息系统产生最多的效益。 问题五:对竞争对手的分析不足。 俗话说“知已知彼百战不殆”。现在由于多家运营商的存在,市场竞争同 趋激烈,菜家运营商如果能够第一时间把握竞争对手的经营情况,那么这会使其 在制定自身发展策略的时候变的更加主动,更加合理,更加有效。使其能够在同 行业的激烈竞争中保持领先的地位。但就目前经营分析系统研究的情况而言,我 国各大运营商的经营分析系统都主要在对自身的发展进行统计分析,对自身的数 据评估,而对竞争对手却没有第一手的资料来进行说明。因此如果我们建立一种 能够分析竞争对手的经营分析系统,通过它可以使运营商得到竞争对手的经营信 息,那么这将对本企业自身的发展会起到很大的帮助作用。 总而言之,现在我国的电信经营分析系统还有很多不完善的地方,需要我们 日后不断去改进,去发展,来使其最大程度上的满足决策者的真实需要。 通过以上对大型电信经营分析系统的架构和实现技术的详细分析,以及对电 信经营分析系统的发展方向进行了了解之后,下面一章论文将对作者提出的一神 地市级的针对自身以及其他运营商的小型电信经营分析系统进行具体而详细的 论述。 北京邮电大学工学硕士学位论文 第三章小型电信经营分析系统的分析 3 1 系统的产生意义 经营分析系统的发展是一个不断总结经验、发现问题、扩展完善的过程,因 此现存系统的问题需要我们一步步的、脚踏实地的来解决。本文论述的小型电信 经营分析系统主要就是针对上面一章的第五类问题提出的一种解决方案,即建立 一种能够了解竞争对手信息的新型经营分析系统。 通过深入思考,我们得出这样的结论,要解决第五类的问题:了解竞争对手 的经营信息,是可以从下面的突破口进行:为符合市场的需要,根据市场利益的 驱动,当前各大运营商的互联互通工作已步入正轨,中国移动、中国电信、中国 联通、中国吉通、中国网通、中国铁通六大运营商之间的通话信息均以全话单方 式在关口局记录。利用这些话单数据,从已有的资源中提取有效的信息,通过数 据处理,即能够得到其他运营商的话单信息,通过这些话单信息我们能够很清楚 的知道竞争对手的经营情况,分析出有利于自身公司发展的经营策略,更好的为 经营发展服务,是有利于本运营商发展的重要手段。 在解决问题的方法发现之后,是需要实践来进行检验的。为此,本文在与保 定网通和廊坊联通在该类系统建立的真实合作项目上展开,通过理论与实践的结 合来完成这种新型经营分析系统的论述。从第二章我们已经看出,当前各个省都 已经建立了在数据仓库技术基础上的大型经营分析系统,所以对于本论文在市级 公司建立的网间话务量分析系统就定义为小型电信经营分析系统。 从上面的应用需求我们可以看出,小型电信经营分析系统的提出并不是对大 型系统的否定,而是作为一种功能独立的系统提出的,它和大型系统之间最大的 f 薹别是经营分析的分析方向不同,一个主要是对外,另一个主要是对内。待目后 技术更加成熟,小型电信经营系统完全可以作为大型系统的有益补充加入到大型 系统当中去。 下表列出了本文所论述的小型电信经营分析系统和目前已有的大型电信经 营分析系统的主要区别: 小型系统大型系统 用户地市级运营商省级运营商 分析目的根据话单分析其他运营商的自身发展的综合情况 经营情况 北京邮电大学工学硕士学位论文 i 主要分析技术l数据库+ 编程语言数据仓库 l; 。 经济成本几万百h ,彳冗 |数掘源单一话单数据、多种业务数据库数据 表3 - 1 系统区别表 车文所论述的系统是通过数据审与j a v a 编程技术完成了话务量的统计分忻 工作,使开发成本大大降低,而性能上却得到了很好的满足。所以该系统的提出 是电信运营商经营分析系统一种新的设计方法上的应用。是非常具有实际意义的 一种解决方案。 3 2 系统的功能目标 要想使系统得到其应有的效果就必须首先要了解系统建立的功能目标。在 进行深入的调研后,我们总结出该小型电信经营分析系统要实现的基本功能要求 是将关口局交换机记录的原始数据定时( 并逐步过度为实时) 的转换为统计分析 数据、图表,并收集n 0 7 检测系统异常情况对比,为经营决策提供依据。系统 要实现定时( 并逐步过渡为实时) 统计分析,每月过网话务量分析,并建立铁通、 联通、移动、中国电信等运营商的用户资料动态监控库,动态掌握数据变化情况 的功能。其具体实现目标为: 数据采集:将交换机原始数据定时( 并逐步过渡为实时) 、正确的采集、导 入数据库。包括来、去、转全部话单。 数据处理:将原始清单数据进行分拣后生成数据库清单数据及费用数据,正 确计算各类费用值。 统计分析:生成统计分析数据,提供统计分析图表。其体内容为: ( 1 ) 建立其他运营商的用户资料动态监控库,实时监控用户数变化情况。 用户数包括( 主叫用户数,被口q 用户数) 对月与月之间用户数变化情况比较。 ( 2 ) 分析过网总话务量、户均话务量、话务量时段分布等指标变化情况。 ( 3 ) 分析各运营商中继群话务量变化情况。 ( 4 ) 离话务量提取分析,区分来、去话及不同业务类型高话务量用户。 ( 5 ) 针对其他运营商用户逐一分析来、去话异常话务量,及时发现普通号 码移做它用等情况。 ( 6 ) 异常主被叫号码分析,及时发现异常情况。 ( 7 ) 免费话单的分析统计,找出免费话单产生的局向,发现非正常免费号 北京邮电大学工学硕士学位论文 码。 ( 8 ) 其他运营商的l p 业务情况及发展趋势分丰斥 ( 9 ) 公司的i p 在其他运营商网上话务量分布情况分析。 ( 1 0 ) 其他运营商的其它业务量分析。 下面以联通为例,来对上面所述的多种需求给与具体分析: 关口局的话革类型主要有两种( 两种类型的话单格式是一样的) : ( 1 ) 不同运营商网间通话产生的话单,主要是( 移动,网通,电信,铁通) 与联通通话产生的话单: ( 2 ) 联通网内不同业务间产生的话单。( 联通的三大业务) 用户数量变化趋势是基于月的统计,有三种情况: ( 1 ) 总用户数量的变化:经过关口局的不同电话( 包括固话和移动) 总数; ( 2 ) 其他运营商用户总数量的变化,按照不同运营商分别显示出来; 其他运营商有:移动,网通,电信,铁通。 各种不同用户的总数 固话用户数移动用户数i p 用户数被叫i p 用户数 移动 l 网通 i 电信 i 铁通 ( 3 ) 本地联通用户总数量的变化趋势 1 3 3 是属于c 网,1 3 0 1 3 2 是属于g 网。 c 网用户数fg 网用户数本地用户总数 ( 4 ) 漫游用户 ( 5 ) 小灵通用户总数变化趋势。( 网通用户6 8 0 _ 6 8 9 ) 2 话务量情况 ( 1 ) 基于中继群话务量统计 运营商日期总话务量用户数平均话务量 ( 对应着中继群) 移动 网通 电信 铁通 1 4 北京邮电大学工学硕士学位论文 ( 2 ) 按时段分步统计各中继群话务量 r 运营商日期( 年月日)1 时【2 时2 4 时 i 移动 i 网通 【电信 铁通 ( 3 ) 高话务量统计显示: 用户自定义高话务量的时长,按主叫被叫分别显示客户电话号码以及通 话时长进行排序。 3 查询某个用户情况: 功能:根据主被叫号码,按时段打印所有话单条目并累计其话务量。 4 异常号码 规则;主叫号码大于l 】位,且不是区号开头,如中继群号属于某个范围。 功能:显示其电话号码及其话务量,并利用话务量排序。 5 其他运营商其他业务: 功能:提供移动,网通,电信,铁通的i p 业务和长途业务的总话务量。 通过对上述需求的具体分析,我们能够了解本论文所述的小型电信经营分析 系统的主要功能。下面一章论文将对系统的设计展开详细的论述来实现上述的 每项具体功能。 3 3 基础数据分析 一, 建立一个好的分析系统,首先必须要对分析对象有深刻的了解。本论文论述 的小型电信经营分析系统的主要分析对象是运营商关口局或端局的话单数弼,这 些数据是以二进制的形式存储在交换机上,是未经加工的,属于原始数据。其数 据特点就是数据量大,属性唯一,精确性高。 下表就是某交换局话单包含内容的详细说明; 编域名1 8主叫号码地址性质表示语 号( “主叫地址性质”) 1顺序号1 9主叫号码( “主口q 号码”) ( “流水号”) 2记录类型2 0 被叫用户号首集 ( “话单类型”)( “被叫号首集”) 5记录有效性标志2 1被叫号码地址性质最不语 ( “有效性”) ( “被叫地址性质”) 北京邮电大学工学硕士学位论文 7 计费免费标志 2 2 被叫号码( “被叫号码”) ( “免费标志”) 1 3 计费方身份识别 2 6 入中继群号( “入中继群号”) ( “付费方”) 、1 4 应答日期时间 2 7 出中继群号( “出中继群号”) ( “应答时间”) 1 5话终日期时间3 1 呼叫类型( “呼口q 类型”) ( 话终时间”) 1 6 通话时长 3 2 业务类型 ( “通话时长”) 1 7主叫用户号首集3 5 话终原因( “话终原因”) ( “主叫号首集”) 表3 - 2 上表列出的是某运营商话单包含的内容,其他运营商的话单在内容上都和上 面显示的基本相同。但有一点值得注意,虽然话单包含的内容各个运营商不尽相 同,可内容的存储类型却很不一样。从本论文所述系统来看,系统是为廊坊联通 和保定网通公司设计的,其话单格式就有四种之多。保定网通的种,是以1 】8 字节的话单格式存储的。廊坊联通的有四种,c d m a 网话单以1 5 2 字节存储;g s m 网有两种,分别是以1 8 7 和2 5 2 字节存储。我们可以想象,如果只是对单一一种 类型话单进行提取,那将是一个很好解决的问题。但如果要使系统具有一定的适 应性,那么系统的数据提取程序就必须能够适应不同地市,不同运营商的话单格 式。因此,系统的数据提取程序一定要设诗的十分合理。文章后面所论述的主题 分析程序及算法一节将提出一种很好解决该类系统适应性的方法。 3 4 系统的硬件结构 在系统的分析对象明确清晰之后,就必须要考虑如何建立系统环境了。目 前对此种系统硬件搭建的解决方案有两种比较流行的形式。 第一莉是采用客户机,服务器的砸层结构模式: 数据从关口局直接导入数据库,客户的请求直接由数据库所在的服务器进 行处理。针对本系统所实施的两层模式的结构如下页图3 1 所示。 客户端提供用户界面、运行逻辑处理应用程序,数据服务器接受客户端s q l 语句并对数据库进行查询,然后返回查询结果。由于业务的处理逻辑主要在客户 机端执行,因此这种结构也被称为胖客户( f a tc l l e n t ) 结构。 北京邮电大学工学硕士学位论文 图3 一l 两层系统模型 该结构最大的优点在于结构简单,开发和运行的环境简单,各方面配置要求 也不高,项目容易实施。但也正是这种结构,产生了其根本性的问题:首先,是 系统的拓展性问题和安装维护的问题。这种系统在小规模环境下还能运行,一旦 进入大规模生产系统之后,性能呈几何级数下降,以致影响到系统的可靠性,在 系统开发完成后,整个系统的安装也非常繁杂。在每一台客户机上不但要安装应 用程序,而且必须安装相应的数据库连接程序,还要完成大量的系统配置工作。 第二种方式是三层结构模式: 采用三层结构模式的方式是服务器从关口提取数据,进行处理后导入数据 库。客户的请求也提交服务器,服务器分析客户机的请求后对数据库进行处理, 从数据库中提出数据并进行适当的处理后返回客户机。 图3 2 三层系统模型 北京邮电大学工学硕士学位论文 三层模式的具体说明如下:第一层是客户机( 用户界面) ,提供用户与系统 的友好访问:第二层是应用服务器,专司业务逻辑的实现;第三层是数据服务器。 负责数据信息的存储、访问及其优化由于业务逻辑被提取到应用服务器,大大 降低了客户机负担,因此也称为瘦客户( t h i nc 1 i e n t ) 结构。 由于现在服务器的性能已经越来越优越,所以一般企业经营分析系统都将主 要工作交给服务器来完成。本论文所述系统即采用三层模式进行开发设计,将大 部分功能集中于应用服务器和数据库来解决,客户端至需要是任何台有浏览器 的计算机,这样整个系统的搭建就变非常简单。 本论文所述系统采用目前比较流行的b s 架构的三层模式来搭建系统,但在 原有b s 架构的系统上又做了一定的改进,加入了后台的以c s 架构建立的管理 界面。这种改进的提出,主要是由于系统的使用者有两种类型,系统管理员和决 策者。管理员的任务是配置规则,并按时进行数据的统计分析;决策者是利用系 统来观测统计分析结果。所以这种将系统的不同功能分离成不同页面的改进型架 构是能够起到更方便用户对系统的使用和管理作用的。 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论