




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 本文根据国内电信企业经营分析的现状,参照规范的电信企业信息化建设标 准,设计了一个电信企业业务经营分析系统,实现了部分功能模块。本文分为以 下几部分内容: 一第一章阐述了国内电信经营分析系统的现状。在经营分析系统的设 计和使用上还存在一些问题,对经营分析系统总体设计缺乏有机和合理的规划构 架,系统的实际应用功效还难以让人满意。并介绍了本设计的目标和所做的主要 工作在于从设计上解决这些问题。 二第二章介绍了经营分析系统的结构,着重介绍了数据模型体系结构 采用多粒度,统一编码,便于以后系统扩展。 三第三章致力于系统功能上的设计,面向实际的应用,提出了自己的 解决方案。包括固定报表,多维分析,联机分析处理,主题分析,专题分析。 四最后章回顾了自己的设计过程,展望了经营分析的应用前景。 关键字:经营分析数据挖掘数据模型 a b s t r a c t a c c o r d i n gt ot h es t a t eo f t e l e c o mi n t e r i o r l ya n dt h et e l e c o mc o n s t r u c t i o ns t a r t - d a r d ,t h i sp a p e rd e s i g n e dat e l e c o mb u s i n e s sa n a l y s i ss y s t e m t h i sp a p e rc o n s i s t e d s e v e r a lp a r t s : 1 t h ef i r s tc h a p t e rd e s c r i b e dt h es t a t eo f t e l e c o m t h e r ea r em a n yp r o b l e m si n t h eb u s i n e s sa n a l y s i ss y s t e m ,s u c ha su n r e a s o n a b l ef r a m ea n da p p l i c a t i o n i ta l s oi n - d i c a t e dt h a ti t st h eg o a lo f t h i sp a p e rt os o l v e t h e s ep r o b l e m s 2 t h es e c o n dc h a p t e rd e s c r i b e dt h ef r a m eo f b u s i n e s sa n a l y s i ss y s t e m ,e s p e c i a l l yt h ed a t am o d e lg r a n u l a r i t y i t sa d v i s e d t h a tm u l t i p l eg r a n u l a r i t ya n du n i q u e c o d ea r eg o o di d e a 3 t h et h i r dc h a p t e rp a i da t t e n t i o nt of u n c t i o nd e s i g na n dm a d es u g g e s t i o n st o a p p l i c a t i o n s 4 t h el a s tc h a p t e rr e v i e w e dt h ep r o c e s so f d e s i g n ,a n dl o o k e df o r w a r dt h ep r o s - p e c to f b u s i n e s sa n a l y s i ss y s t e m k e y w o r d s :b u s i n e s sa n a l y s i ss y s t e m ,d a t am i n i n g ,d a t am o d e l i i 南京邮电大学 硕士学位论文摘要 学科、专业:工学计算机软件与理论 研究方向:数据仓库和决策支持系统 作 者:j 塑堕级研究生 付鑫指导教师塑廛 题目:基于c t g e d m l 0 的电信企业分析系统设计 英文题目:d e s i g nt e l e c o mb u s i n e s sa n a l y s i ss y s t e mb a s e do n c t g e d m l o 主题词:经营分析数据挖掘数据模型 k e y w o r d s : b u s i n e s sa n a l y s i ss y s t e md a t am i n i n g d a t am o d e l 南京邮电大学硕士研究生学位论文 第一章电信企业经衍分析系统综述 第i 章电信企业经营分析系统综述 1 。1 电信企业经营分析系统现状分析 中国的电信运营商拥有的世上独一无二的庞大用户基数,从2 0 0 1 年c r m 的 兴起,到2 0 0 2 年中国移动经营分析系统启动,电信运营商一直在寻找着能够帮 助自己在口趋激烈的竞争中保持不败的办法。 目前来讲,以数据仓库为中心的经营分析系统的建设也面临着较大的困难和 挑战。经营信息数据仍然分散在各个不同的子系统当中,难以形成统一的经营信 息视图,无法为经营分析提供一致的服务:缺乏对经营信息的有效分析和对经营 行为的全面掌控,无法有效地为经营行为提供个性化、差异化的服务。新业务的 支持往往涉及到多个子系统的改造和多个厂家的协调,影响了新业务的支持速 度。随着新的商业模式、新的服务模式不断出现,经营分析系统在功能上也需要 进行补充和完善。 现在存在的主要问题有: 目前各部门业务建设和分析人员还是习惯于报表形式的分析模式,对经营分 析系统所要承担的使命认识不够清晰,对经营分析系统总体功能缺乏有机和合理 的规划构架,大量的临时统计报表贯穿于经营分析系统日常的开发: 作中,经营 分析系统成为了报表系统。 急于满足日常琐碎的经营分析任务,缺乏对系统的长远的基础规划,数据粒 度和层次划分不科学,基础工作做得不好,造成系统出现功能扩展受限的瓶颈, 导致系统崩塌。 重引导需求,轻需求驱动。由于经营分析系统的需求不确定性,系统建设初 期,往往注重凭借开发商的经验,主动向最终用户提供系统可能实现的应用和功 能,而忽视不定期采集和紧密捆绑市场及业务部门的具体需求,造成系统的实际 应用功效太差。 1 2 本课题要达到的目标和主要工作 本课题研究的主要内容和目标是根据国内电信企业经营分析的现状,参照规 范的电信企业信息化建设标准,结合本地的统一客户服务系统、计费帐务系统、 结算系统、网管系统等各系统的情况,设计一个多层混合粒度的数据仓库模型, 南京邮电大学硕士研究生学位沦文 第一章电信企业经营分析系统综述 这样可以为多种应用提供数据平台,获得比较高的处理效率。同时对经营分析系 统的功能进行全面的介绍,提出一些分析方案,解决一些实际的需求。 这些功能包括业务人员使用最频繁,在企业内部传递信息及评估经营指标 的固定报表功能;经营分析人员在进行市场策划、产品评估、经营问题定位过程 中常用的多维分析功能;用数据仓库中的数据,从决策人员分析的角度、方法和 设想来验证结论的主题分析功能:通过对某个问题进行多层面、多角度的分析, 将问题进行分解,针对各个部分采用报表、多维、动态查询以及数据挖掘的主题 分析功能。 南京岍乜大学硕士研究生学位沦文第二章电信企业经营分析系统的结构设计 第二章电信企业经营分析系统的结构设计 2 1 经营分析系统的组织结构 经营分析系统分为集团公司经营分析系统和省公司经营分析系统两级,各省 ( 直辖市、自治区) 只设置一级统一组织、集中存储的经营分析系统数据中心。 地市级分公司不设置单独的经营分析系统数据中心。其中,省公司经营分析系统 主要完成本省客户发展情况、业务发展情况、收益情况、市场竞争、服务质量、 营销管理、大客户、新业务及数据业务、合作服务方等主题分析。如图2 1 示。 第一级 第二级 图2 1 经营分析系统两级结构示意图 2 2 经营分析系统的总体结构 经营分析系统以一个数据仓库系统为基础。整个数据仓库系统是一个包含四 个层次的体系结构,具体由图2 2 表示 南爵f l l i gr i _ l 大学删j 二研究生学位睑文第二章电信企业经营分折系统的结构设计 前端工具 图2 2 数据仓库结构 数据源是包括存放于关系数据库管理系统( r d b m s ) 中的各种业务处理数据、 各类文档数据、相关法律法规、市场信息和竞争对手的信息等等。数据源来自 9 7 系统、计费帐务结算系统、统一客户服务系统、网管系统、资源系统等几个 系统的日常产生的数据。这部分数据经过数据仓库的e t l 流程迸入数据仓库中, 部分数据采用数据集市的方式存储。 。o l a p 系统的应用主要是对用户当前以及历史数据进行多角度、多层次的分 析,辅助领导进行决策,以及进行大量的实时数据查询操作。其典犁的应用有对 银行信用卡风险的分析与预测和公司市场营销策略的制定等。 前端工具主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具 以及各种基于数据仓库或数据集市的应用开发工具。 数据的存储是整个数据仓库系统的核,t l , 。也是数据仓库的关键。数据仓库按 照数据的覆盖范围,可以分为企业级数据仓库和部门级数据仓库( 数据集市) 。 如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企 业级数据仓库的一个子集,它主要面向部门级业务,并且只面向某个特定的主题。 数据集市可以在一定程度上缓解访问数据仓库的瓶颈。它和数据仓库除了在数据 量大小和服务对象上有所区别外,逻辑结构并无多大区别。 企业在计划实施数据仓库时,如果出于项目成本、信息化程度、项目周期等 多方面的考虑,可以选择建立独立数据集市。例如:用户可以将第一个数据仓库 塑室! ! ! ! ! ! ! 查堂型! 土里! 窒竺堂堡堡壅笙三童皇笪垒些丝笪坌! l :叠竺塑堕塑望生 的实现定位于一个特定的部门和应用或者业务线,用来解决个别部门比较迫切的 问题。以后再用几个数据集市组成一个完整的数据仓库。这样可以降低开发成本, 缩短实现周期,并有助于为未来的数据仓库的发展培训t t 人员。 但企业在实施项目前,前提是必须需要根据企业全面的业务信息和全局的视 点制定一个整体决策结构和规划。这个决策是要面对未来企业级数据仓库的建设 和整合上。一定要保证现在所使用的数据模型能够向将来企业范围的数据存储扩 展,以便于将来其他数据集市和战略数据仓库的实现。否则,当企业做商业决策 时,需要从多个数据集市或资源系统提取信息,由于数据集市各自独立,每个都 由一个应用软件支持,因此造成信息调用不方便而影响到整个数据仓库系统。 2 3 应用体系结构 根据课题目标,设计的数据模型体系结构如图2 3 示: 部数据 统一编码 二二煎面亟二二 客户视图话单 总客户信用度 通话行为日汇总竞争对手通话 消费行为月汇总竞争对手信息 勤密群年汇总异常话单数据 产品视图帐单汇总用户转网信息 产品发展欠费汇总客户价值分类 产品使用 产品销售 二二至蔓匦 统一维表 f c i i 业务系统l i 数据f l 企业级数据仓库 o d s 层 存储 图2 3 数据模型体系结构图 数据源具有系统众多、数据分散和平台多样的特点,为此,数据仓库多采用 自顶向下的结构来构建。该结构在建立数据仓库初期就从企业的整体上考虑数据 仓库的需求,并建立一个能为企业所有部门决策提供数据支撑的企业数据仓库。 在企业数据仓库的基础上,各个部门可以根据其特殊需求从数据仓库中获取数据 建立数据集市,直接为部门决策服务。 南京邮电大学嘶l 士研究生学位论文第二章电信企业经营分析系统的结构设计 从数据仓库模型的逻辑架构角度来看,可以分为三层:操作型数据存储层 ( o d s 层) 、中间汇总存储层( 中间层) 、数据仓库主题层。 从数据物理存储角度来看,数据仓库分为o d s 数据存储和d w 数据存储,其 中d w 数据存储包括了中间层和主题层。 模型的设计是采用多层混合粒度的方式,这样可以为多种应用提供数据平 台,获得比较高的处理效率。 从应用层面上来看,o d s 层数据可以作为企业的共享数据平台,同时可以为 数据中间层、主题层、数据挖掘、即席查询等提供数据支持。 中间属性层的数据是经营分析系统对来自多个业务系统的数据源进行整合 后的结果,在这层数据中有关于用户、产品等多种视图,可以为主题分析、数据 挖掘、即席查询等提供数据支持。 在图2 3 中,三户数据取自业务支撑系统,本地话单、长途话单、短信话单 取自数据采集系统、日帐单、缴费清单、欠费数据取自计费系统,结算数据取自 结算系统。 图2 4 就是一个数据中间层对o d s 层的数据进行整合成的一个关于通话行为 的多维表,以此多维表为依据,就可以进行通话行为的多维分析。 通话时间维表 图2 4 关于通话行为的多维表 按照数据的粒度粗细和面向分析应用,数据组织分为o d s 部分、d w 部分。 南京邮电大学硕_ 上研究生学位论文第二章电信企业经营分析系统的结构设计 o d s 部分数据粒度最细,遵循各生产系统的数据本质特征,按照一定的分类原则 来组织数据,该部分数据最稳定;d w 部分是在o d s 的基础上经过轻度和深度汇 总产生,主要是为面向主题分析服务。数据的层次组织既能满足分析需求的变化, 同时也能保证数据仓库的结构稳定。 2 3 1o d s 存储层 o d s 存储层的组成与业务系统相近,下面以计费系统为例,按照不同的域将 计费信息进行分域存储。如表2 1 所示 表2 1 计费信息分域表: 一、客户域 帐户信息 客户信息 二、产品域 设备大类 设备类型表 产品包 产品 专线业务表 三、定价域 价格计划表 优惠规则代码表 营收优惠规则表 四、事件域 呼叫类型表 固话长途清单 固话长途清单的无户 南京邮电大学 ! 十研究生学位论文第二章电信企业经营分析系统的结构设计 固话市网清单 五、帐务域 明细帐目类型表 信息台的帐单清单 数据业务的帐单清单 用户帐单表( 月) 用户帐单表( 日) 7 i 、地区域 营业区信息表 支局信息表 局向信息表 营业厅表 七、公共 营业员信息表 银行信息表 2 3 2 数据中间层 在数据中间层中对来自各个业务系统的数据进行了整合,形成了基于全企业 数据的统一数据视图。 中间层的数据包括以下三部分内容: ( 1 ) 用户视图及产品视图 a 信息汇总的数据中含有用户i d 和产品i d ,这样可以实现对用户级和 产品级的各类分析 b 数据包括有用户级详单汇总、用户级帐单汇总、用户级短信汇总、用 南京邮电大学f 0 ;| 士研究生学忙论叟 第二章电信企业经营分析系统的结构设计 户级收入汇总、用户级通话行为汇总等内容 c 用户视图中包含了用户通话行为信息、用户勤密群信息、用户消费行 为信息、用户缴费习惯信息等内容 d 产品视图从产品的生命周期角度来对产品信息进行管理,从产品的产 生、产品的销售、产品的使用、产品的退出等角度来对信息进行存储, 这样可以提供给经营分析人员关于产品分析中的各类信息。 ( 2 ) 时间粒度信息汇总 a 针对详单级数据可以采用小时级信息汇总、忙闲时段级信息汇总、 天信息汇总、月信息汇总、年信息汇总 ( 3 ) 数据挖掘信息预处理表 a 为数据挖掘的应用提供基础数据准备 b 数据包括有:用户呼叫指纹表、竞争对手通话表、竞争对手信息表、 异常话单表、客户价值分类表等。 如图2 5 所示: 图2 5 数据中间层组成 2 3 3 主题层 主题层是面向分析应用设计的星型数据存储,可以为分析主题、报表等提供 南京邮电人学倒 士研究牛学位论文第二章电信企业经营分析系统的结构设计 数据支持。 主题是决策人员提出分析的角度、方法和设想,然后希望数据仓库中的数据 来验证结论。数据仓库主题层是面向应用构建的,其中主要是事实表及维表。事 实表采用星型结构的设计方式,维表采用分级的设计方式。 数据仓库层的设计需要保持相对的稳定性,可以满足企业对经营分析的持续 支持能力,因此需要在设计时综合考虑近期的应用与远期的战略,尽可能保证在 主题层不受业务系统的变化产生影响。 该系统结构的主要特点有:具有鲜明的层次结构,能很好地支持数据仓库 信息处理、ol ap 、数据挖掘等应用。由于数据仓库将分散的业务数据进行 了整合,可以在数据仓库上进行全局性的信息处理,例如建立整个企业的管理类 报表系统。先建立数据仓库再建立数据集市,可以使数据仓库集中精力解决数 据整合和清理等问题,而数据集市则致力于为特定的决策过程提供服务。数据仓 库在数据源和直接面对决策支持过程的数据集市之间形成了一个缓冲,数据集市 可以面向一个优良的数据仓库来建设,数据源的变化可以不直接影响到数据集 市。以数据仓库为中心,不仅为分析服务提供基础数据,而且满足了数据挖掘 的需求。 2 4 环境分析 数据源介绍 本经营分析系统所需的数据,取自客户服务系统、计费帐务系统、结算系统、 网管系统等系统,下面分别介绍: 用户资料取自业务支撑系统,如下表所示: 表2 2 用户资料 用户资料: 用户资料记录了用户的基本信息,包括用户标识、业务号码、所属地域、受 理渠道、用户状态、开户时间、入网时间、最近开停机时间、退网时间、销 户时间,资费套餐标识、服务套餐标识等权方面的关于拥护的一些基本信息。 用户月帐单资料、用户欠费资料、用户监控资料、用户付款资料和销帐资料 取自计费帐务系统,如下列表所示: 南京邮电大学硕士研究生学位论文第二章电信企业经营分折系统的结构设计 表2 3 用户月帐单资料 用户月帐单资料: 用户帐单资料记录了用户在帐期内的各种应缴费项的情况,主要字段包括最 小收费项标识、用户标识、费用、帐期起始时间、帐期结束时间。 表2 4 用户欠费资料: 用户欠费资料: 用户欠费资料包含了一个用户的所有欠费的记录,包括用户标识、帐期起始 时间、帐期结束时间、本帐期欠费金额、累计欠费金额、数据生成时间。 表2 5 用户监控资料 用户监控资料: 用户监控资料中主要包括用户标识、监控方式、存款余额、奖励总额、欠费 总额、话费总额、信用金额( 呼出限制) 、信用金额( 双向停机) 等。 表2 6 用户付款资料: 用户付款资料: 用户付款表主要包括用户标识、付款金额、付款时间、受理渠道类型、付款 方式等。 表2 7 销帐资料 l 销帐资料: f 销帐资料主要包括用户标识、总费用、应收费用、实收费用等。 用户g s m 详单资料取自数据采集系统,如表2 8 所示: 表2 8 用户g s m 详单资料 用户g s m 详单资料: 用户详单资料包含的内容最为复杂,记录了用户每次通话的详细数据,主要 字段为呼叫类型、本方号码、通话开始时间、通话时长、本地计费时长、长 南京邮电大学硕士研究生学位论文第二章电信企业经营分析系统的结构设计 以上是下面进行分析时可能需要用到的数据资料,随着以后分析功能的扩 展,可能用到更多,在此就不全部列出。 数据预处理: 数据源中的数据通常不可以直接使用,需要经过预处理过程,转换为我们需 要的多维数据,供分析时直接使用。数据准备占去了工作的大部分时间,而且数 据准备工作也比较零散,静态报表、o l a p 分析、数据挖掘都需要数据准备工作, 数据准备的主要工作是把数据源按照用户的级别进行汇总。一个中间表常用的生 成过程包括横表转纵表,表单关联汇总等等。 南京邮l 电大学坝 :研究生学位硷文第三章电信经营分射i 系统的功能设计 第三章电信经营分析系统的功能设计 功能上我们提供了固定报表,多维分析,联机分析处理系统( o l a p ) ,专题 分析等几种,其中固定报表用来解决“发生了什么”的问题;多维分析用来解决 “为什么会发生”的问题,而数据挖掘则用来预测“将来会发生什么”。下面分 别介绍: 3 1 固定报表介绍 固定报表是业务人员使用最频繁的分析内容,在企业内部信息的传递及经营 指标的评估大多都是采用固定报表的方式来进行。报表类主要分为三个方面:领 导报表、曰常业务报表、自由组合报表。这三类报表可以为不同层面的人员来提 供有针对性的数据展现,满足在经营分析活动中对报表层面的需求。 领导报表: 为了更高效地利用公司统一经营信息服务系统,让公司各级市场决策者更加 直观、迅速地了解生产经营状况,需要对日常报表增加对各级市场决策者主要关 注的经营信息增加简单的文字描述。各级决策层对重要指标的需求如下: 省公司业务部门:需要了解公司相关业务经营情况,重要指标是收入、发展 用户( 新装和拆机) 、新业务到达用户、离网用户变动情况、完成计划任务的比 例:在全国电信中所处地位:当地竞争形势;兄弟省公司经验介绍。有的还需要 了解用户结构变动情况。 分公司老总和市场部领导:需要了解公司相关业务经营情况( 重要指标是收 入、发展用户、网上用户、离网用户、潜在离网用户和话务量变动情况、完成计 划任务的比例) :当地竞争形势;其他公司经验介绍。有的还需要单项促销活动 用户数、宽带业务推广情况、增值业务销售统计、不规范资料用户数等:有的还 需要了解关于结算收支等信息。 在这样的需求情况下,可以在经营分析系统上提供能够及时、准确、综合反 映企业经营状况的信息,如: 公司综合业务日重要数据简报。 公司固定电话业务日重要数据简报。 公司无线移动业务曰重要数据简报。 公司宽带业务日重要数据简报。 南京邮也大学碗j j 研究生学位论文 第三章电信经营分 | 亍系统的功能设计 公司增值业务目重要数据简报。 日常业务报表: 日常业务报表是省公司及地市分公司的各个部门日常需要的关于经营分析 的报表。 这部分信息需要在项目调研工作中进行收集,针对各个部门提出的需求进行 相应的整合,并且制定山统一的指标解释文档。 自由组合报表: 自由组合报表是由经营分析系统提供的基于关键指标( k p i ) 组合成自由格 式报表的功能。 市场分析人员通常会对一些指标进行组合分析,需要对一些不确定的指标进 行组合,然后选择一定的条件限制,并且会添加一些统计算法,最终形成一个报 表分析结果。例如:业务人员需要分析从2 0 0 5 7 一l 到2 0 0 5 7 一l o 的住宅电话日 a r p u 值、收入情况与该段时间的住宅电话窄带拨号a r p u 值、收入情况的对比分 析。 经营分析系统需要提供一个完整的指标库,在此基础上,用户通过指标试图 来选择需要的指标“住宅电话a r p u 、收入”和“住宅电话窄带拨号a r p u 、收入”, 然后对指标的限制条件时间段进行设定,最后再定制需要进行的统计运算方法。 3 2 多维分析 3 2 1 多维分析的介绍 多维分析是经营分析人员在进行市场策划、产品评估、经营问题定位过程中 常用的一种分析方式。多维分析使用非常灵活,在多维数据模型中,数据组织成 多维,在已经建立的分析模型基础上,能够对分析内容进行上卷、下钻、切片和 切块等多种分析。分析的结果还可以很方便的转换为图形分析,帮助分析人员了 解发展趋势、异常状况、业务状态等综合信息。 上卷:上卷操作通过一个维的概念分层向上攀升或者通过维归约,在数据立 方体上进行聚集。 下钻:下钻是上卷的逆操作,它由不太详细的数据到更详细的数据。下钻可 以通过沿维的概念分层向下或引入薪的维来实现。 切片和切块:切片操作在给定的数据立方体的一个维上进行选择,导致一个 南京邮电大学埘! 士研究生学位沦文第三章电信经营分析系统的功能设计 子方。切块操作通过对两个或多个维进行选择,定义子方。 转轴:转轴是一种目视操作,它转动数据的视角,提供数据的替代表示。 下面是一个多维分析在用户新增拆机中的应用。 3 2 2 用户新增拆机多维分析 用户新增拆机分析的数据从业务支撑系统和计费系统中获取,包括用户的 新装、拆机记录、用户信息表、客户信息表和产品信息。 数据从业务系统中通过文件的方式抽取到数据仓库o d s 层,形成用户信息、 客户信息、产品信息。其中在用户信息中通过状态描述的方式来标识新增用户和 拆机用户信息。 数据从数据仓库o d s 层到数据仓库中间层,将形成用户业务发展的视图,将 用户的基本属性与产品属性相结合。数据从数据仓库中间层到数据仓库主题层, 将形成用户新增拆机的事实表,将用户的新增拆机情况按照维和度量的方式进 行存储。 数据从数据仓库主题层到最终的分析界面,将形成分析的立方体,也是按照 维和度量的方式来存储,同时生成不同级别的汇总数据。 分析模型 根据需求,建立的主题模型如表3 1 所示: 表3 1 用户新增拆机设计表: 新增用拆机用净增用 指标 户数户数 户数 角度 时间 地域 产品类型 客户类型 在网时长 城乡标识 营销渠道 行业性质 南京邮电大学硕士研究生学位论文 第三章电信经营分析系统的功能设计 其中时间维度包括:日一周一月一年 地域维度包括:省一本地网一营业区一分局一支局一局向 产品类型维度来自产品目录树,如无线业务一小灵通 客户类型维度包括:大客户,商业客户,公众客户,流动客户 在网时长维度包括:i 个月、2 个月、3 个月、 城乡标识维度包括:城市、农村、其他 营销渠道维度包括:主体营业、合作营业、代销代办、其他 行业性质维度包括:金融、保险、军队、国家机关 新增用户数是指在指定统计期的新增使用电信网络的用户数,这里会以在 9 7 系统中的用户状态作为标准 拆机用户数是指在指定统计期停止使用电信网络的用户数,包括各类拆机用 户 净增用户数= 新增用户数一拆机用户数 图3 1 是关于新增拆机的多维表。 南京邮i b 大学硕十研究生学位论文 第三章电信经营分析系统的功能设计 时间维表 客户类型维表 图3 。l 是关于新增拆机的多维表。 3 2 3 多维分析的更广泛应用 在实际应用中,多维分析的应用范围很广,下面是本系统中几个多维分析的 应用。 a 以年龄为维度进行分析: 分析描述: 将年龄分段,分为1 8 岁以,1 8 2 4 ,2 4 - 3 0 ,3 0 4 5 ,4 5 6 0 ,6 0 岁以上几个年龄 段,进行消费额分析。 分析目的: 青年人有青年人的消费特点,中年人的工作比较忙,每月的通话量可能多 南京邮电大学明士研究生学位论文 第三章电信经营分和i 系统的功能设计 于其他年龄段,老年人的通话量可能会相对少一些。区分出不同年龄段的消费 特点,更好地为每个年龄段的用户群提供服务。 输出结果: 上卷出每个年龄段的用户群的消费额特点。 b 以每月的短信条数为维度进行分析: 分析描述: 将在校学生每月的短信条数以5 0 条为一段,进行划分,得出占总的学生人 数的比重,并与务工人员的情况进行对比。 分析目的: 在校的学生,特别是大学生短信的消费量可能会大一些,而踏入工作岗位 的人,由于比较繁忙,可能更愿意选择语音通话。根据不同的消费特点,制定 出不同优惠套餐。 输出结果: 上卷出学生群体短信需求量的特点。 c ,以长途话费为维度进行分析: 分析描述: 将长途话费以十元为一段进行上卷分析。 分析目的: 有家人在外地求学或工作的用户,或者长年在外地求学或工作的人,会有 较高的长途通话需求,可以统计这部分用户在总用户数中所占的比重。 输出结果: 上卷出经常打长途的用户的比重。 d 以话费量为维度进行分析: 分析描述: 将每月的话费额分为几段进行分析,0 元以下,5 0 元一1 0 0 元,1 0 0 元一3 0 0 元, 3 0 0 元一6 0 0 元,6 0 01 元1 - i 0 0 0 元,1 0 0 0 元一1 5 0 0 元,1 5 0 0 元一3 0 0 0 元,3 0 0 0 元一5 0 0 0 南京邮电大学坝士研究生学位论文第三章电信经营分析系统的功能设计 元,5 0 0 0 元- 1 0 0 0 0 元,1 0 0 0 0 0 元以上。 分析目的: 较高话费额收入的用户是电信收入的主要来源,每个人有不同的话费承受 能力,那些收入较商的用户,如企业老总,公司白领,如果有较高的通话需求, 就有可能成为高话费量的用户,还有一些收入并不高,但因工作需要,如企业 营消人员,也有可能成为高话费量的用户,如何保证这部分用户不会流失,或 者在将要流失时有所察觉,是对电信运营商的一大考验。 输出结果: 上卷出各个消费群体人数逐月的变化情况。 e 潜在大客户分析: 分析描述: 客户营收连续三个月收入超过某个设定值,但该客户不在大客户名单中, 即原有的业务系统中没有关怀到的客户。 分析目的: 为了让潜在的大客户( 或者说是非常有价值的客户) 得到更好的服从而为 公司创造更多的营收。 输出结果: 可钻取到该类客户的详细名单并钻取到每个客户使用的所有产品。 附:维度的划分参考附录一,经营分析系统指标体系。 这种可供观察的角度还有很多,通过多维分析,从中可以找出有意义的业务 群体,制定不同的消费套餐,并可以进行统计,预测各个业务群体的发展趋势, 来指导实际的营销策略。 3 3 联机分析处理( o l a p ) 系统 o l a p 简绍 联机操作数据库系统的主要任务是执行联机事物和查询处理,这种系统称为 联机事务处理( o l t p ) 系统。与之对应,数据仓库系统在数据分析和决策方面为 用户或“知识工人”提供服务。这种系统可以用不同的格式组织和提供数据,以 南京邮i _ i j l 人学硕士研究生学位l 仑文第三章电信经营分析系统的功能设计 便满足不同用户的需求。这种系统称为联机分析处理( o l a p ) 系统。 3 4 主题分析 主题是决策人员提出分析的角度、方法和设想,然后希望数据仓库中的数据 来验证结论。数据仓库主题层是面向应用构建的,其中主要是事实表及维表。事 实表采用星型结构的设计方式,维表采用分级的设计方式。 数据仓库层的设计需要保持相对的稳定性,可以满足企业对经营分析的持续 支持能力,因此需要在设计时综合考虑近期的应用与远期的战略,尽可熊保证在 主题层不受业务系统的变化产生影响。 依据业务需求,本经营分析体系建设在功能上分为以下几个分析主题,如图 3 2 所示: 图3 2 主题分析总体框图 3 4 1 业务量收主题 包括业务收入比重分析 实现目标: 对预付费进行分析,以考察预付费方式的发展趋势及对总收入和有关财务指 标的贡献度,探索科学合理的预付费方式。 功能要求: 从下表中所列的角度及其组合对预付费进行分析,比较预付费山收入总量的 南京邮电大学硕士研究生学位论文 第三章电信经营分析系统的功能设计 比例。 分析: 对指定条件下的预付费进行预测 观察角度: 时间,地域,用户年龄组,用户性别,消费层次,用户类型,用户职业,服 务品牌,业务类型,入网时长分档,渠道类型,销售模式。 3 4 2 客户分析主题可分为: 用户价值分析 实现目标: 可分析不同消费量的用户在用户总量中所占的比例,不同消费量的用户的消 费量在运营总收入中所占的比例,帮助制定合理的营销策略。 功能要求: 从下表中所列的角度分析消费量的用户在用户总量中所占的比例,不同消费 量的用户的消费量在运营总收入中所占的比例 观察角度: 时间,地域,年龄组,用户性别,消费层次,用户类型,用户职业,信用等 级,入网时长分档,服务品牌,业务类型。 3 4 3 竞争分析主题可分为: a 用户数占有率分析 实现目标: 使市场人员能够了解不同时间段内的不同服务品牌的产品或服务的市场占 有率情况。了解市场中最有价值产品或服务。了解不同产品的主要竞争对手是谁, 从而为市场经营提供指导。 功能要求: 从下表中所列的角度及其组合对用户数、市场收入进行多维分析、比较分析、 排名分析、意外分析、趋势分析。 南京邮电大学硕士研究生学位论文 第三章电信经营分析系统的功能设计 观察角度: 时间,地域,归属运营商,服务品牌。 b 竞争对手情况分析 实现目标: 从竞争对手用户发展情况、竞争对手用户话费收入情况、竞争对手用户呼叫 行为、竞争对手营销策略、竞争对手服务质量等方面,对竞争对手发展情况进行 分析预测。 功能要求: 从下表中所列的角度及其组合对竞争对手的用户总量、用户新增量、用户流 失量、通信时长、通信次数等情况进行多维分析、比较分析、排名分析、意外分 析、趋势分析。 分析: 根据与竞争对手用户有关的通话清单,统计得出竞争对手用户数现状,并进 行趋势预测;从通话清单中计算出竞争对手用户的通话时长和通话次数;通过与 竞争对手用户互打的清单中,计算出通话次数、通话时长、使用次数、数据量在 一定比例之上的用户( 即大客户) 作为研究对象 观察角度: 时间,地域,竞争对手,服务品牌,消费层次,入网时间。 3 4 4 营销分析主题 促销分析 实现目标: 推广新业务,提高企业在广大客户中的知晓度、认可度,来开拓市场、占领 市场。 功能要求: 从下表中所列的角度及其组合对发展用户数量、业务收入、业务量、发展用 户平均用户信用度、投资回报率情况进行多维分析、比较分析、排名分析、意外 分析、趋势分析。 分析: 南京邮电大学硕- k ) f 究生学位论文 第三章电信经营分析系统的功能设计 对基于不同角度的营销宣传手段的不同组合对新增有效用户数、业务收入增 量、业务量增量的影响进行仿真模拟,针对不同产品、不同地区、不同用户群体, 选择最合理的市场营销手段。 观察角度: 时间,地域,宣传渠道,促销类型,业务类型,用户类型,用户年龄组,用 户性别,用户职业。 3 4 5 收益情况分析 包括收入分析: 实现目标: 推广新业务,提高企业在广大客户中的知晓度、认可度,来开拓市场、占领 市场。 功能要求: 从下表中所列的角度及其组合对收入总量及收入增量进行分析,并能对预定 义的某些特定条件下的关于收入总量的关键指标( 如某一时间的收入总量、某一 地域的收入总量、某用户群的收入总量等等) ,设定预警条件( 涨跌告警、特定 值告警等) ,从而实现对关键指标的实时监测。当出现告警后,可引导经营分析 决策人员从相关角度对其进行原因和影响分析,查找指标出现异常的原因。 观察角度: 时间,地域,年龄组,用户性别,消费层次,用户类型,用户职业,服务品 牌,业务类型,渠道类型,销售模式,呼叫类型,入网时长分档。 3 4 6 业务发展主题: 包括语音业务量分析 实现目标: 按照不同的呼叫类型、漫游类型、对方类型等角度对用户的业务量及其增量 进行分析。以了解不同业务量的用户构成、业务量的变化与发展趋势 功能要求: 分别从下表所标记的不同角度及各角度之间的不同组合,在一定时间段内, 对通信时长、通信次数这些量值在指定对比时间上的增量进行多维分析、比较分 南京邮电大学硕士研究生学何硷文第三章电信经营分析系统的功能设计 析、排名分析、意外分析、趋势分析。 根据当前及过去时间段内的业务量分析,预测今后某一时间段内或时间点上 的业务发展情况。 观察角度: 时间,地域,用户性别,年龄组,用户类型,用户职业,入网时长分档, 消费层次,服务品牌,业务类型,通话时段,漫游类型,通话类型,呼叫类型, 单次通信时长分档。 3 5 专题分析 3 5 1 专题分析的介绍 专题分析是通过对某个问题进行多层面、多角度的分析,通常会将问题进行 分解,针对各个部分采用报表、多维、动态查询以及数据挖掘的方法。 数据挖掘方法论: 在实施数据挖掘之前,先制定采取什么样的步骤,每一步都做什么,达到什么 样的目标是必要的,有了好的计划才能保证数据挖掘有条不紊的实施并取得成功。 很多软件供应商和数据挖掘顾问公司投提供了一些数据挖掘过程模型,来指导他 们的用户一步步的进行数据挖掘工作。比如s p s s 的5 a 一评估( a s s e s s ) ,访问 ( a c c e s s ) ,分析( a n a l y z e ) ,行动( a c t ) ,自动化( a u t o m a t e ) ,和s a s 的s e m m a 一 采样( s a m p l e ) ,探索( e x p l o r e ) ,修正( m o d i f y ) ,建模( m o d e l ) ,评什( a s s e s s ) 。 一些软件供应商和用户组织成立了行业协会,包括n c rs y s t e m se n g i n e e r i n g c o p e n h a g e n ( 丹麦) d a i m l e r b e n za g ( 德国) s p s s i n t e r n a ls o l u t i o n sl t d ( 英 国) ,和o h r av e r z e k e r i n g e ne nb a n kg r e pb v ( 荷兰) 。这个组织的目的就是建 立跨行业数据挖掘过程标准( c r i s p d m ) 。 数据挖掘过程模型 这些基本数据挖掘步骤包括: ( 1 )定义商业问题 ( 2 )建立数据挖掘模型 ( 3 )分析数据 ( 4 )准备数据 南京邮电大学硕士研究生学位论文第三章电信经营分析系统的功能设计 ( 5 ) ( 6 ) ( 7 ) 建立模型 评价模型 实施 ( 1 ) 定义商业问题。 在开始知识发现之前最先的同时也是最重要的要求就是了解你的数据和业务 问题。如果事先没有这种了解,没有任何算法,不管他有多么复杂玄妙,能够为 你提供有价值的结果,即使有也难以使人信赖他。缺少了这些背景知识,你就没 办法明确定义要解决的问题,不能为挖掘准备数据,也很难正确的解释得到的结 果。要想充分发挥数据挖掘的价值,必须要对你的目标有个清晰明确的定义, 即决定到底想干什么。比如你说你想提高直接邮件推销的用户回应时,你想做的 可能是“提高用户响应率”,也可能是“提高一次用户回应的价值”,要解决这两 个问题而建立的模型几乎是完全不同的,你必须做出决定。有效的问题定义还应 该包含一个对你的知识发现项目得到结果进行衡量的标准。当然还应该有整个项 目预算和理性的解释。 ( 2 ) 建立数据挖掘库。 连同下面的两个步骤,这三步构成了数据预处理的核心。这三步和在一起比 其他所有的步骤加在一起所花得时间和精力还多。一旦你从数据挖掘的结果中学 到一些什么之后,你很可能要修改数据以得到更好的结果,因此就需要把数据准 备和数据挖掘不断的反复进行。数据准备工作大概要花去整个数据挖掘项目的 5 0 9 0 的时间和精力。 应该把要挖掘的数据都收集到一个数据库中。注意这并不是说一定要使用个 数据库管理系统。根据要挖掘的数据量的大小、数据的复杂程度、使用方式的不 同,有时一个简单的平面文件或电子表格就足够了。 一般来说,直接在公司的数据仓库上进行数据挖掘是不合适的。你最好建立一 个独立的数据集。数据挖掘会使你成为数据仓库非常活跃的用户,这可能会带来 一些资源中请上的问题。你需要经常把许多表连接在一起,访问数据仓库的细节 数据。一个简单的试验在数据仓库内都要很多步才能完成。 大部分情况下你肯定需要修改要挖掘的数据。而且还会遇到把企业外部的数据 拿到数据仓库内和在原有的表中增加新的字段的情况。其他的数据挖掘用户可能 南京邮电大学硕士研究生学位论文 第三章电信经营分析系统的功能设计 也要对数据仓库进行与您相似或完全不同的修改。而对数据仓库管理员来说,这 恐怕是他最不愿意遇到的事情。 需要建立独立的数据挖掘库的另一个理由是,数据仓库可能不支持你要对数据 进行各种复杂分析所需的数据结构。这包括对数据进行统计查询,多维分析,和 各种复杂的图表和可视化。 最后,你可能希望把这些要挖掘的数据存贮在与公司的数据仓库在物理设计上 不同的d b m s 上。人们越来越倾向于使用d b m s 本身很好的支持数据挖掘的数据库 程序,这样能使数据挖掘工作进行的更容易一些。当然如果你的数据仓库允许你 建立一个在逻辑上独立的数据库并且在计算资源上也足够的话,那么在他上面进 行数据挖掘也是可以的。 可以把建立数据挖掘库分成下面几个部分: a 数据收集 b 数据描述 c 选择 d 数据质景评估和数据清理 e 合并与整合 f 构建元数据 g 加载数据挖掘库 h 维护数据挖掘库 注意这些步骤并不需要一定要按步骤执行,而应该按需要进行。比如你可能在 收集数据时就开始构建元数据,并随着工作的进行不断的对其进行修改。在数据 整合和数据质量评估过程中了解到的东西也有可能是你修改最初的数据选择。 ( 3 ) 分析数据。 请察看“描述型数据挖掘”以获得更详细的关于可视化、连结分析,及其他数 据分析方法。分析的目的是找到对预测输出影响最大的数据字段,和决定是否需 要定义导出字段。 如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗时和 累人的事情,这时你需要选择一个具有好的界面和功能强大的工具软件来协助你 完成这些事情。 ( 4 ) 准备数据。 南京邮电大学坝士研究生学位论丈 第三章电信经营分析系统的功能设计 这是建立模型之前的最后一步数据准备工作。可以把此步骤划分成4 个部分 a 选择变量 b 选择记录 c ,创建新变量 d 转换变量 ( 5 ) 建立模型。 对建立模型来说要记住的最重要的事是它是一个反复的过程。你需要仔细考察 不同的模型以判断哪个模型对你的商业问题最有用。你在寻找好的模型的过程中 学到的的东西会启发你修改你的数据,甚至改变最初对问题的定义。 一旦决定了预测的类型之后( 分类还是回归) ,就需要为这个预测选择模型 的类型。可能是一棵决策树、神经网络、甚至传统的数学统计。选择什么样的模 型决定了你需对数据做哪些预处理工作。如神经网络需要做数据转换,有些数据 挖掘工具可能对输入数据的格式有特定的限制,等。一旦所有的数据准备好之后, 就可以开始训练你的模型了。 为了保证得到的模型具有较好的精确度和健壮性,需要一个定义完善的训练 一验证协议。有时也称此协议为带指导的学习。他的主要思想就是先用一部分数 据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。有时还有第三 个数据集,称为验证集,因为测试集可能受模型的特性的影响,这时需要一个独 立的数据集来验证模型的准确性。 训练和测试数据挖掘模型需要把数据至少分成两个部分:一个用于模型训练, 另一个用于模型测试。如果不使用不同的训练和测试集,那么模型的准确度就很 难使人信服。用训练集把模型建立出来之后,就可以先在测试集数据上先试验一 把,此模型在测试集上的预测准确度就是一个很好的指导数字,它说明如果将来 与训练集和测试集类似的数据用此模型预测时,正确的百分比会有多大。这并不 能保证模型的正确性,他只是说相似的数据用此模型会得出相似的结果。 ( 6 1 评价和解释。 模型建立好
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 惠州家具基础知识培训课件
- 2026届河北省石家庄市一中、唐山一中等“五个一”名校联盟化学高一上期中质量跟踪监视试题含解析
- 情态动词-have-done教学课件
- 患者出入院管理制度
- 恩施消防知识培训班课件
- 入警耳语测试题及答案
- 家电公司财务部报销管理办法
- java面试题及答案类定义
- 抖音运营实战宝典
- 家电公司应急管理办法
- 涉案资金退还协议书
- 安宁疗护之症状管理
- 《神经影像解析》课件
- 电力建设水电工程智慧工地技术规范
- 2025年初级消防员试题及答案
- 2025年四川省成都市锦江区中考数学二诊试卷(含部分答案)
- 食源性疾病防治知识
- 行政岗干货知识培训课件
- 向上沟通培训课件
- 网站篡改演练方案
- 《2025年CSCO卵巢癌诊疗指南》更新要点解读
评论
0/150
提交评论