(计算机软件与理论专业论文)基于生命周期的电信产品分析.pdf_第1页
(计算机软件与理论专业论文)基于生命周期的电信产品分析.pdf_第2页
(计算机软件与理论专业论文)基于生命周期的电信产品分析.pdf_第3页
(计算机软件与理论专业论文)基于生命周期的电信产品分析.pdf_第4页
(计算机软件与理论专业论文)基于生命周期的电信产品分析.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(计算机软件与理论专业论文)基于生命周期的电信产品分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于生命周期的电信产品分析 基于生命周期的电信产品分析 摘要 技术的发展使得电信运营商可以快速的开发和部署新的业务。为了在竞争激 烈的市场中吸引更多用户使用各类新业务,电信运营商将传统的单业务营销模式 变为以电信产品为包装的多业务组合营销模式,向市场推,“。随着新产品的推出, 市场上累积了许多产品,如何对众多的产品进行经营分析,为决策提供支持,成 为运营商迫切需要解决的问题。基于数据仓库和数据挖掘技术的经营分析系统的 出现为解决这类问题提供了实现基础,本文在经营分析系统的框架内,基于产品 生命周期理论,设计并实现电信产品专题分析。 本文研究了数据仓库理论和数据挖掘的相关算法,研究了产品以及产品生命 周期理论,给出了电信产品的市场构成属性及生命周期阶段划分,并结合j f 在建 设中的某运营商统一经营信息服务系统以及产品相关的分析需求,基于生命周期 理论给出了统一经营信息服务系统中产品专题分析的设计和实现。 产品专题分析为产品的构思提供依据,对电信产品作综合评估,根据评估值 划分电信产品的生命周期阶段,根据不同的生命周期阶段给出针对性的产品分 析,并及时准确的将分析结果应用于决策支持。 关键词:数据仓库数据挖掘电信产品产品生命周期经营分析 北京邮电大学硕士学位论文 幕于生命周期的屯信产品分析 t e l e c o mp r o d u c t sa n a l y s i sb a s e d0 n p r o d u c tl i f ec y c l e a b s t r a c t t e l e c o m o p e r a t o r sc a nd e v e l o pa n dd e p l o yt h en e w s e r v i c e sq u i c k l y d u e t ot h e d e v e l o p m e n t o ft h et e l e c o m m u n i c a t i o na n d c o m p u t e r t e c h n o l o g y i no r d e r t oa t t r a c tm o r ec u s t o m e r st oo r d e ra n du s et h e s en e w s e r v i c e s ,t e l e c o mo p e r a t o r sh a v ec h a n g e dt r a d i t i o n a lm a r k e t i n gm e t h o d s f r o ms i n g l es e r v i c et om u l t i s e r v i c ec o m b i n a t i o np a c k e dw i t ht e l e c o m p r o d u c t s b e c a u s et h en e wp r o d u c t sa r ek e e p i n g t ob ew o r k e d o u t ,al a r g e n u m b e ro f p r o d u c t sh a v eb e e na c c u m u l a t e di nt h em a r k e t h o wt om a k e b u s i n e s s a n a l y s i s o fv a r i o u s p r o d u c t s a n d s u p p o r t t h eb u s i n e s s d e c i s i o n - m a k i n g ,i so n eo ft h em o s te m e r g e n ti s s u e st h a tt h et e l e c o m o p e r a t o r sa r ef a c i n g t h eu n i f i e db u s i n e s si n f o r m a t i o ns y s t e m ( u b i s ) , w h i c hi sb a s e do nt h et e c h n o l o g i e so fd a t aw a r e h o u s ea n dd a t am i n i n g , c a n p r o v i d et h ew a y t or e s o l v et h e s ep r o b l e m s i nt h i sp a p e r ,t h ea u t h o r d e s i g n s a n di m p l e m e n t st h et e l e c o m p r o d u c t sa n a l y s i s b a s e do nt h e p r o d u c tl i f ec y c l et h e o r yi nu n i f i e db u s i n e s si n f o r m a t i o ns y s t e m t h ea u t h o rr e s e a r c h e st h et h e o r i e si nd a t aw a r e h o u s e ,d a t am i n i n g a l g o r i t h m s ,a n dt h et h e o r i e so fp r o d u c ta n dp r o d u c tl i f ec y c l e ( p l c ) i n t h i sp a p e r , p o i n t so u tt h ep r o p e r t i e so ft e l e c o mp r o d u c t s m a r k e t i n ga n d p r o v i d e st h ed i v i s i o n so f d i f f e r e n tp l c p e r i o d s c o n s i d e r i n gt h eu b i s o f at e l e c o mo p e r a t o ra n di t sr e l e v a n ta n a l y s i s r e q u i r e m e n t s o ft e l e c o m p r o d u c t s ,t h i sp a p e rp r o v i d e s t h e d e s i g n a n d i m p l e m e n t a t i o n o ft h e s p e c i a la n a l y s i s o ft h et e l e c o mp r o d u c t si nu b i so nt h eb a s i so ft h e t h e o r i e so f t h ep l c t e l e c o m p r o d u c t ss p e c i a la n a l y s i sp r o v i d e sr e f e r e n c e sf o r t h ed e s i g n o f p r o d u c t s ,e v a l u a t e st h et e l e c o mp r o d u c t si ng e n e r a l a c c o r d i n gt ot h e c h a n g i n g c o n d i t i o n so ft h ee v a l u a t i o nv a l u e s ,p r o d u c ta n a l y s i sd i v i d e st h e l i f e c y c l ep h a s e so ft e l e c o mp r o d u c t s ,g i v e ss o m er e l e v a n ts u b - s u b j e c t a n a l y s i sa c c o r d i n g t ot h ed i f f e r e n tl i f e c y c l ep h a s e s ,a n da p p l i e s t h e 北京邮电大学硕士学位论文 基于生命周期的电信产品分析 a n a l y s i s r e s u l t st ot h ed e c i s i o ns u p p o r t e x a c t l ya n dq u i c k l y k e yw o r d :d a t a w a r e h o u s e t e l e c o m p r o d u c t b u s i n e s s a n a l y s i s d a t a m i n i n g p r o d u c t l i f ec y c l e 北京邮电大学硕士学位论文 基于生命周期的电信产品分析 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:日期 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围,适用本授权书。e 本人签名: 导师签名: 是出走 同期: 日期: 北京邮电大学硕士学位论文 沙心- ,r 基于生命周期的屯信产品分析 1 1 论文背景 第1 章绪论 随着我国加入w t o ,电信行业进一步开放,国际化的市场环境要求国内的 电信运营商在经营管理上能够迅速赶上国外的先进水平,以迎接电信运营h k 的国 际化竞争;同时随着国内电信行业改革和重组的不断深化,国内电信业务的市场 环境将渐趋合理,竞争将日益加剧。国内、国际电信业的竞争态势,要求国内的 电信运营企业在经营理念、管理模式上能有一个较高层次的飞跃,以求在电信运 营业日益残酷的国际化竞争中立于不败之地;同时,也要求国内电信运营企业传 统的以产品为中心,以营业窗口为基础的运营模式,逐步向以客户为中一t 5 、以数 据为中心、以信息为基础的模式转变。电信运营商需要及时准确地了解自己的客 户需要怎样的服务,自己的业务开展得怎样,以后需要推广怎样的业务等等。而 之前的b o s s 系统仅仅是建立在运营支撑的基础上,它已经不能满足运营商的这 些分析需求。 另一方面,通信和计算机技术的飞速发展,使得国内的电信运营商已经可以 快速的丌发并且部署新的业务。为了在竞争激烈的市场中吸引更多的客户使用推 出的各类业务,最大化运营企业的利益,电信运营商们对传统的营销模式进行了 根本性的变革,以前单业务的营销模式变为以电信产品为包装的多业务组合营销 模式,并且在实践中取得不错的效果。然而随着新产品的不断推出,如何跟踪众 多产品的生命周期并分析其发展趋势,如何对众多产品在各个时期作综合评估, 并及时准确的将信息应用于决策支持,使得产品可以得到不断的调整与推新,为 不同客户提供更好的服务产品又成了电信运营商需要迫切解决的问题。 而运营商f 在建设的经营分析系统为解决上述问题提供了实现基础。经营分 析系统建立在数据仓库和数据挖掘理论之上,根据日趋成熟的数据仓库以及数据 挖掘理论,整合自己的各个业务子系统的业务数据,建立企业级的数据仓库,在 数据仓库中形成基础的分析数据的存储。并在此基础上,通过固定报表、o l a p 、 数据挖掘等多种方式为决策层提供决策支持。经营分析系统从整个电信运营企业 的层次上给了解决上述此类问题的一个实现平台。而产品分析则是经营分析系统 中非常重要的一部分,对电信产品的分析是经营分析系统中最重要的内容之一。 本文借鉴产品生命周期的相关思想,在经营分析系统框架内,定义了电信产 品的概念,给出电信产品各个生命周期的特征,总结出电信产品的构成属性;并 北京邮电大学硕上学位论立 第1 页 皋于生命周期的电信产品分析 在此基础上,提出产品专题分析解决方案,使得在经营分析系统中基于生命周期 实现对电信产品的分析。 1 2 论文目标 本论文在产品及其生命周期以及数据仓库和数据挖掘的理论基础之上,在经 营分析系统的框架之内,提出电信服务产品的概念以及构成属性,给出电信服务 产品生命周期阶段的划分,并在此基础之上,实现电信服务产品的分析。 1 3 论文内容 基于上述研究目标,本论文主要总结了下面几方面的工作: 产品及其生命周期理论的研究 数据仓库和数据挖掘理论研究以及在电信领域的应用实践 总结产品及其生命周期理论在电信行业内的应用,并在经营分析系统 的框架内实现基于生命周期的电信产品分析 1 4 论文组织结构 本论文按以下章节组织: 第一章是绪论部分,简要介绍了本论文有关的背景和工作内容及成果等。 第二章介绍数据仓库和数据挖掘技术,主要介绍数据仓库的体系结构,数据 挖掘与数据仓库的关系,数据挖掘的基本技术、方法以及数据挖掘过程。 第三章介绍产品、电信产品以及产品生命周期,主要介绍产品的定义、构成 产品的属性特征、产品生命周期理论以及划分。根据电信领域的特殊性,提出电 信产品的概念以及构成属性,并给出电信产品生命周期的概念以及阶段划分。 第四章探讨了基于生命周期的电信产品分析的设计,给出了基于生命周期的 电信产品分析的功能架构,并着重给出产品在生命周期各个阶段的分析目的以及 分析内容。 第五章给出一个电信经营分析系统中基于生命周期的产品分析的实现。 第六章总结本论文的工作成果与不足,并对进一步的研究工作提出一些建 议。 文章的最后是致谢和参考文献列表。 第2 负北京邮电大学硕士学位论文 基于生命周期韵电信产品分析 2 1 数据仓库 第2 章数据仓库和数据挖掘 2 1 1 数据仓库定义 数据仓库概念创始人w h i n m o n 在其著作( b u i l d i n g t h ed a t aw a r e h o u s e ) ) 一 书中给予如下描述:数据仓库( d a t aw a r e h o u s e ) 是一个面向主题的( s u b j e c t o r i e n t e d ) 、集成的( i n t e g r a t e ) 、相对稳定的( n o n v o l a t i l e ) 、反映历史变化( t i m e v a r i a n t ) 的数据集合,用于支持管理决策制定过程。对于数据仓库的概念我们可 以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理, 它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效 集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的 数据一+ 般不再修改。 2 1 2 数据仓库特点 根据数据仓库定义的含义,数据仓库拥有以下四个特点,它们也是数据仓库 与传统操作型信息系统的主要区别: l 、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统 之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个 抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通 常与多个操作型信息系统相关。例如电信业务支撑系统中的操作型信息系统有营 业系统、帐务系统、结算系统、客服等系统,而数据仓库中包含的主题会是业务 收入、业务发展、业务使用等内容,业务收入主题涉及营业系统中的客户信息、 帐务系统和结算系统中业务收入信息。 2 、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数 据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的 数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源 数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信 息。 3 、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时 北京邮电大学硕士学位论文第3 页 基于生命周期的电信产品分析 发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是 数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是 数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的 加载、刷新。 4 、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而 数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点( 如开始 应用数据仓库的时点) 到目前的各个阶段的信息,通过这些信息,可以对企业的 发展历程和未来趋势做出定量分析和预测。 2 ,1 3 数据仓库体系结构 企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基 础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供 他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息 加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任 务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。 整个数据仓库系统是一个包含四个层次的体系结构,具体由下图表示。 固 固 啪 目 麓蟹蠢 粕黻 冒扣王其 橇蜮 翟姆湛 譬澄煳鞘 冒卜 图2 1 :数据仓库体系结构 数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内 部信息和外部信息。内部信息包括存放于r d b m s 中的各种业务处理数据和各类 文档数据。外部信息包括各类市场信息、竞争对手信息和各种手工收集的信息等 等; 数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数 据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也 决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的 第4 炙北京邮电大学硕士学位论文 基十生命周期的电信产品分析 核心,则需要从数据仓库的技术特点具体需求着手分析。针对现有各、业务系统的 数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的 覆盖范围可以分为企业级数据仓库和部门级数据仓库( 通常称为数据集市) 。 o l a p 服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以 便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:r o l a p 、 m o l a p 和h o l a p 。r o l a p 基本数据和聚合数据均存放在r d b m s 之中; m o l a p 基本数据和聚合数据均存放于多维数据库中;h o l a p 基本数据存放于 r d b m s 之中,聚合数据存放于多维数据库中。 前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工 具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针 对o l a p 服务器,报表工具、数据挖掘工具主要针对数据仓库。 2 1 4 数据仓库和数据集市 在企业数据仓库体系结构中,数据集市是面向部门决策支持的数据仓库,所 谓面向部门是相对于数据仓库的面向整个企业而言,也就是说,它存储的数据都 是面向部门个性化的需求。实际上,数据集市是一种更小、更集中的数据仓库, 它为公司提供了一条部门级商业数据分析的廉价途径。数据集市和数据仓库的关 系可以用下图表示: 图2 - 2 数据集市和数据仓库的关系 北京邮电大学硕士学位论文 第5 负 基于生命周期的电信产品分析 由上图可以看出,数据仓库中存储的是最细粒度的数据,而各个数据集市则 按照自己的需要选取不同的数据组合并进行不同程度的汇总。另外,各部门还可 以从仓业外部获取数据,只是这些数据必须在中央元数据库和本地元数据库中保 存相应的元数据,以保持整个企业数据定义的一致性和完备性。数据集市一般不 直接从事务系统中取数据,因为这样做不仅使各个数据集市和数据仓库的数据不 能达到完全意义上的整合,还造成大量的冗余,并且整个系统需要编写、维护和 执行大量的接口。由于所有数据集市的数据都来源于企业数据仓库,所以它们对 数据的理解和定义自然是一致的。 数据集市主要具有以下一些特点: 面向部门应用:数据集市一般由各个部门按照自己特定的需求从数据仓 库中抽取相关的数据搭建而成,这个部门只需从自己的角度出发,而不 必考虑整个企业的需要。比如,销售部门的数据集市只包含销售方面的 数据,而不会导入诸如人力资源、财务方面的数据; 规模小,投资少:数据集市的数据量相对于数据仓库要少的多,各个部 门可以按照自己的需求选择合适的软硬件平台,以节省投资; 使用方便且成本低:各部门可以在任何时候执行自己需要的d s s 处理, 而无需考虑对资源的占用和对其它部门的影响。 数据集市的建设和数据仓库密切相关,一般有两种途径:自顶向下和自底向 上。自顶向下的建设方法是先在原有分散的操作型环境基础上建立一个企业全局 数据仓库,再构建各部门自己的数据集市。这种方法有利于控制和保持整个企业 数据的一致性,但它实施周期长,见效慢,费用昂贵,一般企业都不愿意承担。 另外一种自底向上的方法是从最关心的部分开始,先以最少的投资,完成企业当 前的需求,获得最快的回报,然后再不断扩充不断完善,最终建立起企业全局 的数据仓库。由于这种方法投资少,见效快,所以为大多数企业采用。 产品专题分析中的数据源就是基于数据仓库d w 和o d s 库之上的一个数据 集市。 2 2 数据挖掘 2 2 1 数据挖掘定义 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取 隐含其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。该定义 第6 页北京邮电大学硕十学位论立 基于生命周期的电信产品分析 主要有三方面的内涵,一是数据的定义,数据挖掘是从应用中产生的学科,因此 对数据的要求必须满足实际的需要。从数据源的角度来看,可进行挖掘的数据町 存在于文件、数据库、数据仓库等多种形式的存储数据中。其二,对其挖掘结果, 即知识也确定了一个范围,即挖掘结果是人们事先不知道的、但又是潜在有用的, 可以这样理解,从定性的角度看,人们事先就不知道,或者,从定性的角度看有 基本的认识,但从定量的角度,人们是不能确定的。最后,数据挖掘是一一个过程, 不是某个算法模型、某个软件或者是某种知识。数据挖掘需要在一个体系结构下, 不停地根据商业需求,收集数据,建立模型,从而挖掘出有价值的知识。 数据挖掘是一门面向应用的很广义的交叉学科,其涉及的领域包括数据库、 人工智能、数理统计、可视化和并行计算等。很多科研人员从不同的角度对数据 挖掘进行研究,但可能会有所侧重。 数据挖掘的外延可定义为广义的数据挖掘和狭义的数据挖掘,广义的数据挖 掘用计算机作为工具,实现在大数据量下的数据分析。狭义的数据挖掘是用自动 化或启发式的方法,从数据中挖掘知识。一般我们对数据挖掘的定义都集中在狭 义的范畴。 2 2 2 数据挖掘方法 数据挖掘方法通常分为直接型数据挖掘和间接型数据挖掘两种。直接数据挖 掘,目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定 的变量( 可以理解成数据库中表的属性,即列) 进行描述,间接数据挖掘,目标 中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种 关系。 数据挖掘的能完成的工作有分类、估值、预言、关联分析、聚集、描述和可 视化。其中分类、估值和预言属于直接数据挖掘;相关性分组或关联规则、聚集、 描述和可视化属于间接数据挖掘。 具体描述如下: 分类( c l a s s i f i c a t i o n ) :首先从数据中选出已经分好类的训练集,在该 训练集上运用数据挖掘分类的技术,建立分类模型,对没有分类的数据 进行分类。 估值( e s t i m a t i o n ) :估值与分类类似,不同之处在于,分类描述的是离 散型变量的输出,而估值处理连续值的输出;分类的类别是确定数目的, 估值的量是不确定的。 北京邮电大学硕士学位论文第7 页 基于生命周期的屯信产品分析 预测( p r e d i c t i o n ) :通常,预测是通过分类或估值起作用的,也就是说, 通过分类或估值得出模型,用于对未知变量的预测。从这种意义上说, 预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的 预测,这种预测是需要时间来验证的,即必须经过一定时间后,刁知道 预言准确性是多少。 相关性分组或关联规则( a f f i n i t yg r o u p i n go ra s s o c i a t i o nr u l e s ) :决定哪 些事情将一起发生。 聚集( c l u s t e r i n g ) :聚集是对汜录分组,把相似的记录放在。个聚集 里。聚集和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。 描述和可视化( d e s c r i p t i o na n dv i s u a l i z a t i o n ) :是对数据挖掘结果的表示 方式。 不同的数据挖掘方法,有着不同的算法,比如聚类算法和分类算法;即使相 同的数据挖掘方法,也可以有不同的算法来实现,比如说在分类中,可以采用的 算法一般有:c 5 0 算法、逻辑回归算法、神经网络算法等。 在产品分析中,作者主要利用了数据挖掘中的关联分析和分类预测方法,卜 面详细介绍一下这两种方法及其算法。 2 2 21 关联分析方法 关联规则分析主要用于发现不同事件之间的关联性,即一事物发生时,另一 事物也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事 件。其主要依据是:事件发生的概率和条件概率应该符合一定的统计意义。空间 关联规则的形式是x 一 y 【s ,c 】,其中x 、y 是空间或非空间谓词的集合, s 表示规则的支持度,c 表示规则的置信度。空间谓词的形式有3 种:表示拓 扑结构的谓词、表示空间方向的谓词和表示距离的谓词。各种各样的空间谓词可 以构成空间关联规则。如,距离信息( 如c l o s et 0 ( 临近) 、f a ra w a y o 短离) ) 、拓 扑关系( i n t e r s e c t ( 交) 、o v e r l a p ( 重叠) 、d i s j o i n ( 分离) ) 和空间方位( 如r i g h t右_of( 边1 、w e s to f ( 西边) ) 。实际上大多数算法都是利用空间数据的关联特性改进其分 类算法,使得它适合于挖掘空间数据中的相关性,从而可以根据一个空间实体而 确定另一个空间实体的地理位置,有利于进行空间位置查询和重建空问实体等。 大致算法可描述如下:( 1 ) 根据查询要求查找相关的空间数据;( 2 ) 利用临近等原 则描述空间属性和特定属性;( 3 ) 根据最小支持度原则过滤不重要的数据;( 4 ) 运 用其它手段对数据进一步提纯( o no v e r l a y ) ;( 5 ) 生成关联规则。 关联规则通常可分为两种:布尔型的关联规则和多值关联规则。多值关联规 第8 页北京邮电大学砸十学位论立 基于生命周期的电信产品分析 则比较复杂,一种自然的想法是将它转换为布尔型关联规则,出于空间关联规则 的挖掘需要在大量的空间对象中计算多种空间关系,因此其代价是很高的。一种 逐步求精的挖掘优化方法可用于空间关联的分析,该方法首先用一种快速的算法 粗略地对一个较大的数据集进行一次挖掘,然后在裁减过的数据集上用代价较高 的算法进一步改进挖掘的质量。因为其代价非常高,所以空间的关联方法需要进 一步的优化。 在产品子业务关联分析中,利用关联规则找出适合在一起捆绑销售的子业务 的组合,在此基础上形成新的电信产品供用户订购使用。 2 ,2 ,2 ,2 分类方法 分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的 目的是学会一个分类函数或分类模型( 也常常称作分类器) ,该模型能把数据库中 的数据项映射到给定类别中的某一个。分类和回归方法都可用于预测,两者的目 的都是从历史数据记录中自动推导出对给定数据的推广描述,从而能对未来数据 进行预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出则 是连续的数值。二者常表现为一棵决策树,根据数据值从树根开始搜索,沿着数 据满足的分支往上走,走到树叶就能确定类别。下图为分类的应用模式: 口咩受气多 竣 l罔判定树分类算法f ! 笔。蛾一 蛙型 li 蝴 训练集 决策树 图2 - 3 分类算法的应用流程 要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库 记录或元组构成,每个元组是一个由特征( 又称属性) 值组成的特征向量,此外,训练 样本还有一个类别标记。一个具体样本的形式可为:( v l ,v 2 ,v n ;c ) ;其中v i 表示字段值,c 表示类别。 分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方 法包括贝叶斯法和非参数法( 近邻学习或基于事例的学习) ,对应的知识表示是判 别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表示 为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是反向传播 ( b a c k p r o p a g a t i o n ,简称b p ) 算法,它的模型表示是前向反馈神经网络模型( 由 北京邮电大学硕士学位论文第9 页 幕于生命周期的电信产品分析 代表神经元的节点和代表联接权值的边组成的一种体系结构) ,b p 算法本质上是 一种非线性判别函数。另外,最近又兴起了一种新的方法:粗糙集( r o u g hs e t ) ,其 知识表示是产生式规则。 不同的分类器有不同的特点。有三种分类器评价或比较尺度:1 1 预测准确 度;2 ) 计算复杂度;3 ) 模型描述的简洁度。预测准确度是用得最多的一种比较 尺度,特别是对于预测型分类任务,目前公认的方法是1 0 番分层交叉验证法。 计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是 海量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。对于描 述型的分类任务,模型描述越简洁越受欢迎。例如,采用规则归纳法表示的分类 器构造法就很有用,而神经网络方法产生的结果就难以理解。 另外要注意的是,分类的效果一般和数据的特点有关。有的数据噪声大,有 的有缺值,有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而 有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数 据。 在本文的实现部分,作者在套餐劝转分析中利用了分类的各种算法,来给处 于衰退期的套餐用户选择相应的目标套餐,实现衰退期产品的归并和撤销。 2 2 。3 数据挖掘应用 数据挖掘在各个行业都有着非常有前景的应用,比如生物医学、电信、银行、 保险等等,结合实际,这里介绍一下数据挖掘在电信行业的应用。 电信运营商拥有许多成熟的数据库应用系统,如网管系统、营业系统、计费 系统、账务系统、结算和客服系统等,这些系统都产生了大量的业务处理数据。 如果针对客户关系管理相关决策分析的需求,对这些数据进行重组整合,就能充 分利用这些宝贵的数据,体现信息的真正价值。数据挖掘技术在电信行业客户关 系管理的主要应用领域如下: 客户消费模式分析 客户消费模式分析( 如固话话费行为分析) 是对客户历年来长话、市话、信 息台的大量详单、数据以及客户档案资料等相关数据进行关联分析,结合客户的 分类,可以从消费能力、消费习惯、消费周期等诸方面对客户的话费行为进行分 析和预测,从而为固话运营商的相关经营决策提供依据。 客户市场推广分析 客户市场推广分析( 如优惠策略预测仿真) 是利用数据挖掘技术实现优惠策 第1 0 页北京邮电大学碗士学位论文 基于生命周期的电信产品分析 略的仿真,根据数据挖掘模型进行模拟计费和模拟出账,其仿真结果可以揭示优 惠策略中存在的问题,并进行相应的调整优化,以达到优惠促销活动的收益最大 化。 客户欠费分析和动态防欺诈 通过数据挖掘,总结各种骗费、欠费行为的内在规律,并建立一套欺诈和欠 费行为的规则库。当客户的话费行为与该库中规则吻合时,系统可以提示运营商 相关部门采取措施,从而降低运营商的损失风险。 客户流失分析 根据已有的客户流失数据,建立客户属性、服务属性、客户消费情况等数据 与客户流失概率相关联的分类数学模型,找出这些数据之间的关系,并给出明确 的数学公式。然后根据此模型来监控客户流失的可能性,如果客户流失的可能性 过高,则通过促销等手段来提高客户忠诚度,防止客户流失的发生。这就彻底改 变了以往电信运营商在成功获得客户以后无法监控客户流失、无法有效实现客户 关怀的状况。 2 2 4 数据挖掘过程 数据挖掘需要从大量数据中抽取有价值的信息或知识以提供决策依据,成功 的应用数据挖掘技术以达到最终目标需要分析人员对业务流程、数据集、以及分 析方法都非常了解。同时数据挖掘是一个反复进行的过程,应用工程化的方法对 最终实现分析任务至关重要。本节介绍一个最常见的数据挖掘过程模型: c r i s p d m 。 2 2 41c r i s p d m 模型 c r i s p d m 模型是由数家软件供应商和用户组织成立了行业协会制订的数 据挖掘过程模型。它强调数据挖掘在商业中的应用,解决商业中存在的问题,而 不是把数据挖掘局限在研究领域。 c r i s p d m 模型采用分层方法将数据挖掘划分为四个层次( 1 e v e l ) 。由一般到 具体分别为:阶段( p h r a s e ) ,通用任务( g e n e r i ct a s k ) ,专有任务( s p e c i a l i z e dt a s k ) , 处理实例( p r o c e s si n s t a n c e ) 。如下图: 北京邮电大学硕士学位论文 第1 l 页 基十生命周期的电信产品分析 幽2 - 4c r i s p d m 层次l 奎l 在最高层数据挖掘过程被组织成一系列的阶段,每个阶段包含若干第二级别 的通用任务。第一层之所以称之为通用的是因其涵盖了所有可能的数据挖掘情 况。通用任务通常是完整和稳定的。第三层专有任务定义了通用任务对应具体的 挖掘任务时是如何被由具体动作组成的。比如第二层定义了“清洁任务”则第三 层说明了对于不同类型的数据如数值型数据和分类型数据“清洁任务”是分别如 何进行的。第四层处理实例对应到实际的挖掘行动中行为、结果是如何组成的。 其中上面两层独立于具体的数据挖掘方法,是一般数据挖掘项目均需要实施的步 骤,这两层任务结合具体挖掘项目上下文,映射到下面两层的具体任务和过程。 c r i s p d m 认为上下文包括以下四个方面: 应用领域:如商业、电信行业等; 数据挖掘处理的问题类型:如分类型、预测型问题等; 技术方面:指数据挖掘特定问题所带来的技术方面的问题; 工具和技术:确定了具体数据挖掘项目的工具和技术。 2 2 4 2c r i s p d m 过程参考模型 c r i s p 。d m 的过程模型将一个数据挖掘项目的生命期分为6 个阶段: b u s i n e s s u n d e r s t a n d i n g ,d a t au n d e r s t a n d i n g ,d a t ap r e p a r a t i o n ,m o d e l i n g , e v a l u a t i o n ,d e p l o y m e n t 下图展示了这六个阶段的顺序关系。因为数据挖掘更类似于一个发现的过程 所以往往需要不同阶段之间的往复。 第1 2 页北京邮电大学硕士学位论文 箍于生命周期的电信产品分析 图2 - 5c r i s p d m 过程模型 b u s i n e s su n d e r s t a n d i n g 商业理解 本阶段专注于商业角度理解项目目标和需求,并转化为一一种数据挖掘问题定 义,同时设计出一个初始计划。 d a t au n d e r s t a n d i n g 数据理解 在数据理解阶段,先收集初步的数据,然后了解熟悉数据,以识别数据质量、 找到对数据的基本观察或假设隐含的信息来检测出感兴趣的数据子集。 d a t ap r e p a r a t i o n 数据准备 数据准备阶段包括了从数据构造到最终数据集合( 将要输入建模工具的数据) 的所有活动。数据准备任务可能要执行很多次,并没有任何规定的顺序。任务有 表、记录属性的选择以及为适合建模工具的要求对数据进行的转换和净化。 m o d e l i n g 建模 建模阶段可以选择使用各种建模技术,各类模型参数也可以调整优化。对同 一个数据挖掘问题可以有若干可用技术,某些技术对数据的形式有一定的要求, 因此常常要退回到数据准备阶段。 e v a l u a t i o n 评估 在最终扩展模型前要彻底的评价模型,对所建模型再次考察其执行步骤并确 信其正确的达到了商业目标。这里,一个关键的目的是确定是否有某些重要的商 业问题还没有充分的考虑。 d e p l o y m e n t 发布 北京邮电大学硕上学位论文 第1 3 负 基于生命周期的电信产品分析 所获得的挖掘结果和知识应该采用用户可以使用的方式来组织和表示。可以 简单至0 只有一份报告也可以实现一个可以重复的挖掘过程或系统。很多情况下, 这将由客户而非分析员来实施。 第1 4 页 北京邮电大学硕士学位论文 基于生命周期的电信产品分析 3 1 电信产品 3 1 1 产品定义 第3 章电信产品及其生命周期 产品概念最先来自于制造业,通俗的说法是产品就是指人造品。在早先的制 造业中,一般制造产商都将其生产出来的可供用户使用的物品称为产品,产品进 入市场则被称为商品;而市场营销学中,一般将产品解释为能够满足用户某种需 求的东西,并认为完整的产品是由核心产品,形式产品和附加产品构成,即整体 的产品概念;网络营销一方面继承了上述整体产品的概念,另一方面比以前任何 时候更加注重和依赖于信息对消费者行为的引导,因而将产品的定义扩大了:即 产品是提供到市场上引起注意、需要和消费的东西。所有以上的这些定义,实际 上都只是描述了产品概念在各个不同环境中的某个方面的属性。综合着来晚,所 谓产品,是指企业提供给市场,用于满足人们某种欲望和需要的任何事物,包括 实物、服务、场所、组织、思想、主意等,产品不仅包括传统的有形实物产品的 范围,还包含无形的服务。 3 1 1 1 产品的基本属性 在产品的定义中,指明了产品具有三个基本属性: 产品是用来满足需要和欲望的,即通常所说的产品应该具有使用价值; 产品是指提供给市场、用来进行交换的东西,因此,营销学中所说的产 品,往往与商品这一概念在同义上使用; 产品的有用性,不能单纯理解成是将其物质实体消耗的消费形式,还包 含其他一些形式:如能引起注意,象一则创意、制作很好的广告,表演 艺术等。也有服务,也即是我们所说的无形产品、主意等,这些都是产 品广泛的存在形式。 3 1 1 2 产品概念的外延 针对不同的行业,在不同的范围中考虑,产品概念可以延伸,这些衍生的概 念同样可以表示产品,但是是在不同的范围内。比如说下面几种产品概念的外延: 北京邮电大学硕士学位论文第1 5 页 基于生命周期的电信产品分析 产品种类,如:家电产品、通讯产品、轻工产品( 食品、服装产品等) ; 产品形式,如:家电产品中,有视听产品( 如电视机产品、dvd 产品、 收录机产品等) 、烹饪厨具产品( 如电冰箱产品、微波炉产品、消毒柜 产品等) ; 产品品牌,如:电视机产品,有厦华牌、长虹牌、康佳牌、tcl 牌、 一立牌、东芝牌、乐声牌等。 3 1 1 3 产品概念在电信行业的抽象 电信运营商的存在目的就是以满足消费者的通信需要为中心,而消费者需要 的满足必须通过电信运营商提供某种电信产品或者服务来实现,因此电信产品是 电信运营商中最决定性的因素,那么什么是电信产品昵? 通常的产品是指一种具 有特定物质形状和用途的物体,是实体的产品或者物质的产品,比如衣服、汽车 等,这种传统的产品概念仅仅强调产品的物质属性,把产品局限于有形的物品; 而电信产品作为电信运营商提供给用户的一种服务,它跟传统意义的产品还是有 很多区别,从产品的整体概念出发,电信产品可定义为由电信企业提供的能够满 足顾客某种通信需求的各种服务的总和。 电信产品的整体概念包含了下面三方面的内容: 核心产品 核心产品是指消费者购买某种产品时追求的利益,即产品的功能和效用。核 心产品是产品整体概念最基本、最主要的部分。消费者购买某种产品并不是为了 获得产品本身,而是为了获得能满足某种需要的效用或者利益。因此,电信企业 必须首先向消费者提供适销对路的核,t l , 产品,努力满足消费者对各种实用价值的 需求。 电信企业生产的目的,是为了尽可能满足顾客对电信产品和服务的需要。电 信企业就是通过提供优质、快速、高效、低耗的通信服务,来满足广大人民群众 同益增长的对通信的需求。体现电信企业基本功能的就是电信企业的核心产品, 它也是电信企业为市场所接受的关键。因此,就电信企业而言,其核心产品就是 为顾客所传递的信息实现位移变化,从而带来有益效用。 形式产品 形式产品是核心产品借以实现的形式,即向市场提供的产品实体和服务的形 象。如果产品是实体物品,则其形式产品通常表现为产品质量水平、外观特色、 式样、品牌或者包装等。产品的基本效用必须通过某些具体的形式才能实现。市 场营销者应首先着眼于顾客购买产品时所追求的利益,以求更完美的满足顾客的 第1 6 贞北京邮电大学硕士学也论文 基于生命周期的电信产品分析 需要,从这一点出发再去寻找利益已实现的形式,进行产品设计。 电信产品具有非实物形态,但在产品的品种、形式、品牌、准确性、安全性、 方便性等方面具有很大的差异。如:电话业务、数据业务、图文图像业务、移动 通信业务等分别满足不同顾客的通信需求。电话又有住

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论