【毕业学位论文】(Word原稿)数据挖掘在宁夏移动增值业务综合运营平台中的应用-软件工程_第1页
【毕业学位论文】(Word原稿)数据挖掘在宁夏移动增值业务综合运营平台中的应用-软件工程_第2页
【毕业学位论文】(Word原稿)数据挖掘在宁夏移动增值业务综合运营平台中的应用-软件工程_第3页
【毕业学位论文】(Word原稿)数据挖掘在宁夏移动增值业务综合运营平台中的应用-软件工程_第4页
【毕业学位论文】(Word原稿)数据挖掘在宁夏移动增值业务综合运营平台中的应用-软件工程_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

职业 型 硕士博士 硕士学位论文 ( 计算机技术 ) 数据挖掘在宁夏移动增值业务综合运营平台中的应用 姓 名: 学 号: 所在院系:软 件学院 职业类型:软件工程 专业领域:软件工程 指导 教师: 副 指导教师 : 二 一 三年十一 月 A in 2013 s 数据挖掘在宁夏移动 增值业务综合运营平台中的应用 同济大学 学位论文版权使用授权书 本 人完全了解同济大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名: 年 月 日 同济大学学位论文原创性声明 本人郑重声明:所呈交的 学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。 学位论文作者签名: 年 月 日同济大学硕学位论文摘要 I 摘要 3为 国移 动面临着存量客户流失、新增乏力、收入份额下降等一系列问题。同时, 移动互联网时代的到来,使数据流量呈现 爆炸式增长 , 移动增值业务成为运营商收入增长的 最 重要 的 驱动力 。 2012年开始,中国移动宁夏公司与宁夏煤矿设计院合作 在 宁夏增值业务运营平台( 1期的基础上加强相关数据挖掘应用的实现与探索, 启动增值业务运营平台( 2期项目, 以 实现 移动互联网时代的流量经营能力、增值业务运营能力 的提升。 笔者有幸作为 宁夏煤矿 设计 研究 院的项目经理参与到宁夏移动增值业务运营平台 的项目建设中来,主要负责 期的需求搜集、 模型 设计 、系统优化 工作 ,经过 为期一年的努力工作,完成了 面向移动省市县营销人员的需求搜集、增值业务运营平台的技术 实现以及面向生产经营的增值业务运营平台的应用推广,从系统应用效果上来看,达到了项目预期,有效推动了宁夏移动增值业务的快速健康发展。 本文对中国移动宁夏公司增值业务综合运营平台进行研究,基于中国移动经营分析系统所产生的海量数据,运用数据挖掘相关技术,通过需求描述、指标构建、模型设计、模型算法实现“ 离网预警模型”和“用户 流量 偏好 分析 模型 ”数据挖掘应用为核心的 2期的宁夏增值业务运营平台,并基于此模型 实现 数据业务的客户画像、精准营销、客户挽留 等深度应用,所做工作为宁夏 移动 增值业务的存量客户的 营销 、增量市场的拓展 、差 异化的服务提供有效支撑。论文介绍了研究背景、相关技术、所建立的模型及其实施和应用。 关键词 :增值业务综合运营平台 , 数据挖掘 , 离网预警 , 用户 流量偏好分析 ,精细化营销I a of of to at G of of wo to on to on of is on is to be s is in of on by s s in of of on of to is on by of 博士学位论文目录 录 第 1章 引言 . 5 夏增值业务综合运营平台背景 . 5 值业务运营面临的主要问题 . 5 第 2章 数据挖掘技术 . 7 . 7 据挖掘技术 . 9 第 3章 需求分析 . 14 . 14 . 14 . 14 求规定 . 15 . 15 . 16 . 17 . 18 行环境规定 . 19 . 19 . 21 . 21 . 21 . 22 第 4章 系统架构 . 23 辑架构 . 23 能架构 . 24 术架构 . 26 合方案 . 27 据挖掘应用架构 . 31 . 31 . 31 第 5章 项目实现 . 33 . 33 . 33 . 33 . 36 同济大学硕 /博士学位论文目录 数据探索 . 37 . 39 . 41 . 43 . 47 . 47 . 47 . 51 . 52 . 54 联算法 . 55 统实现 . 57 行与评估 . 60 第 6章 项目应用 . 61 . 61 . 61 . 62 估 . 62 . 63 户流量偏好分析模型应用 . 64 用实施 . 64 用举例 . 66 第 7章 结论与展望 . 68 论 . 68 一步工作的方向 . 68 致谢 . 错误 !未定义书签。 参考文献 . 70 个人简历、在读期间发表的学术论文与研究成果 . 错误 !未定义书签。 数据挖掘在宁夏移动增值业务综合运营平台中的应用 5 第 1 章 引言 夏增值业务综合运营平台 背景 随着移动互联网时代的到来,数据流量业务爆炸式增长,增值业务成为运营商收入增长的核心动力。 2011 年,宁夏移动增值业务收入占运营收入比重仅为20%,而 2013年,增值业务收入占运营收入比重超过 30%,年复合增长率超过 20%,支撑增值业 务融合运营和提升常态化运营管理水平是宁夏移动 支撑系统的重点工作之一。 宁夏增值业务运营平台 ( 自 2010 年建设以来,经过 形成了以 初步客户业务画 像为基础的增值业务数据能力、 以 “ 业务监控、业务稽核、业务优化、营销服务支撑 ” 为基础的日常运营能力。宁夏增值业务运营平台 ( 统 现已接入包含一级 三类业务平台、经分系统及其他外部系统的大量数据源,支撑了 统的数据分析,进行用户、 收入、业务量、 位置分析。 值业务运营面临的主要问题 宁夏增值业务运营平台 ( 1期 形成了以 初步客户业务画像为基础的增值业务数据能力 。但是,随着增值业务的飞速发展,在业务运营中也存在 四 个方面的问题: 一、无线上网流量爆炸式增长,但具体运营缺 乏抓手 流量经营是一个复杂的过程,涉及终端、资费、业务、网络、平台、渠道等多方面的工作 ,运营商如何理清条理,确立方向?流量经营工作不同于传统单一业务的推广,其营销手段、管理方式面临较大的改变,如何将流量经营工作切实落地?随着移动互联网的发展,大量同质、可替代产品和服务出现,用户可选范围不断扩大,如何增强客户粘性?因此,流量经营是一项系统性、多关联的长期复杂过程,体系化的经营机制是完成流量经营目标、提升流量经营效率的必经之路。 二、 运营商传统业务的冲击日益显现 近年来 微信注册客户已达 3亿,最高同时在线 4000万, 日均文本信息 11亿条 , 图片 1500万条 , 语音 频 20万条。内容类产品全面覆盖新闻、音乐、阅读、视频、游戏等各个领域。运营商数据挖掘在宁夏移动增值业务综合运营平台中的应用 6 传统话音、短信业务受到冲击,荷兰 影响利润降 11%, 受闭 3国移动客户使用 信量、通话时长、 注: 指在互联网上面运营的服务, 供商不需要建立物理网络,而是依托运营商提供的互联网进行运营。 信、 务。 三、中国移动面临高流量客户的流失风险 在 3G 时代,相比与竞争对手,移动的资费处于较高水平;在终端上,联通拥有时尚的高流量终端 信引入 于年轻时尚用户吸引力巨大。同时,无论是理论速率还是实际上网速率,中国移动均落后竞争对手,将在一定程度上制约数据业务的发展 。 图 家运营商手机上网速率比较 四、 移动互联网时代推动 运营商 经营 方式 转变 移动互联网带来用户需求和行为变化,对语音 和短彩 信 替代加剧,流量和数据业务成为经营重点,同时驱动营销方式转型。首先 , 用户通信需求的比重逐渐降低,用户需求趋于多样化,用户时间份额的主体从通信转移到移动互联网,互联网属性成为用户属性的核心组成;其次 , 用户使用行为趋于碎片化、瞬态化、情感化,用户使用移动互联网业务的驱动因素从功能驱动转变为时间驱动,推动营销从大众营销向分众营销和个人营销转变;再次,用户沟通方式多样化,传统通信方式被替代,移动互联网沟通方式逐渐替代语音和短彩,运营商的通道价值从话音转移到流量。 数据挖掘在宁夏移动增值业务综合运营平台中的应用 7 第 2 章 数据挖掘技术 据挖掘背景 一 、数据挖掘诞生的背景 随着信息技术的迅速发展以及数据库技术的广泛应用,从而积累了大量的数据。这些庞大的数据背后隐藏着很多重要的信息,但是大量的数据往往使人无法辨别隐藏在其中的那些重要信息,而传统的查询、报表等工具无法满足挖掘这些重要信息的需求。人们需要有新的一中数据分析技术能够对其进行更高层次的分析和抽取,得到这些有价值的潜在知识。数据挖掘技术由此应用而生,弥补了“数据爆炸但是技术手段贫乏”的现象。 二、支持数据挖掘技术的基础 数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在 计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对过去的数据进行查询和遍历,并且能够找出数据之间的潜在 关系 ,从而促进信息的传递。 凭借着三种已经发展成熟的基础技术支持, 现在数据挖掘技术在商业应用中已经可以马上投入使用 ,这三种基础技术是 : 商业数据库现在正在以一个空前的速度增长,并且数据仓库正在广泛地应用于各种行业; 已成熟的并行多 数据挖掘算法经过了这 10多年的发展也已经成为一种成熟,稳定,且易于理解和操作的技术。 三、 数据挖掘的发展 在商业数据进化到商业信息的 过程中, 每一次的进步都是 建立在上一步的基础上的。见下图 。 由此图 可见 ,第四步 的 进化 过程 是革命性的,因为从用户的角度来看,这一阶段的数据库技术已经可以 发现很多商业上隐藏的信息,可以 快速地回答商业上的很多问题了。 数据挖掘在宁夏移动增值业务综合运营平台中的应用 8 表 数据挖掘的进化历程 进化阶段 商业问题 支持技术 产品厂家 产品特点 数据搜集 (60 年代 ) “过去五年中我的总收入是多少?” 计算机、磁 带和磁盘 供历史性的、静态的数据信息 数据访问 (80 年代 ) “在新英格兰的分部去年三月的销售额是多少?” 关系数据库( 结 构 化 查 询 语 言( 记录级提供历史性的、动态数据信息 数据仓库; 决策支持 (90 年代 ) “在新英格兰的分部去年三月的销售额是多少?波士顿据此可得出什么结论?” 联 机 分 析 处 理( 多 维数据库、数据仓库 各种层次上提供回溯的、动态的数据信息 数据挖掘 (正在流行) “下个月波士顿的销售会怎么样? 高级算法、多处理器计算机、海量数据库 他初创公司 提供预测性的信息 数据挖掘的核心模块技术 经历 了数十年的 高速 发展,其中包括数理统计、人工智能、机器学习。 如今 ,这些成熟的技术,加上高性能的关系数据库引擎以及广泛的数据集成,让数据挖掘技术在当前的数据仓库环境中 有了 用武之地 。 数据挖掘 的发展过程是逐步演变的 ,在电子数据处理的初级阶段 ,人们就试图通过某些方法 和手段 来实现 快速 自动决策支持 ,当时机器学习成为人们关心的焦点 , 机器学习的过程就是将一些已知的并已被成功解决的问题作为范例输入计算机 ,机器通过学习这些范例总结并生成相应的规则 ,这些规则具有通用性 ,使用它们可以解决类似的这 一类的问题 随着神经网络技术的形成和发展 ,人们的注意力转向知识工程 ,知识工程不同于机器学习那样给计算机输入范例,让它生成出规则,而是直接给计算机输入已被代码化的规则,而计算机是通过使用这些规则来 解决某些问题。专家系统就是这种方法所得到的成果,但它有投资大、效果不甚理想等不足。 80年代人们 又在新的神经网络理论的指导下,重新回到机器学习的方法上,并将其成果应用于处理大型商业数据库。随着在 80年代末一个新的术语,它就是数据库中的知识发现,简称 据挖掘在宁夏移动增值业务综合运营平台中的应用 9 它泛指所有从源数据中发掘模式或联系的方法,人们接受了这个术语,并用 括最开始的制定业务目标到最终的结果分析,而用数据挖掘( 描述使用挖 掘算法进行数据挖掘的子过程。但最近人们却逐渐开始使用数据挖掘中有许多工作可以由统计方法来完成,并认为最好的策略是将统计方法与数据挖掘有机的结合起来。 数据仓库技术的发展与数据挖掘有着密切的关系。数据仓库的发展是促进数据挖掘越来越热的原因之一。但是,数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据源中挖掘信息。 据挖掘技术 一、 数据挖掘 定义及含义 数据挖掘( 就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知 道的、但又是潜在有用的信息和知识的过程。 知识发现 (被认为是从数据中发现有用知识的整个过程。数据挖掘被认为是 程中的一个特定步骤 , 它是用专门算法从数据中抽取模式。 程定义如下: 从数据集中识别出有效的、新颖的、潜在有用的 , 以及最终可理解的模式的高级处理过程。从广义上理解知识,数据、信息是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。原始数据 可以是结构化的,如数据库中的数据 ; 也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构 型数据。 人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。数据挖掘在宁夏移动增值业务综合运营平台中的应用 10 图 据挖掘 的比较 从商业角度来看, 数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理 ,从中提取辅助商业决策的关键性数据 ;简而言之 , 数据挖掘其实是一类深层次的数据分析方法。数据分析本身已有多年的历史 , 只不过在过去数据收集和分析的目的是用于科学研究 ; 由于当时计算能力的限制 , 对大数据量进行分析的复杂数据分析方法受到很大限制。 现在 , 由于各行业业务自动化的实现 , 商 业领域产生了大量的业务数据 , 这些数据不再是为了分析的目的而收集的 , 而是由于纯机会的 (商业运作而产生。分析这些数据也不再是单纯为了研究的需要 , 更主要是为商业决策提供真正有价值的信息 , 进而获得利润。但所有企业面临的一个共同问题是:企业数据量非常大 , 而其中真正有价值的信息却很少; 因 此从大量的数据中经过深层分析 , 获得有利于商业运作、提高竞争力的信息 , 就像从矿石中淘金一样 , 数据挖掘也因此而得名。因此 , 数据挖掘可以描述为:按企业既定业务目标 , 对大量的企业数据进行探索和 分析 , 揭示隐藏的、未知的或验证已知的规律性 , 并进一步将其模型化的先进有效的方法。 二 、数据挖掘的过程 数据挖掘视为知识发现过程的一个步骤,该过程从大型数据库中挖掘先前未知的 ,有效的 ,可实用的信息 ,并使用这些信息做出决策或丰富知识 . 数据挖掘环境可示意如下图 : 数据挖掘在宁夏移动增值业务综合运营平台中的应用 11 图 据挖掘 环境示意图 数据挖掘的基本过程和主要步骤可示意如下图: 图 据挖掘 基本过程和主要步骤 清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要 探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。 数据选取 (确定发现任务的操作对象 , 即目标数据 ( 是根据用户的需要从原始数据库中抽取的一组数据。 数据预处理 (: 一般包括:消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换等。 数据挖掘在宁夏移动增值业务综合运营平台中的应用 12 如把连续值型数据转换为离散型数据 , 以便于符号归纳;或是把离散型数据转换为连续值型数据 , 以便于神经网 络计算。 数据变换 (削减数据维数或降维即从初始特征中找出真正有用的特征以减少数据挖掘时要考虑的特征或变量个数。将数据转换成一个分析模型 建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。 首先要确定挖掘的任务或目的 , 如分类、聚类或关联规则等。确定任务后 , 就要决定使用的挖掘算法 ;选择实现算法有两个考虑 因素:一是不同的数据有不同的特点;二是用户或实际运行系统的要求。 有的用户可能希望获取描述 型的、容易理解的知识;而有的只是希望获取预测准确度尽可能高的预测型知识。 选择了挖掘算法后,就可以实施数据挖掘操作 , 获取有用的模式。对所得到的经过转换的数据进行挖掘 余一切工作都能自动地完成。 结果分析:解释并评估结果,其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术。 知识的同化:将分析所得到的知识集成到业务信息系统的组织结构中去。 三 、数据挖掘与传统分析方法的区别 数据挖掘与传统的数据分析 (如查询、报表、联机应用分析 )的本质 区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识 , 数据挖掘所得到的信息应具有先未知 ,有效和可实用三个特征 . 先前未知的信息是指该信息是预先未曾预料到的 ,既数据挖掘是要发现那些不能靠直觉发现的信息或知识 ,甚至是违背直觉的信息或知识 ,挖掘出的信息越是出乎意料 ,就可能越有价值 。 在商业应用中最典型的例子就是一家连锁店通过数据挖掘发现了小孩尿布和啤酒之间有着惊人的联系 。 四 、数据挖掘的分类 数据挖掘是一个以数据库、人工智能、数理统计、可视化四大支柱技术为基础,我们知道,描述或说明一个算法设计分为三个部分 :输入、输出和处理过程。数据挖掘在宁夏移动增值业务综合运营平台中的应用 13 数据挖掘算法的输入是数据库,算法的输出是要发现的知识或模式,算法的处理过程则设计具体的搜索方法。从算法的输入、输出和处理过程三个角度分,可以确定数据挖掘主要涉及三个方面:挖掘对象、挖掘任务、挖掘方法。挖掘对象包括若干种数据库或数据源,例如关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据库、多媒体数据库、历史数据库,以及万维网( 。挖掘方法可以粗分为:统计方法、机器学习方法、神经网络方法和数据库方法。统计方法可细分为:回归分析、判别分析等。机器学习可细分为:遗传算法 等。神经网络方法可细分为:前向神经网络、自组织神经网络等。数据库方法主要是多维数据分析方法等。 五 、数据挖掘与可视化技术 可视化技术在数据挖掘的各个阶段都起着重要的作用。特别是在数据准备阶段 , 用户可能要使用散点图、直方图等统计可视化技术来显示有关数据 ,以期对数据有一个初步的了解 ,从而为更好地选取数据打下基础。在挖掘阶段 , 用户则要使用与领域问题有关的可视化工具。在表示结果阶段 , 则可能要用到可视化技术以使得发现的知识更易于理解。 六 、数据挖掘,机器学习和统计 数据挖掘利用了人工智能( 统计分析的进 步所带来的好处。这两门学科都致力于模式发现和预测。数据挖掘不是为了替代传统的统计分析技术。相反,他是统计分析方法学的延伸和扩展。大多数的统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者的要求很高。 随着计算机计算能力的不断增强,我们有可能利用计算机强大的计算能力只通过相对简单和固定的方法完成同样的功能。一些新兴的技术同样在知识发现领域取得了很好的效果,如神经元网络和决策树,在足够多的数据和计算能力下,他们几乎能自动就能完成许多有价值的功能。数据挖掘就是利用了统计和人工智能 技术的应用程序,把高深复杂的技术封装起来,使人 们不用掌握这些技术也能完成同样的功能,而更专注于所要解决的问题。 数据挖掘在宁夏移动增值业务综合运营平台中的应用 14 第 3 章 需求分析 务概述 标 增值业务综合运营平台 作为 移动 公司自有增值业务运营管理工作的支撑平台和统一门户,以提供专业化服务能力为目标,遵循“专业化系统 +开放式集成架构”的规划、建设原则,通过数据集成、流程集成 、数据挖掘 等手段,协同、整合现有 过建立增值业务运营信息视图,加强客户和产品关联性分析,建设综合服务枢纽等手段,实 现对提升客户需求把握、 离网客户预警、流量客户偏好分析、 增值业务深度融合运营、提升常态化运营管理水平等工作的全面支撑。 增值业务综合运营平台 需要遵循开放性、稳定性、灵活性的要求,构建系统基础架构,实现基本业务功能要求,其技术目标主要体现在以下三个方面: 1、 构建统一接入操作门户,优化系统交互能力,提升客户感知度 从综合运营与管理的视角出发,基于 技术,为业务与管理人员提供满足“统一工作界面、基于角色展现”要求的统一操作门户; 以提升用户体验为目标,优化系统交互能力,充分整合系统信息和功能, 建立具有一致性、规范性和兼容性的界面框架和展示风格,实现系统界面的友好性和操作的易用性。 2、 支持多样的跨系统集成能力 支持将外部系统中的功能,通过界面集成、流程集成、服务集成、数据集成的方式进行集成,形成 到及时响应、快速部署、灵活展现的目的;在业务能力整合的基础上,提供基于统一工作流引擎的、面向业务流程的、可视化的业务流程管理机制。 3、实现两类数据挖掘的系统应用 构建离网预警模型和流量客户偏好分析模型两类数据挖掘应用,并应用到日常业务运营工作中,以提升客户的保有能力和市场 细分能力。 户的特点 增值业务综合运营平台主要面向区市县三级的增值业务运营人员 ,使用用户数据挖掘在宁夏移动增值业务综合运营平台中的应用 15 存在以下特点: 1、人员分散 宁夏移动增值业务运营人员主要包括区公司数据部相关增值业务运营管理人员、地市公司市场部增值业务管理人员以及县公司的客户经理、营业员及业务管理人员。人员相对较为分散,地市公司、县公司缺乏专业的增值业务运营机构、关注点各有不同。 2、信息获取困难,各类信息散落在不同的系统中 增值业务在移动体系中越来越重要,但各类信息支撑却散落在不同的平台和系统,缺乏整合和专业型,如报表数据在经 营分析系统中,用户行为数据在 户上网行为数据在网管系统中。增值业务运营人员获取数据困难,且不同系统数据之间的关联分析 缺乏 ,系统对于 增值业务 人员的支撑 作用和工作职责对于增值业务人员的要求不匹配。 3、需要及时的数据信息支撑工作 随着市场竞争的加剧和用户行为属性的变化,增值业务运营管理人员往往需要了解用户的上网行为而进行市场细分和差异性营销,也需要及时了解哪些客户有离网倾向进而做好客户挽留 。总结而言,增值业务运营人员对于客户的细分(需要的判断)和客户的潜在倾向(离网倾向、消费倾向)的掌握存在非常迫 切的需求。 求规定 功能的规定 省级 方面向公司内部市场运营人员以及产品管理人员等各类角色,通过整合现有功能和流程,提供客户和业务管理分析、业务监控和稽核、标签管理、工作任务管理等应用,实现“一站式”服务,提升操作易用性与便捷性;另一方面,省级 向业务平台开放使用权限,使业务平台能够及时查询相应指标,利用平台提供的流程实现服务请求的提出以及接口变更等日常运营工作。 数据挖掘在宁夏移动增值业务综合运营平台中的应用 16 图 作台管理功能 据 挖掘应用 功能 预期 1、离网预警模型需求规定 图 网预警模型用例图 主角 1已离网用户属性潜在客户属性离网预警模型用户 A : 138 离网概率 = 90 %离网概率判断模型用户 C :137 , 50 % 数据挖掘在宁夏移动增值业务综合运营平台中的应用 17 离网预警模型主要根据已离网客户属性(交往圈 变化 、通话时长 变化 、流量变化 )判断客户潜在离网属性,进而构建离网预警模型,对用户的离网概率进行判定,对于潜在离网的客户通过营销方案及客户服务方案的实施实现客户挽留,减少收入损失。 2、 流量客户偏好分析模型 需求规定 随着移动互联网的快速发展、智能手机的迅速普及,当前经营客户的主体正从通信客户向互联网客户转变,客户需求已由单一的通信需求转变为个性化的互联网需求,为顺应市场和客户需求的变化,需要在传 统经分数据基础上,对流量内容数据进行深度分析,深入洞察用户需求,最终有效推动智能管道的建设,提升流量规模和收入。 流量客户偏好分析模型主要采集手机 据、 据以及经营分析系统客户通信使用行为数据,通过建模,实现用户通过手机上网的偏好分析,进而根据输出内容细分客户群体,有针对性地开展专项运营和营销工作,进而提升客户使用率,为运营商创造新的价值和收入。 A c t o G N 数 据 采 集D P I / D F I 数 据 采 集经 营 分 析 系 统 用 户 细 分 数 据用 户 流 量 偏 好分 析用 户 : A 手 机 号 码 :1 3 9 0 9 5 1 0 0 2 9 喜 好 : 玄 幻武 侠 小 说用 户 : B 手 机 号 码 :1 3 9 0 9 5 1 0 0 2 9 喜 好 : 音 乐用 户 : C 手 机 号 码 :1 3 9 0 9 5 1 0 0 2 9 喜 好 : q q 游戏图 户流量偏好分析模型用例图 性能的规定 运营信息视图,聚合目前分散在各个增值业务平台和其他支撑系统内的信息,集中服务于 离网预警及 流量运营等重点应用场景,实现对增值业务融合运营的统一支撑。增值业务运营信息视图以增值业务和客户为角度,利用画像和标签等为手段,精确刻画增值业务的基础信息、使用信息、客户的业务行为、内容偏好等特征,并利用扩展信息统一管理增值业务运营过程中所涉及的其他信息,既便于业务人员及时、全面的了解增值业务运营状况,又为上层分析应用提供基础信息支撑,助力业务融合运营。构建增值业务运营信息视图数据挖掘在宁夏移动增值业务综合运营平台中的应用 18 主要实现以下目标: 数据集中管理:消除业务平 台间及业务平台与业务支撑系统间的信息孤岛,实现增值业务数据的统一管控; 数据集中分析:从单一业务分析到融合业务分析,从简单统计分析到数据挖掘分析,实现多层次、多角度的增值业务集中、深入分析; 数据集中提供:通过省级 通面向业务平台、 增值业务营销服务工作提供及时、准确的分析数据。 据管理能力要求 1、逻辑架构 过调用各系统提供的数据服务接口(如: 完成 数据在 算、以及结果的统一展现。 图 2、数据基础前提 数据集成包括逻辑集成方式和物理集成方式;提供源数据的各外部系统负责保证数据准确性,并对 算、展现。 3、技术要求 及时性要求:由提供数据服务的各外部系统来保障数据响应达到规定的时限要求; 准确性要求:数据准确性是指通过数据校验的方式,确保通过 取数据的过程中,数据不会发生改变,保证互动获得的数据的准确性。 4、安全性管理 数据挖掘在宁夏移动增值业务综合运营平台中的应用 19 安全认证和授权:需要提供 数据服务的各外部系统对 系统调用提供统一的认证和授权,对未授权的非法请求渠道进行过滤;对合法的渠道但不合法的请求进行过滤,严格控制数据权限; 关键业务数据加密,为保障在网络传输过程中传输数据的安全,需对关键业务数据进行加密,防止网络传输数据被窃取; 提供业务数据检查功能: 供对数据来源合法性和数据格式合法性的校验。对接收的数据进行合法性检查,对非法数据和错误数据则拒绝接收,以防止外来数据非法入侵。 行环境规定 署要求 省级 部署要考虑到各个功能域的松耦合,可以独

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论