(计算机应用技术专业论文)话务量分析和多种预测模型的比较研究.pdf_第1页
(计算机应用技术专业论文)话务量分析和多种预测模型的比较研究.pdf_第2页
(计算机应用技术专业论文)话务量分析和多种预测模型的比较研究.pdf_第3页
(计算机应用技术专业论文)话务量分析和多种预测模型的比较研究.pdf_第4页
(计算机应用技术专业论文)话务量分析和多种预测模型的比较研究.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(计算机应用技术专业论文)话务量分析和多种预测模型的比较研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

话务量分析和多种预测模型的比较研究 话务量分析和多种预测模型的比较研究 摘要 随着通信网应用和规模的不断增加,网络管理变得越来越重要, 新一代的网管系统对业务量的预测也提出了新的需求,其中通信话 务量的预测分析已经成为其中非常重要的一部分。准确的话务量预 测对网络管理、规划和设计具有重要意义,围绕这一问题,本论文 重点对话务量分析进行研究,常用的预测模型有a r m a 模型和b p 预测模型,然而a r m a 预测模型预测速度慢、b p 预测模型参数难 以选择,因此本文提出了一种预测速度快、效果好的预测模型 基于s v m 回归算法的预测模型。最后针对话务量的特性,提出了一 种基于s v m 多模型的预测模型,用于对工作日和周末话务量数据分 别建立预测模型。 本论文主要贡献包括以下几个方面:1 ) 设计了一种通用的话务 量预测模型框架;2 ) 基于m a t l a b 实现了三种不同的预测模型, 包括两种常用的a r m a 模型和b p 预测模型,以及提出的基于s v m 回归算法的预测模型;3 ) 针对话务量的特性,提出了一种基于s v m 多模型的预测模型;4 ) 详细比较了各种模型的性能,探讨了最优预 测模型的选择步骤。其具体过程如下: 首先,本论文研究了通信话务量的特性,探讨了话务量预测的 意义并且调研了常用的话务量预测的方法。 其次,本论文介绍了多种预测模型的理论,a r m a 模型将预测对 象随时间推移而形成的序列数据视为一个随机序列,并且用一定的 数学模型来近似描述这个序列;b p 神经网络通过多层的神经网络近 似模拟一个连续的非线性函数来预测话务量;s v m 回归模型则是首先 获得一系列的支持向量,然后通过二次优化逼近一个非线性函数来 预测话务量。 基于预测模型的理论分析,本论文给出了话务量预测模型的设 计框架,并且详细描述了实现三种预测模型的过程:包括常用的 a r m a 模型、b p 神经网络和提出的s v m 回归模型。针对话务量的 话务量分析和多种预测模型的比较研究 特性,提出了一种基于s v m 多模型的预测模型,用于对工作日和周 末话务量数据分别建立预测模型。之后,探讨了选择最优预测模型 的步骤,并且详细比较了各种预测模型的效果。 最后本文汇报了各种模型的预测结果和性能,为了评估不同模 型的预测性能,采集了四个话务量数据库进行实验仿真。实验结果 表明本文提出的s v m 预测模型的平均预测误差最小,其最小均方误 差为0 0 0 9 1 ,而a r m a 模型的平均预测误差略高于a r m a 模型为 0 0 1 1 4 ,两者都比b p 模型的预测效果好;而且s v m 的预测速度明 显比a r m a 模型快,综合各方面考虑,s v m 预测模型的整体性能 最优。 关键词:话务量分析,预测模型,a r m a 模型,b p 模型,s v m 模型 话务量分析和多种预测模型的比较研究 c o m m u n i c a t i o nt r a f f i ca n a ix s i s w i t ht h es t u d ya n dc o m p a r i s o no f m u l 月i p l ep r e d i c t i o nm o d e l s a b s t r a c t w i t ht h ei n c r e a s eo ft h ea p p l i c a t i o n sa n ds i z eo ft h ec o m m u n i c a t i o n n e t w o r k s ,n e t w o r km a n a g e m e n ti s i n c r e a s i n g l yi m p o r t a n t t h en e w g e n e r a t i o no fn e t w o r km a n a g e m e n ts y s t e mf o rp r e d i c t i n gb u s i n e s sh a s m a d en e wd e m a n d s ,i nw h i c hc o m m u n i c a t i o nt r a f f i cf o r e c a s t i n gh a s b e c o m eo n eo ft h em o s ti m p o r t a n tp a r t s a c c u r a t et r a f f i cf o r e c a s tf o r n e t w o r k m a n a g e m e n t ,p l a n n i n g ,d e s i g n i so f g r e a ts i g n i f i c a n c e a c c o r d i n gt ot h i si s s u e ,t h i st h e s i sf o c u s e so nt h ec o m m u n i c a t i o nt r a f f i c a n a l y s i s ,a n dp r o p o s e st h r e ec o m m u n i c a t i o nt r a f f i cf o r e c a s t i n gm o d e l s g e n e r a lf o r e c a s t i n gm o d e li n c l u d e sa r m am o d e la n db pp r e d i c t i o n m o d e l h o w e v e r , i ti sv e r ys l o wt ou s ea r m am o d e lt op r e d i c tt h e f u t u r ev a l u e ,w h i l ei ti sv e r yh a r dt of i tt h eo p t i m a lp a r a m e t e r sf o rb p p r e d i c t i o nm o d e l i nt h i st h e s i s ,t h em a i nc o n t r i b u t i o n si n c l u d et h ef o l l o w i n gp a r t s :1 ) d e s i g n i n gag e n e r i cc o m m u n i c a t i o nt r a f f i cf o r e c a s t i n gm o d e lf r a m e w o r k ; 2 ) i m p l e m e n t a t i o no ft h r e ed i f f e r e n tf o r e c a s t i n gm o d e l s ,w h i c ha r et w o c o m m o n l yu s e da r m am o d e la n db pm o d e l ,a sw e l la so u rp r o p o s e d s v m b a s e d f o r e c a s t i n gm o d e l ;3 ) d e t a i l e dc o m p a r i s o n o ft h e p e r f o r m a n c eo fv a r i o u sm o d e l s ,a n dd e s c r i p t i o no ft h ep r o c e s sh o wt o s e l e c tt h eo p t i m a lp r e d i c t i o nm o d e l t h es p e c i f i cp r o c e s si sa sf o l l o w s : f i r s t l y , w es t u d yt h ep r o p e r t i e so ft h ec o m m u n i c a t i o nt r a f f i c ,w h i c h i sat y p i c a lt i m es e r i e s 肥a l s oi n v e s t i g a t et h ec o m m o nc o m m u n i c a t i o n t r a f f i cf o r e c a s t i n gm e t h o d s s e c o n d l y , w ei n t r o d u c e dt h et h e o r i e so fav a r i e t yo ff o r e c a s t i n g m o d e l s :a r m am o d e lw i l lr e g a r dt h et i m es e r i e sa sar a n d o ms e q u e n c e a n du s es o m eo ft h em a t h e m a t i c a im o d e lt oa p p r o x i m a t et h i ss e q u e n c e ; i i i 话务量分析和多种预测模型的比较研究 b pm o d e la p p r o x i m a t et h es i m u l a t i o n o fan o n l i n e a rf u n c t i o nf o r f o r e c a s t i n gt h ec o m m u n i c a t i o nt r a f f i ct h r o u g ht h em u l t i 1 a y e rn e u r a l n e t w o r k ;s v mr e g r e s s i o nm o d e li st oo b t a i nar a n g eo fs u p p o r tv e c t o r s , a n dt h e ne s t i m a t ean o n l i n e a ro p t i m i z a t i o nf u n c t i o nt op r e d i c tt h et r a f f i c b yaq u a d r a t i cp r o g r a m m m g t h i r d l y , b a s e do nt h et h e o r e t i c a la n a l y s i sa b o u tt h ef o r e c a s t i n g m o d e l ,t h i st h e s i si l l u s t r a t e st h ef r a m e w o r ko ft h ep r e d i c t i o nm o d e l a n d t h e nw ed e s c r i b e dt h et h r e ef o r e c a s t i n gm o d e l si nd e t a i l s :i n c l u d i n gt h e a r m am o d e l ,b pm o d e la n dt h es v m r e g r e s s i o nm o d e l a f t e rt h a t ,w e s h o w e dt h ep r o c e s sh o wt os e l e c tt h eo p t i m a lp r e d i c t i o nm o d e l w b f o u n dt h a tt h ed i m e n s i o no fi n p u tv e c t o rw o u l da f f e c tt h ep e r f o r m a n c eo f t h ep r e d i c t i o nm o d e l ss i g n i f i c a n t l y f i n a l l y , w er e p o r to nt h er e s u l t so ft h et h r e ef o r e c a s t i n gm o d e l s i n o r d e rt oa s s e s st h ep e r f o r m a n c eo ft h ef o r e c a s t i n gm o d e l s ,w ec o l l e c t e da n u m b e ro fc o m m u n i c a t i o nt r a f f i cd a t a s e t s t h ee x p e r i m e n t ss h o wt h a t s v m b a s e df o r e c a s t i n gm o d e la c h i e v e st h em i n i m u ma v e r a g em s e e r r o ra m o n gt h et h r e ed i f f e r e n tf o r e c a s t i n gm o d e l s a n dt h ea v e r a g em s e i s0 0 0 9 1 t h ea v e r a g em s eo ft h ea r 丛m o d e li sh i g h e rt h a nt h a to f t h es v m b a s e dm o d e l ,w h i c hi s0 0 11 4 c o m p a r i n gw i t hb pm o d e l , b o t ho ft h ea r m aa n ds v mm o d e l so u t p e r f o r mb pm o d e l m o r e o v e r , s v m b a s e df o r e c a s t i n gm o d e lp e r f o r m sf a s t e rt h a na r m am o d e lt o f o r e c a s tt h ec o m m u n i c a t i o nt r a f f i c g e n e r a l l y s p e a k i n g ,t h e o v e r a l l p e r f o r m a n c eo fs v mm o d e li so p t i m a l k e yw o r d s :c o m m u n i c a t i o nt r a f f i c a n a l y s i s ,f o r e c a s t i n g m o d e l ,a r m am o d e l ,b pm o d e l ,s v mm o d e l i v 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:韵醇款 日期:刀孵多、却 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公饰学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密 论文注释:本学位论文不属于保密范围,适用本授权书。 本人签名: 导师签名: 穆 p 日期:加孑,习 日期:汐暗弓必 话务量分析和多种预测模型的比较研究 1 1 课题背景 第一章绪论 现在移动通信的用户数和话务量保持着高速增长的势头,移动网络长久、稳 定的运行,有赖于及时、有效的网络规划与优化,运营者以主动性的网络变化成 功应对用户行为的变化及其趋势。移动通信话务量超过一定容量时,极易造成交 换系统过载,出现电路拥塞,话音当接通率下降、话务掉话比上升,甚至出现交 换机大面积瘫痪的现象,给移动通信运营商和移动用户都造成不可弥补的损失。 因此根据话务统计资料和其他业务信息对移动通信话务量的变化趋势进行预测, 以此来确定工程扩容将要达到的容量,并由各地设定的相应话务模型计算设备的 有效容量,从而决定满足设计容量的设备类型和数量,对于移动通信运营商来说 非常有必要。 预测结果的准确与否直接关系到企业未来的发展,因此对话务量需求的预测 日益受到移动运营商的关注 1 3 0 3 4 3 5 3 6 。然而话务量预测工具缺乏和 准确率不高,是我们研究和引入新的预测技术以及方法的重要原因之一:大部分 移动公司目前采用的预测技术,仅限于简单函数的拟合预测,这种简单预测模型, 实际上对一种趋势的粗略的估计,在业务快速发展和网络快速工程建设中,起到 一定的积极作用;而今天,用户行为以及网络规模和结构的变化,原有简单趋势 预测技术己经不再适合了。因此,利用现代数学中有关估计和预测模型进行移动 网络话务模型研究,提高预测的准确度,意义非常重大。 随着用户群体类型的复杂化、开展业务形式的复杂化以及网络结构的日益复 杂化,话务量的变化方式也趋于复杂。对话务量预测模型进行研究和引入新的预 测模型,将具有重大意义。该论文选题基于前沿的话务量预测研究,提出了一种 预测速度快、效果好的预测模型基于s v m 回归算法的预测模型,并且详细 分析比较了该模型与a r m a 模型矛i i b p 预测模型的性能,给该领域的研究和研发人员 的一个参考。 本论文主要贡献包括以下几个方面:1 ) 设计了一种通用的话务量预测模型 框架;2 ) 基于m a t l a b 实现了三种不同的预测模型,包括两种常用的a r m a 模 型和b p 预测模型,以及本文提出的基于s v m 回归算法的预测模型;3 ) 针对话务 量的特性,提出了一种基于s v m 多模型的预测模型;4 ) 详细比较了各种模型的 性能,探讨了最优预测模型的选择步骤。 本论文基于亿阳与北邮p c n & c a d 中心的合作项目“业务健康管理指标分析 和业务系统指标预测 ,本课题主要关注于在二期移动网管调研的基础上对未来 话务量分析和多种预测模型的比较研究 移动网管进行功能模块的增强,即第三期移动数据网管方面在业务健康模型中的 业务量预测部分的研究,主要体现在数据分析上,包括话务量的预测及其它业务 量的预测,使业务性能在影响到用户之前得以屏蔽。本论文旨在话务量分析,并 且就这个问题深入研究,从而展开了对于话务量分析和多个预测模型的比较研 究,虽然这些预测模型是针对话务量数据提出的,但是这些预测模型同样适用于 其他业务量的预测。 1 2 话务量预测概念 所谓预测,就是对尚未发生或目前还不明确的事物进行预先的估计和推测, 是在现时对事物将要发生的结果进行探讨和研究,是综合研究事物内在联系延续 与突变过程的一门学科。从数学的角度,可以把预测模型看成是一种从输入量x 到输出量y 的映射。预测建模的目的就是根据历史数据记录估计出这种映射( 或函 数) ,如:y = f ( x ,0 ) ,用来在给定输入值x 和参数0 的情况下预测出y 的值。 话务量预测,是指通过分析电信网络话务的历史数据统计规律或相关因素, 对未来网络可能出现的话务进行估计和预期。目前中国二大移动运营商中国移动 和中国联通,也开始关注到话务量预测对日常运营和企业发展的重要性,但预测 研究工作开展得并不乐观,前期大多精力都投入到发展新用户、规模上量上。在 用户数量发展到一定的饱和度时,通信网络设备的吞吐能力也就成为了制约业务 发展的瓶颈,因此受到相当的关注。 话务量数据是一种典型的时间序列,而且具有周期性。如一个地区的全网话 务量一般在早晨1 0 时一1 1 时达到一个峰值( 通常称为早忙时) ,在晚上1 9 时 2 0 时达到另一个峰值( 通常称为晚忙时) ,而在凌晨3 时4 时达到低点( 谷 底) ,形成了测量数据的时序性和周期性。本文将把话务量作为一种时间序列进 行预测模型【1 】【1 2 】的设计。 1 3 国内外研究现状 在国内外很多的研究机构都积极设计话务量的预测模型,并且取得了阶段 性的成果。当前,主要的建立预测模型的方法包括惯性预钡f j l 2 7 3 2 1 、k a l m a n 滤波 1 9 1 、话务量o l a p 分析1 3 7 1 等。其中惯性预测和k a l m a n 滤波相对简单, 但是难于满足现阶段话务量的复杂变化方式。 随着时序预测问题的深入研究,其技术手段由原来的概率论、随机过程等 纯数学的方法,如采用a r m a 预测模型【1 6 】来近似描述时问序列,到引入动力 学系统的一些知识抽取时序的系统特征,再到引入神经网络 2 9 1 等人工智能领 话务量分析和多种预测模型的比较研究 域内的技术和数学手段相结合的方法,综合性越来越强。 a r m a 模型 1 6 1 1 1 7 1 被广泛的应用于时间序列的分析和预测,若时间序列 是平稳的,可以用自回归模型a r ( p ) 、滑动平均m a 模型、自回归移动平均 模型a r m a ( p ,q ) 来进行分析,a r m a 模型能够较好地描述时间序列,但是其 前提是时间序列是平稳的,缺点是预测速度慢。 神经网络( a n n ) 是模仿人脑生理特性的人工智能信息处理系统,它具有很 强的映射能力,是进行曲线拟合、近似实现各种非线性系统的有效工具。现在, 神经网络己经成为预测的一种重要模型,神经网络有多种结构,最常用的是多 层b p ( b a c kp r o p a g a t i o n ) 模型。但是b p 预测模型的参数难以选择,难以确定隐 含层和隐含层节点的个数。 鉴于以上模型的不足,本文提出基于s v m 回归分析的预测模型,由于有 较为严格的统计学习理论做保证,应用s v m 方法建立的模型具有较好的推广 能力。近年来s v m 被广泛的应用于人工智能的各个方面,并取得了成功的应 用,因此本文尝试采用s v m 回归分析的方法来建立话务量预测模型,s v m 通 过核函数实现到高维空间的非线性映射,所以适合于解决本质上非线性的回归 函数估计等问题。在第三章将对以上三种模型( a r m a 模型、b p 模型和s v m 模型) 进行详细的理论分析。 1 4 本文工作与论文结构 本文主要分析研究话务量预测,在此过程中本人对本研究领域的国内外研究 现状进行了调研,收集了相关项目背景材料以及论文资料,分析整理了常用的预 测模型,学习其理论框架及原理。在此基础上,基于m a t l a b 实现了三种话务量预 测模型,分析比较了基于不同模型的话务量预测,包括基于b p 神经网络的预测 模型、基于a r m a 模型的预测模型,以及基于s v m 回归分析的预测模型,本人 采用m a t l a b 软件工具开发,编程实现了各个模块的设计,包括预处理、界面设计、 模型设计、参数选择以及实验结果分析等,并且探讨了寻找最优模型参数的方法。 最后针对话务量的特性,提出了一种基于s v m 多模型的预测模型,用于对工作 日和周末话务量数据分别建立预测模型。 本文所采用的数据是吉林移动话务量数据,通过系统全面的实验和分析,发 现s v m 预测模型的平均预测误差最小,其最小均方误差为0 0 0 9 1 ,而a r m a 模型 的平均预测误差略高于s v m 预测模型为0 0 1 1 4 ,两者都比b p 模型的预测效果好; 而且s v m 的预测速度明显t 匕a r m a 模型快,综合各方面考虑,s v m 预测模型的 话务量分析和多种预测模型的比较研究 整体性能最优。通过比较s v m 多模型预测结果与s v m 单模型预测结果,发现基 于s v m 多模型能够获得更准确的预测结果。 本论文可分为六章,章节安排如下: 第一章是绪论部分,介绍了话务量预测的研究背景,简述了国内外关于话务 量预测的现状,简述本论文的主要工作和篇章的组织结构。 第二章是话务量分析综述部分,本章重点分析了话务量的基本特征,综述了 不同的话务量预测的方法。 第三章论述了多种预测模型的理论部分,并且详细阐述了三种模型的理论基 础,本章作为全文的理论部分,旨在作为后文的研究基础。 第四章论述了预测模型的框图,并且详细介绍了三种模型的设计过程和实验 条件,分别训练出各个预测模型的最优模型参数,最后系统分析比较了不同预测 模型的性能。 第五章针对话务量的特性,提出了一种基于s v m 多模型的预测模型,用于 对工作日和周末话务量数据分别建立预测模型,在其中描述了基于s v m 多模型 的设计过程,实验过程及结果分析。 第六章对全文进行概括,并对未来工作进行了简要展望。 话务量分析和多种预测模型的比较研究 第二章话务量分析综述 2 1 话务量概述 对于电信网络,永远面临着资源和需求之间的关系,话务理论就是对网络资 源、用户接入需求以及必要条件( 如拥塞) 进行阐述。为反映电话用户通话的频 繁程度和通话时间的长短,电话交换中引入了“话务量”的概念。话务量定义为 单位时间内发生的呼叫次数与每次呼叫的平均占用时长和计算话务量的时问范 围之乘积。话务量是一个无量纲的数值,但却通常用“小时呼”或“爱尔兰( e r l ) ” 来表示。如果某用户的一次呼叫和通话连续占用话路1 小时,则该用户的话务量 为i e r l 。电话网中电话繁忙的程度在一天2 4 d , 时内是不一样的。因此,在计算交 换机的容量和网络规划及工程设计中所说的话务量都是指一天2 4 d , 时内最繁忙 的一小时的平均话务量,称之为忙时话务量。 话务量的概念 话务量 3 4 反映了电话负荷的大小,与呼叫强度和呼叫保持时间有关。呼叫 强度是单位时间内发生的呼叫次数,呼叫保持时问也就是占用时间。单位时间内 的话务量等于使用相同时问单位的呼叫强度与呼叫保持时间之乘积,其单位为爱 尔兰( e r l a n g ) 。例如:呼叫强度= 1 8 0 0 次d , 时,呼叫保持时间= ( 1 6 0 ) 小时次, 则话务量= 1 8 0 0 次d , 时木( 1 6 0 ) 小时次= 3 0 e r l 。单位时间内流过所有用户终 端的话务量y 可以用以下公式表示: y = n 木( n t ) 术h , ( 2 - 1 ) 其中n 为时间t 内单个用户终端发出的平均呼叫数,h 是由用户终端发出的呼 叫的平均占用时间,n 为用户数的总和,n 术( n t ) 为呼叫强度,h n 呼叫保持时间。 话务量的特性 目前发短信和打电话己经成为节目期间人们相互问候相互祝贺的最好的方 式。因此每到传统的节日,尤其是中秋和春节,总会迎来一个通信高峰。这样的 通信高峰虽然给通信公司带来了巨额的收入,但同时也带来了巨人的压力,尤其 是对通信公司,因为其用户、业务和网络的特点,这些话务高峰对网络的冲击更 大。中秋、元旦等节同的话务高峰是由于用户的话务量和短信使用量增加造成的 结果,春节期间的话务高峰还有一个特殊的因素,就是用户数的变化,用户的变 化主要来自返乡的民工和放假的学生等。许多民工大省如河南、安徽和四川等有 话务量分析和多种预测模型的比较研究 类似现象。全省范围内的用户变化已经比较明显,而对于某些本地网可能增加的 用户数量非常大,如某地2 0 0 4 年春节期间本地固话交换机上的用户比本地统计的 发展用户多出近一倍。这些外来用户对本地电信网络造成全面冲击,如何解决节 假日期间话务量的冲击是摆在部分本地运营商面前的现实问题。 此外电信大客户在话务量上的一个最大特点是在业务繁忙时话务量很大,且 呈现浪涌形态。浪涌的波峰根据大客户性质的不同集中在不同的时段。例如:商 贸连锁业、企事业单位、集团用户话务量的高峰主要集中在上午9 :0 0 至1 1 :0 0 和下1 5 :0 0 至1 7 :0 0 之间,也就是工作时段;对于学校一类的大客户,其浪涌高 峰主要集中在晚上2 1 :0 0 以后的长途、校内呼叫以及拨号上网等。 传统的模块或接入设备只能提供1 :4 1 :8 的固定收敛比,不具备大话务量 承载能力。经常性的占线或瘫机必然导致客户重新选择新的电信运营商。对于电 信运营商而言,大客户的流失以及接通率的下降会带来极大的损失,而接通率 每提高1 个百分点将给其每年带来数亿元的业务收入。 为了能够进一步提高投入产出比,真正实现和大客户的双赢,电信运营商对 于话务量的准确预测需求变得更为迫切,根据用户话务量的历史数据预测需求状 况,并且灵活规划资源分配,解决由于高话务量与大客户语音业务接入的快速发 展而引发的瘫机问题,达到优化网络、提高网络资源利用率的目的。 2 2 话务量分析调研 2 2 1 话务量分析的意义 话务量的急剧增长对于呼叫中心系统着实是个考验 3 0 1 。有的呼叫中心系 统,由于不能负担过多的话务量导致瘫痪。这不仅影响了对用户的服务,也损害 了企业的形象。为了有效地利用网络资源,挖掘现有网络的潜力,面对着庞大、 复杂的本地通信网络,电信运行维护部门必须不断加强网络设备的日常维护分析 力度,不断地进行网络调整和优化,以满足电信发展的需求。而有效地进行网络 调整和优化依赖于优质的网络运行质量分析,因此,如何及时有效地对交换网络 的运行进行分析和管理成为电信运营企业面临的越来越重要的课题。分析的目标 要从各个角度对网络话务量数据进行查询、统计、分析来掌握现行电信网络的运 行质量和效率,了解话务流量流向变化趋势,从而为电信网络运行的生产维护管 理部门和市场营销管理部门制定决策提供支持。话务量分析的重点是对未来话务 量进行预测,以此来对资源进行合理分配,对于移动通信运营商来说非常有必要, 下面将概述常用的预测方法。 话务量分析和多种预测模型的比较研究 2 2 2 预测方法概述 所谓预测,就是对尚未发生或目前还不明确的事物进行预先的估计和推测, 是在现时对事物将要发生的结果进行探讨和研究,是综合研究事物内在联系延续 与突变过程的一门学科。由于预测涉及的内容非常广泛,包罗万象,如各类工业 自动控制技术、财经和金融市场预测、电力管理、交通管理等等,目前各种常用 的预测模型和方法有二三十种。总的来说,根据不同的需求、容量和复杂性可以 分为以下几类:1 ) 分析预测法,2 ) 技术预测法。正如前面表述,这些术语不仅 是话务量预测中唯一使用的,比如还用于股票市场预测。预测方法和模型的选用 取决于很多因素,如预测的目的,可用数据的数量,预测的知识,经验等。事实 上,不少预测学家对某一特定问题进行深入研究,从而寻找预测精度高的预测方 法;或者研究预测方法、预测模型本身,对预测模型的适用范围( 适用条件) 和预 测精度进行研究。 分析预测法 分析预测法的概念是制作一个与事情过程有关的数学模型,它包括“所有” 因素。一个简单的例子是:假设一个月话务增长t 是直接和同期g n p ( 每个总数 g ) 增长成比例,为了使用这个模型预测,假设在月份m 的话务量为l ,预测以 后m 月份的为: 旦 + 珊= 乙+ c :g p , ( 2 2 ) j - “= ,竹+ l 其中c 是一个常数,a g 。是在月份m + l 至l j m 其问( 期望) 增长的g n p c a p i t a 。 g n p c a p i t a 不是唯一的因素,还有其他感兴趣的因素,包括收入的分配,人口统 计学,工业,贸易,收费和有效性,以及从其他网络得到的重要已知因素等。 国外有几个运营商已经成功的使用分析法进行预测,包括法国电信和沃达丰 等。分析模型包括经营战略,因此在本文讨论的话务预测领域很少使用。但这一 模型对高层管理作出经营战略是很重要的,也由于涉及公司经营上的秘密,各个 运营商应用时的具体组成因素相当保密。 技术预测法 技术预测法是排除了确定参数影响问题的方法,把这一问题留给自我学习系 统( 人工智能领域使用的) 。 这样的自我学习系统通常包括模糊逻辑 3 1 。通常的逻辑判断处理二进制 值,如t r u e ( 1 ) 和f a l s e ( 0 ) 。通常的逻辑系统像有两个数据a ,b 的或门输出 话务量分析和多种预测模型的比较研究 为t r u e ( 1 ) ,除非a ,b 都为f a l s e ( 0 ) 。两个数据a 、b 的或门的,模糊逻辑的 输出可以是t r u e ( 1 ) 、f a l s e ( o ) 间的任何值,取决于a ,b 的值和它 f r 卡l l 关的 权重a 和b 。典型的一个是图2 - 1 显示的s 形功能。 含毋。= 烈撕哟 图2 1 模糊逻辑门 h g 2 - 1f u z z yl o g i cg a t e 模糊逻辑的著名应用是人工神经网络 2 6 ,想法是模仿大脑的模型,假设由 彼此相连的神经元组成。在模型中,每一个神经接受许多输入并按函数和增量产 生输出。在电信中的神经网络的出现目前是一些感兴趣的研究课题,神经网络特 别是b p ( b a c k p a g a t i o nn e t w o r k ) 网络,在工业控制和自然应用中广泛使用,但是 b p 预测模型的参数难以选择。 除此以外,支持向量基( s v m ) 3 8 通过核函数实现到高维空间的非线性映 射,适合于解决本质上非线性的分类、回归和密度函数估计等问题,话务量数据 是一种非线性的时间序列,因此s v m 同样适用于建立话务量的预测模型,本文 提出了基于s v m 回归分析的预测模型。 模拟预测法也是一种技术预测法,其配置相关的简单数学模型,模型是量身 定做的,它可以得到预测和推断未来的数据。这种数学模型可以用简单函数构建 或者通过随机过程来模拟,其中比较典型的如a r m a 模型,a r m a 模型能够较好地 描述时间序列,但是其缺点是预测速度慢。在第三章将对以上三种模型( a r m a 模型、b p 模型和s v m 模型) 进行详细的理论分析。 2 3 本章小结 本章主要描述了话务量的概念,特征及性质,并对话务量分析和话务量预测 意义作了简要的概述,调研了几种比较常用的话务量预测的方法,为下文的话务 量预测做了技术准备。 话务量分析和多种预测模型的比较研究 第三章预测模型的理论分析 话务量数据是一种典型的时间序歹f j 1 2 1 ,本论文将把话务量作为一种时间序 列进行预测模型的设计。时间序列【1 6 1 【1 7 1 是指同一变量按事件发生的先后顺序 排列起来的一组观察值或记录值。构成时间序列的要素有两个:其一是时间; 其二是与时间相对应的变量水平。实际数据的时间序列能够展示研究对象在一 定时期内的发展变化趋势与规律,在一定条件下,被预测事物的过去变化趋势 会延续到未来。暗示着历史数据存在着某些信息,利用它们可以解释与预测时 间序列的现在和未来。因而可以从时间序列中找出变量变化的特征、趋势以及 发展规律,从而对变量的未来变化进行有效地预测。在下面将详细介绍针对时 间序列分析的一些预测模型,包括a r m a 预测模型、神经网络预测模型、以及支 持向量机预测模型。 3 1 a i m 预测模型 预测问题涉及到利用过去观测到的观测值预测当前观测值的随机模型构造 问题,在统计学中常常使用具有随机输入的线性差分方程来描述,目前最重要、 最常用的是自回归滑动平均( a u t o r e g r e s s i v em o v i n ga v e r a g em o d e l ,a r m a ) 模型 1 6 1 7 1 8 。a r m a 模型是由美国统计学家g e p b o x 和英国统计学家 g m j e n k i n s 在二十世纪七十年代提出的时序分析模型,用此模型所作的时间序 列预测方法也称博克斯詹金斯( b j ) 法。 a r m a 模型被广泛的应用于时问序列的分析和预测,任何一个有理式的功率谱 密度都可以用一个a r m a 随机过程的功率谱密度精确逼近。它的基本思想是:将预 测对象随时间推移而形成的序列数据视为一个随机序列,用一定的数学模型来近 似描述这个序列,这个模型一旦被识别后就可以从时间序列数据的过去值及现在 值来预测未来值。a r m a ( p ,q ) 模型中包含了p 自回归项和q 滑动平均项,它是自 回归模型( a r 模型) 和滑动平均模型( m a 模型) 的一般形式,下面将分别介绍a r 模型、m a 模型和a r m a 模型。 话务量分析和多种预测模型的比较研究 3 1 1 自回归a r ( p ) 模型 a r 模型即自回归模型,满足: z 善蠛一r , 其中q ) l ,伊,是模型的参数,c 是常数项,占,是误差项,e ( ,) = 0 ,e ( ? ) = 口2 , e ( e ,) = 0 ,t s 。为了简化,常省去常数项c 。为了保持a r 模型的稳定性,对 于模型的参数常有些限制条件,如误差项s ,是均值为0 方差为o r 2 的白噪声。a r 模型本质上是一个具有额外冲击的无限脉冲响应滤波器。满足上面随机差分方程 的时间序列) 是p 一阶自回归过程,记为a r ( p ) 。 3 1 2 滑动平均m a ( q ) 模型 m a 模型即滑动平均模型,满足: e = g t + 善慨, 何 其中0 1 ,巳是模型的参数,巳乒0 ,q ,h ,则同样是误差项。m a 模型在本质 上是具有额外解释的有限脉冲响应滤波器。满足以上方程的时间序列化) 是q 一阶 滑动平均过程,记为m a ( q ) 。 3 1 3 自回归滑动平均a r m a ( p ,q ) 模型 a r m a ( p ,q ) 模型中包含了p 自回归项和q 滑动平均项,它是自回归模型( a r 模型) 和滑动平均模型( m a 模型) 的一般形式,a r m a ( p ,q ) 模型可以表示为: y t = l u t + 薹够z 一+ 耄口,f ,一, c 3 一, 其中e p l ,驴p ,幺,巳是模型的参数,是常数项,g t f “,是误差项。在对 原始数据平稳化处理后,可以通过分析数据的残差序列,得n a r m a 模型中的p ,q 以及各个参数的值,其中p ,q 分别为偏自相关函数和自相关函数显著不为零的最 高阶数。在式( 3 一1 ) 中,p n 果q :o ,那么a r m a 模型就简化成a r 模型,如果p = 0 , 话务量分析和多种预测模型的比较研究 n 么a r m a 模型就简化成m a 模型。由此可以看矗a r ( p ) ,m a ( q ) ,a r m a ( p ,q ) 之间存在着深刻的联系。 在收集的数据处理中,用相关概念来描述两个变量之间的关联关系。它有两 种形式。一种是线性相关,指两个变量之间可用线性方程来描述。另一种是非线 性相关,指两变量之间需用非线性方程来描述。不过,这些都是与时间无关的随 机变量之间的关联性。在时间序列分析中,需要了解与时间有关的信息在不同时 刻的取值有无内在的关联性,这就需要引入相关函数的概念。话务量在一个时刻 的流量值与另一个时刻的流量值之间的依赖关系,可用自相关函数来描述。在t , t + a 时刻的样本记录x ( t ) ,x ( t + a ) 的自相关性可以通过在观察时间t 上对这两个值 的乘积计算平均得到。 3 2 神经网络( b p ) 预测模型 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k s :a n n ) 2 4 是一种根植于许多 学科的技术,其中涉及神经科学、数学、统计学、物理学、计算机科学与工程 学,它模拟人类大脑的记忆、识别和联想等功能,由大量的简单单元神经 元相互连接而成的自适应非线性动态系统。神经网络在两个方面与人脑相似: ( i ) 神经网络获取的知识是从外界环境中学习得来的;( ii ) 互连神经元的连接强 度,即突触权值,用于储存获取的知识。 神经网络具有的一个重要性质,即在有监督或无监督的情况下能够从输入 输出数据中进行学习的能力,这使得它在不同领域中得到应用,如建模、时间 序列分析、模式识别、信号处理与控制。随着神经网络的大量开创性应用,可 以发现,不管网络的组织形式如何,它们均有以下三个共同特性:学习,概括, 抽取。其非线性映射和记忆能力的特点十分适合非线性的数学建模。它不需要 精确的数学模型,能够解决传统自动化技术无法解决的许多复杂的、不确定性 的、非线性的自动化问题,而且易于用硬件或软件来实现。 本文主要是研究其在时间序列分析( 对话务量的预测) 这个领域中的应用。 为了建立神经网络预测模型,需要先认识一个神经网络的构成,下面将简单介 绍基本神经元模型、网络的结构、连接权值的学习算法。 话务量分析和多种预测模型的比较研究 3 - 2 - 1 神经元模型 神经元是构造神经网络的基本单元,一个基本神经元的结构模型如图3 一l 所示,它有几个基本要素:一组连接( 对应于生物神经元的突触,连接强度由 连接线上的权值给出,权值为正的表示激活,为负的表示抑制) 、一个求和单元 ( 用于求取n 个输入信号的加权和也即线性组合) 、一个非线性变换函数( 起非 线形映射作用,并将神经元输出幅度限制在一定范围之内,一般限制在( 0 ,1 ) 或( 一1 ,1 ) 之间) 和一个阈值0 i 。 模型的数学表达式为: 图3 - 1 神经元结构模型 f i g 3 - 1t h em o d e lo fn e u r a lu n i t y r2 f ( 1 荟= w j x j - - 0 i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论