马尔可夫预测算法.doc_第1页
马尔可夫预测算法.doc_第2页
马尔可夫预测算法.doc_第3页
马尔可夫预测算法.doc_第4页
马尔可夫预测算法.doc_第5页
免费预览已结束,剩余9页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

马尔可夫预测算法综述马尔可夫预测法以系统状态转移图为分析对象,对服从给定状态转移率、系统的离散稳定状态或连续时间变化状态进行分析马尔可夫预测技术是应用马尔可夫链的基本原理和方法研究分析时间序列的变化规律,并预测其未来变化趋势的一种技术。方法由来马尔可夫是俄国的一位著名数学家 (18561922),20世纪初,他在研究中发现自然界中有一类事物的变化过程仅与事物的近期状况有关,而与事物的过去状态无关。针对这种情况,他提出了马尔可夫预测方法,该方法具有较高的科学性,准确性和适应性,在现代预测方法中占有重要地位。 基础理论在自然界和人类社会中,事物的变化过程可分为两类:一类是确定性变化过程;另一类是不确定性变化过程。确定性变化过程是指事物的变化是由时间唯一确定的,或者说,对给定的时间,人们事先能够确切地知道事物变化的结果。因此,变化过程可用时间的函数来描述。不确定性变化过程是指对给定的时间,事物变化的结果不止一个,事先人们不能肯定哪个结果一定发生,即事物的变化具有随机性。这样的变化过程称为随机过程一个随机试验的结果有多种可能性,在数学上用一个随机变量(或随机向量)来描述。在许多情况下,人们不仅需要对随机现象进行一次观测,而且要进行多次,甚至接连不断地观测它的变化过程。这就要研究无限多个,即一族随机变量。随机过程理论就是研究随机现象变化过程的概率规律性的。客观事物的状态不是固定不变的,它可能处于这种状态,也可能处于那种状态,往往条件变化,状态也会发生变化状态即为客观事物可能出现或存在的状况,用状态变量表示状态:它表示随机运动系统,在时刻所处的状态为。状态转移:客观事物由一种状态到另一种状态的变化。设客观事物有 共 N种状态,其中每次只能处于一种状态,则每一状态都具有N个转向(包括转向自身),即由于状态转移是随机的,因此,必须用概率来描述状态转移可能性的大小,将这种转移的可能性用概率描述,就是状态转移概率。概率论中的条件概率:P(AB)就表达了由状态 B 向状态 A 转移的概率,简称为状态转移概率。对于由状态 Ei 转移到状态Ej 的概率,称它为从 i 到 j 的转移概率,即为:它表示由状态Ei 经过一步转移到状态Ej 的概率。状态转移概率矩阵具有如下特征:通常称矩阵 P 为 状态转移概率矩阵,没有特别说明步数时,一般均为一步转移概率矩阵。矩阵中的每一行称之为概率向量。状态转移概率的估算方法有两种:主观概率法和统计估算法。状态转移概率矩阵完全描述了所研究对象的变化过程。正如前面所指出的,上述矩阵为一步转移概率矩阵。对于多步转移概率矩阵,可按如下定义解释:若系统在时刻处于状态,经过 n 步转移,在时刻处于状态j。那么,对这种转移的可能性的数量描述称为n步转移概率。记为:并令称 为 n 步转移概率矩阵。多步转移概率矩阵,除具有一步转移概率矩阵的性质外,还具有以下的性质:记为过程的开始时刻, ,则称为初始状态概率向量。已知马尔科夫链的转移矩阵以及初始状态概率向量,则任一时刻的状态概率分布也就确定了:对,记,则由全概率公式有:,若记向量则上式可写为,由此可得在马尔可夫链中,已知系统的初始状态和状态转移概率矩阵,就可推断出系统在任意时刻可能所处的状态。现在需要研究当 k 不断增大时, 的变化趋势。 一、平稳分布 预备定义:如存在非零向量,使得:,其中P为一概率矩阵,则称 X 为 P 的固定概率向量。特别地,设 为一状态概率向量, P为状态转移概率矩阵,若即:称 X 为该马尔可夫链的一个平稳分布性质。若随机过程某时刻的状态概率向量 P(k) 为平稳分布,则称过程处于平衡状态。 (X P = X)一旦过程处于平衡状态,则经过一步或多步状态转移之后,其状态概率分布保持不变,也就是说,过程一旦处于平衡状态后将永远处于平衡状态。对于所讨论的状态有限(即N个状态)的马尔可夫链,平稳分布必定存在。特别地,当状态转移矩阵为正规概率矩阵时,平稳分布唯一。方法改进马氏链预测对象要求具有马氏链和平稳过程等均值的特点,而客观世界中的预测问题大量是随时间变化或呈某种变化趋势的非平稳过程如果采用灰色GM(l,l)模型对预测问题的时序数据进行拟合,找出其变化趋势,则可以弥补马氏链预测的局限。算法应用当实际问题可以用马尔可夫链来描述时,首先要确定它的状态空间及参数集合,然后确定它的一步转移概率。关于这一概率的确定,可以由问题的内在规律得到,也可以由过去经验给出,还可以根据观测数据来估计。例1:某计算机机房的一台计算机经常出故障,研究者每隔 15 分钟观察一次计算机的运行状态,收集了24小时的数据(共作97次观察)。用1 表示正常状态,用0 表示不正常状态,所得的数据序列如下: 11100100111111 10011110111111001111111110001101101 11101101101011110111011110 1111110011011111 100111 解 设Xn(n=1,97)为第n个时段的计算机状态,可以认为它是一个时齐马氏链,状态空间E=0,1,编写如下Matlab程序:a1= 1110010011111110011110111111001111111110001101101;a2= 111011011010111101110111101111110011011111100111 ;a= a1 a2;f00=length(findstr(00,a) f01=length(findstr(01,a) f10=length(findstr(10,a) f11=length(findstr(11,a) 或者把上述数据序列保存到纯文本文件data1.txt中,存放在Matlab下的work子目录中,编写程序如下:Clc,clearclc,clear -209- format rat fid=fopen(data1.txt,r); a=; while (feof(fid) a=a fgetl(fid); end for i=0:1 for j=0:1 s=int2str(i),int2str(j); f(i+1,j+1)=length(findstr(s,a); end end fs=sum(f); for i=1:2 f(i,:)=f(i,:)/fs(i); end f 求得96 次状态转移的情况是: 0 0 ,8 次; 1 0 ,18次; 0 1 ,18次; 1 1 ,52次, 因此,一步转移概率可用频率近似地表示为 例2: 设一随机系统状态空间,记录观测系统所处状态如下: 4 3 2 1 4 3 1 1 2 3 2 1 2 3 4 4 3 3 1 1 1 3 3 2 1 2 2 2 4 4 2 3 2 3 1 1 2 4 3 1 若该系统可用马氏模型描述,估计转移概率解 首先将不同类型的转移数n统计出来分类计入下表 各类转移总和等于观测数据中马氏链处于各种状态次数总和减1,而行和n是系统从状态i转移到其他状态的次数,n是由状态i到状态j的转移次数,则p的估计值p=.计算得Matlab计算程序如下:format rat clc a=4 3 2 1 4 3 1 1 2 3 . 2 1 2 3 4 4 3 3 1 1 . 1 3 3 2 1 2 2 2 4 4 . 2 3 2 3 1 1 2 4 3 1; for i=1:4 for j=1:4 f(i,j)=length(findstr(i j,a); end end f ni=(sum(f) for i=1:4 p(i,:)=f(i,:)/ni(i); end 例3:(带有反射壁的随机徘徊)如果在原点右边距离原点一个单位及距原点s ( s1)个单位处各立一个弹性壁。一个质点在数轴右半部从距原点两个单位处开始随机徘徊。每次分别以概率 )p ( 0p1 )和q(q=1-p)向右和向左移动一个单位;若在+1处,则以概率p 反射到2 ,以概率 q 停在原处;在 s 处,则以概率 q 反射到 1 s ,以概率 p 停在原处。设表示徘徊n步后的质点位置。,n=1,2,是一个马尔可夫链,其状态空间E=1,2,,s,写出转移矩阵P.因此,P为一个s介方程,即定理1 (柯尔莫哥洛夫开普曼定理)设,n=1,2,是一个马尔可夫链其状态空间E=1,2,,则对任意正整数m,n有其中的I,jE定理2 设P是一个马氏链转移矩阵(P的行向量是概率向量),P是初始分布行向量,则第n步的概率分布是。例4 若顾客的购买是无记忆的,即已知现在顾客购买情况,未来顾客的购买情况不受过去购买历史的影响,而只与现在购买情况有关。现在市场上供应 A,B,C 三个不同厂家生产的50 克袋状味精,用“=1”,”=2”,”=3分别表示“顾客第n次购买A,B,C厂的味精”。显然,n=1,2是一个马氏链。若已知第一次顾客购买三个厂味精的概率依次为0.2,0.4,0.4.又知道一般顾客购买的倾向由表2给出。求顾客第四次购买各家味精的概率。2.3转移概率的渐近性质极限概率分布现在我们考虑,随着n的增大,P是否会趋于某一固定量?先考虑一个简单例子:又若取 , 则 为矩阵的对应于特征值=1 的特征 (概率)向量,u也称为P的不动点向量。哪些转移矩阵具有不动点向量?为此我们给出正则矩阵的概念。定义4 一个马氏链的正则矩阵P是正则的,当且仅当存在正整数k,使P的每一个元素都是正数。定理3若P是一个马氏链正则阵,那么:1. P有唯一的不动点向量W,W的每个分量为正。2. P的n次幂p(n为正整数)随n的增加趋于矩阵,的每一行向量均等于不动点向量例5 信息的传播 一条新闻在 等人中间传播, 传播的方式是 传给 , 传给,如此继续下去,每次传播都是由 传给。每次传播消息的失真概率是,即 将消息传给 时,传错的概率是p,这样经过长时间传播,第n个人得知消息时,消息的真实程度如何? 设整个传播过程为随机转移过程,消息经过一次传播失真的概率为p,转移矩阵P是正则矩阵。又设V 是初始分布,则消息经过n次传播后,其可靠程度的概率分为 。 一般地,设时齐马氏链的状态空间为E,如果对于所有, ,转移概率存在极限 或则称此链具有遍历性。又若 ,则同时称为链的极限分布。 下面就有限链的遍历性给出一个充分条件。 定理 4 设时齐(齐次)马氏链 的状态空间为 ,是它的一步转移概率矩阵,如果存在正整数m,使对任意的 都有则此链具有遍历性;且有极限分布它是方程组 的满足条件的唯一解。 例6 根据例5 中给出的一般顾客购买三种味精倾向的转移矩阵,预测经过长期的多次购买之后,顾客的购买倾向如何? 解 这个马氏链的转移矩阵满足定理 4 的条件,可以求出其极限概率分布。为此,解下列方程组:编写如下的 Matlab 程序: format rat p=0.8 0.1 0.1;0.5 0.1 0.4;0.5 0.3 0.2; a=p-eye(3);ones(1,3); b=zeros(3,1);1; p_limit=ab或者利用求转移矩阵的转置矩阵 的特征值 1 对应的特征(概率)向量,求得极限概率。编写程序如下: p=0.8 0.1 0.1;0.5 0.1 0.4;0.5 0.3 0.2; p=sym(p); x,y=eig(p) for i=1:3 x(:,i)=x(:,i)/sum(x(:,i); end x这说明,无论第一次顾客购买的情况如何,经过长期多次购买以后, A厂产的味精占有市场的 , C B, 两厂产品分别占有市场的 。2.4 吸收链 马氏链还有一种重要类型吸收链。 若马氏链的转移矩阵为.P的最后一行表示的是,当转移到状态 4 时,将停留在状态 4,状态 4 称为吸收状态。 如果马氏链至少含有一个吸收状态,并且从每一个非吸收状态出发,都可以到达某个吸收状态,那么这个马氏链被称为吸收链。 具有r个吸收状态,个非吸收状态的吸收链,它的转移矩阵的标准形式为其中 为r阶单位阵,O为 rs 零阵,R为 s r 矩阵,S 为 s s 矩阵。从(4)得(5)式中的子阵 表示以任何非吸收状态作为初始状态,经过n步转移后,处于S个非吸收状态的概率。 在吸收链中,令,则F 称为基矩阵。 对于具有标准形式(即(4)式)转移矩阵的吸收链,可以证明以下定理: 定理 5 吸收链的基矩阵F 中的每个元素,表示从一个非吸收状态出发,过程到达每个非吸收状态的平均转移次数。定理 6 设 N=FC ,F 为吸收链的基矩阵, ,则N 的每个元素表示从非吸收状态出发,到达某个吸收状态被吸收之前的平均转移次数。 定理 7 设B=FR=(),其中F 为吸收链的基矩阵,R为(4)式中的子阵,则 ij 表示从非吸收状态i出发,被吸收状态 j吸收的概率。例7 智力竞赛问题 甲、乙两队进行智力竞赛。竞赛规则规定:竞赛开始时,甲、乙两队各记 2 分,在抢答问题时,如果甲队赢得 1 分,那么甲队的总分将增加 1分,同时乙队总分将减少 1 分。当甲(或乙)队总分达到 4分时,竞赛结束,甲(或乙)获胜。根据队员的智力水平,知道甲队赢得 1 分的概率为 p,失去 1 分的概率为 p 1 ,求: (i) 甲队获胜的概率是多少?(ii)竞赛从开始到结束,分数转移的平均次数是多少?(ii) 甲队获得 1、2、3 分的平均次数是多少?分析 甲队得分有 5 种可能,即 0、1、2、3、4,分别记为状态其中和 是吸收状态, 是非吸收状态。过程是以 作为初始状态。根据甲队赢得 1分的概率为 p,建立转移矩阵:将(6)式改记为标准形式:其中,计算其中因为 是初始状态,根据定理 5,甲队获得 1,2,3 分的平均次数为,。又根据定理 6,以a 为初始状态,甲队最终获胜的分数转移的平均次数为又因为根据定理 7,甲队最后获胜的概率Matlab 程序如下: syms p q r=q,0;0,0;0,p; s=0,p,0;q,0,p;0,q,0; f=(eye(3)-s)(-1);f=simple(f) n=f*ones(3,1);n=simple(n) b=f*r;b=simple(b) 应用马尔可夫链的计算方法进行马尔可夫分析, 主要目的是根据某些变量现在的情况及其变动趋向,来预测它在未来某特定区间可能产生的变动,作为提供某种决策的依据。 例8(服务网点的设置问题)为适应日益扩大的旅游事业的需要,某城市的甲、乙、丙三个照相馆组成一个联营部,联合经营出租相机的业务。游客可由甲、乙、丙三处任何一处租出相机, 用完后, 还在三处中任意一处即可。 估计其转移概率如下表所示: 今欲选择其中之一附设相机维修点,问该点设在哪一个照相馆为最好? 解 由于旅客还相机的情况只与该次租机地点有关,而与相机以前所在的店址无关, 所以可用 表示相机第n次被租时所在的店址; “=1 ” 、 “=2” 、 “ =3”分别表示相机第n次被租用时在甲、乙、丙馆。则是一个马尔可夫链,其转移矩阵P由上表给出。考虑维修点的设置地点问题,实际上要计算这一马尔可夫链的极限概率分布。 转移矩阵满足定理 4 的条件,极限概率存在,解方程组得极限概率由计算看出,经过长期经营后,该联营部的每架照相机还到甲、乙、丙照相馆的概率分别为 由于还到甲馆的照相机较多,因此维修点设在甲馆较好。但由于还到乙馆的相机与还到甲馆的相差不多,若是乙的其它因素更为有利的话,比如,交通较甲方便,便于零配件的运输,电力供应稳定等等,亦可考虑设在乙馆。 马尔可夫预测法还适合以下应用. 1. 在英国,工党成员的第二代加入工党的概率为 0.5,加入保

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论