对于一步转移概率矩阵收敛快慢问题的解答_第1页
对于一步转移概率矩阵收敛快慢问题的解答_第2页
对于一步转移概率矩阵收敛快慢问题的解答_第3页
对于一步转移概率矩阵收敛快慢问题的解答_第4页
对于一步转移概率矩阵收敛快慢问题的解答_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、对于一步转移概率矩阵收敛快慢问题的解答一、问题描述一步转移概率矩阵收敛有快慢之分,请给出判断矩阵收敛快慢的解决方案。二、问题解答假设初始状态为X,一步转移概率矩阵为P,则根据马尔可夫过程理论可知:当nN(N为一个足够大的常数)时,XPn=Y其中Y是一个稳定行向量。由例1.7得:假设X为初始状态,一步转移概率矩阵为P,则n01.0000000r0.33330.33330.333300AP=A*00.33330.33330.33330000.33330.33330.33330001.00000=(0.09090.27270.27270.27270.0909)其中n=38.r01.000000n0.

2、33330.33330.333300P=00.33330.33330.33330000.33330.33330.33330001.000000.09090.27270.27270.27270.09090.09090.27270.27270.27270.09090.09090.27270.27270.27270.09090.09090.27270.27270.27270.09090.09090.27270.27270.27270.0909其中n=38。同样由例1.12得:假设X为初始状态,一步转移概率矩阵为P,则0.50000.500000_nr1.0000000AP=A*00.33330.66

3、6700.500000.50000=(0.66670.333300)其中n=25.而0.50000.500000_npn=.1.000000000.33330.666700.500000.500000.66670.3333000.66670.3333000.66660.33330.000000.66660.33330.00000其中n=25。经过一系列验证,可以得出:结果的稳定性与初始状态X无关,只与一步转移概率矩阵P有关。并且矩阵收敛后,行和为1,每列上的值为相同值。而最终概率分布结果也是矩阵收敛后的一行。以下对最终概率分布结果也是矩阵收敛后的一行作简要的证明:设初始概率分布X=(plp2p

4、3pn),则p1+p2+pn=1.收敛后的一步转移概率矩阵Pn=ala2a3.anala2a3.已门ala2a3.bn其中a1+a2+an=1.易得最终概率分布Y=XPn-(p1+p2+pn)a1(p1+p2+pn)a2(p1+p2+pn)an=a1a2an得证。在研究上面一类矩阵的同时,也对另一类矩阵进行了研究,如下:1.0000n00000100001000001000010000010000100000100001该矩阵不会收敛为每一列为同一个值。2.696000.01000.01000.01000.oioo-n0.20000.20000.20000.20000.20000.01000.

5、96000.01000.01000.0100u.20000.20000.20000.20000.20000.01000.01000.96000.01000.0100=u.20000.20000.20000.20000.20000.01000.01000.01000.96000.01000.20000.20000.20000.20000.20000.01000.01000.01000.01000.960020000.20000.20000.20000.2000,其中n=189.3.0.01000.01000.96000.01000.oio(Tn0,20000.20000.20000.20000.

6、20000.01000.96000.01000.01000.0100IJ.20000.20000.20000.20000.2000Q01000.01000.01000.01000.9600=120000.20000.20000.20000.20000.96000.01000.01000.01000.0100LL20000.20000.20000.20000.20000.01000.01000.01000.96000.0100120000.20000.20000.20000.2000,其中n=189.经过一系列的测试,得出这类矩阵也可以收敛,只不过收敛速度比较慢。而单位阵等一些矩阵,暂且总称为类

7、单位阵(每一列上都有1出现),它们不存在收敛的性质,是以上测试矩阵的极限状态。由以上两个结论得出以下猜想:每一列比较均匀的矩阵收敛的速度较快;与类单位阵类似的矩阵收敛的速度较慢。而两种极限情况分别是:列相同矩阵已经是收敛结果,类单位阵不会收敛。从概率意义上来说,两种极限情况是可以解释的。令s2=(s12+s22+sn2)/n,显然s2=0.列相同矩阵表达的含义是:不同的当前状态到下一步每一状态概率都是相同的,所以下一次每个状态都达到了稳定。类单位阵表达的含义是:当前不同状态到下一步要么不改变状态要么必定转移到某一固定状态。也就是说,下一步状态转移的概率是1或0,也就不存在概率的研究意义。根据以

8、上的猜想,提出了两种刻画矩阵收敛速度的方法。方法一:方差法(王文杰提出)由列相同矩阵出发,刻画某一矩阵与列相同矩阵的相似程度,从而判断出矩阵的收敛快慢。假设矩阵P=alla12alna21a22a2nanlan2ann,令v1,v2vn为每一列的平均值。则可计算出:第1列的方差:S12二(a11-v1)2+(a21-v1)2+(an1-v1)2/n第2列的方差:S22=(a12-v122+(a22-v2)2+(an2-v2)2/n第n列的方差:sn2=(a1n-vn)2+(a22-vn)2+(ann-vn)2/nS2就是方差法用来刻画一步转移概率矩阵收敛快慢的量。当s2=0时,取最小值,此时一

9、步转移概率矩阵每一列都相同,是矩阵收敛最快的极限。当s2=(n-1)/n2时,取最大值,矩阵为类单位阵,是矩阵收敛最慢的极限。所以,n阶一步一转移概率矩阵的S2值越小,矩阵收敛越快,反之,矩阵收敛越慢。以下是收敛速度与S2的关系示意图:Pl=01.00000000.33330.33330.33330000.33330.33330.33330000.33330.33330.33330001.00000L矩阵收敛指数11_J110F用之前的5阶矩阵进行验证:S2(P1)=0.07022,而当n=38时矩阵收敛。0.96000.01000.01000.01000.0100_P2=0.01000.96

10、000.01000.01000.01000.01000.01000.96000.01000.01000.01000.01000.01000.96000.01000.01000.01000.01000.01000.9600S2(P2)=0.14440,而当n=189时矩阵收敛。1000001000P3=001000001000001S2(P3)=(5-1)/(n*n)=0.16000,该矩阵不会收敛。由以上三个矩阵可以得出S2(P1)S2(P2)P2p3。经过其他矩阵的验证,该方法可以刻画矩阵收敛的快慢。下面证明该方法的正确性。证明:方差是用来描述一系列数值的差异程度的量。各个数值相差越大,方差

11、越大;各个数值相差越小,方差越小。当各个数值相同时方差为0。而矩阵中,每一列方差可以刻画该列数值的相差程度。当某列方差为0时,表示该列值相等。而总的方差是各方差之和的均值,所以方差法可以刻画整个矩阵每一列的差异程度,即方差法可以刻画一个矩阵与列相等矩阵的相似程度。方法二:行列式值法(周文为提出)由类单位阵出发,刻画某一矩阵与类单位阵的相似程度,从而判断出矩阵的收敛快慢。假设一步转移概率矩阵为P,用det(P)就可以刻画矩阵收敛的快慢。当矩阵的行列式的绝对值为1时,矩阵为类单位阵,不会收敛,是收敛最慢的极限。当矩阵行列式为0时,是收敛最快的极限。所以,矩阵行列式值越接近1,越与类单位阵类似,稳定

12、速率越慢。矩阵的行列式值越接近0,收敛越快。以下是收敛速度与det(P)的关系示意图:用之前的5阶矩阵进行验证:01.0000000Pl=0.33330.33330.33330000.33330.33330.33330000.33330.33330.33330001.00000det(P1)=0.0370,而当n=38时矩阵收敛。0.96000.01000.01000.01000.0100_P2=0.01000.96000.01000.01000.01000.01000.01000.96000.01000.01000.01000.01000.01000.96000.01000.01000.01

13、000.01000.01000.9600det(P2)=0.8145,而当n=189时矩阵收敛。1000001000P3=001000001000001det(P3)=1.0000,该矩阵不会收敛。而稳定后的行列式的值为0。由以上矩阵可以得出0det(P1)det(P2)P2p3。经过其他矩阵的验证,该方法可以刻画矩阵收敛的快慢。下面证明该方法可以刻画矩阵与类单位阵的相似程度。证明:a.对于2阶矩阵P2=a11a12a21a22得det(P)=a11*det(c(11)+a12*det(c(12)=a11*a22-a12*a21其中c(ij)=(-1)j*m(ij),m(ij)是aij的余子式

14、。即两个对角线上的积作差。对于与类单位阵形似的矩阵可能出现a11*a22-1、a12*a21-0或者a11*a22-0、a12*a21-1两种情况,所以|det(P2)卜1。所以,与类单位阵形似二阶矩阵可以表示为较大两项积与其他较小项积的运算,对于二阶矩阵该运算为减法。由于,与类单位阵形似二阶矩阵其他项很小,所以|det(P2)|约为较大两项之积。b.假设n阶与类单位阵形似矩阵Pn,|det(Pn)|约为某些值比较大的项的乘积。则对于n+1阶与类单位阵形似矩阵P(n+1),|det(P(n+1)|二a11*det(c(11)+a12*det(c(12)+a1n*det(c(1n)其中c(ij)为n阶n阶与类单位阵形似矩阵Pn,即det(c(ij)约等于某些值比较大的项的乘积。在矩阵P(n+1)中,选取其中a1j最大者alm,其余第一行项接近0,得|det(P(n+1)|-a1m*det(c(1m),即|det(P(n+1)|

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论