第四章随机过程.doc_第1页
第四章随机过程.doc_第2页
第四章随机过程.doc_第3页
第四章随机过程.doc_第4页
第四章随机过程.doc_第5页
免费预览已结束,剩余40页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

张学文:气象预告问题的信息分析 第四章 随机过程(已经编辑到115页2008-3-20)第四章 随机过程(电子版:盛艳霞OCR,编辑张学文 2007.12 -2008.01)1. 随机过程的概念及其分布律第四章 随机过程为了从统计角度研究气象要素随时间和空间的变化,最好是利用近数十年发展起来的一个统计数学分支-随机过程和随机场理论。为研究气象信息随时间和空间的分布也要对随机过程有所了解。针对如上情况我们在这一章对随机过程的有关概念、性质和在气象上的个别应用作简要介绍。1、 随机过程的概念及其分布律孤立的研究各点的气压、温度或风等气象要素时,我们把它看成随机变量(矢量)。这时可以分析它的期望值、方差、概率分布等等。然而当把不同时刻的同一点的气压、温度或风连贯起来看时,这就是一连串的随机变量(矢量)。它们以时间为参数而有所变化。随机变量随某一参数(这里指时间)的变化给人们以过程的概念。所以就把随机变量随参数值的变化而变化的过程这一总体称为随机过程。当掷骰子时,骰子出现的点数是随机变量。某次“3”点向上,就说这一次随机变量取值为3。而我们所谓的随机变量远不仅只有一个“3”,而应理解为很多次点子数的集合。同样地,随机过程一词也是指一个总体集合,而不是仅指某一时段的变量取值。例如说“春季北京的气温是一个随机过程”,则是指很多很多年的每年春季北京的气温的变化过程这个总体而言的。如1978年北京春季气温的变程仅是总体中的一个个例。它在随机过程中的地位和骰子为“3”点在随机变量中的地位是相当的。我们把这一条春季气温曲线称为这个随机过程的一个“现实”这样一个随机过程实际上是由无数具有同一的统计属性的现实组成的。图4.1是乌鲁木齐冬季1月份的四年的气温曲线。它们就代表了1月气温这个随机过程的四个现实。而这一随机过程应为无数条这种曲线组成。如以T示表气温,y代表年代,d代表日期,则一个随机过程可以表示为T=T(y,d) (41)图4.1 乌鲁木齐1月份气温曲线、式中y有固定值时,例如y=1963年,则得到随机过程的一个现实。如d取固定值(如d=1)则T表示不同年份的这一天(元旦)的气温。这时同一d值不同y值的气温实为一随机变量。时常把这同一的时间d叫作“截口”。所以一个随机过程在任一截口上表现为一个随机变量。又如随机过程X为X=asint+bcostX=X(a,b,t) (4.2)此式中a,b为随机变量。对某一确定的现实而言,a,b这两个随机变量就取确定值。这时t不同则X就表现为由一个正弦曲线与另一振幅不同的余弦曲线合成的一条曲线。它就是一个现实。反之,当t固定为 t0时(在截口t0上)不同现实就有不同的a和b值。这时X就表现为一个随机变量了。与前例相比,此处a,b对应于y,t对应于d,X对应于T。气象台站经常分析的各种气象要素的时间演变曲线,都可视为各要素的随机过程的一些现实。如在某一固定时刻不仅仅只有一个气象要素值,而是一个要素场。这时此要素场随时间的变化变称为随机场。某年1月份或一个季节的500毫巴逐日天气图就是随机场的一个现实。随机过程在每个截口上既然都成了随机变量,所以在每个截口,此变量就也有概率分布。这常称为一维概率分布。如在两个截口(t1,t2)上则这两个变量的联合概率分布称为随机过程的二维概率分布。对一个随机过程来说仅了解一维或二维的概率分布尚不能对它的统计特性全部了解清楚。我们可以仿前再研究大于二维的任意n维的概率分布律。不过由于随机过程有无数截口,因而从原则上讲任何有限维数的分布律都不能对随机过程的统计特性作完备的描叙。这也表明了随机过程的概率分布律问题是十分复杂的问题。但是地某些随机过程有时可以用有限维的概率分布律描叙之。例如对正态分布的随机过程只要知道二维分布律就够了。2、 随机过程的数学期望及相关函数,两个随机过程的互相关函数由于直接研究随机过程的概率分布规律有困难,因而人们常把研究随机变量时用的求期望值、求相关矩等方法用于随机过程上,以大量简化问题。随机过程X(t)的数学期望Ex(t)为Ex(t)=EX(t) (4.3)此处EX(t)表示在每一截口t上对随机过程X的各种取值(是随机变量)作数学期望运算。即当随机过程的一维分布f(x,t)已知时有 (4.4)一般而言Ex是参量t的函数。随机过程的方差Dx(t )由下式定义 (4.5)用气象上的术语说,就是方差为距平值平方的数学期望。即 (4.6)对两个不同的随机过程来说,它们的数学期望和方差随时间的变化相同并不等于这个随机过程的统计属性相同。图4.2就表示了这种情况。这里两个过程的期望(方差)值是相同的,但各自的不同时间之间的变量值的相关矩是不同的。相关矩随时间而变化的这个函数叫随机过程的自相关函数Kx(t,t)简称相关函数。它由下式决定:(4.7) 图4.2 数学期望和方差相同的两个随机过程式中x(t)即在t时刻的X值(取在与x同一个现实上的)。F(x,x,t,t)即在截口t和t上变量x和x的二维概率分布密度。如用距平(中心化了的随机变量)表示,则可再简化为 (4.8)x0=x(t)-Ex(t), 即为距平。有时为消除量纲和便于计算比较,把自相关函数在t和t时的x的标准差(方差开平方)去除而得 (49)由于它实际上是t和t时刻的x的相关系数,它变动于+1到-1之间,故常称之为标准化了的自相关函数。对当t=t不难得=Dx(t) (4.10)所以相关函数的概念已经包括了方差的概念。自相关函数的概念表达了一个随机过程不同截口上取值的相关性。这一概念也可以扩大到两个不同的随机过程中去。以表示两个随机过程不同截口取值的关连性。这时把两个随机过程X(t),Y(t)的相关函数称为互相函数。它由下式(4.11)决定式中f(x,y,t,t)是x(y)在截口t(t)取值的概率分布密度。类似地也有标准化了的互相关系数Rxy (4.12)它也仅变动于+1到-1之间。相关函数显然有对称性 (4.13)对互相关函数类似有 (4.14)如果我们分析例如各年5月1日的气压与5月2日、3日、4日的气压的相关矩的变化,它实际上就是一个随机过程(气压)的自相关函数。如研究气压与气温的如上各日的相关矩的变化,则就是研究气压和气温这两个随机过程的互相关函数。这一类例子在介绍平稳过程时再给出图例。3、随机过程的运算气温、降水的逐日变化我们可以视为随机过程来研究。那么像滑动平均的气温、降水(如滑动的时间长度为一候、一旬、一个月等)随时间的变化当然也可以视为另一些随机过程来研究。现在问这些不同的随机过程之间有什么关系?!它们的数学期望和相关函数又有什么关系?显然如果我们对日气温这一随机过程作了充分研究,并且知道它与候、旬、月气温这些随机过程的统计特性有什么关系,那么直接从日气温的规律中推算出长、中期预告常用的这些候、旬、月气温的统计规律,这就可以克服长期预告中经常遇到的统计样本不足的困难。这一类问题还可以举出很多,它们都可归入随机过程的运算问题而统一研究之。现把一些常用计算介绍一下。设随机过程X(t)为两个随机过程X1(t), X2(t)之和,那么X(t)的数学期望和相关函数分别 (415) (416)式中右下标号“1”、“2”、“1,2”等分别代表x1,x2和x1与x2等。如果X(t)是n个随机过程的和则有 (417) (418)如各Xi,Xj彼此独立,则在ij时有Kx,j=0,这时上式简化为 (4.19)如对随机过程X(t)进行微分得另一随机过程Y(t),即则Y的数学期望Ey(t)和相关函数Ky(t, t) 与X的数学期望Ex(t )和Kx(t, t)有如下关系 (4.20) (4.21)4、马尔科夫过程(1)马尔科夫过程的定义随机过程这一概念本身反映了人们对变量X在不同时刻的取值的关系很重视。马尔科夫过程就是一种前后有联系,而这种联系又比较简单的一种随机过程。它的基本含义就是一个随机过程的未来状态仅与已知的最后时刻处于什么状态有关,而与更早的状态无关。如以x1,x0,x-1,x-2分别代表随机过程X(t)在t1, t0, t-1, t-2时刻的值,则马尔科夫过程就是指满足如下概率关系的过程(4.22)这是一个条件概率的式子,它表明已知x0时,下一时刻的x值的条件概率分布等于t=t0, t=t-1, t=t-2,甚至更早时刻的x值为已知时所得的条件概率。人们常称马尔科夫过程是无后效后。这是指这种过程的历史状态对未来状态的影响全部集中于最后时刻的状态中。历史状态不会对这一过程的未来状态提供比最后已知时刻的状态更多的信息。如马乐科夫过程的状态仅取离散的状态,时间也是仅取等步长的间隔,则这种状态离散、时间离散的马尔科夫过程称为马尔科夫链。严格地说以上定义的仅是简单的(一重的)马尔科夫链。如其条件概率与前两个(n个)状态有关,则称为二重(n重)马尔科夫链。在数学上可以将它们变成一重马尔科夫链来处理27。如前叙的条件概率只与序列的相对位置有关,而与时间的绝对位置无关时,则说它有时齐性(与以后讲的平稳性是一致的)。这样对于有时齐性的马尔科夫链有下面的等式(4.23)当分析气象问题时因不同季节条件概率常有差别,所以气象问题不一定满足时齐性关系。不过有时我们近似的认为在某一不长时段中具有此性质。而在不同时段选用不同的条件概率。一个序列如是马尔科夫链,常说它有马尔科夫性质。(2)马尔科夫链的转移阵如果X一共有k个状态E1,E2,Ek。现以pij代表已知前一时刻X 处于Ei状态,下一时刻它处于Ej状态的条件概率。那么由于i和j各有k个取值,故pij有kk个取值。我们可以用之组成一个表示状态转移的条件概率矩阵pij。即有 (4.24)由于从任一状态Ei出发必然转变成E1,E2,Ek中的一个状态。所以矩阵中每一行与一个完备事件对应。这样在一行的条件概率之和为1。即有 (4.25)由于条件概率都0,故转移矩阵中每一元素都0。(3)卡普曼-哥尔莫哥洛夫方程和高阶转移矩阵马尔科夫过程虽然是历史对未来的全部影响集中于已知的最后时刻的状态中,但什么是最后,在不同场合却可以不同。如逐日的晴雨转移具有马尔科夫性质时,则就意味着明天的晴雨仅与今天的状态有关,而与昨天的晴雨无关。但研究后天的晴雨状况时,我所已知的最后时刻的状态就不是与后天相隔一个时间步长,而是两个时间步长(两天)了。这时马尔科夫性质体现为两个时间步长后的状态仅与现状有关,而与更早的状态无关。这里本来明天的状态与后天的状态关系更大,但因为尚不知明天状况,所以已知的最后状态就与后天隔了两个时间步长。我们已知有了相隔一个时间步长的条件概率的转移矩阵,现在来研究相隔为n个时间步长的条件概率pij(n)的性质。为此我们把n步的转移分解为m步和n-m步(m0,并小于n),从而得图4.3。图中从左向右表示X的依时序的取值。在最初它处于Ei状态,经m步转移以后它可能处于E1,E2Ek中任一状态。再经n-m步(共经n步)到达Ei状态。从Ei经m步到Er状态再经n-m步到Ej状态的概率现以pirj(n)表示之。由于这是马尔科夫链,所以它从Er经n-m步转入Ej的概率是一它在前m步中从何种状态转入Er状态的概率是独立无关的。故可应用概率乘法定理而有 (0mn) (4.26)经n步从Ei到Ej状态时在第m步时依图4.3可以有k个状态(途径)。故用概率加法定理于图4.3场合可得 (0mn) (4.27)这个把不同步长转移概率联系起来的公式常称为卡普曼-哥尔莫哥洛夫方程。图4.3 n步转移的分解如令m=1则上式变成(4.28)显然pir(1)就是最初讨论的一步转移概率pij。对pij(n)常称为n阶转移概率。由于i和j分别有n个不同值,故由133原书91-132页表4.3 乌鲁木齐4月降水有五实况(1951-1964年,* 代表有降水)年份51525354555657585960616263644月1日*4月2日*4月3日*4月4日*4月5日*4月6日*4月7日*4月8日*4月9日*4月10日*4月11日*4月12日*4月13日*4月14日*4月15日*4月16日*4月17日*4月18日*4月19日*4月20日*4月21日*4月22日*4月23日*4月24日*4月25日*4月26日*4月27日*4月28日*4月29日*4月30日*5月1日*5月2日*5月3日*5月4日*5月5日*5152535455565758596061626364pij就又组成了一个n阶转移矩阵 (4.29)注意到矩阵乘法的规则,方程(4.28)就可以用矩阵自乘全部表示出来。从而有 (4.30)逐步应用此关系可以进而得出n阶转移阵Pij(n)为一阶转移阵Pij的n次自乘。即Pij(n)= Pijn (4.31)所以只要有了一步转移矩阵,自乘n次即得n 阶转移矩阵。(4)气象上马尔科夫链的例子马尔科夫过程应用于气象上现在尚处于开始阶段。在早年就有苏联人对各种环流型的转换用马尔科夫链分析它。一般认为晴雨、旱涝、高温、低温等很多气象要素都可以从马尔科夫过程的角度分析28,25晴雨逐日的转换具有马尔科夫性质已被一些人研究过。现举一个乌鲁木齐的例子。表4.1是14年的4月份逐日降水有无实况。这里共有420个样本,我们以频率代替概率近似算得无降水概率 p(无)=0.74有降水概率 p(有)=0.26此外,我们还可以统计出已知前一天有无降水时当天出现降水或无降水的条件概率,以至前2-5天的天气状况已知时当日的降水有无的条件概率。这些条件概率的统计结果都列于表4.2中。它表示了从实际资料统计出来的一至五阶转移阵实况。表4.2 降水有无的前五阶转移实况当天有降水无有降水前1天一阶有降水(45/110)=0.41(65/110)=0.59无有降水(64/310)=0.21(246/310)=0.79前2天二阶有降水(32/110)=0.29(78/110)=0.71无有降水(79/310)=0.25(231/310)=0.75前3天三阶有降水(30/110)=0.27(80/110)=0.73无有降水(79/310)=0.25(231/310)=0.75前4天四阶有降水(28/110)=0.26(82/110)=0.74无有降水(73/310)=0.25(237/310)=0.76前5天五阶有降水(31/110)=0.28(79/110)=0.72无有降水(71/310)=0.23(239/310)=0.77如果这一降水序列有马尔科夫性质,那么用(4.31)式的矩阵自乘办法求得的理论的高阶转移阵就应当与实际算的表4.2资料相等。表4.3就是我们用(4.31)式算得的一、二、三、四、五阶转移阵。比较实际转移阵表4.2与假设具有马尔科夫性质后用矩阵自乘求得的表4.3可以看出它们几乎完全一样。这就说明了我们研究的随机过程具有马尔科夫性质。应当指出,用一阶移阵可作一个时间步长(现在为一天)的预告。用二、三、四、五阶的转移阵就可以作二、三、四、五个进间步长的预告。而不同时效的预告的这个关系转移阵之间的关系是严格遵守矩阵自乘的数学关系的。这是一个联系中、短期气象预告的严整统计数学关系。这里也引出了一个问题,即逐次自乘下去我们岂不是可以用它作长期预告了吗?实际上表4.3表身回答了这个问题。即随着自乘阶数的增加,转移阵逐步与初始状态无关了。这反映在表4.3中后3天(自乘3,4,5次)已经完全一样了。再注意一下表中的数字可以发现它们分别与降水有无的气候概率(0.26,0.74)完全相等。即随表4.3一阶转移阵的各次自乘着转移次数的增加,矩阵中处列趋于同一个数值。这个数值恰好是气候概率。用气象预告的语言说,就是预告本领随着时间的拉长而下降到与气候概率一致的水平上。表4.3 一阶转移阵的n次自乘当天有降水无有降水n=11次自乘有降水0.410.59无有降水0.210.79n=22次自乘有降水0.290.71无有降水0.250.75n=33次自乘有降水0.260.74无有降水0.260.74n=44次自乘有降水0.260.74无有降水0.260.74n=55次自乘有降水0.260.74无有降水0.260.74这个情况是这个特例独有的,还是有普遍性?极限定理回答了这个问题。(5)各态历经性质与极限定理各态历经也称遍历性,有时音译为挨尔过得(ergodic)是某些随机过程的重要性质。直观上可以理解为对于随机程的每一个现实而言,它的变迹(经历)中都要含有全部可能出现的状态中的任意一个状态,即所谓“遍历”、“各态历经”。对马尔科夫链来说,可理解为任一序列中,从任何状态经过有限步的转移到任意一个可能状态的转移概率大于零(不能等于零)。在上例中由于一阶转称阵中各元素都大于零,所以它就是具有各态历经性质的。但对其他的过程来说有时一阶转移阵中有的元素为零,而到了一个高阶阵时各元素皆大于零,这时仍是各态历经的。从矩阵乘法知,这时更高阶的转移阵的元素必然都大于零。对于具有各态历经性质的马尔科夫链有如下的极限定理 (4.32)存在。即转移阵的阶数n趋于无穷大时,转移阵中每列的数值变成完全一样了。在我们的问题中它就是气候概率,一般来说它就是无条件概率。对矩阵中每一个元素则对应有 (432)pj就是无条件概率。此式清楚地表明当n充分大时历史状况对未来就没有什么影响了。在我们的例子中实际n=3,4,5就已经是充分大了。这表明它趋于气候概率的速度很快。5、平稳随机过程从是否“平稳”的角度来划分随机过程对于研究它们有很大好处与方便。这里先对平稳随机过程作简单介绍。(1)平稳随机过程的定义对于一个随机过程X(t)来说,它在任意n个截口t1,t2,tn上如果X的取值的联合概率分布与t1+t2, 这n个截口上取值的联合概率分布相同,则说此随机过程的狭义平稳的。简言之,狭义平稳是说随机过程的任意维联合概率分布与时间的平移无关。如果随机过程在各截口上的数学期望为同一个常量,而自相关函数仅是时间间隔的函数则称为广义平稳随机过程。用数学式子可以对它表示为EX(t)=C (4.34) Kx(t,t)=Kx(t-t)Kx(t,t)= Kx () (4.35)例如某地1月份气压为一个随机过程。从统计上如得出多年平均的1月1日气压与1月10日的气压或任何其他日子的气压都相等,则就满足了(4.34)式。如果1日与5日的相关矩和5月与10日的相关矩相等。而且任意相隔五天的相关矩都相等以及任意相隔n天的相关矩的大小仅与n有关则就满足了(4.35)式。这样就说它是广义平稳随机过程。两个平衡随机过程如果它们的互相关函数也仅与时间间隔有关,则说它们是平稳关连的。我们以后如不另申明,则都是讨论广义平稳随机过程。在实际应用上一个随机过程是否是平稳固然可以用统计方法验证之,但常常多从物理上分析问题性质从而直接判断是否平稳。如1月份气温可以认为每天的平均值近于相等,而前后的相关性也与时间坐标位置无大关系。即可认为是平稳随机过程。图4.4是它的自相关函数的一个示例而春季气温每日平均值显然不等,故不是平稳的。但如分析它的距平值,则也可初步将距平值视为一个新的平稳随机过程。图4.4 乌鲁木齐1月份850毫巴气温的自相关函数(2)平稳随机过程的谱及其与相关函数的关系我们是可以从统计实验,例如掷硬币实验,中得到一批随机数的。但也可以随机数字表上得到它,近代我们还可以编好某些程序,让电了计算机产生大量具有某指定概率分布律的随机数29,30。对随机过程来说,也有类似的情况。下面就来研究一个简单构造随机过程的办法。设我们有一份平均值为零方差为1的正态分布的随机数字表(也可以让计算机生产之)。现从中任取两个独立的数a,b。我们利用它们在0到T的时间内构造一个三角函数x(t),即(4.36)这里x是以2/为周期的三角函数之和。我们说是人工构成的一个随机过程的一个现实。如对a和b进行多次抽样就可以构成很多个现实。从而也就组成了一个随机过程。显然这一随机过程在任一时间截口上的数学期望值为零。这样它就满足(4.34)条件。由于它的每一个现实上不同时刻x值的连系完全由三角函数的位相关系所决定,因而它的相关函数也很简单。依相关函数的定义再利用a和b的独立性及其期望值为零可以推得相关函数为 (4.37)这里D是a和b的方差,数值为1,=t-t。这一结果表明相关函数仅与时间差值有关,并为一与随机过程有相同频率的余弦函数。由于期望值为常数,相关函数仅与时间差有关满足(4.35)式所以这个人工构成的随机过程为一个广义平稳过程。对于客观存在的过程当然比上述例子复杂,不过我们可以用傅里叶级数来合成之,即一般有 (4.38)这里k为正整数,ak和bk的不同值可以构成在0到T的随机过程的各个现实。如各对ak和bk都彼此独立。数学期望为零,并且同一个k值的ak和bk有相同的方差,我们也可得一平稳随机过程。其相关函数为 (4.39)这样我们就可能粗浅地把随机过程的每个现实视为一个傅里叶级数。它由不同频率的三角函数所合成。它的各频率的振幅对每个现实来说是不变的,但对不同现实来说它是随机变量。以Dk为其方差。平稳随机过程的相关函数是一个确定性(不是随机的)的函数。它本身当然可以用傅里叶级数表示。而(4.39)式实际上正是它的傅里叶展开式。在=0时Kx()即为随机过程的方差D,故从(4.39)在即 (4.40)这表明此随机过程的方差为各个三角函数的振幅的方差之和。频率不同对应的方差的分布常称为方差谱。其示意图可见于图4.5中。已知相关函数Kx()时,可用下式求各Dk k=0时 (4.41) k=1,2,时 (4.41)图4.5 方差谱所以用(4.39)和(4.41)式可以把相关函数和方差谱互相换算。以上是讨论在有限时段0到T的情况。当随机过程为无限长时可令T。这时对应的方差谱就为每单位频率值中的平均的方差值所代替,这常称为频谱密度Sx()。对应傅里叶展开变成了傅里叶积分而有与前相似的关系。 (4.42) (4.43)这里相关函数与谱密度依然是可能互相换算的。对应的方差计算公式变成了 (4.44)(3)平稳随机过程的各态历经性质平稳随机过程也有与马尔科夫过程类似的各态历经性质。在图4.6中给出了两个平稳随机过程的几个现实。其中X(t)的每个现实都围绕自己的一个特定的水准在变动。而Y(t)每个实现几乎都沿着同一个水准在变动。这时我们可以说X(t)的每个现实并不经过每个可有状态,即它不是各态历经的。而后者则几乎每个现实在它的进程中(只要t充分长)经过每个可能的状态。这样就说它具有各态历经性质。这时只要时间充分长,每一个现实对随机过程的统计特性都有代表性。图4.6 具有(不具有)各态历经性质的随机过程由于具有各态历经性质的平稳过程的每个现实都对随机过程的统计特性有代表性,所以在不少的场合下我们即有一个现实求随机过程的统计特征。例如要求随要求随机过程的期望值,就可以用一个现实的充分的纪录的平均值近似之。即有 (4.45)对于自相关函数也可以用类似办法求得。可以证明具有各态历经性质的平稳随机过程的自相关函数在时间间隔 充分大时它趋于零。即有 (4.46)一个平稳随机过程是否为各态历经的,固然可以从数学上分析它,但人们常常从物理上直接判断它。而一旦在物理上指明它具有各态历经性质,就会在数学上得出一些相应的结论,从而简化了一些计算或明确了一些进一步的问题。6、线性动力系统对随机过程的变换如有一个栏河水库它每时都从上游流入一定的河水而在另一方面又有水量的支出,这时我们可以把收入的水量和支出的水量都看成随机过程。如有一个动物它通过一定方式吸收能量,又通过另一些主式消散支出能量,这时我们也可以把能量的收和支看成两个随机过程。如有一个动物它通过一定方式吸收能量,又通过另一些方式消散支出能量,这时我们也可以把能量的收和支看到两个随机过程。一部收音机从天线上感应的电磁波和它从喇叭上放出来的音波都随时间而异,我们也可以把能量的收和支看成两个随机过程。一个气象台它收到各种温压场天气图,另一方面它又作一个地区气温场、风场等的预告图。这里也可以把收、支看成不同的随机场。以上例子中我们看到至少有两个随机过程(或随机场)它们是既有区别又有联系的。图4.7就是对它们的一个模式化的概括。图的核心是有一个所谓“动力系统”它至少有一个输入端和一个输出端。输入和输出的都是随机过程(或随机场)。而对于这个动力系统具体在物理上如何构成则是可以千差万别,它可以是一条河流、一个水库、一部收音机、一个电子装置、一条鱼或是某一气象预告方法。但这些我们都无心细究,我们关心的是数学上要分析进来的随机过程和输出的随机过程有什么内在联系。或者说动力系统是如何把一个输入的随机过程变成一个随机过程而输出来的。动力系统的最关键功能是它对随机过程的“变换”。这样一个模型显然概括了极为广泛的现象。单以气象预告问题说,它实际概括了全部的预告方法。详细研究它在预告上的应用则是专门著作的责任。我们仅是在介绍随机过程时介绍一下它的思想和线性动力系统的一些特点。它主要涉及如何描叙线性动力系统的功能,输入与输出的随机过程的相关函数、谱有什么关系。以及气象上的简单例子。(1) 线性动力系统的权函数与传递函数设欲以日气温X(t)来求5天的滑动平均气温,这时可以依次把连续5天的气温相加除5而得。但我们把X(t)视为一个动力系统的输入,而要求输出为,这时动力系统的功能显然就是对输入的X(t)施以5天滑动平均的运算。图4.7 动力系统这里输入和输出的都是随机过程。现在要研究的是如何描叙这个简单的动力系统的功能。为此可以从它对输入所作的变换上加以分析。设在时刻t输入了X(t),那么它对不同时刻的滑动平均值的贡献不同的。如规定是指前4天加上当天气温除5后作为t时刻的滑动平均气温,则当日气温X(t)对当日的贡献显然为X(t)/5。它对t+1日,t+2日,t+3日,t+4日的5天滑动气温的贡献都是X(t)/5。但它对t-1,t-2,日的滑动平均气温的贡献却全部为零。现在把这个贡献的比例值(即是X的几分之几)用h表示,则h就是输入值的时刻与输出值的时刻的差值的函数。在本例子中r=0,1,2,3,4时X(t)对 的贡献为X(t)的1/5,即h=1/5。为其他值的贡献为0,即h=0。H的变化可见于图4.7中。这样输入X(t)与输出的关系可以通过h表示为 (4.47)图4.48 线性动力系统权函数示例h在式子中的地位显然是对不同时刻差()时的x值给一个加权系数,以表示x(t-)在中占多大的比重。h随时间间隔的变化这个函数常称为线性动力系统的权函数或单位脉冲反应函数。它是描叙线性动力系统数学功能的一个方法。这里所谓线性是指如果输入值乘以n那么输出也放大n倍;如果输入为x1加x2那么输出也是分别输入x1以及x2时输出的随机过程之和。线性系统当然仅是动力系统的一部分,不过它包括了十分广泛的数学功能。上面例子实际是离散的情况。如对一般连续情况而言,则可类似地以如下积分来联系输出设以Y(t)表示之与输入的关系 (448)这里把x的全部过去值对y的现在值的影响都包括了进去。h是的连续函数,一般很大时h就实际上近于零了。如果输出量Y(t)是输入量X(t)在t时刻后时刻的预告值,而此预告值为其简单的外推,即 那么这个简单关系也可按权函数的形式写出来,然后解h()。对于上式更为一般的输入与输出的关系,可以写成如下微分方程 (4.49)上式中各a和b都是常数。此为常系数线性微分方程。如以记号s表示,以sn表示,则可用多项式An(s)和Bn(s)分别代表对Y和X 的微分算子的多项式,即有 (4.50)则上述微分方程可简化为 (4.51)这里(s)是关于算子s的两个多项式之比。从形式上看可以说X(t)经(s)运算变成了Y(t)。这样我们就又看到可以用这个算子多项式之比来描叙一个动力系统的功能。如果把s改成j,则就称(j)为这个动力系统的传递函数(j为,频率)这就表明动力系统对输入施加的变换也可以用传递函数表示。它实际与用权函数h表示是等价的。而传递函数就是h的傅里叶变换,即 (4.52)权函数是从时间的角度分析了输入与输出的关系;传递函数则从频度的角度分析了输入与输出的关系。(2) 输入输出之间的谱和相关函数的关系除了分析输入与输出的变量间的关系外,有时还分析输入的X(t)的相关函数与输出的Y(t)的相关函数之间有什么关系或者它们的谱密度之间有什么关系。在气象上如作长期预告要研究月平均气温距平的自相关函数(或季的、月的等等)为此就要有足够的样本资料才行。这在不少地区都难作到。但如已经有了日气温距平的自相关函数,则就希望经过一个动力系统换算出例如候、旬、月或季度气温距平应当有什么相关函数,这样就可以利用前者资料样本多的有利因素弥补长期预告资料不足的弱点。问题也可以反过来研究,例如要求用气压的已知值作时刻后的预告值。我们已经知道了气压的自相关函数的特征,那么用什么样的一个动力系统才能使预告最准?(即什么样的权函数或传递函数最好)。再例如已知气压与降水的互相关函数及各自的自相关函数,那么设计一个什么样的动力系统用气压来预测降水最好?这类例子还可以举出很多。对这类问题在自动控制、电讯或数学书籍中有不少研究。如文献22是在气象学上应用的一部专著。对于具有各态历经性质的平稳随机过程,它输入到一个稳定的线性动力系统中则它的输出也是一个各态历经的平稳随机过程。可以推得输入X(t)与输出Y(t)的各自的相关函数有如下关系 (4.53)输入和输出的谱密度和与传递函数(j)有如下关系(4.54)这个结果比上式简单,所以人们常从频率角度研究输入与输的出的关系。由于谱密度的积分即为方差,故有(4.55)这样输出量y的方差Dy也可以经输入的随机过程的谱密度与传递函数绝对值的平方之积的积分而得。(3) 简单的例子现在把日气温距平与候、旬、月气温距平的自相关函数的关系作为例子分析一下。设气温距平的标准化自相关函数K()为 (4.56)现在研究5天滑动平均值的自相关数是什么。仿前面的讨论在连续的场合下,系统的权函数可以写成 (4.57)将上式代入(4.53)得注意到被积函数中的绝对值符号,这可以在和分别积分而得 时 (4.59a)时 (4.59b)这个解尽管分成和两段,但不难看出在时是连续的。如日气温距平的自相关函数具有更一般的形式(4.60)而输出的不一定恰为5天,而是r天的平均,则输出的随机过程的自相关函数仿前可以写成 时(4.61a)在时是下面的(4.61b)式这个解把一切具有各态历经性质的平稳随机过程的任意时间步长r的滑动平均问题几乎都包括进去了。现把这个解分析一下。首先对于输入满足(4.56)式时在=0,K()=1即原方差为1。如取a=1/4,则滑动平均后的随机过程的方差。即比原来的小了30%。这与经验中的滑动平均后的曲线要光滑一些是吻合的。如认为气温的变化由长波与短波迭加而成。设长波对应的自相关函数为,与之独立的短波为 。即两者方差都为1但衰减速度差4倍。依(4.19)式,长短波合成的随机过程的自相关函数为 (4.62)它是(4.60)式的一种形式。将之代入(4.61)式可求得5天滑动平均值的方差为0.16+0.34=0.50。这一则说明方差小了一半,另一则说明长短波在方差中的贡献有了变化。长波部分()占了0.50中的0.34,而短波的贡献相对减小。这是我们所谓平滑后滤掉小扰动是一致的。为对比滑动平均后的自相关函数与原相关函数的相对变化,我们把前者标准化(即使方差变成1)后与后者绘于一处(见图4.9)。它反映出经滑动的人为措施后相关函数比原来的要随时间衰减慢得多的情况。这也就是我们经常分析滑动平均曲线比原曲线要“平滑”、“规律”很多的一种表现形式。图4.9 随机过程的一种相关函数(1)和滑动平均后的相关函数(2)7、时间序列的自回归如果只去研究一下随机过程在等间距的离散时间点上的各种取值,则常把这种离散的序列称为时间序列。为预测时间序列在下一个(或几个)时间步长后的数值,常常利用时间序列的现时以及过去的值建立一个线性回归方程。这就是常称的自回归方程。现在我们除给出回归方程的系数的解法外,还要研究这个方程的阶数与时间序列的自相关函数结构有什么关系等问题 本节研究的限于时间 的取值都符合多维正态分布场合。对于一个p阶自回归方程可以写成 这里研究的实际都是平稳随机过程 (4.63)这里t时刻的x值与t-1,t-2,t-p时刻的x值有关,1, 2,p是p个常数。p项过去值的线性组合与x(t)的差值我们以a(t)表示。它就是预告值与实际值的偏差值,一般是一个纯随机的白噪声。现在规定一个所谓“后移算子”B,B作用于一个变量x上时,是将它变成前一个时间步长的x值。即有Bx(t)=x(t-1) (4.64)同理,B的m次方为向后移m 个时间步长。即Bmx(t)=x(t-m) (4.65)将这些关系代入(4.63)式我们整理得(B)x(t)=a(t) (4.66)这里 (4.67)它是关于算子B的p阶项式。对于(4.66)式我们也可以看成是一个有前后连系的随机过程x(t)经过一个线性动力系统的作用之后变成了一个前后毫无连系(独立)的随机过程a(t)。那么对于具有一定统计特性的随机过程x(t)。那么对于具有一定统计特性的随机过程x(t)到底如何选配1, 2,p才能使(B)x(t)变换成一个白噪声a(t)?这也就是如何确定各个值的问题。如以x(t-1)乘以(4.63)式,再取数学期望,则得这里利用了白噪声a(t)的数学期望为零变及其与x(t-1)独立无关的事实,因而a(t)x(t-1)的数学期望值也是零。K(1),K(2)是=1,2, 时平稳随机过程x(t)的自相关函数值。类似如上作法,以x(t-i)乘(4.63)式(i=1,2,p)则共得p个方程式 (4.68)这样即可以从相关函数K()的值利用如上方程组解出p个值来。从而决定了整个自回归方程的系数。在这里我们看到各i的取值与随机过程的相关函数是密切相关的。已知相关函数可以求得诸系数。这个问题也可以反过来说,即当有了一个自回归方程以后,我们也就知道它对应的随机过程有着什么样的自相关函数。实际上在上面的公式(4.68)中如已知各个值,完全可以解出K(0),K(1),K(p)共p个相关函数值来。对于r为更大值时的相关函数值也完全可以用类似的步骤取得。因为一般地说以x(t-r)乘(4.63)式再取数学期望值,可得 0(4.69)这样已知前p个K值时不难进而求得下一个K值。上式还可以改写成或 (4.70)这是自回归算子与随机过程的自相关函数的一般约束关系。如对(4.63)式以x(t)乘之再取数学期望,并利用平稳随机过程的自相关函数的对称性可得 (4.71)此式右侧为x(t)与a(t)之积的期望值。由于x(t)中含有a(t)项见(4.63)式故 (4.72)这里Da为白噪声a(t)的方差值。随机过程的方差Dx显然就是K(0)将这些关系代入(4.71),并引入相关系数即可得到随机过程的方差Dx与纯随机项a(t)的方差Da的关系为 (4.73)从这个式子中可以求得Da,从而知道用了自回归方程后预告与实况偏差值的方差(Da)比原方差Dx小了多少。这个关系我们在第二章讨论要素场的熵时曾引用过。设有如下阶自回归方程X(t)=x(t-1)+a(t) (4.74)将之乘x(t-1)再取数学期望得K(1)= K(0)或K(1)= Dx (4.75)反复利用(4.70)式,我们可以得一般关系如令 则上式改写成 (4.76)以Dx除上式可得相关系数r随时间的变化为 (4.77)这个非常简单的结果告诉我们一个很重要的事实,即以一阶自回归方程约束其过去值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论