




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、随机过程与随机信号处理课程论文 论述马尔可夫模型的降水预测方法摘要:预测是人们对未知事物或不确定事物行为与状态作出主观的判断。中长期降水量的预测是气象科学的一个难点问题, 也是水文学中的一个重要问题。今年来,针对降水预测的随机过程多采用随机过程中的马尔可夫链。本文总结了降水预测的马尔可夫预测的多种方法和模型,对其中的各种方法的马尔可夫链进行了比较和分析,得出了一些有用的结论。关键字:降水预测,随机过程,马尔可夫链,模拟前言:大气降水是自然界水循环的一个重要环节。尤其在干旱半干旱地区, 降水是水资源的主要补给来源, 降水量的大小,决定着该地区水资源的丰富程度。因此, 在水资源预测、水文预报中经常
2、需要对降水量进行预报。然而, 由于气象条件的变异性、多样性和复杂性, 降水过程存在着大量的不确定性与随机性, 因此到目前为止还难以通过物理成因来确定出未来某一时段降水量的准确数值。在实际的降水预测中,有时不必预测出某一年的降水量,仅需预测出某个时段内降水的状况既可满足工作需要。因此,预测的范围相应扩大,精度相应提高。因此对降水的预测可采用随机过程的马尔可夫链来实现。用随机过程中马尔可夫链进行预测是一种较为广泛的预测方法。它可用来预测未来某时间发生的变化, 如预测运输物资需求量、运输市场等等。马尔可夫链, 就是一种随机时间序列, 它表示若已知系统的现在状态, 则系统未来状态的规律就可确定, 而不
3、管系统如何过渡到现在的状态。我们在现实生活中, 有很多情况具有这种属性, 如生物群体的生长与死亡, 一群体增加一个还是减少一个个体, 它只与当前该生物群体大小有关, 而与过去生物群体大小无关。本文针对降水预测过程中采用马尔可夫链进行模拟进行了综述和总结。主要的方法有利用传统的马尔可夫链的方法模拟 ;有采用加权的马尔可夫链模拟来进行预测;还有基于模糊马尔可夫链状模型预测的方法;还有通过聚类分析建立降水序列的分级标准来采用滑动平均的马尔可夫链模型来预测降水量;从这些方法中我们可以看出,马尔可夫链对降水预测有着重要的理论指导意义。1.随机过程基本原理 我们知道,随机变量的特点是,每次试验结果都是一个
4、实现不可预知的,但为确定的量。而在实际中遇到的许多物理现象,实验所得到的结果是一个随时间变化的随机变量,且用一个或多个随机变量我们有时无法描述很多这种现象的的全部统计规律,这种情况下把随时间变化的随机变量的总体叫做随机过程。对随机过程的定义如下: 设E=e是一个样本空间,若对每一时刻tT,都有定义在E上的随机变量X(t,e)与之对应,则称依耐t的一族随机变量X(t,e),tT,eE是一个随机过程,通常将它简化为X(t),tT. 随机过程一般应表示为X(t),tT.随机过程可分为以下两大类,一类为时间参数集T为离散时间集合,即参数集T是一个可列集,如果 或 ,则称X(t), tT为离散时间随机过
5、程,或称随机序列。另一类为时间参数集T为连续时间集合,是一个不可列集,如果 或 则称X(t), tT为连续时间随机过程,或简称随机过程。2.传统的马尔科夫链方法模拟来进行降水预测 “马尔可夫模型”是由俄国数学家A. A. M arkov 在1996年最早提出, 经过几十年不断的发展,M arkov 过程已成为随机过程的一个重要分支, 该方法利用变量的状态转移概率矩阵可预报变幅较大的随机波动, 在生物学、物理学、天文学领域中已有广泛的应用1, 2 。马尔可夫链可以描绘一个随即变化的动态系统, 它根据状态之间的转移概率来推测一个系统未来的发展变化, 而转移概率反映了各随机因素的影响程度, 反映了各
6、状态之间转移的内在规律性, 适合描述随机波动行较大的预测问题. 定义1: 设X ( t) 是一随机过程, 当过程在时刻t0 所处的状态已知的条件下, 过程在时刻t ( t> t0) 所处的状态与过程在时刻t0 之前的状态无关, 这个特性称为无后效性。无后效性的随机过程称为马尔可夫过程。 定义2: 时间离散、状态离散的马尔可夫过程称为马尔可夫链4 。对于马尔可夫链, 用P ij 表示系统由状态E j 经过一次转移到达状态E j 的转移概率。由转移概率构成的矩阵, 即 称为马尔可夫链的状态转移概率矩阵。由于从任何一个状态Ei 出发, 经过转移后, 必然出现状态E1、E2、E3, 因此 任一系
7、统的状态空间I , 可以分解为下列不相交子集之和 其中N 为所有非常返状态组成集合, Ci (i= 1, 2, ) 是互不相交的常返状态组成的闭集.若j 是非周期的正常返状态, 则Uj为状态j 的平均返回时间, 我们称概率分布为马尔可夫链的平稳分布, 其中I 为状态空间, 若它满足 若是马尔可夫链的平稳分布, 则 采用随机过程的马尔可夫进行预测,能充分利用历史数据的信息,其预测精度较高。同时可建立在历史数据分析之上,历史数据越多,越准确,预测也越可靠。但同时也具有两大缺点: 第一, 只考虑了最大概率, 忽略了其它概率的影响;第二, 不清楚预报对象在区间内的大致位置, 无法达到预报对象具体值的要
8、求。3.加权的马尔可夫链的降水预测 对于一列相依的随机变量,用步长为1的马尔可夫链模型和初始分布推算出未来时段的绝对分布来做预测分析,可称之为基于绝对分布的马尔可夫链预测方法。对于利用各阶(多步长)马尔可夫链求得的绝对分布叠加来做预测分析,可称之为叠加马尔可夫链预测法。对于这两种Markov链预测方法,其各自都存在一定的局限性,对于基于绝对分布的马尔可夫链预测方法,默认所论的马尔可夫链满足“齐次性”缺乏依据,事实上,应用中所论及的随机变量序列,尽管满足马尔可夫性,但“齐次性”一般都不满足。另外该法没有考虑到对应各阶(各种步长)马尔可夫链的绝对分布在预测中所起的作用,因此没有能充分利用已知数据资
9、料的信息。而对于叠加马尔可夫链预测方法,尽管应用了各阶(各种步长)马尔可夫链的绝对分布叠加来预测状态,但没有考虑到各阶马尔可夫链对应的绝对概率在叠加中所起的作用,即认为各阶马尔可夫链的绝对概率所起的作用是相同的,这显然是不科学的,事实上满足马尔可夫性的相依时间序列,其各阶自相关性是不一致的。一列相依的随机变量,其各阶自相关系数刻画了各种滞时的状态间的相关关系的强弱。因此,可考虑先分别依其前面若干时段的指标值的状态进行预测,然后,按前面各年与该年相依关系的强弱进行加权求和,充分合理地利用信息进行预测,这就是加权马尔可夫链预测的基本思想。传统的马尔可夫链预测方法与加权马尔可夫链预测方法都没有对指标
10、值序列进行马尔可夫性检验,这是一个缺陷。本研究提出的加权马尔可夫链预测方法弥补了这个缺陷,具体方法如下: (1)计算指标值序列的均值、均方差,建立指标值的分级标准,确定马尔可夫链的状态空间。可根据资料序列的长短及具体问题的要求进行。可以样本均方差为标准 57 也可用有序聚类的方法建立分级标准 7 将指标进行分级。确定马尔可夫链的状态空间E = 1, 2, , m 。 (2)按所建立的分级标准,确定资料序列各时段指标值所对应的状态。 (3)对所得结果进行统计,可得到不同步长马尔可夫链的转移概率矩阵,它决定了指标值状态转移过程的概率法则。(4)马尔可夫性检验。(5)计算各阶自相关系数rk , k
11、E ( E为所研究序列的状态空间)。 式中: rk 为第k阶滞时的自相关系数; xl为第l时段的指标值; x为指标均值; n为指标序列的长度。对各阶自相关系数规范化,即 将wk 作为各种滞时(步长) 的马尔可夫链的权重(m 为按时间需要计算到的最大阶数) 。(6) 分别以前面若干时段的指标值为初始状态, 结合其相应的各阶转移概率矩阵即可预测出该时段的状态概率P( k)i , i E, k为滞时(步长),k=1,2,m.(7) 将同一状态的各预测概率加权和作为指标值处于该状态的预测概率,即 所对应的状态即为该时段指标值的预测状态。待该时段的指标值确定后,将其加入到原始序列中,再重复步骤(1) (
12、7) ,可进行下一时段指标值状态的预测。随机序列是否具有马尔可夫性,是应用马尔可夫链模型分析和解决实际问题的必要前提 5 。通常离散序列的马尔可夫链可用x2 统计量来检验。对于指标值的分级,传统的方法是应用样本均值与样本标准差来刻画指标值的变化区间, 设指标值序列为x1 , x2 , , xn ,样本均值为x,样本标准差为。如果这是一个弱相关(相关系数的绝对值 0. 2) 序列,则可以看做是独立同分布的序列。由中心极限定理知: P - 1. 5s x < +1. 5s 2 (1. 5) - 1 = 0. 87; P - s x < + s 2 (1. 0)- 1 = 0. 68。于
13、是, 可按指标是否落在( - , - 1. 0s) , ( -1. 0s, - 0. 5s) , ( - 0. 5s, + 0. 5s) , ( + 0. 5s, + 1. 0s) , ( +1. 0s, + ) 内,把指标值分成5组。利用这种方法对指标值进行分类,不考虑物理成因对指标值的影响, 仅仅从统计的角度简单地把样本均值作为指标值的中心, 这种方法操作较为方便,因此应用也较广泛。采用加权的马尔可夫来进行降水的预测主要优点有(1)应用样本均值- 标准差分级法来确定分级数,再取适当的1、2 值,可以更加充分地应用到降水序列的数据结构,从而可以更加有效地刻画降水序列内在的分布规律,使划分的降
14、水量区间分级标准更合理。(2)预测结果为降水量的某一个状态(区间值) ,而不是一个具体的数值,在可以完全满足实际工作的前提下,预测的范围更广,其可靠性也得到了提高。(3)由于各种步长的自相关系数为权重,用各种步长的马尔可夫链加权来预测降水状态,与普通的马尔可夫链预测相比较,它可以更充分、更合理地利用信息,使其成功地将马尔可夫链与相关分析结合起来进行预测。(4)根据最后计算出来的状态概率分布,求所预测的降水量的具体值,仍是一个有待解决的问题,加权马尔可夫链的方法为这样的预测提供了一个新的思路。4.基于模糊马尔可夫链状模型预测的方法模糊有序聚类是对有序样品进行分类的一种方法,以往通常应用降水量序列
15、的均值与方差的方法来刻画降水量丰枯状况的变化区间,本文提出应用模糊有序聚类的方法来划分降水量的变化区间,可以更加充分地考虑降水量序列的数据结构,使划分的区间更加合理。模糊有序聚类实现的经典算法是Fisher 算法,其基本原理为:设变量x1 , , xn 的某一归类是 xi , , xj , j i ,定义其均值向量为将公式定义为 xi , , xj , j i 的直径,其含义表示该变量段内部各变量之间的差异情况. 其值越小,表示该段内变量之间差异越小,或相互间越接近;反之,表示该段内变量之间差异越大,或相互间越分散。设将n 个有序变量分为K 类,某一分法为将公式 定义这一分类的误差函数,从理论
16、上可以证明,所谓的最优分法就是使e P( n , K) 达到最小值时的一种分法. 至于分类数K 的确定, 可以通过做e P( n , K) 与K关系的曲线图,曲线拐弯处的K值即为最优分类数.通常一个时间序列X ( t) 的可能取值范围是一个连续的实数区间, 如果采用上述马尔可夫链状模型预测方法, 就必须先将这个实数区间划分成有限个明确的状态。但是在许多问题中, 状态并不是明确的子集合。例如我们利用降雨量来确定旱、偏旱、正常、偏涝和涝等状态。因为它们都是模糊状态, 故要用降雨量上的模糊子集来表示才更近似于实际情况。因此, 针对此类情况必须采用基于模糊状态的马尔可夫链状模型的预测方法。而马尔可夫链
17、预测的关键问题在于计算转移矩阵中的概率值, 概率计算的基础在于状态的划分矩阵, 显然, 将状态划分明确的状态划分矩阵即布尔矩阵进一步拓广为表示状态划分模糊的模糊状态划分矩阵转移概率问题就可以解决了。设时间序列X ( t) : x 1, x 2, x 3, x n , 在其论域X(t) 上划分出K 个模糊状态E 1, E 2,. . . , E k 按照一定的方法总能得X ( t) 隶属于模糊状态E i 的隶属度函数, 满足:从而得到矩阵称为时间序列X ( t) 在论域X 上的模糊状态划分特征值矩阵, 简称模糊状态划分矩阵。显然式( 1) 为, 为时间序列X ( t ) : x 1, x 2,x
18、 3,. . . , x n , 在其论域X 上划分的模糊矩阵, 顾及一般性, 由于数据序列最后的状态转向不明确, 故计算 时不考虑时间序列X ( t) 中最后的m 个数据, 则模糊状态的马尔可夫链转移概率可作如下定义:为x t ( t= 1, 2,. . . , n- m ) 落入状态的数据个数, 易证即为状态的初始概率为状态经m步转移到状态的数据个数,且有 即为状态经m步转移到状态的转移概率,且满足,从而获得模糊状态划分下转移概率矩阵。系统各种状态转移的统计规律在状态概率矩阵中得到了反映, 通过考虑状态转移概率矩阵, 则可预测系统未来的发展变化。预测时需要先列出预测表。表的编制方法是: 选
19、取离预测年最近的j 个年份, 按离预测年的远近, 转移步数分别为1, 2, j , 在转移步数所对应的转移矩阵中, 取起始状态所对应的行向量, 从而组成新的概率矩阵。对新的概率矩阵将其列向量求和, 其和最大的列向量的状态为预测状态, 从而实现了模糊状态的马尔可夫链预测计算。5滑动平均- 马尔可夫模型根据降水过程存在大量不确定性的特点, 通过聚类分析建立降水序列的分级标准, 采用规范化的各阶自相关系数为权重, 用滑动平均的马尔可夫链模型, 通过状态转移概率矩阵预测未来时段的降水状态, 并根据模糊集理论中的级别特征值计算具体的降水量,传统的马尔可夫链模型采用最大隶属原则来确定预报对象的状态, 具有
20、两大缺点: 第一, 只考虑了最大概率, 忽略了其它概率的影响; 第二, 不清楚预报对象在区间内的大致位置, 无法达到预报对象具体值的要求。模糊集理论中的级别特征值可以有效地解决这个问题, 具体计算方法如下:首先给各状态赋以相应的权重, 构成权重集D = d 1, d 2,d 3, d 4, dm , 其中m 为研究系统的状态数。其中权重的大小取决于各状态概率的大小, 即 式中: G最大概率的作用系数, 通常取2。级别特征值H 可以通过下式进行计算。 确定最大概率的状态i 后, 可以根据上式确定系统在预报时段的预报值 与传统的马尔可夫过程相比, 滑动平均- 马尔可夫模型具有以下特点: 采用了滑动
21、平均的思想, 预测未来某时段的滑动平均降水量, 预测范围扩大, 预测精度提高。 采用了聚类的方法对滑动平均降水量进行等级划分,更加充分地考虑了序列中数据结构的合理性, 更加有效地显示了降水量序列的内在分布规律, 使得区间的划分更加合理。 计算序列的各阶自相关系数, 归一化后作为马尔可夫模型的权重, 充分、合理地利用已有信息, 使得预测结果更为精确。结论:通过以上分析,针对降水预测,从中可以看出,随机过程中的马尔可夫链模型在降水预测中有重要的实际指导意义。文中分析了马尔可夫链在其中的应用的各种模型,对具体的降水分析,可采取不同的模型。每个模型都有自身的优缺点,可以采取将两者或两者以上方法结合的思想。比如利用模糊马尔可夫链模型与加权马尔可夫链结合进行结合,产生一种模糊权马尔可夫链模型,将两者优势结合在一起
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 怀化2025年怀化会同县招聘7名事业单位工作人员笔试历年参考题库附带答案详解
- 2025年互联网+教育平台建设资金申请创新机制与实施趋势报告
- 2025云南广电传媒集团招聘16人笔试参考题库附带答案详解
- 2025年文旅地产项目开发与旅游产业政策影响评估研究报告
- 行政管理心理学策略性考试题及答案
- 市政工程问题解析试题及答案指导
- 水利水电工程人力资源管理试题及答案
- 创新药品生产基地项目实施方案(范文模板)
- 充电桩建设与运营的创新路径
- 2025年交通基础设施建设投融资模式创新与交通基础设施建设投资案例分析报告
- 化工设计知到智慧树章节测试课后答案2024年秋浙江大学
- 《建筑构造与识图》课程标准
- 2025年保健食品从业人员培训考试试题
- 2025年贵州盘江精煤股份有限公司招聘笔试参考题库含答案解析
- 2024年中考数学复习:中点模型专项练习
- 旅行社企业章程范本
- 2025年宁波余姚市直属企业招招聘笔试参考题库含答案解析
- 《心理健康测试》课件
- 输变电工程监督检查标准化清单-质监站检查
- GB/T 26718-2024城市轨道交通安全防范系统技术要求
- 《心房颤动》课件
评论
0/150
提交评论