(应用数学专业论文)马尔可夫链预测方法及其应用研究.pdf_第1页
(应用数学专业论文)马尔可夫链预测方法及其应用研究.pdf_第2页
(应用数学专业论文)马尔可夫链预测方法及其应用研究.pdf_第3页
(应用数学专业论文)马尔可夫链预测方法及其应用研究.pdf_第4页
(应用数学专业论文)马尔可夫链预测方法及其应用研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 马氏链运用数学模型对定性问题进行预测提供了一种思路,丰富了预测的内 容。运用马氏链进行预测的基本思路是: 首先,把现象看作是一种系统,并对该系统进行科学的状态划分。根据系统的 实际和需要划分多个状态,系统所划分出来的各个状态就是要预测的内容。 其次,对现象各种状态的状态概率进行统计测定,也就是判定出系统当前处于 什么状态。 第三,对各系统未来发展的每次转移概率进行预测,就是要确定出系统是如何 转移的。 最后,根据系统当前的各种状态和转移概率矩阵,推测出系统经过若干次转移 后,到达各个状态的概率。 本文对马氏链预测方法进行研究,分析了指标值序列分组方法,马氏性的检 验。文章总结了三种马氏链预测方法:基于绝对分布的马氏链预测,叠加马氏链 预测和加权马氏链预测,并利用加权马氏链预测对某河流5 月份的降雨量进行预 测。 根据太湖流域和长江流域的梅雨历史资料,运用马氏链的预测方法对太湖流 域的梅雨期和长江流域的梅雨强度进行了科学的预测,得出了符合实际的预测结 果,验证了马氏链作为一种科学的预测手段,其应用范围是很广泛的。 对时间序列预测方法和马氏链预测方法的吻合性用一个实例进行了验证,说 明了马氏链作为一种预测方法的正确性。利用随机模拟,通过1 0 0 次试验,对两 种预测方法的预测误差进行分析,得出了加权马氏链方法要优于基于绝对分布马 氏链预测。 关键词:马尔可夫链,随机矩阵,转移概率,梅雨 a b s t r a c t m a r k o vc h a i no f f e r sau e wp a t ht of o r e c a s tp r o b l e m i te n r i c h e st h ec o n t e n to f f o r e c a s t f i r s t l y , t h ep h e n o m e n o n i sl o o k e du p o na sas y s t e m ,a n dp a r t i t i o n e dt os e v e r a l s t a t e s s e c o n d l t r a n s i t i o np r o b a b i l i t yi sw o r k e d o u t t h i r d l y , h o w t h es y s t e ms h i f ti sc o n f i r m e d f i n a l l y , b a s e d o nt h et r a n s i t i o np r o b a b i l i t ya n dr a n d o mm a t r i x ,t h ep r o b a b i l i t yo f s e v e r a ls h i f ti ss p e c u l a t e d t h et h i r dc h a p t e rs u r m n a r i z e st h r e ef o r e c a s t i n gm e t h o d so fm a r k o vc h a i n ( f m m c ) ,f m m cb a s e do i l a b s o l u t e n e s sd i s t r i b u t i n g ,f o l da d d i t i o n a lf m m ca n d a d d i t i o n a lp o w e r f u lf m m c t h e f i r s tt w om e t h o d sh a v ee x t e n s i v eu s en o w a d a y s t h e t h i r ds p r i n g su pn o w i nt h ef o r t hc h a p t e gb a s e do nt h eh i s t o r yd a t ao fp l u mr a i n si nt a il a k ea n d t h e y a n g t z er i v e ra r e a ,u s i n gt h em e t h o do f m a r k o vc h a i n ,w ef o r e c a s tt h ep l m nr a i n s p e r i o di nt a il a k ea r e aa n d t h ei n t e n s i t yo f p l u m r a i n si ny a n g t z er i v e ra r e a ,w ea l s o e d u c et h er e s u l ta c c o r dw i mt h ef a c t a sae f f e c t i v ef o r e c a s t i n gm e t h o d ,i th a sa w i d e a p p l y i n g f i l e d i nt h ee n do fa r t i c l e ,w ee v a l u a t et h r e ef m m a u s i n gr a n d o ms i m u l a t i o n ,w e f i n dm a ta d d i t i o n a lp o w e r f u lf m m c i sb e t t e rt h a nf m m cb a s e do na b s o l u t e n e s s d i s t r i b u t i n g k e y w o r d s :m a r k o vc h a i n ;r a n d o mm a t r i x ;t r a n s i t i o np r o b a b i l i t y ;p l u m r a i n s 1 厶- 日盯吾 论文的背景及意义: 马尔可夫链预测法是应用概率论中马尔可夫链的理论与方法,来研究分析 某些动态系统的发展变化过程,并预测其发展变化趋势的一种预测方法,它是现 代预测方法中的一种,具有较高的科学性,准确性和适应性,在现代预测方法中 占有重要的地位。在国外,它不仅广泛应用在自然科学领域,还应用在经济领域。 在我国,它主要应用于水文,气象,地震等自然科学技术的预测,近年在产品市 场占有率预测和经济决策中也有所应用。 论文研究目的与主旨: 为了有效的利用这个工具,解析一下它的基本原理,研究它的应用,这对深 入理解,推广应用马尔可夫链预测法,提高预测质量,发挥该预测法的效力将是 有益的。作者通过对大量文献的阅读和数据的搜集,将马尔可夫预、狈4 法特别是马 氏链的预测方法做出了科学的总结,并将马氏链的预测方法进行了系统分类,为 初学马氏链预测方法的人提供参考。 论文的主要创新点: ( 1 ) 利用马氏链对太湖流域梅雨期长江流域梅雨强度作出预测。 ( 2 )比较时间序列预测方法和马氏链预测方法的吻合性。 ( 3 ) 通过随机模拟比较基于绝对分布的马氏链预测和加权马氏链预测的 优劣。 学位论文独创性声明: 本人所呈交的学位论文是我个人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工 作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并 表示了谢意。如不实,本人负全部责任。 论文作者( 签名) : 幺励卜 学位论文使用授权说明 秒占y 年f 月夕日 河海大学、中国科学技术信息研究所、国家图书馆、中国学术 期刊( 光盘版) 电子杂志社有权保留本人所送交学位论文的复印件或 电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子 文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外, 允许论文被查阅和借阅。论文全部或部分内容的公布( 包括刊登) 授权 河海大学研究生院办理。 论文作者( 签名) :巡 j 。 沙啤莎月 第一章绪论 第一章绪论 马尔可夫是俄国著名的数学家( 1 8 5 6 1 9 2 2 ) ,马尔可夫过程因马尔可夫提 出而命名“3 。马尔可夫过程是现代概率论分支随机过程论中的一类,它已广 泛地应用于许多领域中,如通信,控制,生物,社会科学以及其他科学技术领域 等,并且在这些领域中显示出了十分重要的作用。马尔可夫过程的理论研究起源 于生产科学,科研中的实际问题,其理论产生于本世纪的初期,特别是在1 9 2 9 年由柯尔莫哥洛夫奠定了概率论的数学基础后,随机过程得到了更快更深刻的发 展”3 。近年来,在发达国家中,概率统计与随机过程的应用在科学研究,技术开 发,生产管理与社会经济生活的各个领域内发挥了重要作用。例如日本从5 0 年 代起将统计方法与工业质量管理结合起来,对推动经济飞速发展起到了至关重要 的作用。在我国,随着人们对现象的认识越来越深入,它已经被广泛的应用于自 然科学的许多领域中,大有“水银泻地无孔不入”之势,并在课题的研究和解决 中起着重大的作用,现实的科研活动告诉我们,“只有熟悉和掌握随机过程的基 本理论和方法,才能进一步学习现代科学技术,探索新的科技领域”的说法绝非 夸大之词。 1 1 马尔可夫过程的历史 现实世界中的许多现象是随时间的进展而变化与发展的,这些现象通常称之 为过程。例如,质点的运动过程就是最普遍的过程的例子。假设一个质点在直线 上运动,它的位置随时间而改变。数学上,当某种偶然现象随时间而演变时,便 产生偶然过程。随机过程论是数学( 概率) 的一个分支,它的任务是研究随机过 程中的数量关系。气体分子运动时,由于与其它分子碰撞等原因而迅速改变自己 的位置,运动的过程是不确定的。人们希望知道:运动的轨道有什么性质( 是否 连续可微等等) ? 分子从一点出发,能到达某区域的概率多大? 类似的不确定过 程问题也发生在其他自然科学,工程技术以及一些社会科学中。在一定时内:放 射性物质中有多少原子会分裂或转化? 电话交换台将遇到多少呼叫? 机器会出 现多少次故障? 物价如何波动? 这许多具体问题的数学抽象为随机过程论提供 了研究的课题。 一些特殊的随机过程早已引起注意,例如1 9 0 7 年前后,m a r k o v 研究过一列 相依的随机变量,后人称为马尔可夫链:又如1 9 2 3 年,n w i e n e r 给出了布朗 运动的数学意义,后人也称其为布朗运动过程,或维纳过程,这种过程至今仍是 重要的研究对象。虽然如此,但随机过程一般理论的研究般认为开始于3 0 年 第一章绪论 代。1 9 3 1 年,k o l m o g o r o v 发表了概率中的分析方法;三年后,k h i n t c b i n e 发表了平稳过程的相关理论,这两篇重要论文为马尔可夫过程与平稳过程奠 定了理论基础。稍后,p l e v y 出版了关于布朗运动与可加过程的两本书,其中 蕴含着丰富的概率思想。1 9 5 3 年,j l d o o b 的名著随机过程论问世;这 本书系统严格地叙述了随机过程的主要理论,尤其是对一种所谓“鞅” ( m a r t i n g a l e ) 过程,讨论地更加深入。这种过程的理论近年来得到了很大地发 展。1 9 5 年,伊腾清建立了关于布朗运动的随机微分方程;而流形上的随机微 分方程理论,目前正方兴未艾。6 0 年代,法国学派基于马尔可夫过程与位势理 论中的一般理论,发展了其中包括截口定理与过程的投影理论等。中国学者在平 稳过程,马尔可夫过程,鞅论,极限定理等方面也做出了一定的贡献1 。 作为马尔可夫过程中的一种,马氏链的研究更为人们所关注。早在1 9 5 3 年 b r o o k s 和c a r r u t h e r s 曾在他们的著作中首次应用马尔可夫链分析晴雨逐日变 化”1 。其后,g a b r i e l 和n e u m a n n ( 1 9 6 2 年) 提出用一阶两状态简单马尔可夫 链模式去研究特拉维夫( t e l a v i v ) 逐日降水纪录”。在这以后,又有其它学者提 出关于干湿日和干湿期变化的马尔可夫链模式( g r e e n ,1 9 6 4 :f e y e r h e r m 和 b a r k ,1 9 6 5 ) ( 将目降雨量小于0 1 l m m 定为干日,而大于或等于0 1 l m m 定为湿 日) 。k a t z ( 1 9 7 4 年) ”提出了一个计算湿日出现概率的改进方法。g a t e s 和t o n g ( 1 9 7 6 年) “”重新检查了特拉维夫逐日降水出现的记录,认为二阶马尔可夫链才 能很好的拟合。b i l l a r d 和m e s h k a s i ( 1 9 8 0 年) 认为可以根据实测降水的多少 把湿日按湿润程度更细分为s l 组,这样必然可用具有s 个状态的马尔可夫链去 模拟不同程度的湿日与干日气候序列。在国内,马尔可夫链模式模拟气候序列的 工作也做了不少。1 9 7 4 年王宗皓,李麦村“”用马尔可夫链研究了天气变化的持续 性指标及其预报问题。么枕生( 1 9 6 6 年) “”为了改进马尔可夫链无后效性的缺点, 在划分状态时将以往记录对现在记录的影响考可虑在内,即以各个状态的历史 演变来定义状态,取得较好效果。1 9 7 5 年周家斌等用马尔柯夫链预报浙北汛期 逐日晴雨变化。1 9 8 6 年卢文芳。”则利用简单马尔可夫链对我国逐日降水过程的 统计特征作了初步分析并讨论了马尔可夫链阶数确定的一些问题。 1 2 马尔可夫过程的直观背景 在初等概率论及数理统计的一般教科书中所讨论的随机现象,通常可由一个 或者有限个随机变量来描述,它所考虑的试验结果,一般都可用一个或者有限个 实数来表示,但我们看到,许多随机现象仅研究一个或有限个随机变量,不能揭 示这些随机现象的全部统计规律。这是因为在研究这些现象时,必须考虑其发展 变化过程,它所考虑的试验结果要用一个函数或者无穷多个数来表示,随机过程 第一章绪论 的产生和发展就是适应这一客观需要的。不妨看看下面几个例子: 考虑菜一电话交换台在正常工作条件下在某一时段 0 ,t 接到的呼叫次数, 一般情形下它是一随机变量,并且依赖于时刻t 。因此当我们考虑它随时间t 变 化时,则必须研究依赖于时间t 的随机变量e ( t ) ,若考虑一天的情形,则t 0 , 2 4 。 在商业活动中,需要研究某一商品的销售量。设某臼的销售量为三,一般地 说,它是一随机变量,若研究它的每天销售变化情况,则需要研究依赖于时间t 的随机变量芒( t ) ,t = 1 ,2 3 。 在数字通讯中,若传输过程是用数0 和l 两个源码来传递消息,由于接受者 事先不知道传送什么消息,加上传送过程受干扰影响,因此在某一时刻t ,它传 送的是0 还是1 ,都不能事先预言,因而是随机变量。若我们进行长期时间观 察,每隔单位时间观察一次,则这个随机变量e 。依赖于时间n = 0 ,l ,2 , 在地震勘测中,人们通过检波器把混有随机于扰的随时间变化的地层结构信 号波记录下来,例如在点0 处放炮,而在另一点a 处,记录仪把收到的混有干扰 的地震信号波记录下来,若在相同条件下做n 次记录,则测得n 个彼此有差异的 记录。在时间t 观察信号波的值,可发现它们是不规则的,亦即矗为一随机变 量,且依赖于时间t 0 ,十) 。 在机械加工中,由于受到各种随机因素的影响,工件尺寸在加工过程中都会 产生误差,若令e ( t ) 表示时刻t 加工工件尺寸的大小,因此它是一随机变量, 且依赖于时刻t ,t o ,+ ) 。 考虑一个国家经济活动中的国民收入时,某一年的国民收入即使在有计划的 情况下,仍然受到诸多随机因素的影响而随机变化。逐年研究其变化,则需研究 依赖时间t ( 年) 的随机变量y 。,如果考虑国民收入的合成,一般地有y 。= c 。+ i 。, 其中c 。,i 。分别表示t 年的消费和积累,这时我们就必须研究多于一个依赖时 间t 的随机变量y 。,c 。,i 。,其中t = l ,2 ,。 考虑某一海域在固定时间t 时海域中某一指定点的海水温度,由于受到诸多 随机因素的影响,故它是一随机变量。于是,这一海域中随时间变化的海水温度 是一个依赖于四个参数的随机变量e ( x ,y ,z ,t ) ,其中( x ,y ,z ) 为空间坐 标,t 为时间。 总之,在研究自然界或社会经济现象时,经常需要研究的对象不仅具有随机 性,而且又是一个变化过程,具体地说,是一族无穷多个随机变量。 1 3 马尔可夫链在我国目前的研究现状 由于马尔可夫链( 以下简称马氏链) 理论的研究已经很成熟,因此国内学者 第一章绪论 大多把其应用作为新的研究对象。事实上,马氏链理论在各个领域都得到了广泛 地应用。 1 3 1 马氏链在教育领域的应用 ( 1 ) 将马氏链应用于公共课教师教学效果评估“”。只要依据教师教学前后 学生的成绩的动态变化情况,而不是教师教学后学生的成绩本身,因此评估结果 更符合实际,更能体现出教师教学活动的质量。而传统的教学评估方法依据的是 学生的考试成绩,或者是专家,学生,同行对教师的教学态度,教学方法和教学 效果的综合打分,前一种教学评估方法只考虑了学生的即时成绩而忽略了其基础 差异,造成了评估失真。后一种评估是定性评估,受主观影响太大,而利用齐次 马氏链进行评估则克服了以上不足。 ( 2 ) 利用马氏链对高校文献资源采购预测“”。利用马氏链建立模型,对高 校文献的采购做出定量预测,结果可为高校图书资料管理部门,根据不同读者 需求和借阅量采购图书资料提供决策的依据,对于高校文献资源的合理配置, 有一定的指导意义和应用价值。其理论依据可以这样描述:一个图书系统内部各 种图书资料多种多样,随着时间的推移,系统的发展,系统内的各类资料将有规 律的发生转移,我们可以利用马氏链的基本原理,通过对各类图书的购入量,外 借量和内借量的数理统计,掌握各种图书的借阅规律,用马氏链来预测图书资料 的如何定购和定购量。 ( 3 ) 近来有的学者研究了马氏链在图书情报中的应用。“。利用马氏链构 造了转移矩阵,并建立了信息市场占有率、读者信息素质分析、外文期刊采访风 险分析、信息人员供给预测模型。在图书情报服务过程中,其变化具有较强的随 机性,是一个典型的随机过程,而马氏过程是一种特殊的随机过程,具有描述随机 变化的良好特性,而且信息市场占有率,读者信息素质分析、外刊采访风险分析, 信息人员供给、文献资源采访、信息控制变化态势只与其现在的某种状态有关, 满足m a r k o v 链性质,因;比m a r k o v 链可应用于上述六个方面。 ( 4 ) 马尔可夫链评价法的数学模型。在评价不同教师的教学效果时,往往 总是从他们所教学生的最后考试成绩为依据。实际上这种比较往往带有很大的片 面性。因为不同的教师所面对的不同班级的学生,这些学生之间必然存在着知识 基础等各方面的差异,这些差异肯定影响着学生的最后考试成绩。所以要客观评 价教师的教学效果,必须剔除学生差异这一因素,于是我们采用马尔可夫链评价 法。在教学效果指标的量化过程中,马尔可夫链评价法是将一个班级( 或年级) 的 学生在某次考试中的成绩作如下分等:优( 9 0 分以上) 、良( 8 0 一8 9 分) 、中( 7 0 7 9 分) 、及格( 6 0 一6 9 分) 和不及格( 6 0 分以下) ,然后以某班学生第次考试的成绩作 为初始状态考察第二次考试的变化状况( 对于多次考试成绩,方法相同) ,说明教 第一章绪论 师在这期间的教学效果,从而可比较不同教师的教学质量。 1 3 2 马氏链在经济领域的应用 马氏链在经济领域的应用更加广泛,在此仅举几个例子加以说明。 ( 1 ) 股票价格的回归,利用马氏链可以对股票的价格进行分析和预测。将随 机时间序列分解成趋势变动序列和马尔可夫链,建立了回归一马尔可夫组合预 测模型,并对此模型编制成通用计算机程序,以此预测股票价格取到某个区间 的概率分布、平稳分布,股票价格的均值以及股票价格的平均涨落时间“。 ( 2 ) 对股市行情的预测。将m a r k o v 过程理论,应用于股票交易市场,对股价 综合指数的涨( 跌) 幅度,进行状态分类,建立起对市场运行周期、稳态概率、 稳定程度、投资利润等的分析预测模型,并利用这一模型对上海证券交易所股价 综合的部分历史数据作了相应的分析,得到了较为理想的结果”。 ( 3 ) 市场占有率及期望利润的马尔可夫链预测。运用马尔可夫链理论对商品 销售的市场占有率预测和期望利润预测进行了研究,实例表明:马夫可夫链是预 测市场占有率和期望利润的有力工具o “。 1 3 3 马氏链在医学上的应用 ( 1 ) 马氏链在乙性脑炎预测中的应用。马氏链是一种随机时间序列,其将来 所处的状态与过去状态无关,而仅与现在状态有关,这种性质称马氏链的无后效 性。马氏链是由状态转移概率联系起来的一个个状态所组成的“链条”,我们可 以根据某地乙脑每年发病率时间序列,求出预测值状态的各阶概率转移矩阵,就 可按最大转移概率原理做出预报o “。 ( 2 ) 马尔可夫链计算方法在流行性出血热疫情预测预报中的应用。根据搜集 的资料确定各状态的取值范围和状态划分,求出一阶转移高率矩阵。马尔可夫链 进行预测,预测的结果是区间估计,虽使预测的相对误差降低,却提高了预测 的准确度,在e h f 防治和疫情预测中具有实用价值。 ( 3 ) 马氏链在海军疟疾疫情预测中的应用为海军疫情的防治提供了科学方法, 而用“马氏链”分析生物近亲繁殖的统计规律则将马氏链应用于生物统计这一新 兴科学上。”2 。 1 3 4 马尔可夫链在自然灾害预测上的应用 我们知道,灾变,从广义上讲是指系统行为特征超过某个界限值,这些异 常值会给人们生活、生态环境、农业生产乃至军事活动带来异常结果。如汛期发 第一章绪论 生洪涝、机械化部队在道路泥泞、洪水泛滥、沟渠纵横、湖泊星布的地带难以施 展,而给后勤保障带来严重的困难o ”。 ( 1 ) 利用马氏链模型预测宁南旱情。宁南山区干旱频繁,严重影响农业生 产。根据固原气象站3 5 年雨量资料,应用马尔可夫链模型预测该地区1 9 9 2 1 9 9 6 年的雨量与旱情趋势,对该区农业生产有参考价值o 。 ( 2 ) 用马尔柯夫分析法预测麦蜘蛛发生趋势。麦蜘蛛( p o tr o b i al a t o n s m u l l ) 是乳山市小麦上的主要害虫之一,历年发生面积为l o 万亩一2 0 万亩,约占 小麦播种面积的1 8 一4 5 。对麦蜘蛛发生趋势的预测,一般是根据虫源基数、有关 的气温和降水量,结合历史资料,进行综合分析,从而做出预测。这种预测方法需 要有较准确的虫源基数和相关的气象数据,不仅调查虫源基数的工作量大、对气 象预报的依赖性大、受气象预报准确性的影响较大,而且不能进行较长期的预测。 能否利用麦蜘蛛发生程度本身的历史资料对麦蜘蛛的发生趋势进行预测呢? 本 文用马尔柯夫分析法对乳山市近1 1 年来麦蜘蛛发生程度的资料进行分析,不仅 获得了比较理想的预测效果,而且可以进行超长期预测。1 ”。 ( 3 ) 应用马尔可夫链方法测报草原蝗虫。我国北方草原区,草原蝗虫一年 发生一代,都以卵的形式在土壤内越冬,次年孵化由予种类不同,出土期处于 一定的变化状态。蝗虫是渐变态,即若虫和成虫栖息于同一生境,并取食相同的 食物即草原牧草。了解蝗虫的出土期、系统地掌握蝗虫的个体发育以及种群数量 动态变化,对草原畜牧业生产具有w 。 ( 4 ) 应用马尔可夫链法预测晚稻稻飞虱发生程度。稻飞虱是水稻生产上的 主要害虫之一,化州市以褐飞虱n i a p a r v a t al u n g e n s ( s t u a l ) 为主的第6 代 是危害晚稻中后期的主害代,做好晚稻稻飞虱主害代发生程度的预测,对科学决 策指导防治,保障水稻生产具有十分重要的意义。本文应用马尔可夫链预测法对 化州市晚稻稻飞虱主害代发生程度进行了长期预报。“。 另外,马氏链在房地产市场营销,机车管理,大白菜年景预报,煤矿贵重器 材需求预测,人力资源预测等等中都有可行的应用。马氏链作为一种有效的工具, 在国际工程投标风险预测,中国各地区人均g d p 的马尔可夫预测及变动分析中得 到了很好的应用”“。 1 3 5 马氏链在遗传学领域中的应用 遗传的一个要素是染色体,每一个生殖细胞只有一组单一的染色体,称为单 倍体。一个后裔分别继承了来自父母的两组染色体,称为二倍体。遗传性质的携 带者称为基因。,它们位于染色体上,基因是成对出现的。一般的成对的基因中 每个可以取两种不同的形式( 等位基因) a 和a 。在一个总体中基因a 和a 的比 例是基因频率,记为p 和q 两种等位基因可形成对应于定位点的三个基因型, 第一章绪论 因a a 的概率为p 2 ,类似可计算出它具有基因型aa 和aa 的概率分别为2 p q 和 q 2 为了用马儿可夫链来描述一个给定位点上的遗传过程,用1 ,2 ,3 表示三种 基因型a a ,a a 和a a ,用见表示给定一个上代( 父与母) 的基因i 时,后裔出现 基因j 的概率。以一对母孑为例,设岛= p ( 孩子有基因型j i 母亲有基因i ) fa 1 p 1 2p 1 31 肚嶝;。2 2 对 并从男性群体中以概率p 得到另个a 基因,因此p :,= :1p ,类似的得出 p = 雕割 由此可以求出二步转移概率矩阵p ”,它反映了从祖父母到孙子孙女的转移,一 般的p 4 反映祖先到其r t 代子孙的转移概率,显然p = p ”因此; pq 0 1l1 j pjj 鼋 0 pq 2 p q + q ( q p ) ,2 ”一 2 p q + ( p g ) 2 ” 2 p q + p ( p q ) 2 ”一 q 2 一q 2 2 ”一、 q2 + g ( p q ) 2 ”i q 2 + p q 2 ”1 l 4 他i d y; 刚p 一 馏咖 、十 育 | | 的 步进 第一章绪论 显然对i = 1 ,2 ,3 都有p = + 。,因此所有的状态都是常返的,又当n 充分大后 n = l p p “ o ,i = 1 ,2 ,3 ,故左右状态都是非周期的,由性质知,所有的状态 都是正常返的,从而是个不可分的遍历马尔可夫链,直接取极限可求得它的唯 一平稳分布: 瓦= p 2 ,乃= 2 p q ,乃= q 2 于是得到每个状态的平均返回时间:u ,= 1 p 2 ,u 2 = l 2 p q ,u 。= l q 2 这说明:一 个群体中a 基因越多,基因型a a 所需要的返回时间的平均值就越小。 最后由平稳分布的定义,对v n ,有曩= 巧露+ 乃p 箬+ 乃曩? ,i = 1 ,2 ,3 即链的一维分布为( p 2 ,2 p q ,9 2 ) ,换句话说,虽然随机交配一代复一代的进行 着,但平稳分布却永远保持,这再次肯定了哈代一魏因贝格的平稳定律:不论父 母基因频率是什么数值,在随机交配的假定下,第一代继承者将有基因型频率, 且此频率将永远保持稳定。 1 3 ,6 马尔可夫链模型在算法有效性中的应用 在运筹学和计算机科学中,某些算法是以如下的方式进行的,目标是要决定 n 个元素中最优者,算法是以其中一个元素开始,而后逐次移动到更好的元素, 直到到达最优者为止。一个最重要的例子就是线性规划中的单纯形算法,该算法 试图要求一个受线性约束条件的线性函数的最大值,此时一个元素对应于可行区 域的一个端点,如果从“最差的情况”的角度考察算法的效率,那么一般都能构 造出n l 步才能到达最优元素的例子。下面,我们对必需的步数给出一个简单的 概率模型。我们将考虑一个马尔可夫链,它从任何状态等可能地进入到任一更好 的状态。 考虑一个马尔可夫链链,其转移概率a 1 2 l ,而岛= 击,j 2 1 ,2 ,i ,i l 。 以z 记为从状态i 转移到状态1 的步数,对初始转移取条件可得到e z 的一个递 推公式:e z = 1 + 击五弓,从e t 0 2 0 开始,不难逐个算出e 五= 1 ,e 五= 1 + i 1 , e l 2 l + ;( 1 + l + 去) = 1 + i 1 + j 1 。不难猜想,且可用归纳法证明e l = 莩专。为了更 8 第一章绪论 完全地描述,我们利用表达式 = l ,其中1 一i o ,其他 , j - 1 r j1 ,若过程进 从而不难得出以下几个结论: ( 1 ) j 1 ,2 ,是独立的,且p ( 1 i2 1 ) = 1 ,1 ,; ( 2 ) e 巧= ; ( 3 ) c a r r 。:窆阜一 ) ; ,= 1j, ( 4 ) 对充分大的n ,巧渐进p o i s s o n 分布,均值为1 0 9 n 。 事实上,( 1 ) 成立是由于给定,。,。,令n = m i n i :i j ,。= l ,则 p i = 1 l ,+ 1 ,) = 丽i ( n - 1 ) = 号,而( 2 ) ( 3 ) 可由( 1 ) 及巧= 善i - l 得 到,对( 4 ) ,大量独立的b e r n o u l l i 随机变量的和,当各项不为零的概率很小 时,是渐进p o i s s o n 分布的1 。 1 4 问题的提出 太湖流域是长江三角洲的重要组成部分,自然条件十分优越,农垦历史悠久, 已有5 0 0 0 余年的历史,很早以前就是我国的经济发达地区,素有“鱼米之乡”, “人间天堂”的美称。现在,太湖流域是我国产业最集中,经济最发达的区域之 一,同时也是我国重要的对外经济开放地区,其工农业产值对我国的国民经济有 举足轻重的影响。太湖流域还是我国重要的工业基地,其主要的工业门类有钢铁, 机械,化工,轻工,轻纺,电子,医药,建材等。近年来流域内乡镇企业飞速发 展,不少地区的乡镇企业已成为农村经济发展的主体。在苏锡常地区的某些市县, 乡镇企业的产值已经达到与城市工业平分秋色的水平“。 作为马氏链在天气预报方面的应用,笔者通过对关于太湖流域梅雨的文献的 搜集和阅读,发现利用马氏链来对太湖流域梅雨进行预测有其他模型很难达到的 优点。这种方法不要求深入到动态变化机理的内在联系,其基本的转移概率矩阵, 以一种很少其他模型能够达到的方式来总结出一个系统中动态变化的主要参数, 因此实际使用起来关系直观,且计算简便,不要求很高的手段“。1 9 9 1 年的江 第一章绪论 淮大水,实际上就是太湖,淮河大水,不但在太湖和淮河的治水历史上,而且在 中国的治水历史上,都有重大的影响。太湖流域是我国富庶发达的地区,改革开 放的前沿,又是国家财政收入的重要来源地,在国民经济中占有重要的地位,因 此,太湖流域的汛情和灾情,受到国内外的格外关注。 1 5 研究的主要内容,创新点、研究手段及技术路线 1 5 1 研究的主要内容 文章第一部分回顾了马尔可夫链目前所应用的成果,第二部分介绍了马氏链 的基本理论,第三部分对马氏链的预测方法进行研究,首先分析了指标值序列分 组方法,然后对“马氏性”检验,最后指出了马氏链预测的三种方法:基于绝对 分布的马氏链预测,叠加马氏链预测,加权马氏链预测。文章第四部分利用基于 绝对分布的马氏链预测对太湖流域的梅雨期长度进行预测。从梅雨的相关知识入 手,系统地论述了梅雨的划分标准,梅雨期的评定,梅雨的几个特殊类型。最后 利用马氏链对太湖流域的梅雨期长度进行预测,预测结果的准确性说明了马氏链 预测方法的可靠性。文章第五部分利用时间序列的点预测对某地区1 9 9 1 年5 月 份的降水量进行预测,然后利用马氏链对该地区的降水量进行预测,两者预测结 果的吻合性也说明马氏链方法的可行性。利用随即模拟产生的随机数,我们可以 分别用基于绝对分布的马氏链和加权马氏链进行预测,通过比较对预测误差的大 小我们得出了加权马氏链预测效果要优于基于绝对分布的马氏链预测,这也符合 我们的主管判断。 1 5 2 创新点 一是利用基于绝对分布的马氏链预测对太湖流域的梅雨期长度进行预测 本文依据有关材料提供的1 9 5 4 1 9 9 1 年的太湖流域的入,出梅日期,梅雨 集中期,利用基于绝对分布的马氏链来预测太湖流域的梅雨期,以期为防洪抗旱, 指导生产生活提供科学依据。 二是分别利用时间序列和马氏链来预测某地区1 9 9 1 年5 月份的降水量,预 测结果的一致性也说明了两者作为预测方法的可行性。 三是通过随机模拟比较基于绝对分布的马氏链预测和加权马氏链预测效果 的好坏。由于随机模拟的是建立在大量试验次数的前提下,因此可以排除偶然因 素对试验结果的影响。 第一章绪论 1 5 3 研究手段及技术路线 通过太湖流域梅雨天气历史资料的搜集,运用马氏链原理,把已知的数据作 为预测对象,对其做做出预测。马氏链作为区间预测的一种方法,只能对数据的 一个区间做出科学的预测,而时间序列作为一种点预测的方法其正确性已经得到 了验证,把两者结合起来对具体问题进行分析更有力的说明了两者作为预测的优 点和不足。 利用计算机程序产生随机数据,然后用随机模拟的方法比较基于绝对分布的 马氏链预测方法和加权马氏链预测方法的有效性。 第二章马尔可夫链 第二章马尔可夫链 马尔可夫链是一种特殊的随机过程,最初由a a m a r k o v 所研究。它的直 观背景如下:设有一随机运动的系统( 例如运动着的质点等) ,它可能处的状 态记为e 0 ,e 。,e 。,总共有可数个或者有穷个。这系统只可能在时刻 t = l ,2 ,n ,”上改变它的状态。随着的运动进程,定义一列随机变量x 。, n = 0 ,i ,2 ,其中x 。= k ,如在t = n 时,位于r 。 实际中常常碰到具有下列性质的运动系统。如果已知它在t = n 时的状态, 则关于它在n 时以前所处的状态的补充知识,对预言在r l 时以后所处的状态, 不起任何作用。或者说,在已知的“现在”的条件下,“将来”与“过去”是无 关的。这种性质,就是直观意义上的“马尔可夫性”,或者称为“无后效性”。 2 i 马尔可夫链的定义 假设马尔可夫过程 墨,t i e t 的参数集t 是离散的时间集合,即t = 0 ,1 , 2 ,) ,其相应墨可能取值的全体组成的状态空间是离散的状态空间i = 1 , 2 ,) 。 定义2 1 设有随机过程( 墨,n e t ,若对任意的整数n t 和任意的i 。,i , i 。i ,条件概率满足 p x 。+ ,= i 。,lx 。= i o ,x 。= i 。,x o = i 。) = p x 。= i ,ix 。= i 。) 则称 x 。,n t ) 为马尔可夫链,简称为马氏链嘲。 定义2 2 条件概率 p = p 墨+ - = j i x 。= i ) 称为马尔可夫链 x d ,n e t ) 在时刻n 的一步转移概率,其中i ,j i ,简称为 转移概率。 一般地,转移概率p 矿不仅与状态i ,j 有关,而且与时刻n 有关。当p 不 依赖于时刻n 时,表示马尔可夫链具有平稳转移概率。若对任意的i ,j ei ,马 尔可夫链 x 。,n t ) 的转移概率p ,与n 无关,则称马尔可夫链是齐次的。应 用上主要研究齐次马尔可夫链”1 。 第二章马尔讨夫链 定义2 3 设p 表示一步转移概率p 、,所组成的矩阵,且状态空间i = 1 ,2 , , 则 f p 一 p ,:p 。 p 2 jp 2 1p 2 2 p 2 i l j 称为马尔可夫链的一步转移概率矩阵。它具有性质: ( 1 ) p 口o ,i ,j i ;( 2 ) p 口- - - - i ,i i j e l 为进一步讨论马尔可夫链的统计性质,我们给出1 1 步转移概率,初始概率和 绝对概率的概念。条件概率p x 。+ 。= jlx m = i ) 称为马尔可夫链 x 。,n t 在时刻m 时的n 步转移概率,对于齐次马尔可夫链,它与m 无关,记为硝”。 设 kn e t ) 为马尔可夫链,则对任意的整数n o ,o , o 非空,则称该集合的最大公约数d = d ( d = g c d n : p 妒 o ) 为状态j 的周期。如d ) l 就称j 为非周期的。由定义知,如果j 有周期 d ,则对一切非零的n o ( r o o d ( d ) ) 都有硝= o 。但这不是说对任意的n 有p 扩 o 。 引理2 1 如j 的周期为d ,则存在正整数m ,对一切n m ,有p o 。 证明:设 n :n l ,p o ) = 行l ,n 2 ,- ) ,令屯= g c d n 1 ,n 2 ,- - - ” ) ,贝u f 1 岛d 1 ,故存在正整数n ,使得t = f + 1 - 一d 1 因此d 2 第二章马尔可夫链 g c d h i ,:,怫) ,从而存在正整数m ,对一切n m ,由初等数论有n n d 2 ,为正整数。因而当n m 时, p ; d ) = p l z p p 一p ( a n 州卉 印, n 。 记厶”= p ( 以+ 。,1 s v ”一1 ,x = ,i x 。= f ) h 1 ,表示由质点i 出发, 经n 步首次到达j 的概率,也称首中概率。 记厶= 刀”它表示质点由i 出发经有限步终于到达j 的概率a n = l 定义2 4 称状态,为常返的,如果乃= l ,称状态j 为非常返的,如乃 o ) 证明:d 2g c d f n :n 1 ,砖 0 ) ,t = g c d n :n 1 , o ) , 显然有p ,厶,故 n :n 1 ,p o ) 3 n :n l ,f ” o ,从而 1 d t 若t 2 1 ,则d = t 2 1 若t l ,我们证明d t ,为此只证明t 是 n :n 1 , p o ) 的公约数即可。换言之,如n o ( m o d ( t ) ) ,必有p ? :o 。由t 的定义 及定理4 4 知,对一切n t ,都有p = 杰o + p ? 一今假设n :mt + r , m - 0 女= l 1 ,2 ,n l ,p = o ,则由定理4 4 及如果n o ( m 。d ( t ) ) ,矗一) = 0 我们有 p = p 7 - 1 + 2 。p 一2 h 7 + + ,;m p 了= 0 。 从而由归纳法得d t ,综上我们有d = t 证毕。 定理2 3 状态j 常返的充要条件为p = 。o ,如状态j 非常返,m j j 善2 南 证明:规定p ? = 1 ,厶= o ,由定理4 4 知p :窆,( n - z o p ,n 1 , k = l 两边乘以j “并对n i 求和,若记f p ) 和 兀) 的母函数分别为p ( s ) 和f ( s ) 则有p ( s ) 一l = p ( s ) f ( s ) ,注意到当o s l 时,f ( s ) o :称状态 i 与j 互通,并记为i j ,如果i 哼j 且j 斗i 定理2 4 可达关系与互通关系都具有传递性,即如果i 斗j ,j k ,则i 寸k : 如果i h j ,j k ,则i 针k 证明i 寸j ,即存在l l ,使得p ( t 0 ,j 寸k ,即存在m 1 ,使得p 譬 0 由 c k 方程知道p ”- - e p a p 硝砝2 o ,且l + l ,所以i - - k 定义2 5 :闭集:设c 为状态空间,的一个子集,c c ,如果对于任意的 状态i i 和任意的状态,硭,对一切n ,都有p = 0 ,则称c 为闭集。 状态空间是互通的闭集的马氏链称为不可约马氏链。 定理2 5i 抖j 则( 1 ) i 与j 同为常返或非常返,如为常返则它们同为正 常返或零常返。( 2 ) i 与j 有相同的周期。 证明:( 1 ) 由于i 付j ,由可达定义知存在l 1 和r l 1 ,使得 p 尹= 巧 0 ,砖1 = p 0 由c - k 方程知道p :”“p 扩p 护p 妒= 卿护, 谬”硝够。d ,( n = 卿将上式的两端从1 到0 0 求和,得到 p ! ”o 筘p 妒,可见p 和劣相互控制,所以它们同为有限或者 m = lm = lk = lk = l 无穷,所以它们同为常返或者非常返,又对上式中的n l 取极限,得到 ,1 2 m p ! j 月筇熙p 妒;因此憋硝与! 骢力同为0 或者同为正,所以它们 同为零常返或者正常返。 ( 2 ) 仍令p 妒= 口 o ,p 铲= 0 ,设的i 周期为d ,j 的周期为t ,由上式知 道对任一使p 紫 0 的m ,必然有p ? ” 0 ,从而d 可除尽m ,这说明d o ,于是l i m 砧) _ 1 o ,k i , 为正常返态,故该马氏链是正常返的。 再证必要性:设马氏链是正常返的,于是i i m 力= 一1 o 。由c k 方程,对 “呻。 甜 任意的正数n ,有 令m o o 取极限,得 p 扩+ 州= p p p p e jt 一0 再令- 0 0 0 取极限,得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论