蒙特卡罗方法1ppt课件.ppt

上传人：闯*** IP属地：广东上传时间：2020-03-22 格式：PPT 页数：56 大小：1.56MB 积分：25 举报 版权申诉

已阅读5页，还剩51页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 目录第一章蒙特卡罗方法概述第二章随机数的产生第三章EM算法和MCMC方法参考书茆诗松等高等数理统计第6章高等教育出版社 1998 2 徐钟济蒙特卡罗方法上海科学技术出版社 2 第一章蒙特卡罗方法概述蒙特卡罗方法又称随机抽样技巧或统计试验方法蒙特卡罗方法是一种计算方法但与一般数值计算方法有很大区别它以概率统计理论为基础由于蒙特卡罗方法能够比较逼真地描述事物的特点及物理实验过程解决一些数值方法难以解决的问题因而该方法的应用领域日趋广泛 3 1 蒙特卡罗方法的基本思想理论基础大数定律中心极限定理 F X U 0 1 基本思想 1 当所求问题的解是某个事件的概率或者是某个随机变量的期望或与概率数学期望有关的量时通过某种试验的方法得出该事件发生的频率或该随机变量若干个观察值的算术平均值根据大数定律得到问题的解 2 要生成分布函数为F x 的随机数可先生成U 0 1 随机数F 则可得到随机数X F 1 F 4 例利用MC进行欧式期权定价设股票价格St服从风险中性测度下的几何Brown运动其离散化形式为根据金融工程理论设现在股票价格为S0 T时刻到期单位天敲定价为K的欧式看涨期权的价格为 MC方案按照 1 递推产生n条风险中性测度下的轨道提取出ST n 2 5 2 蒙特卡罗方法的误差根据中心极限定理如果随机变量序列X1 X2 XN独立同分布且具有有限非零的方差 2 即则当N充分大时有如下的近似式它表明误差收敛速度的阶为以概率1 成立 6 通常蒙特卡罗方法的误差定义为关于蒙特卡罗方法的误差需说明两点第一蒙特卡罗方法的误差为概率误差这与其他数值计算方法是有区别的第二误差中的均方差是未知的必须使用其估计值来代替在计算所求量的同时可计算出 7 减小方差的各种技巧显然当给定置信度后误差由和N决定要减小或者是增大N 或者是减小方差 2 在固定的情况下要把精度提高一个数量级试验次数N需增加两个数量级因此单纯增大N不是一个有效的办法降低方差的各种技巧引起了人们的普遍注意一般来说降低方差的技巧往往会使观察一个子样的时间增加在固定时间内使观察的样本数减少所以一种方法的优劣需要由方差和观察一个子样的费用使用计算机的时间两者来衡量这就是蒙特卡罗方法中效率的概念它定义为其中c是观察一个子样的平均费用 8 蒙特卡罗方法的特点优点能够比较逼真地描述具有随机性质的事物的特点及物理实验过程受几何条件限制小收敛速度与问题的维数无关误差容易确定程序结构简单易于实现缺点收敛速度慢误差具有概率性 9 第二章随机数的产生 2 1逆变换法设随机变量X的分布函数为F x 定义定理2 1设随机变量U服从U 0 1 分布则的分布函数为F x 由定理2 1 要生成分布函数为F x 的随机数可先生成U 0 1 随机数U 则可得到随机数X F 1 U 10 2 2合成法如果X的密度函数p x 难于抽样而X关于Y的条件密度函数p x y 以及Y的密度函数g y 均易于抽样则X的随机数可如下产生 Step1由Y的分布g y 抽取y Step2由X关于Y的条件密度函数p x y 抽取x 例2 1设X的密度函数为由合成法 X的随机数可如下抽取 1 取u U 0 1 2 取确定i 使3 由pi x 抽取x 11 2 3筛选抽样当p x 难以直接抽样时如果可以将p x 表示成p x c h x g x 其中h 是一密度函数且易于抽样而0g y 回到1 上述方法就是筛选抽样法它是一种非常重要的抽样方法可解决许多难以直接抽样的分布的抽样问题 12 h x 的的选取有多种方法一种直观的方法是如果存在一个函数M x 满足p x M x 且令h x M x c 若h x 易于抽样则筛选抽样变为1 由U 0 1 抽取u 由h y 抽取y 2 如果u p y M y 则x y停止 3 如果u p y M y 回到1 筛选抽样的理论依据如下定理设X的密度函数为p x 且p x c h x g x 其中0 g x 1 c 1 h 是一密度函数令U和Y分别服从U 0 1 和h y 则在U g Y 的条件下 Y的条件密度为 13 例2 2设已知注意到取则 14 于是的随机数可如下抽取 1 由U 0 1 抽取u 2 由h y 抽取y 可使用逆变换法 3 当y 0 1 时如果则x y 否则转到1 4 当y 1时如果则x y 否则转到1 15 2 4随机向量的抽样法设X1 Xk的联合概率密度为定理2 4设U1 Uk是独立同分布的U 0 1 变量 X1 Xk是方程的解其中是对应于的分布函数则X1 Xk的分布为 2 4 2 4 2 5 16 随机向量的逆变换抽样法由U 0 1 分布独立地抽取u1 uk 用方程 2 5 解x1 xk 例2 3设X1 X2的联合密度函数为试生成X1 X2的随机数解 17 相应的边际分布函数和条件分布函数分别为方程 2 5 变为此方程不易解不妨交换两自变量的次序 18 相应的边际分布函数和条件分布函数分别为方程 2 5 变为对服从特定分布的随机向量有一些特殊的抽样方法 19 例2 6试生成k维正态分布的随机数解注意到若则存在下三角阵使其中C可由迭代实现首先由有从而因于是得依此类推 20 一般迭代公式为至此我们可以给出k维正态分布的抽样步骤 1 迭代计算 2 由N 0 1 分布独立抽取k个随机数 3 计算 21 2 5随机模拟计算 2 5 1随机投点法考虑积分设a b有限 0 f x M 令 x y a x b 0 y M 并设 X Y 是在上均匀分布的二维随机向量其联合密度函数为则易见是中曲线f x 下方面积假设我们向中投点若点落在y f x 下方称为中的则点中的概率为 22 若我们进行了n次投点其中n0次中的则可以得到一个估计不难看出是的无偏估计且其方差为 2 5 1 23 2 5 2样本均值法于是积分注意到若X U a b 则由大数定律若则 MC方法为 1 独立产生n个U a b 随机数2 按 2 5 2 估计 2 5 2 24 可证在0 f x M条件下 2 5 3降低方差的技术 MonteCarlo方法中一类重要的研究课题是考虑一些降低估计方差的技术常用的方法有重要抽样法分层抽样法关联抽样法等一重要抽样法由上节样本平均法比投点法有效将样本平均法做更一般的推广设g x 是 a b 上的密度函数改写 25 由大数定律若则 MC方法为 1 选择适当的g x 独立产生n个g x 随机数2 由 2 5 3 估计显然 2 5 3 26 从理论上看因若f x 0 取则有因为未知这是作不到的但它提示我们取g x 与f x 形状接近应能降低方差这就是重要抽样法的基本思想其方差与g x 有关问题变为如何选择g 使估计的方差最小 27 例2 5 1分别用投点法均值法重要抽样法求积分比较各种方法的有效性解i 投点法1 产生随机数2 对每对记的次数为n0 则 G ii 均值法1 产生随机数2 28 iii 重要抽样法由重要抽样法的思想需选择一个与相似的密度函数由Taylor展开式取 1 产生随机数2 取则数值计算模拟结果 29 二分层抽样法另一种利用贡献率大小来降低估计方差的方法是分层抽样法它首先把样本空间D分成一些不交的小区间然后在各小区间内的抽样数由其贡献大小决定即定义则Di内的抽样数ni应与pi成正比考虑积分将 0 1 分成m个小区间则记为第i个小区间的长度 i 1 m 在每个小区间上的积分值可用均值法估计出来然后将其相加即可给出的一个估计具体步骤为 30 1 独立产生U 0 1 随机数2 计算3 计算于是可得的估计为 2 5 4 易见是的无偏估计其方差为 2 5 5 2 5 6 31 续例2 5 1考察分层抽样法求积分的方差解先将区间 0 1 划分成两个小区间 0 0 5 0 5 1 则设一共抽n个随机数其中在 0 0 5 上抽n1个则使用分层抽样法求得的方差为 32 对n1求导易知在n固定下当时的方差最小为如果我们将区间进行10等份并确定出最优的抽样次数分配则可得到分层抽样法估计的方差为一般地若诸已知在n固定下当时估计的方差最小为 33 分层抽样法在实施上有两个主要问题其一是怎样划分区间简单而常用的方法是将区间等分另一个问题是在区间划分好后如何确定抽样次数的分配由于在实际中总是未知的因而前面最优分配的结论无法应用即使如此分层抽样法还是有其作用的可以证明即使取简单的分配也有事实上取代入 2 5 5 得由Cauchy Schwarz不等式有据此在 2 5 6 式两端各乘以并相加得于是 34 三关联抽样法考虑积分差若用估计则其方差为显然在确定后正相关度越高则的方差越小这便是关联抽样法的基本出发点考虑用重要抽样法来估计I1 I2 即改写为产生n个U 0 1 随机数令则 35 第三章数据添加算法在Bayes统计或极大似然估计的计算中经常会遇到这样一类问题设我们能观测到的数据是Y 关于Y的后验分布p Y 很复杂难以直接进行各种统计计算假如我们能假定一些没有能观察到的潜在数据Z为已知譬如 Y为某变量的截尾观测值 Z为该变量的真值则可能得到一个关于的简单的添加后验分布p Y Z 利用p Y Z 的简单性我们可以进行各种计算如极大化抽样等然后回过头来又可以对Z的假定做检查或改进如此进行我们就将一个复杂的极大化问题转变为一系列简单的极大化或抽样在统计上这种处理问题的方法称为数据添加算法常用的数据添加算法有EM算法和MarkovChainMonteCarlo方法 36 3 1EM算法先考虑一种简单情形设某元件的失效时间Y关于变量x有直线回归关系假设在一次试验中得到一批数据如图表示该元件失效时间坐标表示对应元件的截尾时间小于失效时间如果直线斜率和截矩的估计值已知则我们可以在真实数据不小于截尾数据的前提下将各个被截尾的失效时间估计出来从而得到所谓的完全数据由此完全数据重新对直线的斜率及截矩进行估计再依据新的估计量得到新的完全数据如此循环往复则将一个复杂的估计问题替换成一系列简单的估计问题将之一般化就给出EM算法 37 EM算法是一种迭代方法主要用来求后验分布的众数即极大似然估计它的每一步迭代由两步组成 E步求期望和M步极大化一般地以p Y 表示基于Y的的后验密度称为观测后验分布 p Y Z 表示添加数据Z后得到的的后验密度称为添加后验分布 p Z Y 表示在给定观测数据Y和参数条件下Z的条件密度我们的目的是计算p Y 的众数于是EM算法如下进行记为第i 1次迭代开始时后验众数的估计值则第i 1次迭代的两步为E步将p Y Z 或logp Y Z 关于Z的条件分布求期望从而把Z积掉即 38 M步将极大化即找到一个点使将上述E M步循环进行直至充分小为止例3 1设总体X的分布律为其中 0 1 现进行了 197次试验观察到1 2 3 4的频数为取的先验分布为U 0 1 分布则的观察后验分布为 39 现假设X 1可以分解为两部分其发生概率分别为1 2和 4 令和y1 Z分别表示试验结果中落入这两部分的次数是不能观测到的潜在数据则的添加后验分布为 3 1 1 3 1 2 显然用 3 1 2 式求极值比 3 1 1 式简单迭代如下 40 E步在给定下 M步将关于极大化得可以证明在关于 logp Y 的很一般的条件下由算法得到的估计序列收敛到的稳定点不能保证是极大值点较为可行的办法是选几个不同的初值迭代然后在诸估计值中加以选择这可减轻初值选取对结果的影响 41 估计的精度假设EM算法最后的结果是则根据似然估计的渐近正态性其渐近方差可用Fisher观测信息的倒数近似证明见高等数理统计 p126定理2 5 4 42 3 2MarkovChainMonteCarlo方法对于较简单的后验分布可直接计算或静态MC等近似计算方法但在实际中观测后验分布往往是复杂的高维的非标准形式的分布上述方法都难以实施对于这类问题一种简单且行之有效的Bayes计算方法就是MCMC EM算法得到的是后验分布的众数有时我们希望得到其它一些后验量如后验均值方差后验分布的分位数等计算这些后验量都可归结为关于后验分布积分的计算具体地设为后验密度我们要计算的后验量可写成某函数f x 关于的期望 3 2 1 43 3 2 1基本思路 MCMC方法的基本思想是通过建立一个平稳分布为 x 的Markov链来得到 x 的样本基于这些样本可以作各种统计推断比如若得到了平稳分布为 x 的Markov链的样本轨道则 3 2 1 可估计为 3 2 2 注由Markov链平稳分布的概念可知不论Markov链从什么初始状态出发经过一段时间后各个时间的边际分布都是平稳分布因此可将经过某个m时间之后的观察值看作平稳分布 x 的样本由遍历性定理可知 MCMC的关键是如何构造平稳分布为的Markov链的转移核p x y 44 MCMC方法可概括为如下三步 1 在X上选一个合适的Markov链确定其转移核p x y 使链的平稳分布为 2 由X中某一点X 0 出发用 1 中的Markov链产生序列X1 Xn 3 对某个m和大的n 任一函数f x 的期望估计如下 MCMC有许多研究专题如链的收敛性判断 m大小的确定链的长度 n的大小的确定估计误差等等以下主要讨论转移核的构造 45 3 2 2满条件分布 MCMC主要用于多变量非标准形式且各变量间相互不独立时分布的模拟令我们总可以写出其中如果 3 2 1 式中右端各个因子能够直接模拟则只需要进行静态模拟抽样过程中不改变抽样分布实际中很难满足上述条件因此需进行动态模拟抽样分布随模拟的进行而改变如MCMC 此时满条件分布扮演了一个重要角色 3 2 1 在导出满条件分布时应注意到这样一个事实记 3 2 2 46 等价地若且则 3 2 3 一般地用y表示观测数据其中分别表示参数超参数和缺损数据则有其中表示完全数据的密度函数表示先验分布表示超参数的分布有 3 2 2 各变量的满条件分布如下 47 例3 2 1设 X1 X2 的联合密度为且则其满条件分布为 48 3 2 3Gibbs抽样思想设的密度为任意固定T N 在给定条件下如下定义随机变量具有密度函数则对任一可测集B 因而X 的密度也是上述过程定义了一个由X到X 的转移核且其相应的平稳分布是这样构造的MCMC称为Gibbs抽样当T只有一个元素时称为单元素Gibbs抽样 49 单元素Gibbs抽样具体步骤如下在给定起始点后假定第t次迭代开始时的估计值为则第t次迭代分为如下n步 1 由满条件分布抽取 i 由满条件分布抽取 n 由满条件分布抽取记则是平稳分布为的Markov链的实现值其由x到x 的转移概率函数为 50 3 2 3Metropli

人人文库> 全部分类> 毕业设计 > 开题报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

蒙特卡罗方法1ppt课件.ppt

文档简介

温馨提示

最新文档

评论

蒙特卡罗方法1ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档