




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于R软件的统计模拟,主要内容,1.统计模拟的基本概念,2.赶火车问题,3.R软件的统计模拟功能,4.应用R软件模拟验证大数定律,5.应用R软件模拟验证中心极限定理,一、统计模拟的基本概念,(一)统计模拟的定义,统计模拟即是计算机统计模拟,它实质上是计算机建模,而这里的计算机模型就是计算机方法、统计模型(如程序、流程图、算法等),它是架于计算机理论和实际问题之间的桥梁。它与统计建模的关系如下图。,实际问题,统计、逻辑模型,计算机模拟(程序、算法),统计、计算机解,实际解,一、统计模拟的基本概念,(二)统计模拟方法,一般地,统计模拟分类如下:若按状态变量的变化性质分为连续随机模拟和离散随机模拟。而按变量是否随时间变化又可分为动态随机模拟和静态随机模拟。常用的统计模拟方法主要有以下几种:1.蒙特卡罗法2.系统模拟方法3.其它方法:包括Bootstrap(自助法)、MCMC(马氏链蒙特卡罗法)等。,一、统计模拟的基本概念,(三)统计模拟的一般步骤,二、赶火车问题,一列列车从A站开往B站,某人每天赶往B站上车。他已经了解到火车从A站到B站的运行时间是服从均值为30min,标准差为2min的正态随机变量。火车大约下午13:00离开A站,此人大约13:30到达B站。火车离开A站的时刻及概率如表1所示,此人到达B站的时刻及概率如表2所示。问此人能赶上火车的概率有多大?,表1:火车离开A站的时刻及概率,表2:某人到达B站的时刻及概率,二、赶火车问题,问题的分析这个问题用概率论的方法求解十分困难,它涉及此人到达时刻、火车离开站的时刻、火车运行时间几个随机变量,而且火车运行时间是服从正态分布的随机变量,没有有效的解析方法来进行概率计算。在这种情况下可以用计算机模拟的方法来解决。,:火车从A站出发的时刻;:火车从A站到B站的运行时间;:某人到达B站的时刻;:随机变量服从正态分布的均值;:随机变量服从正态分布的标准差;,二、赶火车问题,进行计算机统计模拟的基础是抽象现实系统的数学模型,为了便于建模,对模型中使用的变量作出如下假定:,此人能及时赶上火车的充分必要条件为:,所以此人能赶上火车的概率模型为:。,二、赶火车问题,为了分析简化,假定13时为时刻t=0,则变量、的分布律为:,二、赶火车问题,R软件求解的总算法:,产生随机数,验证模型,成立次数k=k+1,否,是,计算估计结果k/n,成立次数不变,是,否,编写R程序,借助区间(0,1)分布产生的随机数,对变量、概率分布进行统计模拟;,根据变量、概率分布及模拟程序、命令产生n个随机分布数;,使用随机产生的n组随机数验证模型中的关系表达式是否成立;,计算n次模拟实验中,使得关系表达式成立的次数k;,当时,以作为此人能赶上火车的概率p的近似估计;,进入演示,windows(7,3)prb=replicate(100,#括号内程序重复100次x=sample(c(0,5,10),1,prob=c(0.7,0.2,0.1)y=sample(c(28,30,32,34),1,prob=c(0.3,0.4,0.2,0.1)plot(0:40,rep(1,41),type=n,xlab=time,ylab=,axes=FALSE)axis(1,0:40)r=rnorm(1,30,2)points(x,1,pch=15)i=0while(i=y)points(y,1,pch=19)Sys.sleep(0.1)points(y,1,pch=19)title(ifelse(x+ry)mean(prb),进入模拟,三、R软件的统计模拟功能,1、R软件优秀的随机数模拟功能,生产某概率分布的随机数是实现统计模拟的前提条件,而使用R命令可以生成以下常用分布的随机数:,三、R软件的统计模拟功能,2、优良的编程环境和编程语言,R所拥有的好的兼容性、拓展性和强大的内置函数有利于统计模拟的实现。,3、高效率的向量运算功能,使用R拥有的向量运算功能可以大大减少程序运行的时间,提高程序运行的效率。,下面以求解Pi的程序为例加以说明,未采用R向量运算功能的程序为:,mc1-function(n)set.seed(1234579)k-0;x-runif(n);y-runif(n);for(iin1:n)if(xi2+yi21)k-k+1;data.frame(Pi=4*k/n),引入向量运算功能改进后的程序为:,mc1-function(n)set.seed(1234579)k-0;x-runif(n);y-runif(n);k0,有,(2)辛钦定理:设随机变量相互独立,服从同一分布,且具有数学期望,则对于任意正数,有,四、应用R软件模拟验证大数定律,2、在R软件实现的算法思想:,由大数定律可知,当,样本的均值趋向与理论分布的期望,因此利用样本容量逐渐增大这一趋势来模拟这一趋势,在这种趋势下,样本的均值与理论分布期望的误差应该呈现出越来越小的趋势,同时,根据上述思想,分别对五种常用分布下的大数定律进行验证。,四、应用R软件模拟验证大数定律,大数定律模拟算法,设置参数值,产生m维序列,绘图,是,否,编写R程序,选择分布类型,产生随机数,计算样本均值y,设置循环的跳跃步长、的第一次抽样的样本容量初始值和上限值;,利用函数产生由各模拟样本空间大小组成的m维序列;,选择随机数的分布类型,本文中的相关程序仅选择了常用的随机分布:正态分布、指数分布、均匀分布、泊松分布、二项分布、两点分布;,利用R软件产生n个服从同一分布的随机数;,计算(或)的值;,若循环次数im,则回转,否则转;,以x轴代表样本容量n,y轴代表每次抽样所得的样本均值,描绘出整个试验的过程。,进入演示,五、应用R软件模拟验证中心极限定理,1、验证的中心极限定理有,(1)独立同分布的中心极限定理:设随机变量相互独立,服从同一分布,且具有数学期望和方差:,则随机变量之和的标准化变量:,的分布函数对于任意满足:,(2)DeMoivre-Laplace(棣莫弗-拉普拉斯)中心极限定理,设相互独立的随机变量服从参数为p的两点分布,则对于任意实数x,有,五、应用R软件模拟验证中心极限定理,选择分布类型,确定参数m和n,统计检验和描述性分析,是,否,编写R程序,产生随机数,计算标准化随机变量,设置参数j和step,中心极限定理模拟算法,选择随机变量的分布类型,主要分布类型有正态分布、指数分布、均匀分布、泊松分布、二项分布和两点分布;,设置模拟试验总次数m及每次模拟试验中随机变量的个数n的值;,利用R软件模拟产生n个服从同一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年有机合成工中级笔试重点题解
- 2023四年级语文下册 第五单元 17 记金华的双龙洞(新学习单)说课稿 新人教版
- 短视频推广佣金合同
- 怎么使用ar教学模式下载课件
- 变更原则协议
- 2025年安全生产安全规程模拟题及答案
- 2025年5G网络工程师面试答案
- 云南省大理白族自治州四年级上册语文2024-2025学年知识巩固(人教版)
- 2025北京市劳动合同书示范文本(合同版本)
- 2025年正式离职员工信息保密合同范文
- 烟草香味化学
- 院感培训试题及
- 电气照明系统课件
- 临时用水施工专项方案
- 北京市各县区乡镇行政村村庄村名明细
- GB∕T 9286-2021 色漆和清漆 划格试验
- DB35∕T 1844-2019 高速公路边坡工程监测技术规程
- 720全景照片制作方案及发布流程
- 工作责任心主题培训ppt课件(PPT 26页)
- 除尘器基础知识培训资料(54页)ppt课件
- 完整解读新版《英语》新课标2022年《义务教育英语课程标准(2022年版)》PPT课件
评论
0/150
提交评论