统计基础二:大数定律与中心极限定理.pptx_第1页
统计基础二:大数定律与中心极限定理.pptx_第2页
统计基础二:大数定律与中心极限定理.pptx_第3页
统计基础二:大数定律与中心极限定理.pptx_第4页
统计基础二:大数定律与中心极限定理.pptx_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数定律与中心极限定理,独立同分布大数定律:设随机变量X1,X2,X3,Xn, 相互独立,且具有相同的方差和期望:E(Xk)=,D(Xk)=2(k1,2,3,),作前n个随机变量的算术平均 则对任意小的正数,有,该定律表明,当n足够大时,独立同分布的一系列随机变量的算术平均数接近(以概率收敛于)数学期望,即平均数具有稳定性。从而提供了用样本平均数估计总体平均数的理论依据。,大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。,贝努利大数定律 设A在n重贝努利试验中发生 次,p=P(A),则对任何 0,有,说明:贝努利大数定律是说,当n很大时, 故可用事件发生的频率近似代替事件发生的概率。,例1 设总体X服从参数为2的指数分布, 为 来自总体X的简单随机样本,则当n时, 依概率收敛于 。,定义,中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。最常用的有: 独立同分布中心极限定理: “随机变量x1,x2,独立,且服从同一分布, 若存在有限的数学期望E(xi)=u和方差D(xi)=2, 当n时,随机变量的总和xi趋于均值为nu,方差为n 2的正态分布。 (即算术平均数1/n xi=xbar趋于均值为u,方差为2/n的正态分布)” 不论总体服从何种分布,只要它的数学期望和方差存在, 从中抽取容量为n的样本,则这个样本的总和或平均数是随机变量, 当n充分大时, xi或 xbar趋于正态分布。,定义,德莫佛-拉普拉斯中心极限定理: “如果用X表示n次独立试验中事件A发生(“成功”)的次数,P是事件A在每次试验中发生的概率,则X服从二项分布,B(n,p), 当n时,X趋于均值为np,方差为npq的正态分布。 ” 正态分布和泊松分布都是二项分布的极限分布, 当n足够大时, 可用正态分布近似计算; 当n足够大且p小时,可用泊松分布近似计算。 中心极限定理是一种十分重要的现象,它是统计学中应用的许多方法的理论基础的组成部分(如:计算样本均值的置信区间),利用同样的数据画出两种不同的控制图,并仔细比较它们的差异: 打开文件CENLIMIT.MTW . 分别用下面的两个路径画出个体图和子群大小为5的均值图 个体图路径 均值图路径,应用,图形输出,个体数据,样本平均,仔细比较两个图上的控制上下线(UCL和LCL),有什么不同?,个体控制图和 X bar控制图的差异,应用,平均值分布的标准偏差叫做 均值标准误差 ,因而其定义为: 这个公式表明平均值比个体数据更稳定,稳定因子是样本数的平方根。,s,x,=,=,均值标准误差,个体值的标准差,n,=,平均值的样本数,x,均值的标准误差(Standard Error of the Mean),其中,我们经常依靠从测量系统中得到的一个数值来估计输入或输出变量的值。减小测量系统误差的简易方法就是把两个或更多的读数平均。 我们的测量系统的精密度自动增加,增加因子是平均值样本数的平方根,如果我们要想使测量系统的误差减小一半,我们就需要把4次的测量值平均才可以。,实际应用,测量系统的改善,当总体数据具备正态分布时,中心极限定理理解例题模拟-1,假设你面前有一个大桶,桶里面装有相当多数量的白色纸条,每张纸条上都写 有数字,且假定这些数字都来自一个具有特定平均值和标准偏差的正态分布. 1)从中随机抽出9张白色纸条,并把其上面的9个数字求平均, 2)然后把这个平均值写在一张绿色纸条上, 3)把这9张白色纸条放回原来的桶里, 4)把这张绿色纸条放入另外一个桶里, 如此重复上面的步骤,直到盛有绿色纸条的桶放满为止。 白色纸条代表总体的数据; 绿色纸条代表平均值的样本; 我们用MINITAB来模拟做这个练习。,让我们用MINITAB产生一些模拟的数据来验证我们的理论。 首先用MINITAB产生9列各250个数据,假设这些数据来自一个 平均值=70、标准偏差=9的正态分布: 则列C1-C9 代表白色纸条 然后求出各行9个数据的平均值,其结果放在列C10,则 C10代表绿色纸条。 我们用描述统计的方法求出各列数据的平均和标准偏差。 仔细比较C1-C9列与C10列有什么差别?,例题1 中心极限定理应用模拟,1、用MINITAB随机产生样本数据,分别输入下列信息,2、样本平均数计算,3、输出:产生10列数据,注意:每次每个人操作产生的数据都不一样,4、描述统计路径,5、描述统计结果比较,Variable N Mean SE Mean TrMean StDev Median C1 250 69.218 0.592 69.116 9.364 68.803 C2 250 69.649 0.573 69.610 9.059 69.204 C3 250 70.354 0.548 70.290 8.672 69.870 C4 250 71.108 0.577 71.120 9.125 70.722 C5 250 70.398 0.542 70.402 8.574 70.105 C6 250 70.650 0.534 70.772 8.442 70.483 C7 250 70.161 0.551 70.293 8.713 70.216 C8 250 70.377 0.550 70.238 8.698 70.397 C9 250 69.872 0.580 69.925 9.173 70.145 C10 250 70.199 0.187 70.187 2.955 70.29,5、描述统计结果比较(续),Variable N Mean SE Mean TrMean StDev Median C1 250 69.218 0.592 69.116 9.364 68.803 C2 250 69.649 0.573 69.610 9.059 69.204 C3 250 70.354 0.548 70.290 8.672 69.870 C4 250 71.108 0.577 71.120 9.125 70.722 C5 250 70.398 0.542 70.402 8.574 70.105 C6 250 70.650 0.534 70.772 8.442 70.483 C7 250 70.161 0.551 70.293 8.713 70.216 C8 250 70.377 0.550 70.238 8.698 70.397 C9 250 69.872 0.580 69.925 9.173 70.145 C10 250 70.199 0.187 70.187 2.955 70.29,现在开始比较。,样本的散布(C9)和样本平均的散布(C10)进行比较。,散布 减少了很多., = 9.173, = 2.955,6、直方图结果比较,用点图比较频度数则能够更明确的了解散布。,7、点图结果比较,样本平均值分布的平均值和总体的平均值十分接近; 样本平均值分布的标准偏差等于总体的标准偏差除以样本数的平方根; 样本平均值的分布十分接近正态分布。,8、结论,当总体数据是非正态分布时,若从中随机抽样n个并计算其平均, 同样如此反复若干次,然后比较这些平均的散布与这些个体值的 散布,你会发现,当n时,x-bar的散布也具有正态分布。 为了验证,我们在非正态分布中随机选择一个偏移较大的分布- “Chi-Square分布”,求其x-bar来体会一下中心极限定理。,当总体数据不具备正态分布时,中心极限定理理解例题模拟-2,1、用Chi-Square分布随机产生9列,每列各有250个数据,2、用产生的数据进行点图描绘和正态检验,在这里看到,这是一个很偏移的分布, 我们用它来验证中心极限定理,C10 项是对 C1C9 的平均值的数据统计, 同样样本大小为 9,其散布明显变得小多了。,Variable N Mean SE Mean TrMean StDev Median C1 250 2.041 0.137 1.765 2.163 1.287 C2 250 2.055 0.135 1.798 2.134 1.475 C3 250 1.861 0.119 1.644 1.874 1.291 C4 250 1.966 0.122 1.731 1.930 1.406 C5 250 1.953 0.111 1.791 1.749 1.339 C6 250 1.966 0.128 1.717 2.026 1.220 C7 250 1.842 0.118 1.640 1.869 1.357 C8 250 2.024 0.120 1.843 1.899 1.534 C9 250 1.929 0.132 1.682 2.085 1.156 C10 250 1.9597 0.0431 1.93

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论