若干概率分布的正态逼近及其应用资料_第1页
若干概率分布的正态逼近及其应用资料_第2页
若干概率分布的正态逼近及其应用资料_第3页
若干概率分布的正态逼近及其应用资料_第4页
若干概率分布的正态逼近及其应用资料_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1若干概率分布的正态逼近及其应用为重要许多重要的概率分布都与正态分布密切相关此外很多重要分布的极限分布在一定条件下也都是正态分布有些随机变量其分布虽然未知但是只要满足很一般的条件其极限分布也是正态分布本文主要介绍了若干概率分布的正态逼近方法以及正态逼近的实际应用并从中心极限定理可以看出一个变量如果是由大量微小的、独立的随机因素的叠加结果那么这个变量一定是正态变量因此很多随机变量可以用正态分布或正态近似描述这也充分体现了正态分布在概率论与数理统计中的重要性关键词:常用分布;概率分布;正态逼近;正态逼近的应用正态分布是自然科学与行为科学中的定量现象的一个方便模型.各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从正态分布.尽管这些现象的根本原因经常是未知的,理论上可以证明如果把许多小作用加起来看作一个变量,那么这个变量服从正态分布.正态分布出现在许多区域统计:例如,采样分布均值是近似地正态的,既使被采样的样本总体并不服从正态分布.另外,正态分布信息熵在所有的已知均值及方差的分布中最大,这使得它作为一种均值以及方差已知的分布的自然选择.正态分布是在统计以及许多统计测试中最广泛应用的一类分布.在概率论中,正态分布是几种连续以及离散分布的极限分布.本文讨论了几种常见的概率分布的正态逼近性,并介绍了其应用.为更深入的理解和应用正态分布奠定了一定的理论与应用基础.近2.1正态分布正态分布是最常见最重要的一种分布,例如测量误差、人的生理特征尺寸如身似服从正态分布.2.1.1正态分布的定义一其中其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布或高斯分布,记为:.1.2标准正态分布22x表示为2t(2.3)-的(1)、通过对三组正态曲线分析,得出正态曲线具有的基本特征是两头底、中(2)、曲线在x轴的上方与x轴不相交.(3)、曲线关于直线x=r对称.(5)、当x<r时,曲线上升(增函数);当x>r时,曲线下降(减函数).并且2.1.4正态分布的特征服从正态分布的变量的频数分布由r、Q完全决定.(1)、r是正态分布的位置参数,描述正态分布的集中趋势位置.正态分布以x=r为对称轴,左右完全对称.正态分布的均数和中位数都等于r.3aaa并在x=r时取最大值.从x=r点开始,曲线向正负两个方向递减延伸,不断逼近xxx.(4)、通过三组正态分布的曲线,可知正态曲线具有两头低、中间高、左右对称(5)、标准正态曲线:当r=0、a=1时,正态总体称为标准正态总体,其相应的2.2二项分布2.2.1二项分布的定义如果记X为n重伯努利试验中成功(记为事件A)的次数,则X的可能取值为0,1,,n.记p为每次实验中A发生的概率,即P(A)=p,则P(A)=1-p.o12ni12n意味着o,o,,o中有k个A,n-k个A,所以由独立性知,12n而事件{X=k}中这样的o共有(|(个,所以X的分布列为 这个分布称为二项分布,记为X~b(n,p).2.2.2二项分布的曲线特性4t2t2二项分布的图形有如下特征:二项分布既可以泊松近似也可以正态近似,当p较小时,用泊松近似计算二项分布比较好;而当p0.5,n较小时为偏态分布,较大时逼近正态分布;当np5和2nkk则随机变量nXEnXnXn则随机变量(2.4)的分布函数F(x)对于任意满足n22 这个定理也叫林德贝格—勒维中心极限定理,它有广泛的应用.该定理只假设逼近.XXX12n5爪2nkkE(X)=p,kkkk若存在正数6,使得当n)w时, 1xnE{X-p2+6})0,B2+6kkxnX-E(xnX)xnX-xnp的分布函数F(x)对于任意x满足nxnX-xnpnBn当n很大时,近似的服从正态分布N(0,1).因此当n很大时:xnX=BZ+xnp近似的服从正态分布N(xnp,B2)这就是说,无论各个随机变量服从什么分布,近似的服从正态分布N(xnp,B2)这就是说,无论各个随机变量服从什么分布,只要满足定理的条件,那么它们的和xnX当n很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和.在数理统计中我们将会看到,中心极限定理是大样本统计推断的理论基础.下面介绍的另一个中心极限定理,他是定理一的特殊情况.n 德莫佛—拉普拉斯极限定理是概率论历史上的第一个中心极限定理,它是专门针对6来计算二项分布的概率.因为德莫佛-拉普拉斯极限定理是二项分布的正态近似定理,它使得二项分布的正态逼近有了依据,因此下面我们在给出德莫佛-拉普拉斯极限定理的应用之前,先说明以下两点:1、因为二项分布是离散分布,而正态分布是连续分布,所以用正态分布作为二项分布的近似计算中,作些修正可以提高精度.若kk均为整数,一般先作如下修正后21n21n2nn当使用修正的正态近似式nnn当不使用修正的正态近似时n可见不使用修正的正态近似误差较大.n可用来解决以下三类计算问题:2.3泊松(Poisson)分布Poisson分布是概率论中常用的一种离散型概率分布,当二项分布中n很泊松分布,记作X~P(p).这个分布是S.-D.泊松研究二项分布的渐近公式时提出来的.泊松分布P(p)中只有一个参数p,它既是泊松分布的均值,也是泊松分12k7 812nx12nx12k12k2.4X2-分布n设nn(2.10)机变量X2简称X2变量.图4X2分布的概率分布函数图图5X2分布的累积分布函数图(1)、EX2=n,DX2=2n这两个式子可由分布密度表示式(2.10),用数学期望和方差的定义分别计算计算.事实上,EX2=E2=E1Dn9上面第二式最后一个等号用到DX2=EX4-(E=1j的iii2-的121.21212121.212122nXX,它的自由度等XnX任意x有n)的l2nJn)的l2nJ2n-的因此,n因此,n较大时,-近似服从标准正态分布,亦即自由度n很大时,X2分布近似于正态分布N(n,2n).12n12n12n用中心极限定理,X经标准化后得到的X-n(利用性质(1))的分布,当n)的时趋于标准正态分布N(0,1).当n>45时,在附表中,由a查不到上侧分位数X2(n)的数值.此时可以利用式aaP{U>u}=aaa,aT的u则称此a,aT2.5t分布及其正态逼近2.5.1t分布的定义布,且X与Y相互独立,则XXn的分布密度为这种分布称为自由度为n的t分布,简记为t(n).它亦称为学生分布.随机变量T简称T变量.2.5.2t分布的性质t分布的曲线见图t分布具有如下性质(1)、t分布是对称分布,且其均值为0.(2)、当样本容量n较小时,t分布的方差大于1;当n增大到大于或等于30时,t分布的方差就趋近于1,t分布也就趋近于标准正态分布.(3)、t分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为(4)、与标准正态分布相比,t分布的中心部分较低,2个尾部较高.2.5.3t分布的正态逼近数,所以t分布密度关于y轴是对称的.当n)w时,t分布密度的极限为"n)wnT(|())|1t2=e-其中最后一个等号由T函数性质获得.因此,当n)w时t分布密度趋于标准正态分布密度.ftdtata(n)则称t(n)为t分布的上侧分位数,它的数值可从附表中查得,当n>45时,可用自由度w一栏的数值作为t(n)的近似值,实际上此栏数值是从标准正态分布获得的.a2.6正态母体中X的分布2X的定义12nXXXXn=1xnXnnii=1X=1122kkXX=1122kkn其中k为组数,X为第i组的组中值,f为第i组的频数.ii 2.6.2X分布图像及性质 ()、样本均值的标准差即抽样误差总是按一定比例小于总体的标准差而且不放回抽样的抽样误差比放回抽样的抽样误差要小()、扩大样本容量样本均值的标准差(抽样误差)减小X的正态逼近定理:设X,X,,X是独立同分布随机变量,且每个随机变量服从正态分布12nxnX量,乘上因子1所得到的X也in是正态变量.又 (n) (n)具有何种形式只要样本容量n具有何种形式只要样本容量n足够大的分布就近似标准正态分布装n三常见分布正态逼近的应用正态分布的应用误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理.其中经对数转换后服从正态分布的指标,被称为服从对数正态分布.1.估计频数分布:一个服从正态分布的变量只要知道其均数与标准差就可根据相关公式估计任意取值(X,X)范围内频数比例.22.制定参考值范围(1)、正态分布法:适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标.、百分位数法:常用于偏态分布的指标.3.质量控制:为了控制实验中的测量(或实验)误差,常以X土2S作为上、下警戒值,以X土3S作为上、下控制值.这样做的依据是:正常情况下测量(或实验)误差服从正态分布.等多种统计方法均要求分析的指标服从正态分布.许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的.3.2二项分布的应用设检验.21212Poisson分布适合于描述单位时间内随机事件发生的次数,Poisson分布也态近似的原理,可用对总体均数进行95%的区间估计.同样,也可通过直接计算近似法检验样本率与总体率,两个样本率比较的假设检验.3.4两个例题例一:用中心极限定理说明在正常的射击条件下,炮弹的射程服从或近似服从正态分布.的随机因素在不断变化,所以造成了实际射程对理论射程的偏差.若设:射击时炮身振动引起的偏差;:炮弹外形差异引起的偏差;:炮123i,,,可看作是相互独立的.12n因为正常的射击条件也就是对射击有显著影响的因素已被控制,所以 所起的作用可看作是同样微小.因为可正、可负且相会均等.所以0.那么~N0,2H:=0.010H:=不拒绝H,尚不能认为该地异常率低于一般.1212的和,并且其中每一个随机变量所起的作用都很微小,则这个随机变量服从或近似服从正态分布,这给我们的计算带来很大方便.车的概率.iiii在关系.也即泊松分布与正态分布的关系.且知离散型随机变量的极限分布是正态分布.4.1问题一:电话线路问题在电话局A与B之间有对用户需要采用电话联系,我们希望决定安装在A与B之间的线路数目.假设在任何繁忙的一小时的时间内,一对用户大约占用线路m分钟,这也可以说在任何一个特定的瞬间一对用户大约占用一条线路的概率为p=m,这里可以把不同用户占用线路比拟作具有成功概率等于p的n次伯努利试验,r个用户需要占线的概率为n假定我们希望在以A与B之间安装N条线路,使得任何一个用户不能通话的概率小于或等于a(通常a取0.05或0.01),若在某一瞬时N条线路全部被用户占用,这意味着有多于N对用户需用线路,该事件的概率由下式t=N来决定是相当困难的,故可用给出的正态逼近公式来决定N,式(4.1)的左边等于随qqaqqann

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论