大数定律和中心极限定理.pps_第1页
大数定律和中心极限定理.pps_第2页
大数定律和中心极限定理.pps_第3页
大数定律和中心极限定理.pps_第4页
大数定律和中心极限定理.pps_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

郑州轻工业学院数学与信息科学系,第五章:大数定律和中心极限定理 概率统计教研组,第五章 大数定律和中心极限定理,人们在长期的实践中发现,事件发生的频率具有稳定性,也就是说随着试验次数的增多,事件发生的频率将稳定在一个确定的常数,即概率值附近 频率的稳定性是概率定义的客观基础,在第一章中我们从直观上描述了这一事实。 本章将用大数定律对频率的稳定性作出理论上的说明,第五章 大数定律和中心极限定理,另外,在前面,我们还看到相互独立的正态随机变量的和仍是正态随机变量。 本章将要介绍的中心极限定理将给出概率论中的另一个重要结果:在相当一般的条件下,充分多个相互独立的非正态随机变量(不管它们的分布如何)的和近似服从正态分布这一事实更说明了正态分布的重要性 大数定律和中心极限定理无论在应用上还是理论上都具有极其重要的作用,第五章 大数定律和中心极限定理,【吸烟率调查问题】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?,第五章 大数定律和中心极限定理,主要内容 一 大数定律 二 中心极限定理 第五章:总结,5.1 大 数 定 律,对某个随机变量X进行大量的重复观测,所得到的大批观测数据的算术平均值也具有稳定性. 由于这类稳定性都是在对随机变量进行大量重复试验的条件下呈现出来的,历史上把这种试验次数很大时出现的规律统称为大数定律 首先来引进证明大数定律所需要的预备知识契比谢夫(Chebyshev)不等式,5.1 大 数 定 律,【定理5.1】 设随机变量X的数学期望E(X)及方差D(X)都存在,则对于任意正数,有不等式 (5.1) 即 (5.2) 成立称上述不等式为契比谢夫(Chebyshev)不等式 此定理进一步说明方差是一个反映随机变量在其分布中心E(X)附近集中程度的数量指标 利用契比谢夫不等式,我们可以在随机变量X的分布未知的情况下估算概率值的界限,.,5.1 大 数 定 律,【例5-1】若某班某次考试的平均分为80分,标准差为10,试估计及格率至少为多少? 解:用随机变量X表示学生成绩,则数学期望E(X) = 80,方差D(X) = 100,所以 P60 X 100 P60 X 100 = P|X 80| 20 所以及格率至少为75%,5.1 大 数 定 律,【例5-2】已知n重伯努利试验中参数p = 0.75,问至少应做多少次试验,才能使试验成功的频率在0.74和0.76之间的概率不低于0.90? 解:设需做n次试验,其中成功的次数为X,则XB(n,p),E(X) = np,D(X) = np(1 p)。 因为 根据契比谢夫不等式应有,5.1 大 数 定 律,【例5-2】已知n重伯努利试验中参数p = 0.75,问至少应做多少次试验,才能使试验成功的频率在0.74和0.76之间的概率不低于0.90? 解:设需做n次试验,其中成功的次数为X,则XB(n,p),E(X) = np,D(X) = np(1 p)。 根据契比谢夫不等式应有 令 解得,5.1 大 数 定 律,【定义5.1】 设X1,X2,Xn是一随机变量序列,a是一常数,若对任意正数,有 则称序列X1,X2,Xn,依概率收敛于a,记为 注:若 当n充分大时, Xn 以很大的可能 性接近于a,这种接近是“概率意义下的接近”,与微积 分中数列收敛中的“接近”不同,5.1 大 数 定 律,【定理5.2】(契比谢夫大数定律)设X1, X2, , Xn 是相互独立,服从同一分布的随机变量序列,且具有数 学期望E(Xi) = 及方差D(Xi) = 2(i = 1, 2,), 则 依概率收敛于,即对于任意正数,有 即 (5.3) 证:,5.1 大 数 定 律,【定理5.2】(契比谢夫大数定律)设X1, X2, , Xn 是相互独立,服从同一分布的随机变量序列,且具有数 学期望E(Xi) = 及方差D(Xi) = 2(i = 1, 2,), 则 依概率收敛于,即对于任意正数,有 即 (5.3) 证:对 运用Chebyshev不等式,5.1 大 数 定 律,定理5.2表明,当n充分大时,随机变量序列的算术平均值接近于数学期望E(Xk) = ,这种接近是概率意义下的接近通俗地说,在定理条件下,n个相互独立同分布随机变量的算术平均值,当n无限增大时,几乎变成了一常数 这一定理从理论上说明了大量观测值的算术平均具有稳定性,为实际应用提供了理论依据例如,在进行精密测量时,人们为了提高测量的精度,往往要进行若干次重复测量,然后取测量结果的算术平均值,5.1 大 数 定 律,【定理5.3】(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数,有 即 (5.4) 证:引入随机变量Xi(i = 1,2,): 则,5.1 大 数 定 律,【定理5.3】(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数,有 证:其中Xi相互独立且均服从参数为p的0-1分布,即 且有E(Xi) = p,D(Xi) = p(1 p),i = 1,2,n 由定理5.2得到,5.1 大 数 定 律,【定理5.3】(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数,有 即 (5.4) 证: 由定理5.2得 即,5.1 大 数 定 律,伯努利大数定律表明事件A发生的频率nA/n依概率收敛于事件A发生的概率p 这也正是在大量重复独立试验中,频率nA/n接近于概率p的真正含义,也就是我们所说的频率稳定性的真正含义 所以当试验次数很大时,就可以利用事件发生的频率来近似地代替事件发生的概率,5.1 大 数 定 律,【定理5.4】(辛钦大数定律)设X1,X2,Xn,是相互独立,服从同一的分布的随机变量序列,且具有数 学期望E(Xi) = (i = 1,2,),则 依概率收敛于,即 (5.5) 辛钦大数定律提供了求随机变量数学期望E(X)的近似值的方法 辛钦大数定律是数理统计部分中点估计理论的重要依据,5.1 大 数 定 律,【例5-3】设随机变量X1,X2,Xn独立同分布,且 存在, 令 则 证:因为X1,X2,Xn独立同分布,所以 独立同分布。 又 存在,由辛钦大数定律,5.2 中心极限定理,大数定律讨论的是多个随机变量的算术平均的渐近性质现在我们来讨论独立随机变量和的极限分布先给出一个例子,5.2 中心极限定理,【例5-4】误差分析是人们经常遇到且感兴趣的随机变量,大量的研究表明,误差产生是由大量微小的相互独立的随机因素叠加而成的现在考虑一位操作工在机床上加工机械轴,要求其直径应符合规定要求,但加工后的机械轴与规定要求总会有一定误差,这是因为在加工时受到一些随机因素的影响,它们是: (1) 在机床方面有机床振动与转速的影响; (2) 在刀具方面有装配与磨损的影响; (3) 在材料方面有钢材的成分、产地的影响; (4)在操作者方面有注意力集中程度、当天的情绪的影响,5.2 中心极限定理,【例5-4】误差分析是人们经常遇到且感兴趣的随机变量,大量的研究表明,误差产生是由大量微小的相互独立的随机因素叠加而成的现在考虑一位操作工在机床上加工机械轴,要求其直径应符合规定要求,但加工后的机械轴与规定要求总会有一定误差,这是因为在加工时受到一些随机因素的影响,它们是: (1) 在机床方面有机床振动与转速的影响; (5) 在测量方面有度量工具误差、测量技术的影响; (6) 在环境方面有车间温度、湿度、照明、工作电压的影响; (7) 在具体场合还可列出许多其他影响因素,5.2 中心极限定理,由于这些因素很多,每个因素对加工精度的影响都是很微小的,而且每个因素的出现又都是人们无法控制的、随机的、时有时无、时正时负的 这些因素的综合影响最终使每个机械轴的直径产生误差,若将这个误差记为Yn,那么Yn是随机变量,且可以将Yn看作很多微小的随机波动X1,X2,Xn之和,即 Yn = X1 + X2 + Xn 这里n是很大的,那么我们关心的是,当时n时,Yn的分布是什么?,5.2 中心极限定理,由于这些因素很多,每个因素对加工精度的影响都是很微小的,而且每个因素的出现又都是人们无法控制的、随机的、时有时无、时正时负的 Yn = X1 + X2 + Xn 这里n是很大的,那么我们关心的是,当时n时,Yn的分布是什么? 当然,我们可以考虑用卷积公式去计算Yn的分布,但这样的计算是相当复杂的、不现实的,而且也是不易实现的有时即使能写出Yn的分布,但由于其形式复杂而无法使用,5.2 中心极限定理,5.2.1 独立同分布的中心极限定理 【定理5.5】(独立同分布的中心极限定理)设X1,X2,Xn,为相互独立、服从同一分布的随机变量序列,且E(Xi) = ,D(Xi) = 2 0(i = 1,2,),则对于任意x,有 (5.6) 记 记 为Yn的分布函数,则,5.2 中心极限定理,5.2.1 独立同分布的中心极限定理 推论1:当n充分大时, 或 推论2:当n充分大时 或 其中,,5.2 中心极限定理,5.2.1 独立同分布的中心极限定理 【例5-5】用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20400克的概率 解:设箱中第i袋味精的净重为Xi克, X1, X2, Xn是200个相互独立同分布的随机变量,且 由中心极限定理 即,5.2 中心极限定理,5.2.1 独立同分布的中心极限定理 【例5-5】用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20400克的概率 解:由中心极限定理 所以,,5.2 中心极限定理,5.2.2 二项分布的正态近似 现在将定理5.5应用于服从0-1分布的随机变量,即 设X1,X2,Xn,相互独立,且都服从参数为的0-1分布: PX = k = pk(1 p)1- k,k = 0,1 此时EXi=p, DXi=p(1-p), i=1,2, 又记 则nB(n,p)此时定理5.5的结论可写成 于是,有下述定理:,5.2 中心极限定理,5.2.2 二项分布的正态近似 【定理5.6】(棣莫弗拉普拉斯定理) 设n(n = 1,2,)服从参数为n,p(0 p 1)的二项分布,则对于任意实数x,有 (5.9) 这个定理表明,当n充分大时,服从二项分布的随机变量n的标准化变量近似服从标准正态分布即有 即,5.2 中心极限定理,5.2.2 二项分布的正态近似 【例5-6】设电路供电网内有10000盏相同的灯,夜间每一盏灯开着的概率为0.8,假设各灯的开关彼此独立,计算同时开着的灯数在7800与8200之间的概率 解:记同时开着的灯数为X,它服从二项分布 B(10000,0.8),于是由棣莫弗-拉普拉斯定理,有,5.2 中心极限定理,5.2.2 二项分布的正态近似 【例5-7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分机在用外线时不用等候? 解:设表示同时使用外线的分机数, 则B(260,p),其中p = 0.04根据题意应确定最小的x使 成立由棣莫弗拉普拉斯定理,有,5.2 中心极限定理,5.2.2 二项分布的正态近似 【例5-7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分机在用外线时不用等候? 解:应确定最小的x使 令 查得,5.2 中心极限定理,5.2.2 二项分布的正态近似 【例5-7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分机在用外线时不用等候? 解:应确定最小的x使 令 查得 故取 于是,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象? 解:设共调查n个成年男子,记 则Xi独立同分布,且PXi=1=p,PXi=0=1-p,i=1,2, ,n,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象? 解:又记n个调查对象中,吸烟的人数为X,则有 由大数定理知,当n很大时,频率X / n与概率p很接近,可用频率作为p的估计依题意,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象? 解:又记n个调查对象中,吸烟的人数为X, 即,5.2 中心极限定理,【吸烟率调查问题解答】 某卫生组织为确定某城市成年男

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论