版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 5 章 概率与概率分布,5.4.4 正态分布,正态分布,在北京市场上的精制盐很多是一公斤袋装,上面标有“净含量1kg”的字样。但当你用稍微精确一些的天平称那些袋装盐的重量时,会发现有些可能会重些,有些可能会轻些;但都是在1kg左右。多数离1kg不远,离1kg越近就越可能出现,离1kg越远就越不可能。 一般认为这种重量分布近似地服从最常用的正态分布(normal distribution,又叫高斯分布,Gaussian distribution)。,正态分布,近似地服从正态分布的变量很常见,象测量误差、商品的重量或尺寸、某年龄人群的身高和体重等等。 在一定条件下,许多不是正态分布的样本均值在
2、样本量很大时,也可用正态分布来近似。,正态分布(normal distribution),1.描述连续型随机变量的最重要的分布 2.可用于近似离散型随机变量的分布 例如: 二项分布 3.经典统计推断的基础,正态分布,正态分布的密度曲线是一个对称的钟型曲线(最高点在均值处)。正态分布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别。 一个正态分布用N(m,s)表示;其中m为均值,而s为标准差。也常用N(m,s2)来表示,这里s2为方差(标准差的平方)。,正态分布,标准差为1的正态分布N(0, 1)称为标准正态分布(standard normal distribution)。 任何具有
3、正态分布N(m,s)的随机变量X都可以用简单的变换(减去其均值m,再除以标准差s):Z=(X-m)/s,而成为标准正态随机变量。这种变换和标准分数的意义类似。,两条正态分布的密度曲线。左边是N(-2,0.5)分布,右边是N(0, 1)分布, 和 对正态曲线的影响,概率密度函数,f(x) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71828 x = 随机变量的取值 (- x ) = 总体均值,正态分布函数的性质,概率密度函数在x 的上方,即f (x)0 正态曲线的最高点在均值,它也是分布的中位数和众数 正态分布是一个分布族,每一特定正态分布通过均值的标准差来区分。
4、决定曲线的高度,决定曲线的平缓程度,即宽度,正态分布函数的性质,曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交 正态曲线下的总面积等于1 随机变量的概率由曲线下的面积给出,正态分布,当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线下面的面积。 比如,标准正态分布变量落在区间(0.51,1.57)中的概率,就是在标准正态密度曲线下面在0.51和1.57之间的面积。 很容易得到这个面积等于0.24682;也就是说,标准正态变量在区间(0.51,1.57)中的概率等于0.24682。如果密度函数为f(x),那么这个面积为积分,标准正态变
5、量在区间(0.51, 1.57)中的概率,正态分布,我们有必要引进总体的下侧分位数、上侧分位数以及相应的尾概率的概念。 对于连续型随机变量X,a下侧分位数(又称为a分位数,a-quantile)定义为数xa,它满足关系,这里的a又称为下(左)侧尾概率(lower/left tail probability),正态分布,而a上侧分位数(又称a上分位数,a-upper quantile)定义为数xa,它满足关系,这里的a也称为上(右)侧尾概率(upper/right tail probability)。,正态分布,对于非连续型的分布,分位数的定义稍微复杂一些; 显然,对于连续分布,a上侧分位数等于
6、(1a)下侧分位数,而(1a)下侧分位数等于a上侧分位数。,正态分布,通常用za表示标准正态分布的a上侧分位数,即对于标准正态分布变量Z,有P(Zza)=a。 图4.6表示了0.05上侧分位数za=z0.05及相应的尾概率(a=0.05)。,N(0,1)分布右侧尾概率P(zza)=a的示意图,正态分布的概率,概率是曲线下的面积!,标准正态分布(standardize the normal distribution),一般的正态分布取决于均值和标准差 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的 若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表,标
7、准正态分布函数,标准正态分布的概率密度函数,任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布的分布函数,标准正态分布,标准正态分布表的使用,将一个一般的转换为标准正态分布 计算概率时 ,查标准正态概率分布表 对于负的 x ,可由 (-x) x得到 对于标准正态分布,即XN(0,1),有 P (a X b) b a P (|X| a) 2 a 1 对于一般正态分布,即XN( , ),有,标准化的例子 P(5 X 6.2),标准化的例子P(2.9 X 7.1),一般正态分布,正态分布(例题分析),【例5.21】设XN(0,1),求以下概率: (1) P(X 2); (3
8、) P(-12)=1- P(X 2)=1-0.9972=0.0228 (3) P(-1X 3)= P(X 3)- P(X -1) = (3)- (-1)= (3) 1-(1) = 0.9987-(1-0.8413)=0.84 (4) P(| X | 2) = P(-2 X | 2)= (2)- (-2) = (2)- 1-(2)=2 (2)- 1=0.9545,正态分布 (例题分析),【例5.22】设XN(5,32),求以下概率 (1) P(X 10) ; (2) P(2X 10) 解: (1),(2),用Excel计算正态分布的概率值,标准正态分布: 函数NormsDist(z),2. 正态
9、分布: 函数NormDist(x,0或1),正态分布 (例题分析),【例5.23】已知XN(10,0.22),求以下概率: (1) P(X 9.4) ; (2) P(9.5X 10.5) 是否大于95%? 解: (1),故 该批零件的质量要求可以得到保证,3准则,1.当X服从正态分布时: P|x-3|3=0.9973 2. 因为|x- 3 | 3的概率(=0.0027)很少,因此可以认为X的值几乎落在区间(X 3 )内。(因为小概率事件是不可能发生的) 3. 3准则在质量控制中有着广泛的应用:如剔除异常值,控制图,5.4.5 二项分布的正态近似,二项分布的正态近似,根据德莫佛拉普拉斯定理,当n 很大时,二项随机变量X近似服从正态分布: Nnp , np(1-p) 对于一个二项随机变量X,当n很大时,求 P(x1Xx2)时可用正态分布近似为,为什么概率是近似的,增加的部分与减少的部分不一定相等,二项分布的正态近似(实例),【例5.24】100台机床彼此独立地工作,每台机床的实际工作时间占全部工作时间的80%。求 (1)任一时刻有7080台机床在工作的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 体育产业行政支持团队的工作要点与挑战
- 风险管理计划与实施方案
- 2026年荒漠化防治中心下属事业单位选聘考试试题(附答案)
- 中航工业项目部经理的项目推进计划
- 专业房产经纪人的应聘注意事项及建议
- 质量管控下提高客户满意度的保养管理制度
- 中国南方航空资深专员招聘面试手册
- 体育教育专业岗位面试技能与策略
- 大型会议施工方案(3篇)
- 农业科技公司作物种植方案设计参考
- GB/T 17846-2024小艇电动舱底泵
- 2024年江苏信息职业技术学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 板材行业销售渠道分析
- 2024地面用晶体硅光伏组件环境适应性测试要求第1部分:一般气候条件
- 教科版四年级下册科学全册教案
- 苏教版五年级下册数学 列方程解决两步实际问题 教案(教学设计)
- 洼田饮水试验评定量表
- 《煤气安全作业》培训教材
- 概率论与数理统计期末考试卷附答案
- 穴位注射水针专题宣讲
- 《髋臼骨缺损分型》
评论
0/150
提交评论