




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高一数学(沪教版2020选修第二册)
第7章
概率初步(续)
7.3正态分布(第3课时)学习目标1.通过误差模型,了解服从正态分布的随机变量;2.通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特点;3.了解正态分布的均值、方差及其含义;4.了解3σ原则,会求随机变量在特殊区间内的概率.3正态分布
现今的信息时代,各媒体都充斥着数据,因此正确地理解数据成为非常重要的事.正态分布已经是生活中一个常用的词了.例如,我们常提起学生的考试成绩是不是正态分布,某个城市的家庭收入是不是正态分布,等等.那么,究竟什么是正态分布呢?平日所说的正态分布,大体上是指数据对称地分布在某个中心值两边,且离中心值越远,分布得越少
一包米的外包装上标示的5000g,但实际上是有误差的.假设包装米的公司没有故意偷工减料,计量员精确地检测所有在售的该种米,把米包质量的频率分布直方图画出来,会是一个什么形状呢?图7-3-1中是一条峰值在5000g左右的曲线,它具有一个单峰,粗略展示了一个正态分布的形状.实际上,很多测量数据的分布都呈现出这样的形状.数学中的正态分布是指由下面的函数所表达的分布:其中有两个参数:(1)μ是该分布的期望或均值;(2)σ2是该分布的方差,且总是假设σ>0.这个函数的图像如同钟形,如图7-3-2所示.该函数在数学上称为正态密度函数,也称为钟形曲线.
为了理解“一个函数所表达的分布”,要说明两点:第一,分布是指总数为1的量以某种方式分布在直线上;第二,该函数图像与x轴所夹部分的面积等于1,但这个事实需要用到高等数学的知识才能证明
定义设X是一个取实数值的随机变量.如果对任何给定的实数a与b(a<b),x落在区间(a,b)上的概率p(a<x<b)等于三条直线:y=0、x=a、x=b与正态密度函数图像y=所围的区域面积(或者简称作此函数在该区间上的面积,如图7-3-3所示),那么X服从正态分布(normaldistribution),或更准确地说,X服从参数为μ、σ2的正态分布,记为
当μ=0、σ2=1时,相应的正态分布称为标准正态分布,记作X~N(0.1),其密度函数称为标准正态分布的密度函数,简记作Y=φ(x).实际上,一般的正态分布的密度函数总是标准正态分布的密度函数的某种平移和伸缩变换,其形状保持钟形不变用Φ(x)表示标准正态分布的密度函数y=φ(x)从-∞到x的累计面积,如图7-3-4所示,称为标准正态分布函数.
这个函数没有简单的表达式,其函数值可通过近似计算得到.我们也可以通过某些型号的计算器来查它或者它的反函数的值,如
容易验证y=φ(x)是一个偶函数,所以该函数在区间(-∞,-r)上的面积等于其在区间(r,+∞)上的面积,如图7-3-5所示.此外,由于y=φ(r)与r轴所围面积为1,因此y=Φ(r)满足
如果X~N(μ,σ2),那么将X平移再伸缩后将服从标准正态分布,即成立
这样,正态分布X~N(μ,σ2)的密度函数的图像是一条钟形曲线,它关于直线x=μ对称,其最大值在x=μ处达到.在x=μ的左侧,函数严格增,而在x=μ的右侧,函数严格减,从而它是一条单峰曲线.当区间(a,b)在X轴上平移时,显然当μ处于该区间的中心时,概率p(a<x<b)即函数在区间(a,b)上的面积达到最大.因此,我们通常说正态分布集中在其期望μ的附近,即参数μ表示分布集中的位置.
另外一个参数σ描述的是分布的集中程度.从图7-3-2中可以看出,密度函数的最大值在x=μ处达到,其最大值为它与σ成反比.由于图像与x轴之间的区域的总面积是一个固定值1,因此当σ变小时,最大值变大,钟形变“高瘦”,分布向中心x=μ处集中;反之,当σ变大时,最大值变小,钟形变“矮胖”,分布向x=μ的两边分散.
出于种种原因,在测量的过程中总有误差存在.通常我们总假设误差是一个服从正态分布的随机变量.例5某公司生产的糖果每包标识质量是500g,但公司承认实际质量存在误差.已知每包糖果的实际质量服从μ=500、σ2=2.52的正态分布.问:随意买一包糖果,其质量误差超过5g(即1%)的可能性有多大?(结果精确到0.1%)即误差超过5g的可能性约是4.6%.
例6设X为任取的某袋有包装误差的产品的质量,X~N(μ,σ2).分别求|X-μ|<σ,|X-μ|<2σ及|X-μ|<3σ的概率.(结果精确到0.1%)解令那么P(|X-μ|<σ)=P(|Y|<1).而P(|Y|<1)是标准正态分布的密度函数在区间(-1,1)上的面积,它等于函数在区间(-∞,1)上的面积减去在区间(-∞,-1)上的面积.这样,就有同样,因此,随意购买一袋该产品,约有68.3%的可能性其质量在μ左右σ的范围内;约有95.4%的可能性其质量在μ左右2σ的范围内;约有99.7%的可能性其质量在μ左右3σ的范围内,如图7-3-6所示.这称为正态分布的3σ(sigma)原则.课本练习练习7.3(3)
1.已知随机变量X服从正态分布N(-2,σ2),且P(X≤-1)=K.求P(X≤-3)的值.2.某校高中三年级1600名学生参加了区第一次高考模拟统一考试,已知数学考试成绩X服从正态分布N(100,σ2)(试卷满分为150分).统计结果显示,数学考试成绩在80分到120分之间的人数约为总人数的
,则此次统考中成绩不低于120分的学生人数约为()A.80;B.100;C.120;D.200.随堂检测1.下列函数是正态分布密度函数的是(
)答案:B
2、把一个正态曲线a沿着横轴方向向右移动2个单位,得到新的一条曲线b。下列说法中不正确的是()A.曲线b仍然是正态曲线;B.曲线a和曲线b的最高点的纵坐标相等;C.以曲线b为概率密度曲线的总体的期望比以曲线a为概率密度曲线的总体的期望大2;D.以曲线b为概率密度曲线的总体的方差比以曲线a为概率密度曲线的总体的方差大2.答案:D解析:∵ξ服从正态分布N(0,σ2),∴曲线的对称轴是直线x=0.∵P(ξ<-1)=0.1,∴P(ξ>1)=0.1.∴ξ在区间(0,1)内取值的概率为0.5-0.1=0.4,故选B.答案:B3.在某项测量中,测量结果ξ服从正态分布N(0,σ2).若ξ在(-∞,-1)内取值的概率为0.1,则ξ在(0,1)内取值的概率为(
)A.0.8 B.0.4 C.0.2 D.0.1解析:因为月收入服从正态分布N(500,202),所以μ=500,σ=20,μ-σ=480,μ+σ=520.所以月均收入在[480,520]范围内的概率为0.683.由图像的对称性可知,此县农民月均收入在500到520元间人数的百分比约为34.15%.答案:34.15%4.某县农民月均收入服从N(500,202)的正态分布,则此县农民月均收入在500元到520元间人数的百分比约为
.
解析:零件尺寸属于区间[μ-2σ,μ+2σ],即零件尺寸在[1,5]内取值的概率约为95.4%,故零件尺寸不属于区间[1,5]内的概率为1-95.4%=4.6%.答案:4.6%5.某种零件的尺寸ξ(单位:cm)服从正态分布N(3,12),则不属于区间[1,5]这个尺寸范围
的零件数约占总数的
.
6.
假设某地区高二学生的身高服从正态分布,且均值为170(单位:cm,下同),标准差为10.在该地区任意抽取一名高二学生,求这名学生的身高:(1)不高于170的概率;(2)在区间[160,180]内的概率;(3)不高于180的概率.7.设在一次数学考试中,某班学生的分数X~N(110,202),且知试卷满分150分,这个班的学生共54人,求这个班在这次数学考试中及格(即90分及90分以上)的人数和130分以上的人数.解:μ=110,σ=20,P(X≥90)=P(X-110≥-20)=P(X-μ≥-σ),∵P(X-μ<-σ)+P(-σ≤X-μ≤σ)+P(X-μ>σ)≈2P(X-μ<-σ)+0.683=1,∴P(X-μ<-σ)=0.158
5.∴P(X≥90)=1-P(X-μ<-σ)=1-0.158
5=0.841
5.∴54×0.841
5≈45(人),即及格人数约为45人.∵P(X>130)=P(X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论