第七章正态分布和标准正态分布_第1页
第七章正态分布和标准正态分布_第2页
第七章正态分布和标准正态分布_第3页
第七章正态分布和标准正态分布_第4页
第七章正态分布和标准正态分布_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章正态分布和标准正态分布第一节正态分布及其特征第三章已讨论到,统计数据经过整理后,其次数分布就会出现若干种分布的图形,其中有对称、非对称、偏态、U形、J形等等。但在社会经济等领域内,都服从一类确定的分布规律,这类分布规律叫正态分布。正态分布最早是由德莫弗提出的。以后德国数学家高斯在研究误差理论于1809年及法国天文学家、数学家、物理学家拉普拉斯在1812年分别重新提出。所以人们又称正态分布为高斯分布或高斯拉普拉斯分布。正态分布在统计学中占有极其重要的地位。

1在实际问题研究应用中,标准正态分布使服从正态分布的现象在应用计算时,更具有广泛的应用价值。这里,我们仍然通过实例来阐述正态分布的理论思想和研究方法,这对后面有关章节的学习是有用的。2一、正态分布曲线的形成正态分布曲线或正态分布密度曲线Φ(X)实际上就是频率分布直方图的极限分布或理论分布。例如P102,表7-1为某单位96人的月收入资料整理后的分布情况,根据表中数据,按第三章的方法,绘制频率分布直方图。正态分布曲线实际上就是频率直方图的极限分布或理论分布。

3二、正态分布曲线的概率密度及特征根据实际的经验和理论分布,正态分布的概率密度曲线的数学表达式为:

(7-1)这条分布密度曲线φ(x)具有对称起伏的形状,形成“钟形”曲线。4分布密度曲线φ(x)具有如下几个特征:(1)一个高峰。曲线是单峰,有一个最高点,即φ(x)在x=μ处有最大值;当x向左,向右远离时,曲线不断地降低。形成“中间高,两边低”的古钟。(2)一个对称轴。曲线在高峰处有一个对称轴,对称轴是直线x=μ。在轴的左右两边是对称的。(3)一个渐近线。曲线无论向左向右延伸,都愈来愈接近横轴,但不会和横轴相交,以横轴为渐近线。(4)曲线在x=μ±σ处有拐点(转弯点),拐点离对称轴有同样的距离,曲线在拐点处改变自己下降的方向。(5)两个参数μ和σ决定着曲线的形状。5正态分布曲线的位置,是由μ决定的。而正态分布曲线的形状“高、矮、胖、瘦”的特点,则是由σ所决定。可以看出,当μ和σ确定后,正态分布曲线的图形也就唯一地被确定了。所以μ和σ称作正态分布曲线的两个重要的参数。

μ决定正态分布曲线左右移动的位置6σ决定正态分布曲线的“高、矮、胖、瘦”可以发现,μ就是正态分布曲线的数学期望或总体均值,σ就是正态分布曲线的标准差7根据正态分布概率密度的表达式,

经过计算,正态分布有以下几个典型区间的概率值值得我们予以关注。8①变量取值在区间[μ-σ,μ+σ]之间的概率表明,变量取值在范围[μ-σ,μ+σ]之间的概率为0.6827,其中:μ代表总体的均值;σ代表总体的标准差。9②变量取值在区间[μ-σ,μ+σ]之间的概率

表明,变量取值在[μ-2σ,μ+2σ]之间的概率为0.9545。

10③变量取值在区间[μ-3σ,μ+3σ]之间的概率

表明,变量取值在[μ-3σ,μ+3σ]之间的概率为0.9973

11④变量取值在区间[-∞,+∞]之间的概率为1.⑤以上图形如果以σ为组距,那么围绕着μ,各σ所代表的概率即正态分布曲线的面积如图:以μ为中心各σ代表的概率12第二节标准正态分布一、标准正态分布概率密度上节谈到知道了正态分布中的两个参数,任意两点间的概率,可以通过(7-1)式积分得出。但积分计算毕竟太麻烦,更何况还可能有人对积分运算并不熟悉。为此要计算出现成的表供使用者查找。但由于正态分布随参数μ和σ的不同而变化。为此,要先将变量值进行标准化变换,其中z值称作x的标准值。(7-2)13根据z值所得的分布称为标准正态分布。它的概率密度为:

(7-3)比较(72)和(73)式,可以发现,如果用μ=0,σ=1代入(7-1)式可得(7-4)14可见它与标准正态分布的概率密度(7-4)式相比除了x和z在变量名称上不同外,实质是一样的。所以标准正态分布φ(z)可看作一般正态分布的一个特例。

15二、标准正态分布N(0,1)曲线下的面积1.标准正态分布曲线下的面积根据标准正态分布概率密度的表达式(7-3)式,经过计算,标准正态分布也有几个典型区间的概率值值得我们予以关注。P(-1≤z≤1)=

=0.6827

P(-2≤z≤2)==0.9455

P(-3≤z≤3)=

=0.9973

162.标准正态分布变量z与正态分布变量x的关系根据(7-2)式,则有当x=μ+σ时,z=(x-μ)÷σ=(μ+σ-μ)÷σ=1当x=μ-σ时,z=(x-μ)÷σ=(μ-σ-μ)÷σ=-1当x=μ+2σ时,z=(x-μ)÷σ=(μ+2σ-μ)÷σ=2当x=μ-2σ时,z=(x-μ)÷σ=(μ-2σ-μ)÷σ=-2其余以此类推。

17比较正态分布曲线下的面积(见图7-9)和标准正态分布曲线下的面积(见图7-11),可以看出:(1)图7-9是以X=μ为对称,而图7-11是以z=0为对称。(2)图7-9中组距[μ-σ,μ+σ]的面积与图7-11中组距[-1,1]的面积相同;图7-9中组距[μ-2σ,μ+2σ]的面积与图7-11中组距[-2,2]的面积相同;图7-9中组距[μ-3σ,μ+3σ]的面积与图7-11中组距[-3,3]的面积相同,其余以此类推。18(3)图7-9中组距[μ,μ+σ]的面积与图7-11中的组距[0,1]的面积相同;图7-9中组距[μ+σ,μ+2σ]与图7-11中组距[1,2]面积相同,其余以此类推。(4)由于标准正态分布N(0,1)的图形是唯一的,因此,使用标准正态分布无须读者进行计算,只要会查标准正态分布概率表就可以了(见附表1)。附表1中的z值为标准化的Z值,F(z)为对应于z值的区间[-z,z]的概率值,这样设计概率表是为了方便抽样推断的需要。19三、标准正态分布曲线的应用(一)可以简便地查出随机变量在某一区间的概率[例7-1][例7-2]

P

110(二)根据某一区间的概率求随机变量x的值[例7-3]P111(三)测定学生考试成绩的标准分及百分位次1.标准分标准分是将原始成绩经过标准变换的成绩。标准分不仅能对不同分布的原始成绩进行比较,而且还能表明各个学生的成绩在整个分布中的地位。现以学生考试成绩为例说明标准分应用的意义。表7-2

P112

2.百分位次根据标准分,可以计算学生某一门课程的成绩在全部学生的百分位次。

20思考与练习1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论