正态分布社会统计学原理_第1页
正态分布社会统计学原理_第2页
正态分布社会统计学原理_第3页
正态分布社会统计学原理_第4页
正态分布社会统计学原理_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六讲:正态分布第六讲:正态分布学习目标学习目标n掌握正态分布的特性;掌握正态分布的特性;n正态分布曲线下面积的含义;正态分布曲线下面积的含义;n标准分的计算和应用;标准分的计算和应用;n利用标准正态分布表计算概率。利用标准正态分布表计算概率。n理解大数定理和中心极限定理理解大数定理和中心极限定理一、什么是正态分布?一、什么是正态分布?从从 “分布分布” 说起说起定 类定 序直 方 图折 线 图定 距统 计 图直方图直方图用长条的面积来表示频次或用长条的面积来表示频次或相对频次;相对频次;折线图折线图用直线连接直方图中条形顶用直线连接直方图中条形顶端的中点;端的中点;当组距逐渐减小时,折线将逐

2、渐平滑为曲当组距逐渐减小时,折线将逐渐平滑为曲线。线。峰点(峰点(peak)研究研究单峰单峰多峰多峰几种常见的频数分布曲线几种常见的频数分布曲线对称分布右偏分布左偏分布正j型分布反j型分布u型分布 一、一、 正态分布曲线正态分布曲线 1.1 什么是正态分布?什么是正态分布?1 1、由德国数学家高斯提出,也叫高斯分布;、由德国数学家高斯提出,也叫高斯分布;2 2、自然界、社会经济生活中大量存在的分布规、自然界、社会经济生活中大量存在的分布规律;律;3 3、经典统计推断的基础;、经典统计推断的基础;4 4、在所有的分布中,、在所有的分布中,正态分布居于首要正态分布居于首要位置;位置;1.2 正态分

3、布的基本特征正态分布的基本特征特征一特征一:一个高峰:一个高峰特征二特征二:一条对称轴:一条对称轴特征三特征三:一条渐近线:一条渐近线m0md= 众值众值= =中位值均值中位值均值1.3 正态分布的数学表达式正态分布的数学表达式1( )e22122xx(x) = 随机变量随机变量 x 的频次(概率密度)的频次(概率密度) 总体标准差;总体标准差; = 总体方差总体方差 = 总体均值总体均值 =3.14159; e = 2.71828x = 随机变量的取值随机变量的取值 (- x )1.4 两个参数的影响两个参数的影响( , )位置参数位置参数2221e21)(xx均均 值值标准差标准差 形状参

4、数形状参数1.4.1 对正态曲线的影响对正态曲线的影响1 2 31 2 31.4.2 对对正态曲线的影响正态曲线的影响xcab曲线a和b的比较n正态曲线的位置由均值正态曲线的位置由均值 决定;决定;n正态曲线的形状正态曲线的形状“高,矮,胖,瘦高,矮,胖,瘦”的特点由标准差的特点由标准差 决定;决定;n 二、正态曲线下的面积二、正态曲线下的面积2.1 正态曲线下面积的涵义正态曲线下面积的涵义n随机变量的频次总和;随机变量的频次总和;n一般把正态曲线下的总面积约等于一般把正态曲线下的总面积约等于1,这时一定区间内的频次分布表现为概这时一定区间内的频次分布表现为概率分布。率分布。2.2 正态曲线的

5、一个重要性质正态曲线的一个重要性质 无论正态曲线具有哪种均值和标准无论正态曲线具有哪种均值和标准差,在均值和横坐标某一点的距离内差,在均值和横坐标某一点的距离内(用标准差来表示)曲线下的面积是常(用标准差来表示)曲线下的面积是常数。数。 下图说明此意。下图说明此意。正态曲线下的面积(图)正态曲线下的面积(图) -2 +22.3%2.3% - + 95.46%68.26%2.3 几个典型取值区间的概率值几个典型取值区间的概率值np( - + ) =0.6827;np( -2 +2 )=0.9545;np( -3 +3 )=0.9973;三、标准正态分布三、标准正态分布3.1 什么是标准正态分布什

6、么是标准正态分布 以标准差为单位的正态分布一以标准差为单位的正态分布一般称为标准正态分布般称为标准正态分布(standardized normal distribution)3.2 标准正态分布的重要性标准正态分布的重要性 简化统计分析简化统计分析 一般的正态分布取决于均值一般的正态分布取决于均值 和标准差和标准差 ; 计算概率时计算概率时,每一个正态分布都需要有自,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多己的正态概率分布表,这种表格是无穷多的的 若能将一般的正态分布转化为标准正态分若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表布,计算概率时只需要查一张表

7、3.3 标准分标准分(standard scores)n公式公式:xzz z值代表每个值代表每个x x值在标准正态分布上的数值。值在标准正态分布上的数值。3.4 标准正态分布的表达式标准正态分布的表达式正态分布的表达式为:正态分布的表达式为: n( , )标准正态分布的表达式为:标准正态分布的表达式为: n(0,1)标准正态分布是一般正态分布的特例,即标准正态分布是一般正态分布的特例,即 0 0, 1 1的正态分布。的正态分布。3.5 标准分的实际意义标准分的实际意义n各总体之间可以通过标准分进行合理的比较各总体之间可以通过标准分进行合理的比较n不同总体间综合指标的比较不同总体间综合指标的比较

8、n如如:甲城市居民月收入的均值为甲城市居民月收入的均值为3000元,标准元,标准差为差为500元;乙城市居民月收入的均值为元;乙城市居民月收入的均值为4500元,标准差为元,标准差为1000元。若甲城市的居民元。若甲城市的居民a的月的月收入为收入为4000元,乙城市居民元,乙城市居民b的月收入为的月收入为5500元。看起来元。看起来b的收入比的收入比a的高,但与本地其他的高,但与本地其他居民相比较,结果可能有所不同。这时候就需居民相比较,结果可能有所不同。这时候就需要把要把a与与b的收入都转换成标准值,进行更加的收入都转换成标准值,进行更加直观的比较。直观的比较。n结果是?结果是?3.6 标准

9、分的应用标准分的应用例题例题:李明参加了全校新生入学摸底考李明参加了全校新生入学摸底考试,数学得了试,数学得了90分,英语得了分,英语得了75分。分。假定全校新生数学成绩的均值假定全校新生数学成绩的均值 =85分,标准差分,标准差 =10分;全校新生英语成绩分;全校新生英语成绩的均值的均值 =60分,标准差分,标准差 =5。这次考。这次考试李明哪门科目考试考得好一些?试李明哪门科目考试考得好一些?121u2u3.7 标准正态分布的面积标准正态分布的面积np(-1 z 1 ) =0.6827;np(-2 z 2 ) =0.9545;np(-3 z 3 ) =0.9973; 由于标准正态分布由于标

10、准正态分布n(0,1)的图形是的图形是唯一的,因此使用标准正态分布无须唯一的,因此使用标准正态分布无须自己计算,只需要学会查表就行了。自己计算,只需要学会查表就行了。四、标准正态分布表的使用四、标准正态分布表的使用4.1 标准正态分布表的介绍标准正态分布表的介绍见教材见教材p385附录二附录二有问题有问题4.2标准正态分布的计算标准正态分布的计算【例【例5】已知】已知服从标准正态分布服从标准正态分布n(0,1),),求求p( 1.3)=?1.3)=?解:因为解:因为 服从标准正态分布服从标准正态分布n n(0 0,1 1),),可直接查附表可直接查附表4 4,根据,根据z=1.3z=1.3,有

11、有 p p( 1.3)= 1.3)= 1.31.3 =0.9032=0.9032xi:大写大写,小写,小写读作:克西读作:克西 【例【例6】:已知已知服从标准正态分布服从标准正态分布n(0,1),),求求p( 1.3)=?1.3)=?解:因为解:因为 1 1,而而 p p( 1.3)1.3) p p( 1.3)1.3)1 1因此有因此有p p( 1.3)1.3)1 1 p p( 1.3)1.3)1 1 1.31.3 0.09680.0968【例【例7】已知已知服从标准正态分布服从标准正态分布n(0,1),),求求p( 1.3)=?1.3)=?解:附表四中没有给出解:附表四中没有给出z0z0的的

12、 z z 值。根值。根据标准正态分布图形是以据标准正态分布图形是以z z0 0为对称的为对称的原理,原理,p p( 1.3)=11.3)=1 1.31.3 0.09680.0968【例【例8】已知已知服从标准正态分布服从标准正态分布n(0,1),),求求p(1.3 2.3)?)?解:解: p p(1.3 1.3 2.3 2.3) 2.32.3 1.31.3 =0.9893 =0.98930.9032=0.08610.9032=0.0861【例【例9】根据统计,北京市初婚年龄服从正态分布。其均值为根据统计,北京市初婚年龄服从正态分布。其均值为25岁,标岁,标准差为准差为5岁,问岁,问25岁到岁到

13、30岁之间结婚的人,其百分比为多少?岁之间结婚的人,其百分比为多少?解:解:1. 1. 年龄换为标准分:年龄换为标准分:z1z1 ,z2z22. 2. 查表得查表得 z1z1 0.50, 0.50, z2z2 0.84130.8413 z2z2 - - z1z1 =0.3413,=0.3413,所以所以2525岁到岁到3030岁之间结婚的人,百分数为岁之间结婚的人,百分数为34.13%.34.13%.0525251525304.3 标准正态分布表的使用标准正态分布表的使用1. 通过标准分公式,将一般为正态分布转换为标通过标准分公式,将一般为正态分布转换为标准正态分布;准正态分布;2. 计算概率

14、时计算概率时 ,查标准正态分布表;,查标准正态分布表;3. 对于负的对于负的 x ,可由可由 (-x) x 得到;得到;4. 对于标准正态分布,即对于标准正态分布,即xn(0,1),有有np (a x b) b a np (|x| a) 2 a 1常用的标准值常用的标准值z 1.65,1.65,概率概率p p为为0.05;0.05;z 1.96,1.96,概率概率p p为为0.025;0.025;z 2.58,2.58,概率概率p p为为0.005;0.005;五、大数定理和中心极限定理五、大数定理和中心极限定理5.1 极限定理极限定理 简单讲,凡是采用极限的方法(简单讲,凡是采用极限的方法(

15、例如,例如,观察次数观察次数n n趋于无限)趋于无限)所得出的一系列定理统所得出的一系列定理统称极限定理。称极限定理。 极限定理分为两类:极限定理分为两类: 大数定理大数定理(law of large numbers) 中心极限定理中心极限定理 (central limit theorem) 5.2 大数定理大数定理【例子】【例子】 从扑克牌盒中取出一张牌,出现牌从扑克牌盒中取出一张牌,出现牌“k k”的概率是的概率是1/131/13,在取的次数比较少,在取的次数比较少时,出现时,出现“k k”的频率可能与的频率可能与1/131/13相差得相差得很大,但是在取的次数很多时,出现很大,但是在取的

16、次数很多时,出现“k k”的频率接近的频率接近1/131/13几乎是必然的。几乎是必然的。 5.2 大数定理大数定理 这些例子说明,在大量随机现象中,不这些例子说明,在大量随机现象中,不仅看到了随机事件频率的稳定性,而且还看仅看到了随机事件频率的稳定性,而且还看到平均结果的稳定性。这就是概率论中大数到平均结果的稳定性。这就是概率论中大数定理的概念。定理的概念。阐明大量随机现象平均结果的阐明大量随机现象平均结果的稳定性的一系列定理稳定性的一系列定理。 著名的大数定理:贝努里大数定理和切著名的大数定理:贝努里大数定理和切贝谢夫大数定理贝谢夫大数定理 5.2.1 贝努里大数定理贝努里大数定理 多次重

17、复试验,随机事件的频率日多次重复试验,随机事件的频率日趋稳定,具有接近概率的趋势。趋稳定,具有接近概率的趋势。 5.2.2 切贝谢夫大数定理切贝谢夫大数定理 多次重复试验,随机变量的平均值多次重复试验,随机变量的平均值接近数学期望(即总体均值)。接近数学期望(即总体均值)。 5.3 中心极限定理中心极限定理 任何变量,不管其原有分布如何,任何变量,不管其原有分布如何,如果把它们如果把它们n 个加在一起,只要个加在一起,只要n足够大,足够大,其和的分布必然接近正态分布,均值的其和的分布必然接近正态分布,均值的分布也接近正态分布。分布也接近正态分布。 为什么社会经济为什么社会经济生活、自然界存在生活、自然界存在许多随机变量的分许多随机变量的分布都服从正态分布?布都服从正态分布? 请结合中心极限请结合中心极限定理来解释。定理来解释。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论