c2_2 正态分布.ppt_第1页
c2_2 正态分布.ppt_第2页
c2_2 正态分布.ppt_第3页
c2_2 正态分布.ppt_第4页
c2_2 正态分布.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、正态分布及其应用,Normal distribution and its applications 统计学中最重要的理论分布之一,2,随机变量及其概率分布,连续型随机变量:正态分布 对数正态分布 Weibull分布 离散型随机变量:二项分布 Poisson分布 超几何分布,3,正态分布(Normal distribution),1733年,德国数学家和天文学家A. de Moivre 法国天文学家和数学家Laplace 德国数学家Gauss(1777-1855) 最早用于物理学、天文学 描述观察误差的分布,并 用于行星轨迹的预测,故 又称 Gaussian distribution,4,身高的

2、分布,5,正态分布的概念,如果随机变量X的概率密度函数为 则称X服从正态分布,记作XN(,2)。 其中, 为总体均数, 2为总体方差, =3.14159; e = 2.71828。,(- X +),6,正态分布图形,x,0,.1,.2,.3,.4,f(x),7,2相等, 不等的正态分布图示,8,2不等, 相等的正态分布图示,1,9,正态分布特征,正态分布有两个参数,即位置参数()和形态参数(2); 单峰,高峰在均数处; 均数两侧完全对称; 正态曲线下的面积分布有一定的规律。,10,正态曲线下的面积规律,X轴与正态曲线之间的面积恒等于1 。 对称区域面积相等。,S(-,-X),S(X,)S(-,

3、-X),X轴,-X,X,11,正态曲线下的面积规律,S(-x1, -x2),-x1 -x2 x2 x1,S(x1,x2)=S(-x2,-x1),12,正态曲线下的面积规律,13,正态曲线下的面积规律,-1.96,+1.96,2.5%,2.5%,95%,14,正态曲线下的面积规律,-2.58,+2.58,0.5%,0.5%,99%,15,正态分布的分布函数公式: 故正态曲线下(X1,X2)范围内的面积为:,16,概率为曲线下相应区域的面积!,c,d,X,f(X),P,c,X,d,f,X,dx,c,d,(,),(,),17,标准正态分布,标准正态分布(standard normal distrib

4、ution)是均数为0,标准差为1的正态分布。 记为XN (0,1)。 标准正态分布是一条曲线。 概率密度函数:,(- z +),18,标准化变换,若 XN(,2),作变换: 则z(又称u)服从标准正态分布(0,1)。 z(或u)称为标准正态离差(standard normal deviate),19,z变换,XN(,2) zN(0,1),20,z=0.12,=0, =1,标准化示例,正态分布,标准正态分布,X=6.2, =5.0, =10,21,标准正态分布曲线下面积(z),z 0.00 -0.02 -0.04 -0.06 -0.08 -3.00.00130.00130.00120.0011

5、0.0010 -2.50.00620.00590.00550.00520.0049 -2.00.02280.02170.02070.01970.0188 -1.90.02870.02740.02620.02500.0239 -1.60.05480.05260.05050.04850.0465 -1.00.15870.15390.14920.14460.1401 -0.50.30850.30150.29460.28770.2810 0.00.50000.49200.48400.47610.4681,0,z,22,正态分布的应用,估计频数分布 制定医学参考值范围 质量控制 正态分布是许多统计方法的

6、理论基础,23,1. 估计频数分布,例1. 某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。,24,首先计算标准正态离差z: 查标准正态分布表: (-1.86)= ? 结果:估计低体重儿所占比例为_%,25,例2. 已知z1=-1.20,z2=1.60,欲求标准正态曲线下(-1.20,1.60)范围内的面积。,26,例3. 已知120名5岁女孩身高 =110.15,S=5.86,现欲估计该市城区某年身高界于104.0108.0范围内的5岁女孩所占比例及120名5岁女孩中身高界于104.0108.0范围内的人数。,27

7、,例4. 一个原发性胆石症患者的血清白蛋白水平高于42g/l的概率是多少?(假设原发性胆石症患者的血清白蛋白服从均数34.46g/l,标准差为5.84g/l的正态分布),28,解: 从标准正态分布表可知,大于1.29的概率为0.0985,因此一个原发性胆石症患者的血清白蛋白水平高于42g/l的概率大约为10%。,小结:估计概率(比例、面积)大小,29,2. 制定医学参考值范围 ( medical reference interval),又称正常值范围(normal range) 确定医学参考值范围的意义: 作为判断正常与异常的参考标准,30,什么是医学参考值范围: 是绝大多数正常人的解剖、生理

8、、生化等指标的波动范围 绝大多数:90%,95%,99%等 “正常人”的定义: 排除了影响所研究的指标的疾病和有关因素之后的同质人群。,31,确定参考值范围的注意事项,选定同质的“正常人”作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 选择百分界值(90%,95%) 据资料特点,选用恰当计算方法 确定可疑值范围,32,单侧与双侧参考值范围的确定,根据医学专业知识确定! 双侧:红细胞、白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 , 下限: 肺活量,IQ,,33,计算医学参考值范围常用的方法,正态分布法 : 适用于正态或近似正态分布资料。 双侧界值: 单侧

9、上界: ;单侧下界: 对数正态分布法: 适用于对数正态分布资料 双侧界值: 百分位数法: 常用于偏态分布资料 双侧界值: P2.5和P97.5;单侧上界: P95;或单侧下界: P5,34,例5. 某地调查正常成年男子200人的红细胞数,得均数 =55.261012/L,标准差S=0.381012/L,试估计该地正常成年男子红细胞数的95%参考值范围。,35,解:该地正常成年男子红细胞数的95%参考值范围为 下限: 1.96S =55.26 1.960.38=54.52(1012/L) 上限: 1.96S =55.26 1.960.38=56.00(1012/L),36,例6. 某地调查120

10、名健康成年男性的第一秒肺通气量得均数 =4.2L,标准差S=0.7L,试估计该地健康成年男性第一秒肺通气量的95%参考值范围。,37,解: 因第一秒肺通气量仅过低属异常,故取单侧下限。该地健康成年男性第一秒肺通气量的95%参考值范围为: 下限: 1.64S =4.21.640.7=3.05(L) 即该地健康成年男性第一秒肺通气量的95%参考值范围为不低于3.05L。,38,例7. 测得某年某地282名正常人的尿汞值如下表所示,试制定正常人尿汞的95%参考值范围。,39,表1. 某年某地282名正常人的尿汞值(g/L)测量结果,40,解:正常人的尿汞值为偏态分布,且过高为异常,故用百分位数法计算

11、,且取单侧上限。其95%参考值范围为: 上限: 即该地正常人尿汞的95%参考值范围为不高于43.6g/L 。,41,3. 质量控制,意义 监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。 依据:实验中的检测误差服从正态分布。,42,质量控制图(quality control chart),UCL (上控制限) UWL(上警戒限) CL (中心线) LWL(下警戒限) LCL (下控制限),样本编号、取样时间,+2.58SD +1.96SD -1.96SD -2.58SD,43,质量控制图(quality control chart),123456789101112131415 取样时间,M+3SD M+2SD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论