《正态分布》PPT课件.ppt_第1页
《正态分布》PPT课件.ppt_第2页
《正态分布》PPT课件.ppt_第3页
《正态分布》PPT课件.ppt_第4页
《正态分布》PPT课件.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、正态分布及其应用,Normal distribution and its applications 统计学中最重要的理论分布之一,2,主要内容(Content),随机变量的概率分布 正态分布的概念及图形 正态分布的特征 正态分布曲线下面积的规律 标准正态分布 正态分布的应用 总结,3,随机变量,变量和随机变量 变量取值的相对频率说明了具有某个性质的观察对象出现的可能性。 随机变量 离散型:性别、血型、子女数、事故数 连续型:身高、体重,4,例:密度函数和分布函数,抛两枚硬币,,密度函数,分布函数,5,例:密度函数和分布函数,6,随机变量的概率分布,概率函数(Probability Functi

2、on),或者说概率密度函数(Probability Density Function) 、密度函数。 在统计学中,我们说变量具有分布函数(Distribution Function)。用此函数的大小来说明变量取某些值的可能性。 当变量的取值包括了所有可能的取值时,分布函数为1。 当变量具备了以上两个函数之后,称它具有某种分布(Distribution),7,正态分布,Normal distribution 德国数学家Gauss发现 最早用于物理学、天文学 Gaussian distribution,8,正态分布的概念及图形,10,正态分布的概率密度函数,如果随机变量X的概率密度函数 则称X服从

3、正态分布,记作XN(,2),其中, 为分布的均数, 为分布的标准差。,(- X +),11,正态分布图示,X,0,.1,.2,.3,.4,f(X),12,方差相等、均数不等的正态分布图示,13,均数相等、方差不等的正态分布图示,1,14,正态分布的特征,单峰分布;高峰在均数处; 以均数为中心,均数两侧完全对称。 正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。 有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。 正态曲线下的面积分布有一定的规律。,15,正态曲线下某一区域的面积用定积分来求:,正态曲线下的面积,16,正态曲线下的面积规律,X轴与正态

4、曲线所夹面积恒等于1 。 对称区域面积相等。,S(-, -X),S( +X,)S(-, -X),17,正态曲线下的面积规律,对称区域面积相等。,S( -x1, -x2),-x1 -x2 +x2 + x1,S( -x1, -x2)= S( +x1, +x2),18,正态曲线下的面积规律,-4 -3 -2 -1 0 1 2 3 4,-3 -2 - + +2 +3,S(-, -3)=0.0013,S(-, -2)=0.0228,S(-, -1)=0.1587,S(-, )=0.5,S(-, +3)=0.9987,S(-, +2)=0.9772,S(-, +1)=0.8413,S(-, )=1,19,

5、正态曲线下的面积规律,-4 -3 -2 -1 0 1 2 3 4,-3 -2 - + +2 +3,1-S(-3 , +3)=0.0026,1-S(-2 , +2)=0.0456,1-S(- , +)=0.3174,20,正态曲线下的面积规律,-4 -3 -2 -1 0 1 2 3 4,-3 -2 - + +2 +3,S(-, -3)=0.0013,S(-, -2)=0.0228,S(-, -1)=0.1587,S(-, )=0.5,S(-, +3)=0.9987,S(-, +2)=0.9772,S(-, +1)=0.6587,S(-, )=1,21,正态曲线下的面积规律,-3 -2 - + +

6、2 +3,S(-, -3)=0.0013 S(-, -2)=0.0228 S(-, -1)=0.1587 S(-, -0)=0.5,S(-3, -2)=0.0115 S(-2, -1)=0.1359 S(-1, )=0.3413,-4 -3 -2 -1 0 1 2 3 4,22,正态曲线下的面积规律,-3 -2 - + +2 +3,S(-, -3)=0.0013 S(-, -2)=0.0228 S(-, -1)=0.1587 S(-, -0)=0.5,S(-3, -2)=0.0115 S(-2, -1)=0.1359 S(-1, )=0.3413,23,正态曲线下的面积规律,-3 - + +3

7、 -2 +2,S(-3, -2)=0.0115 S(-2, -1)=0.1359 S(-1, )=0.3413,S(-, -3)=0.0013 S(-, -2)=0.0228 S(-, -1)=0.1587 S(-, -0)=0.5,24,正态曲线下的面积规律,-1.96,+1.96,2.5%,2.5%,95%,25,正态曲线下的面积规律,26,正态曲线下的面积规律,-2.58,+2.58,0.5%,0.5%,99%,27,正态曲线下的面积规律,正态分布的一个显著特点 其曲线下面积完全决定于以标准差为单位从点x到的离差。,28,1,29,正态曲线下的面积规律,正态曲线下面积总和为1; 正态曲线

8、关于均数对称;对称的区域内面积相等; 对任意正态曲线,按标准差为单位,对应的面积相等; -1.64 +1.64内面积为90%; -1.96 +1.96内面积为95%; -2.58 +2.58内面积为99%。 小于-3的面积为 0.13%; 小于-2的面积为 2.28%; 小于- 的面积为15.87%。,30,正态分布转换为标准正态分布,若 XN(,2),作变换: 则u服从标准正态分布。 u称为标准正态离差(standard normal deviate),31,标准正态分布,标准正态分布(standard normal distribution)是均数为0,标准差为1的正态分布。 记为N(0,

9、1)。 标准正态分布是一条曲线。 概率密度函数:,(- u +),32,标准正态分布曲线下面积(u),u 0.00 -0.02 -0.04 -0.06 -0.08 -3.00.00130.00130.00120.00110.0010 -2.50.00620.00590.00550.00520.0049 -2.00.02280.02170.02070.01970.0188 -1.90.02870.02740.02620.02500.0239 -1.60.05480.05260.05050.04850.0465 -1.00.15870.15390.14920.14460.1401 -0.50.30

10、850.30150.29460.28770.2810 00.50000.49200.48400.47610.4681,0,u,33,正态分布的应用,估计频数分布 质量控制 确定临床参考值范围,34,总结,正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一; 正态分布是一簇分布,由两个参数决定:均数和标准差; 正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。,35,需要掌握的内容,正态分布的性质 正态曲线下面积的分布规律 参考值范围确定的原则和方法,36,Thank you,37,估计频数分布,某项目研究婴儿的出生体重服从正态分布,其均

11、数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。 首先计算标准离差: 查标准正态分布表: (-1.86)=0.0314 结果:估计低体重儿的比例为3.14%.,38,质量控制,质量控制的意义 监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。,39,质量控制图(quality control chart),40,质量控制图(quality control chart),UCL (上控制限) UWL(上警戒限) CL (中心线) LWL(下警戒限) LCL (下控制限),样本编号、取样时

12、间,M+2.58SD M+1.96SD M M-1.96SD M-2.58SD,41,质量控制图(quality control chart),123456789101112131415 取样时间,M+3SD M+2SD M M-2SD M-3SD,42,参考值范围(reference interval),参考值范围又称正常值范围(normal range)。 什么是参考值范围: 是绝大多数正常人的某观察指标所在的范围。 绝大多数:90%,95%,99%等等。 确定参考值范围的意义: 用于判断正常与异常。 “正常人”的定义: 排除了影响所研究的指标的疾病和有关因素的同质的人群。,43,参考值范

13、围的估计方法:正态分布法,2.5%,2.5%,95%,-1.96,+1.96,44,参考值范围确定的原则,选定足够例数的同质的正常人作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 选择百分界值(90%,95%) 确定可疑范围,45,单侧与双侧参考值范围,根据医学专业知识确定! 双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 下限: 肺活量,IQ,,46,正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠示意图(单侧),47,正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠示意图(单侧),48,正常人,病人,假阳性率,假阴性率,病

14、人,正常人与病人的数据分布重叠示意图(双侧),49,参考值范围的估计方法:百分位数法,P2.5,P97.5,50,参考值范围的估计方法,方法双侧 单侧下限单侧上限 正态分布法 百分位数法 P2.5P97.5 P5 P95 对数正态分布法 转换成正态分布,51,红细胞计数(RBC)参考值范围,成年男性:4.05.5 (1012/L) 成年女性:3.55.0 (1012/L) 新 生 儿:6.07.0 (1012/L),52,白细胞计数参考值范围,成年: 4.010.0 (109/L) 新生儿:15.020.0 (109/L) 6个月2岁:11.012.0 (109/L),53,南通大学附属医院血常规正常值范围,54,南通大学附属医院生化检验参考值范围,55,例:参考值范围的计算,某地调查了200

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论