版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、正态分布(Normal Distribution) 1 正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.德莫佛 德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.正态分布2正态分布德国数学家Gauss发现最早用于物理学、天文学Gaussian distribution1889年是高尔顿(Francis Galton,1822-1911)创先把该曲线称作正态曲线。3不知你们是否知道街头的一种赌博活动? 用一个钉板作赌具。4 也许很多人不相信,玩这种赌博游戏十有八九是要输掉的,不少人总想碰碰运气,然而中大奖的概率实在是太低了。5 平时,我们很少有人会去关心小球
2、下落位置的规律性,人们可能不相信它是有规律的。一旦试验次数增多并且注意观察的话,你就会发现,最后得出的竟是一条优美的曲线。 高尔顿钉板试验6高尔顿钉板试验这条曲线就近似我们将要介绍的正态分布的密度曲线。7正态分布的重要性医学研究中的某些观察指标服从或近似服从正态分布;很多统计方法是建立在正态分布的基础上很多其他分布的极限形式为正态分布因此,正态分布是统计分析方法的重要基础。正态分布8某市2007年12岁男童120人的身高(cm)资料如下142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 134.5 148.8134.4 148.8 137.9 151
3、.3 140.8 149.8 145.2 141.8 146.8 135.1150.3 133.1 142.7 143.9 151.1 144.0 145.4 146.2 143.3 156.3141.9 140.7 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 134.7 147.3138.1 140.2 137.4 145.1 145.8 147.9 150.8 144.5 137.1 147.1142.9 134.9 143.6 142.3 12
4、5.9 132.7 152.9 147.9 141.8 141.4140.9 141.4 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 129.4 142.5141.2 148.9 154.0 147.7 152.3 146.6 132.1 145.9 146.7 144.0135.5 144.4 143.4 137.4 143.6 150.0 143.3 146.5 149.0 142.1140.2 145.4 142.4 148.9 146.7 1
5、39.2 139.6 142.4 138.7 139.99身高的分布(a)(b)(d)(c)10正态分布的描述正态分布的描述性定义正态分布曲线(normal curve):高峰位于中央,单峰分布,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。11正态分布的概率密度函数 如果随机变量X的概率密度函数 则称X服从正态分布,记作XN(,2),其中, 为分布的均数, 为分布的标准差。 (e表示常数2.71828 ,- X +) 12正态分布图示x0.1.2.3.4f(x)13正态分布的特征正态分布有两个参数(parameter),即位置参数(均数)和形状参数(标准差)。 高峰在均数处;
6、均数两侧完全对称。 正态曲线下的面积分布有一定的规律14方差相等、均数不等的正态分布图示31215均数相等、方差不等的正态分布图示21316正态曲线下的面积规律X轴与正态曲线所夹面积恒等于1 。对称区域面积相等。S(-,-X)S(X,)S(-,-X)17正态曲线下的面积规律对称区域面积相等S(-x1, -x2)-x1 -x2 x2 x1S(x1,x2)=S(-x2,-x1)18正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 S(-, -3)=0.0013S(-, -2)=0.0228S(-, -1)=0.1587S(-, )=0.5S(-, +
7、3)=0.9987S(-, +2)=0.9772S(-, +1)=0.6587S(-, )=119正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 1-S(-3 , +3)=0.00261-S(-2 , +2)=0.04561-S(- , +)=0.317420正态曲线下的面积规律 -3 - + +3 -2 +2 S(-3, -2)=0.0215S(-2, -1)=0.1359S(-1, )=0.3413S(-, -3)=0.0013S(-, -2)=0.0228S(-, -1)=0.1587S(-, -0)=0.521正态曲线下的面积规律-1.
8、96+1.962.5%2.5%95%22正态曲线下的面积规律-1.64+1.645%5%90%23正态曲线下的面积规律-2.58+2.580.5%0.5%99%24正态曲线下的面积规律正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;对任意正态曲线,按标准差为单位,对应的面积相等; -1.64 +1.64内面积为90%;-1.96 +1.96内面积为95%;-2.58 +2.58内面积为99%。25 正态分布由它的两个参数和唯一确定, 当和不同时,是不同的正态分布。 下面我们介绍一种最重要的正态分布标准正态分布26的正态分布称为标准正态分布.标准正态分布其密度函数常用 表示2
9、7正态分布转换为标准正态分布若 XN(,2),作变换: 则z服从标准正态分布28 实际应用中,经z变换后,就可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分布曲线下相应的面积问题。正态分布转换为标准正态分布29标准正态分布的特征标准正态分布特征同正态分布,它是正态分布的特例。每一条正态分布曲线经z变换都可转换为标准正态分布。正态分布取值与标准正态分布取值具有一一对应的关系;曲线下的面积也具有一一对应的关系。30附表1 标准正态曲线下的面积分布表 z取不同值时z值左侧的标准正态曲线下面积,记做 列出了标准正态曲线下-到z(z0)的左侧累计面积 因为z分布是对称的,所以只列出了一半的面积
10、当 时P(X1 X X2)= P(z1z z2)31标准正态分布曲线下面积(z) z 0.00 -0.02 -0.04 -0.06 -0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.0188-1.90.0287 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-
11、0.50.3085 0.3015 0.2946 0.2877 0.2810 00.5000 0.4920 0.4840 0.4761 0.46810z(z)32例 题(1)(-1.23)=0.1093(2)(1.23)=1-0.1093=0.8907(3)(-2.09)=?(4)(2.58)=?(5)P(-1.96U 1.96)=?(6)P(-2.58U 2.58)=?(7)若 XN(2,22)时, P(1X 4)=?33正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;正态分布是一簇分布,由两个参数决定:均数和标准差;正态分布曲线下的面积是有规律的,且与标准正态分布曲线下
12、的面积对应.总 结34曲线下面积分布规律0-11-1.961.96-2.582.5868.27%95.00%99.00%-+-1.96+1.96-2.58+2.5868.27%95.00%99.00% 某市1982年110名7岁男童的身高资料,已知其身高的均数为119.95cm,标准差为4.72cm,试估计该地7岁男童身高在110cm以下者占该地7岁男童总数的百分比。例 题(1)计算身高为110cm所对应的Z值:(2)查附表1,即得Z-2.11所占百分比为1.74%(3)即该地7岁男童身高在110cm以下者, 估计约占1.74% 书92页例5-12 36正态分布的应用 估计频数 确定医学参考值
13、范围 质量控制图 正态分布是许多统计方法的理论基础37 正态变量x转化为标准正态变量z,(公式 )再用z值查表,得所求区间面积占总面积的比例。 估计频数分布38某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。首先计算z值:查标准正态分布表: (-1.86)=0.0314结果:估计低体重儿的比例为3.14%.39例 已知某市120名岁男童身高均数为=142.67cm,标准差为s=6.00cm。设该资料服从正态分布,试求 该地12岁男童身高在132cm以下者占该地12岁男童总数的比例, 分别求 1s、 1.96s和 2.
14、58s范围内12岁男童占该组儿童总数的理论百分数,并与实际百分数比较。 估计频数分布40估计频数分布首先计算z值:查标准正态分布表: (-1.78)=0.0375(3.75) 结果:该地12岁男童身高在132cm以下者,估计约占3.75。 41估计频数分布42参考值范围(reference interval)参考值范围又称正常值范围(normal range)。什么是参考值范围:参考值范围:医学上绝大多数正常人某项指标值的变动范围(常可用于临床诊断,例如白细胞计数、血压参考值)正常人:是指排除了对所研究指标有影响的疾病和有关因素的特定人群。 绝大多数一般指的为80、90、95或99%。确定参考
15、值范围的意义:用于判断正常与异常。43参考值范围确定的原则选定同质的正常人作为研究对象 样本量(例数)应大于100统一测定方法以控制系统误差。判断是否分组(性别,年龄组) 根据研究目的、研究指标的性质、数据分布特征决定单侧还是双侧以及计算方法。44单侧与双侧参考值范围根据医学专业知识确定双侧:白细胞计数,血清总胆固醇,单侧:上限: 转氨酶,血铅,发汞 下限: 肺活量,IQ, 单侧下限-过低异常 单侧上限-过高异常 双侧-过高、过低均异常 单侧下限异常正常单侧上限异常正常异常正常双侧下限双侧上限异常45 正态分布法 百分位数法 对数正态分布法 确定医学参考值范围的方法46(1) 正态分布法适用条
16、件:变量值服从正态分布或近似正态分布参考值范围%双侧单侧下限上限909599 47 (2) 百分位数法 适用条件:变量值服从偏态分布或分布不明参考值范围%双侧单侧下限上限90P5P95P10P9095P2.5P97.5P5P9599P0.5P99.5P1P9948(3) 对数正态分布法适用条件:对数正态分布资料计算公式:双侧95%参考值范围:单侧95%参考值范围:49 分析:资料近似服从正态分布,选用正态分布法; 红细胞数过多过少均为异常,需确定双测参考值范围。 正态分布法双侧95参考值范围的公式为: 代入数据得,该地成年男子红细胞数的95的参考值范围为(54.52,56.42)1012 L某地调查正常成年男子144人的红细胞数(近似正态分布),得均数 55.381012 L,标准差 S0.441012 L。试估计该地成年男子红细胞数的95的参考值范围。 例 题50在某市测得239名正常人的发汞值,试估计其95的参考值范围51频数表资料百分位数计算公式:fx为Px所在组频数i为组距fl 为小于L各组段的累计频数5253质量控制质量控制的意义
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小腿肌肉静脉血栓诊疗护理共识2026
- 2025-2026学年人教版小学一年级下册数学重难点专项练习(100以内数的认识含答案)
- 2024年全国公用设备工程师之专业知识(暖通空调专业)考试专项攻坚题(详细参考解析)
- 2024年大学活动大赛策划书
- 2024年物业服务合同范本物业服务合同
- 20xx时事论据作文素材:共享单车的利与弊
- 2024年国学常识之民间文化小常识
- 2026年北京市房山区初三下学期中考一模语文试卷和答案
- 城市轨道交通应急处理教案15-项目五-信号设备故障应急处理-任务2道岔故障的应急处理
- 2026年河南郑州高三二模英语单词词块归纳总结
- 2024-2025学年福建省厦门市大同中学下学期八年级数学期中考试卷
- (正式版)DB14∕T 3538-2025 《旅游饭店客房清洁服务规范》
- 检察机关知识产权培训课件
- 房产抖音培训课件
- 中亚地区-教学课件
- 文书模板-诗词学会会员入会申请书
- 感染性休克诊治指南
- 江苏省低空空域协同管理办法(试行)
- 肿瘤代谢与营养
- 人保农险理赔试题
- 安徽省A10联盟2024-2025学年高一下学期4月期中政治试卷(扫描版含答案)
评论
0/150
提交评论