正态分布及其应用1.ppt_第1页
正态分布及其应用1.ppt_第2页
正态分布及其应用1.ppt_第3页
正态分布及其应用1.ppt_第4页
正态分布及其应用1.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学,王友洁 email ,正态分布及其应用Normal distribution,主要内容,正态分布的概念及其特征 标准正态分布 医学参考值范围及其制定,一 正态分布(normal distribution),某地140名正常男子红细胞数的频数表,140名正常男子红细胞计数的直方图,频数 f,红细胞数X,频率密度,频率/组距,直方图形状相同,使各直方的面积相应于频率,其和为1(100%),某地成年男子红细胞数的分布逐渐接近正态分布示意图,一、正态分布(Normal Distribution),频率密度,正态分布的概念,又称为Gauss分布(Gaussian distribution)。

2、当原始数据的频数分布图的观察人数逐渐增加且组段不断分细时,图中的直条就不断变窄,其顶端则逐渐接近于一条光滑的曲线。这条曲线形态呈钟形,两头低、中间高,左右对称,近似于数学上的正态分布。在处理资料时,我们就把它看成是正态分布。,正态分布曲线的数学函数表达式,如果随机变量X的分布服从概率密度函数 则称X服从正态分布,记作XN(,2), 为X的总体均数,2为总体方差,正态分布有两个参数: 和 , 分别表示均数和标准差。,二、正态分布的特征,钟型曲线,以为中心,左右完全对称,两端与X轴永不相交 在X=处,f(X)取最大值,X越远离,f(X)越小。 曲线下面积分布有规律 X轴与正态曲线所夹面积恒等于1或

3、100%; 区间的面积为68.3%,区间1.96的面积为95%,区间2.58的面积为99%. 两个参数决定位置和变异:和,图3-2 正态分布曲线下的面积,图3-3 三种不同均值的正态分布,两个参数决定位置和变异,是位置(即平均水平) 参数,决定分布曲线在横轴的偏倚位置,是变异参数,决定分布曲线的形态,图3-4 三种不同标准差的正态分布,正态分布是一个分布族,对应于不同的参数 和 会产生不同位置、不同形状的正态分布。,s,m,为了应用方便, 令:,二、标准正态分布 (Standard Normal Distribution) 对任何参数的正态分布,都可以通过一个简单的变量变换 化成 和 的标准正

4、态分布。通常,可以利用标准正态分布表求出与原始变量X 有关的概率值。此变换也称为标准化变换,或称 Z或u变换,图3-5 标准正态分布及曲线下面积,标准正态分布Z的概率密度函数为 即将XN(,2)的正态分布转化为Z N(0,12)的标准正态分布,Z称为标准正态变量,其分布函数为,根据上述公式制成附表1,欲求一定区间标准正态分布曲线下的面积只需查表即可,且 (z)=1- (-z),(z),例:已知X服从均数为标准差为的正态分布,试估计:(1)X取值在区间1.96内的概率;(2)X取值在区间2.58内的概率。,求X取值在相应区间内的概率,首先要确定区间两端点所对应的Z值,查表,得(-1.96)=0.

5、025, 则Z取值在(-1.96,1.96)的概率为0.95,即X取值在区间1.96内的概率为0.95。,95%,99%,例3-1:正常成年男子的红细胞计数近似服从正态分布,假设均值为4.781012/L,标准差为0.381012/L,试估计红细胞数在41012/L以下所占的比例。,先将4(1012/L)变换为相应的值,即 于是问题就转化成为求标准正态分布Z值小于-2.05概率。查附表1得(-2.05)=0.202,表明成年男子的红细胞数低于4 1012/L的人约占总体的2%。,求出在4 1012/L5.5 1012/L范围内所占的比例 即求P(4.0X5.5),例3-2 上节课的例题中已计算

6、出101名正常成年女子的血清总胆固醇均数为4.03mmol/L,标准差为0.659mmol/L。试估计该单位:正常成年女子血清总胆固醇在4.00mmol/L以下者占正常女子总人数的百分比;在4.005.00mmol/L之间者占正常女子总人数的百分比;在5.00mmol/L以上者占正常女子总人数的百分比。,由于此例样本含量较大,可用样本均数、标准差代替总体均数和标准差,查附表1得(-0. 05)=?,如何求(1.47)?,三、正态分布的应用,正态分布除了可估计频数分布外,还是许多统计方法的基础,并可应用于质量控制及制定医学参考值范围。,一、基本概念 医学参考值:通常指包括绝大多数正常人的解剖、生

7、理、生化、免疫及组织代谢产物的含量等各种生理生化指标常数。 医学参考值范围:由于存在个体差异,生物医学数据并非常数而在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。 主要目的:用于临床疾病诊断。,第三节 医学参考值范围 (Reference Value Range),通常使用的医学参考值范畴有:90%,95%和99%。 最常用的是95%参考值范围。,确定95%参考值范围示意图,二、医学参考值范围的制定方法 (一)选择一定数量的参照样本 选择参照样本必须要考虑可能影响所要制定参考值范围指标的各种疾病及干扰因素,将这些人排除在外。例如在制定血清谷丙转氨酶活性正常值时,选取正常人

8、的条件为肝、肾、心、脑、肌肉等无器质性疾患,近期无特殊用药史等。同时可能需要考虑性别、年龄、民族、地理位置等因素。样本含量一般要较大,如n120。,(二)对选定的参照样本进行准确的测定 为保证原始数据可靠,要严格控制检测误差,包括分析仪器的灵敏度、试剂的纯度、操作技术及标准的掌握等,同时必须对测量条件做出统一的规定和说明,如临床化验参考值范围的制定,应对收集样本时的环境和生理条件(温度、季节、体育活动强度、饮食、妊娠等),收集、转运和储藏样品的方法及时间有明确的规定。,(三)决定取单侧范围还是双侧范围值 有些指标如白细胞数过高或过低均属异常(a) ,故其参考值范围需要分别确定下限和上限,称作双

9、侧。有些指标如24小时尿糖含量仅在过高(b)、肺活量仅在过低时为异常(c),只需确定其上限或下限,称作单侧参考值范围。,(a)白细胞数参考值范围,(b)24小时尿糖参考值范围,(c)肺活量参考值范围,(四)选择适当的百分范围 参考值的百分范围应根据资料的性质和研究目的选择,它与诊断阈值有确定的关系。百分范围的不同将导致不同的假阳性率和假阴性率。,正常人和病人数据分布重叠,(五)估计参考值范围的界限 参考值范围估计主要有百分位数法和正态分布法。 1.百分位数法:适用于任何分布类型的资料,尤其是偏态分布资料,要求样本含量比正态分布法要多(不低于100)。 计算公式: 双侧1-参考值范围:P/2 P

10、100-/2 单侧1-参考值范围: P 或P100- 双侧95%医学参考值范围是( P2.5 ,P97.5 ),单侧范围是P95以下(如人体有害物质如血铅)或P5以上(如肺活量),参考值范围所对应的百分位数,为该地区50岁60岁女性高血脂诊断与治疗提供参考依据,试估计血清甘油三脂含量的95%单侧参考值范围。,即95%单侧参考值范围为小于2.098mmol/L。,2.正态分布法,首先要对资料进行正态性检验,且要求样本含量足够大(n100)。计算公式如下: 双侧1-参考值范围: 单侧1-参考值范围:,参考值范围所对应的正态分布区间,Z界值表,若已算得某地正常成年男子红细胞数的均数为4.781012/L,标准差为0.381012/L, 试估计该地成年男子红细胞数的95%参考值范围。,下限:,上限:,小 结 1.标准差与均数结合能够完整地描述一个正态分布。对任何参数的正态分布,都可以通过一个简单的变量变换化成标准正态分布。 2.利用正态分布可以很容易地确定其数值出现在任意指定范围内的概率。,3.医学参考值范围指“正常参照人群”的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。主要用作划分正常人与异常人的界

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论