《医学统计学》医统-第三章正态分布与医学参考值范围_第1页
《医学统计学》医统-第三章正态分布与医学参考值范围_第2页
《医学统计学》医统-第三章正态分布与医学参考值范围_第3页
《医学统计学》医统-第三章正态分布与医学参考值范围_第4页
《医学统计学》医统-第三章正态分布与医学参考值范围_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、流行病与卫生统计学教研室 祝晓明医 学 统 计 学第三章 正态分布与医学参考值范围第一节 正态分布卡尔弗里德里希高斯(,1777-1855)正态分布(normal distribution)又称为高斯分布。首先由德国数学家和天文学家德莫阿弗尔提出,高斯虽然发现稍晚,但他迅速将正态分布应用于天文学,并对其性质作了进一步的研究,使正态分布的应用价值广为人知。 例2-1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示: 4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.04

2、4.405.274.635.505.244.974.714.444.945.054.784.524.635.024.76红细胞数频 数 频 率(%) 累积频率(%) 3.80 2 1.4 1.44.00 6 4.3 5.74.20 11 7.9 13.64.40 25 17.9 31.54.60 32 22.9 54.44.80 27 19.3 73.75.00 17 12.1 85.85.20 13 9.3 95.15.40 4 2.9 98.05.60 2 1.4 99.45.80 6.00 1 0.7 100.0合计 140 - 100.0 表2-2 某地140名正常男子红细胞数的频数表

3、 00.20.40.60.811.23.84.24.65.05.45.8)(XfX00.20.40.60.811.23.84.24.655.45.8)(XfX00.20.40.60.811.23.644.44.85.25.66f(X)X正态分布有两个参数: 和 , 分别表示均数和标准差。图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图 X第一节 正态分布(Normal Distribution) iiXnfXf/)/()(222)(21)(XeXf一、正态曲线二、正态分布的特征则称连续型随机变量X服从正态分布,记为XX的取值范围理论上没有边界2( ,)N 概率分布函数2121()2X

4、XF Xedx2121()2Xf Xe概率密度函数如果随机变量X的分布服从以下函数 正态分布的主要特征:1.单峰分布,以 为中心,左右完全对称。 以X轴为渐近线,两端与X轴永不相交。 X2.在 处有最大值,其值为 ; X越远离对称轴,y越小。 正态曲线在 处有拐点,呈现为钟型X( )1 (2 )fX3.正态分布由两个参数 和 决定 是位置参数,决定着正态曲线在X轴上的位置 是形状参数,决定着正态曲线的分布形状-4-3-2-101234567123321-5-4-3-2-1012345123321 图3-3 三种不同均值的正态分布 图3-4 三种不同标准差的正态分布 4.正态曲线下的面积分布有一

5、定的规律图3-5图3-6问题:曲线下面积的含义? 如何计算?正态曲线下某一区间的面积占总面积的百分数有何意义? 1.该区间的例数占总例数的百分数(频数分布) 2.观察值落在该区间的概率 3.从此总体随机抽得该区间观察值的概率图 正态曲线面积分布示意图 三、标准正态分布 对任何参数的正态分布,都可以通过一个简单的变量变换 化成 和 的标准正态分布。Z变换也称随机变量的标准化变换。01Xz可以利用标准正态分布表求出与原始变量X 有关的概率值。 图 标准正态分布及曲线下面积 概率分布函数概率密度函数正态分布标准正态分布2121( )2XXF Xedx2121()2Xf Xe2212zze 2212z

6、zzedz如何根据概率分布函数去求阴影部分面积?Z转换的目的?( )1()ZZ 问题:s=? =? 那当和已知时z=?例3-1 若X ,试计算X 取值在区间 上的概率。),(2N1.96111.961.96Xz 221.961.96Xz1.961.961.961.9611.961.96 1 21.961 2 0.0250.95Pz 例3-2 已知某地140名正常成年男子红细胞计数近似服从正态分布, =4.781012/L, =0.381012/L。该地正常成年男子红细胞计数在4.01012/L以下者占该地正常成年男子总数的百分比;XS4.04.782.050.38XXzS 查附表1 ,表明该地

7、成年男子红细胞计数低于 4102/L 者约占该地正常成年男子总数的2.02%( 2.05)0.0202 11.892.051 0.02940.02020.9504 红细胞计数在4.01012/L5.51012/L者占该地正常成年男子总数的百分比4.004.785.504.78(4.005.50)()0.380.38XPXP= =( 2.051.89)Pz表明红细胞计数在 4.01012/L 5.51012/L者约占该地正常成年男子总数的95.04%。课后习题:P25 计算题2第二节 医学参考值范围 一、基本概念 通常指“正常人”的解剖、生理、生化、免疫及组织代谢产物的含量等数据大多数个体值的波

8、动范围。 含义:从选择的参照总体上获得的所有个体观察值,用统计方法建立百分位数界限,由此得到个体观察值的波动区间。 最常用的是95%参考值范围主要目的:1.基于临床实践。作为划分正常人与异常人的界限。2.基于预防医学实践。例如制定儿童发育指标的等级标准。 确定95%参考值范围示意图 二、制定医学参考值范围的注意事项 1. 确定同质的参照总体一般选择“正常”人,主要是排除了对研究指标有影响的疾病或有关因素的同质人群。例如在制定血清谷丙转氨酶活性正常值时,选取正常人的条件为:肝、肾、心、脑、肌肉等无器质性疾患近期无特殊用药史等检测前未做剧烈运此外同时可能需要考虑性别、年龄、民族、地理位置等因素2.

9、 选择足够例数的参照样本 通常情况下,确定参考值范围需要大样本,如果例数过少,确定的参考值范围往往不够准确。若接近正态分布,变异度不大,样本含量可以少一些若明显偏态,变异度大,样本含量要多一些。3. 控制检测误差为保证原始数据可靠,检测过程中要严格控制随机误差,避免系统误差和过失误差。包括分析仪器的灵敏度、试剂的纯度、操作技术及标准的掌握等,同时必须对测量条件做出统一的规定和说明,如临床化验参考值范围的制定,应对收集样本时的环境和生理条件(温度、季节、体育活动强度、饮食、妊娠等),收集、转运和储藏样品的方法及时间有明确的规定。人员培训控制条件重复测定4. 选择单、双侧界值 有些指标如白细胞数过

10、高或过低均属异常(a) ,故其参考值范围需要分别确定下限和上限,称作双侧。有些指标如24小时尿糖含量仅在过高(b)、肺活量仅在过低时为异常(c),只需确定其上限或下限,称作单侧参考值范围。(a)白细胞数参考值范围(b)24小时尿糖参考值范围(c)肺活量参考值范围5. 选择适当的百分数范围参考值的百分范围应根据资料的性质和研究目的选择,它与诊断阈值有确定的关系。百分范围的不同将导致不同的假阳性率和假阴性率。图3-9 正常人和病人数据分布重叠问题:确诊病人和初筛病人参考值范围定大还是定小?6.选择计算参考值范围的方法 正态分布法百分位数法如何选择?三、医学参考值范围的计算方法百分位数法适合于任何分

11、布类型的资料,在实际中最为常用。由于参考值范围所涉及的常常是波动较大的两端数据,使用百分位数法必须要有较大的样本含量,否则结果不稳定。正态分布法要求资料服从或近似服从正态分布,优点是结果比较稳定,在样本含量不是很大的情况下仍然能够进行处理;若偏态分布资料经变量变换能转换为正态分布或近似正态分布,仍可用正态分布法。Medical reference range例3-3 已知某地140名正常成年男子红细胞计数近似服从正态分布, =4.781012/L, =0.381012/L, 估计该地正常成年男子红细胞计数95%参考值范围。XS近似正态分布资料可按正态分布法处理,因红细胞计数值过大或过小均为异常

12、,故应估计双侧95%参考值范围:0.05 24.78 1.96 0.384.04,5.52XzS即该地正常成年男子红细胞计数的95%参考值范围为4.041012/L5.521012/L。Medical reference range例3-4 某年某地测得 100 名正常成年人的血铅含量值(g/dl),试确定该地正常成年人血铅含量的95%参考值范围。根据经验已知正常成年人的血铅含量近似对数正态分布,因此首先对原始数据作对数变换,经正态性检验可知对数值服从正态分布(P),故编制对数值频数表,再利用正态分布法求95%参考值范围。Medical reference rangeG G对数组段 频数累计频

13、数0.6 4 40.7 2 60.8 5 110.9 9 201.0 12 321.1 15 471.2 18 651.3 14 791.4 12 911.5 5 961.6 3 99 1.71.8 1 100合计100 4 4 5 5 6 6 7 7 7 7 7 8 8 8 8 8 8 8 9 9101010101010101011111112131313131313131313131414141515161616161616161617171717171818181819202020202121222222232424252526262627272828293030313132323233

14、3541445051表3-2 某年某地100名正常成年人血铅含量(g/dl)对数值频数表 依据表3-2,设X为对数组段的组中值, , , ,则对数值的均数和 标准差为: 100n120fX 2149.73fX1201.2100fXXn(g/dl)222()149.73 120 /1001100 1fXfXnSn0.2406S (g/dl )Medical reference range因为血铅含量仅过大异常,故参考值范围应为单侧,求单侧95%上限值: 即该地正常成年人血铅含量95%参考值范围为小于 。11lg (1.64 )lg (1.2 1.64 0.2406)39.3173XS(g/dl)

15、Medical reference range例3-5 依据表2-4(P11)某地630名50岁60岁正常女性血清甘油三酯含量(mmol/L)的资料,估计其血清甘油三脂含量的单侧95%参考值范围,为该地5060岁女性高血脂诊断与治疗提供参考依据。资料显现出血清甘油三脂含量数值偏小的人数较多,呈正偏态分布,故选用百分位数法计算参考值范围;依据专业知识,为该地5060岁女性高血脂诊断与治疗提供参考依据应计算单侧95%界值P95。Medical reference range951.90(630 95%580) 28 0.302.098P (mmol/L) 即该地5060岁正常女性血清甘油三脂含量的

16、单侧95%参考值范围为小于2.098 mmol/L。甘油三脂频数累积频数累积频率(%)0.10 27 27 4.30.40169196 31.10.70167363 57.61.00 94457 72.51.30 81538 85.41.60 42580 92.11.90 28608 96.52.20 14622 98.72.50 4626 99.42.80 3629 99.83.10 1630100.0合计630表2-4 某地630名正常女性血清甘油三酯含量(mmol/L)的频数表 许多统计方法都要求资料服从正态分布或者近似正态分布,在使用这些方法之前需对资料进行正态性判定。如有充足的专业知

17、识和经验得知某些医学指标服从正态分布,或样本含量足够大时,可不必再作正态性判定。正态性判定的方法有两类:一是图示法,二是计算法,图示法简单易行但比较粗糙,计算法检验效率较高,可利用统计软件获得计算结果。Medical reference range小 结 1. 正态分布是许多统计分析方法的理论基础,是医学研究应用中重要的一种连续型分布。 2. 正态分布受到两个参数影响,总体均数 是位置参数,决定着正态曲线在横轴上的位置;总体标准差 是形状参数,决定着正态曲线的分布形状。不同的 与 对应不同的正态分布,记为X 。正态曲线下的面积即为概率,利用其面积分布规律 可估计频数分布和确定医学参考值范围。 2( ,)N 4. 医学参考值范围指同质总体中某医学指标大多数个体值的波动范围。计算参考值范围常用的方法有正态近似法和百分位数法,当资料服从正态分布或转换值服从正态分布,可用正态近似法;若资料不服从正态分布或未知分布类型,可用百分位数法。 3. =0、 =

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论