第3章变异程度的统计描述_第1页
第3章变异程度的统计描述_第2页
第3章变异程度的统计描述_第3页
第3章变异程度的统计描述_第4页
第3章变异程度的统计描述_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第三章变异程度的统计描述,变异是生物医学数据最显著的特征。,.,掌握:描述数据分布离散趋势的指标;正态分布的概念和特征、标准正态分布下面积分布规律。熟悉:医学参考值范围的意义和计算;了解:正态分布表、正态分布的应用。,学习目的和要求,.,描述数值变量资料的分布特征必须从集中趋势和离散趋势两方面来进行,缺一不可。例:三组同年龄女大学生体重(kg)如下,试分析其分布特征。甲组4648515357=51乙组4447525557=51丙组4549505556=51,R=11,R=13,R=11,.,一、极差和四分位数间距(一)极差(range)R,也称全距。例:甲、乙两人高血压患者测量5天的收缩压(mmHg)得:甲162145178142186=162.6乙164160163159166=162.4,第一节衡量变异程度的指标,R甲=186-142=44R乙=166-159=7,.,四分位数间距(quartileinterval,Q)就是上四分位数QU(即P75)与下四分位数间距QL(即P25)之差。其间包含了全部观察值的一半,单位与原观察值相同。四分位数间距越大,则数据的变异度越大;反之,说明变异度越小。,(二)四分位数间距(quartile)Q,.,0255075100,四分位数间距与中位数一起可全面描述偏态分布资料的分布特征。,Q=135.7-63.2=72.5(mg/dl),.,例2.4某地630名正常女性血清甘油三酯含量的频数表甘油三酯(mg/dl)频数累积频数累积频率(1)(2)(3)(4)1027274.3401691963161009445772.51308153885.41604258092.11902860896.52201462298.7250462699.4280362999.83101630100.0合计630,.,(一)平均偏差(meandifference),二、离均差平方和、方差、标准差和变异系数,.,例:,对甲乙两名高血压患者连续观察5天,测得的收缩圧分别为:甲患者(mmHg)162145178142186=162.6乙患者(mmHg)164160163159166=162.4,甲患者的血压波动较乙患者大。,.,平均偏差是一个很直观的变异度量,但由于使用了绝对值,在数学上不便于继续处理,使它在应用上受到很大的限制,实际中很少使用。为了克服平均偏差使用绝对值不便进一步运算的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和。,.,(二)离均差平方和(sumofsquare,SS),.,(三)方差与标准差(variance,standarddeviation,S或SD),N-1称自由度Degreeoffreedom,.,.,例3.1对甲乙两名高血压患者连续观察5天,测得的收缩压分别为:,甲患者(mmHg)162145178142186=162.6乙患者(mmHg)164160163159166=162.4甲患者:X162145178142186813X216221452.1862=133713甲乙,.,大样本频数表资料可用下列公式计算标准差:,.,例3.2根据第2章表22资料计算其标准差,红细胞数组中值(x)频数(f)fxfx2(1)(2)(3)(4)=(2)(3)(5)=(2)(4)3.803.9027.8030.424.004.10624.60100.864.204.301147.30203.394.404.5025112.50506.254.604.7032150.40706.88.5.805.9015.9034.81合计140669.803224.20,(1012/L),.,在所有的变异指标中,标准差或方差是其它变异指标所不能比拟的。标准差能够直接用于代数运算,如根据来自总体的几个样本的标准差可以直接求得合并样本的标准差,而不必根据合并样本重新计算。,.,计量资料的主要描述性指标及其适用条件,主要指标适用条件、s对称分布、正态或近似正态分布资料G、lg-1Slgx等比级数或对数正态分布资料M、Q偏态分布、分布不明或分布末端无确定值的资料,.,用标准差比较两个样本的变异程度时需注意:,1.两组数据的均数相差不大2.单位相同(标准差使用的度量衡单位与原始数据相同),.,(五)变异系数(coefficientofvariation,CV),例3.3已知:舒张压均数为77.5标准差为10.7收缩压均数为122.9标准差为17.1舒张压,可见两种指标的变异度几乎没有什么差别。,收缩压,.,例7.10某地调查110名20男大学生,其身高均数为172.73cm,标准差为4.09cm;其体重均数为55.04kg,标准差为4.10kg,试比较两者变异程度。,身高,体重,.,指高峰位于中央(均数所在处)、两测逐渐降低且左右对称、不与横轴相交的光滑的曲线。,以某地140名正常男子红细胞数资料为例:,第二节正态分布及其应用,正态分布曲线:,.,表22某地140名正常男子红细胞数的频数表,红细胞数划记组中值频数频率(1)(2)(3)(4)(5)3.80T3.9021.44.00正一4.1064.34.20正正一4.30117.94.40正正正正正4.502517.94.60正正正正正正T4.703222.94.80正正正正正T4.902719.35.00正正正T5.101712.15.20正正T5.30139.35.405.5042.95.60T5.7021.45.806.00一5.9010.7,.,.,若横坐标为红细胞数(变量值X),第i组的组距和人数分别用Xi和fi表示,则在(X,X+Xi)区间内每单位红细胞数的频率为:f(X)称作密度函数将前图表示人数的纵坐标换成f(X)后可以得到下图:,.,矩形面积等于红细胞在这一区间内出现的频率,.,.,.,.,正态分布的密度函数:,在和未知的情况下,可用和S作为和的估计值。,-x,.,正态分布的几个特征,以均值为中心,左右对称曲线下的面积集中在以均数为中心的部分,越远离中心,曲线下面积越小。正态曲线下面积分布有一定规律:范围内的面积为68.3%范围内的面积为95.0%范围内的面积为99.0%正态分布有两个参数,和,.,.,.,.,二、标准正态分布,(Standardnormaldistribution)是均数为0,标准差为1的正态分布。对任何参数和的正态分布,都可以通过一个简单的变量变化转成标准正态分布,即,.,标准正态分布的密度函数,u,分布函数求标准正态曲线下的面积。,标准正态分布的分布函数,当均数为0,标准差为1时,.,.,.,例如:成年男子红细胞数近似服从正态分布,均数为4.78(1012/L),标准差为0.38(1012/L)。现想知道红细胞数在41012/L以下所占的比例?,一旦完成了这种变换,就可以利用标准正态分布表求出与原始变量X有关的概率值。,可以先将变换为相应的u值,即:,.,例:已知均数为4.78,标准差为0.38,查附表1(P194),标准正态曲线下左侧尾部面积,得(-2.05)=0.0202,即在41012/L以下者占总人数的2.02%。,.,若需要求出在41012/L5.51012/L范围内所占的比例,可以通过下面计算获得。,总体平均数,总体标准差,即在41012/L5.51012/L范围内占总人数的95.04%。,.,例:成年男子红细胞数近似服从正态分布,均数为4.78(1012/L)标准差为0.38(1012/L),现想知道红细胞数在41012/L5.51012/L范围内所占的比例。,第一步:进行U变换,.,第二步:查附表1,标准正态分布曲线下面积。,(-2.05)=0.0202,(-1.89)=0.0294,(1.89查不到),.,.,正态分布的应用,是各种统计推断方法的理论基础可进行医学参考值范围的估计可进行误差分析和检测的质量控制,.,第三节医学参考值范围,医学参考值范围(refrencevaluerange)又称正常值范围(normalrange)。指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。,一、医学参考值范围的概念,.,1、临床实践:着眼于个体,作为划分正常人与异常人的界线。2、预防医学实践:着眼于群体,如评价儿童的发育水平。,参考值范围的应用:,.,二、医学参考值范围的制定方法,1.选择足够数量的正常人作为参照样本2.对选定的正常人进行准确的测定3.决定取单侧范围还是双侧范围值4.选择适当的百分范围5.选择适当的方法估计参考值范围的界限,.,.,青光眼病人和正常人眼内压分布图,受检人数,正常人,患者,14161820222426283032343638,眼内压,重叠区,若将眼内压的阳性诊断标准定为22mmHg,所有患者均被判为阳性。但是,眼内压在22-26mmHg之间的正常人被误判为阳性(假阳性),造成误诊。,若将眼内压的阳性诊断标准定为26mmHg,所有的正常人均被判为阴性。但是,眼内压在22-26mmHg之间的患者被误判为阴性(假阴性),造成漏诊。,.,表3-2参考值范围所对应的百分位数,百分范围(%)单侧双侧(对称)下限上限下限上限95P5P95P2.5P97.599P1P99P0.5P99.5表3-3参考值范围所对应的正态分布区间百分范围(%)单侧双侧(对称)下限上限下限上限95-1.645s+1.645s-1.96s+1.96s99-2.33s+2.33s-2.58s+2.58s,.,医学参考值计算方法,1.正态分布法适用于正态或近似正态分布资料双侧界值:单侧上界:单侧下界:,.,求:该地成年男子红细胞数的95%参考值范围。,下限:,上限:,例:已知,.,2.对数正态分布法适用于对数正态分布资料双侧界值:单侧上界:单侧下界:3.百分位数法常用于偏态分布资料双侧界值:P2.5和P97.5单侧上界:P95单侧下界:P5,例:第二章表2-4资料。估计血清甘油三酯含量的95%单侧参考值范围,.,例2.4某地630名正常女性血清甘油三酯含量的频数表甘油三酯(mmol/L)频数累积频数累积频率(1)(2)(3)(4)0.1027274.30.4016919631.10.7016736357.61.009445772.51.308153885.41.604258092.11.902860896.52.201462298.72.50462699.42.80362999.83.101630100.0合计630,.,.,不同方法比较:正态分布法:资料必须服从正态或近似正态分布。特点:是结果比较稳定,在样本含量不是很大的情况下(n100)仍然能够处理;百分位数法:不符合正态分布法或对数正态分布法的资料。特点:适用范围较广,故在实际中较为常用。但因两端数据波动较大,使用百分位数法必须有较大样本含量,否则结果不稳定。,.,例8-11某年某市调查了200例正常成人血铅含量(g/100g)如下,试估计该市成人血铅含量95医学参考值范围。,.,200个血铅测量值,.,组段频数f336839134718202318281633338743148153158621,200名血铅频数表,.,组段频数f累计频数f累计频率()3363618.08397537.5134712261.0182015276.0231817085.0281618693.033318994.538719698.043119798.548119899.053119999.558621200100.0,200名血铅频数表及P95计算表,.,求95%的单侧上界:,.,对数组段频数f组中值(lgX)flgXf(lgX)20.4510.50.50.250.5550.63.01.800.65100.77.04.900.75200.816.012.800.85110.99.98.910.95211.021.021.01.05291.131.935.091.15251.290.036.01.25301.339.050.71.35201.428.039.21.45161.524.036.01.5581.612.820.481.6531.75.18.671.751.8411.81.83.24合计200230.0279.04,200名血铅值对数变换后的频数表及lgX、SlgX计算表,.,39.278(g/100g),5.0839.28,.,掌握:描述数据分布离散趋势的指标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论