CH3-1-计量资料统计描述-2_第1页
CH3-1-计量资料统计描述-2_第2页
CH3-1-计量资料统计描述-2_第3页
CH3-1-计量资料统计描述-2_第4页
CH3-1-计量资料统计描述-2_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,西安交通大学医学部卫生统计教研室,统计描述,统计学的研究对象:数据(data)一个数据吗?几个数据吗?足量的数据群体归纳个体(数量反映质量),数据(资料)类型,1.计量资料2.计数资料3.等级资料,统计分析内容,1.统计描述2.统计推断,计量资料的分布描述频数表和频数图,频数表(FrequencyTable),例:从某纺织厂2013年的职工体检资料中获得101名正常成年女子的血清总胆固醇(serumcholesterol)的测量结果如下,试编制频数分布表。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.502.704.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.803.414.123.955.084.533.923.585.353.843.603.514.063.073.554.233.574.833.523.844.503.964.503.274.523.194.593.753.984.134.263.633.875.713.304.734.175.133.784.573.803.933.783.994.484.284.065.265.253.985.033.513.863.023.704.333.293.254.154.364.953.003.26,频数表(FrequencyTable),例:从某纺织厂2013年的职工体检资料中获得101名正常成年女子的血清总胆固醇(serumcholesterol)的测量结果如下,试编制频数分布表。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.502.704.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.803.414.123.955.084.533.923.585.353.843.603.514.063.073.554.233.574.833.523.844.503.964.503.274.523.194.593.753.984.134.263.633.875.713.304.734.175.133.784.573.803.933.783.994.484.284.065.265.253.985.033.513.863.023.704.333.293.254.154.364.953.003.26,频数表(FrequencyTable),例:从某纺织厂2013年的职工体检资料中获得101名正常成年女子的血清总胆固醇(serumcholesterol)的测量结果如下,试编制频数分布表。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.502.704.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.803.414.123.955.084.533.923.585.353.843.603.514.063.073.554.233.574.833.523.844.503.964.503.274.523.194.593.753.984.134.263.633.875.713.304.734.175.133.784.573.803.933.783.994.484.284.065.265.253.985.033.513.863.023.704.333.293.254.154.364.953.003.26,编制步骤:,1、计算全距RR=5.712.35=3.362、确定组段和组距组段815常取10组距(等距)=0.3360.33、确定组段上下限4、统计各组频数5、计算各组频率6、计算累计频数、累计频率,频数分布表(FrequencyDistributionTable),频数分布表(FrequencyDistributionTable),频数分布表(FrequencyDistributionTable),2.35,频数分布表(FrequencyDistributionTable),2.35,频数分布表(FrequencyDistributionTable),4.21,频数分布表(FrequencyDistributionTable),4.21,频数分布表(FrequencyDistributionTable),频数分布表(FrequencyDistributionTable),频数分布表(FrequencyDistributionTable),频数分布表(FrequencyDistributionTable),频数图(FrequencyGraph),2.32.62.93.23.53.84.14.44.75.05.35.65.9,频数图(FrequencyGraph),2.32.62.93.23.53.84.14.44.75.05.35.65.9,频数分布表、图用途1,描述分布类型对称分布(SymmetryDistribution),频数分布表、图用途1,描述分布类型偏态分布(PartialDistribution),右偏正偏态,左偏负偏态,频数分布表、图用途2,描述分布的集中位置(CentralTendency)变异范围(TendencyofDispersion),频数分布表、图用途3,便于发现可疑值(ShadinessData),频数分布表、图用途4,利用频数表的方法(加权法)计算均数Mean中位数Median百分位数Percentage标准差StandardDeviation,频数图应用注意事项,分组的每组组距不相等时,大组的频数校正(按小组平均)小组和并为大组,乙脑病人年龄分布频数表:,0123456789102030405060,年龄(岁),人数,乙脑病人年龄分布频数表:,人数,年龄(岁),乙脑病人年龄分布频数表:,0102030405060,年龄(岁),人数,计数资料:SARS发病人数分布频数表:,北京山西广东河北内蒙天津,地区,人数,计量资料的统计描述集中趋势和离散趋势,集中趋势:,描述一组同质的数值资料集中位置的指标,反映这组数据的平均状态、中心位置。医学上常用的有:算术平均数(ArithmeticMean);几何平均数(GeometricMean);中位数(Median);,算术平均数(ArithmeticMean),简称均数(mean)。样本均数适用于对称分布,特别是正态分布,计算方法:,1、直接法,例:某地10名25岁健康成年男子身高(cm)分别为174.9,173.0,175.2,179.0,170.3,172.7,166.5,170.4,171.8,176.2,求算术平均数。,计算方法:,2、频数表法(加权法)各组段的f越大,组段的fX值越大,对fX的贡献越大,f起了“权数”的作用,故本法称为加权法。计算公式如下:,从某纺织厂2013年的职工体检资料中获得101名正常成年女子的血清总胆固醇的测量结果,试利用频数表求其平均数。,例题:,频数分布表,患某病的5名病人的年龄分别为2、2、3、3、20岁,求患者平均年龄。算术均数:(2+2+3+3+20)/5=6不能代表中心位置,不能代表大多数,偏态分布(PartialDistribution),偏态分布(PartialDistribution),几何均数(geometricmean),几何均数:变量对数值的算术均数的反对数。,几何均数的适用条件与实例,适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料,血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。,此例的算术均数为22222,显然不能代表滴度的平均水平。,频数表资料的几何均数,中位数(Median),中位数是一组按大小顺序排列的测量值中位次居中的数值,简记为M。常用于描述偏态分布资料的集中趋势,计算方法:,n为奇数时,n为偶数时,,某病患者7人的潜伏期(天)如下,求中位数。5、3、6、4、3、6、11患者人数又增加了1人,潜伏期为9天,求中位数。5、3、6、4、3、6、11、9,例题:,中位数不受个别特大或特小测量值的影响,特别是分布末端无确定数据时,不能求均数,但可求中数。,平均数应用注意事项,根据使用条件正确选择平均指标算术平均数正态或近似正态几何平均数对数正态或等比资料中位数任何分布(偏态分布常用),计量资料离散趋势的描述,反映数据的离散度(Dispersion)即个体观察值的变异程度。常用的指标有:1.极差(Range)(全距)2.百分位数与四分位数间距PercentileandQuartilerange3.方差Variance4.标准差StandardDeviation5.变异系数CoefficientofVariation,变异(variation)指标,例:设甲、乙、丙三人红细胞计数检验结果,每人检测5次,得结果如下(万/mm3),甲,乙,丙,1.极差(Range)(全距),优点:简便缺点:只利用了两个极端值,n大,R也会大,不稳定,120,40,20,2.百分位数与四分位数间距Percentileandquartilerange,百分位数:数据从小到大排列;在百分尺度下,所占百分比对应的值。记为XP%或者PX四分位间距:QP75P25,频数表资料的百分位数,P250.9+0.1x(160 x25%37)/170.92P751.3+0.1x(160 x75%110)/171.36Q1.36-0.920.44,百分位数的应用,中位数M与四分位间距Q(或半间距QD)一起使用,描述偏态分布资料的特征确定医学参考值范围(referencerange):如95参考值范围P97.5P2.5;表示有95正常个体的测量值在此范围。n小时,不宜取太小/太大的百分位数,3.方差,方差(variance)也称均方差(meansquaredeviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。,样本方差为什么要除以(n1),与自由度(degreesoffreedom)有关。自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(nk)个自由度了。计算标准差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n1)个“离均差”表示,所以只有(n1)个独立的“离均差”。因此只有(n1)个自由度。,4.标准差,标准差(standarddeviation)即方差的正平方根;其单位与原变量X的单位相同。,标准差的计算,方差(221.52182.302/160)/(160-1)0.0869标准差0.29,标准差的应用,描述正态分布资料的离散程度确定医学参考值范围(referencerange):如95参考值范围X1.96S;表示有95正常个体的测量值在此范围。估计均数抽样误差,5.变异系数,变异系数(coefficientofvariation,CV

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论