医学统计学2定量资料的统计描述课件_第1页
医学统计学2定量资料的统计描述课件_第2页
医学统计学2定量资料的统计描述课件_第3页
医学统计学2定量资料的统计描述课件_第4页
医学统计学2定量资料的统计描述课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学 Medical Statistics,2009.09,第二章 个体变异与变量分布,第一节 个体变异,具有同质性的观察单位的某项观察指标显示的差别。 表现的多样性: 定量 定性 等级 变异是普遍存在的。,第二节 频数分布,分布(distribution) 原始数据 分组整理 频数 频数分布 理论分布,一、定量资料的频数分布,例、某市1997年12岁男童120人的身高(cm)资料如下:,频数分布表的编制,1、求全距(range)又称为极差,指所有观察值中最大值与最小值的距离,用R表示。160.9-125.9=35cm 2、划分组段 确定组数 一般取10组左右 确定组距 极差/组数 4cm 确定各组段的上下限 上限=下限+组距 3、统计各组段频数,确定组段上下限的三个注意点,第一组段必须包含最小值,其下限一般取包含最小值的、较为整齐的数值。最后一个组段也应该包括最大值。 连续型计量资料组段应遵循上限不在内原则,每一组段均为半开半闭区间。 除最后一个组段需同时写出其下限和上限外,其余组段只需写出其下限。,频数分布图的绘制,以观察变量为横轴,以频数为纵轴 以直方的面积大小表示频数的多少 以直方面积在总面积中的比例表示频率的大小。,本例的频数分布图,二、定性资料及等级资料的频数分布,定性资料的分组依据:指标值的不同属性,统计的是各类别的频数分布。 等级资料的分组依据:指标值的不同等级,统计的是各等级的频数分布。,三、频数分布的类型,频数分布分为对称分布与非对称分布。 非对称分布又称偏态(skew)分布,包括正偏态(positive skew)和负偏态(negative skew)。 正偏态:分布的尾部偏向数轴正侧又称右偏态。 负偏态:分布的尾部偏向数轴负侧又称左偏态。 频数分布单峰分布、双峰或多峰分布,几种偏态分布实例的图示,自评分,(a) 239人发汞含量的频数分布,(b) 某城市892名老年人生存质量自评分的频数分布,发汞含量(mol/kg),人 数,人 数,(c) 102名黑色素瘤患者的生存时间频数分布,(d) 某地某年10000例死亡者年龄分布,人 数,人 数,生存时间(月),死亡年龄(岁),四、频数分布表(图)的用途,1、揭示资料的分布类型 正态、偏态;正偏、负偏 2、揭示频数分布的特征: 集中趋势(central tendency) 离散趋势(tendency of dispersion) 3、便于发现某些特大或特小的可疑值 4、进一步统计分析的基础,第三节 定量资料的统计指标,集中趋势和离散趋势程度 统计指标量化描述 一、集中位置的描述 平均数(average)是一类描述同质计量资料集中位置或平均水平的统计指标。对一组变量值有代表性。 在医学领域中常见的平均数有算术平均数、几何平均数和中位数。,(一)算术均数,统计学中用希腊字母表示总体均数,用 表示样本均数。 1、直接法,2、加权法 对于已绘制成频数表的资料,可将每组段的组中值(下限+上限)/2代替该组段观察值的实际取值,用加权法求算术均数。,算术均数的特性,1、离均差之和为0 2、最小二乘,算术均数的应用,1、反映平均水平,作为样本的代表值与其他样本进行比较。 2、适用于描述单峰对称分布,尤其是正态分布或近似正态分布资料的集中趋势。(大多数正常人的生理、生化指标,如身高、体重、成人红细胞数、血清总蛋白含量等,都适宜用均数表达其集中趋势) 3、描述正态分布的特征,(二)几何均数,原始资料按数值大小顺序排列后,各观察值呈倍数关系,或近似倍数关系时,习惯上用几何均数,用G表示。 如抗体的平均滴度、细菌计数等。,计算方法 例、某5人的血清抗体效假分别为1:10,1:20,1:40,1:80,1:160,求平均抗体滴度及效价的平均水平。,几何均数的应用注意事项,1、几何均数常用于等比资料或对数正态分布资料。 2、观察值中若有0或负值,则不能直接使用几何均数。 3、观察值不能同时有正值和负值。若全是负值,计算时可先把负号去掉,得出结果后,再加上负号。 4、同一组资料求得几何均数小于算术均数。,(三)中位数(median),中位数常用M表示,是指将一组变量值按从小到大的顺序排列,位置居中的数。 计算方法,百分位数,位置指标 PX 将一组数值分为两部分 P50中位数 10例由小到大排列的正常人发汞值(mol/kg):1.1,1.8,3.5,4.2,4.8,5.6,5.9,7.1,10.5,16.3 ,求P90,中位数的应用注意事项,1、中位数可用于各种分布的资料。 2、中位数不受极端值的影响。 3、适用于偏态分布资料、两端无确切值或分布不明确的资料。,(四)三种平均数的特点,1、算术均数 根据全体观察值计算得到,其计算较为简单,通常被认为是最佳集中趋势的度量值。 如果资料观察值含有少数极端值(相对地说特大特小值)或资料呈偏态分布,算术平均数就变的不稳定而失去代表性。,2、几何均数 根据全部观察值相乘后开n次方计算得到 只适宜于等比资料或对数正态分布资料,此时用几何均数反映集中趋势比算术均数或中位数更合适。,3、中位数 将全部观察值按由小到大的顺序排列后,取中间位置所对应的量值 不受其前后其他数值(特别是极端值)的影响。因此

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论