医学统计学之集中趋势的统计描述(ppt 50页).ppt_第1页
医学统计学之集中趋势的统计描述(ppt 50页).ppt_第2页
医学统计学之集中趋势的统计描述(ppt 50页).ppt_第3页
医学统计学之集中趋势的统计描述(ppt 50页).ppt_第4页
医学统计学之集中趋势的统计描述(ppt 50页).ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

集中趋势的统计描述MeasuresofCentralTendency Medicalstatistics医学统计学 赵华硕 Outline 频数表和频数图频数表和频数图的信息数值变量资料的统计描述描述集中位置的指标描述离散趋势的指标正确应用分类变量资料的统计描述总结 例1 乱七八糟的原始数据 某地140名成年男子红细胞计数 1012个 升 资料如下 4 765 265 615 954 464 574 315 184 924 274 774 885 004 734 475 344 704 814 935 044 405 274 635 505 244 974 714 444 945 054 784 524 635 515 244 984 334 834 565 444 794 914 264 384 874 995 604 464 955 074 805 304 654 774 505 375 495 224 585 074 814 543 824 014 894 625 124 854 595 084 824 935 054 404 145 014 375 244 604 714 824 945 054 794 524 644 374 874 604 724 835 334 684 804 154 654 764 884 613 974 084 584 314 054 165 045 154 504 624 734 474 584 704 814 554 284 784 514 634 364 484 595 095 205 325 054 414 524 644 754 494 224 715 214 944 685 174 915 024 76 频数分布表和频数分布图 原因 由于个体变异的存在 医学研究中某指标在各个体上的观察结果不是恒定不变的 但也不是杂乱无章的 而是有一定规律的 呈一定的分布 distribution 现状 医学研究得到的原始数据 rawdata 往往是庞大的 混乱的 解决 频数分布表的基本思想 将原始数据按照一定的标准划分为若干各组 合计各组的频数 得到频数分布表 在将频数表绘制成频数分布图 频数分布表的制作步骤 计算极差 R R max min 5 95 3 82 2 13 1012个 升 组数 8 15组距 i R 组数 2 13 10 0 213 0 2 1012个 升 组段 含义 含下限不含上限 第一组段下限 min最后一组上限 max划记 计算频数 100名成年男子红细胞计数频数表 100名成年男子红细胞计数频数图 图1140名成年男性的血红细胞计数的频数分布 频数分布所提供的信息 频数分布图用以表示数据的分布规律 观察有无可疑值 考察分布的类型 对称分布非对称分布 偏态分布 考察分布的特征集中位置 CentralTendency 离散趋势 TendencyofDispersion 289只近视眼Lasik术后1月裸眼视力 偏态 正偏态和负偏态 分布不对称者称为偏态分布 偏态分布又分为正偏分布和负偏分布 正偏分布是指分布的长尾在峰的右侧 又称右偏分布负偏分布是指分布的长尾在峰的左侧 又称左偏分布 常见偏态分布 120名7岁男童身高的频数分布图 239人发汞含量的频数分布 发汞含量 mol kg 人数 某市892名老年人生存质量自评分频数分布 自评分 人数 102名黑色素瘤患者的生存时间频数分布 生存时间 月 人数 某地某年10000例死亡者年龄分布 死亡年龄 岁 人数 偏态分布1 老年人生存质量自评分 自评分 人数 偏态分布2 黑色素瘤患者的生存时间 生存时间 月 人数 集中位置和离散趋势 2 2描述集中位置的指标 平均数 Average 算术均数 Mean 几何均数 GeometricMean 中位数 Median 百分位数 Percentile 描述集中位置的指标 算术均数 算术均数 arithmeticmean mean 定义 使用条件单峰对称分布 正态分布的资料 加权均数 weightedmean 加权法计算实例 例2 1 100名成年男性血红细胞均数计算表 描述集中位置的指标 几何均数 几何均数 geometricmean G 定义使用条件呈倍数关系变化或对数正态分布常用 几何均数计算实例 1 10 1 20 1 40 1 80 1 160 描述集中位置的指标 中位数 中位数 median M 定义 将一组数据按从小到大的顺序排列 位置居中的数即是中位数 使用条件 偏态分布资料 开口资料 分布不明计算 中位数计算实例 9例正常人的发汞值 1 1 1 83 54 24 85 65 97 110 5M 4 810例正常人的发汞值 1 1 1 83 54 24 85 65 97 110 516 3M 4 8 5 6 2 5 2 中位数例 对于某项风险较高的新手术术后的生存时间进行跟踪 共调查了7人 6人死亡之前分别生存了5天 6天 10天 16天 25天 29天 还有一人术后30天随访时仍存活 本资料属于 开口 资料 本例数据已经按从小到大的升序排列 n 7 为奇数 其中位数为16天 描述集中位置的指标 百分位数 百分位数 percentile X PX 100 X 50 分位数就是中位数25 75 分位数称四分位数 quartile 某地630名正常女性血清甘油三酯含量 ug dl 甘油三酯频数累积频数累积频率10 27274 340 16919631 170 16736357 6100 9445772 5130 8153885 4160 4258092 1190 2860896 5220 1462298 7250 462699 4280 362999 8310 1630100 0合计630 130 160 81 M 平均数应用的注意事项 同质的资料计算平均数才有意义根据资料分布的特征选用适当的平均数均数 单峰对称分布的资料几何均数 等比资料 滴度资料 正偏态资料中位数 理论上可用于任何分布资料 但当资料适合计算均数或几何均数时 不宜用中位数 偏态分布 分布不明资料 有不确定值的资料 平均数应用的注意事项 计算几何均数时 变量值中不能有0同一组变量值不能同时存在正 负值若变量值全为负值 可先将负号除去 算出结果后再冠以负号样本含量较少时不宜计算靠近两端的百分位数平均数要与变异指标结合使用 例 只用平均数描述资料的弊病 甲组2629303134均数30kg乙组2427303336均数30kg丙组2628303234均数30kg 描述离散趋势的指标 描述离散趋势的指标 极差 全距 range 极差R max min意义 优点 简单明了缺点 不灵敏 只考虑了最大 最小值不稳定 抽样误差大 描述离散趋势的指标 四分位数间距 四分位数间距 inter quartilerange QU QL P75 P25 适用于偏态分布的资料离散程度指标描述偏态分布的资料的集中趋势 离均差离均差之和 离均差平方和 离均差平方和与观察值的个数即样本含量 n 有关 描述离散趋势的指标 方差 方差 variance 方差缺点 描述离散趋势的指标 标准差 标准差 standarddeviation sd n 1 自由度 degreeoffreedom 甲组2629303134乙组2427303336丙组2628303234极差方差标准差甲组88 502 92乙组1222 504 74丙组810 003 16 标准差是描述变量值变异程度的指标 标准差大变异程度大均数的代表性差标准差小变异程度小均数的代表性好 用途1表示变异程度的大小2计算标准误 变异系数3估计正常值范围 标准差的意义 描述离散趋势的指标 变异系数 变异系数 coefficientofvariation CV 排除了平均水平的影响 并取消了单位 因此变异系数常用于 比较度量衡单位不同的两组或多组资料的变异度比较均数相差悬殊的两组或多组资料的变异度 不同指标间变异度的比较 例2 7 某地年龄儿童身高 cm 的变异 正确应用 1 算数均数 适用于单峰对称分布资料 几何均数 适合于作对数变换后单峰对称分布资料 中位数和百分位数 适用于任何分布的资料 中位数和百分位数在样本含量较少时不稳定 越靠两端越不稳定 中位数在抗极端值的影响方面 比均数具有较好的稳定性 但不如均数精确 因此 当资料适合计算均数或几何均数时 不宜用中位数表示其平均水平 不同质的资料应考虑分别计算平均数 正确应用 2 极差不稳定 不灵敏标准差的基本内容是离均差 它显示一组变量值与其均数的间距 故标准差直接地 总结地 平均地描述了变量值的离散程度 在同质的前提下 标准差大表示变量值的离散程度大 即变量值的分布分散

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论