医学统计学第2讲计量资料的统计描述.ppt_第1页
医学统计学第2讲计量资料的统计描述.ppt_第2页
医学统计学第2讲计量资料的统计描述.ppt_第3页
医学统计学第2讲计量资料的统计描述.ppt_第4页
医学统计学第2讲计量资料的统计描述.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章定量资料的统计描述 个体变异是同质观察对象间表现出的差异 变异是生物体在一种或多种 已知或未知的不可控因素作用下所产生的综合反映 就每个观察单位而言 其观察指标的变异是不可预测的 或者说是随机的 random 就总体而言 个体变异是有规律的 变异规律的体现 分布 distribution 何为分布 熊猫分布在温暖多雨的山区 尤以中国西南部 刀鱼分布在长江下游水域 长寿村的由来 统计描述 统计描述 用统计指标 统计表 统计图等方法对资料的数量特征及其分布规律进行测定和描述 频数 当汇总大量的原始数据时 把数据按类型分组 其中每个组的数据个数 称为该组的频数 频数表 频数分布 表示各组及它们对应的组频数的表格称为频数表或频数分布 频数分布表 某市1997年12岁男童120人的身高 cm 1 求极差 range 即最大值与最小值之差 又称为全距 本例极差 R 160 9 125 9 35 cm 2 决定组数 组段和组距 根据研究目的和样本含量n确定 组距 极差 组数 通常分8 15个组 为方便计 组距常取整数或一位小数 本例i R 10 35 10 3 5 4 列出组段 第一组段的下限略小于最小值 最后一个组段上限必须包含最大值 其它组段上限值忽略 3 划记计数 用划记法将所有数据归纳到各组段 得到各组段的频数 频数表的编制步骤 1997年某市120名12岁男童身高的频数分布 某市120名12岁男童身高的频数分布 频数表的分布特征 集中趋势 centraltendency 变量值集中位置 本例在组段 140 集中趋势指标 离散趋势 tendencyofdispersion 变量值围绕集中位置的分布情况 本例132 148 共有114人 占95 离 中心 位置越远 频数越小 且围绕 中心 左右对称 离散趋势指标 120名7岁男童身高的频数分布图 239人发汞含量的频数分布 发汞含量 mol kg 人数 某市892名老年人生存质量自评分频数分布 自评分 人数 102名黑色素瘤患者的生存时间频数分布 生存时间 月 人数 某地某年10000例死亡者年龄分布 死亡年龄 岁 人数 频数分布的类型 对称分布 偏态分布 正偏态 负偏态 长尾向右延伸 长尾向左延伸 频数分布表的用途 揭示资料的分布类型 看出频数分布的两个重要特征 集中趋势 离散趋势 便于发现某些特大或特小的可疑值 便于进一步计算指标和统计分析处理 集中趋势指标 1 算术均数 简称均数 是用得最多的统计描述指标 总体均数 样本均数 计算方法 直接法 例 10名七岁儿童体重 kg 分别为 17 3 18 0 19 4 20 6 21 2 21 8 22 5 23 2 24 0 25 5 求平均体重 加权法 均数的特性 各观察值与均数之差 离均差 的总和等于零 即 各观察值的离均差平方和最小 即 均数是一组观察值最理想的代表 均数的应用 均数能全面反映全部观察值的平均数量水平 应用甚广 最适于对称分布资料 特别是正态分布资料 对于偏态资料 均数不能较好地反映其集中趋势 2 几何均数 计算方法 G 或者G 直接法 加权法 例 5人的血清滴度为1 10 1 20 1 40 1 80 1 160 求平均滴度 G 40 故平均滴度为1 40 例 某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后 抗体滴度测定结果见下表 求平均滴度 75名儿童的平均抗体滴度计算表 75名儿童进行流脑疫苗免疫接种后 平均抗体滴度为1 27 35 几何均数的应用 1 等比资料 如抗体平均滴度 2 对数正态分布资料 Remember 使用几何均数时的注意点 1 观察值不能有0 2 观察值不能同时有正值和负值 若全为负值 在计算时先把负号去掉 得出结果再加上负号 Becareful 3 中位数和百分位数 中位数指将一组观察值从小到大按顺序排列 位次居中的观察值 常用M表示 反映一批观察值在位次上的平均水平 百分位数是一个位置指标 以Px表示 一个Px将总体或样本的全部观察值分为两部分 理论上有x 的观察值比它小 有 100 x 的观察值比它大 而P50就是中位数 因此 中位数也是一个特定的百分位数 适合各种类型的资料 尤其适合于 偏态分布的资料 资料的一端或两端有不确定数值 开口资料 资料分布不明等 中位数和百分位数的适用条件 中位数计算方法 当n为奇数时 M 当n为偶数时 M 例 某病患者5人 其潜伏期分别为2 3 5 8 20 求中位数 n 5 M x3 5 天 例 8名新生儿身长 cm 依次为50 51 52 53 54 56 55 58 求中位数 n 8 M x4 x5 2 53 54 2 53 5 cm 对于频数表资料 fx为Px所在组频数 i为组距 fL为小于L各组段的累计频数 L为Px所在组的下限值 中位数 1 1 0 1x 160 x50 72 20 1 14 P25 0 9 0 1x 160 x25 37 17 0 92P75 1 3 0 1x 160 x75 110 17 1 36 中位数的应用 中位数常用于描述偏态资料的集中趋势 它和均数 几何均数不同的是 不是由全部观察值的数据综合得到 而只受居中变量波动的影响 百分位数的计算 直接法当时 当时 举例 例根据表2 1资料求某地区434名少数民族已婚妇女现有子女数的第80 位数 本例 n 434 434 80 347 2 按式 人 频数表法 百分位数的应用 百分位数用于描述某个观察序列在某百分位置上的水平 常用于确定参考值范围 亦称正常值范围 正常值范围指特定健康状况的人群的解剖 生理 生化等各种数据的波动范围 平均数 平均数 算术均数 几何均数 中位数 加权均数 众数 例 三组同性别 同年龄儿童的体重 kg 如下 试分析该三组资料的异同 离散趋势指标 1 全距 range 极差 优点 简单方便 缺点 除了最大 最小值 不能反应组内其他数据的变异 两样本例数相差悬殊时 不适用全距比较变异度 R max min 2 四分位数间距 P75上四分位数 P25下四分位数 QU QL P25 0 9 0 1x 160 x25 37 17 0 92P75 1 3 0 1x 160 x75 110 17 1 36Q 1 36 0 92 0 44 3 方差和标准差 X 离均差 平方和 2 SS N 2 总体方差 样本方差 自由度 标准差 standarddeviation 即方差的正平方根 其单位与原变量X的单位相同 例 设甲 乙 丙三人 采每人的耳垂血 然后红细胞计数 每人数5个计数盘 得结果如下 万 mm3 标准差的用途 表示观察值的离散度 越大说明围绕均数越离散 反之说明较集中在均数周围 均数代表性越好 结合均数描述正态分布特征 计算标准误 变异系数等 估计正常值范围 4 变异系数 比较单位不同的多组资料的变异度 比较均数相差悬殊的多组资料的变异度 平均数与变异度的关系 它们都是定量资料统计描述的两个指标 分别描述集中趋势与离散趋势分布越集中 变异度越小 平均数代表性就越好 反之 变异度大 代表性就越差 集中趋势指标的正确应用 算数均数 适用于单峰对称分布资料 几何均数 适合于作对数变换后单峰对称分布资料 中位数和百分位数 适用于任何分布的资料 中位数和百分位数在样本含量较少时不稳定 越靠两端越不稳定 中位数在抗极端值的影响方面 比均数具有较好的稳定性 但不如均数精确 因此 当资料适合计算均数或几何均数时 不宜用中位数表示其平均水平 不同质的资料应考虑分别计算平均数 离散趋势指标的正确应用 极差不稳定 不灵敏标准差的基本内容是离均差 它显示一组变量值与其均数的间距 故标准差直接地 概括地 平均地描述了变量值的离散程度 在同质的前提下 标准差大表示变量值的离散程度大 即变量值的分布分散 不整齐 波动较大 反之 标准差小表示变量值的离散程度小 即变量值的分布集中 整齐 波动较小 变异系数派生于标准差 其应用价值在于排除了平均水平的影响 并消除了单位 平均数与变异度 均数 标准差 min max 中位数 四分位数间距 min max 变异度小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论