数值变量资料的统计分析--变异程度的描述PPT课件_第1页
数值变量资料的统计分析--变异程度的描述PPT课件_第2页
数值变量资料的统计分析--变异程度的描述PPT课件_第3页
数值变量资料的统计分析--变异程度的描述PPT课件_第4页
数值变量资料的统计分析--变异程度的描述PPT课件_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

离散趋势指标 变异程度的统计描述 MeasuresofDispersion 要求 掌握 标准差的含义及计算方法 变异系数的计算方法和应用 熟悉 其他描述离散趋势的常用指标 离散趋势 dispersiontendency 指标三组同年龄 同性别儿童的体重 kg 甲组2628303234乙组2427303336丙组2629303134 303030 标准差的意义 标准差是表示一组观察者离散程度或变异程度的统计指标 描述一个变量的所有观察值与均数的平均离散程度的指标 全距表示一群变量值的最大值与最小值之差 反映个体差异的范围 用R表示 全距大 说明变异度大 反之 说明变异度小 甲组2628303234乙组2427303336 R 8 R 12 一 全距 range 1 不能全面反映资料的离散程度 2 不稳定 易受极端值的影响 抽样误差大 优点 缺点 1 表示变异范围 简单明了 容易使用 如用于说明传染病 食物中毒等的最短 最长潜伏期等 2 各种分布类型的资料均可用 全距 range 二 四分位数间距 quartileinterval 四分位数间距是上四分位数 QU P75 和下四分位数 QL P25 之差 用Q表示 QU QL 该数值越大 说明变异度越大 反之 说明变异度越小 某地630名正常女性血清甘油三脂含量 mg dl L 组段的下限 iM 组距 fx 频数 fL Px所在组段之前的累积频数 1 与中位数配套 用于偏态分布资料及分布的一端或两端无确切数值的资料 2 比全距稳定 未考虑到每个观察值的变异度 优点 缺点 四分位数间距 quartileinterval 三 平均差距指标 一 平均偏差 MeanDifference 甲班 乙班 特点 直观 易理解 但由于用了绝对值 不便于数学处理 实际中很少使用 二 离均差平方和 SumofSquare SS 为了克服平均偏差的缺点 可以不通过取绝对值 而是通过取平方来避免正负抵消 即使用离均差平方和 其计算公式为SS通常作为一个中间统计量使用 三 方差 Variance 方差是将离均差平方和再取平均 即注意 对于样本资料 分母用的是n 1 称为自由度 degreeoffreedom df 方差的特点 便于数学上的处理 但由于有平方 度量衡发生变化 不便于实际应用 方差 variance 自由度 n 限制条件的个数 用 表示 n 1 当选定时 n个变量值中能自由变动的变量值的个数 方差越大 资料的离散程度越大 全面考虑了每个观察值 不受观察值个数的影响 优点 缺点 一些资料不适用于以平方表示 方差 variance 四 标准差 StandardDeviation 将方差取平方根 还原成与原始观察值单位相同的变异量度即为标准差 例如对于例3 1经计算有甲患者 同理乙患者 例三组同年龄 同性别儿童的体重 kg 甲组2628303234乙组2427303336丙组2629303134 标准差 直接法 标准差 加权法 标准差应用1 表示观察值分布的离散程度 均数相近 度量单位相同的条件下 S越大 观察值的变异程度越大 均数的代表性越差 2 结合均数计算CV 3 结合均数描述正态分布资料的分布特征和估计医学参考值范围4 结合样本含量计算标准误 五 变异系数 CoefficientofVariation 主要用于对均数相差较大或单位不同的几组观察值的变异程度进行比较 例3 3测得某地成年人舒张压均数为77 5mmHg 标准差为10 7mmHg 收缩压均数为122 9mmHg 标准差为17 1mmHg 试比较舒张压和收缩压的变异程度 变异系数Coefficientofvariation CV 应用 1 表示数据分布的相对离散程度2 比较均数相差悬殊的两组或多组资料的离散程度3 比较度量衡单位不同的两组或多组资料的变异程度 某地20岁男子160人 身高均数为166 06cm 标准差为4 95cm 体重均数为53 72kg 标准差为4 96kg 比较身高与体重的变异程度 20岁男子体重的变异程度比身高的变异程度大 某地不同年龄女童的身高 cm 资料如下表所示 试比较不同年龄身高的变异程度 某地不同年龄女童身高的变异程度 年龄组人数均数标准差CV 1 2月10056 32 13 75 6月12066 52 23 33 3 5岁30096 13 13 25 5 5岁400107 83 33 1 小结全距与四分位数间距 后者较稳定 但均不能综合反映各观察值的变异程度 标准差 最为常用 对正态分布尤为重要变异系数 可用于多组资料间度量衡单位不同或均数相差悬殊时作变异度的比较 以上指标都是数值越小 说明观察值的变异度越小 均数的代表性越好 平均指标和变异指标常配套使用如正态分布 均数 标准差 偏态分布 中位数 四分位间距 练习 某市1974年为了解该地居民发汞的基础水平 为汞污染的环境监测积累资料 调查了留住该市一年以上 无明显肝 肾疾病 无汞作业接触史的居民238人的发汞含量 mol kg 如下 用何种指标说明本资料的集中位置和变异程度较好 并计算之 某检验师测定了10名正常成年钢铁工人的血红蛋白值 g dl 和红细胞数 万 mm3 如下 试比较这两个检测项目的结果哪个变异性大 血红蛋白 g dL 13 013 614 014 514 614 715 215 515 816 0血细胞数 万 mm3 510515517518520522524525528530 小结1 描述一组观察值 除需要表示其平均水平外 还要说明它的离散或变异的情况 2 衡量变异程度大小的指标有多种 极差 四分位数间距 方差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论