离散趋势计量资料的统计描述.ppt_第1页
离散趋势计量资料的统计描述.ppt_第2页
离散趋势计量资料的统计描述.ppt_第3页
离散趋势计量资料的统计描述.ppt_第4页
离散趋势计量资料的统计描述.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量资料的统计描述 离散趋势的描述 只用平均数描述资料的弊病 Ithasbeensaidthatafellowwithonelegfrozeniniceandtheotherleginboilingwateriscomfortable ONAVERAGE 离散趋势的描述 离散趋势的概念 描述一群变量值分布特征时 除用平均数表示其集中位置外 还要说明变量值的分散或变异情况 说明变异情况的特征值称变异指标 变异指标又称离散指标 它用于描述一群计量资料变量值之间参差不齐的程度 即离散程度或变异程度 离散趋势统计指标 例4 11试观察三组数据的离散状况 A组 26 28 30 32 34 B组 24 27 30 33 36 C组 26 29 30 31 34 将三组数据分别点在直线上 如图2 4所示 例如 某零件的真实长度为a 现用甲 乙两台仪器各测量10次 将测量结果X用坐标上的点表示如图 若让你就上述结果评价一下两台仪器的优劣 你认为哪台仪器好一些呢 测量结果的均值都是a 因为乙仪器的测量结果集中在均值附近 甲 乙两门炮同时向一目标射击10发炮弹 其落点距目标的位置如图 你认为哪门炮射击效果好一些呢 甲炮射击结果 乙炮射击结果 因为乙炮的弹着点较集中在中心附近 离散趋势的描述 可见平均数只反映平均水平 还需用变异指标来反映离散度 两者结合起来才能全面说明一组变量值的分布特征 描述离散趋势的统计指标 极差 Range 四分位间距 Quartilerange 方差 Variance 标准差 StandardDeviation 变异系数 CoefficientofVariation 一 极差 Range 符号 R计算 R 最大值 最小值R反映的是观察值变异的范围大小 适用条件 任何资料极差反映个体变异的范围 R大 变异度就大 缺点 易受特大 特小值影响 不稳定 除最大 最小值 不能反映其他数据的变异度 样本量越大极差就会越大 优点 简单明了 如上述三组数据中 甲组数据的极差R 34 26 8乙组数据的极差R 36 24 12丙组数据的极差R 34 26 8甲组 丙组数据分布较乙组集中 甲组与丙组的离散程度相同 二 四分位间距 Quartilerange 百分位数 Percentile 以 表示 是一种位置指标 它是指把全部数据由小到大排列后处于第X百分位置的数值 将总体或样本的全部观察值分为两部分 理论上有 的观察值比它小 有 100 的观察值比他大 计算 中位数是特殊的百分位数 即第50百分位数P50 P100 max P75P50 中位数 P25P0 min 百分位数示意图 P25 0 9 0 1x 160 x25 37 17 0 92P75 1 3 0 1x 160 x75 110 17 1 36 四分位数间距quantilerange 符号 QQU QL 中间一半观察值的极差 计算 Q P75 P25Q越大说明数据间的变异越大 适用条件 可用于任何资料 主要用于偏态资料特点 比极差要稳定常与中位数一起 描述不对称分布资料的特征 例试求下列频数表数据的四分位数间距 三 方差 variance 方差 variance 也称均方差 meansquaredeviation 样本观察值的离均差平方和的均值 表示一组数据的平均离散情况 方差 variance 方差越大 观察值的变异就越大适用条件 对称分布 正态分布特点 它反映的是所有观察值的变异情况单位 原变量单位的平方 四 标准差 standarddeviation 标准差 standarddeviation 即方差的正平方根 其单位与原变量X的单位相同 计算直接法 加权法 频数表 例利用下表中的数据和频数表法计算标准差 N f fX fX2 标准差 适用条件 对称分布 正态分布资料意义 全面反映了一组观察值的变异程度 越大说明围绕均数越离散 反之说明较集中在均数周围 均数代表性越好 应用 表示变量值的离散程度 均数相近 度量衡单位相同的条件下 标准差越大则变异程度越大 结合均数描述正态分布特征计算变异系数 标准误 标准差 例三组同龄男孩的身高值 cm RS甲组9095100105110100207 91乙组969810010210410083 16丙组969910010110410082 92标准差的意义 反映一组变量值平均相差的水平 单位相同时 S越小 表示数据的变异程度越小 同时表示该组均数的代表性越大 五 变异系数 coefficientofvariation 描述相对离散程度的指标符号 CV 没有单位 计算 适用条件 观察指标单位不同 如身高 体重 同单位资料 但均数相差悬殊 变异系数的两个特点及相应的用途 没有单位反映标准差占均数的百分比或标准差是均数的几倍可用来比较度量衡单位不同的资料的变异度不受平均水平的影响反映的是以均数为基数的相对变异的大小比较均数相差悬殊的资料的变异度 1 单位不同时组间变异程度的比较 某地7岁年龄组男童身高与体重指标SCV 身高 cm 123 104 713 83体重 kg 22 292 2610 14结论 7岁年龄组男童身高与体重值指标比较 体重指标的变异大于身高指标 2 比较组单位相同 但均数相差悬殊的组间变异程度比较 某地不同年龄组男童身高 cm 年龄组SCV 1 2月56 32 13 735 6月66 52 23 313 3 5岁96 13 13 225 5 5岁107 83 33 06结论 随着年龄增加 身高的变异变小 绝对变异受平均水平的影响相对变异排除了平均水平的影响 例通过十省调查得知 农村刚满周岁的女童体重均数为8 42kg 标准差为0 98kg 身高均数为72 4cm 标准差为3 0cm 试计算周岁女童身高与体重的变异系数 变异指标小结 极差较粗 适合于任何分布标准差与均数的单位相同 最常用 适合于近似正态分布变异系数主要用于单位不同或均数相差悬殊资料均数和标准差描述正态分布资料的特征中位数和四分位数间距描述偏态分布资料的特征 平均数与变异度的关系 平均数表示的集中性变异度表示的离散性变异度越小 平均数对各变量值的代表性越好变异度越大 平均数对各变量值的代表性越差 正确应用 1 算数均数 适用于单峰对称分布资料 几何均数 适合于作对数变换后单峰对称分布资料 中位数和百分位数 适用于任何分布的资料 中位数和百分位数在样本含量较少时不稳定 越靠两端越不稳定 中位数在抗极端值的影响方面 比均数具有较好的稳定性 但不如均数精确 因此 当资料适合计算均数或几何均数时 不宜用中位数表示其平均水平 不同质的资料应考虑分别计算平均数 正确应用 2 标准差的基本内容是离均差 它显示一组变量值与其均数的间距 故标准差直接地 总结地 平均地描述了变量值的离散程度 在同质的前提下 标准差大表示变量值的离散程度大 即变量值的分布分散 不整齐 波动较大 反之 标准差小表示变量值的离散程度小 即变量值的分布集中 整齐 波动较小 变异系数派生于标准差 其应用价值在于排除了平均水平的影响 并消除了单位 1 为了解定量变量的分布规律 可编制频数表并绘制频数分布 或频率分布 图 用于描述资料的分布特征 集中趋势与离散趋势 以及分布类型 对称或偏峰 2 描述性统计量可以用来定量地刻画统计分布的特征 常用的描述性统计量有三类 描述集中趋势的算术均数 几何均数 中位数 描述离散趋势的极差 四分位数间距 方差 标准差和变异系数 描述分布类型的偏度系数与峰度系数 3 百分位数是一种位置参数 既可用来描述集中趋势 P50 又可用来描述离散趋势 P75 P25 可用于各种连续型分布 小结 计量资料的统计描述小结 1 在医学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论