《统计学》-单薇主编-第3章 数据特征的度量.ppt_第1页
《统计学》-单薇主编-第3章 数据特征的度量.ppt_第2页
《统计学》-单薇主编-第3章 数据特征的度量.ppt_第3页
《统计学》-单薇主编-第3章 数据特征的度量.ppt_第4页
《统计学》-单薇主编-第3章 数据特征的度量.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章数据特征的度量 3 1数据集中程度的度量3 2数据离散程度的度量3 3数据分布的偏度与峰度的度量3 4SPSS在描述统计中应用 描述统计与数据分布特征的测度本章小结 学习目标 掌握集中趋势测度方法及意义掌握离散趋势测度方法及意义了解偏态与峰度的测度方法及意义 数据集中程度的度量 数据集中程度的度量反映的是数据一般水平的代表值或者数据分布的中心值 从不同的角度考虑 集中程度的测度值有多个 我们将一一介绍 3 1 1均值3 1 2调和平均数3 1 3几何平均数3 1 4中位数3 1 5分位数3 1 6众数3 1 7众数 中位数和均值的关系 3 1数据集中程度的度量 3 1 1均值 mean 集中程度的最常用测度值一组数据的均衡点所在易受极端值的影响用于数值型数据 不能用于分类数据和顺序数据 简单均值 simplemean 设一组数据为 x1 x2 xn 总体均值 样本均值 加权均值 weightedmean 设一组数据为 x1 x2 xk相应的频数为 f1 f2 fk 总体均值 样本均值 均值 数学性质 1 各变量值与均值的离差之和等于零 2 各变量值与均值的离差平方和最小 3 1 2调和平均数 Harmonicmean 1 集中程度的测度值之一 又称为倒数平均数2 易受极端值的影响3 常用于特定数据的计算 计算公式 设一组数据为 x1 x2 xn 调和平均数例题 Harmonicmean 3 1 3几何平均数 geometricmean n个变量值乘积的n次方根适用于对比率数据的平均主要用于计算平均增长率 计算公式 设一组数据为 x1 x2 xn 几何平均数 例题分析 例 一位投资者购持有一种股票 在2000年 2001年 2002年和2003年收益率分别为4 5 2 1 25 5 1 9 计算该投资者在这四年内的平均收益率 3 1 4中位数 median 排序后处于中间位置上的值 不受极端值的影响主要用于顺序数据 也可用数值型数据 但不能用于分类数据各变量值与中位数的离差绝对值之和最小 即 中位数 位置的确定 未分组数据 分组数据 数值型数据的中位数 5个数据算例 例 5个工人日产量原始数据 38549排序 34589 中位数 5 位置 数值型数据的中位数 6个数据的算例 例 6个工人日产量原始数据 3854911排序 3458911 中位数 位置 分组数据的中位数公式 N 2表示中位数所在位置 L表示中位数所在组的下组限 Sm 1表示中位数所在组以前各组的累积次数 fm表示中位数所在组的次数 i表示中位数所在组的组距 分组数据中位数例题 3 1 5分位数 中位数是将统计分布从中间分成面积 即数据个数 相等的两部分 与中位数性质相似的还有四分位数 quartile 十分位数 decile 和百分位数 percentile 显然 四分位数就是将数据分布4等分的三个数值 其中中间的四分位数就是中位数 十分位数和百分位数分别是将数据分布10等分和100等分的数值 四分位数 quartile 排序后处于25 和75 位置上的值 不受极端值的影响主要用于顺序数据 也可用于数值型数据 但不能用于分类数据 四分位数 位置的确定 未分组数据 分组数据 数值型数据的四分位数 11个数据的算例 数值型数据的四分位数 12个数据的算例 3 1 6众数 mode 一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据 也可用于顺序数据和数值型数据 众数 不惟一性 无众数原始数据 10591268 一个众数原始数据 659855 多于一个众数原始数据 252828364242 分组数据的众数的计算公式 表示众数 L表示众数所在组的下组限 分别表示众数组次数与前一组次数之差和与后一组次数之差i表示众数组的组距 分组数据众数例题 众数 中位数和均值的关系 众数 中位数 均值的特点和应用 众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用 3 2 1极差3 2 2内距3 2 3方差和标准差3 2 4离散系数 3 2数据离散程度的度量 3 2 1极差 range 一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布 R max xi min xi 计算公式为 3 2 2内距 Inter QuartileRange IQR 也称四分位差上四分位数与下四分位数之差内距 Q3 Q1反映了中间50 数据的离散程度不受极端值的影响可用于衡量中位数的代表性 3 2 3标准差和方差 VarianceandStandarddeviation 1 离散程度的主要测度值2 最常用的测度值3 反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的 称为总体方差或标准差 根据样本数据计算的 称为样本方差或标准差 总体方差和标准差 PopulationvarianceandStandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 样本方差和标准差 simplevarianceandstandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 样本方差自由度 degreeoffreedom 一组数据中可以自由取值的数据的个数当样本数据的个数为n时 若样本均值 x确定后 只有n 1个数据可以自由取值 其中必有一个数据则不能自由取值例如 样本有3个数值 即x1 2 x2 4 x3 9 则 x 5 当 x 5确定后 x1 x2和x3有两个数据可以自由取值 另一个则不能自由取值 比如x1 6 x2 7 那么x3则必然取2 而不能取其他值样本方差用自由度去除 其原因可从多方面解释 从实际应用角度看 在抽样估计中 当用样本方差去估计总体方差 2时 它是 2的无偏估计量 样本标准差计算例题 3 2 4离散系数 coefficientofvariation 1 标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响4 用于对不同组别数据离散程度的比较5 计算公式为 离散系数 例题分析 结论 计算结果表明v1 v2 说明金融专业的同学成绩分布比较均匀 平均成绩的代表性更强 3 3数据分布偏度和峰度的度量 通过计算偏度和峰度系数可以全面了解数据分布的形状偏度 数据分布偏斜方向和程度峰度 数据分布的尖峭程度 1 偏度的计算 当sk 0时 分布对称当sk 0时 分布右偏当sk 0时 分布左偏 3 3 1偏度 2 偏度的判别 偏度峰度计算例题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论