统计学第四章.ppt_第1页
统计学第四章.ppt_第2页
统计学第四章.ppt_第3页
统计学第四章.ppt_第4页
统计学第四章.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章数据的描述性分析 集中趋势的描述 一 数值平均数1 算术平均数2 调和平均数3 几何平均数 第一节集中趋势的描述 二 位置平均数1 中位数2 众数 对比 离散程度的描述 一 绝对指标1 极差与四分位差2 平均差3 标准差与方差二 相对指标 离散系数 第二节离散程度的描述 数据标准化 是非标志标准差 分布的偏态与峰度 一 原点矩二 中心矩 第三节分布的偏态与峰度 三 分布的偏态四 分布的峰度 集中趋势 集中趋势反映的是一组数据向某一中心值靠拢的倾向 在中心附近的数据数目较多 而远离中心的较少 对集中趋势进行描述就是寻找数据一般水平的中心值或代表值 算术平均数 算术平均数是总体中各个体的某个数量标志的总和与个体总数的比值 一般用符号表示 简单算术平均数 加权算术平均数 算术平均数的数学性质 简单算术平均数 加权算术平均数 权数 算术平均数的数学性质 权数 次数f的作用 当变量值比较大的次数多时 平均数就接近于变量值大的一方 当变量值比较小的次数多时 平均数就接近于变量值小的一方 可见 次数对变量值在平均数中的影响起着某种权衡轻重的作用 因此被称为权数 权数 次数f的作用 当变量值比较大的次数多时 平均数就接近于变量值大的一方 当变量值比较小的次数多时 平均数就接近于变量值小的一方 可见 次数对变量值在平均数中的影响起着某种权衡轻重的作用 因此被称为权数 调和平均数 调和平均数 Harmonicmean 是各变量值倒数的算术平均数的倒数 由于它是根据变量值倒数计算的 所以又称作倒数平均数 通常用表示 简单调和平均数 加权调和平均数 调和平均数是算术平均数的变形 简单调和平均数 加权调和平均数 调和平均数是算术平均数的变形 设 为n个正数时 对如下的平均不等式 当且仅当时等号成立 几何平均数 几何平均数是n个变量值连乘积的n次方根 几何平均数是计算平均比率和平均速度最适用的一种方法 通常用表示 简单几何平均数 加权几何平均数 几何平均数多用于计算平均比率和平均速度 如 平均利率 平均发展速度 平均合格率等 简单几何平均数 加权几何平均数 注意 不能直接平均增长速度 中位数 中位数是一组数据按大小顺序排列后 处于中间位置的那个变量值 通常用Me表示 其定义表明 中位数就是将某变量的全部数据均等地分为两半的那个变量值 一半数值小于中位数 另一半数值大于中位数 中位数是一个位置代表值 因此它不受极端变量值的影响 由未分组数据确定中位数 由单项数列确定中位数 由组距数列确定中位数 分位数 由未分组数据确定中位数 对未分组数据资料 需先将各变量值按大小顺序排列 并按公式确定中位数的位置 当一个序列中的项数为奇数时 则处于序列中间位置的变量值就是中位数 例 7 6 8 2 3当一个序列的项数是偶数时 则应取中间两个数的中点值作为中位数 即取中间两个变量值的平均数为中位数 例 2 5 7 8 11 12 由单项数列确定中位数 先计算各组的累计次数 再按公式确定中位数的位置 并对照累计次数确定中位数 由组距数列确定中位数 下限公式 上限公式 分位数 三个数值可以将变量数列划分为项数相等的四部分 这三个数值就定义为四分位数 十分位数和百分位数分别是将变量数列十等分和一百等分的数值 众数 众数是一组数据中出现次数最多的那个变量值 通常用M0表示 由未分组数据确定众数 由单项数列确定众数 由组距数列确定众数 由未分组数据确定众数 例1 7 6 8 2 3例2 7 6 8 2 3 4 3 2 3例3 7 6 8 2 3 4 3 2 3 2 由单项数列确定众数 由组距数列确定众数 下限公式 上限公式 L 众数所在组下限 U 众数所在组上限 对比 1 众数 中位数和算术平均数的关系 2 众数 中位数和算术平均数的特点与应用场合 极差与四分位差 极差也叫全距 是一组数据的最大值与最小值之离差 即 四分位差是指第三四分位数与第一四分位数之差 也称为内距或四分间距 计算公式为 平均差 平均差也称平均离差 是各变量值与其平均数离差绝对值的平均数 通常用MD表示 简单式平均差 加权式平均差 简单式平均差 加权式平均差 标准差与方差 标准差又称均方差 它是各单位变量值与其平均数离差平方的平均数的方根 通常用 表示 它是测度数据离散程度的最主要方法 方差是各变量值与其算术平均数离差平方和的平均数 即是标准差的平方 用 2表示总体的方差 用S2表示样本的方差 总体与样本标准差 简单式标准差 加权式标准差 简单式标准差 加权式标准差 总体与样本标准差 简单式 加权式 总体 样本 数据标准化 标准化数值是变量值与其平均数的离差除以标准差后的值 也称为z分数或标准分数 设标准化数值为z 则有 离散系数 对于平均数不等或计量单位不同的不同组别的变量值 是不能直接用离散程度的绝对指标比较其离散程度的 为了消除变量平均数不等和计量单位不同对离散程度测度值的影响 需要计算离散程度的相对指标 即离散系数 其一般公式是 总方差 组内方差和组间方差 例 某车间有16个工人分成三组 某日生产零件数如表4 8 分别计算各组的平均数与方差 计算组内方差 组间方差和总方差 并验证三者之间的数量关系 原点矩 一般式 一阶原点矩 中心矩 一般式 二阶中心矩 偏态 偏态是对分布偏斜方向和程度的测度 变量分组后 总体中各个体在不同的分组变量值下分布并不均匀对称 而呈现出偏斜的分布状况 统计上将其称为偏态分布 例题 例题 峰度 峰度是分布集中趋势高峰的形状 在变量数列的分布特征中 常常以正态分布为标准 观察变量数列分布曲线顶峰的尖平程度 统计上称之为峰度 例题 例题 作业 1 已知某市工业总产值 年至 年年增长速度分别为 和 则这五年的平均增长速度为 2 已

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论