统计数据的描述统计学第三版.ppt_第1页
统计数据的描述统计学第三版.ppt_第2页
统计数据的描述统计学第三版.ppt_第3页
统计数据的描述统计学第三版.ppt_第4页
统计数据的描述统计学第三版.ppt_第5页
已阅读5页,还剩133页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2 1统计数据的整理 2 1 1统计数据的分组 统计整理根据统计研究目的和要求 对统计调查取得的资料进行科学的分类 汇总 以反映现象总体数量特征和规律 统计分组 指根据统计研究的目的 采用标志 将总体划分为若干个组成部分 某班学生按性别分组表 2 1统计数据的整理 2 1 1统计数据的分组 统计分组 指根据统计研究的目的 采用标志 将总体划分为若干个组成部分 某班学生按年龄分组 统计分组 按照统计研究目的 将数据分别列入不同的组 根据统计分组标志表现形式不同 统计分组分为按品质标志分组和按数量标志分组 2 1统计数据的整理 2 1 2次数分配 按数量标志分组 反映总体单位在各组中分布状况的统计资料 称为次数分配 次数分配 1 次数分配概念 2 1统计数据的整理 某班学生按年龄分组 2 1 2次数分配 2 1统计数据的整理 乡镇按人均纯收入分组 2 1 2次数分配 2 1统计数据的整理 某班学生按年龄分组 2 1 2次数分配 单项式次数分配 即每个组只用一个变量值来表示的次数分配 2 次数分配的种类 分为 单项式次数分配和组距式次数分配 2 1统计数据的整理 2 1 2次数分配 组距式次数分配 即每组以变量值的一定范围表示的次数分配 分组标志是连续变量必须编制组距式次数分配 分组变量为离散变量但变量值表现的形式较多 变动范围较大时 也要编制组距式次数分配 学生按考试成绩分组表 也是组距式次数分配 2 次数分配的种类 组限 是用来表示各组之间界限的变量值 各组两端的数值 上限 每组终点的数值 下限 每组起点的数值 组距 是一组变量值的区间长度组距 上限 下限 开口组以相邻组的组距作为该组的组距 注意 3 组距式次数分配的一些概念 组中值 即上限 下限之间的中点数值 各组变量值的代表性水平 3 组距式次数分配的一些概念 60 70 60 2 90 90 80 2 某地区100个百货商店月销售额与流通费用情况 计算 各组的组中值 简单次数分布表的编制 4 次数分配的编制 总体的分布的表现形式 次数分布表 次数分布图 简单次数分布表累计次数分布表 例 某车间30名工人每周加工零件数的资料如下 单位 件 编制等距的次数分配 简单次数分布表的编制 第1步 确定全距 全距 最大变量值 最小变量值 128 84 44 第2步 确定组数或组距 组距 全距 组数 44 5 8 8件 可选与8 8件较接近的整数 最好是5或10的倍数 我们选10件 简单次数分布表的编制 第3步 确定组限第一组下限要低于最小变量值 最大组上限要高于最大变量值 组限最好是5和10的倍数 本例第一组的下限可选80件 对于离散变量 可采用重叠组限 也可采用不重叠组限 对于连续变量 相邻组组限必须重叠 符合 上组限不在本组内原则 第4步 分组 统计出各组的次数或频率 某车间30名工人周加工零件数频数分布 5 用表格的形式呈现编制的次数分配 该表格称简单次数分布表 它反映了总体分布的状况 等距数列次数分布图的绘制方法 第一步 建立平面直角系 用轴表示变量值 轴表示次数 在轴上标出各组的组限 第二步 以各组的组距为宽 以各组的次数为高作矩形 形成的图形就是柱形图也称直方图 为了让图形美观 一般将矩形画的窄一些 但应注意 每个矩形的宽要一致 各矩形底边的中点要等于各组的组中值 在平面直角坐标系中找到每组的组中值和次数所确定的点 用直线将各点连接后所形成的图形就是折线图也称曲线图 简单次数分布图的绘制 简单次数分布图的绘制 简单次数分布图的绘制 常见的次数分布曲线的类型 向下累计从变量值低的组向变量值高的组逐组累计变量值出现的次数 频率 各组的累计次数 频率 说明该组上限以下的变量值出现次数 频率 累计次数分布表的编制 向下累计从变量值低的组向变量值高的组逐组累计变量值出现的次数 频率 各组的累计次数 频率 说明该组上限以下的变量值出现次数 频率 累计次数分布表的编制 练习 计算累计次数和累计频率 2 1统计数据的整理 2 1 4洛伦茨曲线与基尼系数 罗伦茨曲线是20世纪初美国经济学家 统计家洛伦茨绘制的描述收入和财富分配性质的曲线 2 1统计数据的整理 2 1 4洛伦茨曲线与基尼系数 2 1统计数据的整理 2 1 4洛伦茨曲线与基尼系数 基尼系数 在全部居民收入中 用于进行不平均收入的部分占总收入的百分比 该指标可客观地检测居民之间贫富两级分化的程度 0 4是 警戒线 位置平均数 均值切尾均值 中位数分位数 数值平均数 2 2分布集中趋势的测度 分布集中趋势的测度 平均指标 众数 几何平均数 反映的是一组数据的一般水平的代表值或数据分布的中心值 未经过整理的资料 例 10名学生的考试成绩为 50分 60分 65分 70分 75分 78分 78分 78分 78分 90分 计算集中趋势测度指标常见的资料 计算集中趋势测度指标常见的资料 单项式次数分配 计算集中趋势测度指标常见的资料 组距式次数分配 2 2分布集中趋势的测度 2 1 1众数 1 众数的概念 2 计算公式 重点掌握组距式次数分配众数的计算 3 已知分布曲线确定众数的位置 2 2分布集中趋势的测度 2 1 1众数 众数 mode 是将数据按大小顺序排队形成次数分布后 在统计分布中具有明显集中趋势的数值 用表示 例 10名学生的考试成绩为50分 60分 65分 70分 75分 78分 78分 78分 78分 90分 是总体中出现次数最多的变量值 计算集中趋势测度指标常见的资料 单项式次数分配 2 2分布集中趋势的测度 2 1 1众数 式中 表示众数组的下限 表示众数组次数与其前一组次数之差 表示众数组次数与其后一组次数之差 表示众数组的组距 例 职工按月收入分组资料如下 求月收入的众数 1 确定众数组 2 公式计算众数 例 节能灯泡的使用时数资料如下表所示 计算使用时数的众数 2 2分布集中趋势的测度 2 1 1众数 五名学生的月生活费分别为440元 480元 520元 600元 750元 例 是数据排序后 位置在最中间的数值 用表示 2 2 2中位数 特点 不受极端数值的影响 在变量值差异很大时 具有较强的代表性 中位数 median 2011年国民经济和社会发展统计公报 首次公布了城乡居民收入中位数 2011年 农村居民人均纯收入中位数为6194元 人均纯收入6977元 城镇居民人均可支配收入中位数为19118元 城镇居民人均总收入23979元 中位数 张村有个张千万 隔壁九个穷光蛋 平均起来算一算 人人都是张百万 人均收入中位数是指将所有被调查户按人均收入水平从低到高顺序排列 处于最中间位置的被调查户的人均收入 居民收入通常呈偏态分布 人均收入中位数一般都低于人均收入平均数 1 根据未分组资料 原始资料 确定中位数 1 先把总体各变量值按大小顺序排列 2 确定中位数的位置和中位数 求中位数的方法 例 某售货小组5个人 某天的销售额按从小到大的顺序排列为440元 480元 520元 600元 750元 求中位数 所以 中位数是第3个变量值 因为 变量值的项数是奇数 具体方法为 当标志值的项数为奇数项时 中位数是第 n 1 2个变量值 n为变量值的项数 求中位数的方法 当标志值的项数为偶数项时 中位数等于第个和第个标志值的算术平均数 例 8名工人的日产量为21件 23件 24件 26件 27件 29件 30件 33件 2 根据分组资料 组距数列 确定中位数 式中 表示中位数 表示中位数所在组的下限 表示中位数所在的组以前各组次数之和 中位数所在组的次数 中位数所在的位置 中位数所在组的组距 1 确定中位数的位置和组 2 根据分组资料 组距数列 确定中位数 确定中位数的位置和组 2 根据分组资料 组距数列 确定中位数 中位数 是将总体所有的变量值排序 等分为k各部分的数值 2 2 3分位数 k分位数 K分位数共有k 1个 四分位数 是将总体所有的变量值排序 等分为四个部分的三个数值 记为 计算表2 6中30名工人周加工零件数的四分位数 2 2 3分位数 2 2分布集中趋势的测度 2 2 7众数 中位数和均值的关系 2 2 4均值 均值 mean 即算术平均数 算术平均数是总体各单位的变量值之和 标志总量 与总体单位数的比值 例 6名学生的月生活费总额是4200元 平均月生活费为 根据掌握握的资料变形为 简单算术平均数 加权算术平均数 2 2 4均值 未经过整理的资料 例 10名学生的考试成绩为 50分 60分 65分 70分 75分 78分 78分 78分 78分 90分 计算集中趋势测度指标常见的资料 计算集中趋势测度指标常见的资料 单项式次数分配 工人按周加工零件数分组资料 工人按周加工零件数分组资料 2 2 4均值 2 2 4均值 简单算术平均数 适用于总体资料经过分组整理形成次数分配的情况 工人的日产量分组资料计算平均日产量 第四章静态分析指标 梁前德主编基础统计2010年3 7月使用 加权算术平均数 1 算术平均数 加权算术平均数 工人的日产量分组资料计算平均日产量 工人按周加工零件数分组资料 工人按周加工零件数分组资料 2 2 4均值 工人按周加工零件数分组资料 2 2 4均值 工人按周加工零件数分组资料 2 2 4均值 工人的日产量分组资料计算平均日产量 加权算术平均数 加权算术平均数 计算平均收入 组中值 权数 指次数分配中各组变量值出现的次数 频率 权数 权数 加权算术平均数 61 99 80 决定平均数的变动范围 起到权衡轻重的作用 决定平均数的变动范围 起到权衡轻重的作用 均值的性质 2 2分布集中趋势的测度 2 2 6切尾均值 切尾均值是将数值排序后 去掉大小两端的若干个数值后计算中间数值的均值 2 2分布集中趋势的测度 2 2 6切尾均值 分布离散程度测度的概念 使用时数 小时 甲品牌 3000 4000 5000 6000 7000乙品牌 4998 4999 5000 5001 5002 2 3分布离散程度的测度 反映的是分布离散和差异的程度 总体各单位变量值之间差异程度的大小 也称标志变动度 两个品牌的节能灯泡各抽出5只进行使用时数测定资料如下 那个品牌的质量更稳定 研究两组变量值的差异程度 级差 内距 标准差方差 离散系数 分布离散程度的测度 测定分布离散程度的无名数 2 3分布离散程度的测度 测定分布离散程度的有名数 测定分布离散程度常见的统计资料 工人的日产量分组资料 工人的日产量分组资料 测定分布离散程度常见的统计资料 工人按周加工零件数分组资料 工人按周加工零件数分组资料 测定分布离散程度常见的统计资料 2 3分布离散程度的测度 2 3 1极差 极差 range 也称全距 是数据中的最大值与最小值之差 最低组假定下限 最高组的假定上限 内距是两个四分位数之差 2 3分布离散程度的测度 2 3 2内距 2 3分布离散程度的测度 2 3 3方差和标准差 方差是离差平方的平均数 总体的方差用表示 样本的方差用表示 标准差是方差的算术平方根 总体的标准差用表示 样本的标准差用表示 式中 表示各组的变量值或各组的组中值 表示各组的次数 总体五名学生的成绩 单位 分 为50 60 70 80 90 2 3分布离散程度的测度 2 3 3方差和标准差 例 计算总体成绩的标准差 计算总体的方差 工人的日产量分组资料 工人的日产量分组资料 计算总体的方差 2 3 3方差和标准差 计算样本的方差 总体五名学生的成绩 单位 分 为50 60 70 80 90 表2 7计算样本周加工零件数的标准差 练习 计算以下样本月产量的标准差 十棵向日葵的高度 米 0 80 91 11 21 21 31 51 51 71 8 十棵树木的高度 米 29 529 629 829 929 93030 230 230 430 5 两组变量值 数值 的绝对水平不同 均值不同 不能用比较平均数的代表性和变量值的差异 离散 程度 2 3 4离散系数 离散系数是用来对两组数据的差异程度进行相对比较的测度 是标准差与其算术平均数的比值 2 3 4离散系数 例 甲组 样本 运动员的平均身高为184厘米 标准差为8厘米 乙组 样本 运动员按身高分组资料如表所示 比较两组运动员身高的差异程度 乙组运动员按身高分组资料 2 3 4离散系数 乙组运动员相关资料计算表 2 3 4离散系数 乙组运动员相关资料计算表 2 3 4离散系数 甲组运动员的离散系数系数 乙组运动员的离散系数系数 计算结果表明 因此 甲组运动员比乙组运动员差异大 2 3 4离散系数 2 4分布偏态与峰度的测度 2 4 1偏态及其测度 偏态是对分布偏斜方向及程度的测度 2 4分布偏态与峰度的测度 2 4 1偏态及其测度 峰度是对平峰或尖峰程度的测度 2 4分布偏态与峰度 2 4 2峰度及其测度 例 某车间30名工人每周加工零件数的资料如下 单位 件 计算中位数 下四分位数和上四分位数 统计表是显示统计数据的表格 2 5统计表与统计图 2 5 1统计表 表头 行标题 资料来源 国家统计局数据库 附加 表12011年末我国人口数及相关资料 列标题 数字资料 指标数值 统计表是显示统计数据的表格 2 5统计表与统计图 2 5 1统计表 设计统计表要注意以下几点 1 合理安排统计表的结构 2 表头要包括表号 总标题和表中数据的单位等 总标题应简明确切的概括统计表的内容 统计数据的时间 地点及何种数据 3 表中的统计数字 书写时要求数位要上下对齐 表中数字暂缺时用 表示 不应填写数字的空格用 表示 指标数值与邻项的指标数值相同时 应填写数值不得用 同上 同下 等字样表示 4 统计表中的统计指标要注明计量单位 如果所有数据都是同一个计量单位 可以在表的右上角表明 5 表的上下两端用粗线 左右两端一般不封口 采用开口式 纵栏用细线分开 横行之间可以不加线 6 统计表的资料来源及其他要说明的问题 可在表下注明 统计图是显示统计数据的图形 2 5统计表与统计图 2 5 2统计图 1 茎叶图 例 某车间30名工人每周加工零件数的资料如下 单位 件 编制等距的次数分配 统计图是显示统计数据的图形 2 5统计表与统计图 2 5 2统计图 1 茎叶图 统计图是显示统计数据的图形 2 5统计表与统计图 2 5 2统计图 1 箱线图 由一组数据的最大值 最小值 中位数和两个四分位数5个特征值绘制而成的 反映原始数据分布的图形 称为箱线图 几种重要分布的箱线图 1 箱线图 统计图是显示统计数据的图形 2 5统计表与统计图 2 5 2统计图 2 5 2统计图 1 箱线图 2 5 2统计图 1 箱线图 2 5 2统计图 1 箱线图 可比 可比 是非标志总体 为研究是非标志总体的数量特征 令 性别 男 女 非男 产品质量 合格 不合格 10 10 是非标志总体的指标 具有某种标志表现的单位数所占的成数 不具有某种标志表现的单位数所占的成数 是非标志总体的指标 平均数 标准差 是非标志总体的指标 方差 标准差系数 例 某厂某月份生产了400件产品 其中合格品380件 不合格品20件 求产品质量分布的集中趋势与离中趋势 是非标志总体的指标 解 加权算术平均数 例 某车间某日工人的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论