




已阅读5页,还剩72页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章数据的描述统计分析 1 学习完本章 你将具有下列能力 1 能用字符型变量作频数分布表和图形2 能用数值型变量分组 数据频数分布表3 能用Excel软件作统计图4 能用统计指标 数据的预处理 数据的审核数据筛选数据排序 数据的审核 数据的审核 1 原始数据的审核 2 二手数据的审核 数据审核 原始数据 rawdata 审核的内容完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全准确性审核检查数据是否真实反映客观实际情况 内容是否符合实际检查数据是否有错误 计算是否正确等 数据的审核 二手数据 secondhanddata 适用性审核弄清楚数据的来源 数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要时效性审核尽可能使用最新的数据确认是否有必要做进一步的加工整理 数据筛选 datafilter 当数据中的错误不能予以纠正 或者有些数据不符合调查的要求而又无法弥补时 需要对数据进行筛选数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来 而不符合特定条件的数据予以剔除 数据排序 数据排序是按一定顺序将数据排列 以便研究者通过浏览数据发现一些明显的特征或趋势 找到解决问题的线索 数据排序 升序降序 数据透视表 为了从复杂的数据中提取信息 可利用EXCEL提供的数据透视表功能和MARKWAY提供的频数分析工具 按要求进行汇总和作图 描述统计的频数分布 频数分布 对调查所搜集到的个体数据资料进行分组 汇总 编频数分布表 作图 使数据表述条理化 系统化 描述统计意义 1 从个体数据得到描述总体的数据2 为深入统计分析提供数据基础 频数分布的分析方法 分组 汇总 编表 比较分析 分组 分组前 分组后 25 33 42 1 划分现象类型 作用 分组方法 字符型变量分组 数值型变量分组 频数分布 第一节字符型变量描述分析 字符型变量 定性变量 可分为定类和定序 顺序数据 两类 统计分析方法相同 分析步骤 1 分组2 各组汇总得到频数和频率3 作条形图和饼图 2001年我国人口性别分组 组别 频数 频率 频数分布 分类数据 可计算的统计量 频数 frequency 落在各类别中的数据个数比例 proportion 某一类别数据占全部数据的比值百分比 percentage 将对比的基数作为100而计算的比值比率 ratio 不同类别数值的比值 频数分布 分布数列 反映总体单位在各组的分布状态 基本形式 分组 单位数 频率 合计 100 频数分布 频率分布 字符型数据分类结果 称为频数分布表 全国城乡人口变化比较 分类数据的图示 条形图 barchart 用宽度相同的条形的高度或长短来表示各类别数据的图形主要用于反映分类数据的频数分布绘制时 各类别可以放在纵轴 称为条形图 也可以放在横轴 称为柱形图 columnchart 字符型数据分类条形图 全国城乡人口比例变化比较 分类数据的图示 饼图 piechart 也称圆形图 是用圆形及圆内扇形的角度来表示数值大小的图形主要用于表示样本或总体中各组成部分所占的比例 用于研究结构性问题绘制圆形图时 样本或总体中各部分所占的百分比用圆内的各个扇形角度表示 这些扇形的中心角度 按各部分数据百分比占3600的相应比例确定 分类数据的图示 饼图 饼图 分布的图形表示 2001年我国人口性别分组 组别 频数 频率 频数分布 分类数据的图示 帕雷托图 Paretochart 按各类别数据出现的频数多少排序后绘制的柱形图主要用于字符型分类数据的分布 两个分类变量的分组 称为列联表 列联表 交叉表 交叉表用于表示两个用文字表示的品质变量之间的关系 用于市场研究 进行市场机会 市场细分分析等 例该公司市场部经理希望根据上例中的调查结果 确认不同性别的用户 其移动电话类型偏好是否存在着不同 打开 第2章数据整理 xls 工作簿 选定 移动电话调查 工作表 从 数据 菜单中选择 数据透视表和图表报告 选项 得到 数据透视表对话框 窗口 在第1步之中选择 数据清单或数据库 与 数据透视表 单击 下一步 按钮 在第2步中 确定数据区域A1 D1001 单击 下一步 按钮 在第3步中 确定数据透视表的位置 如图所示 但将其位置调整到 H1 单元格 然后 单击 版式 按钮 打开 版式 对话框如图所示 EXCEL数据排序 1 输入数据P22到A1 A502 排序升序 分组方法 分组方法 单变量值分组 要点 1 将一个变量值作为一组2 适合于离散变量3 适合于变量值较少的情况 组距分组 要点 将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循 不重不漏 的原则可采用等距分组 也可采用不等距分组 组距分组 步骤 确定组数 组数的确定应以能够显示数据的分布特征和规律为目的 在实际分组时 可以按Sturges提出的经验公式来确定组数K 确定组距 组距 ClassWidth 是一个组的上限与下限之差 可根据全部数据的最大值和最小值及所分的组数来确定 即组距 最大值 最小值 组数 统计出各组的频数并整理成频数分布表 组距分组 几个概念 1 下限 lowlimit 一个组的最小值2 上限 upperlimit 一个组的最大值3 组距 classwidth 上限与下限之差4 组中值 classmidpoint 下限与上限之间的中点值 开口组的概念 开口组组限为多少以上如 2500元以上组限为多少以下如 60分以下当数据中的最大和最小值与其它数据本差悬殊时 为避免出现空白组 开口组以它相邻的组距作为其组距 开口组的概念 频数分布表的编制 例题分析 例 某电脑公司2002年前四个月各天的销售量数据 单位 台 试对数据进行分组 频数分布表的编制 步骤 确定组数 根据Sturges提出的经验公式得组数K为 确定各组的组距 组距 237 141 10 9 6 10 用Excel制作频数分布表 等距分组表 上下组限重叠 等距分组表 上下组限间断 等距分组表 使用开口组 组距分组与不等距分组 在表现频数分布上的差异 等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度 频数密度 频数 组距 反映频数分布的实际状况 数值型数据的图示 分组数据 直方图和折线图 下面是调查的学生成绩 9584758390776282857776866583788498858672907887888987718583609195748088739785857092828093799687868988 从一堆杂乱的数据中看不出什么信息 因此需要分组 数值型数据分组 1 多个变量用聚类分组法2 一个变量分组 1 标准化法 2 等距法 主观分组法 客观分组法 根据专业知识确定分组的组限 根据数据确定组限 特点 适用面广 宜进行纵向 横向比较 主观法 专业知识分组 优点 1 可以长期运用 利于比较 2 运用专业知识分组 宜于分析合理 如 考试成绩多用10分一组 数值型数据分组结果 频数分布表 直方图 分布的图形表示 选工具栏中的 数据分析 在 数据分析 中选 直方图 所得到的是分组频数 问题 为什么与教材P23表中数据不同 问题 为什么改动分组限后得到的频数与教材相同 分组数据 直方图 histogram 用矩形的宽度和高度来表示频数分布的图形 实际上是用矩形的面积来表示各组的频数分布在直角坐标中 用横轴表示数据分组 纵轴表示频数或频率 各组与相应的频数就形成了一个矩形 即直方图直方图下的总面积等于1 分组数据的图示 直方图的绘制 某电脑公司销售量分布的直方图 我一眼就看出来了 销售量在170 180之间的天数最多 分组数据 折线图 frequencypolygon 折线图也称频数多边形图是在直方图的基础上 把直方图顶部的中点 组中值 用直线连接起来 再把原来的直方图抹掉折线图的两个终点要与横轴相交 具体的做法是第一个矩形的顶部中点通过竖边中点 即该组频数一半的位置 连接到横轴 最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等 二者所表示的频数分布是一致的 分组数据的图示 折线图的绘制 折线图与直方图下的面积相等1 140 150 210 某电脑公司销售量分布的折线图 190 200 180 160 170 220 230 240 折线图折线图 把直方图的顶部中点用直线连接起来就是折线图 折线图近似反映密度函数累计频数折线图 用累计频数画出的折线图 近似反映分布函数 用EXCEL计算频数分布和直方图1 输入数据P22到A1 A502 排序升序3 给出每个组的界限4 将分组限按列写入5 选用 工具 中的 数据分析 6 选 直方图 7 输入区 接收区 输出区新图表 要求累计百分率和图表输出 累积频数分布表 对下列分数 86 79 92 84 69 88 91 83 96 78 82 85 构造数据茎叶图 2 9 茎叶图 茎叶图 茎叶图 长两片叶子 未分组数据 茎叶图 未分组数据 茎叶图 时间序列数据 线图 lineplot 绘制线图时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2029跨年商用铝板节能门窗系统定制安装及全方位保养合同
- 2025年特色水产养殖产业链承包经营合同
- 2025年度悬疑电影男主角角色扮演及形象使用权转让协议
- 2025年智能物流配送合同:长途货运安全与效率提升协议
- 2025年度航天发射中心配套设施装修施工合同
- 2025年度购物中心电动自行车停车棚租赁管理合同
- 地产项目分销渠道合作协议
- 2025-2030中国无现金售货机行业应用趋势及发展动向分析报告
- 以设备维修为中心建立设备维护档案
- 2026届甘肃省武威市民勤县第三中学化学高一上期中经典试题含解析
- 人教版九年级英语全册词性转换1-14单元
- 铭记抗战历史+弘扬民族精神+纪念抗战胜利主题班会
- 非居民金融账户涉税信息尽职调查管理办法
- 拓扑优化教学课件
- 孕期营养需求指南
- 智能分拣与无人配送技术
- 塑胶件基础知识培训
- 幼儿园课程领导力在生长
- 初中教师教学基本功培训内容课件
- 肝硬化及其并发症
- 《无线网规网优概述》课件
评论
0/150
提交评论