已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲数据的图表展示 3 1品质数据的图表展示3 2数值型数据的图表展示3 3合理使用图表 3 1 品质数据的频数分析 分类数据 顺序数据 一 分类数据的频数分析 什么是分类数据 例3 3 饮料品牌的市场占有率 随机调查50名顾客 变量 购买饮料的品牌 问卷调研后的原始数据 分类数据如何处理 频数 frequency 落在特定类别中的数据个数 Step1 找频数 frequency 本例 露露 的频数为5 可口可乐 的频数为15 Step2 列出频数分布图 frequencydistribution 1 比例 或频率 某一类别数据占全部数据的比值 2 比率 ratio 样本 或总体 不同类别频率的比值 Step3 根据频数 frequency 求出相关的指标 3 百分比 percentage 将比例乘以100得到的数值 1 柱形图 columnchart Step4 频数分布的图形显示 分类数据的图示 柱形图 例题分析 2 饼图 piechart 3 折线图 linechart 课堂作业 p803 1 统计数据的表现形式 1 绝对数 绝对数是统计数据的基本表现形式 表明事物 现象 的总体规模或一般水平 如 一地区的总人口 GDP 商品零售额等 绝对统计数据的计量单位 实物单位 吨 公里 小时 价值单位 元 万元 复合单位 吨公里 元 人 2 相对数 相对数是两个绝对数的比值 反映事物的相对数量 相对数的表现形式 比例 比率比例 Proportion 一个总体中各个部分的数量占总体数量的比重 通常反映总体的构成或结构 例5 一数量为N的总体被分为K个部分 各部分的数量分别为Ni 则比例定义为 Ni N 显然有 比率 Ration 各不同类别的数量比值 1 可以是同一总体中不同部分的数量对比如 总人口中 男性 女性 GDP中 固定资产投资 居民消费GDP中 三次产业增加值之比2 可以是同特征在不同时间或空间上的数量比如 不同年份GDP之比 经济增长率不同地区GDP之比 两个地区经济水平差异 百分数 Percentage 将对比的基数抽象化为100而计算的相对数 练习 例3 4 电脑销售的对比图 2 顺序数据的整理与图示 1 什么是顺序数据 例 您对您家庭目前的住房状况是否满意 变量 1 非常不满意 2 不满意 3 一般 4 满意 5 非常满意 数据具有一定顺序的类别变量称为顺序变量 顺序变量对应的数据称为顺序数据 2 顺序数据的处理 3 累积频数 将各类别频数的逐级累加 4 累积频率 将各类别频率的逐级累加 1 频数图2 频率图 同 分类数据 相同 问题 累积频率的加总和为多少 例3 5顺序数据的频数分布表 甲城市 例 在一项城市住房问题的研究中 研究人员在甲乙两个城市各抽样调查300户 其中的一个问题是 您对您家庭目前的住房状况是否满意 1 非常不满意 2 不满意 3 一般 4 满意 5 非常满意 例3 5顺序数据的频数分布表 乙城市 3 甲乙两城市家庭对住房状况评价的折线图 问题 这个折线图是如何做出来的 4 甲城市 家庭对住房状况评价的 累积 折线图 问题 这个折线图是如何做出来的 5 甲乙两城市满意度比较的环形图 例题3 5 问题 这个折线图是如何做出来的 环形图和饼图的区别 饼图只能显示一个总体 或样本 各部分所占的比例环形图则可以同时绘制多个总体 或样本 各部分的比例 每一个总体 或样本 的数据系列为一个环 环形图可用于结构比较研究环形图主要用于展示分类和顺序数据总体中的每一部分数据用环中的一段表示 3 2数值型数据的图表展示 1 数据分组和图表展示2 未分组数据的处理 一 为什么要进行数据的分组 一 通过数据分组展示数据 因为数据太多了 二 数据分组的方法 组距分组 分组方法 每个data自然就归为一组 要对data进行归类整合 单变量值分组 1 将一个 变量值 作为一组2 适合于 离散变量 3 适合于变量值 较少 的情况 满意 不太满意 不满意 非常不满意 组1 组1 组2 组3 组4 组距分组 将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循 不重不漏 的原则可采用等距分组 也可采用不等距分组 组1 组1 组2 组3 组4 3 组距分组的步骤 确定组数 组数的确定应以能够显示数据的分布特征和规律为目的 在实际分组时 可以按Sturges提出的经验公式来确定组数K 确定组距 组距 ClassWidth 是一个组的上限与下限之差 可根据全部数据的最大值和最小值及所分的组数来确定 即组距 最大值 最小值 组数 统计出各组的频数并整理成频数分布表 组距分组的几个概念 1 下限 lowlimit 一个组的最小值2 上限 upperlimit 一个组的最大值3 组距 classwidth 上限与下限之差4 组中值 classmidpoint 下限与上限之间的中点值 分组所遵循的主要原则是 不重不漏 eachdatavaluebelongstooneclassandonlyoneclass 数据在每组中的归属习惯上采用 上组限不在内 5 10 10 15 15 20 四 数值型数据分组和频数分布表的编制 例 某电脑公司2002年前四个月各天的销售量数据 单位 台 试对数据进行分组 确定组数 根据Sturges提出的经验公式得组数K为 确定各组的组距 组距 237 141 10 9 6 10 用Excel制作频数分布表 3 数字型数据分组后的频数 频率表 问题 是等距分组还是不等距分组 开口组 特殊的情况的处理 原因 数据的最大值和最小值与其他数据相距悬殊 标志 采取 在 以上 在 以下 这样的开口组 避免出现空白组 某电脑公司销售量分布的直方图 我一眼就看出来了 销售量在170 180之间的天数最多 五 分组数据的图形展示 直方图和折线图 分组数据的图示 折线图的绘制 折线图与直方图下的面积相等 140 150 210 某电脑公司销售量分布的折线图 190 200 180 160 170 220 230 240 思考 1 对于等距分组的数据 可用距形的高度直接表示频数的分布 对于不等距分组的数据 用距形的面积 而不是高度 表示各组的频数分布 不等距分组各组的频数受组距大小不同的影响 2 从本质上说 直方图应用频数密度来绘制 这样可使直方图总面积为1 因此需要计算频数密度 频数 组距 才能准确反映频数分布的实际 而频率和频数密度是有区别的 频率 频数 总量 频率的加总一定等于1 而频数密度的加总不一定等于1 频数 频率 分布的类型 日常经济生活中 常见的频数分布曲线主要有正态分布 偏态分布 J型分布 U型分布等几种类型 其次还有双峰型 孤岛型及锯齿型等其他类型 二 未分组数据的处理 一 不分组也可以看出数字的特征 教材p58 例3 6 电脑每日的销售量调研数据 二 处理方式 茎叶图 例 一会计事务所对其20家客户 clients 年底帐目辑核 audits 的时间长度 天 的统计数据如下 TableYear EndAuditTimes indays 1214191815151817202722232221332814181613 树茎 树叶 茎叶图是一种既给出数据的分布状况 又能显示每一个原始数值的图形 Astem and leafdisplaycanbeusedtorankorderdataandprovideanideaoftheshapeofthedistributionofasetofquantitativedata 茎叶图由两部分组成 茎 stem 与叶 leaf 茎 通常由每组数的高位数值 leadingdigits 形成 按组竖立在左边 叶 通常由每组数的低位数值 lastdigits 形成 按组横排在 茎 的右边 上面茎叶显得过于拥挤 尤其是第一行有太多数 可将期扩展为Fig5的形式 Fig5所表现的数据分布特征与直方图十分相似 但茎叶图有明显优势 1 Thestem and leafdisplayiseasiertoconstruct 2 Thestem and leafdisplayprovidesmoreinformationbecauseitshowstheactualdatavalues Fig5 Stem and leafdisplayfortheAudit TimeData1234415567888920122327833 例3 6 表3 12的茎叶图 p58 表3 12扩展的茎叶图 总结 茎叶图 stem and leafdisplay 用于显示未分组的原始数据的分布由 茎 和 叶 两部分构成 其图形是由数字组成的以该组数据的高位数值作树茎 低位数字作树叶树叶上只保留一位数字对于n 20 n 300 个数据 茎叶图最大行数不超过L 10 lg n 6 茎叶图类似于横置的直方图 但又有区别直方图可观察一组数据的分布状况 但没有给出具体的数值茎叶图既能给出数据的分布状况 又能给出每一个原始数值 保留了原始数据的信息 二 箱线图 boxplot 1 箱线图的结构 对于一组数据 绘制一个箱线图即可 对于多组数据 要绘制多批箱线图 未分组数据 多批数据箱线图 例题分析 例 从某大学经济管理专业二年级学生中随机抽取11人 对8门主要课程的考试成绩进行调查 所得结果如表 试绘制各科考试成绩的批比较箱线图 并分析各科考试成绩的分布特征 以科目分组的多批数据箱线图 例题分析 8门课程考试成绩的箱线图 11名学生8门课程考试成绩的箱线图 Min Max 25 75 Medianvalue 45 55 65 75 85 95 105 学生1 学生2 学生3 学生4 学生5 学生6 学生7 学生8 学生9 学生10 学生11 以学生分组的多批数据箱线图 三 时间序列数据 线图 lineplot 绘制线图时应注意以下几点时间一般绘在横轴 x 指标数据绘在纵轴 y 图形的长宽比例要适当 其长宽比例大致为10 7一般情况下 纵轴数据下端应从 0 开始 以便于比较 数据与 0 之间的间距过大时 可以采取折断的符号将纵轴折断 时间序列数据 线图 例题分析 例 已知1991 2000年我国城乡居民家庭的人均收入数据如表 试绘制线图 时间序列数据 线图 例题分析 作业 p85 3 14 用excel绘制时间序列图 4 1多变量数据 雷达图 例题分析 例 2000年我国城乡居民家庭平均每人各项生活消费支出构成数据如表 试绘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO/IEC 29168-2:2025 EN Information technology - Open systems interconnection - Part 2: Procedures for the object identifier resolution system operational agency
- 【正版授权】 IEC SRD 63301-2:2025 EN Smart city use case collection and analysis - Water systems in smart cities - Part 2: Use case analysis
- 【正版授权】 ISO/IEC 18047-6:2025 EN Information technology - Radio frequency identification device conformance test methods - Part 6: Test methods for air interface communications at 86
- TCECS 1648-2024 无机纤维复合保温板外墙外保温工程技术规程
- TCECS 1456-2023 冷库地面工程技术规程
- GBT 50838-2015 城市综合管廊工程技术标准(2024年版)
- 浙江事业单位衢州市开化县定向培养粮油储检人员招考易考易错模拟试题(共500题)试卷后附参考答案
- 河北沧州市审计局事业单位招考易考易错模拟试题(共500题)试卷后附参考答案
- 养猪场工人合同范本
- 占地建设协议书模板
- 旅游大巴保养知识培训课件
- 变电所反恐知识培训内容课件
- 德育课程开发与实施评价方案
- 2025年小学数学课程标准试题及答案
- 矿区生态修复后期管护方案
- 2025至2030中国船用阀和执行器行业产业运行态势及投资规划深度研究报告
- 2025年共青团入团考试测试试卷题库及答案
- 森林消防装备维护保养课件
- 血管活性药物使用与护理
- DB42T 926-2013 地理标志产品 蕲艾
- 反脑控的最佳解决方法
评论
0/150
提交评论