




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学与信息科学学院王坤Telellowang 第三章数据的表述 图和表 统计学概念和方法 一旦数据被收集后 我们必须在它们中寻找所包含的信息 虽然我们可以看到数据文件中的数据 但是无法全部理解它们 因此 我们要想办法从数据中提取信息 这就意味着 我们需要通过图 表 和计算来分析数据 统计图是根据统计数字 用几何图形 事物形象和地图等绘制的各种图形 它具有直观 形象 生动 具体等特点 统计图可以使复杂的统计数字简单化 通俗化 形象化 使人一目了然 便于理解和比较 因此 统计图在统计资料整理与分析中占有重要地位 并得到广泛应用 本章要点 图 画出数据分类变量 饼图和条形图度量变量 点图和直方图根据数据做图作图 优秀的标准表 改变排列方式可能更合适 3 1图 画出数据 分析数据的一种方法是把它们画出来 作图的两个目的 帮助研究者从数据中提取信息 把信息传给他人 看图说话 一幅图胜过一千个文字 3 2分类变量 圆饼图和条形图 分类变量也称定性数据 变量的观测值 转换为数字后 不能被排序 如性别 婚姻状况 满意度等 圆饼图 piechart 用一个圆及圆内几个扇形的面积来表示数据的频数 频率 分布 每一类数据对应一个扇形 它的中心角等于360o乘以该类变量出现的频率 特点 1 用扇形的面积表示部分在总体中所占的百分比 2 易于显示每组数据相对于总数的大小 例 向50个消费者调查 在可口可乐 苹果汁 橘子汁 百事可乐 杏仁露等5种饮料中 您最喜欢喝的是哪一种饮料 得到的结果汇总在下表中 利用Excel软件可以得到以下饼图 条形图 条形图是用宽度相同的长方形的高低或长短来表示数据变动特征的图形 接上例 饮料口味调查 竖直条形图 横置条形图 可显示多个水平 条形统计图的特点 1 能够使人们一眼看出各个数据的大小 2 易于比较数据之间的差别 3 能清楚的表示出数量的多少 3 3度量变量 点图和直方图 度量变量也称计量变量 我们可以用某一尺度度量其观测值 例如收入数 年龄 时间 高度等 3 3 1为一个度量变量作图 盒形图 盒形图也称箱形图 boxgram 主要包含六个数据节点 将一组数据从大到小排列 分别计算出他的上边缘 上四分位数 中位数 下四分位数 下边缘 还有一个异常值 例某班有31名学生 某门课的考试成绩如下 25 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86 86 87 89 89 89 90 91 91 92 100 在R语言中输入 xboxplot x 茎叶图 茎叶图 Stem and LeafDiagrams 又称 枝叶图 由统计学家约翰 托奇turkey设计 它的思路是将数组中的数按位数进行比较 将数的大小基本不变或变化不大的位作为一个主干 茎 将变化大的位的数作为分枝 叶 列在主干的后面 这样就可以清楚地看到每个主干后面的几个数 每个数具体是多少 例 下列数据是一个婚姻登记处一周内申请办理结婚证的37个女性的年龄 不一定是初婚 30 27 56 40 30 26 31 24 23 25 29 33 29 22 33 29 46 25 34 19 23 23 44 29 30 25 23 60 25 27 37 24 22 27 31 24 26 从这些数字我们可以得到什么呢 利用R软件 我们可以做出下列茎叶图 1 92 2233334442 55556677799993 000113343 74 044 65 5 66 0 左边的枝叶表示年龄的第一位数字 右边的枝叶代表年龄的第二位数字 处于该年龄的新娘有几个则列出几个 xstem x Thedecimalpointis1digit s totherightofthe 1 92 2233334442 55556677799993 000113343 74 044 65 5 66 0 注 用茎叶图表示数据有两个优点 一是从统计图上没有原始数据信息的损失 所有数据信息都可以从茎叶图中得到 二是茎叶图中的数据可以随时记录 随时添加 方便记录与表示 茎叶图只便于表示两位有效数字的数据 而且茎叶图只方便记录两组的数据 两个以上的数据虽然能够记录 但是没有表示两个记录那么直观 清晰 直方图 直方图 Histogram 又称柱状图 质量分布图 是一种统计报告图 由一系列高度不等的纵向条纹或线段表示数据分布的情况 一般用横轴表示数据类型 纵轴表示分布情况 如频数 频率等 将数据取值的范围分成若干区间 一般是等间隔的 在等间隔的情形下 每个区间的长度称为组距 下面是某班期末成绩统计的直方图 横轴代表分数 组距为10分 纵轴代表频率 组距对直方图的形态有很大影响 组距太小 每组的频数较少 组距太大 直方图所反映的形态就不灵敏 KarlPearson与直方图 KarlPearson 1857 1936 生卒于伦敦 公认为统计学之父 K Pearson1879年毕业于剑桥大学数学系 曾参与激进的政治活动 出版几本文学作品 并且作了三年的律师实习 1884年进入伦敦大学学院 UniversityCollege London 教授数学与力学 从此待在该校一直到1933年 许多熟悉的统计名词如标准差 成分分析 卡方检验都是他提出的 K Pearson Galton与Weldon为了推广统计在生物上的应用 于1901年创立统计的元老期刊 Biometrika 1895年 K Pearson在给伦敦的皇家协会发布的讲话中 首次使用了histogram 直方图 这个词语 3 3 2为两个度量变量作图 我们常常需要显示两个度量变量的数据 如人们的身高和体重 年龄和收入 新娘和新郎的年龄等 散点图 scatterplot 散点图包括两个轴 横轴和纵轴 横轴和纵轴分别表示一个变量 两个变量的一对观测值在图中用点来表示 例如 下表是24对夫妇结婚年数和每年的吵架次数 利用Excel软件可做出下面的散点图 利用散点图可看出两个变量间的关系 线性 非线性 散点图表示因变量随自变量而变化的大致趋势 据此可以选择合适的函数对数据点进行拟合或者回归分析 时间序列图 当散点图里的横轴为时间变量时 称此时的散点图为时间序列图 使用它的主要目的是观察变量是否随时间变化而呈某种趋势 例已知1990年到2004年我国第三产业的产值 单位 亿元 如下 根据上表数据在EXCEL中作散点图即可 作图 优秀的标准 图优性 在最短的时间内用最少的笔墨 在最小的空间里 给读者最多的信息和思想 图表要符合制图人的目的 坐标轴横纵方向单位比例 坐标轴刻度起始数值 图中垃圾 矩形中的阴影 散点图中的格子 表示数量的符号 点缀图本身的说明 例1900 1936年奥林匹克男子跳高比赛的金牌获得者跳高成绩如下表所示 原理 坐标轴刻度不同 导致视觉效果不同 用Excel作出时间序列图 表 改变排列方式可能更合适 表是另外一种用密集的形式归纳数据的方法 它是由写在行和列中的数字组成 表提供的视觉效果和图很不一样 表提供精确的数字 但不能快速使人对数据有印象 表的最下一行或者最右一行须给出各个项目的合计数 表的使用服务于制表人的目的 3 7小结 图 画出数据将一个完整
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业内部金融交易的区块链解决方案案例
- 医疗领域智能诊断系统的监管框架及实施
- 乳胶合同范例
- 买房屋正规合同范例
- 中考动员学生发言稿模版
- 红色扁平风食品安全模板
- 网站编辑个人工作总结模版
- 医疗大数据库建设与疾病预防控制策略研究
- 公司之间购销合同范例
- 区块链在教育公平中的角色与挑战
- 吊装安全确认表及技术交底
- 遥控器检验作业指导书
- DBJ41∕T 228-2019 河南省房屋建筑施工现场安全资料管理标准
- 三级安全教育考试试题(的)
- DB13 5325-2021 生活垃圾焚烧大气污染控制标准
- 芒针疗法课件
- 鼓乐铿锵课件 (2)
- 小学二年级下册科学课件1.《春夏秋冬》大象版(22张)ppt课件
- 钢结构工程质量通病防治图册
- 鼻咽癌放疗临床路径
- 地下水八大离子-阴阳离子平衡计算公式
评论
0/150
提交评论