




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学与信息科学学院王坤Telellowang,第三章数据的表述:图和表,统计学概念和方法,一旦数据被收集后,我们必须在它们中寻找所包含的信息。虽然我们可以看到数据文件中的数据,但是无法全部理解它们。因此,我们要想办法从数据中提取信息。这就意味着,我们需要通过图、表、和计算来分析数据。统计图是根据统计数字,用几何图形、事物形象和地图等绘制的各种图形。它具有直观、形象、生动、具体等特点。统计图可以使复杂的统计数字简单化、通俗化、形象化,使人一目了然,便于理解和比较。因此,统计图在统计资料整理与分析中占有重要地位,并得到广泛应用。,本章要点,图:画出数据分类变量:饼图和条形图度量变量:点图和直方图根据数据做图作图:优秀的标准表:改变排列方式可能更合适,3.1图:画出数据,分析数据的一种方法是把它们画出来。作图的两个目的:帮助研究者从数据中提取信息;把信息传给他人。看图说话:一幅图胜过一千个文字。,3.2分类变量:圆饼图和条形图,分类变量也称定性数据,变量的观测值(转换为数字后)不能被排序,如性别,婚姻状况,满意度等。圆饼图(piechart)用一个圆及圆内几个扇形的面积来表示数据的频数(频率)分布。每一类数据对应一个扇形,它的中心角等于360o乘以该类变量出现的频率。特点:(1)用扇形的面积表示部分在总体中所占的百分比。(2)易于显示每组数据相对于总数的大小。例:向50个消费者调查“在可口可乐、苹果汁、橘子汁、百事可乐、杏仁露等5种饮料中,您最喜欢喝的是哪一种饮料?”,得到的结果汇总在下表中。,利用Excel软件可以得到以下饼图。,条形图,条形图是用宽度相同的长方形的高低或长短来表示数据变动特征的图形。接上例,饮料口味调查。,竖直条形图,横置条形图,可显示多个水平,条形统计图的特点:(1)能够使人们一眼看出各个数据的大小。(2)易于比较数据之间的差别。(3)能清楚的表示出数量的多少。,3.3度量变量:点图和直方图,度量变量也称计量变量,我们可以用某一尺度度量其观测值。例如收入数,年龄,时间,高度等。3.3.1为一个度量变量作图,盒形图,盒形图也称箱形图(boxgram).主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。,例某班有31名学生,某门课的考试成绩如下:25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,90,91,91,92,100,在R语言中输入:xboxplot(x),茎叶图,茎叶图(Stem-and-LeafDiagrams)又称“枝叶图”,由统计学家约翰.托奇turkey设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。例:下列数据是一个婚姻登记处一周内申请办理结婚证的37个女性的年龄(不一定是初婚)30,27,56,40,30,26,31,24,23,25,29,33,29,22,33,29,46,25;34,19,23,23,44,29,30,25,23,60,25,27,37,24,22,27,31,24,26。,从这些数字我们可以得到什么呢?,利用R软件,我们可以做出下列茎叶图:1|92|2233334442|55556677799993|000113343|74|044|65|5|66|0,左边的枝叶表示年龄的第一位数字,右边的枝叶代表年龄的第二位数字,处于该年龄的新娘有几个则列出几个,xstem(x)Thedecimalpointis1digit(s)totherightofthe|1|92|2233334442|55556677799993|000113343|74|044|65|5|66|0,注:,用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。,直方图,直方图(Histogram)又称柱状图、质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况(如频数、频率等)。将数据取值的范围分成若干区间(一般是等间隔的),在等间隔的情形下,每个区间的长度称为组距。,下面是某班期末成绩统计的直方图。横轴代表分数,组距为10分,纵轴代表频率。,组距对直方图的形态有很大影响,组距太小,每组的频数较少;组距太大,直方图所反映的形态就不灵敏。,KarlPearson与直方图,KarlPearson(18571936),生卒于伦敦,公认为统计学之父。K.Pearson1879年毕业于剑桥大学数学系;曾参与激进的政治活动。出版几本文学作品,并且作了三年的律师实习。1884年进入伦敦大学学院(UniversityCollege,London),教授数学与力学,从此待在该校一直到1933年。许多熟悉的统计名词如标准差,成分分析,卡方检验都是他提出的。K.Pearson、Galton与Weldon为了推广统计在生物上的应用,于1901年创立统计的元老期刊Biometrika。1895年,K.Pearson在给伦敦的皇家协会发布的讲话中,首次使用了histogram(直方图)这个词语。,3.3.2为两个度量变量作图,我们常常需要显示两个度量变量的数据,如人们的身高和体重,年龄和收入,新娘和新郎的年龄等。散点图(scatterplot)散点图包括两个轴,横轴和纵轴。横轴和纵轴分别表示一个变量,两个变量的一对观测值在图中用点来表示。例如,下表是24对夫妇结婚年数和每年的吵架次数。,利用Excel软件可做出下面的散点图。,利用散点图可看出两个变量间的关系(线性/非线性)。散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合或者回归分析。,时间序列图,当散点图里的横轴为时间变量时,称此时的散点图为时间序列图。使用它的主要目的是观察变量是否随时间变化而呈某种趋势。例已知1990年到2004年我国第三产业的产值(单位:亿元)如下:,根据上表数据在EXCEL中作散点图即可。,作图:优秀的标准,图优性:在最短的时间内用最少的笔墨,在最小的空间里,给读者最多的信息和思想。图表要符合制图人的目的(坐标轴横纵方向单位比例,坐标轴刻度起始数值。)图中垃圾:矩形中的阴影,散点图中的格子,表示数量的符号,点缀图本身的说明。,例1900-1936年奥林匹克男子跳高比赛的金牌获得者跳高成绩如下表所示。,原理:坐标轴刻度不同,导致视觉效果不同。,用Excel作出时间序列图:,表:改变排列方式可能更合适,表是另外一种用密集的形式归纳数据的方法,它是由写在行和列中的数字组成。表提供的视觉效果和图很不一样;表提供精确的数字,但不能快速使人对数据有印象。表的最下一行或者最右一行须给出各个项目的合计数。表的使用服务于制表人的目的。,3.7小结,图:画出数据将一个完整
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课件时间缓冲带
- 课件时长合理性
- 金属铬反应工质量管控考核试卷及答案
- 陶瓷彩绘工岗位操作规程考核试卷及答案
- 水泥生料制备工转正考核试卷及答案
- 课件新安全生产法
- 碳二饱和气体回收装置操作工工艺创新考核试卷及答案
- 饲草产品加工工异常处理考核试卷及答案
- 教师招聘之《小学教师招聘》考前冲刺试卷及答案详解(易错题)
- 2025年教师招聘之《幼儿教师招聘》综合提升练习题附参考答案详解(模拟题)
- 租金费用收取管理制度
- 建筑垃圾处理技术标准(CJJT 134-2019)
- 五年级美术素养测评模拟测试
- 木工课堂安全管理制度
- 《AIGC应用实战:写作、绘图、视频制作、直播》-课件 第七章 即梦的使用方法;第八章 AI直播
- 2025中国地中海贫血祛铁治疗指南解读
- 产品标签管理制度
- 妊娠期女性的护理
- 2025-2030中国自闭症治疗行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国除尘设备行业市场发展分析及前景趋势与投资研究报告
- 开学第一课校园防骗课件(小学生)
评论
0/150
提交评论