




已阅读5页,还剩58页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计数据的整理与展示(数据的图表展示P41-77),第三章统计数据的整理与展示(数据的图表展示P41-77),由于统计调查搜集得到了大量零星、分散、不系统的,只反映个体特征的数据资料,如何将其系统化、条理化,转化为综合的、能够反映总体特征的数据资料?采用怎样的整理与展示方法,才能保证调查获得的丰富、完备的资料能清楚、醒目地揭示现象的真实情况?,第三章统计数据的整理与展示(数据的图表展示P41-77),第一节统计数据整理与展示的基本理论第二节品质数据的整理与展示第三节数值型数据的整理与展示第四节统计图表的设计,第一节统计数据整理与展示的基本理论(P41-50),一、统计数据整理与展示的步骤二、统计数据的预处理三、统计分组,一、统计数据整理与展示的步骤,1、统计数据整理与展示的任务根据统计研究的任务与要求,对调查所搜集得到的各种统计数据进行加工整理,使之系统化、条理化,从而得到反映研究对象总体综合数量特征的资料的过程,以满足统计分析的需要2、统计数据整理与展示的步骤整理方案设计数据预处理统计分组和汇总整理数据的展示整理数据的保存与公布,二、统计数据的预处理(P42-50),数据审核检查数据中的错误数据筛选找出符合条件的数据数据排序升序和降序寻找数据的基本特征数据透视按需要汇总,1、数据审核P43(原始数据rawdata),审核的内容(1)完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全(2)准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等审核数据准确性的方法*逻辑检查*计算检查,1、数据审核P43(二手数据secondhanddata,又称次级数据),审核的内容(1)适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要(2)时效性审核应尽可能使用最新的统计数据(3)确认是否有必要做进一步的加工整理,2、数据筛选P43-46(datafilter),(1)对审核过程中发现的错误应尽可能予以纠正(2)当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选(3)数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出,3、数据排序P46(datarank),要点:(1)按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索(2)排序有助于对数据检查纠错,以及为重新归类或分组等提供依据(3)在某些场合,排序本身就是分析的目的之一(4)排序可借助于计算机完成方法:(1)分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分(2)顺序数据直接按其优劣、高低等顺序排列(3)数值型数据的排序递增排序:设一组数据为X1,X2,XN,递增排序后可表示为:X(1)X(2)X(N),4、数据透视表P46-50(pivottable),(1)可以从复杂的数据中提取有用的信息(2)可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图(3)形成一个符合需要的交叉表(列联表)(4)在利用数据透视表时,数据源表中的首行必须有列标题参阅教材P50数据透视表用Excel创建数据透视表,三、统计分组,1、统计分组的概念与作用统计分组是根据统计研究目的和对象的特点,按照一定的分组标志将研究现象总体分为若干个组成部分的一种统计研究方法。分组的作用:划分现象的类型、研究总体的内部结构、分析现象之间的依存关系2、统计分组的种类按照分组标志的多少不同,可分为简单分组与复合分组按照分组标志的性质不同,可分为品质分组与数量分组,实例,简单分组与平行分组体系,复合分组与复合分组体系,第二节品质数据的整理与展示(P50-60),一、分类数据的整理与图示(P50-59)二、顺序数据的整理与图示(P59-60),一、分类数据的整理与图示(基本过程及可计算的指标P50-59),基本过程:1.列出各类别2.计算各类别的频数、频率或比例、比率等3.制作频数分布表(次数分布表)4.用图形展示数据可计算的指标:1.频数(frequency):落在各类别中的数据个数2.比例(proportion):某一类别数据占全部数据的比值3.百分比(percentage):将对比的基数作为100而计算的比值4.比率(ratio):不同类别数值的比值,一、分类数据的整理与图示频数分布表(frequencydistribution)实例,【例3.1】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,一、分类数据的整理与图示图示条形图barChart(条形图的制作P55-56)(Excel绘制的条形图),条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示分类数据的分布时,是用条形图的高度或长度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图(barChart),各类别也可以放在横轴,称为柱形图(columnchart)也可以用帕累托图(paretochart)展示,一、分类数据的整理与图示图示帕累托图P55-56(paretochart),按各类别数据出现的频数多少排序后绘制的柱形图主要用于展示分类数据的分布,一、分类数据的整理与图示图示对比条形图P56(side-by-sidebarchart),分类变量在不同时间或不同空间上有多个取值对比分类变量的取值在不同时间或不同空间上的差异或变化趋势,一、分类数据的整理与图示图示对比条形图(例题分析),一、分类数据的整理与图示图示饼图(制作P56-57)(Excel绘制的饼图),也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推,二、顺序数据的整理与图示(可计算的指标P59),累积频数(cumulativefrequencies):各类别频数的逐级累加2.累积频率(cumulativepercentages):各类别频率(百分比)的逐级累加,二、顺序数据的整理与图示频数分布表(实例P59),【例3.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意2不满意3一般4满意5非常满意,二、顺序数据的整理与图示图示累计频数分布图(由Excel绘制的累计频数分布图),图3-5甲城市家庭对住房状况评价的累积频数分布,二、顺序数据的整理与图示频数分布表(实例P60),二、顺序数据的整理与图示图示环形图(doughnutchart)(制作P58)(Excel绘制的顺序数据的环形图实例),环形图中间有一个“空洞”,样本(或总体)中的每一部分数据用环中的一段表示环形图与饼图类似,但有区别饼图只能显示一个样本(或总体)各部分所占的比例环形图则可以同时绘制多个样本(或总体)的数据系列,每一个样本(或总体)的数据系列为一个环环形图可用于进行比较研究环形图可用于展示品质数据(包括分类数据和顺序数据),甲市,乙市,第三节数值型数据的整理与展示(P60-75),一、频数分布表的编制二、数值型数据的图示三、频数分布的类型,一、频数分布表的编制1、编制频数分布表的步骤(P60-64)(数值型数据的频数分布表),编制频数分布表的步骤,一、频数分布表的编制2、分组方法,分组方法,一、频数分布表的编制(实例),117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121,【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,单变量值分组(要点P61),(1)将一个变量值作为一组(2)适合于离散变量(3)适合于变量值较少的情况,单变量值分组表(实例)(单项式变量分布数列表简称单项数列表),组距分组(要点P61),(1)将变量值的一个区间作为一组(2)适合于连续变量或离散变量(3)适合于变量值较多的情况(4)必须遵循“不重不漏”的原则(5)可采用等距分组,也可采用不等距分组(异距分组),组距分组(步骤及几个概念P61-64),步骤:(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,确定组数K,通常5K15(2)确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定如等距分组的组距,即组距(最大值-最小值)组数(3)确定组限:即每一组的上限和下限,分组遵循“上组限不在内”的原则(4)根据分组整理成频数分布表几个概念:(1)下限:一个组的最小值;上限:一个组的最大值(2)组距:上限与下限之差(3)组中值:下限与上限之间的中点值,代表各组标志值平均水平的数值闭口组(组限齐全)的组中值计算:组中值=(上限+下限)/2开口组的组中值计算:组中值=下限+(相邻组组距/2)(缺上限的开口组)或组中值=上限-(相邻组组距/2)(缺下限的开口组),等距分组表,(离散变量上下组限重叠),(离散变量上下组限间断),等距分组表(使用开口组),等距分组与不等距分组(在表现频数分布上的差异),(1)等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律(2)不等距分组(异距分组)各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度频数/组距)反映频数分布的实际状况,二、数值型数据的图示1、分组数据直方图P65(直方图的制作、直方图与条形图的区别),直方图的制作:用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)直方图与条形图的区别:条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数分布的状况,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列,二、数值型数据的图示1、分组数据直方图P65(直方图的绘制),频数(人),15,12,9,6,3,日加工零件数(个),图3-7某车间工人日加工零件数的直方图,我一眼就看出来了,大多数人的日加工零件数在120125之间!,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频数(人),1.分组数据折线图折线图(也称频数多边形图Frequencypolygon)的绘制,图3-8某车间工人日加工零件数的折线图,*把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉*折线图的两个终点要与横轴相交,做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴*折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,二、数值型数据的图示2、未分组数据茎叶图P65-66(茎叶图的制作),(1)用于显示未分组的原始数据的分布(2)由“茎”和“叶”两部分构成,其图形是由数字组成的(3)以该组数据的高位数值作树茎,低位数字作树叶(4)对于n(20n300)个数据,茎叶图最大行数不超过L=10lgn(5)茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息,树茎,树叶,788,0223457778889,001222233334445566777889,0133445799,数据个数,二、数值型数据的图示2、未分组数据茎叶图(茎叶图的制作),图3-9某车间工人日加工零件数的茎叶图,二、数值型数据的图示2、未分组数据箱线图P66-70(箱线图的制作),(1)用于显示未分组的原始数据或分组数据的分布(2)箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成(3)其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接,二、数值型数据的图示(分布的形状与箱线图),图3-11不同分布的箱线图,二、数值型数据的图示2、未分组数据多批数据箱线图(实例P68-70),【例3.4】从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表3-8。试绘制各科考试成绩的多批比较箱线图,并分析各科考试成绩的分布特征,二、数值型数据的图示2、未分组数据多批数据箱线图(由STATIATICA绘制的多批数据箱线图),图3-128门课程考试成绩的箱线图,图3-1311名学生8门课程考试成绩的箱线图,Min-Max,25%-75%,Medianvalue,45,55,65,75,85,95,105,学生1,学生2,学生3,学生4,学生5,学生6,学生7,学生8,学生9,学生10,学生11,二、数值型数据的图示2、未分组数据多批数据箱线图(由STATIATICA绘制的多批数据箱线图),二、数值型数据的图示3、时间序列数据线图P70-72(线图的制作),绘制线图时应注意以下几点时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断主要反映事物发展变化的规律和趋势,二、数值型数据的图示3、时间序列数据线图(实例P71)(Excel绘制的线图),【例3.5】已知19911998年我国城乡居民家庭的人均收入数据如表3-9。试绘制线图,¥,二、数值型数据的图示4、多变量数据二维散点图P72两个变量间的关系(2DScatterplots),(1)展示两个变量之间的关系(2)用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图,降雨量(mm),二、数值型数据的图示4、多变量数据气泡图P73三个变量间的关系(bubblechart),(1)显示三个变量之间的关系(2)图中数据点的大小依赖于第三个变量,温度,要点:(1)雷达图(RadarChart)也称为蜘蛛图(spiderchart)是显示多个变量或指标的常用图示方法(2)在显示或对比各变量的数值总和时十分有用(3)假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比(4)可用于研究多个样本之间的相似程度雷达图的制作:设有n组样本S1,S2,Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是:先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,再将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示。最后将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图,二、数值型数据的图示4、多变量数据雷达图P73-74(要点及制作),二、数值型数据的图示4、多变量数据雷达图(实例),【例3.6】1997年我国城乡居民家庭平均每人各项生活消费支出数据如表3-10。试绘制雷达图。,今天的主食是面包,二、数值型数据的图示4、多变量数据雷达图(由Excel绘制的雷达图),数据类型及图示(小结P75),三、频数分布的类型,图3-18几种常见的频数分布,第四节统计图表的设计,一、统计图的设计(P75-76)二、统计表的设计(P76-77),一、统计图的设计(P75-76)(概念、种类、鉴别图形优劣的准则、统计图的构成),概念:统计图是以点、线、面积、体积等图形表现数据的一种形式。可以直接借助于计算机完成绘图工作。Excel提供了14种标准的统计图种类:(1)品质数据的统计图:条形图、饼图、环形图等(2)数值型数据的统计图:条形图、饼图、环形图、直方图、折线图、线图、茎叶图、箱线图、雷达图等统计图设计要求:简洁、清晰地显示数据、合理表达统计目的鉴别
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 相似三角形数学综合题解析
- 1.4 整式的除法教学设计 北师大版数学七年级下册
- 贵州国企招聘2025某国有企业招聘工作人员考试历年参考题附答案详解
- cvc导管考试题及答案
- 工业机器人复习题及答案
- 2025年煤炭生产经营单位开采爆破安全管理人员证考试题附答案
- 医疗器械日常维护与管理手册
- 江西省永新县建筑总公司2025年面向社会公开招聘1名会计人员岗位任职要求调整及延期考试历年参考题附答案详解
- 宜宾市属国有企业人力资源中心宜宾国有企业管理服务有限公司2025年第四批员工公开招聘笔试参考题库附带答案详解
- 2025年土木工程力学习题集完整解析及答案
- 发行公司债法律意见书正文
- 部编人教版五年级上册道德与法治全册课件
- 高血压护理查房ppt
- 全关节镜下FiberTape治疗后交叉韧带胫骨止点撕脱骨折课件
- 有限元和有限差分法基础超详细版本
- 《临建布置方案》word版
- epsonlq590面板操作
- 疑似预防接种异常反应(AEFI)监测与处理PPT课件
- 存货计划成本法
- 某某某污水处理厂施工组织设计
- (完整)地面硬化施工合同
评论
0/150
提交评论