第三章 统计数据_第1页
第三章 统计数据_第2页
第三章 统计数据_第3页
第三章 统计数据_第4页
第三章 统计数据_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计数据整理第一节统计数据整理概述第二节统计分组第三节分配数列第四节统计表与统计图第三章统计数据整理一、统计数据整理的概念和内容(一)统计数据整理的概念

统计数据整理是根据统计研究的任务,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合数量特征的资料的工作过程。统计数据整理是统计工作的第二阶段。统计数据整理通常是对统计调查所搜集到的原始资料进行整理,不过在统计实践中,对某些已经加工的综合统计资料的再整理,也属于统计整理。第一节统计数据整理概述第一节统计数据整理概述(二)统计数据整理的原则

1.目的性原则统计数据整理必须有明确的目的。统计目的不同,整理的结果也不一样。如果不按照明确的目的整理统计数据,整理工作是徒劳的。

2.联系性原则统计整理过程中要遵循联系性原则,使得整理的结果便于分析指标之间的相互数量联系,分析事物之间的关联性。

3.简明性原则统计整理过程中要注意整理的结果简单明了,符合使用者的需求。第一节统计数据整理概述(三)统计数据整理的内容

1.对搜集到的资料进行全面审核,确保统计资料准确无误,符合统计研究目的的要求。

2.根据研究目的和统计分析的需要,选择需要整理的标志,并进行划类分组。3.在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标。

4.统计资料的显示。5.对统计数据分门别类地系统积累。第一节统计数据整理概述二、统计数据整理的意义和作用(一)便于人们认识客观总体。(二)统计整理是统计实践工作的中间环节,起着承前启后的作用。(三)统计整理还是积累历史资料的必要手段。第一节统计数据整理概述三、数据的预处理

数据的预处理是统计数据整理的第一步,是在对数据进行分类或分组之前所做的必要处理,包括数据的审核、订正、排序等。(一)数据的审核与筛选(二)数据的订正(三)数据的排序第三章统计数据整理一、统计分组的概念及作用在对数据进行预处理后就可以进行统计整理的第二个步骤——统计分组。统计分组是根据客观现象的特点和统计研究的目的和任务,按照一定的标志把总体划分为若干性质不同的组或类型,使组和组之间的差异尽可能大,同组内的差异尽可能小。第二节统计分组第二节统计分组统计分组的作用表现为三方面:(一)划分现象的类型。(二)揭示现象的内部结构。(三)分析现象之间的依存关系。二、统计分组的种类(一)品质标志分组和数量标志分组分组标志用文字来描述、反映事物属性的分组称为品质标志分组。例如人口普查中对人口按姓名、性别、出生年月、所从事职业等标志分组。

分组标志用数值来描述,反映事物数量特征的分组称为数量标志分组。例如企业职工按年龄、工龄、工资等分组。第二节统计分组(二)简单分组、复合分组和平行分组体系在统计分组中,根据采用分组标志的多少以及分组标志之间的关系,可以分为简单分组、复合分组和平行分组体系。

简单分组是对被研究现象总体各单位只按一个标志进行分组,如人口按性别分组、工业企业按所有制分组等等。

复合分组是对总体各单位选择两个或两个以上标志层叠起来进行分组。

平行分组体系是按照两个或两个以上分组标志对总体各单位进行平行分组,从不同侧面分别说明总体单位的特征。第二节统计分组三、统计分组的关键(一)分组标志的选择。(二)确定分组界限。1.品质标志分组分组界限的确定需要看总体单位分组标志表现的具体情况。2.数量标志分组数量标志分组按值的表现形式分为单变量分组和组距式分组两种。第二节统计分组四、统计分组应遵循的原则(一)穷尽性原则

穷尽性原则就是要使总体内的每一单位都能无一例外地划归到各自所属的组。(二)互斥性原则

互斥性原则是指总体分组后,每个组的范围应该互不相容、互相排斥。即每个总体单位在特定的分组标志下只能归于某一类别,而不能同时或可能同时出现在几个类别中。第三章统计数据整理一、分配数列的概念和种类(一)分配数列的概念在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分布或分配数列。构成分配数列的要素有两个,即分组标志序列(或分组)和与各组对应的分布次数。在分配数列中,分布在各组的个体单位数叫次数或频数,各组次数占总次数的比重叫频率。第三节分配数列第三节分配数列(二)分配数列的种类分配数列按照分组标志的不同可以分为品质分配数列和变量分配数列。1.品质分配数列(简称品质数列)品质分配数列是将总体各单位按照品质标志分组形成的分配数列。品质分配数列由各组名称和次数组成,各组次数可以用绝对数表示,即频数或次数;也可以用相对数表示,即频率。第三节分配数列表3-12010年我国大陆人口的性别分布性别人数(万人)比率(%)男性6868551.27女性6528748.73合计133972100第三节分配数列2.变量分配数列(简称变量数列)变量分配数列是将总体各单位按照数量标志分组形成的分配数列。变量数列按照分组标志值是单一的变量值还是变量的一定变动范围可以分为单项数列和组距数列。(1)单项数列以一个变量值作为一组的分组标志值所编制的变量数列称为单项数列。每个变量值构成一个组,各组按顺序排列,一般在总体各单位的数量标志值不多、且变量值的变动范围不大、变量呈离散型的条件下采用。第三节分配数列表3-22013年会计一班学生年龄分布情况性别人数(人)比率(%)18241918362026522148合计50100第三节分配数列(2)组距数列用变量值变动的一定范围(或距离)代表一个组而编制的变量数列称为组距数列。每个组由若干个变量值形成的区间表示。一般地,对于连续型变量或者是离散型变量在变量值变动幅度较大、总体单位数又多的情况下采用组距数列。第三节分配数列表3-32013年会计一班《统计学原理》期末成绩分组表成绩人数(人)频率(%)60分以下2460~70分61270~80分224480~90分163290分以上48合计50100第三节分配数列二、累计频数和累计频率将变量数列各组的频数或频率逐组累计相加即得对应组的累计频数或累计频率。它表明总体各单位在某一标志值的某一水平上总共包含的总频数或总频率。累计的方法有两种:一种是向上累计(包括向上累计频数、向上累计频率):即将各组的频数或频率由变量值小的组向变量值大的组进行累计。表明对应组上限以下的总频数或总频率。一种是向下累计(包括向下累计频数、向下累计频率):即将各组的频数或频率由变量值大的组向变量值小的组进行累计。表明对应组下限以上的总频数或总频率。第三节分配数列表3-4

2013年会计一班《统计学原理》期末成绩分组表成绩人数(人)频率(%)向上累计频数(人)向上累计频率(%)60分以下242460~70分61281670~80分2244306080~90分1632469290分以上4850100合计50100——第三节分配数列三、组距数列中的相关概念

(一)组数、组限、组距1.组数组数是指总体各单位按照某个数量标志分为多少组。2.组限组限是指各组的数量界限,即数列中每个组两端表示各组界限的变量值。分为上限和下限。每个组较小的组限称为下限,较大的组限称为上限。若一个组的上、下限都齐全,这样的组称为闭口组。有上限缺下限或有下限缺上限的组称为开口组。有上限缺下限,一般表示为“××以下”;有下限缺上限,一般表示为“××以上”。

第三节分配数列组距式分组确定组限要遵守一个基本原则:如果分组标志值是连续型变量,相邻组的上、下限只能重叠,每一组的上限同时是下一组的下限。为了遵守互斥原则,每组组限确定是“包括下限不包括上限”。

3.组距

组距是指每组所包含变量值的变动范围,实际上组距就是每组上限、下限之间的距离,即组距=上限—下限。在组距数列中,各组组距可以是相等的,也可以是不相等的。第三节分配数列(二)组中值

组中值是组距数列中各组所有变量值的代表值,实际上就是各组上限与下限之间的中点值。其计算公式为:

闭口组:缺下限的开口组:缺上限的开口组:第三节分配数列(三)等距数列与异距数列1.等距数列每个组的组距都相等的组距数列称为等距数列。等距数列适用于标志值的变动比较均匀的情况,也适宜于现象性质差异的变动比较均匀的情况。等距数列有两个优点:第一,由于各组的组距相等,各组次数分布不受组距大小的影响,因而能直接比较各组次数的多少,便于反映总体单位的分布情况。第二,便于计算,尤其便于利用简捷法计算平均数、标准差等指标。所以,在一般情况下,应尽量采用等距分组来编制分布数列。第三节分配数列2.异距数列组距不完全相等的组距数列称为异距数列。异距数列适用于标志值的变动不均匀的情况和现象性质差异的变动不均匀时的情况。异距数列各组次数的多少受组距大小的影响,不能直接准确反映实际的分布特征,各组次数也不能直接比较,为了消除组距不等的影响,必须计算次数密度或频率密度。计算公式为:

第三节分配数列四、分配数列的编制(一)确定分配数列的形式

根据总体各单位分组标志的表现形式来确定编制品质数列还是变量数列,如果是变量数列还要确定是单变量数列还是组距式数列。(二)组距式数列的编制1.计算全距全距指的是一组变量值中最大值与最小值之差,用R表示。

2.确定组数一般确定五到十五组比较适宜,或参照史德杰斯经验公式确定组数,其公式为:n=1+3.322lgN

第三节分配数列3.确定组距组距、组数和全距存在以下关系:4.确定组限组限的确定既可以从最小组开始,也可以从最大组开始。如果从最小组开始,首先要确定最小组的下限,然后根据组距=上限-下限的关系,根据最小组的下限和组距得出该组的上限。此组上限可以作为相邻组的下限,以此类推得出所有组的组限。如果从最大组开始,首先要确定最大组的上限,然后根据组距=上限-下限的关系,根据最大组的上限和组距得出该组的下限。此组下限可以作为相邻组的上限,以此类推得出所有组的组限。第三节分配数列5.将所有总体单位按照组距式数列中的各个组限和总体单位具体数值划分到各组。6.将每组的总体单位数进行汇总。第三章统计数据整理一、统计表(一)统计表的概念及作用把搜集到的数字资料,经过汇总整理后,将其按一定顺序填列在一定的表格内,这个表格就是统计表。统计表有以下几方面作用:1.能使大量的统计资料系统化、条理化。2.便于比较各项目(指标)之间的关系,也便于计算。3.采用统计表表述统计资料显得紧凑、简明、醒目。4.利用统计表易于检查数字的完整性和正确性。第四节统计表与统计图第四节统计表与统计图(二)统计表的结构从形式上看,统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加上表外附加。从内容上看,统计表由主词和宾词两个部分构成。主词是统计表所要说明的总体,它可以是各个总体单位的名称,也可以是总体各个分组的名称。形式上表现为行标题。宾词是说明总体的指标名称和指标数值的。形式上表现为列标题和数字资料。第四节统计表与统计图(三)统计表的种类统计表按主词加工方法不同分为简单表、分组表和复合表三种。1.简单表表的主词未经任何分组的统计表称为简单表。简单表的主词一般按时间顺序排列,或按总体各单位名称排列。2.分组表表的主词按照某一标志进行分组的统计表称为分组表。利用分组表可以提示不同类型现象的特征,说明现象内部的结构,分析现象之间的相互关系等,第四节统计表与统计图表3-82013年某公司所属两分厂自行车合格品数量表厂别合格品数量(辆)一分厂二分厂5000070000合计120000第四节统计表与统计图3.复合表表的主词按照两个或两个以上标志进行复合分组的统计表称为复合表。复合表能更深刻更详细地反映客观现象,但使用复合表恰如其分,并不是分组越细越好。因为复合表中多进行一次分组,组数将成倍增加,分组太细反而不利于研究现象的特征。第四节统计表与统计图(四)统计表的设计要求1.要合理安排统计表的结构。2.表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间、地点以及何种数据。3.如果表中的全部数据都是同一计量单位,可放在表的右上角标明,若各指标的计量单位不同,则应放在每个指标后或单列出一列标明。4.表中的上下两条线一般用粗线,中间的其他线要用细线。通常情况下,统计表的左右两边不封口,列标题之间一般用竖线隔开,而行标题之间通常不必用横线隔开。5.在使用统计表时,必要时可在表的下方加上注释。第四节统计表与统计图二、统计图根据统计数字,用几何图形、事物形象或地图等绘制的各种图形叫统计图。(一)直方图和条形图1.直方图直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标中,横轴表示数据分组,纵轴表示频数或频率,这样,各组与相应的频数就形成了一个个矩形,即直方图。根据表3-9中的数据可以画出相应的直方图。第四节统计表与统计图表3-9某商场50名销售员日销售额分组表按日销售额分组(元)频数(人)频率(%)1050~11001100~11501150~12001200~12501250~13001300~13501350~1400358141064610162820128合计50100第四节统计表与统计图图3-1某商场50名销售员日销售额的直方图10501100115012001250130013501400日销售额(元)15301224918612360%频数(人)第四节统计表与统计图2.条形图用一个单位长度(如1厘米)表示一定的数量,根据数量的多少,画成长短相应成比例的直条,并按一定顺序排列起来,这样的统计图,称为条形统计图。条形统计图可以清楚地表明各种数量的多少,是统计图资料分析中最常用的图形。按照排列方式的不同,可分为纵式条形图和横式条形图。按照分析作用的不同,可分为条形比较图和条形结构图。第四节统计表与统计图

图3-2某城市居民关注不同类型广告的人数分布广告类型21016951112思考:直方图和条形图有哪些异同?第四节统计表与统计图(二)折线图和线图1.折线图折线图是在直方图的基础上,把各直方顶部的中点(即组中值)用线段连接起来。需要注意的是,折线图的两个终点要与横轴相交,具体的做法是将第一个矩形顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。这样才会使折线图下所围成的面积与直方图的面积相等,从而使二者所表示的频数分布一致。第四节统计表与统计图

折线图既可用于反映频数以及频率的分布情况,也可反映累计频数和累计频率的分布情况。与条形统计图比较,折线统计图不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化的情况。2.线图线图是在平面坐标上用折线表现数量变化特征和规律的统计图。线图主要用于显示时间序列数据,以反映事物发展变化的规律和趋势。第四节统计表与统计图图3-4我国2013年居民消费价格月度涨跌幅度图第四节统计表与统计图(三)圆形图和环形图1.圆形图圆形图也称饼图,是用圆形及圆内各扇形的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度是按各部分百分比占360°的相应比例确定的。第四节统计表与统计图图3–5某城市居民关注不同类型广告的人数构成第四节统计表与统计图

2.环形图环形图与圆形图既类似又有区别。环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示。圆形图只能显示一个总体各部分所占的比例,而环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环。因此环形图可以显示多个总体各部分所占的相应比例,从而有利于进行比较研究。第四节统计表与统计图图3-6两个城市家庭对住房状况评价的环形图第四节统计表与统计图(四)茎叶统计图茎叶图又称“枝叶图”,是按照一定的间隔将数组中的每个变化的数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。茎叶图是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。通过茎叶图,可以看出数据的分布形状及数据的离散状况,比如,分布是否对称,数据是否集中,是否极端值等等。第四节统计表与统计图茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图的茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。第四节统计表与统计图树茎树叶1078831102234577788891312001222233334

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论