第3章统计整理_第1页
第3章统计整理_第2页
第3章统计整理_第3页
第3章统计整理_第4页
第3章统计整理_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计整理,第一节统计整理的意义和程序,一、统计整理的意义1、统计整理的概念对调查所得原始材料进行科学分组与汇总和对次级材料进行再加工。2、统计整理的作用统计工作的中间环节;积累历史资料的必要手段。二、统计整理的程序设计审核分组汇总制表,统计整理是承上启下的过程,是统计调查的继续也是统计分析的基础。,第二节统计资料审核,一、审核资料的完整性和及时性二、审核资料的正确性三、历史资料的审查四、资料审查后的订正,审核很重要,准确的资料是进行正确统计分析的关键。,第三节统计分组,一、统计分组的概念二、统计分组的作用三、统计分组的种类四、分组标志的选择五、组数、组距、组限、组中值,一、统计分组的概念,1.统计分组:指根据社会经济现象的特点和统计研究的任务,按某个标志(或几个标志)把总体分成若干部分的科学分类。没有统计分组就没有科学的统计。2.统计分组的关键:选择分组标志:使组间差异大,组内差异小划分各组界限。,二、统计分组的作用,划分社会经济现象的不同类型揭示总体的内部结构分析社会现象之间的依存关系,例如:将我国的经济单位按照所有制性质划分为全民所有制、集体所有制、个体所有制、中外合资和外商独资企业五种类型;国民经济三种产业分为第一产业、第二产业和第三产业;对同一行业的企业按照其生产规模大小划分为大、中、小三种不同的类型;从业人员按三种产业分、按地区分、按城乡分、按行业分等。,各种现象千差万别,多种多样,并在其发展中表现出不同的性质和特征。通过统计分组,就可以将不同类型现象的性质和特征区分开来,并且经过比较和研究,揭示其发展变化的规律,达到深刻认识总体的目的。,(一)划分社会经济现象的不同类型,二、统计分组的作用,划分社会经济现象不同类型,按照某种标志将总体划分为若干个不同的组,可以计算出各组数值在总体中所占的比重,或各组之间的比例关系,从而反映出总体的结构状况,加深对现象总体的认识。,例如:按照地理位置不同将我国划分为东部、中部和西部三个地区,可以观察东、中、西三个不同地区经济发展水平和经济资源的差异,以及它们在整个国民经济中所处的不同地位;对人口按照文化程度分组,大学及大学以上、大学肄业及在校、高中、初中、小学、不识字或识字很少各组人口所占的比重,就能反映社会人口的文化素质构成情况。如果将不同时期的同一总体的结构相互比较,还可以揭示出总体现象的发展变化规律。,(二)揭示总体的内部结构,二、统计分组的作用,揭示总体的内部结构,我国出口商品构成(%),一切事物都是普遍联系、相互依存的。一种现象的表现,既是它与其他现象相互作用的结果,也会对其他现象的表现产生一定的影响。通过统计分组,可以反映出现象之间的这种依存关系。,例如:将商品流通企业按照销售额分组,可以观察商品流通企业的规模与商品流转费用率之间的关系;将农作物播种面积按施肥量分组,用以观察农作物单产与施肥量之间的关系;将人口按人均收入分组,以观察收入与储蓄之间的关系等等。,(三)分析现象间的依存关系,二、统计分组的作用,划分社会现象的依存关系,三、统计分组的种类,统计分组,(1)简单分组,对总体只按一个标志进行分组如国民生产总值按产业分组为第一,第二,第三产业三组,等等,按分组标志多少,分为简单分组、复合分组和并列分组,三、统计分组的种类,(2)复合分组:,对总体按两个或两个以上的标志进行的重叠式分组。即在按某一标志分组的基础上再按另一个标志进一步分组。评价:更加深入全面地研究总体各个方面的内部结构,但是,采用复合分组时组数会随着分组标志的增加而成倍增加,每组包括的单位数相应的减少,处理不好就会成为繁琐哲学,因此,不能滥用复合分组,也不宜对较小总体进行复合分组,尤其不宜采用过多的标志进行复合分组。,按分组标志多少,分为简单分组、复合分组和并列分组,三、统计分组的种类,(3)并列分组,同时用两个或两个以上的标志分别从不同的角度进行不重叠的多种分组优点:两种或多种分组相互独立而不重叠,既可以从不同的方面反映事物的多种结构,又不致于使分组过于繁琐,故被广泛采用,按分组标志多少,分为简单分组、复合分组和并列分组,三、统计分组的种类,复合分组和并列分组例,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组2+3+2,(1)品质分组,是按品质标志进行的分组,即由事物的某种属性分组,如企业按经济类型,行业分组,人口按性别分组等,这种分组反映总体构成和不同属性的事物在总体中的地位和作用。(2)数量分组:是按数量标志进行的分组,如商店按商品流转额,职工人数分组,人口按年龄分组等,这种分组的目的在于通过事物在数量上的差异来反映事物在性质上的区别。二者是一对重要的统计分组,统计分组的方法都是围绕这两种分组阐述的。,按分组标志的性质分为品质分组和数量分组,三、统计分组的种类,四、分组标志的选择,分组标志:是指将总体划分为性质不同的组的标准或依据。分组标志选择的要求:1、要符合统计研究的目的和要求2、必须选择最主要的标志作为分组依据3、要考虑社会经济现象所处的具体历史条件,五、组数、组距、组限、组中值,(一)组数1.组数即将总体分为几组。2.组数的确定分下面两种情况:(1)品质分组的组数由两个因素决定:事物本身的属性特征统计研究的要求,(2)数量分组的组数由两个因素决定,1.全距=最大标志值最小标志值2.组距=各组最大标志值(上限)各组最小标志值(下限)公式:组数=全距组距3.组数、组距确定的斯特杰斯经验公式,(一)组数,1、组限:指每组两端数值。分上限和下限。,上限:每组的终点数值(最大值)。下限:每组的起点数值(最小值)。,(二)组限,2、组限的形式:,重合式:指相邻两组中,前一组的上限和后一组的下限数值重合。一般用于连续型变量。组距=上限下限不重合式:指前一组的上限与后一组的下限,两值紧密相连而不相重复。一般用于离散型变量。组距=下组下限本组下限=本组上限前组上限,1、组中值:是各组上下限之间的中点值。代表各标志值的一般水平。,2、组中值计算公式,(三)组中值,组中值=(上限下限)2=下限组距/2=上限组距/2(重合式组限)=(本组下限下一组下限)2=本组下限组距/2=下组下限组距/2(不重合式组限),重合式组限时:组距=上限下限组中值=(上限下限)2=下限组距/2=上限组距/2不重合式组限时:组距=下组下限本组下限=本组上限前组上限组中值=(本组下限下一组下限)2=本组下限组距/2=下组下限组距/2组距式分组中:第一组开口(多少以下),组中值上限相邻组组距/2最后一组开口(多少以上),组中值下限+相邻组组距/2,总结,全距与组距等距与异距组限与组中值开口组与闭口组连续组距分组重叠组限“含下不含上”原则不连续组距分组,组距式分组举例,例:学生按成绩分组(分),(1)506060707080809090100,(2)60以下60697079808990以上,组距=80-70=10,上限:80下限:70,开口组,闭口组,组中值,组中值,组中值,重叠组限值70归于7080组,不连续组距式分组,连续组距式分组,第四节统计汇总,一、统计汇总:即在统计分组的基础上,将统计资料归并到各组中去,并计算各组和总体的合计数(包括单位总数和标志总量)的工作过程。二、统计汇总的形式:1、逐级汇总2、集中汇总3、汇审汇编4、综合汇总三、统计汇总的技术1、手工汇总2、电子计算机汇总,第五节分布数列,分布数列也称次数分布或次数分配,指反映总体单位在各组分布状况的一系列数字。分布数列组成要素:1、组的名称:分组标志的具体体现2、各组次数(也称频数)或频率,一、相关概念,次数:也称频数,是落在各类别中的数据个数。比例(频率):是一个总体中各组的数量占总体数据的比重。通常用于反映事物的构成,假定总体数量为N被分成K个组,每组的数量分别为N1,N2Nk,则比例定义为Ni/N,各部分比例之和为1。比率:是各不同类别的数量的比值。比率不是总体中部分与整体之间的对比关系,因而比值可能大于1,为方便起见,常用100作为基数,比如人口性别比:男女比例105:100。,频数密度(单位组距内分布的频数):采用异距分组,各组次数(频数)的多少受到组距不同的影响,为消除异距分组所造成的影响须计算频数密度。频数密度的计算公式:频数密度=频数/组距各组频数密度与各组组距乘积之和等于总体单位数,一、相关概念,例:某城市居民关注广告类型的分布,二、分布数列的分类,(一)按分组标志不同分为品质数列和变量数列,1.品质分布数列举例:,二、分布数列的分类,2.变量数列举例:,(一)按分组标志不同分为品质数列和变量数列,二、分布数列的分类,(二)按照分组形式不同分为单项式数列和组距式数列,单项式数列:各组由一个具体的变量值(单项)来表示的数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合。,二、分布数列的分类,【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,单项式数列举例,二、分布数列的分类,编制结果如下:,二、分布数列的分类,(2)组距式分组:组距式分组是以变量值变动的一定范围(区间)作为一组,区间的距离就是组距。这样的分组所形成的变量分配数列叫组距式变量数列,简称组距数列。每一组变量值中,其最小值称为下限,最大值称为上限。对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。组距式分组分为:间断式组距分组和连续式组距分组,(二)按照分组形式不同分为单项式数列和组距式数列,二、分布数列的分类,间断组距式分组和连续组距式分组(1)间断组距式分组:是指组限不相连的分组。(2)连续组距式分组:凡是组限相连(或重叠)的分组,即以同一数值作为相邻两组的共同界限的分组。统计上规定:“上限不在内”原则,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。离散型变量,可间断组距式分组,也可连续组距式分组连续型变量,只能采用连续组距式分组。,二、分布数列的分类,按次数分布不同分为钟型分布数列、U型分布数列、J型分布数列,1.钟型分布:,特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。,二、分布数列的分类,钟形分布具体可分为对称分布和非对称分布。,对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,如图。,二、分布数列的分类,对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布。例如,农业平均亩产量、零件公差、商品市场价格、身高、体重、智商、纤维长度、细纱强度、粮食作物产量等。正态分布在社会经济统计学中具有重要意义。在非对称的分布中,有不同方向的偏态,右偏(图2),左偏(图3),二、分布数列的分类,右偏左偏,二、分布数列的分类,2U形分布U形分布的特征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征。绘成曲线图,象英文字母“U”字。如图所示。,二、分布数列的分类,有些社会经济现象的分布表现为U形分布,例如人口死亡率分布。由于人口总体中幼儿死亡人数和老年死亡人数均较高,而中年死亡人数最低,因而按年龄分组的人口死亡率便表现为U形分布。,二、分布数列的分类,3.J形分布J形分布有两种类型。正J形分布是次数随着变量值的增大而增多,绘成曲线图,犹如英文字母“J”字。反J形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“J”字,图形如下:,二、分布数列的分类,在社会经济现象中,有一些统计总体呈J形分布。例如,市场经济当中,投资额按利润率大小分布,一般均呈正J形分布;而人口总体按年龄大小分布,则一般均呈反J分布。,二、分布数列的分类,三、简单分布数列的编制,1、品质分布数列的编制:,只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:,2、变量分布数列的编制步骤:,第一步:将原始资料按数值大小依次排列。,第二步:确定变量的类型和分组方法(单变量分组或组距分组)。,第三步:确定组数和组距。当组数确定后,组距可计算得到:组距=全距/组数全距=最大变量值最小变量值。,第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。或者第一组和最后一组采用”以下”和”xx以上”表示),第五步:汇总出各组的单位数,计算频率,并编制统计表。,三、简单分布数列的编制,编制等距数列,适用于总体单位的标志值变动比较均匀的情况,己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。,实例,三、简单分布数列的编制,编制步骤:,求变异全距,确定组距及组数,R组距(d)组数(m),三、简单分布数列的编制,计算组数(组数不宜过多,也不宜太少),上例中,取d=5,则有,三、简单分布数列的编制,确定组限,三、简单分布数列的编制,计算次数,编制结果:,25+(25-20)/2=27.5,三、简单分布数列的编制,四、简单次数分布图的编制,1、单项式数列次数分布图以变量为横轴,以次数为纵轴,用折线连接各坐标点,绘制曲线图。2、组距式数列次数分布图(1)等距数列(2)不等距数列(换算成标准组距次数)组距式数列次数分布图则有直方图和曲线图两种,而且曲线图是在直方图的基础上绘制的。,等距数列分布图绘制的步骤:,(1)以横轴代表变量,并在上面标出各组组限值所在位置,以纵轴代表次数;(2)以各组组距为宽,各组次数为高,绘出各组所对应的直方图;(3)将各直方图上端的中点连成一条折线,就形成次数分布曲线。,四、简单次数分布图的编制,【例】某车间工人日加工零件分布情况,画出直方图:,四、简单次数分布图的编制,分组数据直方图,遇到异距数列时,则通常按各组的标准组距次数绘制直方图以表示其分布.标准组距次数=频数密度标准组距其中:标准组距通常是组距数列中的最小组距频数密度=某组频数/某组组距绘制分布图的步骤:(1)以横轴代表变量,并在上面标出各组组限值所在位置,以纵轴代表各组的标准组距次数(2)以各组组距为宽,各组的标准次数为高,绘出各组所对应的直方图,四、简单次数分布图的编制,【例】某车间工人日加工零件情况:,四、简单次数分布图的编制,分组数据曲线图(曲线图的绘制),12,15,9,6,3,100,110,120,130,140,150,160,180,日加工零件数(个),频数(人),图某车间工人日加工零件数的曲线图,累计次数分布表的编制向上累计:即从低组到高组累计,表示该组上限以下的次数(频率)有多少。向下累计:即从高组到低组累计,表示该组下限以上的次数(频率)有多少。,累计次数分布图的编制编制方法:以变量为横轴,累计次数和累计频率为纵轴,绘制累计次数分布表。,累计次数分布:可以说明截止到某一组变量值以下或以上所对应的分配次数是多少。,五、累计次数分布,通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。想一想:第四组的累计结果说明什么问题?,2,7,21,52,117,169,192,200,1.0,3.5,10.5,26.0,58.5,84.5,96.0,100,8,31,83,148,179,193,198,200,4.0,15.5,41.5,74.0,89.5,96.5,99.0,100,五、累计次数分布,第六节统计资料的显示,(一)统计表统计表是集中而有序地表现统计资料的表格。统计表的结构从组成因素看,总标题、横行标题与纵栏标题、指标数值。总标题(也称统计表的名称),它用概括性的文字简单明了地说明统计资料的时间、基本内容和范围。一般写在表的上部中端。横行标题反映统计表的主要项目,写在表的左方。纵栏标题是统计指标的名称,说明纵栏所列各项资料的内容,写在表内上方。指标数值也称数字资料,它是统计表的具体内容,列在各横行标题和各纵栏标题的交叉处。任何一个具体数值都由横行标题和纵栏标题所限定。,第六节统计资料的显示,表12000年A国工业企业固定资产投资情况,总标题,横行标题,纵栏标题,指标数值,统计表的内容可以分为两个组成部分:一部分是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组,或者是总体单位的全部,这一部分习惯上称为主词。另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上称为宾词。,统计表的内容,第六节统计资料的显示,统计表的内容,表2000年A国工业企业固定资产投资情况,主词,宾词,第六节统计资料的显示,统计表的种类,按用途分:调查表汇总表分析表按主词的分组情况分简单表分组表复合表,第六节统计资

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论