统原PP第三章统计整理_第1页
统原PP第三章统计整理_第2页
统原PP第三章统计整理_第3页
统原PP第三章统计整理_第4页
统原PP第三章统计整理_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第三章 统计整理,第一节 统计整理的概念和作用 一、统计整理的概念 统计整理 指根据统计研究的目的,将所搜集到的大量原始资料用 科学的方法进行分组汇总,使之系统化、条理化,成为 能够反映事物总体特征的综合资料的过程。统计整理一 般指初级资料整理,广义的统计整理也包括次级资料的 再整理。 手工整理 统计整理一般是为了某项统计研究或统计任务的特定目 的而进行的;由于受计算手段的限制,统计整理的主要 内容是汇总、分组、再加工,整理后的资料主要存储在 纸介质上,然后按既定的目的使用。 计算机整理 可以通过建立数据库把这些宝贵的资料加以有序的排 列,储存在磁介质上,然后可以根据多方面、多层次随 时发

2、生的需要,多次使用于不同的目的,从而实现统计 数据的一源多用,信息共享。,2,使用电子计算机进行统计整理,不仅可以加快计算速度,扩大计算规模,提高计算准确性,而且可以大大增加统计信息的利用率。下面示意图显示计算机整理与手工整理获得信息量的比较。 在电子计算机整理条件下,统计整理的概念可以概括如下: 统计整理 指根据研究的需要,将统计调查所得的原始资料或已加 工的综合资料进行科学的处理和管理,包括对统计资料 的分组、汇总、加工、传输、存储、更新,使之系统化 条理化,反映事物的总体特征,并在建立数据库的基础 上达到一源多用。,3,二、统计整理的作用(意义),1统计整理是承前启后的环节 统计调查搜集

3、到的统计资料是个 别的、分散的,不能反映总体的综合数量特征,达不 到认识社会经济现象总体的目的。因此在统计调查之 后,统计分析之前,需要把原始资料系统化、条理化, 使其能够反映事物总体特征。 2统计整理是认识过程中的一个重要阶段 从认识过程来看,社 会经济统计是一种从个体的实际表现到总体的综合数 量表现的认识过程,也是从对现象的感性认识到对现 象的规律性认识。 3统计整理是统计分析的基础工作 统计整理的目的,是为统计 分析准备系统化、条理化的综合资料。统计分析是要 找出事物数量关系的规律性,得到对社会经济现象的 系统的、深刻的认识。统计整理可以从原始数据中获 得大量新的信息,以满足统计分析的需

4、要。,4,三、统计整理的内容,(一)统计数据处理 1.分组 统计分组的目的在于将同质总体中具有不同特点的单位按 一定标准区分为几个不同的类型,从而更深入地研究总体 的特征,这是完成从个体数据向总体数据转化的关键一步。 2.汇总 确定统计分组后,还需要将原始数据按分组标志进行综合,这一过程称为统计汇总,在不需要分组时,统计汇总是指 直接对各调查单位的数据进行综合的过程。汇总的结果为 各种总量指标,包括标志总量和总体总量。 3.制表 统计资料经过分组、汇总形成了说明总体情况的统计资料 这些资料还需要用一定的形式来表现,统计表是最常用的 表现形式。统计表能有条理地排列统计资料,科学地组织 统计资料、

5、系统地积累统计资料,使人们在利用统计资料 进行分析对比、研究和了解情况时十分方便。,5,(二)统计数据管理,1.传输 传输是指统计数据在不同单位之间的传递、输送。统计数据 传输经历过人工护送、邮寄报表、电话、传真和寄送软盘、 磁带等几种方式,现在用计算机联网、远程通讯传输。 2.存储 存储是指如何保存统计数据。传统的保存数据方式是存储在 纸介质上,或者报表、或者资料本,这使得查阅资料很麻烦 新的存储方式主要存放在磁介质或微缩胶片上。统计数据库 的建立,是统计资料的存储和管理的核心,也是统计数据 源多用的关键。 3.更新 由于统计信息具有一定的时效性,反映一定内容的统计资料 在段时间以后就会失效

6、,这就要不断补充新的统计资料, 代替己失效的资料,这就是统计资料的更新。 4.输出 输出是指统计资料整理结果的表达。数据处理阶段的制表是 一种输出方式,还可以以计算机屏幕显示、打印数字、制图 等不同的方式输出。,6,第二节 统计整理的组织与技术,一、统计整理的步骤p42 统计整理首先都做以下两步工作: 1设计和编制统计资料整理方案,确定整理工作的具体规划和要 求,这是整理工作的指导性文件。 2对原始资料进行审核,审核它们是否准确、完整,如果发现问 题,要进行必要的补充、调整、纠正,这是统计整理的前提。 在手工整理条件下,统计整理的步骤可用下图表示。,7,在计算机整理条件下,统计整理的步骤可用下

7、图表示。,8,3.对调查资料进行分组、汇总、计算 依照一定标志,对调查资料进行分组。按分组的要求,对各项数字进行汇总,计算分组单位数、总体单位数、分组标志总量和总体标志总量。 4.对汇总后的调查资料审核 对整理好的资料再一次进行审核,改正汇总过程中所发生的各种差错。汇总后审核可以从以下几方面进行: 1)复计审核,即对每个指标数值进行复核计算; 2)表表审核,即审核不同统计表上重复出现的同一指标数值是否一致,对统计表中互有联系的各个指标数值,则审核它们之间是否衔接和符合逻辑性; 3)表实审核,即对汇总得到的指标数值,与了解的实际情况联系起来进行检查; 4)对照审核,即对某些统计、会计、业务三种核

8、算都进行计算的指标数值,应进行相互对照检查,看数字是否相同。 5.编制统计表、绘制统计图 把整理好的统计资料用统计表或统计图的形式表现出来,以简明扼要地表现社会经济现象在数量方面的具体特征和相互关系。,9,二、统计整理的组织形式,(一)逐级整理 按照一定的统计管理体制对原始资料自下而上, 逐级地汇总整理。我国现行统计报表较多是采用 这种整理方式,专门调查的资料也有不少是采用 这种整理形式。这种整理形式的优点是可以就地 在较小范围内对数字资料进行及时检查和核对, 资料也能及时提供给各级领导;缺点是汇总层次 多,反复转录,易出现差错。 (二)集中整理 把全部原始资料集中在一个机关直接进行整理, 对

9、于十分重要的或要求时效性极高的调查,往往 采取这种整理形式。优点是便于采用计算机整 理,能够提高资料的准确性和利用率;缺点是对原始资料的差错不易及时发现和改正,整理结果不能及时满足本地区、本部门的需要。 (三)逐级整理与集中整理相结合 兼有二者的优点。,10,三、 统计整理的技术,1、手工整理技术 (1)划记法 用点、线或其它符号计算各组和总体单位数的方 法,常用的符号有“正”字或“册”等,划记法简便易行, 但容易出现漏错,只适用于总体单位不太多的情况。 (2)过录法 将分散的原始资料过录到预先设计好的整理表上, 并计算出各种合计数,然后再填到综合统计表上去。过录法汇总的内容比较全面,但工作量

10、比较大。 (3)折叠法 将所有的调查表需要汇总的项目及其数值全部折在 边上,一张接一张地叠在一起直接加总。这个方法 简单易行,报表汇总常用此法,但汇总时必须细致。 (4)卡片法 一个调查单位用一张卡片,将这个单位的有关资料 全部摘录在卡片上,利用卡片作为分组计数的工具, 加总总体单位数和标志值。这个方法比较准确可靠, 但比较费工费时。,11,2、计算机数据处理的组织技术,(1)选择计算机软件包或自编程序 为一般用户着想软件包中大 部分具有数据处理功能,例如SPSS、LOTUS、 SAS、TSP、MINITAB等。 (2)编码 统计调查表中有两种信息,一种是数字信息,如某人 18周岁,某企业某月

11、总产值为120万元;另一种 是文字信息,如某人为男性,朝鲜族,高中毕 业。前者可以直接录入计算;后者必须根据统计分组 编码的规定,将文字信息转化为数字信息,如男 性编码为1,朝鲜族为10,高中毕业为03。 (3)数据录入 编码之后的调查表只有数字符号,采用手工录入 或光电录入。 (4)数据编辑 让计算机对数据进行自动检查或修改,或者由计 算机打印错误清单,由人工进行检查更正。 (5)计算与制表 根据事先编好的程序,对数据进行计算和制表,得出所需要的各种分组汇总表或各种排序表。,12,第三节 统计分组,一、概念 根据统计研究的任务和现象的特点,按照一定的标志把 总体划分为若干组成部分,每一部分称

12、为组。 就总体而言为“分”,就个体而言为“组”; 以分组标志为准,“同者归类,异者区分” 二、作用 1、划分社会现象的不同类型,称为类型分组; 2、反映社会现象的内部结构,称为结构分组; 3、分析现象之间的依存关系,称为分析分组; 4、经过统计分组整理后,可以发现零星分散统计资料的特点与规律。,13,第三节 统计分组,三、方法 1、分组标志的选择 反映本质特征和内在联系的标志 1)根据统计研究的目的与任务选择分组标志 如果研究的目的是要分析不同经济类型的企业在总体中的构成,那么就要选择经济类型作为分组标志;如果要研究工业企业规模构成状况,则可以选择产值、固定资产原值等作为分组标志。 2)要从众

13、多标志中,选择最能反映被研究现象本质特征的标志作分组标志 职工家庭成员人均收入水平更能反映职工生活水平的高低,更能反映现象的本质特征,因为,即使某一职工工资水平较高,但如果他赡养的人口数很多的话,其家庭生活水平也不会很高。 3)根据现象所处的历史条件或经济条件来选择标志 在生产力水平较低的情况下,用职工人数的多少来表示企业规模的大小比较适当;而在技术进步的历史时期或技术装备比较先进的情况下,有的企业由于采用了机械化生产,虽然职工数不多,但生产能力却很大。 4)此外,在选择分组标志时,还要遵循穷尽性和互斥性两个原则。 2、分组界限的确定 相邻组间的性质界限或数量界限 品质标志分组 属性差别(类型

14、、结构,规定分类标准目录) 数量标志分组 数量差异(分析、质变界限,成绩、计划) (1)单项式分组:即每一组只包含一个变量值。 (2)组距式分组:即在变量值变异幅度较大时,将变量值取值范围人为的划分为若干个区间 四、统计分组体系 对同一总体进行多种分组而形成的相互联系、 相互补充的系统,称为分组体系。 1、简单分组和平行分组体系。2、复合分组和复合分组体系。,14,简单分组和平行分组体系,复合分组和复合分组体系,15,16,第四节 次数分布和统计表,、次数分布的概念 次数分布 在统计分组的基础上,将总体中的所有单位按组归类整 理,形成总体单位数在各组的分布,叫做次数分布,也 称为分布数列,或称

15、分配数列。 频数与频率 各组单位的次数,又称频数;各组次数与总次数之比 称为频率。 分 类 根据分组标志的不同,分布数列可以分为品质分布数列 和变量分布数列两种。 按品质标志分组所编制的分布数列叫做品质数列; 按数量标志分组所编制的分布数列叫 做变量数列。 (1)单项式分配数列(2)组距式分配数列 意 义 次数分布是统计整理的一种重要形式,它可以表明总体 的分布特征、结构情况,并据以研究总体某一标志的平 均水平及其变动的规律性。,17,开口组的组距组中值按照相邻组计算,18,在组距数列中,需要明确以下几个概念: 组限:组距数列中,各组的界限称为组限。组限又分为上限和下限。下限是每组最小的标志值

16、,上限是每组最大的标志值。如标志值150160元一组,150元和160元是组限,150元为下限,160元为上限。 组距数列中,如果各组的组限都齐全,称为闭口组;若组限不齐全,即有上限缺下限或有下限缺上限,称为开口组。,19,组距:每组下限与上限之间的距离叫组距。每组组距等于上限与下限之差,即组距=上限下限。标志值150160元组的组距=160元150元=10元。 组距又有两种表现形式:一种是各组组距都相等,称为等距。这样的组距数列称为等距数列。一种是各组组距不完全相等,称为异距。这样的组距数列称为异距数列,也称不等距数列。,20,组中值:每组下限与上限之间的中点数值叫组中值。组中值等于下限与上

17、限和的一半。 标志值150160元组,21,若 “160元以下”,则,若 “200元以上”,则,22,确定组数时,还可以利用美国学者斯特基斯(HASturges)提出的经验公式。其公式如下: (其中N为标志值项数) 不过这一公式不是在任何情况下都必须遵守的法则,它只适用于总体趋于正态分布的条件下进行等距分组的情况。而且,利用斯特基斯公式确定组数时,如果数据个数少,则确定的组数数值过大;数据个数多,则确定的组数数值过小。所以,在实际工作中,这一公式作为组数确定的参考公式运用是可以的,但不必严格地根据公式所确定的组数执行。,23,全距、组数和组距的关系用公式表达如下,组距,,全距,,组数,,最大变

18、量值,,最小变量值,24,以上计算结果只是一个参考数值,为计算方便,实际工作中一般组距取5或10的整数倍。当然也可以先确定组距,再确定组数。 例如,编制上例某县城40户居民家庭人均月消费性支出分配数列时,其组数确定为: 组数=1+3.322lg40=6.32 因此,可以取整数6为组数。则: (元) 组距可以取为50元。,25,品质数列,.,26,表 我国某年工业企业按轻重工业分组资料,27,单项数列,.,28,例如,某电业局发电厂按拥有发电机组的套数分组, 可编成如下变量数列:,29,等距数列,.,30,异距数列,.,31,二、次数分布的表示方法,(一)列表法 用统计表来表示次数分布,称为列表

19、法。 学生考试成绩组距数列表 频数是分布在各组的学生数,频率是各组学生数与学生总数之比,又叫比重。,32,累计次数 把各组次数累计起来叫做累计次数分布,可据以研究在 一定组限值以上或以下的次数总和。累计次数又分向上 累计和向下累计两种。 向上累计 用小于各组上限的次数累计计算,即从分组资料小值一 端开始累计; 向下累计 用大于各组下限的次数累计计算,即从分组资料大值一 端开始累计,累计次数到总次数止。 密度次数 密度次数组次数组距。它与比重次数的关系是:在 等距数列中两者作用相同,但在异距数列中两者作用不 同,在异距数列中的密度次数,可使不可比的次数变为 可比,用可比次数作图或分析计算才有意义

20、。由于异距 数列的密度次数不同于原次数,用这两种次数计算结果 也不同,当以密度次数为准。,33,(二)图示法,直观地显示次数分布的特征,可用统计图来表示次数分布,这一方法称为图示法。常用的表示次数分布的图形有直方图、折线图和曲线图。 1直方图 即用直方形的宽度和高度来表示次数分布的图形。例:直方图的各直方形的宽度相等,都是等组距10分,高度是各组学生人数(次数)、各直方形的高低表示各组次数的多少。,34,统计图,直方图,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(一般标在右方),35,2折线图 用连续的折线来表示次数分布的图形。例如,用分组 资料的组中值作横轴尺度,学生人数(次数)作

21、纵轴尺 度,然后用组中值x和组次数f画出坐标点,将各坐标点 连接起来,就是折线图。也可把各直方形顶边的中点用 直线连接而成。,36,用折线图还可以表示累计次数的分布,由于累计次数分为向上累计和向下累计,也可以画出向上累计次数分布折线图和向下累计次数分布折线图。图中向上累计折线图用各组上限与累计次数画坐标点,向下累计折线图用下限画坐标点,把两条累计线画在一个图上,两线有一个交点,在累计次数尺度上是总次数的一半(本例为= 20人),在分数尺度上为74.6分,这是本数列的中位数Me,在此分数上下各有20人。,37,3曲线图 即用曲线来表示次数分布的图形。变量数列所表达的次数分布,有经验分布与理论分布

22、之别。根据项数有限的随机样本编制的变量分组数列所画出的是折线图,理论分布是假定资料项数无限多,组距无限小时经验分布的渐近分布,可用数学方法推导出来,画出的图形是平滑曲线。理论分布在数理统计中有十分重要的用途。,38,4.圆形图,圆形图(Pie chart)又叫饼形图,是用圆形的面积大小来表示统计资料的图形,多以图形内扇形面积的大小表示现象数值的大小或现象各部分所占的比重的图形结构,例如,根据表3-7的资料可画圆形图,如图3-3所示。圆形图常常用于总体各部分的结构比例。对于显示较少的数据点很有效,但数据量太大时则很难说明问题。,39,图3-3 2006年中国国内生产总值结构图资料来源:中国统计年

23、鉴2007,57页。北京:中国统计出版社,2007,40,三、次数分布的主要类型,(一)钟形分布 钟形分布 是在社会经济现象中最常见的一种分布类型,特点是“两头小、中间大”,即靠近中间的变量值次数多,靠近两端的变量值次数少,绘成曲线图,就像一口钟,所以称其为钟形分布。 钟形分布有对称的和非对称的两种,对称分布有一个最高的次数,在它上下两侧的次数呈对称式下降,正态曲线就是一种对称钟形曲线;非对称曲线按其偏斜方向不同而分为负偏(左偏)和正偏(右偏)两种,负偏是在次数分布高峰的左侧(小值方向)次数偏多,正偏则反之,在次数高峰的右侧(大值方向)次数偏多。,41,例如,1984年中国农民收入分布就是一种

24、正偏钟形分布,图中显示出农民收入分布变化趋势是:高收入人口所占比重显著增加,低收入人口所占比重显著下降,人口众数由低收入组向较高的收入组移动。 中国农民收入分布,42,(二)U形分布,所谓U形分布,即靠近中间的变量值分布次数少,靠近两端的变量值分布的次数多,形成“两头大、中间小”的分布特征,绘成曲线图,像英文字母U,也称为倒钟形分布。 例如,人口按年龄分组的死亡率分布,是U形分布。两端高、中间低的U形图,表明婴儿死亡率和老年人死亡率都较高,中青年人的死亡率低。U形分布也有对称与非对称之别。,43,(三)J 形分布,J形分布的特点是随着变量值的增大,其次数呈单调增加或单调减少,可分为正J形分布和

25、反J形分布二类。 J形分布 图中新中国死亡分布曲线(根据1982年全国人口普查材料)已呈正J形,接近于人口低死亡率的模式,说明低年龄组死亡人口所占的比重大大下降,死亡人口的重心移向老年。这是新中国经济发展、社会进步的一个重要表现。,44,(四)洛伦茨分布,为了研究国民收入、国民财富在国民之间的分配,美国统计学家洛伦茨(MoLorenz)提出了洛伦茨分布曲线,如图所示。横轴OH表示人口(按收入由低到高分组)的累计百分比,纵轴OM表示收入的累计百分比。假定收入绝对平等,人口累计百分比等于收入累计百分比,洛伦茨曲线为对角线OL。当收入绝对不平等时,1的人口占有100的收入,洛伦茨曲线为折线OHL。实

26、际上,各个国家的收入分配曲线都介于OL和OHL之间,为一条上凹形曲线。,45,罗伦茨曲线例,46,我国1978年、1989年居民收入分配的洛伦茨曲线图见图。图中的曲线显示,我国居民收入分配的平等度明显大于印度和巴西。从图中还可以看出,1989年我国居民收入的差距比1978年拉大了一些。这是由于城乡多种经济成份的发展,允许一部分人先富起来的政策的贯彻,使得城乡居民的收入差距比过去大了。 图 312 中国、印度、巴西居民收入分配的洛伦茨曲线,47,基尼系数,测定收入分配不平均程度的统计指标。 1、定义 为不公平面积。 2、计算 3、意义 w=0 收入分配绝对平均 w=1 收入分配绝对不平均 0w1

27、 w越趋于0,收入分配越平均; w越趋于1,收入分配越不平均。,48,基尼系数是衡量总体收入差距的重要指标。从1978年到1984年,我国基尼系数稳定在0.16的水平。而从1984年开始,基尼系数一路攀升,到2007年已达到0.473。一般说0.2之下叫“高度平等”,0.2到0.4叫“低度的不平等”,0.4以上叫“高度不平等”,我国现在0.473说明不平等的问题已经比较突出。 至于2007年以后,我国的基尼系数又达到了何种“新高”,几乎所有官方媒体和统计部门保持了相对的沉默,似乎基尼系数到0.473以后就停滞不前了。在百姓的生存体会中,这个数据肯定还在继续扩大,事实就是如此。,49,这是“世界

28、工资研究”发表的最新统计资料,50,四、 统计表,(一)统计表的概念和分类 统计表 是统计资料的一种表现形式。把统计资料按照一定 的结构和顺序在表格中表现出来,这种表格叫作统 计表。 意 义 用统计表来表达数据,比用文字表达更清晰更连贯、 更简明、更节省篇幅。统计表能以综合的形式提供 系统的统计资料,便于显示数字之间的联系,便于 进行比较和研究。 分 类 1、统计表按表的用途不同,可分为调查表、整理表、分析表;2、统计表按表的总体分组情况不同,可分为 简单表、简单分组表、复合表。,51,统计表的种类 1用途不同 调查表:调查项目以表格的形式表示出来。 整理表(又称汇总表):对调查资料直接整理的

29、结果。 分析表:表述统计分析资料的统计表。,52,1).简单表,指总体未经任何分组的统计表,它把总体单位依次排列。或者把总体单位按时间次序排列,具有一览表性质。,2.对总体是否进行分组及分组情况不同分,53,2)简单分组表,指总体仅按某一个标志进行分组的统计表。利用分组表可以揭示不同类型的不同特征,研究总体的内部构成,分析现象之间的依存关系等。 1990年农民家庭平均每人纯收入,54,3)复合表,复合表是总体按两个或两个以上标志进行复合分组的统计表。复合表把几个标志结合起来,能较深入地分析比较复杂的社会经济现象。 1990年农民家庭平均每人生活消费支出及构成,55,3.性质不同 时间数列表:主

30、词栏中是按时间单位的顺序排列的统计表,如表29所示。,表2-9 我国历年国内生产总值资料,56,空间数列表:反映在同一时间不同空间范围内(如不同单位、不同地区、不同部门等)的资料的统计表,如表210所示。,表2-10 我国1998年国内生产总值资料,57,统计表的结构,统计表,统计表的名称,用以概括统计表中全部统计资料的内容,一般放在表的上端中央,又称横标目,它表明统计表横行项目的名称,一般置于表的左边,又称纵标目,它表明纵栏指标名称,一般置于表的右上方,一般在各横行标题与纵栏标题的交叉处,是说明总体(各组)数量特征的指标。,统计表所要说明的对象,即统计总体各个组成部分的名称,一般是指表的标行

31、标题部分 。,用来说明主词的各种统计指标,一般指表的纵栏标题和数字资料部分 。,58,59,宾词的设计,统计表中宾词的设计主要指统计指标的编排。宾词指标的设计在不要求分组的情况下,可以按照指标的主次先后排列;在需要分组时,宾词指标的设计分为简单设计和复合设计。宾词指标的简单设计是将宾词中的各个指标作平行的设置,即指标与指标之间彼此独立。如表3-21所示,60,61,宾词指标的复合设计是将说明主词的各个指标按分组标志作层叠的设置,如表3-22所示, 宾词指标的复合设计能够更全面、更深入地描述所研究总体的特征,但由于复合设计中根据分组标志所划分的指标栏目数量呈乘积关系,当分组标志较多时,宾词指标会

32、分得过多过细,容易造成统计表混乱不清。因此,对宾词指标的复合设计应慎重考虑。,62,63,(二)统计表的设计规则和标准化,1、统计表形式的设计 (1) 统计表通常都应设计成纵横线条交叉组成的长方形表格, 在计算机处理的条件下,表式设计要考虑计算机输出的条件。在手工制表的条件下,统计表除尽量使长宽之间有适当比例,以保持美观之外,应当考虑到印刷开本的条件。 (2) 统计表一般采用开口式, 表的左右两端不画纵线,表的上下通常用粗线封口,统计表的各栏可用(1)、(2)、(3)统一编号。 (3) 为阅读方便, 主词按次序排列的横行数据一般每隔五行要留一个空行。 (4) 统计表的注解、数字的资料来源等一般

33、都写在表的下面,以便核查, 必要时还可附以简要文字说明,以明确统计表所反映的主要情况和问题。,64,2、统计表内容的设计,(1) 统计表的主语和谓语的安排要通盘考虑,内容不要过分庞杂, 最好一个表集中说明一个问题。如果内容较多,可分成几张表。 (2) 统计表的总标题和纵横标题都要简明扼要,能恰当地反映表的内容,纵横各栏的排列要注意表述资料的逻辑关系,反映现象的内在联系。 (3) 统计表中的数字要注明计算单位,如果全表只有一个统一的计 算单位,可以列在表的右上角;如各栏的计量单位不同时,则应将计量单位标写在各纵栏标题的下方或右侧;当同行统计资料以同一单位计量,而各行的计量单位不同时,则可在横行标

34、题后添列一计量单位栏,用以标写各行的计量单位。 (4.) 表中的数字资料应填写整齐。当数据不足本表最小单位时,应用点线“”标明。 (5). 表式标准化是统计制表发展的必然趋势。随着制表标准的颁布,统计制表必须严格按国家标准执行。,65,第五节 统计软件应用,一、利用EXCEL表格中FREQUENCY函数进行统计数据的分组整理 在Excel的统计函数中有一个专门于统计分组的FREQUENCY函数,可以完成分组、计算频数和频率等操作。 例如,某班40位学生的英语考试成绩如下: 89 88 76 99 74 60 82 60 89 86 93 99 94 82 77 79 97 78 95 92 8

35、7 84 79 65 98 67 59 72 84 85 56 81 77 73 65 66 83 63 79 70 现准备将这40名学生的英语考试成绩分为5组,分别为60以下、60-70、70-80、80-90、90-100。,66,第一步,将40名学生英语考试成绩输入A1至A40单元格,并选定C3:C7单元格作为放置分组结果的区域(选定后反白显示)。,67,第二步,从“插入”菜单中选择“函数”项,在弹出的对话框中“函数类别”列表中选择“统计”,在 “选择函数”列表中选择FREQUENCY,回车进入FREQUENCY函数参数对话框(对话框见图3-5)。,68,第三步,在FREQUENCY函数

36、参数对话框中填写Data array和Bins array,Data array中输入待分组计算频数分布原数据,本例可输入A1:A40;Bins array中输入分组标志。FREQUENCY要求按组距的上限分组,不接受非数值字符的分组标志(如“以下”或“不足”之类),因此,断开的分组标志可以直接输入各组上限数值,而重叠的分组标志则以各组上限减1的方式确定分组标志,这样上限数值自动计入下一组。本例的分数分段区间为50-60,60-70,70-80,80-90,90-100,因此可输入59、69、79、89、99。由于分组结果要给出一组频数,故必须以数级公式的形式输入,即在输入数据的两端加大括号,

37、各数据之间用分号隔开,即输入59;69;79;89;99。(需要注意的是,如果分组变量为连续变量,而且变量值中有小数的话,那么分组标志则应以各组上限减0.1、减0.01或减0.001等的方式确定,至于减多少要看变量值的小数位数。),69,输入完毕,即在框下看到频数分布2;7;11;12;8(后面的0表示没有其他)。 第三步:按Shift+Ctr1+Enter组合键,即将频数分布2;7;11;12;8记入指定的C3:C7单元格内(注意:回车无效)。 第四步,取得频数分布后,可按图3-6所示将横行标题和纵栏标题填写齐全。,70,第五步,取得频数分布后,再列表计算频率以及累计频数和频率。 (1)人数

38、合计,可单击C8单元格,输入“SUM(C3:C7)”,回车得出结果为40人(SUM是求和函数)。 (2)D列频率,可先单击D3单元格,输入“C3/40*100” (*是乘法符号)(除数要直接输入数字40,否则无法使用填充柄功能),回车得出结果为5;然后利用填充柄功能按住鼠标左键向下拖曳,至D8单元格放开鼠标,即得出D4、D8单元格的频率。 (3)E列向上累计次数可先单击E3单元格,输入“C3”,再单击E4单元格,输入“=E3+C4”, 然后利用填充柄功能按住鼠标左键向下拖曳,至E7单元格放开鼠标,即得出E5E7单元格的累计次数。F列引用E列公式即可得到累计频率。G列、H列可仿照此法计算。,71

39、,二、利用EXCEL表格中的图表向导绘制统计图,利用上例整理出的次数分布表,选中B3:C7,点击图表向导,在图表向导对话框的图表类型中选择需要的图表类型,如柱形图、饼形图等,在子图表类型中选择适当的类型。(此处以直方图为例),72,回车填写数据区域:=sheet1!$C$3:$C$7(即选中C3:C7区域),系列产生在列。然后点序列,填写分类x轴标志: =sheet1!$B$3:$B$7(即选中B3:B7区域),再回车填写分类轴、数值轴标题,根据需要设置网格线、图例、数据标志等。点击完成即可完成统计图的绘制,如图3-8所示。图3-8 某班学生英语考试成绩次数分布图,73,上图格式可以调整,如果要消除各个分类间距(即各个直方形中间的间距),则双击直方形打开数据系列格式对话框或数据点对话框,点击选项页签,将分类间距调整为0,如果希望将各组数据用不同颜色表示,也可以选择“依数据点分色”。图3-9 数据系列格式对话框,74,单击确定,调整图表大小即可。图3-10 某班学生英语考试成绩频数分布直方图,75,饼形图结果,如图3-11所示。图3-11 某班学生英语考试成绩饼形图,76,三、利用数据分析工具分组并绘制直方图,由于在默认的情况下,Excel并没有安装分析工具库,因此在使用数据分析工具之前,必须先安装分析工具库。方法是单击工具菜单下的“加载宏”命令,在“加载宏”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论