第三章统计数据的整理(.doc_第1页
第三章统计数据的整理(.doc_第2页
第三章统计数据的整理(.doc_第3页
第三章统计数据的整理(.doc_第4页
第三章统计数据的整理(.doc_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 统计数据的整理通过统计调查,我们得到许多原始数据,但这些数据是反映总体单位特征的、分散的、不系统的,为此必须对数据进行整理,使之由“个别”上升到“一般”,成为既便于储存,又便于传递的反映总体特征的资料。统计数据的整理是统计分析的前提,关系到整个统计工作的质量,因此,必须十分重视统计数据的整理。统计数据整理的主要内容有:数据预处理、数据的分组(类)、汇总、整理后的数据显示。第一节 数据预处理一、数据的审核在分类汇总之前,必须对原始数据进行认真的审核。审核的内容是数据的完整性和准确性。所谓完整性审核,一是审核各调查单位的调查表或调查问卷是否汇集齐全,比如,已对500个学生分别发放了调查问卷,要审核是否全部回收,如果回收不全要及时催收;若无法催收,要清点已回收的数量;若回收的数量不能满足要求,必须进行补充调查。其次,要审核各份调查表或调查问卷的项目是否填写齐全。若填写不全要补充完整;若一些缺失的重要项目无法补充填写,视为无效调查表或调查问卷对其剔除。所谓准确性审核,就是审核各调查项目的填写内容是否准确。数据的准确性审核主要采用逻辑检查和计算检查。逻辑检查就是根据项目之间存在的内在联系,从逻辑上或常识上判断其合理性,以确定其正确与否。计算检查就是根据有些项目之间数量上的依存关系,通过简单的计算,检查数据有无错误。对于二手数据,应该弄清楚数据的来源、数据的口径、数据的时效性以及有关的背景材料,以便确定这些数据是否符合自己的需要,是否需要重新加工整理。二、数据的录入在对数据审核基础上,应该将调查所得的原始数据录入计算机形成数据文件,以便进行分组与汇总。用计算机Excel录入数据的文件格式为:第一列为各总体单位(或调查单位)的名称或编号,以后各列分别为调查所得的各变量的具体数据。应该注意的是,必须标示每列变量的名称标志。【例3-1】用单一表对重庆市5个企业2006年的销售收入等进行了调查,得到如下资料(单位:万元),将其录入到计算机Excel表格中。企业名称销售收入利税资产负债红星公司10505152142嘉林公司360019420290红光公司375040670370白云公司40055435渝乐公司38036033 录入后的文件格式如图3-1。图3-1 重庆市5个企业2006年销售收入等数据的文件格式二、数据的筛选与排序(一)数据的筛选筛选的目的主要有两个,一是对原始资料做进一步的准确性检查,将有错误的或不合要求的或录入有误的数据筛选出来,并根据具体情况给予修正或剔除。二是将符合某种条件的数据筛选出来。【例3-2】根据以上的数据文件,筛选出重庆市销售收入3000万元以上的企业;销售收入3000万元、利税20万元且资产500万元以上的企业。筛选出销售收入3000万元以上企业的计算机操作步骤是:解:第1步:顺次点击【销售收入】单元格、【数据】菜单、【筛选】和【自动筛选】命令,见图3-2。图3-2 Excel自动筛选命令第2步:顺次点击【销售收入】标志的下拉箭头、【自定义】, 见图3-3。图3-3 选择“自定义”命令第3步:点击对话框中的下拉箭头,选择“大于或等于”,并在其后的空格中输入3000,见图3-4。单击【确定】,即可得到图3-5所示的结果。图3-4 填写“自定义自动筛选方式”对话框图3-5 自动筛选结果要筛选出销售收入3000万元、利税20万元且资产500万元以上的企业,由于筛选条件大于两个,需要进行高级筛选。进行高级筛选时,必须在数据文件之前预留三行,输入筛选条件,见图3-6。图3-6 输入高级筛选条件顺次点击【数据】、【筛选】、【高级筛选】,填写对话框。在高级筛选对话框的【数据区域】、【条件区域】对应的空格中分别引用A4:E9、A1:D2,见图3-7。单击“确定”,即可得到筛选的结果。图3-7 填写高级筛选对话框(二)数据的排序从某种意义上说,数据的排序就是对资料的初步分析。因为通过数据的排序,可以对现象的发展趋势和分布状况有一个初步的认识,可以为统计分组提供有用的信息。有时,研究者就是要认识变量值最大的几个总体单位,比如,要认识某地纳税最多的几个企业。通过数据的排序,还可以发现极端值偏离一组数据的程度,从而对输入数据的正确性做出大致的判断。用Excel对数值型数据降序或升序排序,即可以用工具栏的图标进行,也可以用【数据】菜单中的【排序】对话框完成;若要按字母顺序、笔画多少进行排序,则必须用【数据】菜单中的【排序】对话框完成。第二节 数据的统计分组一、统计分组的含义与原则(一)统计分组的含义根据统计研究的目的和研究对象的特点,按照一个或几个标志,将被研究的统计总体划分为几个不同的组成部分,称为统计分组。任何统计总体都是由具有某种共同性质的许多个别单位所组成,这些个别单位除了它们的共性之外,在其它方面的特征各不相同。为了深刻认识总体的全貌,就需要把总体的全部单位按一定标志划分为不同的组成部分。统计分组实际上是对总体进行“分”与“合” 的过程。所谓“分”,就是将总体划分为几个不同的组成部分,“合”就是将性质相近的总体单位合并在一组。比如,按文化程度标志把被调查者分为不识字或识字很少、初中、高中、大学及以上几个组,就是把各个被调查者按照文化程度的差异分到不同的组,即为“分”;把具有相同文化程度的人归并到同一个组,体现了“合”。通过统计分组,可以划分社会经济现象的类型,可以研究现象的内部结构,也可以揭示某一现象与另一现象之间的依存关系。统计分组既是一种整理数据的方法,也是一种常用的统计分析方法。在分组时,对研究总体可以按一个标志进行分组,从一个方面说明和反映事物的分布状况和内部结构,这种分组叫简单分组。比如,对某一人口总体按年龄可以分为20岁以下、20-35岁、35-55岁、55-65岁几个组。在许多场合,要用两个或两个以上的标志对总体进行分组,即先按一个标志分组,在此基础上再按第二个标志分组,又再层叠地按第三个标志分组等,它可以从多方面反映事物的分布和内部结构,这种分组叫做复合分组。比如,一定时期的新增价值按物质生产部门划分为农业、工业、建筑业、商业和邮电通讯业,在此基础上,对各个组又按一定的标志分组,比如农业,可进一步分为种植业、养殖业、林业、渔业,这种分组可以进一步揭示新增价值的构成。(二)统计分组的原则统计分组必须遵循两个基本的原则,这就是穷尽原则和互斥原则,或不重不漏的原则。所谓穷尽原则,就是在分组时,必须使每一个总体单位都可以归属于某一组,而不能让任何总体单位遗漏。所谓互斥原则,就是在分组时,必须使总体的各个单位只能归属于一个组,而不能同时或可能同时归属于两个及两个以上的组。比如,把被调查者按从事的工作不同,分为企业工作人员、企业管理人员、科教文卫工作人员、个体从业人员等几个组,若某被调查者是企业的销售经理,那么,他既可以归属于企业工作人员,也可以归属于企业管理人员,这种分组不满足互斥原则。二、非数值型数据的统计分组可以对非数值型数据即分类数据或顺序数据分组,也可以对数值型数据分组。分组数据的性质不同,进行统计分组时的处理方法也不完全相同。对非数值型数据分组也称为分类。分类数据和顺序数据是对事物性质属性的描述,在分类的时候,二者的区别在于:按分类数据分组可以不考虑类别之间的顺序,而按顺序数据分组则必须按照一定的顺序排列所分的类别。有些现象的属性界限比较明确,且类别不多,按照这种标志分组就比较容易。比如,人口按性别、文化程度、婚否状况分组,学生按照所在院系的分组等。分组时,列出这些标志的各个类别,按类别汇总即可。有些现象的品质属性界限比较模糊,存在交叉过渡状态,按照这种标志分组就比较困难。比如,从业人员按行业分组,若某人在高校从事校办工厂的工作,应归属于教育行业还是工业?又如人口按居住地分为城镇与乡村的分组,对于居住在城镇乡村过渡地带的居民如何分类?对于这一类问题,需研究制定统一的分类标准,为统计分组提供统一的依据。在实际工作中为了方便和统一,各国都制定了适合一般情况的标准分类目录,如我国的国民经济行业分类、三次产业划分的规定、公有和非公有控股经济的分类办法等,联合国为便于各国的国际比较,还制定了国际通行的有关分类标准。三、数值型数据的分组数值型数据分组就是要通过数值的不同来反映事物性质的差异。数值型数据分组有单项式分组和组距式分组。单项式分组就是一一列举有限的变量值,用一个变量值作为一个组的分组形式。比如,对被调查住户按家庭就业人数分组,可分为:0个、1个、2个、3个等四个组。单项式分组适合于离散型变量并且变动范围不大情形,因为只有这种情形才可能一一列举有限的变量值。而对变动范围较大的离散型变量,若一一列举所有的变量值,将导致分组太多,每组的单位数太少,难以反映总体的特征,从而失去分组的意义;对于连续型变量,不可能一一列举所有的变量值,所以不适合进行单项式分组。组距式分组就是将变量值依次划分为几个区间,每个区间作为一个组,再将总体各单位按变量值的大小分别归并于相应的某一个组的分组形式。比如,对被调查住户按月人均收入的多少分为0-500元、500-800元、800-1500元、1500-3000元、3000元以上几个组。组距式分组适合于连续型变量或变动范围较大的离散型变量。组距式分组中,每一个组的最大值和最小值分别称为上限和下限,统称为组限;待分组数据中的最大值与最小值之差称为全距;各组的上限与下限之差为组距;上限和下限之间的中点数值称为组中值,其计算公式为:组距式分组要确定并考虑组距、组数、组限、组中值等问题。组距式分组的步骤是:(一)确定组距与组数组距与组数互为消长,在全距一定的情况下,若组数很多,则必然组距较小,反之,若组数少,则必然组距较大。在分组时,应避免组距过大或过小,因为当组距过大以至组数过少时,则可能将一些性质不同的单位归并到同一组,不能充分显示总体的特征;当组距过小以至组数过多时,则可能把性质相同或相近的单位分散到不同的组,也不能很好地显示总体的特征。比如对学生按考试成绩分为0-60分、60-100分,显然分组过少,不能充分揭示学生考试成绩的差异;反之,分为0-10、10-20、20-30、等若干组,则分组过多,将一些性质相近的分数值分散到不同的组,也不便于反映考试成绩的分布。组距式分组是先确定组距还是先确定组数?组数应为多少、组距应取多大?由于面临的社会经济现象不同,分析研究的目的不同,因此不能一概而论。应根据研究者的经验、研究对象的性质特征和研究目的来确定,也可以在以前分组的基础上做适当的调整。组距式分组有等距分组和异距分组两种。若每组的组距完全相同,称为等距分组,若各组组距不完全相同,称为异距分组。一般来说,变量值分布比较均匀的情况下,适宜等距式分组。等距式分组有很多好处,它便于绘制统计图,便于进行一些运算。若变量值的分布不均匀,适宜于异距分组,即:在变量值比较密集的区间取较小的组距,在分布比较稀疏的区间取较大的组距。 (二)确定组限和组中值确定了组数和组距后,还应考虑每个区间的端点值。各组两端的数值称为组限。组限的表现形式有很多,常见的有以下两种:形式一形式二500以下499以下500-600500-599600-700600-699 形式一的特点是:相邻两组的上下限为相同的数值。形式二的特点是:相邻两组的上下限为相邻的两个自然数,又称为非重叠组限。一般来说,形式一适宜于连续型变量的分组,这样可以保证统计分组穷尽原则的实现,比如,某个总体单位的数值为599.5,则应归属于600-700组,若采用形式二,该单位将找不到可归属的组。形式二一般用于离散型变量的分组,因为离散型变量不可能出现599.5这种非整数的数据。在采用形式一时,对于与组限相同的变量值应归属于哪一组?为满足统计分组的互斥原则和可比性,习惯上规定“上组限不在内”,也称“下闭上开原则”,即各组内包含下限值而不包括上限值。比如,500-600组包含500不含600,变量值500应归属于该组,而变量值600应归属于600-700这一组。组距式分组掩盖了各组内数据的差异,为反映各组数据的一般水平,通常用组中值作为该组数据的代表值。若各组内数据分布均匀,组中值的代表性较强,如果分布不均匀,用组中值作为代表值的误差较大。因此,在确定组限时,应尽可能使各组内的数据均匀分布,以减小组中值作为各组代表值的误差。在组距式分组中,若全部数据中的最大值或最小值与其它数据的差异较大,为避免出现空白组(没有变量值的组),经常将第一组或最后一组设计为“以下”或“以上”,这种没有明确下限或上限形式的组称为开口组。对于开口组组中值的计算,通常的做法是:假定与相邻组的组距相同,求出其下限或上限,再计算组中值。为便于统计运算,组限尽可能取整为5或10的倍数。 四、统计汇总实践表明,统计资料整理不仅仅是对原始数据分组,还必须进行统计汇总。一方面,要汇总总体的某一总量,比如,要汇总人口的总量、国家或地区新增价值的总量、主要产品的产出总量;另一方面,要在统计分组的基础上,汇总各组的总体单位数和各组的标志总量,以反映总体多方面的特征。比如,对某城市的150户居民户户主的文化程度、年龄、家庭人口数、家庭月总收入、家庭月总支出等进行调查。在取得各户数据的基础上,若要研究户主的文化程度与家庭经济水平的关系,可以按户主的文化程度分组,汇总各文化程度组的居民户数、家庭人口数、家庭月总收入等,在此基础上可进一步计算各组的户均人数、人均每月总收入等指标,以认识户主的文化程度与家庭的规模大小、与家庭人均总收入等是否存在某种联系。汇总的内容和进一步计算的指标可用统计表的形式反映,见表3-1。表3-1 150户居民家庭情况汇总表文化程度户数家庭人口数家庭月总收入家庭月总支出户均人数人均月总收入不识字或识字很少小学初中高中大学及以上 合计第三节 频数分布的概念及其编制一、频数分布的概念和种类在统计分组的基础上,将各组的数据个数即总体单位数(若抽样调查则是样本单位数)汇总出来,把它们一一对应排列,并以表格的形式表现出来,这种形式称为频数分布,也称为次数分布或分布数列。例如,将150个居民住户按户主的文化程度分组,把各组的户数汇总出来,排列成统计表3-2的形式,就是频数分布。表3-2 150户居民按户主文化程度分组的频数分布文化程度户数户数比重(%)不识字或识字很少21.3小学138.7初中3020.0高中8456.0大学及以上2114.0合计150100.0频数分布由两部分组成,一部分是按某标志分组形成的组别,另一部分是与各组对应的总体单位数,也称为频数、次数。根据需要,可以计算各组频数与总频数的比值,称其为频率或比重。频率应满足两个条件:各组频率大于(或等于)0而小于1;各组频率之和等于1或100%。频数分布是统计整理得到的重要结果,它可以反映总体的分布特征、研究总体内部结构,在统计定量分析中有广泛的用途。统计分组可按分类数据、顺序数据或数值型数据分组,因此,在此基础上形成的频数分布有分类数据的频数分布、顺序数据的频数分布和数值型数据的频数分布。由于统计调查得到的原始数据数量巨大,用手工的方式编制频数分布非常繁复,借助于计算机可以十分快捷地得到结果。下面介绍用计算机Excel编制频数分布的方法。二、非数值型数据频数分布的编制对于非数值型数据即分类数据和顺序数据的频数分布,可以用Excel的【数据】菜单编制,也可以用【工具】菜单编制,还可以用统计函数【FREQUENCY】编制。下面介绍用【工具】菜单编制非数值型数据频数分布的步骤。【例3-3】为进一步了解重庆市农村全面建设小康社会的主要障碍和问题,随机抽取了800户农户进行调查,其调查内容之一是户主的文化程度。备选答案有不识字或识字很少、 小学 、初中、高中(含中专)、大学及以上。为简便起见,只给出60户的回答结果如下,要求根据以下资料编制频数分布。小学初中初中初中初中初中小学初中初中高中高中初中初中初中高中初中小学初中初中小学初中初中小学小学小学初中不识字小学高中小学初中小学小学高中初中初中高中小学小学初中高中高中高中高中高中初中初中初中初中初中初中高中初中初中高中初中高中小学初中初中解:以上资料为顺序数据,用Excel的【工具】菜单编制频数分布的步骤如下:第1步:将数据输入到A列,并对不同的文化程度按由低到高的顺序分别赋值为1、2、3、4、5。见图3-8。图3-8 数据输入的形式第2步:顺次单击【工具】、【数据分析】,见图3-9;单击【直方图】、【确定】,出现【直方图】对话框,见图3-10。图3-9 选择【工具】菜单第3步:填写对话框:在【输入区域】中引用对各文化程度的赋值,本例为B1:B61;在【接受区域】引用按顺序排列的文化程度的代码,即D1:D6;勾选【标志】;选择【输出区域】,并在相应的空格中引用一个单元格,比如F1;勾选“图表输出”。见图3-10。 图3-10 填写直方图的对话框第4步:单击【确定】,得到如图3-11的结果:图3-11 输出的结果第5步:根据以上结果编制按文化程度分组的频数分布,根据需要还可以计算频率,见表3-3:表3-3 农户按户主文化程度分组的频数分布文化程度人数人数比重(%)不识字或识字很少11.7小学1423.3初中3151.7高中1423.3大学及以上00.0合计60100.0从表3-3可以看出,60户农户户主中,不识字的人很少,也没有大学及以上文化程度的户主,50%多的户主是初中文化程度。三、数值型数据频数分布的编制数值型数据分组有单项式分组和组距式分组。在单项式分组条件下的频数分布称为单项式频数分布,又称为单项数列;组距式分组条件下形成的频数分布称为组距式频数分布,又称组距数列。编制单项数列与非数值型数据频数分布的操作方法相似,此不赘述。现介绍用Excel编制组距式频数分布的操作步骤。【例3-4】续上例。对60户农户的年纯收入调查,得到以下数据。要求对60户农户按年纯收入分组,编制组距式频数分布。80007500150001200016000450075004500120005000800030000800012000600090002500090001200012500712030007120900013000680090007120790017000590079007120820030000752082007900680015000600068008200900045008000900068007800800090007800900096009000150009600960096007120解:根据以上数值型数据编制频数分布的步骤是:第1步:将原始数据输入Excel的某一列,比如A列,并将数据排序。根据排序结果所反映的分布情况,拟分为七个组,即:5000以下、5000-6000、6000-7000、7000-8000、8000-10000、10000-20000、20000以上。第2步:将各组上限减1的数值(最后一组应大于或等于最大的变量值)输入Excel的另一列,比如B列。这是因为:对于与组限相同的变量值,计算机汇总时包含上限值,故此,要在B列输入各组上限减1的数值,以保证下闭上开原则的实现。见图3-12。图3-12 输入数据及各组上限第3步:顺次单击【工具】、【数据分析】、【直方图】、【确定】,出现直方图对话框。第4步:填写对话框:在【输入区域】引用输入的原始数据,本例为A1:A61;在【接收区域】引用各组上限减1的数值,本例为B1:B8;勾选【标志】;选择【输出区域】并在对应的空格内引用一个单元格,比如C1;勾选【图表输出】。见图3-13。图3-13 填写直方图的对话框第5步:单击【确定】,得到输出结果,见图3-14。图3-14 输出的结果第6步:根据输出结果编制频数分布,还可以计算频率,即各组农户数占总户数的比重。见表3-4。表3-4 农户按纯收入分组的频数分布农户年纯收入(元)户数户数比重(%)5000以下5000-60006000-70007000-80008000-1000010000-2000020000-3000035.023.3610.01321.72135.01118.346.7合计60100.0从表3-4可以看出60户农户年纯收入的分布状况,有18.3%的农户年纯收入低于7000元,8000-10000元的农户较多,占35%,20000-30000元以上的农户只有6.7%。第四节 数据的展示一、统计表统计整理的结果应该以一定的形式展示出来。统计表和统计图是展示统计数据的两种主要形式。将经过汇总整理的数据按一定的顺序排列在表格上,这种表格就叫统计表。广义上讲,任何用以反映统计资料的表格都叫统计表。统计表能够系统地组织和有条理地安排大量统计数字资料,使统计资料更为集中醒目、条理分明,便于对照比较,也便于比较分析和积累资料,因而统计表是展示统计数据的重要工具。 (一) 统计表的构成从形式上看,统计表由总标题、横行标题、纵栏标题和数字资料四个部分构成,见表3-5。总标题位于统计表的正上方,简明扼要地说明统计资料的主要内容、时间和地点。横行标题位于表的第一栏,一般用以列示统计总体的各个组(类)或各单位的名称,也可列示资料的所属时间。纵栏标题位于统计表的第一行,用以说明各栏数字的具体含义。横行标题和纵栏标题共同说明填入表格中统计数字的具体内容。指标数值列于各横行标题与各纵栏标题交叉处。表格中的数值用来说明总体及组成部分的数量特征,是统计表的核心内容。表3-5 100户居民家庭情况汇总表 总标题 文化程度户数家庭人口数家庭月总收入家庭月总支出户均人数纵栏标题人均月总收入不识字横行标题小学初中高中大学 合计主词栏 宾词栏从内容上看,统计表由主词栏和宾词栏构成。主词栏一般列在统计表的第一栏,其它栏为宾词栏。主词栏一般列示总体各单位的名称或总体各组(类)的名称;宾词栏是说明总体各单位或总体各组(类)数量特征的各个统计指标。在有些情况下,主词栏和宾词栏可以互换,比如,在总体的分组或类别较少而指标名称较多的时候,为使表格的形式简明、美观,可以将统计表的主词宾词互换,把横式表改为竖式表。(二) 统计表的种类按用途可以将统计表分为以下几类:1.调查表。就是在统计调查中用于展示调查内容、搜集原始资料的统计表。第二章介绍的单一表、一览表就是调查表。2.整理表或汇总表。就是在统计资料的整理中用于表现整理或汇总结果的统计表。频数分布表就是汇总表。3.分析表。就是用于统计分析的统计表,这类表格通常与整理表结合在一起,成为整理表的延续。后面章节的很多统计表都是分析表。按照主词分组与否和分组的情况可以将统计表分为以下几类:1.简单表。就是主词未经过分组的统计表。这类统计表的主词一般是总体各单位的名称或总体指标所属的时间。2.分组表。就是主词只按一个标志分组而形成的统计表,也称简单分组表。频数分布表即为分组表。3.复合分组表。就是主词按两个或两个以上标志分组的统计表。这类统计表一般用于统计分析。按宾词设计的形式不同统计表可以分为:1.宾词简单排列表。就是宾词不加任何分组、按一定顺序加以排列的统计表。如表3-5。2.宾词分组平行排列表。就是宾词按一个或多标志分组、但各标志的分组彼此分开,平行排列的统计表,如表3-6。表3-6 我国各地区社会商品零售总额分类情况按地区分组按商品性质和用途分组按城乡分组按经济类型分组社会消费品零售总额农业生产资料销售额城镇乡村国有集体个体其它北京上海天津河北山西合计3.宾词分组层叠排列表。就是宾词按两个或两个以上标志分组、且各种分组层叠排列的统计表。如表3-7。表3-7 我国各地区劳动力分布情况按地区分组劳动力三 次 产 业人数第一产业第二产业第三产业合计男女小计男女小计男女小计男女北京上海天津河北山西合计统计表的主词分组与宾词分组是有区别的。主词分组的结果使统计总体分成许多组成部分,它们是需要统计指标来描述和表现的。宾词分组的结果并不增加统计总体的组成部分,其目的是比较详细地描述总体各组成部分的数量特征。可以说,宾词的分组从属于主词的需要。(三)设计统计表应注意的问题统计表是由纵横直线交叉组成的长方形表格,长与宽之间应保持适当的比例,力求简练、明确、适用、美观,在设计时应注意以下一些具体问题:1.线条的绘制。表的上下两条直线应以较粗的直线绘制,表内的直线应较细。表的左右两端一般不划线,采用“开口式”。2.合计栏的设置。统计表的各纵列需要合计时,一般在最后一行设计合计行;若各行需要合计时,可将合计列在最后一栏。3.纵栏的编号。若统计表的栏数很多,可以按顺序标号,并可以用顺序号说明其相互关系。习惯上主词栏和计量单位栏以“甲、乙”为序号,宾词栏以(1)、(2)、(3)为序号。4.标题设计。统计表应该有总标题和纵栏标题、横行标题,总标题应简明扼要的表达统计表中资料的时间、空间和主要内容。5.指标数值。统计表中的数字应填写齐全、数位对齐,各栏数字小数的位数应保持一致。当缺少某项数字时,可用符号“”表示,不应有数字的地方用符号“”表示。相邻格内的数字相同,应如实填写,不得以“同上”等字样表示。6.计量单位。统计表必须注明数字的计量单位。当统计表内的数字只有一种计量单位时,可以把它写在统计表头的右上方;如果各栏数字的计量单位不同,可以将计量单位写在各纵栏标题下方;如果各行数字的计量单位不同,可以在主词栏后增加计量单位栏。7.注释和资料来源。为保证统计表的科学性并尊重他人的劳动成果,在统计表外的下方,应注明资料的来源;一些必要的说明或注解也应反映在表外的下方。二、统计图统计图是展示统计资料的重要形式之一。统计图的特点是直观形象、简明生动、通俗易懂,能使人获得深刻的印象。在绘制统计图时,一定要根据资料选择最合适的图形,使之能准确明了地反映统计资料。统计图必须有简要的标题、计量单位,有时还应有图例和主要的统计数字和其它必要的说明。常用的统计图有:直方图(柱形图)、圆形图、折线图。(一) 直方图直方图又称为柱形图,常用来反映总体的分布、比较数值的大小。反映总体分布时,图形的横轴表示各组名称,纵轴表示各组的频数或频率。图3-15是根据表3-4绘制的频数分布图。比较数值大小时,可以是同一总体不同时间指标数值的比较,也可以是不同总体指标数值的比较,横轴代表时间或各总体的名称,纵轴代表指标数值。 图3-15 直方图(柱形图)(二)圆形图(饼图)圆形图主要用来反映总体的内部构成。圆形图以整个圆形的面积代表一个统计总体,以圆内各扇形面积的大小反映总体的各个组成部分,形象地反映总体各部分所占分额。图3-16是根据表3-3绘制的圆形图。图3-16 圆形图(饼图)(三)折线图折线图又称为曲线图,通常用来反映事物发展变化的规律或趋势、总体的分布,也可用以反映事物之间的相互联系。反映事物发展变化的规律或趋势时,图形的横轴代表时间,纵轴表示指标数值;反映总体的分布时,横轴代表各组的名称,纵轴代表各组的频数或频率;反映事物之间的相互联系时,横轴代表某一事物的数量,纵轴代表另一事物的数量。图3-17是根据我国1986-2000年居民消费价格指数资料绘制的折线图。图3-17 折线图(曲线图)此外,散点图也是常用的一种统计图,主要用来反映现象之间的依存关系,也用于反映事物随着时间的推移而呈现的变化趋势或规律。相关分析和时间序列分析中将运用散点图。用计算机Excel 绘制统计图十分方便,下面举例说明。【例3-5】以表3-5农户按纯收入分组的资料为例,说明绘制直方图的具体步骤。第1步:将表3-5资料输入Excel,见图3-18。图3-18 输入绘制直方图的分组资料第2步:单击【图表向导】图标、【柱形图】,在【子图标类型】中选择一种图形,比如第一种,见图3-19。图3-19 图表类型的选择第3步:单击【下一步】,在【数据区域】中引用统计数据,本例为A1:B8,见图3-20。图3-20 在“数据区域”中引用分组资料第4步:点击【下一步】,分别填写【图表标题】、【分类(X)轴】、【数值(Y)轴】的相关内容,见图3-21。图3-21 填写统计图的标题、纵轴和横轴的含义第5步:单击【下一步】、【完成】,得到绘制的直方图,见图3-22。在此基础上进行个性化的修饰,就可以得到一幅理想的直方图。其它图形的绘制步骤与此相似。图3-22 Excel输出的直方图思考与练习1. 为什么要对原始数据进行整理?2. 数据整理包括哪些具体内容?3. 数据的预处理包括哪些内容?4. 原始数据的完整性审核包含哪些内容?5. 原始数据的准确性审核包含哪些内容?进行准确性审核一般采用哪些方法?6. 什么是统计分组?统计分组有什么作用?7. 什么是单项

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论