经济应用统计学-第四章统计整理_第1页
经济应用统计学-第四章统计整理_第2页
经济应用统计学-第四章统计整理_第3页
经济应用统计学-第四章统计整理_第4页
经济应用统计学-第四章统计整理_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计整理经济应用统计学-第四章统计整理共69页,您现在浏览的是第1页!学习目标明确统计资料整理的涵义和作用了解统计整理的内容和程序掌握分布数列的编制方法经济应用统计学-第四章统计整理共69页,您现在浏览的是第2页!本章主要内容节统计整理的一般问题第二节统计汇总技术第三节统计汇总的质量控制第四节分布数列的编制经济应用统计学-第四章统计整理共69页,您现在浏览的是第3页!节统计整理的一般问题经济应用统计学-第四章统计整理共69页,您现在浏览的是第4页!一、统计整理的概念统计整理将统计调查得到的原始资料进行科学的分组和汇总,使其系统化、条理化,成为能够反映总体特征及其发展变化情况的综合统计资料的工作过程统计整理是统计调查的继续,统计分析的前提和基础经济应用统计学-第四章统计整理共69页,您现在浏览的是第5页!三、统计整理的程序1、设计和编制统计资料的汇总方案2、对原始资料进行审核3、对调查数据进行编码及录入4、分组汇总原始资料5、编制统计表和绘制统计图经济应用统计学-第四章统计整理共69页,您现在浏览的是第6页!第二节统计汇总技术利用计算机进行统计汇总主要包括:审核、编码、录入、数据净化、

逻辑检查运算以及编制和打印汇总表、统计图等。经济应用统计学-第四章统计整理共69页,您现在浏览的是第7页!(一)编码的常用方法又称系列编码法。只用一个标准对数据进行分类,并按照一定的顺序用连续数字或字母进行编码的方式。例如:根据某项对家庭月度消费支出的调查,对家庭月度消费支出分为四个档次:小于500元500元—1000元1000元—1500元1500元以上13421、顺序编码法操作简便,但不便于进行分组处理经济应用统计学-第四章统计整理共69页,您现在浏览的是第8页!(一)编码的常用方法把调查数据分成不同的组,给以一定的组码(数字区间)来进行编码的方法.例如:对某地市场上99种商品的价格变动进行调查,在运用信息组码编码法对调查的信息进行编码时,首先对99种商品分组,再给每个组分配一个组码:3、信息组码编码法组别百货组食品组家电组服装组其他组名称码01-3031-5051-6566-8081-99经济应用统计学-第四章统计整理共69页,您现在浏览的是第9页!(二)编码手册的编制

也称编码表,是用来进行数据编码的工作手册,包括四个项目:问题顺序号,每个调查项目的预置代码位置,项目名称,内容说明.经济应用统计学-第四章统计整理共69页,您现在浏览的是第10页!问题序号项目名称编码位置编码意义1职务11.正高2.副高3.中级4.其他2年龄2-3答卷人回答年龄3从事专业4-6专业编码见附表4工作评价71.已充分发挥积极性2.基本发挥了积极性3.积极性有所发挥4.完全没有发挥积极性5是否打算离开学校81.是2.否6按投入精力排列9-111.校内工作2.校外兼职3.生活琐事若某份问卷的回答信息在答录卡上的前11为数字为:23300112132则表示为??????经济应用统计学-第四章统计整理共69页,您现在浏览的是第11页!三、数据净化

数据净化指通过计算机处理错误的或不合理的数据以及进行一致性检验。方式:统计软件:SPSS、SAS经济应用统计学-第四章统计整理共69页,您现在浏览的是第12页!全面性审核一、资料审核汇总前对统计资料进行审核是统计汇总质量控制的关键。准确性审核审核调查单位的全面性、审核调查项目的全面性逻辑审核、计算技术审核经济应用统计学-第四章统计整理共69页,您现在浏览的是第13页!三、统计预处理缺省数据的处理加权处理原始数据或变量的转换经济应用统计学-第四章统计整理共69页,您现在浏览的是第14页!

通过对调查数据进行加权,使样本更具代表性,或为了强调某些被访群体的重要性。(例如:P91)统计预处理2、加权处理经济应用统计学-第四章统计整理共69页,您现在浏览的是第15页!第四节分布数列的编制经济应用统计学-第四章统计整理共69页,您现在浏览的是第16页!一、次数分布与分布数列的概念1、次数分布:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各单位在各组间的分布,就叫做次数分布。

表示各组标志值对总体标志值所起作用的强度频数(次数):各组单位数。频率:各组单位数占总体单位数的比率。性别人数比例男4040%女6060%合计100100%经济应用统计学-第四章统计整理共69页,您现在浏览的是第17页!2、分布数列

分布数列:将各组组别的名称与相应的频数和频率,依次排列起来形成的数列称为次数分布数列,简称分布数列。也称分配数列或次数分配数列。分布数列的意义:分布数列是统计整理结果的一种表现形式,也是统计分析的一种方法。不仅可以表明总体单位的分布特征和结构状况,而且可用以进一步研究总体单位某一标志的构成、平均水平及其变异程度。作用:反映总体中所有单位在各组的分布状态和分布特征。经济应用统计学-第四章统计整理共69页,您现在浏览的是第18页!某地人口的性别分布按性别分组次数人数(人)比重(%)男女154349271461329751.3748.63合计30048224100.00学生的成绩分布按成绩分组次数学生数(人)比重(%)60以下60-7070-8080-9090以上2820155416403010合计50100f/∑ff/∑fff经济应用统计学-第四章统计整理共69页,您现在浏览的是第19页!某地人口的性别分布按性别分组次数人数(人)比重(%)男女154349271461329751.3748.63合计30048224100.00学生的成绩分布按成绩分组次数学生数(人)比重(%)60以下60-7070-8080-9090以上2820155416403010合计50100变量数列品质数列经济应用统计学-第四章统计整理共69页,您现在浏览的是第20页!【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。分布数列的种类单项式分布数列—案例日产量(件)X工人数(人)f202122232425263564321合计24经济应用统计学-第四章统计整理共69页,您现在浏览的是第21页!指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限组限每组变量值变动区间的长度,为上下限之差组距每组变量取值范围的中点数值组中值分布数列的种类组距式分布数列—相关概念经济应用统计学-第四章统计整理共69页,您现在浏览的是第22页!变量值变动区间的长度相等变量值变动区间的长度不完全相等等距分布数列异距分布数列分布数列的种类变量式分布数列经济应用统计学-第四章统计整理共69页,您现在浏览的是第23页!分布数列的种类考分组距次数次数密度=次数/组距50-60420.560-66650.83366-8216140.87582-9210111.192-100881.0经济应用统计学-第四章统计整理共69页,您现在浏览的是第24页!销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100分布数列的种类经济应用统计学-第四章统计整理共69页,您现在浏览的是第25页!销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————分布数列的种类经济应用统计学-第四章统计整理共69页,您现在浏览的是第26页!用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1次数分布图分组数据—直方图经济应用统计学-第四章统计整理共69页,您现在浏览的是第27页!遇到异距数列时,则通常按次数密度绘制直方图以表示分布

直方图一般不用来表示累计次数的分布。次数分布图分组数据—直方图经济应用统计学-第四章统计整理共69页,您现在浏览的是第28页!R结果经济应用统计学-第四章统计整理共69页,您现在浏览的是第29页!1512963105110115120125130135140日加工零件数(个)频数(人)折线图下的面积与直方图的面积相等!某车间工人日加工零件数的折线图分组数据—折线图次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第30页!树茎树叶7880223477788890012222333344466777889013344579910111213数据个数3132410茎叶图类似横置的直方图某车间工人日加工零件数的茎叶图未分组数据—茎叶图次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第31页!用于显示未分组的原始数据或分组数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me

和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接未分组数据—箱线图次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第32页!时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断时间序列数据—线图次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第33页!020004000600019911992199319941995199619971998城镇居民农村居民收入

(元)

城乡居民家庭人均收入时间序列数据—线图次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第34页!【例】1997年我国城乡居民家庭平均每人各项生活消费支出数据如表。试绘制雷达图。1997年城乡居民家庭平均每人生活消费支出项目城镇居民农村居民食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务1942.59520.91316.89179.68232.90448.38358.64185.65

890.28109.4185.4162.4553.92148.18233.2334.27合计4185.641617.15多变量数据—雷达图次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第35页!对称钟形分布右偏钟形分布左偏钟形分布正J型分布反J型分布U型分布五、次数分布类型例:不同年龄人口的死亡率分布经济应用统计学-第四章统计整理共69页,您现在浏览的是第36页!节统计整理的一般问题一、统计整理的概念二、统计整理的内容三、统计整理的程序经济应用统计学-第四章统计整理共69页,您现在浏览的是第37页!二、统计整理的内容统计整理统计汇总统计分组就是在统计分组设计的基础上,根据各单位的标志归属,把总体各单位归纳到各组中,计算出各组和总体的单位数和标志值。逐级汇总集中汇总优点:满足各层次的需要;便于审核更正缺点:费时费力;易出错优点:速度快层次少缺点:有错不易查找;不能及时满足中间层次需要经济应用统计学-第四章统计整理共69页,您现在浏览的是第38页!第二节统计汇总技术经济应用统计学-第四章统计整理共69页,您现在浏览的是第39页!一、编码将调查表或调查问卷中的各个项目转化为数字符号的过程。编码事前编码事后编码适用封闭性问题适用开放性问题经济应用统计学-第四章统计整理共69页,您现在浏览的是第40页!(一)编码的常用方法又称区间编码法,是根据调查数据的属性特点和处理要求,将具有一定位数的代码单元分成若干个组,每个组的数字均代表一定的意义。例如:在某项关于社会公众保险意识调查中,对被调查者个人的基本情况进行了调查,运用分组编码法对有关信息编码如下:2、分组编码法性别居住地家庭人口数月收入水平回答编码编码编码编码回答回答回答男女12大城市中小城市县乡镇农村1234单身两人三口之家四人以上1234200以下200-300300-400……1000-1100010203…10若某个被调查者为女性,居住于中等城市,家中有三口人,月收入为1000-1100则其回答信息为22310经济应用统计学-第四章统计整理共69页,您现在浏览的是第41页!(一)编码的常用方法又称助忆编码法,它用数字符号等表明编码对象的属性,并依此方式对调查数据进行编码的方法.例如:用180BXJ表示容量为180升的进口电冰箱.其中180为冰箱的容量,BX表示冰箱.J表示进口.4、表义式文字编码法经济应用统计学-第四章统计整理共69页,您现在浏览的是第42页!1.您的职务?

(1)正高级(2)副高级(3)中级(4)其他2.您的年龄_____________________3.您从事的专业__________________________4.您对自己工作情况的评价?(1)已充分发挥积极性(2)基本发挥了积极性(3)积极性有所发挥(4)完全没有发挥积极性5.目前,您是否有离开学校的想法?(1)是(2)否6.请您按投入精力的多少,将下列三项活动排序?(1)校内工作(2)校外兼职(3)生活琐事位____第二位____第三位_____案例:对某高等学校教师的工作,生活状况的调查,一共有32个问题,我们摘录6个问题,来说明编码手册的编制.经济应用统计学-第四章统计整理共69页,您现在浏览的是第43页!二、录入

数据录入就是将问卷或编码表中的每一个项目对应的代码读到磁盘中,或通过键盘直接敲入计算机中的工作过程。方式:程序录入光电扫描录入经济应用统计学-第四章统计整理共69页,您现在浏览的是第44页!第三节统计汇总的质量控制经济应用统计学-第四章统计整理共69页,您现在浏览的是第45页!二、编码和录入的质量控制编码工作的质量控制录入工作的质量控制经济应用统计学-第四章统计整理共69页,您现在浏览的是第46页!统计预处理1、缺省数据的处理以样本统计量代替缺省值一般为平均值以统计模型计算的估计值代替缺省值回归模型等缺省值样本删除缺省值样本保留,仅在相应的分析中作必要删除经济应用统计学-第四章统计整理共69页,您现在浏览的是第47页!变量类型的转化数学意义上的变量代换统计预处理3、原始数据或变量的转换经济应用统计学-第四章统计整理共69页,您现在浏览的是第48页!第四节分布数列的编制一、次数分布与分布数列的概念二、分布数列的种类三、累计分布数列四、次数分布图五、次数分布的类型经济应用统计学-第四章统计整理共69页,您现在浏览的是第49页!反映统计总体内所有总体单位在各组间的分布。同类总体不同的分布状况差异反映了它们的性质差异。如各班成绩分布。对某随机现象的重复观察,频率分布可以渐近反映其统计规律。次数分布的作用经济应用统计学-第四章统计整理共69页,您现在浏览的是第50页!

各组名称(常用x表示)两个构成要素各组次数

分布数列的构成要素绝对数,称频数,用f

表示。相对数,称频率,用f/∑f表示。总体所分各组的分组标志的具体体现各组对应的总体单位数或频率。经济应用统计学-第四章统计整理共69页,您现在浏览的是第51页!次数分布品质分布数列变量分布数列单项式分布数列组距式分布数列等距分布数列异距分布数列由于分组是次数分布的基础,因此有怎样的分组就形成怎样的次数分布。综合上述各种分组类型,次数分布的类型,可归纳为:二、分布数列的种类按品质标志分组形成的分布数列称为品质分布数列,简称品质数列。按数量标志分组形成的分布数列称为变量分布数列,简称变量数列。二、经济应用统计学-第四章统计整理共69页,您现在浏览的是第52页!每个组值只用一个具体的变量值表现的数列同时具备变量是离散变量变量的不同取值个数较少编制条件:分布数列的种类单项式分布数列经济应用统计学-第四章统计整理共69页,您现在浏览的是第53页!每个组的变量值用一个区间来表现的变量数列或者变量是连续变量编制条件:分布数列的种类组距式分布数列总体单位数较多,变量不同取值个数也较多的离散变量经济应用统计学-第四章统计整理共69页,您现在浏览的是第54页!某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L组距d=U-L=100-50=50(万元)组中值x=(U+L)/2=(100+200)/2=150(万元)分布数列的种类组距式分布数列经济应用统计学-第四章统计整理共69页,您现在浏览的是第55页!等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况,以解决各组频率由于组距不同而不可比的问题。分布数列的种类等距分组与不等距分组的差异经济应用统计学-第四章统计整理共69页,您现在浏览的是第56页!将变量数列各组的频数(或频率)逐组累计相加而形成的数列三、累计分布数列向上累计向下累计从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。什么以下的有多少什么以上的有多少经济应用统计学-第四章统计整理共69页,您现在浏览的是第57页!销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——分布数列的种类经济应用统计学-第四章统计整理共69页,您现在浏览的是第58页!117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例】某生产车间50名工人日加工零件数如下(单位:个)。

四、次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第59页!频数(人)1512963105110115120125130135140日加工零件数(个)直方图下的面积之和等于1某车间工人日加工零件数的直方图我一眼就看出来了,大多数人的日加工零件数在120~125之间!次数分布图分组数据—直方图经济应用统计学-第四章统计整理共69页,您现在浏览的是第60页!条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列次数分布图分组数据—直方图直方图与条形图的区别经济应用统计学-第四章统计整理共69页,您现在浏览的是第61页!折线图也称频数多边形图(Frequencypolygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的分组数据—折线图次数分布图经济应用统计学-第四章统计整理共69页,您现在浏览的是第62页!用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体的数值茎

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论