统计学3数据的整理和展示_第1页
统计学3数据的整理和展示_第2页
统计学3数据的整理和展示_第3页
统计学3数据的整理和展示_第4页
统计学3数据的整理和展示_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第一节第一节 统计数据的整理统计数据的整理一、数据整理的概念和作用一、数据整理的概念和作用 统计整理是指根据统计研究的目的,将统计整理是指根据统计研究的目的,将统计调查所得的原始资料(也称初级资料)统计调查所得的原始资料(也称初级资料)进行科学的分类和汇总;或对已经加工的综进行科学的分类和汇总;或对已经加工的综合资料(也称次级资料)进行再加工,为统合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的综合资料的计分析准备系统化的、条理化的综合资料的工作过程。工作过程。 统计整理是统计调查的继续、统计分析统计整理是统计调查的继续、统计分析的前提。的前提。 二、统计整理的步骤二、统计

2、整理的步骤 三、统计整理的组织方式三、统计整理的组织方式 主要方法主要方法分组分组汇总汇总统计表统计表统计图统计图手工汇总手工汇总1. 计算机汇总计算机汇总第二节、统计分组第二节、统计分组 统计分组的两方面涵义:统计分组的两方面涵义: 对总体而言,是对总体而言,是“分分”,即将总体中的各个个体按照它即将总体中的各个个体按照它们的差异性区分为若干部分;们的差异性区分为若干部分; 对个体(总体单位)而言,是对个体(总体单位)而言,是“合合”,即将性质相同的即将性质相同的个体组合起来。个体组合起来。 分组分组253342二、作用:二、作用: 例:按所有制性质划分,我国现有例:按所有制性质划分,我国现

3、有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济联营国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济;股份制经济;外商投资经济;港澳台投资经济经济例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%) 1980年年1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业3.2 4.32.5 2.3 第二产业第二产业75.7 63.854.5 52.2 第三产业第三产业21.1 31.943.0 45.5例:某地农民家庭按收入分组的恩格尔系数例:某地农民家庭按收入分组的恩格尔系数

4、按收入分组(元)按收入分组(元) 200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6 (2) 完整性原则(完整性原则(即应使总即应使总体中的每一单位都应有组可归,或者说各分组体中的每一单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。的空间足以容纳总体所有的单位。 (3) 即总体中任即总体中任一单位只能归入某一组。一单位只能归入某一组。三、统计分组的原则和方法三、统计分组的原则和方法1、统计分组的原则、统计分组的原则 2 2、统计分组的方法、统计分组的方法 统计分组的关键在于正确选

5、择分组标志。统计分组的关键在于正确选择分组标志。(1)分组标志的选择)分组标志的选择原则是:原则是:1)从研究目的出发选择分组标志;)从研究目的出发选择分组标志;2)选择最能反映现象本质特征的分组标志;)选择最能反映现象本质特征的分组标志;3)根据事物所处的具体历史条件和经济条件)根据事物所处的具体历史条件和经济条件选择分组标志。选择分组标志。 简单分组简单分组对总体各单位只采用一个标志进对总体各单位只采用一个标志进行分组。行分组。 平行分组体系平行分组体系对总体各单位同时采用两个对总体各单位同时采用两个或两个以上的标志进行或两个以上的标志进行分组。分组。 ( (表表3-43-4) 复合分组复

6、合分组对总体各单位同时采用两个或两对总体各单位同时采用两个或两个以上的标志进行个以上的标志进行分组。分组。( (表表3-53-5) 第三节第三节 次数分布次数分布一、次数分布数列的概念和种类一、次数分布数列的概念和种类1、次数分布数列的概念、次数分布数列的概念 在统计分组的基础上,将总体中的所有单在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各位按组归类整理,形成总体中各个单位数在各组间的分布,叫做组间的分布,叫做,将各组组,将各组组别与次数依次编排而形成的数列叫做次数分布别与次数依次编排而形成的数列叫做次数分布数列,简称为数列,简称为分布数列分布数列。次数分布(分

7、布数列)次数分布(分布数列)是一种重要的分组资料,反映总体单位在各组的是一种重要的分组资料,反映总体单位在各组的分布状态。分布状态。基本形式:基本形式:分组分组单位数(频数)单位数(频数)频率频率合计合计100次数分布次数分布频率分布频率分布一、次数分布数列的概念和种类一、次数分布数列的概念和种类2、次数分布数列的种类、次数分布数列的种类 变量分布数列的分类见变量分布数列的分类见P56图示图示 在连续变量或变量值较多的情况下,可采用组距分组。它将全部变量值依次分为若干个区间,并将这个区间的变量值作为一组。 “上限在不内上限在不内”原则:原则:在连续组距式分组中,以同在连续组距式分组中,以同一个

8、数值作为相邻两组共同的界限,统计上规定,凡是总体某一个数值作为相邻两组共同的界限,统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。下限值的那一组内。离散型变量离散型变量 下限,上限:下限,上限:组距式分组的每一组变量值中,其组距式分组的每一组变量值中,其最小值为下限,最大值为上限。最小值为下限,最大值为上限。 组限:组限:相邻两组的界限。相邻两组的界限。 间断组距式分组:间断组距式分组:组限不相连的组距式分组。组限不相连的组距式分组。 连续组距式分组:连续组距式分组:组限相连(或称相重叠的),组

9、限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式即以同一数值作为相邻两组的共同界限的组距式分组。分组。 离散型变量,可间断组距式分组,也可连续组距离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。式分组。连续型变量,只能采用连续组距式分组。 开口式分组开口式分组第一组缺下限、最末组缺上限第一组缺下限、最末组缺上限 闭口组闭口组各组上下限齐全各组上下限齐全 组距:组距:上下限之间的距离。上下限之间的距离。 连续式分组的组距计算公式:连续式分组的组距计算公式:组距组距=本组上限本组上限本组下限本组下限 间断式分组的组距计算公式:间断式分组的组距

10、计算公式:组距组距=本组上限本组上限本组下限本组下限+1等距分组:等距分组:标志值在各组保持相等的组距,即各组的标标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。较均匀的场合。异距分组:异距分组:各组的组距不相等。各组的组距不相等。开口组的组距:以相邻组的组距为本组的组距。开口组的组距:以相邻组的组距为本组的组距。组中值:组中值:上下限之间的中点数值称为组中值,组中值的上下限之间的中点数值称为组中值,组中值的计算公式:计算公式: 计算平均指标或进行其它统计分析时,常以组中值来计算平均指标或进行其它统

11、计分析时,常以组中值来代表各组标志值的平均水平。代表各组标志值的平均水平。 组数组数 组数组数=全距全距/组距组距 组数组数依经验确定,一般分为组。依经验确定,一般分为组。缺下限开口组组中值缺下限开口组组中值= =该组上限该组上限-1/2-1/2邻组组距,邻组组距,缺上限开口组组中值缺上限开口组组中值= =该组下限该组下限+1/2+1/2邻组组距。邻组组距。闭口组组中值闭口组组中值= =(上限(上限+ +下限)下限)2 2 二、变量数列的编制二、变量数列的编制 1、单项变量数列的编制、单项变量数列的编制 适用于变量值个数不多的离散型变量适用于变量值个数不多的离散型变量 二、变量数列的编制二、变

12、量数列的编制 2、组距变量数列的编制、组距变量数列的编制适用于标志值比较多的离散型变量和连续性变量适用于标志值比较多的离散型变量和连续性变量117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121107 108 108 110 112 112 113 114 115

13、 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139采用单变量值分组形成的频数分布表采用单变量值分组形成的频数分布表零件数频数零件数频数零件数频数10710811011211311411511611711812121113311912012112212312412512612712144322312812913013113

14、3134135137139211122112按零件数分组频数(人)频率(%)105109110114115119120124125129130134135-139358141064610162820128合计50100某车间某车间50名工人日加工零件数分组名工人日加工零件数分组采用组距式分组形成的频数分布表采用组距式分组形成的频数分布表三、次数分布的特征三、次数分布的特征 按职工人数分组按职工人数分组 企业个数企业个数 频率频率(%) 200人以下人以下 1 1.7 200299 3 5.0 300399 5 8.3 400499 16 26.7 500599 20 33.3 600699 9

15、 15.0 700799 4 6.7 800人以上人以上 2 3.3 合合 计计 60 100.0P70习题、习题、累计频数与累计频率累计频数与累计频率 累计频数累计频数(或频率或频率)可以是向上累计频数可以是向上累计频数(或频率或频率),也可以,也可以是向下累计频数是向下累计频数(或频率或频率)。 ,其方法是先列出各组的上限,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数然后由标志值低的组向标志值高的组依次累计频数(或频率或频率)。某组向上累计频数表明该组上限以下的各组单位数之和是多某组向上累计频数表明该组上限以下的各组单位数之和是多少,某组向上累计频率表明该组上限以

16、下的各组单位数之和少,某组向上累计频率表明该组上限以下的各组单位数之和占总体单位数的比重。占总体单位数的比重。 ,其方法是先列出各组的下限,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数然后由标志值高的组向标志值低的组依次累计频数(或频率或频率)。某组向下累计频数表明该组下限以上的各组单位数之和是多某组向下累计频数表明该组下限以上的各组单位数之和是多少,某组向下累计频率表明该组下限以上的各组单位数之和少,某组向下累计频率表明该组下限以上的各组单位数之和占总体单位数的比重。占总体单位数的比重。 累计频数累计频数(或频率或频率)分布曲线,可用以研究财富、土分布曲线,可用以研

17、究财富、土地和工资收入的分配是否公平。这种累计分布曲线最早地和工资收入的分配是否公平。这种累计分布曲线最早由美国洛伦茨博士提出的,故又称由美国洛伦茨博士提出的,故又称洛伦茨曲线图洛伦茨曲线图。其绘。其绘制方法如下:制方法如下: 1将分配的对象和接受分配者的数量均化成结构相将分配的对象和接受分配者的数量均化成结构相对数并进行向上累计对数并进行向上累计 2.纵轴和横轴均为百分比尺度,纵轴自下而上,用以纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的对象测定分配的对象(如一国的财富、土地或收入等如一国的财富、土地或收入等),横轴,横轴由左向右用以测定接受分配者由左向右用以测定接受分配者(如一国

18、的人口如一国的人口)。 3根据计算所得的分配对象和接受分配者的累计百根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点并使之平滑分数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即所要求的洛伦茨曲线化,所得曲线即所要求的洛伦茨曲线。第四节:统计数据的图表展示 从统计图表获取信息从统计图表获取信息 用统计图表表达信息用统计图表表达信息统计图表进入寻常百姓家 对对青年报青年报2007年年2月月15日的调查日的调查带有带有统计数字统计数字的文字随处可见,如的文字随处可见,如 3天近百个咨询电话,天近百个咨询电话,50余热心人将牵手余热心人将牵手空巢老人空巢老人

19、 零点公司最新调查显示,独生子女夫妻流零点公司最新调查显示,独生子女夫妻流行分居过年行分居过年 截至截至2006年底,全国年底,全国657个城市中,已经个城市中,已经有有512个城市建立了廉租住房制度,占城个城市建立了廉租住房制度,占城市总数的市总数的77.9%对青年报的调查(续) 统计图表主要在财经&证券版 一、统计表一、统计表 1、统计表的概念和作用、统计表的概念和作用 统计调查所取得的原始资料,经过整理,得到统计调查所取得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格上,就形成了统计表。一定的

20、顺序排列在表格上,就形成了统计表。 广义的统计表包括统计工作各个阶段中所用的广义的统计表包括统计工作各个阶段中所用的一切表格:一切表格:调查表,汇总整理表,计算分析表调查表,汇总整理表,计算分析表。狭。狭义的统计表专指分析表和容纳各种统计资料的表格,义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表。也就是通常所说的统计表。 统计表的结构统计表的结构表表2-5 19971998年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1997年年 1998年年 一、调查户数一、调查户数 二、平均每户家庭人口数二、平均每户家庭人口数 三、平均每户就业人口数三、平均每户

21、就业人口数 四、平均每人全部收入四、平均每人全部收入 五、平均每人实际支出五、平均每人实际支出 消费性支出消费性支出 非消费性支出非消费性支出 六、平均每人居住面积六、平均每人居住面积户户人人人人元元元元元元元元平方米平方米 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40资料来源:资料来源:中国统计摘要中国统计摘要19991999,中国统计出版社,中国统计出版社,19991999,第,第7979页。页。注:注:1 1本表为城市和县城

22、的城镇居民家庭抽样调查材料。本表为城市和县城的城镇居民家庭抽样调查材料。 2 2消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。统计表的制作要求(1)(1) 统计表的各种统计表的各种标题标题,特别是总标题的表达应该十分简明、,特别是总标题的表达应该十分简明、确切,概括地反映出表的基本内容,总标题还应该标明资确切,概括地反映出表的基本内容,总标题还应该标明资料所属的地点和时间。料所属的地点和时间。(2) 统计表的内容

23、要扼要而不庞杂,无论统计表的内容要扼要而不庞杂,无论主词主词(即统计表所要(即统计表所要说明的总体及其分组)还是说明的总体及其分组)还是宾词宾词(即用来说明主词的各种(即用来说明主词的各种统计指标)分组层次不宜过多,为使统计表长宽适中,必统计指标)分组层次不宜过多,为使统计表长宽适中,必要时,可将主词与宾词互换位置。要时,可将主词与宾词互换位置。(3) 表中数字应填写表中数字应填写整齐整齐,对准位数。,对准位数。表中的数据一般是右对表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统齐,有小数点时应以小数点对齐,而且小数点的位数应统一一.当数字为当数字为0或因数小可略而不计时

24、,要写上或因数小可略而不计时,要写上0;当;当缺缺乏某乏某项资料时,用符号项资料时,用符号“”表示;无数字的表示;无数字的空格空格,用符号,用符号“”表示。表示。统计表的制作要求(2)(4) 统计表中必须注明数字资料的计量统计表中必须注明数字资料的计量单位单位。当全表只有一种。当全表只有一种计量单位时,可以把它写在表的右上方;当表中需要分别注计量单位时,可以把它写在表的右上方;当表中需要分别注明不同单位时,横行的计量单位,可专设明不同单位时,横行的计量单位,可专设“计量单位计量单位”一栏,一栏,纵栏的计量单位,要与纵栏标目写在一起,用小字标写。纵栏的计量单位,要与纵栏标目写在一起,用小字标写。

25、(5) 统计表的统计表的表式表式,一般是,一般是“开口开口”式的,即表的左右两端不式的,即表的左右两端不划纵线;表的上下端基线通常要划粗线,其余用细线表示。划纵线;表的上下端基线通常要划粗线,其余用细线表示。(6) 必要时,统计表应加注必要时,统计表应加注说明或注解说明或注解。例如某些指标有特殊。例如某些指标有特殊的计算口径,某些资料只包括一部分地区,某些数字是由估的计算口径,某些资料只包括一部分地区,某些数字是由估算来插补的等等,都要加以说明。此外还要注明统计资料的算来插补的等等,都要加以说明。此外还要注明统计资料的来源,以便查考。说明或注解一般写在表的下端,说明或注来源,以便查考。说明或注

26、解一般写在表的下端,说明或注解不宜太多。解不宜太多。 统计图是用几何学的点、线、面或具体事物的形统计图是用几何学的点、线、面或具体事物的形象所构成的用来描述统计资料的图形。象所构成的用来描述统计资料的图形。 117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 1211

27、、直方图、直方图(Histogram):): 用矩形的宽度和高度来表示频数分布的图形。高度表示每用矩形的宽度和高度来表示频数分布的图形。高度表示每一组的次数,宽度表示各组的组距。一组的次数,宽度表示各组的组距。2、折线图、折线图v折线图也称频数多边形图折线图也称频数多边形图v是在直方图的基础上,把直方图顶部的中点是在直方图的基础上,把直方图顶部的中点( (组组中值中值) )用直线连接起来形成的多边形图用直线连接起来形成的多边形图v折线图的两个终点要与横轴相交,做法是:第折线图的两个终点要与横轴相交,做法是:第一个矩形的顶部中点和最后一个矩形顶部中点一个矩形的顶部中点和最后一个矩形顶部中点分别通

28、过竖边中点连接到横轴分别通过竖边中点连接到横轴v折线图下所围成的面积与直方图的面积相等,折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的二者所表示的频数分布是一致的折线图的绘制折线图的绘制2、折线图、折线图3、曲线图、曲线图:在作直方图时,如果数据不:在作直方图时,如果数据不断增多,组距不断缩小,直方图中的矩形断增多,组距不断缩小,直方图中的矩形将逐渐变窄,顶端将渐渐珠连使折线接近将逐渐变窄,顶端将渐渐珠连使折线接近于一条光滑曲线,这条曲线称为于一条光滑曲线,这条曲线称为次数分布次数分布曲线曲线,或称为次数密度曲线,近似于概率,或称为次数密度曲线,近似于概率密度曲线。密度曲线。次数分布曲线的三种类型:次数分布曲线的三种类型:钟型分布曲线钟型分布曲线,U型分布曲线和型分布曲线和J型分布曲线。型分布曲线。 次数分布曲线的三种类型次数分布曲线的三种类型4 4、条形图、条形图(Bar chartBar chart)用宽度相同的条形的高度或长短来表示数用宽度相同的条形的高度或长短来表示数据变动的图形。据变动的图形。图2.1 某城市居民关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论