统计从业资格考试第三章统计整理_第1页
统计从业资格考试第三章统计整理_第2页
统计从业资格考试第三章统计整理_第3页
统计从业资格考试第三章统计整理_第4页
统计从业资格考试第三章统计整理_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 统计整理统计整理第一节统计整理的相关概念 一、统计整理的定义、统计整理的定义 概念:根据统计研究的任务与要求,对统计调查所搜集到的概念:根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行审核、分类、汇总,或对已加工过的资料在加原始资料进行审核、分类、汇总,或对已加工过的资料在加工工,使其条理化、系统化,科学化从而得到反映现象总体特使其条理化、系统化,科学化从而得到反映现象总体特征的统计资料的工作过程。统计整理包括对原始资料和次级征的统计资料的工作过程。统计整理包括对原始资料和次级资料的整理。这里主要讲对原始资料的整理。资料的整理。这里主要讲对原始资料的整理。 二、统计整理

2、的意义二、统计整理的意义 统计整理是统计调查的继续,是我们由个别现象的认统计整理是统计调查的继续,是我们由个别现象的认识上升到总体现象的认识的一个重要阶段。在统计工作中发识上升到总体现象的认识的一个重要阶段。在统计工作中发挥着承前启后的作用,它既是统计调查的继续和深化,又是挥着承前启后的作用,它既是统计调查的继续和深化,又是统计分析的前提和基础。统计分析的前提和基础。三、统计整理的步骤三、统计整理的步骤设计编制整理方案原始资料审核检查对原始资料统计分组汇总编制统计表绘制统计图四、统计整理的方法(补充)统计整理方法分组汇总编制统计图表统计整理的基本方法包括( )。A.分组 B.汇总C.编制统计图

3、表 D.计算机录入E.计算指标值答案:ABC统计整理仅对原始资料的整理。( )统计分组是统计整理的第一步。( )答案:、习题第二节 统计分组 一、统计分组的定义一、统计分组的定义: 根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按一个或几个分组标志划分为几个组,使组与组之间具有差异性,同一组内的单位保持相对同质性。 注意三点:1、统计分组的对象是总体 2、统计分组应有分组标志 3、对总体而言是分,对个体而言是合。 统计分组的意义:依据是总体的变异性。统计分组的意义:依据是总体的变异性。 统计分组的结果:增加组内的同质性,组间差异统计分组的结果:增加组内的同质性,组间差异性。性。统计

4、分组是对现象总体进行的一种定性分类。统计分组是对现象总体进行的一种定性分类。统计分组还要注意:分组的互斥性、穷尽性统计分组还要注意:分组的互斥性、穷尽性 二、统计分组的作用二、统计分组的作用 1、凸现社会经济现象的规律、凸现社会经济现象的规律P34 2、划分社会经济现象的类型。统计工作中、划分社会经济现象的类型。统计工作中应用最广泛、最主要的分组,是将社会经济应用最广泛、最主要的分组,是将社会经济总体划分为若干类型。总体划分为若干类型。 3、反映社会经济现象内部结构。按某一标、反映社会经济现象内部结构。按某一标志分组后志分组后 ,可以计算各组单位数(标志值),可以计算各组单位数(标志值)占总体

5、单位数(标志总量)的比重,反映经占总体单位数(标志总量)的比重,反映经济现象的结构和比例关系。济现象的结构和比例关系。P35 4、揭示现象之间的依存关系。当总体单位、揭示现象之间的依存关系。当总体单位具有两个或以上标志时,可按其中一个分组,具有两个或以上标志时,可按其中一个分组,观察其它标志的变化,反映现象之间的相互观察其它标志的变化,反映现象之间的相互依存关系。分析分组的目的是研究现象总体依存关系。分析分组的目的是研究现象总体内部各标志之间的依存关系。内部各标志之间的依存关系。 如:研究商业企业中商品销售额与流通费用如:研究商业企业中商品销售额与流通费用的依存关系的依存关系指标实际完成(亿元

6、) 所占比重%全社会固定资产投资总额其中:国有经济 集体经济 个体经济 其他经济24941.1113091.723850.873429.424569.0910052.4915.4413.7518.31 三、统计分组的原则(新增) 1、科学性原则 2、完整性原则 3、互斥性原则四、统计分组方法:四、统计分组方法:分组的关键是选择分组的关键是选择分组标志分组标志与与划分各组界限划分各组界限。分组标志分组标志:指对总体进行分组时所遵循的标准或依:指对总体进行分组时所遵循的标准或依 据。如:学生按据。如:学生按”性别性别”分组;分组;划分各组界限划分各组界限:是在分组标志变异的范围内,划定各:是在分组

7、标志变异的范围内,划定各相邻组间的性质界限和数量界限。相邻组间的性质界限和数量界限。(一)选择分组标志(一)选择分组标志: 1、根据研究目的选择分组标志、根据研究目的选择分组标志 2、选择最能反映现象本质的标志、选择最能反映现象本质的标志 3、结合具体历史条件及社会经济环境选择、结合具体历史条件及社会经济环境选择(二)统计分组方法:(二)统计分组方法: 1、按品质标志与数量、按品质标志与数量标志分组标志分组 a、品质标志分组就是、品质标志分组就是用反映事物属性、性用反映事物属性、性质的标志分组,可以质的标志分组,可以将总体单位划为若干将总体单位划为若干类型。例如工业企业类型。例如工业企业按经济

8、类型、部门、按经济类型、部门、人口按性别、职业地人口按性别、职业地区等标志分组区等标志分组性别性别学生数学生数男男女女3020合计合计50 b、数量标志分组是用事物数量的多少作为、数量标志分组是用事物数量的多少作为分组标志进行分组。例如工业企业按职工分组标志进行分组。例如工业企业按职工人数、资产总额分组;人口按年龄、收入人数、资产总额分组;人口按年龄、收入等标志分组。数量标志可以是绝对数也,等标志分组。数量标志可以是绝对数也,可以是相对数。可以是相对数。 分组形式可以是单项式,也可以是组距式分组形式可以是单项式,也可以是组距式数量数量标志标志分组分组单项式分组单项式分组:将每将每一个变量值一个

9、变量值作为作为一组一组来分组,一般来分组,一般 适用于适用于变量值变化幅度比较小变量值变化幅度比较小的的离散变量离散变量组距式分组组距式分组:就是把整个变量值依次划分为几个区间,就是把整个变量值依次划分为几个区间, 各个变量值则按其大小确定所归并的区间各个变量值则按其大小确定所归并的区间 区间的距离称为组距区间的距离称为组距 2、按主要标志与辅助标志分组:、按主要标志与辅助标志分组: 实际分组时,一个分组标志,往往不能区分事物实际分组时,一个分组标志,往往不能区分事物的不同性质特点,因此除了使用一个主要标志外,的不同性质特点,因此除了使用一个主要标志外,还要用一个或几个辅助标志作为分组补充标志

10、。还要用一个或几个辅助标志作为分组补充标志。 五、统计分组体系五、统计分组体系对同一总体可以按一个标志分组对同一总体可以按一个标志分组,也可以按两个或两也可以按两个或两个以上标志分组个以上标志分组,按两个或两个以上分组时按两个或两个以上分组时,就形成就形成了分组体系了分组体系.(一一)、简单分组和平行分组体系:、简单分组和平行分组体系:简单分组简单分组:研究总体是按一个分组标志进行的研究总体是按一个分组标志进行的 分组分组. 平行分组平行分组:对同一总体按照两个或两个以上的标志分对同一总体按照两个或两个以上的标志分别进行简单分组而形成的分组体系别进行简单分组而形成的分组体系.性别男女人数文化程

11、度人数大学及以上专科高中及以下男女男女男女简单分组复合分组2、复合分组和复合分组体系:、复合分组和复合分组体系:复合分组:对研究总体按两个或两个以上的分复合分组:对研究总体按两个或两个以上的分组层叠起来进行分组组层叠起来进行分组.复合分组体系:多个复合分组组成的分组体系复合分组体系:多个复合分组组成的分组体系就是复合分组体系。就是复合分组体系。平行分组体体系与复合分组的区别:平行分组体体系与复合分组的区别:复合分组是先按主要标志进行第一次分组,然复合分组是先按主要标志进行第一次分组,然后再按次要标志分组。只在一个总体进行。后再按次要标志分组。只在一个总体进行。平行分组体系是每一个分组固定一个分

12、组标志,平行分组体系是每一个分组固定一个分组标志,以所有分组都是独立进行的,各分组之间是以所有分组都是独立进行的,各分组之间是平行并列的关系。相当于几个总体进行。平行并列的关系。相当于几个总体进行。 统计工作中常用的统计分组统计工作中常用的统计分组 1、按生产资料所有制性质分组、按生产资料所有制性质分组 2、按国民经济行业分组、按国民经济行业分组 3、按单位隶属关系分组、按单位隶属关系分组 4、按地区分组、按地区分组 统计分组是将统计总体按一定标志区分为若干部分的统计整理方法,它( )。A.应有分组标志 B.是在统计总体内部进行的C.是在统计总体之间进行的 D.对总体而言是“分”E.对个体而言

13、是“合” (2009年试题)答案:ABDE习题习题 对某工厂工人先按工种分组,在此基础上再按年龄分组,这种分组方法是( )。 A.简单分组 B.复合分组 C.按数量标志分组 D.以上都不对 (2010年试题) 答案:B 选择分组标志应考虑( )。 A.研究目的与任务 B.能反映事物本质或主要特征 C.现象所处历史条件与经济条件 D.与过去的分组标志一致 E.现象之间的依存关系 答案:ABC习题第三节第三节 统计分布统计分布一、统计分布的概念一、统计分布的概念1、统计分布、统计分布(次数分布次数分布)的概念:将总体的所的概念:将总体的所有单位按组进行归并排列有单位按组进行归并排列,形成总体中各个

14、形成总体中各个单位在各组间的称为统计分布或次数分布单位在各组间的称为统计分布或次数分布或变量分布又称分配数列。是统计整理结或变量分布又称分配数列。是统计整理结果的重要表现形式。果的重要表现形式。2、统计分布的实质统计分布的实质:在各组按顺序排列的基在各组按顺序排列的基础上,列出每个组的总体单位数,就形成一础上,列出每个组的总体单位数,就形成一个数列,称之为次数分布数列,或简称分配个数列,称之为次数分布数列,或简称分配数列,各组的总体单位数叫次数或频数。数列,各组的总体单位数叫次数或频数。3、统计分布的两个要素、统计分布的两个要素: a、是总体按某一标志分的组,、是总体按某一标志分的组, b、各

15、组的单位数、各组的单位数简称简称(次数次数) 根据分组标志不同,分配数列分为品质分配数列和变量分配数列. 品质分配数列:按品质标志分组所编成的分配数列.简称品质数列 变量分配数列:按数据标志分组所编成的分配数列叫变量分配数列简称变量数列.其又可分为:单项式数列 组距式数列.成绩学生数60分以下60707080809090分以上51015155合计50EX:一个班的学生按成绩分组,所形成的:一个班的学生按成绩分组,所形成的次数分布数列次数分布数列 二、统计分布的编制过程:1、根据分组标志不同、根据分组标志不同,可分为品质分配数列和变可分为品质分配数列和变量分配数列:量分配数列: 按品质标志分组,

16、观察总体各单位分布情按品质标志分组,观察总体各单位分布情况的分配数列叫品质数列。按某一数量标志分况的分配数列叫品质数列。按某一数量标志分组,观察总体各单位分布情况的数列叫变量分组,观察总体各单位分布情况的数列叫变量分配数列。配数列。 2、 按照变量是否连续,变量数列可以分为离按照变量是否连续,变量数列可以分为离散变量数列和连续变量数列。散变量数列和连续变量数列。 离散变量变量数列:如果变量值的变动幅度离散变量变量数列:如果变量值的变动幅度小,数目不多,就可以一个变量值对应一组,小,数目不多,就可以一个变量值对应一组,称单项式。称单项式。 如果变量值的变动幅度很大,变量值的如果变量值的变动幅度很

17、大,变量值的个数很多,则把整个变量值依次划分为几个个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,数列称为组距区间,区间的距离称为组距,数列称为组距式数列。式数列。 连续变量数列:只能编制组距式数列。连续变量数列:只能编制组距式数列。 3、静态数列和动态数列:、静态数列和动态数列: 静态数列是指某一时间总体中各总体单位在静态数列是指某一时间总体中各总体单位在各组分布而形成的数列。各组分布而形成的数列。 动态数列是指某一总体在不同时间上的指标动态数列是指某一总体在不同时间上的指标值排列形成的数列。值排列形

18、成的数列。 1、单项式分配数列单项式分配数列 2、组距式分配数列、组距式分配数列(某社区按家庭小孩数分组)(某社区按家庭小孩数分组) (某厂工人按工资分组)(某厂工人按工资分组)3、品质分配数列、品质分配数列(某市企业按经某市企业按经济类型分组济类型分组)按家庭小孩按家庭小孩数分组数分组家庭数家庭数(频数)(频数)比重比重%(频率(频率) 1245682 250516.86 3341.14合计2995100工资分组工资分组职工人数(人)职工人数(人)(次数或频数)(次数或频数)比重比重%(频率)(频率)500-600100256007002005070080010025合计合计400100经济

19、类型分组经济类型分组企业数(频数)企业数(频数)比重比重%(频率)(频率)国有企业国有企业15009集体企业集体企业500330私营企业私营企业1008660.5外资企业外资企业860.5合计合计16675100分配数列的类型分配数列的类型分配数列品质分配数列品质分配数列变量数列变量数列单项数列单项数列组距数列组距数列等距数列等距数列异距数列异距数列 三、变量数列的编制三、变量数列的编制 (一)、单项式变量(一)、单项式变量数列的编制方法数列的编制方法 Ex:P34例例2 (二)、组距式变量(二)、组距式变量数列的编制方法数列的编制方法 Ex:P35表表3-7 累计分布数列:向上累计分布数列:

20、向上累计累计工资分组工资分组职工人数(人)职工人数(人)(次数或频数)(次数或频数)向上累向上累计计500-600100100600700200300700800100400合计合计400 1、编制组距式变量数、编制组距式变量数列的步骤:分组、汇列的步骤:分组、汇总、排列总、排列 向下累计:向下累计:工资分组工资分组职工人数(人)职工人数(人)(次数或频数)(次数或频数)向下累向下累计计500-600100400600700200300700800100100合计合计400 2、编制组距式变量分组要注意的基本要素、编制组距式变量分组要注意的基本要素: (1)组距和组数)组距和组数 组距是指每个

21、组变量值中最大值与最小值之组距是指每个组变量值中最大值与最小值之差,一般把最大值叫该组上限,最小值叫该差,一般把最大值叫该组上限,最小值叫该组下限。组距等于上限与下限之差。组下限。组距等于上限与下限之差。 组距组距=上限上限-下限下限 编制组距数列时,确定组距和组数要遵循编制组距数列时,确定组距和组数要遵循以下两个原则:以下两个原则: a、能区分总体内部各个组成部分的性质差、能区分总体内部各个组成部分的性质差别别 b、能准确清晰的反应总体单位的分布特征。、能准确清晰的反应总体单位的分布特征。 当全距一定时,组距大,组数就少;组距当全距一定时,组距大,组数就少;组距小,组数就多。同一变量数列中,

22、组距与小,组数就多。同一变量数列中,组距与组数成反比。在实际应用中,组距应是整组数成反比。在实际应用中,组距应是整数,最好是或的整倍数。数,最好是或的整倍数。 (2)等距数列与不等距数列:)等距数列与不等距数列: 在组距数列中,各组组距都相等的数列,叫在组距数列中,各组组距都相等的数列,叫等距数列,各组组距不相等的数列,叫异距等距数列,各组组距不相等的数列,叫异距数列。数列。 对于标志之的变动幅度在各组之间相等的组,对于标志之的变动幅度在各组之间相等的组,为等距分组,否则为不等距分组。为等距分组,否则为不等距分组。 在等距分组时,组数在等距分组时,组数=全距全距/组距组距 (3)组限与组中值:

23、组限与组中值: 组限是每个组的两端标志值,每个组的起点组限是每个组的两端标志值,每个组的起点为下限,终点为上限。为下限,终点为上限。每个组上限与下限的中点值叫组中值。每个组上限与下限的中点值叫组中值。即组中值即组中值=(上限(上限+下限)下限)/2 或下限或下限+(上限(上限-下限)下限)/2 或上限或上限-(上限(上限-下限)下限)/2划分组限时,相邻组的上下限可以不重叠,也可以划分组限时,相邻组的上下限可以不重叠,也可以重叠,后一种情况,与上限相等的标志值应该计重叠,后一种情况,与上限相等的标志值应该计入下一组,即入下一组,即“上限不在组内上限不在组内”开口组组限的求法:开口组组限的求法:

24、首组开口的下限首组开口的下限=首组上限首组上限-邻组组距邻组组距末组开口的上限末组开口的上限=末组下限末组下限+邻组组距邻组组距首组开口的组中值首组开口的组中值=首组上限首组上限-邻组组距邻组组距/2末组开口的组中值末组开口的组中值=末组下限末组下限+邻组组距邻组组距/2Ex:某连续变量数列,其末组为开口组,下限为:某连续变量数列,其末组为开口组,下限为180,又知邻组的下限为,又知邻组的下限为150,组中值为,组中值为 末组开口的组中值末组开口的组中值=末组下限末组下限+邻组组邻组组距距/2 =180+(180-150)/2 =195Ex:某连续变量数列,其末组为开口组,:某连续变量数列,其

25、末组为开口组,下限为下限为180,又知,又知邻邻组的组中值为组的组中值为165,则末组组中值为则末组组中值为 邻组组中值邻组组中值=(邻组上限(邻组上限+邻组下限)邻组下限)/2邻组下限邻组下限=2邻组组中值邻组组中值-邻组上限邻组上限 =2*165-180=150邻组组距邻组组距=180-150=30 末组开口的组中值末组开口的组中值=末组下限末组下限+邻组组距邻组组距/2 =180+30/2 =195 Ex:某连续变量数列,其首组为开口组,:某连续变量数列,其首组为开口组,上限为上限为200,又知,又知邻邻组的组中值为组的组中值为220,则首组组中值为则首组组中值为邻组上限邻组上限=2邻组

26、组中值邻组组中值-邻组下限邻组下限 =2*220-200=240邻组组距邻组组距=240-200=40首组开口的组中值首组开口的组中值=首组上限首组上限-邻组组距邻组组距/2 =200-40/2 =180 在组距数列中,关于组中值的表述,下列选项正确的有( )。 A.是上限和下限之间的中点数值 B.当各组内标志值均匀分布时,用来代表各组标志值的平均水平 C.在开口组中无法确定 D.在开口组中,可以参照相邻组的组距来确定 E.是该组的上限值 ( 2010年试题) 答案:ABD习题 (4)频数与频率)频数与频率 所谓频数,是指分配数列中各组的单位数,也叫所谓频数,是指分配数列中各组的单位数,也叫次

27、数;各组单位数占总体单位总数的比重称频率。次数;各组单位数占总体单位总数的比重称频率。各组的频率大于,所有组的频率总和等于。各组的频率大于,所有组的频率总和等于。 在变量分配数列中,频率是将各组的单位数在变量分配数列中,频率是将各组的单位数(频数)与总体单位数相比(频数)与总体单位数相比,求得的用百分比表示求得的用百分比表示的相对数的相对数.也称比率也称比率比重或权重比重或权重.表明对应组标志表明对应组标志值的作用程度。频数(频率)数值越大表明该组值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,

28、表明该组标志值对于总频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。体水平所起的作用越小。某班级统计学考试成绩如下,根据下列数据编制变量数列42 55 87 46 78 79 89 90 92 98 67 56 76 76 88 89 45 66 78 60 95 65 70 54 67 69 80 82 58 60 66 77 72 85 80 88 9070 62 80 90 95 86 78 89 90 92 42 42 45 46 54 55 56 58 60 60 62 65 66 66 67 67 69 70 70 70 72 76 76 76 77 78 78 78 79 80 80 80 82 85 86 87 88 88 89 89 89 90 90 90 90 92 92 95 95 98成绩人数(人)比重(%)7080607060分以下809090分以上合计5091212982418241810016 四、统计分布的表示方法四、统计分布的表示方法 1、列表法、列表法 2、图示法:直方图、折线图、曲线图、饼、图示法:直方图、折线图、曲线图、饼图。图。分配数列包含两个组成要素,即()。.分组标志和组距B.分组和表式C.分组标志和次数D. 分组和次数答案:D习题习题 划分组限时,如果相邻组的上下限重叠,则( )。 A.与上限

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论