第3章统计整理_第1页
第3章统计整理_第2页
第3章统计整理_第3页
第3章统计整理_第4页
第3章统计整理_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 统计整理第三章第三章 统计整理统计整理第一节第一节 统计整理方案统计整理方案第二节第二节 统计分组统计分组第三节第三节 统计表统计表第四节第四节 分布数列分布数列统计整理统计整理是统计调查的继续,统计分析的是统计调查的继续,统计分析的前提和基础前提和基础 统计资料的分组、汇总及制表统计资料的分组、汇总及制表 数据的传输、贮存、更新及输出数据的传输、贮存、更新及输出第一节第一节 统计整理统计整理方案方案统计整理的步骤统计整理的步骤 一、统计分组的概念和意义一、统计分组的概念和意义 二、统计分组的程序和原则二、统计分组的程序和原则 三、统计分组的种类三、统计分组的种类 四、变量分组四、变量

2、分组第第二二节节 统计分组统计分组一、一、统计分组统计分组的概念和意义的概念和意义选择分组选择分组标志标志确定分组确定分组体系体系总体单位总体单位归类归类科学性:科学性:组间差异大,组间差异大,组内差异小。组内差异小。完备性和互斥性:完备性和互斥性:每个单位均能且每个单位均能且只能归到某个组只能归到某个组中。中。按家庭收入水平按家庭收入水平分组;分组;按城乡分组;按城乡分组;按性别分组;按性别分组;按年龄分组。按年龄分组。 单亲下岗;单亲下岗; 双亲下岗;双亲下岗; 双亲在岗。双亲在岗。三、统计分组的种类三、统计分组的种类对教师对教师的分类的分类按性别分类按性别分类男性男性女性女性按职称分类按

3、职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类四、变量分组四、变量分组1 1、变(数)量分组、变(数)量分组2 2、相关指标的计算相关指标的计算组距数列的编制组距数列的编制1 1、变(数)量分组、变(数)量分组 1 1)单项式分组和组距式分组)单项式分组和组距式分组 2 2)间断组距式分组和连续组距式分组)间断组距式分组和连续组距式分组 3 3)等距分组和异距分组)等距分组和异距分组1)单项式分

4、组与组距式分组)单项式分组与组距式分组 单项式分组:用一个变量值作为一组,形成单项式变量数单项式分组:用一个变量值作为一组,形成单项式变量数列。列。 单项式分组一般适用于单项式分组一般适用于离散型变量且变量变动范围不大离散型变量且变量变动范围不大的的场合。场合。 组距式分组:将变量依次划分为几段区间,一段区间表现组距式分组:将变量依次划分为几段区间,一段区间表现为为“从从到到”,把一段区间内的所有变量值归为一组,把一段区间内的所有变量值归为一组,形成组距式变量数列。形成组距式变量数列。 组距式分组适用于组距式分组适用于连续型变量连续型变量或者变动范围较或者变动范围较大大的的离散离散型型变量。变

5、量。 下限,上限:组距式分组的每一组变量值中,其下限,上限:组距式分组的每一组变量值中,其最小值为下限,最大值为上限。最小值为下限,最大值为上限。 组距:上下限之间的距离。组距:上下限之间的距离。 组限:相邻两组的界限。组限:相邻两组的界限。 “上限在不内上限在不内”原则:统计上规定,凡是总体某原则:统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。位归入作为下限值的那一组内。 2)间断组距式分组和连续组距式分组)间断组距式分组和连续组距式分组间断组距式分组:组限不相连的组距式分组。间断组距式分组:组限不相

6、连的组距式分组。连续组距式分组:组限相连的组距式分组。连续组距式分组:组限相连的组距式分组。离散型变量,可间断组距式分组,也可连续组距离散型变量,可间断组距式分组,也可连续组距式分组。式分组。连续型变量,只能采用连续组距式分组。连续型变量,只能采用连续组距式分组。3)等距分组与异距分组)等距分组与异距分组 等距分组:标志值在各组保持相等的组距,即等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。各组的标志值变动都限于相同的范围。 一般用于标志值变动比较均匀的场合。一般用于标志值变动比较均匀的场合。 异距分组:各组的组距不相等。异距分组:各组的组距不相等。 一般用于标志值

7、变动分布不均匀一般用于标志值变动分布不均匀2、 相关指标的计算相关指标的计算1)组距)组距连续式分组的组距计算公式:连续式分组的组距计算公式:组距组距=本组上限本组上限本组下限本组下限间断式分组的组距计算公式:间断式分组的组距计算公式: 组距组距=本组上限本组上限-前组上限(通用公式)前组上限(通用公式)2)组中值:)组中值:上下限之间的中点数值,组中值的计算公式:上下限之间的中点数值,组中值的计算公式:年龄分组:,年龄分组:,2下限上限组中值某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销售额(万元)销售额(万元)商店数商店数(个)(个)每百元商品销售额每

8、百元商品销售额中支付的流通费中支付的流通费(元)(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L组距组距d=U-L=100-50=50(万元)(万元)组中值组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)开口式组距数列组中值的计算:开口式组距数列组中值的计算: 首组假定下限首组上限相邻组组距首组假定下限首组上限相邻组组距 末组假定上限末组下限相邻组组距末组假定上限末组下限相邻组组距先计算开口组的假定上、下限:先计算开口组的假定上、下限: 因此有:因此有:22相邻组组距

9、上限首组首组假定下限首组上限22相邻组组距下限末组末组假定上限末组下限首组首组组中值组中值末组末组组中值组中值某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销售额(万元)销售额(万元)商店数商店数(个)(个)每百元商品销售额每百元商品销售额中支付的流通费中支付的流通费(元)(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5组中值组中值=300+(300-200)/2 =350(万元)(万元)组中值组中值=50-(100-50)/2 =25(万元)(万元)3、组距数列的编制 1)等距数列的

10、编制)等距数列的编制 2)异距数列的编制)异距数列的编制等距数列编制等距数列编制适用于总体单位的标志值变适用于总体单位的标志值变动比较均匀的情况动比较均匀的情况7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.613.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8

11、10.5 16.3 22.02.03.54.04.55.05.86.06.46.87.07.48.38.59.510.010.511.411.912.012.412.612.813.213.413.613.914.214.514.714.815.015.515.615.716.016.316.717.117.317.518.218.719.320.021.022.023.025.026.029.0确定组距的原则:确定组距的原则:q要能区分各组的性质差异要能区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍

12、的整数倍确定组距及组数确定组距及组数R组距组距(d) 组数(组数(m)编制等距数列编制等距数列编制步骤:编制步骤:求全距求全距百万元)(27229minmaxXXR计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)组)(615271dRm1dRmdRmdRdR确定组限确定组限对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也可,也可重叠重叠;对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;符合符合“上组限不计入上组限不计入”原则;原则;首末两组可使用首末两组可使用“以下以下”及及“以上以上”的开口组。的开口组。编制等距数列编制等距数列编

13、制异距数列编制异距数列编制步骤:编制步骤:确定标准组距确定标准组距标准组距标准组距=数列中最小组组距数列中最小组组距2.确定标准组距次数确定标准组距次数或者直接计算次数密度或频率密度或者直接计算次数密度或频率密度频数密度频数密度=频数频数/组距组距频率密度频率密度=频率频率/组距组距工人按年龄分工人按年龄分组组组距组距人数(人)人数(人)标准组距人数标准组距人数次数密度次数密度15202025253030353545455055551051728407065101728407032.5103.45.68146.52合计合计230第第三三节节 统计图表统计图表统计表的常用结构:统计表的常用结构:

14、以纵横交叉的线条所形成的表格来表现以纵横交叉的线条所形成的表格来表现统计资料的形式统计资料的形式一一、统计表、统计表统计表有广义和狭义之分:统计表有广义和狭义之分:广义指统计工作阶段中的所有的一切表格。广义指统计工作阶段中的所有的一切表格。狭义指整理后的结果表和分析表。狭义指整理后的结果表和分析表。具有具有容量容量大、大、方便方便计算计算等特等特点点 总总 标标 题题数据栏数据栏主词栏主词栏宾词栏宾词栏注释注释按月工资分按月工资分组组按性别分(人按性别分(人) 按级别分按级别分小计小计男男女女小计小计技工技工学徒工学徒工300以下以下300400400500500600600700700以上以

15、上416221510516101184310124214162215105024585414181020合计合计724032722448对宾词栏的简单设计对宾词栏的简单设计按月工资按月工资分组分组按级别分(人)按级别分(人)总总计计技工技工学徒工学徒工小计小计男男女女小计小计男男女女对宾词栏的复合设计对宾词栏的复合设计统计图统计图以点、线条、面积等方法描述、显以点、线条、面积等方法描述、显示统计数据的形式示统计数据的形式二二、统计图、统计图HistogramVAR00001174.0170.0166.0162.0158.0154.0403020100Std. Dev = 4.86 Mean =

16、 163.3N = 83.00饼图饼图 Pie第四节第四节 分布数列分布数列 1 1、分布数列的定义及种类、分布数列的定义及种类 2 2、累计频数与累计频率、累计频数与累计频率 3 3、频数分布的类型、频数分布的类型将总体各单位按某个标志分成若干组,将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组在总体中列出各组的总体单位数或各组在总体中所占的比重而形成的数列所占的比重而形成的数列构成要素构成要素1、分配数列的定义及种类、分配数列的定义及种类频数频数: 分布在各组的个体单位数分布在各组的个体单位数频率频率: 频数与总频数之比频数与总频数之比各组频数(各组频数(fi)之和等于总体单位

17、数)之和等于总体单位数各组频率各组频率( )( ) 之和等于之和等于1 1,且,且0 0 频率频率1 1iiff 从变量值从变量值低低的组开始,将各组频数(频的组开始,将各组频数(频率)逐次向变量值率)逐次向变量值高高的组累计,说明某一的组累计,说明某一组上限组上限以下各组的累计频数(频率)。以下各组的累计频数(频率)。向向上上累累计计向向下下累累计计 从变量值从变量值高高的组开始,将各组频数(频的组开始,将各组频数(频率)逐次向变量值率)逐次向变量值低低的组累计,说明某一的组累计,说明某一组下限组下限以上各组的累计频数(频率)。以上各组的累计频数(频率)。2、累计频数与累计频率、累计频数与累

18、计频率VAR0000111.21.21.222.42.43.622.42.46.044.84.810.811.21.212.022.42.414.522.42.416.91214.514.531.378.48.439.889.69.649.444.84.854.233.63.657.889.69.667.556.06.073.533.63.677.178.48.485.511.21.286.756.06.092.822.42.495.233.63.698.811.21.2100.083100.0100.0152.00154.00155.00156.00157.00158.00159.00160.00161.00162.00163.00164.00165.00

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论