




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一节 统计数据的整理 一、数据整理的概念和作用 统计整理是指根据统计研究的目的,将统计调查所得的原始资料(也称初级资料)进行科学的分类和汇总;或对已经加工的综合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的综合资料的工作过程。 统计整理是统计调查的继续、统计分析的前提。,第三章 数据的整理和展示,二、统计整理的步骤 (一)设计和编制统计资料的整理方案。 (二)对原始资料进行审核。 (三)用一定的组织形式和方法,对原始资料进行排序、分组、汇总和计算。 (四 )对整理好的资料再一次进行审核,改正在汇总过程中发生的各种差错。 (五)编制统计图表。 (六)统计数据的积累和保管。,汇
2、总 手工汇总 2.计算机汇总,四、统计整理的方法,三、统计整理的组织方式 1、逐级整理 2、集中整理 3、逐级整理与集中整理相结合,第二节、统计分组 一、统计分组的概念 统计分组是根据统计研究的目的和研究对象的特点,将统计总体各个单位按照一定的标志划分为若干性质不同的部分或组。 统计分组的两方面涵义: 对总体而言,是“分”,即将总体中的各个个体按照它们的差异性区分为若干部分; 对个体(总体单位)而言,是“合”,即将性质相同的个体组合起来。 即对总体实行异质分解,对总体单位实行同质组合。即组内同质性,组间差异性,分组,分组前,分组后,25,33,42,(1)划分社会经济现象的类型,二、作用:,例
3、:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济,(2)揭示社会经济现象的内部结构和比例关系,例:上海市按GDP计算的三次产业结构(%) 1980年1990年 1996年1997年 GDP100 100 100 100 第一产业3.2 4.32.5 2.3 第二产业75.7 63.854.5 52.2 第三产业21.1 31.943.0 45.5,(3)研究现象之间的依存关系,例:某地农民家庭按收入分组的恩格尔系数,按收入分组(元) 200 300 400 500 600 800 1000 恩格尔系数(%) 6
4、4.9 60.2 56.7 54.4 50.5 49.9 43.6,(1) 科学性原则 (2) 完整性原则(穷尽原则)即应使总体中的每一单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。 (3) 互斥原则(不相容性)即总体中任一单位只能归入某一组。,三、统计分组的原则和方法,1、统计分组的原则,2、统计分组的方法,统计分组的关键在于正确选择分组标志。 (1)分组标志的选择原则是: 1)从研究目的出发选择分组标志; 2)选择最能反映现象本质特征的分组标志; 3)根据事物所处的具体历史条件和经济条件选择分组标志。,(2)分组方法(统计分组的种类) 1)、按分组标志的性质不同,分为品质分组
5、(或称属性分组)和数量分组(或称变量分组)。 品质分组按品质标志进行的分组。 数量分组按数量标志进行的分组。 、按分组的作用和任务不同,分为类型分组、结构分组和分析分组。 类型分组将复杂现象分为若干性质不同部分的分组。 结构分组表明总体结构的分组。 分析分组分析现象间依存关系的分组。,2)、按采用分组标志多少不同的分组方法 简单分组对总体各单位只采用一个标志进行分组。 平行分组体系对总体各单位同时采用两个或两个以上的标志进行并列分组。 (表3-4) 复合分组对总体各单位同时采用两个或两个以上的标志进行层叠分组。(表3-5) 四、统计分类标准化和国民经济中常用的统计分组,第三节 次数分布 一、次
6、数分布数列的概念和种类 1、次数分布数列的概念 在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做频(次)数分布,将各组组别与次数依次编排而形成的数列叫做次数分布数列,简称为分布数列。,次数分布(分布数列),是一种重要的分组资料,反映总体单位在各组的 分布状态。,基本形式:,分组,单位数(频数),频率,合计,100,次数分布,频率分布,一、次数分布数列的概念和种类 2、次数分布数列的种类 按分组标志特征的不同,分布数列可以分为两种: 品质分布数列与变量分布数列。 (1)品质分布数列,()按数量标志分组 则应按照研究目的及研究对象的特点确定相应的组数,划
7、分相应的组限。 按数量标志分组即变量分组,有两种: 单项式分组 单项式分组即将某一变量的每一个变量值作为一组。组数及组限是明确的。 *,单项式分组,组距式分组,变量分布数列的分类见P56图示,组距式分组在连续变量或变量值较多的情况下,可采用组距分组。它将全部变量值依次分为若干个区间,并将这个区间的变量值作为一组。 连续型变量相邻两组的上、下限采用同限,且遵循“下闭上开”(即上限不在内)的原则。“上限在不内”原则:在连续组距式分组中,以同一个数值作为相邻两组共同的界限,统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。 离散型变量相邻两组的上、下限间断
8、,且采用差数为“”的形式。 相邻两组的上、下限重叠。,下限,上限:组距式分组的每一组变量值中,其最小值为下限,最大值为上限。 组限:相邻两组的界限。 间断组距式分组:组限不相连的组距式分组。 连续组距式分组:组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式分组。 离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。 开口式分组第一组缺下限、最末组缺上限 闭口组各组上下限齐全,组距:上下限之间的距离。 连续式分组的组距计算公式: 组距=本组上限本组下限 间断式分组的组距计算公式: 组距=本组上限本组下限+1 等距分组:标志值在各组保持相等的组
9、距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。 异距分组:各组的组距不相等。 开口组的组距:以相邻组的组距为本组的组距。,组中值:上下限之间的中点数值称为组中值,组中值的计算公式: 计算平均指标或进行其它统计分析时,常以组中值来代表各组标志值的平均水平。 组数 组数=全距/组距 组数依经验确定,一般分为组。,缺下限开口组组中值=该组上限-1/2邻组组距, 缺上限开口组组中值=该组下限+1/2邻组组距。,闭口组组中值=(上限+下限)2,二、变量数列的编制 1、单项变量数列的编制 适用于变量值个数不多的离散型变量 第一步:将调查获得的原始资料按数值大小依次排列 第二步:
10、确定各组的标志值和组数。 第三步:计算各组的次数和频率。 第四步:按变量值大小顺序编制单项变量数列。,二、变量数列的编制 2、组距变量数列的编制 适用于标志值比较多的离散型变量和连续性变量 第一步:将调查获得的原始资料按数值大小依次排列起来,并确定最大值、最小值和全距。 (全距)最大值最小值。 第二步:确定组数和组距。 第三步:确定组限和组限的表示方法。 第四步:计算各组次数和频率,编制成组距数列。,三、次数分布的特征,图3-1.2.3 几种常见的次数分布,一、统计表 1、统计表的概念和作用 统计调查所取得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表
11、格上,就形成了统计表。 广义的统计表包括统计工作各个阶段中所用的一切表格:调查表,汇总整理表,计算分析表。狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表。,第四节:统计数据的图表展示,2、统计表的结构 可以从表式和内容两个方面来认识。 1从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。 2从内容上看,统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量持征的各个统计指标。,统计表的制作要求(1),(1) 统计表的各种标题,特别是总标题的表达应该十分简明、确切
12、,概括地反映出表的基本内容,总标题还应该标明资料所属的地点和时间。 (2) 统计表的内容要扼要而不庞杂,无论主词(即统计表所要说明的总体及其分组)还是宾词(即用来说明主词的各种统计指标)分组层次不宜过多,为使统计表长宽适中,必要时,可将主词与宾词互换位置。 (3) 表中数字应填写整齐,对准位数。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一.当数字为0或因数小可略而不计时,要写上0;当缺乏某项资料时,用符号“”表示;无数字的空格,用符号“”表示。,统计表的制作要求(2),(4) 统计表中必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表的右上方;当表
13、中需要分别注明不同单位时,横行的计量单位,可专设“计量单位”一栏,纵栏的计量单位,要与纵栏标目写在一起,用小字标写。 (5) 统计表的表式,一般是“开口”式的,即表的左右两端不划纵线;表的上下端基线通常要划粗线,其余用细线表示。 (6) 必要时,统计表应加注说明或注解。例如某些指标有特殊的计算口径,某些资料只包括一部分地区,某些数字是由估算来插补的等等,都要加以说明。此外还要注明统计资料的来源,以便查考。说明或注解一般写在表的下端,说明或注解不宜太多。,二、统计图 统计图是用几何学的点、线、面或具体事物的形象所构成的用来描述统计资料的图形。,【例】某生产车间50名工人日加工零件数如下(单位:个
14、):,117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,1、直方图(Histogram): 用矩形的宽度和高度来表示频数分布的图形。高度表示每一组的次数,宽度表示各组的组距。,频 数 (人),15,12,9,6,3,日加工零件数(个),图2-1 某车
15、间工人日加工零件数的直方图,2、折线图,折线图也称频数多边形图 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来形成的多边形图 折线图的两个终点要与横轴相交,做法是:第一个矩形的顶部中点和最后一个矩形顶部中点分别通过竖边中点连接到横轴 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频 数 (人),折线图的绘制,图2-4 某车间工人日加工零件数的折线图,2、折线图,3、曲线图:在作直方图时,如果数据不断增多,组距不断缩小,直方图中的矩形将逐渐变窄,顶端将渐渐珠连
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东省茂名市电白区2025届物理高一第二学期期末复习检测试题含解析
- 2025届浙江省湖州市高二物理第二学期期末经典模拟试题含解析
- 辽宁省重点六校协作体2025年物理高二下期末经典模拟试题含解析
- 2025届天津市宁河区芦台第一中学高二物理第二学期期末质量检测模拟试题含解析
- 2025届福建省龙岩市漳平第一中学物理高一第二学期期末教学质量检测模拟试题含解析
- 河南省济源市2025届物理高二第二学期期末复习检测模拟试题含解析
- 小店快递合作协议书范本
- 出租私家车位协议书范本
- 大班安全教育实施要点
- 社区临时看护协议书范本
- DB65∕T 3952-2016 反恐怖防范设置规范 学校
- 科研助理合同协议书
- 患者身份识别制度培训
- 绿化工程挂靠合同协议
- 父亲同意孩子户口迁到母亲协议书5篇
- 《诸子百家教学课件》课件
- T-SHWSHQ 01-2023《医疗卫生机构安全生产标准化管理规范》
- 房屋美化合同协议
- 四年级音体美试卷及答案
- 混凝土外观质量规范要求
- 数控操作工培训内容
评论
0/150
提交评论