版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,统计学,第四章统计整理,第一节统计整理概述 一、统计整理的概念和内容 、统计整理的概念:根据统计研究的目的,对调查取得的原始资料进行科学加工(或对次级资料进行再加工),为统计分析提供系统化、条理化的工作过程就是统计整理。,2、统计整理的内容 ()统计分组(关健) ()统计汇总(中心) ()编制统计表(手段) 二、统计整理的程序 1、统计整理的方案 2、统计资料审核 3、统计资料 的分组和汇总 4、编制统计图表 5、统计资料的积累和保管 三、统计资料汇总的方法(略),第二节 统计分组,一、统计分组的概念 统计分组:按照选定的变异标志,把总体划分为若干个不同性质的类型组。使组内同质性,组间差异性
2、。 统计分组对总体是“分”。对总体单位是“合”,一 统计分组的概念和作用,二、统计分组的作用主要有三个方面:,划分社会经济现象的类型。, 类型分组:,单位:亿元,(2)结构分组:研究总体的结构 “九五”期间我国国内生产总值构成(%),(3)分析分组:分析现象之间的数量依存关系 某乡某种农作物的耕作深度与收获率的关系,三、统计分组的原则 1、正确选择分组标志,根据研究问题的目的来选择分组标志。,要选择最能反映被研究现象本质特征的标志作为分组标志。,要结合现象所处的具体历史条件来选择分组标志。,02/25/07,2、正确划分各组界限 (1)分组界限不能过大或过小 (2)分组不能遗漏 (3)分组不能
3、重复,1、品质标志分组 品质分组,反映事物属性差异,四、 统计分组的种类及其方法,(一)按分组标志性质不同分为 :,(1)单变量分组 每组只有一个标志值,运用于变量值少,变动幅度小的情况,如家庭人数分组。 (2)组距式分组 每组若干个标志值,运用于变量变动幅度大、项目多的分组。 如:按月工资(元)分组(600650,650700,700750,)连续型变量只能组距式分组,2、数量标志分组 变量分组,反映事物数量差异,在组距式分组中,因数列两端组限形式不同分:,开口组:最低组与最高组不封口。例:成绩60分以下,90分以上。 闭口组:例40-60分,90-100分。,组距=上限-下限,组距式分组的
4、关健: (1)是确定组距和组数 组数=1+3.322N N为数据的个数,此公式为参考公式,当数据较少,值过大,缩小取整 当数据较多,值过小,扩大取整 组距= 全距/组数 ( 一般取5或10的倍数) 组距与组数的关系 (2)是确定组限,关于组限问题 一般用整数表示,用5或10 的倍数 最小组下限略小于最小的值 最大组的上限略大于最大的变量值 连续变量用重叠组限,适用于越大越好的变量,如产值。,适用于越小越好的变量,如成本。,对连续变量,相邻两组的组限应重叠。习惯上遵守:,对离散型变量,组与组之间是间断的, 可用不重叠组限,若将考试成绩仅分为不及格与及格两组, 则可编成如下组距数列:其中60分为重
5、叠组限。,某班学生统计学考试成绩表,若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。,某班学生统计学考试成绩表,(二)按分组标志的多少分 :,无论是简单分组还是复合分组,都只能对社会经济现象从一个方面或几个方面进行观察和分析研究,而对社会经济现象需要从各方面进行观察和分析研究,这就需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。,1、简单分组 按一个标志对总体进行分组。 2、复合分组 按两个或两个以上标志重叠起来对总体进行分组。,02/25/07,平行分组体系:二个(二个以上)的简单分组并列起来形成的分组体系。 复合分组体系:二
6、个(二个以上)的复合分组形成的分组体系。,第三节 次数分布,一 次数分布的概念,组别(变量) 次数(频数) 频率(比率),某班学生的性别构成情况,组别 次数 频率,组别(变量) 次数(频数) 频率(比率),二、变量数列:是数量标志次数分布数列的简称,单项变量数列(单项数列) 一个变量值代表一个组,适用于离散变量。,组距变量数列(组距数列) 按变量值的变动区间代表一个组。适用于连续变量或变量值的数目多,变动范围较大的离散变量。,某厂第二季度工人平均日产量,数量标志(变量) 次数(频数) 频率(比率),从另一角度看,变量数列分为:,连续型变量数列 可有小数,采取组距式。,离散型变量数列 整数,采取
7、单项式或组距式 (例:一个地区的企业按职工人数分组)。,三、变量数列的编制步骤: 1、排序求全距 2、确定组数,组距和组限 见P93第3题,闭口组的组中值求法:,开口组的组中值求法:,3、编制次数分布表 向上累计次数(频率)即较小制累计。就是将各组次数(频率)由变量值小的组向变量值大的组累计。每一组的累计次数(频率)表示小于该组上限(变量值)的次数(频率)累计有多少。,向下累计次数(频率)即较大制累计。就是将各组次数(频率)由变量值大的组向变量值小的组累计。每一组的累计次数(频率)表示大于该组下限(变量值)的次数(频率)累计有多少。,某班统计学考试成绩次数分配 P80资料,02/25/07,第
8、四节 统计数据 的表现一、统计表,一、统计表的概念 1、概念 统计表是一表格,用来表现 统计资料的一种形式。,2、构成 从形式上看:统计表由总标题、横栏标题、纵栏标题、指标数值构成。,从内容上看:统计表由主词和宾词两部分构成。,统计表要说明的对象或总体。,用来说明总体的统计指标。,2003年某月某公司各企业劳动生产率统计表 单位_,横 行 标 题,主词,宾词,总标题,纵栏标题,数据资料 (指标数值),02/25/07,3、统计表的种类 (1)按用途分:调查 表 汇总表 分析 表 (2)按统计数列 的性质分: 时间数列表 空间数列表 时空数列结合表 (3)按主词结构分: 简单表 简单分组表 复合
9、分组表,某年某公司所属两企业自行车合格品数量表,某年某地区工业增加值和职工人数,02/25/07,4、统计表的宾词设计 (1)平行分组设计:按不同的分组 标志平行排列设计。 (2)分组重叠设计:按两个或两个以上标 志进行复合分组,作重叠排列设计(P85)。,1. 总标题须简明扼要表达出全表的内容; 2. 各标题要确切反映表的内容,且表格安排合理; 3. 指标数值要位数对齐,缺项补0。不得用同上、同下、同左、同右代替相同的数字。 4. 对指标内容作必要说明时,可加注在表的下方; 5. 表的上下边线(基线)用粗实线或双线,表的两边是开口式; 6. 纵栏较多时编栏号,指标数值栏要注明计量单位和资料表
10、示的时间。 7. 表中不允许有空格:若不需要此资料则用“_”,暂缺某资料则用“” 总原则:合理、科学、实用、简练、美观。,二、 统计图,即用几何图形即统计图来表示次数分布,1、直方图,仍以上例考试成绩数据,画成如下直方图:,2、折线图,在直方图的基础上连接各条形顶边的中点成折线图,如下图红笔围成。在折线图的基础上修匀为平滑曲线即为次数分布曲线图。 (对单项数列可直接绘制次数多边形图),折线图还可用来表示累计次数分布(仍以上例数据):,3、曲线图 是组数趋向于无限多时折线图的极限描绘,是一种理论曲线,其曲线的形态有各种不同的类型,主要有以下几种:,向下累计,向上累计,钟型分布的种类很多,主要有对
11、称分布和非对称分布。在统计上具有重要意义的正态分布是一种理想的对称分布。,对称型,Y,Y,右偏型 (上偏型),左偏型 (下偏型),X,X,非对称分布,又称偏态分布曲线,或称偏态曲线,(2)U型分布曲线 :其形状为两头大,中间小,J型分配曲线,U型分配曲线,(3)J型分布曲线 有正J和反J之分如上图 (4)还有双峰曲线,如下图,02/25/07,在社会经济统计中会遇到这样一类问题,即总体 的 标志总量在总体各单位之间的配置是否均衡公平例如 社会资源的区域分配,市场产品在企业 间的分配, 利税收入在部门、地区分配等 (4)劳伦茨曲线 统计学家 劳伦茨用累计百分数曲 线来评价总体 标志总量在总体各单
12、位间的配置是否 均衡、公平。这种曲线称为劳伦茨曲线。 劳伦茨在研究居民收入分配公平 程度时 把居民收入 数累计百分比与家庭户数累计百分比结合起来绘制实 际分配曲线用 于揭示居民收入分配的公平程度。P87,02/25/07,(5)基尼系数(劳伦茨系数) 意大利经济学家基尼根据劳伦茨曲 线提出了定量测度收入分配平均程度的 方法。 基本公式 G= SASASB 其中 G=0 分配绝对公平 G=1分配绝对不公平 0G1时,接近0赿平均,接近 1差异越大 计算公式 G=( MWiVWi+1MWi+1Vwi) 评价标准 合理值在0.25左右即在0.2O.3之间 我国评价标准是 G 0.2 为高度平均 0.
13、2 G 0.3为相对平均 0.3G0.4 为仍属合理 G0.4为不公平,02/25/07,一填空题 1、_是统计工作的中间阶段,它是 _继续_前提。 2、按数量标志分组形成的分配数列,称为 _它包括_和_两要素。 3、用_代表各组的一般水平。 4、组距数列中,组距的大小与组数的多少成_。 5、统计表从形式上看,包括_,_ _和_;从内容上看,包括_ _。 6、统计分组的关健是_。,02/25/07,二判断题 1、连续变量分组只能是组距式 ( ) 2、较小制累计次数表示大于该组变量值下限的 次数合计有多少 ( ) 3、洛伦茨曲线是采用次数分布曲线的形 式研究收入分配公平程度的一种方法 ( ) 4
14、、人口按年龄大小的分布呈正 J分布( ) 5、由于离散型变量取的是整数而不能取 小数, 因此只能编制单项式分配数列 ( ),02/25/07,三、单选题 1、次数分布的构成要素是 ( ) A 分组标志和指标 B 分组标志和次数 C 数量分组标志数值和 频 数 D 品质分组标志值和频数 2、某连续变量数列,其末组为开口组 下限为200,又知其邻组的组中值为170 则末组组中值为 ( ) A 260 B 230 C 215 D 185 3、统计表从内容上看主要由( )构 成 A 主词和宾词 B 各标题和数字 C 总体及分组 D 指标和指标数值,02/25/07,三、单选题 4、简单分组与复合分组的
15、根本区别是 ( ) A 分组标志的大小 B 分组标志的多少 C 分组标志是品质标志或数量 标志 D 所用统计表是简单表或复合表 5、统计分组时,在全距一定的情况下 ( ) A 组距越大,组数越多 B 组距越大 组数越少 C 组距大 小与组数多少无关 D 组距大 小与组数多少成正比,02/25/07,四、多项选择 1、统计分组的作用 ( ) A.说明总体 基本情况 B. 区分经济类型 C.研究内部结构 D.分析现象之间依存关系 E.揭示总体 变化趋势和规律 2、统计表按主词是否分组可分为 ( ) A.简单表 B.一览表 C.分组表 D.复合表 E.单一表,02/25/07,3.下列那组资料可用劳伦茨曲线分析 ( ) A.家庭人口数和收入数 B .企业个数和企业 产值数 C.学生分数和学生数 D.科技收入额和科研机构数 E.农业收入额和工业收入额 4.下列那些属于连续变量次数分布数列 ( ) A.工人技术等级和全部工人数 B.煤炭灰分程度和煤炭产量 C.平均劳动生活率和工人数 D.在校学生数和全市学生数 E.产品品种和全部产品产量,02/25/07,5.钟型分布是统计分布的一种常
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 团队合作:学会与人携手共进小学主题班会课件
- 2025年时尚行业虚拟试衣技术报告
- 工业品分销网络优化与智能仓储管理方案
- 制药工程师技能培养指导书
- 初中英语写作中从句嵌套错误识别与干预措施课题报告教学研究课题报告
- 维修人员设备保养操作方案
- 音乐可视化交互网页前端技巧课程设计
- bpmf人教版电子课程设计
- 数字博物馆导览App规范要求课程设计
- 机械管柱维修方案范本
- 安全答题题库及答案
- 供水抄表员安全知识培训课件
- DB64-266-2018 建筑工程资料管理规程
- 西藏拉萨北京实验中学2025届数学七下期末统考试题含解析
- 北京路沂河桥及两岸立交改造工程桥梁顶升专项施工方案
- 2024年专利代理人专利法律知识考试试卷及参考答案
- GB/T 44804-2024声学自由场条件下18岁至25岁耳科正常人听力阈值的统计分布
- 学生处分撤销申请书范文1
- J-T 3351-2024 农村公路简易铺装路面设计施工技术细则 (正式版)
- 教育与美好人生智慧树知到期末考试答案2024年
- VTE预防健康教育
评论
0/150
提交评论