版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计数据的整理
统计整理是对取得的资料进行加工整理的工作过程。它是统计调查的继续,又是统计分析的前提。第一节统计数据整理的意义和内容一、统计数据整理的意义统计整理的目的主要体现在以下三个方面:1、对统计调查所获得的反映个体特征的原始数据进行整理,使之成为反映总体特征的综合数据。2、对统计调查获得的次级资料(二手数据)进行再加工和再整理,使之符合当前分析的需要。例1、某地1997年和1990年对城镇居民家庭进行抽样调查所得分组资料如下表。两组资料不宜直接比较。为便于比较,对1990年分组资料进行再分组。1990年城镇居民家庭生活情况1997年城镇居民家庭生活情况对1990年分组资料的再分组例2、在例1中,又设该地1997年对农村进行抽样调查所得分组资料如下表。对1997年城镇和农村的分组资料进行重新整理,得再分组对照表。3、不同的统计分析方法,对数据有不同的要求,也需要通过对数据进行不同的变换等整理方式为统计分析准备适用和需要的统计数据。1997年农村居民家庭生活情况1997年城镇与农村居民家庭资料的再分组二、统计数据整理的内容:(1)根据研究目的设计整理汇总方案;(2)统计汇总;(3)编制统计表。三、统计数据整理的程序:1、审核和订正原始资料。2、分组和汇总。3、编制统计表或统计图。4、积累和保管统计数据。第二节统计分组一、统计分组的意义与作用:统计分组:将统计总体按照一定的标志分成为若干个有联系的组成部分。统计分组的目的就是使组与组之间具有差别性,而同组内的单位保持相对的同质性。统计分组的作用:1、区分现象的类型。2、研究现象的内部结构。3、分析现象之间的依存关系。统计分组的原则:1、科学性原则。2、完备性原则。
3、互斥性原则。二、统计分组的种类:属性分组变量分组简单分组复合分组类型分组结构分组分析分组某企业职工构成(平行分组)某企业职工构成(复合分组)三、原始数据整理结果的基本表现形式—分布数列和次数分布图统计分组的结果——形成次数分布数列。(一)分布数列的概念和种类1、分布数列的概念:分布数列?分布数列:将总体各单位按某个标志分组后,列出各组总体单位数或各组单位数在总体单位数中的比重,这样所形成的数列称为次数分布数列,简称为分布数列或次数分布(分配)。分布在各组的单位数称为次数或频数;各组次数占总次数的比重称为频率。2、次数分布数列的种类:品质数列变量数列例3、我国大陆(不含港、澳、台)人口的性别分布(2000年11月1日0时)某企业某月份工人日产量表变量数列单变量值数列组距数列等组距数列异组距数列开口组闭口组组距数列:间断分组与连续分组。
变量数列是按数量标志分组后形成的分布数列。离散型变量可以编制单项式数列,也可以编制组距式数列。连续型变量只能编制组距式数列。例4、某企业日产量表某县人均年收入表例5、某班学生统计学考试成绩表(二)变量数列的编制1、影响组距数列的因素:组数、组距、组限。其中:组距=上限-下限2、变量数列编制的步骤:⑴首先将原始数据按大小顺序排列,并得到整个数列的最大值和最小值;确定组距参考公式:
⑵根据研究的需要确定组数和组距。确定分组区间的常用方法:①选择一个量纲单位的10k或10-k(k是整数)作为数据分组的区间长度;②为了达到增加区间个数的目的,采用“减半”的原则缩减区间长度;③若经两次区间减半后,区间的个数仍不够,则采用“降低数量级”的方法;④若初始分组的区间长度使得区间的个数太多,则采用“增加数量级”的方法增加区间的长度,以减少区间的个数。
⑶确定组限及表示方法。我国遵循“上限不在本组内”的原则。
⑷将编制好的变量数列用表格的形式或图形的形式来加以显示。例6、某集团公司下属30个企业2000年产值计划完成程度(%)如下:
90,95,100,105,106,108,109,111,112,114,114,115,116,118,118,119,119,120,124,124,124,128,128,129,132,135,135,135,138,139。试据以编制变量数列。
某集团公司30个企业产值计划完成情况表例7.某班的96个同学“统计学”的期末成绩(分)如下:82,73,75,56,57,57,9l,78,89,94,76,50,78,90,67,86,8l,85,65,80,86,85,92,90,86,74,70,85,90,80,85,89,94,8l,76,70,50,60,78,44,91,87,42,90,81,83,86,70,66,72,81,81,75,42,85,83,94,71,85,35,90,89,52,62,72,76,89,47,86,85,79,89,75,83,66,75,73,60,81,85,86,93,97,8l,72,80,64,66,50,60,92,75,78,77,93,88。试编制变量数列以反映其成绩分布状态。
某班同学“统计学”成绩的次数分布
(三)次数分布图及次数分布曲线类型1、次数分布图:(1)直方图与折线图、曲线图:30个企业计划完成程度的直方图对于异组距变量数列,只有以频数密度绘制直方图。频数密度=频数/组距频率密度=频率/组距(2)茎叶图:例7中“统计学”成绩数据的茎叶图(3)圆形图(饼图):圆形图的绘制方法:①画一个大小适当的圆圈,给每一个不同的变量值一个与其频数(或频率)相当的圆心角;②每个不同的变量值所占据的圆心角的大小由下式计算:
某变量值对应的圆心角=该变量值的频率×360°。我国大陆[不含港、澳、台)人口的性别比例(2000年11月1日零点)例3的圆形图(饼图)某班同学“统计学”成绩的次数分布(4)条形图:某班同学“统计学”成绩的次数分布钟形曲线分布图2、次数分布曲线类型:
U型分布曲线:J型分布曲线:(四)累计次数分布及洛伦茨曲线1、累计次数分布:向上累计次数分布向下累计次数分布例6的累计次数分布:某集团公司30个企业产值计划完成情况表例6的累计次数分布折线图洛伦茨曲线
2、洛伦茨曲线:利用两组对应的累计百分比资料的关系构成一个正方形图。本世纪初意大利经济学家基尼(G.Gini)根据洛伦茨曲线给出了衡量收入分配平均程度的指标,即基尼系数,用公式表示为:一、统计表(一)统计表的定义和结构:统计表:第三节统计图表表头横行标题纵拦标题数据资料资料来源:《中国国情国力》2000年第10期
1999年世界500强企业中利润额最高的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年农业行业乡村振兴乡村生态环境人才培养认证考核试卷
- 2025年公路工程监理实务(平行检验监理)考核试卷
- 2025年金融行业养老金融合规考核试卷-养老金融评级业务(如产品风险等级)标准与独立性合规
- 2025年舞台机械负载测试与验收考核试卷
- 2025年BIM模型参数化设计与族库建设考核试卷
- 2025年疫苗行业《合规管理体系搭建与数据安全合规操作实务》专项考核试卷
- 2025年健康中国行动实施-老年健康(认知功能障碍筛查)考核试卷
- 2026年安顺职业技术学院单招职业适应性测试必刷测试卷附答案
- 2026年承德应用技术职业学院单招职业适应性测试必刷测试卷必考题
- 吉安市中医院喉部注射技术考核
- 青岛版二年级数学上册第六单元“用2-6的乘法口诀求商”教学设计
- 口腔辐射安全培训记录课件
- 学校班长培训课件
- lng应急预案安全培训课件
- 2025年健身运动与体能训练技术考试试题及答案解析
- 心理韧性:在困境中绽放的力量+课件-2025-2026学年高一上学期时代楷模主题班会
- 高分子材料概论橡胶课件
- 2025年学历类成考专升本-政治参考题库含答案解析(5套试卷)
- 公路养护机械管理方案(3篇)
- 围手术期感染预防措施
- 建设工程停工承包人费用计算标准T-YJXB-0001-2023知识解读
评论
0/150
提交评论