版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
任务三统计整理
学习目标知识目标理解统计整理的意义和整理步骤理解统计分组的概念和作用掌握统计分组的方法掌握编制统计表和绘制统计图的方法掌握运用Excel软件进行统计整理的方法能力目标能够根据实际资料进行统计分组、编制分配数列能够根据实际资料编制统计表、绘制统计图能够利用Excel软件对统计资料进行整理
经过前期艰苦的统计调查,你已经从A市自来水公司的客户那里获得了原始的调查资料,统计调查阶段结束。现在你的统计工作开始进入统计资料整理阶段,这一阶段你的任务是将收集来的零散的、不系统的、甚至是存在虚假差错的统计资料进行整理,为下一阶段的统计分析创造良好的条件。
任务描述与分析(1)资料的整理大致分为哪些工作环节?(2)使用什么方法能够使零散的原始调查资料条理化?(3)在汇总调查资料时,使用手工汇总还是计算机汇总?(4)使用什么方法把整理好的调查资料表现出来?思考问题相关知识知识一、统计整理的意义和步骤知识二、统计分组知识三、分配数列知识四、统计表和统计图知识五、Excel在统计整理中的应用是指根据统计研究的目的和任务,将统计调查所得的原始资料进行科学的分类和汇总,或对已经加工的综合资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。
统计整理是统计工作的中间环节,它是统计调查的继续,也是统计分析的前提,在统计工作中起着承上启下的重要作用。统计整理的质量不仅直接关系到调查资料能否发挥其应有的作用,也直接影响到统计分析和预测能否得出正确的结论。统计整理的概念
统计资料整理是统计工作的第三个阶段,是统计人员根据统计研究的目的,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化,从而得到表现总体特征的综合统计资料的工作过程
。
设计统计整理方案对原始资料进行审核录入数据数据排序与分组绘制统计表和统计图统计整理的步骤统计分组的概念统计分组是根据统计研究的需要,将统计总体按照一定的标志分为若干组成部分的一种统计分析方法。统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分
(组间差别性)
对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组
(组内同质性)统计分组的作用反映总体特点和规律划分现象类型揭示现象内部结构分析现象的依存关系案例3-1:某班级共50位学生,以下是某次统计考试的卷面成绩,请对该班的学习成绩进行具体分析。89
75
60
48
95
88
78
90
66
93
74
71
58
85
80
69
79
7792
70
61
55
8183
66
62
51
72
90
86
65
73
83
61
86
6782
71
51
92
69
77
87
82
79
72
75
80
76
58
统计分组的作用表3-1
某班学生统计考试成绩分组表按成绩分组学生人数(人)60分以下0660~70分1070~80分1580~90分1390~100分06合计50从表3-1中可以看到,某班学生的统计考试成绩经过分组整理后,能够比较直观地反映该班的总体成绩情况了。统计分组的作用表3-2
某市100个商店流通费用率情况按销售额分组(万元)商店数(个)流通费用率(%)100以下1011.8100~2002011.2200~3003010.5300~4002509.7400以上1508.9由表3-2的分组资料可见,销售额与流通费用之间具有明显的依存关系,即销售额越大,每百元销售额中的流通费用越小。统计分组的作用统计分组的方法选择分组标志确定分组界限编制分配数列目的和任务原则反映现象本质特征原则历史条件和经济条件原则统计分组的方法一、选择分组标志
在学习确定分组界限之前,我们先来了解一些分组中用到的概念。根据分组标志的不同,统计总体可以按品质标志分组,也可以按数量标志分组。按品质标志分组按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志是指选择反映现象属性特征的品质标志作为分组标志例如:学生按性别分组统计学生的考试成绩,按成绩分组统计分组应达到的要求穷尽性:每一单体单位都能划归到各自所属的组互斥性:不同组所包括的单位性质相异统计分组的方法二、确定分组界限简单分组对总体只按一个标志进行分组复合分组对同一总体,先按一个主要标志分成若干组,再按其他辅助标志在对各组细分,形成多层次分组组合。国民收入累积额生产性非生产性固定资产流动资产固定资产流动资产国民收入累计额:平行分组体系:对同一总体,分别按几个标志进行简单分组按用途分生产性非生产性按性质分固定资产流动资产统计分组的方法二、确定分组界限案例3-2解析
提示:其实在设计调查问卷时就已经涉及分组概念了,调查问卷上的每一个调查项目(标志)都已进行了分组。例如,问卷中的问题D1,“对于A市自来水有限公司提供的自来水的质量,您的满意度如何?”,这个调查分为“无特殊气味”、“无杂质”、“无色”、“无特殊味道”等4个项目,分别按“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”进行了分组。案例3-2:现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你觉得会使用哪些分组方法?案例分析
我们通过选择合理的分组标志和分组界限解决了如何分类汇总统计资料的问题,在此基础上我们需要实施第3个步骤,通过编制分配数列,将分组统计汇总的结果表现出来。
在明确了应如何对A市自来水公司的客户满意度进行分组的基础上,你现在开始着手对客户意见进行汇总,当你计算汇总出结果后,该以什么方式来反映分组统计出的客户意见的总体情况呢?案例3-3统计分组的方法三、编制分配数列
分配数列又称分布数列、次数分布,是指在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布。分布数列是统计整理结果的一种重要表现形式,也是统计分析的一种重要方法。它表明了总体单位分布的特征和结构状况,为进一步研究总体的构成、计算统计指标提供了方便。品质分配数列变量分配数列单项数列(P43表3-6)组距数列等距数列不等距数列分配数列统计分组的方法三、编制分配数列只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现所出现的次数即可。统计分组的方法品质分配数列的编制行为类型人数(个)
比重(%)绝不闯红灯有急事才会闯没有过往车时会闯有人闯我就闯能闯就闯17688769972735274
合计250100某市市民遵守交通规则观念调查统计表统计分组的方法变量分配数列的编制单项数列的编制
某生产车间50名工人日加工零件数:(个)117、108、110、112、137、122、131、118、134、114、120、127、123、125、124、129、117、126、123、128、139、122、133、119、124、107、133、134、113、115、117、126、127、120、139、128、123、123、122、130、122、118、118、127、124、125、108、112、135、121零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)10711191128210821202129111011211130111221224131111311234133211411243134211511252135111731262137111831273139250名工人日加工零件排序并分组:
在进行组距分组时,会涉及到一些问题,包括:等距分组和不等距分组、组限、组距、组中值等。统计分组的方法三、编制分配数列组限组限就是每一组两端的数值。
10—2020—3030—40下限上限职工人数(人)
99以下
100—199200—299300—399固定资产额(万元)
50—6060—7070—8080—90衔接式确定组限适用于离散变量重叠式确定组限适用于连续变量衔接式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。重叠式确定组限:汇总各组单位数时,按照“上限不在本组内”的原则汇总。统计分组的方法组距变量值在各组变动的最大范围。组距计算方法:重叠式组限的组距=上限-下限职工人数(人)
99以下
100—199200—299300—399固定资产额(万元)
50—6060—7070—8080—90衔接式组限的组距=大邻组的下限-本组下限统计分组的方法等距分组各组组距均相等。如:
10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。不等距分组各组组距不一定相等。如:
10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。统计分组的方法组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2=下限+组距/2=上限-组距/2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75闭口组:上限、下限都具备开口组:只有上限或下限的组
······以上·······以下将变量值进行分组计算各组频数、频率、累计频数和累计频率对全距分段原始资料按数值大小顺序排列排顺序求全距单项数列适用于离散型变量数列且取值不多累计频数计算组中值累计频率组距数列适用取值较多离散变量数列适用连续型变量数列开口闭口等距异距组距数列的编制基本步骤:第一步:将原始资料按数值大小依次排列,计算全距。第二步:确定变量数列形式(确定编制单项式数列还是组距式数列)。第三步:确定组距和组数。
全距=最大变量值-最小变量值
组数=全距÷组距组距应尽可能取5或10的倍数变量取值不多且变量值的变动范围不大时,适宜编制单项数列。当变量值取值较多或变量值差异很大时,适宜编制组距数列。编制分配数列第四步:确定组限。注意
1、组限最好用整数表示,如果组距是5或10等,则每组的组限最好是其倍数;
2、第一组下限略小于资料中的最小变量值,最末组上限略大于资料中的最大变量值;
3、无极大或极小的极端数值时,则采用闭口组;如果变量值相对比较分散,为了不出现空白组,跟好地反映总体的分布情况,则应采用开口组。
4、对于连续型变量,应采用重叠式组限,而对于离散型变量,二种方法都可以采用。第五步:汇总出各组的单位数,计算频率,并编制统计表。统计分组的方法序
计划完成
工人数频率向上累计
向下累计号程度(%)(人)(%)
人数频率人数频率
160—70
2
1.0270—8052.53
80—90147.0490—1003115.55100—1106532.56
110—1205226.07120—1302311.58130—1408
4.0
合计
200100.02721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100统计分组的方法案例3-3:现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你该怎样编制分配数列?下面以编号为D1的问卷处理为例,说明其编制分配数列的方法。按客户对自
来水质量满
意度分组无特殊气味无杂质无色无特殊味道客户数(人)比率(%)客户数(人)比率(%)客户数(人)比率(%)客户数(人)比率(%)非常不满意51.2571.7592.2530.75不满意287.004611.505413.50246.00一般12832.0012230.5010526.2511629.00满意17142.7517243.0017343.2519548.75非常满意6817.005313.255914.756215.50合计400100.00400100.00400100.00400100.00次数分布的类型钟形分布(正态分布)U形分布J形分布案例3-4解析
提示:统计数据经过分组整理后,通过编制分配数列已经变得有条理了,在此基础上,你需要按照统计表的规范格式展示分配数列,以便于读者阅读和理解,你还可以考虑用形象的统计图把总体的数量特征和数量关系更直观地表现出来,尤其是在你特别需要强调的关键问题上,这种效果会更好。案例3-4:现在你已完成了对A市自来水公司调查资料的分组整理,并按要求编制了各个调查项目的分配数列。你的统计整理任务是否已经完成?你还需要做些什么?
统计表——数据代替文字描述,便于统计结果的精确、简洁的表达和对比分析
统计图——用图形代替数据,获得直观、形象的效果统计表和统计图统计表的结构统计表和统计图简单表:指主词未经任何分组的统计表,仅按单位名称或时间先后顺序排列而成的统计表。
年份销售额(万元)2011年51582012年56492013年66872014年7103统计表和统计图简单分组表:指主词只用一个标志分组形成的统计表,简称分组表。统计表和统计图复合分组表:指主词按两个或两个以上标志进行分组,简称复合表。按各城市自来水用户性质分组自来水用水量(亿立方米)A市4.5企业用户2.4居民用户2.1B市6.5企业用户3.8居民用户2.7C市4.3企业用户2.5居民用户1.8……各城市某年自来水用水量统计
统计表和统计图(1)统计表的各种标题,特别是总标题的表达,应该十分简明、确切,能够概括地反映出统计表的基本内容。总标题还应该标明资料所属的时间和空间。(2)统计表的左右两端习惯上均不画线,采用开口式。表的上下横线最好用粗线,纵栏之间用细线分开,横行之间可以不加线。(3)如果统计表的栏数较多,通常要加以编号,主词和计量单位等栏用(甲)、(乙)、(丙)等文字标明;宾词指标各栏用(1)、(2)、(3)等数字编号。各栏之间若有计算关系,可以用数字符号表示。如(3)=(2)×(1),表示第(3)栏等于第(2)栏乘以第(1)栏。(4)表中数字应该填写整齐,对准位数,同类数字要保持有效的统一位数。当数字为0或因数小可忽略不计时,要写上0;当缺乏某项资料时,用符号“…”表示;不应有数字时用符号“—”表示。表内如有相同的数字时,应全部重写一遍,不能用“同上”、“同左”等字样表示。(5)表中的横行“合计”,一般列在最后一栏(或最前一栏),表中纵栏的“合计”一般列在最后一行。(6)统计表中必须注明数字资料的计量单位,当表中只有一种计量单位时,可以把它写在表头的右上方。如果表中需要分别注明不同的单位,横行标题的计量单位可以专设一栏,纵栏标题的计量单位,要与纵栏标题写在一起,用小字标写。(7)必要时,统计表应加注说明或注解。例如,某些数字是由估算来插补的,某些资料只包括一部分地区,这些都需要加以说明。设计规则(P52)统计表和统计图Excel直方图折线图曲线图饼图统计图统计表和统计图直方图是用宽度相等、高度或长短不同的柱形来表示现象之间对比关系的统计图,故又被称为柱形图。直方图折线图是在直方图的基础上,将每个长方形的顶端中点用折线连接而成,或用组中值和频数相应的坐标点连接而成折线,来绘制折线图。描述某种现象随时间变化而变化的趋势,通过分析其规律,来预测未来发展变化。折线图曲线图是将纵横坐标相交的实心点以光滑的曲线相连接而形成的图形。曲线是表现连续型变量数列次数分布的常用形式,适用于变量值非常多或变量数列的组数非常多的情况。
曲线图饼图又称圆形图,是以圆形面积或以圆内各扇形面积的大小来表示指标数值大小的图形,它常用于反映总体的内部结构。
饼图Excel在统计整理中的应用录入编
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024高考语文一轮复习2023年高考语文真题及高分作文选载
- 会计财经法规会计法律制度
- 2024年影视三维后期制作岗位职责(共7篇)
- 农村家庭理财方案-以范女士家庭为例
- FP设计应用教程 9
- 2026年办公室租赁长期合同三篇
- 2026年全国临床执业医师考试押题密卷四
- 河南省百师联盟2025-2026学年高三下学期3月阶段检测英语
- 2026年高二物理下学期期中考试试卷及答案(三)
- 2026年低压电工实操知识全真模拟考试卷及答案(六)
- 干法电极技术介绍
- 医院救护车司机安全培训课件
- (2025)廉洁答题题库与答案
- 胖东来门店管理办法
- 绘画线条课件
- 广东省东莞市2024-2025学年高一下学期期末考试 思想政治试卷
- 消防设施操作员初级课件
- 康复科多学科团队合作与协调
- DB31∕T 1091-2025 生活饮用水水质标准
- 泌尿造口并发症及护理管理
- QGDW1373-2013电力用户用电信息采集系统功能规范
评论
0/150
提交评论