




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2022/12/20皖西学院经济与管理学院1第一节统计整理概述第二节统计分组方法第三节次数分布第四节统计表第五节Excel在统计整理中的应用第三章统计整理
2022/12/20皖西学院经济与管理学院2本章主要内容2022/12/20皖西学院经济与管理学院3内容及学习重点学习目的与要求:通过对本章的学习,使学生明确统计整理的概念与程序,认识统计分组的的意义与作用,掌握统计分组和变量数列的基本方法。
重点是统计整理的技能,变量数列的编制,难点是掌握并运用统计分组的种类。
2022/12/20皖西学院经济与管理学院42022/12/20皖西学院经济与管理学院5分组前分组后25%33%分组前分组后25%42%例3.22022/12/20皖西学院经济与管理学院6统计工作的四个过程统计调查统计整理统计分析有组织、有计划地搜集资料。要求:准确、完整、及时对调查资料去伪存真、去粗取精、科学分类、浓缩简化描述性分析、推断分析、决策分析。要求:定性定量结合统计设计统计工作各个方面、环节的通盘考虑和全面安排意义:统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中发挥着承上启下的作用。2022/12/20皖西学院经济与管理学院7第一节统计整理概述2022/12/20皖西学院经济与管理学院8一、统计整理的概念
统计整理──根据统计研究的目的和任务的要求,将统计调查所得到的原始资料进行科学的分组和汇总,并用一定的方式将其显示出来,为统计分析提供系统化、条理化、能说明总体数量特征的综合资料的过程。2022/12/20皖西学院经济与管理学院9二、统计整理的意义1、统计调查得到的资料是分散的、零碎的和表面的,要说明总体情况,揭示总体的内在特征,还需要对其进行科学的加工整理,使之系统化、条理化。2、统计整理是整个统计工作和研究工程的中间环节,起着承上启下的作用,既是统计调查的继续,又是统计分析的基础。3、统计整理是积累历史资料的必要手段和方法。2022/12/20皖西学院经济与管理学院10三、统计整理的内容和程序(一)统计整理的内容一般来说,统计资料的整理包括初级资料的整理和次级资料的整理两个方面的内容。1、初级资料的整理初级资料是指在统计调查阶段获得的原始资料。
初级资料的整理就是把调查表中的材料整理到综合表中。
初级资料的整理主要是汇总性整理,该阶段的工作内容大致包括:设计和编制汇总方案,审查订正初级资料,根据汇总方案进行分组和计算,最后编制统计表、统计图等。2022/12/20皖西学院经济与管理学院112、次级资料的整理次级资料是指已经进行了一定程度加工的综合统计资料。次级资料的整理是指对已经汇总的现成的统计资料进行再加工,使其成为适合需要的资料。
次级资料的整理主要是综合性整理,该阶段的工作内容主要是:⑴对现有资料进行甄别。
⑵对现有资料作出评价。
⑶对现有资料进行加工、调整和补充。
2022/12/20皖西学院经济与管理学院12(二)统计整理的程序1、设计统计整理方案主要内容包括:分组方法、统计指标、整理表式、汇总方式和方法的设计与选择,以及整理的时间和质量要求等。
2、审核统计资料审核的内容主要是资料的准确性、及时性和全面性(原始资料);适用性和时效性(二手资料)。
逻辑检查计算检查原始资料资料的审核
二手资料完整性准确性适用
时效
及时性2022/12/20皖西学院经济与管理学院133、统计分组和汇总统计分组是实现资料整理科学性、正确性的保证。
统计整理的关键是统计分组。
统计汇总是统计整理工作的主要内容。
4、编制统计图表统计图表是统计整理成果最常用的表现形式,也是整理统计资料的重要工具。5、统计资料汇编要注意资料的积累,建立完善的保管和提供制度。
2022/12/20皖西学院经济与管理学院14四、统计整理的组织形式1、逐级汇总。又称分级汇总,它是将统计调查资料按照一定的统计管理体制,自下而上地逐级汇总,然后逐级上报。
2、集中汇总。它是把全部调查资料集中到组织统计调查的最高一级机关直接进行汇总。
3、综合汇总。它是把逐级汇总和集中汇总结合起来应用的一种形式。
2022/12/20皖西学院经济与管理学院15五、统计整理的技术1、手工汇总手工汇总是指用算盘或小型计算器进行的汇总。
·常用的手工汇总方法有四种:⑴划记法,也称点线法。它是用点线符号计算各组单位数和总体单位数。
⑵过录法。是将调查资料过录到事先设计好的整理表上,然后计算出各组的单位数及标志值的合计数,编制出统计表。
⑶折叠法。是将所有调查表中需要汇总的某一横行或纵栏的统计资料,全部折在边上,然后按顺序叠放整齐,露出数字,进行加总计算,将汇总的结果填入统计表中。
⑷卡片法。是利用专门制作的卡片作为分组记数的工具进行汇总的方法。汇总步骤为:⑴编号。
⑵摘录。⑶分组计数。
2022/12/20皖西学院经济与管理学院162、电子计算机汇总电子计算机数据处理的全过程大体上分为五个步骤:⑴编制程序(计算机软件或自编)
(3)数据录入(4)数据编辑(5)计算与制表(6)建立数据库
(2)编码2022/12/20皖西学院经济与管理学院17一、统计分组的概念统计分组,就是根据统计研究的目的和被研究现象本身的性质,将统计总体按照一定的标志划分为若干性质不同的组或类的一种统计方法。
统计分组的一个基本原则是:必须保持各组内资料的一致性和组与组之间资料的差异性。
第二节统计分组2022/12/20皖西学院经济与管理学院18
注:从分组的性质来看,分组具有“分”和“合”双重含义。1、对于现象总体而言是“分”,即把总体分为性质相异的若干组;而对于总体单位而言,又是“合”,即把性质相同的总体单位合为一组。2、对于分组标志而言是“分”,即按分组标志将不同的标志分为若干组;而对其他标志而言是“和”,即在一个组内的各个单位即使其他标志表现不相同也只能结合在一起。2022/12/20皖西学院经济与管理学院19简单举例说明□◎□※※※□※□□□□◎□◎◎※※□※□□□□□□□□□※※※※※※※◎◎◎◎第一手资料:简单、凌乱通过统计整理:(合并、分类)直观、有规律2022/12/20皖西学院经济与管理学院20又如:某企业有100名工人,该企业每个工人的工资资料如下:
820490620580950620760690620760460580950880620580760760820520580760460760620620880690620420690690760880690580690580690760690880580580690760760820950460760620320760760880620460760690620820820420620880520580580760760820520950820690820690760760690690580620760490580820880580580690620880420690620520580690根据上面的资料无法对该企业工人的工资水平进行具体分析。现在,我们对上述资料进行分组整理,得到如下结果。2022/12/20皖西学院经济与管理学院21某企业工人工资情况表按工资分组(元)工人数(人)400——500500——600600——700700——800800——900900——10009193219174合计1002022/12/20皖西学院经济与管理学院22根据统计分组可以分析:从上表可以看出,工资在500~800元的工人数占该企业全部工人数的70%,其中:工资在600~700元的工人数最多,占32%,工资较低(500元以下)和较高(900元以上)的工人数较少,所占比重分别为9%和4%,这样可以得到该企业工人工资水平的具体分布。2022/12/20皖西学院经济与管理学院23二、统计分组的作用1、发现现象的特点和规律。通过统计分组,可以将统计资料整理得既有条理,又能反映事物的特点,有助于人们很直观地发现现象的基本特点和规律。
2022/12/20皖西学院经济与管理学院242、划分社会经济现象的类型按所有制类型分组代码分类及构成111122212223公有经济国有经济集体经济非公有经济私有经济港澳台经济外商经济2022/12/20皖西学院经济与管理学院253、揭示现象内部结构统计分组法是研究总体内部结构的前提,所谓总体内部结构是指总体内各部分占总体的比重。例如:人口统计中的各种年龄构成、国民经济中三次产业的构成等,都是统计分组的结果。按性别分组人数所占(%)男性职工女性职工6004006040合计10001002022/12/20皖西学院经济与管理学院264、分析现象之间的依存关系社会经济现象之间不同程度的存在着相互依存关系,通过统计分组,可以从数量上研究现象之间依存关系的规律性。居民家庭随着月收入的增加而月支出也在增加的相关关系。
家庭月收入(元)家庭户数(户)家庭月平均支出(元)1600以下410001600-1700710901700-1800212001800-1900915701900-2000716602000以上1116902022/12/20皖西学院经济与管理学院27三、统计分组的原则与方法统计分组的关键在于正确选择分组标志和划分各组的界限。
1、分组标志的选择分组标志就是将总体单位划分为不同性质的组的标准和依据。选择分组标志时应遵循以下原则:⑴应根据统计研究的目的和任务来选择分组标志。⑵应选择最能够反映客观现象本质特征的标志作为分组标志。⑶应结合研究现象所处的历史条件或经济条件来选择分组标志。2022/12/20皖西学院经济与管理学院282、各组界限的确定分组标志有品质标志和数量标志两种。划分各组界限,是指根据分组标志划定各相邻组间的性质界限和数量界限。
2022/12/20皖西学院经济与管理学院29四、统计分组的类型(1)按分组的作用或目的分类,分为类型分组、结构分组和分析分组(2)按照分组标志的数量,可将统计分组分为简单分组、平行(并列)分组和复合分组。(3)按照分组标志的性质,可将统计分组分为属性分组和变量分组。2022/12/20皖西学院经济与管理学院30四、统计分组的种类
按分组标志的性质分类⑴按品质标志分组。就是选择反映现象性质属性差异的品质标志作为分组标志进行分组。⑵按数量标志分组。就是选择反映现象数量差异程度的数量标志作为分组标志进行分组。2022/12/20皖西学院经济与管理学院31例子:品质标志分组
(按品质标志分组就是用反映事物的属性、性质的标志分组,它可以将总体单位划分为若干类型。
)性别学生人数(人)学生人数比重(%)男性
女性11696
198485.5
14.5合计13680100.0某大学在校学生的性别分布情况2022/12/20皖西学院经济与管理学院32变量分组(按数量标志)
(按数量标志分组是用事物数量的多少作为标志进行分组)某县人均年收入
年收入(元)2500以下32
2500—300088
3000—3400160
3400—4000272
4000—5000152
5000以上44
合计748
人数(千人)2022/12/20皖西学院经济与管理学院33按性别分人数男60女40按考试成绩分组(分)人数60以下560~703070~803580~902090以上102、按分组标志的多少分类⑴简单分组,又称单一分组,是指按一个标志对总体进行分组。2022/12/20皖西学院经济与管理学院34⑵平行分组,是指按两个或两个以上标志分别对总体进行简单分组。2022/12/20皖西学院经济与管理学院35
平行分组
按轻重工业分按生产规模分按经济类型分全部工业企业轻工业重工业特大型工业大型工业中型工业国有工业企业集体工业企业其他工业企业小型工业平行分组的特点是:每一个分组固定一个分组标志的差异,以反映总体内部的分布情况。所有分组都是独立进行的。各分组之间是平行并列关系。2022/12/20皖西学院经济与管理学院36(3)复合分组和复合分组体系A、复合分组:对某一总体按两个或两个以上的标志进行连续分组就是复合分组。B、复合分组体系:复合分组会自动形成一种体系即复合分组体系。复合分组体系两种表现形式:复合式(重叠式)或交叉式。
2022/12/20皖西学院经济与管理学院37重叠式
2022/12/20皖西学院经济与管理学院38交叉式
2022/12/20皖西学院经济与管理学院39
复合分组货运量总计客运量总计公路铁路铁路公路水路中央中央中央中央中央地方地方地方地方地方复合分组的特点是:进行复合分组时,要先按照主要标志对总体进行第一次分组,然后按次要标志再进行第二次、第三次分组。所有分组都是和关系。所有分组加起来才能反映总体。2022/12/20皖西学院经济与管理学院403、按变量数列分组分组方法等距分组异距分组单项式分组组距式分组2022/12/20皖西学院经济与管理学院41单项式分组(要点)1.将一个变量值作为一组;2.适合于离散变量且变量值较少的情况;2022/12/20皖西学院经济与管理学院42单项式分组表企业工人日产量完成情况表日产量(个)工人数(人)频率(%)353647586970合计20253035405020010.012.515.017.520.025.0100.02022/12/20皖西学院经济与管理学院43组距式分组1、将变量值的一个区间作为一组2、适合于连续变量;3、适合于变量值较多的情况;4、必须遵循“不重不漏”的原则;5、可采用等距分组,也可采用不等距分组。~~~~~2022/12/20皖西学院经济与管理学院44组距式分组(几个概念)1.下限:一个组的最小值2.上限:一个组的最大值3.组距:上限与下限之差4.组中值:下限与上限之间的中点值下限值+上限值2组中值=假定条件:组内数据在组中值两侧对称分布2022/12/20皖西学院经济与管理学院45等距组距式分组的步骤1、确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。斯特杰斯经验公式:组数=1+3.32LgN2、确定各组的组距:组距=(最大值-最小值)÷组数3、根据分组整理成频数分布表2022/12/20皖西学院经济与管理学院46单变量值分组表
某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221122022/12/20皖西学院经济与管理学院47连续组距式分组(上下组限重叠)
规定:上组限不在内某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计501002022/12/20皖西学院经济与管理学院48间断组距式分组(上下组限间断)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计501002022/12/20皖西学院经济与管理学院49等距分组表(使用开口组)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合计501002022/12/20皖西学院经济与管理学院50不等距分组(异距分组)适用场合:1、标志值分布很不均匀;2、标志值相等的量具有不同的意义;疾病研究的年龄分组:一岁以下按月分组,1-10岁按年分组等;3、标志值按一定比例发展。企业按产值分组:1-10万;10-100万;100-1000万;2022/12/20皖西学院经济与管理学院51上述统计分组的种类各有其特点,实践中,可根据需要进行选择。但不论采用何种分组方式,都必须遵循以下原则:⑴组内同质性和组间差异性原则。⑵穷举性原则。⑶互斥性原则。4、分组遵循的原则2022/12/20皖西学院经济与管理学院52第三节次数分布2022/12/20皖西学院经济与管理学院53一、次数分布的概念
在统计分组的基础上,将总体中所有的单位按某个标志分组后,形成了总体单位在各组之间的分布,称之为次数分布或频数分布。分布在各组的总体单位个数叫次数,或叫频数;各组次数与总次数之比叫比率、比重或频率。分别将组别与次数或者频率按一定的顺序一一对应排列所形成的数列叫分布数列或分配数列。分布数列主要由各组的名称和对应的各组单位数(即频数)两部分组成,有时候也把频率列入其中。
2022/12/20皖西学院经济与管理学院54二、分配数列的种类分布数列根据分组标志性质的不同,可以分为品质分布数列和变量分布数列。(一)品质分布数列品质分布数列简称品质数列,是指按品质标志分组后所形成的分布数列,用来反映具有不同属性的各组的次数在总体中的分布情况。品质分布数列品由两个要素构成:一是各组名称;二是各组的次数(频数)或频率(比率)。2022/12/20皖西学院经济与管理学院55性别人数/人比重(%)男性女性7800660054.1745.83合计14400100品质分布数列各组名称次数(频数)比率(频率)某校学生性别分布表2022/12/20皖西学院经济与管理学院56(二)变量分布数列1、变量分布数列的概念变量分布数列简称变量数列,是指按数量标志分组后所形成的分布数列,用来反映具有不同变量值的各组的次数在总体中的分布情况。变量数列是一种典型的分布数列。
变量分布数列品由两个要素构成:一是各组变量值,用符号Xi表示;二是各组的次数(频数)或频率(比率),用符号fi或Pi表示。与品质数列的两个要素相区别的是,变量数列中各组的名称一定是由变量值所表示的。2022/12/20皖西学院经济与管理学院57按月工资收入分组人数(人)所占(%)1000元以下1000-15001500-20002000-25002500-30003000元以上80150230340150508152334155合计1000100变量数列示例各组名称次数(频数)比率(频率)2022/12/20皖西学院经济与管理学院58
2、变量分布数列的种类⑴变量数列按照变量类型的不同,可以分为离散型变量数列和连续型变量数列。离散型变量数列,一般是指变量取值是不连续的,只能取整数,相邻组之间的上下限不重合。连续型变量数列是指变量取值是连续不断的,每一组中的变量可以用小数形式表示,分组后,相邻组之间的上下限重合。
⑵变量数列按照各组变量表现形式的不同,可以分为单项变量数列和组距变量数列。
单项变量数列简称单项数列,是指总体按单项式分组而形成的变量数列。组距变量数列简称组距数列,是指总体按组距式分组而形成的变量数列。2022/12/20皖西学院经济与管理学院59组距数列根据组距是否相等,分为等距数列和异距数列。等距数列是指各组组距都相等的组距数列。异距数列是指各组组距不完全相等的组距数列。
分布数列的种类图示如下:
离散型分布数列品质数列变量数列连续型等距数列异距数列单项式数列组距式数列等距数列异距数列2022/12/20皖西学院经济与管理学院60例如:单项式数列居民家庭按子女数分组户数(户)01234200030000800060004000合计500002022/12/20皖西学院经济与管理学院61组距数列(等距)按零件数分组(个)频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计501002022/12/20皖西学院经济与管理学院62组距数列(不等距)年龄人数(人)15下15~3435~6060以上21283210合计91某村人口按年龄的不等距分组2022/12/20皖西学院经济与管理学院63三、变量数列的编制编制步骤(1)将杂乱无章的数据从小到大排列,找出最大值和最小值;(2)确定组数和组距;(3)确定组限及组限的表示形式(4)统计各组次数,计算合计栏,计算各组的相应频率。2022/12/20皖西学院经济与管理学院64确定组数编制变量数列的步骤确定组距确定组限计算频数编制表格2022/12/20皖西学院经济与管理学院65变量分布数列的编制117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。2022/12/20皖西学院经济与管理学院66
编制过程首先,对上面的数据进行排序1071081081101121121131141151171171171181181181191201201211221221221221231231231231241241241251251261261271271271281281291301311331331341341351371391392022/12/20皖西学院经济与管理学院67分组方法分组方法等距分组异距分组单项式分组组距分组2022/12/20皖西学院经济与管理学院68单项式分组表(实例)
某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221122022/12/20皖西学院经济与管理学院69组距式分组将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组2022/12/20皖西学院经济与管理学院70第一步:排序,计算全距最大值139最小值107计算全距:全距=最大值–最小值
2022/12/20皖西学院经济与管理学院71组数的确定以能显示数据分布特征和规律为目的1、公式:2、经验:本例中可取组数m=6第二步:确定组数m资料数目Nm
一般m50以下4-71050-1006-10100-2007-12200以上10-202022/12/20皖西学院经济与管理学院72第三步:确定组距组数和组距的关系:确定组距根据来确定组距h=32/6=5.33(可取为5)2022/12/20皖西学院经济与管理学院73
确定组数和组距的原则
对于组数和组距,其确定的原则是:符合社会现象的实际情况,能够充分反映总体分布的特点。组数的多少和组距的大小是互为制约的,两者成反比例变化,根据经验,组数过多或过少都不妥。
一般来说,组数的多少取决于组距的大小和组距是否相等。组数确定了,组距也就确定了;反之,一样:组距确定了,组数也就随之确定了,用公式表示为:2022/12/20皖西学院经济与管理学院74第四步:确定组限组限的确定要能反映总体分布特征满足条件:最小组的下限<=最大组的上限>=2022/12/20皖西学院经济与管理学院75
确定组限和组限的表示法当组数、组距确定后,只需划分各组的数量界限就可编制组距数列。
确定组限时应注意以下几点:⑴组限的确定应当有利于表现各变量值实际分布的特点。⑵确定的组限是事物性质的数量界限。也就是要使同质的总体单位在同一组内。⑶第一组的下限应等于或小于最小变量值,但不宜小得过多。最末一组的上限应等于或大于最大变量值,但不能过大。⑷为了方便计算,组限尽可能取整数,最好是5或10的整倍数。
2022/12/20皖西学院经济与管理学院76⑸由于变量分为连续型变量和离散型变量,因此组限的确定也有所不同。
对于连续型变量的分组,由于它的任何两个数值之间可能还有无限多个数值,相邻两组的上限与下限必须重叠,即以同一个数值来表示,每一组的上限同时是下一组的下限。为了避免计算总体单位分配数值的混乱,一般原则是把达到上限值的单位数计入下一组内,一般称为“上组限不在内”原则。
对于离散型变量的分组,则相邻两组的上限与下限通常是以两个确定的不同整数值来表示,相邻两组的上下限可以不重叠,这样分组明确,不会混乱。也可以按“上组限不在内”原则写为重叠式组限。
2022/12/20皖西学院经济与管理学院77第五步:次数汇总(1)计算各组次数:落在各组的单位数计算各组频率:各组单位数占总体单位数的比重任何组的频率都在0-1之间各组的频率之和等于12022/12/20皖西学院经济与管理学院78等距分组表(上下组限重叠)
某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计501002022/12/20皖西学院经济与管理学院79等距分组表(上下组限间断)
某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计501002022/12/20皖西学院经济与管理学院80等距分组表(使用开口组)
某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合计501002022/12/20皖西学院经济与管理学院81统计上,对缺少上限或下限的组叫做开口组;反之,上限与下限都齐备的组叫做闭口组。
开口组的组距习惯上都以相邻组的组距近似代替,这样,开口组组中值按下列公式计算:注:开口组和闭口组2022/12/20皖西学院经济与管理学院82等距分组与不等距分组
(在表现频数分布上的差异)等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况2022/12/20皖西学院经济与管理学院83第五步:次数汇总(2)计算各组的累计次数、累计频率向上累计:按变量值由小到大累计向下累计2022/12/20皖西学院经济与管理学院84
累计次数分布就是将变量数列各组的次数或比率逐组累计相加而成的。
它表明总体在某一标志值的某一水平以上或以下总共包含的次数或比率。2022/12/20皖西学院经济与管理学院85累计次数的计算方法有两种:⑴向上累计,又称较小制累计。它是将各组次数或比率,由变量值小的组向变量值大的组逐组累计。每组的累计次数、比率表明该组上限以下总共所包含的次数或比率有多少。⑵向下累计,又称较大制累计。它是将各组次数或比率,由变量值大的组向变量值小的组逐组累计。每组的累计次数、比率表明该组下限以上总共所包含的次数或比率有多少。2022/12/20皖西学院经济与管理学院8650名工人日产零件数次数分布表
按零件数分组次数频率(%)
向上累计
向下累计次数频率%)次数频率(%)110以下363650100110—120132616324794120—130244840803468130—1401020501001020
合计50100————
2022/12/20皖西学院经济与管理学院87四、次数分布的特征(一)次数分布的表示方法1、列表法:用统计表来表示次数分布
按零件数分组次数频率(%)
向上累计
向下累计次数频率%)次数频率(%)110以下363650100110—120132616324794120—130244840803468130—1401020501001020
合计50100————2022/12/20皖西学院经济与管理学院882、图示法:用统计图形描述次数分布,直观地表明总体单位的分布状态和规律(1)条形图工人日加工零件数2022/12/20皖西学院经济与管理学院89(2)直方图2022/12/20皖西学院经济与管理学院90(3)折线图2022/12/20皖西学院经济与管理学院91(3)曲线图2022/12/20皖西学院经济与管理学院92次数分布图与次数分布表比较,可以更直观地显示数据集合的次数分布状况。
对于变量数列,常用的次数分布图有直方图、折线图、曲线图和累计次数分布图;
对于品质数列,常用的次数分布图有圆形图和条形图。直方图、条形图、折线图、圆形图、茎叶图、线图、雷达图2022/12/20皖西学院经济与管理学院93分组数据—直方图(直方图的制作)用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图2022/12/20皖西学院经济与管理学院94分组数据—直方图(直方图的绘制)频数(人)1512963105110115120125130135140日加工零件数(个)
某车间工人日加工零件数的直方图我一眼就看出来了,大多数人的日加工零件数在120~125之间!2022/12/20皖西学院经济与管理学院95分组数据—折线图(折线图的制作)也称频数多边形图在直方图的基础上,把直方图的顶部中点(组中值)用直线连接起来,再抹掉原来的直方图折线图的两个终点要与横轴相交,具体做法:第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的2022/12/20皖西学院经济与管理学院96日加工零件数(个)1512963频数(人)分组数据—折线图(折线图的绘制)
某车间工人日加工零件数的折线图1051101151201251301351402022/12/20皖西学院经济与管理学院97分组数据的图示—圆形图也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的2022/12/20皖西学院经济与管理学院98圆形图图示—(由Excel绘制的圆形图)
其他广告1.0%
房地产广告8.0%
商品广告56.0%
金融广告4.5%
服务广告25.5%
招生招聘广告5.8%
某城市居民关注不同类型广告的人数构成2022/12/20皖西学院经济与管理学院99分组数据的图示—环形图(制作)环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于进行比较研究环形图可用于展示定类和定序的数据2022/12/20皖西学院经济与管理学院100环形图的图示(由Excel绘制的环形图)8%36%31%15%7%33%26%21%13%10%
非常不满意
不满意
一般
满意
非常满意
图3-4甲乙两城市家庭对住房状况的评价2022/12/20皖西学院经济与管理学院101未分组数据—茎叶图(茎叶图的制作)用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶对于n(20≤n≤300)个数据,茎叶图最大行数不超过
L=[10×log10n]2022/12/20皖西学院经济与管理学院102未分组数据—茎叶图(茎叶图的制作)
茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息2022/12/20皖西学院经济与管理学院103树茎树叶7880223477788890012222333344466777889013344579910111213数据个数3132410茎叶图类似横置的直方图未分组数据—茎叶图(茎叶图的制作)
某车间工人日加工零件数的茎叶图2022/12/20皖西学院经济与管理学院104时间序列数据—线图(线图的制作)
绘制线图时应注意以下几点:时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。2022/12/20皖西学院经济与管理学院105时间序列数据—线图(实例)已知1991~1998年我国城乡居民家庭的人均收入数据如表3-11。试绘制线图¥
$
1991~1998年城乡居民家庭人均收入年份城镇居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6784.0921.61221.01577.71926.12091.12162.02022/12/20皖西学院经济与管理学院106时间序列数据(由Excel绘制的线图)020004000600019911992199319941995199619971998城镇居民农村居民收入
(元)
城乡居民家庭人均收入2022/12/20皖西学院经济与管理学院107是显示多个变量的常用图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度多变量数据—雷达图(要点)2022/12/20皖西学院经济与管理学院108设有n组样本S1,S2,…Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是:多变量数据—雷达图(雷达图的制作)
先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图2022/12/20皖西学院经济与管理学院109多变量数据—雷达图(实例)某年我国城乡居民家庭平均每人各项生活消费支出数据如表3-12。试绘制雷达图。今天的主食是面包
某年城乡居民家庭平均每人生活消费支出项目城镇居民农村居民
食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务1942.59520.91316.89179.68232.90448.38358.64185.65890.28109.4185.4162.4553.92148.18233.2334.27合计4185.641617.152022/12/20皖西学院经济与管理学院1100500100015002000
食品
衣着
家庭设备用
品及服务
医疗保健
交通通讯
娱乐教育
文化服务
居住
杂项商品
与服务城镇居民农村居民1997年城镇居民家庭消费支出
(元)多变量数据—雷达图
(由Excel绘制的雷达图)2022/12/20皖西学院经济与管理学院111(二)次数分布的主要类型日产量(件)1、钟型分布
(1)对称的钟型分布2022/12/20皖西学院经济与管理学院112
钟型分布的特征是“中间大,两头小”,即靠近中间的变量值出现的次数较多,越往两端的变量值出现的次数越少,其分布曲线的形状好像一口古钟,故称之为钟型分布。
钟型分布根据其是否对称又可分为对称分布(正态分布)、正偏(右偏)分布、负偏(左偏)分布。例如,粮食亩产量、股票收益率、人的身高、学生成绩等等,都服从正态分布;企业职工总数的分布就是正偏分布,即职工总数较少的中小型企业较多,职工总数较多的大型企业较少。2022/12/20皖西学院经济与管理学院113(2)左偏分布日产量(件)2022/12/20皖西学院经济与管理学院114(3)右偏分布日产量(件)2022/12/20皖西学院经济与管理学院115
U型分布与钟型分布正好相反,其特征是“中间小,两头大”,即靠近中间的变量值出现的次数较少,越往两端的变量值出现的次数越多,其分布曲线的形状好像字母“U”。例如,人口死亡率按年龄分布往往服从U型分布,即婴儿死亡率较高,随着年龄的增长死亡率渐降,青壮年死亡率最低,到了老年死亡率又增高。2、U型分布2022/12/20皖西学院经济与管理学院116
J型分布的特征是“一边大,一边小”,其分布曲线的形状好像字母“J”,有正J型分布和反J型分布两种。
正J型分布是指次数随着变量值的增大而增加,反J型分布是指次数随着变量值的增大而减少。例如经济学中的供给曲线就是正J型分布,随着价格(横轴)的增加,供给量(纵轴)以更快的速度增加;而需求曲线则呈反J型分布,随着价格(横轴)的增加,需求量(纵轴)以较快的速度减少。
3、J型分布
2022/12/20皖西学院经济与管理学院117J型分布
2022/12/20皖西学院经济与管理学院118Spss、Sas、Minitab、Eviews等统计分析软件Excel—是Office中创建和维护电子表格的应用软件,可用于输入、输出和显示数据,并对输入的数据进行各种复杂的统计运算,实现数据自动处理。Excel中文版除了可以完成各学科较复杂的数学运算外,还可以把数据用各种类型的二维或三维统计图形象地表示出来,可以制定自己独有的统计图形式。注:借助计算机绘制统计图2022/12/20皖西学院经济与管理学院119第四节统计表一、统计表的概念和构成1、统计表的概念统计表是以纵横交叉的线条所绘制的表格来表现统计资料的一种形式。用统计表来表现统计资料的显著优点是:①能使统计资料的排列条理化、系统化、标准化,一目了然;②能科学地、合理地组织统计资料,便于阅读、对照比较和分析。2022/12/20皖西学院经济与管理学院1202、统计表的构成⑴从形式上看,统计表主要由总标题、横行标题、纵栏标题和指标数值四个部分构成。
①总标题是统计表的名称,概括统计表的内容,一般位于表的上端正中。②横行标题是横行的名称,即总体的各组或各单位的名称,一般位于表的左方(即表的第一列)。③纵栏标题是纵栏的名称,即各种统计指标或变量的名称,一般位于表的上方(即表的第一行)。④指标数值,列在各横行标题和各纵栏标题的交叉处。此外,有些统计表还增列补充资料、注解、资料来源、填表时间、填表单位等表脚。2022/12/20皖西学院经济与管理学院121⑵从内容上看,统计表由主词和宾词两部分构成。①主词是统计表所要说明的对象,即总体的各组或各单位的名称。
②宾词是统计表所要说明的各种统计指标或变量的名称以及指标数值。2022/12/20皖西学院经济与管理学院123(二)统计表的种类1、按作用分,可分为:⑴调查表,是指在统计调查中用于登记、搜集原始资料的表格。
⑵整理或汇总表,是指统计整理或汇总过程中用于表现统计整理或汇总结果的表格。
⑶分析表,是指用于统计定量分析的表格,通常是整理表的延续
2022/12/20皖西学院经济与管理学院1242、按统计数列的性质分类,可分:⑴时间数列表,是指反映在同一空间条件下,不同时间的统计数列的表格,也称动态表。⑵空间数列表,是指反映在同一时间条件下,不同空间范围内的统计数列的表格,也称静态表。⑶时空数列结合表,是指同时反映时间和空间两方面内容的统计表。既说明社会现象在不同空间的数量分布,又说明它们在不同时间上的数量变动。2022/12/20皖西学院经济与管理学院1253、按分组情况分,可分为:
⑴简单表,是指统计总体未经任何分组的统计表。
⑵简单分组表,是指统计总体按一个标志进行分组后形成的统计表。⑶复合分组表,是指统计总体按两个或两个以上标志进行分组后形成层叠式的统计表。2022/12/20皖西学院经济与管理学院126简单表
城市名称人口数(万人)北京市天津市上海市重庆市1961129423022885第六次人口普查我国四个直辖市的人口2022/12/20皖西学院经济与管理学院127分组表
按性别分组人数所占(%)男性女性6004006040合计1000100日工资额(元)人数(个)各组人数占总人数百分比%80-9031090-100723100-1101343110-120517120-13027合计301002022/12/20皖西学院经济与管理学院128复合表
项目投资额(亿元)比重(%)一.全民所有制单位基本建设更新改造及其它措施二.集体所有制单位城镇农村三.个人建房投资城镇农村952594358156451112611724469.543.426.111.43.38.119.11.317.8合12/20皖西学院经济与管理学院129二、统计表的制作要求
1、一般采用长方形,左右两端开口形式;
2、主词和宾词的排列应合理有序,根据时间的先后,数量的大小,空间的位置等自然顺序排列;3、总标题简明扼要,符合表的内容;4、主词和宾词位置可互换;5、数字应注明计量单位;6、解释说明的部分,写在表的下方;7、数字填写应对位整齐,同栏中的数字精读保持一致,相同的数值要重新填写。“—”表示没有数字或免填;“……”
表示缺少资料或忽略不计统计表经审核后,制表人和填报单位应签名盖章。2022/12/20皖西学院经济与管理学院130第五节Excel在统计整理中的应用例3.1数据录入2022/12/20皖西学院经济与管理学院131第五节Excel在统计整理中的应用利用Excel绘制直方图要用到“数据分析”工具。第一次使用需要“加载宏”加载。具体步骤如下:①点击“工具”→“加载宏”,此时弹出“加载宏”对话框。②在弹出的加载宏对话框中,点选“分析工具库”,再点击“确定”按钮,系统会自动加载上数据分析。如果加载不上,说明用户在安装Excel时没有完全安装,则需要使用Office光盘进行加载。
202
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校天然气使用协议书
- 成都安置房合同协议书
- 智能家居品牌及协议书
- 贝米钱包协议书
- 瓶装水生产转让协议书
- 毕业实习第三方协议书
- 终端购机协议书
- 排雷班主播签约协议书
- 快递员承包合同协议书
- 营销保密协议书
- 2025-2030新型钢材产业市场深度调研及前景趋势与投资研究报告
- 新媒体国企面试题及答案
- 2025年5G网络在无人机领域的应用可行性研究报告
- 央企华润集团杭州片区年度品牌传播策略案
- 工业用地开发项目成本分析与资金筹措方案
- 2025-2030年中国正丁醇行业市场现状供需分析及投资评估规划分析研究报告
- (人教2024版)英语七年级下册Unit7.4 Section B 1a-2d课件(新教材)
- 2025年广东嘉城建设集团有限公司及其下属公司招聘笔试参考题库含答案解析
- 新药研究与开发技术 课件3.新药的工艺与质量研究
- 2025-2030中国基础设施行业市场前景趋势及竞争格局与投资研究报告
- 2025年统编版一年级(下)期末语文试题(含答案)
评论
0/150
提交评论