数据的描述性整理1.ppt_第1页
数据的描述性整理1.ppt_第2页
数据的描述性整理1.ppt_第3页
数据的描述性整理1.ppt_第4页
数据的描述性整理1.ppt_第5页
已阅读5页,还剩89页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3-1,面向21世纪课程教材,统计学 STATISTICS 高等教育出版社,3-2,第三章 数据的描述性整理,第一节 总量指标和相对指标 第二节 统计整理的基本理论 第三节 次数分布 第四节 统计图 第五节 统计汇总,3,3-4,第一节 总量指标和相对指标,统计指标按其表现形式的不同,可分为总量指标(绝对数统计指标),平均指标(平均数统计指标),相对指标(相对数统计指标)。,5,3-6,一、总量指标,(一)总量指标的概念 总量指标是反映社会经济现象总规模、总水平或者工作总量的统计指标。 总量指标用绝对数形式表现。有时也可以表现为总量之间的绝对差额、增加额或者是减少额。,3-7,(二)总量指标的种类,1.按其反映现象的内容不同,2. 按其反映事物的 时间状况的不同,3-8,1.总体单位总量和标志总量 总体单位的总数目称作总体单位总量;总体各单位某一数量标志值的总和称作标志总量。 总体单位总量与标志总量的区分只有在一个特定的总体中才有意义。,3-9,例如:拟调查某班统计学某次考试成绩 调查总体: 该班全体学生 总体单位: 该班每一位学生 总体单位总量:该班学生总数 标志总量 : 该班学生统计学成绩总和,3-10,2.时期性总量指标和时点性总量指标 时期指标反映社会经济现象在一段时间内发展变化的总量。时期指标和时期有着直接的关系。 时点指标反应现象在某一时刻(瞬间或者时点)状态上的水平。时点指标与时间长短没有直接的关系,且不具有可加性。,3-11,时期性指标和时点性指标的区别,时期性总量指标和时点性总量指标的特点是: 1.从指标数值的大小当中是否包含有时间过程因素来看,时期性总量指标数值的大小与它所反映的时间过程的长短直接有关,它所反映的时间越长,指标数值就越大。时点性总量指标所反映的是事物在时点上停留量,其中不含有时间过程因素。,3-12,2.从前后时间上的数值相加有无实际意义来看,时期性总量指标前后时间上的数值可以相加,相加后的结果有实际意义;而时点性总量指标相加无实际意义。有时将时点性总量指标前后时间上的数值相加,只是为了满足计算上的某种需要。,3-13,3.时期性总量指标靠经常登记取得,而时点性总量指标是间断登记取得的。,请对下列指标进行分类,a.手机拥有量 b.商品库存 c.市场占有率 d.人口数 e.出生人口数 f.单位产品成本 g.人口出生率 h.利税额 质量指标: 数量指标: 时期指标: 时点指标: 离散变量: 连续变量:,3-15,(三)总量指标的计量单位,总量指标的计量单位有实物单位、货币单位、劳动单位三种。 1.实物单位 实物单位是根据事物的自然属性和特点而采用的自然、物理计量单位。 实物单位包括自然单位、度量衡单位、双重单位和复合单位。,3-16,(1)自然单位 根据被计量事物的自然状况来计量其数量的计量单位。其计量结果表现为整数。,3-17,(2)度量衡单位 按国家统一的度量衡来计量的一种单位。它一般用来表示连续型变量。,3-18,(3)双重单位和复合单位 双重单位和复合单位是使用两个或者两个以上单位结合起来计量的一种单位。,3-19,当一种事物的几个特征都与绝对数的目的有关时,就要采用双重单位计量。 例如,电动机同时用台/千瓦;蒸汽机同时用台/马力。,3-20,一种总量是由两种总量要素复合而成的,这时要采取复合计量单位。 例如,货物周转量是由货物的运输重量和运输里程同时体现的,因此用吨公里来计量;医院的诊疗工作量是由诊疗的患者人数和对同一患者重复诊疗的次数同时体现的,因此用人次来计量。,3-21,2.货币单位 货币单位是用货币作为价值尺度来计量社会物质财富和劳动成果价值量的计量单位。具有广泛的综合性和概括能力。 3.劳动单位 劳动单位是反映劳动时间表示的计量单位,如工时,工日等。,3-22,二、相对指标,(一)相对指标的意义 1. 含义 相对指标是由两个有联系的指标数值对比而成的。 相对指标通常用相对数形式表示。,3-23,2.作用 相对指标的作用在于能够揭示总体内部的结构、比重、比例等等数量关系,以及反应相关事件之间的数量联系程度。,3-24,(二)相对指标的表现形式,1.无名数 无名数是一种抽象化的数值,多以系数、倍数、成数、百分数、千分数等表示 。,3-25,2.有名数 有名数是将相对数中的分子和分母指标的计量单位同时并列,以表明事物的强度、密度、普遍程度等。 例如,人口密度用“人/平方公里”表示;每人平均粮食产量用“公斤/人”表示;每人平均国民生产总值用“元/人”。,3-26,(三)相对指标的计算,(一)结构相对指标 结构相对指标,是在分组的基础上,将各组的总量指标与总体的总量指标对比,计算出各组数量在总体中所占的比重,从而反映总体的内部结构状况。其计算公式为:,3-27,例如,下表资料反映了我国2006年国内生产总值的分配情况。,3-28,(二)比例相对指标 比例相对指标是在分组基础上将总体不同部分的指标数值进行对比,表明总体范围内各个局部之间的比例关系和协调平衡状况。其计算公式如下:,3-29,例如,2006年年末我国总人口为131448万人,其中,男性人口67728万人,女性人口63720万人。 人口性别比例67728/63720=106.29:100,3-30,(三)比较相对指标 比较相对指标是将同类现象在同一时间不同空间的指标数值进行对比,反映同类现象在不同空间上的差异程度和现象发展的不平衡状况。,3-31,(四)计划完成程度相对指标 计划完成程度相对指标是将某一指标的实际完成数与计划数(或目标任务数)对比,用以反映计划数的完成程度或用来监督检查计划的执行情况。,3-32,计算和应用计划完成相对数应注意的问题,1. 计划完成相对数计算公式中的分子与分 母不能互换。 2. 对于正指标,其数值越大越好,计划完成百分比大于100%的部分表示超额完成计划百分比。对于逆指标,则小于100%才表示超额完成计划。,3-33,3.如果计划任务是以比某个基期数增减百分比的形式给出的,则计算计划完成相对数时分子和分母都应包含基数而不能只看增减部分,即此时计算公式可写为:,3-34,例题,某企业去年盈利目标是2000万元,实际盈利2120万元。计划劳动生产率应比上年提高5%,而实际提高了10%;计划单位产品成本比上年降低5,实际降低了2。试分别求该企业去年的盈利总额、劳动生产率和单位产品成本的计划完成百分比。,3-35,解:,3-36,(五)动态相对指标 动态相对指标是将同一现象在不同时间上的指标数值进行对比,反映现象的数量随着时间推移而发展变动的程度及其趋势。动态对比分析最基本的方法是计算动态相对数即发展速度,其计算公式为:,3-37,(六)强度相对指标 强度相对指标是将同一时间同一空间两个内容不同而有联系的指标数值对比,可以反映现象的强度、密度、普遍程度和经济效益等。,3-38,强度相对指标的特点,强度相对数的分子分母一般可以互换,故说明同一问题的强度相对数通常有正指标与逆指标两种形式。 如资金利税率是正指标,若将其分子分母互换,每实现一元利税所占用资金量就是逆指标。 强度相对数大多数为有名数(且为复名数),有些也用百分数或千分数等无名数形式表示 如外贸依存度、人口死亡率(报告期死亡人数除以报告期平均人数)。 强度相对数常常带有“平均”意义,但统计理论上倾向于把它作为一种相对数而不是平均数。,39,五种常见的相对指标,常见的相对指标,动态相对指标,比较相对指标,计划完成相对指标,结构相对指标,强度相对指标,同种指标,同种指标,同种指标,不同时间的数值对比,不同地点的数值对比,实际与计划数值对比,整体中的一部分/整体,同一范围内两个总量指标之比,3-40,第二节 统计整理的基本理论,一、统计整理的意义 1.含义 统计整理,是指根据统计研究目的,将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。,3-41,2.意义 统计整理是统计工作过程的第三阶段,是统计调查的继续,是统计分析的前提,它是从对现象的感性认识过渡到对现象理性认识的开始,是这个过程的连续点,并为这个过程提供坚实的基础,它在统计工作中起着承前启后的作用 。,3-42,二、统计整理的内容与程序,统计数据整理的内容与程序主要包括以下几个方面:,首先,统计数据的预处理调查资料的审核;,其次,统计数据的排序;,再次,是统计数据的分组和汇总;,最后,是编制统计表和绘制统计图。,3-43,第三节 次数分布,一、次数分布的概念 在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做次数分布。,3-44,分布在各组中的个体单位数叫做次数或频数。 各组次数与总次数之比叫做比率或频率。 将各组别与次数按一定的次序排列所形成的数列称作次数分布数列,简称分布数列,又称分配数列或频数分配。,3-45,1987年底我国职工构成表,组的名称 次数(频数 ) 比率(频率),3-46,任何分布数列都必须满足两个条件: (1)各个组的频率(比率)大于或等于零; (2)各个组的频率之和等于1。,3-47,例如,下表资料反映了我国2006年国内生产总值的分配情况。,3-48,二、变量数列的类型 统计整理中,根据分组标志的不同,分布数列分为品质分布数列(按品质标志分组所编制的分布数列)和变量分布数列(按数量标志分组所编制的分布数列)。,3-49,品质分布数列,(1)品质数列是由组的名称和各组的次数两个要素构成的。 (2)品质数列的编制程序一般比较简单,其步骤是:原始数据,归类,合计,制表。,3-50,变量分布数列,任何一个变量分布数列都是由各组变量值和各组的次数两个要素构成的。 依照各组变量值的表现形式不同,变量分布数列又可以分为单项式分布数列和组距分布数列。,3-51,(一)单项式数列,按每个变量值分别列组,依次分组编制的变量数列叫做单项式变量数列。适用于离散型变量以及变量之间变异幅度不大的情况。,3-52,【例1】己知某车间有24名工人,他们的日产量(件)分别是: 20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23. 要求根据以上资料编制变量数列。,3-53,3-54,依组距分组而编制的变量数列叫做组距数列。组距数列中的每个组不是用一个具体的变量值表示,而是用变量值的一定变化范围即各组标志值变动的区间表示。每组标志值变动的区间长度称为组距。,(二)组距数列,3-55,某班学生某学期统计学成绩,3-56,组距数列中,各组变量值变动的界限称为组限,组内最大变量值称为上限,最小变量值称为下限。组距就是上限与下限之差,即:组距组上限组下限。 每一区间中点位置的数值叫做组中值,组中值(上限下限)2,3-57,上述公式通常在由连续型组距数列计算组距时使用。而在离散型组距数列中,考虑到离散型组距数列的特点,其组距一般为后组下限与本组下限之差。 即:组距后组下限本组下限,3-58,三、变量数列的编制 变量数列的编制可以分为以下5个步骤: 1.将数据按大小排序整理; 2.指定初始组数和组距; 3.确定组限的位置; 4.把数据写入各组,计算出各组的频数和频率,绘制出直方图; 5.审查直方图是否反映出数据的分布规律。,3-59,指定初始组数和组距,美国学者斯特杰斯提出,在总体各单位标志值趋于正态分布的情况下,可以根据总体单位数(N)来确定分组数(n),其公式为:n=1+3.322lgN。 缺陷:当N较少时,由该式算得的组数过多;当N较多时,由该式算得的组数过少。,3-60,组数和组距之间存在着密切的关系。当全距一定时,组数和组距的关系是: 组距=全距/组数 其中,全距等于最大变量值和最小变量值之差。,3-61,确定组限的位置,做法是:仔细审查已经排序整理过的全体数据,找出其中数据密度最大的区间范围,用这个区间范围的中点(或者是靠近中点的适当数值)作为未来统计分组所分各组中某一组的组中值,再根据已经确定的组距计算出该组的上限和下限,并以此组为基础推算出其他各组。,3-62,【例2】某地区20个企业,某年产品销售额利率指标按大小顺序排列如下(%): 6.5,9.6,11.3,13.8,15.4,16.2,18.2,18.6,18.6,19.2,19.5,19.7,20.6,20.9,21.9,22.5,24.3,24.9,28.6,29.5。 如果拟定组距为10,组数为3。,3-63,审查直方图是否反映出数据的分布规律,对数据作组距式分组整理时确定组数的原则是: 在能够反映出数据分布规律的情况下,分组数尽可能多一些。,3-64,四、累计次数和累计频率 在变量分布数列的基础之上,将各组的频数和频率依次累计,形成了累计分布数列。 累计分布数列可以分为向上累计(又称上限以下累计)和向下累计(又称下限以上累计)。,3-65,3-66,一、统计图的意义和绘制原则 统计图是利用统计资料成的几何图形或者具体图,用来说明社会经济现象数量方面的一种形式。,第四节 统计图,3-67,绘制统计图,应该遵循以下原则: (1)统计图应该能够放映客观实际情况; (2)统计图要简明扼要,主题突出,通俗易懂; (3)要根据不同的统计资料和不同的目的绘制不同的图形,尽量做到内容与形式的协调。,3-68,二、统计图的绘制步骤 1.确定绘制统计图的目的 2. 搜集统计资料 3. 决定绘制的图式 4. 绘制图形,3-69,三、几种主要统计图的绘制方法,(一)条形图 用宽度相同的直条的高低或者长短来表示各项统计指标数值大小的图形。条形图的用途非常广泛。 适用场合:品质标志分组数列和数量标志分组数列中的单项数列。,3-70,条形图按照排列的不同分为垂直条形图(柱图)和水平条形图。根据表现资料的内容不同,可以分为单式条形图、复式条形图和结构条形图。,3-71,3-72,3-73,条形图的绘制比较简单,基本操作步骤如下: (1)绘制基线 (2)绘制尺度线 (3)绘制直条,3-74,(二)直方图 关于画法:直条的高等于该组频率密度,宽为各组的组距。 关于直条面积:所有直条面积之和等于总频数或总频率(为1)。,3-75,3-76,(三)圆形图 圆形图是以圆形面积或者圆内各扇型面积的大小来表示统计指标数值大小的图形。 它可用于各指标数值的比较,也可以圆形面积作为总体,而以圆形内各扇形面积代表总体结构比重,说明总体内部结构和总体内部结构的发展变化。,3-77,3-78,(四)曲线图 曲线图也称线图,它是以线条的连续升降表示统计指标数值大小以及变动趋势的图形。 曲线图的用途很广,主要用于显示现象在时间上的发展变动、研究现象的分配情况和分析现象之间的依存关系等。,3-79,3-80,第四节 统计汇总,按照既定方案对数据进行汇总整理所采用的技术手段 划记法 过录法 电子计算机汇总(最常用的方法),81,重新列出某市居民户总体的下列资料:,3-82,【问题】 有一户居民的调查结果如下: 职业类别白领 文化程度大学 拥有住宅面积140平方米 是否“双气”齐全是 家庭人口2人 怎样把这些数据输入电子计算机?怎样用Excel工具对全体居民户的调查结果进行汇总整理,完成前面所设计的分组表?,3-83,(1)制订品质型标志的标准分类及代码 是否双气齐全 职业类别 文化程度 是 1 白领 1 大学及以上 1 否 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论