统计学课件(2014年).ppt_第1页
统计学课件(2014年).ppt_第2页
统计学课件(2014年).ppt_第3页
统计学课件(2014年).ppt_第4页
统计学课件(2014年).ppt_第5页
已阅读5页,还剩382页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统 计 学,主讲:杨彩虹 会计系,学习统计学的目的和要求: 在理解基本概念的基础上,掌握统计资料的搜集、整理以及分析的方法。重点掌握抽样推断、动态分析、指数分析、相关与回归分析方法。,统计学内容,第一章 总论 第二章 统计数据的搜集和整理 第三章 数据分布特征的测度 第四章 动态数列分析 第五章 统计指数 第六章 抽样推断 第七章 相关与回归分析 第八章 综合复习 返回,第一章 总论,通过本章学习要求学生了解统计学产生与发展的历史,明确统计学的涵义、研究对象等一些基本问题,重点理解统计学中的几个基本概念。 第一节 统计学的产生与发展 第二节 统计学的研究对象与研究方法 第三节 统计学的基本概念 返回,第一节 统计学的产生与发展,一、统计的涵义 二、统计学的产生和发展 三、统计学的分科 返回,一、统计的涵义,统计工作: 统计工作者搜集、整理、计算分析或推断统计资料的工作过程。 统计资料: 以文字、图表等形式显示出来,用来说明事物的现状、事物之间的内在联系以及未来发展趋势的数据。 统计学: 是一门研究搜集、整理、分析或推断统计资料的方法论性质的科学。 返回,二、统计学的产生和发展 (一)古典统计学时期(17世纪中叶18世纪中叶),1、政治算术学派 1创始人:威廉配第 、格朗特 2产生的背景:当时的英国统治阶级为了管理国家、发展经济、争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派。 3研究方法:从数量方面研究社会经济现象。 返回,2、 国势学派 1创始人:海尔曼康令、阿亨瓦尔 2产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派。 3研究方法:对国家重要事项的记述,几乎完全偏重于品质方面而忽视了量的分析。 返回,(二)近代统计学时期(18世纪末19世纪末),1、数理统计学派 1创始人:阿道夫凯特勒(比利时) 2产生的背景:当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派. 3研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。 返回,2、社会统计学派 (1)创始人:德国的克尼斯 (2)产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。 (3)研究方法:在对统计资料进行搜集、整理、分析的基础上,明确现象内部的联系和规律性。 返回,(三)现代统计学时期(20世纪初至今),数理统计学派与社会统计学派逐步融合,成为统一的现代统计学。从20世纪60年代以后,统计学的发展有几个明显的趋势: 1、统计学依赖和吸收的数学方法越来越多; 2、统计学向其它学科领域逐渐渗透; 3、借助电子计算机后,统计学发挥的功效日益增强。 返回,(一)从统计方法的构成来看 1.描述统计学 研究如何搜集、加工处理、显示及计算分析数据的方法。 2.推断统计学 研究如何根据样本数据推断总体数量特征的方法。 返回,三、统计学的分科,(二)从统计方法的研究和应用角度 1.理论统计学 即数理统计学,主要探讨统计学的数学原理和统计公式的来源。 2.应用统计学 主要探讨如何运用统计方法去解决实际问题。 返回,第二节 统计学的研究对象与研究方法,一、统计学的研究对象: 统计学的研究对象是社会现象和自然现象的数量方面,即数量特征和数量关系。 返回,(一)统计学的性质: 统计学是一门适用于自然现象和社会现象的方法论性质的学科。 (二)研究对象的特点 1.总体性 2.数量性 3.客观性 4.具体性 5.变异性,二、统计学的研究方法,(一)大量观察法 (二)统计分组法 (三)综合指标法 (四)统计模型分析法 (五)统计推断法 返回,三、数据的计量尺度,(一)定类尺度 = (二)定序尺度 (三)定距尺度 + - (四)定比尺度 ,第三节 统计学中的基本概念,一、统计总体与总体单位 二、标志 三、指标 四、变量 返回,一、总体与总体单位,(一)总体 1、概念: 在同一性质基础上结合起来的许多个别事物的整体。 2、种类 (1)有限总体:总体中的单位数是有限的。 (2)无限总体:总体中的单位数是无限的。 3、注意 构成总体的单位必须是同质的; 返回,4、总体的特点,(1)同质性:构成总体的各个单位至少具有某种相同的性质。构成全国所有油田这个总体的各个单位经济职能是相同的,都是进行原油生产和加工的。 (2)大量性:总体是由许多单位组成的,仅仅个别或少数单位不能形成总体。 (3)差异性:构成总体的各个单位在诸多方面是不同的。 返回,(二)总体单位 构成总体的各个单位称为总体单位。 (三)总体与总体单位不是固定的 随着研究目的和范围地改变,原来的总体(总体单位)可以变为总体单位(总体)。 返回,二、标志,(一)标志和标志表现 标志:是说明总体单位特征的名称。 标志表现:是标志特征在各单位的具体体现。 (二)标志的分类 1、按变异情况 (1)不变标志: 当一个标志在各个单位的具体表现都相同时,称为不变标志,它是构成统计总体的基础; (2)变异标志 当一个标志在各个单位的具体表现不尽相同时,称为变异标志,它是统计研究的主要内容; 返回,2、按性质可分为,(1)品质标志:说明总体单位质的特征,不能用数值表示。如果总体单位是一位学生,性别、籍贯、是否近视等是品质标志。 (2)数量标志:说明总体单位量的特征,是用数值表示的。年龄、身高、以百分制表示的学习成绩等是学生这个总体单位的数量标志 返回,三、指标,(一)概念: 指标是说明总体数量特征的名称及数值。 (二)特点: 1、总体性: 2、数量性:所有的指标都可以用数值来表现; 3、综合性:指标的形成都必须经过从个体到总体的过程; 4、具体性:它是一定的具体的社会经济现象的量的反映,说明的是客观存在的已经发生的事实; 返回,(三)分类,1、按说明总体内容的不同: (1)数量指标:反映总体绝对数量多少的指标。其特点是指标数值随总体范围的扩大(缩小)而增大(减小)。 (2)质量指标:说明总体内部数量关系和总体一般水平的指标,一般表现为相对数和平均数。其特点是指标数值大小不随总体范围的变化而增减。 返回,2、按作用形式和表现形式不同: (1)总量指标 (2)相对指标 (3)平均指标 返回,(四)指标与标志的关系,1、区别: (1)指标是说明总体特征的,标志是说明总体单位特征的。 (2)指标都是用数值表示的,标志有用数值表示的和不用数值表示的。 2、联系: (1)综合关系,指标数值是总体单位的数量标志值综合汇总而来的。 (2)转换关系,由于研究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志(指标)。 返回,四、变量,1、概念 指可变的数量标志。 变量的具体数值表现称为变量值。 2、种类 (1)按变量值是否连续分为:连续变量、离散变量 (2)按性质分为:确定性变量、随机性变量 返回,第二章 统计数据的搜集和整理,第一节 统计数据的搜集 第二节 统计数据的整理 第三节 统计数据的显示 返回,第一节 统计数据的搜集,一、数据的来源 二、数据的类型 三、统计调查方式 四、统计调查的具体方法 五、统计调查方案 返回,(一)数据的间接来源 优点:易得到,采集成本低,采集速度快 局限性:相关性、时效性、准确性欠缺 (二)数据的直接来源 1、社会现象-调查的方式 2、自然现象-试验的方式,一、数据的来源,二、数据的类型,(一)按计量尺度划分 1、定类数据 2、定序数据 3、定距数据 4、定比数据,(二)按数据的收集方法 、观测数据 、实验数据 (三)按现象与时间的关系 、截面数据 、时间序列数据,三、统计调查方式,(一)定义:根据统计研究的目的要求和任务,运用科学的调查方法,有计划、有组织地想客观实际搜集资料的过程。 (二)类别,(三)统计调查方式,1.统计报表 (1)概念:统计报表是按照国家有关法规的规定,自上而下统一布置,自下而上地逐级提供基本统计数据的一种调查方式。 (2) 种类: 按报送范围不同,有要求调查对象中每个单位都填报的全面报表和只要求调查对象中的一部分单位填报的非全面报表。 按报送的周期不同,有日报、月报、季报、年报等。 按报表的内容和性质不同,有国家统计报表、部门统计报表、地方统计报表。,2.普查 (1)概念:普查是为某一特定目的而专门组织的一次性全面调查。 (2)特点: 普查通常是一次性或周期性的。 普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏。标准时间一般定在调查对象比较集中,变动相对较小的时间上。 普查数据一般比较准确,规范化程度也较高。 普查的适用对象比较狭窄,只能调查一些最基本、最一般的现象。,3.抽样调查 抽样调查是从总体中随机抽取一部分单位进 行调查,根据其调查结果推断总体数量特征的一 种非全面调查方法。 4.重点调查 重点调查是从全部单位中选择少数重点单位 进行调查,以了解总体的基本情况。 5.典型调查 是从研究对象的全部单位中选择一个或几个 少数有代表性的单位进行全面深入的调查,用来 揭示同类事物的本质规律性。 返回,四、统计调查的具体方法,(一)观察法 调查者通过实际观察事情发生的经过和结果,得到自己所需要的资料。 (二)访问法 调查者采用各种询问的方式向被调查者了解情况的一种方法。有(1)面谈访问法(2)电话访问法 (3)邮寄访问法 (三)实验法 控制一个或几个变量,调查另外一个市场变量有关资料的方法。 (四)报告法 被调查单位按照统一要求和表格形式,向有关部门提供统计资料的方法。 返回,(五)文献法 调查人员根据调查方案的内容和要求,收集文献资料的一种方法。 (六)网上调查 利用互联网进行调查,获取调查资料的统计调查方法。,五、统计调查方案,(一)确定调查目的 调查研究所要达到的具体目标,解决的问题,具有 的社会经济意义。 (二)确定调查对象、调查单位和报告单位 1.调查对象:根据调查目的所确定的调查研究的总体。 2.调查单位:构成调查对象的每个单位。 3.报告单位:负责报告调查内容的单位。 返回,(三)确定调查内容 调查内容一般以调查表或问卷的形式出现。 1.调查表有单一表和一览表。 2.问卷是一种特殊的调查表,其内容是由一系列问 句所构成的。 (四)确定调查时间 包括时期资料所属的时期、时点资料所属的时点和调 查工作的期限。 (五)调查的组织和实施 包括调查所采用的方法、组织和实施的具体细则等事 项。 返回,第二节 统计数据的整理,一、统计整理的概念和意义 二、统计分组 三、频数分布 返回,一、统计整理的概念和意义,(一)概念: 统计整理是指根据统计研究任务的要求, 对调查所搜索的原始资料进行分组、汇总,使其 条理化、系统化的工作过程,也包括对加工过的 次级资料进行再整理。 (二)意义 统计资料整理是统计调查的继续,也是统计 分析的前提,在整个统计工作中具有承前启后的 作用。,(三)统计整理的步骤 1.设计和制定统计整理方案 2.对原始资料和二手资料进行审核; 3.对经过审核的资料进行分组、汇总,计算出总体总量指标; 4.将汇总计算的结果,以统计表或统计图的形式表现出来; 5.对统计资料妥善保管,系统积累;,二、统计分组,(一)统计分组的含义 指根据统计研究任务的要求和现象总体的内 在特点,把统计总体按照某一标志划分为若干性 质不同而又联系的几个部分。,(二)统计分组的种类 1.按分组标志个数不同 (1)简单分组 把总体只按一个标志分组。 (2)复合分组 对同一总体选择两个或两个以上标志层叠起来 进行分组。,例如:对全国的工业企业进行,简单分组: 按经济类型分:全民所有制企业、集体所有制企业、城 乡个体企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业,2.按分组标志性质不同 (1)按品质标志分组 (2)按数量标志分组 A.单项式分组:一个变量值表示一个组的分组。适用于离散型变量且变量的取值不多(或变量值变动幅度比较小)。 例如,职工家庭人口数,其取值不可能很多,且每一个取值都可视为一种类型: 职工家庭人口数 3人 4人 5人 6人,B.组距式分组 把整个变量值依次划分为几个区间,各个变量值按其大小确定所归并的区间,区间的距离称组距。 适用于连续型变量或虽为离散型变量但取值很多,不便一一列举的情况。,连续型变量的组距式分组:相邻组的上限和下限必须是重叠的,因此上一组的上限同时也是下一组的下限。 例如:企业按工人工资对工人进行分组如下: 500600元 600-700元 700-800元 如果某工人工资为700元,应将他归并到哪一组? “上组限不计入”原则:遇到某单位的标志值刚好等于相邻两组上下限时,一般把次值归并到作为下限的那一组。,离散型变量的组距式分组:各组的上下限都可以用确定的数值(整数)表示。 因此上下限之间不必重合,只要相互衔接即可。如:5X10,11X16;17X22, 生产小组按人数分组(人) 510 511 1116 1117 1722 1723,组距式分组中的有关问题, 组限、上限、下限: 开口组和闭口组: 组距:组距=上限-下限 组距式分组有等距分组和异距(不等距)分组;,组中值,闭口组,缺上限组,缺下限组,合理确定组中值:第一组:50人以下 第二组:50200人,(一)概念:在统计分组的基础上将总体的所有单位按组归类,并把所有的组及其单位数按一定顺序排列起来,用以反映总体单位在各组的分布状况。又称分配数列。 分配数列包含的两要素:总体按某标志所分的组和各组所占有的单位数-次数或频率。 (二)分配数列的种类: 1、品质分配数列:按品质标志分组所编成的分配数列。 2、变量分配数列:按数量标志分组所编成的分配数列。(又分单项式数列、组距式数列),三、频数分布,(三)分配数列的编制,例:对某企业30个工人完成劳动定额的情况进行调查,原始资料如下(%): 98 81 95 84 93 86 91 102 100 103 105 100 104 108 107 108 106 109 112 114 109 117 125 115 120 119 118 116 129 113 要求:编制分配数列。 第一步:计算全距;全距=最大值-最小值=129-81=48 第二步:确定组数和组距 等距分组时:组距=全距/组数 组距=48/5=9.610,第三步:确定组限; 注意: 1、最小组的下限应低于最小变量值,最大组的上限应高于最大变量值; 2、组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化; 3、为方便计算,组限应尽可能取整数,最好是5或10的整倍数。 4、连续型变量和离散型变量组限的确定;,第四步:编制频数(频率)分布表 某企业30个工人劳动定额完成情况分布表,第五步:计算累计频数和累计频率; 向上累计频数(频率):由变量值小的向变量值大的组累计频数和频率;表示小于该组上限的各组的频数或频率之和; 向下累计频数(频率):由变量值大的向变量值小的组累计频数和频率;表示大于及等于该组下限的各组的频数或频率之和;,某企业工人完成劳动定额累计分布表,(四)频数分布的主要类型,日产量(件),1、钟型分布,日产量(件),日产量(件),2、型分布,3、J型分布(1),价格,返回,型分布(),价格,第三节 统计数据的显示,一、统计表 二、统计图 (一)定类数据 (二)定序数据 (三)数值型数据 返回,(一)统计表的结构,横 标 题,纵标题,数字资料,主 词,宾 词,我国2002年国内生产总值,一、统计表,(二)统计表的种类 1.按主词的结构分类 简单表,A、我国三个城市的人口数(1990年7月1日0时),分组表(见表的结构) 复合表 某年末某地区人口资料,返回,2.按宾词的结构分类(见教材),(三)统计表的设计要求 1、统计表的标题应简明扼要,能恰当反映表的内容;2、主次和宾词的排列要符合逻辑关系 3、栏目较多时,通常要加编号,主词用甲、乙、丙,宾词用1、2、3等编号; 4、表的上下端用粗横线,其余用细线,左右两端不封口; 5、表内数字填写整齐,位数对准,不能留有空白,缺资料,用表示; 6、计量单位相同,可放在表右上角,若不同,应在每个指标后或单列一列; 7、统计资料来源以及需附加的说明,可写在表下面,以便考查;,二、统计图 (一)定类数据 1、条形图(Bar)。 条形图可用于显示离散型变量的次数分布。最主要是显示定类数据和定序数据的频数分布。,【例1】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?” 1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告,2、圆形图(饼图 Pie )。 用于显示定类变量的次数分布。饼图主要用于表示总体中各组成部分所占的比例。在绘制饼图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分比占360度的相同比例确的。,(二)定序数据,【例2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2不满意;3一般;4满意;5非常满意。,1.累计频数分布图,图3 甲城市家庭对住房状况评价的累积频数分布,2、环形图,(1)环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示 (2)环形图与圆形图类似,但又有区别: 圆形图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环 (3)环形图可用于进行比较研究,用于展示定类和定序的数据,(三)数值型数据,117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用组距式对数据进行分组。,1.分组数据(单项式分组),等距分组 各组频数的分布不受组距大小的影响 可直接根据绝对频数来观察频数分布的特征和规律 不等距分组 各组频数的分布受组距大小不同的影响 各组绝对频数的多少不能反映频数分布的实际状况 需要用频数密度(频数密度频数/组距)反映频数分布的实际状况,A.直方图,频 数 (人),15,12,9,6,3,日加工零件数(个),图5 某车间工人日加工零件数的直方图,我一眼就看出来了,大多数人的日加工零件数在120125之间!,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频 数 (人),B.折线图,图6 某车间工人日加工零件数的折线图,C.曲线图,树茎,树叶,788,022347778889,0012222333344466777889,0133445799,数据个数,2、未分组数据:茎叶图,图7 某车间工人日加工零件数的茎叶图,(扩展的茎叶图),3、时间序列数据:线图,【例5】已知19911998年我国城乡居民家庭的人均收入数据如表11。试绘制线图,4、多变量数据的图示 A、散点图(两种变量) B、气泡图(三个变量) C、雷达图(多个变量),【例6】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据如表13。将各指标用雷达图表示出来,并分析该河流的主要污染源。,练习:某百货公司连续40天的商品销售额 (单位:万元)如下: 25 26 28 29 30 30 32 33 34 34 35 35 36 36 36 36 37 37 37 37 37 38 38 38 39 40 41 42 42 43 43 44 44 44 45 45 46 46 47 49 要求(1)根据上面的数据进行适当分组,编制频数分布表,并绘制直方图。 (2)绘制茎叶图,第三章 总量指标和相对指标,通过本章的学习,要求学生在理解总量指标、相对指标的基础上,重点掌握各种指标的计算方法。 第一节 总量指标 第二节 相对指标 返回,第一节 总量指标,一、总量指标的概念及特点 (一)概念:指反映社会经济现象发展的总规模、总水 平的综合指标。 (二)特点: 1.是认识社会经济现象总体的起点; 2.是编制计划、实行经营管理的主要依据; 3.是计算相对指标、平均指标的基础;,二、总量指标的计量单位,1、实物单位,自然单位,度量衡单位,2、货币单位 3、劳动单位(工时、工日),三、总量指标的种类,(一)按其所反映的内容不同 、总体单位总量指标:指总体中所有单位的总数。 、总体标志总量指标:指总体中各单位的某种数量标志值总和。 (二)按其所反映的时间状况不同 、时期指标:反映现象在某一段时期内发展变化结果的总量。 (1)具有可加性; (2)指标数值的大小与所属时期的长短直接相关; (3)必须连续登记而得; 返回,、时点指标:反映社会经济现象在某一时刻或某一时点上状况的总量。 (1)不具有可加性; (2)数值大小与登记时间的间隔长短无关; (3)不必要经过连续登记而得;,一、相对指标的概念 用两个有联系的指标进行对比的比值来反映 社会经济现象数量特征和数量关系的综合指标。 二、相对指标的表现形式 (一)有名数 (二)无名数 1、系数和倍数 2、成数 3、百分数 4、千分数 返回,第二节 相对指标,三、相对指标的种类及计算,总体中某部分数值 (一)结构相对指标= 100% 总体全部数值 一般用百分数表示。总体各组的结构相对指标数值之和 等于100%。 意义: 1.分析总体内部构成状况,说明事物性质和特征; 2.不同时间的结构相对数进行对比分析,说明现象的变化过程和规律; 3.说明各组在总体的地位和作用。,第六次人口普查结果 大陆地区人口中,0-14岁人口占16.60%;15-59岁人口占70.14%;60岁及以上人口为占13.26%,其中65岁及以上人口为占8.87%。 同2000年第五次全国人口普查相比,0-14岁人口的比重下降6.29个百分点,15-59岁人口的比重上升3.36个百分点,60岁及以上人口的比重上升2.93个百分点,65岁及以上人口的比重上升1.91个百分点。,(二)比例相对指标,可用一比几或几比几形式表示,也可用百分数表示。,例 人口性别比指标: 人口出生性别比正常值一般在103到107之间。但我国人口的出生性别比,自20世纪80年代中期以来却迅速攀升。 1995年,0岁4岁人口性别比:118.38 2000年,0岁4岁人口性别比:120.17 2003年,0岁4岁人口性别比:121.22 2005年,0岁4岁人口性别比:122.66 2010年,0岁4岁人口性别比:118.06,(三)比较相对指标,可用倍数、系数表示。分子分母可以交换。 例甲、乙两公司2000年商品销售额分别为: 5.4亿元和3.6亿元 则甲公司商品销售额为乙公司的1.5倍,注:用总量指标进行计算对比,往往受到总体规模 和条件的影响,结果不能准确反映现象的本质差异。 一般采用相对指标或平均指标计算。 上例中,如用各公司人均年销售额进行对比: 甲公司:216万元/人,乙公司: 232万元/人 则比较相对指标216/23.2=0.93=93% 甲公司人均年销售额为乙公司的93%。 说明虽然甲公司总销售额比乙公司多,但劳动 效率却低于乙公司。,(四)动态相对指标,基期是作为比较标准的基础时期。 报告期是用来与基期对比的时期,也称比较期或计算期。 此指标也称发展速度。增长速度=发展速度-1。,甲公司2011年的产值是2400万元,2010年的产值是2000万元,则该公司的产值发展速度为120%,即产值增长了20%(增长速度),(五)强度相对指标,单位一般以名数和复名数表示,如商品流转 次数用“次”表示,地区一定时期人均粮食产量 为“公斤/人”. 也可采用百分数、千分数等表示, 如资金利税率、人口死亡率。,有些强度相对指标的分子和分母可以互换,形成正指 标和逆指标两种计算方法。 例:反映卫生事业对居民服务保证程度的指标: 正指标的数值大小与现象的发展程度或密度成正比, 一般指标数值越大越好。 将分子分母互换: 逆指标的数值大小与现象的发展程度或密度成反比 一般指标数值越小越好。,(六)计划完成相对指标,1、基本公式 2、短期计划的检查 (1)计划任务数为总量指标 例1:某企业计划规定本年度销售收入达到1000万元,实际为950万元,计划完成相对指标为,(2)计划任务数为平均数,例2:某企业计划某种产品单位成本为50元,实际为45元,计划完成相对指标为,(3)计划数为相对数,计划完成%=(1+实际提高率)/(1+计划提高率) 计划完成%= (1-实际减低率)/(1-计划降低率) 某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为 (正指标) 某企业计划某种产品成本今年比去年降低5%,实际降低了6%。计划完成相对指标为 (逆指标),第四章 数据分布特征的测度,通过本章的学习,要求学生在理解平均指标、变异指标概念的基础上,重点掌握各种指标的计算方法。 第一节 集中趋势的测度 第二节 数据离散趋势的测度 第三节 数据偏态与峰度的测度 返回,第一节 数据集中趋势的测度,平均指标(平均数)是反映现象的一般水平或平均水平的指标。它具有代表性和抽象性。 一、数值平均数 (一)算术平均数 (二)调和平均数 (三)几何平均数 二、位置平均数 (一)众数 (二)中位数 (三)四分位数 返回,一、数值平均数 (一)算术平均数,1、简单算术平均数 计算公式: 应用条件:资料未分组 举例:5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:,2、加权算术平均数,计算公式: 应用条件:分组数据,例1:某车间工人人数和日产量情况表:,平均日产量=348/10=34.8(件) 或平均日产量=3+6.4+6.8+10.8+3.8+4=34.8(件),例2:某车间职工工资分组情况:,职工平均工资=13800/40=345(元) 或职工平均工18.75+37.5+175+45+68.75=345(元),3、算术平均数的数学性质,(1)各个变量值与其平均数离差之和等于零 (2)各个变量值与其平均数离差平方之和为最小值 (3)给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。 (4)给每个变量值乘以或除以一个任意数A,则算术平均数也相应扩大或缩小A倍。,4、算术平均数的应用,(1)如何选择加权算术平均数的权数; A.根据被平均的对象在总体中的重要程度设定权数; B.以次数分布数列中各组变量值出现的次数或频率为权数; C.根据事物之间的相互关系确定权数; (2)切尾平均数:当总体内存在过大或过小的极端数值,为正确反映总体水平,应将其剔除,然后将其余数值加以平均,称为切尾平均数。文艺、体育比赛中应用较多。,(二)调和平均数(H),1、简单调和平均数 计算公式: 应用条件:资料未分组 例:一个人步行两里,走第一里时速度为每小时候10里,走第二里时为每小时20里,则平均速度为:,2、加权调和平均数,计算公式: 应用条件:资料经过分组 例1:,例2:某局所属的三个企业的资料:,平均产值计划完成程度= 实际产值/计划产值 = m / m/x=37320/36000=103.7%,(三)几何平均数(G),1、简单几何平均数 计算公式: 应用条件:资料未分组 例:某企业生产某种产品需经三个连续作业车间才能完成,=79.58%,2、加权几何平均数,计算公式: 应用条件:资料经过分组 例:将一笔钱存入银行,存期10年,以复利计息,利率分别是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率。,平均年利率=8.77%,二、位置平均数,(一)众数(m0) 1、概念:总体中出现次数最多的标志值是众数。 2、众数的计算 (1)未分组资料:哪个变量值出现的次数最多,那个变量值就是众数。 例:7名工人日产量(件)为4、5、6、6、6、7、8。则众数是6。 (2)单项式数列,(3)组距数列确定众数 首先将出现次数最多的组确定为众数所在组,再利用插补法求其众数近似值。,:表示众数所在组的下限;:表示众数所在组的上限; 1: 表示众数所在组次数与前一组次数之差; 2: 表示众数所在组次数与后一组次数之差; d: 表示众数所在组的组距。,例:已知资料如下,要求确定众数,(1)确定众数组(67) (2)计算众数,(二)中位数( me ) 1、含义:把某一标志值按大小顺序排列起来居于 中间位置的那个数就是中位数。 2、计算 (1)由未分组资料确定中位数 首先将标志值按大小顺序排列, Me= 当n为奇数 ;,Me= ,当n为偶数,(2)单项式变量数列,Me=,,当 为奇数,,当 为偶数,例:资料如下,要求确定中位数,中位数为第40 名和41名日产量的平均值: (24+24)/2=24(件),(3)组距数列确定中位数,首先从变量数列的累计频数栏中找出第 /2个单位所在组,即“中位数”组,该组的上下限就规定了中位数的可能取值范围。 假定在中位数组内的各单位是均匀分布的,则,L: 表示中位数组的下限; U: 表示中位数组的上限; fm:表示中位数组的次数; Sm-1表示中位数所在组以前各组的 累计次数; Sm+1表示中位数所在组以后各组的 累计次数; d: 表示中位数所在组的组距。,例:资料如下,要求确定中位数。,(1)计算累计次数 (2)确定中位数组(67) (3)确定中位数数值,(三)四分位数,1、含义: 一组数据排序后处于25%和75%位置上的值,称为四分位数。处于25%处的数值称为下四分位数,处于75%处的数值称为上四分位数。 2、计算: (1)未分组数据 设下四分位数为QL,上四分位数为,对于未分组的原始数据,各四分位数的位置分别为: 当四分位数的位置不在某一个位置上时,可根据四分位数的位置,按比例分摊四分位数两侧的差值。,例:在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:元),1500、750、780、1080、850、960、2000、1250、1630,计算人均月收入的四分位数。 解: QL(780850)2815(元) QU(15001630)2156(元) QL和QU之间包含了50%的数据,因此,我们可以说有一半的家庭人均月收入在8151565元之间。,(2)单项式分组数据 (3)组距式分组数据,三、平均数之间的关系,(一)各种平均数的特点及应用场合 是就全部数据计算的,具有优良的数学性质,实际中应用最为广泛。其主要缺点是易受极端值的影响,对偏态分布其代表性较差。 H主要用于不能直接计算 的数据,易受极端值的影响。 G主要用于计算比率数据的平均数,易受极端值的影响。 不受极端值大小的影响,对偏态分布其代表性较 好。但不是根据所有的变量值计算的. 不受极端值的影响,对偏态分布其代表性较 好.但不是根据所有的变量值计算的.,1、当一组数据中所有数据不尽相同时,据此计算的三种平均数的结果为:算术平均数最大,调和平均数最小,几何平均数居中。它们的关系用公式表示即为: G H,极端值对其影响大小也是如此。 2、当一组数据中所有的数据都相同时,据此计算的三种平均数相等。,(二)算术平均数与众数、中位数的关系,对称分布,左偏分布,右偏分布,算术平均数与众数、中位数当频数分布的偏斜程度不是很大时,无论左偏还是右偏,众数与中位数的距离约为算术平均数与中位数距离的两倍。 即(Me-M0)=2( -Me)可以得出:,例:根据某城市住户家庭月收入的抽样调查资料算得众数为2043元,中位数为2271元,问算术平均数为多少?其分布呈何形态? 由已知资料,推算样本的算术平均数为:,因为 2385 2271 2043 所以,该城市住户家庭月收入分布呈右偏态分布。,第二节 数据离散趋势的测度,变异指标是反映总体各标志值间差异程度的, 且能衡量总体平均数的代表性。 一、定类数据离散程度的测度-异众比率 二、定序数据离散程度的测度-四分位差 三、数值型数据离散程度的测度 (一)全距 (二)平均差 (三)方差和标准差 (四)标准分数 (五)标准差系数 返回,一、定类数据离散趋势的测度-异众比率,(一)定义: 非众数组的频数占总频数的比率,称为异众比率。 (二)作用: 异众比率的作用是衡量众数对一组数据的代表性程度的指标。异众比率越大,说明非众数组的频数占总频数的比重就越大,众数的代表性就越差;反之,异众比率越小,众数的代表性就越好,为变量值的总频数;,为众数组的频数;,二、定序数据离散趋势的测度四分位差,(一)定义: 上四分位数与下四分位数之差,称为四分位 差,亦称为内距或四分间距,用Qd表示。Qd=Qu-QL (二)作用: 四分位差反映了中间50%数据的离散程 度,其数值越小,说明中间的数据越集中;数值 越大,说明中间的数据越分散。,三、数值型数据离散趋势的测度 绝对数形式的变异指标,(一)全距(R) 公式: R =最大值最小值 优点:计算简便 缺点:易受极端值的影响 举例:5名学生的成绩为50、69、76、88、97 则 R=97-50=47,(二)平均差(MD),1、简单平均差(资料未分组) 公式:MD= 例:某厂甲、乙两组工人生产某种产品的产量资料如表:平均差计算表,MD甲=,=6/5=1.2(件),MD乙=,=80/5=16(件),从计算结果看,甲、乙两组平均生产件数相等,但由于甲组的平均差(1.2件)小于乙组的平均差(16件),因而其平均数的代表性比乙组大。,2、加权平均差(资料分组),公式:MD=,例:某企业105名工人的月工资资料如表所示 平均差计算表,(元),MD,(元),计算结果表明,该企业105名工人的月工资水平 差异程度平均为80.7元。,3、平均差的优缺点,优点:平均差是根据全部数值计算的,受极端值 影响较全距小。 缺点:由于采取绝对值的方法消除离差的正负 号,应用较少。 返回,(三)方差和标准差( ),1、总体的方差和标准差公式:,,未分组资料,分组资料,例:现利用前面资料计算方差和标准差,计算 过程见下表。,方差和标准差计算表,(元),2、样本的方差和标准差,未分组资料,分组资料,例:如果上表的数据为样本资料,则计算的 样本方差和标准差为:,(元),这与根据总体的方差和标准差计算公式计算的结 果相差不大。当n很大时,样本方差S2 与总体方差2 的计算结果相差很小,这时样本方差也可以用总体方差的公式来计算。,(四)相对位置的度量:标准分数,1、作用:测度每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群值。 比如,如果某个数值的标准分数为-2,我们就知道该数值低于均值2倍的标准差。,2、公式:变量值与其平均数的离差除以标准差后的值,称为标准分数,也称标准化值或值。设标准分数为,则有: 3、举例:根据已知数据计算得: 要求根据下列数据,计算每个家庭人均收入的标准分数。 解:每个家庭人均月收入的标准分数如下表:,可知,收入最低的家庭其人均收入与平均数相比低1.042个标准差;而收入最高的家庭人均收入比平均数高1.853个标准差。 标准分数均值为0,标准差为1,即,绝对数形式变异指标的适用条件,当两个或多个数列的平均水平相等时,对比数列标志值间的变异程度及平均水平的代表性,用绝对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。 返回,相对数形式的变异指标 (五)标准差系数(应用最广泛),公式为: 例:甲组日产量(件)为:60 65 70 75 80。 乙组日产量(台)为: 2 5 7 9 12。,相对数形式变异指标的适用条件,当两个或多个数列的平均水平不等时,对比数列标志值间的变异程度及平均水平的代表性,用相对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。 返回,第三节 数据分布偏态与峰度的测定,偏态是对数据分布在偏移方向和程度所作的进一 步描述; 峰度是用来对数据分布的尖峭程度所做的描述。 对于偏斜程度的描述用偏态系数,尖峭程度的描 述用峰度系数。 一、偏态系数 二、峰度系数,返回,一、偏态系数,=0时,次数分布为对称分布; 0时,次数分布为非对称右偏分布或正偏分布; 0时,次数分布为非对称左偏分布或负偏分布;的绝对值越大,表示偏斜的程度越大。,二、峰度系数,当0时,表示尖峰分布; 当0时,表示标准正态分布; 当0时,表示平峰分布。,尖峰分布,平峰分布,X,X,频数,频数,第五章 时间数列分析,本章主要介绍如何根据时间数列进行动态分析,动态分析包括两方面,一是计算各种动态分析指标,反映现象在某一段时期内发展变化的水平和速度。二是测定现象发展变化的规律性,对未来状况作出预测。重点掌握动态分析指标。 第一节 时间数列的概念和种类 第二节 时间数列的水平指标分析 第三节 时间数列的速度指标分析 第四节 现象变动的趋势分析,第一节 时间数列的概念和种类,一、概念 将一系列指标数值按时间先后顺序排列起来所形成的数列。又称时间序列或动态数列。 二、种类 (一)绝对数时间数列(总量指标数列) 按反映时间状况的不同,可以分为: 1、时期数列 反映某种社会现象在一段时期内发展过程的总量。特点和时期指标相同。 返回,2、时点数列 反映某种现象在一定时点(瞬间)上的发展状况的总量。特点与时点指标相同。 (二)相对数时间数列 各项指标值不能直接相加; 包括两个时期数列对比形成的;两个时点数列对比形成的;一个时期数列和一个时点数列对比形成的; (三)平均数时间数列 各项指标值不能直接相加;,三、编制时间数列的原则,(一)时间方面的可比性 (二)空间方面的可比性(即总体范围大小应该一致) (三)指标口径的可比性 (四)指标计算方法和计量单位方面的可比性,第二节 时间数列的水平指标分析,动态分析:现象发展的水平分析、现象发展的速度分析。 水平分析是速度分析的基础,速度分析是水平分析的深 入和继续。 一、发展水平 二、平均发展水平 (一)根据绝对数时间数列计算的 1、根据时期数列计算的 2、根据时点数列计算的 (1)根据连续性时点数列计算的 间隔相等 间隔不等 (2)根据间断性时点数列计算的 间隔相等 间隔不等 (二)根据相对数动态数列计算的 (三)根据平均数动态数列计算的 三、增长量 四、平均增长量,一、发展水平,(一)定义: 是动态数列中每一项具体的指标数值。(可以是总量指标,也可以是相对指标或平均指标) (二)分类 最初水平时间数列中第一项指标值,用a0表示 最末水平时间数列中最后一项指标值,用an表示 报告期水平和基期水平 用符号表示:a0、a1、a2、a3an,二、平均发展水平,是将不同时间的发展水平加以平均而得到的平均数,由于它是不同时间的、动态上的平均,故又称为序时平均数或动态平均数。 平均发展水平与一般平均数的联系与区别: (一)绝对数时间数列的序时平均数 1、时期数列的序时平均数(采用简单算术平均法),例:1998-2002年我国国内生产总值(亿元)为78345 82067 89442 95933 102398,则 平均国内生产总值为,2、时点数列的序时平均数,(1)连续性时点数列计算序时平均数,返回,对逐日排列的时点资料,视其为连续时点资料,资料登记的时间单位仍然是1天,但实际只在指标值发生变动时才记录一次。,例:某种商品5月份的库存量记录如下表,计算5月份平均日库存量。,解:该商品5月份平均日库存量如下:,=(504+556+4010+356+305)/(4+6+10+6+5)=42(台),(2)间断性时点数列计算序时平均数,间隔相等 解:4月份平均库存额= 5月份平均库存额= 6月份平均库存额= 第二季度的平均库存额,间隔不等,1月份平均人数=,2、3月份平均人数=,4、5、6月份平均人数=,(二)相对数时间数列的平均发展水平,基本公式 1:由两个时期数列对比形成的,=102.94%,平均生产工人%,返回,2、由两个时点数列相比的比值所形成的,3、一个时期和一个时点数列对比形成的,第四季度平均每人增加值,返回,(三)根据平均数时间数列计算平均发展水平,例1:已知各季平均人数为351 353 352 350则全年平均人数为 例2:某企业人数,1月份平均452,2、3月平均455,第二季度平均每月458,则上半年平均人数为,三、增长量,1、公式:增长量=报告期水平-基期水平 2、种类: 累计增长量=报告期水平-最初水平 a1-a0、a2-a0an-a0 逐期增长量=报告期水平-前期水平 a1-a0、a2-a1. an-an-1,3、关系: (1)逐期增长量之和等于相应时期累计增长量,(2)相邻两个累计增长量之差等于相应时期逐期增长量,四、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论