应用统计学PPT课件.ppt_第1页
应用统计学PPT课件.ppt_第2页
应用统计学PPT课件.ppt_第3页
应用统计学PPT课件.ppt_第4页
应用统计学PPT课件.ppt_第5页
已阅读5页,还剩312页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/9/18,1,在终极的分析中,一切知识都是历史在抽象的意义下,一切都是科学数学在理性的基础上,所有的判断都是统计学 C.R.劳,应用统计学,2020/9/18,2,1 统计学是什么,Statistics is the science of collecting, organizing, presenting, analyzing, and interpreting numerical data to assist in making more effective decisions. 统计学是关于下列活动的方法和程序: 采集数据,例如问卷调查 呈现数据,例如绘制图表 概括数据,例如计

2、算均值 分析数据,例如区间估计 做出决策,例如假设检验,2020/9/18,3,无处不在的统计,在诺贝尔经济学获奖者中,2/3以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。 1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。,2020/9/18,4,无处不在的统计(续),大仲马的作品

3、多曲折感人,而他又多私生子。取笑讥讽他的人,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准。果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说: “所有统计数字都是撒谎的,包括有关本人的数字在内” 。听众哄堂大笑。,2020/9/18,5,统计的应用,学者不能离开统计而研究 政治家不能离开统计而施政 企业家

4、不能离开统计而执业 - 马寅初,2020/9/18,6,2 如何学统计学,Cultivate your statistical awareness in your daily life. numeric information on newspaper, TV program, webs Read some good books on statistics books magazines Practice statistical skills by exercises and computer software. Excel Spss Sas,2020/9/18,7,3 教材及参考文献,应用统

5、计学,施金龙、吕洁,南京大学出版社,2005 统计学,贾俊平、何晓群、金勇进,中国人民大学出版社,2002 统计学概论,曾五一,首都经济贸易大学出版社,2003 统计学的世界,戴维S穆尔,中信出版社,2003 The Basic Practice of Statistics,David S. Moore ,W. H. Freeman Company出版社,2004,2020/9/18,8,4 课程成绩评定,期末书面考试成绩(70%) 平时各项表现成绩(30%) 课堂参与(10%) 作业完成(20%),2020/9/18,9,5 课程主要内容,第一章 绪论 第二章 统计调查 第三章 统计整理 第

6、四章 综合指标 第五章 变异与均衡指标 第六章 时间数列,2020/9/18,10,课程主要内容(续),第七章 指数 第八章 抽样分布 第九章 参数估计 第十章 假设检验 第十一章 方差分析 第十二章 相关分析,2020/9/18,11,第一章 绪论,一、统计涵义 二、统计工作 三、统计资料 四、统计科学,那些默默无闻的统计学家们已经改变了我们的世界,不是由发现新的事实或技术,而是改变了我们推理和试验的方法,以及我们对这个世界的观念的形成方式。 哈克英,2020/9/18,12,一、统计涵义,Statistics: (1)Numeric data, when used as plural of

7、 statistic. (2)A scientific procedure used in the study and evaluation of numeric data. 统计: (1)统计工作(2)统计资料(3)统计科学,2020/9/18,13,二、统计工作,工作任务:调查、分析,服务、监督 工作职能:信息,咨询,监督 工作过程:设计,调查,整理,分析 工作组织:集中、分散,综合、专业,2020/9/18,14,三、统计资料,数据计量:定类、定序,定距、定比。 定类尺度是按照客观现象的某种属性对其进行分类。例如,人口按性别分为男女,用“1” 表示男性,用“0” 表示女性。定类尺度的主要

8、数学特征是“=”或“”。 定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。例如,学生成绩可以分为优、良、中、及格和不及格等五类。定序尺度的主要数学特征是“”。,2020/9/18,15,数据计量,定距尺度是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”或“”。统计中的总量指标就是运用定距尺度计量的。 定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用

9、于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是“”或“”。,2020/9/18,16,数据类型,Quantitative (or measurement) data Qualitative (or categorical) data Discrete data ,Continuous data 横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。 数据

10、信息知识智慧,2020/9/18,17,四、统计科学,1 统计学发展简史 2 统计学对象方法 3 统计学基本概念,2020/9/18,18,1 统计学发展简史,英国(1690),威廉配第,政治算术 德国(1749),阿亨瓦尔,国势学 比利时(19世纪中),凯特勒,数理统计 德国(19世纪中),恩格尔,社会统计,2020/9/18,19,理论统计学和应用统计学,历经300多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。 统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。 从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家

11、族”。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。 现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学;另一类是以各个不同领域的具体数量为研究对象的应用统计学。,2020/9/18,20,统计学学科体系,统计学家未必是经济学家, 经济学家也未必是统计学家。 但经济统计学家应当- 既是统计学家又是经济学家。,2020/9/18,21,2 统计学对象方法,对象:实质性学科与方法论学科 理论统计学与应用统计学 方法:特殊方法论与通用方法论 描述统计学与推断统计学 大量观察,平均分析,归纳推断,202

12、0/9/18,22,统计学家与数学家的对话,一名统计学家遇到一位数学家,统计学家调侃数学家,说道:“你们不是说若且,则吗,那么想必你若是喜欢一个女孩, 那个女孩喜欢的男生你也会喜欢了?” 数学家想了一下,反问道:“如果你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里, 想来你也没事吧!因为它们平均不过是五十度而已! ”,2020/9/18,23,Descriptive and Inferential Statistics,描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。 推断统计:研究如

13、何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行表书的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。,2020/9/18,24,3 统计学基本概念,总体、个体、样本 标志、指标、变量 同质、变异、分布 统计量、参数 同质性是总体的前提 变异性是统计的前提。,2020/9/18,25,第二章 统计调查,一、统计调查概述 二、统计调查方案 三、统计调查体系,数据胜过自封的专家。 戴维穆尔,2020/9/18,26,一、统计调查概述,调查概念:直接搜集资料 调查要求:准确、及时、系统、方便 调查用意:为研究提供素材 对表现进行衡量 用数据阐明问题,2020/9/18,27,D

14、ata Sources,数据,来源,直接来源,间接来源,试验,出版物,(或者网上),问卷,观察,2020/9/18,28,调查方法,观察法: 现场,直接 询问法: 采访,问卷,通讯,网上 报告法: 行政,向上 实验法: 随机,双盲,重复,2020/9/18,29,二、统计调查方案,目的、任务: 为什么调查 对象、单位: 向谁调查 项目、表格: 调查什么 时间、期限: 什么时候调查 什么时候的资料,2020/9/18,30,Questionnaire Design,问题内容 问题措辞 问题次序 答问方式 版面设计,2020/9/18,31,统计调查种类,2020/9/18,32,三、统计调查体系

15、,统计报表: 定报,年报 普 查: 一次,专门 抽样调查: 随机,推断 重点调查: 重点,大体 典型调查: 典型,细致,2020/9/18,33,统计调查体系改革,我国长期以来,基本上依靠全面统计报表采集统计资料。改革开放后,抽样调查等非全面调查虽然有所发展,但应用的领域不很广泛。这种以全面统计报表为主的统计调查体系,面对日益发展的多种经济成分、多种经营方式等复杂多样的调查对象已经难以适应。 统计调查体系改革的目标模式是:建立以必要的周期性普查为基础,经常性的抽样调查为主体,重点调查、科学推算等为补充的多种方式综合运用的统计调查体系。,2020/9/18,34,第三章 统计整理,一、整理程序

16、二、统计分组 三、频数分布 四、统计图表,数字不会说谎,但说谎的人会想出办法。 格罗夫纳,2020/9/18,35,一、整理程序,审核:计算审核,逻辑审核 分组:分类,分组 汇总:手工汇总,电子汇总 表现:列表,图示,2020/9/18,36,二、统计分组,概念:划分一个总体为若干组 原则:穷尽,互斥 作用:划分类型,研究结构,分析关系 方法:品质标志分组,数量标志分组,2020/9/18,37,三、频数分布,概念:总体单位在各组的分布状况 种类:品质数列,变量数列 单项数列,组距数列 编制:全距,组距,组限,频数 类型:钟型,U型,J型,2020/9/18,38,组距数列编制举例,某生产车间

17、50名工人日加工零件数如下: 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,2020/9/18,39,第一步,对数据进行排序,计算全距(R) 107 108 108 110 112 112 113 114 135 137 139 139 第二步,

18、确定组数(k)和组距(i) k=4 i=Rk i=10 k=1+3.3 Lg N 第三步, 设置组限(u,l) 离散变量与连续变量的不同要求 第四步,计算各组次数(f),组距数列编制举例(续1),2020/9/18,40,组距数列编制举例(续2),50名工人日产零件数,2020/9/18,41,分布数列类型-钟型分布,日产量 (件),2020/9/18,42,分布数列类型-型分布,2020/9/18,43,分布数列类型-J型分布(1),价格,需求,2020/9/18,44,分布数列类型-J型分布(2),价格,供应,2020/9/18,45,四、统计图表,统计表: 主词栏、宾词栏 简单表、分组表

19、、复合表 统计图: 分布图、条形图、圆形图,2020/9/18,46,统计表举例,主词,总标题,横行 标题,纵栏标题,数字资料,宾词,2020/9/18,47,统计图举例,直方图,2020/9/18,48,统计图举例(续1),条形图,2020/9/18,49,统计图举例(续2),19982002年我国进出口总额(亿美元),复合条形图,2020/9/18,50,统计图举例(续3),圆形图,2020/9/18,51,Errors in Presenting Data,Chart Junk 垃圾数图表 No Relative Basis 无相对基准 Compressing Vertical Axis

20、 压缩纵轴 No Zero Point on Vertical Axis 纵轴无零点,2020/9/18,52,垃圾数图表,差的表示,好的表示,1960: $1.00,1970: $1.60,1980: $3.10,1990: $3.80,最低工资,最低工资,0,2,4,1960,1970,1980,1990,$,2020/9/18,53,无相对基准,好的表示,按年级统计的A,按年级统计的A,差的表示,0,100,200,300,大一,大二,大三,大四,频数,0%,10%,20%,30%,大一,大二,大三,大四,%,2020/9/18,54,压缩纵轴,好的表示,季度销售,季度销售,差的表示,0

21、,25,50,1季,2季,3季,4季,$,0,100,200,1季,2季,3季,4季,$,2020/9/18,55,纵轴无零点,好的表示,月销售量,月销售量,差的表示,0,20,40,60,一,三,五,七,九,十一,$,36,39,42,45,一,三,五,七,九,十一,$,2020/9/18,56,第四章 综合指标,一、总量指标 二、相对指标 三、平均指标,统计学家通常醉心于平均数,而不着迷于 更广泛的考虑。这一点很像一些英格兰人 对瑞士的回忆:如果可以将它的山脉扔进 它的湖泊,那么两种讨厌的东西将立即去 除。 高尔顿,2020/9/18,57,一、总量指标,概念:反映总体规模、水平;绝对数

22、分类:时期指标、时点指标 计量:实物单位,价值单位 计算:直接计算、间接推算,2020/9/18,58,总量指标举例,国内生产总值简称GDP,是由本国常住单位所创造的社会最终产品的价值总量,同时又是全社会各常住单位所创造的增加值的总和。 GDP(各部门总产出该部门中间消耗) 各部门的增加值 GDP总消费总投资净出口 GNP GDP付给国外的要素收入 + 来自国外的要素收入 GDP + 来自国外的要素收入净额,2020/9/18,59,二、相对指标,1 相对指标意义 2 相对指标形式 3 相对指标种类 4 相对指标原则,2020/9/18,60,1 相对指标意义,相对指标是将两个性质相同或互有关

23、联的指标数值通过对比求得的商数或比率;用以反映事物内部的结构、比例,事物发展的程度、强度,事物之间的联系、区别。 对比是统计分析的基本方法。通过对比显示事物的相对水平,可以更深入地说明事物发展的程度和差别,弥补总量指标的不足;提供事物之间共同的比较基础,便利对事物的鉴别和分析。所以说,相对指标具有说明和比较两大作用。,2020/9/18,61,2 相对指标形式,相对指标的指标数值大多是相对数,或称无名数。无名数是一种抽象化的数值,分为系数、倍数、成数、百分数、干分数等。 相对指标是由两个指标分别作为分子项与分母项对比而成的,其分母项作为比较的基础,故称为基数。系数和倍数是将基数抽象为l而计算出

24、来的相对数。成数、百分数、干分数是将基数抽象为10、100、1000计算的相对数,其中百分数最常用。 像人口密度、人均国民生产总值这类相对指标,将其分子项与分母项的计量单位同时使用,即以(人平方公里)、(元人)作为数值形式,此称有名数或名数。,2020/9/18,62,3 相对指标种类,计划完成相对指标 结构相对指标 比例相对指标 比较相对指标 动态相对指标 强度相对指标,2020/9/18,63,4 相对指标原则,保持可比性 结合绝对数 运用多指标,2020/9/18,64,三、平均指标,意义 一般水平,坐落位置 种类 静态平均数,动态平均数 作用 说明,比较,判断 计算 数值平均数,位置平

25、均数,2020/9/18,65,1 数值平均数,算术平均数 调和平均数 几何平均数,2020/9/18,66,某车间200名工人日产量资料:,算术平均数计算举例,2020/9/18,67,算术平均数,基本公式: 标志总量/总体总量 计算形式: 简单平均,加权平均 数学性质: 离差、离差平方之和 是非标志: 成数是特殊的平均数,2020/9/18,68,两个平均数是否矛盾,2020/9/18,69,调和平均数,概念:倒数平均数 应用:算术平均数的变形 结论:对逆指标求平均,2020/9/18,70,某局所属的三个企业的资料:,调和平均数计算举例,2020/9/18,71,两个平均数是否矛盾(续)

26、,2020/9/18,72,几何平均数,概念: 对数平均数 性质: 受极端值影响小 结论: 对比率、速度求平均,2020/9/18,73,某企业三个连续作业车间的合格率:,几何平均数计算举例,2020/9/18,74,2 位置平均数,众数 中位数 四分位数,2020/9/18,75,众数,概念:频数最大的标志值 计算:单项数列,组距数列 公式:上限公式,下限公式,2020/9/18,76,众数计算举例,2020/9/18,77,中位数,概念: 序列正中间的标志值 计算: 单项数列,组距数列 公式: 上限公式,下限公式,2020/9/18,78,四分位数,四分位数:数据分为四份 十分位数:数据分

27、为十份 百分位数:数据分为百份,2020/9/18,79,平均指标的关系和原则,关系 数值平均数之间的关系 数值平均数与位置平均数的关系 原则 正视同质性 补充组平均 运用多指标,2020/9/18,80,第五章 变异与均衡指标,一、变异指标 二、偏度峰度 三、均衡指标,当事实改变时,我就改变主意。你呢? 凯恩斯,2020/9/18,81,一、变异指标,概念 反映总体内部差异程度或离散程度 作用 评价平均指标的代表性 测度现象发展过程的均衡性、稳定性 揭示总体分布的离中趋势,2020/9/18,82,全距 四分位差 平均差 方差 标准差 标准差系数,变异指标种类,代表着国内军舰建造最高水平的

28、171“海口”号导弹驱逐舰,2020/9/18,83,标准差计算举例,2020/9/18,84,标准差系数计算举例,甲组日产量(件):60 、65 、70、75、80 乙组日产量(台): 2、 5 、 7、 9、12,2020/9/18,85,二、偏度峰度,1 统计动差 2 偏度指标 3 峰度指标,2020/9/18,86,1 统计动差,动差(又称矩),原是物理学上用以表示力与力臂对重心关系的术语。统计学上标志值与权数对平均数的关系,与此种关系十分相似。因此,统计学借用动差概念,描述次数分布的某些性质或特征。 一般地说,标志值与任意数(A)之差的K次方的算术平均数,称为标志值关于的K阶动差。

29、一阶原点动差即为算术平均数,二阶中心动差即为方差(标准差的平方)。所以,次数分布的集中趋势和离中趋势等特征,皆可由动差描述。,2020/9/18,87,2 偏度指标,笼统地说,偏度是指频数分布的非对称形态及程度。频数分布的非对称形态依算术平均数与众数的大小关系分为两种:一为右偏态分布,简称右偏或正偏;一为左偏态分布,简称左偏或负偏。左、右偏缘于频数分布曲线向左、右方拖长尾巴,正、负偏缘于算术平均数与众数之差为正、负值。 严格地说,偏度是指偏态分布(包括正偏、负偏)的偏斜程度。而偏度的描述或测定,就是运用适当的指标或方法,度量分布偏斜程度的大小,揭示分布的形态特征。,2020/9/18,88,偏

30、度指标计算,皮尔逊指标 以标准差为单位的算术平均数与众数的离差。 三阶中心动差 分布负偏,三阶中心动差为负数;分布正偏,则为正数。为消除三阶中心动差立方单位的影响,也为不同水平数列偏度的直接比较,须将三阶中心动差除以标准差的三次方,以获得数列偏度的相对度量。,2020/9/18,89,频数分布(非)对称状况,Right-Skewed 右偏的,Left-Skewed 左偏的,Symmetric 对称的,均值,=,中位数,=,众数,均值,中位数,众数,众数,中位数,均值,2020/9/18,90,3 峰度指标,峰度是频数分布的一种性质或特征。这一特征是指,某一数列的分布曲线与正态分布曲线相比较,是

31、尖顶,还是平顶,其尖顶或平顶的程度如何。 峰度通常分为三种:尖顶峰度、正态峰度和平顶峰度。当标志值的次数,更密集分布于众数左右,使分布曲线较正态分布曲线更为尖耸的,为尖顶峰度;当标志值的次数,完全符合正态分布的规律,分布曲线与正态分布曲线完全一致,为正态峰度,又称为标准峰度;当标志值的次数,更离散分布于众数左右,使分布曲线较正态分布曲线更为平坦的,为平顶峰度。,2020/9/18,91,峰度指标计算,偶数阶中心动差有一特点,即不论数列的离差为正或负,经偶数次乘方后,皆为正值。由于离差经偶数次乘方后,必加重较大离差的分量,能使它在度量分布的峰度中发挥作用。 可以取数列的偶数阶中心动差,作为分布峰

32、度的测度指标。偶数阶中心动差只能作为峰度的绝对度量,还必须经适当处理,形成一种峰度的相对度量的指标。 可以证明,正态分布的四阶中心动差与其标准差的四次方之比值为3。所以,通常以数列的四阶中心动差与其标准差的四次方之比,作为测度峰度的指标。,2020/9/18,92,尖顶与平顶,峰度指标=3,分布为正态峰度,当峰度指标3时,表示频数分布比正态分布更集中,分布呈尖峰状态,3时表示频数分布比正态分布更分散,分布呈平坦峰。如图所示:,2020/9/18,93,三、均衡指标,1 洛伦茨曲线 2 基尼系数,2020/9/18,94,1 洛伦茨曲线,洛伦茨在研究居民的收入分配状况时,将居民家庭数的累计频率作

33、为横坐标,将居民收入数的累计频率作为纵坐标,绘制出一条表示实际居民收入分配的累计频率曲线。他利用这条实际分配曲线(洛伦茨曲线)与绝对均匀分配的曲线(直线)的对比,描述了实际分配的非均等状态。,2020/9/18,95,2 基尼系数,洛伦茨曲线,直观、形象地描述了收入分配的非均衡状况。基尼系数,则是对这种非均衡状况的具体程度的定量测度。 若以SA表示上图中绝对均匀分配线与洛伦茨曲线围成的面积,以SB表示洛伦茨曲线与绝对不均匀分配线围成的面积,则基尼系数(以G表示)为 G = SA / ( SA+ SB) 0G1。基尼系数越小,说明收入分配越均匀;基尼系数愈越大,说明收入分配越不均匀。,2020/

34、9/18,96,基尼系数计算举例,G = (0.06*0.06-0.18*0.01)+(0.18*0.20-0.38*0.06)+ +(0.90*1.00-1.00*0.81) = 0.2512,2020/9/18,97,基尼系数的应用,基尼系数不仅可以用于收入分配问题的研究,还可用于所有资源配置或分布的均衡程度的分析和评价。例如,以城市数为总体单位数,以人口数为总体标志值,据此计算基尼系数,可以观察城市人口的稠密或稀疏状况,反映城市人口分布的(非)均衡程度。 基尼系数是对收入分配均匀程度的整体评价,它只能对总体的公平程度作出判断,而无法考察各组(层次)因素对总体公平程度的影响。因此,同一资料

35、,不同分组,基尼系数数值的计算结果也不同。,2020/9/18,98,第六章 时间数列,一、时间数列概述 二、时间数列指标 三、时间数列分析 四、时间数列预警,统计是流动的历史。 德国学者,2020/9/18,99,一、时间数列概述,概念:指标数值的时序排列 种类:时期数列,时点数列 相对数列,平均数列 原则:保持可比性,2020/9/18,100,时间数列举例,2020/9/18,101,二、时间数列指标,发展水平指标 发展水平 平均发展水平 增长水平 平均增长水平 发展速度指标 发展速度 平均发展速度 增长速度 平均增长速度,2020/9/18,102,平均发展水平计算举例(1),计算前表

36、资料,平均每年国内生产总值为:,2020/9/18,103,平均发展水平计算举例(2),计算前表资料,平均每年人口数为:,2020/9/18,104,平均发展速度计算方法,累计法(方程式法)计算平均发展速度:,几何平均法(水平法)计算平均发展速度:,2020/9/18,105,运用动态指标的原则,选择可比基期:环比,定基 使用合适方法:水平法,几何法 结合水平速度:绝对数,相对数 (增长1%的绝对值),2020/9/18,106,增长1%的绝对值计算举例,甲企业增长1%绝对值500/1005万元 乙企业增长1%绝对值60/1000.6万元,2020/9/18,107,三、时间数列分析,时间数列

37、因素 Y = f(T,S,C,I) 时间数列因素组合 Y = T+ S + C + I Y = T* S * C * I,2020/9/18,108,时间数列因素,2020/9/18,109,时间数列因素测定,长期趋势测定 季节变动测定 循环波动测定,2020/9/18,110,长期趋势测定,时距扩大法 移动平均法 趋势方程法 选择合适方程 估计方程参数 测算系列数值,2020/9/18,111,移动平均法举例,2020/9/18,112,趋势方程法举例,2020/9/18,113,趋势方程法举例(续1),根据上表得 a 和 b 结果如下,2020/9/18,114,趋势方程法举例(续2),2

38、020/9/18,115,趋势方程的选择,观察散点图 分析数据特点 一次差大体相同,配合直线 二次差大体相同,配合二次曲线 对数的一次差大体相同,配合指数曲线 一次差的环比值大体相同,配合修正指数曲线 对数一次差的环比值大体相同,配合Gompertz曲线 倒数一次差的环比值大体相同,配合Logistic曲线 计算指标:,2020/9/18,116,季节变动测定,同期平均法 计算同月(或同季)的平均数 计算全部数据的总月(总季)平均数 计算季节指数(S),趋势剔除法 计算移动平均趋势值(T) 从序列中剔出趋势值(Y/T) 计算季节指数(S),2020/9/18,117,同期平均法举例,2020/

39、9/18,118,趋势剔除法举例,2020/9/18,119,循环变动测定,剩余法:依据乘法模式思路,从时间数列资料中陆续或一次消除长期趋势和季节变动,得到剩余的循环变动和不规则变动的数列;继而运用移动平均法消除不规则变动,测定出循环变动。 直接法:由每年各月数值直接与上一年同月数值相比,用以消除长期趋势和季节变动;再采用移动平均法,消除比值(年距发展速度)中含有的不规则变动因素,最后得出循环系数。,2020/9/18,120,四、时间数列预警,指标法:构建预警指标体系,正确分析领先指标的预警信号,及时发出经济景气循环的信号,可以促使宏观决策部门采取相应的对策,避免经济发展的过大起落与震荡。

40、指数法:为了达到不同时间数列之间进行综合和比较目的,先计算标准循环偏差(各时间数列以其循环系数减1 除以其相应的标准差),再计算综合指数(同类多个指标标准循环偏差的算术平均数),最后根据综合指数值绘制预警信号图。,2020/9/18,121,第七章 指数,一、指数概述 二、指数计算 三、指数分析 四、指数数列,对于“生活质量”改变的量度,可能要依靠过多的主观判断,以至无法提供能令人接受的 CPI 调整依据。 美国劳工统计局,2020/9/18,122,一、指数概述,概念: 特殊的、一般的相对数 种类: 综合指数,平均数指数 简单指数,加权指数 性质: 综合,相对,平均 作用: 综合测定,因素分

41、析,2020/9/18,123,二、指数计算,1 综合指数 数量指标指数 (拉氏公式) 质量指标指数 (派氏公式) 2 平均数指数 综合指数的变形 独立意义的平均数指数 算术平均数指数 调和平均数指数,2020/9/18,124,1 综合指数,2020/9/18,125,拉氏公式与派氏公式,价格总指数为 派氏公式,销售量总指数为 拉氏公式,结论:与1998年相比,三种商品的销售量平均增长了25.34% ,零售价格平均上涨了8.06%,,2020/9/18,126,综合指数的编制原则,编制数量指标指数,一般选用拉氏公式,即以质量指标作为同度量因素,并且把这个同度量因素固定在基期。 编制质量质量指

42、数,一般选用派氏公式,即以数量指标作为同度量因素,并且把这个同度量因素固定在报告期。,2020/9/18,127,理想指数(费雪公式),由(美)Fisher 提出,能通过他本人提出的对指数公式测验的重要要求,自称为理想公式。,2020/9/18,128,2 平均数指数,2020/9/18,129,综合指数变形,单位成本指数为,产量总指数为,结论:报告期与基期相比,三种产品的单位成本平均提高了14.88%,产量平均提高了4.59%。,2020/9/18,130,零售商品价格指数,2020/9/18,131,算术平均数指数,2020/9/18,132,农产品收购价格指数,2020/9/18,133

43、,调和平均数指数,2020/9/18,134,股票价格指数,我国的上证指数、美国标准普尔指数、香港恒生股票指数等,都是采用综合指数公式编制。其计算公式为:,它是以基期的股票发行量(或流通量)为同度量因素的拉氏综合指数。式中q0代表基期股票发行量。,2020/9/18,135,美国标准普尔指数,样本范围包括500种股票。其中工业股票400种、公用事业股票40种、金融业股票40种、运输业股票20种。选择1941年1943年为基期。 香港恒生指数选择了33种具有代表性的股票(成分股)为指数计算对象。其中金融业4种、公用事业6种、地产业9种、其他行业14种。选择1964年7月31日为基期。 我国的上海

44、证券交易所股票价格指数包括全部上市股票,基期为1990年12月19日。,股价指数的样本范围和基期日期,2020/9/18,136,道琼斯股票指数,著名的道琼斯股票指数就是运用平均的方法来编制的,全称为股票价格平均数。,道琼斯股票价格平均指数 以1928 年10 月1 日为基数,因为这一天收盘时的道琼斯股票价格平均指数恰好约为100美元,所以就将其定为基准日。,2020/9/18,137,道琼斯股票价格平均指数编入股票为65种,包括30种工业股、20种运输股、15种公用事业股。 从1996年5月25开始,还针对我国的股票市场编制了道琼斯中国股票指数。 截至1998年4月1日,沪深两市共有88支股

45、票作为其成分股入选,故称为道琼斯中国88股票指数。,道琼斯股票指数(续),2020/9/18,138,三、指数分析,指数体系 产值指数=产量指数价格指数 原材料消耗总额指数 =产量指数单耗指数单价指数 因素分析 两因素分析 总量指标,平均指标 多因素分析,2020/9/18,139,总量指标两因素分析,从相对数和绝对数两方面对销售额的变动进行因素分析,2020/9/18,140,96.44%=121.11%79.63%,-80 = 475 + (-555),2170-2250=(2725-2250)+(2170-2725),相对数绝对数分析,2020/9/18,141,平均指标两因素分析,报告

46、期技术工人、学徒工人的平均工资比基期都有所提高,为什么总平均工资却下降了?,2020/9/18,142,平均指标两因素分析的指数体系,相对数,绝对数,2020/9/18,143,总平均工资变动分析,利用前页指数体系,分析上例总平均工资变动如下: 97.62%=113.89%85.71% -10=50+(-60) 分析结果表明:从相对数说,所有工人的总平均工资下降了2.38%,是由于各组工人的平均工资上升了13.89%和结构的影响使平均工资下降了14.29%两个因素共同作用的结果。从绝对数说,总平均工资减少10元,是由于各组工人平均工资的上升使平均工资增加50元和结构的影响使平均工资减少了60元

47、两个因素共同作用的结果。,2020/9/18,144,多因素分析,从相对数和绝对数两个方面对该企业费用总额的变动进行因素分析,2020/9/18,145,相对数,绝对数,112.8%=118.5%100.8%94.4%,1022-906=(1074-906)+(1082.5-1074)+(1022-1082.5),11600(元)=16800(元)+850(元)+(-6050元),原材料消耗费用总额变动分析,2020/9/18,146,四、指数数列,概念 对同一指数进行长时期对比研究,就形成了指数数列。指数数列就是把不同时期同一指数的多个数值,按照时期先后顺序加以排列所形成的一种数列。 种类

48、环比指数数列和定基指数数列 可变权数指数数列固定权数指数数列,2020/9/18,147,指数变换,运用不变权数的环比指数与不变权数的定基指数之间的连乘关系,对有关指数作换算、转移、编接和连锁等变换,可以进行现象动态变化的观察和测定、动态比较的计算和分析。具体运用有: 价格换算 基期转移 数列衔接 指数推算,2020/9/18,148,第八章 抽样分布,一、抽样概述 二、抽样设计 三、抽样分布,你不必吃完整头牛,才知道肉是老的。 谚语,2020/9/18,149,一、抽样概述,抽样推断是按照随机原则,从总体中抽取一部分单位进行调查,并依据所获得数据对总体 的某一数量特征做出具有一定可靠程度的估

49、计或推断的一种方法。 总体是所要认识的研究对象的全体,它是具有某种共同性质或特征的许多单位的集合体。总体的单位数通常用N来表示。样本是总体的一部分,它是从总体中随机抽取出来、代表总体的那部分单位的集合体。样本的单位数称为样本容量,通常用n表示,一般来说,样本单位数等于或大于30,称为大样本;小于30,称为小样本。,2020/9/18,150,重复抽样与不重复抽样,从单位数为N的总体中随机抽取一个容量为n的样本,如果每次抽出一个单位,将它的测试、观察结果登记下来后,又重新放回总体,继续参加下一次的抽选,这样的抽样方法称为重复抽样。从单位数为N的总体中随机抽取一个容量为n的样本,如果每次抽选一个单

50、位登记以后不再放回总体,参加下一次的抽选,这样的抽样方法称为不重复抽样。 若从总体N个单位中,随机重复抽取n个单位构成样本,则样本可能数目为Nn个;随机不重复抽取n个单位构成样本,则样本可能数目为N(N-1)(N一2)(Nn+1)个。,2020/9/18,151,总体参数与样本统计量,总体参数是根据总体各个单位的标志值或标志特征计算的、反映总体的某种数量特征的综合指标。由于总体是唯一的,所以总体参数是一确定的数值。对不同性质的总体,需要研究不同的总体参数。通常需要计算总体平均数、总体比率和总体方差。 样本统计量是由样本各单位标志值或标志特征计算的、反映样本的某种数量特征的综合指标。它的数值随着

51、样本的不同而变化,因此它是一个随机变量。和总体参数相对应,样本统计量有样本平均数、样本成数和样本方差等。,2020/9/18,152,二、抽样设计,在进行抽样调查时必须根据所研究总体的特征和调查的目的要求,对抽取样本的程序和工作,作出周密的设计和安排,此称为抽样组织方式或抽样方案的设计。 选择抽样方式或设计抽样方案,必须遵循两项基本原则:随机原则,效果原则。 常用的抽样组织方式有简单随机抽样、分类抽样、等距抽样、整群抽样。,2020/9/18,153,简单随机抽样,简单随机抽样又称纯随机抽样,也即在对总体未作任何处理的情况下,按随机原则直接从总体N个单位中抽取n个单位作为样本,保证总体中每个单

52、位在抽选时都有相等的被抽中机会。 采用简单随机抽样,在进行抽样调查之前应该先确定总体范围,并对总体的每个单位进行编号,然后用抽签的方式或根据“随机数字表”来抽选必要的单位数。,2020/9/18,154,类型抽样,也称分类抽样或分层抽样。它的特点是先对总体各单位按某一主要标志加以分组,然后再分别从各组中按随机原则抽选一定单位构成样本。 每个类型组应该抽取多少样本单位,是进行抽样前必须考虑的问题。通常有两种分配办法:等比例分配,即按照总体单位数在各组之间的比例,分配各组的抽样单位数;不等比例分配。,2020/9/18,155,等距抽样,等距抽样又称机械抽样或系统抽样。它是在抽样之前将总体各单位按

53、照一定的标志顺序排列,根据总体单位数和样本单位数计算出抽选间隔或抽选距离,然后按照这一间隔或距离抽选样本单位。 等距抽样分成按有关标志排队的等距抽样和按无关标志排队的等距抽样。,2020/9/18,156,整群抽样,整群抽样就是将总体各单位按一定的标志或要求,分成若干群,使得每群内均含多个总体单位,然后以群为单位从中随机抽取一部分群,对被抽中的群进行全面调查。这种抽样方式又称成批抽样。整群抽样也常按地理区域划分群,这时又称区域抽样。 进行整群抽样时,可以按随机抽样方式进行抽选,也可以按等距抽样方式抽选。抽样的可靠程度取决于采用的抽样方法及抽选的单位数。,2020/9/18,157,三、抽样分布

54、,1 样本平均数的分布 2 样本比率的分布 3 t分布、 2分布和F分布 4 样本方差的分布,2020/9/18,158,1 样本平均数的分布,某班组5个工人的日工资为34、38、42、46、50元。 = 42 2 = 32 现用重置抽样的方法从5人中随机抽取2个构成样本,共有 52 =25个样本。如右图:,2020/9/18,159,两个结论,2020/9/18,160,抽样方法 平均数 方差 标准差,重复抽样,不重复抽样,样本平均数的平均数与标准差,2020/9/18,161,中心极限定理,从正态总体中抽样得到的样本平均数的分布服从正态分布,从非正态总体中抽样得到的样本平均数的分布呢? 中

55、心极限定理:无论总体为何种分布,只要样本足够大(n30),样本平均数逼近正态分布,即:,2020/9/18,162,正态分布思考题,试想你在通用电器公司的质量控制部门工作。灯泡寿命服从正态分布:= 2000 、= 200 小时。 灯泡寿命为以下值的概率为多少? A. 2000 2400小时 B. 1470 小时以下,2020/9/18,163,Z,Z,= 0,Z,= 1,2.0,题解 P(2000 X 2400),正态分布,.4772,标准正态分布,Z,X,2400,2000,200,2,0,.,X,= 2000,= 200,2400,2020/9/18,164,Z,Z,= 0,Z,= 1,-

56、2.65,题解 P(X 1470),正态分布,.4960,.0040,.5000,标准正态分布,Z,X,1470,2000,200,2,65,.,X,= 2000,= 200,1470,2020/9/18,165,两个样本平均数之差的抽样分布,正态总体,非正态总体 (大样本),2020/9/18,166,抽样方法 平均数 方差 标准差,重复抽样,不重复抽样,2 样本比率的分布,根据中心极限定理,只要样本足够大, 的分布就近似正态分布。(np和nq大于5时),2020/9/18,167,两个样本比率之差的抽样分布,2020/9/18,168,3 t分布、 2分布和F分布,t分布是小样本分布,小样

57、本一般是指n30。t分布适用于当总体标准差未知时用样本标准差代替总体标准差。 当我们对正态随机变量X随机地重复抽取n个数值,将每一个x值变换成标准正态变量,并对这n个新的变量分别取平方再求和之后,就得到一个服从2分布的变量。 F分布定义为两个独立的2分布被各自的自由度除以后的比率这一统计量的分布,F分布与2分布都是非对称分布。,2020/9/18,169,4 样本方差的抽样分布,从一个正态总体中抽样,所得到的样本方差S2,有,当,2020/9/18,170,从两个正态总体中分别独立抽样所得到的两个样本方差之比的抽样分布:,两个样本方差之比的抽样分布,2020/9/18,171,第九章 参数估计,一、参数估计概述 二、总体平均数估计 三、总体比率估计 四、总体方差估计 五、样本容量确定,数学定律不能百分之百确实地用在现实生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论