高级计量经济学_第1页
高级计量经济学_第2页
高级计量经济学_第3页
高级计量经济学_第4页
高级计量经济学_第5页
已阅读5页,还剩190页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高级计量经济学I

整理课件高计的重要性高级计量经济学是现代经济学的三门核心课程之一。三高:高级计量经济学、高级宏观经济学、高级微观经济学整理课件其他参考书:达摩达尔.N.故扎拉蒂〔DamodarN.Gujarati)?计量经济学根底?中国人民大学出版社〔第四版〕计量经济学导论:现代观点,伍德里奇,2003,中国人民大学出版社.李子奈、潘文卿编著?计量经济学?高等教育出版社2021-11李子奈、叶阿忠?高级计量经济学?清华大学出版社格林〔WilliamH.Greene〕?计量经济学分析?中国人民大学出版社〔第六版〕2021-09高铁梅?计量经济分析方法与建模:EViews应用及实例?清华大学出版社〔第二版〕2021-05整理课件教学大纲安排课程特点:

应用型硕士生博士生

注重计量理论和思想

培养学生统计软件分析解决实际问题

指导学生写实证论文整理课件第一章绪论计量经济学概述统计根本理论矩阵代数根本知识第一节计量经济学概述计量经济学释义计量经济学的功能计算机在计量经济分析中的应用整理课件1.1.1计量经济学释义一、计量经济学开展历史考察我们从开展的角度看计量经济学,它既是一部计量经济理论开展史,又是一部应用计量经济开展史。因为计量经济学的开展时刻离不开应用,它是在应用中诞生,在应用中成熟、独立,又在应用中不断地扩充自身的方法、内容和领域,从而改变了原有单一学科开展的思路,形成了现代计量经济学的分析思路和方法,充分的表达出了计量经济学旺盛的生命力。——应用是生命力、应用是王道!整理课件计量经济学开展历程计量经济学的开展可分为四个时期:〔1〕二十世纪20年代中至二十世纪40年代末,为经典计量经济学的产生与形成阶段;〔2〕二十世纪50年代初至二十世纪70年代中,为经典计量经济学的开展阶段;〔3〕二十世纪70年代末至二十世纪90年代中,为现代计量经济学形成阶段;〔4〕二十世纪90年代末至现在,为现代计量经济学的开展阶段。整理课件第一阶段经典计量经济学的产生与形成1、二十世纪20年代中至二十世纪40年代末,为经典计量经济学的产生与形成阶段。在二十世纪之前,面对错综复杂的经济现象,经济工作者主要是使用头脑直接对材料进行归纳、综合和推理。十九世纪欧洲主要国家先后进入资本主义社会。工业化大生产的出现,经济活动规模的不断扩大,需要人们对经济问题做出更精确、深入的分析、解释与判断。这就为计量经济学的诞生形成了社会根底。整理课件到二十世纪初,数学、统计学理论日趋完善为计量经济学的出现奠定了理论根底。十七世纪Newton-Leibniz提出微积分,十九世纪初〔1809年〕德国数学家Gauss提出最小二乘法,1821年提出正态分布理论。十九世纪末英国统计学家Galton提出“回归〞概念。二十世纪20年代FisherR.〔英1890-1962〕和NeymanJ.D.〔波兰裔美国人〕分别提出抽样分布和假设检验理论。至此,数理统计的理论框架根本形成。这时,人们自然想到要用这些知识解释、分析、研究经济问题,从而诞生了计量经济学。整理课件“计量经济学〞一词首先由挪威经济学家Frisch仿照生物计量学〔biometrics〕一词于1926年提出。1930年由Frisch,Tinbergen和Fisher等人发起在美国成立了国际计量经济学会。1933年1月开始出版“计量经济学〞〔Econometrica〕杂志。目前它仍是计量经济学界最权威的杂志。二十世纪30年代,计量经济学研究对象主要是个别生产者、消费者、家庭、厂商等。根本上属于微观分析范畴。第二次世界大战后,计算机的开展与应用给计量经济学的研究起了巨大推动作用。从二十世纪40年代起,计量经济学研究从微观向局部地区扩大,以至整个社会的宏观经济体系,处理总体形态的数据,如国民消费、国民收入、投资、失业问题等。但模型根本上属于单一方程形式。整理课件第二阶段经典计量经济学的开展阶段2、二十世纪50年代初至二十世纪70年代中,为经典计量经济学的开展阶段。1950年以Koopman发表论文“动态经济模型的统计推断〞和Koopman-Hood发表论文“线性联立经济关系的估计〞为标志计量经济学理论进入联立方程模型时代。计量经济学研究经历了从简单到复杂,从单一方程到联立方程的变化过程。进入二十世纪50年代人们开始用联立方程模型描述一个国家整体的宏观经济活动。比较著名的是Klein于1950年构建的的美国经济波动模型〔1921~1941〕和1955年构建的美国宏观经济模型〔1928~1950〕。联立方程模型的应用是经济计量学开展的一个重要程碑。整理课件进入二十世纪70年代西方国家致力于更大规模的宏观模型研究。从着眼于国内开展到着眼于国际的大型经济计量模型。研究国际经济波动的影响,国际经济开展战略可能引起的各种后果,以及制定评价长期的经济政策。二十世纪70年代是联立方程模型开展最辉煌的时代。最著名的联立方程模型是“连接方案〞〔LinkProject〕。截止1987年,已包括78个国家2万个方程。这一时期最有代表性的学者是L.Klein教授。他于1980年获诺贝尔经济学奖。整理课件第三阶段现代计量经济学形成阶段3、二十世纪70年代末至二十世纪90年代中期,为现代计量经济学形成阶段。因为二十世纪70年代以前的建模技术都是以“经济时间序列平稳〞这一前提设计的,而战后多数国家的宏观经济变量均呈非平稳特征,所以在利用联立方程模型对非平稳经济变量进行预测时常常失败。从二十世纪70年代开始,宏观经济变量的非平稳性问题以及虚假回归问题越来越引起人们的注意。因为这些问题的存在会直接影响经济计量模型参数估计的准确性。整理课件Granger-Newbold于1974年首先提出虚假回归问题,引起了计量经济学界的注意。Box-Jenkins1976年出版?时间序列分析,预测与控制?一书。时间序列模型有别于回归模型,是一种全新的建模方法,它是依靠变量本身的外推机制建立模型。由于时间序列模型妥善地解决了变量的非平稳性问题,从而为在经济领域应用时间序列模型提供了理论依据,也为现代计量经济学方法的研究奠定了理论根底。现代计量经济学方法是以概率结构和参数都未知或者不稳定的问题为研究对象。整理课件此时,计量经济理论和应用研究面临一些亟待解决的问题,即如何检验经济变量的非平稳性;如何把时间序列模型引入经济计量分析领域;如何进一步修改传统的经济计量模型。Dickey-Fuller1979年首先提出检验时间序列非平稳性〔单位根〕的DF检验法,之后又提出ADF检验法。Phillips-Perron1988年提出Z检验法。这是一种非参数检验方法。。。。非平稳性检验时间序列的根本问题,但又没有完全解决的问题整理课件Sargan1964年提出误差修正模型概念。当初是用于研究商品库存量问题。Hendry-Anderson(1977)和Davidson(1978)的论文进一步完善了这种模型,并尝试用这种模型解决非平稳变量的建模问题。1980年Sims提出向量自回归模型〔VAR〕。这是一种用一组内生变量作动态结构估计的联立模型。这种模型的特点是不以经济理论为根底,然而预测能力很强。以上成果为协整理论的提出奠定根底。整理课件现代计量经济学开展的标志性成果之一,是1987年Engle-Granger发表论文“协整与误差修正,描述、估计与检验〞。该论文正式提出协整概念,从而把计量经济学理论的研究又推向一个新阶段。Granger定理证明假设干个一阶非平稳变量间假设存在协整关系,那么这些变量一定存在误差修正模型表达式。反之亦成立。1988-1992年Johansen〔丹麦〕连续发表了四篇关于向量自回归模型中检验协整向量,并建立向量误差修正模型〔VEC〕的文章,进一步丰富了协整理论。整理课件协整理论之所以引起经济计量学界的广泛兴趣与极大关注是因为协整理论为当代经济学的开展提供了一种理论结合实际的强有力工具,也标志着现代计量经济分析方法的真正形成。另外,对经典计量经济学方法论反思的同时,推动了非参数分析方法的产生和开展,拓宽了现代计量经济学理论研究和应用领域。在这方面的研究,促使人们开始考虑脱离预先设定参数模型的计量经济分析,着眼于非参数分析方法和半参数分析方法的研究。实际上,非参数分析和非参数统计有很大的关系,其实质是对概率分布比较弱的设定,非参数分析的关键主要是一些非参数的估计方法。整理课件第四阶段现代计量经济学开展阶段 4、二十世纪90年代末至现在,为现代计量经济学的开展阶段。最近十多年是经济计量学快速开展的十多年。不仅在非平稳经济时间序列的研究取得了长足进展,而且在对特殊研究对象和特殊应用问题等方面,现代计量经济学研究也取得了显著的成绩。在计量经济分析中利用的数据类型有了本质性的变化,从截面数据、时间序列数据开展到了面板数据。只用时间序列数据或截面数据进行计量经济分析,其数据都是一维的信息载体,信息的容量比较有限。而利用面板数据可以增加模型的自由度,降低解释变量之间的多重共线性程度,从而可能获得更精确的参数估计值。整理课件此外,面板数据可以进行更复杂的行为假设,并且能控制缺失或不可观测变量的影响,也为计量经济分析方法的深入研究开拓了广阔的空间。例如,在区域科学模型的计量分析中,处理空间引起的特殊性的一系列方法,就涉及到近年来计量经济学研究的热点之一的空间计量经济分析方法。这里我们可以充分的体会到,理论的进展、数据的可用和计算机本身的开展给现代计量经济的开展注入了新的活力。随着现代信息技术和互联网的开展,使得截面数据的统计调查有了更大的可能和降低了本钱,并促之了微观计量、离散选择和受限变量等问题的研究。此外,行为经济学的开展也使得微观计量分析受到了更大的重视。整理课件2000年诺贝尔经济学奖得主Heckman和McFadden,就是在微观计量经济分析方面研究的开创和奠基者。从应用的角度看,根据不同的领域现代计量经济分析方法,表达出了不同的特点,针对不同领域的专门计量经济学,如宏观计量经济分析和金融计量经济分析等,都有了很大的开展,这与计算机技术的迅猛开展和计量软件的广泛应用有着密切的关系。同时,也充分表达出了科学的融合,将会进一步促进现代计量经济学的开展。整理课件二、计量经济学的性质我们通过对计量经济学的开展历史的考察,对计量经济学的性质有了更明朗化的认识。随着时代的变迁,社会的开展,对计量经济学的概念又有了更深层次的理解。计量经济学学会的创始人Fisher〔1933〕在?计量经济学?期刊的创刊号中指出:“计量经济学学会的目标是促进各界实现对经济问题定性与定量研究和实证与定量研究的统一,促使计量经济学能像自然科学那样,使用严谨的思考方式从事研究。但是,经济学的定量研究方法多种多样,每种方法单独使用都有缺陷,需要与计量经济学相结合。整理课件1954年Samuelson和Koopmans著名等经济学家在计量经济学家评审委员会的报告中认为:“计量经济学可定义为,根据理论和观测的事实,运用合理的推理方法使之联系起来同时推导,对实际经济现象进行数量分析〞。?美国现代经济词典?认为:“计量经济学是用数学语言来表达经济理论,以便通过统计方法来论述这些理论的一门经济学分支〞。整理课件尽管这些经济学家对计量经济学概念表述各不相同,但可以看出,计量经济学不是对经济学的一般量度,它与经济理论、统计学和数学都有密切的关系。实际上,计量经济学的概念可以概况为:“计量经济学是以经济理论和经济数据为根底,运用数学方法,利用统计思想,对社会经济现象进行数量关系和规律性分析,以及对经济理论进行验证的一门经济学科〞。这里我们应该注意到,计量经济学所研究的主体是经济现象及其开展变化的规律,从本质上讲,它是一门经济学科。在计量经济分析过程中时刻表达着利用统计的思维来寻找社会经济现象的开展规律,这样计量经济学当然会应用大量的数学方法,但数学在这里只是工具,而不是研究的主体。整理课件计量经济学的研究目的是要把实际经验的内容纳入经济理论,确定表现各种经济关系的经济参数,从而验证经济理论,预测经济开展趋势,为制订经济政策提供科学的依据。计量经济学不仅要寻求经济计量分析的方法,而且要对实际经济问题加以研究,以到达解决研究目的的理论和方法。从理论方面〔理论计量〕,计量经济学研究的是如何建立适宜的方法去测定由计量经济模型所确定的经济关系;从应用方面〔应用计量〕,计量经济学是运用理论计量经济学提供的工具,研究经济学中某些特定领域的经济规律问题。课程目的:学会利用计量方法研究实际经济问题,发现经济规律。整理课件1.1.2计量经济学的功能目前,计量经济学不仅自身得到了迅速的开展,而且也在现代经济分析中起着重要的作用,发挥着计量经济学应有的功能。宏观经济学、微观经济学和计量经济学一起构成了现代经济学教学的三大根本课程,从现代经济学研究的一般思路中,可以充分的表达出计量经济学在现代经济学中的地位。整理课件第一,收集数据和总结经验特征事实。经验特征事实一般从观察到的经济数据中提炼出来。比方,微观经济学中著名的恩格尔曲线就是一个经验特征事实,它刻画家庭生活用品支出占总收入的比例随着家庭总收入的上升而递减;宏观经济学中一个著名的经验特征事实是菲利普斯曲线,它描述一个经济的失业率和通货膨胀率之间的负相关关系。经验特征事实是经济学研究的出发点,比方,时间序列计量经济学中的单位根和协整理论,就是基于Nelson和Plossor〔1982〕在实证研究中发现大多数宏观经济时间序列都是单位根过程这一经验特征事实而开展起来的。整理课件第二,建立经济理论或模型。找到经验特征事实以后,建立经济理论或模型,以解释这些经验特征事实。这一阶段的关键是建立适宜的经济数学模型。第三,实证检验。这一步的工作需要把经济理论或模型转化为可用数据检验的计量经济模型。经济理论或模型通常只指出经济变量之间的因果关系和数量关系,没有给出确切的函数形式。从经济数学模型到计量经济模型的转化过程中,需要对函数形式作出假设,然后利用观测到的数据,估计未知参数值,并进一步验证计量经济模型的设定是否正确。整理课件第四,模型应用。计量经济模型通过实证检验后,可用来检验经济理论或经济假说的正确性,预测未来经济的变动趋势以及提供政策建议。可以看出,对经济理论进行数学建模和对经济现象进行实证分析已成为现代经济学的两个根本分析方法。事实上,现代经济学可以看作是,具有比较严密的理论根底和分析方法表达,由适合不同研究对象、研究目的的大量经济理论和经济计量模型构成的庞大的学科体系。整理课件1.1.3计算机在计量经济分析中的应用从计量经济学产生和开展的历史我们可以看到,在计量经济分析的过程中,对计量经济学的兴盛开展起决定性作用的工具就是高速的计算工具——计算机。没有计算机的开展就没有现代计量经济学。首先,应在计量经济学教学中大力加强通用计量应用软件的教学。在国外比较流行的统计应用软件如SAS、SPSS、Eviews、Gauss、Mathematica、S-Plus、R、stata、Minitab、Excel等,这些软件在计量经济分析方面各有特色,可以根据实际有重点的选择应用软件,例如,SPSS具有非常强的统计分析功能,适合于为计量分析做事前处理,比方多元变量降维,即数据收集、整合、假设检验等等工作,做回归分析SPSS的能力不是十分全面和方便;整理课件Excel是常用的数据收集软件,它普及率高,一般人都用过,使用方便,数据收集只需要添写表格即可,有些数据下载就是用Excel文档保存的。至于数据分析与回归,Excel只能做比较简单的,稍微复杂一点就要自己编写程序;EViews是专门的计量经济学软件,专用于回归分析,如广义最小二乘法、间接最小二乘法、两阶段和三阶段最小二乘法、面板数据回归分析、时间序列模型调整等等操作;整理课件Gauss数学和统计系统是一个易于使用的基于强有力的Gauss矩阵语言的数据分析系统,其操作简单、快速且具弹性,包括广泛的转换、统计、数学及矩阵函数,它是计量经济学编程计算的非常有效和强大的工具。因此,加强计量经济学应用软件的教学十分重要。整理课件SPLUS是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化〞以争取顾客。但仍然以编程方便为顾客所青睐。R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,很方便。还有不断参加的各个方向统计学家编写的统计软件包。同时从网上可以不断更新和增加有关的软件包和程序。这是开展最快的软件,受到世界上统计师生的欢送。是用户量增加最快的统计软件。对于一般非统计工作者来说,主要问题是它没有“傻瓜化〞。整理课件StataStata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。Stata是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上,Stata的ado文件(高级统计局部)都是用Stata自己的语言编写的整理课件应注重于应用,根据经济管理类专业的课程特点,处理好计量经济分析应用软件课程教学与计量经济学方法课程教学间的关系,尽可能把它们有机地结合起来。这样不仅能突出有关计量经济分析方法课程的应用特色,更好地理解其原理、根本思想及适用条件,而且能使学生通过课程的反复学习,熟练掌握计量经济分析软件的使用。在计量经济学的教学中,加强计算机的应用教学就显得尤为重要。整理课件针对实际问题,根据经济理论,建立计量经济模型后,计算机计量经济学分析的根本过程为:1、根据确立的指标体系,组织数据。数据的组织实际上就是数据库的建立。数据组织有两步。第一步是编码,即用数字代表分类数据〔有时也可以是区间数据或比率数据〕。第二步是给变量赋值,即设置变量并根据研究结果给予其数字代码。

整理课件

2、根据计量经济分析的需要,录入数据。数据的录入就是将编码数据输入计算机、即输入已经建立的数据库结构,形成数据库。数据录入关键的是保证录入的正确性。录入错误主要有认读错误和按键错误。在数据录入后还应进行检验,检验可采取计算机核对和人工核对两种方法。

3、根据计量经济学理论,分析数据。首先根据研究目的和需要确定计量经济分析方法,然后确定与选定的计量经济分析方法相应的运行程序,既可以用计算机存储的分析程序,也可以用其他的数据分析软件包中的程序。

4、根据实际分析的需要,输出分析结果。经过计量经济分析,计算结果可用计算机打印出来,输出的形式有列表、图形等。整理课件参考文献洪永淼.计量经济学的地位、作用和局限.经济研究,2007(5):277-301成九雁、秦建华.计量经济学在中国的开展轨迹.经济研究,2005〔4〕:116-122洪永淼、汪寿阳.论中国计量经济学教学与研究.workingpaper.整理课件第二节统计根本理论随机变量及其分布统计推断理论随机过程及其平稳性

整理课件1.2.1随机变量及其分布一、随机变量随机现象中,有很大一局部问题与数值发生关系,例如在产品检验问题中,我们关心的是抽样中出现的废品数;在车间供电问题中我们关心的是某时刻正在工作的车床数;在问题中关心的是某段时间中的话务量,它与呼叫的次昂数及每次呼叫占用交换设备的时间长短有关。此外如测量时的误差,气体分子运动的速度,信号接收机所收到的信号〔用电压表示或数字表示〕的大小,也都与数值有关。为了更好地描述这一问题,最直接明了的方法就是用数量来与结果对应。整理课件例如,买彩票时,用0表示“未中奖〞,用1表示“中一等奖〞,2表示“中二等奖〞,3表示“中三等奖〞。将每个结果对应于一个数,也就等价于在样本空间上定义了一个“函数〞,对于试验的每一个结果,都可以用一个实数来表示。这个量就称为随机变量〔randomvariable〕。我们对随机变量所关心的,不但要知道它取什么数值,而且要知道它取这些数值的概率。这样,了解随机现象的规律就变成了解随机变量的所有可能取值及随机变量取值的概率。而这两个特征就可以通过随机变量分布来表现出来。整理课件二、离散型随机变量分布从随机变量的可能出现的结果来看,随机变量至少有两种不同的类型。一种是随机变量所可能取的值为有限个或至多可列个,能够一一列举出来,这种类型的随机变量称为离散型随机变量。在日常生活中经常碰到离散型随机变量,例如废品数、呼叫数、人口调查等等。其随机变量分布就称为离散型随机变量分布。离散因变量模型整理课件如果随机变量X的取值可以一一列出,记为 ,而相对于所取的概率为,即 ,{}称为随机变量X的概率分布,它应满足下面关系:

〔1.1〕〔1.2〕整理课件那么当和时,这两组值就完全描述了随机变量的规律,此时把如下的表示方法称为该随机变量的分布列:

〔1.3〕 对于集合{}中任何一个子集,事件“在中取值〞即“〞的概率为〔1.4〕整理课件三、连续型随机变量的概率密度与离散型随机变量有所不同,一些随机变量X的取值不可列。例如测量误差、分子运动速度、候车时的等待时间、降水量、风速、洪峰值等等皆是。考虑市场上对于某种商品的需求量就不可能具体地一一列出,只能列出大概的范围,如[2000,5000]。这时用来描述随机变量还是样本点的函数:严格写应是,其中。但是这个随机变量可能取某个区间或的一切取值。整理课件定义1.1对于随机变量,如果存在一个非负可积函数,,使对于任意两个实数a,b(a<b),都有,那么称X为连续型随机变量,就称为随机变量X的密度函数,满足性质: (1)〔1.5〕 (2)〔1.6〕整理课件

四、一般场合的分布函数但是,除了前面得到的离散型和连续型的随机变量外,还存在其他类型的随机变量,就不能用离散型随机变量的分布列或者连续型随机变量的密度函数来描述,于是引入分布函数的概念。这是概率论中重要的研究工具,可以用于描述包括离散型和连续型在内的一切类型随机变量。定义1.2设X是一个随机变量,是它的分布密度函数,那么称函数〔1.7〕 为随机变量X的分布函数。整理课件根据定义,具有如下性质:〔1〕〔1.8〕针对连续型的随机变量有〔2〕,〔3〕是关于X的单调非减函数〔4〕〔1.9〕

〔5〕左连续性:〔6〕〔1.10〕整理课件

五、多元随机变量分布在许多经济或其它学科的问题中,仅仅考虑一个变量是不够的。例如,一项投资组合就至少包含两个投资变量。下面提出多元随机变量的一些根本概念。定义1.3设是n维随机变量向量,是n维实空间上的点,那么事件的概率为〔1.11〕称为随机变量的联合分布函数。从随机变量的联合分布函数可以引出随机变量边际分布的概念。整理课件定义1.4设的联合分布函数为,令

〔1.12〕称为的边际分布。整理课件定义1.5设X为随机变量,事件B满足,那么称〔1.13〕为在事件B发生的条件下X的条件分布函数,简称为条件分布。

整理课件这里应该说明的是,如果上述条件分布函数中的事件B为另一个随机变量Y取某个特定值y,那么上述条件分布函数为这就是一个随机变量以另一个随机变量取特定值为条件的条件概率。整理课件定义1.6如果的联合分布函数等于所有一维边际分布函数的乘积,即

〔1.14〕 那么称是相互独立的。整理课件六、随机变量的数字特征一个随机变量的分布包括了关于这个随机变量的全部信息,是对此随机变量最完整的刻画。但它并没有使我们对随机变量有一种概括性的认识。在很多情况下,为了突出随机变量在某个侧面的重点,我们常用由这个随机变量的分布所决定的一些常数对此随机变量给出简单明了的特征刻画,这些常数被称为随机变量的“数字特征〞。随机变量的数字特征是指能集中反映随机变量概率分布根本特点的数字。整理课件〔一〕数学期望定义1.7设离散型随机变量X的分布为假设级数绝对收敛,那么将其称为X的数学期望,简称为期望或均值,记为。整理课件定义1.8设连续型随机变量X的密度函为,当积分绝对收敛时,就称它为X的数学期望〔或均值〕,记作,即

〔1.15〕整理课件根据定义,数学期望的根本性质如下:设如下各变量的数学期望存在,c为常数,可以得到关于数学期望的性质:〔1〕〔1.16〕〔2〕〔1.17〕〔3〕〔1.18〕〔4〕假设相互独立,那么〔1.19〕整理课件〔二〕方差方差这个概念描述的是随机变量的取值相对于它的期望的平均偏离程度。定义1.9设随机变量X的数学期望为,称为X的方差,记作,〔1.20〕 称为X的标准差〔或标准偏差〕。整理课件根据期望的性质及方差的概念,可以得到方差的几个根本性质: (1),其中c为常数〔1.21〕 (2)〔1.22〕 (3)〔1.23〕 (4)〔1.24〕 (5)n个独立随机变量平均值的方差等于各个变量 方差平均值的,即〔1.25〕整理课件〔三〕条件期望与条件方差条件期望和条件方差的概念在计量经济分析的参数估计与预测等方面都很有用,是利用已有的信息提高预测准确性的重要工具。定义1.10设是随机变量X对事件B的条件分布函数,那么当下面积分绝对收敛时,称〔1.26〕 为X对事件B的条件期望。定义1.11设X和Y,以X为条件的Y的条件方差为〔1.27〕整理课件根据条件期望和条件方差的概念,可以得到一些根本性质: (1)对任意的随机函数,有〔1.28〕 (2)对随机函数和,有〔1.29〕 (3)对任意的随机变量X和Y,有〔1.30〕 (4)对任意的随机变量X,Y和Z,有〔1.31〕整理课件 (5)如果随机变量X和Y是独立的,那么〔1.32〕 反之那么不然。 (6)如果随机变量X和Y是独立的,那么〔1.33〕整理课件〔四〕高阶矩定义1.12设X为随机变量,当,如果和的期望存在,那么称〔1.34〕为阶的原点矩;那么称〔1.35〕为阶的中心矩。

整理课件这里我们应该注意到,可以用高阶矩构造一些有用的特定统计量。对于随机变量X,定义

为X的偏度;定义为X的峰度。整理课件〔五〕协方差与相关系数两个或多个随机变量的相关性是概率论和数理统计的重要概念,对随机变量相关性的分析,也就是相关分析,在经济问题中有重要的应用。 1、协方差定义1.13设两个随机变量X和Y的期望和方差都存 在,那么称

〔1.36〕 为X和Y的协方差。整理课件下面是协方差的一些性质〔假设下面各随机变量的协方差存在,且为常数〕 (1)与X,Y的顺序无关,即 (2)假设X和Y独立,那么 (3) (4) (5) (6)整理课件2、相关系数定义1.14设随机变量X和Y的方差都存在,且都不为0,那么称〔1.37〕 为X和Y的相关系数。 同样我们可以列出相关系数的一些性质: (1) (2)的充要条件是 为常数。整理课件3、偏相关系数设有、和是三个相互之间都有关系的随机变量,包含和的影响,包含和的影响,包含和的影响。在这种情况下,和的相关系数反映的其实不是和的之间的真正关系,因为和的水平受到的影响。衡量和的之间的真正关系的方法是设法先把的影响从和中去掉后,再计算两个“净值〞的相关系数。这样得到的相关系数我们称为偏相关系数。偏相关系数是反映两个随机变量之间实际关系的更好指标,在描述计量经济模型方面有重要的作用。整理课件计算偏相关系数要用到第二章的回归分析。首先把和分别对进行回归,然后用各自的回归残差计算相关系数,因为这种回归残差就是和分别去掉影响以后的净值,用它计算相关系数确实符合相关系数的定义。如果用表示和相对于偏相关系数,和分别表示上述两个回归的残差序列,那么〔1.38〕整理课件七、常见的几种分布随机变量的概率分布也有很多类型,但常见的概率分布是有限的,最常见的连续型分布有正态分布、分布、分布和分布。熟悉这些分布对于判别随机变量的分布类型,利用概率分布进行检验都是非常重要的。〔一〕正态分布正态分布是连续型分布中十分重要的一个,它在概率论与数理统计乃至计量经济分析与应用中,都占有特别重要的地位。下面我们就来看看它的定义。整理课件定义1.15假设随机变量的密度函数为:

〔1.39〕其中,与均为常数,称随机变量X服从参数为,的正态分布(normaldistribution),简记为。整理课件如果随机变量,其期望和方差分别为和。正态分布的图形(如图1.1)具有如下特点。

图1.1不同方差的正态分布

整理课件〔1〕正态曲线的图形是关于的对称钟形曲线,且峰值在处。〔2〕正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就惟一确定,不同参数取值的正态分布构成一个完整的正态分布族。〔3〕正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,标准差相同而均值不同的正态曲线在坐标轴上表达为水平位置。整理课件〔4〕正态分布的标准差为大于零的实数,它决定正态曲线的“陡峭〞或“扁平〞程度。越大,正态曲线越扁平;越小,正态曲线越陡峭。〔5〕当X的取值向横轴左右两个无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相交。〔6〕与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。整理课件特别地,当时,分布称为标准正态分布,记为,相应的密度函数和分布函数分别记为和。,〔1.40〕

,〔1.41〕服从标准正态分布的随机变量在某一区间上取值的概率可以通过书后所附的标准正态分布概率表查得。整理课件有了标准正态分布后,就可以将任意一个服从一般正态分布的随机变量转化成标准正态分布,转换公式为〔1.42〕 Z是一个标准正态分布的随机变量, 即Z~。整理课件一般地,对于服从标准正态分布的随机变量Z,其变量在任何一个区间上的概率可以表示为〔1.43〕〔1.44〕 对于负的z,可以由下式得到:〔1.45〕整理课件同样,对于服从一般正态分布的随机变量X,取值在某一个区间上的概率都可以通过标准正态分布求得。

〔1.46〕

〔1.47〕整理课件〔二〕-分布定义1.16设是相互独立且服从标准 正态分布的随机变量,那么称随机变量 所服从的分布为自由度为n的-分布,并记为。整理课件〔三〕t-分布定义1.17设随机变量X服从标准正态分布,随机变量Y服从自由度为n的-分布且它们相互独立,那么随机变量所服从的分 布称为自由度为n的t-分布,并记为。

可以证明,当自由度n充分大时,它的分布密度曲线与正态分布密度曲线很近似。一般当n大于或等于30时,t-分布与标准正态分布的差异已非常小,可用标准正态分布来代替它。整理课件〔四〕F-分布定义1.18设随机变量X和Y分别服从自由度是m和n的-分布且相互独立,那么称随机变量 所服从的分布为自由度为〔m,n〕的F-分布,并记为。整理课件八、随机变量的极限理论在实际中,随机现象往往是大量随机因素综合反映的结果,计量经济分析方法中经常涉及到大量随机变量之和等复杂的随机现象。对于研究大量随机变量之和的概率分布,属于概率分布极限理论的内容,包括一系列大数定律和中心极限定理。〔一〕随机变量的收敛性随机变量序列的收敛性与一般变量不同,是概率、概率分布或分布特征的收敛等等。不同的收敛性定义将导致不同的极限定理。这里我们介绍几个有关随机变量收敛性的定义。整理课件定义1.19〔分布函数弱收敛〕对于分布函数序列,如果存在函数,使得〔1.48〕在的每个连续点上都成立,那么称弱收敛于。整理课件定义1.20〔依分布收敛〕设随机变量序列的分布函数序列,随机变量X的分布函数为,如果弱收敛于,那么称依分布收敛于X。定义1.21〔依概率收敛〕对随机变量序列和随机变量X,如果〔1.49〕 对任意的成立,那么称依概率收敛于X。 有时也称的概率极限为X,并较为。整理课件〔二〕大数定律(1)贝努里〔Bernoulli〕大数定律 设是n次独立重复试验中事件A发生的次数,p是每次试验中A发生的概率,那么对于任意的 ,有(1.50)整理课件(2)切比雪夫〔Chebyshev〕大数定律 设随机变量序列X1,X2,…,Xn,…相互独 立(即任意给定n>1,X1,X2,…,Xn相互独 立),且具有相同的数学期望和方差

那么对于任意的,有

(1.51)整理课件可以看出贝努里大数定律其实是切比雪夫大数定律的特例,从切比雪夫大数定律来看,我们可以说,大量的独立随机因素对总体的影响当进行平均后在总体平均数那里稳定下来,它反映了随机因素综合作用的结果,这就是大数定律的意义。整理课件〔三〕中心极限定理设随机变量X1,X2,…,Xn,…相互独立,且服从同一分布,该分布存在有限的期望和方差,〔i=1,2,…)。 令,那么(1.52) 也就是说,当n趋于无穷大时,Yn的分布趋向于标准正态分布N〔0,1〕。整理课件关于中心极限定理的两个推论: (1)均值的分布近似于正态

分布。 (2)n项和

的分布近似于正态分

布。

从上述定理可以得出结论:对于独立同分布的随机变量X1,X2,…,Xn,无论其服从何种分布,只要它的期望与方差存在,当n充分大时,平均数就近似服从正态分布。整理课件1.2.2统计推断理论统计学的重要内容之一就是统计推断,它包括参数估计和假设检验等等。在计量经济学理论中,回归分析就是根据样本推断总体的情况,就是一种统计推断。一、统计量与抽样分布抽样的目的是为了利用样本估计或推断总体的各种性质。那么估计量就应该是样本的函数而且这个函数本身不能含有总体的未知参数。整理课件定义1.22设是来自总体X的样本,是一个不含总体分布的未知参数的 函数,那么随机变量就称为〔样本〕统计量,其概率分布就称为抽样分布。整理课件在计量经济分析中,常用的统计量有: (1)k阶样本原点矩 特别地,当时,k阶样本原点矩就是样本均值〔平均数〕

(1.53)整理课件(2)样本方差与标准差

(1.54)(3)k阶样本中心矩

(1.55)整理课件我们知道抽样分布就是统计量的概率分布,有一个我们已经知道的结果是假设总体,那么样本均值。在假设总体服从正态分布的条件下,我们还有更多的重要统计量的抽样分布的结果。整理课件设总体,是来自X的简单随机样本,那么 (1)和相互独立; (2)或; (3)〔自由度为的分布〕; (4)〔自由度为的t分布〕。整理课件这里我们应该主要到,这些结果在统计推断中有重要应用,唯一遗憾的是这些结论要求总体服从正态分布。然而,幸运的是,当这个条件不满足时,只要样本量充分大,同时符合中心极限定理的要求,那么根据中心极限定理我们仍有或近似成立。整理课件二、参数的点估计(pointestimation)点估计就是设总体随机变量的分布函数形式为,但它的一个和多个参数未知,假设从总体中抽取一组样本。用该组数据来估计总体的参数,称参数的点估计。点估计的方法很多,在计量经济分析中常用的方法有矩估计、最大似然法、最小二乘法等,我们这里主要介绍这些方法的根本原理。整理课件〔一〕矩估计法(ME)对总体参数进行估计,最容易想到的方法就是矩估计法,它是用样本的矩去估计总体的矩,从而获得有关参数的估计量。在统计学中,矩是指以期望为根底而定义的数字特征。例如数学期望、方差、协方差等。矩可以分为原点矩和中心矩两种。设X为随机变量,对任意正整数k,称为随机变量X的k阶原点矩,记为(1.56)整理课件当时可见一阶原点矩为随机变量X的数学期望。我们把〔1.57〕称为以为中心的k阶中心矩。显然,当时,可见二阶中心矩为随机变量X的方差。整理课件

一般情形,如果随机变量X包含k个未知参数

,其分布函数记为。假设X的k阶原点矩存在,即

针对总体一组样本而言,就可以作出k个样本矩,即整理课件将这些样本矩代入各个总体矩方程,把其中的参数换成估计量,得到方程组

解出其中的,就得到的估计量矩估计法简便、直观,比较常用。但是也有其局限性:首先,它要求总体的阶原点矩存在,假设不存在那么无法估计;其次,矩估计法不能充分地利用估计时已掌握的有关总体分布形式的信息。整理课件〔二〕最大似然估计(MLE)最大似然估计根本原理是:随机变量分布参数水平虽然未知,但在数据生成过程中起着重要的作用,不同的参数水平生成特定数据集的可能性不同,因此可以根据生成样本的可能性大小估计参数水平。最大似然估计的核心是确定似然函数。设描述总体的随机变量X的概率密度函数为,其中都是总体的未知参数。从总体中抽取一组样本为,这里注意到,对一维随机变量进行n次测量得到的n个测量值可以看成是对n维独立的随机向量进行一次测量得到的n个测量值。那么n维随机向量的联合概率密度为整理课件这个联合概率密度反映了生成这组数据的可能性大小,是未知参数的函数称为似然函数,记为〔1.58〕

对于给定的,使似然函数〔1.58〕式到达最大的的估计值,就称为的“最大似然估计〞。

整理课件这里需要强调的是,似然函数的形式通常比较复杂,直接求解最大值问题比较困难。为此常利用自然对数函数的有关性质,即单调性和对数变换不改变最大值的性质。先用自然对数对似然函数作变换,得到对数似然函数,在对对数似然函数求最大值。整理课件〔三〕最小二乘估计(OLS)最小二乘法是估计随机变量参数最根本的方法,也是计量经济分析中应用最早最广泛的参数估计方法。最小二乘法的根本原理是根据随机变量理论值与观测值的离差平方和最小来估计参数。设是K各变量的函数,含有m个参数,即〔1.59〕 如果是的估计量,那么〔1.60〕 就是的近似,称为理论方程。整理课件设和观测值为,将其代入〔1.60〕式就得到了的一组理论值,即这样,理论值和实际观测值之间的偏差的总体情况,在很大程度上反映的就是参数估计的好坏。如果有一组参数估计水平,能够使得理论值和实际观测值之间的偏差平方和,整理课件即〔1.61〕

得到最小,就是参数的较好的估计,称为最小二乘估计。最小二乘法在计量经济分析中会经常的使用,关于找参数最小二乘估计量的过程将在第二章详细介绍。整理课件三、估计量的优良标准前面介绍了总体参数的的估计方法。对于同一参数,用不同的方法来估计,可能得到不同的估计量。但究竟采用哪种方法为好呢?这就涉及到用什么标准来评价估计量的问题。判别点估计优良性的关键是:线性性、无偏性、有效性和一致性。整理课件〔一〕线性性(linear)参数估计量的一个重要性质就是线性性,所谓线性性就是参数估计量是随机变量观测值的线性组合。具有线性性的参数估计量也称为线性估计。例如,最大似然估计和矩估计中,正态分布的数学期望的估计,就是随机变量观测值的线性组合,其估计量为线性估计。线性性之所以重要,就是因为参数估计量可以表示为随机变量观测值的线性组合,意味着估计量与随机变量有相同类型的概率分布。这是考察估计量性质,并利用它们的分布特征进行统计推断的重要依据。整理课件〔二〕无偏性(unbias)假设要求估计量的数学期望等于待估计参数的真值。即〔1.62〕 那么称为的满足无偏性准那么的估计量。

例如,样本均值是总体均值的一个无偏估计量。但样本方差不是总体方差的无偏估计量。

整理课件事实上,因为表示n次观测结果的n个独立随机变量,且这n个独立随机变量是来自同一总体,因而有相同的分布律,从而有相同的期望值和均方差。那么

所以,样本均值是总体均值的一个无偏估计量。整理课件又因为

所以不是的无偏估计量。整理课件通常我们用

来计算样本方差,这是因为

即是的无偏估计量。整理课件这个性质是通过估计量推断参数真实值的重要根底。同时具有线性性和无偏性参数估计量称为线性无偏估计量。线性无偏估计是参数估计中比较重要的一局部,在统计推断方面起着重要的作用。整理课件〔三〕有效性无偏性只考虑估计值的平均结果是否等于待估参数的真值,而不考虑每个估计值与待估参数真值之间偏差的大小和分布程度。我们在解决实际问题时,不仅希望估计是无偏的,更希望这些估计值的偏差尽可能地小。通常我们用偏差的平方的期望值来衡量估计量偏差的大小,称之为均方误差,并记为〔1.63〕整理课件假设为的无偏估计量,其均方误差等于其方差设、为的两个无偏估计量,假设的方差小于的方差,即〔1.64〕那么称是较有效的估计量。这里我们需要注意的是,仅仅满足有效性不一定是好的估计量,只有同时满足线性性、无偏性和有效性的估计量才是最有价值的,这时的参数估计量称为最小方差线性无偏估计,或称为“最优线性无偏估计〞〔bestlinearunbiasedestimate,BLUE〕。整理课件〔四〕一致性(consistency)设未知参数的估计量,当时,要求按概率收敛于。即〔为任意小正数〕〔1.65〕那么称为的满足一致性标准要求的估计量。一致性标准说明:当样本单位数〔或样本容量〕n越来越大时,估计量接近于被估计量的概率为1。样本平均数作为总体数学期望的一个估计量就满足一致性准那么要求。这里应该注意到,一致性准那么要求是从极限性质来说的,这个性质只对于样本容量较大时才起作用。整理课件四、区间估计〔intervalestimation)上面介绍的点估计,有优点但也有缺陷。点估计最大的优点就在于它能够提供总体参数的具体估计值,可以作为行动决策的数量依据,并且这种方法也很简单。但任何事情都有两面性,这种简单的参数估计方法存在三个方面的局限性,一是这种估计方法似乎与样本容量的大小没有关系;二是点估计得到的估计值不是对就是错,但由于总体参数的未知性,我们永远不知它到底是对还是错的,即我们不可能得到它的误差情况;三是由于第二方面的局限性,我们无从得到这种估计的可靠程度。这三个方面的情况却是我们对参数估计时非常想了解的。因此,必须有一种新的方法,它能够克服点估计的缺陷,这种方法就是区间估计。整理课件所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。设和是两个统计量〔<〕,分别作为总体参数区间估计的下限和上限,那么要求:〔1.66〕式中1-是区间估计的置信水平或置信度,其取值大小由实际问题确定,通常人们取99%、95%和90%,是置信水平〔度〕为的的置信区间。区间估计的特点是,给出总体参数的一个估计区间,总体参数恰好在这个区间内的概率不要求到达1,可放低要求,减去一个小概率,即到达就行了。整理课件置信区间表达了区间估计的准确性〔或精确性〕,置信水平〔度〕表达了区间估计的可靠性,它是区间估计的可靠概率。例如或99%,是说所估计的置信区间平均每100次中有99次会包含总体参

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论