




已阅读5页,还剩616页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第一章:绪论,什么是计量经济学?计量经济学的研究对象计量经济学的内容体系计量经济学的应用计量经济学研究经济问题的步骤计量经济学软件,2,一、什么是计量经济学,计量经济学又名经济计量学英文名称:Econometrics。这个词是在1926年由挪威经济学家、第一届诺贝尔经济学奖获得者之一拉格纳费瑞希(RagnarFrish)仿照“生物计量学”(Biometrics)一词提出。,3,一、什么是计量经济学,费瑞希:“对经济的数量研究有好几个方面,其中任何一个就其本身来说都不应该和经济计量学混为一谈。因此,经济计量学与经济统计学绝不是一样的。它也不等于我们所说的一般经济理论,即使这种理论中有很大部分具有确定的数量特征,也不应该把经济计量学的意义与在经济学中应用数学看成是一样的。,4,一、什么是计量经济学,经验表明,统计学、经济理论和数学三个方面观点的每一种都是实际理解现代化经济生活中数量关系的必要条件,但任何一种观点本身都不是充分条件。这三者的统一才是强有力的工具;正是由于这三者的统一才构成了经济计量学。”,5,一、什么是计量经济学,丁伯根:“计量经济学的范围包括用数学表示那些从统计检验的观点所做的经济假设和对这些假设进行统计检验的实际过程。”萨缪尔森:“经济计量学的定义为:在理论与观测协调发展的基础上,运用相应的推理方法,对实际经济现象进行数量分析。”,6,一、什么是计量经济学,兰格:“经济计量学是经济理论和经济统计学的结合,并运用数学和统计方法对经济学理论所确定的一般规律给予具体的和数量上的表示。”克莱茵:“经济计量学是数学方法、统计技术和经济分析的综合。就其字义来讲,经济计量学不仅是指对经济现象加以测量,而且包含根据一定的经济理论进行计算的意思。”,7,一、什么是计量经济学,计量经济学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学。计量经济学运用数理统计知识分析经济数据,对构建于数理经济学基础之上的数学模型提供经验支持,并得出数量结果。计量经济学是以经济理论为前提,利用数学、数理统计方法与计算技术,根据实际观测资料来研究带有随机影响的经济数量关系和规律的一门学科。,8,计量经济学构成要素,9,三大要素,经济理论数据统计推断经济理论、数据和统计理论这三者对于真正了解现代经济生活中的数量关系都是必要的,但本身并非是充分条件。三者结合起来就是力量,这种结合便构成了计量经济学。,10,经济理论,经济理论的作用是对经济现象进行分析和解释,描述在一定条件下经济变量之间的相互关系。体现在计量经济学模型之中。经济理论对于计量经济学是建立计量经济模型的依据和出发点。计量经济学对于经济理论而言是理论到实际的桥梁和检验工具。,11,经济理论,理论是抽象的,在实证分析时,需要具体化。计量经济的方法和统计方法一样,本质上是归纳法,是将实事归纳成理论的一个有效的辅助工具。计量经济学可以结合实际观测数据对经济理论进行验证,检验理论的正确性,提供进一步改进理论的方向。,12,数据,观测数据:主要是指统计数据和各种调查数据。是所考察的经济对象的客观反映和信息载体,是计量经济工作处理的主要现实素材。经济数据是计量经济分析的材料。经济数据是经济规律的信息载体。,13,1、数据类型,时间序列数据(timeseriesdata)截面数据(cross-sectiondata)平行数据(paneldata)虚拟变量数据(dummyvariabledata),14,时间序列数据(timeseriesdata),按照时间的顺序,每隔一定的时间观测经济变量的取值,所得到的统计数据。观测对象是一个单位:一国,一地区,某企业时间间隔:可以是一年,一个季度,一个月,一天,甚至更短,要视问题的性质和重要性而定。,15,时间序列数据(timeseriesdata),这类变量反应了变量的动态特征,即在时间上的变动趋势。一般可由统计年鉴、公报得到,是计量经济模型使用得最多的一类数据。,16,例、中国的GDP(19522000当年价,亿元),17,18,截面数据(cross-sectiondata),在某一时刻所观察到的一组个体的数据。这类数据反应个体在分布或者结构上的差异。例:某班计量经济学的考试成绩。六十个学生,有六十个成绩,这是一个容量为60的截面数据。,19,时序数据和截面数据的区别,前者:同一个体在不同时间的数据;后者:一组个体在同一个时刻的数据。例如,一名学生的体重,被连续的记录了十年,得到一个容量为10的时间序列数据;在某一时间,记录一个班级所有30个学生的体重,得到一个容量为30的截面数据。,20,平行数据(paneldata),是时间序列数据和截面数据的结合。是一组个体在一段时间上的数据,既研究某段时间内的数据又研究某个时刻上的数据。,21,例从1997年到2000年,我国各省的GDP,22,虚拟变量数据(dummyvariabledata),或者称为二进制数据,一般取0和1两个值(也可以取其他两个不同的值)。这类变量往往用来表示性质和状态的差异,也可以表示分组取0还是1:研究者按照实际情况来确定,23,例时间序列型的虚拟变量,24,例截面数据型虚拟变量,25,2、数据采集和处理,来源:统计、调查质量:非实验,历史数据残缺,各种偏误(观测误差、选择性、随机性问题、处理方法问题)加工:加总、指数运算、季节调整,随变量作变换结论:研究结果的质量不可能高于数据的质量。不管方法多么科学。,26,统计推断,统计理论:是指各种数理统计方法,包括参数的估计,假设检验等内容。是计量经济的主要数学基础,很多计量经济学方法都是在数理统计的基础上发展起来的。,27,计量经济学与经济理论、统计学和数学的联系和区别,是经济学,统计学,数学构成的一门交叉学科和边缘学科。,28,1、计量经济学与经济理论,经济学是计量经济学的服务对象,计量经济学是提高经济学科科学性和实用性的工具。一般经济理论(定性)是计量经济学的基础。例:关于失业问题的数量实证分析(1)菲利普斯曲线(工资和失业率);(2)资本和技术变化的影响;(3)人口和移民的影响(供给方面);(4)经济增长和产业结构(需求方面、结构性失业)。,29,1、计量经济学与经济理论,一般经济理论是修正计量经济分析模型、方法的依据。一般经济理论是解读计量分析结果的工具。定性、定量,30,2、计量经济学与统计学,计量的参数估计、模型检验、数据收集和处理、方法设计,应用分析中的置信区间分析等,都与统计有关,以统计为基础。,31,3、计量经济学与数学,数学(微积分、线性代数、概率统计)是计量分析(级数、矩阵、方差、期望,)的基础和工具。数学知识(函数性质等)对计量建模的作用。计量经济学不是数学,是经济学。,32,二、研究对象,计量经济学是利用数学的方法,根据统计测定的经济数据,对反映经济现象本质的经济数量关系进行研究。计量经济学研究的对象是经济现象,是研究经济现象中的具体数量规律。,33,三、内容体系,1、从学科发展角度划分2、从内容角度划分3、从程度角度划分4、从模型类型角度划分5、从估计方法角度划分6、从数据类型角度划分,34,1、从学科发展角度划分,经典计量经济学广义计量经济学:包括投入产出分析方法、时间序列分析方法等,35,2、从内容角度划分,理论计量经济学:也称经济计量方法,以介绍、研究计量经济学的理论与方法为主要内容,侧重于理论与方法的数学证明与推导。包括计量经济学的数学理论基础,计量经济模型的估计和检验方法等内容。应用计量经济学:以建立与应用计量经济模型为主要内容,强调应用模型的经济学和统计学基础,侧重于建立与应用模型过程中实际问题的处理。,36,理论计量经济学与应用计量经济学,37,3、从程度角度划分,初级计量经济学中级计量经济学高级计量经济学,38,4、从模型类型角度划分,经典线性模型非经典线性模型非线性模型动态模型无参数回归模型,39,5、从参数估计方法角度,最小二乘法最大似然法贝叶斯估计方法广义矩方法,40,最小二乘法,最小二乘法是一类依赖样本信息,从最小二乘原理出发的参数估计方法。概念清楚、方法简单,是经典线性计量经济模型的最主要的估计方法。,41,最小二乘法,普通最小二乘法(OLS):模型满足基本假设时采用加权最小二乘法:模型存在异方差广义最小二乘法:模型存在序列相关二阶段最小二乘法:估计联立方程,42,最大似然法,最大似然法是一类依赖样本信息,从最大似然原理出发的参数估计方法。坚实的理论基础、数学描述复杂最大似然法普通最小二乘法有限信息最大似然法二阶段最小二乘法完全信息最大似然法三阶段最小二乘法,43,贝叶斯估计方法,在计量经济模型参数估计中,它的主要特点是利用了非样本信息,包括前验信息和后验信息。在一些特殊的计量经济应用模型中,由于样本量不足,使得最小二乘法和最大似然法无法应用,这时贝叶斯估计方法是无可替代的。,44,广义矩方法,广义矩(Generalizedmethodofmoments,GMM)方法是矩方法(Methodofmoments,MM)的一般化,也是一类依赖样本信息的参数估计方法,具有广泛的适用性。最小二乘法和最大似然法等可以看作是广义矩方法的特例。,45,6、从数据类型角度划分,截面数据分析时序数据分析平行数据分析离散被解释变量数据计量经济模型受限被解释变量数据计量经济模型持续被解释变量数据计量经济模型,46,四、计量经济模型的应用,结构分析经济预测政策评价检验与发展经济理论,47,1、结构分析,经济学中的结构分析是对经济现象中变量之间相互关系的研究。它研究的是当一个变量或几个变量发生变化时会对其他变量以至经济系统产生什么样的影响。结构分析采用的主要分析方法:弹性分析、乘数分析、比较静态分析。,48,2、经济预测,计量经济模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。计量经济模型是以模拟历史,从已经发生的经济活动中找出变化规律为主要技术手段。,49,3、政策评价,政策评价是指从许多不同的政策中选择较好的政策予以执行,或者说是研究不同的政策对经济目标所产生的影响的差异。经济计量模型充当“经济政策实验室”。,50,政策评价方法,工具目标法:给定目标变量的预期值即我们所希望达到的目标,通过求解模型可以得到政策变量值。政策模拟法:即将各种不同的政策代入模型,计算各自的目标值,比较其优劣,决定政策的取舍。最优控制法:将经济计量模型与最优化方法结合起来,选择使得目标最优的政策或政策组合。,51,4、经济理论的检验与发展,经济理论的检验:首先根据某种经济理论建立模型,然后用已经发生的经济活动的样本数据去拟合,如果拟合效果好,则这种经济理论通过检验。经济理论的发现与发展:用所采集的样本数据拟合各种模型,拟合最好的模型所表现出来的数量关系就是经济活动所遵循的经济规律。,52,应用示例1,例子:各种产品和服务的供给和需求关系厂商欲估计广告对销售和利润的影响将股票价格和厂商的特征联系起来宏观政策,国家,地方税收收入预测,53,应用示例2,例子:广告战是否成功地增加了销售?需求对价格变化是富有弹性的,还是缺乏弹性的?政府的宏观政策是否有效?确实存在工资的性别差异吗?,54,应用示例3,例子:厂商需要预测销售、利润、生产成本、所需的存货城市发展对交通、能源、通讯的需求国家的税收、支出、通货膨胀、失业、预算和贸易等方面的预测汽车厂商对中国轿车市场的预测,55,五、研究经济问题的步骤,1、理论或假说的陈述2、收集数据3、建立数学模型4、建立统计或经济计量模型5、估计计量经济模型参数6、检查模型的准确性:模型的假设检验7、检验来自模型的假说8、运用模型进行预测,56,五、研究经济问题的步骤,57,1、模型设计,模型设定(理论模型设计):依据一定的经济理论,先验地用一个或一组数学方程式来表示被研究经济系统内经济变量之间的关系。需要做以下工作:研究有关经济理论确定函数形式确定参数的符号和理论期望值,58,研究有关经济理论,根据经济理论分析所研究的经济现象,找出经济变量之间的因果关系及相互之间的联系,把目标或者经济问题作为因变量,影响问题的主要因素作为自变量,非主要因素归入随机项,按照它们之间的结构关系和经济理论,建立方程。,59,需求函数:Q=f(P1,P2,Y,T)-?+消费函数:Cf(Y)按照凯恩斯的绝对收入假说,“平均说来,当人们收入增多时,消费倾向于增加,但其增长的程度并非和收入增加的程度一样多。”按照凯恩斯的观点,边际消费倾向MPCb=dc/dy,0=500是S=tt=0的子集,则A为上述试验的一个随机事件。,98,事件(events),在每次试验中,当且仅当代表该事件的子集中的一个样本点出现时,称这一事件发生。不可能事件:空集不包含任何样本点,它作为样本空间的子集,在每次试验中都不发生,称为不可能事件。必然事件:样本空间S本身为必然事件,它包含所有的样本点,是自身的子集,在每次试验中都会发生。,99,事件(events),基本事件:由一个样本点组成的单点集,称为基本事件。互斥事件:如果两个事件不能同时发生,则这两个事件是互斥的或互不相容的。等可能事件:如果一个事件的发生与另一个事件的发生的可能性相同,则这两个事件称为等可能事件。穷举事件:如果可穷举试验的所有可能结果,则事件称为穷举事件。,100,频率与概率,人们认可的一个常识,或叫“公理”是:多次试验中,事件A发生的次数多,说明一次试验事件A发生的可能性大。人们还发现随着试验的次数增多,事件A发生的频率越来越接近一个常数p。,101,102,频率与概率,在相同条件下,进行了n次试验,在这n次试验中,事件A发生的次数m称为事件A发生的频数;比值m/n称为事件A发生的频率。频率具有随机波动性,即对于同样的n,所得到的频率不尽相同,当n趋于无穷大时,频率的大小会呈现出稳定性。概率:频率趋于稳定时的值。事件A发生的概率记为P(A)。,103,概率性质,0P(A)1若事件A、B、C为互斥事件,则事件和的概率等于事件概率之和P(A+B+C)=P(A)+P(B)+P(C)若事件A、B、C为相互独立事件,则事件积的概率等于事件概率的积P(ABC)=P(A)P(B)P(C)如果事件A、B不是互斥事件,则:P(A+B)=P(A)+P(B)-P(AB),104,概率性质,例如:掷骰子点数大于3点的概率P(4+5+6)=p(4)+P(5)+P(6)=1/6+1/6+1/6=1/2P(1+2+3+4+5+6)=P(1)+P(2)+P(3)+P(4)+P(5)+P(6)=1(完备事件组),105,概率性质,例:假设同时抛掷两枚硬币,两枚硬币均正面朝上的概率是多少?A:第一枚硬币正面朝上B:第二枚硬币正面朝上A、B两事件独立P(AB)=P(A)P(B)=(1/2)(1/2)=1/4,106,概率性质,从一副扑克中抽取一张,它是红心或皇后的概率是多少?A:红心B:皇后A、B不是互斥事件P(A+B)=P(A)+P(B)-P(AB)=13/52+4/52-1/52=4/13,107,等可能概型,如果随机实验E具有以下特点:1样本空间S中所含样本点为有限个2一次试验,每个基本事件发生的可能性相同则称这类随机试验为等可能概型。,108,随机变量,随机变量:设E是随机试验,它的样本空间是S=e1,e2,e3,如果对于每一个eiS,有一个实数X(ei)与之对应,这样就得到一个定义在S上的单值实值函数X=X(e),称X为随机变量。离散型随机变量(如抛掷硬币)连续型随机变量(如体重、温度),109,随机变量,抛掷两枚硬币,统计正面朝上的硬币个数。H:正面;T:反面样本空间S=HH,HT,TH,TTX=2110X为离散型随机变量,110,离散型随机变量的概率分布,PX=xk=Pk为离散型随机变量X的概率分布或分布律。分布律表格形式Xx1x2.xnPkp1p2.pn,111,离散型随机变量的分布函数,设X是一个随机变量,x是任意实数,函数F(x)=PXx称为X的分布函数。例如:掷骰子点数小于3点的概率F(3)=PX3=P(1+2)=p(1)+P(2)=1/6+1/6=1/3,112,连续型随机变量的概率密度及分布函数,113,随机变量,相互独立的随机变量:对于随机变量X,Y的所有可能取值(xi,yj),有PX=xi,Y=yj=PX=xiPY=yj,114,二、随机变量的数字特征,数学期望(expectedvalue):设离散型随机变量X的分布律为PX=xk=Pk,k=1、2、3.若级数xkPk绝对收敛,则称级数xkPk为随机变量X的数学期望,记为E(X),简称期望,又称为均值。数学期望是对随机变量集中趋势的度量。,115,数学期望,例:甲、乙两人进行打靶,所得分数分别记为X1、X2,它们的分布律分别为X1012X2012P100.20.8P20.60.30.1试评定他们成绩的好坏E(X1)=0*0+1*0.2+2*0.8=1.8E(X2)=0*0.6+1*0.3+2*0.1=0.5,116,数学期望性质,E(b)=b,b为常数E(X+Y)=E(X)+E(Y)E(aX)=aE(X),a为常数E(XY)=E(X)E(Y),其中X、Y相互独立一般情况下,E(XY)E(X)E(Y)E(aX+b)=aE(X)+E(b),117,方差(Variance),方差:设X是一个随机变量,若EX-E(X)2存在,则称EX-E(X)2为的方差,记为D(X)或Var(X),即D(X)=Var(X)=EX-E(X)2令(X)=D(X),称为标准差或均方差。,118,方差(Variance),方差D(X)是随机变量离散程度的度量。表达了X的取值与其数学期望的偏离程度。若X取值比较集中,则D(X)比较小;反之,若X取值比较分散,则D(X)比较大。因此,D(X)是刻画X取值分散程度的一个量,是衡量X取值分散程度的一个尺度。,119,方差的性质,D(b)=0b为常数D(X+b)=D(X)D(aX)=a2D(X)a为常数如果X、Y相互独立,则D(X+Y)=D(X)+D(Y)D(X-Y)=D(X)+D(Y),120,121,数学期望与方差,数学期望与方差是描述单变量概率密度函数(分布律)最常用的数字特征,前者给出随机变量中心值,后者描述了单个值围绕该中心值分布的离散程度。,122,协方差与相关系数,考虑多维随机变量的数字特征协方差(covariance):EX-E(X)Y-E(Y)称为随机变量X与Y的协方差,记为cov(X,Y),即:cov(X,Y)=EX-E(X)Y-E(Y)PXY=cov(X,Y)/D(X)D(Y)称为随机变量X与Y的相关系数(correlation)。,123,协方差,一般而言,协方差可正可负。如果两个变量同方向变动,则协方差为正;如果两个变量反方向变动,则协方差为负。cov(X,Y)=cov(Y,X)cov(X,X)=D(X)cov(aX,bY)=abcov(X,Y)a、b为常数cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y),124,相关系数,相关系数PXY是刻画两变量之间的相关程度的数字特征,亦即表明两变量之间线性相关程度的大小。定理:|PXY|1|PXY|=1的充要条件是:存在常数a、b,使得PY=a+bX=1,125,相关系数的性质,相关系数可正可负。它与协方差同号。-1PXY1PXY=1,表示两变量完全正相关PXY=-1,表明两变量完全负相关PXY0,表明两变量负相关PXY0,表明两变量正相关,126,127,128,样本均值,样本均值:X=Xi/n样本均值是总体均值(期望E(X))的估计量。估计量可以简单地理解为估计总体的规则或公式。例:对从业十年的汽车销售商每月前十天出售汽车的平均数量(9,11,11,14,13,9,8,9,14,12)X=(9+11+11+14+13+9+8+9+14+12)/10=11,129,样本方差,样本方差(samplevariance):S2=(X-X)2/(n-1)n-1为自由度S2=(9-11)2+(11-11)2+(12-11)2/(10-1)=4.89,130,样本协方差、偏度、峰度,样本协方差:(X-X)(Y-Y)/(n-1)偏度(样本三阶矩):(X-X)3/(n-1)峰度(样本四阶矩):(X-X)4/(n-1),131,三、重要的概率分布,正态分布(normaldistribution)X2分布t分布F分布,132,正态分布,“钟型”经验表明:对于其值依赖于众多微小因素且每一因素均产生微小的或正或负影响的连续型随机变量而言,正态分布是一个相当好的描述模型。体重、身高、考试分数XN(u,2),133,正态分布性质,正态分布曲线:以均值u为中心,对称分布正态分布的概率密度函数呈中间高,两边低,在均值u处达到最高。正态曲线下的面积约有68%位u于之间,约有95%的面积位于u2之间,99.7%在u3之间。两个(或多个)正态分布的随机变量的线性组合仍服从正态分布。,134,标准正态分布,标准(单位)正态变量:Z=(X-u)/其中:XN(u,2)ZN(0,1)简化计算,135,X2分布(Chisquaredistribution),XN(u,2)ZkN(0,1),k=1、2、3.Zk2=Z12+Z22+.+Zk2Zk2服从自由度为k的X2分布,136,X2分布的性质,X2分布只取正值X2分布是斜分布,其偏度取决于自由度的大小。X2分布的期望为k,方差为2k,k是X2的自由度。若E1,E2分别为自由度k1,k2的两个相互独立的X2变量,则E1+E2也是X2变量,自由度是k1+k2。,137,t分布,t分布又称为学生t分布XN(u,2/n)Z=(X-u)/(/n1/2)N(0,1)t=(X-u)/(S/n1/2)服从自由度为(n-1)的学生t分布。S为样本标准差。,138,t分布的性质,t分布具有对称性K为30时,t分布的方差已与标准正态分布方差相差无几。,139,F分布,定义:令随机样本X1,X2,.Xm来自均值为ux、方差x2为的正态总体,其样本容量为m;随机样本Y1,Y2,.Yn为来自均值uy、方差y2的正态总体,样本容量为n;两个随机样本相互独立;则F=Sx2/Sy2=(X-X)2/(m-1)(Y-Y)2/(n-1)其中Sx2、Sy2分别为两个随机样本样本方差。,140,F分布,F分布常用于比较两总体的方差。F分布又称为方差比分布。两总体方差相差越大,F值就越大。自由度考虑分子和分母的自由度(m-1)和(n-1),141,F分布的性质,F分布是斜分布,只为正值分子分母自由度越大,F分布越接近正态分布。若分母自由度充分大,F值的m倍(m为分子的自由度)近似自由度为m的X2分布。,142,四、统计推断,总体、样本统计推断研究的是总体与来自总体的样本之间的关系。统计推断是根据来自总体的样本对总体(概率密度函数)的种种统计特征作出判断。,143,统计推断,估计假设检验,144,估计量的评选标准,无偏性有效性一致性,145,无偏性(unbiasedness),估计量是随机变量无偏性:如果重复使用某种方法,得到的估计量的均值与真实参数值一致,那么这个估计量就是无偏估计量,亦即该估计量具有无偏性。E(X)=ux,146,147,有效性(efficiency),有效性:如果在样本容量相同的情况下,E1、E2都是E的无偏估计量,若有D(E1)D(E2)则E1较E2更有效。,148,一致性(consistency),一致性:设E为参数E的估计量,若对于任意的E,当样本数量n趋于无穷时,E都依概率收敛于E,则称E为E的一致估计量。一致性是大样本的性质,它考察当样本容量越来越大时,估计量是否趋于真值。,149,150,151,152,置信区间,153,第三章:一元线性回归模型,回归的含义一元线性回归方程模型参数的最小二乘估计样本的决定系数及回归直线拟合优度的检验回归系数估计量的显著性检验方程的显著性检验,154,第一节回归的含义,回归的含义回归分析的用途回归关系与确定性关系回归关系与因果关系回归分析与相关分析,155,一、回归的含义,回归分析是研究关于一个叫做被解释变量的变量对另一个或多个叫做解释变量的依赖关系。其用意在于通过后者(在重复抽样中)的已知或被设定值去估计和(或)预测前者的(总体)均值。回归分析构成计量经济学的方法论基础,主要内容包括:根据样本观察值对经济计量模型参数进行估计,求得回归方程对回归方程、参数估计值进行显著性检验利用回归方程进行分析、评价及预测。,156,二、回归分析的用途,通过自变量的值来估计应变量的值。对独立性进行假设检验根据经济理论建立适当的假设。通过自变量的值对应变量进行预测。上述多个目标的综合。,157,三、回归关系与确定性关系,回归关系(统计关系):研究的是非确定现象随机变量间的关系。确定性关系(函数关系):研究的是确定现象非随机变量间的关系。,158,四、回归关系与因果关系,回归关系研究一个变量对另一个变量的统计依赖关系,从逻辑上说,统计关系式本身并不意味着任何因果关系。因果关系:理论关系。“一种统计关系,无论多么的强有力,(其自身)总不能成为因果关系,因果关系最终来自于理论而不是统计”。几个荒谬的关系,159,中国人口和美国个人收入,19801995年中国人口(亿人)和美国的个人收入(亿美元)多么好的相关关系!但决不是因果关系!,160,中国农村用电量与美国消费者价格指数,中国农村用电量和美国消费者价格指数(19801996),161,五、回归分析与相关分析,回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。有相关关系并不意味着一定有因果关系。相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。,162,第二节一元线性回归模型,线性回归模型的形式随机干扰项u的意义一元线性回归模型对ui分布的假定,163,一、线性回归模型形式,称为K元线性回归模型如果K=1,一元线性回归模型u为随机干扰项(误差项),164,t观测值下标,若是时间序列数据,则表示时间下标,表示第t期;若是截面数据,则表示观测序号,表示第t个观测。n样本容量ut(第t期的)随机干扰项。,165,变量的称谓,166,参数及其经济解释,为回归参数(系数)经济解释:表示在其他条件不变时,自变量xj变化一个单位y将变化个单位,167,例:参数的经济意义,需求函数:Q=20-0.5P+2I消费函数:C=200+0.7Y线性生产函数:Q=aK+bL成本函数:C=a+bQ收益函数:TR=a+bQ,168,线性,变量线性参数线性,169,变量线性,指模型中的变量之间呈线性关系例,VL,PL,VL,PNL,VNL,PNL,170,参数线性,指模型中的参数之间呈线性关系一般,从估计的角度看,我们总是对参数线性感兴趣例:,VL,PL,VNL,PL,VNL,PNL,171,例:消费函数,一个国家消费支出与可支配收入之间的关系:c=a+by其中c消费支出y可支配收入a,b为参数,b称为边际消费倾向,0t/2是小概率事件,如果该事件在一次抽样中就出现,说明假设H0值得怀疑,应当拒绝H0,248,检验步骤,(1)计算|t|(2)查表求临界值t2(n-k-1)(3)比较,下结论如果|t|t2,则接受H0,认为在显著性水平为的意义下,bj不显著;如果|t|t2,则拒绝H0,认为在显著性水平为的意义下,bj显著。,249,例,估计结果:Yt=7.193-1.39X1+1.47X2se(1.595)(0.205)(0.956)t(4.510)(-6.780)(1.538)n=13,k=2,=0.05t2(n-k-1)=t0.025(10)=2.228结论:常数项和X1的系数是显著的,X2的系数不显著,250,Eviews回归结果,251,简易“2倍”检验法,当=0.05,n-k-18时,t2(n-k-1)2将t和2比较,就可得出参数的显著性检验可以化简为:当估计值的绝对值大于标准差的2倍时,则认为参数是显著的,反之是不显著的。,252,P值检验法(P-ValueTest),p值的概念:为了方便,将t统计量的值记为计算pPtt0称为p值(pvalue)通常的计量经济学软件都可自动计算出p值,253,P值检验法原理,如果p,则p/2/2,t0落入接受域,应接受H0,254,P值检验法原理,如果pF是小概率事件,如果该事件在一次抽样中就出现,说明假设H0值得怀疑,应当拒绝H0,266,检验步骤,1)计算F(2)查表求临界值F(k,n-k-1)(3)比较下结论:FF,则拒绝H0,认为方程是显著成立的FF,则接受H0,认为方程是不显著的(无意义),267,例,回归结果见下页其中,n=27,k=4,0.05F(k,n-k-1)F0.05(4,22)4.55t/2tt/2是小概率事件,如果该事件在一次抽样中就出现,说明假设H0值得怀疑,应当拒绝H0,312,检验步骤,(1)计算|t|(2)查表求临界值t2(n-k-1)(3)比较,下结论如果|t|t2,则接受H0,认为在显著性水平为的意义下,bj不显著;如果|t|t2,则拒绝H0,认为在显著性水平为的意义下,bj显著。,313,例,估计结果:Yt=7.193-1.39X1+1.47X2se(1.595)(0.205)(0.956)t(4.510)(-6.780)(1.538)n=13,k=2,=0.05t2(n-k-1)=t0.025(10)=2.228结论:常数项和X1的系数是显著的,X2的系数不显著,314,简易“2倍”检验法,当=0.05,n-k-18时,t2(n-k-1)2将t和2比较,就可得出参数的显著性检验可以化简为:当估计值大于标准差的2倍时,则认为参数是显著的,反之是不显著的。,315,P值检验法(P-ValueTest),p值的概念:为了方便,将t统计量的值记为计算pPtt0称为p值(pvalue)通常的计量经济学软件都可自动计算出p值,316,P值检验法原理,如果p,则p/2/2,t0落入接受域,应接受H0,317,P值检验法原理,如果pF是小概率事件,如果该事件在一次抽样中就出现,说明假设H0值得怀疑,应当拒绝H0,325,检验步骤,(1)计算F(2)查表求临界值F(2,n-3)(3)比较下结论:FF,则拒绝H0,认为方程是显著成立的FF,则接受H0,认为方程是不显著的(无意义),326,P值检验法(P-Value),P值:准则:当P值小于显著性水平时,系数在显著性水平下是显著的当P值大于显著性水平时,系数在显著性水平下是不显著的,327,例:税收政策会影响公司资本结构吗?,Y=C+2.4X1+0.3X2+1.4X3-1.2X4-2.4X5Y:杠杆利率(债务/产权)X1:公司税率X2:资本利得税率X3:通货膨胀率X4:个人税率X5:非债务避税,328,例:牙买加对进口的需求,为了解释牙买加对进口的需求,J.Gafar根据19年的数据得到下面回归结果:Y=-58.9+0.20X1-0.10X2se=(0.0092)(0.084)t=(21.74)(-1.1904)R2=0.96Y:进口量;X1:个人消费支出;X2:进口价格/国内价格,329,美国对酒精饮料的需求,为了解释美国对酒精饮料的需求,T.McGuinness根据20年的年数据得到下面结果:Y=-0.014-0.354X1+0.0018X2+0.657X3+0.0059X4se=(0.012)(0.2688)(0.0005)(0.266)(0.0034)t=(-1.16)(1.32)(3.39)(2.47)(1.73)R2=0.689,330,美国对酒精饮料的需求,Y:每一个成年人酒精消费的年变化X1:酒精饮料的真实价格指数的年变化X2:个人真实的可支配收入的年变化X3:许可证颁发数量年变化量/成年人人口X4:在酒精饮料上的广告支出费用的年变化,331,建模中注意的问题,依照经济理论以及对具体经济问题的深入分析初步确定解释变量当引用现成数据时,要注意数据的定义是否与所选定的变量定义相符,332,建模中注意的问题,谨慎对待异常值。不能把建立模型简单化为一个纯数学过程,目的是寻找经济规律改变变量的测量单位可能会引起回归系数值的改变,但不会影响t值。即不会影响统计检验结果,333,建模中注意的问题,在作F与t检验时,不要把自由度和显著性水平用错(正确查临界值表)利用回归模型预测时,解释变量的值最好不要离开样本范围太远回归模型的估计结果应与经济理论或常识相一致,334,建模中注意的问题,解释变量应具有外生性,与误差项不相关异方差、自相关、多重共线性应具有高度概括性。若模型的各种检验及预测能力大致相同,应选择解释变量较少的一个,335,建模中注意的问题,模型的结构稳定性要强,超样本特性要好世界是变化的,应该随时间的推移及时修改模型,336,第五章线性回归模型的扩展,对数线性模型半对数模型线性对数模型双曲函数模型多项式回归模型特征:参数线性,变量不一定线性包含虚拟变量的回归模型,337,第一节对数线性模型:度量弹性,双对数线性模型对数线性模型的假设检验多元对数线性回归模型,338,一、双对数线性模型,考虑函数:Y=AXb1变量X非线性恒等变换:lnY=lnA+b1lnXln表示自然对数(以e为底的对数)lnY=lnA+b1lnX+u令b0=lnAlnY=b0+b1lnX+u将形式如上式的模型称为双对数模型。,339,双对数线性模型,令y=lnY,x=lnX则有y=b0+b1x+u若上式满足古典线性回归模型的基本假定,则很容易用普通最小二乘法估计它,并且得到的估计量是BLUE估计量。,340,双对数线性模型,双对数模型特性:斜率b1度量了Y对X的弹性,即给X一个很小的变动所引起Y变动的百分比。弹性=Y变动百分比/X变动百分比双对数模型又称为不变弹性模型,341,例:对widget教科书的需求,342,二、双对数模型的假设检验,在随机误差项u满足假定的情形下,线性模型与双对数模型的假设检验方法相同。,343,三、多元对数线性回归模型,将双变量对数线性回归模型推广到模型中解释变量多于一个的情形如三变量双对数模型lnY=b0+b1lnX1+b2lnX2+u在这个模型中,偏斜率系数b1、b2又称为偏弹性系数。b1是Y对X1的弹性(X2不变)b2是Y对X2的弹性(X1不变),344,多元对数线性回归模型,在多元对数线性模型中,每一个偏斜率系数度量了在其他变量保持不变的条件下,因变量对某一个解释变量的偏弹性。,345,例:柯布道格拉斯生产函数,lnY=b0+b1lnX1+b2lnX2+u令X1表示劳动投入,X2表示资本投入柯布道格拉斯生产函数(C-D函数)Y:19551974年间墨西哥产出(GDP,百万比索)X1:劳动投入(总就业人数,千人)X2:资本投入(固定资本,百万比索),346,柯布道格拉斯生产函数,lnY=-1.6524+0.3397lnX1+0.8640lnX2se=(0.6062)(0.1857)(0.09343)t=(-2.73)(1.83)(9.06)R2=0.995,347,对回归方程解释,b1:产出对劳动投入的弹性b2:产出对资本投入的弹性以上两个弹性系数相加(b1+b2)得到规模报酬系数,反映产出对投入的比例变动。规模报酬系数=1:规模报酬不变规模报酬系数1:规模报酬递增规模报酬系数1:规模报酬递减,348,对回归方程解释,b1=0.3397b2=0.8640规模报酬系数(b1+b2)=1.2037墨西哥经济特征是规模报酬递增资本投入对产出影响大于劳动对产出的影响。,349,例:对能源需求,数据:19601982年间7个OECD国家(美国、加拿大、德国、英国、意大利、日本、法国)的总最终能源需求指数Y;实际GDP(X1);实际能源价格(X2)所有指数均以1970年为基准(1970=100),350,回归结果,lnY=1.5495+0.9972lnX1-0.3315lnX2se=(0.0903)(0.0.0191)(0.0243)t=(17.17)(52.09)(13.61)R2=0.994,351,回归结果分析,能源需求与收入(GDP)正相关,与实际能源价格负相关收入弹性:0.9972价格弹性:-0.3315,缺乏弹性(基本消费品),352,第二节:半对数模型:测度增长率,政府根据预计的GDP增长率指标确定预算赤字规划美联储根据未偿付消费者信贷的增长率指标监视其货币政策的运行效果,353,例:美国未偿付消费者信贷的增长,数据:19731987年间未偿付消费者信贷Y:未偿付消费者信贷复利计算公式:Yt=Y0(1+r)tY0Y的初始值Yt第t期的Y值r复利率,354,例:美国未偿付消费者信贷的增长,求对数:lnYt=lnY0+tln(1+r)令b0=lnY0;b1=ln(1+r)引进随机误差项u,得到:lnYt=b0+b1t+u半对数模型:仅因变量以对数出现,355,OLS回归结果,lnYt=12.007+0.0946tse=(0.0319)(0.0035)t=(376.4)(26.03)R2=0.9824未偿付信贷增长率0.0946(9.46%)半对数模型中,斜率度量了给定解释变量的绝对变化所引起的被解释变量的相对变动,356,线性趋势模型,Yt=b0+b1t+u将因变量对时间t回归,其中t按时间先后顺序计算,这类模型称为线性趋势模型。时间t称为趋势变量若斜率为正,则称Y有向上的趋势;若斜率为负,则称Y有向下的趋势,357,例:美国为偿付消费者信贷,Yt=98084+35289tse=(23095)(2540.1)t=(4.247)(13.893)R2=0.9369因变量不同,不能比较R2,358,回归结果分析,在样本区间内,未偿付消费者信贷的年绝对增加值为35289百万美元。在此期间,未偿付消费者信贷有一个向上趋势。,359,第三节:线性对数模型,线性对数模型:解释变量是对数形式,而因变量不是对数形式。,360,例:美国GNP与货币供给,考虑模型:Y=b0+b1lnX+u其中:Y=GNP;X=货币供给回归结果:Y=-16329.0+2584.8lnXt=(-23.494)(27.549)R2=0.9832,361,第四节:双曲函数模型,双曲函数模型:Y=b0+b1(1/X)+u参数线性变量非线性(X以倒数形式进入模型)特征:X无限增大时,1/X趋近于0,Y逐渐接近b0渐近值。,362,双曲函数模型,平均固定成本恩格尔消费曲线菲利普斯曲线,363,例:美国菲利普斯曲线,数据:美国19581969年间小时收入指数(Y)和城市失业率(X)回归结果:Y=-0.2594+20.588(1/X)t=(-0.2572)(4.3996)R2=0.6594线性模型:Y=8.0147-0.7883Xt=(6.4625)(-3.2605)R2=0.5153,364,第五节:多项式回归模型,多项式回归模型:在模型等式右边只有一个解释变量,但却以不同的次幂出现,可将它们看作多元回归模型。多项式回归模型在生产与成本函数领域中被广泛应用。,365,多项式回归模型,形式:变量非线性,参数线性变量之间不完全共线性,366,三次多项式函数,形式:c=a0+a1Q+a2Q2+a3Q3又称为立方函数变量Q的最高次幂代表了多项式函数的次,上式最高次为3。,367,例:成本产出,数据Y=141.7667+63.4776X-12.961X2+0.9396X3,368,第六节包含虚拟变量的回归模型,虚拟变量:定性的或者反映质的差别的或者分组的信息结合到回归模型中。比如性别、种族、宗教、季节、战争/和平、有自然灾害/无自然灾害、南方/北方。我们可以用只取0和1的变量来表示这些定性或者分组的因素。称为虚拟变量。指标变量、二元变量、分类变量、二分变量,369,虚拟变量,(1)D=1表示男,0表示女(2)D=1表示生活在南方,0表示不生活在南方一般地D=,370,虚拟变量,季节i=1、2、3、4四个变量合起来可以表示各个季度,371,虚拟变量的性质,如果定性变量有m种情形,则应引进m-1个虚拟变量。否则就会陷入虚拟变量陷阱,即完全多重共线性。虚拟变量赋值是任意的。赋值依习惯而定。赋值为0的一类称为基准类、控制类、对比类。基准类的选择根据研究目的确定。虚拟变量D的系数称为差别截距系数,表明赋值为1的类和基准类截距值的差距。,372,1、方差分析模型,虚拟变量和定量变量一样可以用于回归分析。模型中的解释变量可以同时包含定量变量和虚拟变量。若回归模型中的变量仅仅只有虚拟变量,这样的模型称为方差分析模型(ANOVA)。,373,例:大学毕业生的初职年薪,模型:Y=b0+b1D1+uY:初职年薪D1=1:大学毕业D1=0:其他(非大学毕业)毕业生初职年薪的期望为:E(Y|D1=0)=b0+b1*0=b0E(Y|D1=1)=b0+b1*1=b0+b1,374,大学毕业生的初职年薪,截距b0表示非大学毕业生的平均初职年薪“斜率”b1表明大学毕业生的平均初职年薪与非大学毕业生的初职年薪的差距b0+b1表示大学毕业生的平均初职年薪,375,例:回归结果/图形,376,例:工作权利法对工会会
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【语文】湖南省长沙县金鹰小学小学二年级上册期末试题(含答案)
- 数学六年级下册期末重点中学真题经典
- 高考物理带电粒子在复合场中的运动易错题二轮复习及答案
- 2025年地基与基础考试题及答案
- 2025年安全员之江苏省C2证土建安全员综合检测试卷含答案
- 2025年消防安全知识培训考试题库消防应急救援指挥应急处理试题及答案
- 2025年“世界知识产权日”线上知识竞赛题库(附答案)
- 水上钻探船钻探施工方案
- 2025年储冷、蓄热装置项目立项申请报告
- 热点营销-方案
- 便利店陈列培训
- 学校食堂餐厅投诉处理制度
- SolidWorks-全套基础培训教程
- 安吉汽车物流运输优化方案全套
- 软式棒垒球-上手传接球教案高一上学期体育与健康人教版
- 变更董事股东会决议
- 中国功夫介绍英文
- 驾驶员管理台帐
- 部编版五年级道德与法治上册第3课《主动拒绝烟酒与毒品》优秀课件【最新】
- 拆房协议书模板
- 制造企业物料试用单
评论
0/150
提交评论