版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章双变量回归的估计我们在第二章已导出PRL和SPL,回归分析的目的是运用样本估计 样本回归直线SRL,使之能最大限度“逼近”于PRL.即对于总体回 归直线-PRL,即Y = E(Y|X ) + u =。+。X + u (3.1)i1 i i 12 i i利用样本形成样本回归直线(SRL),由此而提出的问题是,在什么 假定下,运用何种方法形成SRL,使SRL尽可能逼近PRL(3.1)? 由于ui是对总体回归直线的偏差,自然地希望基于u来实现这一目的. 由于气的估计u度量了样本点Y到样本回归直线的距离(误差或偏差), 且成为u.的主部,因此基于总体误差u.就转化于基于样本误差U。如 果直接使Z
2、 u最小,但单个的u可能有正有负,有大有小,从而导致 部分匕较大但其代数和却较小,这样产生的参数估计和对应的样本回 归直线就可能没有最大可能逼近PRL的性质。类似地,可讨论对Z|u| 求最小所产生的问题。为回避这一类问题,通过对Zu2求最小所产 生的参数估计及其SPL,才可能尽可能逼近PRL,由此形成样本回归 直线的估计,即 TOC o 1-5 h z Y = B +B X + u(3.2)i 12 i i这一种方法称为最小二乘法(OLS)。现在,我们有总体回归直线Yi=E(Yi/X=Xi)+ui=p1+p2Xi+ui样本回归直线Y =B +(3 X + u = Y + ui人日(i = 1,
3、2)(为方便,有时亦记作b)为底的估计,匕(为方便,有时亦 记作ei)称为残差,可看作*的估计,Y为E(Yi/X=Xi)的估计,为方便和 出于残差的均值为o, Y即为y.的估计:1 1ii3.1.OLS回归分析的目的是运用样本数据,求出待估参数,为此将残差平方和 表述为待估参的函数并求最小,由此求出参数估计,这一过程为OLS, 实质上是最优化问题,故这一求解问题可表述为 TOC o 1-5 h z min Zu 2 =Z (Y - Y )2 =Z (Y 6 项 X V=f (P , P )(3.3)ii i12 i12i =1i=1(3.3)表明,残差平方和为待估参数的函数,因此对其求最小,能
4、 解出这些参数。我们从代数或统计中已学习,求(3.3)即是对其求偏导并令为0,即 TOC o 1-5 h z a ( u 2 )/ap = a(r - 8 - 8 x )2)/ap = 0 i1i12 i1a(u2)/ap =a(r -p -p x )2)/ap = 0 i2i12 i2有(r -P -P X )2)/郎=-2(r -pP -B x ) = -2u = 0i 12 i1i 12 ii2 (r - B - B X )X = -2 u X = 0i 12 i ii i一 一一Q Q4a ( u 2)/ap = a(乙 i1i 1 2 i1a( u 2 )/aB =a(r-p -B
5、x )2)/aB = i2i12 i2由此得到(3.4)-2 (r -B -B X ) = (-2 u ) = 0 n 1 i i r = + B 2 x = 0-2 (r -B -B X )X = (-2 u X ) = 0 n(3.5)v i p 2i i乙rx =px +p 乙x2 = 0, 一 求解有 x r 切(x - X)(r - r) 联立上述两个方程(记X - X = X , Y - Y = y )nxy 二二二、L = 旦= XT iyi (3.6)N X2 ( X )2 (X _ X )2 * 2AAP广 r 一2 X(3.7)对于(3.6)和(3.7)所得到的样本回归直线
6、的参数估计,由此得到OLS 样本回归直线(3.6)中,x,y分别为样本的均值,所以X -X,y -y为对样本均值 的离差,度量第i个观测值X和y对其均值的偏离。上述推导中,N 为样本点个数或样本长度,为方便,以后以小写的表示。将(3.6)代 入(3.4)中,有r=8 +8 X +u =r+ui12 i i i i对于上一章的例子和样本1,运用OLS所得到的SRL如下图,SRL具有性质:参数估计由样本信息所形成;这二个估计称为点估计(稍后将讨论区间估计),即给定一组样本河 得到相应的参数估计值,它们是对于总体参数(P)的一个点估计,不同 的样本,得到的估计可能不完全相同,不同的样本所得到的估计,
7、均是 对总体的一个点估计;由样本得到参数估计即得到了 SRL,样本回归直线具有性质:(1). SRL通过样本均值点(X, y )(由B =Y-B X n Y = B +6又,. .一 . 1 .一 212即样本均值满足样本回归直线,所以通过样本均值点),如图.Intro to EconometricsRegression basics slide 16图3.1样本回归直线SRF:Y =24 +(0.5 y1) X,_j|ofmeains (X=170Y=111).(2). y.的均值等于样本均值,即(3.9)?(= Y / n) = Y(= Y / n)ii这一性质是指,回归直线上的点的均值等
8、于样本均值。证明:由 Y = B +B x =(Y-B X)+B x = y+B(X -X) i 12 i22 i2 i故 EY /n = EY/n + (&2(X. - X)/n (X - X) = 0i所以Y = Y 残差的均值治0,即亦=( ui)/n = 0证明:由(3.4)2 (Y -P - B X ) = (-2 U ) = 0 n U = 0i 12 iii利用上述性质1,2, 3, SRL可以表述为离差形式。对于 TOC o 1-5 h z -6 +B X + u nN一涕 +B ZX +Zu ni 12 i ii12 iiY = 6 + B X n Y - Y = B (X
9、- X) + u (3.10)12i2 ii最后一步是将样本点表示(3.2)Y =6 +6 X + u(3.2)i 12 i i减去所得到的Y = 6 +6 X的结果。这样(3.10)即为样本离差形式12 一-即 X - X = x ,Y - Y = y,所以(3.10)为ii ii /一, 人y =6 x + u (3.11)i 2 i i于是,SRL可写为人yi =6 2Xi(3.12) TOC o 1-5 h z (3.12)实际上是将原有含截踞不过原点的直线平移至过以(x , y )为 原点的直线。(4)残差与预测或估计的Y不相关,这一性质需证明Z u y = 0。 对于相关的概念,我
10、们这里暂不从数学上说明,只是理解不相关的含 义为,两个变量没有线性关系,相关的严格定义在以后给出。我们这里说u与旧不相关,等价于u与y(=(Y -歹)=Y -Y)不相关。这 tr、.i Ii i ii是因为Z u Y =Z u(Y-Y+Y ) = Z u y +Z u y=Z u y i ii ii iii iy, = 6 2 Xj n日 Zyu =ZB xu = 6 Zx(y -B x)证明: .,寸2寸 2 i i 2 i=6 Z x y 一6 2Z x 2) v i i i=B 2 Z x 2 6 2 Z x 2(= 0)2 i 2 i因为(5). u与X不相关,即Z u x = 0,它
11、等价于Z u x = 0 o_Zu X =Zu (X - X + X) = Zu x +Zu X =Zu xi ii ii iii i这一性质由(3.5)给出.3.2. OLS的基本假定以上我们仅得到了估计以及相应的样本回归直线,尽管从估计的角度 看,运用OLS已经能求出参数的估计。但没有对残差的分布和变量 X作出任何假定,因此我们无法对这种估计或SRL作出评价和推断, 而回归分析的目的不仅要求出参数的估计,还需对总体作出推断,即 对于PRL= E(YIX ) + u =P +P Xi1 i i 12 i通过上述OLS方法,得到了 SRL= B +(3 x问题:SRL是否为PRL的一2个无偏估
12、计?如何定义无偏?这一问题 归结为估计量日(i = 1,2)在期望的意义下是否与总体参数p有偏差? 也就是说,从SRL能否推断PRL的真值?解决这一问题的途径是对 总体的残差作出分布假定,然后讨论估计量的分布性质,基于此讨论 估计量是否有偏等一系列问题。另一方面,从PRL可知,Y依赖于 X和扰动,只有对X和扰动作出相应的假定,才可能对Y和参数作 出统计推断,亦即对模型作出评价。经典线性回归模型(CLRM)或 称为高斯或标准直线回归模型具有10大假设,构成了计量经济学理 论基础。在这10大假设下,SRL具有对总体无偏等性质。这些假定 有下述10条。线性回归模型,即模型对参数而言是线性的。这一假定
13、强调的是 对参数,而不是变量。如Y=P+P2X+uY=p1+p2X1+p3X2+u为线性模型(对参数而言),但Y=p1+p2X1+p 1 p2X2+u对参数而言就是非直线模型,如果设定这样的非直线模型,则违反了性 线回归模型的假设.在重复抽样中X是固定的,或X是非随机的。这一假定难以理解, 对于表2.1所假定的总体,对于X=80,随机抽取一个家庭,其Y= 70,直至X=260,随机抽取Y=150,在第二次抽样时,仍将X固定在X =80,再次抽取一个样本Y=55,直至X=260,随机抽取Y=175.这种 重复抽样的过程是将X固定在X=80直至X=260.在重复抽样过程中, 将X固定或不变,从这个
14、意义上说,X是非随机的,X固定后,随机 抽取相应的Y。干扰项或随机项的均值为0,即E (u X ) = 0这一假定是对于固定的X,如X=80,指偏离总体条件均值的和为0, 无论个别的偏差有多大(小),是正还是负,其和为0.回到表2.1,X =80,总体为5户家庭,Y的均值为65,第一个家庭的Y为55,偏 差为一10,第二个为60,偏差为一5,等等,这些偏差相加应为0,也就是说,正和负的偏差相互抵消。图3.3P49所示。 由上述性质2和3,回归分析是建立在条件回归的基础上。随机项的同方差或扰动的方差相同。即var(u |X.) = E(u -E(u )|X.)2 = 2Vz由P50的图3.4所示
15、.图3.2.扰动(以及Y的同方差 与之不同的是异方差,如下图所示.图3.3.扰动(以及Y的异方差 这是因为由假定3即扰动的均值为0,var(u IX ) = E(u - E(u )|X )2 = E(u X )2 i iii ii i=E(Y X ) - E(Y X )2 = var(F |X )=扰动之间无(自)相关。即给定任意的X的两个值,对应的扰动没有自相关。基于相关和协方差的定义,不相关与协方差为0等价。 即 f , 1cov(u ,u X , X ) = Eu - E(u ) X )1(u - E(u ) X i ji i i j J ji i jcov=E(uXi )(uj|Xj)
16、 = 0,Vi, j, i 卫 j其中的记号co;表示协方差。回到例2.1,如 X = 80和X=100两个 不同的水平,与总体均值的偏差不相关。协方差正是针对不同水平之 间而定义的。这一性质所强调的是,所有的与总体均值的偏差(误差) 之间不相关,而不仅仅是对给定某一水平(如X=80 )之下的误差而 言。与之不同的是残差的相关,即残差之间具有某种变化的规则. 对这种相关性,目前只能作直观的解释。我们在分析表2.1所示的总 体中,如果与u正相关,总体函数为Y =p +p X +u,Y不仅依赖 于X,也依赖于;,而u依赖于u。 t 12 t 扰劫与X不相关,或但们之间时协方差为0。E (u iii
17、.-E(X )E(u ) = 0/ E(X )non - schastic11 E (u ) = 0icov(u ,X ) = Eku -E(u )1X. -E(X.)1 =E(u )X即:=E(u X ) - E(X ) E(u )=E(u X )=0这观赢的雾的长E度大摆临宸是一个数。X值要有变异性,即对于一个给定的样本,X的值不能全部相同, 也就是说,X的方差必须是一个有限的正数。反之,若X在一个样 本中取相同的值(无变异性),方差就为0,无法估计参数。正确设定了模型,或者说,所用的模型不存在设定误差。所谓设定问题,在本书中包括:模型应包括哪些变量,模型的函数形式(如线性还是非线性),对
18、模型的变量和扰动应有哪些假定等。以后我们还应看到,设(1)(2)(3)定问题还有更多的内容。所谓设定误差即是指,当模型应包括但没有包括某一个变量而引起的 误差;当模型应为线性而将其设定为非线性(或反之)而引起的误差 等.以线性和非线性菲氏曲线为例,菲氏曲线理论所陈述的是,货币工 资变化率(或通胀率)与失业率彼此消长的关系,即yi=P1+P2(i/xi)+ui若将菲氏典线模型设定为Yi=P1+P2Xi+Ui则y.=p1+p2x.+u.具有设定错误,或不当设定.以上的假定就是全部关于经典线性回归(CLR)的假定,这些假定是 对总体作出的假设,不是对样本回归函数的假定。但是,OLS的一些 性质,与上
19、述某些假定类似。如OLS的均值为0与扰动均值为0相 似,即 it /n = u = 0 与 E(wJX.) = 0 U X = 0 与 cov(u X ) = 0但是一个是对样本,另一个是对总体。我们特别说明,这些假定并不 一定全部成立,但在这些假定之下,所得到的回归和SPL,为以后的 分析建立了一个框架,或镜子,违反这些假定的任何一条,将得不到 这些假定之下的估计量的性质。因此,计量经济学正是对这些假定的 逐步取消或在某些假定之下能导出仍然有效的估计或统计推断而不 断将研究的问题深入和逼近现实。10.解释变量之间没有完全的共线关系。回忆线性代数中关于共线的 定义,对于向量X和Z,若存在常数8
20、】和,使得对于81X+52Z=0,有 X=(S 1/5 2)Z,称 X 和 Z 共线.在计量经济模型中,对于模型Y=p1+p2x+p3z+u若X和Z的样本,使得X=(8 1/8 2)Z,即称它们完全共线,我们以后将会 看到,在这种情况下,OLS将无法估计模型.3.3.OLS的精度:标准差我们在前面有关异方差的讨论中已说明,方差越小,与总体的偏离 就越小,对这一问题的正式分析即为标准差。从OLS可知,估计量均为样本数据的函数,如何评价估计量的可信度或精度?工具就是所谓标准差。对于样本回归直线其参数估计为Y =B +(3 Xi 12 i其方差定义为var(p ) = E(P22标准差定义为-E (
21、 P )2 = E ( P -P )2 = E (E (x / x 2)u )2 =b 2/E x 2222ii ii同理,有se(P ) = v var(P ) =b / 飞: x222* i(3.12)var(P )与c 2 n se(P ) 2 与,1一21:乃, x2(3.13)以上的参数估计的方差和标准差都含总体扰动的方差和标准差,而总体扰动一般是不可观测的,即总体方差c 2和标准差c是未知的,故需 要用样本予以估计,我们以下予以推导。从Y = P + P X + u n Y = P + P X + uy = P x + (u u)12 i i12i 2 i iu = y P x y
22、Tu = P x + (u u) P x n u = (P P )x + (u u) n ii2 ii2 ii2 ii22 ii八/OOxz、u = (P P ) x + (u u) yt q2 人 2 i niE Z/2 = ( P P )2 E x2)+ E (u - u )2 E(Eu2) = E(P P )2)E x2) + i-2( P 2 P 2)E x (u u)君_ P )2)E x 2) + E(E (u u)2) 2E【(P P )E 22c 2 +i(n 1)c 2x (u u)2- 2 i i2c 2 = (n 2)c 2若定义E,、 u 2 c2 =L n E(c2)
23、 = c2(3.14)E所以定义c2匕,则它是总体方差的无偏估计。进一步,标准差的 估计即为方差估计开平方。即总体的估计的标准误差为c =工,(3.15)n 2这一估计量所度量的是,样本Y对估计的回归直线的离差的平方的 标准差。注意的是,b2所度量的是,所有的Y与总体直线的偏差的 平方,而b 2仅是它的一个无偏估计,度量的是与估计的直线即样本 回归直线的偏差的平方。图示。观测值与总体直线和回归直线的偏差。 对于上述所估计的参数的方差即(3.12)和(3.13),有如下特点:(1)由var(B= b2/EX2可知其特点,即它与b2正比,与股反 比,因此,对于给定的。2,度量X值变化的xf越大,v
24、aMj越小, 说明p 2的估计越精确,因此我们假定X要有变异性。另一方面,随 着样本长度增加,Ex2变大(相对于小样本而言),从而使估计越精 i确。同理分析p 的方差。(2)B(,= 1,2)是样本估计量,故不同的样本所得到的估计不一定相同,对于同一样本,它们还可能是相互依赖的,或是相关的。 这种相互依赖性由它们之间的协方差所度量,可推证其协方差为cov(B ,pp ) = Xvar(B ) = X(b2/x2)(3.16)122i如何利用估计量的方差来评价这些估计量的可靠性,这即是统计推断 问题。3.4. OLS估计量的性质:高斯一马尔可夫定理估计量关于X是线性的。即& (i = 1,2)是
25、关于K的线性组合,由于y 为随机变量的一个样本,所以估计量也是一个随机变量。作为例子,1.2.在给定上述假定条件,由OLS所得到的估计量所具有的性质:.ExxEEp =2_L_L = i y 三乙k y ,(k = x /乙 x2)2E x 2E x 2 i i i i i ,一 1a 一估计量是无偏的,即E(p ) = p (i = 1,2)。例子 i iE(p ) = E(k y ) = E(k (Y Y) = E(kY )(v k = 0) n TOC o 1-5 h z 2 E(p ) = EE (k (p +p X + u ) = El p Ek +p EkX +Eku /=2、i
26、1 、2、 i i1 i 2 i ii ip +EE(ku ) = p ( EkX = 1,E(ku ) = 0)2i i 2i ii i3. B (i = 1,2)在所有线性无偏估计量中具有最小方差(具有最小方差的 估计量称为有效估计量).高斯一一马尔可夫定理:在给定经典线性回归模型的假定下,OLS估计量,在无偏线性估计量中,具有最小方差,即OLS估计量是最优 线性无偏估计量(BLUE).注意:有效估计量强调最小方差,即对所有线性和非线性估计量,只 要是最小方差,就称为有效估计量。一般而言,这一定义对于大样本 而定义的。而BLUE是定义在所有线性估计量中,方差最小的估计量称为BLUE。 也就
27、是说,对于其它任何线性无偏估计量,日( = 1,2)的方差均比它们 的方差小。因此,证明BLUE的方法是假定有一个线性无偏估计p*, 需证明.var( P *) var( P )2由于p *的任意性,即B具有最小方差。如图P59所示,由于&和p *均 为线性无偏,所以它们的分布图都对称于真值p 2,即 E (p ) = E (P *) = P,但由于var( P *) var( p ),故p的分布图比p *的分布 2.222图更集中于总体p。3.5.判定系数:拟合优度的一个度量1.以上所讨论的是关于估计量的性质,即线性无偏且方差最小,因此, 样本回归直线是总体的一个无偏且具有高精度(方差最小)
28、的估计,但 由于总体一般是未知的,所以以下的分析针对样本回归直线。但对于 所谓尽可能逼近还没有正式定义和度量,所谓尽可能逼近,其定义和 度量之一是,围绕样本回归直线的偏差(残差)尽可能小,即样本数 据尽可能拟合SRL,度量这种拟合程度即为判定系数,或拟合优度, 记为尸2(R2)。基于对SRL的残差尽可能小,我们以下导出拟合优度的公式。Y = Y + u n y = y + ui y u i = 0)由!X y 2 =Z y 2 ;Z u 2 + 2Z y u =Z y 2 +Z 必(. Z=6 2 乙 2+Z u 2(. y =6 育 2 ii i 2 i(3.17)在(3.17)中,定义(3
29、.18)TSS = S y 2 =E (Y - Y )2 =E (Y - V )2 ii ii i(3.18)所度量的是所有观测值(样本点)与其均值(或总体均值, 因为= Y)的总变异(y -Y),故称为总变异或总平方和,记为TSS。 而解释平方和ESS定义为ESS = X 2 =X (Y Y )2 =X (Y ? )2i i i i i(3.19)=& 2 X %2由于在ESS中,X (Y -Y)2表示回归直线上的点与样本均值(等于总 体均值)的总离差,因此它度量了回归直线与总体均值的“逼近”程度, 故称为解释平方和,或由回归解释的平方和,即在TSS (总变异)中, 由回归所解释的变异。而残
30、差平方和RSS定义为RSS = X U2(3.20)i这一项称为残差平方和。这样TSS就分解为TSS=ESS+RSS(3.21)其意义如上所述,图示如P61图3.10.图3.3. Y的总离差分解图对(3.20),有1=ESS/TSS+RSS/TSS拟合优度的定义即是在总变异中,由回归所产生的变异占的比重(3.22)ESS X(Y - Y)2RSSXu2TSS X(Y - Y)2 i r2(R2)可表示为r 2 = _i= 1 一匚TSS X(Y - Y)2i显然,有0 r2 1,经简单推导,ESS 奂人乙2但)r 2 = V i = P 2 W i = 一TSS 乙 y 2)2 Y2 -( Y
31、 )2 1 乙 y 2 乙 x 2 乙 y 2iii i进一步,将TSS=ESS+RSS用r2表示,有y2 = r2y2+ (1 - )y2iii图示:用园表示变异,r2的大小可直观表示为下图.8. Precision of estimates and fit.Venn diagram view of fit:r2:=0CDr2 =:0.5Intro to Econometricsr2 =:0.9Regression basics slide 243.相关系数X和Y的相关系数,度量这两个变量之间的线性相关程度,这 是与拟合优度相关但不相同的一个概念。定义:X和Y之间的相关系数,定义为X2 (
32、X )(3.22) xyr L( X2)2( y2)2)、 iiVn XY - ( X )( Y)这一相关系数称为样本相关系数。我们前面所讲的拟合优度的意义是X的变异对Y的变异的解释程度,即r2=ESS/TSS但相关系数r所度量的是线性相关程度,尽管它们之间的关系为r = : r 2相关系数r的性质:1. -1 r 0,b0,a,b,c,d 为常数;4. X 与 Y 独立,则它 们之间的相关系数为0,反之,不相关,即相关系数r=0不等于它们独 立;5.相关系数r仅是线性相关(或线性相依)的一个度量,不能用于度 量非线性,如X与Y之间有非线性关系Y=X2,即X与Y没有线性相 关,故相关系数r=0
33、; 7.相关系数r不能度量X的变异解释Y的变异 的程度.P64图3.11所示的是正负相关和不相关的图解,当X的变化 与Y的变化成比例,X与Y有正或负相关,而当X与Y呈现出近似 的比例变化,r接近于1或一1,而r=0表明X与Y之间没有线性相 关而是具有确定的非线性的函数关系。 TT3.6数值例子。关键概念,MPC,估计,注意S =一, n - 2从表3.2中读取数据X.和Y.后计算x.=X.-又,*=匕-Y和x2.,x.y.(i=1,2,_10)等数据,按定义计算T。2 = T = 0.5091,0 = Y -。2X = 24.4545iSr计算 Y = 24.4545 + 0.5091X n
34、U = Y - Y n YU 和 S =J=42.1591, ii i i i i i 10 2进一步,计算参数估计的方差和标准差:var(0 ) =6 2 /Sx2 = 41.137,se匕)=6 /(Sx2)1/2 = 6.14. T x 2.-Txtvar(。) = 62 = 0.0013,se(0 ) =ey | v z = 0.0357110乙 x 2110乙 x 2i1icov(6 , B ) = -X6 2 /T x2 =-0.217212再计算TSS,ESS和RSS和拟合优度TSS = 1(Y - Y)2 =Z y2,ESS =-Y)2=四y2, TOC o 1-5 h z i
35、iii=1i=1i=1i=1RSS = Z(Y - Y )2 =1Lu2, r2 = ESS/TSS = 1 - (RSS/TSS) = 0.9621, r = 0.9809ii=1i=1基于以上的计算所得到的回归直线为人= 24.4545 + 0.5091Xii其样本表示为= 24.4545 + 0.5091X + U.图形为:Intro to EconometricsRegression basics slide 16SRF:Y =24 +(0.5L1) X*gofmeains (X=170Y=14nJ对于以上的计算(估计)结果的解释:样本回归直线是总体回归直线的一个估计,即对于任一 X(
36、如 X=100),从样本回归直线上可找到相应的点 Yx_100=24.4545+0.5091*100=75.46 它是总体 E(Y/X=100)的估计,一般 地,Y为E(Y/X=X.)估计,由于E(Y/X=X)为条件均值,所以Y为Y的期 望(均值)的估计;12.& = 0.5091表示在X=80至260这样的极差变化的范围内,周收入X2每增加一美元,将使每周消费增加0.51美元,即MPC=0.51,p = 24.4545可机械地解释为当收入为0时,每周消费平均需24.4545,1由于X的值不包括0,故上述解释是强行令X=0,故这种解释是机械地 解释.另一种解释是,模型仅包括收入变量,故截距的估
37、计可解释为没 有包括在模型中的变量对消费的平均影响.拟合优度为0.9621,表明样本回归直线对数据拟合的程度很高,从 图形看,样本数据Y没有偏离样本回归直线较远,且有两个点落在直线 上,说明每周消费的变异约有96%被X所解释。3.7例子例1.美国咖啡需求:替代品与模型设定,即咖啡的替代品(水,茶等) 可能对咖啡需求产生影响,如考虑替代品的影响,需用多元模型。我 们这里用二元模型研究需求与价格的关系(可能导致模型设定偏差), 作为例子,用每人每日杯数和每杯价格分别作为应变量和解释变量, 故模型为yi=Pi+P2xi+Ui例2.消费函数与关于总体和样本的例子不同,本例研究总量个人消费支出(PCE,
38、记 为Y)与GDP(度量总量收入,记为X)的关系,基于消费理论,有Yi=Pi+P2Xi+Ui运用EVIEWS,第一步,输入数据;第二步,根据所设定的模型进行 估计,命令:LS Y C X,产生回归结果;第三步,报告和分析回归 结果.数据如图80 81 82 83 84 85 86 87 88 89 90 91回归:LS Y C XDependent Variable: Y Method: Least SquaresDate: 09/05/04 Time: 18:31Sample: 1980 1991Included observations: 12VariableCoefficientStd.
39、 Errort-StatisticProb.C-231.79510357694.5275-2.45210.03413X0.7194334726580.0217433.07801.5051e-11R-squared0.99094334525Mean dependent var2880.6Adjusted R-squared0.990037679775S.D.dependent var314.4417S.E. of regression31.3848778159Akaike info criterion9.8815Sum squared resid9850.10555522Schwarz crit
40、erion9.96235897529Log likelihood-57.289247202F-statistic1094.16045179Durbin-Watson stat1.28418254948Prob(F-statistic)1.50516803291e-11基于以上的回归结果,有Y = 231.8 + 0.719 Xiise(6 ) = 94.53se(B ) = 0.02212r 2 = 0.993.8 .要点:1.CLRM,方差标准差及其估计性质,无偏估计,最优无偏估计,评价数据对模型的拟合优度,BLUM的假定与估计性质,概念:方差与变异,自由度,相关系数,独立。第四章 正态性假
41、定:经典正态线性回归模型在前面的分析中,我们对扰动作出了一系列假定,但没有假定分布, 相应地,对估计量也就没有讨论分布问题,因此,我们也无法对估计量 进行推断.本章将继续讨论推断这一问题.对于模型Y = P +P X + u(4.1)i 12 i i我们首先讨论扰动u的分布。4.1. u的概率分布.前述对(4.1)作OLS时,对扰动的分布没有假定。也就是说,无论 扰动的分布为何,对(3.1)作OLS,所得到的估计量,在前面10 条假定之下,均为BLUE,如果研究的目的仅是估计参数,OLS方法 就可实现这一目的。但是,没有分布假设,不可能对估计参数作出任 何推断,也就不可能对估计作出有意义的评价,而且也不可能对任何有关总体的假定作出检验。对的概率分布作出合适的假定,即假定 为正态分布,能解决上述问题4.2. u的概率分布假定为正态分布iE(u ) = 0E (u 2) =c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026新疆乌鲁木齐市科信中学教师招聘备考题库附答案详解(达标题)
- 员工自我评价范文总结范文十篇
- 餐饮企业从业人员健康管理不到位整改报告
- 2026广东深圳市宝安区西乡文康小学诚聘语文教师备考题库附答案详解(达标题)
- 2026上半年贵州事业单位联考安顺市招聘601人备考题库含答案详解(夺分金卷)
- 2026上半年重庆事业单位联考重庆市属单位招聘242人备考题库含答案详解(能力提升)
- 2026年青岛市交通运输局所属部分事业单位公开招聘工作人员备考题库(5名)带答案详解(培优a卷)
- 2024年阿拉善职业技术学院马克思主义基本原理概论期末考试题含答案解析(夺冠)
- 2026四川广元市苍溪县人力资源和社会保障局第一批就业见习岗位备考题库及参考答案详解一套
- 2026云南临沧市统计局城镇公益性岗位人员招聘1人备考题库附参考答案详解ab卷
- 路面工程的检测方案(3篇)
- 粮食仓储管理培训课件
- 压力开关校准培训课件
- 煤矿炸药管理办法
- 幼儿园食堂工作人员培训计划表
- 文学常识1000题含答案
- (高清版)DB31∕T 1289-2021 户外广告和招牌设施安全检测要求
- 丁华野教授:上卷:幼年性纤维腺瘤与叶状肿瘤
- 输液导轨施工方案
- 《肿瘤治疗相关心血管毒性中医防治指南》
- 肺结节科普知识宣教
评论
0/150
提交评论