大三上计量济学二章_第1页
大三上计量济学二章_第2页
大三上计量济学二章_第3页
大三上计量济学二章_第4页
大三上计量济学二章_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章一元线性回归模型古典线性回归模型及其基本假设回归参数的点估计——OLS法经典假设满足时的区间估计与假设检验方差分析与拟合优度用回归模型进行预测一元线性回归分析案例一、古典线性回归模型任意抽出一个妇女,试猜测其体重如何猜?准确性如何?猜平均体重,最大偏差:26如何猜得更准确?影响体重的最直接因素是身高:一般身高高的人体重大。平均身高:62.85inch,标准差:3.3以平均身高分界:最大偏差20E(weight/hight)=b0+b1hight,例:20个妇女的体重资料如表,

平均体重:123.6pound,标准差:15.5

最低体重:93pound,最大体重:155一个身高60的妇女体重平均111.5,最大偏差1293155体重均值123.6猜体重平均值,最大偏差:26身高相同的人体重不一定相同平均来看,体重随身高的增加而增加平均身高62.85134.0113.2以平均身高分界,高于平均身高猜134,低于平均身高猜113.2:最大偏差20能不能猜得更准?这条直线的含义是什么?一个身高60的妇女体重平均111.5,最大偏差12观测值weighti估计值weight身高体重总体回归线通常,身高高的人体重大。同样身高的人体重不同,即在给定身高下,体重有一个分布。大样本下为正态分布。总体回归线反映了给定身高下,体重的平均水平:E(weight/hight)=b0+b1hight

,b0,b1是未知的参数已知20个妇女的身高体重资料以此为样本估计总体参数样本回归线为什么要有

回归分析的任务:从样本回归线估计总体回归线一元线性回归的一般模型其中:(Yi,Xi)-样本观测值,

0、1回归系数(总体参数,待估),

i-随机误差项(方差为总体参数,待估,反映了因变量的离散程度)

1的经济意义:X对Y的影响程度:X增加一个单位,平均来说将导致Y增加

1个单位经典回归模型的基本假定假设1:解释变量x是非随机变量,它的值是确定的——条件回归。Yi与

i同分布。假设2:随机误差项具有0均值和同方差。即:E(

i)=0,Var(

i)=i=1,2,…,n

685810360111144hightweightE(

i)=0的说明E(

i)=0即:凡是模型不显含的、因而归属于

i的因素,对y的均值都没有系统影响。如果E(

i)=

,即被省略的变量对y的均值有系统性影响,则有:Yi=

0+1Xi+i=0+1Xi+i+-=(0+)+1Xi+(i-)=+1Xi+——新模型,——所有系统性影响都包含在截距项(常数项)中,所以一般不予过多关注。总体回归函数Var(

i)=的说明随机误差项具有相同的散布程度,即对应于不同x值的y总体具有同样的方差。如果Var(

i)=则称随机误差项具有异方差每周收入$每周支出$每周收入$每周支出$古典回归模型的基本假定假设3:随机误差项在不同样本点之间是独立的,不存在序列相关,即:Cov(

i,j)=0iji,j=1,2,…,nCov(

i,j)=E[(i–E(i))(j–E(j))]=E(

i

j)=0当来自于不同观测值的误差项相关时,即其协方差不为0,则称这个误差序列是序列相关的。古典回归模型的基本假定

i

j

i

i

j

j古典回归模型的基本假定假设4:随机误差项与解释变量之间不相关,即:Cov(Xi,

i)=0i=1,2,…,n此假定意味着X和

(代表了所有被省略的变量的影响)对Y有各自的影响,并且使可加的。当X为非随机变量时,此假设自动成立。证明?Cov(Xi,

i)=E[(Xi–E(Xi))(i–E(i))]=0古典回归模型的基本假定假设5:随机误差项服从0均值,同方差的正态分布,即:

iN(0,)YiN(0+1Xi,)前4个假设构成了古典线性回归模型。对于假设5,根据中心极限定理,但样本容量趋于无穷大时,对于任何实际模型都是满足的。二、回归参数的点估计回归参数的最小二乘估计最小二乘估计量的性质1.普通最小二乘估计(OLS)一元线性回归模型:Y=

0+1X+在μ的零均值假设下,——总体回归线总体回归线:说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。

0、1为总体参数1.普通最小二乘估计(OLS)随机抽取n组样本值Xi,Yi,i=1,2,…,n,有Yi=

0+1Xi+i利用样本数据得到参数

0、

1的估计量、设被解释变量Yi的估计值为:样本回归线可以看作是对总体回归线的一个点估计样本观测值与估计值的关系为:

称为回归残差,它是对随机误差项

i的一个估计——样本回归线回归分析的主要目的:根据样本回归函数估计总体回归函数。1.普通最小二乘估计(OLS)OLS的思路:使残差平方和最小,即:极值条件:残差的性质正规方程组正规方程组的另一种写法:1.普通最小二乘估计(OLS)求解上述联立方程得到回归参数点估计量:其中:分别是xi和yi的离差随机误差项方差的估计量为:1.普通最小二乘估计(OLS)OLS回归线的性质:回归线通过Y和X的样本均值,即:

残差之和为零,即:残差和Xi不相关,即:残差和Ŷi不相关,即:证明?*极大似然估计基本原理:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。ML必须已知随机项的分布。Yi的分布Yi的概率函数

Y的所有样本观测值的联合概率—似然函数

对数似然函数

对数似然函数极大化的一阶条件结构参数的ML估计量结果与参数的OLS估计相同。分布参数的ML估计量分布参数估计结果与OLS不同2.最小二乘估计量的性质高斯-马尔可夫定理:在给定经典线性回归模型的假定下,最小二乘估计量在无偏线性估计量一类中具有最小方差,即它们是最优线性无偏估计量(BLUE)。线性性:

0、1的最小二乘估计量是Y的观测值的线性函数,即:无偏性:一个估计量的均值(期望)等于其真值,即:有效性:在所有线性无偏估计量中方差最小OSL估计量与各类估计量的关系全部估计量线性估计量子集线性无偏估计量子集BLUEOLS估计量性质的证明线性性的证明:性质:1.ki非随机

2.

ki=03.4.基本假设1OLS估计量性质的证明无偏性证明:0均值假设OLS估计量性质的证明有效性证明:方差的推导方差的性质:同方差假设无序列相关假设最小二乘估计量的方差OLS估计量性质的证明有效性证明:设为

1的任一线性无偏估计量,则有:且

i=0

iXi=1只要iki,关于OLS估计量方差的说明对给定的,方差越大,回归系数估计量的方差就越大,估计精度越低;对给定的,x值越分散,的方差越小,估计的精度越高。

和之间的依赖性由它们间的协方差来衡量。

随着样本容量n的增大,总和中的项数将增加,1的估计精度也随之增加。负号表明:如果

1被高估,0就将被低估三、经典假设满足时的区间估计与假设检验只有在经典假设满足时,OLS估计量是最优线性无偏估计量——区间估计和统计检验的前提条件回归系数的置信区间回归系数的假设检验——t检验1.回归系数的置信区间求

1的置信区间在

i正态性假定下,OLS估计量也是正态分布的:

构造t变量:设给定的显著性水平是,其/2的临界值为t变量遵循自由度为n-2的t分布

置信上限置信下限例1.手表需求函数根据我国1973-1983年手表价格和销售的实际资料拟合手表需求函数,置信度95%。解题步骤:作散点图,观察销售量与价格的相关形式建立一元线性回归模型yi=

0+1xi+i i=1,2,…,ny:手表销售量x:手表平均价格,结果:ŷi=9642.6-64.95xi

se:(1009.8)(8.4)

195%的置信区间:t=2.262

的95%的置信区间为(0.42,0.60)

例2.凯恩斯消费函数每周家庭消费支出y和每周家庭收入x的数据如表,求凯恩斯消费函数。建立一元线性回归模型yi=

0+1xi+i i=1,2,…,ny:每周家庭消费支出x:每周家庭收入结果:ŷi=24.45+0.51xise:(6.41)(0.04)

195%的置信区间:t=2.306,

=2.306*0.04=0.092.回归系数的显著性检验凯恩斯消费函数例。样本回归方程为(一次估计):

ŷi=24.45+0.51xi→E(yi/xi)=

0+1xise:(6.41)(0.04)H0:1=0;H1:10检验统计量t服从n-2的t分布接受域:或t的精确p值大于

。结果:计量经济学中,回归系数的显著性检验主要是针对回归参数真值是否为零来进行的。2.回归系数的显著性检验对一元模型yi=

0+1xi+i

得到回归系数的估计值后,软件输出两个常规检验的t统计量,并给出各自的精确p值:一般t检验:经济意义检验一般回归系数的显著性检验用t检验:边际消费倾向1<1的假设检验?H0:11H1:1<1拒绝域:或t的精确p值小于

=0.05,T

=-1.86

统计上显著,拒绝原假设p(t)=3.88E-07四.方差分析与方程显著性检验方差分析:一个好的方程应该是有助于解释y的大部分变异的方程。回归误差,可由X的改变解释残差:随机四.方差分析与方程显著性检验TSS=RSS+ESS总平方和残差平方和回归平方和Y的变异拟合优度拟合优度由判定系数来衡量:含义:Y的总变异中可由X变化解释的部分所占百分比0r2

1如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,r2越接近1,拟合程度越高方程的显著性检验:对模型中被解释变量与所有解释变量之间的线性关系在总体上是否成立做出判断。H0:1=0,H1:1≠0检验统计量F构造如下:如果

I服从正态分布,则F服从分子自由度为1,分母自由度为n-2的F分布。F

(n1,n2)

给定显著性水平

,则当F1,n-2F临界或当F1,n-2的p值小于时,拒绝原假设。注意F统计量与t统计量的区别注意:一元线性回归中,t检验与F检验一致

一方面,t检验与F检验都是对相同的原假设H0:

1=0

进行检验;

另一方面,两个统计量之间有如下关系:

参数估计的标准误回归参数估计值单零检验之t统计量:H0:B=0方程显著性检验之F统计量判定系数假设检验例:凯恩斯消费函数残差平方和因变量均值因变量标准差假设检验例凯恩斯消费函数估计结果

ŷi=24.45+0.51xi

Se:6.4140.036t:3.81314.243p:0.00510.0000在5%的水平下显著R2=0.962即:96%的每周支出的变异能由收入来说明F=202.868p(F)=0.0000在5%的水平下显著在$80-$260这个极差范围内,收入每增加$1,平均消费估计增加$0.5120个妇女的体重对身高作回归身高对体重的影响是显著的吗?求回归系数95%的置信区间五.利用回归方程做预测给定样本以外的观测值X=X0,可以得到Y的条件均值

E(Y0/X0)=

0+1X0的估计值:xy均值预测方差的特征?1.均值预测:给定X0,预测E(Y0/X0)均值预测的置信区间可以证明Ŷ0也遵循正态分布。以代替,构造t统计量:2.个值预测:给定x0,预测Y0=

0+1X0+0给定样本以外的观测值X0,可以得到单个Y值(Y0=

0+1X0+0)的估计值:则:个值预测方差的特征?凯恩斯消费函数例:ŷi=24.45+0.51xi每周家庭收入为300元(x0=300),估计其消费支出的均值和个值95%的置信区间。x0=300,均值置信区间:177.45±5.08t2/

=个值置信区间:177.45±8.24t2/

=177.45±5.08×2.306=(165.74,189.16)177.45±8.24×2.306=(158.45,196.45)六、一元线性回归分析案例我国1980-2001年发电量与GDP数据如表,试作一元回归模型,并作回归系数的区间估计与假设检验作发电量与GDP的散点图,选择合适的函数形式建立模型yi=

0+1xi+i

EVIEW估计结果线性模型yi=

0+1xi+i参数估计值参数估计值的标准误差参数t检验:H0:=0t检验的精确p值估计结果本章小结一元线性回归的一般模型随机误差项的内涵一元线性回归模型的经典假设回归参数的OLS估计基本思想:残差平方和最小几个基本关系式Yi=

0+1Xi+iOLS估计量的性质高斯-马尔可夫定理线性性、无偏性、有效性的含义及证明OLS回归线的性质及证明OLS估计量方差的性质回归系数的区间估计回归系数的假设检验:单零检验,一般t检验:查表法、精确P值方差分析、拟合优度与方程的显著性检验三种平方和,联合零检验,F统计量利用回归方程作预测均值点预测和区间预测、个值点预测和区间预测课堂练习1:下面的陈述是正确的、错误的或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论