免费预览已结束,剩余17页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元线性回归与最小二乘估计1假定条件、最小二乘估计量和高斯马尔可夫定理 多元线性回归模型:yt = 0 +1xt1 +2xt2 +k- 1xt k -1 + ut (1.1)其中yt是被解释变量(因变量),xt j是解释变量(自变量),ut是随机误差项,i, i = 0, 1, , k - 1是回归参数(通常未知)。 对经济问题的实际意义:yt与xt j存在线性关系,xt j, j = 0, 1, , k - 1, 是yt的重要解释变量。ut代表众多影响yt变化的微小因素。使yt的变化偏离了E( yt) =多元线性回归与最小二乘估计1假定条件、最小二乘估计量和高斯马尔可夫定理 多元线性回归模型:yt = 0 +1xt1 +2xt2 +k- 1xt k -1 + ut (1.1)其中yt是被解释变量(因变量),xt j是解释变量(自变量),ut是随机误差项,i, i = 0, 1, , k - 1是回归参数(通常未知)。 对经济问题的实际意义:yt与xt j存在线性关系,xt j, j = 0, 1, , k - 1, 是yt的重要解释变量。ut代表众多影响yt变化的微小因素。使yt的变化偏离了E( yt) =0 +1xt1 +2xt2 +k- 1xt k -1决定的k维空间平面。 当给定一个样本(yt , xt1, xt2 , xt k -1), t = 1, 2, , T时, 上述模型表示为 y1 =0 +1x11 +2x12 +k- 1x1 k -1 + u1, 经济意义:xt j是yt的重要解释变量。 y2 =0 +1x21 +2x22 +k- 1x2 k -1 + u2, 代数意义:yt与xt j存在线性关系。 . 几何意义:yt表示一个多维平面。 yT =0 +1x T 1 +2x T 2 +k- 1x T k -1 + uT, (1.2)此时yt与x t i已知,j与 ut未知。 (1.3) Y = X+ u , (1.4)为保证得到最优估计量,回归模型(1.4)应满足如下假定条件。假定 随机误差项ut是非自相关的,每一误差项都满足均值为零,方差 s2相同且为有限值,即E(u) = 0 = , Var (u) = E( ) =2I = 2.假定 解释变量与误差项相互独立,即 E(X u) = 0.假定 解释变量之间线性无关。rk(X X) = rk(X) = k .其中rk()表示矩阵的秩。假定 解释变量是非随机的,且当T 时T 1X X Q .其中Q是一个有限值的非退化矩阵。最小二乘 (OLS) 法的原理是求残差(误差项的估计值)平方和最小。代数上是求极值问题。minS = (Y - X) (Y - X) = Y Y -X Y - Y X +X X = Y Y - 2X Y + X X. (1.5)因为Y X是一个标量,所以有Y X = X Y。(1.5) 的一阶条件为:= - 2X Y + 2X X= 0 (1.6)化简得 X Y = X X因为 (X X) 是一个非退化矩阵(见假定),所以有= (X X)-1 X Y (1.7)因为(1.5)的二阶条件= 2 X X 0 (1.8)得到满足,所以 (1.7) 是 (1.5) 的解 。因为X的元素是非随机的,(X X) -1X是一个常数矩阵,则是Y的线性组合,为线性估计量。求出,估计的回归模型写为Y = X+ (1.9)其中= ( ) 是的估计值列向量,= (Y - X) 称为残差列向量。因为 = Y - X= Y - X (X X)-1X Y = I - X (X X)-1 X Y (1.10)所以也是Y的线性组合。的期望和方差是 E() = E(X X)-1 X Y = E(X X)-1X (X+ u) =+ (X X)-1X E(u) = (1.11)Var() = E() ()= E(X X)-1X u u X (X X)-1 = E(X X)-1X s 2I X (X X)-1 = 2 (X X)-1 . (1.12) 高斯马尔可夫定理:若前述假定条件成立,OLS估计量是最佳线性无偏估计量。具有无偏性。具有最小方差特性。具有一致性,渐近无偏性和渐近有效性。2. 残差的方差s2 = / (T - k) (1.13)s 2是2 的无偏估计量,E(s 2 ) =2。的估计的方差协方差矩阵是() = s2 (X X)-1 (1.14)3. 多重确定系数(多重可决系数)Y = X+ = + (1.15)总平方和SST = = Y Y - T, (1.16)其中是yt 的样本平均数,定义为= 。回归平方和为SSR = = - T (1.17)其中的定义同上。残差平方和为SSE = = = (1.18)则有如下关系存在, SST = SSR + SSE (1.19)R2 = (1.20)显然有0 R 2 1。R 2 1,拟合优度越好。 4. 调整的多重确定系数当解释变量的个数增加时,通常R2不下降,而是上升。为调整因自由度减小带来的损失,又定义调整的多重确定系数如下: = 1 - = 1 - (1.21) 5. OLS估计量的分布 若u N (0, 2I ) ,则每个ut都服从正态分布。于是有Y N (X, 2I ) (1.22)因也是u的线性组合(见公式1.7),依据(1.11)和(1.12)有N (, 2 (X X)-1 ) (1.23) 6. 方差分析与F检验与SST相对应,自由度T-1也被分解为两部分,(T-1)= (k -1) + (T- k) (1.24) 回归均方定义为MSR = ,误差均方定义为MSE = 表1.1 方差分析表方差来源平方和自由度均方回归SSR =-T2k-1MSR = SSR / (k-1)误差SSE = T-kMSE = SSE / (T-k)总和SST= Y Y - T2T-1H0: 1=2 = =k-1 = 0; H1: j不全为零F = = F(k-1,T-k) (1.25)设检验水平为a,则检验规则是,若 F Fa (k-1,T-k) , 拒绝H0。 0 Fa (k-1, T-k) -ta(T-k) 0 ta(T-k)F检验示意图 t检验示意图7t检验H 0:j = 0, (j = 1, 2, , k-1), H 1:bj 0t = t(T-k) (1.26)判别规则:若 t ta(T-k) 接受H 0;若 t ta(T-k) 拒绝H 0。 8i的置信区间 (1) 全部bi的联合置信区间接受F = (-) (X X) (-) / s2 Fa (k, T-k) (1.27)(-) (X X ) (-) SST。为维持SSE+SSR=SST,迫使SSR ta) = a, P( t Fa (k-1,T-k) , 拒绝H0。 0 Fa (k-1, T-k) -ta(T-k) 0 ta(T-k)F检验示意图 t检验示意图7t检验H 0:bj = 0, (j = 1, 2, , k-1), H 1:bj 0t = t(T-k) (1.26)判别规则:若 t ta(T-k) 接受H 0;若 t ta(T-k) 拒绝H 0。 8bi的置信区间 (1) 全部bi的联合置信区间接受F = (b -) (X X) (b -) / s2 Fa (k, T-k) (1.27)( b -) (X X ) ( b -) s2 k Fa (k, T-k),它是一个k维椭球。 (1.28) (2) 单个bi的置信区间bi = s ta/2(T-k) . (1.29) 9预测 (1)点预测C = (1 xT+1 1 xT+1 2 xT+1 k-1 ) (1.30)则T + 1期被解释变量yT+1的点预测式是,= C=0 +1 xT+1 1 + + k-1 xT+1 k-1 (1.31) (2)E(yT+1) 的置信区间预测 首先求点预测式C的抽样分布E() = E(C) = Cb (1.32)Var() = Var(C) = E(C- Cb ) (C- Cb ) = EC (- b ) C (- b ) = C E(- b ) (- b ) C = C Var()C = C s2 (X X )-1C = s2 C (X X )-1C , (1.33)因为服从多元正态分布,所以C也是一个多元正态分布变量,即= C N (Cb, s2C (X X ) -1C ) (1.34)构成 t 分布统计量如下t = t (T-k) (1.35)置信区间 C ta/2 (1, T-k) s (1.36) (3) 单个yT+1的置信区间预测yT+1值与点预测值有以下关系 yT+1 = + uT+1 (1.37)其中uT+1是随机误差项。因为E( yT+1) = E(+ uT+1) = Cb (1.38) Var( yT+1) = Var() + Var(uT+1) = s 2 C (X X)-1C + s 2 = s 2 (C (X X)-1C + 1) (1.39)因为服从多元正态分布,所以yT+1也是一个多元正态分布变量,即yT+1 N (Cb, s2C (X X ) -1C + 1)与上相仿,单个yT+1的置信区间是C ta/2 (T-k) s (1.40) 计算举例:(见计量经济分析第19-27页,熟悉矩阵运算)10. 预测的评价指标注意,以下6个公式中的et表示的是预测误差,不是残差。可以在样本内、外预测。(3) 预测误差。预测误差定义为et = - yt, t = T+1, T+2, (4) 相对误差PE (Percentage Error)。 PE = , t = T+1, T+2, (3) 误差均方根rms error (Root Mean Squared Error) rms error = (4) 绝对误差平均MAE (Mean Absolute Error) MAE = (5) 相对误差绝对值平均MAPE (Mean Absolute Percentage Error) MAPE = (6) Theil系数(Theil Coefficent) Theil = , t = 1, 2, , T以上6个式子中,表示预测值,yt表示实际值。Theil的取值范围是 0,1。显然在预测区间内,当与yt完全相等时,Theil = 0;当预测结果最差时,Theil = 1。公式中的累加范围是用1至T表示的,当然也可以用于样本外预测评价。11建模过程中应注意的问题(1)研究经济变量之间的关系要剔除物价变动因素。以上图为例,按当年价格计算,我国1992年的GDP是1980年的5.9倍,而按固定价格计算,我国1992年的GDP是1980年的2.8倍。另外从图中还可看出,1980-1992期间按名义价格计算的GDP曲线一直是上升的,而按不变价格(1980年价格)计算的GDP曲线在1989年出现一次下降。可见研究经济变量应该剔除物价变动因素。 (2) 依照经济理论以及对具体经济问题的深入分析初步确定解释变量。例:我国粮食产量 = f(耕地面积、农机总动力、施用化肥量、农业人口等)。但根据我国目前情况,“耕地面积”不是“粮食产量”的重要解释变量。粮食产量的提高主要来自科技含量的提高。例:关于某市的食用油消费量,文革前常驻人口肯定是重要解释变量。现在则不同,消费水平是重要解释变量,因为食用油供应方式已改变。(3) 当引用现成数据时,要注意数据的定义是否与所选定的变量定义相符。 例:“农业人口”要区别是“从事农业劳动的人口”还是相对于城市人口的“农业人口”。 例:2002年起我国将执行新的规定划分三次产业。即将农、林、牧、副、渔服务业从原第三产业划归第一产业。(4) 通过散点图,相关系数,确定解释变量与被解释变量的具体函数关系。(线性、非线性、无关系)(nonli8)(5)谨慎对待异常值。不能把建立模型简单化为一个纯数学过程,目的是寻找经济规律。年INV(投资)IMPORT(进口)19912.56200023.4700019922.42970032.2900019936.71240063.99000199415.3760078.75000199521.31000149.1300199627.37000113.8100199741.71000106.1500199839.78000112.2000 (6) 过原点回归模型与非过原点回归模型相比有如下不同点。以一元线性过原点模型,yt = b1 xt + ut ,为例, = 0不一定成立。原因是正规方程只有一个(不是两个),= 2 (yt -xt) (- xt) = 0,即 xt = 0,而没有 = 0。所以残差和等于零不一定成立。可决系数R 2有时会得负值!原因是有时会有SSESST。为维持SSE+SSR=SST,迫使SSR ta) = a, P( t ta) = a -ta(T-k) 0 ta(T-k) Fa(k-1,T-k)(10) 对于多元回归模型,当解释变量的量纲不相同时,不能在估计的回归系数之间比较大小。若要在多元回归模型中比较解释变量的相对重要性,应该对回归系数作如下变换* =, j = 1, 2, k-1 (1.41)其中s(xt) 和s(yt) 分别表示xt 和yt的样本标准差。*可用来直接比较大小。以二元模型为例,标准化的回归模型表示如下(标准化后不存在截距项),= b1*+ b2*+ + ut*两侧同乘s(yt),得(yt -) = b1*(xt1 -) + b2*(xt2 -) + + ut* s(yt)所以有bj*=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三全监督制度
- 农村财会会计制度
- 健全任用监督制度
- 名词解释会计监督制度
- 两议一公开两监督制度
- 医疗保险财会制度
- 城管外部监督制度
- 国旗监督制度
- 产检诊断妊娠监督制度
- 2026年书记员机考测试题及答案
- 2026年开封大学单招职业适应性考试必刷测试卷带答案
- 非遗宋锦-交娱企业文化日活动执行方案
- 化妆品安全技术规范课件
- GB/T 18451.2-2025风能发电系统风力发电机组功率特性测试
- 寻找红色足迹 传承红色精神
- 西方经济学(微观部分第九版) 课件 第1-6章 引论 -完全竞争市场
- 防雷检测安全培训课件
- 防城港柳钢多元产业园之金属回收产业园项目-杰灿公司厂房环评报告
- 弱电安全培训案例课件
- 辽宁柞蚕场管理办法
- 消防车辆安全行驶课件
评论
0/150
提交评论