元线性回归模型.ppt_第1页
元线性回归模型.ppt_第2页
元线性回归模型.ppt_第3页
元线性回归模型.ppt_第4页
元线性回归模型.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章 一元线性回归模型,模型的建立及其假定条件 最小二乘估计(OLS) 最小二乘估计量的特性 参数估计量的分布 的估计 拟合优度的测量 回归参数的显著性检验与置信区间 yF 的点预测与区间预测 案例分析 EViews操作,1. 模型的建立及假定条件,0 + 1 xt,ut (随机误差项),粮食产量 yt (被解释变量),种植面积xt (解释变量),t=1,2,T. T=200,0 和1称为参数,yt,= 0 + 1 xt + ut,一元线性回归模型: yt = 0 + 1 xt + ut,回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)数学模型形式欠妥,(3)归并误差(粮食的归并)(4)测量误差等。 回归模型存在两个特点。 (1)回归函数(这里是直线)不能百分之百地再现所研究的经济过程。 (2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。,1. 模型的建立及假定条件,模型解释变量和误差项ut(t=1,2,T)的假定条件如下: (1) ut 是随机变量,ut 的取值服从概率分布。 (2) E(ut) = 0。 (3) ut 具有同方差性。 D(ut) = Eut - E(ut) 2 = E(ut)2 = 2。 (4) ut 非自相关。 Cov(ui, uj) = E(ui - E(ui) ) ( uj - E(uj) ) = E(uiuj) = 0,(i j )。 (5) ut 为正态分布。,1. 模型的建立及假定条件,以上假定条件可作如下表达。 ut i.i.d. N (0, 2) t=1,2,T (6) xt是非随机的,即xt的取值是确定的。,一元线性回归模型: yt = 0 + 1 xt + ut 在假定(1)(2)(6)成立条件下有 E(yt) = E(0+1 xt +ut) = 0+1 xt,1. 模型的建立及假定条件,2.最小二乘估计,E(yt) = 0 + 1 xt,粮食产量 yt,种植面积xt,yt= 0 + 1 xt + ut,真实的统计模型,真实的回归直线,通常真实的回归直线 是观测不到的,即参数 和 是未知的。,我们需要对它进行估计,即参数估计。,,即参数估计量。,2. 最小二乘估计,估计的统计模型,估计的回归直线,如何确定红色直线的位置?,使残差之和最小? 互相抵消,不能用于实际计算。 使残差绝对值之和最小? 绝对值的计算比较麻烦。,使残差平方和最小! 称为最小二乘法 (Ordinary Least Square, OLS),直线在点中间!,正规方程一 正规方程二,,即点 在回归直线上。,两个参数估计量都是随机变量! (对x和y重复抽样进行计算,估计量值不同),(C F Gauss, 1777-1855),C F Gauss 1809年提出OLS估计方法。,谁提出的OLS估计方法?,思考:参数估计量是随机变量,服从一定分布。 除OLS估计量外,还有没有其他的估计量? 如何评价你的随机变量?,(3)最小方差性: OLS得到的0, 1是所有线性无偏估计量中方差最小的。,3. 最小二乘估计量的特性:高斯-马尔科夫定理,满足上述假设条件的OLS估计量是最佳无偏线性估计量(BLUE),4参数估计量 的分布,同样可以证明,的分布,ut N(0, 2) yt服从正态分布 服从正态分布,yt = 0 + 1 xt + ut,5 的估计,(或称为样本方差),用残差的方差来估计,又称为误差均方,是随机变量!,6拟合优度的测量 拟合优度是指回归直线对观测值的拟合程度。,TSS = ESS + RSS,总体平方和回归平方和残差平方和,线性关系是否恰当?,y的变差,被x所解释的变差,未被x所解释的变差,证明,其中,度量拟合优度的统计量:可决系数(确定系数),R2的取值范围是 0,1。 对于一组数据,TSS是不变的,所以RSS(),ESS()。 RSS:指残差平方和(sum of squared residuals) ESS:指回归平方和(explained sum of squares),7回归参数估计量的显著性检验,的分布,先假设 再构造统计量试图推翻,同样的方法也可以应用于检验 等于其他值的原假设,见书53页,8回归参数的置信区间,(1-)%的置信区间是,未知,构造t 统计量求解,例题2.1 人均鲜蛋需求量y与人均可支配收入x关系,OLS估计结果:,样本容量 1988年-1998年 (file: li-2-1),Coefficient:参数估计量,(file: li-2-1),参数估计量的样本标准差,回归函数的标准误差,例题2.1 人均鲜蛋需求量y与人均可支配收入x关系,估计量标准差:,注意RSS与S.E.的关系,可决系数:,(file: li-2-1),S.D. dependent var: 被解释变量标准差,例题2.1 人均鲜蛋需求量y与人均可支配收入x关系,显著性检验:,H0:1 = 0; H1:1 0。在H0成立条件下,,H0:0 = 0; H1:0 0。在H0成立条件下,,Prob=P | t-Statistic |临界值 即接受原假设的概率。,检验结果: 回归参数显著不为零。,例题2.1 人均鲜蛋需求量y与人均可支配收入x关系,1的置信区间: 0的置信区间:,(file: li-2-1),例题2.1 人均鲜蛋需求量y与人均可支配收入x关系,OLS回归模型的标准格式:,(7.7) (4.3) R2 = 0.67,T=11,(19881998),(file: li-2-1),参数显著性检验的t值,真实值,拟合值,残差,S.E.,-S.E.,分析残差的正态分布性,(file: li-2-1),分析残差,Actual表示yt的实际观测值,Fitted表示yt的拟合值,,Residual表示残差。,残差图中的两条虚线与中心线的距离表示残差的一个标准差,即s.e.。通过残差图可以看到,大部分残差值都落在了正、负一个标准差之内。,方程估计窗口中点击veiwactual,fitted,residual,9yF 的点预测与区间预测,是一个随机变量,且是无偏预测量,即,假定样本外也服从回归直线。,称为预测误差,其期望为0,方差,利用回归模型预测时,解释变量的值最好不要离开样本范围太远。原因是: 根据预测公式离样本平均值越远,预测误差越大。,Y1999的点估计值:Y1999 = 10.77 + 0.005069 1863 = 20.21 Y2000的点估计值:Y2000 = 10.77 + 0.005069 1983 = 20.82,(file: li-2-1),Y1999的置信区间:20.20892.261.4417 16.9507,23.4671 Y2000的置信区间:20.81712.261.5297 17.3600,24.2742,例题2.1 人均鲜蛋需求量y与人均可支配收入x关系,补充案例1:用回归模型预测木材剩余物(file:b1c3),伊春林区位于黑龙江省东北部,有森林面积219万公顷,木材蓄积量为2.3亿m3。森林覆盖率为62.5%,是我国主要的木材工业基地之一。1999年伊春林区木材采伐量为532万m3。按此速度44年之后,1999年的蓄积量将被采伐一空。 为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。,1999年16个林业局,黑龙江省伊春林区,观测点近似服从线性关系。 建立一元线性回归模型如下: yt = 0 + 1 xt + ut,年剩余物yt和年木材采伐量xt散点图,分析EViews输出结果。注意:S.D.和s.e.的区别。s.e.和SSR的关系。,= -0.7629 + 0.4043 xt (-0.6) (12.1) R2 = 0.91, T = 16 上述模型的经济解释是,对于伊春林区各林业局平均每采伐1 m3木材, 将平均产生0.4 m3的剩余物。,假设已知xF=20,F,F,F,0.05/2,假设已知,假设已知,10. EViews操作, 怎样建立EViews新工作文件。file new workfile 选择数据类型unstructured(undated)表示横截面数据;dated表示时间序列数据。启始期(Start date);终止期(End date)。 怎样用EViews通过键盘输入,复制、粘贴功能输入数据。object new object series 注意:(1)变量命名时,字符不得超过16个。 (2)给变量命名时,避免使用下列名字:ABS,ACOS , AR, ASIN,C,CON,CNORM, COEF,COS,D,DLOG, DNORM,ELSE,ENDIF,EXP,LOG,LOGIT,LPT1, LPT2,MA,NA,NRND,PDL,RESID,RND,SAR, SIN,SMA,SQR,THEN。 画散点图:quick graph scatter x y,怎样用EViews预测,以补充案例1为例,给定xt = 20,求yF=?EViews预测步骤如下。 (1)点击Procs键选Change workfile range功能。在弹出的对话框的End data选择框处改为17。点击OK键。 (2)双击工作文件的Sample:1 17区域,在弹出的对话框的Sample range pairs选择框处把16改为1 17。 (3)双击工作文件窗口中的x序列,打开x数据窗口。点击Edit+/-键,使x数据窗口处于可编辑状态。在t =17的x的观测值位置输入20。相当于给定x=20。 (4)打开估计式eq01窗口,点击Forecast键。yf表示yt的预测值,若在S.E. 选择框处填入yfse则表示输出yt的预测标准差,点击OK键,工作文件窗口中已经出现一个yf序列。双击yf序列,可以看到。y17 = 7.322668。,OLS估计的操作步骤。 在已建立Eviews数据文件的基础上,进行OLS估计的操作步骤如下:打开工作文件,从主菜单上点击Quick键,选Estimate Equation 功能。在出现的对话框中输入y c x。点击Ok键。,11相关理论与相关系数,相关(correlation) :指两个或两个以上变量间相互关系的程度或强度。 分类:按强度分 完全相关:变量间存在函数关系。 高度相关(强相关):变量间近似存在函数关系。 弱相关:变量间有关系但不明显。 零相关:变量间不存在任何关系。,按变量个数分 简单相关:指两个变量间相关。 按形式分:线性相关, 非线性相关 按符号分:正相关, 负相关, 零相关 复相关(多重相关和偏相关): 指3个或3个以上变量间的相关。,11相关系数,非线性相关 负相关 零相关,完全相关 高度相关、线性相关、正相关 弱相关,11.2 简单线性相关的度量,简单线性相关系数,简称相关系数(correlation coefficient) 。 度量两个变量间的线性相关强度,用 表示。 的随机变量表达式是,11.3 相关系数的取值范围,图1 正相关 图2 负相关,图3 r = 0.92 图4 r = 0.99,散点图与相关系数 值的对应关系,11.4 线性相关系数的局限性,(1) 只适用于考察变量间的线性相关关系。变量无关变量独立(线性无关)。 (2) 相关系数的计算是一个数学过程,但不能揭示变量间关系的实质。 (3) 一般说二变量相关时,可能属于如下一种关系。 单向因果关系。如施肥量与农作物产量;对金属的加热时间与温度值。 双向因果关系。如工业生产与农业生产;商品供给量与商品价格。 另有隐含因素影响二变量变化。 虚假相关。,(1997-2001,file: 5correlation1),11.5 简单相关系数与拟和优度,拟和优度R2简单相关系数的平方r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论