一元回归案例数据_第1页
一元回归案例数据_第2页
一元回归案例数据_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、10.案例:用回归模型预测木材剩余物( file:b1c3 )林区位于省东北部。全区有森林面积218.9732万公顷,木材蓄积量为 2.324602亿m3。森林覆盖率为 62.5%,是我国主要的木材工业基地之一。1999年林区木材采伐量为532万m3。按此速度44年之后,1999年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规划 与方式,保护森林生态环境。为缓解森林资源危机,并解决部分职工就业问题,除了做好木 材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测 林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。下面,利用一元线性回归模型预测林区每年的木材

2、剩余物。显然引起木材剩余物变化的关键因素是年木材采伐量。给出林区16个林业局1999年木材剩余物和年木材采伐量数据如表2.1。散点图见图2.14。观测点近似服从线性关系。建立一元线性回归模型如下:yt = o + 1 xt + ut表2.1年剩余物yt和年木材采伐量xt数据林业局名年木材剩余物yt(万m3)年木材采伐量xt(万m3)乌伊岭26.1361.4东风23.4948.3新青21.9751.8红星11.5335.9五营7.1817.8上甘岭6.8017.0友好18.4355.0翠峦11.6932.7乌马河6.8017.0美溪9.6927.3大丰7.9921.5南岔12.1535.5带岭6

3、.8017.0朗乡17.2050.0桃山9.5030.0双丰5.5213.8合计202.87532.00图2.14年剩余物yt和年木材采伐量xt散点图Dependant Variable: YM3h(xj: Least SquaresDate; 1GO9/03 Time:Sample: 1 16Included observations:VariableGcieffi 匚 ientStd Error卜StatisticProb.C-.7629291.220966-0.62405606421X 4042800.03337712.112660.0000R-&quarad0.912B90Me

4、an dependent var12.67930Adjustedd906668S.D. dependent var丘旺£4圧S.E. of regression< 2.03631I*Akaike info critierion4.376633Swnn squared reidU SB托圧Schwarz criterion4.473207Log likelihood-39.01306F-statistic146.7166Durbin-Watson slat1.481946Prob(F-staiistic)0.000000图2.15 EViews输出结果EViews估计结果见图 2

5、.15。建立EViews数据文件的方法见附录1。在已建立 Eviews数据文件的基础上,进行OLS估计的操作步骤如下:打开工作文件,从主菜单上点击 Quick键,选Estimate Equation功能。在出现的对话框中输入y c x。点击Ok键。立即会得到如图2.15所示的结果。下面分析EViews输出结果。先看图2.15的最上部分。被解释变量是yt。估计方法是最小二乘法。本次估计用了16对样本观测值。输出格式的中间部分给出5列。第1列给出截距项(C)和解释变量xt。第2列给出第1列相应项的回归参数估计值(?0和?1)。第3列给出相应回归参数估计值的样本标准差( s( ?。), s( ?1)

6、。第4列给出相应t值。第5列给出 t统计量取值大于用样本计算的t值(绝对值)的概率值。以t = 12.11266为例,相应概率0.0000表示统计量t取值(绝对值)大于12.1的概率是一个比万分之一还小的数。换句话说,若给定检验水平为 0.05,则临界值为t0.05 (14) = 2.15。t = 12.1>2.15落在了 H0的拒绝域,所以 结论是1不为零。输出格式的最下部分给出了评价估计的回归函数的若干个统计量的值。依纵向顺序,这些统计量依次是可决系数R2、调整的可决系数 R2 (第3章介绍)、回归函数的标准差(s.e,即均方误差的算术根?)、残差平方和、对数极大似然函数值(第2章介

7、绍)、DW统计量的值、被解释变量的平均数 (y )、被解释变量的标准差(s(yj、赤池(Akaike )信息准则(是一个选择变量最优滞后期的统计量)、施瓦茨(Schwatz、准则(是一个选择变量最优滞后期的统计量)、F统计量(第3章介绍)的值以及F统计量取值大于该值的概率。注意:S.D.和s.e.的区别。s.e.和 SSE的关系。根据EViews输出结果(图2.15),写出OLS估计式如下:?t= -0.7629 + 0.4043 xt(2.64)(-0.6)(12.1)R2 = 0.91, s. e. = 2.04其中括号数字是相应t统计量的值。s.e.是回归函数的标准误差,即? = J ?

8、2/(16 2)。R2是可决系数。R 2 = 0.91说明上式的拟合情况较好。yt变差的91%由变量xt解释。检验回归系数显著性的原假设和备择假设是(给定 =0.05)H0:1 = 0; H1:10脚护伍|06借Print色F怕电词戢Im吕be笛吕创口电日也obsActual126.1300223.4900321970041L530057.18000S6.300007184300311.G90096.00000W9.60 DOO117.990001212.1500136.800001417.2000159.500001S5.52000Residual Plot24.0S992.0701518.

9、75334.72B2120.176817912313.7507 -2.Z2072 6433250Y4S756.109S30.5001721.4725 -3.04246 12.4570 -0.7B702 6.109830.5S01710.2739 -0.5B391 7,32309 0J6051 13.5390 -1.439C0 6.10963 0.60017 19.4511 -2.25 WS11.3G55 -1.865474.816130.7U367图2.16残差图因为t = 12.1 > to.05(14)= 2.15,所以检验结果是拒绝1 = 0 ,即认为年木材剩余物和年木材采伐量之间

10、存在回归关系。上述模型的经济解释是,对于林区每采伐1 m3木材,将平均产生0.4 m3的剩余物。图2.16给出相应的残差图。Actual表示yt的实际观测值,Fitted表示yt的拟合值y?t,Residual表示残差U?。残差图中的两条虚线与中心线的距离表示残差的一个标准差,即s.e.。通过残差图可以看到,大部分残差值都落在了正、负一个标准差之。估计1的置信区间。由?11t = P t0.05 (14) = 0.95s(?J得? ?'11t0.05 (14) s(刁)1的置信区间是?1- t0.05 (14) S( ?) , ?1 + t0.05 (14) s( ?1)0.4043

11、- 2.150.0334,0.4043 + 2.150.03340.3325, 0.4761(2.65)以95%的置信度认为,1的真值围应在0.3325, 0.4761 围中。下面求yt的点预测和平均木材剩余物产出量的置信区间预测。假设乌伊岭林业局2000年计划采伐木材20万m3,求木材剩余物的点预测值。?2000 = - 0.7629 + 0.4043 X2000=-0.7629 + 0.404320 = 7.3231 万 m3(2.66)g(E( 02000) = ?2(-+ 凶 荃)T (x X)1(20 33.25)2=4.1453 (+) = 0.4546163722.2606s(E

12、( ?2000) = 0.4546 = 0.6742因为E( ?2000 ) = E( ?0 + ?-| X2000 ) =0 +1 X2000 = E(y2000).?2000 E(y2000).t =t (T-2)s( $2000 )则置信度为0.95的2000年平均木材剩余物 E(y2000)的置信区间是?2000t0.05 (14) s(E( y?2000) = 7.32312.15 0.6742=5.8736,8.7726(2.67)从而得出预测结果,2000年若采伐木材20万m3,产生木材剩余物的点估计值是7.3231万m3。平均木材剩余物产出量的置信区间估计是在5.8736, 8

13、.7726万m3之间。从而为恰当安排2000年木材剩余物的加工生产提供依据。木材剩余物产出量单点的置信区间的计算。S2(?2000)= ?2(1+ -+(XF X)2)T(X X)21(20 33.25)2=4.1453 (1+) = 4.5999163722.2606s(? 2000 )=、4.5999 = 2.1447EViews通过预测程序计算的结果是,木材剩余物产出量单点的置信区间的估计结果是?2000t0.05 (14) s( ? 2000) = 7.32312.152.145 = 2.71, 11.93问题:估计结果中?0没有显著性,去掉截距项0可以吗?答:依据实际意义可知, 没有

14、木材采伐量就没有木材剩余物, 所以理论上0是可以取零 的。而有些问题就不可以。例如家庭消费和收入的关系。即使家庭收入为零,消费仍然非零。 一般来说,截距项的估计量没有显著性时,也不做剔出处理。本案例剔出截距项后的估计结果是?t= 0.3853 xt(28.3)R2 = 0.91,s. e. = 2.0点预测值是y?2000 = 0.3853 X2000 = 0.385320 = 7.7060 万 m3附录1:怎样用EViews通过键盘输入数据建立新工作文件的方法是从EViews主菜单中单击 File键,选择New, Workfile。则打开一个数据围选择框(Workfile Range )如图

15、1。需要做出3项选择。选择数据性质。数据性质分为:启始期(Start date)。终止期(End date)。3项选择完毕后,点击“ OK”键。这时,会建立起一个尚未命名的工作文件(Workfile),且处于打开状态。当打开新工作文件或现有工作文件后,可以通过键盘输入数据和追加数据。具体操作如下:从EViews主菜单中点击 Quick键,选择Empty Group功能。这时会打开一个空白表格 数据窗口( Group)如图3所示。每一个空格代表一个观测值位置。按列依次输入每一个变 量(或序列)的观测值。键入每一个观测值后,可通过按回车键(Enter键)或方向指示键()进行确认。按方向指示键()的

16、好处是在确认了当前输入的观测值的同时,还把光标移到了下一个待输入位置。每一列数据上方的灰色空格是用于输入变量名的。给变量命名时,字符不得超过16个。注意:下列名字具有特殊意义,给变量命名时,应避免使用。它们是:ABS,ACOS ,AR,ASIN,C,CON,CNORM,COEF,COS,D,DLOG,DNORM,ELSE,ENDIF, EXP, LOG,LOGIT,LPT1,LPT2,MA,NA,NRND,PDL,RESID,RND,SAR,SIN, SMA,SQR,THEN。附录2:怎样用EViews预测。以案例1为例,给定xt = 20,求?t = ? EViews预测步骤如下。( 1)点击 Procs 键选 Change workfile range 功能。 在弹出的对话框的 End data 选择框处改 为 17 。点击 OK 键。( 2)双击工作文件的 Sample:1 17 区域,在弹出的对话框的 Sample ra

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论