




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三课 一元及多元线性回归模型3.1一元线性回归模型 一、做两个变量的散点图,从而看两个变量是否具有线性关系。 案例数据:1985-2002年我国人均钢产量与人均GDP的时间序列数据(数据3_1_1)。操作方法:通过序列组的形式右键单击打开后,在group窗口下viewgraph-scatter,通过对散点图结果的观察,判断是否适合做回归方程,结果显示,数据表现出明显的线性关系,适合做线性回归分析。同样的操作可以检验其它案例数据(3_1_2和3_1_3)的特征:案例数据2、3、4、5:10个家庭人均收入与消费支出的横截面数据;1978-2000年中国人均消费模型;1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据(case1_1的数据); 1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)(其中,零售价格是已经经过物价调整的) 二、通过建立方程对象的方式来估计一个方程,并保存我们建立的方程对象。 Workfile窗口下建立新的对象-equation对象并命名,在equation estimation 窗口下的specification选项卡下的equation specification对话框中设置因变量、自变量及常数项,在estimation settings对话框中选择估计方法为ols,确定。结果如下;CoefficientStd. Errort-StatisticProb.STEELP93.687647.48679312.513720.0000C-3394.972614.4414-5.5252980.0000R-squared0.907296Mean dependent var3913.444Adjusted R-squared0.901502S.D. dependent var2580.715S.E. of regression809.9396Akaike info criterion16.33624Sum squared resid10496034Schwarz criterion16.43517Log likelihood-145.0261Hannan-Quinn criter.16.34988F-statistic156.5932Durbin-Watson stat0.554019Prob(F-statistic)0.0000001978-2000年中国人均消费模型结果:VariableCoefficientStd. Errort-StatisticProb.C201.118914.8840213.512410.0000GDPP0.3861800.00722253.474710.0000R-squared0.992710Mean dependent var905.3304Adjusted R-squared0.992363S.D. dependent var380.6334S.E. of regression33.26450Akaike info criterion9.929800Sum squared resid23237.06Schwarz criterion10.02854Log likelihood-112.1927F-statistic2859.544Durbin-Watson stat0.550636Prob(F-statistic)0.000000注意:建模途径:command: quickestimation equation回车,或objectequation object,设置。命令行形式:(1)列表法:consp c gdpp 或(2)公式法:consp=c(1)+c(2)*gdpp三、方程估计结果的解释、评价及模型检验(拟合优度评价,估计参数和方程的显著性检验) 消费方程中,C为自发性消费,x(gdpp)的系数为经济参数,关注其意义;通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p(相伴概率);f统计量的p来判断对原假设接受与否四、在回归估计结果中显示方程的三种形式(即估计命令,回归方程的一般表达式,带有系数估计值的表达式) Estimation Command:LS GDPP STEELP C Estimation Equation:GDPP = C(1)*STEELP + C(2)Substituted Coefficients:GDPP = 93.6876362857*STEELP - 3394.97191614五、如何查看因变量的实际值、拟合值和回归方程的残差(包括表的形式和图的形式)通过方程窗口下的view去实现实际值、拟合值和回归方程的残差;单独显示残差及标准化后的残差;六、如何用我们建立的方程进行预测,可以进行样本内预测,也可以进行样本外预测。对于案例数据1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据,进行样本内与外的预测。通过equation窗口中的forecast直接进行样本内预测:查看图及workfile中的yf序列;在sample或range中改变样本区间或文件区间(需补充观察值)后进行样本外预测。对案例数据1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)散点图观察后,显示负相关的直线关系,操作过程同上。 实验作业一元线性回归建模。附录:练习数据3.1为了研究某市城镇每年鲜蛋的需求量,首先考察消费者年人均可支配收入对年人均鲜蛋需求量的影响。由经济理论知,当人均可支配收入提高时,鲜蛋需求量也相应增加。但是,鲜蛋需求量除受消费者可支配收入影响外,还要受到其自身价格、人们的消费习惯及其他一些随机因素的影响。为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系,我们将影响鲜蛋需求量的其他因素归并到随机变量u中,建立这两个变量之间的数学模型。表中给出Y为某市城镇居民人均鲜蛋需求量(公斤),X为年人均可支配收入(元,1980年不变价),通过抽样,得到1988-1998年的样本观测值。年份YX198814.4847.26198914.4820.99199014.4884.21199114.7903.66199217.0984.09199316.31035.26199418.01200.90199518.51289.77199618.21432.93199719.31538.97199817.11663.63练习数据3.2:10个家庭收入与消费支出的界面数据。家庭收入X家庭消费支出Y1800.00770.0021200.001100.0032000.001300.0043000.002200.0054000.002100.0065000.002700.0077000.003800.0089000.003900.00910000.005500.001012000.006600.003.2多元线性回归模型 一、做以因变量为横轴,多个自变量为纵轴的散点图,简单观察该因变量与多个自变量之间的关系。案例数据:中国粮食生产函数。 根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。下表给出了19832000中国粮食生产的相关数据,拟建立中国粮食生产函数。Wokfile窗口下建立graph对象,注意在序列对话框中首先输入y,再依次输入x1到x5,首先生成系统默认的折线图,通过option改成散点图,观察得到的图形结果,分析可知需要分轴显示或标准化处理,处理前后图形结果如下; 二、建立组对象查看自变量的相关系数矩阵。目的是为了查看哪些变量之间线性相关性比较强,也就是相关系数比较大。(同时也是为了和散点图及回归方程相互验证。) 建立组对象group1,打开后利用view-group member添加x1-x5所有的序列,选择yes保持改变,再打开组对象,发现所添加序列已经存在;查看其相关系数矩阵;结果如下;YX1X2X3X4X5Y 1.0000000.9444260.2739950.3994540.8675870.553560X10.9444261.0000000.0118230.6401750.9602780.545450X20.2739950.0118231.000000-0.454908-0.0384790.182359X30.3994540.640175-0.4549081.0000000.6895650.355735X40.8675870.960278-0.0384790.6895651.0000000.454169X50.5535600.5454500.1823590.3557350.4541691.000000三、以建立方程对象的方式来建立多元线性回归模型。 建立方程对象,命名为equation1,输入变量列表(变量过多可提前复制,粘贴即可),确定完成模型建立,结果如下;CoefficientStd. Errort-StatisticProb.C-12815.7514078.90-0.9102800.3806X16.2125620.7408818.3853730.0000X20.4213800.1269253.3199190.0061X3-0.1662600.059229-2.8070650.0158X4-0.0977700.067647-1.4452990.1740X5-0.0284250.202357-0.1404710.8906R-squared0.982798Mean dependent var44127.11Adjusted R-squared0.975630S.D. dependent var4409.100S.E. of regression688.2984Akaike info criterion16.16752Sum squared resid5685056.Schwarz criterion16.46431Log likelihood-139.5077Hannan-Quinn criter.16.20845F-statistic137.1164Durbin-Watson stat1.810512Prob(F-statistic)0.000000四、对模型结果的解释和评价。本案例中有明显的多重共线性的现象,从计算结果看,R2较大并接近于1,而且F=137.11F0.05=3.11,故认为粮食生产量与上述所有解释变量间总体线性相关显著。但是,同时,X4 、X5 前参数未通过t检验,而且符号的经济意义也不合理,故认为解释变量间存在多重共线性。结果说明模型存在共线性,与相关系数矩阵得到了相互验证。 即通过观察可见,F统计量概率为0,说明方程显著;部分t的prob大于5%,说明解释变量间存在共线性; 五、我们选取逐步引入法选择变量,同时克服多重共线性。方法有两种:一个是手动逐个加入自变量;二是采取逐步回归的办法来让计算机自动加入。1.首先是手动逐步引入,过程如下:(1)分别做粮食生产量对各个解释变量的回归,得AY对X1回归结果:VariableCoefficientStd. Errort-StatisticProb.C30867.311206.36425.587060.0000X14.5761150.39819911.492020.0000R-squared0.891941Mean dependent var44127.11Adjusted R-squared0.885187S.D. dependent var4409.100S.E. of regression1493.984Akaike info criterion17.56072Sum squared resid35711799Schwarz criterion17.65965Log likelihood-156.0465F-statistic132.0666Durbin-Watson stat1.855174Prob(F-statistic)0.000000B.Y对X2回归结果:VariableCoefficientStd. Errort-StatisticProb.C-33822.4168409.15-0.4944140.6277X20.6988800.6132731.1395900.2712R-squared0.075073Mean dependent var44127.11Adjusted R-squared0.017265S.D. dependent var4409.100S.E. of regression4370.873Akaike info criterion19.70775Sum squared resid3.06E+08Schwarz criterion19.80668Log likelihood-175.3698F-statistic1.298665Durbin-Watson stat0.118043Prob(F-statistic)0.271231C.Y对X3回归结果VariableCoefficientStd. Errort-StatisticProb.C35712.864926.5837.2490120.0000X30.3499780.2008021.7429060.1005R-squared0.159563Mean dependent var44127.11Adjusted R-squared0.107036S.D. dependent var4409.100S.E. of regression4166.457Akaike info criterion19.61196Sum squared resid2.78E+08Schwarz criterion19.71089Log likelihood-174.5076F-statistic3.037721Durbin-Watson stat0.935587Prob(F-statistic)0.100533D.Y对X4回归结果:VariableCoefficientStd. Errort-StatisticProb.C31918.721828.71517.454180.0000X40.3799670.0544486.9785870.0000R-squared0.752707Mean dependent var44127.11Adjusted R-squared0.737252S.D. dependent var4409.100S.E. of regression2260.060Akaike info criterion18.38861Sum squared resid81725964Schwarz criterion18.48754Log likelihood-163.4975F-statistic48.70067Durbin-Watson stat1.109488Prob(F-statistic)0.000003E.Y 对X5回归结果:VariableCoefficientStd. Errort-StatisticProb.C-28260.0227240.49-1.0374270.3150X52.2396140.8423522.6587620.0172R-squared0.306429Mean dependent var44127.11Adjusted R-squared0.263081S.D. dependent var4409.100S.E. of regression3784.948Akaike info criterion19.41989Sum squared resid2.29E+08Schwarz criterion19.51882Log likelihood-172.7790F-statistic7.069018Durbin-Watson stat0.357079Prob(F-statistic)0.017160(2)逐步回归,A、Y对X1、X4回归结果:VariableCoefficientStd. Errort-StatisticProb.C31164.921137.21927.404510.0000X16.9259381.3315025.2015970.0001X4-0.2211780.120350-1.8377920.0860R-squared0.911800Mean dependent var44127.11Adjusted R-squared0.900040S.D. dependent var4409.100S.E. of regression1394.000Akaike info criterion17.46875Sum squared resid29148555Schwarz criterion17.61715Log likelihood-154.2188F-statistic77.53409Durbin-Watson stat1.992572Prob(F-statistic)0.000000从回归结果看,拟合优度虽然上升,但X4的系数不显著,因此,存在共线性,而相比较而言,X1更重要,因此剔除X4(从相关分析也有助于这个结论)。B、Y对X1、X5回归结果:VariableCoefficientStd. Errort-StatisticProb.C24133.8412406.481.9452610.0707X14.4315590.4858839.1206250.0000X50.2212890.4057060.5454420.5935R-squared0.894042Mean dependent var44127.11Adjusted R-squared0.879914S.D. dependent var4409.100S.E. of regression1527.902Akaike info criterion17.65219Sum squared resid35017273Schwarz criterion17.80059Log likelihood-155.8697F-statistic63.28281Durbin-Watson stat1.839712Prob(F-statistic)0.000000拟合优度升高不显著,修正的拟合优度略微下降,且X5系数不显著,因此,剔除X5.C、Y对X1、X3回归结果:VariableCoefficientStd. Errort-StatisticProb.C35065.011064.61232.936880.0000X15.6543300.31219918.111320.0000X3-0.3045460.056452-5.3948030.0001R-squared0.963248Mean dependent var44127.11Adjusted R-squared0.958348S.D. dependent var4409.100S.E. of regression899.8443Akaike info criterion16.59333Sum squared resid12145797Schwarz criterion16.74173Log likelihood-146.3400F-statistic196.5723Durbin-Watson stat1.728340Prob(F-statistic)0.000000从回归结果看,拟合优度提高,X1和X3的系数显著,因此接受X3.D、Y对X1、X2、X3回归结果:VariableCoefficientStd. Errort-StatisticProb.C-11978.1814072.92-0.8511510.4090X15.2559350.26859519.568280.0000X20.4084320.1219743.3485220.0048X3-0.1946090.054533-3.5686370.0031R-squared0.979593Mean dependent var44127.11Adjusted R-squared0.975220S.D. dependent var4409.100S.E. of regression694.0715Akaike info criterion16.11616Sum squared resid6744293.Schwarz criterion16.31402Log likelihood-141.0454F-statistic224.0086Durbin-Watson stat1.528658Prob(F-statistic)0.000000从回归结果看,拟合优度提高,X1、X2和X3的系数显著,因此接受X2.即,回归方程为:Y = -11978.18057 + 5.255935121*X1 + 0.408432175*X2 - 0.1946087795*X32.计算机自动逐步回归Equation对象设置时,选择最后逐步回归法(step wise ),同时,第一个框中输入因变量和必须包含的自变量,当前输入y和c;第二个框输入所有解释变量,让eviews自己去选择,再点击option选项卡,选择向前还是向后回归,先前及逐步加入回归,向后即先将所有变量都放进去,再删除,本例中选择,forward确定后,观察结果,与手动结果一样;五、多元回归建模多元回归模型估计、检验及预测案例数据:我国1988年-1998年的城镇居民人均全年耐用消费品支出、人均全年可支配收入以及耐用消费品价格指数的统计资料如下表,试建立城镇居民人均全年耐用消费品支出Y关于人均全年可支配收入x1和耐用消费品价格指数X2的回归模型,并进行回归分析。(数据来源:张晓峒,计量经济学基础,P79,例3.9)根据经验和对经济现实的分析,设定模型为二元线性回归模型,理论形式为:,(1)数据如下表,年份人均全年可支配收入X1(元)耐用消费品价格指数X2(1987)人均耐用消费品支出Y(元)19881181.4115.96137.1619891375.7133.35124.5619901501.2128.21107.9119911700.6124.85102.9619922026.6122.49125.2419932577.4129.86162.4519943496.2139.52217.4319954283140.44253.4219964838.9139.12251.0719975160.3133.35285.8519985425.1126.39327.26(2)Eviews的输出结果(下表)写出回归方程为:EXPENSEY = 158.5398355 + 0.04940379666*INCOMEX1 - 0.911684216*PRINDEX2VariableCoefficientStd. Errort-StatisticProb.C158.5398121.80711.3015640.2293INCOMEX10.0494040.00468410.547860.0000PRINDEX2-0.9116840.989546-0.9213160.3838R-squared0.947989Mean dependent var190.4827Adjusted R-squared0.934986S.D. dependent var79.29127S.E. of regression20.21757Akaike info criterion9.077982Sum squared resid3270.001Schwarz criterion9.186499Log likelihood-46.92890F-statistic72.90647Durbin-Watson stat1.035840Prob(F-statistic)0.000007(3)检验从经济意义来看,可支配收入前的系数为0.0494,正的,介于0和1之间,符号、大小与理论符合;价格指数前的系数为-0.91,大小和符号符合经济理论;从统计角度看,l R-squared=0.947989,Adjusted R-squared=0.934986,从多元回归修正的判定系数看,回归方程较好地拟合了散点,被解释变量的变异中有93%以上可以由方程来解释;l 从F统计量的结果来看,F=72.90647F0.05(2,8)=4.46,而且F=72.90647F0.01(2,8)=8.65,可见方程总体来看,无论在0.05还是0.01水平上都显著,即在我国城镇居民人均全年耐用消费品支出与人均全年可支配收入和耐用消费品价格指数之间存在显著的线性关系。这一点结论由F统计量的精确显著性水平Prob=0.000007也可得到。l t统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中班健康活动运食物课件
- 中学生心理健康促进策略
- 感恩的心理健康教育课件
- 心内科病例分析:青壮年急性心肌梗死的警示
- 中班健康情绪变变变课件
- 碳层裂解行为-洞察及研究
- 中班健康驼背的秘密课件
- 中班伞的课件
- 2025年度Oracle区块链技术应用开发合同模板
- 2025智慧城市泥工施工总承包合同模板
- 中小学校长管理案例
- 《电力设施治安安全风险等级和安全防护要求》
- 工程项目部安全生产治本攻坚三年行动实施方案
- 四川建筑安全员-C证考试(专职安全员)题库及答案
- 光伏验收报告
- 职业倦怠量表MBI-HSS
- 学校桌椅采购投标方案
- 盘扣式外脚手架施工方案
- 初中数学目录(浙教版)
- 呼吸衰竭抢救流程
- 慰问品采购投标方案(完整技术标)
评论
0/150
提交评论