上机课实验作业三 - 用于合并.doc_第1页
上机课实验作业三 - 用于合并.doc_第2页
上机课实验作业三 - 用于合并.doc_第3页
上机课实验作业三 - 用于合并.doc_第4页
上机课实验作业三 - 用于合并.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上机课实验作业三姓名:李姝仪学号:2012310320班级:12级审计二班一:数据集DATA 4-71)先验地预期CM和各个变量之间的关系,并计算样本相关系数。 答:先验地预期:CM与FLR之间呈负相关关系,即女性文盲率越高,婴儿死亡率越低;CM与PGNP之间呈负相关关系,即人均国民产值越高,婴儿死亡率越低;CM与TFR之间呈正相关关系,即总生育率越高,婴儿死亡率就越高。 对应的样本相关系数如下表所示: . correlate cm flr pgnp tfr(obs=64) | cm flr pgnp tfr-+- cm | 1.0000 flr | -0.8183 1.0000 pgnp | -0.4077 0.2685 1.0000 tfr | 0.6711 -0.6260 -0.1857 1.00002)做CM对FLR的回归。答:输入stata命令:. reg cm flr Source | SS df MS Number of obs = 64-+- F( 1, 62) = 125.65 Model | 243515.049 1 243515.049 Prob F = 0.0000 Residual | 120162.951 62 1938.11211 R-squared = 0.6696-+- Adj R-squared = 0.6643 Total | 363678 63 5772.66667 Root MSE = 44.024- cm | Coef. Std. Err. t P|t| 95% Conf. Interval-+- flr | -2.390496 .2132625 -11.21 0.000 -2.816802 -1.96419 _cons | 263.8635 12.22499 21.58 0.000 239.4261 288.3009得回归结果:CM=263.86-2.39FLR。3)做CM对FLR和PGNP的回归。答:输入stata命令:. reg cm flr pgnp Source | SS df MS Number of obs = 64-+- F( 2, 61) = 73.83 Model | 257362.373 2 128681.187 Prob F = 0.0000 Residual | 106315.627 61 1742.87913 R-squared = 0.7077-+- Adj R-squared = 0.6981 Total | 363678 63 5772.66667 Root MSE = 41.748- cm | Coef. Std. Err. t P|t| 95% Conf. Interval-+- flr | -2.231586 .2099472 -10.63 0.000 -2.651401 -1.81177 pgnp | -.0056466 .0020033 -2.82 0.006 -.0096524 -.0016408 _cons | 263.6416 11.59318 22.74 0.000 240.4596 286.8236得回归结果:CM=263.64-2.23FLR-0.0056PGNP。4)做CM对FLR、PGNP和TFR的回归。观察校正拟合优度的变化。答:输入stata命令:. reg cm flr pgnp tfr Source | SS df MS Number of obs = 64-+- F( 3, 60) = 59.17 Model | 271802.616 3 90600.8721 Prob F = 0.0000 Residual | 91875.3836 60 1531.25639 R-squared = 0.7474-+- Adj R-squared = 0.7347 Total | 363678 63 5772.66667 Root MSE = 39.131- cm | Coef. Std. Err. t P|t| 95% Conf. Interval-+- flr | -1.768029 .2480169 -7.13 0.000 -2.264137 -1.271921 pgnp | -.0055112 .0018782 -2.93 0.005 -.0092682 -.0017542 tfr | 12.86864 4.190533 3.07 0.003 4.486323 21.25095 _cons | 168.3067 32.89166 5.12 0.000 102.5136 234.0998得回归结果:CM=168.31-1.77FLR-0.0055PGNP+12.87TFR。观察发现校正拟合优度随着解释变量个数的增加而不断增大,但始终小于拟合优度的数值。5)根据各种回归结果,选择哪个模型?为什么?答:根据以上回归结果,选择4)中的模型。因为此模型中解释变量个数最多,考虑的变量因素多,且此模型的拟合优度和校正拟合优度都比前几个模型大,说明此模型对因变量的解释力较前几个模型更好些,得到的结果更准确。6)对3)中的回归,检验FLR和PGNP的联合显著性。(写出原假设、备择假设、检验统计量) 答:输入stata命令:. reg cm flr pgnp(结果略). test flr pgnp ( 1) flr = 0 ( 2) pgnp = 0 F( 2, 61) = 73.83 Prob F = 0.0000其中:原假设:H0:2=3=0 备择假设:H1:2与3至少有一个不为零。检验统计量:F值,F(2,61) =73.83,且Prob F =0.0000,说明FLR和PGNP通过联合显著性检验,FLR和PGNP是联合显著的。二:数据集DATA6-8(1)做收盘价格对时间的散点图。散点图呈现出什么样的模式?答:输入stata命令,得散点图如下图所示:. twoway scatter close time可以发现,散点图呈现出正相关的模式。(2)建立一个线性模型预测Qualcom股票的收盘价格。 答:建立线性模型:close=1+2time+。输入stata回归命令,可得:. reg close time Source | SS df MS Number of obs = 260-+- F( 1, 258) = 161.30 Model | 493579.523 1 493579.523 Prob F = 0.0000 Residual | 789466.982 258 3059.94954 R-squared = 0.3847-+- Adj R-squared = 0.3823 Total | 1283046.51 259 4953.84751 Root MSE = 55.317- close | Coef. Std. Err. t P|t| 95% Conf. Interval-+- time | .5805136 .0457079 12.70 0.000 .4905056 .6705216 _cons | -4.69406 6.881046 -0.68 0.496 -18.24422 8.856105得回归结果:close=-4.69+0.58time。(3)建立一个二次模型,解释变量包括时间和时间的平方。模型的拟合效果如何?答:建立二次模型:close=1+2time+3time2+。输入stata回归命令,可得:. gen time2=time2. reg close time time2 Source | SS df MS Number of obs = 260-+- F( 2, 257) = 211.27 Model | 797808.219 2 398904.11 Prob F = 0.0000 Residual | 485238.286 257 1888.08672 R-squared = 0.6218-+- Adj R-squared = 0.6189 Total | 1283046.51 259 4953.84751 Root MSE = 43.452- close | Coef. Std. Err. t P|t| 95% Conf. Interval-+- time | -1.191469 .1441386 -8.27 0.000 -1.475312 -.9076263 time2 | .0067892 .0005348 12.69 0.000 .005736 .0078424 _cons | 72.68253 8.146947 8.92 0.000 56.63926 88.7258得回归结果:close=72.68-1.19time0.0068time2。模型的拟合效果一般,拟合优度只有0.6218,校正拟合优度也只有0.6189。(4)建立一个三次模型: 其中,是股票价格,是时间。哪一个模型更好地拟合了数据?答:输入stata命令,得:. gen time2=time2. gen time3=time3. reg close time time2 time3 Source | SS df MS Number of obs = 260-+- F( 3, 256) = 375.21 Model | 1045314.84 3 348438.28 Prob F = 0.0000 Residual | 237731.665 256 928.639316 R-squared = 0.8147-+- Adj R-squared = 0.8125 Total | 1283046.51 259 4953.84751 Root MSE = 30.474- close | Coef. Std. Err. t P|t| 95% Conf. Interval-+- time | 2.612844 .254008 10.29 0.000 2.112632 3.113055 time2 | -.0295807 .0022591 -13.09 0.000 -.0340296 -.0251319 time3 | .0000929 5.69e-06 16.33 0.000 .0000817 .0001041 _cons | -10.85435 7.669922 -1.42 0.158 -25.95852 4.249829得回归结果:close=-10.85+2.61time-0.0296time2+0.000093time3。由回归结果可知,三次模型较二次模型更好地拟合了数据,原因是三次模型的校正拟合优度比二次模型的大,说明了该模型更具解释力。三:数据集DATA6-9(1)利用数据拟合一个LIV(变量线性)模型,解释回归系数的涵义。模型拟合的效果如何?分别做对和对的散点图。散点图是否呈现出线性模式?答:建立模型:Y=1+2 X1+3 X2+。其中回归系数2、3分别表示当其他解释变量不变时,这一解释变量各自对被解释变量Y的影响程度。输入stata回归命令可得:(因为所给数据有缺失,故剔除了两组数据). rename lifeexp Y. rename peopletv X1. rename peoplephys X2. reg Y X1 X2 Source | SS df MS Number of obs = 38-+- F( 2, 35) = 13.75 Model | 991.123688 2 495.561844 Prob F = 0.0000 Residual | 1261.24473 35 36.0355638 R-squared = 0.4400-+- Adj R-squared = 0.4080 Total | 2252.36842 37 60.8748222 Root MSE = 6.003- Y | Coef. Std. Err. t P|t| 95% Conf. Interval-+- X1 | -.0234954 .0096469 -2.44 0.020 -.0430796 -.0039112 X2 | -.000432 .0002023 -2.14 0.040 -.0008427 -.0000214 _cons | 70.25196 1.087705 64.59 0.000 68.0438 72.46012回归结果:Y=70.25-0.0235X1-0.0004X2。由回归数据可得,该模型的拟合优度只有0.44,即该模型的拟合效果不是很好。 分别做Y对X1和Y对X2的散点图如下:. twoway scatter Y X1. twoway scatter Y X2 Y对X1Y对X2可以上图看出,这两个散点图都没有呈现出线性模型。(2)分别做对和对的散点图。散点图是否呈现出线性模式?答:输入stata命令可得:. gen lnY=log(Y). gen lnX1=log(X1). gen lnX2=log(X2). twoway scatter lnY lnX1. twoway scatter lnY lnX2 lnY对lnX1 lnY对lnX2由上图可以看出,这两个散点图都呈现出线性模式,而且是负相关。(3)估计一个双对数模型。拟合的效果如何? 答:建立双对数模型:lnY=1+2 lnX1+3 lnX2+。输入stata命令可得:. reg lnY lnX1 lnX2 Source | SS df MS Number of obs = 38-+- F( 2, 35) = 69.45 Model | .423465472 2 .211732736 Prob F = 0.0000 Residual | .106700184 35 .003048577 R-squared = 0.7987-+- Adj R-squared = 0.7872 Total | .530165656 37 .014328802 Root MSE = .05521- lnY | Coef. Std. Err. t P|t| 95% Conf. Interval-+- lnX1 | -.0449974 .0088061 -5.11 0.000 -.0628747 -.0271202 lnX2 | -.035013 .0111428 -3.14 0.003 -.057634 -.012392 _cons | 4.563085 .064933 70.27 0.000 4.431264 4.694906得回归结果:lnY=4.56 -0.045lnX1-0.035lnX2。从回归数据可得,该双对数模型的拟合优度达0.7987,高于线性模型的拟合优度。所以此模型的拟合效果较线性模型的拟合效果更好些。(4)解释双对数模型中的回归系数。这些回归系数是否合理?答:回归系数2表示,在其他解释变量不变的情况下,X1的1%的变化引起Y改变2%,即为-0.045%;:回归系数3表示,在其他解释变量不变的情况下,X2的1%的变化引起Y改变3%,即为-0.035%;这些回归系数中,回归系数2合理,回归系数3不合理。四、使用数据集wage.dta,求得wage、educ、exper、tenure之间的相关系数矩阵。答:输入stata命令得:. correlate wage educ exper tenure(obs=526) | wage educ exper tenure-+- wage | 1.0000 educ | 0.4059 1.0000 exper | 0.1129 -0.2995 1.0000 tenure | 0.3469 -0.0562 0.4993 1.0000wage、educ、exper、tenure之间的相关系数矩阵即如上图所示。五、使用mroz.dta数据集,剔除其中在5%的显著性水平下不显著的自变量。答:输入stata命令,得:. sw reg wage inlf hours kidslt6 kidsge6 age educ hushrs husage huseduc huswage faminc motheduc fatheduc exper expersq,pr(.05)(inlf dropped because constant) begin with full modelp = 0.9747 = 0.0500 removing fatheducp = 0.9230 = 0.0500 removing expersqp = 0.8791 = 0.0500 removing husagep = 0.7765 = 0.0500 removing kidslt6p = 0.4023 = 0.0500 removing kidsge6p = 0.2174 = 0.0500 removing huseducp = 0.2087 = 0.0500 rem

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论