第3章计算机习题答案.pdf_第1页
第3章计算机习题答案.pdf_第2页
第3章计算机习题答案.pdf_第3页
第3章计算机习题答案.pdf_第4页
第3章计算机习题答案.pdf_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第第 3 章章 多元回归分析:估计多元回归分析:估计 C3.1 使用数据使用数据 bwght.dta (i)2的符号应该为正,更高的收入一般意味着母亲有更好的营养和更好的产前照顾。 (ii) 一方面,收入增加通常会增加对物品的消费,所以 cigs 和 faminc 正相关。另一方面,高收 入家庭会有更高的教育水平,而教育水平与吸烟数量可能是负相关的。Cigs 和 faminc 这两 个变量的样本相关系数是-0.173,这显示它们是负相关的。 (iii) 包含 faminc 和不包含 faminc 的回归结果分别是 2 119.770.514 1388,0.023 bwghtcigs nR 2 和 2 116.970.4630.093min 1388,0.030 bwghtcigsfac nR 当 faminc 被加入回归后,吸烟数量对婴儿体重的效应轻微缩小了,与未加入 faminc 的回归 相比,cigs 的系数仅仅从-0.514 上升到-0.463,因此 cigs 对 bwght 的影响并没有发生实质差 别。这是因为 cigs 和 faminc 相关性较小,faminc 的系数实际上也是比较小的。(变量 faminc 的衡量单位是千美元,因此以 1988 年美元计算的收入每增加 10000 美元,婴儿体重的预测 值仅仅增加 0.93 盎司。) C3.2 使用数据使用数据 hprice1.dta (i) 估计方程是 2 19.320.12815.20 88,0.632 pricesqrftbdrms nR (ii)保持住房平方尺数不变, 15.20pricebdrms,所以 price会增加 15.20,即 15200 美元。 (iii) 现在 0.2815.200.128 140 15.2033.12pricesqrftbdrms, 或者说 33120 美 元。因为房子的面积增加了,这个效应比(ii)中的效应大得多。 (iv)大约 63.2%。 (v) 3 第 1 套住房的预测价格是 354.605,或者说 354605 美元。 (vi) 残差是-54.605。这说明买者在某种程度上少支付了一部分钱。但是,住房的很多其他特征 也影响价格,有些因素我们甚至无法量化,我们不能完全控制这些因素。因此,我们不能说 购买者为这套住房支付了过低或过高的价格。 C3.3 使用数据使用数据 ceosal2.dta (i) 常弹性方程是 2 log()4.620.162log()0.107log() 177,0.299 salarysalesmktval nR (ii) 4 我们不能把利润的对数形式加入模型是因为样本中有 9 家企业的利润是负值。 我们在回归模 型加入利润的水平形式,可以得到 2 log()4.690.161log()0.098log()0.000036 177,0.299 salarysalesmktvalprofits nR Profits 的系数非常小。 这里, profits 的度量单位是百万美元。 所以如果利润增加 10 亿美元, 这意味着1000profits,这是一个很大的变动,但是预测这个变动只会使 salary 增加大 约 3.6%。当然,记得我们需要保持 sales 和 mktval 的值不变。 总体来看,这些变量(我们可以舍去 profits,这并不会有任何不同)只解释了 log(salary)的样 本变异的大约 30%。这肯定谈不上解释 CEO 薪水变异中的“大部分”。 (iii) 5 增加 ceoten 后方程变为 2 log()4.560.162log()0.102log()0.0000290.012 177,0.318 salarysalesmktvalprofits nR 这意味着 CEO 每增加 1 年任期,预测 salary 增加大约 1.2%。 (iv) Log(mktval)和 profits 的样本相关系数是大约 0.78, 这是相当高的。 我们知道, 这不影响 OLS 估计量的无偏性,但会使得它的方差变大。由于市场价值和企业利润有如此高的相关性,回 归时加入利润根本无助于解释 CEO 的薪水。而且,profits 是一个短期术语,它衡量了企业 当前经营的方式;而 mktval 的大小则基于企业过去、当前和预期未来的利润获取能力。 C3.4 使用数据使用数据 attend.dta (i) 这 3 个变量的最小值、最大值和平均值如下表 变量 平均值 最小值 最大值 atndrte 81.71 6.25 100 priGPA 2.59 0.86 3.93 ACT 22.51 13 32 (ii) 估计方程是 6 2 75.70 17.261.72 680,0.291 atndrtepriGPAACT nR 这里的截距意味着对一个学生来说,如果他以前学期的 GPA 为 0,并且他的 ACT 成绩也是 0,那么预测他的出勤率为 75.7%。很显然这没有什么意义。(事实上,在大学的总体中,没 有任何学生 priGPA=0,ACT=0) (iii)priGPA 的系数意味着, 如果一个学生以前学期的GPA提高1 个点 (如从2.0提高到 3.0) , 出勤率大约会提高 17.3 个百分点。上面的结论需要保持 ACT 不变。 ACT 的系数为负,也 许这有点奇怪。ACT 提升 5 个点会在给定 priGPA 水平下使得出勤率降低 8.6 个百分点。由 于 priGPA 衡量大学成绩(至少可以部分反映过去的出勤率) ,而 ACT 可以衡量大学潜力, 这显示 had more promise(这意味着天赋能力更高)的学生认为他们即使上课次数较少也可以 通过考试。 (iv) 我们有 75.70 17.26 3.65 1.72 20104.299atndrte。当然,一个学生的出勤率不 可能超过 100%。 当使用存在自然上界和下界的因变量进行回归时经常会得到这样的预测值。 在实践中, 我们可以预测这个学生的出勤率为 100%。(实际上, 这个学生的出勤率仅为 87.5%) (v) 对于 A 和 B 来说,预测出勤率的是 22.26. C3.5 使用数据使用数据 wage1.dta 用 educ 对 exper 和 tenure 作回归,得到 1 2 13.570.0740.048 526,0.101 educexpertenurer nR 7 现在我们用 log(wage)对 1 r 作回归,得到 1 2 log()1.620.092 526,0.207 wager nR 我们得到式(3.19) 2 log()0.2840.0920.0040.022 526,0.316 wageeducexpertenure nR 和预期的一样,第二次回归中 1 r 的系数等于式(3.19)中 educ 的系数。注意到第二次回归的 R2小于式(3.19)的 R2。事实上,对 1 r 的回归仅仅使用 educ 中与 exper 和 tenure 不相关的那部 分来解释 log(wage)。 C3.6 使用数据使用数据 wage2.dta (i) 8 用 IQ 对 educ 的简单回归的斜率系数 1 3.53383 (ii) 用 log(wage)对 educ 作回归的斜率系数 1 0.05984 (iii) 用 log(wage)对 educ 和 IQ 做回归的斜率系数分别是 1 0.03912和 2 0.00586。 (iv) 我们有 121 0.039120.00586 3.533830.05983 ,它非常接近于 0.05984。 9 C3.7 使用数据使用数据 meap93 (i) 回归结果是 2 10 20.366.23log()0.305 408,0.180 mathexpendlnchprg nR 斜率系数的符号意味着在给定 lnchprg 的情况下,更多的支出将会提高通过率;并且在支出 给定的情况下,更高的贫困率(用 lnchprg 代表)会降低通过率。 (ii)一般来说,截距是当所有解释变量为 0 时因变量的预测值。如果贫困率很低,那么 lnchprg=0 是可以理解的。但 log(expend)=0 是没有道理的,因为此时 expend=1,spend 衡量 的是每个学生支出的美元数。 显然, 这个假设超过了合理范围。 毫不奇怪, 此时预测值-20.36 是没有意义的。 (iii) 这个简单回归的结果是 2 10 69.34 11.16log() 408,0.030 mathexpend nR 这里估计的支出效应超过第(i)部分,这是值得怀疑的。 (iv) 10 这里 lexpend 和 lnchprg 之间的样本相关系数是大约-0.19,这意味着,平均来说,贫困学生 更多的高中每个学生的支出较少。这是有道理的,特别是在 1933 年,密歇根州的学校所需 资金完全取决于当地的财产税筹集情况。 (v)我们可以使用式 3.23。因为 corr(x1,x2)0,这意味着 1 0 ,而且 2 0,简单回归系数 1 大于多元回归估计量 1 。直觉上来看,没有考虑贫困率导致对支出效应的过度估计 (overestimate)。 C3.8 使用数据使用数据 discrim.dta (i) 样本中 prpblck 的平均值约为 0.113,标准差约为 0.182;income 的平均值为 47053.78,标准 差为 13179.29。prpblck 的度量单位是比值,income 的单位应是美元。 (ii) 回归结果是 11 2 0.9560.1150.0000016 401,0.0642 psodaprpblckincome nR prpblck 的系数的含义是在 income 保持不变时,人口中黑人比例如果增加十个百分点(比如 从 0.20 上升到 0.30),那么苏打的价格会上升 0.0115 美元。这个数字在经济上是个很小的数 字。 (iii) 回归结果: 2 1.0370.065 401,0.0181 psodaprpblck nR 在控制收入变量后,这种歧视效应更大了。 (iv) 常弹性方程的回归结果是: 2 log()0.7940.1220.077log() 401,0.0681 psodaprpblckincome nR 若 prpblck 提高 0.01,即 1 个百分点,估计会使得 psoda 上升 0.122%;因此,若 prpblck 提 高 0.20,即 20 个百分点,估计会使得 psoda 上升 2.44%。 (v) 12 回归结果是: 2 log()0.4630.0730.137log()0.380 401,0.0681 psodaprpblckincomeprppov nR 加入变量 prppov 后, prpblck 由 0.122 下降到 0.073,几乎下降了一半。 (vi) Log(income)和 prppov 的相关系数大约是-0.84。 大致符合我的预期。 因为 prppov 是各邮区的 贫困率,显然,若某邮区的贫困率(prppov)较高,则该邮区平均家庭收入的中位数(income) 就会较低,进而 log(income)也较低。因此,log(income)和 prppov 有较强的负相关性。 (vii)尽管 log(income)和 prppov 相关性较强,但我们并不能断定它会带来严重的问题,特别 是在样本容量较大时。这里的样本容量为 401,并不是太小,因此这两个变量可以同时进入 回归方程。 C3.9 使用数据使用数据 charity.dta (i) 13 简单回归的估计方程是 2 2.01 2.65 4268,0.0138 giftmailsyear nR 估计方程是: 2 4.552.170.005915.36 4268,0.0834 giftmailsyeargiftlastpropresp nR 现在的 R2是大约 0.083,而不包括 giftlast 和 propresp 的简单回归得到的 R2是大约 0.014。 所以,相比于简单回归,变量 giftlast 和 propresp 有助于更多的解释 gifts 的变动。 (尽管仍 然只有 8%多一点) (ii)保持 giftlast 和 propresp 不变,每年寄出的邮件每增加 1 封,估计 gift 将增加 2.17 盾。简 单回归的系数是 2.65,所以多元回归中 mailsyear 的系数略有下降。需要记住,简单回归的 估计量并没有保持其他任何因素不变。 (iii)因为 propresp 是个比值,所以增加 1 个单位是没有意义的,只有从 0 增加到 1 才能发生 这种情况。我们考虑 propresp 增加 0.10,这意味着增加了 10 个百分点。估计 gift 会增加 15.36 0.10=1.536 盾。 (iv) 14 估计方程是 2 7.33 1.200.26116.20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论