《商务统计分析 第2版》 第10章 习题答案_第1页
《商务统计分析 第2版》 第10章 习题答案_第2页
《商务统计分析 第2版》 第10章 习题答案_第3页
《商务统计分析 第2版》 第10章 习题答案_第4页
《商务统计分析 第2版》 第10章 习题答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

思考与练习题思考题10.1.多重判定系数和修正的多重判定系数有什么作用?多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例,其计算公式为:修正的多重判定系数考虑了样本量()和模型中自变量的个数()的影响,这就使得的值永远小于,而且的值不会由于模型中自变量个数的增加而越来越接近1,其计算公式为:10.2.如何进行回归系数的显著性检验?将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著。10.3.模型中虚拟变量是什么,为什么要引入虚拟变量?虚拟变量是用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入虚拟变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。10.4.多重共线性会导致什么后果,如何检测并处理?多重共线性是指回归模型中两个或两个以上的自变量彼此相关,多重共线可能会使回归的结果造成混乱,可能对参数估计值的正负号产生影响。检测多重共线性的最简单的一种办法是计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验。将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。10.5.解释向前回归、向后剔除和逐步回归的异同点。逐步回归法可以认为是向前引入法与向后剔除法的综合。逐步回归法克服了向前引入法与向后剔除法的缺点,吸收两种方法的优点。10.6.多元线性回归预测和因果分析有什么不同?预测因果分析遗漏的变量遗漏变量对于预测的影响小的多。预测的目标是基于可用的变量的线性组合,得到优化的预测。因此不存在对预测来说“真正的”系数进行优化估计的说法。除非如果加入遗漏的变量,可以改进预测。因果分析的主要目标是得到回归系数的无偏倚估计。因此遗漏的变量造成的偏倚是极具威胁的。特别是那些既影响因变量,又和自变量相关的变量。这些变量的遗漏往往会导致无效结论。反映了预测模型对数据的拟合度。最大化R2对预测建模是关键性的。当小的时候,也能做好因果分析,检验自变量对因变量效果的假设。可以通过大样本量抵消小的短处。多重共线性预测不管多重共线性。看的是所有自变量的组合对因变量的预测能力。因此可以不一个个地拆开对待自变量。多重共线性是因果分析的一个主要问题。当两个或更多自变量高度相关时,对每个自变量独立的系数估计就能难得到可靠的结论。缺失数据缺失数据对预测的影响可能有两个方面。首先,某个数据缺失了本身对预测来说是一个有用的信息。其次,不仅仅训练数据会缺失,测试数据也会有缺失。以前对缺失数据的研究都是为了做参数估计和假设检验。测量误差测量误差对预测肯定有影响。但如何干预要看情况。很多时候做预测的数据就长成那样,也没法干预。测量误差会对因果分析的参数估计带来误差。因此需要尽量控制。练习题10.7.为了分析薪酬与受教育年限、工作年限之间的关系,某调查机构调查了15个员工的情况,数据如下表所示:员工编号薪酬(元)受教育年限(年)工作年限(年)1550012224850963700012104685016353500926900016275400125849501249825016210670012611795016312435094136300129145900128158500163(1)建立回归模型,得出估计方程并对解释回归系数的含义。(2)根据估计方程说明的含义。解:首先多元线性回归模型需要满足残差零均值、方差齐性、正态性及独立性的假设,同时还需要进行多重共线性诊断。先做出因变量的分布图以及回归的残差图,如下从以上残差图可以看出,基本满足零均值、正态性、方差齐性条件。(1)设薪酬为,受教育年限为,工作年限为,根据最小二乘法估计回归模型参数:,,可得估计方程为下面运用SPSS软件进行回归分析,结果如下表所示模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.926a.858.834659.3982.235a.预测变量:(常量),工作年限,受教育年限。b.因变量:薪酬根据上表对于残差独立性的检验,DW值在2附近,说明模型不存在自相关。模型的参数估计和检验a模型非标准化系数标准系数tSig.共线性统计量β标准误差β容忍度VIF1(常量)-1897.3051071.848-1.770.102受教育年限597.51470.730.9808.448.000.8791.138工作年限135.28170.493.2231.919.079.8791.138a.因变量:薪酬从上表可以看出VIF<10,不存在较严重的多重共线性。对于回归系数的解释:在控制其他变量不变的情况下,每增加1年受教育年限,薪酬增加597.514元;在控制其他变量不变的情况下,每增加1年工作年限,薪酬增加135.281元。(2),修正后,说明薪酬能被回归方程所解释的比例为83.4%。10.8.某公司对于新上线的产品通过电脑端和手机端两种渠道进行推广,为调查收入与两种推广渠道的关系,选取了87个月的收入和渠道推广费用数据:收入(万元)电脑端费用(万元)手机端费用(万元)955.01.5902.02.0964.51.5922.52.5943.03.0953.53.0933.02.5(1)确定估计方程。(2)给出收入的预测值及95%置信区间和预测区间。解:首先多元线性回归模型需要满足残差零均值、方差齐性、正态性及独立性的假设,同时还需要进行多重共线性诊断。先做出因变量的分布图以及回归的残差图,如下从残差图中可以发现零均值、方差齐性不满足,可采用加权最小二乘法进行估计,残差的正态性近似满足。(1)设收入为,电脑端费用为,手机端费用为,根据最小二乘法估计回归模型参数:,,可得估计方程为:下面运用SPSS软件进行回归分析,结果如下表所示模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.955a.912.868.7521.650a.预测变量:(常量),手机端费用,电脑端费用。b.因变量:收入从上表看出,DW在2附近,基本满足独立性。模型的参数估计和检验a模型非标准化系数标准系数tSig.共线性统计量β标准误差β容忍度VIF1(常量)82.8052.18137.968.000电脑端费用2.176.3421.1246.367.003.7061.417手机端费用1.514.574.4652.635.058.7061.417a.因变量:收入从表中可以看出VIF<10,不存在较严重的多重共线性。(2)收入的预测值及95%置信区间和预测区间如下表所示收入y预测值标准化预测值置信区间下限置信区间上限预测区间上限预测区间下限9595.961.2194.3897.5493.3498.589090.19-1.7188.4291.9587.4592.929694.870.6693.4996.2592.3797.379292.03-0.7890.9893.0889.6994.379493.880.1592.6095.1591.4396.329594.960.7093.5196.4192.4297.519393.12-0.2392.2693.9790.8695.3710.9.某地区为了研究农作物产量与降水量和温度的关系,随机选取7组数据进行分析。产量(公斤)降水量(ml)温度(℃)23502053400357475050961508511680010013750011516815012017(1)建立二元线性回归方程,对回归模型的线性关系和回归系数进行检验()。(2)判断是否存在多重共线性。解:首先多元线性回归模型需要满足残差零均值、方差齐性、正态性及独立性的假设。先做出因变量的分布图以及回归的残差图,如下从残差图中看出正态性、零均值、方差齐性基本满足。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.993a.986.980309.1721.523a.预测变量:(常量),温度,降水量。b.因变量:产量根据上表DW值在2附近,说明残差独立性假设基本满足。模型的参数估计和检验a模型非标准化系数标准系数Sig.共线性统计β标准错误β容忍度VIF1(常量)1243.750524.2262.373.077降水量41.05117.759.7602.312.082.03231.676温度113.358158.280.236.716.513.03231.676a.因变量:产量y(1)二元线性回归方程为:①首先对回归方程总体进行F检验:提出假设:,:,至少有一个不为0计算检验统计量:根据给定的显著性水平,查F分布表,得,显然,故拒绝原假设,这表明农作物产量和降水量、温度之间存在显著的关系。②对回归系数进行t检验:提出假设:,:(i=1,2)根据给定的显著性水平,自由度4查t分布表,得,显然,,故不拒绝原假设,这表明降水量、温度和产量之间不存在显著的关系。(2)由(1)可知,模型F检验显著,但回归系数,的t检验均不显著,模型可能存在多重共线性。VIF>10,,的共线性超过容许界限,存在严重共线性。10.10.某房地产行业为对新开发地区房产进行合理估价,选取了10栋房产的评估数据,以此建立模型实现价格预测。房产编号售价(元/m2)地产房产面积(m2143508002089127302480090029551725035250380359410760457004002176134305630010003958126506665058044651882077200610512718770876507705395185309815010305539195001084002270488918150(1)进行逐步回归,确定估计方程。(2)给出预测值及95%置信区间和预测区间。解:首先多元线性回归模型需要满足残差零均值、方差齐性、正态性及独立性的假设。先做出因变量的分布图以及回归的残差图,如下从残差图中看出零均值、方差齐性、独立性基本满足;正态性近似满足。(1)对3个自变量分别进行一元线性回归,计算F统计量。,,在显著性水平下,因此x1不适合来解释因变量。由此,选择F统计量最大的自变量进入模型,可得到估计的回归方程:。同时引入自变量及交互项,分别计算F统计量。,在显著性水平下,因此x2可以来解释因变量。进一步针对回归系数进行显著性检验,提出假设:,:(i=2,3),,在显著性水平,自由度7查t分布表,得,显然,,故不拒绝原假设,这表明面积及面积与房产的交互项和售价之间不存在显著的关系。综上,估计的回归方程为。下面运用SPSS软件进行回归分析,结果如下表所示模型的参数估计a模型非标准化系数标准系数tSig.β标准错误β1(常量)2497.690730.4663.419.009房产x.982.174.8945.646.000a.因变量:售价y排除的变量a模型输入βt显著性偏相关共线性统计容许1地产x.264b1.766.121.555.890面积x.133b.560.593.207.484a.因变量:售价yb.模型中的预测变量:(常量),房产x(2)预测值及95%置信区间和预测区间如下表编号售价y(元/m2预测值标准化预测值置信区间下限置信区间上限预测区间上限预测区间下限143504549.58-1.503634.275464.892754.186344.98248005400.20-0.834751.636048.763724.997075.40352506027.84-0.335510.556545.144398.967656.73457004635.03-1.443749.055521.022854.416415.66563006385.38-0.055896.346874.424765.258005.51666506883.370.356363.167403.585253.568513610.866873.148194.095853.769213.46876507796.851.077059.718533.996085.419508.30981507938.291.187156.958719.646207.359669.241084007299.840.686699.467900.215642.708956.9810.11.男女的薪资差异一直存在着争议,某调查机构为了研究性别与薪资的关系,随机调查了12名员工,相关数据如下。月薪(元)工作年限(年)性别(1=男性,0=女)55843.2166903.9145782.7079554.7173464.5058683.4157723.3045502.8048732.7167453.8139502.3133482.40进行回归并对结果进行分析。解:首先多元线性回归模型需要满足残差零均值、方差齐性、正态性及独立性的假设。先做出因变量的分布图以及回归的残差图,如下从残差图中看出正态性、零均值、方差齐性基本满足。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.987a.975.969246.6761.474a.预测变量:(常量),性别,工作年限。b.因变量:月薪根据上表DW值在2附近,说明残差独立性假设基本满足。模型的参数估计和检验a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)-235.3283

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论