第十一章 一元线性回归(共10页)_第1页
第十一章 一元线性回归(共10页)_第2页
第十一章 一元线性回归(共10页)_第3页
第十一章 一元线性回归(共10页)_第4页
第十一章 一元线性回归(共10页)_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人大出版社统计学第四版课后习题参考答案第十一章 一元(y yun)线性回归11.1 从某一行业中随机抽取12家企业,所得产量与生产费用(fi yong)的数据如下:企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)14013078416524215081001703501559116167455140101251805651501113017567815412140185要求(yoqi):(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。(2)计算产量与生产费用之间的线性相关系数。(3)对相关系数的显著性进行检验( = 0.05),并说明二者之间的关系强度。解:(1)

2、利用Excel的散点图绘制功能,绘制的散点图如下:从散点图的形态可知,产量与生产费用之间存在正的线性相关。(2)利用Excel的数据分析中的相关系数功能,得到产量与生产费用的线性相关系数r = 0.920232。(3)计算t统计量,得到t = 7.435453,在 = 0.05的显著性水平下,临界值为2.6337,统计量远大于临界值,拒绝原假设,产量与生产费用之间存在显著的正线性相关关系。r大于0.8,高度相关。11.2 学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之间是否有关系?为研究这一问题,以为研究者抽取了由8名学生构成的一个随机样本,得到的数据如下:复习时间x考试

3、分数y20641661348423702788329218722277要求(yoqi):(1)绘制复习时间和考试分数的散点图,判断(pndun)二者之间的关系形态。(2)计算相关系数,说明两个变量(binling)之间的关系强度。解:(1)利用Excel的散点图绘制功能,绘制的散点图如下:从散点图的形态来看,考试分数与复习时间之间似乎存在正的线性相关关系。(2)r = 0.862109,大于0.8,高度相关。11.3 根据一组数据建立的线性回归方程为。要求:(1)解释截距的意义。(2)解释斜率意义。(3)计算当x = 6时的E(y)。解:(1)在回归模型中,一般不能对截距项赋予意义。(2)斜率

4、的意义为:当x增加1时,y减小0.5。(3)当x = 6时,E(y) = 10 0.5 * 6 = 7。11.4 设SSR = 36,SSE = 4,n = 18。要求:(1)计算判定(pndng)系数R2并解释(jish)其意义。(2)计算(j sun)估计标准误差se并解释其意义。解:SST = SSR+SSE = 36+4 = 40,R2 = SSR / SST = 36 /40 = 0.9,意义为自变量可解释因变量变异的90%,自因变量与自变量之间存在很高的线性相关关系。(2) = 0.5,这是随机项的标准误差的估计值。11.5 一家物流公司的管理人员想研究货物的运送距离和运送时间的关

5、系,因此,他抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:运送距离x运送时间y8253.5 2151.0 10704.0 5502.0 4801.0 9203.0 13504.5 3251.5 6703.0 12155.0 要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态。(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。解:(1)利用Excel绘制散点图,如下:从散点图的形态(xngti)来看,运送时间和运送距离之间存在正的线性相关关系。(2)计算(

6、j sun)的相关系数为0.9489,这是一个很高的相关系数。(3)用OLS方法(fngf)估计得到模型参数为= 0.118129,= 0.003585,回归方程为:运送时间 = 0.118129 + 0.003*运送距离,意义为:运送距离每增加1km,运送时间增加0.003383天,即0.086小时。11.6 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京224607326辽宁112264490上海3454711546江西48512396河南54442208贵州26621608陕西45492035要求:(1)人均GDP

7、作自变量,人均消费水平左因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性( = 0.05)。(6)如果某地区(dq)的人均GDP为5000元,预测其人均消费水平。(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测(yc)区间。解:(1)利用Excel绘制(huzh)的散点图如下:从散点图来看,人均消费水平与人均GDP之间存在很强的正线性相关关系。(2)r = 0.998,高度相关。

8、(3)用OLS方法估计得到模型参数为= 734.69,= 0.308,回归方程为:人均消费水平 = 734.69 + 0.308*人均GDP,意义为:人均GDP每增加1元,人均消费水平增加0.31元,此值即为经济学中的边际消费倾向。这里截距可解释为人均GDP为0时,居民的消费支出为734元/年,即经济学中的自发支出。(4)判定系数R2 = 0.996,人均消费水平变异的99%可由人均GDP来解释。(5)这是一个一元线性回归模型,只需要检验斜率系数的显著性即可。斜率系数的t统计量,显著性水平为0.05,自由度为7-2=5,临界值为3.16,统计量远大于临界值,是高度显著的。(6)将人均GDP代入

9、到估计的回归方程,计算得到人均消费水平的期望值为2278元。(7)查表得,点估计值为2278元,标准误差为247.3035,人均消费水平95%的置信区间为即(1990.73,2565.27)。而人均消费水平95%的预测(yc)区间为即区间(q jin)(1580.79,2975.21),对个别值的预测精确度比对总体(zngt)均值的预测低。11.7 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据如下:航空公司编号航班正点率(%)投诉次数(次)181.821276.658376.685475.768573.874672.293771.272870.812299

10、1.4181068.5125要求:(1)绘制散点图,说明二者之间的关系形态。(2)用航班正点率左自变量,顾客投诉次数左因变量,求出估计的回归方程,并解释回归系数的意义。(3)检验回归系数的限制性(=0.05)。(4)如果航班正点率为80%,估计顾客投诉次数。(5)求航班正点率为80%时,顾客投诉次数95%的置信区间和预测区间。解:(1)散点图如下。从散点图的形态来看,航班正点率与顾客投诉(tu s)次数之间有负的线性相关关系。(2)用Excel回归分析,得到(d do)估计的回归方程如下:斜率系数为-4.70062,表示(biosh)航班正点率提高1个百分点,顾客投诉次数减少4.7次。符号为负

11、,与理论相符。截距系数一般不赋予意义。(3)一元回归只要检验斜率系数的显著性即可。斜率西数的t统计量为相应的P值为0.001108,小于0.05,t统计量是显著的。(4)由估计的回归方程,得到果航班正点率为80%,估计顾客投诉次数为430.1892 - 4.70062*80 = 54.1396(次)(5)查表得,点估计值为54.1396元,标准误差为18.887,故置信区间为即区间(37.6597,70.61949)。而预测区间为即区间(7.57204,100.7071)11.8 下面是20个城市(chngsh)写字楼由出租率和每平方米月租金的数据。地区编号出租率(%)每平方米月租金(元)17

12、0.6 99269.8 74373.4 83467.1 70570.1 84668.7 65763.4 67873.5 105971.4 951080.7 1071171.2 861262.0 661378.7 1061469.5 701568.7 811669.5 751767.7 821868.4 941972.0 922067.9 76设月租金为自变量,出租率为因变量,用Excel进行回归,并对结果(ji gu)进行解释和分析。解:回归分析结果(ji gu)如下:SUMMARY OUTPUT回归统计Multiple R0.79508R Square0.632151Adjusted R S

13、quare0.611715标准误差2.685819观测值20方差分析dfSSMSFSignificance F回归分析1223.1403223.140330.933182.8E-05残差18129.84527.213622总计19352.9855Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept49.317683.80501612.961231.45E-1041.3236457.3117241.3236457.31172X Variable 10.2492230.044815.5617612.8E-0

14、50.155080.3433650.155080.343365结果(ji gu)分析如下:(1)斜率系数(xsh)的t统计量在95%的显著性水平下是高度显著的,斜率系数等于0.2492,表示每平方米月租金提高1元,出租率将提高0.2492个百分点。(2)判断(pndun)系数R2等于6321,表示出租率的变异可由月租金解释63.21%。判断系数不算很高,可能还有其它的变量影响出租率。11.9 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificance F回归2.17E-09残差40158

15、.07总计111642866.67参数估计表Coefficients标准误差t Stat.P-valueIntercept363.689162.455295.8231910.000168X Variable 11.4202110.07109119.977492.17E-09要求:(1)完成上面的方差分析表。(2)汽车销售量的变差中有多少是由广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。(5)检验线性关系的显著性(=0.05)。解:(1)此为一元线性回归,由自由度可知,样本容量n = (11+1)=12。由此可计算各自由度和S

16、S。进而计算各均方误,最后计算出F统计量(MSR/MSE)。结果如下:方差分析表变差来源dfSSMSFSignificance F回归11602708.61602708.6199.12.17E-09残差1040158.074015.807总计111642866.67(2)计算判断(pndun)系数,表明(biomng)销售量的变异有97.55%是由广告费用的变东引起的。(3)一元线性回归模型(mxng)中,相关系数等于判断系数的平方根,即0.9877。(4)根据估计得到的模型参数,回归方程如下:表示广告费用增加1单位,销售量将平均增加1.42单位。(5)由参数估计表可知,斜率系数的t统计量等于19.97749,这是一个在显著性水平0.05下高度显著的统计量。11.10 根据下面的数据建立回

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论