(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)_第1页
(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)_第2页
(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)_第3页
(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)_第4页
(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项e具有零均值、同方差和不序列相关性:E( e)=0i=1,2,nVar (i)=。2i=1,2,nCov( i, j)=0i wj i,j= 1,2,,n假设3、随机误差项e与解释变量X之间不相关:Cov(Xi, i)=0i=1,2,,n假设4、e服从零均值、同方差、零协方差的正态分布iN(0,仃2)i=1,2,,n2.2 考虑过原点的线性回归模型Yi= 3iXi+ a i=1,2,,n误差& (i=1,2,)n仍满足基本假定。求 自的最小二乘估计解:

2、nnQe =Z (Yi -Y?)2 = (Yi 邑 Xi)2 i =1i=1Qe = 2. (Yi /Xi)Xi =0二?1i 1n” (XiYJ i dnx (Xi2)i T2.3 证明(2.27 式),工ei =0 ,工eiXi=0 。nnQ=Z (Y -Y?)2 =S (Y -(K+因XJ)2证明:11其中:叶=用+歌 e=Y-Y?I (向+A37= o|Vo+/?rVj-T;)A; = 0即:三 eiXi=02.4 回归方程E (Y)=向+自X的参数 乱例的最小二乘估计与最大似然估计在什 么条件下等价?给出证明。答:由于 e iN(0,仃2)i=1,2,,n所以 Yi=0 + X +

3、qN (向+ iXi ,仃2 )最大似然函数:一 一 2-n2n/217- 一2L( 0, 1,02) =nLfi(Yi) =(2二二 2)exp Yi -( 01 0,Xi)22 ijcm)n91,ncc9LnL( 0, 1,二 2)= -2 二二2)一2% Yi -( 01 0,X i )222 ij使彳3Ln (L)最大的网,邑就是由,伉的最大似然估计值。同时发现使得Ln (L)最大就是使得下式最小, nnQ = (Y T)2 = (Y-(凡+ Xi)2 11上式恰好就是最小二乘估计的目标函数相同。值得注意的是:最大似然估计是在iN(0,。2)的假设下求得,最小二乘估计则不要求分布假设。

4、所以在iN(0,仃2 )的条件下,参数乱代的最小二乘估计与最大似然估 计等价。2.5 证明稣是由的无偏估计。n _ n x _ x证明:E(彳)=E(Y- ZX)= E-x Yi - X iYi)nid Lxx二 En (l_X)Yi = En (口一 XA)。,)i=1 nLxxy nLxx=E 0 : P -X,i=1 nLxx2.6证明证明:)曾=九十 PX告二X)E(M) = P0i T nLxxVar( ?0)=(工X),2 =二 2p -X-)n Xi X 2n Lxxi 1Var(?0) =VarJ - XXi X(- X jXjX)2Var( 0Xi i)U nLxxV nLx

5、x1 2_ X X一()2 -2X ii4 nnLxx(XXi XLxxr1 X、2 二n小2.7 证明平方和分解公式:SST=SSE+SSR证明:SST = (Yi -Y 2 = M Y?)+(Y?Y2=z_ 2 n_ nY? Y2V Yi Y?)(Y? Y 八 Yid)2=(Yi Y2 +Z (Yi i) 2 =SSR +SSE i=12.8验证三种检验的关系,即验证:(2)u SSR/1F 二SSE/(n -2)c?2=t2证明:(1)t ?Lxx一 ;?yy Lxx.c? Lxx - SSE(Lxx(n-2) - . SSE (n - 2) 一,SSE SST 一,1 一 r2(2)s

6、src(?-y)2 = (?1xi -y)2 =、(y 备Xi-X)-y)2=E (耳(xX)2”2Lxxi=1l SSR/1F 二?2hSS日(n -2)2.9 验证(2.63)式:1 Var(ei )=(1 -1 n(xi -x)2Lxx证明:var(e ) = var( X y?) = var( x) + var( y?) 2cov( yi, y?)= var(V)+var(用 +) -2cov( yi, y + 用3 1)(为-x)22 1 (xi -x) -2; -=1(xx)Lxx二2Cov(yi,y ?i(Xi X)=Cov(yi, y) Cov(yi, ?i(Xi X)nn其中

7、:1 (xi - x)、= Cov(yi,yi) (xi - x)Cov(y-y )n i 1iL xx2 21 _ 2 (xi - X) _ 21 (xi - X) 2=;.- = (一 - ) _nLxxn Lxx2.10用第9题证明 n-2是的无偏估计量证明:1 n1noE(;22) =-E(yi -?)2 =- E(e2)n -2 yn -2 T1 J / 1 ,1 (x -x)22二一var(s)二一-y 1 -(卜n _ 2 i 4n _ 2 i 4 nLxx122=(n2)。=:;n -22.11验证决定系数与F值之间的关系式2 F r 二F n-2证明:2 SSR SSR1r

8、二 SST SSR SSE 1 SSE/SSR1二n21 SSR/(SSE/(n -2)1Fd n -2 F n -21 - F2.14为了调查某广告对销售收入的影响, 某商店记录了 5个月的销售收入y (万元)和广告费用x (万元),数据见表2.6,要求用手工计算:表2.6月份12345X12345Y1010202040(1)画散点图(略)(2) X与Y是否大致呈线性关系?答:从散点图看,X与Y大致呈线性关系(3)用最小二乘法估计求出回归方程。计算表XY一 2(Xi -X)一 2(Yi Y)(Xi _X)(Yi _Y)Y?(Y?-Y)2(Y?-Yi)21104100206(-14) 2(-4

9、) 221011001013(-7) 2(3) 2320000200042010027727254044004034142(-6) 2和15100和 Lxx=10Lyy=600和 Lxy=70和100SSR=490SSE=110均3均20均20Lw70M7,*iX回归方程为:Y?=阿+I?X = 1+7X(4)求回归标准误差所以先求SSR (Qe)见计算表。qQe110-?6.055.,n-23(5)给用,耳的置信度为95%的区间估计;由于(1-口)的置信度下,f?的置信区间是(现-7?,? + %/5?)查表可得 t /2(n-2)=to.o25(3) =3.182。?236.667S ?1

10、.915所以?的95%的区间估计为:1 Lxx. 10(73.182*1.915, 7+3.182*1.915),即(0.906,13.094)y 1X2气=?(nL、x)1 2536.667() = 6.3515 10所以?0的 95%的区间估计为:(-1-3.182*6.351, -1+3.182*6.351),即(-21.211,19.211)。P0的置信区间包含0,表示P0不显著“ SSR SSRSST Lyy490600= 0.817(6)计算x和y的决定系数说明回归方程的拟合优度高。(7)对回归方程作方差分析方差分析表方差来源平方和自由度F值SSR490149013.364SSE1

11、10336.667SST6004F值= 13.364F 0.05(1,3)=10.13(当5=1m2=8时,%=0.05查表得对应的值为10.13),所以拒绝原假设,说明回归方程显著。(8)做回归系数01的显著性检验H0: P 1=0t =舀/S? =7/1.915 = 3.656t值=3.656t 0.05/2(3)=3.182,所以拒绝原假设,说明x对Y有显著的影 响。(8)做相关系数R的显著性检验R = R2 = SSR = 0.817 = 0.904 SSTR值=0.904R 0.05(3)=0.878,所以接受原假设,说明x和Y有显著的 线性关系。(9)对回归方程作残差图并作相应的分

12、析残差图(略).从残差图上看出,残差是围绕e=0在一个固定的带子里随 机波动,基本满足模型的假设eiN(0, 22,但由于样本量太少,所以误差 较大.(10)求广告费用为4.2万元时,销售收入将达到多少?并给出置信度为95%的 置信区间.解:当=4.2时,Y0 = ?0?,=1 7 4.2 = 28.4所以广告费用为4.2万元时,销售收入将达到28.4万元.由于置信度为1-a时,Yo估计值的置信区间为:Yo-t:Sy?丫Y0:二 Y0t:Sy?y2 Yo- 0-2 丫0-丫0qq2 1( X 0 - X )1 1.44 xSY? Y = ? (136.667(1 -)工 0nLxx.510所以

13、求得Yo的95%的置信区间为:6.05932 ,50.74068预测误差较大.2.15 一家保险公司十分关心其总公司营业部加班的制度,决定认真调查一下现状。经过十周时间,收集了每周加班工作时间的数据和签发的新保单数目,x为每周新签发的保单数目,y为每周加班工作时间(小时)。见表2.7。表 2.7周序号12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.01、画散点图散点图5.0 每周加 4.0 一班工作,3.0 时间(小 2.0 时)1.0 OO0&O。GOOO111111120040060080

14、0100012001400每周签发的新保单数目2、由散点图可以看出,x与y之间大致呈线性关系3、用最小二乘法求出回归系数回归系数显著性检验表a模型未标准化系数标准化系数tP直95%回归系数的置信区间B标准误下限上限1(Constant).118.355.333.748-.701.937每周签发的新保单数目.004.000.9498.509.000.003.005a. Dependent Variable:周加班工作时间(小时)由表可知:?0 =0.118 ?1 = 0.00 35 9回归方程为:夕=0.118+0.00359X4、求回归标准误差?方差分析表b模型平方和自由度均方FP值1回归16

15、.682116.68272.396.000 a残差1.8438.230总和18.5259a. Predictors: (Constant), 每周 签发 的新 保单 数目b. Dependent Var iable:每周 加班 工作时间(小时)由方差分析表可以得到:SSE=1.843A 2故回归标准误差仃=壁,仃=0.48n 25、给出回归系数的置信度为95%的区间估计回归系数显著性检验表a模型未标准化系数标准化系数tP195%回归系数的置信区间B标准误3下限上限1(Constant).118.355.333.748-.701.937每周签发的新保单数目.004.000.9498.509.00

16、0.003.005a. Dependent Variables周加班工作时间(小时)由回归系数显著性检验表可以看出,当置信度为95%时:*0的预测区间为-0.701,0.937,61的预测区间为0.003,0.005.瓦的置信区间包含0,表示瓦不拒绝为零的假设。模型概要b模型R决定系 数调整后的 决定系数估计值的标 准误差Durbin-Wats on1.949 a.900.888.4800.753a. Predictor s: (Constant), 每周签发的新保单数目b. Dependent Vari able:每 周加 班 工作时 间(小 时)6、决定系数由模型概要表得到决定系数为0.9

17、接近于1,说明模型的拟合优度高方差分析表b模型平方和自由度均方FP值1回归16.682116.68272.396.000 a残差1.8438.230总和18.5259a. Predictors: (Constant), 每周 签发 的新保单 数目b. Dependent Var iable:每周加班 工作 时间(小时)7.对回归方程作方差分析由方差分析表可知:F值=72.3965.32(当星=1门2=8时,查表得对应的值为5.32)P值=0,所以拒绝原假设,说明回归方程显著。8、对3的显著性检验从上面回归系数显著性检验表可以得到 Pi的t统计量为t=8.509 , 所对应的p值近似为0,通过t

18、检验。说明每周签发的新保单数目x对每 周加班工作时间y有显著的影响。9.做相关系数显著性检验相关分析表每周签发的 新保单数目每周加班 工作时间 (小时)每周签发的新保单数目Pearson Correlation1.949*Sig. (2-tailed).000N1010每周加班工作时间(小Pearson Correlation.949*1时)Sig. (2-tailed).000N1010*.Correlation is significant at the 0.01 level (2-tailed).相关系数达到0.949,说明x与y显著线性相关。10、对回归方程作残 差图并作相应分析从残差

19、图上看出,残 差是围绕e=0随即波 动,满足模型的基本 假设。0.600000.30000 _未标 0.00000 _准化残-0.30000 差-0.60000 一-0.90000残差图20040060080010001200每周签发的新保单数目140011、该公司预计下一周签发新保单 X0=1000张,需要的加班时间是多少?当X0=1000 张时,y =0.118 + 0.00359* 1000 = 3.7032 小时12、给出Y。的置信水平为95%的预测区间通过SPSS运算得到Y0的置信水平为95%的预测区间为:(2.5195 , 4.8870 )13给出E (Y0)的置信水平为95%的预

20、测区间(3.284,通过SPSS运算得到Y0的置信水平为95%的预测区间为:4.123)。2.16 表是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资 y(美元)和学生的人均经费投入x(美元).序号yX序号yX序号yX119583334618208163059351953826422202633114191809529673620460312432032535542020939328537214192752426800454221226443914382516034295294704669222462445173922482394762661048882327186434940

21、209692509730678571024339905020412722454408271705536252338235944225892404292585341682620627282143226443402102450035472722795336644246402829112427431592821570292045223412297122717036212922080298046256102932133016837823022250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349172197431553418443230551258453766解答:(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?4 0 0 0 0.03 5 0 0 0.03 0 0 0 0.02 5 0 0 0.02 0 0 0 0.02 0 0 0.0 030 00.0 04 0 0 0.0 0500 0.0 06

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论