版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《应用回归分析》部分课后习题答案
第一章回归分析概述
1.1变量间统计关系和函数关系的区别是什么?
答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量
唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另
外一个变量的确定关系。
1.2回归分析与相关分析的联系与区别是什么?
答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.
在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变
量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x
与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机
变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以
是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的
密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归
方程进行预测和控制。
1.3回归模型中随机误差项£的意义是什么?
答:£为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为
一个随机方程,使得我们可以借助随机数学方法研究y与xl,x2….xp的关系,
由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,
随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑
的种种偶然因素。
1.4线性回归模型的基本假设是什么?
答:线性回归模型的基本假设有:1.解释变量xl.x2….xp是非随机的,观测值
xil.xi2-..xip是常数。2.等方差及不相关的假定条件为{E(£i)=0i=l,2….
Cov(ei,£j)={o-2
3.正态分布的假定条件为相互独立。4.样本容量的个数要多于解释变量的个数,
即n>p.
1.5回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?
答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判
断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意
的问题有:在选择变量时要注意与一些专门领域的专家合作,不要认为一个回归
模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需要反复试
算,最终找出最合适的一些变量。
1.6收集,整理数据包括哪些内容?
答;常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要
有按时间顺序统计数据和在同一时间截面上统计数据,在数据的收集中,样本容
量的多少一般要与设置的解释变量数目相配套。而数据的整理不仅要把一些变量
数据进行折算差分甚至把数据对数化,标准化等有时还需注意剔除个别特别大或
特别小的“野值
1.7构造回归理论模型的基本依据是什么?
答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出
解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关
系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模
拟,对不同的模拟结果,选择较好的一个作为理论模型。
1.8为什么要对回归模型进行检验?
答:我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这
个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确
定这个模型是否真正揭示了被解释变量和解释变量之间的关系。
1.9回归模型有那儿个方面的应用?
答:回归模型的应用方面主要有:经济变量的因素分析和进行经济预测。
1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?
答:在回归模型的运用中,我们还强调定性分析和定量分析相结合。这是因为数
理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,
单纯的表面上的数量关系是否反映事物的本质?这本质究竟如何?必须依靠专
门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据
估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及
现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。
第二章一元线性回归
2.14解答:(1)散点图为:
40.00000-
35.00000-
3000000-
A2500000-
2000000-
1500000-
1000000-
1000002.00000300000400000.00000
X
(2)x与y之间大致呈线性关系。
(3)设回归方程为y=A+4x
〃——
A工七%一〃xy
0尸一,一7
i=\
/70=y—/7tx=2O—7x3=—1
.,.可得回归方程为y=-l+7x
A2]、A2
(4)(T
n-2M
1nAA2
就3-(…X))
I(10-(-1+7x1))2+(10-(-1+7x2))2+(20-(-1+7x3))2
3+(20-(-1+7x4)¥+(40-(-1+7x5))2
#16+9+0+49+36]
110/3
2
^■=-7330^6.1
3
A(y~
(5)由于月N(4,厂)
Jb/4CT
服从自由度为n-2的t分布。因而
1一a
CT
AA
也即:p^p-tan-^=<<^+ta/2-^=)=\-a
可得用的置信度为95%的置信区间为(7-2.353xg回,7+2.353xg屈)
即为:(2.49,11.5)
2
A1(y\
AN(/3o,(一+~f—)/)
〃4
A)-AA)-A)
服从自由度为n-2的t分布。因而
P।,一用|<%2(W—2)=l-a
;IE
(yAI—i----
LN〃4
nnA1(XL02Ali(XT、.
即P(&-b卜+——ta/2</70</?0+(T.-+——G/2)=1—&
V«4r\nLxx
可得衣的置信度为95%的置信区间为(-7.77,5.77)
(6)x与y的决定系数产=T-----=490/600«0.817
f(y‘-y)2
i=l
3
(7)
ANOVA
平方和df均方F显著性
组间(组合)9.00024.5009.000.100
线性项加权的8.16718.16716.333.056
偏差.8331.8331.667.326
组内1.0002.500
总数10.0004
由于尸>笈(1,3),拒绝"o,说明回归方程显著,x与y有显著的线性关系。
八2
1«A2
其中。Z(yr)
〃一2i=I
7xV10
=,—«3.66
-V33O
3
%2=2353
t=3.66>ta/2
二接受原假设H0:g=0,认为4显著不为0,因变量y对自变量X的一元线性回归成立。
--
Z(Xj—x)(y—y)L
(9)相关系数r=1
历―y)LA
V1=1i=\
707
=0.904
V10x600V60
「小于表中a=1%的相应值同时大于表中a=5%的相应值,x与y有显著的线性关系.
(10)
V
序号XAe
y
111064
221013-3
3320200
442027-7
5540346
残差图为:
4
残差图
5.00-
2.50-
o.oo-
-2.50-
-5.00-
-7.50-
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)当广告费%=4.2万元时,销售收入%=28.4万元,置信度为95%的置信区间
近似为,±2(r,即(17.1,39.7)
2.15解答:
(1)散点图为:
x与y散点图
5.00-O
O
4.00-O
O
A3.00-OO
2.00-O
O
1.00-oO
250.00500.00750.001000.001250.00
X
(2)x
5
与y之间大致呈线性关系。
(3)设回归方程为y=/()+/1x
_自若/一〃/)'(26370—21717)
'一『2~-(7104300-5806440)=0.0036
i=\
0o=y~B、x=2.85—0.0036x762=0.1068
可得回归方程为y=0.1068+0.0036^
A2|11A2
⑷。=
n-2M
2
1nAA
=--(A)+/i%))
n-2i=i
=0.2305
o-=0.4801
△(y~
(5)由于笈N(7?「厂)
La
lB、—B\
A
a
服从自由度为n-2的t分布。因而
p1生监“〃_/=〜
a
(J3
也即:P(4一%2r:—<<P\+%2
yl.xx
可得用的置信度为95%的置信区间为
(0.0036-1.860x0.4801/71297860,0.0036+1.860x0.4801/J1297860)
即为:(0.0028,0.0044)
4)N3),(/+^-)(T2)
6
片一片片一片
服从自由度为n-2的t分布。因而
1-«
可得区的置信度为95%的置信区间为(-0.3567,0.5703)
Z(y-y)2
16.82027
(6)x与y的决定系数r2i=l--------------=0.908
18.525
i=\
⑺
ANOVA
平方和df均方F显著性
组间(组合)1231497.5007175928.2145.302.168
线性项加权的1168713.03611168713.03635.222.027
偏差62784.464610464.077.315.885
组内66362.500233181.250
总数1297860.0009
由于尸>乙(1,9),拒绝“°,说明回归方程显著,x与y有显著的线性关系。
A21n1nA2
其中0=口],"口自⑸7.)
0.0036xjl297860
=8.542
0.04801
搂=1.895
t=8.542>t
7
二接受原假设“0:自=°,认为四显著不为°,因变量y对自变量X的•元线性回归成立。
X(x,一初X-),)
(9)相关系数r=i=1
£(i2t(…
4653
0.9489
71297860x18.525
「小于表中a=1%的相应值同时大于表中a=5%的相应值,x与y有显著的线性关系.
(10)
序号XyAe
y
18253.53.07680.4232
221510.88080.1192
3107043.95880.0412
455022.0868-0.0868
548011.8348-0.8348
692033.4188-0.4188
713504.54.9688-0.4668
83251.51.27680.2232
967032.51880.4812
10121554.48080.5192
♦系列1
-0.4
-0.6
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)新保单x°=1000时,需要加班的时间为y°=3.7小时。
(12)%的置信概率为「a的置信区间精确为Yo士a2(〃-2)灰痣6
即为(2.7,4.7)
近似置信区间为:),o±2b,即(2.74,4.66)
8
(13)可得置信水平为1-a的置信区间为£±%2(〃-2)师b,即为(3.33,4.07).
可以用直线回归描述y与x之间的关系.
⑵回归方程为:;=12112.629+3.314x
(3)
直方图
9
回归标准化残差的标准P-P图
因变量:y
1.0-
期
望
的
累
积
概
率
00IIIIII
0.00.20.40.60.81.0
观测的累积概率
从图上可看出,检验误差项服从正态分布。
10
第三章多元线性回归
3.11解:(1)用SPSS算出y,xl,x2,x3相关系数矩阵:
相关性
yxlx2x3
Pearson相关性y1.000.556.731.724
xl.5561.000.113.398
x2.731.1131.000.547
x3.724.398.5471.000
y.048.008.009
xl.048.378.127
x2.008.378.051
x3.009.127.051
Ny10101010
xl10101010
x210101010
x310101010
/1.0000.5560.7310.724\
所以尸=(0.5561.000(UIS
\a.7310.1131.0000.5471
\0.7240.3980,5471.000/
系数.
模型标准系
非标准化系数数B的95.0%直信区间:目关性共线性统计量
B标准误差试用版tSig.F限上限零阶偏部分容差VIF
(常量)-348.2176.459-1.974.096-780.083.500
8060
xl3.7541.933.3851.942.100-.9778.485.556.621.350.8251.211
x27.1012.880.5352.465.049.05314.149.731.709.444,6871.455
x312.44710.569.2771.178.284-13.4138.310.724.433.212.5861.708
5
a.因变量:y
(2)
所以三元线性回归方程为y=-348.28+3.754x1+7.101x2+12.447x3
11
模型汇总
模型标准估计的更改统计量
RR方调整R方误差R方更改F更改dfldf2Sig.F更改
1.898,.806.70823.44188.8068.28336.015
a.预测变量:(常量),x3,xl,x2o
(3)
由于决定系数R方=0.708R=0.898较大所以认为拟合度较高
(4)
Anovab
模型平方和df均方FSig.
1回归13655.37034551.7908.283.015,
残差3297.1306549.522
总计16952.5009
a.预测变量:(常量),x3,xl,x2。
b.因变量:y
因为F=8.283P=0.015<0.05所以认为回归方程在整体上拟合的好
(5)
系数3
模型B的95.0%置信区
非标准化系数标准系数恒相关性共线性统计量
B标准误差试用版tSig.下限上限零阶偏部分容差VIF
1(-348.280176.459-1.974.096-780.06083.500
常
量
)
X13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211
x27.1012.880.5352.465.049.05314.149.731,709.444.6871.455
x312.44710.569.27?1.178.284-13.41538.310.724.433.212.5861.708
a.因变量:y
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检
验,应去除。
去除x3后作F检验,得:
Anovab
模型平方和df均方FSig.
1回归12893.19926446.60011.117.007
残差4059.3017579.900
总计16952.5009
a.预测变量:(常量),x2,xl。
b.因变量:y
12
由表知通过F检验
继续做回归系数检验
系数’
模型共线性统计
非标准化系数标准系数B的95.0%置信区间相关性量
B标准误差试用版tSig.下限上限零阶偏部分容差VIF
(常量)-459.624153.058-3.003.020-821.547-97.700
X14.6761.816.4792.575.037.3818.970.556.697.476.9871.013
x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013
a.因变量:y
此时,我们发现xl,x2的显著性大大提高。
(7)xl:(-0.997,8.485)x2:(0.053,14.149)x3:(-13.415,38.310)
(8)/=0.385x1*+0.535x2*+0.277x3,
(9)
残差统计量'
极小值极大值均值标准偏差N
预测值175.4748292.5545231.500038.9520610
标准预测值-1.4381.567.0001.00010
预测值的标准误差10.46620.19114.5263.12710
调整的预测值188.3515318.1067240.183549.8391410
残差-25.1975933.22549.0000019.1402210
标准残差-1.0751.417.000.81610
Studentft残差-2.1161.754-.1231.18810
已删除的残差-97.6152350.88274-8.6834843.4322010
Student化已删除的残差-3.8322.294-.2551.65810
Mahal。距离.8945.7772.7001.55510
Cook的距离.0003.216.486.97610
居中杠杆值.099.642.300.17310
a.因变量:y
所以置信区间为(175.4748,292.5545)
(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量
影响不大,但是回归方程整体对数据拟合较好
3.12解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产
业每增加一个单位,GDP就增加0.607个单位。
在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每
增加一个单位,GDP就增加1.709个单位。
13
第四章违背基本假设的情况
4.8
030-
0.20-
0.10-
加
权
变
换0.00-
残
差
-0.10-
加权变化残差图上点的散步较之前的残差图,没有明显的趋势,点的散步较随
机,因此加权最小二乘估计的效果较最小二乘估计好。
4.9解:
系数
模型非标准化系数标准系数
B标准误差试用版tSig.
1(常量)-.831.442-1.882.065
X.004.000.83911.030.000
a.因变量:y
由SPSS计算得:£=-0.831+0.004x
残差散点图为:
14
散点图
O
2-
L
5
PI归
标
准-1-
化
残
方
O
-3-
l
l
I
I
l
I
I
l
00
14.
00
12.
0
10.0
8.00
6.00
4.00
2.00
0.00
y
差性
在异方
可知存
散点图
由残差
(2)
:
分析
系数
相关
等级
再用
数
相关系
t
X
.318”
1.000
数
相关系
X
o
的rh
rman
Spea
.02
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全生产责任制评审表
- 防水施工工程合同模板5篇
- 上海安装工程有限公司项目部安全生产责任制
- 新增智能化烘焙设备技术改造项目可行性研究报告
- 信丰物流入库作业优化方案设计和实现 仓储物流管理专业
- 乡镇公务员激励机制问题和对策研究分析 人力资源管理专业
- 施虐受虐症个案护理
- 创业空间的创业创新与社会变革
- 森林经营与生态产业发展
- 制鞋业渠道管理与发展
- 储粮化学药剂管理和使用规范
- 轮胎配方及原料介绍
- 上一年度的资金来源及使用情况、公益活动和非营利活动的明细情况上课讲义
- 我的初中数学教学故事
- 中国石油大学毕业生登记表
- 国内己内酰胺及尼龙6生产现状
- 三国立志传2秘籍
- 个人征信查询授权书模板
- 青年教师培训
- 手术室各种无菌巾的标准规格
- 新乡中新化工变更换电流互感器方案
评论
0/150
提交评论