




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章一元线性回归
第一部分学习目的和要求
本章主要介绍一元线性回归模型、回归系数的确定和回归方程的有效性检验方法。回归
方程的有效性检验方法包括方差分析法、t检验方法和相关性系数检验方法。本章还介绍了
如何应用线性模型来建立预测和控制。需要掌握和理解以下问题:
1一元线性回归模型
2最小二乘方法
3一无线性回归的假设条件
4方差分析方法
5t检验方法
6相关系数检验方法
7参数的区间估计
8应用线性I可归方程控制与预测
9线性回归方程的经济解释
第二部分练习题
一、术语解释
1解释变量
2被解释变量
3线性问归模型
4最小二乘法
5方差分析
6参数估计
7控制
8预测
二、填空
1在经济计量模型中引入反映()因素影响的随机扰动项椅,目的在于使模型更
符合()活动。
2在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的
()、社会环境与自然环境的()决定了经济变量本身的();(2)
建立模型时其他被省略的经济因素的影响都归入了()中;(3)在模型估计时,
()与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了()
与()之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生
的误差也包含在随机扰动项中了。
3()是因变量离差平方和,它度量因变量的总变动。就因变量总变动的变异来源看,
它由两部分因素所组成。一个是自变量,另一个是除自变量以外的其他因素。()是
拟合值的离散程度的度量。它是由自变量的变化引起的因变量的变化,或称自变量对因变量
变化的贡献。()是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所
致,它又叫残差或剩余。
4回归方程中的回归系数是自变量对因变量的()<,某自变量回归系数夕的意义,指
的是该自变量变化一个单位引起因变量平均变化()个单位。
5模型线性的含义,就变量而言,指的是回归模型中变量的();就参数而言,指
的是回归模型中的参数的();通常线性回归模型的线性含义是就()而言的。
6样本观察值与回归方程理论值之间的偏差,称为(),我们用残差估计线性模型中
的()。
三、简答题
1在线性回归方程中,“线性”二字如何理解?
2用最小二乘法求线性回归方程系数的意义是什么?
3一元线性回归方程的基木假设条件是什么?
4方差分析方法把数据总的平方和分解成为两部分的意义是什么?
5试叙述t检验法与相关系数检验法之间的联系。
6应用线性回归方程控制和预测的思想。
7线性回归方程无效的原因是什么?
8I可归分析中的随机误差项J有什么作用?它与残差项与有何区别?
9判断如下模型,哪些是线性模型,哪些不是。以及它们经过怎样的变化能够变成线性模型?
模型描述性名称
Yi=P\倒数
h.X=化+02mxi+鸟半对数
c.InYj=仇+反半对数
c.In%=In°、+/?2InX.+与对数或双对数
c.ln¥=0「02J+4对数倒数
10如下模型是线性回归模型吗?并说出原因。
a,K=心也…
卜Y=_________
(I、
c.InX=月+夕2—+J
d.¥=仇+(0.5-仇)/“XT+与
e.丫尸0廿代Xi+%
四计算题
1给定如下表第一列的假设,说明第二列中的假定是与之等效的。
关于经典模型的假设
(1)(2)
总(耳匡)=0E化£)=4+凤Xj
COV(与,£j)=0i手jcov(")=0zVJ
2
var(^|X/.)=0-、钝化£)=/
2下表给由了美国30所知名学校的MBA学生1994年基本年薪(ASP)、GPA分数(14
共四个等级)、GMAT分数以及每年学费的数据.
a.用双变量回归模型分析GPA是否对ASP有影响?
b.用合适的回归模型分析GMAT分数是否与ASP有关系?
c.每年的学费与ASP有关吗?你是如何知道的?如果两变量之间正相关,是否意味着进到最
高费用的商业学校是有利的。
d.你同意高学费的商业学校意味着高质量的MBA成绩吗?为什么?
1994年MBA毕业生平均初职薪水
学校ASP/美元GPAGMAT学费/美元
Hanard3.465023894
Stanford3.366521189
Columbian3.364021400
Daiimouth954103.466021225
Wharton899303.465021050
Northwestern846403.364020634
Chicago832103.365021656
Mit805003.565021690
Virginia742803.264317893
Ucla740103.564014496
Berkeley719703.264714361
Cornell719703.263020400
Nyu706603.263020276
Duke704903.362321910
Carnegiemellon598903.263520600
NorthCarolina698803.262110132
Michigan678203.263020196
Texax618903.36258580
Indiana585203.261514036
Purdue547203.25819556
Casewestern572003.159117600
Georgetown698303.261919584
Michiganstate418203.259016057
Pennstate491203.258011400
Southernmethodist609103.160018034
Tulane440803.160019550
Illinois471303.261612628
Lowa416203.25909361
Minnesota482503.260012618
Washington441403.361711436
3你的朋友将不同年度的债券价格作为该年利率(在相等的风险水平下)的函数,估计出的
简单方程如下:
=101.40-4.78%,.
其中:匕=第1年美国政府债券价格(每100美元债券)
乂:=第1年联邦资金利率(按百分比)
请回答以下问题:
(1)解释两个所估系数的意义。所估的符号与你所期望的符号一样吗?
(2)为何方程左边的变量是g而不是Y?
(3)你朋友在估计的方程中是否遗漏了随机误差项?
(4)此力程的经济意义是什么?对此模型你有何评论?(提示:联邦资金利率是一
种适用「银行间隔夜持有款项的利率)
4对于家庭收入X影响家庭消费支出Y的问题,如果通过调查得到一组数据,如下表所示。
家庭收入X家庭消费支出Y
1800770
212001100
320001300
430002200
540002100
650002700
770003800
890003900
9100005500
10120006600
(1)试建立Y与X之间的样本回归方程。
(2)预测收入为6000元这类家庭的平均消费支出(显著性水平a=0.05)
(3)以95%的概率预测某个收入为6000元的家庭的消费支出。
5中国的人均GDP(元/人,用Y表示)与人均钢产量1千克/人,用X表示)如下表所示:
年度YX
198585344.52
198695648.93
1987110451.92
1988135553.95
1989151255.05
1990163458.45
1991187961.70
1992228769.47
1993293976.00
1994392377.70
1995485479.15
1996557683.15
1997605488.57
1998603893.05
1999655199.12
20007086101.77
20017651119.22
20028184142.43
资料来源:《中国统计年鉴2003》,北京,中国统计出版社,2003o
(1)试建立样本回归方程,并在5%的水平下进行显著性检验。
(2)求简单相关系数。
(3)如果X。=200千克,以90%的概率对E(K)和〃进行预测。
6下表给出了1977—1991年期间美国的黄金价格、消费者指数和纽约股票交易所指数数据。
NYSE指数包括在NYSE上市的大多数股票,约有1500多利
年份在纽约每盎司黄金的消费者价格指数纽约股票交易所指数
美元价格1982-1984=1001965.121.31=100
1977147.9860.653.69
1978193.4465.253.70
1979307.6272.658.32
1980612.5182.468.10
1981459.6190.974.02
1982376.0196.568.93
1983423.8399.692.63
1984360.29103.992.46
1985317.30107.6108.90
1986367.87109.6136.00
1987446.50113.6161.70
1988436.93118.3149.91
1989381.28124.0180.02
1990384.08130.7183.46
1991362.04136.2206.33
a.在同一散布图中描绘黄金价格,CPI和NYSE指数。
b.一种投资,如果它的价格和(或)回报率至少赶得上通货膨胀,就被认为是(对通
货膨胀)保值(能抵御通货膨胀)的。为检验这一假设:投资是保值的,假定a中
的散点图表明拟合以下模型是最适宜的:
黄金价格广四+ACP4+O
NKSE指数,=4+&CPL+q
7下表给出了,1959—1997年间美国国内总产值数据
年份NGDPRGDP年份NGDPRGDP
1959507.20002210.20019792557.5004630.600
i960526.60002262.90019802784.2004615.000
1961544.80002314.30019813115.9004720.700
1962585.20002454.80019823242.1004620.300
1963617.40002559.40019833514.5004803.700
1964663.00002708.40019843902.4005140.100
1965719.10002881.10019854180.7005323.500
1966787.70003069.20019864422.2005487.700
1967822.60003147.20019874692.3005649.500
1968910.60003293.90019885049.6005865.200
1969982.20003393.60019895438.7006062.00
19701035.6003397.60019905743.8006136.300
19711125.4003510.00019915916.706079.400
19721237.3003702.30019926244.4006244.400
19731382.6003916.30019936558.1006389.600
19741496.9003891.20019946947.0006610.700
19751630.6003873.90019957269.6006761.700
19761819.(X)04082.90019967661.6006994.800
19772026.9004273.60019978110.9007269.800
19782291.4004503.000
a.将当年美元和不变(即1992年)美元数据对时间描图。
b.用Y表示GDP,X表示时间(按年历从1代表1959,2代表I960开始,直至39代表
1997).看以下模型是否适合GDP数据:Y小仇十&Xh
试用当年美元和不变美元两种数据分别估计此模型。
c.你会怎样解释用?
d.如果用当年美元估计用和不变美元GDP估计的有所不同,你会怎样解释这个差距?
e.从你计算的结果,你能对样本时期美国通货膨胀的性质得出什么评论?
第三部分参考答案
一、术语解释
I解释变量:也称自变量,是在模型中对被解释变量起解释作用的变量。如模型
y=a++与中的为。
2被解释变量:也称因变量,在模型中假设其变动由解释变量引起,对解释变量起依存关系。
如模型y=a+/七+与中的%o
3线性回归模型:是相对于模型的参数而言的,即对于其参数是一次的。对于变最而言,模
型可以是线性的,也可能不是线性的。
4最小二乘法:普通最小二乘法归功于德国数学家高斯,在一定假设下,最小二乘法有一系
列非常令人向往的统计性质,是回归中较常用的一种方法。如,对模型+〃为+与
(y=a+/7xj而言,通过使得统计量。=Z(y—))2最小而求得参数a、。。
5方差分析:通过分析总离差平方和引=与回归平方和S;=2():—斤、剩
余平方和s;.二Z(»—)',)2的数值,及相互之间的数量关系,来分析变量之间的关系和回
归模型。
6参数估计:选定模型,根据解释变量和被解释变量的数据,使用一定的估计方法得出模型
中的未知参数,称为参数估计。
7控制:是预测的反问题:即要求观察值在某个区间(),;,%)取值时,解释变量七应控制在
什么范围。
8预测:根据回归模型和已估计出的参数,在给定解释变量/时,预测被解释变量上的取
值或取值范围。
二、填空题
1不确定性;客观经济。
2随机性;随机性;随机性;随机扰动项;测量误差;被解释变量;解释变量。
3总离差平方和;回归平方和;残差平方和。
4净影响;夕。
5指数是一次;指数是一次;参数。
6残差;随机扰动项。
三、简答题
1答:在线性回归方程中,“线性”二字指的是方程对参数而言是线性的的,即参数的次数
为一次。对于变量而言,模型可以是线性的,也可能不是线性的。
2答:最小一乘法归功于德国数学家高斯,在一定假设下,最小一乘法有一系列非常令人向
往的统计性质,是回归中较常用的一种方法。如,对模型y=a+与(y=a+■「)
而言,通过使得统计量Q=Z(y-y?最小而求得参数々、B。最小二乘法使得回归的
参差平方和尽可能的小,却总体上来说,y与y的偏差最小。在满足一定的条件下,最小
二乘法具有最优线性无偏估计量的性质(BLUE)。
3答:假设I,随即误差项?的均值为0,方差为,,H服从正态分布。即与〜
假设2,随即误差项弓,名,飞,……J之间是两两不相关的。即cov(q,£j)=0
由于正态分布的随即变量不相关与独立是等价的,因此改假设实际上表示各随机变量误差项
相互独立。
假设3,随机误差项与解释变量X之间不相关,即
cov(耳,与)=0r=1,2,n
实际上,如果X是可观察或可控制变量,则它就不是随机变量,因此改条件一定成立,
4答:方差分析通过分析总离差平方和s;=£3-5『与回归平方和s;=Z(y—不丫、
剩余平方和Sr=Z(y-y)2的数值,及相互之间的数量关系,来分析变量之间的关系和
回归模型。通过方差分析,我们可以判断线性回归方程的好坏。我们可以知道总离差平方和
5;=X(X-5)2的构成情况,回归平方和啜=Z(y一亍『反映由于X与y之间的线性关
系而引起的回归值的离散程度,而剩余平方和S:=Z(y—y)2则反映了除x与y之间的
线性关系以外引起数据y波动的因素,这种波动性实际上是由于观测误差等随机因素引起
的。这样,我们就通过平方和的分解把引起数据y波动的两种原因在数值上分开了。
5答:t检验的思路,若线性假设符合实际,那么b不应该为零。否则,若b=0,那么y就
不依赖于x了。因此,我们需要检验假设:°,通过计算I统计量,二幺二向,
■:6工()b丫
及相应的临界值得出拒绝域。当假设〃o:b=O被拒绝时,我们认为线性回归效果是显著的;
反之,则认为线性回归效果不显著。
L
相关系数检验法主要是通过由数据观测值计算出的样本相关系数&.二xv作为相关
y[^xxy[^yy
系数的估计值,通过々,的大小来判断x与y之间线性关系的密切程度。因此,我们需要
检验假设:"。:'二°,通过计算检验统计量/二飞■尸2,及相应的临界值得出拒绝域。
对于一元线性回归方程而言,有5=所以对于一元线性回归方程而言,I检
验中的假设:〃=0等价于相关系数中的假设“o:2=0。
6答:预测:根据回归模型和已估计出的参数,在给定解释变量为时,预测被解释变量y的
取值或取值范围。即,己知自变量的取值,求因变量的取值或取值范围。
控制:是预测的反问题,即要求观察值在某个区间(),;,%)取值时,解释变量』应控制在
什么范围。
7答:①影响y取值的,除x外,还有其他不可忽略的因素。
②y与x的关系不是线性的,它们存在其他关系。
③y与x不存在关系。
8答:一个回归模型永远也不可能对现实做出完全准确的描述。因此,回归子的实际值与从
选择的模型中估计出来的值之间必定不同。二者之差就简单的归纳为随机误差项。而参差是
指样本的随机误差项。
9答:模型a、b、c和e都是线性(于参数的)回归模型。如果我们另a=ln片,则模型d
也是线性的。
10答:(a)通过取自然对数,我们发现lnX=;?|+&X,+d,便成为一个线性回归模型。
(b)如下被称为logit变换的变换使得模型成为一个线性问归模型:
ln[(”X)/K1=/+AXj+逐
(C)线性回归模型
(d)非线性回归模型
⑹因为自的哥指数是3,所以不是线性回归模型。
四、计算题
I解:(1)Yj=0?Xi+与,因此
七化囚)=七8+/?/,+弓忙)
=4+P,X,+E(£;|X,)因为仅为常数而X为非随机的。
w+河X,
(2)假定对所有的仃了吟/)都有COV([,邑)=0,•工,,于是
cov化』)=网,"化)]已一£化)]}
=E(^.)利用(1)中的结论
=£(<.)网与)根据假定误差项不相关
=0根据假定每个J的均值都为零。
(3)给定var(£/Xj)=/,于是根据假定有
var化因)=E[工-E(K)了=E(婷)=var⑻X,)=/
2解:a.回归结果为
DependentVariable:ASP
Method:LeastSquares
Date:07/23/06Time:15:47
Sample:130
Includedobservations:30
VariableCoefficientStd.Errort-StatisticProb.
C-.585758.31-3.0.0035
GPA.626347.093.0.0004
R-squared0.Meandependentvar68260.00
AdjustedR-squared0.S.D.dependentvar18187.78
S.E.ofregression14779.44Akaikeinfocriterion22.10420
Sumsquaredresid6.12E+09Schwarzcriterion22.19762
Loglikelihood-329.5630F-statistic15.91789
Durbin-Watsonstat1.Prob(F-statistic)0.
因为估计的GPA的系数是统计显著的,所以它对ASP有正的影响。
b.回归结果为:
DependentVariable:ASP
Method:LeastSquares
Date:07/23/06Time:15:49
Sample:130
Includedobservations:30
VariableCoefficientStd.Errort-StatisticProb.
C-.847572.09-6.0.0000
GMAT641.659876.150368.0.0000
R-squared0.Meandependentvar68260.00
AdjustedR-squared0.S.D.dependentvar18187.78
S.E.ofregression9843.701Akaikeinfocriterion21.29139
Sumsquaredresid2.71E+09Schwarzcriterion21.38480
Loglikelihood-317.3709F-statistic71.00122
Durbin-Watsonstat1.Prob(F-statistic)0.
显著的正相关。
c.回归模型为:
DependentVariable:ASP
Method:LeastSquares
Date:07/23/06Time:15:51
Sample:130
Includedobservations:30
VariableCoefficientStd.Errort-StatisticProb.
C22789.949769.6552.0.0271
XUEFEI2.0.4.0.0000
R-squared0.Meandependentvar68260.00
AdjustedR-squared0.S.D.dependentvar18187.78
S.E.ofregression13690.92Akaikeinfocriterion21.95119
Sumsquaredresid5.25E+09Schwarzcriterion22.04461
Loglikelihood-327.2679F-statistic23.17903
Durbin-Watsonstat1.Prob(F-statistic)0.
每年的学费与ASP显著正相关。
从回归方程看,学费高,ASP就高。但因为影响ASP变动的因素还很多,所以不是绝对的。
d.因为
DependentVariable:GPA
Method:LeastSquares
Date:07/23/06Time:15:54
Sample:130
Includedobservations:30
VariableCoefficientStd.Errort-StatisticProb.
C3.0.43.290600.0000
XUEFEI6.28E-064.10E-061.0.1370
R-squared0.Meandependentvar3.
AdjustedR-squared0.S.D.dependentvar0.
S.E.ofregression0.Akaikeinfocriterion-1.
Sumsquaredresid0.Schwarzcriterion-1.
Loglikelihood26.99939F-statistic2.
Durbin-Watsonstat1.Prob(F-statistic)0.
DependentVariable:GMAT
Method:LeastSquares
Date:07/23/06Time:15:55
Sample:130
Includedobservations:30
VariableCoefficientStd.Errort-StatisticProb.
C570.140713.8537341.154300.0000
XUEFEI0.0.4.0.0004
R-squared0.Meandependentvar624.2667
AdjustedR-squared0.S.D.dependentvar24.00421
S.E.ofregression19.41423Akaikeinfocriterion8.
Sumsquaredresid10553.55Schwarzcriterion8.
Loglikelihood-130.5135F-statistic16.33355
Durbin-Watsonstat0.Prob(F-statistic)0.
所以,高学费的商业学校意味着较高的GMAT成绩,因为GMAT与学费显著正相关。因为
成绩与学费不是显著相关的,所以,高学费的学校并不意味着较高的GPA成绩。
3解:(I)10I.40是常数项的估计值,它是当联邦资金利率为零时的债券价格的估值。但由
于联邦资金利率通常不为零,此解释意义不大。一4.78是斜率系数的估值,它告诉我便当联
邦资金利率变化一单位(一个百分点)时债券价格变化多少。斜率系数估值的符号与预期一
致;当利率上升时,现有债券的价格会下降。我们通常对常数项不作假定。
(2)原方程可等价地描述为:
匕=101.40—4.78Xj+。
(3)误差项是不可观察的,不应被包括在我们用于实际计算£的样本方程中。此问题被
重新表述为:问方程中为什么没有包括余项,则回答与(2)相同)
(4)若联邦资金利率上升一个百分点,债券价格将下降4.78美元。可能的评论是:
①当解释长期资产的价值时,应使用的合适利率是长期利率而不是短期利率。
②另外,可能有除利率之外的更多的解释变量
③给定资本市场对利率变化的反应程度,则采用按月的数据集将给相同的年数提供更多
的观察值。(因而拟合优度更好)。
4解:
(1)把上述数据导入eviews,进行回归得到:
VariableCoefficientStd.Errort-StatisticProb.
C380.5269212.36301.0.1109
X0.0.14.962980.0000
所以样本回归方程为:/=380.5269+().484532Xj
(2)这是求E(%)。
8
Xo=6000又=5400=1.3848*105=381.0639
H=1()a=().05rOO25(8)=2.306
Yo=380.52686+0.4845321*6000=3287.719
JvAr闯=SU+=381.0639*(6000"]22.0593
(号U+s=
v''W?Z七V101.3848*10
5解:
(1)把数据导入eviews,进行回归得如下结果:
DependentVariable:Y
Method:LeastSquares
Date:07/03/06Time:14:58
Sample:19852002
Includedobservations:18
VariableCoefficientStd.Errort-StatisticProb.
C-3395.318614.4268-5.0.0000
X93.687797.12.514040.0000
R-squared0.Meandependentvar3913.111
AdjustedR-squared0.S.D.dependentvar2580.713
S.E.ofregression809.9203Akaikeinfocriterion16.33619
SumsquaredresidSchwarzcriterion16.43512
Loglikelihood-145.0257F-statistic156.6012
Durbin-Watsonstat0.Prob(F-statistic)0.
查表得fog(16)=2.120<12.51,所以拒绝”o
(2)r=0.9525
⑶13713.15<E(^)<16971.33
6解,(a)
这些变量相对于时间都有上升趋势;黄金的波动价格较大。
(b)如果假设正确,我们将预期四之1
(c)黄金价格对CPI做I可归得到如下表格(使用eviews)
DependentVariable:HUANGJIN
Method:LeastSquares
Date:07/23/06Time:10:59
Sample:19771991
Includedobservations:15
VariableCoefficientStd.Errort-StatisticProb.
C186.1833125.40391.0.1615
CPI1.1.1.0.1535
R-squared0.Meandependentvar371.8193
AdjustedR-squared0.S.D.dependentvar109.4400
S.E.ofregression104.6939Akaikeinfocriterion12.26353
Sumsquaredresid.7Schwarzcriterion12.35793
Loglikelihood-89.97644F-statistic2.
Durbin-Watsonstat1.Prob(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 兄弟无偿赠予合同范例
- 充电线租赁合同范例
- 个人物业管理合同范例
- 与单位签正式合同范例范例
- 公司集成电路订购合同范例
- 公司合同范例备案查询系统
- 供方购销合同范例
- 公司有效合同范例
- 公司经理岗位合同范例
- 入境英国住房合同范例
- JBQGTGST9000控制器说明书
- 水下探测技术发展-洞察分析
- UL2595标准中文版-2015电池驱动设备的要求中文版
- 初二英语语法填空浙江版单选题100道及答案解析
- DB21T 3508-2021 旅游景区木栈道设置与维护规范
- 扁桃体癌护理查房
- 医疗质量及医疗安全
- 烧伤治疗和护理
- 2024年广西职业院校技能大赛高职组《区块链技术应用》赛项样卷
- 医疗技术销售技巧
- 使用错误评估报告(可用性工程)模版
评论
0/150
提交评论