




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学第2章一元线性回归模型2第2章一元线性回归模型本章内容安排:2.1
回归分析和回归函数2.2
简单线性回归模型参数的估计2.3
回归直线的拟合优度2.4
一元线性回归模型的统计检验2.5
一元线性回归模型的预测3一直以来,总需求不足为制约我国经济可持续发展的重要因素。与经济发达国家不同,我国的总需求不足源于消费需求不足,而消费需求不足则主要由居民消费需求不足所致。统计资料显示,我国最终消费率(支出法
GDP
中消费的
比重)由2000
年的62.3%下降为2011年的49.1%,而居民
消费率(居民总消费占
GDP
的比重)则从
2000
年的
43.6%持续下降到2010
年的33.8%,平均每年下降1个百分点。消费市场的持续低迷,严重制约了我国经济的增长,那么,如何提高我国居民的消费水平呢?案例:如何提高我国居民消费水平4第一节
回归分析与回归方程本节基本内容:回归与相关总体回归函数随机扰动项样本回归函数5◆确定性的函数关系◆不确定性的统计关系—相关关系(ε为随机变量)Y
=
f
(
X
)
+
e◆没有关系一、回归与相关(对统计学的回顾)1.经济变量间的相互关系Y
=
f
(
X
)2.相关关系相关关系的描述相关关系最直观的描述方式——坐标图(散布图)Y6X••••••••••7相关关系的类型从涉及的变量数量看简单相关多重相关(复相关)从变量相关关系的表现形式看线性相关——散布图接近一条直线非线性相关——散布图接近一条曲线从变量相关关系变化的方向看正相关——变量同方向变化,同增同减负相关——变量反方向变化,一增一减不相关总体线性相关系数:
Var(
X
)Var(Y
)样本线性相关系数:Cov(
X
,Y
)r
=282(Xi
-
X
)(Yi
-Y
)XYii(X
-
X
)(Y
-Y
)g
=
3.相关程度的度量-相关系数9X和Y都是相互对称的随机变量
线性相关系数只反映变量间的线性相关程度,不能说明非线性相关关系样本相关系数是总体相关系数的样本估计值,由于抽样波动,样本相关系数是个随机变量,其统计显著性有待检验
相关系数只能反映线性相关程度,不能确定因果关系,不能说明相关关系具体接近哪条直线计量经济学关心:变量间的因果关系及隐藏在随机性后面的统计规律性,这有赖于回归分析方法使用相关系数时应注意104.回归分析回归的古典意义:高尔顿遗传学的回归概念(父母身高与子女身高的关系)回归的现代意义:一个应变量对若干解释变量依存关系的研究回归的目的(实质):由固定的解释变量去估计应变量的平均值11Y
的条件分布当解释变量
X
取某固定值时(条件),Y的值不确定,Y
的不同取值形成一定的分布,即Y
的条件分布。Y
的条件期望对于X的每一个取值,对Y所形成的分布确定其期望或均值,称为Y
的条件期望或条件均值注意几个概念XiYXE(Y
Xi
)iXX代表这些Y
的条件期望的点的轨迹所形成的直线或曲线,称为回归线。回归线与回归函数回归线:对于每一个X
的取值,Y都有
Y
的条件期望E(Y
Xi
)与之对应,12回归函数:应变量Y
的条件期望变量
X
的的变化而有规律的变化,如果把
YX的某种函数回归线与回归函数E(Y
Xi
)
=
f
(
Xi
)这个函数称为回归函数。回归函数分为:总体回归函数和样本回归函数E(Y
Xi
)随解释的条件期望
E(Y
Xi
)表现为13141.总体回归函数的概念前提:假如已知所研究的经济现象的总体应变量Y和解释变量X的每个观测值,可以计算出总体应变量Y
的条件均值E(Y|X),并将其表现为解释变量X的某种函数这个函数称为总体回归函数(PRF)二、总体回归函数(PRF)15••iuXiXYiE(Y
X
)iY2.总体回归函数的表现形式i
iE(Yi
Xi
)
=
f
(
Xi
)
=
b0
+
b1
Xi(2)个别值表现形式(1)条件均值表现形式假如
Y的条件均值
E(Y
是X解i
)释变量
的X线性函数,可表示为:在
E(的Y
周X
i)围,若令各个
与条Y件i均值E(Y的X偏i
)差为,显u然i是随机变ui量,则有对于一定的
X,
的Y
各个别值
分Y
布Xi
)
=
Yi
-
b1
-
b2
Xi或
Yi
=
b1
+
b2
Xi
+
uiui
=
Yi
-
E(Yi163.如何理解总体回归函数实际的经济研究中总体回归函数通常是未知的,只能根据经济理论和实践经验去设定。“计量”的目的就是寻求PRF。总体回归函数中Y与X的关系可是线性的,也可是非线性的。对线性回归模型的“线性”有两种解释就变量而言是线性的——
的Y条件均值是
的X线性函数就参数而言是线性的——
的Y条件均值是参数 的线b
性函数计量经济学中:线性回归模型主要指就参数而言是“线性”,因为只要对参数而言是线性的,都可以用类似的方法估计1其7变量、参数均为“线性”参数“线性”,变量”非线性”变量“线性”,参数”非线Xi
)
=
b1
+
b2
XiE(Yii
i
1
2
iE(Y
X
)
=
b
+
b
X
2E(Yi
Xi
)
=
b1
+性”b2
Xi“线性”的判断18三、随机扰动项概念:各个
Yi
值与条件均值◆性质:ui
是期望为0有一定分布的随机变量重要性:随机扰动项的性质决定着计量经济方法的选择••iu代表YXXiuiE(Y
X
)的偏差排除在模型以外的所有因素对Y
的影响。19未知影响因素的代表无法取得数据的已知影响因素的代表众多细小影响因素的综合代表模型的设定误差变量的观测误差变量内在随机性引入随机扰动项的原因20四、样本回归函数(SRF)•••••样本回归线:对于
X
的一定值,取得Y的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹称为样本回归线。样本回归函数:如果把应变量Y
的样本条件均值表示为解释变量 的某种函数,这个函数称为样本回归函数(SRF)。YXSRF
的特点每次抽样都能获得一个样本,就可以拟合一条 样本回归线,所以样本回归线随抽样波动而变 化,可以有许多条(SRF不唯一)。SRF1SRF221YX22●样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。●样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。23或者样本回归函数的表现形式10ˆ
ˆiY
=
b+
b
Xi
+
eii均值,二者之差用
ei
表示,
ei
称为剩余项或残差项:ei
=
Yi
-Yˆi应变量Y
的实际观测值Y不完全等于样本条件i0
1bˆ
和bˆ
分别是样本回归函数的参数样本回归函数如果为线性函数,可表示为Yˆ
=
bˆ
+
bˆ
Xi
1
2
i其中:Yˆ
是与Xi相对应的Y的样本条件均值对样本回归的理解如果能够获得
bˆ
和bˆ
的数值,显然:1
2和的估计ei
在概念上类似总体回归函数中的
ui
,可视为对ui的估计。iYˆi24是对总体条件期望
E(Y
X
)
的估计ˆ
ˆi
0
1
i
iY
=
b
+
b
X+
e10ˆ
ˆb
和b
是对总体回归函数参数0b1biY样本回归函数与总体回归函数的关系RFPRFuiieˆYiE(Yi
Xi
)A25SiYYXiX26回归分析的目的用样本回归函数SRF去估计总体回归函数PRF。由于样本对总体总是存在代表性误差,SRF
总会过高或过低估计PRF。要解决的问题:1
1bˆ和bˆ寻求一种规则和方法,使得到的SRF的参数尽可能“接近”总体回归函数中的参数b0
和b1
。这样的“规则和方法”有多种,最常用的是最小二乘法27第二节简单线性回归模型参数估计本节基本内容:简单线性回归的基本假定普通最小二乘法OLS回归线的性质参数估计式的统计性质28一、简单线性回归的基本假定1.为什么要作基本假定?●模型中有随机扰动,估计的参数是随机变量,只有对随机扰动的分布作出假定,才能确定所估计参数的分布性质,也才可能进行假设检验和区间估计●只有具备一定的假定条件,所作出的估计才具有较好的统计性质。292、基本假定的内容(1)对模型和变量的假定如假定解释变量X是非随机的,或者虽然是随机的,但与扰动项u是不相关的假定解释变量X在重复抽样中为固定值假定变量和模型无设定误差Yi
=
b0
+
b1
Xi
+
ui(2)对随机扰动项u
的假定又称高斯假定、古典假定假定1:零均值假定在给定
X
的条件下u
,
ui
的条件期望为零E(ui
Xi
)
=
0假定2:同方差假定在给定X
的条件下,ui的条件方差为某个常数s
22
2Xi
)]
=
s30Var(ui
Xi
)
=
E[ui
-
E(ui31假定3:无自相关假定随机扰动项ui
的逐次值互不相关假定4:随机扰动ui
与解释变量X
不相关Cov(ui
,
u
j
)
=
E[ui
-
E(ui
)][u
j
-
E(uj
)]=
E(uiuj
)
=
0 (i
„
j)Cov(ui
,
Xi
)
=
E[ui
-
E(ui
)][
Xi
-
E(
Xi
)]
=
032假定5:对随机扰动项分布的正态性假定即假定ui
服从均值为零、方差为s
2
的正态分布(说明:正态性假定不影响对参数的点估计,但对确定所估计参数的分布性质是需要的。且根据中心极限定理,当样本容量趋于无穷大时,ui的分布会趋近于正态分布。所以正态性假定是合理的)iu
N
(0,s
2)Y
的分布性质假定1:零均值假定
假定2:同方差假定
假定3:无自相关假定假定5:正态性假定由于
Yi
=
b0
+
b1
Xi
+
uiui
的分布性质决定了Yi
的分布性质。对ui
的一些假定可以等价地表示为对Y的假定:Cov(Yi
,Yj
)
=
0 (i
„
j)iXi
)
=
b0
+
b1
XiE(YiVar(Y
X
)
=
s
2i33Y
N
(b
+
b
X
,s
2
)i
0
1
i34OLS的基本思想●理想的估计方法应使
与越小越好的差即剩余最小二、普通最小二乘法(Ordinary
Least
Squares
)0不同的估计方法可得到不同的样本回归参数bˆ1i和
bˆ
,所估计的
Yˆ
也不同。ˆiiY
Yiei●因
e
可正可负,所以可以取即2e
i220ˆ
ˆmin(i
i1
ie
)
=
min(Y
-
b-
b
X
)35正规方程和估计式用克莱姆法则求解得观测值形式的OLS估计式:0^b
=22iinX
)X
Y
-
X X
YX
-(
取偏导数为0,得正规方程^b1
=22iin
i
i
i
i
i2X-(
X
)n
XiYi
-
Xi
Yi
ˆ
ˆ0
1
iYi
=
nb+
b
X2iˆ
ˆi
i
0
i
1X
Y
=
bX
+
b
X
36为表达得更简洁,或者用离差形式OLS估计式:而且样本回归函数可写为^b1
=22(
Xi
-
X
)(Yi
-Y
)(
Xi
-
X
)ix
xi
yi=^ˆb
0
=
Y
-
b1
X注意其中:xiyi=
X
i
-
X=
Yi
-
Y用离差表现的OLS估计式ˆ1
iˆiyx=
b三、OLS回归线的性质可以证明:●回归线通过样本均值●估计值际观测值Y的i
均值XYXYiYˆ的均值等于实Y
=
bˆ
+
bˆ
X0
1i37Yˆ=
Yn剩余项
ei
的均值为零n38e
=
ei
=
0ii●应变量估计值
Yˆ
与剩余项
e
不相关Cov(Yˆ
,
e
)
=
0i
i●解释变量X
i
与剩余项ei
不相关Cov(
Xi
,
ei
)
=
0四、参数估计式的统计性质(一)参数估计式的评价标准1.无偏性前提:重复抽样中估计方法固定、样本数不变、经重复抽样的观测值,可得一系列参数估计值参数估计值bˆ
的分布称为bˆ的抽样分布,密度函数记为f
(bˆ)如果
E(bˆ)
=
b
,称
bˆ是参数则称
bˆ
是有偏的,其偏倚为(见图1.2)b
的无偏估计式,否E(bˆ)
-
b3940f
(b*
)图2.2bbE(b*
)f
(bˆ)估计值偏倚概率密度41前提:样本相同、用不同的方法估计参数,可以找到若干个不同的估计式目标:努力寻求其抽样分布具有最小方差的估计式——
最小方差准则,或称最佳性准则(见图2.3)既是无偏的同时又具有最小方差的估计式,称为最佳无偏估计式。2.
最小方差性概率密度图2.3bf
(b*
)f
(bˆ)b
估计值424.渐近性质(大样本性质)nfi
¥思想:当样本容量较小时,有时很难找到最佳无偏估计,需要考虑样本扩大后的性质一致性:当样本容量
n趋于无穷大时,如果估计式bˆ依概率收敛于总体参数的真实值,就称这个估计式bˆ
是
b
的一致估计式。即或渐近有效性:当样本容量n趋于无穷大时,在所有的一致估计式中,具有最小的渐近方差。(见图2.4)bˆ-
b
£
e)
=1
P
lim(bˆ)
=
b43lim
P(概率密度估计值图2.4f
(
bˆ
)100f
(bˆ)8040f
(
bˆ
)f
(
bˆ
)
20bb4445(二)
OLS估计式的统计性质由OLS估计式可以看出和 唯一表示。是随机变量iYiX122ˆ
i
i
i
i
i
iiX
)nX
-(
X
2
Y
-
X
XYb=
22ˆi
i
i
i
i
inX
)2n X
Y
-
X
YX
-(b
=
kbˆ
由可观测的样本值因存在抽样波动,OLS估计bˆkOLS估计式是点估计式461.
线性特征是Y
的线性函数偏估计式(BLUE)OLS估计式的统计性质——高斯定理无偏特性E(bˆk
)
=
bk最小方差特性在所有的线性无偏估计中,OLS估计bˆk
具有最小方差结论:在古典假定条件下,OLS估计式是最佳线性无=i
i=
k
yi
iiiix
2i(
X
-
X
)2(
X
-
X
)(Y
-
Y
)
x
y2^b
=2iixixk
=bˆk47第三节
回归直线的拟合优度本节基本内容:什么是拟合优度总变差的分解可决系数一、什么是拟合优度?概念样本的一法可拟合值总样本:回归线是对样本数据
种拟合,不同估计方
拟合出不同的回归线,的回归线与样本观测
有偏离。回归线对样本观测数据拟合的优劣程度—拟合优度—拟合优度的度量建立在对总变差分解的基础上无法显示该图片。*
*******
*XY48二、总变差的分解(TSS)
(ESS)(RSS)分析Y的观测值、估计值与平均值的关系^
^Yi
-
Y
=
(Yi
-
Y
)
+
(Yi
-
Yi
)将上式两边平方加总,可证得249^22i-Y
)
+
(Y
-Y
)(Y
-Y
)
=
(Y^
i
i
i50总变差(TSS):应变量Y的观测值与其平均值的离差平方和(总平方和)解释了的变差(ESS):应变量Y的估计值与其平均值的离差平方和(回归平方和)剩余平方和(RSS):应变量观测值与估计值之差的平方和(未解释的平方和)2iy2^yi2ieYi•^(Y
i-Y)=总变差^(Y
i-Y)=来自回归ei来自残差SRFXiY51变差分解的图示YX三、可决系数以TSS同除总变差等式两边:或定义:回归平方和(解释了的变差ESS)差(TSS)示:
2
或i2r
=y
yˆ
2TSS
TSS
TSSTSS
ESS
RSS=
+
2iy
中所占的比重称为可决系数,用r
2表ˆ
在总变
2iy
2i
2i=
1
-r
2ye
521
=2i+
i
2iyy
yˆ2
e253作用:可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。特点:●可决系数取值范围:0
£
r
2
£
1●随抽样波动,样本可决系数r
2是随抽样而变动的随机变量●可决系数是非负的统计可决系数的作用和特点可决系数与相关系数的关系(1)联系数值上,可决系数等于应变量与解释变量之间简单相关系数的平方:2i5422i1R
22
22i=
r
222ˆˆ(2
2i(2ii
i2iiiiyx(
x
y
)xyx
)(y
)yx
)yb====
xi
yi
55可决系数与相关系数的关系可决系数相关系数就模型而言就两个变量而言说明解释变量对应变量的解释程度度量两个变量线性依存程度。度量不对称的因果关系度量不含因果关系的对称相关关系取值:[0,1]取值:[-1,1](2)区别56运用可决系数时应注意可决系数只是说明列入模型的所有解释变量对因变量的联合的影响程度,不说明模型中每个解释变量的影响程度(在多元中)
回归的主要目的如果是经济结构分析,不能只追求高的可决系数,而是要得到总体回归系数可信的估计量,可决系数高并不表示每个回归系数都可信任
如果建模的目的只是为了预测因变量值,不是为了正确估计回归系数,一般可考虑有较高的可决系数57第四节一元线性回归模型的统计检验本节基本内容:OLS估计的分布性质回归系数的区间估计回归系数的假设检验58问题的提出为什么要作区间估计?OLS估计只是通过样本得到的点估计,不一定等于真实参数,还需要找到真实参数的可能范围,并说明其可靠性为什么要作假设检验?OLS估计只是用样本估计的结果,是否可靠?是否抽样的偶然结果?还有待统计检验。区间估计和假设检验都是建立在确定参数估计值概率分布性质的基础上。59一、OLS估计的分布性质是的线性Ybˆk是服从正态分布的随机变量,bˆk函数,决定了bˆ也是服从正态分布的随机变量,k
k只要确定 的期bˆ
望和方差,即可确定的分布性质基本思想bˆk
是随机变量,必须确定其分布性质才可能进行区间估计和假设检验ui
是服从正态分布的随机变量,
决定了
Yi
也i
iY●bˆ
的期望:
E(bˆ
)
=
bk
k(无偏估计)的方差和标准误差(标准误差是方差的算术平方根)注意:以上各式中s未2
知,其余均是样本观测值βˆ
的期望和方差202ˆVar(b
)
=
s
2iXNx
ibˆs
212ˆVar(b
)
=ix12ixSE(bˆ
)
=
s
2i600SE(bˆ
)
=
siXNx2无法显示该图片。(n-2为自由度,即可自由变化的样本观测值个数)可以证明(见教材P70附录2.2)s
2
的无偏估计为对随机扰动项方差
s
2
的估计261iesˆ
2
=n
-
2将
作标准化变换bˆ在s
2
已知时^^0
0b
0
-
b0^SE(b
0)22~
N
(0,1)
i
iXnxb
-
bz1
=
=s^62^=
b1
-
b12^SE(b1
)2~
N
(0,1)izxs=
b1
-
b163●当s
2
未知时^ˆSE(bk
)t
=
k k
~
t(n
-
2)当样本为大样本时,用估计的参数标准误差对
bˆ
作标准化变换,所得Z
统计量仍可视为标准正
态变量(根据中心极限定理)当样本为小样本时,可用sˆ
2
代替s
2
,去估计参数的标准误差,用估计的参数标准误差对bˆ作标准化变换,所得的t
统计量不再服从正态分布(这时分母也是随机变量),而是服从t
分布:bˆ
-
b64二、回归系数的区间估计概念:对参数作出的点估计是随机变量,虽然是无偏估
计,但还不能说明估计的可靠性和精确性,需要找到包含真实参数的一个范围,并确定这个范围包含参数真实值的可靠程度。在确定参数估计式概率分布性质的基础上,可找到两个正数δ和α(的概率为bk1-a,即(bˆk
-d,bˆk
+d)包含真实P(bˆk
-d
£
bk
£
bˆk
+d)
=1-a这样的区间称为所估计参数的置信区间。0
£
a
£)1,使得区间65一般情况下,总体方差s
2未知,用无偏估计sˆ
2去代替,由于样本容量较小,统计量t不再服从正态分布,而服从t分布。可用t
分布去建立参数估计的置信区间。回归系数区间估计的方法*^ˆSE(b1
)bˆ
-
bt
=
1 1
~
t(n
-
2)选定α,查t
分布表得显著性水平为由度为
n
-
2的临界值
,则有即a,2
自^£
b1
-
b1^
^SE(b1
)a
2a
2P[-t£
t
]
=1-a^66^
^SE(b1
)]
=1-a2P[b1
-
ta2^
^
^SE(b1
)
£
b1
£
b1
+
ta67三、回归系数的假设检验1.假设检验的基本思想为什么要作假设检验?和方差都是通过样本估计的,都是随抽样而变动的随机变量,它们是否可靠?是否抽样的偶然结果呢?还需要加以检验。2ˆs0所估计的回归系数
bˆ
、1ˆb68对回归系数假设检验的方式计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验的。目的:对简单线性回归,判断解释变量X
是否是被解释变量Y
的显著影响因素。在一元线性模型中,就是要判断X
是否对Y
具有显著的线性影响。这就需要进行变量的显著性检验。一般情况下,总体方差s
2
未知,只能用sˆ
2
去代替,可利用
t
分布作
t
检验给定α
,查t
分布表得设
,而接受备择假设▼如果则接受原假设H0
:b1
=0£
-ta
2
(
n
-
2)▼如果
t
*
或者
t
*‡-ta
2
(n
-2)
则拒绝原假α
2α
2-t
(n
-
2
)
≤
t
*
≤
t(
n
-
2)tα
2
(n
-
2)69*^
^ˆ
ˆbˆSE(b1
)
SE(b1
)bˆ
-
bt
=
1 1
=
1
~
t(n
-
2)H0
:
b1
=
0H
1
:
b1
„
02.
回归系数的检验方法P用P值判断参数的显著性a统计量t70ta
2-ta
2t**-t假设检验的p值:p值是基于既定的样本数据所计算的统计量,是拒绝原假设的最低显著性水平。统计分析软件中通常都给出了检验的p值相对于显著性水平a
的临界值:ta
或ta
2注意:P值检验是比较和pt检验是比较t*和ta
2a与P
相对应t*由样本计算的统计量为:t*ta
2
与a
相对应71用P
值判断参数的显著性假设检验的p
值:p值是根据既定的样本数据所计算的统计量,拒绝原假设的最小显著性水平。统计分析软件中通常都给出了检验的p
值。72方法:将给定的显著性水平与p
值比较:若α/2
>
p值,则在显著性水平a
下拒绝原假设,即认为
X
对
Y
有显著影响若α/2
≤p
值,则在显著性水平a
下接受原假设,即认为对
Y
没有显著影响规则:当时,
p
值越小,越能拒绝原假设H0ap
<
α
/
2H0
:
βk
=
0用P
值判断参数的显著性的方法H0
:
βk
=
0X73本节主要内容:回归分析结果的报告被解释变量平均值预测被解释变量个别值预测第五节 一元线性回归模型预测74一、回归分析结果的报告经过模型的估计、检验,得到一系列重要的数据,为了简明、清晰、规范地表述这些数据,计量经济学通常采用了以下规范化的方式:例如:回归结果为iiYˆ
=
374.6882
+
0.350334
X(68.8959)
(0.0057)t
=
(5.4385)
(61.4705)R2
=
0.991602
F
=
3778.627
n
=
3475二、被解释变量平均值预测1.基本思想运用计量经济模型作预测:指利用所估计的样本回归函数,用解释变量的已知值或预测值,对预测期或样本以外的被解释变量数值作出定量的估计。●计量经济预测是一种条件预测:条件:◆模型设定的关系式不变所估计的参数不变解释变量在预测期的取值已作出预测对应变量的预测分为平均值预测和个别值预测对应变量的预测又分为点预测和区间预测预测值、平均值、个别值的相互关系是真实平均值的点估计,也是对个别值的点估计个别值真实平均值点预测值SRFE(YF
X
F
)76uFFYˆFYˆeFX
FXYFPRFY772.Y
平均值的点预测将解释变量预测值直接代入估计的方程=
bˆ
+
bˆ
X0
1
FFYˆF这样计算的
Yˆ
是一个点估计值3.Y
平均值的区间预测基本思想:XF
)作区间为对Y
作区间预测,必须确定平均值预测值的抽计量E(YF真实平均值
E(YF
XF
)
,还需要对估计。由于存在抽样波动,预测的平均值
Yˆ
不一定等于FE(YFF78样分布,
必须找出与
Yˆ
和
XF
)都有关的统7922Fx1 (
X
-
X
)2nVar(Yˆ
)
=
s
[+
F
]
i具体作法(从的分布分析)已知可以证明Y
F
服从正态分布,将其标准化,XF
)
=
b0
+
b1
XFF
FE(Yˆ
)
=
E(Y21ˆx2(
XF
-
X
)SE(YF
)
=
s
n
+
i当未知时,只得用2s(n
-2)
代替,这时有ˆ22s
=ei^Y
F^2Yˆ
-
E(Y
X
)~
t(n
-
2)sˆt
=
F
F
F
ix1 (
X
-
X
)2n+
F
80Y平均值的置信度为1
-a的预测区间为给定显著性水平α,查t分布表,得自由度n-2的临界值
ta
2
(n
-
2)
则有显然这样的t
统计量与Y
F和^
^
^X
F
)
£
[Y
F
+
ta
2
SE(Y
F
)]}
=
1
-a^
^
^p{[Y
F
-
ta
2
SE(Y
F
)]
£
E(YF^
^[Y
F
-
t
s
2i+
F
]^s^
2i+
F
,Y
F
+
ta
2x(
X
-
X
)21nx1
(
X
-
X
)2na
2构建平均值的预测区间^X
F
)都有关。E(YF)
=1-aˆ^a
2
a
2Yˆ
-
E(Y
X
)SE(YF
)P(-t
£
t
=
F
F
F
£
t81三、应变量个别值预测基本思想:于
Y的个别值为了对Y的个别值YF作区间预测,需要寻找与其概率分布YFF预测值
Yˆ
和个别值
YF
有关的统计量,并要明确FYˆ
既是对Y平均值的点预测,也是对Y个别值的点预测由于存在随机扰动ui的影响,Y的平均值并不等具体作法:及个别值明~
t(n
-
2)^SE(eF)t
=
eF
-
E(eF
)
=21+^YF
-Y
Fx1 (
X
-
X
)2n
i+
F
sˆF
F^已知剩余项
e
-
Y
F是与预测值=
YY
F^FY都有关的变量,并且已知eF
服从正态分布,且可证E(eF
)
=
0F,对e
标准化的变量t2^Var(eF
)
=
E(YF
-Y
F
)22=
s
[1+x1 (
X
-
X
)2n+
F
]
i(n
-2)代替s
时282ˆ22当用
为is
=
e应变量Y
区间预测的特点1、Y
平均值的预测值与真实平均值有误差,主要是受抽样波动影响Y个别值的预测值与真实个别值的差异,不仅受抽样波动影响,而且还受随机扰动项的影响2
i+
F
a
2^
^YF
=
Y
F
t
sx1 (
X
-
X
)2n283Fa
2sˆYF
=
Yˆ
tx1 (
X
-
X
)2n1++
F
i842、平均值和个别值预测区间都不是常数,是随XF的变化而变化的3、预测区间上下限与样本容量有关,当样本容量n→∞时个别值的预测误差只决定于随机扰动的方差85各种预测值的关系Y的个别值的置信区间SRFY均值的置信区间XFX当XF
=
X时,置信区间最小XY8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 养殖场合伙合同(标准版)
- 时间管理忙而不盲教学设计-2025-2026学年高中心理健康北师大版浙江专版高中三年级全一册-北师大版浙江专版
- 2025灯光设备购销合同
- 购新房双合同(标准版)
- 2025一级建造师机电专业 合同管理与风险控制全考点
- 2023-2024学年高中英语人教版(2019)必修第三册Unit 2 Morals and Virtues教学设计
- 《4.2 做个受欢迎的人》(教学设计)-2023-2024学年三年级下册综合实践活动安徽大学版
- 2024-2025高三物理个性化辅导计划
- 3.1 农业区位因素与农业布局 教学设计 湘教版(2019)地理 必修二 2024-2025学年高一下学期
- Module 6 Hobbies Unit 2 说课稿2025-2026学年外研版八年级英语下册
- 2025年教师节感恩教师主题班会课件
- 2025沈阳各区县(市)工会公开招聘工会社会工作者数量考试参考试题及答案解析
- 中公协议班协议书照模板
- 2025年叉车操作证考试题库及答案
- (2025秋新版)苏教版小学数学二年级上册全册教案
- 市妇幼保健院关于调整实验室生物安全管理委员会的通知
- 亚麻籽油在化妆品配方的应用研究
- 企业负责人施工现场带班检查记录
- 《携手语文共赴美好开学第一课》课件统编版语文七年级上册
- (2025年标准)自愿交社保协议书
- 租房合同范本下载(可直接打印)
评论
0/150
提交评论