区间估计与假设检验_第1页
区间估计与假设检验_第2页
区间估计与假设检验_第3页
区间估计与假设检验_第4页
区间估计与假设检验_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

区间估计与假设检验第1页,课件共93页,创作于2023年2月◆经典正太线性回归模型◆统计学预备知识◆区间估计基本概念◆回归系数β1和β2的置信区间◆σ2的置信区间第2页,课件共93页,创作于2023年2月一、经典正太线性回归模型所谓统计推断的经典理论由两个分支构成,即估计和假设检验。前面讨论了双变量线性回归模型的参数估计问题。用OLS方法,估计参数β1

,β2

,σ2

。在经典线性回归模型的假定下,可以证明、和这些参数的估计量满足线性性、无偏性和最小方差(BLUE)。估计量的值随样本变化而变化,因此,这些估计量都是随机变量。估计是成功的一半。假设检验是另一半。第3页,课件共93页,创作于2023年2月回归分析的目的,不仅仅是估计样本回归函数,而是要用估计来对总体回归函数进行推断。我们想知道,和与真实的和有多接近。由于、和是随机变量,所以我们需要清楚它们的概率分布,若不知其概率分布,那我们就无法将它们与其真实值相联系。第4页,课件共93页,创作于2023年2月1.干扰项ui

的概率分布为得到OLS的概率分布,我们将专门考虑:

(4.1.1)其中假定X为固定或非随机的,则条件回归分析就以Xi

的固定值为条件。方程(4.1.1)表明,是Yi

的一个线性函数,Yi根据假定是随机的。由于则由于ki

,β系数和Xi

都是固定的,所以最终是ui的一个线性函数。第5页,课件共93页,创作于2023年2月假定ui

为随机变量,则的概率分布将取决于对ui的概率分布所做的假定。在上一章,我们把普通最小二乘法应用于经典线性回归模型时,并没有对干扰项ui

的概率分布做出假定。对这些ui

所做的假定仅是:(1)它们的期望值为零,(2)它们是不相关的,(3)它们有一个不变的方差。有了这些假定,OLS中估计量满足诸如无偏性和最小方差的统计性质。但是,我们的兴趣不仅要得到,还要利用它对真值做出推断。或者说,我们的目的不仅是要得到样本回归函数,还要用它来推测总体回归函数。第6页,课件共93页,创作于2023年2月尽管有了高斯-马尔可夫定理,但由于OLS法不对ui的概率性质做任何假定,仍难以从SRF去推断PRF。

对这一不足,在回归分析中,人们常常假定ui遵从正态分布。在第4章中讨论的经典线性回归模型的假定中增加ui的正态性假定,就得到了所谓的

经典正态线性回归模型(classicalnormallinearregressionmodel,CNLRM)第7页,课件共93页,创作于2023年2月2.关于ui

的正态性假定经典正太线性回归假定每个ui

都是正态分布的,并且:均值:方差:协方差:这些假定可更简洁的表述为:其中代表“其分布为”,N代表“正态分布”,括号中的两项代表正态分布的两个参数:均值和方差。第8页,课件共93页,创作于2023年2月性质:对两个正态分布变量来说,零协方差或零相关就意味着两个变量互相独立。因此,在正态性假定下,ui

和uj

协方差为零不仅意味着它们不相关,而且它们是独立分布的。可写成:NID表示正态且独立分布(normallyandindependentlydistributed)。第9页,课件共93页,创作于2023年2月为什么是正态假定?ui

代表回归模型中未明显引进的许多自变量(对因变量)的总影响。我们希望这些影响是微小的而且是随机的。利用统计学中著名的中心极限定理(centrallimittheorem),就能证明,如果存在大量独立且相同分布的随机变量,那么随着这些变量的个数无限增大,它们的总和将趋向正态分布。

回顾中心极限定理。

令为n个独立的、有均值=,方差=的相同PDF的随机变量。令(样本均值),那么第10页,课件共93页,创作于2023年2月2.正态分布的一个性质是,正态分布变量的任何线性函数都是正态分布的。OLS估计量和是ui

的线性函数,因此,若ui

是正态分布的,则和也是正态分布的。3.正态分布是一个比较简单、仅有两个参数的分布,为人们所熟知。4.如果处理小样本或有限容量样本时,比如说数据少于100次观测,那么正态假定就起到关键作用。它不仅有助于推导出OLS估计量精确的概率分布,而且使我们能用t、F和卡方来对回归模型进行检验。第11页,课件共93页,创作于2023年2月3.在正态性假定下OLS估计量的性质它们是无偏的。它们有最小方差。连同性质1,就意味着它们是最小方差无偏的或者说它们是有效估计量(efficientestimators)。一致性。就是说,随着样本含量无限增大,估计量将收敛到它们的真值。

(ui

的线性函数)是正态分布的。

均值:

方差:方差:或者写成:定义标准正态化变量:Z服从标准正态分布,写作:第12页,课件共93页,创作于2023年2月第13页,课件共93页,创作于2023年2月5.(ui

的线性函数)是正态分布的。

均值:

方差:写成

同样的,Z服从标准正态分布。服从n-2个自由度的分布。

的分布独立于。

,第14页,课件共93页,创作于2023年2月二、统计学预备知识统计推断点估计参数估计的一种形式。目的是依据样本X=(X1,X2,…,Xn)估计总体分布所含的未知参数θ或θ的函数

f(θ)。一般θ或f(θ)是总体的某个特征值,如数学期望、方差、相关系数等。比如令,那么就是真均值的一个估计量。比如。由于估计量仅提供的单一一点估计值,故称点估计量(pointestimator)。第15页,课件共93页,创作于2023年2月区间估计通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。与点估计相对照,在区间估计中,我们提供真θ将落入其间的一个可能值域。例如,如果变量X是正态分布的,则样本均值也是正态分布的,且其均值=μ,方差=σ2/n。即估计量的抽样或概率分布是。因此我们可以构造区间:并这样的区间约有95%的概率包含真μ,那么我们正在构造着μ的一个区间估计。注意上面所给的区间依据于一个样本变到另一个样本的,所以是随机的。第16页,课件共93页,创作于2023年2月例如,α=0.05,则1-α=0.95,意味着如果我们构造一个置信系数为0.95的置信区间,所构区间有95%的概率含有真θ时。一般的,如果置信系数是1-α,我们常说有一个100(1-α)%置信区间,α就是显著性水平(levelofsignificance)。构造两个估计量和,两者都是样本X值的函数,使得即我们可以说从到的区间里含有真θ的概率是1-α。此区间被称为θ的置信度为1-α的置信区间(confidenceinterval),而1-α成为置信系数(confidencecoeffiect)。第17页,课件共93页,创作于2023年2月例假定总体中男子身高是正态分布的,其均值=μ英寸且σ=2.5英寸。从总体中取一个100人的随机样本,其平均身高为67英寸,求总体平均身高(=μ)的一个95%的置信区间。解:由于

在本咧中,查表可见:将给定的,σ和n值代入,就得到这个95%的置信区间为:第18页,课件共93页,创作于2023年2月2.假设检验假定随机变量X有一已知的概率密度函数f(x;θ),其中θ是分布的参数,在取得一个大小为n的样本之后,我们得到点估计量,由于真θ鲜为人知,提问:这个估计量是否与某个假设的θ值相符?比方说,,是一个特定的(假定的)θ数值。

称虚拟假设(nullhypothesis),通常记为。与虚拟假设相对的是对立假设(alternativehypothesis),通常记为,可叙述为:。第19页,课件共93页,创作于2023年2月

一个假设被称为简单的,如果它确定了分布的各参数的各一个值;否则就称为复合假设,例如如果,并且这是一个简单假设。如果因为σ的值未被确定,这是一个复合假设。第20页,课件共93页,创作于2023年2月为了检验虚拟假设(即检验其真实性),我们利用样本信息以获得检验统计量(teststatistic)。统计检验量常常就是未知参数的点估计量。然后我们试图找出检验统计量的抽样或概率分布,并利用置信区间或显著性方法去检验虚拟假设。接上例,考虑一个总体中的男子身高(X):现假设问题是:这个检验统计量为的样本会来自均值为69的总体吗?直觉上,如果“足够接近”,我们也许不会拒绝虚拟假设,否则我们宁可拒绝它而接受对立假设。第21页,课件共93页,创作于2023年2月因为,所以检验统计量的分布是:既然知道了的概率分布,可以根据建立μ的一个100(1-α)置信区间,然后看此置信区间是否包含。如果包含,就不拒绝虚拟假设;如果不包含,就可拒绝虚拟假设。例如,取α=0.05,将有一个95%的置信区间。如果此区间包含,由于这样建立起来的区间每100个中有95个会含有,我们就不拒绝虚拟假设。怎样决定是否足够接近“”呢?有两种方法:(1)置信区间法(2)显著性检验法。(1)置信区间法第22页,课件共93页,创作于2023年2月置信区间法操作步骤:因,从而Zi

是一个标准正态变量,于是由正态分布表知:即整理得:这就是μ的一个95%置信区间。一旦建立了这个区间,我们所要做的不外是看是否落入此区间。如果落入,就不拒绝虚拟假设,如果不落入则拒绝之。第23页,课件共93页,创作于2023年2月例我们已建立μ的一个95%的置信区间,即此区间显然不包含μ=69,因此我们能以95%置信系数拒绝真μ是69的虚拟假设。落入拒绝域拒绝域拒绝域接受域第24页,课件共93页,创作于2023年2月用假设检验的语言说,我们所建立的置信区间叫做接受域(acceptanceregion)。接受域以外的区域叫做虚拟假设的临界域(criticalregion)或拒绝域(regionsofrejection)。接受域的上下限(与拒绝域的分界线)叫做临界值(criticalvalues)。拒绝域是当原假设为真时,不太可能发生或发生概率很低的检验统计量的数值的集合。如果使用样本数据时所取得的检验统计量的值落入了概率很低的区域中,则该检验统计量不太可能具有之前假设的分布,因此原假设不太可能为真。因此,用假设检验的语言说,如果假设值落入接受区间,就不可拒绝虚拟假设;否则可以拒绝。第25页,课件共93页,创作于2023年2月在决定拒绝或不拒绝H0时,我们可能犯两类错误:(1)拒绝一个事实上是真的H0。——第I类错误(typeIerror)

这种当虚拟假设为真而拒绝虚拟假设的错误又称为据真错误。其概率通常用α表示,并称为显著性水平(levelofsignificance)。

(2)没有拒绝一个不真的H0。——第II类错误(typeIIerror)

即接受了错误的虚拟假设。这类错误的概率记为β,并把不犯II类错误的概率1-β称为检验的功效(powerofthetest)。检验的功效就是它拒绝一个错误假设的能力。自然状态

决策H0是对的H0是错的拒绝I类错误无错不拒绝无错II类错误第26页,课件共93页,创作于2023年2月第一类错误就是拒真错误,为了降低第一类错误的概率,就要尽可能的做接受的推断,随之带来的就是可能把假的也当成真的接受了,这就导致纳伪错误的增加,即增加第二类错误发生的概率。这样本容量固定的前提下,两类错误的概率不能同时减少。为了同时减少两类错误的概率就得增加样本容量。当样本含量一定时,α愈大,β愈小;反之,α愈小,β愈大。第27页,课件共93页,创作于2023年2月P值或准确显著性水平。除预选某个任定的α水平外,还可求一个检验统计量的p(概率)值或准确的显著性水平。P值被定义为:虚拟假设可被拒绝时所看到的最低显著性水平。假使在一项应用中我们得到一个自由度为20的t值为3.552。从表中看到,获得一个等于或大于3.552的t值的p值或准确概率是0.001(单尾)或0.002(双尾)。我们说所观测的t值3.552是在0.001或0.002水平上统计上显著的。第28页,课件共93页,创作于2023年2月(2)显著性检验方法回顾在任一给定应用中,

和n是已知的(或可以估计的),而真μ和σ是未知的。如果规定σ并在H0下假定,我们就能计算出Zi,然后查正态分布表以得到所算的Z值的概率。如果是一个小的概率,比如小于5%或1%,就可拒绝虚拟假设——如果假设真实,那么获得所算的Z值的机会应该很大。在本例中由于使用了Z变量,故称此检验为Z检验。第29页,课件共93页,创作于2023年2月例:如果,则Z统计量为:查表知,超出3或-3的Z值概率约为0.001。因此超过-8的概率更小。因此可拒绝μ=69这个虚拟假设,也就是说给定μ=69而得到为67的机会微乎其微。第30页,课件共93页,创作于2023年2月图A.15Z统计量的分布第31页,课件共93页,创作于2023年2月当我们说一个检验是显著的,通常的意思是我们可以拒绝虚拟假设。而如果一个检验统计量被认为是显著的,得到它的概率等于或小于犯I类错误的概率α。例如,α=0.05,我们知道得到一个等于-1.96或1.96的Z值的概率是5%。在我们的说明性例子中,Z=-8,由此得到的Z值的概率比2.5%小得多,大大低于预定的犯I类错误的概率。这就说明为什么所算的Z=-8是统计上显著的,也就是为什么拒绝μ*=69这个虚拟假设。第32页,课件共93页,创作于2023年2月

某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令α=0.05,检验这批产品是否合格。例第33页,课件共93页,创作于2023年2月检验统计假设的步骤归纳如下:步骤1.叙述虚拟假设H0和对立假设H1

(如,

)。步骤2.选择检验统计量(如,)步骤3.确定检验统计量的概率分布(如,)。步骤4.选定显著性水平(犯I类错误的概率)α。步骤5.利用检验统计量的概率分布,建立一个100(1-α)%置信区间。如果虚拟假设下的参数值(如)落入此置信区间即接受域,则不拒绝虚拟假设。如果落在此区间之外(即落入拒绝域),就可拒绝虚拟假设。当你拒绝一个虚拟假设时,你正冒着100%α次的犯错误风险。第34页,课件共93页,创作于2023年2月三、区间估计基本概念在重复抽样中估计值的均值可能会等于真值,(),但由于抽样波动,单一估计值很可能不等于真值。在统计学中,一个点估计量的可靠性由它的标准误差来衡量。因此,我们不能完全信赖一个点估计值,而是要围绕点估计量来构造一个区间。如,在点估计量的两旁各划出宽为2或3个标准误的一个区间,使得它有95%的概率包含着真实的参数值。这就是区间估计的粗略概念。第35页,课件共93页,创作于2023年2月假定我们想知道离有多“近”,可以试求两个正数和,α位于0与1之间,使得随机区间(randominterval)

包含的概率为1-α。用符号表示:这样一个区间存在的话,就称之为置信区间(confidenceinterval);1-α称置信系数(confidencecoefficient);而α(0<α<1)称显著性水平(levelofsignificance)。置信区间的端点称为临界值(criticalvalue)。为置信下限,为置信上限。(5.2.1)第36页,课件共93页,创作于2023年2月注意:(5.2.1)中的区间是一个随机区间;它从给一个样本变到另一个样本,因为它是根据来构造的,是随机的。如果在重复抽样中,像(5.2.1)那样,在1-α的概率基础上构造置信区间多次,那么从长期看,平均的说,这些区间将有100%(1-α)次包含着参数的真值。只要尚不知道,区间(5.2.1)就是随机的。但是,一旦我们有了一个特定的样本并获得的一个特定的数值,区间(5.2.1)就不再是随机的,而是固定的了。这时,我们不能说一个给定了的固定区间包含真实的概率是1-α。在这种情况下,要么落入这个固定区间内要么落在区间外,概率只能是1或0.比如,求得95%置信区间是,我们

就不可以说这个区间包含真实的概率是95%。这个概率

不是1就是0.第37页,课件共93页,创作于2023年2月四、σ2的置信区间在正态性假定下,变量:遵循自由度为n-2的分布。(卡特希尔P73)回顾令为独立标准化正态变量(零均值,单位方差),则量:

遵从k个自由度(df)的分布,这里df一词指上述总和中独立的量的个数。(5.4.1)第38页,课件共93页,创作于2023年2月其中居于双重不等式中间的值由(5.4.1)给出,而

和是得自数值表中自由度为n-2的两个

值(临界值),使得它们各切去分布的100(1-α)%的尾部面积。如图。整理得:这就给出σ2的100(1-α)%置信区间。第39页,课件共93页,创作于2023年2月第40页,课件共93页,创作于2023年2月例:对于自由度为8的表给出下列临界值;

(表示值超过17.5346的概率是2.5%)因此根据得第41页,课件共93页,创作于2023年2月五、回归系数β1和β2的置信区间1.β2的置信区间在ui

的正态性假定下,OLS估计量和本身就是正态分布的。因此,以为例,变量是一个标准正态化变量。如果真实的总体方差已知,可利用正态分布对β2做概率性表达。但是很少知道,在实践中用无偏估计量来测定。(5.3.1)第42页,课件共93页,创作于2023年2月如果用代替σ,(5.3.1)可写成:证明见后,这样定义的t变量遵循自由度为n-2的t分布。注意(5.3.2)和(5.3.1)的区别,我们不用正态分布,而是用t分布来建立β2的置信区间,如下:

是由显著水平为α/2和自由度为n-2的t分布给出的t变量值,常常被称为在α/2显著水平上的临界值。估计量—参数估计量的标准误差的估计值第43页,课件共93页,创作于2023年2月回顾t分布如果Z1是一标准化正态变量,而另一变量Z2遵从自由度为k的分布且独立于Z1,则如下定义的变量:令第44页,课件共93页,创作于2023年2月第45页,课件共93页,创作于2023年2月重新整理得:更简洁的写成,

β2的一个100(1-α)%置信区间:第46页,课件共93页,创作于2023年2月类似地,可以写出:或写成,β1的一个100(1-α)%置信区间:注意给出的β1和β2的置信区间有一重要特点:置信区间的宽度与估计量的标准误差成比例。标准误差越大,置信区间越宽,对未知参数的真值进行估计的不确定性越大。因此估计量的标准误差被喻为估计量的精度。第47页,课件共93页,创作于2023年2月例:若取α=5%,求β2的置信区间。解:查表得,β2的95%置信区间应该为即或第48页,课件共93页,创作于2023年2月对这个置信区间的解释是:给定置信系数95%,从长远看,在类似于(0.4268,0.5914)的每100个区间中,将有95个包含着真实β2值。但要注意,我们不可以说,这个特定的区间有95%的概率包含着真实的β2,因为这个区间已经固定而不再是随机的了,那么,β2要么落入其中,要么落在其外。因此,这个给定的固定区间包含着真实的β2的概率不是1就是0.第49页,课件共93页,创作于2023年2月2.β1的置信区间仿照上例,容易证实,在消费—收入一例中,β1的95%的置信区间是:即仍需留意,每100个区间中有95个将包含真实的β1;但这个特殊的固定区间含有β1的概率则是1或0.第50页,课件共93页,创作于2023年2月六、假设检验一般地,假设有三种形式:

(1)双侧检验:

H0:0;H1:0

(2)左侧检验:

H0:0;H1:<0

H0:0;H1:<0

(3)右侧检验:

H0:0;H1:>0

H0:<=0;H1:>0

第51页,课件共93页,创作于2023年2月假使我们公设:就是说在虚拟假设下MPC是0.3,而在对立假设下MPC大于或小于0.3.对立假设是一个复合假设,就是双侧假设(two-sidedhypothesis)。这样的双侧假设,常常反映着我们对于对立假设偏离虚拟假设的方向没有一个强有力的先验性或理论性期望。双侧或双尾检验第52页,课件共93页,创作于2023年2月所观测的是否与H0

相符?引入置信区间。在重复抽样意义下,置信区间以95%的置信系数给出真值落入其中的一个范围或界限,从而给出了可信的虚拟假设的一个集合。虚拟假设的落入这个100(1-α)%置信区间,我们就不拒绝虚拟假设;如果它落在区间之外,我们就可拒绝虚拟假设。决策规则:构造一个的100(1-α)%置信区间。如果在假设H0

下落入此区间,就不要拒绝H0

。但如果它落在此区间之外,就要拒绝H0

。第53页,课件共93页,创作于2023年2月在假设H0

下,落入此区间的值有100(1-α)%可信性。因而,若

果真落入此域,就不拒绝H0.第54页,课件共93页,创作于2023年2月拿人为的例子来说:置信区间:

显然落在给出的95%置信区间之外,因此我们能以95%的置信度拒绝MPC的真值是0.3的假设。即使虚拟假设是真的,我们得到一个大到0.5914的MPC值,最多也只有5%的机会,这是一个小概率。第55页,课件共93页,创作于2023年2月在统计学中,当我们拒绝虚拟假设时,我们说我们的发现是统计上显著的。反之,当我们不拒绝虚拟假设时,我们说我们的发现不是统计上显著的。一些作者使用“统计上高度显著”一词。该词通常是指,当他们拒绝虚拟假设时,犯I类错误的概率是一个小数,通常指1%。但在后面我们对p值的讨论将表明,较好的做法是,让研究者自己去决定一个统计上的发现,究竟是“显著的”、“中度显著的”,还是“高度显著的”。第56页,课件共93页,创作于2023年2月七、假设检验:显著性检验法检验回归系数的显著性:t检验显著性检验,是利用样本结果来证实一个虚拟假设的真伪的一种检验程序。显著性检验的基本思想在于一个检验统计量(作为估计量)以及在虚拟假设下,这个统计量的抽样分布。根据手中数据算出的统计量的值决定是否接受H0

。第57页,课件共93页,创作于2023年2月回顾在正态性假定下的变量:遵循自由度为n-2的t分布。如果在虚拟假设下的真值被设定,则可做出如下置信区间表述:其中是在H0

下的值。第58页,课件共93页,创作于2023年2月假设检验的置信区间发和显著性检验法之间的联系:在置信区间程序中,我们试图建立一个以某种概率包含有真实但未知的一个范围或区间。而在显著性检验步骤中,我们假设为某值,然后来看所计算的是否位于该假设值周围的某个置信范围之内。回到消费—收入例;df=8。若取α=5%,则令:则如图,因所测的落在拒绝域中,故拒绝的虚拟假设。第59页,课件共93页,创作于2023年2月第60页,课件共93页,创作于2023年2月在实践中,并不需要明显的估计出的置信区间,只需计算t值,然后看它是否落在两个t临界值之间。如该例:落入临界域内,拒绝H0。第61页,课件共93页,创作于2023年2月注意:如果等于假设的,t值将为零。然而随着值远离假设的值,t的绝对值将越来越大。因此,一个“大”的|t|值便是与虚拟假设相违背的迹象。对给定自由度,得到的|t|越大,其概率越小,即第I类错误的概率越小。

因为我们应用了t分布,所以前述检验程序称为t检验。用显著性检验的语言说,如果一个统计量的值落在临界域内,这个统计量是统计上显著的,这时我们拒绝虚拟假设。如果一个统计量的值落在接受域中,这个检验是统计上不显著的,这时我们不拒绝虚拟假设。

该例中,t是显著的,因而我们拒绝虚拟假设。第62页,课件共93页,创作于2023年2月前面描述的是双尾检验,如果统计量的值落在任何一尾端,则拒绝假设。若经验提示我们,MPC预期大于0.3,则有和

。H1仍是一个复合假设,但它是单侧的。为检验此假设,我们利用单尾检验。如下图:第63页,课件共93页,创作于2023年2月第64页,课件共93页,创作于2023年2月表5.1显著性t检验:决策规则假设类型H0:虚拟假设H1:对立假设决策规则:拒绝H0

如果双尾右尾左尾注:df:自由度,对双变量模型是(n-2),对三变量模型是(n-3)。依此类推。第65页,课件共93页,创作于2023年2月检验σ2的显著性:

检验例

,df=8,,在H的假设下算出取α=5%,的两个临界值分别是2.1797和17.5346。

值落入两临界值之间,不拒绝虚拟假设。这一检验程序叫做显著性检验。第66页,课件共93页,创作于2023年2月卡方检验概要H0:虚拟假设H1:对立假设临界域:拒绝H0

如果第67页,课件共93页,创作于2023年2月八、假设检验:实际操作问题“接受”或“拒绝”假设的含义在显著性检验的基础上,如果我们“接受”虚拟假设,其实是说,根据样本证据,我们还没有理由拒绝它;而不是说,虚拟假设毫无疑问是真的。为什么?例如消费—收入一例假定假定第68页,课件共93页,创作于2023年2月“零”虚拟假设与“2-t”经验法则经常检验的一个虚拟假设是,即斜率系数为零。其目的是要明确Y是否与X有任何关系。如果Y和X之间无任何关系,则诸如之类的虚拟假设就没有意义。“2倍t”经验法则:如果自由度20且显著水平定在0.05,那么

在绝对值上超过2时,就可拒绝虚拟假设。查附录可看到,当自由度约为20或更大时,计算的t值绝对值超过2,如2.1,在5%水平上是统计显著的。因此,对于20或更多的自由度,如果计算的t值如2.5或3,就不需要查阅t表了。当自由度小于20时,一定要查阅t表。对于单侧检验或,则对于20或更多的自由度一个超过1.73的t值在5%显著水平上单尾是统计上显著的。第69页,课件共93页,创作于2023年2月选择显著性水平α拒绝或不拒绝虚拟假设,关键在于α这个显著性水平或犯第I类错误的概率——拒绝了真值的假设的概率。人们通常选择把α定在1%、5%或10%的水平上,然后选择一个能使犯第II类错误的概率尽可能小的检验统计量。即使检验功效最大化。如果使用p值,则选择适当α值的问题可以避免。第70页,课件共93页,创作于2023年2月精确的显著性水平:p值当对给定的样本算出一个检验统计量(如t统计量)的值时,我们可以查阅适当的统计表得到一个和检验统计量一样大或更大的数值的确切概率。——这个概率就叫做p值,或概率值(probabilityvalue),也叫做观测或精确显著性水平,或犯第I类错误的概率。p值是被定义为一个虚拟假设可被拒绝的最低显著性水平。还是消费—收入例:得到t值为5.86.得到一个大到5.86或更大的t值的p值是多少?查阅t表,对于自由度为8,得到这样t值的概率一定比0.001(单尾)或0.002(双尾)小的多。通过计算机得出获得5.86或更大的t值(df=8)的概率约为0.000189。——这就是所测t统计量的p值。可以把α固定在某一水平,并在p值小于α时拒绝虚拟假设。第71页,课件共93页,创作于2023年2月九、回归分析与方差分析TSS=ESS+RSS,它把总平方和分解为两个部分:解释平方和与残差平方和。对TSS的构成部分进行研究就叫做从回归的观点做方差分析(analysisofvariance,ANOVA).自由度:独立观测值的个数。TSS有n-1个自由度,在计算样本均值时失去一个自由度。RSS有n-2个自由度(why?)ESS有1个自由度(仅指双变量情形),因为仅是的函数。第72页,课件共93页,创作于2023年2月表5.3双变量回归模型的ANOVA变异来源由于回归由于残差第73页,课件共93页,创作于2023年2月现考虑如下变量:假定干扰项ui是正态分布的且就可证明此F服从自由度为1和n-2的F分布。证明如下:第74页,课件共93页,创作于2023年2月前证,则服从自由度为1的分布。服从自由度为n-2的分布。在假定下化简成前式。第75页,课件共93页,创作于2023年2月上述F比有什么用处?若为零,则两式都给出相同的真实σ2的估计。这时解释变量X与Y没有任何线性影响,Y的全部变异均由随机干扰项ui来解释(yi=ui

)。若不为零,则两式有所不同,从而Y的变异部分归因于X。因此,这个F比就为检验虚拟假设真实是零提供了一个检验统计量。我们需要做的就是算出F值,与选定显著性水平的F临界值进行比较,或查找F统计量的p值。(5.9.2)(5.9.3)第76页,课件共93页,创作于2023年2月表5.4消费——收入一例的ANOVA表变异来源由于回归由于残差查表得自由度为1和8的F临界值为11.26(α=1%)。因此F=202.87明显是显著的,拒绝虚拟假设。从而我们可以做出收入X对消费支出有影响的结论。第77页,课件共93页,创作于2023年2月十、报告回归分析的结果消费——收入例子:表3.2每周家庭消费支出Y和每周家庭收入X的假想数据YXYX7080115180651001202009012014022095140155240110160150260第78页,课件共93页,创作于2023年2月DependentVariable:YMethod:LeastSquaresDate:03/26/12Time:10:26Sample:110Includedobservations:10

VariableCoefficientStd.Errort-StatisticProb.C24.454556.4138173.8127910.0051X0.5090910.03574314.243170R-squared0.962062Meandependentvar111AdjustedR-squared0.957319S.D.dependentvar31.42893S.E.ofregression6.493003Akaikeinfocriterion6.756184Sumsquaredresid337.2727Schwarzcriterion6.816701Loglikelihood-31.7809Hannan-Quinncriter.6.689797F-statistic202.8679Durbin-Watsonstat2.680127Prob(F-statistic)0.000001

第79页,课件共93页,创作于2023年2月第一组括号内的数字代表估计的系数的标准误的估计值,第二组数字代表每个回归系数的真实总体值都是零的虚拟假设下计算出来的t估计值,第三组数字代表估计的p值。在真实总体截距值为零的虚拟假设下,得到一个大到3.8128的t值的概率仅约为0.0026。这是一个很小的概率,因此我们拒绝虚拟假设,真实总体截距不为零。同理,拒绝真实MPC是零的虚拟假设。如果真实MPC确实为零的话,我们得到一个0.5091的MPC的机会实际上为零。第80页,课件共93页,创作于2023年2月十一、评价回归分析的结果根据消费——收入模型,我们可以回答这个模型拟合的有多“好”:(1)所估系数的符号是否与理论或事前预期相一致?

先验说,消费函数中β2

应试正的。在本例中确是如此。(2)如果理论上认为这个关系式不仅是正的,而是是统计上显著的,在本例中是这样的吗?

如5.10节讨论的,MPC不仅是正的,而且统计上显著地异于零,t估计值的p值极小,截距项系数同理。(3)回归模型在多大程度上解释了消费支出的变异?

可以用r2

来回答。本例中r2

约为0.96,这是一个很高的值。如此看来,为了解释消费支出行为,我们选用的模型算是够好的了。在结束讨论之前,我们还想看看模型是否满足CNLRM假定,检查其中关于干扰项ui

的正态性。第81页,课件共93页,创作于2023年2月正态性检验残差直方图正态性的雅克-贝拉(Jarque-Bera)检验。此检验先计算OLS残差的偏态(skewness)和峰态(kurtosis),再使用下列检验统计量:JB统计量渐进的遵循自由度为2的卡方分布。因此,如果计算出来的卡方统计量的p值充分低,就可拒绝残差为正太分布的假设。如果p值合理的高,则不拒绝正态性假设。第82页,课件共93页,创作于2023年2月印度食物支出例DependentVariable:FOODEXPMethod:LeastSquaresDate:03/26/12Time:13:00Sample(adjusted):155Includedobservations:55afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.C94.2087850.856351.8524490.0695TOTALEXP0.4368090.0783235.5770470R-squared0.369824Meandependentvar373.3455AdjustedR-squared0.357934S.D.dependentvar83.4351S.E

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论