




已阅读5页,还剩170页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,第一章计量经济学基础知识,如果表示n个数的一个序列,那么我们就把这n个数的总和写为:,第一节高数知识,一、求和,.,二、算术平均算术平均(arithmeticmean)就是我们日常生活中使用的普通的平均数,其定义如下式:,.,三、加权算术平均,加权平均是将各数据先乘以反映其重要性的权数(w),再求平均的方法。其定义如下式:,.,四、变化率,变化率的定义如下式:,.,五、几何平均几何平均是n个数据连乘积的n次方根,其定义如下式:,六、线性函数,如果两个变量x和y的关系是:,我们便说y是x的线性函数:而和是描述这一关系的两个参数,为截距(Intercept),为斜率。,一个线性函数的定义特征在于,y的改变量总是x的改变量的倍:其中,表示“改变量”。换句话说,x对y的边际效应是一个等于的常数。,例:线性住房支出函数,假定每月住房支出和每月收入的关系式是Housing=164+0.27income那么,每增加1元收入,就有0.27元用于住房支出,如果家庭收入增加200元,那么住房支出就增加0.27200=54元。机械解释上述方程,即时一个没有收入的家庭也有164元的住房支出,这当然是不真实的。对低收入水平家庭,这个线性函数不能很好的描述housing和income之间的关系,这就是为什么我们最终还得用其他函数形式来描述这种关系。,多于两个变量的线性函数:假定y与两个变量和有一般形式的关系:由于这个函数的图形是三维的,所以相当难以想象,不过仍然是截距(即=0和=0时y的取值),且和都是特定斜率的度量。由方程(A.12)可知,给定和的改变量,y的改变量是若不改变,即,则有因此是关系式在坐标上的斜率:,因为它度量了保持固定时,y如何随而变,所以常把叫做对y的偏效应。由于偏效应涉及保持其他因素不变,所以它与其他条件不变(CeterisParibus)的概念有密切联系,参数可作类似解释:即若,则因此,是对y的偏效应。,线性函数的性质,假定大学生每月对CD的需求量与CD的价格和每个月的零花钱有如下关系:式中,price为每张碟的价格,income以元计算。需求曲线表示在保持收入(和其他因素)不变的情况下,quantity和price的关系。,例:对CD的需求,线性函数的基本性质:不管x的初始值是什么,x每变化一个单位都导致y同样的变化。x对y的边际效应是常数,这对许多经济关系来说多少有点不真实。例如,边际报酬递减这个重要的经济概念就不符合线性关系。为了建立各种经济现象的模型,我们需要研究一些非线性函数。非线性函数的特点是,给定x的变化,y的变化依赖于x的初始值。,七、若干特殊函数,1.二次函数,刻画报酬递减规律的一个简单方法,就是在线性关系中添加一个二次项。考虑方程式式中,和为参数。当时,y和x之间的关系呈抛物线状,并且可以证明,函数的最大值出现在,1.二次函数,例如,若y=6+8x-2x2。(从而=8且=-2),则y的最大值出现在x*=8/4=2处,并且这个最大值是6+82-2(2)2=14。,对方程式意味着x对y的边际效应递减,这从图中清晰可见,应用微积分知识,也可以通过求这个二次函数的一阶导数得出。斜率=方程右端是此二次函数对x的导数。同样,则意味着x对y的边际效应递增,二次函数的图形就呈U行,函数的最小值出现在点处。,1.二次函数,在计量经济分析中起着最重要作用的非线性函数是自然对数,或简称为对数函数,记为还有几种不同符号可以表示自然对数,最常用的是或。当对数使用几个不同的底数时,这些不同的符号是有作用的。目前,只有自然对数最重要,因此我们都用表示自然对数。,2.自然对数,2.自然对数,图2.1.4y=log(x)的图形,2.自然对数,有如下性质:1.log(x)可正可负:log(x)0,x12.一些有用的性质(牢记):log(x1x2)=log(x1)+log(x2),x1,x20log(x1/x2)=log(x1)-log(x2),x1,x20log(xc)=clog(x),x0,c为任意实数,2.自然对数,对数可用于计量经济学应用中的各种近似计算。1.对于x0,有log(1+x)x。这个近似计算随着x变大而越来越不精确。2.两对数之差可用作比例变化的近似值。令x0和x1为两个正数,可以证明(利用微积分),对x的微小变化,有如果我们用100乘以上述方程,并记那么,对x的微小变化,便有“微小”的含义取决于具体情况。,2.自然对数,近似计算的作用:定义y对x的弹性(elasticity)为换言之,y对x的弹性就是当x增加1%时y的百分数变化。若y是x的线性函数:,则这个弹性是它明显取决于x的取值(弹性并非沿着需求曲线保持不变)。,2.自然对数,不仅在需求理论中,在许多应用经济学领域,弹性都是非常重要的。在许多情况下,使用一个常弹性模型都很方便,而对数函数能帮助我们设定这样的模型。如果我们对x和y都使用对数近似计算,弹性就近似等于因此,一个常弹性模型可近似描述为方程式中,为y对x的弹性(假定x,y0)。这类模型在经验经济学中扮演着重要角色。目前,式中的只是接近于弹性这一事实并不重要,可以忽略。,例:常弹性需求函数,若q代表需求量而p代表价格,并且二者关系为则需求的价格弹性是-1.25.初略地说,价格每增加1%,将导致需求量下降1.25%。,2.自然对数,在经验研究工作中还经常出现使用对数函数的其他可能性。假定y0,且则,从而。由此可知,当y和x有上述方程所示关系时,,例:对数工资方程,假设小时工资与受教育年数有如下关系:根据前面所述方程,有由此可知,多受一年教育将使小时工资增加约9.4%。通常把%y/x称为y对x的半弹性,半弹性表示当x增加一个单位时y的百分数变化。在上述模型中,半弹性是个常数并且等于,在上述例子中,我们可以方便的把工资和教育的关系概括为:多受一年教育无论所受教育的起点如何都将使工资提高约9.4%。这说明了这类模型在经济学中的重要作用。,2.自然对数,另一种关系式在应用经济学中也是有意义的:其中,x0。若取y的变化,则有,这又可以写为。利用近似计算,可得当x增加1%时,y变化个单位。,例:劳动供给函数,假定一个工人的劳动供给可描述为式中,wage为小时工资而hours为每周工作小时数,于是,由方程可得:换言之,工资每增加1%,将使每周工作小时增加约0.45或略小于半个小时。若工资增加10%,则或约四个半小时。注意:不宜对更大的工资百分数变化应用这个近似计算。,考虑方程此处log(y)是x的线性函数,但是怎样写出y本身作为x的一个函数呢?指数函数给出了答案。我们把指数函数写为y=exp(x),有时也写为,但在我们课程中这个符号不常用。指数函数的两个重要的数值是exp(0)=1和exp(1)=2.7183(取4位小数)。,3.指数函数,3.指数函数,图2.1.4y=exp(x)的图形,从上图可以看出,exp(x)对任何x值都有定义,而且总大于零。指数函数在如下意义上是对数函数的反函数:对所有x,都有logexp(x)=x,而对x0,有explog(x)=x。换言之,对数“解除了”指数,反之亦然。对数函数和指数函数互为反函数。指数函数的两个有用性质是exp(x1+x2)=exp(x1)exp(x2)和expclog(x)=xc,3.指数函数,记忆:经济学中常用的一些函数及其导数有,4.微分学,当y是多元函数时,偏导数的概念便很重要。假定y=f(x1,x2),此时便有两个偏导数,一个关于x1,另一个关于x2。y对x1的偏导数记为,就是把x2看做常数时方程对x1的普通导数。类似的,就是固定x1时方程对x2的导数。若则这些偏导数可被视为经济学所定义的偏效应。,4.微分学,把工资与受教育年数和工作经验(以年计)相联系的一个函数是exper对wage的偏效应就是上式对exper的偏导数:这是增加一年工作经验所导致工资的近似变化。注意这个偏效应与exper和educ的初始水平都有关系。例如,一个从educ=12和exper=5开始的工人,再增加一年工作经验,将使工资增加约0.19-0.085+0.00712=0.234元。准确的变化通过计算,结果是0.23,和近似计算结果非常接近。,例:含交互项的工资方程,一、随机变量及其概率分布假设我们掷一枚钱币10次,并计算出现正面的次数,这就是一个实验的例子。一般地说,一个实验是指至少在理论上能够无限重复下去的任何一种程序,并且它有一个定义完好的结果集。一个随机变量是指一个具有数值特征并由一个实验来决定其结果的变量。,第二节概率论基础,按照概率和统计学的惯例,我们一律用大写字母如常见的W,X,Y和Z表示随机变量,而用相应的小写字母w,x,y和z表示随机变量的特定结果。例如,在掷币实验中,令X为一枚钱币投掷10次出现正面的次数。所以X并不是任何具体数值,但我们知道X将在集合中取一个值。比方说,一个特殊的结果是x=6。我们用下标表示一系列随机变量。例如,我们记录随机选择的20个家庭去年的收入。可以用X1,X2,X20表示这些随机变量,并用x1,x2,x20表示其特殊结果。,一、随机变量及其概率分布,如定义所言,即使随机变量描述的是一些定性事件,我们也总定义它的结果是数值。例如,考虑只掷一枚钱币,其两个结果是正面和反面。我们可以定义一个随机变量如下:如果出现正面则X=1;如果出现反面则X=0。一个只能取0和1两个值的随机变量叫做贝努利随机变量。XBernoulli()(读作“X服从一个成功概率为的贝努利分布):P(X=1)=,P(X=0)=1-,一、随机变量及其概率分布,1.离散随机变量离散随机变量是指一个只取有限个或可数的无限个数值的随机变量。“可数的无限个”:虽然随机变量可取无限个值,但这些值可以和正整数一一对应。贝努力随机变量是离散随机变量的最简单的例子。,一、随机变量及其概率分布,一个离散随机变量要由它的全部可能值和取每个值的相应概率来完整描述。如果X取k个可能值其概率p1,p2,pk被定义为pj=P(X=xj),j=1,2,k(读作:“X取值xj的概率等于pj”。)其中,每个pj都在0-1之间,并且p1+p2+pk=1,1.离散随机变量,X的概率密度函数(probabilitydensityfunction,pdf)概括了X的可能结果及其相应概率的信息:而且对某个j,凡是不等于xj的x都有f(x)=0。换言之,对任何实数x,f(x)都是随机变量X取该特定值x的概率。当我们设计多于一个随机变量时,有时需要给所考虑的pdf加一个下标:例如fx是X的pdf,fY是Y的pdf等等。,1.离散随机变量,给定任一离散随机变量的pdf,就不难计算关于该随机变量的任何事件的概率。例如,设X为一名篮球运动员在两次罚球中的命中次数。因此X的三个可能值是0,1,2。假定X的pdf是f(0)=0.20,f(1)=0.44和f(2)=0.36这三个概率之和必然为1.利用这个pdf,我们能算出该运动员至少投中一球的概率:P(X1)=P(X=1)+P(X=2)=0.44+0.36=0.80。X的pdf如下图示:,1.离散随机变量,2.连续随机变量连续随机变量是指一个取任何实数的概率都为零的变量。这个定义有点违背直觉,因为在任何应用中,我们最终都会观测到一个随机变量取得的某种结果。这里的思想是,一个连续随机变量X的可能取值如此之多,以致我们无法用正整数去计算,因而,逻辑上的一致性就要求X必须以零概率取每一个值。,一、随机变量及其概率分布,在计算连续随机变量的概率时,讨论一个连续随机变量取某特定值的概率是没有意义的,最方便的是使用累积分布函数(cumulativedistributionfunction,cdf)。设X为任意随机变量,它对任何实数x的cdf被定义为F(x)P(Xx)对于一个连续随机变量,F(x)就是概率密度函数f之下、点x以左的面积。因为F(x)就是一个概率,所以它总是介于0-1之间。此外,若x1c)=1-F(c)2.对任何两个数ac)和P(aXb)=P(aXb)=P(aXb)=P(a0,则sd(aX)=asd(X)。,4.标准差,.,标准差S的的定义分别如下式:,作为方差和标准差性质的一个应用而且本身也是有实际意义的一个问题假如给定随机变量X,我们将它减去其均值并除以其标准差,便定义了一个新的随机变量Z这又可写为Z=aX+b,其中a=(1/)而b=-(/)。可得:E(Z)=aE(X)+b=(/)-(/)=0Var(Z)=a2Var(X)=2/2=1因此,随机变量Z的均值为零,方差(或者标准差)为1。这一过程有时被称为将随机变量X标准化,而Z则叫做标准化随机变量。,5.标准化一个随机变量,1.关联度:协方差与相关虽然两个随机变量的联合pdf完整地描述了它们之间的关系,但对于它们大致如何互相变动,仍需要一个扼要的度量手段。正如期望值和方差一样,这类似于用一个数字来概括整个分布的某一方面,现在要概括的便是两个随机变量的联合pdf。,四、联合与条件分布的特征,两个随机变量X和Y之间的协方差(有时也叫做总体协方差,以强调它考虑的是描述一个总体的两个随机变量之间的关系),被定义为乘积(X-X)(Y-Y)的期望值:有时又记为。若,则平均而言,当X超过其均值时,Y也超过其均值;若,则平均而言,当X超过其均值时,Y低于其均值。,2.协方差,计算的几个有用表达式如下:协方差度量两个随机变量之间的线性相依性。一个正的协方差表示两随机变量同向移动,而一个负的协方差则表示两随机变量反向移动。,2.协方差,性质Cov.1:若X和Y相互独立,则注意:此性质的反命题并不成立:X和Y之间的协方差为零并不意味着X和Y相互独立。性质Cov.2:对任意常数a1,b1,a2和b2,都有此性质的重要含义在于,两个随机变量之间的协方差会因为将两者或者两者之一乘以一个常数倍而改变。这在经济学中之所以重要,是因为诸如货币变量和通货膨胀率等,都可使用不同的度量单位进行定义而不改变其实质。,协方差的性质,取决于度量单位是协方差的一个缺陷。为克服这一缺陷,现引进X和Y的相关系数(correlationcoefficient):X和Y的相关系数有时记做(而且有时称总体相关)。所谓相关系数是用来测量诸如收入与消费、气温和啤酒的消费量、汇率与牛肉的进口价格等两个变量X、Y之间的相互关系的大小和方向(正或负)的系数。通过计算相关系数,可以知道X与Y之间具有多大程度的线性(linear)关系。相关系数R的定义如下式:,3.相关系数,.,性质Corr.1-1Corr(X,Y)1若Corr(X,Y)=0,或等价地Cov(X,Y)=0,则X和Y之间就不存在线性关系,并称X和Y为不相关随机变量;否则X和Y就是相关的。Corr(X,Y)=1意味着一个完全的正线性关系,意思是说,我们对某常数a和某常数b0可以写Y=a+bX。Corr(X,Y)=-1则意味着一个完全的负线性关系,使得对某个b0,则Corr(a1X+b1,a2Y+b2)=Corr(X,Y)若a1a20,则Corr(a1X+b1,a2Y+b2)=-Corr(X,Y)作为一个例子,假定薪水和教育的总体相关系数是0.15.这一度量将与用美元、千美元或任何其他单位计算薪水都无关;与用年、季、月或其他单位来衡量受教育时间也无关。,3.相关系数,一旦定义了协方差和相关系数,就可以把方差的主要性质完整地列出来。性质VAR.3对于常数a和b,有由此可知,若X和Y不相关(从而Cov(X,Y)=0)则和在后一情形中,要注意为什么差的方差是(两个)方差之和,而不是方差之差。,4.随机变量之和的方差,例:令X为星期五夜晚某酒店赚到的利润,而Y为接下来星期六夜晚赚到的利润。因此,Z=X+Y就是这两个夜晚赚的利润。假定X和Y都有一个300美元的期望值和一个15美元的标准差(因而方差为225)。两夜晚的期望利润将是E(Z)=E(X)+E(Y)=2300=600美元。若X和Y独立,从而它们也不相关,则总利润的方差便是两个方差之和:Var(Z)=Var(X)+Var(Y)=2225=450。于是总利润的标准差是,约为21.21美元。,4.随机变量之和的方差,从两个变量推广到多于两个变量的情形。若随机变量中的每一个变量与集合中其他任何一个变量都不相关,我们便称其为两两不相关的随机变量。也就是说,对所有的,都有,4.随机变量之和的方差,性质VAR.4若是两两不相关的随机变量且是常数,则用求和符号便可写为此性质的一个特殊情形就是,对所有i都取ai=1.这时,对两两不相关的随机变量来说,和的方差就是方差之和:,4.随机变量之和的方差,协方差和相关系数都是对两个随机变量之间线性关系的度量,并且对称地处理两者。在社会科学中更多的情况是,我们想用一个变量X去解释另一个变量Y。而且,若Y和X有非线性形式的关系,则我们还希望知道这个形式。把Y叫做被解释变量,而X叫做解释变量。例如Y代表小时工资,而X代表受过正式教育的年数。可以通过给定X下Y的条件期望(有时又称条件均值)来概括Y和X之间的关系。即,一旦我们知道X取了某个特定值x,就能根据X的这个结果算出Y的期望值。记作E(Y|X=x)或简记E(Y|x)。一般情形是,随着x的改变,E(Y|x)也会改变。,5.条件期望,当Y是取值为的离散随机变量时,则有当Y连续时,E(Y|x)便由对的y的所有可能值求积分来定义。好比无条件期望那样,条件期望也是对Y所有可能值的一个加权平均,只不过这时的权数反映了X已取了某个特殊值的情形。因此,E(Y|x)是x的某个函数,这个函数告诉我们Y的期望值如何随x而变化。,5.条件期望,例令(X,Y)代表一个工人总体,其中X为受教育年数,Y为小时工资。那么,E(Y|x=12)便是总体中所有受了12年教育(相当于读完高中)的工人的平均小时工资。E(Y|x=16)则是所有受过16年教育的工人的平均小时工资。跟踪各种教育水平的期望值,便为工资和教育之间的关系提供了重要信息。,5.条件期望,原则上,可以在每个教育水平上求出小时工资的期望值,然后将这些期望值列表。由于教育的变化范围很大且可度量为一年的某个分数所以用这种方法显示平均工资和受教育程度之间的关系很烦琐。计量经济学中的典型方法是,设定一些足以刻画这种关系的简单函数。作为一个例子,假设WAGE在给定EDUC时的期望值是如下线性函数:E(WAGE|EDUC)=1.05+0.45EDUC假定这一关系对工人总体成立,则受8年和16年教育者的平均工资分别是多少?EDUC的系数如何解释?,5.条件期望,条件期望的一些基本性质对计量经济分析中的推导颇为有用。性质CE.1对任意函数c(X),都有Ec(X)|X=c(X)。这意味着,当我们计算以X为条件的期望值时,X的函数可视为常数。例如E(X2|X)=X2。直观上,这无非就是说,若知道了X,也就知道了X2。,6.条件期望的性质,性质CE.2对任意函数a(X)和b(X),有例如,我们能很容易地计算像XY+2X2这种函数的条件期望:,6.条件期望的性质,性质CE.3若X和Y相互独立,则E(Y|X)=E(Y)。这个性质意味着,若X和Y相互独立,则Y在给定X时的期望值与X无关,这是E(Y|X)必定等于Y的(无条件)期望。在工资与教育一例中,假设工资独立于教育,则高中毕业生和大学毕业生的平均工资便相同。这几乎无疑是错误的,所以我们不能假定工资与教育是独立的。,6.条件期望的性质,性质CE.4EE(Y|X)=E(Y)。这个性质意味着,如果我们先把E(Y|X)看做X的函数,再求这个函数的期望值,那么结果就是E(Y)。例:令Y=WAGE和X=EDUC,其中WAGE为小时工资,而EDUC为受教育年数。假定给定EDUC下WAGE的期望值是E(WAGE|EDUC)=4+0.6EDUC,且E(EDUC)=11.5。则有E(WAGE)=E(4+0.6EDUC)=4+0.6E(EDUC)=10.90美元/小时。,6.条件期望的性质,性质CE.5若E(Y|X)=E(Y),则Cov(X,Y)=0(因而Corr(X,Y)=0。事实上X的每个函数都与Y不相关。该性质的含义是,若对X的了解不能改变Y的期望值,则X和Y必然不相关。注意:此性质的逆命题不成立。若X和Y不相关,E(Y|X)仍然可能取决于X。,6.条件期望的性质,1.正态分布正态分布和由它衍生出来的分布是统计学和计量经济学中最广泛使用的分布。假定在总体上定义的随机变量是正态分布,将使概率计算得以简化。,五、正态及其有关分布,图正态概率密度函数的一般形状,.,当连续的随机变量的概率密度函数形式为时,称X的分布为正态分布,记为X,密度函数中和是X的数学期望和方差。当和时,称X服从标准正态分布,记为X。,表正态分布与标准正态分布,图标准正态分布的分布函数,卡方分布(分布)是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。1.卡方分布的数学形式设随机变量X1,X2,Xk,相互独立,且都服从同一的正态分布N(,2)。那么,我们可以先把它们变为标准正态变量Z1,Z2,Zk,k个独立标准正态变量的平方和被定义为卡方分布(分布)的随机变量(读作卡方),六、卡方分布,X即所谓具有n个自由度(degreesoffreedom,df)的分布。自由度概念在我们计量经济学中扮演着重要角色。,1.卡方分布的数学形式,t分布在经典统计学和多元回归分析中广为应用:它可以从一个标准正态和一个分布得到。设Z服从标准正态分布,而X服从自由度为n的分布。于是,随机变量便服从自由度为n的t分布,记为Ttn。t分布的自由度得子分母中的随机变量。t分布的特点是:左右对称;当n很大时,非常接近正态分布。,七、t分布,.,如果随机变量X服从标准正态分布N(0,1);随机变量服从自由度为n、方差为2n的分布。并且X和相互独立,则统计量:,服从t分布(注:可以将分子理解为符合正态分布的参数,分母看作其标准差。,.,对于从标准正态分布中的总体中抽的容量为n的简单随机样本,其样本均值与样本标准差S构成如下统计量。,服从自由度为n-1的t分布,记为tt(n-1)。注意:这里的分母是子样标准差除以自由度,实际上是子样均值的标准差!只有这样才与分子保持一致性。分子被平均了,分母当然也要平均!,t分布在小样本(n0,都有Wn便是的一个一致估计量。若Wn不是的一致估计量,则说它是非一致性的。当Wn是一致的,我们也说是Wn的概率极限,记作plim(Wn)=。,3.一致性,和无偏性不一样无偏性是估计量在给定样本容量下的一个特征一致性描述了估计量的抽样分布在样本容量变大时的形态。为了强调这一点,我们在陈述上述定义时,就已对估计量加上了样本容量n这个下标,并将在本节中始终保持这个惯常做法。前述方程意味着,Wn的分布越来越集中于,粗略地讲,对于越来越大的样本容量,Wn离开很远的可能性越来越小。,3.一致性,无偏估计量不一定是一致的,但那些随着样本容量增大而方差缩减至零的无偏估计量是一致的。这个结果可规范陈述如下:若Wn是的无偏估计量,且随着有Var(Wn)0,则plim(Wn)=。利用全部数据样本的无偏估计量,通常其方差都随着样本容量的扩大而缩减至零,因而是一致的。一致估计量的一个很好的例子,是取自均值为和方差为的总体的一个随机样本的均值。该样本均值对是无偏的。对于任何一个样本容量n,我们都推导出。因此,随着n,有,所以,除了无偏外,还是的一致估计量。,3.一致性,是的一致估计量,即使不存在Var(),这一结论也是成立的。这个经典的结论被称为大数定律。大数定律令Y1,Y2,Yn是均值为的独立同分布随机变量,于是plim()=大数定律意味着,如果我们对估计总体均值感兴趣,通过选取一个足够大的样本,便能得到一个任意接近的数。这个基本结论和概率极限的基本性质相结合,便可以证明一些相当复杂的估计量时一致的。,3.一致性,中心极限定理是概率与统计学中最强有力的结论之一。它表明任何(具有有限方差)的总体的一个随机样本的均值,经过标准化后,都服从一个渐近标准正态分布。中心极限定理令为一个均值为和方差为2的随机样本。于是,服从一个渐近标准正态分布。,4.渐近正态性,上式中的变量Zn就是的标准化形式:我们从中减去了,然后除以。这样,无论Y的总体分布是什么,Zn都有和标准正态分布一样的零均值和单位方差。令人惊奇的是,随着n变大,Zn的整个分布便任意接近于标准正态分布。我们可以把方程中的标准化变量写,它向我们表明,为了得到有用的极限分布,我们必须将样本均值与总体均值之差乘以样本容量的平方根。若不乘,我们只能得到依概率收敛于零的。换言之,随着n,的分布仅向一个点靠拢,对于合理样本容量,这不可能是一个很好的近似。,4.渐近正态性,乘以便可确保Zn的方差保持不变。实践中,我们经常把视为均值为均值为和方差为2/n的近似正态分布,这就为我们给出了正确的统计程序,因为它得到方程中的标准化变量。统计学和计量经济学中遇到的大多数估计量都可写为样本均值的函数,这是我们就能应用大数定律和中心极限定理。当两个一致估计量都服从渐近正态分布时,我们便选择渐近方差最小的那个估计量。,4.渐近正态性,四、参数估计的一般方法,点估计的基本思想,1、矩估计,根据大数定律,样本矩依概率收敛于相应的总体矩,而样本矩的连续函数依概率收敛于总体矩的连续函数。通常以样本均值作为总体均值的点估计,以样本方差作为总体方差的点估计。,令为来自总体分布f(y;)的一个随机样本。因为假定了随机抽样,所以的联合分布无非就是各个密度之积:f(y1;)f(y2;)f(y3;)。在离散情形中,这就是。现在定义似然函数为这是一个随机变量,因为它取决于随机样本的结果。的极大似然估计量,且称之为W,是使似然函数最大化的值。显然,这个值取决于随机样本。极大似然原理是说,在所有可能的值中,应选取使观测数据有极大似然性的值,直觉上,这是估计的一种合理方法。,2、极大似然估计法,通常使用对数函数更加方便,将似然函数取自然对数便得到对数似然函数:极大似然估计(MLE)通常是一致性的而且有时候是无偏的。然而许多其他的估计量也是这样。MLE之所以广受欢迎是因为如果总体模型f(y;)设定正确,则它一般都是最渐近有效的估计量。其次,MLE有时是最小方差无偏估计量(minimumvarianceunbiasedestimator);即在的所有无偏估计量中,它的方差最小。,2、极大似然估计法,区间估计基本思想,区间估计求解步骤,图正态总体区间估计的分类,1.区间估计的性质从一个特定样本得到的点估计值,本身还不足以对检验经济理论或进行政策探讨提供足够的信息。一个点估计值也许是研究者对总体值的最好猜测,但根据其性质,并不能告诉我们估计值到底离总体参数有“多么”接近。例如,假定某研究者根据公认的一个随机样本报告说,工作培训津贴使小时工资增加了6.4%。我们怎能知道一旦整个工人总体都接受了培训,其效果是否会接近这个数字呢?由于我们不知道总体值,所以无法知道某一特定估计值究竟离它有多近。然而,我们能作出概率方面的陈述,并由此诞生区间估计。,我们已经知道评价一个估计量不确定性的一个方法:求出它的抽样标准差。连同点估计值一起报告估计量的标准差,提供了估计值的某些精确度信息。然而,这个标准差依赖于未知的总体参数,就算这个问题可以忽略,连同点估计值一起报告标准差,也并没有直接陈述总体值很可能坐在相对于估计值的什么地方。通过构造置信区间(confidenceinterval)便克服了这一局限。,1.区间估计的性质,假定总体服从Normal(,1)分布,并令是来自这个总体的一个随机样本。(为了便于说明,我们假定总方差已知且等于1,然后我们再说明怎样处理方差未知的更现实的情形。)样本均值服从一个均值为和方差为1/n的正态分布:。现在将标准化,因为标准化的服从一个标准正态分布,所以有,即有方程表明,随机区间包含总体均值的概率是0.95或95%。这一信息使我们能构造的区间估计值为,简记为,1.区间估计的性质,一旦观测到样本数据,方程中的置信区间便容易计算;是依赖于数据的唯一因素。例如,假定n=16,并且16个数据点的均值是7.3,则这个95%置信区间是7.31.96/4=7.30.49,即6.81,7.79。根据构造可知,=7.3是此区间的中心。置信区间虽然容易计算,但较难理解。当我们说方程是的一个95%置信区间时,意味着,随机区间包含的概率是0.95。换言之,在抽取随机样本之前,方程便有95%的机会包含。方程是区间估计量的一个例子。它是一个随机区间,因为端点随不同的样本而变。,1.区间估计的性质,有人常这样解释置信区间:“落在区间上的概率是0.95”。这种解释是错误的。一旦样本被观测到且也已计算出来,则置信区间的上下限只是两个数字(在上述例子中就是6.81和7.79)而已。总体参数虽然未知,也仅是个常数。因此只有两种可能:或者落入或者不落入区间(我们永远也无法确切知道是哪一种情形)。一旦利用现有数据把置信区间计算出来,就不再有概率的问题。概率解释来自如下事实:利用所有随机样本构造这样的置信区间,有95%的可能包含。,1.区间估计的性质,前面推导置信区间,有假定总体服从Normal(,1)分布。实践中,该总体的方差不一定为1,设方差为,假定为已知,则95%置信区间是当已知时,的置信区间便已构造出来。为了考虑未知的情形,我们必须用一个估计值。令表示样本标准差。于是,用的估计值s代替置信区间表达式中的,我们就能求出一个完全依赖于观测数据的置信区间。但是,s取决于特定样本,这就不能保持95%的置信水平。换言之,因为常数已被随机变量s代替,随机区间包含的概率不再是0.95。,2.正态分布总体均值的置信区间,我们该怎样做下去呢?我们必须依靠t分布,而不是使用标准正态分布。t分布得自式中,为样本均值;S为随机样本的样本标准差。为了构造一个95%的置信区间,令c表示tn-1分布中的第97.5分位数。换言之,c是这样一个值,使得tn-1中的面积有95%落在-c与c之间:P(-c0.42而我们没有拒绝H0,就出现第类错误。在我们作出是否拒绝虚拟假设的决定之后,我们不是做了正确的决定就是犯了一种错误。我们永远不会确切地知道是否犯了错误。然而我们能计算出犯了第类错误或第类错误的概率。人们在构造假设检验的规则时,使得犯第类错误的概率相当小。,1.假设检验基础,通常我们把一个检验的显著(性)水平定义为犯第类错误的概率;并典型地记为,用符号表示就是=P(拒绝H0|H0)等式的右端读作:“当H0为真时拒绝H0的概率。”经典的假设检验要求我们,在作一个检验时,一开始就定下一个值。当我们设定了值,就基本上量化了我们对犯第类错误的容忍度。通常的值有0.10、0.05和0.01.若=0.05,则研究者为了侦察出对H0的偏离,愿意以5%的概率错误地拒绝H0。,1.假设检验基础,小概率事件在一次实验中不可能发生先对总体分布函数的形式或其参数做出某种假设,然后在假设成立的条件下,寻找一个概率发生很小的事件。若该小概率事件在一次试验中发生了,则应拒绝原假设,选择备择假设,否则,应接受原假设。,2.小概率事件原理,3假设检验步骤,第一步:分析问题,提出原假设H0和备择假设H1;第二步:确定检验统计量,并在H0成立下求出它的分布;第三步:构造小概率事件,即给定显著性水平,在H0成立下确定拒绝域和临界值。第四步:由样本值计算出统计量,若该值落入拒绝域,则拒绝H0,选择H1,否则接受H0。,接受域,显著性水平小概率,拒绝域,为了相对于一个独立假设而去检验一个虚拟假设,我们需要挑选一个检验统计量(或简称统计量)和一个临界值。统计量和临界值的选择则基于方便和给定检验显著性水平下的功效的最大化。在本小节中我们回顾检验关于正态总体均值的那些假设。一个检验统计量,记为T,是指随机样本的某个函数。当我们对某个特定结果计算统计量时,我们就得到这个统计量的一个结果,我们将把它记为t。,4.检验关于整体总体均值的假设,给定一个统计量,我们便能定义一个拒绝规则,来决定什么时候我们拒绝H0而支持H1。在本课程中,所有的拒绝规则都基于一个检验统计量的值t与一个临界值c的比较。所有导致拒绝虚拟假设的t值一起被称为拒绝域。为了定出临界值,我们要首先决定检验的显著性水平。于是,给定,与相联系的临界值就由H0被假定为正确时T的分布来决定。我们将此临界值写为c,而略去其与有关的事实。,4.检验关于整体总体均值的假设,对Normal(,2)总体的均值进行假设检验则很容易。把虚拟假设表述为H0:=0其中,0是我们设定的值。在多数应用中0=0,但也有不等于0的时候。怎样选择拒绝规则仍与对立假设的性质有关。我们感兴趣的三种对立假设是H1:0H1:0给出了一个单侧对立假设,方程H1:0时,虚拟假设实际上是H0:0,因为只有当0时我们才会拒绝H0。如果我们仅在至少和0一样大时才对值感兴趣,那么单侧对立假设便是适当的。方程H1:0是一个双侧对立。我们若对任何偏离虚拟假设的情况都感兴趣,它就比较合适。,4.检验关于整体总体均值的假设,先考虑方程H1:0中的对立假设。直觉上,当样本均值“足够”大于0时,我们便应拒绝H0而支持H1。但我们应如何确定,在选定的显著性水平上,是否大到足以拒绝H0呢?这要求我们知道当虚拟假设正确时而拒绝它的概率。我们不直接考虑,而是使用它的标准化形式,并用样本标准差s代替其中的:其中,是的标准误(standarderror)。给定数据样本,t很容易求出。上述方程中的统计量常被称为检验H0:=0的t统计量(tstatistic)。,4.检验关于整体总体均值的假设,我们使用t是因为,在虚拟假设下,随机变量服从一个tn-1分布。现假定我们决定使用5%的显著性水平,于是临界值c的选择将使得P(Tc|H0)=0.05;即犯第类错误的概率是5%。一旦我们求出c,拒绝规则就是tc,其中,c是tn-1分布中的第100(1-)百分位数;作为一个百分数的显著性水平将是100%。这是一个单尾检验(one-tailedtest)的例子,因为其拒绝域位于t分布的一尾。不同的显著性水平将会导致不同的临界值。,4.检验关于整体总体均值的假设,4.检验关于整体总体均值的假设,图2.3.4相对于单侧对立假设0的5%显著性水平的拒绝域,在某特定州被准予建立企业园区的城市总体中(关于印第安纳州,可参见Papke,1994),令Y代表一个城市在成为企业园区前后的一年中投资变化百分数。假定Y服从一个Normal(,2)分布。企业园区对商业投资没有影响的虚拟假设是H0:=0;而有积极影响的对立假设是H1:0(我们假定不会出现消极影响)。假定我们想在5%的水平上检验H0。此时的检验统计量便是,例:企业园对工商业投资的影响,假定我们有36个城市被准予建立企业园区的一个样本,查表知临界值c=1.69。因而,若t1.69,我们就拒绝H0而支持H1。假定样本给出=8.2和s=23.9。由此得到t2.06,从而在5%的显著性水平上拒绝H0。就是说,我们的结论是,在5%的水平上,企业园区对平均投资有正影响。1%的临界值是2.44,所以还不能在1%的水平上拒绝H0。这里存在和2.3.1同样的缺陷:我们没有控制那些此文可能影响城市投资的其他因素,所以还不能说我们找到了因果关系。,例:企业园对工商业投资的影响,对单侧对立假设H1:c。其中,|t|是方程中t统计量的绝对值。这是一个双尾检验。这时我们必须小心选择临界值:c是tn-1分布中第100(1-/2)百分数。,4.检验关于整体总体均值的假设,例如=0.05时,这个临界值便是tn-1分布中第97.5百分位数。这就保证H0在正确时只有5%的机会被拒绝。例如,取n=22,则临界值为c=2.08,这是t21分布中的第97.5百分位数。为了在5%的水平上拒绝H0而支持H1,t统计量的绝对值必须超过2.08。熟悉假设检验的适当表达语言非常重要。如把“我们未能在5%的显著水平上拒绝H0而支持H1”换成“我们在5%的水平上接受H0”,后者的措辞欠妥。基于同一数据集,常常很多假设是不能拒绝的。拿选举的例子来说,若说H0:=0.42和H0:=0.43都“被接受”,便出现逻辑上的矛盾,因为其中只能有一个正确。但两者都未被拒绝却完全有可能。由于这个缘故,我们常说“未能拒绝H0”而非“接受H0”。,4.检验关于整体总体均值的假设,4.检验关于整体总体均值的假设,图2.3.5相对于双侧对立假设0,显著性水平为5%的检验拒绝域,事先选定一个显著性水平的传统要求意味着,利用同样的数据和同样的方法去检验同样的假设,不同的研究者最终会得到不同的结论。先报告我们所进行检验的显著性水平,在一定程度上解决了这个问题,但是也不能完全解决。为提供更多的信息,我们可以问如下问题:我们检验虚拟假设并未被拒绝的最大显著性是什么?这个最
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年建筑工程师岗位面试要点及常见问题解答
- 2025年焊接工艺考试热点钎焊操作规范及安全注意事项
- 2025年水利专业求职者必看初级灌区管理工面试攻略与模拟题解析
- 2025年特岗教师招聘考试指南初中语文教学法
- 2025年旅游策划与管理专业面试预测题及解析
- 2025年信息技术员招聘考试热点解析及模拟题
- 电力交易员基础知识培训课件
- 电刀使用课件
- 电冰箱基础知识培训教材课件
- 2025年特岗教师招聘初中数学面试技巧与预测题解析
- 中国老年患者术后谵妄防治专家共识
- DB14T 1596-2024玉米间作花生机械化栽培技术规程
- 2025-2030坚果炒货市场发展分析及行业投资战略研究报告
- 选矿概论-6 浮选
- 温通刮痧技术操作流程图及考核标准
- 教师如何使用AI开展教学DeepSeek使用指南人工智能 课件
- 《企业竞争情报》课件
- 刑事撤案申请书
- 排水证授权委托书范本
- 《矿山隐蔽致灾因素普查规范》解读培训
- 2024年考研英语一阅读理解80篇试题及答案
评论
0/150
提交评论