




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Chapter2 现代观点下计量经济的 基本理念和理论基础§1 问题的提出1、 从数据谈起模型、数据哪个是第一位的?传统观点是模型第一位,现代观点认为数据是第一位的。我们不应当假设数据满足模型的条件,而应当要求模型适应数据的特点,这是现代观点下计量经济的出发点。a.如果手头有一些数据,它能告诉你什么?什么也没有!因为我们不知道数据来源背景,从而不知道数据所表达的含义。b.如果该数据是某人历次考试成绩的记录,它能告诉你什么?可以认为,X是某人的学习能力,称为总体(population),是学习能力的反映,它是取自总体X中的样本,可建立模型:,a是真值,是客观存在的能力,但不可观测。于是
2、,就反映了该学生的学习能力水平,就反映了该生学习能力的稳定性。等等。c.但是,如果该数据是某企业的股票价格,那么就没有理由认为是相互独立的,而是一个与时间有关联的序列,那么就有可能不再有一个稳定的极限,例如,随机游走。则,从而显得不可预测,这样的数据可以认为是没有用的,但在现在的随机过程理论和计算机技术下,我们仍能从中捕捉到“股票价值”X的某些信息。这里,我们看到,经济中数据的来源是非常复杂的,有的可以看成是服从某一分布的随机变量,有的则是某一特定的随机过程,甚至是不平稳过程。d、对于有相互关联的多组数据,同样我们首先要知道数据的来源,知道有关的知识,这一点与传统观点是一致的。但传统观点的局限
3、是,解释变量是确定性的,与误差项无关。而这种要求的数据一般只在实验室中才能做到,大量经济数据一般事前无法安排,并且解释变量之间也存在关联性,解释变量与误差项之间也有关联性,另外,数据是不可重复的。为此,现实经济要求我们把对数据的要求放宽。我们做如下的陈述:假设:(1)我们关注的结果Y是一个随机变量(视为一个总体)。(2)我们认为影响结果Y的原因是一个K维随机变量,。(3)的联合分布存在,且存在期望和方差。(4)可以从随机抽取观测样本(random sampling),或抽取受各种限制的观测样本。提出的问题是,如果能从获取观测样本(信息),如何调整对的认识?即如何用来表达?注:(1)的联合分布、
4、期望、方差存在,并不意味着已知。(2)的因果关系中,X的分量对Y的影响既有轻重之分,又有可观测和不可观测之分,甚至有半不可观测,即Y与X的因果关系可以按理论更加随意的设定。例如,我们关注的是工资与教育的关系,但是影响工资的因素除了教育之外,根据劳动经济学的知识,还有工作经验和能力。其中,工作经验可用工作年限表示,又由于工作经验有正外部性,故可设计工作经验的平方作为另一个解释变量,而能力则是不可观测,如chapter1的例1,但仍可以放在因果关系中,不过需要有特殊的处理。(3)因果关系不一定是线性关系,从平均意义或期望意义上讲,我们要关注的是条件期望,的直观含义是如果知道X,平均意义上看Y是什么
5、?它包含比从全体平均意义上看Y是什么即有更多的信息。并且希望能把表达出来,建立一个模型,称为总体模型(population model)。(4)随机抽取样本的最基本形式是截面数据(cross section data),含义是给定一个固定的时间点或是时间段上,解释变量与因变量的数据是从母体中随机发生的,而是实验数据(experimental data)的含义是实验者预先设定解释变量的实验值,然后观测因变量的结果值,传统观点下的样本设定为实验数据,与实验数据是分开的,指的是一切其他环境对结果的随机影响。(5)随即样本的另外几种形式:Pooled cross section data 在不同时间点
6、样本独立,但不同分布(混同样本)。Spatial correlation 在不同地区样本有相关性,不独立(空间相关性)。Cluster sample 串样本,时间数据有分段特征(群集数据)。Panel data 面板数据,数据有二元特征,特别是有时间特征,但时间不太长,有限。这些特殊样本的处理,特别是面板数据我们在后面的模型中专门分析、介绍。§2 有关理论下面着手建立解决上述问题的一套基本理论。假设是客观存在,但是未知或者部分未知,那么获取数据资料以后,从获取的数据和中就应当反映这种客观存在的关系,。进一步,如果的函数关系也不清楚,那么找一个什么样的函数关系是合理的?合理性的准确含义
7、又是什么?着手解决两个问题:1、合理性按均方误差标准,即选择g(X)使得其与Y的误差平方最小,简记成MSE(mean square error)。2、如果用线性关系,具备什么条件才能使满足条件1的,即使与等价。我们有如下的基本定理:定理1:用条件期望来表达Y,则MSE最小,即:, arg表示满足最小值条件的g(X)。首先复习一下条件期望的概念及性质:关于条件概率,我们知道,。此意味着存在一概率空间,且。其实质是将改变成,以及把事件的概率调整为在中的比例。现在如果让A遍历整个,这就在上定义了一个新的概率。它是由和导出的概率。并可认为构成一个新的概率空间。这是在事件发生的条件下获得的对原概率的调整
8、。直观讲就是取代了的地位。设是上的一个随机变量,那么,数学期望。这是一个在上的加权平均。现在把放到上看,那么应有,条件数学期望。这是一个在事件上的加权平均。再设、是上的二个随机变量,联合分布存在。,为要使,取,则。再令,如果极限存在,那么,这是一个与有关的数。有结论是,除去一个零概率集,极限是存在有限的。因为零概率集上可测函数的积分总是0,故我们可以在这个零概率集上重新定义它的值,例如取值为0, 那么,对,有定义。这是一个与随机变量取值有关的函数。因为是随机取值的,所以当不确定取值的时候,它就是一个与X有关的随机变量。记成。称为Y关于X的条件数学期望。注,给定事件下的条件期望是一个数,而随机变
9、量Y关于随机变量X的条件数学期望是一个随机变量。具体计算就是,如果,则:。条件期望有性质如下:设随机变量(X,Y)有联合分布和联合分布密度,不妨设。则X的边际分布密度;Y的边际分布密度。那么给定X的条件下,Y的条件分布密度是,给定X的条件下,Y的条件数学期望是。性质1:,直观含义是分段平均再平均等于直接平均。又由定义,做变量代换,则:性质2:。的直观含义更明显,已经知道的信息,那么的平均就是它自己。即知道,那么。它是常数的期望等于常数的直接推广。有了上述准备,我们证明定理1:设,那么,注意到,。所以取,最小。定理得证。注:这个定理很重要,它奠定了条件期望在均方误标准下的最优地位,问题当Y与X的
10、联合分布很复杂,甚至不知时,E(Y|X)实质上仍然是不清楚的。例:随机参数过程:设,其中与X独立,且,则,。注:我们也可以将模型看成,但是,于是就与相关,如果有其他的解释变量与相关,内生性就产生了。且条件方差也与X相关。大量的计量经济模型都是由于环境既影响结果又影响原因,从而内生性和条件异方差性往往是不可避免的,这正是现代观点要处理的问题,传统观点假定X与无关的要求不符合实际。一般情况下,仍很复杂,甚至是未知的,所以,尽管我们知道在均方误标准下表达是最优的,但是我们需要一种方法,用其他的合理方式来取代,取代的方式取决于不同的目的,这就是问题(2)。如果目的是预测、是趋势、可采用非参数估计方法,
11、这超出本书的范围,请参阅相关非参数估计的书。如果目的是政策评价,验证理论是否正确,一般采用参数估计方法,参数估计方法的理论基础就是线性投影。设X是影响Y的一切原因集,是一个k+1维的参数空间,是未知的。是取自X中的k+1维向量,并且线性无关。例如定义:AF注:我们只要求g(X)关于是线性的,对X不做任何要求,A的直观含义是从母体X中提取部分外加常数构成k+1维向量X,把X与做内积,构成的线性函数集A,于是我们可以把求的问题转化为求未知参数向量的问题,即:当然,A中的函数要比中F的少,但是限制在A中,却使问题变得可以求解了。定理2:若且存在非奇异,那么中A的最小二乘解。证明:由一阶条件得:。由非
12、奇异, (施瓦茨不等式)故,所以 。注:一般。这是非线性回归模型要解决的问题。下面考虑设定(specification), 。称为的(关于线性)模型,其中为回归误差。定理3:设定则当且仅当垂直条件成立,有成立。证明:必要性:如果,那么由;充分性:如果那么,。注:1)特别取2)这里没有考虑,仅是说明当Y写成的线性投影形式时,当时,要满足的条件,它比=0要弱。下面解决的问题是,把Y写成与把Y写成在什么条件下是一致的,这个条件也就是现代观点下的多元线性回归模型的前提假定。定义:线性回归模型称为正确设定的(correct model specification)如果存在某一,使得从母体X选取个向量有否
13、则,如果对所有的,则称线性回归模型不是正确设定的。定理4:线性模型是正确设定的,那么:1) 存在某一,使得;2) ;3) 。证明:由定义,由定理1的性质知, (1)成立再由定理3,(2)(3)成立。注:1)由,故当模型是正确设定时,参数的经济含义是边际效果,(,i=1,2,),否则的含义是误导的。2)。此时,若采用最小二乘法估计,参数会产生有偏、不一致的后果。这正是本课程要重点解决的问题。 接下来的问题是,在正确设定下,知真值。 如何获得?通过样本,利用大数律,保证一致性。§3大样本下渐近理论基础现代回归模型的估计和检验由于样本N不再固定,更注重一致性,基本原则是保证一致性成立,现代
14、回归模型的估计和检验由于样本N不固定,更注重一致性。基本原则是,保证一致性成立,降低有偏性,提高有效性。从而,样本的极限理论具有基本的重要性。1、收敛的概念:a) 序列收敛,记为b) 随机变量序列依概率收敛,c) 随机变量序列依分布收敛,d) 连续映照定理(Slutskys Theory),向量序列,连续,则,即。2、随机样本的极限定理定理1 :设是一列独立同分布的维随机向量序列,且,那么,其中,此称为向量序列的弱大数定律。定理2:是一列独立同分布维随机向量序列,且, ,那么是一半正定矩阵。此称为向量序列的中心极限定理。在定理1、2的基础上,我们定义一致性:定义1:(一致性)是一个P×
15、;1维的样本函数的序列,N是样本容量,如果,对任意的成立,则称的一致估计,其中是未知参数空间的定义域。定义2:是一个P×1维的样本函数的序列,如果,其中V是半正定阵,则称是渐近正态的,且V是的渐近方差,记作。因此,故也称的渐近方差为,记成。一般而言, 协差阵V未知,我们有许多关于V的一致估计,因此的渐近方差估计就是,记成。注:因为0,(N),所以0,故当N充分大,无意义。我们说是的渐近方差估计,意义是指的渐近方差估计是,而不是,这一点很重要,不要搞乱。定义3:如果,且V正定,其主对角线元素用表示。又有,且,那么的第j个分量的渐近标准差规定为。定义4:和都是的一致估计,即,且,如果是半
16、正定矩阵,则称比是渐近有效的。又,则称和是渐近等价的。定义5 :如果,若,且相应的,有有渐近方差,有渐近方差,则称估计和是渐近独立的。关于统计检验的渐近理论有:定义6:对假设检验,如果它的备择假设为真,且,则称检验是渐近一致的。引理:线性变换下的渐近正态性:如果,V正定,又R是Q×P矩阵,QP,秩(R)=Q,则:。又,二次型,此外如果有,那么Wald统计量,即二次型: 在第一章我们看到,利用Wald统计量,我们可以得到统计量,并由此解决有线性约束的检验问题,:,:。(为保持与伍书中符号一致性,相当经典模型中的,相当于)。最后,简单介绍参数假设检验的大样本理论:设是总体中的参数向量,。
17、为已知的维列向量,为的元函数,。称为对参数的约束条件,为约束的个数。这里的函数形式已知,可以是线性的,也可以是非线性的。且在的某邻域行满秩。如果能把对参数的约束条件作为假设检验的命题:,。那么,由数理统计的知识,在大样本条件下,可采用三个渐近等价的检验统计量来完成。具体讲:设是的一致估计,由于最大似然估计()在大样本条件下满足一致性、渐近正态性和不变性,有很好的统计性质。一般常采用作为假设检验前的一致估计。我们记为不带约束条件下的一致估计,为带约束条件下的一致估计。设为似然函数,为似然函数值。我们有如下结论:(1) 沃尔德统计量(Wald) 如果不带约束条件下的一致估计易得,那么对假设检验的命
18、题:,且秩。可构造Wald统计量:。特别当约束是线性时,即,那么有。(2) 拉格朗日统计量(LM) 如果带约束条件下的一致估计易得,那么对,秩。可构造LM统计量:。其中,;,。称为信息矩阵。 (3)似然比统计量(LR)令,称为似然比,。似然比检验常在时间序列分析中用。注:当约束是线性时,有。故拒绝,则都拒绝。本章小结本章的内容承上启下,核心概念是条件数学期望,怎么强调也不过分。后面的内容都是围绕着条件期望的性质建立各种模型展开的。此外,假设检验的三个基本统计量也是后面各种假设检验的理论基础,各种检验统计量都是在它们的基础上建立的。本章的内容在后面继续学习时还要经常回头看,故把重点小结如下:1、现代观点:数据本位,模型要适应数据的要求。2、现代观点基本理念:(1)关注的目标Y是一个随机变量,它与影响它的因素X,X是一个多维随机向量,存在联合分布,并且可以随机抽样。X和Y允许受到限制,或某些因素不一定可观测,且X和Y的期望和方差均存在、有限。(2)用表达,在均方误差最小(MSE)的意义下,g*(X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 行政管理的政策构建与实施试题及答案
- 行政管理学全球视野试题及答案
- 行政管理学课程结构分析试题及答案
- 2025年自考行政管理的伦理道德建设试题及答案
- 行政管理学的政策制定过程试题及答案
- 行政管理中的文化因素试题及答案
- 共同 经营 合同范例
- 买卖土地房屋合同范例
- 现代管理学中的文化变革试题及答案
- 行政管理本科重要试题及答案揭秘
- 不良行为学生教育转化工作实施方案例文(6篇)
- 【MOOC】现代教育技术-淮阴师范学院 中国大学慕课MOOC答案
- 《山海经》读书分享班会课件
- GENE-ENGINEERING基因重组与基因工程
- 西藏自治区建筑行业劳动合同范本
- 博物馆环境卫生保洁方案
- 产品方案设计模板
- 2023年山东省济南市中考语文试卷
- 人民大2023张占录-张正峰-国土空间规划学课件第2章-国土空间规划原理
- 静脉治疗护理技术操作标准解读
- 一起干活安全协议书
评论
0/150
提交评论