版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章计量®济学的性质与经济数据
1.1复习笔记
一、计量经济学
由于计量经济学主要考虑在搜集和分析非实验经济数据时的固有问题,计量经济学已从数理统计分离出来并
演化成一门独立学科.
1.非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。非实验数据有
时被称为观测数据或回顾数据,以强调研究者只是被动的数据搜集者这一事实。
2.实验数据通常是在实验环境中获得的,但在社会科学中要得到这些实验数据则困难得多。
二、经验经济分析的步骤
经验分析就是利用数据来检验某个理论或估计某种关系.
1.对所关心问题的详细阐述
在某些情形下,特别是涉及到对经济理论的检验时,就要构造一个规范的经济模型。经济模型总是由描述各
种关系的数理方程构成.
2.经济模型变成计量模型
先了解一下计量模型和经济模型有何关系.与经济分析不同,在进行计量经济分析之前,必须明确函数的形
式。
通过设定一个特定的计量经济模型,就解决了经济模型中内在的不确定性。
在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型构造的细节。一旦设
定了一个计量模型,所关心的各种假设便可用未知参数来表述。
3.搜集相关变量的数据
4.用计量方法来估计计量模型中的参数,并规范地检验所关心的假设
在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。
三、经济数据的结构
1.横截面数据
(1)横截面数据集,就是在给定时点对个人、家庭、企业、城市、州、国家或一系列其他单位采集的样本
所构成的数据集。有时,所有单位的数据并非完全对应于同一时间段.在一个纯粹的横截而分析中,应该忽略数
据搜集中细小的时间差别。
(2)横截面数据的重要特征
①假定它们是从样本背后的总体中通过随机抽样而得到的。
当抽取的样本(特别是地理上的样本)相对总体而言太大时,可能会导致另•种偏高随机抽样的情况.这种
情形中潜在的问题是,总体不够大,所以不能合理地假定观测值是独立抽取的.
②数据排序不影响计量分析这一事实,是由随机抽样而得到横截面数据集的一个重要特征.
2.时间序列数据
(1)时间序列数据集,是由对一个或几个变量不同时间的观测值所构成.与横截面数据的排序不同,时间
序列对观测值按时间先后排序,这也传递了潜在的瓯要信息.
(2)时间序列数据的特征
①很少(即使能够)假设经济数据的观测独立于时间,使得对它的分析比对横截面数据的分析更为困难。
②数据搜集时的数据频率,最常见的频率是每天、每周、每月、每个季度和每年。
3.混合横截面数据
有些数据既有横截而数据的特点,又有时间序列的特点.为了扩大样本容量,可以将数据合并成一个混合横
截而数据。
对混介横截面数据的分析与对标准横截面数据的分析十分相似,不同之处在于,前者通常要对变量在不同时
间的长期差异做出解释。实际上,除了能扩大样本容量之外,混合横截面分析通常是为了看出一个基本关系如何
随时间而变化.
4.面板或纵列数据
(1)面板数据(或纵列数据)集,是由数据集中每个横截面单位的一个时间序列组成。
(2)面板数据与横截面数据的比较
①面板数据有别于混合横截面数据的关键特征是,同一横截面数据的数据单位都被跟踪了一段特定的时期。
②由于面板数据要求同一单位不同时期的重复观测,所以要得到面板数据(特别是那些个人、家庭和企业的
数据),比得到混合横截而数据更加困难.
③对同一观测单位观测一段时间,应该比横截而数据甚至混合横截面数据更有优越性。对同一单位的多次观
测,能控制个人、企业等观测单位的某些观测不到的特征.
④面板数据的第二个优点是,它通常能够研究决策行为或结果中滞后的重要性.由于预期许多经济政策在一
段时间之后才产生影响,所以面板数据所反映的信息就更有意义.
四、计量经济分析中的因果关系和其他条件不变的概念
1.因果关系
在多数对经济理论的检验中,经济学家的目标就是要推定一个变量对另一个变量具有因果效应。虽然简单地
发现两个或多个变量之间有某种联系很诱人,但除非能得到某种因果关系,否则这种联系很难令人信服.
2.其他条件不变
“其他(相关)因素保持不变”的概念在因果分析中有重要作用.在研究两个变量之间的关系时,所有其他的
相关因素都必须固定不变。因为社会科学中所搜集到的多数数据都具有非实验特征,所以发现其中的因果关系极
具挑战性.
1.2课后习题详解
一、习题
1.假设你所在的大学要求你“找出每周学习小时数(study)和每周工作小时数(work)之间的关系”。把这
个问题说成“推断study是否,导致Mork或work是否得致'stud/的问题是否讲得通?请解释.
答:把这个问题描述为因果关系是无意义的。经济学家会假设学生理性的选择学习时间和工作时间(以及其
他活动,如上课、娱乐和休息)的组合,使得他们在每周总共168小时的时间约束下获得最大的效用.可以使用
统计方法如回归分析方法去衡量学习和工作时间之间的关系,但是不能判断哪一个变量“导致”另一个变量。他
们同属于学生选择的变量之一。
2.假设让你进行一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
(i)如果你能设定你想做的任何实验,你想做些什么?请具体说明。
(ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据.你能得到他们四年级班级规模和四
年级末的标准化考试分数。你为什么预计班级规模与考试成绩存在负相关关系?
(iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释.
答:(i)假定能够魁机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如能力和家庭背景等特
征的前提下,每个学生被随机的分配到不同的班级.因此可以看到班级规模(在伦理考量和资源约束条件下的主
体)的显著差异.
(ii)负相关关系意味着更大的班级规模与更差的考试成绩是有宜接联系的,因此可以发现班级规模越大,
导致考试成绩越差。
通过数据可知,两者之间的负相关关系还有其他的原因。例如,富裕家庭的孩子在学校可能更多的加入小班,
而且他们的成绩优于平均水平.
另外一个可能性是:学校的原则是将成绩较好的学生分配到小班。或者部分父母可能坚持让自己的孩子进入
更小的班级,而同样这些父母也更多的参与子女的教育。
(iii)鉴于潜在的其他混杂因素(如ii所列举),负相关关系并不一定意味着较小的班级规模会导致更好的
成绩.控制混杂因素的方法是必要的,而这正是多重回归分析的主题.
3.工作培训项目的理由之一是能提高工人的生产力。假设要求你评估更多的工作培训是否使工人更有生产
力。不过,你没有工人的个人数据,而是有俄亥俄州制造企业的数据。具体而言,对每个企业,你都有人均工作
培训小时数(training)和单位工时生产的合格产品数(output)方面的信息。
(i)仔细陈述这个政策问题背后其他情况不变的思维试验.
(ii)一个企业培训其员工的决策看起来有可能独立于工人特征吗?工人可观测与不可观测的特征各有哪
些?
(iii)除工人特征之外,再列出一个影响工人生产力的因素。
(iv)你若发现training和output之间有正相关关系,你令人信服地证明了工作培训能提高工人的生产力了
吗?请解释。
答:(i)其他情况不变的思维在本题可以假设两个厂商A、B,厂商A除了对每个工人提供比厂商B更多的
职业培训外,其他条件与厂商B都是相同的,由此可以得出厂商A的产出与厂商B的产出的不同。
(ii)一个企业培训其员工的决策看起来依赖于工人特征。
可观测的特征包括:工作年限、学历、专业工作经验,甚至包括年龄、性别和种族。
不可观测的特征包括:企业可能根据能力高低来为员工提供培训,但是“能力”是难以量化的,经理只能根
据不同员工能力相关的方面来作出判断。另外,不同类型的员工可能被更高的平均培训时间所吸引,这对雇主而
言是不明显的。
(iii)工人可获得的资本和技术的数量也影响产出。如果两个企业采用不同的资本或技术,即使他们拥有相
同类型的员工,他们的产出也将会不同。经理的质量同样也是影响产出的因素之一。
(iv)并没有,除非培训量是随机分配的。即使培训不能促进工人的生产率提高,ii和iii所列的因素也能导
致培训和产出之间呈现正相关关系。
第1篇横截面数据的回归分析
第2章简单回归模型
2.1复习笔记
一、简单回归模型的定义
1.双变最线性回归模型
一个简单的方程是:
y=A+即+u
假定方程在所关注的总体中成立,它便定义了一个简单线性回归模型。因为它把两个变最*和y联系起来,
所以乂把它称为两变成或者双变成线性回归模型.
2.回归术语
表2-1简电回归的术语
yX
因变量自变量
被解料变量解释变量
响应变量控制变量
被预测变量预测变量
回归子回归元
3.零条件均值假定
(1)零条件均值
”的平均值与x值无关。可以把它写作:
E(wIx)=£(«)
当方程成立时,就说"的均值独立于X。
(2)零条件均值假定的意义
①零条件均值假定给出四的另一种非常有用的解释。以x为条件取期望值,并利用E(“lx)=O,便得到:
E(ylx)=4>+4x。方程表明,总体回归函数(PRF)E(ylx)是x的一个线性函数,线性意味着x变化一个单位,
将使y的期望值改变四。对任何给定的K值,y的分布都以E(ylx)为中心.4就是斜率参数。
②给定零条件均值假定E(ulx)=O,把方程中的y看成两个部分是比较有用的。一部分是表示E(ylx)的
4+?/,被称为y的系统部分,即由上解释的那一部分,另一个部分是被称为非系统部分的",即不能由x解释
的那一部分.
二、普通最小二乘法的推导
1.最小二乘估计值
从总体中找一个样本。令{&,%):i=l,•“,”}表示从总体中抽取的一个容量为”的随机样本.
%=4+4%+«.
在总体中,"与*不相关。因此
E(")=0和cov(x,«)=£(x,u)=0
用可观测变量*和y以及未知参数4和4表示为:
E(y-4-知)=0
E[x(y-&-/V)]=。
得到
法卜,_凡_跄)=0
和
,£毛(%-腐-配)=0
nt.i
这两个方程可用来解出A和自,Q=则以,=歹-和f.
一旦得到斜率估计值丸,则有
彳心-(>一厢)-西卜0
整理后便得到
%(%-y)=&£七u-X)
i=1|>1
根据求和运算的基本性质,有
次能-可=£&-可
/(%-,=£(%-云)(》-司
IH
因此,只要有
£&-x)1>0
估计的斜率就为
姐-积%7)
R广口---------
£(怎-工)2
(»|
所给出的估计值称为用和片的普通最小二乘(OLS)估计值。
2.普通最小二乘估计的合理性
已知力第i次观测的残差是》的实际值与其拟价值之差:
选择凡和A最小化残差平方和:
L^=Z(y1-A-M)
,・l3
“普通最小二乘法''之所以得名,就是因为这些估计值最小化了残差平方和。
一旦确定了OLS截距和斜率估计值,就能够建立OLS回归线:
§=RQ+RIX
方程又被称为样本回归函数(SRF),因为它是总体回归函数E(>lx)=4+/V的一个样本估计。总体回归函
数是固定而又未知的.因为样本回归函数来自一组给定的数据样本,所以一个新的样本将使得方程中产生不同的
斜率和截距.
三、OLS的操作技巧
1.拟合值和残差
假定从给定数据样本中得到截距和斜率的估计值,。和小给定A和A,能够获得每次观测的拟合粉。根
据定义,yt的每个拟合值都在OLS回归线上。
与新次观测相联系的OLS残差可是%与其拟合值之差。若可为正,则回归线低估了入;若可为负,则回
归线高估了小。第i次观测最理想的情况是可=0,但在大部分情形中,并非每个残差都等于零。换言之,实际
上没有一个数据点必须在OLS线上。
2.OLS统计量的代数性质
(1)OLS残差和及其样本均值都为零。数学表述为:
E«.=°
f=l
(2)回归元和OLS残差的样本桃方差为零。
£玳=。
i=1
(3)点("刃总在OLS回归线上。
3,定义总平方和(SST)、解释平方和(SSE)和残差平方和(SSR)
SST=S(y,-y)2
r=1
SSE=-
i=l
SSR=.;
1=1
SST度量了y,中的总样本变异;这就是说,它度量了X在样本中的分散程度。SSE度量了%的样本变异,SSR
度量了%的样本变异。),的总变异总能表示成解释了的变异和未解释的变异SSR之和。因此,
SST=SSE+SSR
不能把残差平方称为“误差平方和“,因为误差和残差是不同的两个量。
4.拟合优度
拟合优度&2,有时又称为判定系数,被定义为
R2«SSE/SST=1-SSR/SST
正是解释变异与总变异之比,因此被解释成y的样本变异中被X解释的部分。因为SSE不可能大于SST,所
以R2的值总介于。和1之间。
回归方程中的川过低是很正常的,对于横截面分析来说,一个看似很低的W值,并不意味着OLS回归方
程没有用。
四、度量单位和函数形式
1.改变度量单位对OLS统计我的影响
(1)当因变量的度景单位改变时,很容易计算出截距和斜率估计值的变化。若因变量乘以一个常数c(意
味着样本中的每个数据都乘以c),则OLS截距和斜率的估计值都扩大为原来的c倍。
(2)若自变量被除以或乘以一个非零常数c,则OLS斜率系数也会分别被乘以或者除以c。
(3)仅改变自变量的度量单位,不会影响截距估计值。
(4)模型的拟合优度不依赖于变量的度量单位。利用&2的定义可知,*事实上不因),或*的单位变化而改
变。
2.在简单回归中加入非线性因素
一个给出百分比影响(近似)为常数的模型是:
\ogx=/il+/ily+u
特别地,若Au=O,则
%Ag(100/jAy
自然对数的另一个应用,是得到一个常弹性模型:
logx=/?0+/7,logy+M
定义因变量为y=logy,自变M为x=log*,这个模型就变成了简单回归模型。
3.对数函数的几种形式
表2-2含对数的函数形式总览
模型因变邕自变量对侬]解释
水平值一水平值XX
水平值一对数yiog(*)
对数一水平值l°g(7)x%Ay=(100A)Ax
对数一对数logCx)叫⑺
一般性模型同样允许非线性关系的存在.关键是,方程中的参数片和四是线性的,至于被解释变量和解释
变量有何联系,并没有限制。
五、OLS估计量的期望值和方差
1.OLS的无偏性
(1)相关假定
假定SLR.1(线性于参数)
在总体模型中,因变量y与自变量x和误差(干扰)"的关系如下:
y=Pa+P\x+u
其中,儿和儿分别表示总体的截距和斜率参数。
假定SLR.2(随机抽样)
具有一个服从总体模型方程的随机样本{&,%):i=1,2,-,n},其样本容量为n。
假定SLR.3(解释变量的样本有变异)
x的样本结果即{4,1=1,…,n]不是完全相同的数值。
假定SLR.4(零条件均值)
给定解释变量的任何值,误差的期望值都为零,E(Ulx)=O.
(2)自与4的差异
斜率估计量为
£(芍-加
。'=弋-----
可转换为
.力(—)%.„
P\=Px+----P\+E44
其中,4=占-7。可以看到,区的估计量等于总体斜率4加上误差{%,/,…,4}的一个线性组合。以X
的值为条件,原的随机性完全来自于样本中的误差。这些误差一般都不为零的事实,正是"与四有差异的原因。
(3)定理2.1:OLS的无偏性
利用假定SLR.1〜SLR.4,对儿和4的任何值,都有
E(A)=A>,E㈣=A
换言之,A对色、4对儿而言是无偏的。
(4)证明OLS的无偏性
E俱)"+E(应燧为=川+岛序(4必)
=4+(序冏")=4+岛序,。=仪
根据假定SLR.2和SLR.4有E(i7)=0,于是以看的值为条件,有
E00)=A+E[(A-丽+E(«)=A+E[(A-A)S]
Eg=1,这就意味着E[佃-4)]=0。
因此,E(A)=40
2.OLS估计后的方差
(1)相关假定
假定SLR.5(同方差性)
给定解释变量的任何值,误差都具有相同的方差,Var(ulx)=a\
(2)定理2.2:OLS估计量的抽样方差
在假定SLR.1〜SLR.5下,以样本值{不如…,三}为条件,有
Var伍)==£_-=^jr
<-l
Var(A)=
/aI
(3)证明
因为四只是一个常数,而且以为为条件,所以SST,和4=x,-x也是非陋机的.而且,“,在i上(根据旭机
抽样)是独立的随机变量,故和的方差就是方差的和。,以:
3.误差方差的估计
(1)误差与残差的区分
利用随机样本观测把总体模型写成y,=4+4X,+“j其中“,是第i次观测的误差。还可以将其用其拟合值和
残差表示出来:%=编+立玉+自。比较这两个方程,可以看出,误差出现在包含总体参数为和片的方程中。另
一方面,残差则出现在使用凡和«的估计方程中。误差是无法观测的,但残差却可以从数据中计算出来。
把残差写成误差的函数:
Z-Ps-PlXl=(Po+Pixi+ui)~Po~P\Xl
或者
尽管风的期望值等于用,。的期望值也等于用,而用却不等于.。但二者之差的期望值倒确实为零。
(2)1的无偏估计量
对自由度进行调整:
(3)定理2.3:i的无偏估计
在假定SLR.1〜SLR.5下,有
E(ff2)=CT2
证明:如果把方程&=%-(A-4)_(a-4)x对所有,进行平均,并利用OLS残差均值为零的结论,便得
到0=记-体-4卜伍-月印从原方程中减去它,则得到:
«,=(%一—-一-)(玛-7)
2+2
=(«/-«)(A-A)-5)-2(u(-u)(A-^,)(x(-x)
对所有,•求和,又得到:
I?:=Z(u(-«*)2+佃-A)£(%-对一伍-A)XU'-
i=li=lT'i=l
等式右边第一项的期望值是第二项的期望值是。2,第三项的期望是2,,则有:
=+a2-2a2=(n-2)<r2
因此E[SSR/("-2)]=(T,
。的自然估计最为,
a=4^
并被称为回归标准误差(SER).尽管才不是”的无偏估计看,可能够证明它是“的一致估计成。
A的标准误为;
吨卜福一,住人叫’
六、过原点回归
规范地,选择一个斜率估计量(称之为自)和如下形式的一条线
2而
因为直线经过点x=0,y=0,所以得到的方程又被称为过原点回归。
使用普通最小二乘法,此时最小化的残差平方和为
£(一丽)'
|>|
利用一元微积分可以证明,衣必须满足一阶条件
£茗(乂-旅)=。
«*4
从而解出自为:
.右XX
A=三—
EMd
当且仅当工=0时,这两个估计值才是相同的。
2.2课后习题详解
一、习题
I.在简单线性回归模型y="0+/也+“中,假定E(“卜0。令/=£(叫,证明:这个模型总可以改写为另一
种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。
证明:在方程右边加上%=£(“),则
丫=[R+吁/
令新的误差项为0=口-%,因此£(e)=0・
新的截距项为4+用,斜率不变为4。
2.下表包含了8个学生的ACT分数和GPA(平均成绩).平均成绩以四分制计算,且保留一位小数。
studentGPAACT
12.821
23.424
33.026
43.527
53.629
63.025
72.725
83.730
(I)利用OLS估计GPA和4CT的关系;也就是说,求出如下方程中的截距和斜率估计值
GPA="+3\ACT
评价这个关系的方向.这里的截距有没有一个有用的解择?请说明.如果ACT分数提高5分,预期GE4会
提高多少?
(II)计算每次观测的拟合值和残差,并验证残差和(近似)为零。
(III)当ACT=20时,GR4的预测值为多少?
(IV)对这8个学生来说,GR4的变异中,有多少能由ACT解弹?试说明。
答:(I)变量的均值为:GPA=3.2125,ACT=25.875.
次(G必-GPA)(AC7;-ACT;)=5.8125
根据公式2.19可得:4=5.8125756.875=0.1022»
根据公式公17可知:/}0=3.2125-0.1022x25.875=0,5681.
因此GPA=0.5681+0.10224CT。此处截距没有一个很好的解释,因为对样本而言,ACT并不接近0。如果ACT
分数提高5分,预期GE4会提高0.1022x5=0.511。
(II)每次观测的拟合值和残差表如表2-3所示:
表2-3
iGPAGPAu
12.82.71430.0857
23.43.02090.3791
33.03.2253-0.2253
43.5332750.1725
53.63.53190.0681
63.03.1231-0.1231
72.73.1231-0.4231
83.73.63410.0659
根据表可知,残差和为9.002,忽略固有的舍入误差,残差和近似为零。
(111)当ACT=20,贝(JGPA=0.5681+0.1022x20=2.61。
(IV)残差平方和为:%:=0.4347,而力卜,-4=1.0288,则判定系数为:
/?2=1-SSR/SST=1-0.4377/1.0288«0.577
GPA的变异中,有57.7%能由ACT解释。
3.令表示一名妇女生过的孩子数目,ed“c表示该妇女接受过教育的年数。生育率对受教育年数的简单
回归模型为
kids=!\educ+u
其中,"是无法观测到的误差。
([)«中包含什么样的因素?它们可能与受教育程度相关吗?
(II)简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
答:(I)收入、年龄和家庭背景(如兄弟姐妹的数量)都可能包含在误差项中.它们可能是与受教育程度
相关的:收入和受教育程度是呈正相关的;年龄与受教育程度是呈负相关的:兄弟姐妹的数章与受教育程度是负
相关的。
(II)假定(I)中所列举的因素固定不变,即以误差项的形式呈现在回归方程中,但是误差项与解释变鼠
是相关的,因此E("[educ)wO,经典假定被推翻,因此简单回归分析不能解释教育对生育率在其他条件不变下的
影响.
4.假设你对估计花在SAT备考课程上的小时数(加g)对SAT总分(sar)的影响感兴趣。
总体是某一年内所有计划上大学的中学高年级学生.
(I)假设你有权进行一项控制实验。请说明为了估计也s对s。的引致效应,你将如何构建实验。
(II)考虑一个更加实际的情形,即由学生选择在备考课程上花多少时间,而你只能随机地从总体中抽出s”
和垢ws的样本。将总体模型写作如下形式:
sat=凤+(i,hours+u
其中,与通常带截距的模型一样,我们可以假设E(")=0。列举出至少两个"中包含的因素。这些因素与痴rs
可能呈正相关还是负相关?
(山)在(II)的方程中,如果备考课程有效,那么片的符号应该是什么?
(IV)在(H)的方程中,为该如何解释?
答:(1)构建实验时,首先随机分配准备课程的小时数,以保证准备课程的时间与其他影响SAT的因素是
独立的。然后收集实验中每个学生SAT的数据,建立样本{“叫,6"):i=l,•••,“},”表示试验中所包括的学
生的数量。根据方程2.7,应该尝试采用尽可能多的有差异的“小时数”。
(II)误差项还可能包含以下三个因素:天赋能力、家庭收入以及考试当天的健康状况。如果学生拥有天赋
能力,那么他们不需要为考试花费太多时间,能力与时间是负相关的。家庭收入与学习时间呈正相关关系,因为
家庭收入越高,就能负担去越多的课时费用。排除慢性的健康问题,考试当天的健康状况与为准备考试花费的时
间是无关的。
(III)如果备考课程有效,儿的符号应该为正,在其他因素相同的情况下,备考时间越多,越高.
(IV)截距有一个有用的解释:因为E(U)=O,4表示备考时间为0时学生获得的平均sar总分。
5.考虑储蓄函数
sav=凤+与nc+u,u=4inc-e
其中,e是一个随机变量,且有E(e)=O和Var(e)=b:,假设e独立于加c。
(1)证明:若E("linc)=O,则满足零条件均值的关犍假设(假定SLR.4)。偎示:若e独立于山,则
E(uIme)=E(e)]
(II)证明:若Var(uli"c)=b;加c,则不满足同方差假定SLR5。特别地,sav的方差随着加c而增加.[提
示:若e和inc独立,则Var®加c)=Var(e)。]
(IU)讨论支持储蓄方差随着家庭收入递增的证据。
证明:(I)计算而■的条件期望值时,后?变为一个常数,因此E(ulinc)=E(而加c)=>/i£E(e[讥c)=0.
(II)i/ic的方差为:Var(ul加c)=Var(>/^・e:加Var(e|加c)=inc-rr;.
(Ill)低收入家庭支出的灵活性较低,因为低收入家庭必须首先支付衣食住行等必需品。而高收入家庭具有
较高的灵活性,部分选择更多的消费,而另一部分家庭选择更多的储蓄.这种较高的灵活性暗示高收入家庭中储
蓄的变动幅度更大.
6.令/0和«分别为OLS截距和斜率估计量,并令;;为误差(不是残差)的样本均值。
(I)证明:k可写成W=“,其中叫=d,/s订和4=x,-x.
,T
(H)利用(I)及£叱=0,证明:自和i无关.[提示,要求你证明E仅-%)£=0]
-I
(ID)证明瓦可写成A=A+1伍-4)。
(IV)利用(H)和(III)证明:Var(向)="2/n+,G)2/SSl;.
22
(V)(IV)中的表达式能简化成方程(2.58)吗?[提示:SSTJ/n=n'i.r,-(x).]
1=1
证明:(I)该理论推导与公式2.52的推导本质上是一样的,区别只是将吗=d,/SST;带到求和的里面。
(II)因为cov(4=公式右边等于0。从(1)可知,
~P\~^[^-iwtu1]=^-i"因为误差项两两互不相关,则E(u,u.)=0,iw/i,
E(%力)=E(u]/〃)=,/〃。因此Zliw』E(M)=E3==0。
(山)最小二乘估计的截距公式为:盘=歹-而,代入》=4+4工+心则
A=(用+监+*-丽=A+«-(A-A)XO
(IV)因为冗和£是不相关的,则有:
Var(4))=Var(H)+Var(4)x2=(T2/n+(ff2/SST)x2=(T2/n+/产/SST
(V)能。
根据SST/n=/5>,2-(T『,贝I]
之1
Var阔=,[(SS1;/")+铲]/SST,
=叫(犷£片-针)+刃/SST,=/)/SS「
7.利用KielandMcClain(1995)有关1988年马萨诸塞州安第沃市的房屋出售数据,如下方程给出了房屋
价格(price)和距离一个新修垃圾焚化炉的距离(dist)之间的关系:
log(price)=9.40+0.312log(dist)
n=135,/?2=0.162
<1)解释iog(&M的系数。它的符号是你所预期的吗?
<11)你认为简单回归给出了对由w在其他条件不变下弹性的无偏估计量吗?(考虑•个城市决定放
置焚化炉的地点的决策。)
(III)还有哪些其他因素影响房屋的售价?这些因素会与距离焚化炉的远近相关吗?
答:(I)符号为正,与预期相符。log(小sr)的系数表示距离焚化炉的距离越远,价格就越高,价格的距离
弹性是0.312,即距离远1%,价格上升0.312%。
(n)如果城市决定将焚化炉放置在远离较贵的居民区的地方,则iog(d,M与房价是正相关的。这将违背假
定4,而OLS估计是有偏的.
(1U)房屋的面积、洗手间的数成、占地面积大小、房龄社区质仅(包括学校殖量)都会影响房屋的售价。
这些与距离焚化炉的远近是有关的。
8.(I)令凡和九为y对七进行回归的截距和斜率(有n次观测):。和「2为常数且c/0:儿和A为
对c?Xj进行回归的截距和斜率。证明«=匕/6)&且力,=0%),从而验证了2.4节中关于度破单位的命题“提示:
为得到自,把改变了度量单位的X和y代入方程(2.19)。然后用方程(2.17)求瓦,确定代入的是进行度量单
位变换后的x和y以及正确的斜率。
(H)现在令&和自得自(q+y,)对(G+玉)的回归(对£和q不加任何限制)。
证明:«=衣且/O=A+G-C/]。
(III)令凡和4为log(y)对先回归的OLS估计值,其中我们必须假定对所有3都有%>0。对G>0,令
A和自为log(qy)对、回归的截距和斜率.证明:自=4且A=iog(q)+A。
(IV)现在假定对所有i,都有工>0。令A和«为角对log(c/J回归的截距和斜率。。和«与此对log&)
回归的截距和斜率相比如何?
答:(I)因为不=c»,不=中,当为qy,对02可进行回归时,可以通过方程2.19得到方程的斜率:
次(。居-⑶-可(y-刃
A=----------------------=-------------------
£(讣-*)^CJ(AJ-X)2
I
cEU-5)(yi-y),
-------=斗、
J力a-尹Q
1=1
根据公式2.17可得截距项为:
A=(c»)-月(中)=(C»)-[(CJC2)6](常)=03-效)=4伍)
(II)使用与(1)相同的方法,可得(不仃)=q+y,(/)=G+f・因此
(t,i+^)-(ci+y)=(ci+x)-(ci+>)=z->?»(c2+x/)-(c2+x)=^-10在"+y)对(Cz+G的回归中,
q和q被完全排除在斜率公式以外,以及
截距为:A)=(G+y)-/"c2+x)=(q+刃一6&+7)=(歹一aj+q-c/i=a+c,-c/1。
(III)因为108(5%)=108((:1)+咋(%),令q代替log(cj,其代替log(%),且。2=。,然后采用与(II)相
同的方法。
(IV)采用与(II)相同的方法,设q=0,q替代log(G),玉替代log(xj,如果凡和凡是原截距和斜率,
那么此时的截距和斜率为:储=和8、=6.
9.在线性消费函数caw=A+A读中,收入的(估计)边际消费倾向(MFC)无非就是斜率A,而平均消
费倾向(APC)为cwW加°=仅"比+".利用对100个家庭的年收入和消费观测(均以美元计),便得到如下方
程:
cons=-124.84+0.853/nc
n=\OQ,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2022年湖南省娄底市冷水江三尖中学高一数学文联考试卷含解析
- 辽宁省鞍山市第三十七中学高一数学文知识点试题含解析
- 广东省惠州市马安中学高一数学文下学期摸底试题含解析
- 2022年江苏省连云港市中学高一数学文测试题含解析
- 四川省泸州市兴文县五星中学2022年高一数学文下学期摸底试题含解析
- 山西省晋中市左权县拐儿中学高一数学文上学期摸底试题含解析
- 正规租房合同12篇 20XX版租房合同范本
- 2022-2023学年湖南省怀化市辰溪县实验中学高一数学文模拟试题含解析
- 河南省周口市西城中学2022-2023学年高一数学文期末试卷含解析
- 辽宁省大连市瓦房店第四初级中学高一英语知识点试题含解析
- 2024年贵州银行股份有限公司招聘笔试冲刺题(带答案解析)
- 2024年广州民航职业技术学院单招职业适应性测试题库及答案解析
- 全国职业院校教师教学能力比赛模板-蓝色优雅
- 英语-衡水名师卷2024届高考模拟压轴卷(二)试题和答案
- 地理会考辅导重点知识复习省公开课一等奖全国示范课微课金奖课件
- 纯电动汽车整车控制策略研究及基于Simulink的建模仿真
- 2024小学道德与法治(部编版)六年级下册 第一单元复习课件
- 2024年“312”新高考志愿填报指南
- 2022-2023学年高教版(2021)中职数学基础模块下册-指数函数与对数函数-单元测试卷
- 2023-2024学年北京市清华附中中考数学最后一模试卷含解析
- 浅析当前特警建设及其发展方向.doc
评论
0/150
提交评论