双变量回归模型_第1页
双变量回归模型_第2页
双变量回归模型_第3页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、双变量回归模型一个人为的例子研究每周家庭消费支出Y 对可支配收入 X 的关系。将家庭划分为收入差不多的10 组。每周家庭收入(美元)X80100120140160180200220240260Y5565798010211012013513715060708493107115136137145152每周65749095110120140140155175家庭708094103116130144152165178消费758598108118135145157175180支出-88-113125140-160189185-115-162-191总计32546244570767875068510439

2、661211表格给出了以X 的定值为条件的Y 的条件分布。计算给定 X 的 Y 的概率,即 P(Y/X )。计算条件均值,即E(Y/X= X i )作图平均的说,随着X 的增加, Y 也在增加。条件均值落在一根有正斜率的直线上,总体回归线( population regression line), Y 对 X 的回归 。对每一个 X i 都有 Y 值的一个总体和相应的均值, 回归线是穿过了这些条件均值的线。总体回归函数( PRF )的概念图中看到,每一条件均值 E(Y/ X i )都是 X i 的一个函数,并且是线性函数。E(Y / X i )f ( X i)12 X i1 和 2 是未知但固

3、定的参数, 被分别称为截距和斜率参数。“线性”一词的含义对变量为线性非线性的例子: E (Y / Xi )12 X i2对参数为线性非线性的例子: E (Y / Xi )12 X i本课程中,只对参数是线性的。PRF 的随机设定随着家庭收入的增加,家庭消费平均的说也增加。但某一个别家庭的消费支出却不一定。个别家庭的消费支出聚集在收入为 的所有家庭的平均消费支出的周围。YiE(Y / X i )uiE(Y/X i)代表相同收入水平的所有家庭的平均消费支出,称为系统性( systematic)成分, 称为随机或非系统性 (non-systematic)成分。假定 E(Y/X i )是对 为线性的,

4、则YiE(Y / X i ) ui12 X iuiE(ui / X i )0随机干扰项的意义理论的含糊性数据的欠缺核心变量与周边变量人类行为的内在随机性糟糕的替代变量节省原则 错误的函数形式样本回归函数以上讨论局限在与值相对应的值总体现在我们考虑抽样问题样本:我们能从样本预测整个总体中对应于选定的平均每周消费支出吗?从个不同的样本会得到个不同的, 并且这些不大会是一样的。能不能设计一种规则使尽可能的“接近”样本回归函数( sample regression function, SRF)?X iYi12SRF 随机形式:?Yi12 X i ui?回 归分 析的 主要 目的 是 根 据 Yi1来

5、估计2 X i uiYi12 X iui图形Y i?YE(Y / X i )u?iu?ui?u( )普通最小二乘法?YiYiuiYi?X i12选择一个,使得残差和ui?) 尽可能小(Yi Yi?(图)但正负残差可以相互抵消最小二乘准则是要定出使得:?2? 2(YiYi )ui(Y i12 X i )2消费 -收入的例子中,估计到的结果:?24.4545 0.5091X iYi- OLS 估计量是由可观测的量( X 和 Y )表达的,因此这些量是可以计算的- 这些量是点估计量回归线的性质:它通过和的样本均值。 估计的( ?)等于实测的均值Yi 残差 u?i 的均值为零。 离差形式 残差 u?i

6、 和预测的 值不相关 残差 u?i 和 不相关最小二乘法的基本假定回归分析的目的是从 ?1 和 ?2 推断 1 和 2 需要对 的产生方式作出某些假定。经典线性回归模型()个假设:线性回归模型。回归模型对参数是线性的。在重复抽样中是固定的,即假定是非随机的。干扰项 的均值为零,即 的条件均值为零,E(ui / X i ) 0围绕均值分布,正负相抵, u 对 Y 没有影响。同方差性或 的方差相等。Var (ui / X )EuiE(ui ) / X i 2E(u 2i / X i )2Homoscedasticity and Heteroscedasticity 图(形 )方差随收入增加而增加,

7、富裕家庭的方差大,可靠性则越来越小。各个干扰项之间无自相关。cov(ui , u j / X i , X j ) EuiE(ui ) / X i u j E(u j ) / X j E(ui/ X i ) E(u j / X j )0无序列相关,正相关,负相关。 (图形)Ui 和 Xi 的协方差为零。Cov(ui , X i )0- 干扰 u 和变量 X 是不相关的- 因为如果 u 和 X 相关,就不可能评价它们各自对 Y 的影响。7. 观测次数 n 必须大于待估计的参数个数。换言之,观测次数必须大于解释变量的个数。8X 值要有变异性变量一定要变!正确的设定了回归模型- 模型应该包括哪些变量-

8、 模型的函数形式为何?(Phillips Curve model) 没有完全的多重共线性。以上假定都是关于的,而不是关于的,但 OLS?0 和估计量的一些性质和关于 PRF 的假定相类似。如 uE(u/ X) 0?) 0 ,但 SRF 不复制对ii, ui X i 0 和 Cov(ui , X iCLRM 的全部假定,如 Cov(ui ,u j )? ?Cov(ui ,u j ) 这些假定有多真实?- 假定是为了便于我们逐步开展我们的主体研究- 便于在以后的篇章里深入的分析复杂的情况。最小二乘估计量的特性:高斯-马尔可夫定理OLS 估计量 ?2 ,是2 的最优线性无偏估计量(Best Line

9、arUnbias Estimator BLUE ) 线性的,无偏的,有效的(公式,图)最小二乘估计量的精度或标准误差估计量随着样本不同而不同,用什么衡量精度?2se( ?2 )var( ?2 )22xixiX i22X i2var( ?1 )se( ?1 )n xi2n xi22 为 的方差,由以下公式计算:2?2u?in2其中 ?2 是真正的但未知的2 的估计量。为自由度。ui2 则表示残差平方和() 。2 兼代表和 的(条件)方差。?的方差与2成正比,而与2成反比2xi?的方差与2和2成正比,而与2和样本大小1X ixi成反比。?1 和?2 之间可能相互依存cov( ?1 , ?2 )X

10、var( ?2 )2X (xi2)?和?之间的协方差与 X 的符号有关,如果X 是正的,那12么协方差是负的,这时若?被过高估计,?将会被过低 估12计。的正态性假定以前假定 的期望值为零,之间不相关,方差不变。估计量 BLUE 。如果进行假设检验,必须知道 的分布,从而得知 的分布。除了以前的假定,ui NID (0,2 )NID normally and independently distributed为什么设为正态分布?- 中心极限定理为 的正态性假定提供了理论依据- 即使变量个数并不是很多或这些变量不是严格的独立分布,它们的总和仍可视为正态分布。- 为正态, ? 和 ? 也都应该是正态的。1 2- 正态分布比较简单正态假定下估计量的性质 BLUE 一致性( consistency)? 是正态分布的1E( ?1)1var( ?1 )2X i221nxi2? N (1,2? )11所以?11Z服从标准正态分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论