线性回归模型_第1页
线性回归模型_第2页
线性回归模型_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、线性回归模型1. 回归分析 回归分析研究的主要对象是客观事物变量之间的统计关系, 它是建立在对客观事物进行大量 试验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的方法。 回归分析方法是通过建立模型研究变量间相互关系的密切程度、 结构状态及进行模型预测的 一种有效工具。2. 回归模型的一般形式如果变量 x_1,x_2,x_p 与随 机变量 y 之间存在 着相关关 系,通常就意 味着每当 x_1,x_2, ,x_p 取定值后, y 便有相应的概率分布与之对应。随机变量 y 与相关变量 x_1,x_2, ,x_p 之间的概率模型为y = f(x_1, x_2,x_p) + (

2、1)f(x_1, x_2,x_p)为变量 x_1,x_2,x_p 的确定性关系, 为随机误差项。由于客观经济现 象是错综复杂的, 一种经济现象很难用有限个因素来准确说明, 随机误差项可以概括表示由 于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。当概率模型( 1)式中回归函数为线性函数时,即有y = beta_0 + beta_1*x_1 + beta_2*x_2 + + beta_p*x_p + (2)其中, beta_0, ,beta_p为未知参数,常称它们为回归系数。当变量x个数为 1 时,为简单线性回归模型,当变量 x 个数大于 1 时,为多元线性回归模型。3. 回归建模的

3、过程 在实际问题的回归分析中,模型的建立和分析有几个重要的阶段,以经济模型的建立为例:(1)根据研究的目的设置指标变量 回归分析模型主要是揭示事物间相关变量的数量关系。 首先要根据所研究问题的目的设置因 变量 y,然后再选取与 y 有关的一些变量作为自变量。通常情况下,我们希望因变量与自变 量之间具有因果关系。 尤其是在研究某种经济活动或经济现象时, 必须根据具体的经济现象 的研究目的,利用经济学理论,从定性角度来确定某种经济问题中各因素之间的因果关系。(2)收集、整理统计数据 回归模型的建立是基于回归变量的样本统计数据。 当确定好回归模型的变量之后, 就要对这 些变量收集、 整理统计数据。

4、数据的收集是建立经济问题回归模型的重要一环, 是一项基础 性工作,样本数据的质量如何,对回归模型的水平有至关重要的影响。(3)确定理论回归模型的数学形式 当收集到所设置的变量的数据之后,就要确定适当的数学形式来描述这些变量之间的关系。 绘制变量 y_i 与 x_i (i = 1,2, ,n )的样本散点图是选择数学模型形式的重要手段。一般 我们把( x_i,y_i )所对应的点在坐标系上画出来,观察散点图的分布状况。如果 n 个样本 点大致分布在一条直线的周围,可考虑用线性回归模型去拟合这条直线。(4)模型参数的估计 回归理论模型确定之后, 利用收集、 整理的样本数据对模型的未知参数给出估计是

5、回归分析 的重要内容。 未知参数的估计方法最常用的是普通最小二乘法。 普通最小二乘法通过最小化 模型的残差平方和而得到参数的估计值。即Min RSS = ( y_i hat(y_i )2其中, hat(y_i) 为因变量估计值, hat(beta_i) 为参数估计值。(5)模型的检验与修改 当模型的未知参数估计出来后, 就初步建立了一个回归模型。 建立回归模型的目的是应用它 来研究经济问题,但如果直接用这个模型去做预测、控制和分析, 是不够慎重的。 因为这个 模型是否真正揭示了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定。 统计检验通常是对回归方程的显著性检验, 以及回归系数的

6、显著性检验, 还有拟合优度的检 验,随机误差项的序列相关检验,异方差性检验,解释变量的多重共线性检验等。如果一个回归模型没有通过某种统计检验, 或者通过了统计检验而没有合理的经济意义, 就 需要对回归模型进行修改。(6)回归模型的运用 当一个经济问题的回归模型通过了各种统计检验, 且具有合理的经济意义时, 就可以运用这 个模型来进一步研究经济问题。 例如, 经济变量的因素分析。 应用回归模型对经济变量之间 的关系作出了度量, 从模型的回归系数可发现经济变量的结构性关系, 给出相关评价的一些 量化依据。在回归模型的运用中, 应将定性分析和定量分析有机结合。 这是因为数理统计方法只是从事 物的数量

7、表面去研究问题, 不涉及事物的规定性。 单纯的表面上的数量关系是否反映事物的 本质?这本质究竟如何?必须依靠专门学科的研究才能下定论。Lasso在多元线性回归中,当变量 x_1,x_2, ,x_3 之间有较强的线性相关性,即解释变量间出现 严重的多重共线性。 这种情况下, 用普通最小二乘法估计模型参数, 往往参数估计方差太大, 使普通最小二乘的效果变得很不理想。 为了解决这一问题, 可以采用子集选择、 压缩估计或 降维法, Lasso 即为压缩估计的一种。 Lasso 可以将一些增加了模型复杂性但与模型无关的 变量的系数压缩为 0,从而将这些变量从模型中剔除,仅保留与被解释变量有较强相关性的 解释变量,使模型更有解释力。Lasso 的未知参数通过求解下式的最小值得到:其中, 为压缩惩罚项, 当 beta_1, ,beta_p 接近于 0 时比较小,因此惩罚项具有将 beta_i 估计值向 0 的方向进行压缩的作用。 Lambda>=0称为调节参数,其作用是控制残差平方和项 与惩罚项对回归系数估计的相对影响程度。当lambda = 0 时,惩罚项不产生作用, lasso的结果与最小二乘结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论