下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、参数回归与非参数回归的优缺点比较:,参数回归:,优点:(1).模型形式简单明确,仅由一些参数表达 (2).在经济中,模型的参数具有一般都具有明确的经济含义 (3).当模型参数假设成立,统计推断的精度较高,能经受实际检验 (4).模型能够进行外推运算 (5).模型可以用于小样本的统计推断 缺点:(1).回归函数的形式预先假定 (2).模型限制较多:一般要求样本满足某种分布要求,随机误差满足 正态假设,解释变量间独立,解释变量与随机误差不相关,等 (3)需要对模型的参数进行严格的检验推断,步骤较多 (4).模型泛化能力弱,缺乏稳健性,当模型假设不成立,拟合效果 不好,需要修正或者甚至更换模型,非参
2、数回归:,优点:(1)回归函数形式自由,受约束少,对数据的分布一般不做任何要求 (2)适应能力强,稳健性高,回归模型完全由数据驱动 (3)模型的精度高 ;(4)对于非线性、非齐次问题,有非常好的效果,缺点:(1)不能进行外推运算,(2)估计的收敛速度慢 (3)一般只有在大样本的情况下才能得到很好的效果, 而小样本的效果较差 (4)高维诅咒, 光滑参数的选取一般较复杂,非参数回归 方法,样条光滑,正交回归,核回归:N-W估计、P-C估计、G-M估计(9.1),局部多项式回归:线性、多项式(9.2),光滑样条:光滑样条、B样条,近邻回归:k-NN、k近邻核、对称近邻(9.4),正交级数光滑(9.5
3、),稳健回归:LOWESS、L光滑、R光滑、M光滑 -(9.3),局部回归,Fourier级数光滑,wavelet光滑,处理高维的非参数方法:多元局部回归、薄片样条、 可加模型、投影寻踪、 回归树、张量积,等,3,核函数K :函数K(.)满足:,常见的核函数:,Parzen 核:,Gaussian核:,Epanechnikov核:,tricube核:,为示性函数,4,回归模型:,(1)模型为随机设计模型,样本观测 (X i, Yi)iid,(2)模型为固定设计模型,Xi 为R中n个试验点列, i=1,2,n,Yi为固定Xi的n次独立观测,i=1,2,n,m(x)为为一未知函数,用一些方法来拟合
4、,定义:线性光滑 (linear smoother),5,光滑参数的选取,风险(均方误差) (mean squared error , MSE),理想的情况是希望选择合适的光滑参数h,使得通过样本数据拟合的回归曲线能够最好的逼近真实的回归曲线(即达到风险最小),这里真实回归函数m(x)一般是未知的。 可能会想到用平均残差平方和来估计风险R(h),但是这并不是一个好的估计,会导致过拟合(欠光滑),原因在于两次利用了数据,一次估计函数,一次估计风险。我们选择的函数估计就是使得残差平方和达到最小,因此它倾向于低估了风险。,是 的估计,h是光滑参数,称为带宽或窗宽,6,光滑参数的选取,缺一交叉验证方法
5、(leave-one-out cross validation , CV),这里 是略去第i个数据点后得到的函数估计,交叉验证的直观意义:,因此:,7,光滑参数的选取,定理:若 那么缺一交叉验证得分 能够写成:,这里 是光滑矩阵L的第i个对角线元素,广义交叉验证(generalized cross-validation,GCV),其中: 为有效自由度,8,光滑参数的选取,其他标准,(1)直接插入法(Direct Plug-In , DPI),相关文献可以参考:,Wolfgang Hrdle(1994),Applied Nonparametric Regression,Berlin Jeffre
6、y D.Hart (1997), Nonparametric Smoothing and Lack-of-Fit Tests, Springer Series in Statistics 李竹渝、鲁万波、龚金国(2007),经济、金融计量学中的非参数估计技术,科学出版社,北京 吴喜之译(2008),现代非参数统计,科学出版社,北京,(2)罚函数法(penalizing function),(3)单边交叉验证(One Sided Cross Validation,OSCV),(4)拇指规则(Rule Of Thumb),9,9.1.核回归(核光滑)模型,N-W估计是一种简单的加权平均估计,可以写
7、成线性光滑:,局部回归,由Nadaraya(1964) 和 Watson(1964)分别提出,,(1)N-W估计,形式:,其中: , 为核函数, 为带宽或窗宽,10,局部回归,(2) G-M估计,由Gasser and Mller(1979)提出,形式如下:,其中,写成线性光滑的形式:,11,局部回归,核估计存在边界效应,边界点的估计偏差较大, 以N-W估计为例,如下图,12,局部回归,一般,核函数的选取并不是很重要,重要的是带宽的选取,13,局部回归,一般,核函数的选取并不是很重要,重要的是带宽的选取,14,局部回归,一般,核函数的选取并不是很重要,重要的是带宽的选取,可以看到:拟合曲线的光
8、滑度受到光滑参数h变化的影响,15,局部回归,核估计的渐近方差核渐近偏差,其中,h为光滑参数,f为X的密度函数,且,16,局部回归,9.2.局部多项式回归,多项式的回归模型,其中 可由最小二乘法估计, 即,局部多项式回归:对m(x)在u处进行p阶泰勒展开,略去p阶高阶无穷小量,得到m(x)在u处的一个p阶多项式近似,即,此时,x应该靠近u,且,17,局部回归,通过最小二乘来估计系数,注意:是在x的一个邻域内进行多项式估计,因此,最小二乘应该与x的邻域有关,局部加权平方和:,使上述问题最小化,可以得到系数的局部多项式的最小二乘估计,可以很容易得到,取p=0时为局部常数估计,即N-W核估计,取p=
9、1,为局部线性估计,18,局部回归,写成矩阵形式:,使上式最小化,可以得到系数的估计,其中,19,局部回归,得到加权最小二乘估计,当p=1时(局部线性估计)的渐近偏差和渐近方差,其中,可以看到局部线性回归的渐近方差和N-W估计相同,而渐近偏差却比N-W回归小,说明局部线性多项式可以减少边界效应,局部线性估计由于N-W估计,20,局部回归,局部多项式光滑可以很好的减少边界效应,21,局部回归,检验函数(Doppler函数),22,局部回归,使用GCV选取最优带宽h=0.017,权函数为tricube核函数,23,局部回归,使用GCV选取最优带宽h=0.017,权函数为tricube核函数,24,
10、局部回归,9.4.近邻光滑,(1) k-NN回归(k-nearest neighbor regression),其中 = i : xi是离x最近的k个观测值之一,K-NN估计的渐近偏差和渐近方差:,对于随机设计模型,近邻估计写成线性光滑器的形式,权函数:,25,局部回归,(1) k-NN回归(k-nearest neighbor regression),26,局部回归,(1) k-NN回归(k-nearest neighbor regression),27,局部回归,(2)k-近邻核回归,K近邻核估计的权重,其中R为xi 中离x最近的第k个距离,K为核函数,渐近偏差和渐近方差:,28,局部回归,(2)k-近邻核回归,29,局部回归,(2)k-近邻核回归,30,局部回归,9.3. 稳健光滑,(1)局部加权描点光滑(Locally Weighted Scatter plot Smoothing, LOWESS),Step1:在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 环保工程安全责任合同书
- 安全器具采购验收制度
- 医用耗材应急采购制度
- 工厂采购内控管理制度
- 公司采购小组成立制度
- 小企业材料采购制度
- 正版软件采购管理制度
- 办公室用品采购领用制度
- 数字化转型下W证券公司核心业务流程再造:策略、实践与成效
- 数字化转型下H银行信用风险管理的困境与突破:理论、实践与创新路径
- 隧道爆破安全培训课件
- 喝酒划拳活动方案
- 日语数字考试题目及答案
- CJ/T 83-2016水处理用斜管
- T/CI 467-2024复合集流体(铜箔)
- 《赤壁之战》课本剧剧本:感受三国英雄的壮志豪情
- 《平顶山平煤神马集团公司成本管理现状、问题及完善对策》7100字
- 电梯年度维修保养项目及要求
- 《经络与腧穴》课件-腧穴
- 2017-2021年安徽专升本考试英语真题卷
- 《百威啤酒定位分析》课件
评论
0/150
提交评论