




已阅读5页,还剩64页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
面板数据的统计分析方法,冯国双,主要内容,1、面板数据简介2、面板数据的固定效应模型3、面板数据的随机效应模型4、动态面板数据模型5、空间面板数据模型,面板数据,横断面数据时间序列数据,面板数据,面板数据(paneldata),面板数据,面板数据:同时含有横断面和时间序列的数据对一组固定个体的多次观测数据其它称谓:重复追踪数据纵贯调查数据,面板数据,微观面板数据:主要指个体的重复调查数据,一般个体数N较大,观察时间较短宏观面板数据通常涉及一段时间内国家、省等单位的重复调查数据,观察时间较长,面板数据模型,面板数据用双下标变量yit表示其中,i=1,2,N表示第i个个体,共N个个体t=1,2,T表示第t个观测时间,共观测T次yit表示第i个个体在第t时间点的观测值,面板数据模型,面板数据模型的一般形式i是截距项i=1,2,N(N为个体数)t=1,2,T(T为每一个体的观察时点数)K为解释变量个数uit是随机误差项,混合模型,(一)混合模型(pooledmodel)表示对所有个体都有一个相同的截距项。,混合模型,混合模型,混合模型,混合模型,混合模型的参数估计:混合模型将所有数据混合在一起作为样本数据,可采用普通最小二乘法(ordinaryleastsquare,OLS)进行参数估计。,混合模型,混合模型的缺点:假定所有个体(如不同省、市、区县、家庭)都是同质的,没有区分不同个体,也无法说明是否不同个体之间存在差异。掩盖了个体间可能存在的异质性,把个体特征全部放到误差项中。,混合模型,针对混合模型缺点的解决方法:需要体现出个体的差异,主要基于两种方法:1、个体固定效应模型2、个体随机效应模型,固定效应模型,(二)个体固定效应模型(fixedeffectmodel)把各个个体的值设定为一套固定的参数,采用一定的方法估计出来个体固定效应模型根据不同情况还可分为:1、变截距的个体固定效应模型2、变斜率/系数的个体固定效应模型,固定效应模型,1、变截距的个体固定效应模型:i反映了个体对总均值的偏离,表示不同个体有不同的截距项。,固定效应模型,变截距的固定效应模型,固定效应模型,变截距固定效应模型的参数估计:最小二乘虚拟变量(leastsquaredummyvariable,LSDV)利用虚拟变量的方式,估计出所有个体的截距值如个体固定效应模型可以表示为:共需估计N个虚拟变量系数和K个自变量系数,固定效应模型,2、变系数的个体固定效应模型也称似不相关回归(SeeminglyUnrelatedRegression)i反映了个体对总均值的偏离,表示不同个体有不同的截距项。i反映了个体对总斜率的偏离,表示不同个体有不同的斜率。,固定效应模型,变系数的固定效应模型,随机效应模型,(三)个体随机效应模型(randomeffectmodel)把各个个体的值设为一套具有特定概率分布的随机变量,假定这些个体仅是从一个具有特定分布的总体中随机抽取出来的随机效应模型也可分为两大类:1、变截距的个体随机效应模型2、变斜率/系数的个体随机效应模型,随机效应模型,1、变截距的个体随机效应模型:2、变斜率的个体随机效应模型vi是独立于解释变量的一个具有特定概率分布的随机变量,反映了个体成员的随机影响。,随机效应模型,个体随机效应模型的参数估计:由于个体之间可能存在一定的相关,普通的最小二乘法不再是最有效的估计通常采用可行广义最小二乘法(feasiblegeneralizedleastsquare,FGLS)。,面板数据模型,固定效应模型与随机效应模型:固定效应模型中,假定每一个体有自己(固定)的截距;模型允许未被观测到的变量与任何已观测的自变量之间存在相关。随机效应模型中,假定这些个体是从一个更大的总体中随机抽取的。未被观测到的变量与所有自变量之间不相关。,面板数据模型,如何选择混合、固定或随机效应模型1、约束的F检验(比较混合模型和固定效应模型)判断:如果P大于0.05,可以认为约束模型(混合模型)成立;否则认为应采用无约束模型(固定效应模型),面板数据模型,如何选择混合、固定或随机效应模型2、BP检验(拉格朗日乘数检验,比较混合模型和随机效应模型)原假设(H0)为:接受混合模型BP检验的统计量判断:如果P大于0.05,可以接受混合模型;P小于0.05,可认为应采用随机效应模型,面板数据模型,如何选择混合、固定或随机效应模型3、Hausman检验(比较随机效应模型和固定效应模型)原假设(H0)为:接受随机效应模型Hausman检验的统计量判断:如果P大于0.05,可以接受随机效应模型;P值小于0.05,可认为应采用固定效应模型,面板数据模型,如何选择混合、固定或随机效应模型4、更实际的考虑流行病学中个体追踪随访数据通常考虑随机效应模型更为合适省、市、区等的观察可考虑固定效应模型结合实际研究目的而定,面板数据分析案例,例1:四个城市1-6月份手足口病报告发病率与气温的关系,面板数据分析案例,首先进行因变量的变换原变量对数变换,面板数据分析案例,混合模型(pooledmodel)的最小二乘估计:SAS程序:procreg;modellhfm=temp;run;,面板数据分析案例,最小二乘估计(pooledmodel)结果:,面板数据分析案例,自相关的Durbin-Watson检验:SAS程序:procreg;modellhfm=temp/dwdwprob;run;,面板数据分析案例,Durbin-Watson检验结果:提示:可能存在空间或时间自相关,面板数据分析案例,残差(Residual)分析:,面板数据分析案例,残差(Residual)分析,面板数据分析案例,各城市的变化趋势图,面板数据分析案例,个体固定效应模型(最小二乘虚拟变量回归)SAS程序procpanelprintfixed;idcitymonth;modellhfm=temp/fixone;run;,面板数据分析案例,虚拟变量及自变量的估计结果:,面板数据分析案例,各城市截距:乌鲁木齐:-0.4091哈尔滨:-0.4091-0.67097=-1.08007北京:-0.4091+1.123651=0.714551上海:-0.4091+1.210117=0.801017,面板数据分析案例,固定效应的约束F检验:模型拟合效果:与最小二乘回归相比,R2增加,MSE降低。,面板数据分析案例,固定效应模型的残差分析,面板数据分析案例,Pooled模型预测值固定效应模型预测值,面板数据分析案例,个体随机效应模型SAS程序procpanel;idcitymonth;modellhfm=temp/ranone;run;,面板数据分析案例,随机效应模型估计结果:随机效应模型的拟合结果,面板数据分析案例,Hausman检验和BP检验结果:P值仅略大于0.05,考虑选择固定效应模型,面板数据分析案例,拟合变斜率面板数据模型固定效应模型似不相关回归(SUR)procsyslinsur;modely1=x1;modely2=x2;modely3=x3;modely4=x4;run;,面板数据分析案例,似不相关模型(SUR),面板数据分析案例,普通最小二乘回归模型(OLS),面板数据分析案例,SUR模型OLS模型,面板数据分析案例,拟合变斜率面板数据模型随机效应模型procmixedcovtestmethod=MIVQUE0;classcity;modellhfm=temp/solution;randominttemp/subject=citytype=vc;run;,面板数据分析案例,随机系数分析参数估计结果,动态面板数据模型,如果现在的结果不仅受到当前因素的影响,还可能受到以往结果或因素的影响,可考虑动态面板数据模型。动态面板数据模型的参数估计通常采用广义矩估计(GMM),动态面板数据模型,例2:续例1数据,考虑到手足口病发病有可能受到上个月份手足口病例数的影响,采用动态面板数据进行分析分析:只考虑前一个月手足口发病率的影响,将因变量的一阶滞后项纳入模型,动态面板数据模型,SAS程序procpanel;idcitymonth;claghfm(1)/out=hfmlag;run;procpaneldata=hfmlag;instdepvar;modelhfm=hfm_1temp/gmmtwostepmaxband=5;idcitymonth;run;,动态面板数据模型,主要结果:,空间面板数据模型,常见空间模型1、空间滞后模型(SpatialLagModel,SLM)该模型包括解释变量X和空间滞后项Wy式中,W是空间权重矩阵。是空间自回归系数,反映样本数据的空间依赖性,测量y对周边或相邻空间观测的影响,如果0,提示存在区域之间的相互影响。表示随机误差。,空间面板数据模型,常见空间模型2、空间误差模型(SpatialErrorModel,SEM)该模型结合了一个标准的回归模型和一个随机误差的空间自回归模型。式中,W是空间权重矩阵,是空间误差相关的参数,表示随机误差。,空间面板数据模型,两种空间模型的选择如果我们确信每个个体的y值受到周围值的直接影响,可以考虑空间滞后模型。如果我们相信y并没有直接受到周围值的影响,而是因为某些我们没有考虑到的因素而导致模型的误差出现空间相关,此时可以考虑空间误差模型。,空间面板数据模型,空间面板数据模型,两种空间面板数据模型(SPDM)1、空间面板滞后模型2、空间面板误差模型,空间面板数据模型,例3:全国31个省3年的模拟数据,分析x1、x2对y的影响,空间面板数据模型,线性回归分析结果(SASprocreg过程):SSE=145.91886,MSE=1.6213,空间面板数据模型,面板数据个体固定效应模型(SASprocpanel过程)SSE=3.3568,MSE=0.0559,空间面板数据模型,空间面板个体固定效应滞后模型(Rspml包)SSE=3.2485,MSE=0.0541,面板数据模型与多水平模型的关系,面板数据可以看做是二水平数据,面板数据模型中的随机效应模型等同于二水平模型多水平模型也可用于处理面板数据,只是思路不同。多水平强调层次结构,通过对各水平残差方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多媒体技术在农村小学音乐教学中的作用
- 呼吸慢病健康教育讲课件
- 2024年单克隆抗体制剂项目资金筹措计划书代可行性研究报告
- 2025年品牌传播新趋势:游戏化营销策略研究与实践指南与应用案例报告
- 2025年农业新型经营主体培育与政策支持体系构建报告
- 睡眠健康课件
- 2025年农业生物技术在种业中的生物技术产品技术创新与专利分析报告
- 小药童的秘密花园讲课件
- 商业决策中的教育数据分析方法与应用
- 眼保健方法课件
- 2024-2025学年湘少版(三起)(2024)小学英语三年级下册(全册)知识点归纳
- 《义务教育生物课程标准(2022年版)》解读
- 承包安全协议书
- 广东食品安全管理人员抽查考核题库附答案
- 2025年白芷种植市场调研报告
- 《DTP药房管理中静脉注射类创新药物患者用药风险识别分析5400字》
- 全国行政区域身份证代码表(电子表格版)
- 期末复习人教PEP版英语五年级下册
- 微弱的光亮(2024年山东烟台中考语文试卷记叙文阅读试题)
- 渠道安全巡检注意事项
- 互联网医院共建合同
评论
0/150
提交评论