金融数据分析课件第8章：面板计量模型与检验

上传人：q*** IP属地：山东上传时间：2024-04-02 格式：PPTX 页数：85 大小：1.41MB 积分：15 举报 版权申诉

已阅读5页，还剩80页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第八章面板数据计量模型与检验学习目标掌握基础几个面板数据模型的概念、内容区分混合模型、随机效应模型和固定效应模型的使用范围与适用条件了解面板数据模型的计量程序与实际应用了解我国数字金融发展现状，掌握数字金融对区域经济发展的影响和重要性。8.1面板数据的基本界定8.2面板数据的设定和加载8.3面板回归模型8.4面板数据模型的检验8.5动态面板数据与广义矩GMM估计8.6

专题8：数字金融对地区经济发展的影响目录CONTENTS面板数据的基本界定

8.1面板数据的定义面板数据（PanelData），与时间序列数据与截面数据所区别的是在时间序列的基础上取多个截面，在这些截面上同时选取样本观测值所构成的样本数据集。或者说从数据形式上来说面板数据集是一个m*n的数据矩阵，因此具有（m，n）二维的数据性质，记载的是n个时间节点上，m个对象的某一数据指标。如表8-1所示，面板数据的格式是每个样本不同年份一个接一个叠起来的。8.1面板数据的基本界定表8-1数据型态序号年份y_pricex1_per-gdpx2_populationx3_income12014456026868326452821201543612852932951146120164456307123335601512017486633589338615371201856573601433970034120195857420613417528512020606542852330779901202162824031333280792220144811100653280562462201543601019422835950022016456310411828663987220174851908602886970622018538276218289753182201965246855529081889220206351743952718339222021618387416272849238.1面板数据的基本界定

面板数据为何有用呢？在我们进行回归分析中，有一部分受到一些观测不到的因素所影响，举个例子，地区贷款量和地区贷款政策的关系。地区贷款政策就是观察不到但是对地方贷款量求有影响，且如果对这些因素忽略，会导致遗漏变量偏差使得估计有误，但是这些因素因为观察不到，并且可能无法进行数据收集整理纳入回归。这些因子在横截面的N不同，但不会随着时间而变动，进而我们可以采用面板数据捕捉控制这些观察不到的因素对被解释变量的影响。假设纯截面数据、时间序列数据回归（地区贷款数和地区gdp）,其中yi和yt为贷款规模，xi和xt为地区gdp，同时也有一个观察不到的变量zi和zt，如我国不同地区的地方性信贷政策。8.1面板数据的基本界定如下两个方程式的回归：（8.1)式是典型横截面数据回归式，（8.2）式则是时间序列数据回归式。这两种形态的线性模型，最小二乘法的参数估计式是无偏且一致。但是，如果z是观察不到的变量，实证上就缺了这一个变量，存在遗漏变量。式(8.1)和式(8.2)使用工具变量估计法才会是无偏且一致的。但是，观察不到变量的两种情况，在使用面板数据的架构均可以解决。假设纯截面数据、时间序列数据回归（地区贷款数和地区gdp）,其中yi和yt为贷款规模，xi和xt为地区gdp，同时也有一个观察不到的变量zi和zt，如我国不同地区的地方性信贷政策。8.1面板数据的基本界定第一种情况。如果我们将(8.1)式的数据进行延展成面板数据。此时假设zit不随时间变动，故zit=zi，可得回归式(8.3）：

(8.3）将（8.3）式同步滞后一期：

（8.4）（8.3）式和（8.4）式相减：

（8.5）通过两式的差分我们可以发现无法估计的变量z在（8.5）式中抵消了，由此通过估计Δyit=β1Δxit+eit将我们想知道的β1进行无偏估计得出。8.1面板数据的基本界定第二种情况。如果我们将式（8.2）延展成面板数据。假设zit不随i变动，故zit=zt，可以使用均数移除法：移除每一个时间点的横截面平均，可得回归式（8.6）：（8.6）再进行均数处理得：（8.7）是无偏且一致。（8.6）式减去（8.7）式可得：（8.7）（8.8）面板数据的设定和加载

8.28.2

面板数据的设定和加载首先学习如何将数据导入进R。这里将数据类型分成两种情况介绍。平衡面板：对于所有的样本N，其覆盖的时间区间T都一样。非平衡面板：所有样本N中至少有一个样本的时间区间T与其他样本的时间区间T不同。我们采用收集于我国各个省或地级市的统计年鉴整理成的数据表（见下表8-2）：8.2

面板数据的设定和加载表8-2观察表头前六个样本数据

注：BalancedPanel:n=100,T=17,N=1700接下来，我们加载非平衡面板。这里我们调用r语言中自带的数据包“Hedonic”,该数据集为调查波士顿地区的自住房数量影响因素，其中变量含义如书中所示idyearprizepoplutionincomerjgdpsup120051906.178322.88139809465.008.56787120061924.866322.001598610000.989.85881120072418.383321.001977911910.4710.4429120082575.568321.002248711882.5912.8611120093237.848321.002551112968.1547.6307120104041.577316.902870814987.24342.90378.2

面板数据的设定和加载表8-3观察数据包“Hedonic”样本变量

mvcrimzninduschasnoxrmage1-110.090.01182.31no28.9443.2365.202-19.980.0307.07no22.0041.2378.902-210.450.0307.07no22.0051.6261.103-110.420.0302.18no20.9848.9745.803-210.500.0702.18no20.9851.0854.203-310.260.0302.18no20.9841.3458.70

disradtaxptratioblackslstattownidtime1-11.410.0029615.300.40-3.00112-11.600.6924217.800.40-2.39212-21.600.6924217.800.39-3.21223-11.801.1022218.700.39-3.53313-21.801.1022218.700.40-2.93323-31.801.1022218.700.39-2.96338.2

面板数据的设定和加载pdim(mydata2)#查看面板数据信息UnbalancedPanel:n=92,T=1-30,N=506进一步，将介绍如何在R中对面板数据进行描述性统计分析。Aggregate(Data,by=list(),FUN=)上面语法中有三个设定参数取第3~7列的数据为列，以N的维度当作群组因子，分组计算平均数，结果如下：aggregate(mydata1[3:7],by=list(mydata1[,"id"]),FUN="mean")8.2

面板数据的设定和加载表8-4分组计算的平均数组一prizepoplutionincomerjgdpsup14172.507326.4806244581.1924612.55534.6248724207.116270.0729453316.5679423.90148.9742534098.8351112.0154543114.8618177.231082.7583544662.147162.5679543878.6734629.50194.83064522676.1391994.0764799855.2881321.51590.1485663377.539566.5499042580.1229914.58589.1732277822.694468.8623065449.6674841.60936.130838.2

面板数据的设定和加载进一步，通过设定不同参数，我们可以得到更多的数据分析结果。aggregate(mydata1[,-c(1,2)],by=list(mydata1[,"year"]),FUN="mean")上面的代码是将数据集中的前两列数据去掉，然后依照时间T维度(year),计算平均数，这样算出来的，就是横截面面平均时间序列数据:每年都是100个城市的平均值。8.2

面板数据的设定和加载表8-5各变量每年100个城市的平均值组一yearprizepoplutionincomerjgdpsup120052508.752568.229318861.1022458.75129.3624220062847.050574.498821246.0825565.03139.0088320073526.182582.765025069.9928959.94149.6675420083896.435591.004828787.9431939.92172.2874520094555.806601.163231617.9834643.64250.3389620105523.836621.682935786.3439042.02548.75638.2

面板数据的设定和加载如果需要更多的统计衡量函数，如偏度和峰度等，可以通过加载包fBasics来实现:library(fBasics)#加载fBasics包比如：aggregate(mydata1[3:5],by=list(mydata1[,"id"]),FUN="skewness")上面我们通过fBasics实现了对第三到第五列变量的偏度8.2

面板数据的设定和加载表8-6相关变量的偏度组一prizepoplutionincome1-0.191660.531760.235622-0.17408-0.362200.0263830.37827-1.699410.245114-0.066711.138150.2949550.51973-0.735470.3760860.004350.363510.2735270.911630.589760.28759面板回归模型8.38.3.1

面板回归模型的一般形式一般来说，面板数据的回归方程式可以表示如下：用矩阵可以表示为：8.3.2

面板数据回归模型的分类在上述面板数据一般回归模型的基础上，附加上相应不同的限制性假设，使其成为不同类型的面板数据回归模型。我们可以将其分为以下几种（1）混合效应回归模型混合效应（PooledRegressionModels）估计模型：其中，8.3.2

面板数据回归模型的分类从理论上我们就可以发现，混合效应回归模型假设了解释变量对被解释变量的影响与个体以及时间无关。实际上，混合效应回归模型假设了解释变量对被解释变量的影响与个体无关。

在许多问题的研究中，由于过强的假设前提，混合效应模型有时并不适用。8.3.2

面板数据回归模型的分类（2）单因素效应模型单因素效应模型是对模型（8.10）施加了如下假设：

（8.14）在个体单因素效应模型(individualeffectregressionmodel)（8.15）

8.3.2

面板数据回归模型的分类其中，ξi与uit相互独立，并且ξi反应了个体i的非时变异质性，被称为个体效应，也可以写作下面的矩阵形式：

（8.16）其中，T是是N阶单位矩阵IN和T阶列向量lT=(1,1,1,⋯,1)'的克罗内克积。接下来考虑时间单因素效应模型(timeeffectsregressionmodel)：

（8.17）其中λt与uit相互独立，并且λt反应了个体i的时变同质性，被称为时间效应，也可以写作下面的矩阵形式：

（8.18）8.3.2

面板数据回归模型的分类同样地,如果劳动力市场、资本市场和商品市场是有效的,那么在各地区(个体)技术效率相同的假设下,根据各地区的面板数据利用柯布道格拉斯生产函数估计劳动和资本对产出的贡献时,可以将模型设定为时间单因素效应模型,前提条件允许全球技术进步是时变。因此，可以很明显得分析得出相对于混合回归模型,时间单因素效应模型更合意,它控制了不可观测的时变同质性对模型参数估计的影响。8.3.2

面板数据回归模型的分类（3）双因素效应模型所谓双因素效应模型,实际上就是在模型中既考虑了不可观测的非时变异质性效应,又考虑了不可观测时变同质性效应的面板数据线性回归模型，直观地讲就是两种单因素的结合。

（8.19）

其矩阵表示为

（8.20）8.3.2

面板数据回归模型的分类（4）固定效应模型基于单因素效应模型和双因素效应模型,如果Xit与λt是相互独立的,与ξi相关,或者Xit与λt相关,与ξi独立以及与λt、ξi都相关，这时的单因素效应模型和双因素模型都属于固定效应模型，更具体地可以分为:个体固定效应模型时间固定效应模型时间个体固定效应模型。8.3.2

面板数据回归模型的分类1）个体固定效应模型个体固定效应模型是对于不同的纵剖面时间序列（个体）只有截距项不同的模型

（8.21）或者表示为矩阵形式

（8.22）其中I_N⊗l_T是N阶单位矩阵I_N和T阶列向量l_t=(1,1,1,⋯,1)的克罗内克乘8.3.2

面板数据回归模型的分类2）时间固定效应模型时间固定效应模型就是对于不同的截面（时点）有不同截距的模型。如果确知对于不同的截面，模型的截距显著不同，但是对于不同的时间序列（个体）截距是相同的，那么应该建立时间固定效应模型（8.23）其矩阵表示为：（8.24）其中是N阶单位矩阵IN和T阶列向量lt=(1,1,1,⋯,1)的克罗内克乘，8.3.2

面板数据回归模型的分类3）时间个体双固定效应模型时间个体固定效应模型就是对于不同的截面（时点）、不同的时间序列（个体）都有不同截距的模型。表示如下:

（8.25）其矩阵表示为

（8.26）8.3.2

面板数据回归模型的分类4）固定效应模型的估计常用的固定效应的估计方法有最小二乘虚拟变量法(LeastSquareDummyVariable,LSDV)和广义最小二乘法(GeneralizedLeastSquares,GLS)两种。

LSDV法的是将每个个体的观测值表示为一个拟合常数项和一个个体固定效应的和。可以写成如下方程式：（8.27）（8.28）上式中的残差如果未知，则使用可行广义最小二乘法(FeasibleGLS。8.3.2

面板数据回归模型的分类（5）随机效应模型1）随机效应模型个体随机效应模型和时间随机效应模型，可表示为：

（8.29）

（8.30）双因素随机效应模型模型则为：

（8.31）8.3.2

面板数据回归模型的分类2）随机效应的估计在随机效应假设之下，用GLS和MLE(最大似然法)皆可以。随机效应之下的GLS和前面的不同，主要差异在随机效应需要进行基本分布假设。已知一个面板数据回归：yit=α+βxif+(μi+εit)，随机效应GLS有如下假设：E[εi]=0；E[μi]=0；E[εij

μj]=0（8.32）E[εij2]=σ_e2；E[μij2]=σμ2

（8.33）E[εijεj]=0，s≠t（8.34）E[μi

μj]=0，i≠j（8.35）8.3.2

面板数据回归模型的分类2）随机效应的估计故如同一般GLS的观念，就是一个内插逆矩阵的做法，结果如下：

（8.36）上式为：

（8.37）

且：

（8.38）8.3.2

面板数据回归模型的分类如果假设同质变异，则：

（8.39）对照Q转换，随机效应则是Ω-1转换。假设其为正态分布时，其概似函数如下：

（8.40）

（8.41）8.3.2

面板数据回归模型的分类

图1面板回归模型简易分类图面板数据模型的检验8.48.4.1

固定效应模型检验如果估计的模型设定是“固定效应”，我们就要检验用扩张的虚拟变量矩阵（LSDV）方法所估计出的个体效应，在统计是否不显著。原假设如下：

（8.42）上面的原假设中也隐含了横截面N的异质性是否在统计上不显著的问题，但它可以被忽略。标准的检验方法如F检验，概念类似于ANOVA，建立在残差平方和（RSS）的基础上：截面F=（8.43）8.4.1

固定效应模型检验除了F检验，另一个方法就是似然比（likelihoodratio，LR）检验，LR统计量在渐近上是卡方分布的，所以一般也称为卡方检验：截面（8.44）同时似然比和卡方检验结果一般可以通过观测频数和期望频数之间的差异方式进行观察8.4.2随机效应模型检验随机检验和固定效应模型检验一样，但是检验对象是由随机效应估计后的模型。如果是单维模型，原假设为：（8.45）如果是双维模型，则原假设为：（8.46）8.4.3随机效应和固定效应的选择在涉及随机效应和固定效应模型的选择问题上，随机效应较好还是固定效应较好，是一个需要检验的问题。在计量上我们使用豪斯曼检验。原假设如下：H0：(E(ui，t|Xi，t)=0（8.47）此原假设的统计量为豪斯曼统计量:

（8.48）

上式中

标符号RE代表随机效应，FE代表固定效应。根据书中结果，最终，接受原假设，选择随机效应，拒绝原假设，选择固定效应。

8.4.3随机效应和固定效应的选择【案例8.1】中国百城房价的影响因素前文为大家介绍面板数据的导入方法以及描述统计，进一步我们将介绍面板数据的混合、固定、随机效应回归以及检验的实操。通过此案例研究影响我国商品房房价的因素。在前文所展示的数据集中适配我国100个地级市的商品房均价，其中包括北京、上海、成都、重庆等一线大城市，将关键数据进一步拟合为4个变量，分别为城市常住人口、城镇居民人均年收入、实际人均gdp以及供应的住宅商品房面积，通过这四个变量来构建模型，根据不同结果得出影响房价的结论：8.4.3随机效应和固定效应的选择表8-7混合回归模型的估计结果

估计系数标准误t检验p值截距项-3.1438e+032.1625e+02-14.53742.2e-16***x12.6497e+002.1943e-0112.07542.2e-16***x21.0074e-014.4487e-032.64562.2e-16***x37.6842e-024.9929e-0315.39022.2e-16***x4-6.4606e-017.6496e-02-8.44572.2e-16***8.4.3随机效应和固定效应的选择同样如果我们假设存在影响房价的地区或时间因素，且与x相关，这是我们对方程进行固定效应模型估计。>gsp_fe0=plm(y~x1+x2+x3+x4,data=mydata1,model="within",effect="individual")#估计共同截距pool模型。利用函数内的model="within"设定固定效应model,并将估计结果存入对象gsp_fe0>summary(gsp_fe0)#对象gsp_fe0内的估计结果8.4.3随机效应和固定效应的选择表8-8固定效应模型的估计结果

估计系数标准误t检验p值x116.428020.7736421.23462.2e-16***x20.082750.0041719.85632.2e-16***x30.027440.006923.96417.691e-05***x4-0.104790.05279-1.98530.04728**8.4.3随机效应和固定效应的选择表8-9固定效应模型的估计结果对比

估计系数标准误t检验p值x116.428020.7736521.234642.4624e-88***x20.082750.0041719.856331.3760e-78***x30.027440.006923.964147.6915e-05***x4-0.104790.05279-1.985290.04728**比较两个模型，我们发现得出的估计值还是有差别，进一步介绍R的plm()函数，提供6种模型处理个体效应设定，通过其中的model参数的设置来实现model=c(“within”“random”,...)8.4.3随机效应和固定效应的选择>write.csv(summary(gsp_fe)$coef,file="table1.csv")#使用函数write,csv(),将估计系数，输出成.csv格式前文中有讲解到还可以通过可行广义最小二乘法(FeasibleGLS）来估计混合最小二乘法(pooledOLS)和固定效应。如范例程序如下。>gsp_poolFGLS=pggls(myFormula,data=mydata1,model="pooling")>summary(gsp_poolFGLS)8.4.3随机效应和固定效应的选择表8-10广义最小二乘法混合模型的估计结果

估计系数标准误z检验p值截距项-1.0428e+031.9211e+02-5.42805.700e-08***x11.3933e+002.5445e-015.47574.357e-08***x28.1421e-024.1192e-0319.76632.2e-16***x34.8315e-023.9585e-0312.20542.2e-16***x4-3.6106e-023.8751e-02-0.93170.3528.4.3随机效应和固定效应的选择>gsp_feFGLS=pggls(myFormula,data=mydata1,model="within")>summary(gsp_feFGLS)表8-11广义最小二乘法固定模型的估计结果

估计系数标准误z检验p值x18.378220.7333411.42482.2e-16***x20.073520.0038219.23792.2e-16***x30.026980.004466.04541.491e-09***X40.034960.018171.92360.054*8.4.3随机效应和固定效应的选择进一步如果我们假设存在影响房价的地区或时间因素，且不与x相关，这是我们对方程进行随机效应模型估计：>gsp_re=plm(myFormula,data=mydata1,model="random",random.method="walhus")#执行随机效应回归估计>summary(gsp_re)表8-12随机效应模型walhus的估计结果

估计系数标准误z检验p值截距项-4.4312e+034.0022e+02-11.07202.2e-16***x17.1347e+004.9506e-0114.41172.2e-16***x29.5359e-024.0822e-0323.35962.2e-16***x34.1270e-026.7478e-036.11619.591e-10***x4-1.6067e-015.6371e-02-2.85030.00437**8.4.3随机效应和固定效应的选择估计随机效应，R提供4个GLS用的权重矩阵"swar"(默认)"walhus""amemiya"和"nerlove"。"swar"就是Swamy-Arora估计式；"walhus"是Wallace-Hussain估计式，后面两个是工具变量估计随机效应模型所使用的。同时我们还可以运用极大似然法MLE对随机效应模型进行估计的具体操作如下所示。>library(nlme)>gsp_reMLE=nlme::lme(myFormula,data=house_prize,random=~1|id)#执行MLE的随机效应回归估计>summary(gsp_reMLE)8.4.3随机效应和固定效应的选择表8-13MLE随机效应模型的估计结果

估计系数标准误t检验p值截距项-7083.206658.9443-10.7493260.000***x112.4840.663918.8037700.000***x20.0890.004121.7677880.000***x30.0310.00684.5784810.000***x4-0.1190.0531-2.2435230.025**8.4.3随机效应和固定效应的选择上面的程序是对于MLE的估计，进一步来说明lme这个函数：

lme(myFormula,data=house_prize,random=~1|id)这个函数的使用简单，但要注意两个参数的设定。第一，数据不能设定具有面板数据结构的myDatal,因为1me()不是plm内的估计函数,所以不能放这种数据结构。第二，random=~1|id设定随机效应的来自第一个解释变量(本例中为变量x1：城市常住人口),id是分群变量。如果要设置双因素随机效应，也相当方便。通过这个函数，还可以处理多层次面板数据以及修正序列相关。8.4.3随机效应和固定效应的选择接下来对模型进行检验阶段首先对其进行个体固定效应检验，范例程序如下：>pFtest(gsp_fe,gsp_pool)这个检验结果的F统计量是31.212,p值小于0.001,所以显著地拒绝固定效应估计值皆为0的原假设。进一步通过前文四个统计量对模型个体随机效应检验的操作，范例如下>plmtest(gsp_pool,effect="individual",type="honda")>plmtest(gsp_pool,effect="individual",type="bp")>plmtest(gsp_pool,effect="twoways",type="ghm")>plmtest(gsp_pool,effect="twoways",type="kw")8.4.3随机效应和固定效应的选择表8-14个体固定效应检验和随机效应检验的统计结果统计值P值F检验31.2122.20E-16Honda检验61.7692.20E-16BP检验3815.42.20E-16GHM检验3850.62.20E-16KW检验28.5442.20E-16注意：使用这4个统计量时，要注意GHM和KW仅适用于估计“双因素”模式；另外两个Honda和BP检验则对单因素、双因素模式皆可适用。8.4.3随机效应和固定效应的选择表8-15豪斯曼检验的统计结果根据p值拒绝无内生性的原假设，这个模型的个体效应和解释变量之间有内生性。因此，固定效应设定估计的参数，会比随机效应的结果较好。

统计值P值豪斯曼检验296.532.2e-16

随机效应和固定效应的豪斯曼检验如范例程序如下所示。>phtest(gsp_re,gsp_fe)判断"随机效应vs.固定效应"8.4.3随机效应和固定效应的选择【案例8.2】波士顿自住房数量的影响因素此案列目的为研究影响波士顿地区自住房数量的因素。其中变量含义：mv:所在地区自住房的中位数crim:犯罪率zn:25000平方英尺住宅地段的比列Indus：非零售商业用地比列chas:该地区是否有查尔斯河流经nox：年平均氮氧化物浓度（百万分之一）rm:平均房间数age：1940以前建造的房屋所占比列dis:到波士顿五大就业中心地区的加权平均距离rad：公路方便水平tax:物业税税率（元/万元）ptratio:学生/教师比列black:黑人在人口在中的比列lstat：低收入群体在人群中的比列townid：城镇标号进一步，我们将通过前文为大家所展示非平衡面板载入展示的“hedonic”数据集更全面地展示r中的回归操作。>mydata2$chas=(mydata2$chas=="yes")*1.0#先将数据集中文本型变量chas赋值为01变量>ybl=names(mydata2)[1]>zbl=paste(names(mydata2)[2:14],collapse="+")>myEq1=paste(ybl,zbl,sep="~")>myFormula1=as.formula(myEq1)#定义回归方程因变量和自变量zzf_pool=plm(myFormula1,data=mydata2,model="pooling")#混合效应回归summary(zzf_pool)8.4.3随机效应和固定效应的选择表8-16混合效应模型的估计结果

估计系数标准误t检验p值截距项9.7565e+001.4960e-0165.21682.2e-16***crim-1.1865e-021.2448e-03-9.53222.2e-16***zn8.0307e-055.0566e-040.15880.874indus2.4069e-042.3638e-030.10180.919chas9.1384e-023.3205e-022.75210.006***nox-6.3817e-031.1315e-035.63992.873e-08***rm6.3325e-031.3123e-034.82561.866e-06***age8.9802e-055.2630e-040.17060.865dis-1.9131e-013.3395e-02-5.72871.765e-08***rad9.5711e-021.9136e-025.00177.921e-07***tax-4.2042e-041.2269e-04-3.42660.00066***ptratio-3.1119e-025.0137e-03-6.20691.149e-09***blacks3.6379e-011.0312e-013.52770.001***lstat-3.7105e-012.5008e-02-14.83702.2e-16***8.4.3随机效应和固定效应的选择zzf_fe=plm(myFormula1,data=mydata2,model="within")#固定效应模型估计summary(zzf_fe)表8-17固定效应模型的估计结果

估计系数标准误t检验p值crim-0.006250.00104-6.01274.068e-09***chas-0.045240.02985-1.51550.13nox-0.005590.00135-4.13994.227e-05***rm0.009270.001227.57082.520e-13***age-0.001410.00049-2.89480.00399***dis0.080140.071171.12600.261blacks0.66340.103226.42703.655e-10***lstat-0.24530.02556-9.59592.2e-16***8.4.3随机效应和固定效应的选择zzf_re=plm(myFormula1,data=mydata2,model="random",random.method="walhus")#估计随机模型summary(zzf_re)表8-18随机效应模型的估计结果

估计系数标准误z检验p值截距项9.684430.1992248.61182.2e-16***crim-0.007380.00105-7.05711.701e-12***zn0.000070.000660.10990.912indus0.001650.004090.40330.687chas-0.005650.02916-0.19360.846nox-0.005850.00125-4.69502.666e-06***rm0.009080.001197.65151.987e-14***age-0.000870.00047-1.86480.062*dis-0.142360.04439-3.20720.001***rad0.096140.026923.57110.0004***tax-0.000380.00018-2.10450.035**ptratio-0.029510.00919-3.21060.001***blacks0.565190.101795.55242.817e-08***lstat-0.289910.02391-12.12342.2e-16***8.4.3随机效应和固定效应的选择pFtest(zzf_fe,zzf_pool)#固定效应检验综上结果如表8-19所示，由F检验可知，固定效应显著，由honda检验可知，随机显著。表8-19固定效应检验和随机效应检验的统计结果

统计值P值F检验6.50672.2e-16Honda检验15.5182.2e-16BP检验240.82.2e-16GHM检验240.82.2e-16KW检验5.1761.134e-078.4.3随机效应和固定效应的选择phtest(zzf_re,zzf_fe)表8-20豪斯曼检验的统计结果如表8-20所示，根据p值拒绝无内生性的原假设，这个模型的个体效应和解释变量之间有内生性。因此，固定效应设定估计的参数，会比随机效应的结果较好。

统计值P值豪斯曼检验1346.92.2e-16动态面板数据与广义矩GMM估计8.58.5.1动态面板介绍如果在面板模型中，解释变量包括被解释变量的滞后值，此时则称之为“动态面板模型”，其目的是处理内生性问题。动态面板模型发展分为3个阶段，第1阶段是差分GMM(differenceGMM)，第2阶段水平GMM，第3阶段是系统GMM(SystemGMM)。对于动态面板数据，即使组内估计量（FE）也是不一致的（Nickell,1981)。一般的动态面板回归方程如下：Blundell和Bond(1998)通过模拟实验指出一阶差分GMM估计和水平GMM估计方法有时会产生弱工具变量问题，从而导致GMM估计结果具有较大的偏差，因此通过一阶差分GMM估计的工具变量和水平GMM估计的部分工具变量进行有效整合，产生更多的矩条件，提出了一种更加有效的估计方法，即系统GMM估计方法。8.5.1动态面板介绍针对面板数据自回归模型，相互独立，矩条件为，其中：假设为系统GMM估计方法的权重矩阵：那么对应的样本矩为：因此，的GMM估计量为其中：8.5.2广义矩GMM估计【案例8.3】房价可以直观的反映一个地区的经济发展水平和人民的生活情况。同时，房价往往受到许多因素的影响。探究房价影响因素对地区经济发展具有重要意义。本部分主要分析不同变量对房价的影响，数据涵盖100个城市从2005年2021年的房价数据。同时，利用系统GMM进行实证分析，研究分析分析这些变量对房价的影响大小和规律。8.5.2广义矩GMM估计首先使用差分GMM进行估计。房屋价格受不同变量的影响，本期的房价会对下一期房价变化产生动态连续影响。为体现动态影响效应，设立了含有因变量滞后一起的动态项的DynamicPanelData模型。##差分GMM```{recho=FALSE,warning=FALSE}z3<-pgmm(dynformula(log(prize)~log(poplution)+log(income)+log(rjgdp)+log(sup),list(1,0,0,0,0)),##滞后阶数data=df,effect="individual",##设置固定效应model="onestep",##设置模型gmm.inst=~log(prize),##设置工具变量lag.gmm=c(2,99),transformation="d")summary(z3)#输出结果包含系数及显著性和检验8.5.2广义矩GMM估计建模结果如下：结果显示，Wald检验拒绝了模型系数为0的原假设，同时Sargan的p值接受了工具变量有效的原假设，说明模型结果稳健有效。8.5.2广义矩GMM估计其次使用系统GMM进行估计，系统GMM是对差分GMM的补充。##系统GMM```{rpressure,echo=FALSE,warning=FALSE}z2<-pgmm(dynformula(log(prize)~log(poplution)+log(income)+log(rjgdp)+log(sup),list(1,0,0,0,0)),##滞后阶数data=df,effect="twoways",##设置固定效应model="onestep",##设置模型gmm.inst=~log(prize),##设置工具变量lag.gmm=c(2,99),transformation="ld")screenreg(z2)#输出结果包含系数及显著性和检验8.5.2广义矩GMM估计建模结果如下：建模结果显示，Wald检验拒绝了模型系数为0的原假设，同时Sargan的p值接受了工具变量有效的原假设，说明建模结果总

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

金融数据分析课件第8章：面板计量模型与检验

文档简介

温馨提示

最新文档

评论

金融数据分析 课件 第8章：面板计量模型与检验

文档简介

温馨提示

最新文档

评论

相关文档

金融数据分析课件第8章：面板计量模型与检验