时间序列_截面数据模型_s_第1页
时间序列_截面数据模型_s_第2页
时间序列_截面数据模型_s_第3页
时间序列_截面数据模型_s_第4页
时间序列_截面数据模型_s_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 在进行经济分析时经常会遇到时间序列和横截面两在进行经济分析时经常会遇到时间序列和横截面两者相结合的数据。例如,在企业投资需求分析中,我们者相结合的数据。例如,在企业投资需求分析中,我们会遇到多个企业的若干指标的月度或季度时间序列;在会遇到多个企业的若干指标的月度或季度时间序列;在城镇居民消费分析中,我们会遇到不同省市地区的反映城镇居民消费分析中,我们会遇到不同省市地区的反映居民消费和居民收入的年度时间序列。本章将前述的企居民消费和居民收入的年度时间序列。本章将前述的企业或地区等统称为个体,这种业或地区等统称为个体,这种,有的书,有的书中也称为平行数据或面板数据(中也称为平行数据或面板数据(

2、panel data)。我们称)。我们称这些数据为联合利用时间序列这些数据为联合利用时间序列/截面数据(截面数据(Pooled time series,cross section)。)。l关于面板数据的计量理论也几乎涉及到关于面板数据的计量理论也几乎涉及到了以往截面分析和时间序列分析中所有了以往截面分析和时间序列分析中所有可能出现的主题,如近年来发展出的面可能出现的主题,如近年来发展出的面板向量自回归模型(板向量自回归模型(Panel VAR)、面)、面板单位根检验(板单位根检验(Panel Unit Root test)、)、面板协整分析(面板协整分析(Panel Cointegeratio

3、n)等,都是在现有截面分析和时间序列分等,都是在现有截面分析和时间序列分析中的热点主题的基础上发展起来的。析中的热点主题的基础上发展起来的。2l采用面板数据模型进行分析的主要目的采用面板数据模型进行分析的主要目的在于两个方面:在于两个方面:l一是控制不可观测的个体异质性;一是控制不可观测的个体异质性;l二是描述和分析动态调整过程,处理误二是描述和分析动态调整过程,处理误差成分。差成分。34l使用面板数据主要有以下几方面的优点:使用面板数据主要有以下几方面的优点:l1、便于控制个体异质性。比如,我们在研究全国、便于控制个体异质性。比如,我们在研究全国30个省个省份居民人均消费青岛啤酒的数量时。可

4、以选取居民的收份居民人均消费青岛啤酒的数量时。可以选取居民的收入、当地的啤酒价格、上一年的啤酒消费量等变了作为入、当地的啤酒价格、上一年的啤酒消费量等变了作为解释变量。但同时我们认为民族习惯、风俗文化、广告解释变量。但同时我们认为民族习惯、风俗文化、广告投放等因素也会显著地影响居民的啤酒消费量。对于特投放等因素也会显著地影响居民的啤酒消费量。对于特定的个体而言,前两种因素不会随时间的推移而有明显定的个体而言,前两种因素不会随时间的推移而有明显的变化,通常称为个体效应。而广告的投放往往通过电的变化,通常称为个体效应。而广告的投放往往通过电视或广播,我们可以认为在特定的年份所有省份所接受视或广播,

5、我们可以认为在特定的年份所有省份所接受的广告投放量是相同的,通常称为时间效应。这些因素的广告投放量是相同的,通常称为时间效应。这些因素往往因为难以获得数据或不易衡量而无法进入我们的模往往因为难以获得数据或不易衡量而无法进入我们的模型型l2、包含的信息量更大,降低了变量间共、包含的信息量更大,降低了变量间共线性的可能性,增加了自由度和估计的线性的可能性,增加了自由度和估计的有效性。有效性。l3、便于分析动态调整。、便于分析动态调整。56 Pool对象在对象在EViews中扮演着两种角色。首先,中扮演着两种角色。首先,Pool对对象中包含了一系列的标识名。这些标识名描述了工作文件象中包含了一系列的

6、标识名。这些标识名描述了工作文件中的时间序列中的时间序列/截面数据的数据结构。在这个角色中,截面数据的数据结构。在这个角色中,Pool对象在管理和处理时间序列对象在管理和处理时间序列/截面数据上的功能与组对象有截面数据上的功能与组对象有些相似。其次,利用些相似。其次,利用Pool对象中的过程可以实现对各种时对象中的过程可以实现对各种时间序列间序列/截面数据模型的估计及对估计结果的检验和处理。截面数据模型的估计及对估计结果的检验和处理。在这个角色中,在这个角色中,Pool对象与方程对象有些相似对象与方程对象有些相似 7 。为明。为明显起见,名称要相对较短。例如,国家作为截面成员时,显起见,名称要

7、相对较短。例如,国家作为截面成员时,可以使用可以使用USA代表美国,代表美国,CAN代表加拿大,代表加拿大,UK代表英国。代表英国。 定义了定义了Pool的截面成员名称就等于告诉了的截面成员名称就等于告诉了EViews,模,模型的数据结构。在上面的例子中,型的数据结构。在上面的例子中,EViews会自动把这个会自动把这个Pool理解成对每个国家使用单独的时间序列。理解成对每个国家使用单独的时间序列。 必须注意,必须注意,。因此,删除一。因此,删除一个个Pool并不会同时删除它所使用的序列,但修改并不会同时删除它所使用的序列,但修改Pool使用的使用的原序列会同时改变原序列会同时改变Pool中的

8、数据。中的数据。 8 在本章中,使用的是一个研究投资需求的例子,包括了五在本章中,使用的是一个研究投资需求的例子,包括了五家企业和三个变量的家企业和三个变量的20个年度观测值的时间序列:个年度观测值的时间序列: 5家企业:家企业: 3个变量:个变量: GM:通用汽车公司:通用汽车公司 I :总投资:总投资 CH:克莱斯勒公司:克莱斯勒公司 M :前一年企业的市场价值:前一年企业的市场价值 GE:通用电器公司:通用电器公司 K :前一年末工厂存货和设备的价值:前一年末工厂存货和设备的价值 WE:西屋公司:西屋公司 US:美国钢铁公司:美国钢铁公司 要创建要创建Pool对象,选择对象,选择Obje

9、cts/New Object/Pool并在编并在编辑窗口中输入截面成员的识别名称:辑窗口中输入截面成员的识别名称: 9 对截面成员的识别名称没有特别要求,但必须能使用这对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建立合法的些识别名称建立合法的EViews序列名称。此处推荐在每个识序列名称。此处推荐在每个识别名中使用别名中使用“_”字符,它不是必须的,但把它作为序列名的字符,它不是必须的,但把它作为序列名的一部分,可以很容易找到识别名称。一部分,可以很容易找到识别名称。 10 在在Pool中使用序列的关键是序列命名:使用中使用序列的关键是序列命名:使用和和组合命名。截面识别名称可以

10、放在序列名中组合命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可。的任意位置,只要保持一致即可。 例如,现有一个例如,现有一个Pool对象含有识别名对象含有识别名JPN,USA,UK,想建立每个截面成员的,想建立每个截面成员的GDP的时间序列,我们就的时间序列,我们就使用使用“GDP”作为序列的基本名。作为序列的基本名。,不能这样命名序列:不能这样命名序列:JPNGDP,GDPUSA,UKGDP1,因为因为EViews无法在无法在Pool对象中识别这些序列。对象中识别这些序列。11 一旦选定的序列名和一旦选定的序列名和Pool中的截面成员识别名称相中的截面成员识别名称相对应,就可

11、以利用这些序列使用对应,就可以利用这些序列使用Pool了。其中关键是要了。其中关键是要理解理解Pool序列的概念。序列的概念。 一个一个Pool序列实际就是一组序列序列实际就是一组序列, 序列名是由基本序列名是由基本名和所有截面识别名构成的。名和所有截面识别名构成的。,其中,其中。如果序列。如果序列名为名为GDPJPN,GDPUSA,GDPUK,相应的,相应的Pool序列序列为为GDP?。如果序列名为。如果序列名为JPNGDP,USAGDP,UKGDP,相应的相应的Pool序列为序列为 ?GDP。 12 要显示要显示Pool中的截面成员识别名称,单击工具条的中的截面成员识别名称,单击工具条的D

12、efine按钮,或选择按钮,或选择View/Cross-Section Identifiers。如果需。如果需要,也可以对识别名称列进行编辑。要,也可以对识别名称列进行编辑。 Pool中使用的数据都存在普通中使用的数据都存在普通EViews序列中。这些序列序列中。这些序列可以按通常方式使用:可以列表显示,图形显示,产生新序可以按通常方式使用:可以列表显示,图形显示,产生新序列,或用于估计。也可以使用列,或用于估计。也可以使用Pool对象来处理各单独序列。对象来处理各单独序列。13 有很多种输入数据的方法,在介绍各种方法之前,首有很多种输入数据的方法,在介绍各种方法之前,首先要理解时间序列先要理

13、解时间序列/截面数据的结构,区别堆积数据和非堆截面数据的结构,区别堆积数据和非堆积数据形式。积数据形式。 时间序列时间序列/截面数据的数据信息用三维表示:截面数据的数据信息用三维表示:。例如:。例如:1950年,通用汽车公司,投资数据。年,通用汽车公司,投资数据。 使用三维数据比较困难,一般要转化成二维数据。有使用三维数据比较困难,一般要转化成二维数据。有几种常用的方法。几种常用的方法。 存在工作文件的数据都是这种非堆积数据,在这种形存在工作文件的数据都是这种非堆积数据,在这种形式中,给定截面成员、给定变量的观测值放在一起,但和式中,给定截面成员、给定变量的观测值放在一起,但和其他变量、其他截

14、面成员的数据分开。例如,假定我们的其他变量、其他截面成员的数据分开。例如,假定我们的数据文件为下面的形式:数据文件为下面的形式: 14 其中基本名其中基本名 I 代表企业总投资、代表企业总投资、M 代表前一年企业的市场价值、代表前一年企业的市场价值、K 代代表前一年末工厂存货和设备的价值。每个企业都有单独的表前一年末工厂存货和设备的价值。每个企业都有单独的 I、M、K 数据。数据。 EViews会自动按附录会自动按附录A中中 介绍的标准输入程序读取非堆积数据。并把介绍的标准输入程序读取非堆积数据。并把每个截面变量看作一个单独序列。注意要按照上述的每个截面变量看作一个单独序列。注意要按照上述的P

15、ool命名规则命名。命名规则命名。 15 确认后确认后EViews会打开新建序列的堆积式数据表。我们看会打开新建序列的堆积式数据表。我们看到的是按截面成员堆积的序列,到的是按截面成员堆积的序列,Pool序列名在每列表头,截面序列名在每列表头,截面成员成员/年代识别符标识每行:年代识别符标识每行: 选择选择View/Spreadsheet(stacked data),),EViews会要求输会要求输入序列名列表入序列名列表16 Pool数据排列成堆积形式,一个变量的所有数据放在一数据排列成堆积形式,一个变量的所有数据放在一起,和其他变量的数据分开。大多数情况下,不同截面成员起,和其他变量的数据分

16、开。大多数情况下,不同截面成员的数据从上到下依次堆积,每一列代表一个变量:的数据从上到下依次堆积,每一列代表一个变量: 17 我们称上表数据是以截面成员堆积的,单击我们称上表数据是以截面成员堆积的,单击Order+/-实现堆实现堆积方式转换,也可以按日期堆积数据:积方式转换,也可以按日期堆积数据: 每一列代表一个变量,每一列内数据都是按年排列的。如果每一列代表一个变量,每一列内数据都是按年排列的。如果数据按年排列,要确保各年内截面成员的排列顺序要一致。数据按年排列,要确保各年内截面成员的排列顺序要一致。18 EViews对时间序列对时间序列/截面数据模型的估计是通过含有截面数据模型的估计是通过

17、含有Pool对象的工作文件和具有面板结构的工作文件来实现的。对象的工作文件和具有面板结构的工作文件来实现的。 。通过。通过Pool对象可以实现对各种变截距、变系数时间序列模型的估对象可以实现对各种变截距、变系数时间序列模型的估计,但计,但Pool对象侧重分析对象侧重分析“窄而长窄而长”的数据,即截面成员较的数据,即截面成员较少,而时期较长的侧重时间序列分析的数据。少,而时期较长的侧重时间序列分析的数据。 对于截面成员较多,时期较少的对于截面成员较多,时期较少的“宽而短宽而短”的侧重截面的侧重截面分析的数据,一般通过分析的数据,一般通过进行分析。利用面板结构的工作文件可以实现变进行分析。利用面板

18、结构的工作文件可以实现变截距时间序列截距时间序列/截面数据模型以及动态时间序列截面数据模型以及动态时间序列/截面数据模截面数据模型的估计。型的估计。 19 使用使用Pool对象从文件读取数据,先打开对象从文件读取数据,先打开Pool,然后选,然后选择择Procs/Import Pool Data(ASCII,.XLS,.WK?),要使用,要使用与与Pool对象对应的输入程序。对象对应的输入程序。20 按照和上面数据输入相反的程序可进行数据输出。由于按照和上面数据输入相反的程序可进行数据输出。由于EViews可以输入输出非堆积数据,按截面成员堆积和按日期可以输入输出非堆积数据,按截面成员堆积和按

19、日期堆积数据,因此可以利用堆积数据,因此可以利用EViews按照需要调整数据结构。按照需要调整数据结构。 21 每个截面成员的基础序列都是普通序列,因此每个截面成员的基础序列都是普通序列,因此EViews中中对各单个截面成员序列适用的工具都可使用。另外,对各单个截面成员序列适用的工具都可使用。另外,EViews还有专门适用于还有专门适用于Pool数据的专用工具。可以使用数据的专用工具。可以使用EViews对与对与一特定变量对应的所有序列进行类似操作。一特定变量对应的所有序列进行类似操作。 可以使用可以使用PoolGenr(panelgenr)程序生成或者修改程序生成或者修改Pool序序列。列。

20、平行数据模型一般形式平行数据模型一般形式 itxi2(0,)it为1*K向量 为K*1向量 1.in1.tT.(1)itiitiityxl 表示那些不随时间改变的影响因素,表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯观测或难以量化的,如个人的消费习惯、国家的社会制度等,一般称其为、国家的社会制度等,一般称其为“个个体效应体效应”(individual effects)。对)。对“个个体效应体效应”的处理主要有两种方式:一种的处理主要有两种方式:一种是视其为不随时间改变的固定性因素,是视其为不随时间改变的固

21、定性因素,相应的模型称为相应的模型称为“固定效应固定效应”模型;另模型;另一种是视其为随机因素,相应的模型称一种是视其为随机因素,相应的模型称为为“随机效应随机效应”模型。模型。23i24 单击单击Pool工具栏的工具栏的Estimate选项打开如下对话框:选项打开如下对话框: 25 在因变量对话框中输入在因变量对话框中输入Pool变量或变量或Pool变量表达式。变量表达式。 在下面的编辑窗口中输入样本说明。样本的缺省值是各在下面的编辑窗口中输入样本说明。样本的缺省值是各截面成员中的最大样本值。如果得不到某时期截面成员的解截面成员中的最大样本值。如果得不到某时期截面成员的解释变量或因变量的值,

22、那么此观测值会被排除掉。释变量或因变量的值,那么此观测值会被排除掉。 在两个编辑框中输入解释变量。在两个编辑框中输入解释变量。 (1) Common :此栏中输入的变量对所有截面成员有此栏中输入的变量对所有截面成员有相同的系数,并用一般名称或相同的系数,并用一般名称或Pool名称输出结果。名称输出结果。 (2) Cross-section specific :此栏中输入的变量对此栏中输入的变量对Pool中每个截面成员的系数不同。中每个截面成员的系数不同。 (3) Period specific :此栏中输入的变量对此栏中输入的变量对Pool中每个中每个时期的系数不同。时期的系数不同。26 模型

23、模型(10.1.2)常用的有如下三种情形:常用的有如下三种情形: 对于情形对于情形1,称为变系数模型,除了存在个体影响外,称为变系数模型,除了存在个体影响外,在横截面上还存在变化的经济结构,因而结构参数在不同横在横截面上还存在变化的经济结构,因而结构参数在不同横截面上是不同的。截面上是不同的。 对于情形对于情形2,称为变截距模型,在横截面上个体影响不同,称为变截距模型,在横截面上个体影响不同,个体影响表现为模型中被忽略的反映个体差异的变量的影响,个体影响表现为模型中被忽略的反映个体差异的变量的影响,又分为固定影响和随机影响两种情况。又分为固定影响和随机影响两种情况。 对于情形对于情形3,在横截

24、面上无个体影响、无结构变化,则,在横截面上无个体影响、无结构变化,则普通最小二乘法估计给出了普通最小二乘法估计给出了 和和 的一致有效估计。相当于的一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。将多个时期的截面数据放在一起作为样本数据。jiji ,jiji ,jiji ,27 经常使用的检验是协方差分析检验,主要检验如下两经常使用的检验是协方差分析检验,主要检验如下两个假设:个假设: H1: H2: 可见如果接受假设可见如果接受假设 H2 则可以认为样本数据符合情形则可以认为样本数据符合情形3,即模型为即模型为,无需进行进一步的检验。,无需进行进一步的检验。 如果拒绝假设如果拒

25、绝假设H2,则需检验假设则需检验假设H1。如果接受如果接受H1,则则认为样本数据符合情形认为样本数据符合情形2,即模型为,即模型为,反之拒绝,反之拒绝H1 ,则认为样本数据符合情形,则认为样本数据符合情形1,即模型为,即模型为。N21N21N2128 下面介绍假设检验的下面介绍假设检验的 F 统计量的计算方法。首先计算情统计量的计算方法。首先计算情形形1()的残差平方和,记为的残差平方和,记为 S1 1 ;情形情形2()的残差平方和记为的残差平方和记为 S2 2 ;情形情形3()的残差平方和的残差平方和记为记为 S3 3 。计算计算 F2 统计量统计量 (10.2.7) 在假设在假设 H2 下

26、检验统计量下检验统计量 F2 服从相应自由度下的服从相应自由度下的F分布。分布。若计算所得到的统计量若计算所得到的统计量 F2 的值不小于给定置信度下的相应临的值不小于给定置信度下的相应临界值,则拒绝假设界值,则拒绝假设 H2,继续检验假设,继续检验假设 H1。反之,接受。反之,接受 H2则则认为样本数据符合模型情形认为样本数据符合模型情形3 ,即,即。)1(),1)(1()1()1)(1/()(1132kTNkNFkNNTSkNSSF29 在假设在假设H1下检验统计量下检验统计量F1也服从相应自由度下的也服从相应自由度下的F分布,分布,即即 (10.2.8) 若计算所得到的统计量若计算所得到

27、的统计量F1的值不小于给定置信度下的相的值不小于给定置信度下的相应临界值,则拒绝假设应临界值,则拒绝假设H1。 如果接受如果接受H1,则认为样本数据符合情形则认为样本数据符合情形2,即模型为,即模型为,反之拒绝,反之拒绝H1 ,则认为样本数据符合情形,则认为样本数据符合情形1,即模,即模型为型为。)1(,) 1()1() 1/()(1121kTNkNFkNNTSkNSSF30 例例10.5中系数中系数 和和 取何种形式可以利用模型形式设定检验取何种形式可以利用模型形式设定检验方法来确定。方法来确定。 (1) 首先分别计算首先分别计算3种形式的模型:变参数模型、变截距模种形式的模型:变参数模型、

28、变截距模型和不变参数模型,在每个模型的回归统计量里可以得到相应型和不变参数模型,在每个模型的回归统计量里可以得到相应的残差平方和的残差平方和S1=339121.5、S2 = 444288.4 和和S3 = 1570884。 (2) 按按(10.2.7)式和式和(10.2.8)式计算式计算F统计量,其中统计量,其中N=5、k=2、T=20,得到的两个,得到的两个F统计量分别为:统计量分别为: F1= (S2 - S1)/8)/(S1 /85) = 3.29 F2= (S3 - S1)/12)/(S1 /85) = 25.73 利用函数利用函数 qfdist(d, k1, k2) 得到得到F分布的

29、临界值,其中分布的临界值,其中d 是临是临界点,界点,k1和和k2是自由度。在给定是自由度。在给定5%的显著性水平下的显著性水平下(d=0.95),得,得到相应的临界值为:到相应的临界值为: F(12, 85) = 1.87 F(8, 85) =2.049 由于由于 F21.87,所以拒绝所以拒绝H2;又由于又由于 F12.049,所以也拒绝所以也拒绝H1。因此,例因此,例10.5的模型应采用变系数的形式的模型应采用变系数的形式。 31 使用时间序列使用时间序列/截面数据模型数据结构信息,有很多种方截面数据模型数据结构信息,有很多种方法进行方程估计。可以估计固定截距模型,随机截距模型,法进行方

30、程估计。可以估计固定截距模型,随机截距模型,或者模型变量对各截面成员的系数不同,以及估计单独的或者模型变量对各截面成员的系数不同,以及估计单独的AR项系数。也可以为各个截面成员分别估计一个方程。项系数。也可以为各个截面成员分别估计一个方程。 下面将介绍怎样使用下面将介绍怎样使用Pool和系统估计更一般和复杂的模型,和系统估计更一般和复杂的模型,包括二阶段最小二乘估计和非线性模型,以及有复杂截面系包括二阶段最小二乘估计和非线性模型,以及有复杂截面系数限制的模型。数限制的模型。 32 下面讨论下面讨论Pool模型的计算方法。设有模型的计算方法。设有N个观测值互相堆积。个观测值互相堆积。为讨论方便,

31、把堆积方程表示为:为讨论方便,把堆积方程表示为:, i =1, 2, , N (10.3.1) 其中其中 yi 是是第第 i 个个截面成员的截面成员的T 1维维因变量向量,因变量向量,xi 是是第第 i 个个截截面成员面成员的的T k 维维解释变量矩阵。解释变量矩阵。 i 是是第第 i 个个截面成员的截面成员的k 1维维未知参数向量,未知参数向量,ui 是是第第 i 个个截面成员的截面成员的T 1维维扰动项向量。用扰动项向量。用分块矩阵形式表示如下:分块矩阵形式表示如下: NNNNNuuuxxxyyy2121212121000000iiiiiuxy33 并且方程的残差协方差矩阵为:并且方程的残

32、差协方差矩阵为: 基本说明把基本说明把Pool说明作为联立方程系统并使用系统最说明作为联立方程系统并使用系统最小二乘法估计模型。小二乘法估计模型。NNNNNNEEuuuuuuuuuuuuuuuuuuuu212221212111)(34 当残差同期不相关,并且时期和截面同方差时,当残差同期不相关,并且时期和截面同方差时, 对堆积数据模型使用普通最小二乘法估计系数和协方差。对堆积数据模型使用普通最小二乘法估计系数和协方差。相当于情形相当于情形3: i = = j , i = = j ,在横截面上无个体影响、无结在横截面上无个体影响、无结构变化,则普通最小二乘法估计给出了构变化,则普通最小二乘法估计

33、给出了 和和 的一致有效估的一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。计。相当于将多个时期的截面数据放在一起作为样本数据。其中其中 yi 和和 xi 分别是分别是 各时期的因变量向量和解释变量矩阵。各时期的因变量向量和解释变量矩阵。TNII2uxxxyyyTT212135以例以例10.5为例为例:36 所有的截面的系数相等,和将所有的截面的系数相等,和将5个公司的数据接到一起,个公司的数据接到一起,用用OLS的估计结果相同。的估计结果相同。37 固定影响估计量通过为每个截面成员估计不同常数项使固定影响估计量通过为每个截面成员估计不同常数项使 i 不不同。同。EViews将每

34、个变量减去平均值,并用转换后的数据,通过最将每个变量减去平均值,并用转换后的数据,通过最小二乘估计来计算固定影响。小二乘估计来计算固定影响。 (10.3.3)其中其中 ,, i =1, 2, , N (10.3.4) TxxTyytitititi/,/FEiiiyxNiTtiitiitNiTtiitiitFEyy11111)()()()(xxxxxxktkititiitxxx1,2,1,x38 如果引进总体均值截距项(如果引进总体均值截距项(m),可以将模型(),可以将模型(10.3.1)写成如下的等价形式:写成如下的等价形式: i =1, 2, , N (10.3.10) 在该形式下,模型(

35、在该形式下,模型(10.3.1)中的反映个体影响的跨成员)中的反映个体影响的跨成员方程变化的截距项被分解成在各个体成员方程中都相等的总方程变化的截距项被分解成在各个体成员方程中都相等的总体均值截距项体均值截距项(m)和跨成员方程变化的表示个体对总体均和跨成员方程变化的表示个体对总体均值偏离的个体截距项(值偏离的个体截距项( i*)。)。个体截距项个体截距项 i* 表示的是个体成表示的是个体成员员i对总体平均状态的偏离,所有偏离之和应该为零,即对总体平均状态的偏离,所有偏离之和应该为零,即 (10.3.11)iiiimuxy*01*Nii39 在该约束下,可以得到模型在该约束下,可以得到模型(1

36、0.3.10)中的各参数的最优线中的各参数的最优线性无偏估计性无偏估计 (10.3.12) (10.3.13) (10.3.14)其中:其中: , , 。 EViews计算固定影响是包含总体均值截距项的变截距模计算固定影响是包含总体均值截距项的变截距模型,以例型,以例10.5为例:为例:FEymxFEiiimyx*)(111NiTtitNTxx)(111NiTtityNTyTxxTyytitititi/,/NiTtiitiitNiTtiitiitFEyy11111)()()()(xxxxxx404142 模型模型(10.3.1)还可以推广为包含时期个体恒量的形式,还可以推广为包含时期个体恒量的

37、形式,即模型形式为:即模型形式为: i =1, 2, N ,t =1, 2, T (10.3.15) 其中:其中: t 为时期个体恒量,反映时期特有的影响。类似地,为时期个体恒量,反映时期特有的影响。类似地,通过引进相应的个体成员和时期虚拟变量,利用普通最小通过引进相应的个体成员和时期虚拟变量,利用普通最小二乘法可以得到各参数的二乘法可以得到各参数的OLS估计。估计。 ittiititmuxy*434445 利用利用OLS参数估计,我们得到参数估计,我们得到5个公司的方程残差的方个公司的方程残差的方差差 i2 ,具有截面异方差性。,具有截面异方差性。通用汽车公司(通用汽车公司(GM)9410.

38、91克莱斯勒公司(克莱斯勒公司(CH) 755.85通用电器公司(通用电器公司(GE)34288.89西屋公司(西屋公司(WE) 633.42美国钢铁公司(美国钢铁公司(US)33455.5146 当残差具有截面异方差性和同步不相关时最好进行截面加权当残差具有截面异方差性和同步不相关时最好进行截面加权回归:回归: EViews进行可行广义最小二乘(进行可行广义最小二乘(FGLS)。)。 首先从一阶段首先从一阶段Pool最小二乘回归,得到方差最小二乘回归,得到方差 i2 的的估计值估计值 si2,计算公式为:计算公式为:, i =1, 2, , N (10.3.24) 其中其中 是是OLS的拟合

39、值。的拟合值。 NTNTTEEIIIuu2222100000)(21iitTtitiTyysi/)(212ity 47 其次系数值其次系数值 由标准由标准GLS估计量估计,是有效估计量估计量估计,是有效估计量。 NiiiiNiiiiFE1211211111yxxxyXXX4849 当残差具有截面异方差性和同步相关性时,当残差具有截面异方差性和同步相关性时,SUR加权最小二加权最小二乘是可行的乘是可行的GLS估计量:估计量: 其中其中 是同步相关的对称阵:是同步相关的对称阵: (10.3.28)一般项一般项 ,在所有的,在所有的 t 时为常数。时为常数。 NNNNNNN212222111211T

40、TNNTNTNTTTNTTEIIIIIIIIIuu12222111211)()(itjtijuuE50 EViews估计估计SUR模型时使用的模型时使用的 ij 是由一阶段是由一阶段Pool最小二最小二乘回归得到:乘回归得到: i, j = =1, 2, , N (10.3.30) 其中:其中: 和和 可由式(可由式(10.3.3)和式()和式(10.3.4)得到。计算后,)得到。计算后,再进行广义最小二乘估计(再进行广义最小二乘估计(GLS),此时),此时 的的SUR估计为:估计为: (10.3.31) )()()()()()(111YYIXXXXIXXTTSURFEiTsFEiijFEii

41、iij)()(xyxy51此时此时 的的SUR估计为:估计为: 52l固定效应和随机效应模型的差异主要反固定效应和随机效应模型的差异主要反映在对映在对“个体效应个体效应”的处理上。固定效的处理上。固定效应模型中的个体差异反映在每个个体都应模型中的个体差异反映在每个个体都有一个特定的截距项上;随机效应模型有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项,则假设所有的个体具有相同的截距项,个体的差异主要反映在随机干扰项的设个体的差异主要反映在随机干扰项的设定上,因此该模型通常也称为定上,因此该模型通常也称为“误差成误差成分模型分模型”。5354 随机影响模型假设随机影响模型假设

42、it 项是共同系数项是共同系数 和不随时间改变的和不随时间改变的截面说明随机变量截面说明随机变量 vi 的和,的和, vi 和残差和残差 ui 是不相关的。是不相关的。 i =1, 2, , N (10.3.36) 为了分析方便,可以将模型为了分析方便,可以将模型(10.3.36)写成如下形式:写成如下形式: (10.3.43)其中其中: , = ( , ) ,wi = vi + ui。iiiivuxy)1(),(kTiixexwXY55EViews按下列步骤估计随机影响模型:按下列步骤估计随机影响模型: (1) 使用固定影响模型的残差估计使用固定影响模型的残差估计 ui 的方差:的方差:(

43、(10.3.52) ) 使用包含总体均值截距项的变截距模型的残差估计使用包含总体均值截距项的变截距模型的残差估计 vi 的的方差,方差, ( (10.3.52) )kNNTyyNiTtFEiitiitu1122)()(xxTkNyuNiFEiiiv21221)(x56222222222222 vuvvvvuvvvvu (2) 由于由于 有了成分方差有了成分方差 和和 的估计,可以求出模型的估计,可以求出模型(10.3.42)中参中参数数 的的GLS估计量:估计量: (10.3.50)其中:其中: 。 2u2viNiiiNiiGLSyXXX11111),(iiiixxxX57 个体随机影响个体随

44、机影响 vi 相应的估计为相应的估计为 i =1, 2, , N (10.3.56)其中:其中: (10.3.57)TtGLSititBviyv122)(x1)(122kNyNiFEiiiBx5859l一种常见的观点认为,当样本来自一个一种常见的观点认为,当样本来自一个较小的母体时,应该使用固定效应模型较小的母体时,应该使用固定效应模型,而当样本来自一个很大的母体时,应,而当样本来自一个很大的母体时,应当采用随机效应模型。当采用随机效应模型。l比如在研究中国地区经济增长的过程中比如在研究中国地区经济增长的过程中,以全国,以全国28个省区为研究对象,可以认个省区为研究对象,可以认为这为这28个省

45、区几乎代表了整个母体。同个省区几乎代表了整个母体。同时也可以假设在样本区间内,各省区的时也可以假设在样本区间内,各省区的经济结构、人口素质等不可观测的特质经济结构、人口素质等不可观测的特质性因素是固定不变的,因此采用固定效性因素是固定不变的,因此采用固定效应模型是比较合适的。应模型是比较合适的。60l如果研究西安市居民的消费行为时,即如果研究西安市居民的消费行为时,即使样本数为使样本数为10000人,相当于西安市人,相当于西安市1000万人口的母体而言仍然是个很小的样本万人口的母体而言仍然是个很小的样本。此时,可以认为不同的居民在个人能。此时,可以认为不同的居民在个人能力、消费习惯等方面的差异

46、是随机的,力、消费习惯等方面的差异是随机的,此时采用随机效应模型较为合适。此时采用随机效应模型较为合适。61l遗憾的是,很多情况下,并不能明确的遗憾的是,很多情况下,并不能明确的区分样本来自一个较大的母体还是较小区分样本来自一个较大的母体还是较小的母体。因此有些学者认为,区分固定的母体。因此有些学者认为,区分固定效应模型和随机效应模型应当看使用二效应模型和随机效应模型应当看使用二者的假设条件是否满足。由于随机效应者的假设条件是否满足。由于随机效应模型把个体效应设定为干扰项的一部分模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相,所以就要求解释变量与个体效应不相关,而固定效应

47、模型并不需要这个假设关,而固定效应模型并不需要这个假设条件。所以如果我们的检验结果表明该条件。所以如果我们的检验结果表明该假设满足,就采用随机效应模型。假设满足,就采用随机效应模型。6263 前面所介绍的变截距模型中,横截面成员的个体影响是前面所介绍的变截距模型中,横截面成员的个体影响是用变化的截距来反映的,即用变化的截距来反映模型中忽略用变化的截距来反映的,即用变化的截距来反映模型中忽略的反映个体差异的变量的影响。然而现实中变化的经济结构的反映个体差异的变量的影响。然而现实中变化的经济结构或不同的社会经济背景等因素有时会导致反映经济结构的参或不同的社会经济背景等因素有时会导致反映经济结构的参

48、数随着横截面个体的变化而变化。因此,当现实数据不支持数随着横截面个体的变化而变化。因此,当现实数据不支持变截距模型时,便需要考虑这种系数随横截面个体的变化而变截距模型时,便需要考虑这种系数随横截面个体的变化而改变的变系数模型。改变的变系数模型。 64 变系数模型的基本形式如下:变系数模型的基本形式如下: i =1, 2, , N (10.4.1)其中:其中:yi 为因变量向量为因变量向量,xi 为为 T k 维解释变量矩阵维解释变量矩阵,参数参数 i 表示模型的常数项,表示模型的常数项, i 为对应于解释变量矩阵为对应于解释变量矩阵 xi 的系的系数向量。随机误差项数向量。随机误差项 ui 相

49、互独立,且满足零均值、等方相互独立,且满足零均值、等方差的假设。差的假设。 iiiiiuxy65 在式在式(10.4.1)所表示的变系数模型中,常数项所表示的变系数模型中,常数项 i 和系数和系数向量向量 i 都是随着横截面个体的改变而变化的,因此可以将都是随着横截面个体的改变而变化的,因此可以将变系数模型改写成如下形式:变系数模型改写成如下形式:, i =1 , 2 , , N (10.4.2)其中:其中: , i = ( i , i ) 。 类似于变截距模型,变系数模型也分为固定影响变系数类似于变截距模型,变系数模型也分为固定影响变系数模型和随机影响变系数模型两种类型。模型和随机影响变系数

50、模型两种类型。 iiiiuxy), 1 (iixx 666768 EViews不能估计这样的模型:很少的时期或者庞大不能估计这样的模型:很少的时期或者庞大的截面成员。所用的时期数平均应至少不小于截面成员的截面成员。所用的时期数平均应至少不小于截面成员数。即使有足够的观测值,估计的残差相关矩阵还必须数。即使有足够的观测值,估计的残差相关矩阵还必须是非奇异的。如果有一条不满足是非奇异的。如果有一条不满足EViews的要求,的要求,EViews会显示错误信息:会显示错误信息:“Near Singular Matrix”。 当选择加权时,复选框当选择加权时,复选框Iterate to converge

51、nce控制可控制可行行GLS程序。如果选择,程序。如果选择,EViews就一直迭代权重和系数就一直迭代权重和系数直到收敛。如果模型中包括直到收敛。如果模型中包括AR项,这个选择就没有意义,项,这个选择就没有意义,因为在因为在AR估计中,估计中,EViews会一直迭代直至收敛。会一直迭代直至收敛。 6970 EViews能估计那些广义异方差性的强的协方差。这种能估计那些广义异方差性的强的协方差。这种形式的异方差性比上面介绍的截面异方差性更普遍,因为一形式的异方差性比上面介绍的截面异方差性更普遍,因为一个截面成员内的方差可以随时间不同。个截面成员内的方差可以随时间不同。 要得到怀特标准差和协方差要

52、得到怀特标准差和协方差,点点Options按钮,选择按钮,选择Coef covariance method。EViews5给出了一个下拉列表,列表中给出了一个下拉列表,列表中包含包含8种选项。默认的是最上方的种选项。默认的是最上方的Ordinary项,对应式项,对应式(10.3.7) 和式和式(10.3.8)给出的系数协方差形式。在此下拉列表给出的系数协方差形式。在此下拉列表中的另外中的另外7种系数协方差形式参见种系数协方差形式参见10.5节。节。 注意此选项不适用于注意此选项不适用于SUR和随机影响估计。和随机影响估计。7172 EViews在在Pool对象中提供了比较方便的,可以进行多序列

53、单位根检验对象中提供了比较方便的,可以进行多序列单位根检验的工具。在的工具。在Pool对象中,对对象中,对ADF、PP等单位根检验方法均可以实现。在等单位根检验方法均可以实现。在Pool工具栏选择工具栏选择View/Unit Root Test,EViews会打开如下对话框,在对会打开如下对话框,在对话框最上边的话框最上边的“Pool series”栏中输入所要检验的序列名称,并选定其他设栏中输入所要检验的序列名称,并选定其他设置后单击置后单击“OK”,便可以进行相应的单位根检验了。,便可以进行相应的单位根检验了。 7374 以我国各省市城镇居民人均消费和可支配收入作为以我国各省市城镇居民人均

54、消费和可支配收入作为例子:相应的例子:相应的Pool识别名称为识别名称为BJ_,TJ_,HB_,SX_,NMG_,LN_, 。估计城镇居民人均消费。估计城镇居民人均消费?CS的回的回归模型,模型中的被解释变量归模型,模型中的被解释变量?CS 为为城镇居民人均全年城镇居民人均全年消费,解释变量为城镇居民人均全年可支配收入消费,解释变量为城镇居民人均全年可支配收入?YD(单位:元),变量均为年度数据,样本区间为(单位:元),变量均为年度数据,样本区间为1991 2003年。年。 75 检验模型形式设定形式;检验模型形式设定形式; (1) 首先分别计算首先分别计算3种形式的模型:变参数模型、变截距模

55、种形式的模型:变参数模型、变截距模型和不变参数模型,在每个模型的回归统计量里可以得到相应型和不变参数模型,在每个模型的回归统计量里可以得到相应的残差平方和的残差平方和S1=5279603、S2 = 8287453 和和S3 =13282535。 (2) 按按(10.2.7)式和式和(10.2.8)式计算式计算F统计量,其中统计量,其中N=29、k=1、T=13,得到的两个,得到的两个F统计量分别为:统计量分别为: F1= (S2 - S1)/28)/(S1 /319) =6.49 F2= (S3 - S1)/56)/(S1 /319) = 8.63 利用函数利用函数 qfdist(d, k1,

56、 k2) 得到得到F分布的临界值,其中分布的临界值,其中d 是临是临界点,界点,k1和和k2是自由度。在给定是自由度。在给定5%的显著性水平下的显著性水平下(d =0.95),得到相应的临界值为:得到相应的临界值为: F(56, 319) = 1.37 F(28, 319) =1.51 由于由于 F21.37,所以拒绝所以拒绝H2;又由于又由于 F11.51,所以也拒绝所以也拒绝H1。因此,模型应采用变系数的形式因此,模型应采用变系数的形式。 7677 从城镇居民人均从城镇居民人均可支配收入可支配收入?YD的系的系数看,各省市的边际数看,各省市的边际消费倾向是不同的,消费倾向是不同的,最高是山

57、西,最高是山西,0.844,最低是江西,最低是江西,0.669。78 估计出估计出Pool方程后,可以按下述方法检验输出结果:方程后,可以按下述方法检验输出结果: 选择选择View/Representations检查输出。检查输出。EViews把把Pool估计成估计成一个方程的系统,每个截面成员一个方程。一个方程的系统,每个截面成员一个方程。 可能有些复杂的时间序列可能有些复杂的时间序列/截面数据方程不能用截面数据方程不能用Pool对象进对象进行估计。要使用更多的估计方法,如二阶段最小二乘法,三阶行估计。要使用更多的估计方法,如二阶段最小二乘法,三阶段最小二乘法,段最小二乘法,GMM,或使用任意系数限制,需要用,或使用任意系数限制,需要用Pool对对象创建一个系统对象。可以用一个已估计的象创建一个系统对象。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论