版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 经典单方程计量经济学模型:多元线性回归模型,第一节 为何要用多元模型,考虑下面的例子: 某人试图解释一个人的工资水平的决定,为此,他找到的解释变量为受教育水平,于是他构造了如下的计量模型: wagei=+edui+i (1) 这里:wagei-第i个人的工资水平,edui第i个人的受教育水平,i-随机扰动项。 考虑一下,如果要满足最基本的一致性,这个模型有何缺陷?,分析: 显然,除受教育水平外,影响工资水平的还有一个人的工作经历。而工作经历则与受教育水平又相关。,压力仅是砖头1的吗?,砖头1,砖头2,如果为了测定砖头1对桌面的压力,应如何做呢?,解决办法:只要在模型(1)中加入新的变量
2、即可,即模型变成如下形式: wagei=+1edui+2 experi+i (2) 这里:experi-第i个人的工作经历。,应用多元线性回归模型的几个原因: 第一,即使我们所关注的仅是一个解释变量X1对被解释变量Y的影响,但如果还存在其它解释变量X2、X3等也对Y有影响,且同时与X1相关,那么此时就应将X2、X3等一并引入模型,即建立如下新模型: Yi=+1X1i+ 2X2i+ 3X3i+i (3),第二,提高预测准确度。 如果我们要试图解释被解释变量Y的波动,显然,引入更多的解释变量可以使解释更准确,即预测Y更准确。 第三,提高假设检验中所用“仪器”的准确度。比如,有时一个因素虽然与已有的
3、解释变量无关,但你不将其“揪出来”放到模型中去,而将它看作随机扰动项的一部分,它就可能造成扰动项的异方差、自相关等问题。,需思考的问题,为什么只要加入另外一些与已有解释变量相关的新解释变量就可保证我们所关注参数的一致性呢? 由于这些新加入的新解释变量与原解释变量是相关的,这不会对原解释变量的参数估计形成影响吗? 如果直观的理解上述问题,留待后面章节。,第二节 多元线性回模型的参数估计,1.基本模型设定 Y=+1X1+ 2X2+ 3X3+kXk+i (3) 这里:Yi-被解释变量,Xji-第j(j=1,2 k)个解释变量, iN(0,2)。 2.要估计的参数 、 1、 2、 3 k,还有2。,特
4、别要注意: 第一,万不可忘记,我们同时要估计参数2。(回想一下,为什么?) 第二,要估计的参数,并不一定是我们实际应用中所一定关注的参数。 比如,实际中,我们可能只关注x1的参数1,因而其他参数估计的准确性,我们并不关心。,3.估计的方法 普通最小二乘法(OLS) 最大似然法(ML) 矩估计(MON) 我们只关注OLS法。,4.最小二乘估计结果,要求:尽可能看懂课本P58-59页的推导过程;但必须要记住这个结果。,这里,这里,Y1、X11等是你调查所得的样本,我们即用它们进行估计。 X中的第一列全为1,记为向量I,它实际上指的是常数项后面的变量,显然无论你哪次调查,它都取1。,5.多元线性回归
5、模型的矩阵样本表达式 Y=X+ (5) 这里:=(1, 2 n)T =(,1,2k),最小二乘法的几何解释,Y,X1,X2,e,含义:解释变量x1、x2组成一个向量空间,OLS法实际是在寻找被解释变量到这个空间的最短距离。,从图上可见,残差项e与解释变量、被解释变量的估计值均是垂直的。 在统计上,垂直即表示不相关,或相关系数为0。,第三节 估计参数的优劣与推断,一.模型估计出来后面临的两个问题 (1)估计出的参数的“精确度”; (2)从实际应用来看,某一个或某几个解释变量是否真的对被解释变量具有重要影响。 回忆一下,这与一元的情形是否相同?各自要做的具体工作是什么?,二.模型的假设 1.一个完
6、美多元模型的条件 (1)回想一下,一元模型的条件有哪几条假设? (2)多元情形的条件 各个解释变量之间不能完全相关(即不能出现某一个解释变量是另外其他解释变量线性组合的情形),例如,为了研究一国的吉尼系数,某人在封闭经济中建立了如下模型: jct=+1yt+2ct+ 3It+ t 这里:jc是t时期的吉尼系数,y、c、I分别为产出、消费与投资。 试分析一下,这个模型有何问题?,扰动项无条件均值为0、扰动项同方差、扰动项序列不相关。 即:E(i)=0,D (i)=2,cov(i,j)=0 (I,j=1,2n) 任何一个解释变量均与扰动项不相关。 即:cov(Xji,j)=0,i=1k;j=1n
7、注意,这里的不相关,指的是样本意义上的。 扰动项服从正态分布。 此条在大样本情形下可以不考虑,实际应用中,大部分情况下不予考虑。,2.满足上述条件的结果 (1)用OLS法估计出的参数是:无偏、一致和有效的 (2)所有的常规假设检验也是有效的。,要求:最好能了解一下课本P63页中关于估计参数性质的推导;但必须对上述两条记住。,三.估计参数的一致性问题 1.OLS估计的参数满足一致性的条件 (1)再重复一次:一致性是对估计参数的最基本与实际应用中最通常的要求,但样本必须足够大。 (2)所有的关于无偏、一致、有效的直观解释与一元的情形完全相同。 (3)只要、两个假设成立,且样本数量足够大,那么参数就
8、会满足一致性。,(4)注意,这与课本有区别,课本要求各解释变量间不相关,实际只要不完全相关即可。 2.为何即使各个解释变量间存在一定程度相关,参数仍会满足一致性呢? 数学解释:,注:最后一步利用大数定律。,直观解释:首先,一致性要求的是,随着调查样本容量的增大,我们的参数估计量具有“越来越靠近”真实值的特征,或统计意义上说,具有偏离真实值的可能性越来越小的特征。 而只要解释变量间不是完全相关,一般来说,随着样本容量的增大,我们总能发现关于所关注的解释变量对被解释变量进行解释的更多信息,即对这个解释变量作用的认识越来越清晰,这就是一致性。,四.假设检验问题 1.模型的形式及检验的内容 (1)假定
9、模型具有如下形式: Y=+1X1+ 2X2+ 3X3+kXk+i(6) (2)与一元线性回归模型的区别 假设检验多了一个对多个解释变量的联合显著性检验,即几个解释变量合起来,是否对被解释变量具有显著影响。 即使对单个解释变量的显著性进行检验,T检验这个“仪器”的构造也有所不同了。,2.拟合优度或方程总体显著性检验 (1)二者具有相当强的一致性,故一般检验均是针对于后者的,对于前者,只给出一个具体值。 (2)检验目的:都是看一下,所有的解释变量作为一个总体,是否对被解释变量的波动具有明显的影响,或形成了显著的解释能力。,(3)拟合优度(可决系数) 回想一下,一元线性回归模型是哪个指标? 多元线性
10、回归模型与一元的一样:,该统计量越接近于1,模型的拟合优度越高。,问题: 在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大(Why?) 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。 但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。,调整后的可决系数,其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。 在eviews估计结果中,是Adjusted R-squared这一指标,比通常的R2小,应用中可记作ADR。 这里各个平方和、平方和关系,以及平方和的自由度必须记住,(4)解释变量联合显著性检验 H0: =1=2=
11、 =k=0(原假设) H1: 、 j不全为0 (备择假设) 所用“仪器”:,服从自由度为(k , n-k-1)的F分布,给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过 F F(k,n-k-1) 或 FF(k,n-k-1) 来拒绝或接受原假设H0。,直观解释,被解释变量的波动(总平方和)=已解释的被解释变量估计值的波动(回归平方和)+未解释的残差的波动(残差平方和),具体推导过程见课本66页。 “仪器”的构造思想是这样的:如果这些解释变量联合起来真的对被解释变量的波动具有显著的解释能力,那么,已解释的波动与未解释的波动之比应比较大。 但无论是已解释的波动也好,未
12、解释的波动也罢,这种波动受组成“仪器”的模块的可自由变动的随机变量个数的影响。显然,自由变动的随机变量越多,波动就越大,故要去掉这种个数所带来的影响。,小概率事件的判断,x,y,Y=f(x):密度函数,F(k,n-k-1),想一下,这个小概率事件的面积所处位置可以任意选择吗?为何选择尾部?,要从两点思考上述问题:一是直观上“仪器”的构造;二是“密度”的含义。,Eviews上的判断,见前页。,3.单个解释变量系数的显著性检验 (1)检验目的:仍与一元的一样,看一下某一个解释变量是否对被解释变量真的具有重要影响? (2)检验原假设H0:i=0,i=1k。 (3)检验所用的“准确”的“仪器”:,服从
13、于标准正态分布。,这里,其直观含义是:你所调查的第i个解释变量的变异程度。也就是说,你调查的第i个解释变量样本的差异程度。 比如,如果你在调查一个城市人群的消费行为时,如果你仅集中于某一个具有共同人群特征的小区,那么你的样本的差异程度就小。它所带来的问题是,如果你研究的是一个城市的总体,那么实际你这样调查是得不到多少信息的。,R2j的含义是,第i个解释变量与其他解释变量之间的相关程度。可见,解释变量之间的相关程度虽不会影响参数估计的准确性,但会影响假设检验的有效性。,注:这个“仪器”须记住。,(4)相对不太准确的“仪器” 即是用2的估计值来代替2。此时得到的“仪器”的分布,服从于自由度为n-k
14、-1的T分布。,这里n是样本数量,k是解释变量的个数。,这个“仪器”也要记住,(5)检验的标准 不太严格的来看,如果T的绝对值大于等于2,那么就可认为小概率事件发生,即拒绝原假设。 它的经济含义就是说,第i个解释变量对被解释变量在统计上有着显著的影响,即它是影响被解释变量的重要因素。,样本容量问题:一个原则是,样本越多越好,但最小不能小于未知参数的个数。见课本64页。,第四节 非线性模型的线性化,回想一下,我们所说的“模型是线性的”指的是相对什么的?是相对于解释变量吗?还是相对于未知参数?,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。,如著名的恩格尔曲线(Eng
15、le curves)表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillips cuves)表现为双曲线形式等。 但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归的方法进行计量经济学方面的处理。,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。,如著名的恩格尔曲线(Engle curves)表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillips cuves)表现为双曲线形式等。 但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归的方法进行计量经济学方面的
16、处理。,一、模型的类型与变换,1、倒数模型、多项式模型与变量的直接置换法,例如,描述税收与税率关系的拉弗曲线:抛物线 s = a + b r + c r2 c0 s:税收; r:税率,设X1 = r,X2 = r2, 则原方程变换为 s = a + b X1 + c X2 c0,2、幂函数模型、指数函数模型与对数变换法,例如,Cobb-Dauglas生产函数:幂函数 Q = AKL Q:产出量,K:投入的资本;L:投入的劳动,方程两边取对数: ln Q = ln A + ln K + ln L,3、复杂函数模型与级数展开法,方程两边取对数后,得到:,(1+2=1),Q:产出量,K:资本投入,L
17、:劳动投入 :替代参数, 1、2:分配参数,例如,常替代弹性CES生产函数,将式中ln(1K- + 2L-)在=0处展开台劳级数,取关于的线性项,即得到一个线性近似式。,如取0阶、1阶、2阶项,可得,如果可以台劳展开,那么一个一般性模型均可线性化。,二、非线性回归实例,例 建立中国城镇居民食品消费需求函数模型。,根据需求理论,居民对食品的消费需求函数大致为,Q:居民对食品的需求量,X:消费者的消费支出总额 P1:食品价格指数,P0:居民消费价格总指数。,零阶齐次性,当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变,(*),(*),为了进行比较,将同时估计(*)式与(*)式。,根据
18、恩格尔定律,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系:,首先,确定具体的函数形式,对数变换:,考虑到零阶齐次性时,(*),(*),(*)式也可看成是对(*)式施加如下约束而得,因此,对(*)式进行回归,就意味着原需求函数满足零阶齐次性条件。,X:人均消费 X1:人均食品消费 GP:居民消费价格指数 FP:居民食品消费价格指数 XC:人均消费(90年价) Q:人均食品消费(90年价) P0:居民消费价格缩减指数(1990=100) P:居民食品消费价格缩减指数(1990=100,中国城镇居民人均食品消费,特征: 消费行为在19811995年间表现出较强的一致性 1995年之后呈现出
19、另外一种变动特征。,建立19811994年中国城镇居民对食品的消费需求模型:,(9.03) (25.35) (-2.28) (-7.34),按零阶齐次性表达式回归:,(75.86)(52.66) (-3.62),为了比较,改写该式为:,发现与,接近。,意味着:所建立的食品需求函数满足零阶齐次性特征,第五节 实例,计量经济学是一门应用学科,因而学会如何在实际应用中构建一个模型,并对模型的优劣进行评判,对模型的结果会进行分析至关重要。 为此,首先要学会如何报告一个eviews 估计结果。,1.如何对eviews的结果进行观察 Dependent Variable: GDP Method: Leas
20、t Squares Date: 04/27/10 Time: 17:14 Sample: 1996Q1 2005Q1 Included observations: 37 VariableCoefficientStd. Errort-StatisticProb. C4165.1698219.1530.5067640.6157 M01.7041276.0605760.2811820.7803 M125.956762.34420911.072720.0000 M2-9.9840981.466353-6.8087960.0000 R-squared0.841557Mean dependent var-
21、585.8468 Adjusted R-squared0.827153S.D. dependent var49151.45 S.E. of regression20434.64Akaike info criterion22.78966 Sum squared resid1.38E+10Schwarz criterion22.96381 Log likelihood-417.6087F-statistic 58.42561 Durbin-Watson stat2.116550Prob(F-statistic)0.000000,看最后一列prob,它对应的就是概率,若很小,表示小概率事件发生。,2
22、.对于一个eviews结果,在应用写作中应如何报告? 第一,不要直接将上面表拷贝; 第二,可以写成如下形式: GDP=4165.17+1.70M0+25.96M1-9.98M2 (7) (0.51) (0.28) (11.07) (-6.81) R2=0.84 括号中是T统计值。,一个原则是,你要从eviews一个回归结果中选取你需要的指标,目的在于你要告诉别人,你的模型的参数估计结果与假设检验情况。,3.如何对一个eviews 结果进行解释? 答:第一,对其进行统计解释,主要是告诉别人,从统计指标来看,你所关注的解释变量对被解释变量到底有无显著影响。 第二,从经济意义上进行解释,主要是分析一
23、下,如果你所关注的解释变量对被解释变量有显著影响,那么具体影响是多少?这说明了什么? 而如果你所关注的解释变量对被解释变量没有显著影响,那么这背后的原因又是什么?,仍以式(7)为例。 如果我们关注的是货币供应M1对的变化对GDP的影响,那么我们可做如下简单分析: 从统计指标上来看,首先,由于M1系数的T统计值为11.07,远大于2,因而表明货币供应M1的变化对产出有着显著的影响。 从回归的具体结果来看,如果M1增加1个单位,那么将导致GDP增加25.96个单位。,特别注意:你要报告哪一些指标,取决于你的分析目的。比如,如果式(7)中你所关注的是模型总体对GDP的解释力度,或你要用这个模型进行预
24、测,那么你应当关注哪些指标?,这里是一位同学的毕业论文的一部分,试找出他(她)在写作上存在的问题。 示例。,本章练习题,1.答:假设见课本P56-57页。 (1)无偏性:假设1、假设2中的随机扰动项是0均值、假设3。 (2)有效性:所有假设。 (3)一致性:假设1与假设3。,注意:由此可见,一致性是我们对估计参数“准确性”的最一般要求。,2.答:t检验用于检验某一个解释变量是否对被解释变量具有显著的影响,F检验则用于检验所有的解释变量联合起来,是否对被解释变量具有显著影响。 3.答:直观上可以这样理解,因为OLS法所要追求的就是残差平方和的最小化,因而如果对模型施加约束,那么就意味着我们只能在
25、一个较小范围内寻找最小化。这就相当于局部极小值与全局最小值的问题。 当这个约束是无效或是虚假的时候,二者相近或相等。,4.答:违背了解释变量完全相关的假定。如果要改进,那么,我们可以试着去掉其他x4,前提是我们要假设x4不影响大学生的学习成绩,如果我们还能在x4中找到影响大学生成绩的因素,那么仍将其放在模型中作为一个新的解释变量。 5.答:对式(b)进行简单的变形后,再利用OLS进行估计,可知,式(a)、(b)的OLS结果完全一致。 当对模型b施加某种约束时,那么模型b的R2小于模型a的。(想一下R2的计算公式及问题3),6.答:具体证明过程,你可自己利用OLS法的参数计算公式、离差公式,一步
26、步代入即可。,本题的直观意义告诉我们:对于一个多元线性回归模型来说,即使解释变量相关,那么,它对估计的未知参数的估计结果也没有任何影响!因为式(2)的Vi的含义即在于剔除了x2后的x1对Y的影响。 “上帝归上帝,恺撒归恺撒”!,7.答:(1)利用课本P58-59页推导即可,此时 。 (2)第一个式不成立了,后面两个仍成立。具体证明可用两种方法:一是OLS的几何含义;二是课本P58页式子(3.2.2),分别对 求导即可得到。,8.答:具体计算可自己试作一下。 三者的区别是,(a)、(b)分别是有约束的回归,(c)则是无约束的回归。它们的好坏的区别在于,你所提前施加的约束是否是真实的?如果是真实的
27、,说明你更多的利用了已有的信息,因而估计会更有效。否则,估计的效率会降低。,9.提示: 第一,n=15。回顾前面的要求,必须知道各个平方和、各个平方和的关系,以及各个平方和的自由度。 第二,用课本P66-67公式计算。 第三,用F检验。 第四,用P68页,式(3.3.7),并配合查F表。,第四章 基本数据处理,4.1 数据对象,EViews中信息保存在对象中,每个对象中包含特定类别的信息。每个对象都有给定的类型,例如,一个序列对象是关于一个随机变量的观测值,一个方程对象是关于一些变量之间关系的信息。 一个对象中包含的信息不止一种,例如一个方程对象中包含了所有估计得到的结果的信息,如方程形式、检
28、验结果及残差等。所有需要的数据及结果都集中在一个对象中,简化了EViews中信息组织管理工作。 本章重点讨论序列和数组的操作,矩阵、向量和标量留到程序设计中讨论。,4.1.1 序列,建立序列对象: 点击EVIEWS主菜单中的Objects/New Object,然后选择Series即可; 点击工作文件窗口菜单中的Genr,键入一个表达式,可形成一个新的序列。 编辑序列:双击序列名称或Show可以显示序列数据,然后点击Edit+/-按钮,可切换编辑状态。当处于可编辑状态时,可修改数据,按回车确定。 改变表单显示:一般是竖行显示,点击Wide+/-按钮,可切换成表格显示状态。 改变样本区间:点击S
29、mpl+/-按钮,可切换序列的样本区间为当前样本区间或工作区样本区间。 在序列中插入或删除观测值:选中要插入或删除的单元,然后点击InsDel按钮,可以插入或删除。,4.1.2 组,建立组对象: 点击EVIEWS主菜单中的Objects/New Object,然后选择Group,键入序列表即可; 选择组名和序列名后,点击Show,可形成一个新的组。 编辑:点击组名称或Show可以显示组中的数据,然后点击Edit+/-按钮,可切换编辑状态。当处于可编辑状态时,可修改数据,按回车确定。 改变样本区间:点击Smpl+/-按钮,可切换序列的样本区间为当前样本区间或工作区样本区间。,4.2 样本,EVi
30、ews中最重要的概念是观测值的样本,在工作文件中样本是显示和统计运算时观测值的集合(经常是子集合),样本可以特殊指定范围,还可用条件语句来确定。 4.2.1 工作文件样本 工作文件的样本区间是建立工作区时设定的,一般不去改动,如需重新设定,可双击Range后的时间区间,但有可能丢失数据。,4.2.2 改变当前样本区间,点击工作文件中的Objects/Sample或Sample钮,也可双击Sample后的样本区间,然后在对话框输入时间,全体观测值也可用all表示,起始时间可用FIRST表示,终止时间可用LAST表示。下边对话框输入条件,可以使用数学表达式及 AND、OR逻辑表达式。,也可用命令方
31、式改变当前样本区间: Smpl 1955:1 1958:12 Smpl 1980:1 2000:4 IF RC3.6,4.3 输入数据,1. 键盘输入 在主菜单下,选择Quick/Empty Group(Edit Serirs)打开一个新序列后,在编辑状态下,通过键盘输入数据,并给定一个序列名。 2. 粘贴输入 通过主菜单中的Edit/Copy和Edit/Paste功能复制粘贴数据,注意粘贴数据的时间区间要和表单中的时间区间一致。 3. 文件输入 可以从其它程序建立的数据文件直接输入数据。点击主菜单中的File/Import /Read TextLotusExcel或工作文件菜单中的Procs
32、/Import/Read TextLotusExcel。, 文本文件: 可以在WINDOWS子目录中找到文本文件,点击后出现下面的对话框:,在左上角键入序列名,在Series headers选择序列数据输入序号(去掉的数据个数),点击OK即可形成一个新序列,注意原数据文件的时间区间。, Excel(.XLS)文件: 可以在WINDOWS子目录中找到Excel(.XLS),点击后出现下面的对话框:,键入序列名,点击OK即可形成一个新序列,注意原数据文件的时间区间和Excel(.XLS)文件的数据开始单元。,4.4 输出数据,1.复制粘贴 通过主菜单中的Edit/Copy和Edit/Paste功能
33、,对不同工作文件窗口中的编辑菜单进行复制粘贴。注意复制数据的时间区间要和粘贴的时间区间一致。 2.文件输出 可以直接将数据输出成其它程序建立的数据文件类型。点击主菜单中的File /Export/Write TextLotusExcel或工作文件菜单中的Procs/ Export/Write TextLotusExcel。, 文本文件: 选中要存储的序列,点击主菜单或工作文件菜单中的Procs/ Export/Write TextLotusExcel后,可以在WINDOWS子目录中找到存储的目录,文件类型选择Text-ASCII,并给出文本文件名,点击后出现下面的对话框:,或键入要存储的序列名
34、,点击OK即可形成一个新文本文件,注意原数据文件的时间区间。, Excel(.XLS)文件: 选中要存储的序列,点击主菜单或工作文件菜单中的Write TextLotusExcel后,可以在WINDOWS子目录中找到你的要存储的目录,文件类型选择Excel(*.XLS),给出Excel文件名,点击后出现下面的对话框:,或键入要存储的序列名,点击OK即可形成一个新的Excel文件,注意原数据文件的时间区间和Excel(.XLS)文件的数据开始单元。,4.5 频率转换,工作文件中的数据都是一个频率的,但是从一个工作文件窗口向另一个不同数据频率的工作文件窗口拷贝数据,或者从数据库提取数据,就有一个频
35、率转换的问题。存在两个数据频率转换方式:从高频率数据向低频率数据转换,如月度数据向季度数据转换;从低频率数据向高频率数据转换,如季度数据向月度数据转换。在序列窗口的菜单中选择View/Conversion Options,出现一个选择窗口:,左边是从高频率数据向低频率数据转换,有6种选择: 1观测值的平均值; 2观测值的和; 3第一个观测值; 4最后一个观测值; 5观测值的最大值; 6观测值的最小值。 Conversion propagates Nas选择项如果选上,则遇到缺少的数据就添上NA,如果不选,则在部分区间选值。,右边是从低频率数据向高频率数据的转换,有6种插值方法: 1常数与平均值
36、相匹配; 2常数与和相匹配; 3二次函数与平均值相匹配; 4二次函数与和相匹配; 5线性函数与最后的值相匹配; 6三次函数与最后的值相匹配。,4.6 命令,为了从已经存在的序列中产生一个新的序列,在Series或Genr命令后输入一个新序列的名字、一个等号和包括已存在序列的表达式: seires logy=log(y) 产生一个名为logy的新序列,它是序列y的自然对数。 为了产生一个新组,在Group命令后输入一个组名,包含在组中的一系列序列,它们之间用空格隔开: group rhs c x1 x2 z 产生一个名为rhs的组,它包含常数c (a series of ones)和序列x1、x
37、2、z。 为了观察序列或组,在Show命令后输入序列或组的名字: show logy 为了打开输入对话框,在Read命令后输入需要导入文件的完整名字(包括文件扩展名): read c:datecps88.dat 为了打开输出对话框,在Write命令后输入需要导出文件的完整名字(包括文件扩展名): write a:usmacro.dat,返回,第五章 数据操作,5.1 使用表达式,Eviews 提供了强大的对表达、产生和使用序列和数据的语言支持,Eviews中可以使用表达式。 5.1.1 表达式的使用 Eviews提供了广泛的运算符集和庞大的内建函数库。Eviews不仅提供了标准的数学运算和统计
38、运算,也提供了很多能够自动处理时间序列中的先行、滞后、差分等操作的特殊函数。 Eviews的表达式是由数字、序列名、函数、数学运算符、和关系运算符组成。,5.1.2 运算符 Eviews中包含的基本算术运算符分别是 +、-、*、/、(幂),例如: 5+6/13 、32-9 参加运算的数可以写为整数形式、十进制形式和科学计数法的形式。,另外 +、-还可以作为符号运算符来使用。比如:2+-2, Eviews各种运算符的优先级别为(从高到低): +(正号),-(负号) * / + - = = and or 最后2列用于逻辑运算。,Eviews的表达式是从左往右计算的,也可以使用括号来改变运算的先后顺
39、序。,5.1.3 序列表达式,Eviews的表达式还可以对样本序列的观测值进行操作,比如:,2*y+3 表示用2乘以y的每一个观测值之后加3。也可以在一个运算中使用多个序列。例:x/y+z,5.1.4 序列函数,Eviews提供的函数能够对当前样本的序列元素进行运算,一些函数是“元素函数”他们返回的是序列中每一个元素的值。有些是“整体函数”他们返回的是标量、向量和矩阵。这些函数一般在创建新序列时使用或在矩阵语言中使用。,Eviews中大多数函数前都有一个符号.例: mean 此函数可以计算一个序列的平均值。例: scalar s s=mean(x),5.1.5 序列元素,有时希望使用序列中的一
40、个实际观测值。 Eviews提供的elem函数可实现此操作,elem有两个参数,第一个参数是序列名,第二个参数是数据或观测值的标识符。例如:使用y序列中的1980:3的季度数据,则应写为:elem(y,1980:3)。非时间序列x的第323个数据: elem(x,323) 。,5.1.6 逻辑表达式,使用逻辑表达式来计算真假值。逻辑表达式能作为数学表达式的一部分、样本描述的一部分或在程序中作为if判断的一部分。例如:incm5000 这个表达式允许我们选择特殊条件的观测值,incm值大于5000,则就得到真值,否则得到假值。 通常,逻辑表达式中常用到比较运算符、=、=、。另外,还可以使用逻辑运
41、算符and、or组成更复杂的逻辑表达式。例如:incm5000 and educ=2000。注意:Eviews用1表示真,用0表示假。因此,可以用逻辑值参加数学运算。例如: (inc =2000),如果inc300,得1,否则得0。另外,= 既可以当赋值运算符,又可以当作比较运算符使用。现在,我们只要注意到=用于关系表达式中就表示是比较运算符。,5.1.7 先行指标、滞后指标和差分,处理序列中的先行、滞后指标是很容易的,只要在序列名后加一对小括号,括号中写上先行滞后的数字即可。滞后的数字用负号表示,先行的用正数表示。例如:income(-4)表示收入序列的四阶延迟的滞后指标。sales(2)表
42、示sales序列的超前二阶的先行指标。括号中的数要求是整数,但写入的数也可以不是整数,这时系统会自动把它转换成整数。如果转换不了系统会发出警告。如果必须使用非整型数,最好使用round、floor、ceil函数处理一下。 Eviews中有些地方,可以指定一个先行或滞后指标的分布。例如:在估计方程中可以有这样的表达式 income(-1 to -4) 这里描述的是一个从1到4的滞后指标的分布。例如: sales sales(-1) sales(-2) sales(-3) sales(-4) sales(0 to -4) sales(to -4) 是完全等价的。,Eviews也有几个函数可以处理差
43、分或先取对数后作差分。D函数和DLOG函数就可以实现此功能。例如: d(income) 等价于 income-income(-1) dlog(income) 等价于 log(income)-log(income(-1),并且这两个函数可以提供更高阶的差分计算。例如: d(income,4) dlog(income,4) 这是作四阶差分。,也可以既指定作季节差分,又指定作普通差分。例如: d(income,1,4) 等价于 d(income-income(-4) dlog(income,1,4) 等价于 d(log(income)-log(income(-4),如果只作季节差分,就把普通差分项设
44、为0。例如: d(income,0,4) 等价于 income-income(-4) dlog(income,0,4) 等价于 log(income)-log(income(-4),5.1.8 缺失数据,在处理数据时可能会遇到一些没有值或某一时段观测值没有用,或者进行了一些非法计算(例如用一个数除以0),Eviews使用空值NA表示这些情况。,5.2 序列的操作,表达式的一个主要用途是从一个存在的序列产生一个新序列或修正已存在的序列值。另外,表达式也允许你进行复杂的数据传送,并可以保存新序列或已经存在序列对象的结果。,5.2.1 建立一个新序列 选择quick/generate series或
45、者单击工作文件工具条上的“genr”按钮。Eviews会弹出一个窗口,你只要在上面的编辑框中写上分配表达式,并在下面编辑框中写上相应的样本空间即可。另外,你写入的表达式在计算时是针对每一个观测值的。,5.2.2 基本的赋值表达式,可以写一个序列的名字后加一个=,然后再写一个表达式。Eviews将会使用等号右边的表达式对每一个样本元素进行计算。并把相应的计算结果赋给等号左边的序列,如果有必要Eviews会创建一个新序列。例如: y=2*x+37*z 如果序列y不存在,则先建立一个序列,这时序列中的值都为空(NA),之后对于当前样本的每一个观测值,Eviews将会把通过表达式计算的结果赋给它们。如
46、果y已经存在了,则在当前的样本空间范围内用表达式计算的结果替换,而样本空间以外的观测值不替换。 如果等号右端是一个常量表达式,例如: y =3 则把样本空间中的所有观测值用常量代换。,5.2.3 使用样本,我们可以用表达式形式调整和使用已有样本的观测值,这时用 “Genr”按钮。例如:在上面的对话框中写入 y=z 在下面的对话框中写入 all if z=-1。 注意:建议使用Genr按钮和在尽可能多的地方使用样本表达式,因为这种方式更有效。,5.2.4 动态分配 也可以在目标序列中使用滞后的值进行动态分配。例如:一个年度工作文件,观测值是从1945-1997年,则如果在上面的编辑框中写入:y=
47、y+y(-1) 在下面的编辑框中写入:1946 1997 则Eviews将会用y序列的累加和来替换y序列。这是因为我们在移到下一个时间段时,则滞后的的那个序列的值已经包含了前几项的累加和。这就是动态分配。,5.2.5 暗示分配,通过在表达式左端的简单的表达式,你可以完成暗示分配操作。例如:log(y)=x 则按 y=exp(x) 计算。 通常Eviews只能处理: + - * / log( ) exp( ) sqr( ) d( ) dlog( ) inv( ) 这几种运算的暗示操作。除此以外其他的运算就不行了。例如:tdist(y,3)=x , 就不可以了。 另外,Eviews也不能在等号左边
48、多次出现目标序列的情况,例如:x+1/x=5就不可以。以上提到的两种情况Eviews都会出现提示信息。,5.2.6 命令窗口的方式,也可以使用命令在命令窗口中建立一个新序列,并为它们分配值。建立一个新序列,则必须使用关键字series或genr例如:series y=exp(x) genr y=exp(x) 一旦序列建立起来则在使用该序列时就不用这两个关键字了。,5.3 自动序列操作,在表达式中我们也可以使用一个表达式代替序列名字的位置。不管是序列、序列对象还是组元素,不管这些名字出现在等式中还是在模型中,都可以进行这样的替换。 代替序列名的表达式叫做自动序列。之所以叫自动序列,是因为如果信息有变化,数据的更新是自动进行的,而不需要我们额外写命令进行更新。所以自动序列中的数据总是新的。,5.3.1 创建自动序列,例如用图形的方式察看 年度cp序列取log后的值,这时我们可以用自动序列来实现。创建自动序列可以单击“show”按钮或选择主菜单上的“quick/show”然后键入:log(cp), Eviews会以表格打开一个序列窗口。在显示序列名字的地方就显示log(cp),则就建立了一个自动序列。我们就可以象对其他序列一样对自动序列进行任何操作。要以图形方式显示此序列只要选view/line graph 就
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 46940-2025中医药中医临床术语系统分类框架
- 海外领事保护培训课件
- 电子数据取证分析师岗前操作规范考核试卷含答案
- 布艺工操作能力竞赛考核试卷含答案
- 船舶机工岗前个人技能考核试卷含答案
- 润滑油调合操作工岗前情绪管理考核试卷含答案
- 渔网具工测试验证测试考核试卷含答案
- 动物胶提胶浓缩工创新思维强化考核试卷含答案
- 酒店员工职业发展与晋升通道制度
- 浪费培训教学课件
- 2026年上半年眉山天府新区公开选调事业单位工作人员的参考题库附答案
- 供应室护士长年底工作总结
- 水产养殖技术手册
- 英国汽车工业市场分析现状供需格局投资前景未来规划研究报告
- 血液净化中心护士长2025年度述职报告
- 2025年及未来5年市场数据中国吸塑、注塑行业发展前景预测及投资战略数据分析研究报告
- 眼科医疗风险防范培训
- 物流金融理论与实务课件
- 海内外云厂商发展与现状(三):资本开支压力与海外云厂需求情况拆解-国信证券
- 2025年社区网格员招录考试真题库(含答案)
- 2025年新疆中考道德与法治试卷(含答案)
评论
0/150
提交评论