《经济管理定量分析高级方法》实验指导书.doc_第1页
《经济管理定量分析高级方法》实验指导书.doc_第2页
《经济管理定量分析高级方法》实验指导书.doc_第3页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经济管理定量分析高级方法实验指导书经济管理定量分析高级方法实 验 指 导 书康继军 编重庆大学经济与工商管理学院2007 年 7 月目 录实验1 非线性回归模型估计(2)实验2 工具变量估计与虚拟变量应用(9)实验3 模型诊断与检验方法(15)实验4 时间序列估计实验(22)实验1 非线性回归模型估计实验 一、实验目的通过本次实验,学会使用两种非线性回归模型的估计方法:(1)通过线性化的方式估计非线性回归模型;(2)直接估计非线性回归模型。二、实验安排1学时: 本实验安排4个学时,主要用于完成实验及实验报告。2时间: 由实验室统一安排3地点: 由实验室统一安排三、实验原理、内容、方法和步骤:(1)实验要求1通过实例演示,学会使用两种非线性回归模型的估计方法;2熟悉使用EVIEWS软件进行非线性回归模型估计的操作方法;(2)实验内容某硫酸厂生产的硫酸的透明度指标一直达不到优质的要求,经过分析透明度低与硫酸中的金属杂质含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。测量了47组样本值,数据如表11,硫酸透明度(y)与铁杂质含量(x)的散点图如图11,应该建立非线性回归模型。表11硫酸透明度(y)与铁杂质含量(x)数据序数yx序数yx序数yx1190311750523340742190321860533425763180341944543530794140352054543625855150362148563716876120372250563816897110392356583920998814024525840207691004225506041201001080422641604220100111104327526143151101280432834634415110136848294064452712214804930256546201541550503130694720210167052322074图12硫酸透明度(y)与铁杂质含量(x)散点图1通过线性化的方式估计非线性回归模型先建立倒数模型。首先建立工作文件。从工作文件主菜单中点击Quick键,选择Estimate Equation功能,在弹出的对话框的Equation Specification(方程设定) 选择框输入1/y c 1/x点击OK键,得到估计结果如图12,对应的表达式是:1/Y = 0.06927695796 - 2.372132322*1/Xt-value (18.6)* (-11.9) *R2=0.76, s.e.=0.009, F=143可决系数R2=0.76。图12实际上,如果建立指数函数,拟合的效果会更好。打开方程设定(Equation specification)对话框,输入估计命令,log(y) c 1/x点击OK键,得到估计结果如图13,对应的表达式是:LOG(Y) = 1.993732697 + 104.5194751*(1/X)t-value (21.97)* (21.64) * R2=0.91, s.e.=0.22, F=468, 把表达式还原为指数形式,Lny=Ln(7.33)+104.5(1/x) 式(1.1)y = 7.33e105.5(1/x)可决系数R2由0.76提高到0. 91,可见拟合为指数函数比倒数函数效果好。图13散点图与拟合的指数曲线见图14.图14EViews的操作步骤是,打开x,y数据组窗口,点击View键,选Graph/Scatter/Scatter with Regression功能(见图15).图15在随后弹出的对话框中y和x选对数和倒数形式(如图16),点击OK,就得到了图14.图16注意,对数变量和倒数变量也可以通过生成新序列的方式定义新的变量,然后用新变量进行估计,回归结果是一样的,例如把对数变量log(y)定义成Lny,倒数变量1x定义为z,这样估计命令为:Lny c z这一估计命令不如原估计命令“log(y) c 1/x”好,因为在预测时,前者只能得到Lny的预测值,而后者即可以得到Lny的预测值,也可以得到y的预测值,而我们通常更关心y的预测结果。2直接估计非线性回归模型EViews的估计方法是直接书写非线性形式的命令,操作步骤如下。从工作文件的主菜单从工作文件主菜单中点击Quick键,选择Estimate Equation功能,在弹出的对话框的Equation Specification(方程设定) 选择框输入指数形式的估计命令:Y=c(1)*EXP(C(2)*(1/X)如图17所示。其中C(1)、C(2)表示被估参数,EXP(.)表示指数函数形式。图17在Method(估计方法)对话框内默认的选择就是LS Least Squares (NLS and ARMA),其中NLS表示非线性最小二乘估计,即直接采用非线性函数回归形式估计参数。点击OK键,输出结果如图18.图18对应的非线性估计结果是: 式(1.2)式(1.2)比式(1.1)的估计结果更好,因为可决系数R2由0.91提高到0.96。当x=82时,y的预测值为28.11.实验2 工具变量估计与虚拟变量应用实验 一、实验目的通过本次实验,掌握工具变量估计方法和虚拟变量的应用方法。二、实验安排1学时: 本实验安排4个学时,主要用于完成实验及实验报告。2时间: 由实验室统一安排3地点: 由实验室统一安排三、实验原理、内容、方法和步骤(1)实验要求1通过实例演示,学会使用工具变量估计方法和虚拟变量的应用方法;2熟悉使用EVIEWS软件进行工具变量估计和虚拟变量应用的操作方法;(2)实验内容参照下面的实验方法和步骤,进行工具变量估计和虚拟变量的应用操作,并得出结果。(3)实验方法和步骤1. 工具变量估计:19781998年中国国内生产总值GDPt 、宏观消费CONSt 、资本形成总额CAPIt数据见表21.表21 GDPt 、CONSt 、CAPIt 数据 (单位:亿元)年份国内生产总值宏观消费资本形成总额年份国内生产总值宏观消费资本形成总额yearGDPtCONStCAPItyearGDPtCONStCAPIt19783605.52239.11377.919891646610556.5609519794073.92619.41474.2199018319.511365.2644419804551.32976.11590199121280.413145.9751719814901.43309.11581199225863.615952.1963619825489.23637.91760.2199334500.620182.11499819836076.34020.52005199447110.927216.219260.619847164.34694.52468.6199558510.5336352387719858792.157733386199668330.440003.926867.2198610132.865423846199774894.343579.428457.61987117847451.24322199879853.346405.9303961988147049360.15495建立宏观消费模型:得到估计结果如下:模型中宏观消费CONSt是随机变量。因为CONSt是国内生产总值GDPt的一部分,所以GDPt也应该是随机变量,这就违反了模型中解释变量非随机的假定。而且GDPt也必然与ut高度相关,估计结果还显示模型存在严重的自相关,所以应该选择一个工具变量设法替代变量GDPt。资本形成总额CAPIt是GDPt的一部分,与GDPt高度相关。经过计算,以上模型的残差与CAPIt的相关系数为-0.03,这在一定程度上说明了CAPIt与ut不相关。基于上述理由,选择CAPIt做GDPt的工具变量。具体操作方法:从EViews主菜单中点击Quick键,并选择Estimate Equation功能,打开Equation Specification(模型设定)对话框。点击Method窗口,选择TSLS(两阶段最小二乘)估计方法,如图21.图21点击OK键,从而打开如图22的对话框,在Equation Specification选择区输入命令:cons c gdp其中cons表示CONSt,c表示截距项,gdp表示GDPt。在Instrument list(列写工具变量)选择区输入命令:c cpi表示用CAPIt和c(截距项)做工具变量(c可以省略不写,EViews程序会自动加入)。点击OK键,得到结果如图23.图22图23因此相应的回归式是:630.2961和0.5726分别是和的工具变量法估计值。2. 虚拟变量的应用:1982:11985:4中国季度酒销量(yt,万吨)数据如表22,序列见图24.这是一个季度时间序列数据,呈明显的季节变化特征,建立模型时应该加入季节虚拟变量以反映季节特征。表22 全国酒销量(yt,万吨) 季度数据时间ytD1时间ytD11982Q192.711984Q1107.911982Q279.301984Q296.701982Q380.101984Q397.801982Q486.701984Q493.601983Q1104.111985Q1111.511983Q289.701985Q298.401983Q390.201985Q397.701983Q490.201985Q4940图2-4EViews中有专门定义季节虚拟变量的命令,操作如下:从工作文件主菜单中点击Quick键,选Generate Series功能,如图25,在弹出的对话框中填入D1=seas(1),如图26,定义虚拟变量D1,D1的具体取值见表22.同理可定义虚拟变量D2和D3。图25图26执行EViews估计命令:y c trend(1982.1) d1 d2 d3估计结果见图27.图27从图27可以看出,D2、D3的回归参数没有显著性,说明不需要把第2季度和第3季度单独分类。从模型中删除这两个变量,执行估计命令:y c trend(1982.1) d1估计结果如图28.图28相应的估计式是:回归结果表明对于该组数据,只需要把第一季度区别于其他3个季度就可以了。如果感觉DW值比较小,可以采用进一步的方法提高DW值,例如:图29实验3 模型诊断与检验方法实验 一、实验目的通过本次实验,熟悉和掌握4种模型诊断与检验方法:CHOW突变点检验;CHOW模型稳定性检验;似然比检验;WALD检验。二、实验安排1学时: 本实验安排4个学时,主要用于完成实验及实验报告。2时间: 由实验室统一安排3地点: 由实验室统一安排三、实验原理、内容、方法和步骤(1)实验要求1通过实例演示,掌握4种模型诊断与检验方法:CHOW突变点检验;CHOW模型稳定性检验;似然比检验;WALD检验;2熟悉使用EVIEWS软件进行掌握4种模型诊断与检验方法的操作方法;(2)实验内容参照下面的实验方法和步骤,进行4种模型诊断与检验方法的应用操作并得出结果。(3)实验方法和步骤1. 邹突变点检验(Chow Breakpoint Tests)邹突变点检验由邹至庄1960年提出,用于检验模型参数在样本范围内某一点是否发生变化。19852002年中国家用汽车拥有量(yt,万辆)与城镇居民家庭人均可支配收入(xt,元),数据见表31.表31中国家用汽车拥有量(yt)与城镇居民家庭人均可支配收入(xt)数据年份yt(万辆)x t(元)年份yt(万辆)x t(元)198528.49739.11994205.423496.2198634.71899.61995249.964283198742.291002.21996289.674838.9198860.421181.41997358.365160.3198973.121375.71998423.655425.1199081.621510.21999533.885854199196.041700.62000625.3362801992118.22026.62001770.786859.61993155.772577.42002968.987702.8图31图31是关于yt 和xt的散点图,从图中看1996年应该是一个突变点。当城镇居民人均可支配收入突破4838.9元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是否是一个突变点。原假设是两个子样本(19851995年,19962002年)相对应的模型回归参数相等,备择假设是两个子样本对应的回归参数不相等。在19852002年样本区间作如下回归,y c x点击回归结果窗口中的View键,选Stability tests/Chow Breakpoint Test功能,如图32. 图32 图33在随后弹出的对话框中填入1996(如图33),点击OK键,得到检验结果如图34.因为F2720.7远远位于临界值的右侧,所以推翻原假设,结论为1996年是突变点。图342. 邹模型稳定性检验(Chow Forecast Test)仍然使用表31的数据,在用19851999年数据建立的模型基础上,检验当把20002002年数据加入样本后,模型的回归参数是否出现显著性变化。由于已知1996年为结构突变点,所以设定虚拟变量,以区别两个不同的时期。用19852002年数据按以下命令回归,y c x d1 x*d1在回归结果窗口中点击View键,选Stability tests/Chow Forecast Test功能,如图35. 图35 图36在随后弹出的对话框中填入200 2001 2002(如图36).点击OK键,得到的检验结果如图37.图37由于F值对应的概率为0.73,说明F0.43,位于临界值左侧(原假设接受域),所以接受原假设,结论为模型加入2000,2001,2002年的样本值后,回归参数没有发生显著性变化。3. 似然比检验(LR Test)似然比检验、wald检验、拉格朗日乘数检验都基于MLE(Maximum likelihood estimation:极大似然估计),就大样本而言三者是渐进等价的。1)、似然比检验的思想是:如果参数约束是有效的,那么加上这样的约束不应该引起似然函数最大值的大幅度降低。也就是说似然比检验的实质是在比较有约束条件下的似然函数最大值与无约束条件下似然函数最大值。似然比定义为有约束条件下的似然函数最大值与无约束条件下似然函数最大值之比。以似然比为基础可以构造一个服从卡方分布统计量(具体形式参见Greene)。2)、wald检验的思想是:如果约束是有效的,那么在没有约束情况下估计出来的估计量应该渐进地满足约束条件,因为MLE是一致的。以无约束估计量为基础可以构造一个Wald统计量(具体形式参见Greene),这个统计量也服从卡方分布;3)、拉格朗日乘数检验(LM)的思想是:在约束条件下,可以用拉格朗日方法构造目标函数。如果约束有效,则最大化拉格朗日函数所得估计量应位于最大化无约束所得参数估计值附近。这里也是构造一个LM统计量(具体形式参见Greene),该统计量服从卡方分布。对于似然比检验,既需要估计有约束的模型,也需要估计无约束的模型;对于Wald检验,只需要估计无约束模型;对于LM检验,只需要估计有约束的模型。一般情况下,由于估计有约束模型相对更复杂,所以Wald检验最为常用。对于小样本而言,似然比检验的渐进性最好,LM检验也较好,Wald检验有时会拒绝原假设,其小样本性质不尽如人意。例:有中国国债发现总量(DEBTt,亿元)模型如下: 式(31)其中GDPt表示年国内生产总值(百亿元),DEFt表示年财政赤字额(亿元),REPAYt表示年还本付息额(亿元),用19802000年的数据,见表32得到估计结果如图38.表32 国债发行总量(DEBTt)、GDPt、财政赤字(DEFt)、年还本付息(REPAYt)数据年份DEFt(亿元)GDPt(百亿元)DEFt(亿元)REPAYt(亿元)198043.0145.17868.928.581981121.7448.624-37.3862.89198283.8652.94717.6555.52198379.4159.34542.5742.47198477.3471.7158.1628.9198589.8589.644-0.5739.561986138.25102.02282.950.171987223.55119.62562.8379.831988270.78149.283133.9776.761989407.97169.092158.8872.371990375.45185.479146.49190.071991461.4216.178237.14246.81992669.68266.381258.83438.571993739.22346.344293.35336.2219941175.25467.594574.52499.3619951549.76584.781581.52882.9619961967.28678.846529.561355.0319972476.82744.626582.421918.3719983310.93783.452922.232352.9219993715.03820.67461743.591910.5320004180.1894.4222491.271579.8220014604959.3332516.542007.73图38在用似然比(LR)统计量检验约束GDPt对应回归系数等于零是否成立。检验过程是:在输出结果图38窗口中点击View键,选Coefficient tests/Redundant Variables-Likelihood Ratio功能,如图39.在随后弹出的对话框中填入GDP(如图310),点击OK键,得到检验结果如图311. 图39 图310图311输出结果的上部给出了关于约束GDP系数为零的F检验和LR检验两种结果,因为相应概率均小于0.05,表明F和LR统计量的值都落在了相应的临界值的右边,即原假设的拒绝域,所以结论是:GDP系数为零的约束不成立。模型中应该保留解释变量GDP。图38给出的是非约束模型的估计结果,图311的下半部分的回归是约束模型(去掉了GDP变量)的估计结果。这一检验也可以以图311下部的回归为基础做,检验路径是,在回归窗口中点击View键,选Coefficient tests/Omitted Variables-Likelihood Ratio 功能,在随后弹出的对话框中也填入GDP,则检验结果与图311的上部结果相同。第一种方法是以非约束模型为基础做LR检验,第二种方法是以约束模型为基础做LR检验。注意:似然比(LR)统计量只能检验线性约束。4. Wald检验仍然以表32的数据为例介绍EViews的Wald检验。在输出结果图38窗口中点击View键,选Coefficient tests/Wald-Coefficient Restrication功能,如图3-12.然后在随后弹出的对话框中填入3*c(2)=c(3),如图313. 图312 图313其中c(2)代表GDPt的回归参数,c(3)代表DEFt的回归参数.点击OK键,得到结果如图314.图315输出结果的上部给出了关于约束条件3*c(2)=c(3)是否成立的Wald检验结果,其中包括F和LR两个统计量。因为相应的概率都大于0.05,表明F和LR统计量的值都落在了相应临界值的左边,济原假设的接受域,所以结论是,约束条件3*c(2)=c(3)成立,是的3倍。图315的下部给出约束条件3*c(2)c(3)=0的样本值和样本标准差。实验4 时间序列估计实验 一、实验目的通过本次实验,要求掌握以下内容:画时间序列图;求时间序列的相关图和偏相关图,识别模型形式;时间序列模型估计;样本外预测。二、实验安排1学时: 本实验安排4个学时,主要用于完成实验及实验报告。2时间: 由实验室统一安排3地点: 由实验室统一安排三、实验原理、内容、方法和步骤(1)实验要求1通过实例演示,掌握时间序列模型的基本估计方法;2熟悉使用EVIEWS软件进行掌握时间序列模型估计的操作方法;(2)实验内容参照下面的实验方法和步骤,进行时间序列模型估计的应用操作,并得出结果。(3)实验方法和步骤本实验以19492001年中国人口时间序列数据(表41)为例。表41 中国人口时间序列数据 (单位:亿人)年份人口yt年份人口yt年份人口yt年份人口yt年份人口yt19495.416719606.620719718.5229198210.159199311.851719505.519619616.585919728.7177198310.2764199411.98519515.6319626.729519738.9211198410.3876199512.112119525.748219636.917219749.0859198510.5851199612.238919535.879619647.049919759.242198610.7507199712.362619546.026619657.253819769.3717198710.93199812.476119556.146519667.454219779.4974198811.1026199912.578619566.282819677.636819789.6259198911.2704200012.674319576.465319687.853419799.7542199011.4333200112.762719586.599419698.067119809.8705199111.582319596.720719708.2992198110.0072199211.71711. 画时间序列图打开工作文件窗口,双击所要选择的中国人口变量yt,从而打开yt的数据窗口。点击View键,选择Graph/Line功能(如图4-1),就可以得到中国人口时间序列图,如图4-2图41图42从EViews主菜单中点击Quick键,选择Graph / Line Graph功能(见图4-3),在随后弹出的对话框中填入d(y),点击OK键,就可以得到中国人口差分序列图 (见图4-4). 图43 图44从人口序列图和人口差分序列图可以看出我国人口总水平除在1960年和1961年两年出现回落外,其余年份基本保持线性增长趋势。52年间平均每年增加人口1412.6923万人,年平均增长率为16.6。由于总人口数逐年增加,实际上的年人口增长率是逐年下降的。把52年分为两个时期,即改革开放以前的时期(19491978年)和改革开放以后时期(19792001年),则前一个时期的人口年平均增长率为20.0,后一个时期的年平均增长率为12.3,从人口序列yt的变化特征看,这是一个非平稳序列。2. 求中国人口序列的相关图和偏相关图,识别模型形式在中国人口序列yt数据窗口中点击View键、选择Correlogram功能(见图45),可以得到对话框(见图46).其中包括两种选择:对原变量(Level)还是对其一阶差分变量(1st difference)、二阶差分变量(2nd difference)求相关图。此项的默认选择是Level。对于本例,选择Level,即选择对yt画相关图、偏相关图。另一项选择是确定相关图的滞后期(Lags to include),这里选择的是10.点击OK键,可以得到yt的相关图、偏相关图(如图47).图的左侧给出的是yt的相关图、偏相关图,右侧给出的是相对于每一个滞后期的估计的自相关系数和偏相关系数值。Q-Stat所对应的列是相应自由度的Q统计量的值。最右侧Prob列的数字表示相应自由度条件下统计量取值大于相应Q值的概率。 图45 图46图47在图46中选择一阶差分变量(1st difference),可以得到dyt的相关图、偏相关图(见图48).图48由图47中相关图衰减的很慢,知道中国人口序列yt是非平稳序列,而图48中相关图呈现指数衰减特征可知dyt是平稳序列。通过初步分析,认定dyt是一个1阶或2阶自回归过程。假定先估计AR(2)模型。3. 时间序列模型估计从EViews主菜单中点击Quick键,选择Estimate Equation功能,在随即弹出Equation specification对话框中输入AR(2)模型估计命令如下:D(Y) c AR(1) AR(2)将样本区间改为19492000年,留下2001年的值用于计算预测精度。点击OK键,可得到估计结果如图49所示。图49由于AR(2)项,即Dyt-2的系数不显著,因此点击Estimate键,从估计命令中剔除AR(2)项继续估计,则得到估计结果如图410.图410对应的模型表达式为:或者直接写为:输出结果中的0.1429是Dyt的均值,表示年平均人口增量是0.1429亿人。整理上述输出结果得到:漂移项0.0547,表示线性趋势的增长速度。从图410输出结果的最后一行知,特征根是10.621.61,满足平稳性要求。点击View选择Residuals Tests/Correlogram-Q-Statistics功能,如图411,可以得到如图412的对话框,选择滞后期为10,点击OK键,可得到如图413的结果。 图411 图412图413由于右侧一列概率值都大于0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论