spss多元回归及非线性_第1页
spss多元回归及非线性_第2页
spss多元回归及非线性_第3页
spss多元回归及非线性_第4页
spss多元回归及非线性_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元回归分析回归线性,拟合优度检验总离差平方和(tss)=回归平方和(ess)+残差平方和(rss);可决系数的取值范围:0,1 。 R2越接近1,说明实际观测点离样本线越近,拟合优度高。由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。调整的可决系数思路是:将残差平方和与总离差平方和分别除以各自的自由度(df),以剔除变量个数对拟合优度的影响:(2)方程总体线性的显著性检验(F检验 H0: b1=b2= ¼ =bk=0 H1: bj不全为0 F> Fa(k,n-k-1) 或 F£Fa(k,n-k-1)来拒绝或接受原假设H0,以判定原方程总体上的线性关系是

2、否显著成立。 (3)变量的显著性检验 (t检验)如果变量X对Y的影响是显著的,那么X前的参数应该显著的不为0检验步骤:1)对总体参数提出假设H0: b1=0, H1:b1¹0若|t|> t a/2(n-2),则拒绝H0,接受H1;(小概率事件发生)若|t|£ t a/2(n-2),则接受H0 ;看指标选模型· 拟合程度Adjusted R2: 越接近1拟合程度越好· 回归方程的显著性检验F统计量的值,及其Sig· 回归系数表回归系数B和显著性检验Sig(4)满足基本要求的样本容量 从统计检验的角度: n>30 时,Z检验才能应用;

3、n-k³8时, t分布较为稳定 四、预测一元或多元模型预测的SPSS实现:特征根和方差比 特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法。最大特征根的值远远大于其他特征根的值,则说明这些解释变量间具有相当多的重叠信息,原因是仅通过这一个特征根就基本刻画出了所有解释变量的绝大部分信息。解释变量标准化后它的方差为1。如果某个特征根既能够刻画某解释变量方差的较大部分(0.7以上),同时又可以刻画另一根解释变量方差的较大部分,则说明这两个解释变量间存在较强的线性相关关系。4、条件指数条件指数反映解释变量间多重共线性的指标。当0<=Ki<10时,多重共线性较弱;当1

4、0<=Ki<100时,认为多重共线性较强;Ki>=100时,认为多重共线性很强。v 分析回归线性绘制选正态概率图继续确定查看输出窗口数据点围绕基准线还存在一定的规律性。v 分析回归线性保存,选残差中的标准化继续确定分析非参数检验1样本k-s(1)把standardized residual 放入检验变量列表确定查看输出窗口,sig(p)表明标准化残差和标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。(该要求是要求残差服从正态分布)v 分析回归线性保存,选距离中cook距离,杠杆值继续确定查看输出窗口没有发现强影响点。(库克距离大于1对应的解释变量为强影响点。

5、杠杆值越高,对应的解释变量就越可能是强影响点)曲线估计分析预测序列图把在外就餐放入变量框分析回归曲线估计因变量在外就餐;自变量年份模型选指数分布,点保存。非线性预测估计R 方 = 1 -(残差平方和)/(已更正的平方和)相关术语ZRE残差标准话 ZPR预测值标准化 LEV距离杠杆值 FIT预测值时间序列1 数据的平稳性及其检验一、时间序列数据的平稳性。如果 满足下列条件:1)均值 与时间t 无关的常数; 2)方差 与时间t 无关的常数;3)协方差 只与时期间隔k有关,与时间t 无关的常数。则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationary s

6、tochastic process)若时间序列 是一具有零均值同方差的独立分布序列: ()该序列常被称为是一个白噪声(white noise)如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。检验样本自相关函数及其图形来判断平稳时间序列首先定义随机时间序列的自相关函数,实际上我们对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数随着k的增加,样本自相关函数下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列快得多,检验对所有k>0,自相关系数都为0的联合假设,这可通过如下统计量,Q值大于显著性水平为的临界值,拒绝所有(k>0)同时为0的假设,软件:

7、检验哪个序列,就打开该序列,点击菜单view 下拉菜单corrdlogram,选择level,表示对原始序列的平稳性检验,lags to include处,输入原始序列长度的一半或者稍小于一半的数值。点击确定。若概率很小,说明原序列并不是自相关系数均为零的。说明原序列是非随机的。如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。这也正是随机时间序列分析模型的优势所在。四、随机时间序列模型的识别工具主要是时间序列的自相关函数(autocorrelation function)ACF及偏自相关函数(partial autocorrelation

8、 function)PACF。偏自相关函数自相关函数ACF(k)给出了与的总体相关性,偏自相关函数(partial autocorrelation,PACF)则是消除了中间变量, 带来的间接相关后的直接相关性,它是在已知序列值,的条件下,与间关系的度量。因此,在AR(1)中,从中去掉的影响,则只剩下随机扰动项,显然它与无关,因此我们说与的偏自相关系数为零,记为AR(p)的一个主要特征是时,即偏自相关函数在p以后是截尾的识别规则:若的偏自相关函数在p阶以后截尾,即时,=0,而它的自相关函数是拖尾的,则此序列是自回归AR(p)序列。MA(q)过程识别规则:若随机序列的自相关函数截尾,即自q以后 ,

9、而它的偏自相关函数是拖尾的,则此序列是移动平均MA(q)序列。 ARMA(p,q)模型的ACF与PACF理论模式模型ACFPACF白噪声AR(p)衰减趋于零(几何型或振荡型)P阶后截尾:,k>pMA(q)q阶后截尾:,k>q衰减趋于零(几何型或振荡型)ARMA(p,q)q阶后衰减趋于零(几何型或振荡型)p阶后衰减趋于零(几何型或振荡型)六、模型的估计点击工作窗口quick下拉菜单中estimate equation 在弹出的窗口中书写模型变量,Y建立ARMA(2,2)模型,Y c AR(1) AR(2) MA(1) MA(2)七、模型的检验由于ARMA(p,q)模型的识别与估计是在

10、假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模型确认正确的话,残差应代表一白噪声序列。如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。在实际检验时,主要检验残差序列是否存在自相关。可用第一节提出的统计量进行检验八、软件实现在估计结结果窗口的view,residual test 中的Correlogram Q-statistics功能选择的滞后期随意,尽可能的多或样本的一半。得到残差项的自相关系数和偏自相关系数值。Q-stat所对应的列是相应自由度的Q统计量的值,最右侧Prob列中的数字表示相应自由度条件下统计量取值大于相应值得概率。如

11、果这一列概率值都大于0.05,说明所有值都小于检验水平为0.05的分布临界值(位于临界值左侧)。结论是模型的随机误差项序列是一个白噪声序列(1) 绘制该序列的时序图。(2)自相关图检验。看autocorrelation)(3)纯随机性检验,看统计量的P值,若P值很小<0.05,说明我们有95%,属于非白噪声序列。(看Q-stat与prob)下面非白噪声序列进行建模及预测。原假设:该序列是白噪声序列,在原假设成立的条件下得到的Q统计量(看右侧第二列,)以及得到Q统计量的概率,发现是小概率事件,故拒绝原假设,即原序列不是白噪声序列(5)在考察样本偏自相关系数图。(6)估计。在eviews估计

12、窗口中,导入序列y,在估计窗口输入y c y(-1),单击主窗口中的菜单Quick-Estimate equation,在空白对话框中依次输入y c y(-1)单击Ok。至此,得到估计结果。点击估计结果窗口name,给方程命名,默认即可。主窗口空白处书写:genr e=resid,回车也可估计结果窗口,点菜单view,下拉菜单中选择Actual,Fitted,residualActual,Fitted,residual Table,复制residual一列。(7)检验 A、主要是看模型提取的信息是否充分看残差序列view下拉菜单中的correlation,出现的图中看得到统计量的P值,若P值均

13、较大,说明残差序列是一个白噪声序列。B、参数的显著性。检验每一个待估计的参数是否显著非零,这个检验的目的是为了使模型精简。1. 序列预处理。看该序列的图形发现无明显趋势或周期,波动稳定。2. 根据相关图的自相关系数的2阶截尾,可以尝试MA(2)3. 根据偏自相关的1阶截尾,尝试拟合AR(1)。比较(越大越好), (越小越好),预测1)扩大区间:双击range和sample区域,在弹出的对话框中,将70,改为71。22) 在估计结果窗口,点forecast,在弹出的窗口处 更改method处,点选static forecast,其他默认即可。在workfile窗口就出现了yf序列,第71个数据就

14、是预测值。具体步骤1,、模型识别1)数据录入 打开Eviews软件,选择“File”菜单中的“New-Workfile”选项,在“Workfile structure type”栏选择“Unstructured /Undated”,在“Date range”栏中输入数据个数201,点击ok,见图2-1,这样就建立了一个工作文件。点击File/Import,找到相应的Excel数据集,打开数据集,出现图2-2的窗口,在“Data order”选项中选择“By observation”即按照观察值顺序录入,第一个数据是从a2开始的,所以在“Upper-left data cell”中输入a2,本例

15、只有一列数据,在“Names for series or number if named in file”中输入序列的名字production或1,点击ok,则录入了数据。(2)绘制序列时序图双击序列production,点击view/Graph/line,则出现图2-3的序列时序图,时序图看出201个连续生产的数据是平稳的,这个判断比较粗糙,需要用统计方法进一步验证。(3)绘制序列相关图双击序列production,点击view/Correlogram,出现图2-4,我们对原始数据序列做相关图,因此在“Correlogram of”对话框中选择“Level”即表示对原始序列做相关,(4)AD

16、F检验序列的平稳性通过时序图和相关图判断序列是平稳的,我们通过统计检验来进一步证实这个结论,双击序列production,点击view/unit root test,(5)模型定阶1看,偏自相关系数在k=n,尝试拟合AR(n),自相关系数在k=m处显著不为0,考虑拟合MA(m)同时可以考虑ARMA(n,m)模型等,点击主菜单Quick/Generate Series,在对话框中输入赋值语句Series x=production-84.11940,2、模型参数估计(1)尝试AR模型在主菜单选择Quick/Estimate Equation,x ar(1) ar(2) ar(3) ar(i)(i=

17、1,2)表示自回归系数;(2) 尝试MA模型,方程定义空白区键入x ma(1) ma(2)(其中ma(j),j=1,2代表移动平均系数)或在主窗口输入ls x ma(1) ma(2) 。(3) 尝试ARMA模型;在主窗口命令栏输入ls x ar(1) ar(2) ar(3) ma(1),由参数估计结果经过进一步筛选,同一个平稳序列建立多个适合模型,但比较AIC和SC的值,以及综合考虑其他检验统计量,考虑模型的简约原则,3、模型检验参数估计后,应对拟合模型的适应性进行检验,实质是对模型残差序列进行白噪声检验。若残差序列不是白噪声,说明还有一些重要信息没被提取,应重新设定模型。可以对残差进行纯随机性检验,也可用针对残差的检验。通常有两种方法进行检验。当一个模型估计完毕之后,会自动生成一个对象resid,它便是估计模型的残差序列值,对其进行相关图分析便可看出检验结果;另一种方法是在方程输出窗口中点击View/Residual Tests/Correlogram-Q-Statistics,输入相应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论