spss多元回归及非线性_第1页
spss多元回归及非线性_第2页
spss多元回归及非线性_第3页
spss多元回归及非线性_第4页
spss多元回归及非线性_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元回归多元回归 分析分析 回归回归 线性 线性 拟合优度检验拟合优度检验 总离差平方和 总离差平方和 tss 回归平方和 回归平方和 ess 残差平方和 残差平方和 rss 可决系数可决系数的取值范围 取值范围 0 1 R2越接近越接近 1 说明实际观测点离样本线越近 拟合优度高 说明实际观测点离样本线越近 拟合优度高 由增加解释变量个数引起的由增加解释变量个数引起的 R2的增大与拟合好坏无关 的增大与拟合好坏无关 R2需调整 需调整 调整的可决系数思路是调整的可决系数思路是 将残差平方和与总离差平方和分别除以各自的自由度 将残差平方和与总离差平方和分别除以各自的自由度 df 以剔 以剔 除变量个数对拟合优度的影响除变量个数对拟合优度的影响 2 方程总体线性的显著性检验 方程总体线性的显著性检验 F 检验检验 H0 1 2 k 0 H1 j不全为不全为 0 F F k n k 1 或或 F F k n k 1 来拒绝或接受原假设来拒绝或接受原假设 H0 以判定原方程总体上的线性关系是否显著成立 以判定原方程总体上的线性关系是否显著成立 3 变量的显著性检验 变量的显著性检验 t 检验 检验 如果变量如果变量 X 对对 Y 的影响是显著的 那么的影响是显著的 那么 X 前的参数应该显著的不为前的参数应该显著的不为 0 检验步骤 检验步骤 1 对总体参数提出假设 对总体参数提出假设 H0 1 0 H1 1 0 若若 t t 2 n 2 则拒绝 则拒绝 H0 接受 接受 H1 小概率事件发生 小概率事件发生 若若 t t 2 n 2 则接受 则接受 H0 看指标选模型看指标选模型 拟合程度拟合程度 Adjusted R2 越接近 越接近 1 拟合程度越好拟合程度越好 回归方程的显著性检验回归方程的显著性检验 F 统计量的值 及其统计量的值 及其 Sig 回归系数表回归系数回归系数表回归系数 B 和显著性检验和显著性检验 Sig 4 满足基本要求的样本容量 满足基本要求的样本容量 从统计检验的角度 从统计检验的角度 n 30 时 时 Z 检验才能应用 检验才能应用 n k 8 时时 t 分布较为稳定分布较为稳定 四 预测四 预测 一元或多元模型预测的一元或多元模型预测的 SPSS 实现 实现 特征根和方差比特征根和方差比 特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法 最大特征根的值特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法 最大特征根的值 远远大于其他特征根的值 则说明这些解释变量间具有相当多的重叠信息 原因是仅通过远远大于其他特征根的值 则说明这些解释变量间具有相当多的重叠信息 原因是仅通过 这一个特征根就基本刻画出了所有解释变量的绝大部分信息 这一个特征根就基本刻画出了所有解释变量的绝大部分信息 解释变量标准化后它的方差为解释变量标准化后它的方差为 1 如果某个特征根既能够刻画某解释变量方差的较大部分 如果某个特征根既能够刻画某解释变量方差的较大部分 0 7 以上 以上 同时又可以刻画另一根解释变量方差的较大部分 则说明这两个解释变量间 同时又可以刻画另一根解释变量方差的较大部分 则说明这两个解释变量间 存在较强的线性相关关系 存在较强的线性相关关系 4 条件指数 条件指数 条件指数反映解释变量间多重共线性的指标 当条件指数反映解释变量间多重共线性的指标 当 0 Ki 10 时 多重共线性较弱 当时 多重共线性较弱 当 10 Ki 100 时 认为多重共线性很强 时 认为多重共线性很强 分析分析 回归回归 线性线性 绘制绘制 选正态概率图选正态概率图 继续继续 确定确定 查看输出查看输出 窗口窗口 数据点围绕基准线还存在一定的规律性 数据点围绕基准线还存在一定的规律性 分析分析 回归回归 线性线性 保存 选残差中的标准化保存 选残差中的标准化 继续继续 确定确定 分析分析 非参数检验非参数检验 1 样本样本 k s 1 把 把 standardized residual 放入检验变量列表放入检验变量列表 确定确定 查看输出窗查看输出窗 口 口 sig p 表明标准化残差和标准正态分布不存在显著差异 可以认为残差满足 表明标准化残差和标准正态分布不存在显著差异 可以认为残差满足 了线性模型的前提要求 了线性模型的前提要求 该要求是要求残差服从正态分布 该要求是要求残差服从正态分布 分析分析 回归回归 线性线性 保存 选距离中保存 选距离中 cook 距离距离 杠杆值杠杆值 继续继续 确定确定 查看输出窗查看输出窗 口口 没有发现强影响点 没有发现强影响点 库克距离大于库克距离大于 1 对应的解释变量为强影响点 杠杆值越对应的解释变量为强影响点 杠杆值越 高 对应的解释变量就越可能是强影响点高 对应的解释变量就越可能是强影响点 曲线估计曲线估计 分析分析 预测预测 序列图序列图 把在外就餐放入变量框把在外就餐放入变量框 分析分析 回归回归 曲线估计曲线估计 因变量在外就餐 自变量年份因变量在外就餐 自变量年份 模型选指数分布 点保存 模型选指数分布 点保存 非线性预测非线性预测 估计估计 R 方方 1 残差平方和 残差平方和 已更正的平方和 已更正的平方和 相关术语相关术语 ZRE 残差标准话残差标准话 ZPR 预测值标准化预测值标准化 LEV 距离杠杆值距离杠杆值 FIT 预测值预测值 时间序列 1 数据的平稳性及其检验数据的平稳性及其检验 一 时间序列数据的平稳性 如果一 时间序列数据的平稳性 如果 满足下列条件 满足下列条件 1 均值 均值 与时间与时间 t 无关的常数 无关的常数 2 方差 方差 与时间与时间 t 无关的常数 无关的常数 3 协方差 协方差 只与时期间隔只与时期间隔 k 有关 与时间有关 与时间 t 无关的常数 无关的常数 则称该随机时间序列是平稳的 则称该随机时间序列是平稳的 stationary 而该随机过程是一平稳随机过程 而该随机过程是一平稳随机过程 stationary stochastic process 若时间序列若时间序列 是一具有零均值同方差的独立分布序列 是一具有零均值同方差的独立分布序列 9 1 1 0 2 N t 该序列常被称为是一个白噪声 该序列常被称为是一个白噪声 white noise 如果一个时间序列是非平稳的 它常常可通过取差分的方法而形成平稳序列 如果一个时间序列是非平稳的 它常常可通过取差分的方法而形成平稳序列 1ttt XX 检验样本自相关函数及其图形来判断平稳时间序列检验样本自相关函数及其图形来判断平稳时间序列 首先定义随机时间序列的自相关函数首先定义随机时间序列的自相关函数 实际上我们对一个随机过程只有一个实现 实际上我们对一个随机过程只有一个实现 0 k k 样本 样本 因此 只能计算样本自相关函数随着 因此 只能计算样本自相关函数随着 k 的增加 样本自相关函数下降且趋于零 的增加 样本自相关函数下降且趋于零 但从下降速度来看 平稳序列要比非平稳序列快得多 但从下降速度来看 平稳序列要比非平稳序列快得多 检验对所有检验对所有 k 0 自相关系数都为 自相关系数都为 0 的联合假设 这可通过如下的联合假设 这可通过如下统计量 统计量 Q 值值 LB Q 大于显著性水平为大于显著性水平为的临界值 拒绝所有的临界值 拒绝所有 k 0 同时为同时为 0 的假设 软件 检验哪个序列 的假设 软件 检验哪个序列 k 就打开该序列 点击菜单就打开该序列 点击菜单 view 下拉菜单下拉菜单 corrdlogram 选择 选择 level 表示对原始序列的平稳 表示对原始序列的平稳 性检验 性检验 lags to include 处 输入原始序列长度的一半或者稍小于一半的数值 点击确定 处 输入原始序列长度的一半或者稍小于一半的数值 点击确定 若概率很小 说明原序列并不是自相关系数均为零的 说明原序列是非随机的 如果该序若概率很小 说明原序列并不是自相关系数均为零的 说明原序列是非随机的 如果该序 列是平稳的 即它的行为并不会随着时间的推移而变化 那么我们就可以通过该序列过去列是平稳的 即它的行为并不会随着时间的推移而变化 那么我们就可以通过该序列过去 的行为来预测未来 这也正是随机时间序列分析模型的优势所在 的行为来预测未来 这也正是随机时间序列分析模型的优势所在 四 随机时间序列模型的识别四 随机时间序列模型的识别 工具主要是时间序列的自相关函数 工具主要是时间序列的自相关函数 autocorrelation function ACF 及偏自相关函数及偏自相关函数 partial autocorrelation function PACF 偏自相关函数偏自相关函数 自相关函数 ACF k 给出了与的总体相关性 偏自相关偏自相关 t X kt X 函数 函数 partial autocorrelation PACF 则是消除了中间变量 带来的间接相关后的直接相关性 它是在 1 t X 1 kt X 已知序列值 的条件下 与间关系的度 1 t X 1 kt X t X kt X 量 因此 在 AR 1 中 从中去掉的影响 则只剩下随 t X 1 t X 机扰动项 显然它与无关 因此我们说与的偏自 t 2 t X t X 2 t X 相关系数为零 记为AR p 的一个主要特征0 2 2 tt XCorr 是时 即偏自相关函数在 p 以后是pk 0 kttk XCorr 截尾的 识别规则 识别规则 若的偏自相关函数在 p 阶以后截尾 即 t X 时 0 而它的自相关函数是拖尾的 则此序列pk k k 是自回归 AR p 序列 MA q 过程过程 识别规则 若随机序列的自相关函数截尾 即自识别规则 若随机序列的自相关函数截尾 即自 q 以后以后 而它的偏自相关函数是拖尾的 而它的偏自相关函数是拖尾的 则此序列是移动平均则此序列是移动平均 MA q 序列 序列 9 2 1 ARMA p q 模型的模型的 ACF 与与 PACF 理论模式理论模式 模型ACFPACF 白噪声 0 k 0 k AR p 衰减趋于零 几何型或 振荡型 P 阶后截尾 k p0 k MA q q 阶后截尾 k q0 k 衰减趋于零 几何型或 振荡型 ARMA p q q 阶后衰减趋于零 几何 型或振荡型 p 阶后衰减趋于零 几 何型或振荡型 六 模型的估计六 模型的估计 点击工作窗口 quick 下拉菜单中 estimate equation 在弹出的 窗口中书写模型变量 Y 建立 ARMA 2 2 模型 Y c AR 1 AR 2 MA 1 MA 2 七 模型的检验七 模型的检验 由于 ARMA p q 模型的识别与估计是在假设随机扰动项 是一白噪声的基础上进行的 因此 如果估计的模型确认如果估计的模型确认 t 正确的话 残差正确的话 残差 应代表一白噪声序列 应代表一白噪声序列 如果通过所估计的 t 模型计算的样本残差不代表一白噪声 则说明模型的识别 与估计有误 需重新识别与估计 在实际检验时 主要检主要检 验残差序列是否存在自相关 验残差序列是否存在自相关 可用第一节提出的统计量 LB Q 进行检验 2 八 软件实现八 软件实现 在估计结结果窗口的 view residual test 中的 Correlogram Q statistics 功能选择的滞后期随意 尽可能的多或样本的一 半 得到残差项的自相关系数和偏自相关系数值 Q stat 所 对应的列是相应自由度的 Q 统计量的值 最右侧 Prob 列中 的数字表示相应自由度条件下统计量取值大于相应 值得 2 Q 概率 如果这一列概率值都大于 0 05 说明所有 值都小于Q 检验水平为 0 05 的分布临界值 位于临界值左侧 结论 2 是模型的随机误差项序列是一个白噪声序列 1 绘制该序列的时序图 2 自相关图检验 看 autocorrelation 3 纯随机性检验 看统计量的 P 值 若 P 值很小 LB Q 0 05 说明我们有 95 属于非白噪声序列 看 Q stat 与 prob 下面非白噪声序列进行建模及预测 原假设 该序列 是白噪声序列 在原假设成立的条件下得到的 Q 统计量 看右侧第二列 以及得到 Q 统计量的概率 发现是小概 率事件 故拒绝原假设 即原序列不是白噪声序列 5 在考察样本偏自相关系数图 6 估计 在 eviews 估计窗口中 导入序列 y 在估计窗 口输入 y c y 1 单击主窗口中的菜单 Quick Estimate equation 在空白对话框中依次输入 y c y 1 单击 Ok 至此 得到估计结果 点击估计结果窗口 name 给方程命名 默 认即可 主窗口空白处书写 genr e resid 回车 也可估计结果窗口 点菜单 view 下拉菜单中选择 Actual Fitted residual Actual Fitted residual Table 复制 residual 一 列 7 检验 A 主要是看模型提取的信息是否充分看残差 序列 view 下拉菜单中的 correlation 出现的图中看得到 统计量的 P 值 若 P 值均较大 说明残差序列是一个白 LB Q 噪声序列 B 参数的显著性 检验每一个待估计的参数是否显著非零 这个检验的目的是为了使模型精简 1 序列预处理 看该序列的图形发现无明显趋势或周期 波动稳定 2 根据相关图的自相关系数的 2 阶截尾 可以尝试 MA 2 3 根据偏自相关的 1 阶截尾 尝试拟合 AR 1 比较 越大越好 越小越好 2 R AIC SC 预测 1 扩大区间 双击 range 和 sample 区域 在弹出的对 话框中 将 70 改为 71 22 在估计结果窗口 点 forecast 在弹出的窗口处 更改 method 处 点选 static forecast 其他默认即可 在 workfile 窗口就出现了 yf 序列 第 71 个数据就是预测值 具体步骤 1 模型识别 模型识别 1 数据录入 打开 Eviews 软件 选择 File 菜单中的 New Workfile 选项 在 Workfile structure type 栏选择 Unstructured Undated 在 Date range 栏中输入数据个数 201 点击 ok 见图 2 1 这样就建立了一个工作文件 点击 File Import 找到相应的 Excel 数据集 打开数据集 出现图 2 2 的窗口 在 Data order 选项中选择 By observation 即按照观 察值顺序录入 第一个数据是从 a2 开始的 所以在 Upper left data cell 中输入 a2 本 例只有一列数据 在 Names for series or number if named in file 中输入序列的名字 production 或 1 点击 ok 则录入了数据 2 绘制序列时序图 双击序列 production 点击 view Graph line 则出现图 2 3 的序列时序图 时序图看出 201 个连续生产的数据是平稳的 这个判断比较粗糙 需要用统计方法进一步验证 3 绘制序列相关图 双击序列 production 点击 view Correlogram 出现图 2 4 我们对原始数据序列做相关图 因此在 Correlogram of 对话框中选择 Level 即表示对原始序列做相关 4 ADF 检验序列的平稳性 通过时序图和相关图判断序列是平稳的 我们通过统计检验来进一步证实这个结论 双击 序列 production 点击 view unit root test 5 模型定阶 1 看 偏自相关系数在 k n 尝试拟合 AR n 自相关系数在 k m 处显著不为 0 考 虑拟合 MA m 同时可以考虑 ARMA n m 模型等 点击主菜单 Quick Generate Series 在对话框中输入赋值语句 Series x production 84 11940 2 模型参数估计 模型参数估计 1 尝试 AR 模型 在主菜单选择 Quick Estimate Equation x ar 1 ar 2 ar 3 ar i i 1 2 表示自回归系数 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论