商务数据分析课件:计量模型_第1页
商务数据分析课件:计量模型_第2页
商务数据分析课件:计量模型_第3页
商务数据分析课件:计量模型_第4页
商务数据分析课件:计量模型_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量模型

第一节时间序列分析

1.时间序列分析简介(2)时间序列分析方法主要可以分为两类:描述性时序分析和统计时序分析。描述性时序分析指的是,通过绘制时序图等方式,比较、观察、发现时间序列中显然存在的一些变化趋势,如数据逐渐增大或变小的趋势性,或者数据变化呈现周期性等。1.时间序列分析简介(2)时间序列分析方法统计时序分析目前比较流行的方法是进行时域分析,认为时间序列的值之间存在有一定的相关关系,而且这种相关关系通常具备某些统计规律。时域分析就是利用模型刻画时间序列的值中体现的关系的规律。2.时间序列建模:平稳性检验时间序列根据其所具备的统计特征(如平均数、方差等)随时间变化是否发生改变,可以分为平稳时间序列和非平稳时间序列,针对这两种时间序列进行时序分析,需要采用不同的处理手段和建模方法。所以在获得到一个时间序列之后,要做的第一件事就是判断该序列的平稳性,即“平稳性检验”。(1)平稳性检验定义平稳性检验的重要依据是数据的特征统计量,包括均值,方差,自协方差和自相关系数、偏自相关系数等。从特征统计量的角度来判断,平稳时间序列具有三个主要特征:方差有限,均值为常数,且自协方差及相应自相关的大小只与时间段的相对长度而与时间发生的具体时间点无关的的时间序列。

2.时间序列建模:平稳性检验(1)平稳性检验方法绘制观察自相关图平稳时间序列具有短期自相关性。用自相关系数来描述就是随着延迟期数的增加,平稳时间序列的自相关系数会很快衰减到0。在自相关系数图上,自相关系数会随着延迟期数的增长迅速衰减到0附近,并有所波动。单位根检验方法时间序列无单位根,认为该时间序列为平稳时间序列。3.平稳时间序列常用模型(1)非白噪声序列白噪声定义对平稳时间序列进行建模的一个前提是:该时间序列不是纯随机序列。纯随机序列也被称为白噪声序列。因为一个纯随机序列,数值之间没有关联,对这种序列进行预测是没有任何意义的。白噪声检验在进行平稳时间序列建模前,需要对序列是否是白噪声序列进行检验。如果一个时序值为白噪声序列,则该序列延迟非零期的样本自相关系数将近似服从均值为0,方差为序列长度倒数的正态分布。由此建立原假设。通过计算时间序列的上述统计量,决定是否拒绝原假设,即判断该序列是不是白噪声序列。3.平稳时间序列常用模型(2)模型的定义常见的平稳时间序列分析模型有三种:AR(AutoRegressive)MA(MovingAverage)ARMA(AutoRegressiveandMovingAverage)。从本质上来看,这三个模型都是通过过去预测未来,即基于对系统进行观测得到的平稳时间序列数据,用曲线拟合方法对系统进行客观的描述并预测未来数值。三个模型的不同在于,它们基于平稳时间序列的不同特性,模型中采用了不同的自变量描述前期数据与当前数据的关系。3.平稳时间序列常用模型(2)模型的定义AR模型聚焦于数值本身,利用前期数值与后期数值的相关关系建立模型,即把本期数值用之前的若干个时序值的线性组合表示。MA模型聚焦于时序值的白噪声,认为时间序列本期数值等于之前若干个时点白噪声的线性组合ARMA模型综合了AR模型和MA模型的思想,把本期数值用之前的若干个时序值及若干个时点的白噪声两种成分线性组合而成3.平稳时间序列常用模型(3)模型识别与定阶从三个模型中选择出适合描述特定时间序列的模型绘制自相关系数图和偏自相关系数图进行观察、定阶根据AR模型,MA模型和ARMA模型的性质,决定选择哪一种模型确定模型类型后,参数估计可采用矩估计,极大似然估计和最小二乘估计等方法。4.非平稳时间序列基本思路是将非平稳时间序列转换成平稳时间序列,建立平稳时间序列模型,对转换后的数据进行分析。(1)趋势效应与季节效应非平稳时间序列产生的原因长期趋势,季节周期变化和随机波动。趋势效应有些时间序列具有非常显著的随着时间增长或降低的趋势。对于这种单调的变化趋势,可以使用趋势拟合法来测定。趋势拟合法描述时序值随时间的变化趋势,所以模型将时间作为自变量,相应的时序值作为因变量。进而可以选择线性或非线性回归模型对自变量与因变量之间的关系进行拟合。4.非平稳时间序列(1)趋势效应与季节效应季节效应时间序列数据会呈现周期性波动变化。通常通过季节指数进行测量。季节指数反映的是每个季度时序值的平均值与总平均值之间,是否存在比较稳定的关系,如果关系稳定则判定存在季节效应。具体的计算方法为:首先计算周期内的各期平均数,再计算总平均数,周期内各期平均数与总平均数之商,则为季节系数。季节系数与1相比的大(小)关系,说明了该季度的值一般高(低)于总平均值。如果序列的季节指数都近似等于1,那就说明该序列没有明显的季节效应。4.非平稳时间序列(2)非平稳时间序列建模ARIMA模型(AutoregressiveIntegratedMovingAverageModel)即全称为差分自回归移动平均模型。原理即为将非平稳时间序列做差分转换为平稳时间序列,然后将因变量仅对它滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。对于趋势性,可以使用一阶差分,即使用时间序列的后一项减去前一项,若一阶差分后时间序列仍呈现有趋势性,可再进行一次一阶差分。对于周期性,可以使用多步差分,例如如果周期约为7,则使用时间序列的第n项减去第n-7项,形成新序列。可以使用移动平均法消除时间序列的季节性。移动平均法是指对原时间序列中每个周期长度内的值取平均值,作为新的时间序列中的一项。如果经过单位根检验结果显示,新的时间序列为平稳时间序列,就可以对平稳的时间序列进行建模了。第二节回归模型另一种常见的计量模型在回归模型中,样本数据的属性特征被称为自变量,而代表研究对象的目标特征被称为因变量。通过回归分析研究自变量和因变量的关系,可以判断自变量和因变量之间是否存在显著因果关系,并且可以分析自变量对因变量的影响程度。常见的回归有很多种分类方法1.回归模型评价标准

1.回归模型评价标准(1)误差平均平方差MSE将真实值和预测值之间的差进行平方通过平方操作也可以解决总误差因为误差之间正负不同会抵消的问题,同时还方便求导。但是它对异常点比较敏感。平方根误差RMSE将MSE值的开方,对异常点比较敏感。平均绝对百分误差MAPE考虑预测值与真实值的值域。是一个相对值,可以通过比较两个模型的MAPE来衡量它们的优劣,但是对于单个模型的MAPE值没有实际意义。1.回归模型评价标准

1.回归模型评价标准

2.线性回归

2.线性回归

3.非线性回归思路一:观察散点图,选择合适的模型非线性函数拟合建模将样本数值以散点图表示,通过观察数据点的分布特点,包括因变量随自变量的变化规律、散点图的大致形状,直接相应可能的非线性函数进行拟合建模,并结合数据点进行对这些函数参数的估计。常见的非线性回归模型有多项式模型、指数函数模型、对数函数模型、幂函数模型等。多项式回归拟合建模如果通过观察散点图,发现因变量与自变量的关系是非线性的,但是又找不到合适的非线性函数曲线进行拟合,则可以采用多项式回归。采用多项式回归模型对样本数据进行建模,基本上能够取得一个较好的效果。不过,模型在参数的估计、阶数的选择上有一定的难度,而且如果在多项式回归中的指数选择不当,容易导致过拟合。

3.非线性回归思路二:转化为线性模型常见的幂函数回归、指数函数回归、对数函数回归均可以通过对原数据的转换变为线性回归。采用建立线性模型的方法建立模型、估计未知参数。在回归中可以根据因变量类型的不同来选择不同的回归模型,线性和非线性回归是当因变量是连续值的时候能够应用到的回归模型,当因变量是离散型时,可以使用逻辑回归模型。4.回归模型和回归系数的显著性

4.回归模型和回归系数的显著性

5.多重共线性的检验多重共线性模型中两个或者更多个自变量之间具有高度线性相关而导致。多重共线性的存在,会使得模型中一个自变量系数会依赖于在模型中的其他自变量,导致参数估计的不稳定提高。多重共线性出现原因各变量之间本身存在相关联系。各变量在时间上有共同变化的趋势。在建立模型时,使用因变量的滞后值作为自变量。常见的多重共线性检验相关系数检验。基于样本数据,计算两个自变量之间的相关系数。辅助回归模型检验。择模型中的一个自变量作为因变量构造辅助回归模型。计算方差扩大因子。变量的共线程度越高,参数估计量的方差就越大。观察

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论