版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据分析(方法与案例),2020-6-15,未来是不可预测的,不管人们掌握多少信息,都不可能存在能作出正确决策的系统方法。C.R.Rao,统计名言,第11章时间序列预测,11.1时间序列的成分和预测方法11.2平稳序列的预测11.3趋势预测11.4多成分序列的预测11.5Box-Jenkins方法:ARIMA模型,Forecast,2020-6-15,学习目标,时间序列的组成要素预测方法的选择与评估平稳序列的预测方法趋势序列的预测方法多成分序列的预测方法ARIMA模型使用SPSS和Excel预测,2020-6-15,下个月的消费者信心指数是多少?,消费者信心指数不仅仅是消费信心的反映,在某种程
2、度上反映了消费者对整个宏观经济运行前景的看法一些国家都把消费者信心指数作为经济运行的一项预警指标来看待。国家统计局定期公布这类数据下表是国家统计局公布的2009年7月至2010年8月我国的消费者预期指数、消费者满意指数和消费者信心指数(%)怎样预测下个月的消费者信心指数呢?首先需要弄清楚它在2009年7月至2010年8月过去的这段时间里是如何变化的,找出其变化的模式。如果预期过去的变化模式在未来的一段时间里能够延续,就可以根据这一模式找到适当的预测模型并进行预测。本章介绍的内容就是有关时间序列的预测问题,2020-6-15,下个月的消费者信心指数是多少?,11.1时间序列的成分和预测方法11.
3、1.1时间序列的成分11.1.2预测方法的选择与评估,第11章时间序列预测,11.1.1时间序列的成分,11.1时间序列成分和预测方法,2020-6-15,时间序列(timesseries),按时间顺序记录的一组数据观察的时间可以是年份、季度、月份或其他任何时间形式观测时间用表示,观测值用表示时间序列的组成要素(components):趋势、季节变动、循环波动和不规则波动,2020-6-15,时间序列的组成要素(components),趋势(trend)持续向上或持续向下的变动季节变动(seasonalfluctuation)在一年内重复出现的周期性波动循环波动(Cyclicalfluctua
4、tion)非固定长度的周期性变动不规则波动(irregularvariations)除去趋势、季节变动和周期波动之后的随机波动称为不规则波动只含有随机波动而不存在趋势的序列也称为平稳序列(stationaryseries)四种成分与序列的关系:Yi=TiSiCiIi,2020-6-15,含有不同成分的时间序列,平稳,趋势,周期,季节,2020-6-15,时间序列的成分(例题分析),【例11-1】1990年2005年我国人均GDP、轿车产量、金属切削机床产量和棉花产量的时间序列。绘制图形观察其所包含的成分,2020-6-15,含有不同成分的时间序列,(a)人均GDP序列,(b)轿车产量序列,(c
5、)机床产量序列,(d)棉花产量序列,11.1.2预测方法的选择与评估,11.1时间序列成分和预测方法,2020-6-15,预测方法的选择与评估,2020-6-15,预测方法的评估,一种预测方法的好坏取决于预测误差的大小预测误差是预测值与实际值的差距度量方法有平均误差(meanerror)、平均绝对误差(meanabsolutedeviation)、均方误差(meansquareerror)、平均百分比误差(meanpercentageerror)和平均绝对百分比误差(meanabsolutepercentageerror)较为常用的是均方误差(MSE),11.2平稳序列的预测11.2.1移动平
6、均预测11.2.2简单指数平滑预测,第11章时间序列预测,2020-6-15,平稳序列的预测,平稳序列(stationaryseries):不含有趋势的序列,其波动主要是随机成分所致,序列的平均值不随着时间的退役而变化通过对时间序列进行平滑以消除其随机波动,因而也称为平滑法平稳序列的预测方法有简单平均(simpleaverage)法、移动平均(movingaverage)法、简单指数平滑(simpleexponentialsmoothing)法、Box-Jenkins方法(ARIMA模型)等本节主要介绍移动平均和简单指数平滑两种方法,Box-Jenkins方法在10.5节中介绍,11.2.1移
7、动平均预测,11.2平稳序列的预测,2020-6-15,移动平均预测(movingaverage),选择一定长度的移动间隔,对序列逐期移动求得平均数作为下一期的预测值将最近k期数据平均作为下一期的预测值设移动间隔为k(1kt),则t+1期的移动平均预测值为预测误差用均方误差(MSE)来衡量,2020-6-15,移动平均预测(特点),将每个观测值都给予相同的权数只使用最近期的数据,在每次计算移动平均值时,移动的间隔都为k主要适合对较为平稳的序列进行预测对于同一个时间序列,采用不同的移动步长预测的准确性是不同的选择移动步长时,可通过试验的办法,选择一个使均方误差达到最小的移动步长,2020-6-1
8、5,移动平均预测(例题分析),【例11-2】根据表11-1中的棉花产量数据,分别取移动间隔k=3和k=5进行移动平均预测,计算出预测误差,并将原序列和预测后的序列绘制成图形进行比较。,进行移动平均预测,Excel,Excel,2020-6-15,移动平均预测(例题分析),2020-6-15,移动平均预测(例题分析),cotton,MA,11.2.2简单指数平滑预测,11.2平稳序列的预测,2020-6-15,简单指数平滑预测(simpleexponentialsmoothing),适合于平稳序列(没有趋势和季节变动的序列)对过去的观测值加权平均进行预测的一种方法观测值时间越远,其权数也跟着呈现
9、指数的下降,因而称为指数平滑t+1的预测值是t期观测值与t期平滑值St的线性组合,其预测模型为,Yt为第t期的实际观测值St为第t期的预测值为平滑系数(01),2020-6-15,简单指数平滑预测(平滑系数的确定),不同的会对预测结果产生不同的影响当时间序列有较大的随机波动时,宜选较小的,注重于近期的实际值时,宜选较大的选择时,还应考虑预测误差误差均方来衡量预测误差的大小确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值,2020-6-15,简单指数平滑预测(例题分析),指数平滑预测,【例11-2续】根据表11-1中的棉花产量数据,分别取=0.3和=0.5进行指数平滑预测,计算出预
10、测误差,并将原序列和预测后的序列绘制成图形进行比较,阻尼系数=1-,SPSS,Excel,Excel,2020-6-15,简单指数平滑预测(例题分析Excel输出的结果),2020-6-15,移动平均和简单指数平滑预测(例题比较分析),cotton,S-EXP&MA,2020-6-15,用SPSS进行简单指数平滑预测(13.0版本),第1步:选择【Analyze-TimeSeries】【ExponentialSmoothing】,进入主对话框第2步:将预测变量(本例为“棉花产量”)选入【Variables】。在【Model】下选择【Simple】。点击【Parameters】,在【Genera
11、lAlpha-Value】后输入制定的值(本例分别取0.3和0.5)(注:若不知道指定多大的合适,可选择【GridSearch】,系统会自动搜索,初始值为0,步长为0.1,终止值为1)在【InitialValue】下选择【Custom】,并在【Starting】后输入初始值(本例选择1990年的实际值:450.77),在【Trend】后输入“0”(表示没有趋势)。点击【Continue】返回主对话框(注:初始值的默认方式是【Automatic】,此时系统会根据原始值序列自动计算适合的初始值和趋势值)点击【Save】,在【PredictCase】下点击【Predict-Through】,在【Ob
12、servation】后的方框内输入要预测的要预测的观测值的时期数(本例为17,表示要预测2006年的数值)。【Continue】返回主对话框。点击【OK】,指数平滑预测,SPSS,2020-6-15,用SPSS进行简单指数平滑预测(16.0版本),使用SPSS进行时间序列预测时,首先需要对观测值序列附加时间因方法是选择【Data】【Definedates】,然后在【CasesAre】下根据需要选择【Years】、【Years,quarters】等等,然后指定第一个观测值的时间【FirstCaseIs】。这样,SPSS会在观测值序列之后加上时间变量第1步:选择【Analyze-TimeSerie
13、s】【Createmodels】,进入主对话框第2步:将预测变量选入【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,在【ModelType】下选择【Simple】(进行简单指数平滑预测),点击【Continue】返回主对话框第3步:点击【Save】,在【Description】下选择需要预测的结果,如【PredictedValues】、【LowerConfidenceLimits】、【UpperConfidenceLimits】、【NoiseResiduals】等。点击【options】,在【Foreca
14、stPeriod】下选中【Firstcaseafterendofestimationperiodthroughaspecifieddate】,在【Date】框内输入要预测的时期,指数平滑预测,SPSS,2020-6-15,简单指数平滑预测(例题分析SPSS13.0输出的结果),自动模式:1.不知道指定多大的合适,选择【GridSearch】,系统自动搜索2.系统自动计算合适的初始值和趋势值,系统自动搜索的预测及误差平方和排序。误差最小的是=0.4,11.3趋势预测11.3.1线性趋势预测11.3.2非线性趋势预测11.3.3残差自相关及其检验,第11章时间序列预测,2020-6-15,趋势序列
15、预测,时间序列有常数增减的线性趋势和不同形态的非线性趋势可选择的预测模型线性趋势(lineartrend)模型回归直线Holt指数平滑模型(Holtsmodel)非线性趋势(non-lineartrend)模型指数曲线多项式,11.3.1线性趋势预测,11.3趋势预测,2020-6-15,线性趋势预测(lineartrend),线性趋势:是时间序列按一个固定的常数(不变的斜率)增长或下降拟合一条线性趋势方程进行预测,2020-6-15,线性趋势预测(例题分析),【例11-3】根据表11-1中人均GDP数据,用直线趋势方程预测2006年的人均GDP,并给出各年的预测值和预测误差,将实际值和预测值
16、绘制成图形进行比较,线性趋势方程:预测的R2和标准误差:R2=0.98062005年人均GDP增长率的预测值,线性趋势预测,SPSS,2020-6-15,线性趋势预测(例题分析),预测值,预测误差,置信区间,SPSS,2020-6-15,线性趋势预测(例题分析),GDP,linear,11.3.2Holt指数平滑预测,11.3趋势预测,2020-6-15,在简单指数平滑中,实际上是用期的平滑值作为期的预测值,它适合于较平稳的序列。当时间序列存在趋势时,简单指数平滑的预测结果总是滞后于实际值Holt指数平滑预测模型,一般简称为Holt模型(Holtsmodel),适合于含有趋势成分(或有一定的周
17、期成分)序列的预测Holt模型使用两个参数(平滑系数)和(取值均在0和1之间)和以下三个方程,Holt指数平滑预测模型(Holtsmodel),2020-6-15,Holt模型的三个方程,Holt指数平滑预测模型(Holtsmodel),平滑值,趋势项更新,K期预测值,2020-6-15,Holt模型中初始值的确定,Holt指数平滑预测模型(Holtsmodel),Holt,2020-6-15,Holt指数平滑预测模型(例题分析),【例11-4】沿用例113。用Holt指数平滑模型预测2006年的人均GDP,并将实际值和预测值绘制成图形进行比较,SPSS,2020-6-15,用SPSS进行Ho
18、lt指数平滑预测(16.0版本),第1步:选择【Analyze-TimeSeries】【Createmodels】,进入主对话框第2步:将预测变量选入【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,在【ModelType】下选择【Holtslineartrend】。点击【Continue】返回主对话框第3步:点击【Save】,在【Description】下选择需要预测的结果,如【PredictedValues】、【LowerConfidenceLimits】、【UpperConfidenceLimits】
19、、【NoiseResiduals】等。点击【options】,在【ForecastPeriod】下选中【Firstcaseafterendofestimationperiodthroughaspecifieddate】,在【Date】框内输入要预测的时期,Holt指数平滑预测,SPSS,2020-6-15,Holt指数平滑预测(例题分析SPSS16.0输出的结果),2020-6-15,Holt指数平滑预测(例题分析SPSS16.0输出的结果),人均GDP的Holt指数模型预测,Holt,11.3.2非线性趋势预测,11.3趋势预测,2020-6-15,时间序列以几何级数递增或递减一般形式为,指
20、数曲线(exponentialcurve),b0,b1为待定系数exp表示自然对数ln的反函e=2.71828182845904可线性化后使用最小二乘法可直接使用SPSS,2020-6-15,指数曲线(例题分析),【例11-5】根据表11-1中的轿车产量数据,用指数曲线预测2006年的轿车产量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较,指数曲线趋势方程:2005年轿车产量的预测值,2020-6-15,用SPSS进行曲线估计,第1步:选择【Analyze】【RegressionCurveEstimation】选项,进入主对话框第2步:在主对话框中将被预测变量(本例为“轿
21、车产量”)选入【Dependent】;将自变量(本例为“时间t”)选入【Variable】;在【Models】下选择【Exponential】(如果需要其他曲线,可选择【Cubic】(三次曲线)、【S】(S型曲线)等等);点击【Save】。在【SaveVariables】下选中【PredictedValues】(输出点预测值)、【Residual】(输出残差)、【PredictionIntervals】(输出95%的预测区间)。点击【Continue】回到主对话框。点击【OK】,指数曲线预测,SPSS,2020-6-15,用SPSS进行曲线估计(Model中的其他曲线),【Models】下提供
22、的其他曲线:【Quadratic】二次曲线【Cubic】三次曲线【Compound】复合曲线【S】S型曲线【Growth】成长曲线【Power】幂指数曲线,曲线预测,SPSS,2020-6-15,指数曲线(例题分析SPSS),预测值,预测误差,置信区间,SPSS,2020-6-15,指数曲线(例题分析SPSS),car,Y=5.734EXP(0.242t),Y=5.7341.273t),2020-6-15,有些现象的变化形态比较复杂,它们不是按照某种固定的形态变化,而是有升有降,在变化过程中可能有几个拐点。这时就需要拟合多项式函数当只有一个拐点时,可以拟合二阶曲线,即抛物线;当有两个拐点时,需
23、要拟合三阶曲线;当有k-1个拐点时,需要拟合k阶曲线k阶曲线函数的一般形式为可线性化后,根据最小二乘法求使用SPSS中的【Analyze】【RegressionCurveEstimation】【Models】【Cubic】得到,多阶曲线,2020-6-15,多阶曲线(例题分析),【例11-6】根据表11-1中的金属切削机床产量数据,拟合适当的趋势曲线,预测2006年的金属切削机床产量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较,三阶曲线方程:2005年的预测值,三阶趋势预测,SPSS,2020-6-15,多阶曲线(例题分析),预测值,预测误差,置信区间,SPSS,202
24、0-6-15,多阶曲线(例题分析),machinetool,Cubic,11.3.3残差自相关及其检验,11.3趋势预测,2020-6-15,残差自相关及其检验(autocorrelation),不同点的时间序列残差之间的相关称为自相关时间序列的残差是时间序列的观测值与相应的预测值之差对于大多数商业和经济序列来说,残差会出现连续的正值和连续的负值,也就是相邻的两个残差具有相同的正负号,时间序列残差之间的相关称为自相关相邻两期(t期和t-1期)残差之间的相关称为一阶自相关,2020-6-15,残差自相关及其检验(自相关对预测的影响),对于自相关序列应避免使用最小二乘法拟合的回归模型进行预测最小二
25、乘回归的基本假定之一就是残差是相互独立的随机变量自相关显然破坏了这些假定,从而使回归系数的估计不再具有最小方差的性质用最二乘模型进行预测时产生的误差比预期的要大将回归方法用于时间序列时应注意这一问题解决残差自相关的办法之一是引进观测值的滞后值作为自变量进行这种回归预测,这样的回归称为自回归,2020-6-15,残差自相关及其检验(D-W检验),判断残差之间是否存在自相关的方法之一就是使用Durbin-Watson检验,简称D-W检验对于双侧检验提出的假设为H0:残差无自相关,H1:残差存在自相关检验统计量为,检验时使用D-W检验统计量临界值表判断,2020-6-15,残差自相关及其检验(D-W
26、检验统计量临界值表),显著性水平为=0.05、样本量为n、自变量个数为k,统计量的临界值下限为dL和上限dU,2020-6-15,残差自相关及其检验(D-W检验的判别),统计量的取值范围是0dU,不拒绝原假设,没有证据表明存在自相关如果dLddU,属于不确定区,无法根据Durbin-Watson统计量作出判断,2020-6-15,残差自相关及其检验(例题分析),【例】根据表11-1中的金属机床产量序列,检验是否存在自相关,统计量d=0.471.10,拒绝原假设,机床产量序列存在自相关,2020-6-15,自相关及其检验(用SPSS计算检验统计量d),【Analyze】【Regression-l
27、inear】将因变量选入【Dependent】(本例为机床产量)将自变量选入【Independent(s)】(本例为时间)主对话框点击【Statistics】,选择【Residuals】中的【Durbin-Watson】,点击【Continue】回到主对话框点击【OK】在输出结果中的“ModelSummary”给出的统计量为0.470,计算D-W统计量,SPSS,11.4多成分序列的预测11.4.1Winters指数平滑预测11.4.2引入季节哑变量的多元回归预测11.4.3分解预测,第11章时间序列预测,2020-6-15,多成分序列的预测,序列包含多种成分预测方法主要有Winters指数平
28、滑预测模型(Wintersmodel)引入季节哑变量的多元回归模型(seasonalmultipleregression)预测分解(decomposition)预测等分解预测是先将时间序列的各个成分依次分解出来,尔后再进行预测,11.4.1Winters指数平滑预测,11.4多成分序列的预测,2020-6-15,简单指数平滑模型适合于对平稳序列(没有趋势和季节成分)的预测;Holt指数平滑模型适合于含有趋势成分但不含季节成分序列的预测如果时间序列中既含有趋势成分又含有季节成分,则可以使用Winter指数平滑模型进行预测要求数据是按季度或月份收集的,而且至少需要4年(4个季节周期长度)以上的数据
29、Winter指数平滑模型包含三个平滑参数即、和(取值均在0和1之间)和以下四个方程,Winter指数平滑预测模型(Wintersmodel),2020-6-15,Winter模型的四个方程,Winter指数平滑预测模型(Wintersmodel),平滑值,趋势项更新,季节项更新,K期预测值,2020-6-15,Winter模型四个方程的含义,Winter指数平滑预测模型(Wintersmodel),平滑值,趋势项更新,季节项更新,K期预测值,2020-6-15,winter指数平滑预测模型(例题分析),【例11-7】下表是一家啤酒生产企业20052010年各季度的啤酒销售量数据。用Winter
30、模型预测2011年各季度的啤酒销售量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较,2020-6-15,用SPSS进行Winter指数平滑预测(13.0),第1步:选择【Analyze-TimeSeries】【ExponentialSmoothing】,进入主对话框第2步:将预测变量(本例为“销售量”)选入【Variables】。在【Model】下选中【Winters】。点击【Parameters】,在【GeneralAlpha-Value】后输入指定的值;在【TrendGamma-Value】后输入指定的值;在【SeasonalDelta-Value】后输入指定的值(若
31、不知道指定多大的、和合适,可选择【GridSearch】,系统会自动搜寻,初始值为0,步长分别为=0.1、=0.2和,终止值为1)。在【InitialValue】下选择【Custom】,并在【Starting】后输入初始值的平滑值,在【Trend】后输入初始的趋势平滑值(如果不知到指定多少合适,可采用系统的默认方式【Automatic】,此时系统会根据原始值序列自动计算适合的初始值和趋势值)。点击【Continue】返回主对话框第3步:点击【Save】,在【PredictCase】下点击【Predict-Through】,在【Year】后的方框内输入要预测的年份(本例为2006,表示要预测20
32、06年各季度的数值)。【Continue】返回主对话框。点击【OK】,Winter指数平滑预测,SPSS,2020-6-15,用SPSS进行Winter指数平滑预测(16.0版本),第1步:选择【Analyze-TimeSeries】【Createmodels】,进入主对话框第2步:将预测变量选入【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,在【ModelType】下选【Wintersadditive】或【Wintersmultiplicative】。如果序列的趋势不依赖于序列的水平,选择【Winter
33、sadditive】,如果序列的趋势依赖于序列的水平,选择【Wintersmultiplicative】第3步:点击【Save】,在【Description】下选择需要预测的结果,如【PredictedValues】、【LowerConfidenceLimits】、【UpperConfidenceLimits】、【NoiseResiduals】等。点击【options】,在【ForecastPeriod】下选中【Firstcaseafterendofestimationperiodthroughaspecifieddate】,在【Date】下的【Year】中输入要预测的年份,在【Quarter
34、】中输入要预测的季节值个数,比如要预测2011年14季度的值,在【Year】中输入2011,在【Quarter】中输入4。点击【OK】,Winter指数平滑预测,SPSS,2020-6-15,Winter指数平滑预测(例题分析SPSS163.0输出的结果),2020-6-15,Winter指数平滑预测(例题分析SPSS13.0输出的结果),Winter,beer,11.4.2引入季节哑变量的多元回归预测,11.4多成分序列的预测,2020-6-15,季节哑变量多元回归预测(seasonalmultipleregression),用虚拟变量表示季节的多元回归预测方法若数据是按季度记录的,需要引入
35、3个虚拟变量(一季度作为参照水平);按月记录的,则需要引入11个虚拟变量季度数据的季节性多元回归模型可表示为,2020-6-15,季节哑变量多元回归预测(系数的解释),b0时间序列的平均值b1趋势成分的系数,表示趋势给时间序列带来的影响值Q2、Q3、Q33个季度的虚拟变量b2、b3、b4每一个季度与参照的第一季度的平均差值,2020-6-15,季节哑变量多元回归预测(例题分析),【例11-8】下表是一家啤酒生产企业20052010年各季度的啤酒销售量数据。用分解预测法预测2011年各季度的啤酒销售量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较,2020-6-15,用SP
36、SS进行哑变量回归(只有一个哑变量:一个哑变量和一个数值自变量),第1步:选择【Analyze】,并选择【GeneralLinearModel-Univaiate】进入主对话框第2步:将因变量(销售量)选入【DependentVariable】,将自变量(性别)选入【FixedFactor(s)】,将数值自变量(时间变量t)选入【Covariate(s)】第3步:点击【Model】,并点击【Custom】;将季度F选入【Model】,将时间变量tC也选入【Model】;在【BuildTerm(s)】下选择【Maineffects】。点击【Continue】回到主对话框。点击【Options】,
37、在【Display】下选中【Parameterestimates】(估计模型中的参数)。点击【Continue】回到主对话框。点击【OK】,哑变量回归,SPSS,2020-6-15,季节哑变量多元回归预测(例题分析参数估计),啤酒销售量哑变量多元回归模型的检验,2020-6-15,季节哑变量多元回归预测(例题分析参数估计),啤酒销售量哑变量多元回归模型的估计,2020-6-15,季节性哑变量元回归预测(例题分析),2020-6-15,季节哑变量多元回归预测(例题分析),beer,11.4.3分解预测,11.4多成分序列的预测,2020-6-15,分解预测(预测步骤),分解(decomposit
38、ion)预测是适合于含有趋势、季节、循环多种成分序列预测的一种古典方法,仍得到广泛应用,因为该方法相对来说容易理解,结果易于解释,在很多情况下能给出很好的预测结果预测步骤确定并分离季节成分计算季节指数,以确定时间序列中的季节成分将季节成分从时间序列中分离出去,即用每一个观测值除以相应的季节指数,以消除季节性对消除季节成分的序列建立线性预测模型进行预测计算出最后的预测值用预测值乘以相应的季节指数,得到最终的预测值,2020-6-15,分解预测(例题分析),【例11-9】下表是一家啤酒生产企业20052010年各季度的啤酒销售量数据。用分解预测法预测2011年各季度的啤酒销售量,并计算出各期的预测
39、值和预测误差,将实际值和预测值绘制成图形进行比较,2020-6-15,分解预测(例题分析),beer,2020-6-15,分解预测(第1步:确定并分离季节成分),计算季节指数以其平均数等于100%为条件而构成的反映季节变动的值表示某一月份或季度的数值占全年平均数值的大小如果现象的发展没有季节变动,则各期的季节指数应等于100%季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定,2020-6-15,分解预测(第1步:确定并分离季节成分),季节指数计算步骤计算移动平均值(季度数据采用4项移动平均,月份数据采用12项移动平均),并将其结果进行“中心化”处理计算移动平均的比值,也称为
40、季节比率将序列的各观测值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值,即季节指数季节指数调整各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整具体方法是:将第2步计算的每个季节比率的平均值除以它们的总平均值,计算季节指数,进行分解,SPSS,Excel,2020-6-15,分解预测(第1步:确定并分离季节成分),分离季节成分:将原时间序列除以相应的季节指数季节因素分离后的序列反映了在没有季节因素影响的情况下时间序列的变化形态,2020-6-15,用SPSS进行分解(例题分析),第1步:选择【Analyze-TimeSeri
41、es】【SeasonalDecomposition】,进入主对话框第2步:将待分解变量(本例为“销售量”)选入【Variable(s)】。在【Model】下选中【Multiplicative】。点击【Continue】返回主对话框。点击【OK】,进行分解,SPSS,2020-6-15,分解预测(SPSS分解的结果),季节分离,趋势和循环,实际值,beer,decomposition,2020-6-15,分解预测(SPSS的分解结果),季节指数,趋势和周期,季节分离,随机波动,预测误差,最终预测,回归预测,2020-6-15,分解预测(第3步:计算出最后的预测值),根据分离季节性因素的序列确定线
42、性趋势方程根据趋势方程进行预测该预测值不含季节性因素,即在没有季节因素影响情况下的预测值计算最终的预测值将回归预测值乘以相应的季节指数,2020-6-15,实际值和最终预测值图,beer,11.5Box-Jenkins方法:ARIMA模型11.5.1自相关与自相关图11.5.2Box-Jenkins方法的基本思想11.5.3ARIMA模型的识别,第11章时间序列预测,11.5.1自相关与自相关图,11.5Box-Jenkins方法:ARIMA模型,2020-6-15,自相关与自相关图,自相关(autocorrelation)是时间序列各观测值之间的相关时间序列后期的观测值与它前面的观测值相关可
43、以想象2007年的人均GDP与2006年的人均GDP相关,2008年与2007年相关等等自相关程度用自相关系数来度量与两个变量之间的Pearson相关系数类似,2020-6-15,自相关与自相关图(自相关系数),自相关系数,2020-6-15,自相关与自相关图,判断一个序列是否存在显著自相关的一种方法是,算出每个自相关系数的95%的置信区间,如果某个自相关系数落在这个区间内,就可以认为该自相关系数是不显著的,如果所有(或大多数)在自相关系数都落在这个区间内,就可以认为该序列不存在自相关另一种判断方法是凭经验,提出假设总体的自相关系数等于0的原假设(即不存在自相关),对于n个观测值的序列,任意的
44、滞后期为k,如果,就拒绝原假设,表明该序列存在自相关,2020-6-15,自相关与自相关图(自相关系数例题分析),【例11-10】利用例11-1中的人均GDP序列,计算滞后1期(即,k=1)的自相关系数,计算自相关系数,计算自相关系数,绘制自相关图,SPSS,Excel,2020-6-15,自相关与自相关图(自相关系数例题分析),【例11-10】Excel输出的滞后1期人均GDP序列的自相关系数,2020-6-15,自相关与自相关图(自相关系数例题分析),【例11-10】SPSS输出的人均GDP序列的自相关系数,SPSS【Graphs】【TimesSeries】【Autocorrelation
45、s】作图功能可直接得到不同滞后期的自相关系数及自相关图,2020-6-15,自相关与自相关图(自相关图例题分析),【例11-10】人均GDP序列的自相关图,纵坐标是自相关函数(AFC)。两条线是自相关系数的95%的置信上限和置信下限。随着滞后期的增加,自相关系数并没有逐渐递减和趋于0,而且有多个自相关系数都超出了95%的置信区间,这表明人均GDP序列不是平稳序列,2020-6-15,自相关与自相关图(自相关图例题分析),【例】棉花产量序列的自相关图,随着滞后期的增加,自相关系数逐渐递减和趋于0,而几乎都在95%的置信区间内,这表明棉花产量序列基本上是平稳序列,2020-6-15,自相关与自相关
46、图(自相关图例题分析),【例】啤酒销售量序列的自相关图,虽然随着滞后期的增加,自相关系数逐渐递减和趋于0,但k=4及4的倍数时的自相关系数明显偏大,而且几乎都超出了95%的置信区间,有明显的周期性特征,表明啤酒销售量具有明显的季节成分,2020-6-15,偏自相关与偏自相关图,2020-6-15,偏自相关与偏自相关图(偏自相关图例题分析),【例】人均GDP序列的偏自相关系数及偏自相关图,2020-6-15,偏自相关与偏自相关图(偏自相关图例题分析),【例】机床产量序列的偏自相关系数及偏自相关图,2020-6-15,偏自相关与偏自相关图(偏自相关图例题分析),【例】棉花产量序列的偏自相关系数及偏
47、自相关图,11.5.2Box-Jenkins方法的基本思想,11.5Box-Jenkins方法:ARIMA模型,2020-6-15,Box-Jenkins方法的基本思想(与经典回归模型的区别),经典的回归预测是通过解释变量(自变量)来预测被解释变量(因变量)的一种模型。用回归模型进行预测时,预测者需要事先知道有哪些因素影响(自变量)影响被预测变量(因变量)。但现实中我们通常不知道影响预测变量的因素有哪些,这时ARIMA模型就是一个很好的选择假定时间序列数据产生于一个黑盒子(blackbox),即回归预测方法是试图寻找自变量来预测观测到的时间序列,即,黑盒子,观测到的时间序列,解释变量(自变量)
48、,黑盒子(回归模型),观测到的时间序列,2020-6-15,Box-Jenkins方法的基本思想,ARIMA该模型是利用时间序列过去的观测值来进行预测的一种方法,它不需要解释变量而Box-Jenkins方法并不是从解释变量入手,而是从观测值入手,然后试图去寻找正确的黑盒子。它可以从某一白噪声(whitenoise)序列产生出所观察到的时间序列,即由于在模型中没有用到解释变量,所以我们假设所观察的时间序列从白噪声序列开始,经过黑盒子后变成要预测的时间序列。这里的白噪声序列实际上就是一系列的纯随即数字,其特点是相邻的观测值之间没有联系;以前的观测值对预测未来的观测值没有作用,白噪声序列,黑盒子,观
49、测到的时间序列,2020-6-15,Box-Jenkins方法的基本思想,Box-Jenkins方法是通过对时间序列实际观测值特征的分析来确定选择什么样的黑盒子将实际序列转化成白噪声序列开始时选择一个最可能的黑盒子,如果得到白噪声序列,就认为这是一个正确的模型,可以用它来进行预测。如果没有得到白噪声序列,就再尝试另一个黑盒子,直到得到白噪声序列为止。这里的黑盒子就是我们要寻找的模型由于实际中我们面对的是一个观察到的时间序列,把上述过程反过来看,如果我们让一个实际观测到的时间序列通过由我们所选择的模型这个黑盒子,若所选择的模型是正确的,那么得到的预测误差就应该是一个白噪声序列,11.5.3ARI
50、MA模型的识别,11.5Box-Jenkins方法:ARIMA模型,2020-6-15,ARIMA模型的识别(AR模型),自回归(autoregression)模型,简称AR模型,是利用观测值Yt与以前时期的观测值之间的关系来预测值Y的一种多元回归方法。P阶AR模型为:,2020-6-15,ARIMA模型的识别(AR模型的识别),AR模型意为着时间序列的任意一个观测值都是由以前的p个观测值的线性组合加上随机误差et如果一个实际的时间序列与AR模型相似,我们就可以用AR模型进行预测对于实际的时间序列,怎样判断它是否与AR模型相似呢?或者说,我们怎样检验一个实际的时间序列是否是AR序列呢?通常的办
51、法是观察时间序列的自相关图和偏自相关图,2020-6-15,ARIMA模型的识别(AR模型的识别),AR序列的自相关图和偏自相关图具有的典型特征自相关图单调递减逐步降为0或交替递减逐步降为0,而它的偏自相关图则具有明显的峰值如果一个序列的偏自相关图只有一个明显的峰值,也就是在p=1后就变得很小,而且没有什么特别的模式,这样的图形称为在p=1后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,那它就是一个AR(1)序列如果偏自相关函数有两个明显的峰值,也就是在p=2后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个AR(2)序列如果它的偏自相关函数有个明显的峰值,
52、也就是在个值后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个AR(p)序列。这时,就可以将该序列识别为一个AR序列,进而用AR模型进行预测,2020-6-15,ARIMA模型的识别(AR模型的识别),AR模型的识别一个白噪声序列生产的AR(1)序列,一个峰值,自相关图,偏自相关图,2020-6-15,ARIMA模型的识别(MA模型),移动平均(movingaverage)模型,简称MA模型,是利用观测值Yt作为因变量,预测Yt时产生的预测误差作为自变量。q阶MA模型为:,2020-6-15,ARIMA模型的识别(MA模型的识别),MA模型意为着时间序列的任意一个观测值都
53、是由目前的和以前的q个随机误差的线性组合如果一个实际的时间序列与MA模型相似,我们就可以用MA模型进行预测对于实际的时间序列,我们怎样判断它是否与MA模型相似呢?或者说,我们怎样检验一个实际的时间序列是否是MA序列呢?通常的办法仍然是观察时间序列的自相关图和偏自相关图,2020-6-15,ARIMA模型的识别(MA模型的识别),MA序列的自相关图和偏自相关图具有的典型特征自相关图则具有明显的峰值,而它的偏自相关图单调递减逐步降为0或交替递减逐步降为0,如果一个序列的自相关图只有一个明显的峰值,也就是在q=1后就变得很小,而且没有什么特别的模式,这样的图形称为在q=1后截尾,而它的偏自相关函数呈
54、现出指数衰减或正弦衰减,呈现出拖尾,那它就是一个MA(1)序列如果偏自相关函数有两个明显的峰值,也就是在q=2后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个MA(2)序列如果它的偏自相关函数有个明显的峰值,也就是在个值后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个MA(q)序列。这时,就可以将该序列识别为一个MA序列,进而用MA模型进行预测,2020-6-15,ARIMA模型的识别(MA模型的识别),MA模型的识别一个白噪声序列生产的MA(1)序列,一个峰值,自相关图,偏自相关图,2020-6-15,ARIMA模型的识别(ARMA模型),自回
55、归移动平均(autoregression-movingaverage)模型,简称ARMA模型,是ARMA模型是由AR(p)模型和MA(q)模型混合而成的ARMA(p,q),AR(p)模型,MA(q)模型,+,ARIMA(p,q),2020-6-15,ARIMA模型的识别(ARMA模型的识别),ARMA序列的自相关图和偏自相关图具有的典型特征自相关图和偏自相关图都是逐渐趋于0而不是突然变为0,或者说自相关图和偏自相关图都拖尾为了确定模型的阶数,需要计算AR项中偏自相关系数显著不为0的项,以及MA项中自相关系数显著不为0的项。如果AR的偏自相关系数有1项显著不为0,MA的自相关系数有1项显著不为0
56、,那这就是一个ARMA(1,1)模型,2020-6-15,ARIMA模型的识别(ARIMA模型),使用ARMA模型进行预测时,要求时间序列必须是平稳的,即时间序列中没有趋势、季节和循环成分,其观测值的平均数不随时间的变化而变化现实中的很多序列都是非平稳的,其自相关系数的特点是:开始通常显著不为0,然后逐渐趋于0,或者在自相关图中呈现出一种伪模式(spuriouspattern)。这时使用自相关图或偏自相关图来识别模型就可能产生误判对于非平稳序列,在选择模型之前需要对其进行修正时期平稳化。消除非平稳性的办法之一就是进行差分(difference),也就是将时间序列中的每期观测值减去其前面的观测值
57、,这称为一阶差分(firstdifference),如果原始序列中存在一个斜率不变的趋势,经过差分后就可以消除趋势成分。如果一阶差分不能消除趋势,就需要进行多次差分。比如,在一阶差分的基础上再进行一次差分,就是二阶差分,等等。如果差分后的序列是平稳的,那么它的自相关系数在k=2或k=3后则会落入随机区间,并逐渐趋于0,2020-6-15,ARIMA模型的识别(MAIMA模型),人均GDP序列一阶差分后的自相关和偏自相关图,自相关图,偏自相关图,自相关图在k=2后出现出随机波动,经一阶差分后的人均GDP序列已上不存在趋势,2020-6-15,ARIMA模型的识别(MAIMA模型),经过差分将序列
58、变成平稳后,通常将模型称为ARIMA(p,d,q)模型其中“I”的加入代表整合项(integrated)或差分项d表示差分的阶数p表示自回归(AR)的项数q表示移动平均(MA)的项数如果模型为ARIMA(p,0,0),就是阶自回归模型AR(p);如果模型为ARIMA(0,0,q),就是阶MA(q)模型;如果模型为ARIMA(p,0,q),就是自回归移动平均模型ARMA(p,q),2020-6-15,ARIMA模型的识别(MAIMA模型),2020-6-15,ARIMA模型的识别(MAIMA模型),2020-6-15,ARIMA模型的识别(ARIMA(p,d,q)模型例题分析),【例11-11】
59、利用例11-1中的金属机床产量序列,选择适当的ARMA模型进行预测,拟合ARIMA模型,ARIMA模型的应用,SPSS,2020-6-15,ARIMA模型的识别(ARIMA(p,d,q)模型例题分析),机床产量序列一阶差分后的自相关和偏自相关图,自相关图,偏自相关图,一阶差分后的序列已不存在趋势,且各有一个明显的峰值,选用ARIMA(1,1,1)模型,2020-6-15,ARIMA模型的识别(ARIMA(p,d,q)模型例题分析),机床产量序列一阶差分后的自相关和偏自相关图,自相关图,偏自相关图,一阶差分后的序列已不存在趋势,且各有一个明显的峰值,选用ARIMA(1,1,1)模型,2020-6-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 47217-2026犬猫体况评分技术规范
- GB/T 17980.14-2026农药田间药效试验准则第14部分:杀虫剂防治菜螟
- 浙江省杭州市杭州市萧山区高桥初级中学2025-2026学年普通高中毕业班单科质量检查数学试题含解析
- 浙江省温州市六校2026届初三5月质检英语试题含解析
- 陕西省西安市高新第一中学2026年初三下期入学检测试题数学试题含解析
- 陕西省西安市西安交大附中2025-2026学年初三第二次模拟测试英语试题含解析
- 浙江省宁波市余姚市重点名校2026年初三化学试题质量调研卷(文理合卷)含解析
- 浙江省宁波市镇海区重点达标名校2026年中考二轮物理试题1-4月复习专号数理报含解析
- 武汉市2026届初三下学期期初学情调研考试数学试题试卷含解析
- 2025 高中时评类阅读理解之文化传承创新问题课件
- DB31/T 5000-2012住宅装饰装修服务规范
- 钢结构预拼装方案及标准
- 马工程西方经济学(精要本第三版)教案
- 【初中 语文】第15课《青春之光》课件-2024-2025学年统编版语文七年级下册
- GenAI教育在不同场景下的应用案例分析与演进路径
- GB/T 44815-2024激光器和激光相关设备激光束偏振特性测量方法
- 某爱琴海购物中心开业预热推广方案
- 口腔颌面部肿瘤-血管瘤与脉管畸形的诊疗
- 康复质控中心建设思路和工作计划
- GB/T 44457-2024加氢站用储氢压力容器
- 和父亲断绝联系协议书范本
评论
0/150
提交评论