版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二节经济社会发展预测模型一回归预测模型二时间序列模型线性回归分析非线性回归分析概率统计方法计量经济方法(投入产出方法、宏观计量经济模型)状态转移分析法仿真神经网络技术定性预测方法时间序列分析因果关系预测
专家调查法类比法市场调查移动平均法指数平滑法灰色预测法趋势外推法季节系数法预测方法分类回归分析方法线性回归的概念1.预测原理函数关系(确定性关系),Y=4X相关关系(非确定性关系,随机关系)汽车生产数量X与所需车轮数量Y之间的关系人的身高X与体重Y之间的关系在研究相关关系时,将其中一些因素作为所控制的变量(自变量X),另一些随机变量作为它们的因变量Y,这种关系分析就称为回归分析。具有相关关系的变量,虽然不能用准确的函数式表达其联系,却可以通过大量实验数据(或调查数据)的统计分析,找出各相关因素的内在规律,从而近似地确定出变量间的函数关系。回归regression19世纪英国生物学家高尔顿统计概念-相关correlation-回归分析2.预测步骤(1)调查分析,确定相关因素(确定回归方程中的自变量和因变量),收集统计资料;(2)从收集到的样本数据(散点图)出发确定自变量和因变量之间的数学关系式,即建立回归方程;(3)对回归方程进行统计检验,验证方程的合理性;(4)利用回归方程进行预测。
研究变量间的相关关系及其相关程度3.适用范围在使用回归分析法之前,先要通过经济理论分析或实践经验研究变量之间是否存在相关关系,对不存在相关关系的变量,就不能够用这种方法进行预测。一元线性回归分析一元线性回归模型是用于分析一个自变量x与一个因变量y之间线性关系的数学方程,又称回归方程或回归直线。其数学表达式(经验回归方程)是:称为变量y对x的一元线性回归方程。——预测对象,因变量或被解释变量——影响因素,自变量或解释变量——常数,表示回归直线在纵轴上的截距——回归系数(又称斜率),表示当自变量变动一个单位所引起的因变量的平均变动单位
基本原理:最小二乘法原理以回归直线与样本数据点在垂直方向上的偏离程度(残差平方和)最小为原则,进行回归方程的参数求解。
Oyx残差=实际值-回归值=实际值-拟合值样本数据点回归直线一元线性回归模型的检验经济意义检验计量检验统计检验四种统计检验回归方程显著性F检验相关系数r的显著性检验拟合优度检验r2回归系数显著性t检验回归方程显著性F检验相关系数r的显著性检验拟合优度检验r2回归系数显著性t检验一元线性回归检验统计检验回归系数显著性t检验为查t分布表得到的临界值,不通过回归系数显著性检验,通过回归系数显著性检验是否与零有显著性差异为显著性水平,n为样本数量,显著性水平,significancelevel是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设”错误的可能性大小。越小,犯拒绝“假设”的错误可能性越小。回归系数显著性t检验是否与零有显著性差异为查t分布表得到的临界值=3.182?,通过。回归系数显著性t检验是否与零有显著性差异查表t分布表如果不查表,如何进行检验?方法就是用相伴概率值,也称P值,不通过回归系数显著性检验,通过回归系数显著性检验?软件自动计算t的相伴概率值,P=0.005,通过回归系数显著性检验通过回归方程显著性检验不通过回归方程显著性检验为查t分布表得到的临界值为显著性水平,n为样本数量回归系数显著性t检验是否与零有显著性差异P为相伴概率值,回归方程显著性F检验,通过回归方程显著性检验,不通过回归方程显著性检验为查F分布表得到的临界值检验因变量y与自变量x之间的线性关系是否显著为显著性水平,n为样本数量=10.13?,通过。回归方程显著性F检验检验因变量y与自变量x之间的线性关系是否显著F分布临界值表,α=0.05通过回归方程显著性检验不通过回归方程显著性检验为查F分布表得到的临界值为显著性水平,n为样本数量回归方程显著性F检验检验因变量y与自变量x之间的线性关系是否显著P为相伴概率值,相关系数是反映两变量间是否存在相关关系,以及这种相关关系的密切程度的统计量。相关系数r(1)当|r|=0时,表示变量y与x之间无相关关系;(2)当r→+1时,表示y与x之间存在强正相关,x增加时,将引起y的增加(2)当r→-1时,表示y与x之间存在强负相关,x增加时,将引起y的减少(4)当0<|r|<1时,表示变量y与x之间存在不同程度的线性相关关系:当|r|=1时,表示变量y与x完全线性相关;当0<|r|
0.3时,为微弱相关;当0.3<|r|0.5时,为低度相关;当0.5<|r|0.8时,为显著相关;
当0.8<|r|1时,为高度相关。
工程中希望r越大越好Oyxr=1Oyxr=-1Oyxr=0Oyx0<r<1Ox-1<r<0Ox|r|<1(a)(b)(c)(d)(e)(f)回归方程显著性F检验相关系数r的显著性检验回归系数显著性t检验一元线性回归检验统计检验关系?三种检验结果完全一致t检验与相关系统r检验完全等价F统计量是t统计量的平方拟合优度检验r2数量指标:判定系数r2拟合优度是指样本数据点在样本回归直线周围的紧密程度,以此评价回归方程对样本数据的代表程度。Oyx判定系数r2性质:1.具有非负性2.取值范围0≤r2≤1修正判定系数r2在线性回归分析中,修正判定系数越大越好。修正判定系数更能准确地反映回归方程对样本数据点的拟合程度。随着自变量个数增加,r2必然也增加数学习性还是引入好的自变量?回归方程显著性F检验相关系数r的显著性检验拟合优度检验r2回归系数显著性t检验一元线性回归检验统计检验r2越大越好残差分析残差=实际值-回归值=实际值-拟合值,可看作是误差项的估计值。
线性回归模型的前提要求残差项应服从方差相等的正态分布,且残差间相互独立。
Oyx理论模型经验模型e是不可观测的随机误差表示其它因素的影响
一元线性回归检验残差分析残差随机性残差正态性残差独立性(1)残差独立性分析DW=2时,表示残差序列不存在自相关,实际应用中,一般要求DW值处在1.5-2.5之间,接近2时基本可以认定残差序列具有独立性。0<DW<2时,表示残差序列存在某种程度正自相关。2<DW<4时,表示残差序列存在某种程度负相关。DW(Durbin-Watson)检验:用于检验随机误差项是否存序列相关,以保证预测结果的有效性。(2)残差随机性分析残差散点图横轴:因变量回归值纵轴:残差如果残差序列是随机的,那么残差序列应与预测值序列无关,所有残差应是在附近随机变化,并在变化幅度不大的一条带子内(-2和+2之间)。(3)残差正态性分析①残差直方图。是以一组无间隔的直条图表现残差频数分布特征的统计图,其中每一条形的高度分别代表相应组别的频率。直方图可以展示正态分布曲线及其参数。图形显示越接近标准正态分布越好。②积累概率图。是一种用来判断一个变量分布与指定分布是否符合的概率分布图。这里代表残差分布的曲线与代表正态分布的斜线重合程度越高,则两种分布的一致性越好。一元线性回归检验残差分析残差随机性残差正态性残差独立性残差应在变化幅度不大的一条带子内(-2和+2之间)残差直方图或积累概率图DW=1.5~2.5回归方程显著性F检验相关系数r的显著性检验拟合优度检验r2回归系数显著性t检验一元线性回归检验统计检验残差分析残差随机性残差正态性残差独立性残差应在变化幅度不大的一条带子内(-2和+2之间)残差直方图或积累概率图DW=1.5~2.5判定系数r2越大越好一元线性回归方程:多元线性回归分析多元线性回归方程中的自变量个数有2个以上,是一元线性回归模型的扩展,其基本原理与一元线性回归模型相类似,仍然采用最小乘法确定回归方程参数
式中,假定该线性方程中有k个自变量。-常数项-方程的偏回归系数。偏回归系数表示当其他自变量都固定时,某一自变量变化一个单位而使因变量平均变化的量。回归方程显著性F检验相关系数r的显著性检验拟合优度检验r2回归系数显著性t检验多元线性回归检验统计检验回归方程显著性F检验相关系数r的显著性检验拟合优度检验r2回归系数显著性t检验多元线性回归检验统计检验残差分析残差随机性残差正态性残差独立性残差应在变化幅度不大的一条带子内(-2和+2之间)残差直方图或积累概率图DW=1.5~2.5判定系数r2越大越好多元线性回归方程:时间序列分析方法(简称时序分析)是在具有先后顺序的信号中提取有用信息的一门学科。时序分析起源于上世纪20年代,最早是为了市场预测。随着对时序分析的理论和应用这两方的深人研究。时序分析的应用范围日益扩大,从一般的市场预测到语音识别与模拟,从机械设备的监视到生物生理、心理状态研究,时间序列分析的应用也越来越广泛,越来越深入。
二时间序列模型时间序列就是一个变量在一定时问段内不同时间点上观测值的集合,如Y:{Y1,Y2,…,},这些观测值是按时间顺序排列的,时间点之间的间隔是相等的。时间序列获取以后可以对它进行预测分析,预测方法可以从定性分析法和定量分析法两方面考虑。
(一)时间序列的含义时间序列的组成长期趋势变动一个时间序列可能相对平稳或表现出一定的趋势。长期趋势一般是线性、二次或者指数函数.季节性变动当变化规律在一些时间内重复,序列就认为具有季节因素影响.季节因素通常与日期和气候变化有关.季节变动的时间通常以年为单位.周期变动上升或下降与季节变动无关.通常是由经济条件的改变引起的.随机因素时间序列分析预测法定量方法:(1)算术平均法(2)加权平均法(3)几何平均法(4)移动平均法(5)指数平滑法(6)季节指数法ARMA模型ARMA模型是一类常用的随机时间序列模型,是一种精度较高的时间序列短期预测方法,其基本思想是:某些时间序列是依赖于时间t的一组随机变量,构成该时间序列的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述.ARMA模型的基本原理将预测指标随时间推移而形成的数据序列看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延续性。一方面,影响因素的影响,另一方面,又有自身变动规律,假定影响因素为x1,x2,…,xk,由回归分析,
其中Y是预测对象的观测值,e为误差。作为预测对象Yt受到自身变化的影响,其规律可由下式体现,误差项在不同时期具有依存关系,由下式表示,
由此,获得ARMA模型表达式:ARMA模型的三种基本类型:
ARMA模型(Auto-RegressiveandMovingAverageModel)是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成。自回归(AR:Auto-regressive)模型移动平均(MA:MovingAverage)模型自回归移动平均(ARMA:Auto-regressiveMovingAverage)模型1、自回归【AR
】模型自回归序列:
如果时间序列是它的前期值和随机项的线性函数,即可表示为【1】【1】式称为阶自回归模型,记为AR()
注1:实参数称为自回归系数,是待估参数.随机项是相互独立的白噪声序列,且服从均值为0、方差为的正态分布.随机项与滞后变量不相关。
注2:一般假定均值为0,否则令
记为步滞后算子,即,则模型【1】可表示为令
,模型可简写为AR()过程平稳的条件是滞后多项式的根均在单位圆外,即的根大于1【2】2、移动平均【MA】模型移动平均序列:
如果时间序列是它的当期和前期的随机误差项的线性函数,即可表示为
【3】式【3】称为阶移动平均模型,记为MA()注:实参数为移动平均系数,是待估参数
引入滞后算子,并令则模型【3】可简写为
注1:移动平均过程无条件平稳注2:滞后多项式的根都在单位圆外时,AR过程与MA过程能相互表出,即过程可逆,【4】即为MA过程的逆转形式,也就是MA过程等价于无穷阶的AR过程注3:【2】满足平稳条件时,AR过程等价于无穷阶的MA过程,即3、自回归移动平均【ARMA】模型自回归移动平均序列:如果时间序列是它的当期和前期的随机误差项以及前期值的线性函数,即可表示为【5】式【5】称为阶的自回归移动平均模型,记为ARMA注1:实参数称为自回归系数,为移动平均系数,都是模型的待估参数注2:【1】和【3】是【5】的特殊情形注3:引入滞后算子,模型【5】可简记为【6】注4:ARMA过程的平稳条件是滞后多项式的根均在单位圆外可逆条件是滞后多项式的根都在单位圆外
一、自回归移动平均模型的概念
如果平稳随机过程既具有自回归过程的特性又具有移动平均过程的特性,则不宜单独使用AR(p)或MA(q)模型,而需要两种模型混合使用。由于这种模型包含了自回归和移动平均两种成分,所以它的阶是二维的,由p和q两个数构成,其中p代表自回归成分的阶数,q代表移动平均成分的阶数,记作ARMA(p,q),称作自回归移动平均混合模型或称为自回归移动平均模型。最简单的自回归移动平均模型是ARMA(1,1),其具体形式为:模型ARMA(p,q)的一般表达式为显然,ARMA(0,q)=MA(q),ARMA(p,0)=AR(p),因此,MA(q)和AR(p)可以分别看作ARMA(p,q),当p=0和q=0时的特例。(二)时间序列模型的步骤1、获得时间序列数据要进行时间序列分析,首先要有时间序列数据,这里可以是有时间变量的数据,也可以是物理上的空问变里数据等具有一定前后相关性的数据。2、判断时间序列是否平稳平稳序列的特点:a.不同时刻,均值相同。围绕常数的长期均值波动,即均值问复。b.方差有界并且不随时间变化,是常数。在毎一时刻,对均值的偏离基本相同,波动程度大致相等。c.预测的特点足收敛到均值。判断数据是否平稳的方法:a.检验序列的平稳性。主要记单位根检验方法。b.观察观测数据的折线图。如果折线图有趋势或经常不会到均值线上,说明序列不平稳。c.观察样本自相关函数图形。如果样本自相关函数不呈指数衰减趋势,也说明序列不平稳。如若序列平稳进行下一步,否则需要平稳化。平稳方法主要有差分法。但问时要注意不能过度差分,这样会导致模型不能满足可逆条件。判断过度差分的常见方法是差分后的方差是否会増大,如果增大则表示已过度差分。纯随机性检验纯随机序列也称为白噪声序列,对于一个纯随机过程来说,若其期望和方差均为常数,则称之为白噪声过程。白噪声过程的样本实称成为白噪声序列,简称白噪声。之所以称为白噪声,是因为他和白光的特性类似,白光的光谱在各个频率上有相同的强度,白噪声的谱密度在各个频率上的值相同。它满足如下两条性质:检验原理:如果一个时间序列是纯随机的,得到一个观察期数为n的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布:原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性
样本自相关系数:
拒绝原假设:当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列。反之则接受。
结论:若检验结果显示接受原假设,则此次时叫序列分祈结束,再做分析没有任何意义。若是结果拒绝,则进行下一步。4、模型识别对于AR、MA、ARMA模型,在进行参数估计之前,需要进行模型的识别。识别的基本任务是找出ARMA(p,q)、AR(p)、MA(q)模型的阶。方法:(1)残差方差图定阶法(2)自相关函数(ACF)和偏相相关函数定阶法(PACF)(3)F检验定价法(4)信息准则定阶法(AIC及BIC准则)
基本原则MA(q)AH(p)ARM(p,q)自相关函数q步拖尾拖拖尾偏自相关函数拖尾P步截尾拖尾时间序列样本的自相关函数(ACF)和偏自相关函数(PACF)定阶法。根据自相关函数,当k>q时,yt与yt-k不相关,这种现象称为截尾,因此,当k>q时,自相关函数为零是MA(q)的一个特征。也就是说,可以根据自相关系数是否从某一点开始一直为零来判断MA(q)模型的阶。MA(q)的偏自相关系数随着滞后期的增加,呈现指数衰减,趋向于零,这称为偏自相关系数的拖尾性。根据自相关函数的特征,可见AR(p)序列的自相关函数是非截尾序列,称为拖尾序列。因此,自相关函数拖尾是AR(p)序列的一个特征。根据偏自相关函数的特征,当k>p时,PACF=0,也就是在p以后截尾。AR(p)模型的识别。若序列的偏自相关函数在p以后截尾,而且自相关系数是拖尾的,则此序列是自回归AR(p)序列。MA(q)模型的识别。若序列的自相关函数在q以后截尾,而且偏自相关系数是拖尾的,则此序列是移动平均MA(q)序列。ARMA(p,q)模型的识别。若序列的自相关函数和偏自相关系数都是拖尾的,则此序列是自回归移动平均ARMA(p,q)序列。至于模型中p和q的识别,则要从低阶开始逐步试探,直到定出合适的模型为止。计算样本相关系数样本自相关系数样本偏自相关系数由克莱姆法则,解Yule-Walker方程组得到。AIC准则是由日本学者赤池(Akaike)在识别AR模型阶数准则即最小最终预测误差准则(FPE)的基础上推广发展到识别ARMA模型阶数,称为最小信息准则AIC,进而赤池又从Bayes观点出发引入新的准则,称为BIC。信息准则定阶法定阶准则:
是模型的未知参数的总数是用某种方法得到的方差的估计为样本大小,则定义AIC准则函数
用AIC准则定阶是指在
的一定变化范围内,寻求使得
最小的点
作为的估计。
AR()模型:ARMA模型:BIC(S)=ln+(SlnN)/N5、估计未知参数
常用估计方法:矩估计极大似然估计最小二乘估计模型参数估计一般分两步进行,首先找出参数的初步估计,又称矩估计,然后在初步估计的基础上,根据一定准则,用最小二乘法和极大似然估计法作参数的精估计。MA()模型
ARMA模型的参数矩估计分三步:
i)求的估计
(1)矩估计ii)令,则的自协方差函数的矩估计为
iii)把近似看作MA()序列,利用(2)
对MA()序列的参数估计方法即可
矩估计的特点:优点估计思想简单直观不需要假设总体分布计算量小(低阶模型场合)缺点信息浪费严重只依赖p+q个样本自相关系数信息,其他信息都被忽略估计精度较差通常矩估计方法被用作极大似然估计和最小二乘估计迭代计算的初始值
(2)极大似然估计原理极大似然准则:抽取的样本出现概率最大。因此未知参数的极大似然估计就是使得似然函数(联合密度函数)达到最大的参数值
似然方程由于和都不是的显式表达式。因而似然方程组实际上是由p+q+1个超越方程构成,通常需要经过复杂的迭代算法才能求出未知参数的极大似然估计值
极大似然估计的特点优点极大似然估计充分应用了每一个观察值所提供的信息,因而它的估计精度高同时还具有估计的一致性、渐近正态性和渐近有效性等许多优良的统计性质缺点需要已知总体分布实际中,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 历史隋唐时期的民族交往与交融 课件 2025-2026学年统编版七年级历史下学期
- 医药活动招商策划方案(3篇)
- 住院医师规范化培训《全科医学》模拟练习题与参考答案
- 2025年8月住院医师规范化培训《康复医学》练习题库(附答案)
- 食品饮料行业调研报告:需求稳中向好茅台领衔白酒零食餐供亮眼-2026年食品饮料春节旺季调研反馈
- 医药股票投资可行性研究报告
- 年产1.6GWh户用钠电池储能系统生产项目可行性研究报告
- 温通拨筋罐在脑卒中后便秘中的应用
- 农业领域中的太阳能利用技术探讨
- 传染病防控中护理人员职责与操作规范
- 警车日常工作科普知识培训课件
- 海外项目质量管理体系的实施要求与案例分析
- 普货运输综合应急演练记录
- 设备检查管理办法
- 仔猪供货方案模板(3篇)
- 一例肺炎患者的个案护理
- 文明实践健康义诊活动策划
- 2025年内蒙古自治区中考物理试题(原卷版)
- 2024司法考试试题及答案
- 2025年山西省中考英语试卷真题(含答案详解)
- TD/T 1036-2013土地复垦质量控制标准
评论
0/150
提交评论