




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
I 基于 ARIMA 模型的股价预测研究 摘 要 随着我国金融市场的逐步放开、股票市场的迅猛发展,股票市场作为整个国民经济的重要基石之一,其地位和作用也日益突出如何有效地控制金融市场风险,促使金融市场有效、健康的运行,已成为我国金融机构面临的重大挑战而通过历史数据,建立ARIMA 模型,能较好地预测股价的发展趋势,从而使股票的投资者和管理者获得最大的回报或最小的损失。本 文 利用同花顺软件收集 深 市 同德化工( 002360) 股票 从 2010年 3月 3 日 2016 年 4 月 25 日 间的 每 日 收 盘 价 ,其中样本数据 采用股指对数收益率作为样本数据 ,并采用其数据进行平稳、零均值化处理,模型识别和模型定阶,在使用最小二乘法估计参数后,建立 ARIMA模型;最后利用已建模型预测出未来 3 天的股票开盘价 指数 ,并与实际数据相对照,计算模型预测误差,验证 ARIMA模型是否适合于所选股票的短期预测。 关键词: 股价 ARIMA模型 II Comparison of urban and rural residents in Hebei Province Li da Directed by Lecturer Liu linghui Abstract In recent years, under the guidance of the national integration strategy launched in Beijing, Tianjin, Hebei Province, by means of its regional advantages Hebei Province efforts to build one hour life circle.Accelerate the flow of population makes the structural differences in Hebei Household Consumption size changed.In order to better describe this difference, and this difference is a measure of the size of the paper to survive and consumption, development and enjoyment and consumption and consumption in total consumption in proportion to the share of differences and build differentiated consumption structure.In this paper, descriptive statistics, found that the proportion of urban and rural consumption structure difference in survival consumption and enjoyment and consumption of large differences in the development and consumption of a smaller proportion of the status quo.Then analyzed to find a comprehensive description of the size difference factor by factor analysis reveals that the reason for the difference generated by the status quo.Finally, the specific economic development in Hebei Province, Hebei Province, is given to promote the coordinated development of urban and rural consumption policy recommendations. KEY WORDS: Urban and Rural Residents Consumption Differences Compare Research 1 目 录 摘 要 . I 英文摘要 . II 目 录 . 1 前 言 . 2 1 概念界定 . 5 1.1 城镇和乡村的界定 . 5 1.2 本研究中的消费结构 . 5 2 指标体系的建立与原数据的选取 . 20 2.1 河北省城乡居民消费结构体系的建立 . 20 2.2 河北省城乡居民消费结构数据 .错误 !未定义书签。 3 河北省消费结构的描述性统计分析 . 23 3.1 恩格尔系数分析 . 23 3.2 衣着和房屋消费分析 . 24 3.3 交通通信和文化教育消费分析 . 25 3.4 家用服务和医疗保健消费分析 . 27 4 河北省消费结构的因子分析 . 28 4.1 原数据与数据预处理 . 28 4.1.1 原始 数据的选取 . 28 4.1.2 数据预处理 . 29 4.2 确定公共因子和载荷矩阵 . 30 4.3 因子旋转与两个公因子的实际含义 . 31 4.4 计算因子得分与差异趋势 . 32 5 结论 与建议 . 33 5.1 差异现状分析 . 33 5.2 原因分析 . 33 5.3 建议 . 34 参考文献 . 35 附录 . 36 致 谢 . 38 2 前 言 随着社会的进步及科技的快速发展,中国的股票市场也日益完善,并且逐步成为我国最重要的资本市场之一。由股份公司在筹集资本时向投资者发行的一种有价证券称为股票。它可以显示出投资者股权身份和权力,股票持有者可以根据所持的股份享有专有的权力。它也是股票持有者承担义务的凭证。只有股份有限公司可以发售股票,并且它只能发给持股者持股证明,同时不能转售,所以股票市场就是股票转让、流通和买卖的场地,它包含交易所市场及场外交易市场。股票是一种“投资小、收益大”同时伴随高风险的投资行为,所以无论是投资者还是股票的管理者,预测股价的 发展走势,通过了解股价的发展走势来进行投资与管理尤为重要。而所谓的股票价格趋势分析就是借助某种工具通过对股价现有的情况来对未来的股价进行预测,已有研究表明应用时间序列分析理论可以对未来的股价进行分析和研究。 实际上,应用时间序列分析知识的领域是十分广泛的。时间序列分析的应用一般有两个目的 :一个是通过给出的数据生成模型,二是根据历史数据,预测出将来的可能取值。学者常常能通过一定顺序的时间点来观察所获得的数据,如日股票开盘价、某城市的降水量、每毫秒心电活动的状况、月价格指数、年销售量等等 。 在观察这些数据时发现它 们之间具有相依性。通过对这些具有相依性的数据进行观察与研究来找出其发展规律,并利用其规律来拟合出数学模型,这些数学模型可以用来预测数据的未来发展走向。 而 ARIMA模型就是其最重要的时间序列模型之一 。 他能很好地预测股价的发展趋势,从而使股票的投资者和管理者得到最大的收益。 随着社会的快速进步和发展,股票市场也逐渐成为我国经济发展和金融活动的阴晴表。正规股票市场最早出现在美国。如果股票交易市场出现了不良影响,那么势必会影响经济及其金融的发展。在股市活跃的投资者和管理者都知道股市唯一不变的性质就是它是每分每秒都在变化。这就需要我们借助某种工具来研究股价的趋势走向。我们使用时间序列分析对股价进行分析,进而达到“投资小,收益大”的目的。通过对股价数据的分析,利用时间序列分析中的模型对其建模,进而了解股价的未来走向。 时间序列分析在很多领域应用得十分广泛。 1970 年, George E.P. Box 和Gwilym M. Jenkins 著写了一本名为 (Time Series Analysis-Forecasting and Control的书 1。此书引起了广泛的关注和重视。其后国内外学者通过多个领域对时间序列分析进行研究,并且出版了许多专著和专门的期刊。如 1994 年,J.Hamilton著写 Time Series Analysis 2。 2003年,美国的经济学家 Robert F.Engle 和英国的经济学家 Clive W J.Grange 因在经济时间序列分析上取得了 3 巨大的成 就而获得诺贝尔经济学奖 3。 1999 年,查正洪利用时间序列分析对上证综合指数进行建模分析与研究,从而建立了 ARIMA 模型 4。冯盼和曹显兵在“基于 ARMA 模型的股价分析与预测的实证研究”中 5,利用单位根检验首先确定原序列的平稳性,从而利用差分法使其变得平稳并通过 ADF 检验,然后建立 ARMA 模型,并利用猜想法确定 p 和 q 的值。再确定模型的参数值来确保模型的参数显著,最后对于所建的模型进行残差 检验来确定模型的合理性,并利用所建模型对股价进行预测。通过对比实际值和预测值,可以看出所建模型是较为合理的。郭雪、王彦波的“基于ARMA 模型对沪市股票指数的预测” 6及邓军、杨宣、王玮等的“运用 ARMA 模型对股价预测的实证研究” 7和邵丽娜的“基于 ARMA模型对招商银行股票价格的预测” 8,这些文章都是应用 ARIMA模型对其数据进行建模与预测。 总之,目前的研究是在 ARIMA模型的基础上对股票进行分析来建立模型和拟合模型,最终达到预测的目的,从而使股票受益者达到利益最大化。 本文主要关注的 是 ARMA模型在股价指数拟合和预测方面的应用 9。我们知道, ARMA 模型是基于数据序列为线性、平稳的假设前提下的,而事实上,经济时间序列的一个重要特征是存在趋势性及非线性成分,即通常认为时间序列)(tY 具有以下形式: )()()()( tCtStXtY 其中 )(tX 为趋势性成分, )(tS 为季节性成分, )(tC 为随机性成分。 ARMA 模型是针对随机性成分 )(tC 的建模。对季节性成分 )(tS (如果存在的话 ),通常采用季节调整;对趋势性成分 )(tX ,通常采用 d 阶差分的办法去除趋势性,使之平稳,然后用 ARMA (p, q)模型拟合,此即为 ARIMA (p, d, q)模型,然而对于某些数据样本,比如文所选取的深 市 同德化工( 002360) 股票 2015年 8月 2016年 3月 的对数数据序列,虽然存在明显的趋势,对其进行一阶差分后固然消除了趋势成分使序列平稳,然而得到的序列自相关性不明显,在显著性水平下与历史数据呈不相关性,即为一个白噪声序列。本文考虑的是用 ARIMA 模型来拟合时间序列的趋势性成分。下面是论文的框架 : 第二章首先阐述时间序列模型 AR、 MA、 ARMA 及 ARIMA 的概念;其次绍 AR、 MA 和 ARMA 模型参数的估计、模型的检验和选择模型的标准 ;最后说明 ARIMA 模型的差分阶数的确定和适用标准。 第三章采用 ARIMA 模型对深 市 同德化工( 002360) 股票 进行分析预测,分别介绍了指数组成的来源,模型的识别和定阶、检验,并比较了预测结果。 4 第四章结束语。 5 1 时间序列的理论模型与方法概述 本文在这一章里主要介绍时间序列的相关概念以及模型,以便为下面章节的顺利展开做一个铺垫。时间序列 (Time Series)系指以时间顺序型态出现之一连串观测值集合,或更确切的说,对某动态系统 (Dynamic System)随时间连续观察所产生有顺序的观测值集合。 1.1 时间序列模型的含义 时间序列是以时间顺序生成的观测值的集合 10。分为连续型时间序列和离散型时间序列。本文中我们讨论离散型时间序列,它是某一过程中的某一个变量或一组变量 tY 在一系列时刻上如 : )(, 212,1 mm ttttttt 为自变量,且 得到的离散有序数集合 mYYY , 21 ,即某一过程在 mttt , 21 时刻的观测值,一般为离散等间隔的数字时间序列,属于随机过程的一次样本实现。如 :某产品价格的月度数据、某产品产量的年度数据、消费品价格指数的季度数据以及股票价格的口数据等等都是以时间序列的形式出现的。 随机过程指随时间顺次发展且遵从概率法则的统计现象。 1.2 随机时间序列模型 随机时间序列的一个最基本特征就是相邻两个数据之间有相互依赖性,即 :两个随机数据呈现一定的相关。时间序列分析就是依据不同时刻变量的相关关系进行分析,生成随机动态模型来揭示其相关结构并进行预测。本文主要采用ARIMA模型的时间序列预测方法。 1.3 平稳时间序列 利用 ARIMA模型对时间序列进行分析的时候,要求序列是平稳的。非平稳的时间序列要转化为平稳时间序列再利用 ARIMA 模型进行预测。 1.3.1 随机平稳时间序列 6 随机平稳过程如果一个随机过程在 t 和 kt 时刻变量概率分布的随机特性不随时间的改变而改变,我们便称其为随机平稳过程。随机平稳过程的联合分布和条件分布均不随时间变化而发生变化,即过程的随机性具有时间上的不变性,在图形上表现为所有的样本点皆在某一水平线上下随机地波动。由随机平稳过程产生的时间序列即为随机平稳时间序列。如果序列 yt 是平稳的,则对任意 kt, 和m 都有 ),( ktt YY 与 )( kmtmt YY , 是同分布的。 所以平稳时间序列 yt 有以下性质 : 1、序列的数学期望 )()( tt yEyu 是常数,记为 yu ; 2、序列的方差 )( 22 ymty uyE 是常数,所以 )()( 22 ymtyt uyEuyE 3、序列的自协方差 : )(),co v ( ymtytkttk uyuyEyy 是常数,所以,对于任意 ),c o v (),c o v (, kmtmtktt yyyyk 。 白噪声过程是一种特殊的平稳序列,也是最简单的平稳时间序列。如果一个平稳序列 rt 对于任何 st, ,都有 2 为常数 strrurE stt ,0),c o v (,)( 为任取的时刻且 st 就称 rt 是一个白噪声。 当 rt 是独立序列时,称 rt 为独立白噪声。 当 0u 时,称为零均值白噪声 ; 当 1,0 2 u 时,称为标准白噪声 ; 平稳时间序列的线性模型 11 1、自回归模型 (Autoregressive model) 如果一个随机平稳时间序列在任意时刻 t 的取值 Y ,都可以表示成为过去 p 个时刻上的数值 pttt yyy , 21 的线性组合加上 t 时刻的残差,并且构成残差的序列表现白噪声的性质。这样的序列就可以用自回归模型表示为 : Ttyyycy tptpttt ,2,1,2211 7 其中 :参数 c 为常数 ; p , 21 是自回归模型系数,且 0p ;p 为自回归模型的阶 数 ;t 是均值为 0 ,方差为 2 的白噪声序列。可以表示为上述形式的平稳序列模型称为自回归模型。 p 阶自回归模型简记为 AR(P). 2、移动平均模型 (Moving average model) 如果一个随机平稳时间序列 Y 在任意时刻 t 的取值都可以表示为过去 q个时刻残差序列 t 的加权平均值和 t 的和,并且残差序列 t 表现为白噪声的性质。这样的时间序列用移动平均模型可以表示成为 : Tty qtqtttt ,2,1,2211 其中 :参数 为常数 ; q , ,21 是自回归模型系数,且 ;0q q 为自回归模型的阶数 ;t 是均值为 0 ,方差为 2 的白噪声序列。符合上述形式的模型称为移动平均模型。 q 阶移动平均模型简记为 :MA(q)。 3、自回归移动平均模型 (Autoregressive Moving Average Model) 自回归移动平均过程是自回归过程和移动平均过程的组合。所以自回归移动平均模型可以表示成为 : Ttyyycy qtqtttptpttt ,2,1,22112211 显然此模型是 AR(p)和 MA(q)的混合形式,称为混合模型,常记作ARMA( p, q)。当 0p 时, )(),0( qMAqA R M A ;当 0q 时, ARMA( p, 0)=AR( p)。 其中 :参数 c 为常数 ; p , 21 是自回归模型系数,且 ;0q q 为自回归模型的阶 数 ; t 是均值为 0,方差为 2 的白噪声序列。上述形式的平稳时间序列称为自回归移动平均模型,简记为 ARMA (p, q)。 4、自回归求积移动平均模型 (Autoregressive Integrated Moving Average Model) 如果一个时间序列模型是非平稳的,在建模的过程中我们必须把他差分d 次,把它变为平稳的,然后用 ARMA (p, q)作为它的模型,那么,我们就说那 8 个原始的时间序列是 ARIMA (p, d, q),我们把它称作是一个自回归求积移动平均模型。 1.3.2 非平稳时间序列 非平稳序列时间序列的统计规律随着时间推移而不断发生变化,即生成变量时间序列的随机过程的特征随时间变化。只要平稳过程中的三个条件不完全满足,它所生成的时间序列就是非平稳时间序列。非平稳时间序列分为两种 : 1、趋势平稳的时间序列时间序列有确定性的时间趋势,去除这种趋势后即为平稳时间序列。用方程表示为 : tt utfy )( 其中 ty 表示为时间序列在 t 时刻的取值 ; )(tf 表示为时间的函数 ;tu 表示为残差序列,并且 ut 为一平稳时间序列。 一般我们讨论的只有线性趋势平稳的时间序列。所以可以表示为 : tt uty 对于线性趋势平稳的时间序列,去掉完全确定的线性趋势后 所形成的时间序列就是一个平稳时间序列。即 : )( tyu tt 为一平稳的时间序列。 所以我们可以采用最小二乘法估计这个趋势,然后利用所估计出来的趋势进行预测。 判断一个时间序列是否能用线性模型拟合这种上升趋势,就要对)( tyu tt 的平稳性进行检验。因为 和 未知,所以通过最小二乘法估计出 和 ,然后对估计的残差 )( tyu t 进行平稳性检验。 2、差分平稳时间序列经过一次或者多次差分后的平稳时间序列称为差分平稳时间序列 12,13。非平稳时间序列转化为平稳序列所要经过的差分的次数被称为差分平稳序列的阶。记为 ddI ),( 为差分阶数 , ,2,1d 。 一般一阶差分记为 Y ,即 : ,1tt YYY 为差分运算符 9 同样 d 阶差分记为 Yd ,即 111 tdtdd YYY 一般来说一个非平稳时间序列经过 d 次差分以后都会变成一个平稳的时间序列。 1.3.3 随机平稳时间序列样本的数字特征 1、时间序列的样本均值 (mean) nt tYnY11 2、时间序列的样本方差 (variance) 2102 )(1 nt tYYn 3、时间序列样本的自协方差 (Auto coefficient) knt kttkYYYYn1)(1 4、时间序列样本自相关函数 (Autocorrelation Coefficient) 02121),co v ()(1)(1 kkttnttkntkttkYYYYnYYYYn 5、时间序列样本偏自相关函数 (Partial Autocorrelation Coefficient) ,5,4,3,1111111ssjjssjjssssj 其中 s 代表滞后量 , 1,2,1,1,1 sjjssssjssj 1.4 时间序列模型的建模步骤 10 建立时间序列模型的整个过程由数据预处理、模型的识别、参数估计和模型检验四个部分组成 14-20 时间序列模型建立基础是平稳时间序列。因此,我们在得到一组样本数据后,应先检查该组数据的平稳性。 1.4.1 判断时间序列的平稳性 根据平稳时间序列的特征对其平稳性进行判断,常见的时间序列平稳性检验主要有以下几种 :(1)利用散点图进行平稳性判断 (2)根据自相关函数判断 (3)单位根检验。 (1)散点图检验 图 2-1平稳时问序列的散点图 图 2-1主要是看时间序列 y,y,y m21 的各观测值是否在 y 的均值上下来回波动,并且具有相等的方差。 这种方法简单易行,但往往结果过于粗糙,精度不高。 根据样本自相关函数判断 02121),co v ()(1)()(1 kkttnttktknttkyyyynyyyyn 如果样本自相关函数随着 k的增大,而呈现迅速衰减的状态,则认为该序列是平稳的 ;如果衰减非常缓慢则认为该序列是非平稳的。 (2)单位根检验 考虑简单的 AR (1)过程 tttt yy 1 其中, t 是白噪声时间序列,而且只有 1 时序 列 yt 才是平稳的 ;当1 时,序列 yt 呈现爆炸性,即 yt 会逐渐增大为非平稳序列。 11 所以可以写成 tttt yy 1 或者 ttyL )( -1 其中 L 为滞后算子,表示时间序列的滞后。如 : ty 的一期滞后可表示为 )( tyL ,即 : 1)( tt yyL 所以, ,2,1,)( nyyL nttn yt 平稳的条件就是其特征方程 01 L 的根的绝对值大于 1 。此方程的唯一的根为 1L ,所以平稳性要 1 ,因此检验神平稳吐的原假设和备假设为 : 1:0 H 1:1 H 接收原假设 0H 表明序列是非平稳序列,而拒绝原假设表明序列是平稳序列 ; 如果 1 ,则该过程为随机游走过程,是一种特殊的差分平稳过程,是非平稳的。 p 阶自回归过程 AP(p),则可以表示成 : tptpttt yyyy 2211 其特征方程 : 01 221 pp LLL 只有当此方程所有根的绝对值都大于 1 ,才能有过程 tptpttt yyyy 2211 是平稳的,如果有一个特征方程根为 1 ,则必有一个单位根,这时方程tptpttt yyyy 2211 可以写成 : 122111 ttptptttt yyyyyy 12 而对于 AR(1)模型,则有 : ttt yy 1 1- 因为大多数的经济事件序列 为正,所以假设可以写成 : 0:0 H 0:1 H 通过这样变换,可以把检验原参数 1 ,转化为检验 0 是否成立,这类检验可以分别用两个 T 检验进行 : 由于统计量 )(1t和 )(st 并不服从 t 分布,而称之为 统计量,其极限分布由富勒 (Fuller)所决定,迪基 (Dickey)给出其分布经验上的粗略估计。所以此检验又称迪基一富勒检验,即 DF 检验。后来麦金农 (Mackinnon)通过蒙特卡洛模拟法系统模拟出了这些临界值,相比 T 检验,他们要大得多。 因为 : 临界值依赖于回归方程的类型,所以,对于另外两种类型的方程 : tttttt ytyyy 11 和 迪克一富勒还编制了另外两个 统计表。 (3 ) ADF 检验 (Augmented Dickey- Fuller Test) 在 ADF检验中,我们假设随机误差项是相互独立的,不存在自相关,但是大多数的经济事件序列是不满足此项调价的,当不满足时我们采用扩展的迪基一富勒检验 (Augmented Dickey,一 Fuller Test)方法。 所以原来模型变为 : pj ttjttyyy1 11 (1) pj ttjttyyy1 11 (2) pj ttjttyyty1 11 (3) 13 检验步骤如下 1、估计模型 (3),在给定 ADF 临界值的显著水平下,如果参数 显著的不为零,则序列不存在单位根,序列平稳,结束检验,反之进入第一步 ; 2、给定 0 ,在给定 ADF临界值的显著水平下,如果参数 显著的不为零, 存在时间趋势,进入第 3步 ;否则进入第 4步 ; 3、用 T 分布检验 0 ,如果参数 s 显著的不为零,则序列不存在单位根,序列平稳,否则序列不平稳,结束检验。 4、估计模型 (2),在给定 ADF 临界值的显著水平下,如果参数 显著的不为零 ,则序列不存在单位根,序列平稳,结束检验,反之进入第 5 步 ; 5、给定 0 ,在给定 ADF临界值的显著水平下,如果参数 显著的不为零,表明含有常数项,则进入第 3步,否则进行下一步 ; 6、估计模型 (1),在给定 ADF 临界值的显著水平下,如果参数 显著的不为零,则序列不存在单位根,序列平稳:结束检验,反之序列不平稳。 1.4.2 模型的识别 ARMA 模型识识别的方法 21-22有很多种,这里我们只考虑使用自相关函数和偏才函数的拖尾和截尾性,来初步判断所采用的模型类型。 移动平均过程的自相关系数特征 对于移动平均过程则有 : )( tYE 222221 )1()v a r ( qtY 所以, qjqjr jqqjjjj ,0,2,1,)( 22211 即 qjqjqjqqjjjj ,2,1,01 222212211 14 所以,当移动平均的阶为 q 时,间隔期大于 q 的自相关函数值为零。 在样本充分大的条件下,自相关函数的 95%置信区间为 nn kk2,2 ,所以如果自相关函数 ,0 k 在大样本的情况下如果落入 nn2,2区间内,则在 5%的显著水平下不拒绝 0 k 的假设。 所以在实践中当 qK 时,如果平均 20 个 j 中至多有一个使 nj 2 ,那么我们认为 j 在 qK 处截尾 。 自回归过程的自相关系数特征 因为是自回归过程,则有 : ptYE 211)( 222110 tpp pjpjj 22111 所以, kpjpjjj 2211 解得 : jpj jjj zC 11其中, C 为任意常数, jz 为特征多项式 pp zzzz 2211)( 的特征根,所以在原模型平稳性条件下, j 被负指数所控制,随 j 的增大, j 绝对值下降,但是不会到某一点以后突然被截断,所以是非截尾 的。 自回归过程的偏相关函数特征 偏相关系数的定义 :tY 与 jtY 的偏相关系数是去掉 121 , jttt YYY 的线性影响后简单的相关系数。表示如下 : ),( 121 jtttttjj yyyyEyc o r r 15 例如在 AR (1)过程中 ttt eyy 111 , tttt eyyy 222121 ,其中 代表偏相关系数。 偏相关系数的计算基于 Yule-Walker 方程组: kppppppppp12112211211211解得 : 111 1s 2121222 -1- )(2s 1111111sjjssjjssssj ,4,3s 其中 s 代表滞后量, 。1,2,1,1,1 sjjssssjssj 因此对于 AR (p)过程, 当 ps 时, ty 和 1ty 之间不存在直接相关,所以这时所有的 ss 都为零,呈现 p 阶截尾状态。所以在实践中当 pK 时,“如果平均 20个 ss 中至多有一个使 nss 2 ,那么我们认为 ss 截尾在 pk 处。 自回归滑动平均模型自相关函数和偏相关函数的特征 若 j 序列与 ss 序列皆不截尾,被负指数函数控制收敛到零,则 tY 很有可能是 ARMA序列。 总结零均值平稳序列模型的自相关和偏相关函数的统计特征如下 : 表 1 ARMA(p, g)模型的白相关系数和偏相关系数特征 模型 相关系数 偏相关系数 AR(p) 拖尾 p 阶截尾 MA(q) q 阶截尾 拖尾 ARMA(p,q) 拖尾 拖尾 16 1.4.3 模型的定阶 基本思想 :确定一个函数,该函数既要考虑用某一模型拟合原始数据的接近程度,同时又考虑模型中所含参数的个数。当该函数取最小值时,就是最合适的阶数。 基于基本思想,如果选择的滞后长度与真实的滞后长度相同时,模型估计值与观测值的误差应该最小,所以可以用误差平方和或者均方误表示 : Tt ttyySSE12)( 或者 TyyM SETttt 12)(但是由于随着解释变量的增加, SSE 和 MSE都呈现减小状态,这样的模型拟合度很高,但是拟合效果不一定高,考虑到自由度的影响我们通常都采用AIC准则和 BIC准则。 AIC准则 (Akaikes Information Criterion), AIC 准则又称为最小信息准则,它是由日本学者赤池首先提出并成功地应用于 AR 模型的分析定阶中,该方法也可 用来辨识 ARMA 模型的阶数。舒瓦茨准则 (Schwaz Bayesian Information Criterion)比赤池准则增加了更严格的惩罚条件。舒瓦特信息准则通常简写为 BIC 准则 (有的书本也称 SBC 准则或者 SC 准则,本文中采用 BIC 准则 )AIC及 BIC的定义函数为 : TeTB ICTeTkA ICTt tTkTt t12122e x p其中有不同的变形 : 取对数可得 : TTInqpInqpB I CTqpInqpA I C)()(2)(),()(2)(),(222、根据对数似然函数变换 : TTInqpTLInqpB I CTqpTLInqpA I C)()(22),()(22),( 17 其中 T 为样本容量。 qpk 代表模型中参数的个数,如果有常数项, qp被 lqp 代替, 2 是噪声项方差的估计, TeTt t 1 22,在对数函数中KInTInL )(2 2 , K 是与参数无关的量。 理论上, AIC 和 BIC要尽可能的小,当模型拟合优度上升时, AIC和 BIC的值会趋近于 。若模型 A的 AIC(或者是 BIC)小于模型 B,则 称模型 A优于模型 B。对于每个模型回归变量的增加会导致 qp 的增加,但残差平方和会减少。如果回归变量对模型没有解释力,在模型中增加回归变量只会使 AIC和 BIC增加。因为 2)( TIn ,这样 BIC增加回归变量的边际成本较大, BIC与 AIC 相比总是倾向于选择更简练的模型。 在这两个准则中, BIC 更具有大样本特性,在样本容量无限大时, AIC原则的模型阶数要大于 BIC,准则选择的模型阶数, BIC 准则渐趋一致,而 AIC更倾向于选 择参数过多的模型,然而在小样本的情况下 AIC 准则的效用要优于BIC准则。 1.4.4 模型参数的估计 模型参数的估计主要采用最小二乘或者极大似然估计,这两种方法的估计精度较高,所以称为精估计。本文主要采用 Eviews 软件,直接给出了参数的估计值。 1.4.5 模型检验 模型的检验主要从以下几个方面判断 :(1)、所有的系数是否都显著不为零 ;(2)、残差序列是否为白噪声 ;(3)、预测是否准确 ;(4)、是否有更大的拟合优度和更小的 AIC 值和 BIC 值 ;(5)、是否有更简单的模型 ;( 6)、是否有直观意义和经济理论基础 : 1、对于残差序列是否为白嗓声,要绘制残差得自相关和偏相关图,看自相关系数和偏相关系数是否在 0.05的置信区间内。 2、 Box-Piece Q 统计量 18 给出 Q 统计量计算函数 mk kTQ12* , T 为样本长度,2k 是样本子相关系数,m 主观给定,一般在 15-20之间,一般令 Tm 。 原假设残差 t 是白噪声过程,统计量 *Q 渐进服从 )(2 qpm 分布,如果模型中含有常数项,则模型渐进服从 )1(2 qpm 的,所以给定置信度 1 (通常为 0.05或者 0.01),若 )(2 qpmQ ,则不能拒绝残差是白噪音的假设,检验通过,否则检验不能通过。 3、 D. W值 D. W值源于 Durbin-Wstson检验,主要是检查残差序列的 自相关特性。 D. W统计量又称 d 统计量,其函数表达式为 : )1(212)(2212221nttntttnttntttuuuuuud因为 可以看作是 tu 与 1-tu 之间的自相关系数,又由于自相关系数处于 1- 和 1之间,所以 d 统计量位于 0到 4之间。又以下关系 : 2d 时,残差之间存在正相关 ; 2d 时,残差之间不存在相关 ; 2d 时,残差之间存在负相关。 Durbin-Wstson 检 验给出了不同的样本容量和不同的自变量个数在不同的显著水平 1%5%10% , 的检验临界值。一般来说如果 D. W 值距离 2 较远,就认为有一定程度的自相关。但同时值得注意的一点是 :Durbin-Wstson 检验只能检验残差序列的一阶相关,不能检验残差序列的高阶相关。 4、样本决定系数和修正的 2R 因为模型的总方差进行分解为 : 19 ntntnt ttttyyyyyy1 1 1222 )()()( 即 SSESSRSST 而 )1(1111)()(2212122RknnnSSTknSSRRSSTSSESSTSSRyyyyRnttntt修正 2R 的取值范围一般为 0,1,也可能是绝对值很小的负数。同一类型的模型,修正 2R 越高,越接近 1,拟合越理想。当修正 2R 等于 1 时,表明模型完全拟合。 1.5 预 测评价中的其他指标 预测评价中的其他指标是 误差均值 nt tyynME1)(1 绝对误差 nt tyynMAE11 绝对误差百分比 nt ttt y yynM A P E1100均方根误差率 nt tttyyynR M S E 121Theil inequality coefficient=n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江西传媒职业学院《材料力学》2024-2025学年第一学期期末试卷
- 闽江学院《接口自动化》2024-2025学年第一学期期末试卷
- 黑河学院《体育文献检索》2024-2025学年第一学期期末试卷
- 长沙轨道交通职业学院《发展与教育理学》2024-2025学年第一学期期末试卷
- 四川文轩职业学院《建筑构造基础》2024-2025学年第一学期期末试卷
- 天津体育职业学院《海洋生物技术》2024-2025学年第一学期期末试卷
- 广安职业技术学院《工程制图Ⅱ》2024-2025学年第一学期期末试卷
- 湖北科技学院《互动设计基础》2024-2025学年第一学期期末试卷
- 恩施职业技术学院《水土保持与生态安全专题》2024-2025学年第一学期期末试卷
- 莆田学院《建筑制图》2024-2025学年第一学期期末试卷
- 2025内蒙古森工集团招聘工勤技能人员3100人笔试参考题库附带答案详解析集合
- 登销记以及运统46系统运用21课件
- 四大会计师事务所面试题
- HY/T 112-2008超滤膜及其组件
- GB/T 4669-2008纺织品机织物单位长度质量和单位面积质量的测定
- GB/T 4604-2006滚动轴承径向游隙
- GB/T 31315-2014机械结构用冷拔或冷轧精密焊接钢管
- Fanuc系统宏程序教程
- 腾讯云TCA云架构工程师考试真题
- 兽医产科学之公畜科学课件
- 动物育种学第四章生产性能测定
评论
0/150
提交评论