(金融学专业论文)基于灰色系统和神经网络的股价指数预测.pdf_第1页
(金融学专业论文)基于灰色系统和神经网络的股价指数预测.pdf_第2页
(金融学专业论文)基于灰色系统和神经网络的股价指数预测.pdf_第3页
(金融学专业论文)基于灰色系统和神经网络的股价指数预测.pdf_第4页
(金融学专业论文)基于灰色系统和神经网络的股价指数预测.pdf_第5页
已阅读5页,还剩78页未读 继续免费阅读

(金融学专业论文)基于灰色系统和神经网络的股价指数预测.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨工程大学硕士学位论文 摘要 随着社会经济的发展,股票已经成为人们投资理财的一种重要工具。作 为一种高风险和高收益并存的投资工具,股票的高风险性主要表现为股票价 格的高波动性。股价指数反映了股票市场上股票价格的总体波动状况,比较 准确的预测股价指数对于投资决策具有重要的指导意义。 论文运用灰色预测模型与人工神经网络模型对上证综指与深证综指的预 测进行了研究。 分别建立了两种股价指数的日收盘指数、周收盘指数和月收盘指数的 t + i 、t ”和t + 5 预测模型。在建模的过程中改变输入数据的数量进行试验, 以研究输入数据数量的多寡对模型的预测精确度与预测方向准确性有何影 响。 研究发现,灰色预测模型和人工神经网络模型的预测精确度水平一般都 比较高,绝大部分的误差在1 0 以下,而预测的方向准确性大多较低,大多 数在5 0 0 左右。为了找出影响模型预测精确度的因素,将各样本点的预测精 确度指标按照可能的影响因素分别进行分组,利用非参数检验的方法对各组 之间的差异性进行分析,如果组间差异显著,则表明该因素对模型的预测精 确度有显著的影响。实证研究结果表明指数名称、输入变量数、预测距离及 数据周期这四种因素均对预测的精确度构成显著的影响,模型类型因素对预 测的精确度不构成显著影响。模型预测精确度影响因素的研究,为进一步研 究高精确度的预测模型奠定了一定基础。 关键词:股价指数;预测;灰色系统;人工神经网络;非参数检验 哈尔滨工程大学硕士学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to f s o e i e t ya n de c o n o m y s t o c kh a sb e e o m eo o f m e m o s ti m p o r t a n tm v e s l m 蹦tt o o l s a s 趾m v e s t m e n tt o o l 、i mh i g hr i s ka n dh i g h r e t u r n , t h er i s ko fs c o c ki sm a i n l yc 0 璐i d 啪d 勰t h ev o l a t i l i 够o fi 拓p r i s t o c k p d c ci n d e xr e f l e e t st h eo v c ra l lv o l m u i t yc o 删o no ft h ep i c e si nt h es t o c k m a r k e t , c o r r e c tp r c d i c d o no f f s t o c kp d 砌e xi sh e l p f u lt on l a k ed e c i s i o no n s t o c ki l l 、,e s l m e n :l t h i sp a p e rs t u d i c dm e 即d i c t i o f 也es c o c kp r i m d e x 铭o fs h a n g h a i 趾d s h e n z h 髓s t o c km a r k e tb a s e do na n nm o d e la n dg r e ym o d e l t h i sp a p e rs e t s 叩t h ep r e d i c t i o nm o d e lo ft + l ,t + 3a n dt + 5b a s e do nt h e h i s 幻i y 出妞o fd a y , w e e ka n dm o n t hd o s i n gi n d c x t h i sp a p e rc a l c u l a t e d p r e d i c t i o n 弘删i n d e x 距dd i r e c t i o n 伽旺e c 协e 锱i l l d e xo fe a c hm o & 1 h 也c 弘o c e s so fs e t t i n gu pt h em o d e l s ,s e v e r a li 印md a mq u a n t i 锣w e r cu s e dt ot e s t 也e p r e d i c t i o np e r f o r m 黜,i no r d 盱t os t u d yt h e 阳l a 虹o n s h i pb e 钾吣e nq u a n f i 够o f i n p l i td a t aa n d 硼e d i e f i o np r e c i s i o nl e v e la n dd i r d o nc o r r c c t l l e s sl “e 1 i nt h i sp a p e r ,t h ep r e d i c t i o np f e e i s i o al e v e l so f 血em o d c l s 种v e r yh i g h , m o s to ft b 黜b e l o w1 0 w h i l et h ed i r e c t i o nc 加r c c m e s sl c v e l sa r ev e r yl o w , m o s to ft h 锄a r o u n d5 0 t h e n , t h i sp a p e rs t i l d i e do nt h ef a e t o r sw h i c hm a y a f f e c t 血ep r e s t o np r e c i s i o nl e v do f 也cm o d e l s f i r s t , g r o u r , e , tt l l ep r e d i c t i o n p r e c i s i o ni n d e x e si n t os e v e r a l 掣饥l p sa c c o r d i n gt ot h ef a c t o r ;t h e n ,c o m p a r e d1 h e f e l e v a mg r o u p s 啦n o n p a r a m e t e rm e t h o d 幻f i n do u tw h e t h e rt h ef a c t o rh a sa s i g n i f i e 孤ti n f l u e n c eo np 础c p r e e i s i o 也t h er e s d ti st h a tq u a n 衄o f 却l l t d a :t a p r e d i c 6 0 nm t e r v a l ,d a t au n i ta n di n d e xt y p ea l lh a v eas i g n i f i e 龃ti n f l u e n c e o np r e d i c t i o np r e c i s i o na tas t a d s t i c a ll e v e l ,w h i l et h ef a c t o ro fm o d e l 卯e d o 船 n o th a v ea s i g n i f i e 锄ti n t l u e n e e 眦p r e d 硎o np r e c i s i o n 砒as t a t i s t i c a ll e 、,e 1 k 呵w o r d s :s b kp d c em d e x ;p r e d i c t i o n ;g r e ys y s t e m ;a n n ;n o 印a r a m e t e r t e s t 哈尔滨工程大学硕十学位论文 第1 章绪论 1 1 论文的选题背景 随着社会经济的发展,股票已经成为人们投资理财的一种重要工具,2 0 0 4 年,我国股票的流通市值已经超过当年g d p 总量的1 0 ,且全年我国股票 市场的成交金额已经超过4 万亿元人民f l i t n 。股票是一种高风险与高收益并 存的投资工具。股票市场的风险性主要表现为股票价格的波动性。以深圳证 券市场为例,从年度看,1 9 9 6 年深证综指从最低的1 0 4 9 点上升到4 7 6 7 1 点, 波动幅度达3 5 4 4 ;从月度看,1 9 9 4 年8 月,股价指数从9 6 5 6 点摸高至 1 7 3 3 7 点,波动幅度达7 9 5 0 ;从成交日看,1 9 9 4 年8 月1 日,深证综指 暴涨3 1 2 9 2 1 。 在广大投资者被股票市场的高风险性所带来的高回报所吸引的同时,众 多的学者也在探求股市的内在的规律,寻找有效的预测方法和工具。但是, 股票市场作为一种影响因素众多,各种不确定性共同作用的复杂系统,其价 格的波动往往表现出较强的非线性特征。正是由于其复杂的非线性特征,使 得关于股市的预测往往难如人意。 随着科技的发展和计算机普遍的运用,使得人们解决问题的方式不再只 是单凭过去的经验,尤其是在瞬息万变的股票市场,过去与未来之间或许有 潜在的关联存在,然而单凭个人的记忆和经验来决策,不仅不易掌握出其中 的关联性,更易流于主观,所以投资者特别是机构投资者越来越倾向于采用 更客观的方式来进行投资行为。预测技术的不断进步也为投资者更为精确的 预测股市变化提供了理论依据和技术支持。越来越多的企业与专家都会使用 计算机来作为投资决策的辅助工具,各种预测方法不断地出现,例如:时间 序列分析、灰色系统、人工神经网络、遗传算法、小波分析这些预测方 法的出现与应用,使得股票投资决策更具理性。 1 2 论文的写作目的和意义 股票市场既是企业的重要融资渠道,也是人们投资理财的重要场所。股 市的变幻奠测在给投资者带来获得巨额收益的可能的同时,也给投资者带来 了巨大的风险,能够比较准确的预测股市的变化趋势是投资者长久以来的梦 想。 哈尔滨工程大学硕士学位论文 本文的选题目的在于:应用灰色预测g m ( i ,1 ) 模型及b p 神经网络分别构 建沪、深股市以日、周、月为时间单位的股价指数预测模型,计算预测的数 值精确性与方向准确性指标,并通过统计方法研究有关因素对于预测绩效的 影响,以作为学者进一步研究股价指数预测及广大投资者在预测股价、股价 指数未来走势时的参考。 本文写作的意义在于: ( 1 ) 有利于增强投资者证券投资决策的科学性。本文对两种预测模型进 行了研究,并初步探讨了影响预测模型预测精确度的因素,可以使投资者在 科学实证的基础上选择更为优良的预测模型,在定量数据的基础上进行决策, 减少主观性在投资决策上的影响,使投资决策更为客观、科学。 ( 2 ) 有利于降低投资者的投资风险。上证综指、深证综指反映了沪、深 两市的运行情况,其波动大致反映了两市的系统风险。若对上证综指和深证 综指能进行准确的预测,则在投资中就可以对系统风险做出必要的防范。 因此,本研究对于有效控制投资风险、为投资决策提供客观依据以及提 高投资决策的客观性和科学性等方面都有重要的现实意义和实践意义。 1 3 国内外研究现状 目前,在股票市场的预测中被广泛使用的预测方法主要有神经网络、灰 色系统以及时间序列模型等等。除了单独运用上述模型进行预测之外,也有 学者将上述模型组合运用,取得了很好的预测效果 1 3 ,1 国外研究现状 m e n d e l s o h n 和s t e i n ( 1 9 9 1 ) 用德国市场三年的日数据训练人工神经网络 来产生买和卖的信号,用期间为一年的数据进行验证,表明神经网络产生的 2 4 个买入信号中一半是正确的,并可以带来满意的回报【3 j 。 m a r i a ss c h u m a n n ( 1 9 9 3 ) 在研究中研究了a r i m a 模型与神经网络模型 在股市预测中的应用。研究表明,无论是a r m a 模型还是神经网络模型, 其对下一交易日股价涨跌的预测均优于随机游走模型的预测。从预测结果来 看,a r i m a 模型的预测结果稍优于神经网络模型,作者认为可能是因为关 于a r i m a 模型的有关理论已经比较成熟,而神经网络模型的建模还主要依 靠试误法,从而有时难于获得理想的模型【4 】。 j i n g t a oy a o 和h e a r t - l e ep o h ( 1 9 9 5 ) 利用b p 神经网络对吉隆坡证券交 易所的指数进行了预测,在研究中发现用以日数据进行训练的神经网络的预 测效果优于以周数据进行训练的神经网络,作者认为这可能是吉隆坡市场的 2 哈尔滨工程大学硕士学位论文 高波动性造成的p j 。 c o r c h a d oj 、f y f e c 和l e e s b ( 1 9 9 8 ) 比较了多层前馈式和径向基函 数等两种神经网络模型与a r i m a 模型在金融领域的应用。研究以道琼斯工 业股票指数为预测对象,实证研究表明就预测的平均误差而言,a r i m a 模 型优于径向基函数模型而劣于多层前馈网络模型【6 j 。 s h e n g - c h a ic h i ( 1 9 9 9 ) 在研究中将灰色关联度引入了神经网络的输入变 量,并对不同的网络结构进行了测试,研究表明灰色关联度的引入,提高了 模型的预测精度并减少了网络训练所需要的时间,同时也表明更多的神经元 数量并没有带来更高的预测精度 7 t x i a o h u aw a n g ( 2 0 0 4 ) 检验了增加交易量的信息是否能够提高神经网络 预测的准确性。在研究中使用标准普尔5 0 0 指数和道琼斯工业指数的收益率 和交易量数据对神经网络进行训练,其结果用来与不含交易量信息的神经网 络进行比较。实证结果显示交易量对改善预测方向上的准确性几乎没有作用, 有时甚至会造成过度拟合,对于预测的精确性来说,交易量有无规律的提高 作用 8 1 。 从以上的文献回顾可以看出,国外对股市预测的研究,在预测方法方面, 主要集中于人工神经网络及其衍生模型上。三层b p 神经网络在理论上可以 逼近任何函数,目前在国外的研究中,多数学者所采用的人工神经网络均为 b p 网络。在变量的选择方面,多数学者采用了历史收盘价数据,也有学者采 用收盘价结合成交量或其他技术指标;在收盘价的周期方面,多数学者使用 日收盘价,也有学者使用周收盘价,有研究认为日收盘价相对于周收盘价的 预测结果会更好,因为周收盘价的波动可能会更剧烈。 1 3 2 国内研究现状 潘晓琳( 2 0 0 0 ) 将灰色灾变预测应用于股市预测中。灰色灾变预测是一 种预测异常值的时间分布的预测方法,在股市中作者利用它来预测股价上涨 日的时间分布。作者利用个股历史数据构建了预测模型,并预测了下2 个上 涨日,预测结果与实际情况基本相同1 9 1 。 吴微、陈维强等( 2 0 0 1 ) 运用b p 神经网络对上证综指进行了预测。研 究中以今日收盘价、今日成交量以及3 0 日内平均成交额等8 个指标作为输入 变量,对下一交易日进行预测。作者利用1 0 0 个交易日的数据对神经网络模 型进行训练,对下3 0 个连续交易日进行了预测,训练精度达到了9 8 ,预 测精度达到了7 0 。作者对隐藏层神经元的数目对网络的影响进行了探讨, 3 哈尔滨工程大学硕士学位论文 研究认为当隐藏层神经元的数目增加到一定程度时,隐藏层神经元数目的增 加不但不能减少迭代次数,反而会降低系统的效率、影响网络的推广能力i l u j 。 陈海明、李东( 2 0 0 3 ) 应用灰色数列预测模型对上证综指的收盘指数进 行预测,通过5 个历史数据构建模型,除关联度检验为2 级外其余检验均为 1 级,显示拟合程度优良,对下一交易日的收盘指数进行预测,预测的相对 误差率仅为0 2 4 ,获得了较高的预测精度i l ”。 张秀艳、徐立本( 2 0 0 3 ) 分别利用收盘价、技术指标和宏观经济数据训 练b p 神经网络,并进行了比较。在拟合精度和预测精度方面,收盘价模型 和技术指标模型相差无几,宏观经济数据模型劣于前两种模型1 1 2 j 。 夏景明、肖冬荣等( 2 0 0 4 ) 将灰色( 3 m ( i ,1 ) 模型与人工神经网络相结合, 利用灰色关联度选取与收盘价关联度大的8 个技术指标作为神经网络的输入 指标,分别对这些指标建立c o m ( i ,1 ) 模型进行灰色拟合,利用灰化的数据对 神经网络进行训练。使用这些指标的灰色预测值作为神经网络的输入,得到 最终的预测值。研究表明,无论从拟合精度还是从预测精度来看,灰色神经 网络均优于一般的灰色g m ( i ,1 ) 模型l l ”。 李国平( 2 0 0 5 ) 分别利用日、周、月、年作为时间单元对上证综指构建 灰色模型进行预测,其中以日、周、月作为时间单元的预测模型精度均达到 “好”级,以年为时间单元的预测精度达到了“合格”级,显示了灰色预测 在股市预测中的优良预测能力,也说明了灰色预测在股市短期预测中的可行 性【1 4 1 。 杨成( 2 0 0 5 ) 在研究中比较了多元线性回归模型与人工神经网络模型在 股价预测方面的绩效,其所用的建模数据为1 1 种财务指标,实证结果表明人 工神经网络模型的预测精度远远高于线性回归模型【l 鄂。 从以上的文献回顾可以看到,我国学者在股市预测方面已经进行了广泛 的研究,特别是在利用灰色系统理论对股市进行预测方面我国学者的学术成 果相对国外学者来说更多一些。灰色系统模型不仅能预测股价或股价指数未 来的数值,还可以预测股价或股价指数未来的上涨或下跌日,并且我国学者 的实证研究已经取得较高的预测精度,显示了这是一种非常值得深入研究的 股市预测方法。但我国学者在对预测模型的预测绩效进行评价时,往往只利 用三、五个预测结果进行,然而这其中受偶然性因素影响的可能较大,评价 的结果难以全面的反映预测模型的预测能力,也难以令人信服。 4 哈尔滨工程大学硕士学位论文 1 4 论文的研究思路 1 4 1 论文的总体思路 论文首先对国内外相关研究的现状进行了回顾,并对目前常用的两种模 型的基本理论进行了总结;在此基础上,分别以上证综指和深证综指为预测 对象,建立预测模型,并对各预测模型的预测精确度指标和预测方向准确性 指标进行计算;而后,对预测精确度指标进行描述性统计;最后,运用统计 分析的方法,研究各种因素对模型预测精确度的影响。 1 4 2 论文的总体研究框图 论文的总体结构如图1 1 所示。 图1 1 文章总体结构图 1 5 论文的研究方法 论文在研究过程中主要使用了实证的方法、比较的研究方法和定量的研 究方法。 论文研究各预测模型的预测绩效,主要运用实证的研究方法。将这两种 预测方法应用于深、沪两市的综合指数,通过试误法等方法构建预测模型, 计算预测模型的预测绩效指标。论文在处理数据、建立模型和进行预测绩效 5 哈尔滨工程大学硕士学位论文 分析时所用的软件主要是m a t l a b 、s p s s 以及e x c e l 。 论文大量使用了比较的研究方法。首先,在使用试误法进行建模时,需 要对各个应用可能参数建立的模型的预测精确度和预测的方向准确性进行比 较,以确定建模参数和预测模型;其次,为了找出影响模型预测精确度的因 素,按照影响因素对预测精确度指标进行分组,利用统计学方法比较各组之 间的差异,如果差异在统计学意义上显著,则可以认为该因素对预测精确度 存在影响。 1 6 论文的创新之处 ( 1 ) 论文针对上证综指和深证综指分别构建模型进行预测,并分别计算 绩效评价指标,从统计学的角度研究了不同预测对象的预测精确度之间的差 别。 ( 2 ) 论文利用灰色预测模型和人工神经网络模型分别进行了t + 1 、t + 3 和t + 5 周期的预测,研究了不同预测间隔的预测精确度之间的差别,并将这 种差别运用统计学方法进行比较。 ( 3 ) 论文分别利用日收盘指数、周收盘指数和月收盘指数进行建模和预 测,研究了建模数据的周期与预测精确度之间的关系。 ( 4 ) 论文分别使用灰色预测模型和人工神经网络模型进行预测,运用非 参数检验的方法在验证了灰色预测模型和人工神经网络模型在预测精确度上 没有显著的差别。 ( 5 ) 论文使用多种建模数据数量( 或者称输入变量数量) 分别建立预测 模型,并对不同建模数据量的预测模型的预测精确度进行了比较,研究了建 模数据量与模型预测精确度之间的关系。 6 哈尔滨工程大学硕士学位论文 第2 章论文相关理论 2 1 灰色预测理论 2 1 1 灰色系统理论 我国华中科技大学的邓聚龙教授于1 9 8 2 年首先提出了灰色系统的概念, 并提出了灰色系统理论,引起了国内外学者的关注和重视【1 日。之后,灰色系 统理论得到了广泛的研究,并在众多领域得到了广泛的应用。 灰色系统是指部分信息已知,部分信息未知的系统。相应的,信息完全 明确的系统称为白色系统,信息完全未知的系统称为黑色系统。灰色系统理 论的研究对象是部分信息已知,部分信息未知的小样本、贫信息不确定性系 统,它通过对。部分”己知信息进行生成、开发实现对现实世界的确切描述 和认识【1 7 1 。 灰色预测主要分为以下五类【l 川: ( 1 ) 数列预测。这是最为常见的一种灰色预测,是对系统行为特征指标 观测值所形成的序列的灰色预测,如国民生产总值预测等。 ( 2 ) 灾变预测。灾变预测是指异常值时间分布的预测,是异常值可能在 未来的哪些时区出现的预测。所谓异常值是指过大或过小的值,如在气象方 面降雨过多就形成洪灾,降雨过少就形成旱灾 ( 3 ) 拓扑预测。拓扑预测是对一段时间内系统行为特征指标数据波形的 预测。 ( 4 ) 系统预测。系统预测是指对系统行为特征指标建立一组相互关联的 灰色预测模型,在预测系统整体变化的同时,预测系统各个环节变化的方法。 ( 5 ) 包络预测。 在本论文的研究中主要使用的是灰色数列预测模型,因此下面主要介绍 灰色数列预测模型的相关理论和建模方法。 2 1 2 灰色预测模型的建立 在本论文中所使用的灰色预测模型主要是灰色数列预测模型。要建立灰 色数列预测模型,需要经过三个大的步骤:( 1 ) 累加生成;( 2 ) 建立灰微 分方程;( 3 ) 灰微分方程的参数辨识1 1 9 1 。下面来具体具体介绍每一步骤口o 】: 7 哈尔滨工程大学硕士学位论文 ( 1 ) 累加生成 设为原始序列 = o ”( 1 ) ,一o ( 2 ) ”o )( 2 - 1 ) 对一m 进行一次累加生成,即1 - a g o ,得生成序列一, 一1 = 0 x 一1 ( 2 x , x o ( 砌( 2 2 ) 其中,一( i ) = 一o ( o ,k = l ,2 ,刀。 f 耐 ( 2 ) 灰微分方程的建立 由构造背景值序列 z o ) = 0 1 o x = “( 2 ) ”口1 ( 呦( 2 - 3 ) 其中,z 【1 0 ) = ( 七一d + o a 1 传) ,k = 2 , 3 , - - , n 。 一般取a = 0 5 ,得到灰微分方程为: 一o 0 ) + o ( t ) = 6( 2 - 4 ) 一般称之为定义型g m ( 1 ,1 ) 灰微分方程。其中口和b 都是待定参数,分别 称为发展系数和灰作用量。 g m ( 1 ,1 ) 灰微分方程对应于下述( 白) 微分方程 辈+ 一- ) :b( 2 5 ) 讲 上式被称为g m ( i ,1 ) 的白化型。 基于 ( d g m ( i ,1 ) 白化型; g m ( 1 ,1 ) 建模序列j x = 0 ( 1 ) ,地) 颠h ) ) , 则g m ( 1 ,1 ) 的白化响应式为 掣( 七+ 1 ) :o ( 1 ) 一。+ 旦 ( 2 6 ) a 口 :e ( 七+ 1 ) = ( 七十1 ) 一”( 七) ( 2 7 ) 实际灰色建模中,系统的原始序列数据不一定全部用来建模,不同维数 ( 长度) 序列建模,所得参数口,b 的值是不一样的,因而模型的预测效果 也不同。 ( 3 ) 灰微分方程模型参数的辨识1 由g m ( 1 ,1 ) 模型的定义型,在k = 2 ,3 ,甩时得到以下方程组 一o ( 2 ) + 1 ( 2 ) = 6 ,( 2 - 8 ) 一”( 3 ) + 口:m ( 3 ) = 6 ,( 2 - 9 ) 8 哈尔滨工程大学硕士学位论文 一”( 帕+ t r y ( 1 ( 呻= b 。( 2 1 0 ) 上述方程组可以转化为下述矩阵方程 靠= b p , ( 2 - 1 1 ) 其中 ,= 【一”( 2 x o ( 3 x ”( ,卯, 一( 2 ) i 一一1 ( 3 ) 1 一z m ( 岫1 ,= 豳 称丑为数据矩阵,“为数据向量,为参数向量。 在最小二乘准则下,y t , ;b p 的解为 ,= 阶( b t b ) - _ 以( 2 - 1 2 ) 上式即为g m ( 1 ,1 ) 参数a 。b 的矩阵辨识算式。 2 1 3 灰色预测的检验 灰色预测的检验包括:( 1 ) 对原始序列一o 作g m ( 1 ,1 ) 建模的可行性检 验,由于这种检验是在建模前进行的,称之为事前检验;( 2 ) 模型精确度检 验,这种检验在模型建立后进行,可称之为模型检验或事中检验;( 3 ) 预测 可信度检验,这种检验是考察已建模型对数据外推的可信度,是在建模后进 行的,可称之为事后检验或预测检验【2 ”。 2 1 3 1 事前检验 对于给定序列,可否建立精度较高的g m ( 1 ,1 ) 模型,一般用o ) 的级 比盯( o ( k ) 的大小及其所属区间来判断瞄l 。 令一o 为 o = ( 0 0 ( 1 ) ,一( 2 ) ,x o ( n ) ) , ( 2 - 1 3 ) ( 七) ,一们传一1 ) x ( o ) , 其级比仃( ( k ) 为 阶鬻, 哈尔滨工程大学硕士学位论文 当级比口o ( 七) 为常数时,即 0 - ( o ( 后) = c o n s t ,( 2 1 5 ) 则称o 具有白指数规律( 即确切的指数律) 。g m ( i ,1 ) 建模并不要求原始序 列具有白指数律。 灰色理论的创立者华中科技大学的邓聚龙教授提出的事前检验的准则 是: 建模序列o 的级比盯( ( j | ) 若满足 兰土 盯( o ( j | ) 0n 1 ,e n + 1 ) , ( 2 1 6 ) 贝t 0 - i 认为可作g m ( i ,1 ) 建模】。 2 1 3 2 事中检验 g m ( i ,1 ) 模型的事中检验一般说来有三种检验方法,即级比偏差检验、残 差检验和后验差检验。 ( 1 ) 级比偏差检验 对于给定的序列级比盯( o ( 七) 与模型级比彦o 可定义级比偏差p ( 为 从七) :竺芸塑1 0 0 ,( 2 - i 0 其中,模型级比 矛( o ) :l + 0 5 a ( 2 1 8 ) l o 5 口 上式中的a 为模型参数中的发展系数,带入到式( 2 - 1 7 ) 得 p ( k ) - 1 一畿鬻 ( 2 1 9 ) 若占为指定实数,当 以_j)占(2-20) 时,称o 的g m ( 1 ,1 ) 模型具有占指数符合率,即在实际检验时对于原始序列 一o 及其g m ( i ,1 ) 模型,如果满足 p ( 玎】a x ) = m y x p ( k ) 占,( 2 - 2 1 ) 则认定o 的g m ( 1 ,1 ) 模型具有占指数符合率。 ( 2 ) 残差检验 令工( o 为原始序列 一o = ( o ( 1 ) ,x o ( 2 ) ,一o ( ,1 ) ) ( 2 2 2 ) 1 0 哈尔滨工程大学硕士学位论文 为预测值序列 彭o = o ( 1 ) ,量o ( 2 ) ,弘o ( 聍) )( 2 - 2 3 ) 称 占( 七) = ! 警l 。 为g 1 ( 1 ,1 ) 的残差;称 f ( a v g ) 2 石i 沙( 七) l 为g m ( 1 ,1 ) 的平均残差;称 p 。= 0 一s ( a v g ) ) x 1 0 0 为g m ( i ,1 ) 的建模精度。 ( 3 ) 后验差检验 后验差检验的过程如下: 计算原始数列的均值i 仰 矿- 吉善( f ) 计算原始数列均值o 的均方差 而= 晤 碚= 扛x 一o ) 2 计算残差o 的均值虿仰 。吉善0 ( d 求残差一的均方差丑 = 晤 其中 ( 2 2 4 ) ( 2 - 2 5 ) ( 2 2 6 ) ( 2 - 2 7 ) ( 2 - 2 8 ) ( 2 - 2 9 ) ( 2 - 3 0 ) ( 2 - 3 1 ) 哈尔滨工程大学硕士学位论文 i i i i | _ _ 1 1 霹= ( f 。( 沪) 2 ( 2 - 3 2 ) * 计算方差比c c :旦 , ( 2 3 3 ) 计算小误差概率p p = 缈。手町i 0 6 7 4 5 s o ( 2 3 4 ) 根据经验,当c 0 7 时为勉强合格,当c 0 8 时为 合格。 2 1 3 3 事后检验 事后检验即预测检验,包括滚动检验与实际检验。 滚动检验 滚动检验是利用时间存在轴上左边的数据建立模型,预测下一个存在数 据,以了解其预测残差。 令o 为原始序列,z 为一o 的新陈代谢子列 x = o o ( 1 ) ,工o ( 2 ) ,x ( o ( 刀”, o ) = ( o o 3 ) ,o o 一2 ) 一o ( f 1 ) ,工o ( 功,f j = 4 ,5 ,田。 以上为4 维序列。事实上允许,维,4 _ ,玎一j 。 对o 作g m ( 1 ,1 ) 建模,有o 专量o o + 1 ) , 则称8 ( m t ,f + 1 ) 肌m ) = 坐墨并半x 1 0 0 为i + 1 点的新陈代谢滚动误差;称8 ( m t ,a v g ) 8 ( m t ,a v g ) = 三i 万( 埘“+ 1 ) 1 ( 2 - 3 6 ) n 一斗五 为o 的新陈代谢滚动误差;称p 。( m t ) p 。( m r ) = o - 8 ( m t ,a v g ) ) x 1 0 0 ( 2 - 3 7 ) 为石( 0 的新陈代谢平均滚动精度。 实际检验 通过实际发生的数据与预测数据对比,以了解其预测精度。 哈尔滨工程大学硕士学位论文 2 2 神经网络相关理论 2 2 1 生物神经元与人工神经元 人脑的工作方式与现在的计算机是不同的,人脑是由大量的基本单元( 称 之为神经元) 经过复杂的相互连接而形成的一种高度复杂的、非线性的、并 行处理的信息处理系统。单个神经元的反应速度是在毫秒级,比计算机的基 本单元逻辑门( 反应时间在l o 飞量级) 低5 6 个数量级。由于人脑的神 经元数量巨大( 约1 0 ”个) ,每个神经元可与几千个其他神经元连接( 总连 接数为6 x 1 0 1 3 ) ,对有些问题的处理速度反而比计算机快得多。它的能耗约 为每一运算1 0 。6 j s ( 计算机为每一运算1 0 6 j s ) ,可见其性能要比现代计算 机高得多洲。 因此,人们自然会想到,大脑的组织机构和运行机制必有其绝妙的特点, 从模仿人脑智能的角度出发,来探寻新的信息表示、存储和处理方式,设计 全新的计算机处理结构模型,构造一种更接近人类智能的信息处理系统来解 决实际工程和科学研究领域中传统的冯诺依曼计算机难以解决的问题,必 将大大促进科学进步,并会在人类生活的各个领域引起巨大变化,这就促使 人们研究人工神经网络系统。简而言之,人工神经网络就是模仿人脑工作方 式而设计的种机器,它可以用电子或光元件实现,也可以用软件在常规计 算机上仿真;或者说人工神经网络是一种具有大量连接的并行分布式处理器, 它具有通过学习获取知识并解决问题的能力,且知识分布存储在连接权( 对 应于生物神经元的突触) 中,而不是像常规计算机那样按地址存在特定的存 储单元中瞄】。 按照生物神经元的结构和工作原理f 2 6 _ 2 _ 7 l ,构造一个人工神经元如图2 1 所示。 x 2 图2 1 人工神经元 1 3 o 哈尔滨工程大学硕士学位论文 j i ii i i i i i | 叠葺i i i i i i i 薯| 一 人工神经元是人工神经网络的基本单元,从图2 1 中可以看出,它相当 于一个多输入单输出的非线性阈值器件。定义x = 阮,艺,毛r 表示其他神 经元的轴突输出,亦即该神经元的输入向量;w = 【m ,w 2 ,”挑】表示其他神经 元与该神经元n 个突触的连接强度,亦即权值向量,其每个元素的值可正可 负,分别表示为兴奋性突触和抑制性突触;口为神经元的阈值,如果神经元 输入向量的加权和罗w j x , 大于占,则该神经元被激活,所以输入向量的加权 和也称为激活值;f 表示神经元的输入输出关系函数,亦即传输函数。因为 激活值越大,表示神经元的膜电位总和越大,该神经元兴奋所发放的脉冲数 越多,所以传输函数一般为单调升函数。但它又是个有限值函数,因为神经 元发放的脉冲数是有限的。这样,神经元的输出可以表示为 叫陲m ,一刁 q - 3 s ) d = ,i m 而一口i ( 2 - l l 2 2 2 神经网络的结构 人工神经网络的连接形式和其拓扑结构多种多样,但总的来说有两种形 式,即分层型和互联型神经网络网。 2 2 2 1 分层型神经网络 分层型神经网络又分为简单前馈网络、反馈型前馈网络和层内互连型神 经网络。 分层型神经网络将所有神经元按功能分为若干层,一般有输入层、中间 层和输出层,各层顺序连接。因为中间层不直接与外部输入和输出打交道, 所以又称为隐层。根据处理功能的不同,隐层可以有多层( 一般不超过两层) , 也可以没有。 2 2 2 2 互连型神经网络 互连型神经网络的任意两个神经元都相互连接,则构成全互连神经网络; 如果不是全部的神经元都彼此相互连接,则构成局部互连神经网络。 在人工神经网络的发展过程中,对生物神经系统已从不同的角度进行了 不同层次的描述和模拟,提出了各种各样的神经网络模型,其中具有代表性 的网络模型有感知器神经网络、线形神经网络、b e 网络、径向基函数网络、 自组织网络、反馈网络等。 哈尔滨工程大学硕士学位论文 2 2 3 神经网络的学习方式 人工神经网络与生物神经网络一样,必须通过学习,才具有智能特性。 人工神经元网络的学习过程,实际上就是调节权值和阈值的过程。模仿人的 学习过程,人们提出了许多神经网络的学习方式,其中主要有三种形式:有 教师学习、无教师学习和强化学习例。 乏2 3 1 有教师学习( 监督学习) 有教师学习是在有“教师”指导和考察的情况下进行学习的方式。有教 师学习的学习过程可以由图2 2 表示。 期望输出 图2 2 有教师学习 口 实际输出 这种学习方式,“教师”给出了与所有输入模式p 对应的输出模式的“正 确答案”,即期望输出t ( 目标) ,用于学习过程的输入输出模式的集合称为 训练样本集;神经网络学习系统根据一定的学习规则进行学习,每一次学习 过程完成后,“教师”都要考察学习的结果,即实际输出a 与期望输出t 的 差别( 误差e ) ,以此决定网络是否需要再次学习,并根据误差信号调整学 习的进程,使网络实际输出和期望输出的误差随着学习的反复进行逐渐减小, 直至达到要求的性能指标为止例。 对误差信号可以有不同的定义,常用的有: ( 1 ) 均方误差m s e ( m e a ns q u a r e de r r o r ) 窆瓴一& ) 2 衄= 占( p ) 丛- ( 2 3 9 ) 1 5 哈尔滨工程大学硕士学位论文 式中:一输出单元数; 瓯第k 个输出单元的实际值; 第k 个输出单元的期望( 目标) 值。 ( 2 ) 平均绝对误差m a e ( m e a na b s o l u t ee r r o r ) k 一吼i m i l e = 主= l 一 万 ( 3 ) 误差平方和s s e ( s u m s q u a r e d e r r o r ) s s e :杰瓴一q ) 2 ( 2 枷) ( 2 - 4 1 ) 2 2 3 2 无教师学习( 无监督学习) 无教师学习不存在“教师”的指导和考察,是靠神经网络本身完成的。 由于没有现成的信息作为相应的校正,学习规则是根据输入的信息,根 据其特有的网络结构和学习规则来调节自身的参数或结构( 这是一种自学习、 自组织过程) ,从而使网络的输出反映输入的某种固有特性( 如聚类或某种 统计上的分布特征) 阱j 。 2 2 3 3 强化学习( 再励学习) 强化学习介于上述两种学习方式之间。 外部环境对学习后的输出结果只给出评价信息( 奖或惩) ,而不给出正 确答案。神经网络学习系统通过强化那些受奖励的行为来改善自身的性能 【3 2 】。 无论哪种学习方式,其学习过程都有一定的规则,神经网络典型的学习 规则有h e b b 学习规则、误差纠正学习规则、竞争学习规则等。 2 2 4b p 网络与b p 算法 2 2 4 1 即网络模型 b p 神经网络一般为多层神经网络。一个三层的b p 神经网络如图2 3 所 示。b p 神经网络的信息从输入层流向输出层,因此是一种多层前馈神经网络。 如果多层b p 网络的输出层采用s 形传输函数,其输出值将会被限制在 一个较小的范围内:而采用线性传输函数则可以取任意值【3 3 】。 1 6 哈尔滨工程大学硕士学位论文 输出层神经元 隐藏层神经元 输入层神经元 图2 3 三层b p 神经网络模型 输出层 隐藏层 输入层 2 2 4 2b p 网络结构的确定 网络设计是一个综合问题,它应满足多种不同的要求,例如,希望所设 计的网络有较好的推广能力,易于硬件实现,训练速度快等,其中有较好的 推广能力是最主要的。一般说来,推广能力决定于3 个主要因素,即问题本 身的复杂程度、网络结构以及样本量的大小洲。 ( 1 ) 网络层数的确定 对于多层神经网络来讲,首先应该确定选用几层隐藏层。h e c h t - n i e l s e n 曾经证明了当各结点都具有不同的阙值时,对于在任何闭区间内一个连续函 数都可以用具有一个隐藏层的神经网络来逼近,因而一个三层的基于b p 算 法的人工神经网络可以完成任意的行维到m 维的映射m j 。 一般认为,增加隐藏层数可以降低误差,提高精度,但同时也使网络更 加复杂化,因而增加网络的训练时间和产生“过拟合”( o v e rf i t t i n g ) 现象p 6 j 。 b p 网络的特点之一在于误差的反向传播,因此,若隐层数增加,则网络 所表达的映射就越复杂,除了增大计算量外,还容易造成数据失真。这是因 为在误差的反向传播的过程中,由于数值精度的限制,使得当误差回传到第 一个隐藏层时,因较多的“舍”或“入”而使得误差失真度增加。 若输入层和输出层采用线性传输函数,隐藏层采用s 形传输函数,则含 一个隐藏层的网络能够以任意精度逼近任何有理函数唧j 。在设计b p 网络时 可参考这一点,应优先考虑3 层b p 网络( 即有1 个隐藏层) ( 2 ) 隐藏层神经元数的确定 在b p 网络中,隐藏层神经元数的选择非常重要,它不仅对建立的神经 网络模型的性能影响很大,而且是训练时出现“过拟合”的直接原因,但是 目前理论上还没有一种科学的和普遍的确定方法1 3 5 j 。 1 7 。 哈尔滨工程大学硕士学位论文 隐藏层神经元的选择与其说具有科学性,不如说更具技巧性。往往与输 入数据中隐含的特征因素有关。目前常见的经验计算公式主要有以下几种 【3 观: h o m i k 经验公式: mg ( 2 i n + o u t ) 1 2 , ( 2 i n + o u t ) ( 2 - 4 2 ) h e c h t - n i e l s e n 经验公式: m = 2 i n + l ( 2 4 3 ) w o n g 经验公式: m = 2 i n( 2 4 4 ) d a v i ds h e p a r da s s o c i a t e 经验公式: = f f n x o u t ) “2 ( 2 - 4 5 ) l i p p m a m 经验公式: = 2 i n + l( 2 4 6 ) 在上面的经验公式中m 指隐藏层神经元数量,加指输入层神经元数量, o u t 指输出层神经元数量。 目前多数文献中提出的确定隐藏层神经元数的计算公式都是针对训练样 本任意多的情况,而且多数是针对最不利的情况。事实上,各种计算公式得 到的隐藏层神经元数有时相差几倍甚至几十倍。为尽可能避免训练时出现“过 拟合”现象,保证足够高的网络性能和泛化能力,确定隐藏层神经元数的最 基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少 的隐藏层神经元数【柏】。研究表明,隐藏层神经元数不仅与输入输出层的神经 元数有关,更与需解决的问题的复杂程度和传输函数的形式以及样本数据的 特性等因素有关。 2 2 4 3 卵神经网络的学习 在确定了b p 神经网络的结构后,要通过训练样本集对网络进行训练, 亦即对网络的闺值和权值进行学习和修正,以使网络实现给定的输入输出映 射关系。 b p 神经网络的学习过程分为两个阶段: 第一个阶段是输入已知学习样本,通过设置的网络结构和前一次迭代的 权值和阈值,从网络的第一层向后计算各神经元的输出。在信号的向前传递 过程中网络的权值是固定不变的,每一层神经元的状态只影响下一层神经元 的状态。 第二个阶段是对权值和阙值进行修改,从最后一层向前计算各权值和阙 1 8 哈尔滨工程大学硕士学位论文 值对总误差的影响,据此对各权值和阈值进行修改。在误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论