基于人工神经网络的预测研究_第1页
基于人工神经网络的预测研究_第2页
基于人工神经网络的预测研究_第3页
基于人工神经网络的预测研究_第4页
基于人工神经网络的预测研究_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录TOC\o"1-2"\u1.引言 11.1研究背景及意义 11.2研究现状 21.3主要研究方向 42.人工神经网络 52.1人工神经网络的根本内容 52.2人工神经网络的根本特征 62.3人工神经网络的工作原理 82.4人工神经网络的分析方法 133.人工神经网络BP模型 143.1BP神经网络的概念 143.2BP网络模型的类型 153.3BP学习算法 173.4BP神经网络的应用及缺乏 184.人工神经网络RBF模型 194.1RBF神经网络的概念 194.2径向基函数(RBF)网络结构和模型 194.3RBF的网络学习算法 214.4RBF网络模型的优点和缺点 235.基于人工神经网络的空调系统故障预测 235.1用BP网络对空调系统故障进行预测 245.2空调系统故障诊断的RBF网络建立 285.3小结 296.结论 306.1结论 306.2考前须知 316.3人工神经网络的局限性 31参考文献 32基于人工神经网络的预测研究摘要:随着多媒体和网络技术的飞速开展及广泛应用,人工神经网络已被广泛运用于各种领域,本文首先介绍了人工神经网络的根本原理以及概念,然后详细介绍了反向传播算法(BP)和径向基算法(RBF)简介以及应用,BP是误差反传误差反向传播算法,RBF网络是一种具有3层单向传播的前馈网络。最后通过举出空调系统的故障的例子,通过建立空调系统故障的BP模型和RBF模型,网络输入输出向量及参数的选取,网络结构及训练样本的选取,网络的训练与检验,计算总结空调故障从而预测出空调故障。并对实验的结果进行了分析,得出相同的样本数和精度要求下,RBF神经网络的隐层神经元数要大大多于BP网络,这表达在网络的复杂度要高于BP网络。最后一个局部对论文进行了总结,阐述了人工神经网络的预测的前景。关键词:人工神经网络;BP模型;RBF模型;故障预测1.引言1.1研究背景及意义现代计算机构成单元的速度是人脑中神经元速度的几百万倍,对于那些特征明确,推理或运算规那么清楚地可编程问题,可以高速有效地求解,在数值运算和逻辑运算方面的精确与高速极大地拓展了人脑的能力,从而在信息处理和控制决策等方面为人们提供了实现智能化和自动化的先进手段。但由于现有计算机是按照冯·诺依曼原理,基于程序存取进行工作的,历经半个多世纪的开展,其结构模式与运行机制仍然没有跳出传统的逻辑运算规那么,因而在很多方面的功能还远不能到达认得智能水平。随着现代信息科学与技术的飞速开展,这方面的问题日趋锋利,促使科学和技术专家们寻找解决问题的新出路。当人们的思想转向研究大自然造就的精妙的人脑结构模式和信息处理机制时,推动了脑科学的深入开展以及人工神经网络和闹模型的研究。随着对生物闹的深入了解,人工神经网络获得长足开展。在经历了漫长的初创期和低潮期后,人工神经网络终于以其不容无视的潜力与活力进入了开展高潮。这么多年来,它的结构与功能逐步改善,运行机制渐趋成熟,应用领域日益扩大,在解决各行各业的难题中显示出巨大的潜力,取得了丰硕的成果[[1]朱大奇,人工神经网络研究现状及其展望[N][1]朱大奇,人工神经网络研究现状及其展望[N].江南大学学报2004(3):103~108.目前,关于神经网络的定义尚不统一,按美国神经网络学家HechtNielsen的观点,神经网络的定义是:“神经网络是由多个非常简单的处理单元彼此按某种方式相互连接而形成的计算机系统,该系统靠其状态对外部输入信息的动态响应来处理信息的〞。综合神经网络的来源、特点和各种解释,它可简单地表述为:人工神经网络是一种旨在模仿人脑结构及其功能的信息处理系统[[2]董军,[2]董军,胡上序,混沌神经网络研究进展和展望[J].信息与控制,1997(5):360~368.正是由于人工神经网络是一门新兴的学科,它在理论、模型、算法、应用和时限等方面都还有很多空白点需要努力探索、研究、开拓和开发。因此,许多国家的政府和企业都投入了大量的资金,组织大量的科学和技术专家对人工神经网络的广泛问题立项研究。从人工神经网络的模拟程序和专用芯片的不断推出、论文的大量发表以及各种应用的报道可以看到,在这个领域里一个百家争鸣的局面已经形成。在进行神经网络的理论研究时,人们可以将自己的神经网络模型或算法在通用的串行或并行计算机编程实现,但这只是研究的手段而绝非目的,在构造实际的神经网络应用系统时,必然要考虑到硬件实现问题,特定应用下的高性能专用神经网络硬件是神经网络研究的最终目标。人工智能的方法和技术已经用于解决很多领域的问题,并取得了一定的成就。人工神经网络是人工智能领域的重要分支,而神经网络的硬件实现是神经网路研究的根本问题之一。从对神经网络进行理论探讨的角度,可以通过计算机仿真途径来模拟实现特定的神经网络模型或算法,但在构造神经网络的实际应用系统时,必然要研究和解决其硬件实现问题。神经网络专用硬件可提供高速度,并具有比通用串、并行高得多的性价比,所以特定应用下的高性能专用神经网路硬件是神经网络研究的最终目标。1.2研究现状神经网络的硬件实现可追溯到60年代,当时有几家公司和研究机构试图用硬件来实现神经元,最为著名的便是感知机和ADALINE神经网络模型的实现。当时CornellAeronautical实验室〔现在名为CALSPANCorporation〕的Rosenblatt从理论上和实现上描述了感知机。ADALINE神经网络那么是由斯坦福人学的Widrow提出的。感知机和ADALINE均为单个神经元模型,他们均能接受多路输入,并能自适应地修改与这些输入相对应的突触强度〔互连权值〕,然而他们实现上有所不同。感知机中,其突触强度通过一种电子机械的方法来改变〔通过一个电动马达的转动来改变突触强度〕,这种实现有许多缺点,如体积大,价格高,运行不可靠等。Widrow的ADALINE实现中那么用电阻的方法来表示突触强度。1965年至1980年,除AdaptronicsCorp〔现为DivisionofFlowGeneralCrop〕之外,其它一些研究尸体在神经网络实现上没有做更多的工作。Adaptronics的LouisGilstrap和RogerBarron在1947年开发了第一块神经元芯片。这种很一般的芯片只包含一个神经元,具有多个输入端且其互连强度可以自适应的改变。要构造具有多个神经元的网络,只需将许多这种芯片在插件板上排列并互连起来就可以了。将许多这种插件构建在一起便可满足神经网络在商业和军事上的许多应用目的。随着人工神经网络的20世纪80年代在世界范围内的复苏,国内也逐步掀起了研究热潮,1989年10月和11月分别在北京和广州召开了神经网络及其应用讨论会和第一届全国型号处理——神经网络学术会议;1990年2月由国内八个学会〔中国电子学会、人工智能学会、自动化学会、通信学会、物理学会、生物物理学会和心理学会〕联合在北京召开“中国神经网络首届学术会议〞,这次大会以“八学会联盟,探只能奥秘为主题,收到了300多篇学术论文〞,开创了中国人工神经网络及神经计算机方面科学研究的新纪元,经过十几年的开展,中国学术界和工程界在人工神经网络的理论研究和应用方面取得了丰硕成果,学术论文、应用成果和研究人员逐年增加。在国际上,1987年,在美国加洲召开第一届国际神经网络学会,此后每年召开两次国际联合神经网络大会〔UCNN〕,不久,改学会创办了刊物JournalNeuralNetworks,另有十几种国际著名的神经网络学术刊物相继问世。至此,神经网络理论研究在国际学术领域获得了其应有的地位。经过多年的开展,目前已有上百种的神经网络模型被提出,下表列出了神经网络开展过程中起过重要作用的几种著名神经网络,他也是神经网络开展史的一个缩影。表1-1有重要影响神经网络网络名称创造者时间特点局限性典型应用领域自适应线性单元〔Adaline〕BernardWidrow〔斯坦福大学1960-1962学习能力较强,较早开始商业应用要求输入-输出之间是线性关系雷达天线控制、自适应回波抵消等误差反转网络BP〔BackPropagation〕WerbsP.(哈佛大))RumelhartD.(斯坦福大学)Mcclelland〔斯坦福大学〕1974-1985多层前馈网络,采用最小均方差学习方式是目前应用最广泛的网络需要大量输入-输出数据,训练时间长,易陷入局部极小语音识别、过程控制、模式识别等盒中脑BSB网络〔BrainStateinaBox〕JamesAnderson〔布朗大学1977具有最小均方差的单层自联想网络,类似于双向联想记忆,可对片段输入补全只能作一次性决策,无重复性共振解释概念形成,分类和知识处理双向联想记忆网BAM〔Bi-directionalAssociativeMemory〕BartKosko〔南加州大学〕1985-1988双向联想式单层网络,有学习功能,简单易学存储的密度低,数据必须能编码内容寻址的联想记忆双向传播网CPN〔CunterPropaation〕RobertHechtnielsen〔美国〕1986一种在功能上作为统计最优化和概率密度函数分析的网络需要大量处理单元和连接,要高度准确神经网络计算机,图像处理和统计分析现在人工神经网络广泛运用到了各个领域,它的更多用法也在不断被开发中,用它来预测事物的开展也是其中之一,而现在人工神经网络预测模型可通过几个问题就能确定答题者是否感染艾滋病,以往判定出入境人员是否感染艾滋病,必须要进行特异性血清学诊断和病原体检测,不仅花费时间,还需要被检测者支付一定的费用,因而工作比拟难以开展。使用人工神经网络预测技术使得在没有特异性血清学诊断和病原体检测的条件下,有望在口岸疾病监测和现场卫生检疫工作中及时发现性病、艾滋病高危人群,尽早切断传播途径,最大限度地保障口岸平安。据了解,用这个模型研究者随机抽取了15例梅毒患者和15例非性病患者进行测试,结果该模型准确地识别出15例梅毒病例,准确率达100%。这就是人工神经网络预测的意义,通过问题建模用反向传播算法来计算出答案,直接缩短了原本检查需要的实验时间。1.3主要研究方向神经网络的研究内容相当广泛,反映了多学科交叉技术领域的特点。目前,主要的研究工作集中在以下几个方面:〔1〕生物原型研究。从生理学、心理学、解剖学、脑科学、病理学等生物科学方面研究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。〔2〕建立理论模型。根据生物原型的研究,建立神经元、神经网络的理论模型。其中包括概念模型、知识模型、物理化学模型、数学模型等。〔3〕网络模型。与算法研究。在理论模型研究的根底上构作具体的神经网络模型,以实现计算机模拟或准备制作硬件,包括网络学习算法的研究。这方面的工作也称为技术模型研究。〔4〕人工神经网络应用系统。在网络模型与算法研究的根底上,利用人工神经网络组成实际的应用系统,例如,完成某种信号处理或模式识别的功能、构作专家系统、制成机器人等等。纵观当代新兴科学技术的开展历史,人类在征服宇宙空间、根本粒子,生命起源等科学技术领域的进程中历经了崎岖不平的道路。我们也会看到,探索人脑功能和神经网络的研究将伴随着重重困难的克服而日新月异。2.人工神经网络2.1人工神经网络的根本内容2.1.1人工神经网络的模型神经元是人工神经网络的根本处理单元,它一般是一个多输入/单输出的非线性元件[[3]韩力群,[3]韩力群,人工神经网络理论、设计及应用[M].北京:化学工业出版社,2002.人工神经网络模型主要考虑网络连接的拓扑结构、神经元的特征、学习规那么等。目前,已有近40种神经网络模型,其中有反传网络、感知器、自组织映射、Hopfield网络、波耳兹曼机、适应谐振理论等。根据连接的拓扑结构,神经网络模型可以分为:〔1〕前向网络网络中各个神经元接受前一级的输入,并输出到下一级,网络中没有反应,可以用一个有向无环路图表示。这种网络实现信号从输入空间到输出空间的变换,它的信息处理能力来自于简单非线性函数的屡次复合。网络结构简单,易于实现。反传网络是一种典型的前向网络。〔2〕反应网络网络内神经元间有反应,可以用一个无向的完备图表示。这种神经网络的信息处理是状态的变换,可以用动力学系统理论处理。系统的稳定性与联想记忆功能有密切关系。Hopfield网络、波耳兹曼机均属于这种类型。2.1.2人工神经网络的概念人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点〔或称神经元〕和之间相互联接构成。每个节点代表一种特定的输出函数,称为鼓励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权值,这相当于人工神经网络的记忆。网络的输出那么依网络的连接方式,权重值和鼓励函数的不同而不同。输入加权求和阈值传递函数输出......图2-1人工神经元的一般模型由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的根底上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理[[4]马锐,人工神经网路原理[M][4]马锐,人工神经网路原理[M].北京:机械工业出版社.2021.2.2人工神经网络的根本特征人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的根底上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。人工神经网络具有四个根本特征:〔1〕非线性非线性关系是自然界的普遍特性。大脑的智慧就是一种非线性现象。人工神经元处于激活或抑制二种不同的状态,这种行为在数学上表现为一种非线性可以提高容错性和存储容量。\o"查看图片"〔2〕非局限性一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子。〔3〕非常定性人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程。〔4〕非凸性一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。例如能量函数,它的极值相应于系统比拟稳定的状态。非凸性是指这种函数有多个极值,故系统具有多个较稳定的平衡态,这将导致系统演化的多样性。人工神经网络中,神经元处理单元可表示不同的对象,例如特征、字母、概念,或者一些有意义的抽象模式。网络中处理单元的类型分为三类:输入单元、输出单元和隐单元。输入单元接受外部世界的信号与数据;输出单元实现系统处理结果的输出;隐单元是处在输入和输出单元之间,不能由系统外部观察的单元。神经元间的连接权值反映了单元间的连接强度,信息的表示和处理表达在网络处理单元的连接关系中。人工神经网络是一种非程序化、适应性、大脑风格的信息处理,其本质是通过网络的变换和动力学行为得到一种并行分布式的信息处理功能,并在不同程度和层次上模仿人脑神经系统的信息处理功能。它是涉及神经科学、思维科学、人工智能、计算机科学等多个领域的交叉学科。输入层隐层输出层XY阈值隐层单元权值图2-2根底人工神经网络示意图人工神经网络是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的机理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点。2.3人工神经网络的工作原理人工神经网络是对人类神经系统的一种模拟。尽管人类神经系统规模宏大、结构复杂、功能神奇,但其最根本的处理单元却只有神经元。人工神经系统的功能实际上是通过大量神经元的广泛互连,以规模宏伟的并行运算来实现的。基于对人类生物系统的这一认识,人们也试图通过对人工神经元的广泛互连来模拟生物神经系统的结构和功能。人工神经元之间通过互连形成的网络称为人工神经网络。在人工神经网络中,神经元之间互连的方式称为连接模式或连接模型。它不仅决定了神经元网络的互连结构,同时也决定了神经网络的信号处理方式。生物神经元结构与功能人工神经网络反映了人脑功能的假设干根本特性,但并非生物系统的逼真描述,只是某种模仿、简化和抽象。与数字计算机比拟,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。神经元也和其他类型的细胞一样,包括有细胞膜、细胞质和细胞核。但是神经细胞的形态比拟特殊,具有许多突起,因此又分为细胞体、轴突和树突三局部。细胞体内有细胞核突起的作用是传递信息。来自其他神经元的信息来自其他神经元的信息兴奋神经元抑制神经元阈值膜电位细胞膜图2-1生物神经元的信息传递与处理示意图细胞体由细胞核、细胞质和细胞膜等组成,其直径大约为0.5--100μm,大小不等。细胞体是神经元的主体,用于处理由树突接受的其它神经元传来的信号。〔1〕细胞体〔2〕树突〔3〕轴突〔4〕突触图2-2简单神经元网络图轴突是由细胞体向外延伸出的所有纤维中最长的一条分枝,用来向外传递神经元产生的输出电信号。每个神经元都有一条轴突,其最大长度可达1m以上。在轴突的末端形成了许多很细的分枝,这些分支叫神经末梢。每一条神经末梢可以与其它神经元形成功能性接触,该接触部位称为突触。所谓功能性接触,是指非永久性的接触,这正是神经元之间传递信息的奥秘之处。树突是指由细胞体向外延伸的除轴突以外的其它所有分支。树突的长度一般较短,但数量很多,它是神经元的输入端,用于接受从其它神经元的突触传来的信号。神经元中的细胞体相当于一个初等处理器,它对来自其它各个神经元的信号进行总体求和,并产生一个神经输出信号。突触可分为兴奋性与抑制性两种类型,它相应于神经元之间耦合的极性。每个神经元的突触数目正常,最高可达10个。各神经元之间的连接强度和极性有所不同,并且都可调整、基于这一特性,人脑具有存储信息的功能。利用大量神经元相互联接组成人工神经网络可显示出人的大脑的某些特征。细胞膜内外的电位之差被称为膜电位。在无信号输入时的膜电位称为静止膜电位。当一个神经元的所有输入总效应到达某个阈值电位时,该细胞变为活性细胞。(1)时空整合功能神经元对不同时间通过同一突触传入的神经冲动,具有时间整合功能。对于同一时间通过不同突触传入的神经冲动,具有空间整合功能。两种功能相互结合,使生物神经元对由突触传入的神经冲动具有时空整合的功能。兴奋与抑制状态神经元具有兴奋和抑制两种常规的工作状态。当传入冲动的时空整合结果使细胞膜电位升高,超过动作电位的阈值时,细胞进入兴奋状态,产生神经冲动。相反,当传入冲动的时空整合结果使细胞膜电位低于动作电位的阈值时,细胞进入抑制状态,无神经冲动输出。〔3)脉冲与电位转换突触界面具有脉冲/电位信号转化功能。沿神经纤维传递的信号为离散的电脉冲信号,而细胞膜电位的变化为连续的电位信号。这种在突触接口处进行的“数/模〞转换,是通过神经介质以量子化学方式实现的如下过程:电脉冲神经化学物质膜电位〔4〕神经纤维传导速率神经冲动沿神经纤维传导的速度在1150m/s之间。其速度差异与纤维的粗细、髓鞘的有无有关。一般来说,有髓鞘的纤维,其传导速度在100m/s以上,无髓鞘的纤维,其传导速度可低至每秒数米。(5)突触延时和不应期突触对相邻两次神经冲动的响应需要有一定的时间间隔,在这个时间间隔内不响应鼓励,也不传递神经冲动,这个时间间隔称为不应期。人脑神经系统的结构与特征神经生理学的研究结果说明,人脑的神经系统是一个由大量生物神经元并行互连所形成的一个网络系统。每个人的大脑大约有10111012个神经元,每个神经元大约有103104个突触,即与其它103104个神经元相连。(1)记忆和存储功能人脑神经系统的记忆和处理功能是有机的结合在一起的。神经元既有存储功能,又有处理功能,它在进行回忆时不仅不需要先找到存储地址再调出所存内容,而且还可以由一局部内容恢复全部内容。尤其是当一局部神经元受到损坏〔例如脑部受伤等〕时,它只会丧失损坏最严重局部的那些信息,而不会丧失全部存储信息。(2)高度并行性提供了非常巨大的存储容量和并行度。例如,人可以非常迅速地识别出一幅十分复杂的图像。(3)分布式功能人们通过对脑损坏病人所做的神经心理学研究,没有发现大脑中的哪一局部可以决定其余所有各局部的活动,也没有发现在大脑中存在有用于驱动和管理整个智能处理过程的任何中央控制局部。人类大脑的各个局部是协同工作、相互影响的,并没有哪一局部神经元能对智能活动的整个过程负有特别重要的责任。可见,在大脑中,不仅知识的存储是分散的,而且其控制和决策也是分散的。因此,大脑是一种分布式系统。(4)容错功能容错性是指根据不完全的、有错误的信息仍能做出正确、完整结论的能力。大脑的容错性是非常强的。例如,我们往往能够仅由某个人的一双眼睛、一个背影、一个动作或一句话的音调,就能识别出来这个人是谁。(5)联想功能人脑不仅具有很强的容错功能,还有联想功能。善于将不同领域的知识结合起来灵活运用,善于概括、类比和推理。例如,一个人能很快认出多年不见、面貌变化较大的老朋友。(6)自组织和自学习功能人脑能够通过内部自组织、自学习能力不断适应外界环境,从而可以有效地处理各种模拟的、模糊的或随机的问题。在人工神经网络中,改变信息处理及能力的过程,就是修改网络权值的过程。人工神经元之间通过互相联接形成网络,称为人工神经网络,人工神经元的主要结构单元是信号的输入、综合处理和输出,输出信号强度大小反映了该神经元对相邻神经元影响的强弱,神经元之间相互联接的方式称为联接模式,相互之间的联接强度由联接权值表达。人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。人工神经网络首先要以一定的学习准那么进行学习,然后才能工作。现以人工神经网络对手写“A〞、“B〞两个字母的识别为例进行说明,规定当“A〞输入网络时,应该输出“1〞,而当输入为“B〞时,输出为“0〞。所以网络学习的准那么应该是:如果网络作出错误的的判决,那么通过网络的学习,应使得网络减少下次犯同样错误的可能性。首先,给网络的各连接权值赋予(0,1)区间内的随机值,将“A〞所对应的图象模式输入给网络,网络将输入模式加权求和、与门限比拟、再进行非线性运算,得到网络的输出。在此情况下,网络输出为“1〞和“0〞的概率各为50%,也就是说是完全随机的。这时如果输出为“1〞(结果正确),那么使连接权值增大,以便使网络再次遇到“A〞模式输入时,仍然能作出正确的判断。如果输出为“0〞(即结果错误),那么把网络连接权值朝着减小综合输入加权值的方向调整,其目的在于使网络下次再遇到“A〞模式输入时,减小犯同样错误的可能性。如此操作调整,当给网络轮番输入假设干个手写字母“A〞、“B〞后,经过网络按以上学习方法进行假设干次学习后,网络判断的正确率将大大提高。这说明网络对这两个模式的学习已经获得了成功,它已将这两个模式分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模式时,能够作出迅速、准确的判断和识别。一般说来,网络中所含的神经元个数越多,那么它能记忆、识别的模式也就越多。拓扑结构的单隐层前馈网络,一般称为三层前馈网或三层感知器,即:输入层、中间层〔也称隐层〕和输出层。它的特点是:各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反应连接,构成具有层次结构的前馈型神经网络系统。单计算层前馈神经网络只能求解线性可分问题,能够求解非线性问题的网络必须是具有隐层的多层神经网络。2.4人工神经网络的分析方法研究神经网络的非线性动力学性质,主要采用动力学系统理论、非线性规划理论和统计理论,来分析神经网络的演化过程和吸引子的性质,探索神经网络的协同行为和集体计算功能,了解神经信息处理机制。为了探讨神经网络在整体性和模糊性方面处理信息的可能,混沌理论的概念和方法将会发挥作用。混沌是一个相当难以精确定义的数学概念。一般而言,“混沌〞是指由确定性方程描述的动力学系统中表现出的非确定性行为,或称之为确定的随机性。“确定性〞是因为它由内在的原因而不是外来的噪声或干扰所产生,而“随机性〞是指其不规那么的、不能预测的行为,只可能用统计的方法描述。混沌动力学系统的主要特征是其状态对初始条件的灵敏依赖性,混沌反映其内在的随机性。混沌理论是指描述具有混沌行为的非线性动力学系统的根本理论、概念、方法,它把动力学系统的复杂行为理解为其自身与其在同外界进行物质、能量和信息交换过程中内在的有结构的行为,而不是外来的和偶然的行为,混沌状态是一种定态。混沌动力学系统的定态包括:静止、平稳量、周期性、准同期性和混沌解。混沌轨线是整体上稳定与局部不稳定相结合的结果,称之为奇异吸引子。一个奇异吸引子有如下一些特征:〔1〕奇异吸引子是一个吸引子,但它既不是不动点,也不是周期解;〔2〕奇异吸引子是不可分割的,即不能分为两个以及两个以上的吸引子;〔3〕它对初始值十分敏感,不同的初始值会导致极不相同的行为。3.人工神经网络BP模型BP〔BackPropagation〕网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络[[5]胡守仁,余少波,戴葵,神经网络导[M][5]胡守仁,余少波,戴葵,神经网络导[M].长沙:国防科技大学出版社,1992.输出层输出神经元隐含层隐含神经元输入层输入神经元图3-1典型的神经网络结构3.1BP神经网络的概念在人工神经网络开展历史中,很长一段时间里没有找到隐层的连接权值调整问题的有效算法。直到误差反向传播算法〔BP算法〕的提出,成功地解决了求解非线性连续函数的多层前馈神经网络权重调整问题。BP神经网络,即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。3.2BP网络模型的类型BP神经网络模型BP网络模型包括其输入输出模型、作用函数模型、误差计算模型和自学习模型。(1)节点输出模型隐节点输出模型:(1)输出节点输出模型:(2)f-非线形作用函数;q-神经单元阈值。输入层隐含层输出层图3-2典型BP网络结构模型(2)作用函数模型作用函数是反映下层输入对上层节点刺激脉冲强度的函数又称刺激函数,一般取为(0,1)内连续取值Sigmoid函数:(3)误差计算模型误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数:tpi-i节点的期望输出值;Opi-i节点计算输出值。(4)自学习模型神经网络的学习过程,即连接下层节点和上层节点之间的权重拒阵Wij的设定和误差修正过程。BP网络有师学习方式-需要设定期望值和无师学习方式-只需输入模式之分。自学习模型为h-学习因子;-输出节点i的计算误差;Oj-输出节点j的计算输出;a-动量因子。3.3BP学习算法BP算法因其简单、易行、计算量小、并行性强等优点,是目前神经网络训练采用最多也是最成熟的训练算法之一[[6]胡金滨,唐旭清.人工神经网络的BP算法及其应用[J].信息技术[6]胡金滨,唐旭清.人工神经网络的BP算法及其应用[J].信息技术,2004(4):1~4.一般的BP算法称为标准误差逆传播算法,也就是对应每一次输入都校正一次权值。这种算法不是全局误差意义上的梯度下降计算。对各个神经元的输出求偏导数,那么就可以算出误差EP对所有联结权值的偏导数,从而可以利用梯度下降法来修改各个联结权值。真正的全局误差意义上的梯度下降算法是在全部训练模式都学习完后才校正联结权和阈值。其计算流程如下列图3-3所示开始网络初始化给定输入量和目标输出完成Yes,进入工作状态学习NO求隐含层和输出层各单元输出计算目标与实际输出值的偏差EYes所有单元的eYes求输E满足要求?满足要求?出向量No计算隐含层单元误差No调整学习效率给出结果调整中间层到输出层的联结权值和输出层单元的阈值调整输出层到中间层的联接权值和中间层单元的阈值学习完成图3-3BP算法流程图3.4BP神经网络的应用及缺乏神经网络可以用作分类、聚类、预测等。神经网络需要有一定量的历史数据,通过历史数据的训练,网络可以学习到数据中隐含的知识。在你的问题中,首先要找到某些问题的一些特征,以及对应的评价数据,用这些数据来训练神经网络。虽然BP网络得到了广泛的应用,但自身也存在一些缺陷和缺乏,主要包括以下几个方面的问题。首先,由于学习速率是固定的,因此网络的收敛速度慢,需要较长的训练时间。对于一些复杂问题,BP算法需要的训练时间可能非常长,这主要是由于学习速率太小造成的,可采用变化的学习速率或自适应的学习速率加以改良。其次,BP算法可以使权值收敛到某个值,但并不保证其为误差平面的全局最小值,这是因为采用梯度下降法可能产生一个局部最小值。对于这个问题,可以采用附加动量法来解决。再次,网络隐含层的层数和单元数的选择尚无理论上的指导,一般是根据经验或者通过反复实验确定。因此,网络往往存在很大的冗余性,在一定程度上也增加了网络学习的负担。最后,网络的学习和记忆具有不稳定性。也就是说,如果增加了学习样本,训练好的网络就需要从头开始训练,对于以前的权值和阈值是没有记忆的。但是可以将预测、分类或聚类做的比拟好的权值保存。4.人工神经网络RBF模型4.1RBF神经网络的概念RBF神经网络是一种具有拓扑结构的前向神经网络.由输入层、隐含层、输出层构。RBF神经网络以径向基函数(RBF)作为隐层单元的基,构成隐含层空间,隐含层对输入矢量进行变换将低维的模式输入数据变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分。4.2径向基函数(RBF)网络结构和模型径向基函数是20世纪80年代末由J.Moody和C.Darken提出的网络模型,它模拟了人脑中局部调整、相互覆盖感受野(receptivefield),因此是一种局部逼近网络,科学界已经证明它能以任意精度逼近任意函数。输出输出层…隐藏层…输入输出层图4-1RBF网络结构图径向基函数〔RBF〕神经网络,是具有单隐层的三层前馈网络,结构见图4-1。由于它模拟了人脑中局部调整、相互覆盖接收域的神经网络结构,因此,是一种局部逼近网络,已证明它能以任意精度逼近任一连续函数。U…y……图4-3RBF神经网络结构模型RBF网络的神经元模型是改良了感知器神经元模型得到的。输入层:隐层:一维二维输出层:u1w1...xyu2...unwn图4-4RBF神经元结构模型径向基神经网络与BP网络在结构上根本相同,区别在于RBF网络隐含层节点传输函数为径向基函数,即隐含层节点对输入产生局部响应,此RBF常被称为局部感受野网络。径向基函数表现为多种形式,常见的为高斯函数。4.3RBF的网络学习算法RBF网络的学习算法,由两局部组成;无导师学习、有导师学习。根据学习时是否需要外部指导信息,通常将神经网络的学习分为二种类型:有导师学习:必须预先知道学习的期望结果——教师信息,并依此按照某一学习规那么来修正权值。无导师学习:不需要教师信息或强化信号,只要给定输入信息,网络通过自组织调整,自学习并给出一定意义下的输出相应。无导师学习对所有输入样本进行聚类,求得各隐层节点的RBF的中心。介绍用k--均值聚类算法调整中心。(1)聚类聚类分析符合“物以类聚,人以群分〞的原那么,把相似性大的样本聚集为一个类型,在特征空间里占据着一个局部区域。类型越多,这样的具备区域就越多。每个局部区域都形成一个聚合中心,往往以聚合中心代表相应的类型。聚类分析算法可以自动地确定类型的数目K,不必以预知K为前提条件。当然,也可以给定K作为算法终止的条件。如果没有给定K,如何在聚类过程中自动确实定K,是聚类分析中的一个关键性的问题。(2)相似性度量如何衡量样本相似性,对聚类有直接影响。通常使用距离相似性度量和角度相似性度量。距离相似性度量:一个模式样本,在它的特征空间里是一个点。如果模式的特征是适中选择的,即各维特征对于分类来说都是等效的,那么,同一类的模式样本就密集的分布在一个区域里,不同类的模式样本就会远离。因此,点间距离远近反映了相应模式样本所属类型有无差异,可以作为样本相似性度量。点间距离近,那么样本相似性大,它们属于同一个类型;否那么,它们属于不同的类型。在聚类分析中,最经常使用的就是距离相似性。欧式(Euclidean)距离欧式距离又称为距离,模式样本向量x和y之间的欧式距离定义为:其中d为特征空间的维数。显然,假设样本x和y位于同一个类型区域里,欧式距离是比拟小的;假设它们位于不同类型的区域里,那么是比拟大的。马氏(Mahalanobis)距离我们已经知道马氏距离的定义,可以表达为:明氏(Minkowsky)距离:有导师学习当ci确定后,训练由隐层至输出层间的权系值,它是线性方程组,那么求权系值成为线性优化问题,可利用各种线性优化算法求得,如:LMS算法、最小二乘递推法、镜像映射最小二乘法等。(1)LMS算法LMS算法即规那么,对于本网络权值调整算法::常值,。当,算法结束。(2)最小二乘递推法〔RLS〕。(3)镜像映射最小二乘法。4.4RBF网络模型的优点和缺点RBF网络的优点(1)它具有唯一最正确逼近的特性,且无局部极小问题存在;(2)RBF神经网络具有较强的输入和输出映射功能,并且理论证明在前向网络中RBF网络是完成映射功能的最优网络;(3)网络连接权值与输出呈线性关系;(4)分类能力好;(5)学习过程收敛速度快。RBF网络的缺点(1)最严重的问题是没能力来解释自己的推理过程和推理依据;(2)不能向用户提出必要的询问,而且当数据不充分的时候,神经网络就无法进行工作;(3)把一切问题的特征都变为数字,把一切推理都变为数值计算,其结果势必是丧失信息;(4)理论和学习算法还有待于进一步完善和提高。RBF神经网络的非线性映射能力表达在隐层基函数上,而基函数的特性主要由基函数的中心确定,从数据点中任意选取中心构造出来的RBF神经网络的性能显然是不能令人满意的目的;〔5〕RBF神经网络用于非线性系统建模需要解决的关键问题是样本数据的选择L在实际工业过程中,系统的信息往往只能从系统运行的操作数据中分析得到,因此如何从系统运行的操作数据中提取系统运行状况信息,以降低网络对训练样本的依赖,在实际应用中具有重要的价值。5.基于人工神经网络的空调系统故障预测5.1用BP网络对空调系统故障进行预测5.1.1空调系统故障诊断的BP网络建立空调系统故障模式及故障机制分析[[7]余江海.一种制冷系统故障诊断方法[C].上海交通大学硕士论文,2001.[7]余江海.一种制冷系统故障诊断方法[C].上海交通大学硕士论文,2001.[8]中国机械工程学会设备维修分会,机械设备维修问答丛书,编委会空调制冷设备维修问答[M].北京:机械工业出版社.1988.表5-1空调系统故障模式及故障机制分析表示符号故障模式表示符号故障原因x1房间温度均偏高y1y2y3y4y5y61.冷冻机产冷量缺乏2.喷水堵塞3.通过空气处理设备的风量过大,热交换不良4.回风量大于送风量5.送风量缺乏(可能空气过滤气堵塞)6.表冷器结霜,造成堵塞x2相对湿度均偏低y77.室外空气未经加湿处理x3系统实测风量大于设计风量y8y98.系统的实际阻力小于设计阻力9.设计时选用风机容量偏大x4房间气流速度超过允许流速y10y11y1210.送风口速度过大11.总送风量过大12.送风口的型式不适合网络输入输出向量及参数的选取以故障模式X=(x1,x2,x3,x4)作为输入,故障原因Y=(y1,y2,y3⋯y12)作为输出,以不同的故障原因导致的故障模式为训练样本进行学习,从而建立故障模式与故障原因之间的映射关系。x1,x2,x3,x4分别代表故障房间温度均偏高、相对湿度均偏低、系统实测风量大于设计风量和房间气流速度超过允许流速的4种故障现象;y1,y2,⋯,y12分别代表冷冻机产冷量缺乏;喷水堵塞⋯⋯送风口的型式不适合等故障原因。网络结构及训练样本的选取空调系统故障诊断的神经网络模型分为3层,分别为输入层、隐含层和输出层。输入层节点个数为4,对应于4个故障现象,输出层节点个数为12,对应于12个故障原因。输出节点值的大小反映了故障出现的可能性。隐含层节点的个数可参照公式初步选取[[9]宋桂荣.[9]宋桂荣.改良BP算法在故障诊断中的应用[N].沈阳工业大学学报,2001(3):252~254.,其中M为输出节点数,N为输入节点数,为1至10的常数,在此,选取16个隐含层节点。输入单元数为4个,输出单元数为12个。隐含层单元个数凭经验选取,一般取4~5个隐含节点对应一个输入节点,这里选4个,那么隐含层节点为4×4=16个,网络共32个节点。各单元的输入与输出的特征函数采用Sigmoid函数,即隐含层第j个神经元的输入为,输出Oj为:式中θj表示阈值,θ0的作用是调节Sigmoid函数的形状。取4个训练样本,具体如表5-2所示。(x1,x2,x3,x4)=(1,0,0,0)表示房间温度均偏高的故障模式;(y1,y2,y3⋯y12)=(1,1,1,1,1,1,0,0,⋯⋯)表示房间温度均偏高的故障原因。表5-2BP网络的训练样本表样本序号故障模式故障原因x1x2x3x4y1y2y3y4y5y6y7y8y9y10y11y1211000111111000000201000000001000003001000000001100040001000000000111网络的训练与检验我们以给定模式作为网络的输入,要求网络通过调节所有的联结权系数和各神经元的阈值,使得在输出层神经元上得到理想的结果;然后再给出另一个模式,要求网络继续完成对这对模式的学习。当系统的平均误差E满足下式即可完成训练:式中:是对应于第k个样本、第t个输出节点的期望输出值Ct是第t个输出节点的实际输出值。根据程序框图及BP算法,运用神经网络工具箱进行样本训练。计算程序如下:P=[1000;0100;0010;0001];T=[1000;1000;1000;1000;1000;1000;0100;0010;0010;0001;0001;0001]net=newff(minmax(P),[16,12],{‘tansig’‘,purelin’}‘,traingda’);net.trainParam.show=200;net.trainParam.lr=0.05;net.trainParam.epochs=2000;net.trainParam.goal=1e-5;[net,tr]=train(net,P,T)计算结束后,网络到达收敛,其训练收敛过程,如图5-2所示:图5-2BP网络梯度下降法收敛图最后用非训练样本测试网络的判断能力,测试结果如表5-3所示:表5-3测试结果1样本序号1234故障模式x1x2x3x41000010000100001故障原因y1y2y3y4y5y6y7y8y9y10y11y120.9997-0.0000-0.00030.00021.00260.00580.0022-0.00691.00060.00130.0011-0.00181.00050.00180.0016-0.00210.9973-0.0055-0.00180.0067-0.9992-0.0019-0.00120.0023-0.0001-0.9985-0.00160.0016-0.0007-0.00181.00000.00200.00070.00251.0015-0.00260.00090.00410.00290.99500.00370.00740.00230.9908-0.00000.00280.00250.99735.2空调系统故障诊断的RBF网络建立空调系统故障诊断的RBF网络建立空调系统故障模式及故障机制分析如表5-1所示RBF网络主要包含隐含层和输出层,其中隐含层的传递函数为radas,输出层的传递函数为纯线性函数purelin。RBF网络的隐含层有S1个神经元,输出层有S2个神经元.RBF网络的向量参数的选取与训练其完成如下非线性映射:其中,是输入矢量,是一个的非线性函数,一般取高斯型函数RBF神经网络中待定的参数有两类:一类是基函数的中心ci和宽度i以及中心数目n,RBF神经网络的非线性映射能力表达在隐层基函数上,其特性主要由基函数的中心确定;另一类为输出层与隐层之间的连接权重。当基函数中心ci和宽度以及数目n确定之后,网络输出对输出层权参数是线性的,可以采用最小二乘法求得。因此ci,i,n确实定是建立RBF神经网络的关键。经过计算,得到:表5-4测试结果2样本序号1234故障模式x1x2x3x41000010000100001故障原因y1y2y3y4y5y6y7y8y9y10y11y120.9999-0.0000-0.00020.00021.00260.00580.0012-0.00691.00060.00130.0011-0.00181.00050.00180.0016-0.00210.9973-0.0055-0.00180.0067-0.9992-0.0019-0.00110.0023-0.0001-0.9985-0.00160.0016-0.0008-0.00181.00000.00200.00070.00251.0014-0.00260.00090.00400.00290.99500.00370.00740.00230.9901-0.00000.00270.00240.99775.3小结由此可见,与相同的样本数和精度要求下,RBF神经网络的隐层神经元数要大大多于BP网络,这表达在网络的复杂度要高于BP网络。传统的信息处理方法不同,人工神经网络是自适应和可以被训练的,它有自修改能力,同时有对信息并行处理及并行推理的能力,从原理上就比传统的方法要快得多,并且具有高度的非线性、模拟并行性、高度容错性、鲁棒性、自联想自学习和自适应等许多特点。因此,把人工神经网络对故障预测技术引入,只需建立神经网络模型统计一些东西就可以轻松预测出空调故障的位置,大大缩短了空调维修的时间。在理论上.RBF网络和BP网络一样能以任意精度逼近任何非线性函数。但由于它们使用的鼓励函数不同,其逼近性能也不相同。Poggio和Girosi已经证明,RBF网络是连续函数的最正确逼近,而BP网络不是。BP网络使用的Sigmoid函数具有全局特性,它在输入值的很大范围内每个节点都对输出值产生影响,并且鼓励函数在输入值的很大范围内相互重叠,因而相互影响,因此BP网络训练过程很长。此外,由于BP算法的固有特性,BP网络容易陷入局部极小的问题不可能从根本上防止,并且BP网络隐层节点数目确实定依赖于经验和试凑,很难得到最优网络。采用局部鼓励函数的RBF网络在很大程度上克服了上述缺点,RBF不仅有良好的泛化能力,而且对于每个输入值,只有很少几个节点具有非零鼓励值,因此只需很少局部节点及权值改变。学习速度可以比通常的BP算法提高上千倍,容易适应新数据,其隐层节点的数目也在训练过程中确定,并且其收敛性也较BP网络易于保证,因此可以得到最优解[[10]智会强,牛坤,[10]智会强,牛坤,田亮等.BP网络和RBF网络在函数逼近领域内的比拟研究[J].科技通报,2005(2).[11]刘永,张立毅.BP网络与RFB神经网络的实现及其性能比拟[J].电子测量技术研究设计,2007(4):77~80.从上面所示的结果来看,主要有一下几方面的不同:〔1〕由于学习速率是固定的,因此BP网络的训练过程较长,当需要处理较复杂的问题时,需要的时间很长。而RBF网络的建网过程即是训练过程此外,训练时间较少.精度也比拟高。〔2〕在处理同一问题时,通常情况BP网络所需的神经元个数比RBF网络要少。〔3〕BP网络的输出和初始的权值有关,而RBF网络的输出与初始的权值无关。〔4〕RBP网络隐含层的层数和单元数的选择要凭借经验反复验证,因此网络的冗余性比拟大。RBF隐层节点的数目也在训练过程中确定。但是要确定径向基函数的分布密度。隐层基函数的中心是在输入样本集中选取的,这在许多情况下难以反映出系统真正的输入输出关系,并且初始中心点数太多;另外优选过程会出现数据病态现象。6.结论6.1结论人工神经网络近来越来越受到人们的关注,因为它为解决大复杂度问题提供了一种相对来说比拟有效的简单方法。可以通过神经网络对事物进行预测从而用简单的方法完成复杂的问题。神经网络可以很容易的解决具有上百个参数的问题〔当然实际生物体中存在的神经网络要比我们这里所说的程序模拟的神经网络要复杂的多〕。神经网络常用于两类问题:分类和回归。在结构上,可以把一个神经网络划分为输入层、输出层和隐含层。输入层的每个节点对应一个个的预测变量。输出层的节点对应目标变量,可有多个。在输入层和输出层之间是隐含层,隐含层的层数和每层节点的个数决定了神经网络的复杂度。人工神经网络的构筑理念是受到生物〔人或其他动物〕神经网络功能的运作启发而产生的。人工神经网络通常是通过一个基于数学统计学类型的学习方法〔LearningMethod〕得以优化,所以人工神经网络也是数学统计学方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论