006第6章新型控制策略

上传人：顺*** IP属地：广东上传时间：2024-01-23 格式：PPT 页数：76 大小：414KB 积分：15 举报 版权申诉

已阅读5页，还剩71页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第6章新型控制战略为什么提出新型控制战略？一方面，以PID为中心的传统控制方式是一种基于被控对象的准确数学模型的控制方式。另一方面，随着工业消费的飞速开展，被控对象越来越复杂，难以用准确的数学模型描画。显然，传统控制技术难以处理上述现实问题。因此，提出新型控制战略。本部分主要引见模糊控制技术、神经网络控制技术、预测控制、最优控制、自顺应控制等智能控制或先进控制技术，用来处理那些运用传统控制方法难以处理的复杂对象、复杂环境、复杂义务的控制问题。我们主要引见神经网络控制技术：神经网络的实际根底，典型神经网络，神经网络控制。6.1神经网络的实际根底人工神经网络(简称神经网络，artificialNeuralNetwork)是相对于生物学中所说的生物神经网络系统而言的。提出的目的就在于用一定的简单数学模型来对生物神经网络构造进展描画，并在一定的算法指点前提下，使其能在某种程度上模拟生物神经网络所具有的智能行为，处理用传统算法所不能胜任的智能信息处置问题。神经网络控制是将神经网络与控制实际相结合而开展起来的智能控制方法。它已成为智能控制的一个新的分支，为处理复杂的非线性、不确定、不确知系统的控制问题开辟了新途径。6.1.1神经网络开展简史神经网络研讨始于1943年，至今曾阅历了50多年的漫长历程，并且不是从一开场就遭到广泛关注的，而是阅历了一条从兴起到萧条，又从萧条到兴盛的曲折开展道路。详细说来，大致可为以下4个阶段：2.低潮期〔1969-1982年〕受当时神经网络实际研讨程度的限制，加之遭到冯·诺依曼式计算机开展的冲击等要素的影响，神经网络的研讨堕入低谷。但在美、日等国仍有少数学者继续着网络模型和学习算法的研讨，提出了许多有意义的实际和方法。例如，1969年，Grossberg提出了至今为止最复杂的ART神经网络。1972年，Kohonen提出了自组织映射的SOM模型。3．复兴期〔1982-1986年〕1982年，物理学家Hopfield提出了Hopfield神经网络模型，该模型经过引入能量函数，实现了问题优化求解，1984年他用此模型胜利地处理了游览商途径优化问题(TSP)。这一成果的获得使神经网络的研讨获得了突破性进展。1986年，在Rumelhart和McCelland提出了一种著名的多层神经网络模型，即BP网络，该网络是迄今为止运用最普遍的神经网络。4．高潮时期(1986年至如今)神经网络从实际走向运用领域，出现了神经网络芯片和神经计算机。神经网络逐渐在方式识别与图像处置(语音、指纹、缺点检测和图像紧缩等)、控制与优化、预测与管理(市场预测、风险分析)、通讯等领域得到胜利的运用。6.1.2神经网络原理单个〔生物〕神经元模型的表示图如以下图所示。人脑大约包含1012个神经元，分成约1000种类型，每个神经元与102-104个其他神经元相衔接，构成极为错综复杂而又灵敏多变的神经网络。每个神经元虽然都非常简单，但是如此大量的神经元之间、如此复杂的衔接却可以演化出丰富多彩的行为方式。神经系统的根本构造是神经元〔神经细胞〕，它是处置人体内各部分之间信息传送的根本单元。每个神经元都由一个细胞体、一个衔接其他神经元的轴突和一些向外伸出的较短分支——树突组成。轴突的功能是将本神经元的输出信号〔兴奋〕传送给别的神经元，其末端的许多神经末梢使得兴奋可以同时传送给多个神经元。树突的功能是接纳来自其他神经元的兴奋。神经元细胞体将接纳到的一切信号进展简单的处置，由轴突输出。神经元的轴突与另外神经元相连的部分称为突触。神经元由4部分构成：(1)细胞体(主体部分)：包括细胞质、细胞膜和细胞核；(2)树突：用于为细胞体传入信息；(3)轴突：为细胞体传出信息，其末端是神经末梢，含传送信息的化学物质；(4)突触：是神经元之间的接口(104一105个每神经元)。一个神经元经过其轴突的神经未梢，经突触与另外一个神经元的树突衔接，以实现信息的传送。由于突触的信息传送特性是可变的，随着神经激动传送方式的变化，传送作用强弱不同，构成了神经元之间衔接的柔性，称为构造的可塑性。神经元具有如下功能：(1)兴奋与抑制：假设传入神经元的激动经整合后使细胞膜电位升高，超越动作电位的阈值时即为兴奋形状，产生神经激动，由轴突经神经未梢传出。假设传入神经元的激动经整合后使细胞膜电位降低，低于动作电位的阈值时即为抑制形状，不产生神经激动。(2)学习与遗忘：由于神经元构造的可塑性，突触的传送作用可加强和减弱，因此，神经元具有学习与遗忘的功能。决议生物神经网络性能的3大要素为：(1)神经元(信息处置单元)的特性；(2)神经元之间相互衔接的方式-----拓扑构造；(3)为顺应环境而改善性能的学习规那么。人工神经网络是以工程技术手段来模拟人脑神经元网络的构造与特征的系统。利用人工神经元可以构成各种不同拓扑构造的神经网络。它是生物神经网络的一种模拟和近似，具有学习、识别、控制等功能。就神经网络的主要衔接方式而言，目前已有数十种不同的神经网络模型，其中，前馈型网络和反响型网络是两种典型的构造〔模型〕。〔人工〕神经网络的研讨主要分为3个方面的内容，即神经网络模型、神经网络构造和神经网络学习算法。6.1.3神经网络的构造分类根据神经网络的衔接方式，神经网络主要分为2类。前馈网络图6-2前馈型神经网络如图6-2所示，神经元分层陈列，组成输入层、隐含层和输出层。每一层的神经元只接受前一层神经元的输入。输入方式经过各层的依次变换后，由输出层输出。在各神经元之间不存在反响。感知器和误差反向传播网络采用前向网络方式。2.反响网络图6-3反响型神经网络网络构造如图6-3所示，该网络构造在输出层到输入层存在反响，即每一个输入节点都有能够接受来自外部的输入和来自输出神经元的反响。这种神经网络是一种反响动力学系统，它需求任务—段时间才干到达稳定。网络构造如图6-3所示，该网络构造在输出层到输入层存在反响，即每一个输入节点都有能够接受来自外部的输入和来自输出神经元的反响。这种神经网络是一种反响动力学系统，它需求任务—段时间才干到达稳定。Hopfield神经网络是反响网络中最简单且运用最广泛的模型，它具有联想记忆的功能，假设将Lyapunov函数定义为寻优函数，Hopfield神经网络还可以处理寻忧问题。6.1.4神经网络学习算法神经网络学习算法是神经网络智能特性的重要标志，神经网络经过学习算法，实现了自顺应、自组织和自学习的才干。目前神经网络的学习算法有多种，按有无导师分类，可分为有导师学习(SupervisedLearning)、无导师学习(UnsupervisedLearning)和再励学习(ReinforcementLearning)等几大类。在有导师的学习方式中，网络的输出和期望的输出(即导师信号)进展比较，然后根据两者之间的差别调整网络的权值，最终使差别变小，如图6-5所示。在无导帅的学习方式中，输入方式进入网络后，网络按照一种预先设定的规那么(如竞争规那么)自动调整权值，使网络最终具有方式分类等功能，如图6-6所示。再励学习是介于上述两者之间的一种学习方式。下面引见两个根本的神经网络学习算法。Hebb学习规那么Hebb学习规那么是一种联想式学习算法。生物学家D.O.Hebbian基于对生物学和心思学的研讨，以为两个神经元同时处于激发形状时，它们之间的衔接强度将得到加强，这一论述的数学描画被称为Hebb学习规那么，即Hebb学习规那么是一种无导师的学习方法，它只根据神经元衔接间的激活程度改动权值，因此，这种方法又称为相关学习或并联学习。假设误差准那么函数为6.1.5神经网络的特征及要素1．神经网络特征神经网络具有以下几个特征：(1)非线性映射逼近才干〔能逼近恣意非线性函数〕：已有实际证明，恣意的延续非线性函数映射关系都可由某一多层神经网络以恣意精度加以逼近。这种组成单元简单、构造有序的模型是非线性系统建模的有效框架模型，预示着神经网络在具有挑战性的非线性控制领域有很好的运用前景。(2)信息的并行分布式综合优化处置才干〔信息的并行分布式处置与存储〕：神经网络的大规模互连网络构造，使其能很快地并行实现全局性的实时信息处置，并很好地协调多种输入信息之间的关系，兼容定性和定量信息，这是传统的串联任务方式所无法到达的效果，非常适宜于系统控制中的大规模实时计算。同时，某些神经网络模型本身就具有自动搜索能量函数极值点的功能。这种优化计算才干在自顺应控制设计中是非常有用的。(3)高强的容错才干：神经网络的并行处置机制及冗余构造特性使其具有较强的容错特性,提高了信息处置的可靠性和鲁棒性。(4)对学习结果的泛化和自顺应才干〔能进展学习，以顺应环境的变化〕：经过适当训练的神经网络具有潜在的自顺应方式匹配功能，能对所学信息加以分布式存储和泛化，这是其智能特性的重要表达。(5)便于集成实现和计算模拟：神经网络在构造上是一样神经元的大规模组合，所以特别适宜于用大规模集成电路实现，也适宜于用现有计算技术进展模拟实现。但由于现有的计算机运算方式与神经网络所要求的并行运算和分布存储方式是截然不同的，所以两者在运算时间上必然存在着显著差别。2．神经网络具有以下3个要素：(1)神经元(信息处置单元)的特性；(2)神经元之间相互衔接的拓扑构造；(3)为顺应环境而改善性能的学习规那么。6.1.6神经网络的研讨领域1．基于神经网络的系统辨识(1)将神经网络作为被辩识系统的模型，可在知常规模型构造的情况下，估计模型的参数。(2)利用神经网络的线性、非线性特性，可建立线性、非线性系统的静态、动态、逆动态及预测模型，实现系统的建模和辨识。2．神经网络控制器神经网络作为控制器，可对不确定、不确知系统及扰动进展有效的控制，使控制系统到达所要求的动态、静态特性。3．神经网络与其他算法相结合将神经网络与专家系统、模糊逻辑、遗传算法等相结合，可设计新型智能控制系统。4．优化计算在常规的控制系统中，常遇到求解约束优化问题，神经网络为这类问题的处理提供了有效的途径。目前，神经网络控制曾经在多种控制构造中得到运用，如PID控制、模型参考自顺应控制、前馈反响控制、内模控制、预测控制、模糊控制等。6.2典型神经网络6.2.1单神经元网络图6-7神经元构造模型右图是一种简化的人工神经元构造模型，它是一个多输入、单输出的非线性元件，其输入、输出关系可描画为上述方式。输出鼓励函数f(·)又称为变换函数，它决议该神经元的输出。常用的神经元鼓励函数有以下3种。阈值型阈值型函数如图6-8所示。图6-8阈值型函数2．分段线性型分段线性型函数表达式为图6-9分段线性型函数3.函数型有代表性的有Sigmoid型和高斯型函数。Sigmoid型函数表达式为图6-10Sigmoid型函数6.2.2BP神经网络1986年，Rumelhart等提出了误差反向传播神经网络，简称BP网络(BackPropagation)，该网络是一种单向传播的多层前向网络。误差反向传播的学习算法简称BP算法，其根本思想是梯度下降法。它采用梯度搜索技术，以期使网络的实践输出值与期望输出值的误差均方值为最小。2.BP网络构造图6-11BP神经网络构造3．BP网络的逼近图6-12BP神经网络逼近用于逼近的BP网络如图6-13所示。图6-13用于逼近的BP网络BP算法的学习过程由正向传播和反向传播组成。在正向传播过程中，输入信息从输入层经隐层逐层处置，并传向输出层，每层神经元(节点)的形状只影响下一层神经元的形状。假设在输出层不能得到期望的输出，那么转至反向传播，将误差信号(理想输出与实践输出之差)按衔接通路反向计算，由梯度下降法调整各层神经元的权值，使误差信号减小。(1)正向传播：计算网络的输出。(2)反向传播：采用学习算法，调整各层间的权值。(1)正向传播：计算网络的输出。隐层神经元的输入为一切输入的加权之和，即隐层神经元的输出采用S函数激发，得

那么输出层神经元的输出为误差性能目的函数为网络输出与理想输出误差为(2)反向传播：采用学习算法，调整各层间的权值。根据梯度下降法，权值的学习算法如下：输出层及隐层的衔接权值学习算法为式中，为学习速率，。k十1时辰网络的权值为隐层及输入层衔接权值学习算法为式中，。问题:如何调整权值W，使E最小。可用梯度下降法来求解，其根本思想是沿E的负梯度方向不断修正权值，直到E到达最小。k十1时辰网络的权值为为厂防止权值的学习过程发生振荡、收敛速度慢，需求思索上次权值变化对本次权值变化的影响，即参与动量因子。此时的权值为式中，为动量因子，。4.BP网络逼近仿真实例运用BP网络逼近对象图6-14BP网络逼近效果图6-15BP网络逼近误差图6-16Jacobian信息的辩识5.BP网络的忧缺陷BP网络的优点：1.只需有足够多的隐层和隐层节点，BP网络可以逼近恣意的非线性映射关系；由于BP网络具有很好的逼近非线性映射的才干，该网络在方式识别、图像处置、系统辨识、函数拟合、优化计算、最优预测和自顺应控制等领域有着较为广泛的运用。2.BP网络的学习算法属于全局逼近算法，具有较强的泛化才干，可用于神经网络控制器的设计。3.BP网络输入输出之间的关联信息分布地存储在网络的衔接权中，个别神经元的损坏只对输入输出关系有较小的影响，因此BP网络具有较好的容错性。BP网络的主要缺陷为：1.待寻优的参数多，收敛速度慢；难以顺应实时控制的要求。2.目的函数存在多个极值点，按梯度下降法进展学习，很容易堕入部分极小值；3.难以确定隐层及隐层节点的数目。目前，如何根据特定的问题来确定详细的网络构造尚无很好的方法，仍需根据阅历来试凑。6.BP网络方式识别由于神经网络具有自学习、自组织和并行处置等特征，并具有很强的容错才干和联想才干，因此，神经网络具有方式识别的才干。在神经网络方式识别中，根据规范的输入输出方式对，采用神经网络学习算法，以规范的方式作为学习样本进展训练，经过学习调整神经网络的衔接权值。当训练满足要求后，得到的神经网络权值构成了方式识别的知识库，利用神经网络并行推理算法便可对所需求的输入方式进展识别。神经网络方式识别具有较强的鲁棒性。当待识别的输入方式与训练样本中的某个输入方式一样时，神经网络识别的结果就是与训练样本中相对应的输出方式。当待识别的输入方式与训练样本中一切输入方式都不完全一样时，那么可得到与其相近样本相对应的输出方式。当待识别的输入方式与训练样本中一切输入方式相差较远时，就不能得到正确的识别结果，此时可将这一方式作为新的样本进展训练，使神经网络获取新的知识，并存储到网络的权值矩阵中，从而加强网络的识别才干。BP网络的训练过程如下：正向传播是输入信号从输入层经隐层传向输出层，假设输出层得到了期望的输出，那么学习算法终了；否那么，转至反向传播。以第p个样本为例，用于训练的BP网络构造如图6-17所示。图6-17BP神经网络构造网络的学习算法如下：(1)正向传播：计算网络的输出。(2)反向传播：采用梯度下降法，调整各层间的权值。(1)正向传播：计算网络的输出。隐层神经元的输入为一切输入的加权之和，即隐层神经元的输出采用S函数激发，得那么输出层神经元的输出为(2)反向传播：采用梯度下降法，调整各层间的权值。权值的学习算法如下输出层及隐层的衔接权值学习算法为式中，为学习速率，。k十1时辰网络的权值为隐层及输入层衔接权值学习算法为式中，。k十1时辰网络的权值为为厂防止权值的学习过程发生振荡、收敛速度模，需求思索上次权值变化对本次权值变化的影响，即参与动量因子。此时的权值为式中，为动量因子，。7.BP网络方式识别仿真实例取规范样本为三输入两输出样本，见表6-1。表6-1训练样本BP网络方式识别程序包括网络训练程序chap6-2a.m和网络测试程序chap6-2b.m。运转程序chap6-2a.m，取网络训练的最终目的为E=10-20，网络训练目的的变化如图6-18所示。将网络训练的最终权值为用于方式识别的知识库，将其保管在文件wfile.mat中。表6-2测试样本及结果图6-18样本训练的收敛过程6.3神经网络控制控制实际在阅历了经典控制和现代控制以后，随着被控对象变得越来越复杂、对对象和环境的知识知道得越来越少、控制精度越来越高，迫切希望控制系统具有自顺应自学习才干、良好的鲁棒性和实时性。6.3.1概述神经网络是一种具有高度非线性的延续时间动力系统，它有着很强的自学习才干和对非线性系统的强大映射才干。神经网络所具有的大规模并行性、冗余性、容错性、本质的非线性及自组织、自学习、自顺应才干，使其广泛运用于复杂对象的控制中。神经网络本身具备传统的控制手段无法实现的一些优点和特征，使得神经网络控制器的研讨迅速开展。从控制角度来看，神经网络用于控制优越性主要表现为：(1)神经网络能处置那些难以用模型或规那么描画的对象；(2)神经网络采用并行分布式信息处置方式，具有很强的容错性；(3)神经网络在本质上是非线性系统，可以实现恣意非线性映射，神经网络在非线性控制系统中具有很大的开展出路；(4)神经网络具有很强的信息综合才干，它可以同时处置大量不同类型的输入，可以很好地处理输入信息之间的互补性和冗余性问题；(5)神经网络的硬件实现愈趋方便，大规模集成电路技术的开展为神经网络的硬件实现提供了技术手段，为神经网络在控制中的运用开辟了宽广的前景。神经网络控制所获得的进展为：(1)基于神经网络的系统辨识：可在己知常规模型构造的情况下，估计模型的参数；或利用神经网络的线性、非线性特性，建立线性、非线性系统的静态、动态、逆动态及预测模型。(2)神经网络控制器：神经网络作为控制器，可实现对不确定系统或未知系统进展有效的控制，使控制系统到达所要求的动态、静态特性。(3)神经网络与其他算法相结合：神经网络与专家系统、模糊逻辑、遗传算法等相结合可构成新型控制器。(4)优化计算：在常规控制系统的设计中，常遇到求解约束优化问题，神经网络为这类问题提供了有效的途径。(5)控制系统的缺点诊断：利用神经网络的逼近特性，可对控制系统的各种缺点进展方式识别，从而实现控制系统的缺点诊断。神经网络控制在实际和实际上，以下问题是研讨的重点：(1)神经网络的稳定性与收敛性问题；(2)神经网络控制系统的稳定性与收敛性问题；(3)神经网络学习算法的实时性；(4)神经网络控制器和辨识器的模型和构造。

6.3.2神经网络控制的构造根据神经网络在控制器中的作用不同，神经网络控制器可分为两类：一类为神经控制，它是以神经网络为根底而构成的独立智能控制系统；另一类为混合神经网络控制，它是指利用神经网络学习和优化才干来改善传统控制的智能控制方法，目前神经网络控制器尚无一致的分类方法。综合目前的各种分类方法，可将神经网络控制的构造归结为以下7类。1.神经网络监视控制首先对人工控制或传统控制进展学习，然后用神经网络控制器逐渐取代传统控制器的方法，称为神经网络监视控制。神经网络监视控制的构造如图6-19所示。图6-19神经网络监视控制在监视控制系统中，神经网络需求脱机进展训练。训练时采用一系列示教数据。这些数据是执行人工控制时的输入、输出数据。输入数据普通是传感器所检测出的数据，输出数据那么是人所确定的数据。也就是说，神经网络的学习是执行传感输入到人工控制造用的映射。2.神经网络直接逆控制神经网络直接逆控制就是将被控对象的神经网络逆模型直接与被控对象串联起来，以便使期望输出与对象实践输出之间的传送函数为1。那么将此网络作为前馈控制器后，被控对象的输出为期望输出。在逆控制系统中，假设被控对象的模型用F表示，那么，神经网络所构成的控制器的模型是F-1，即是一个逆模型。实践上，被控对象可以是一个未知的系统，在被控对象输入端参与u*，那么其输出就会产生y*。用y*作为输入，u*作为输出去对神经网络进展训练，那么得到的神经网络就是被控对象的逆模型。在训练时，神经网络的实践输出用u’表示，那么用〔u’-u*〕这个偏向可以控制网络的训练过程。普通来说，为了获取良好的逆动力学性能，通常在训练神经网络时所取值的范围比实践对象的输入、输出数据的取值范围要大一些。在逆控制系统中，神经网络直接连在控制回路作为控制器，控制效果严重地依赖控制器对对象逆向模拟的真实程度〔逆控制的可用性在相当程度上取决于逆模型的准确精度〕。由于这种系统短少反响环节，

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

006第6章新型控制策略

文档简介

温馨提示

最新文档

评论

006第6章新型控制策略

文档简介

温馨提示

最新文档

评论

相关文档