




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、摘 要最优控制,又称无穷维最优化或动态最优化,是现代控制理论的最基本,最核心的部分。它所研究的中心问题是:如何根据受控系统的动态特性,去选择控制规律,才能使得系统按照一定的技术要求进行运转,并使得描述系统性能或品质的某个“指标”在一定的意义下达到最优值。最优控制问题有四个关键点:受控对象为动态系统;初始与终端条件(时间和状态);性能指标以及容许控制。 一个典型的最优控制问题描述如下:被控系统的状态方程和初始条件给定,同时给定目标函数。然后寻找一个可行的控制方法使系统从输出状态过渡到目标状态,并达到最优的性能指标。系统最优性能指标和品质在特定条件下的最优值是以泛函极值的形式来表示。因此求解最优控
2、制问题归结为求具有约束条件的泛函极值问题,属于变分学范畴。变分法、最大值原理(最小值原理)和动态规划是最优控制理论的基本内容和常用方法。庞特里亚金极大值原理、贝尔曼动态规划以及卡尔曼线性二次型最优控制是在约束条件下获得最优解的三个强有力的工具,应用于大部分最优控制问题。尤其是线性二次型最优控制,因为其在数学上和工程上实现简单,故其有很大的工程实用价值。关键词:最优控制; 控制规律; 最优性能指标; 线性二次型abstract the optimal control, also called dynamic optimization or infinite dimension, optimiza
3、tion of modern control theory, the most basic part of the core. it is the center of the research question: how to control system based on the dynamic characteristics, to choose, can control system according to certain technical requirements, and makes the operation performance of the system or the q
4、uality of describing a "index" in certain significance to achieve optimal value. the optimal control problem has four points for dynamic systems, controlled, the initial and terminal conditions (state) and, performance index and allow control.a typical of optimal control problem is describ
5、ed as follows: the state equation and initial conditions are given, and given the objective function. then a feasible method for the control system of the output state transition to the target state and optimum performance. the optimal performance index and quality in the specific conditions of the
6、optimal value is functional form. therefore solution of optimal control problem is due to the constraint condition of functional, belongs to the category of variational learning. the variational method, the maximum principle (minimum principle) and dynamic planning is the optimal control theory, the
7、 basic contents and methods. the pontryagin maximum principle, behrman dynamic programming and kaman linear quadratic optimal control is obtained in the constraint condition of the optimal solution of the three powerful tools, used in the most optimal control problem. especially the linear quadratic
8、 optimal control, because its in mathematics and engineering implementation is simple, so it has great practical value.key words: the optimal control, control rule, optimal performance indicators, the linear quadratic一 绪论1.1背景和意义要求将最优控制问题典型解决方法变分法、极值原理和动态规划及其在时间最短控制问题的应用和线性二次型最优控制问题(包括线性二次型实验及仿真结果)作
9、为主要内容。其中有关线性二次型的实验要利用matlab软件建立数学模型及仿真并作对结果一定的分析。通过理论与实践操作加深对最优控制这门课程的理解,使之能应用于以后的学习和工作。1.2主要内容 现代控制理论是在经典控制理论基础上逐步发展起来的。其基本内容包括:线性系统的状态空间理论,最优估计与最优滤波、最优控制理论,系统辨识理论、鲁棒控制、自适应控制。它以状态空间法为基础,研究多输入多输出、变参数、非线性、高精度、高效能等控制系统的分析与设计问题。我们这个学期学习的是现代控制理论中一个重要核心部分:最优控制。在上个世纪50年代初期,就出现了最短时间控制问题研究的论文,为最优控制理论的应用提供了第
10、一批模型。实际上,任何问题都存在优化问题。优化问题可以分成两大类:参数最优化问题和最优控制问题。参数最优化问题也称为静态最优化问题,它可以被抽象为在各种约束条件下的函数求极值的问题。最优控制问题又称为动态最优化问题,它可以被数学抽象为在各种约束条件下泛函求极值的问题。泛函求极值世纪上就是变分问题。经典变分法只能解决一类简单的最优控制问题,因为它只适于研究不带闭域约束而且数学模型要具有足够的可微性的场合。但实际问题往往具有闭域约束,而且往往不具备所需的可微性。这样,就需要探索新的理论和新的方法,以便求解各种实际的最优控制问题。在这些新的方法中,苏联学者庞德里亚金与20世纪50年代提出的“最大值原
11、理”和美国学者贝尔曼与同一时期提出的“动态规划”具有特别重要的意义。这两种方法从不同的角度发展了经典变分学,完善了最优控制理论,推动了最优控制理论的实际应用。卡尔曼在60年代初提出和解决的线性系统在二次型性能指标下的最优控制问题,可以构成最优闭环反馈系统,在工程上实用价值很大。二 线性二次型最优控制2.1 线性二次型问题概述线性二次型最优控制问题,也叫lq问题。它是指线性系统具有二次型性能指标的最优控制问题。线性二次型问题所得到的最优控制规律是状态变量的反馈形式,便于计算和工程实现。它能兼顾系统性能指标的多方面因素。例如快速性、能量消耗、终端准确性、灵敏度和稳定性等。线性二次型最优控制目标是使
12、性能指标j取得极小值, 其实质是用不大的控制来保持比较小的误差,从而达到所用能量和误差综合最优的目的。2.2 线性二次型问题的提法 给定线性时变系统的状态方程和输出方程如下: (2.2.1) 是维状态变量,是维控制变量,是维输出变量,是时变矩阵,是时变矩阵。假设,不受约束。若表示预期输出变量,它是维向量,则有 称为误差向量。现在的问题是,选择最优控制使下列二次型性能指标(2.2.2)为最小,这就是线性二次型最优控制问题。(其中是半正定对称常数矩阵,是半正定对称时变矩阵,是正定对称时变矩阵,终端时间是固定的,终端状态自由。2.3 二次型性能指标及其涵义 (1)终端代价(限制终端误差):(2)过程
13、代价(限制控制过程误差):(3)控制代价(限制控制u(t)的幅值及平滑性):2.4线性二次型最优控制问题的几种特殊情况 2.4.1状态调节器问题: 若(单位矩阵),=0,则 。于是性能指标变为 则问题归结为:用不大的控制能量,使系统状态保持在零值附近,因而称为状态调节器问题。2.4.1.1有限时间状态调节器 是给定的终端时刻,是自由的终端状态,控制函数不受约束。要求确定最优控制函数,使性能指标达到最小值。 系统状态方程: 初始条件 x(t0)=x0性能指标则最优控制存在且唯一,最优控制的充要条件是:其中p(t)是矩阵黎卡提微分方程: 满足边界条件 的唯一对称解。并且,当q为半正定对称矩阵时,p
14、(t)(t0£t£tf)是半正定对称矩阵;而当q为正定对称矩阵时,p(t)是正定对称矩阵。状态最优轨线是下列状态方程 满足初始条件x(t0)=x0的解。则性能指标的最小值为2.4.1.2无限时间状态调节器终端时刻 tf 为无限值,终端状态x(¥)=0,u(t)不受约束,要求确定最优调节作用u*(t),使性能指标达到最小值。线性定常系统的状态方程和初始条件:(a,b为定常矩阵,系统(a,b)完全可控)性能指标: (q,r是定常对称正定矩阵)使性能指标j达到最小值的最优调节作用为:;是矩阵黎卡提代数方程 的唯一正定对称解。则性能指标的最小值为 2.4.2输出调节器问题
15、tf是有限的终端时刻,控制函数u(t)不受约束,系统是完全可观测的。要求确定最优调节作用u*(t),使性能指标达到最小值。其实质是用不大的控制能量,使输出变量y(t)保持在零值附近。 完全可观测的线性定常系统的状态方程和输出方程 性能指标 (q是定常半正定对称矩阵,r是定常正定对称矩阵)(当tf时,变成无限时间输出调节器) 2.4.3跟踪问题u(t)不受约束,要求确定最优控制u*(t),使性能指标达到最小值。这个问题的实质是,用不大的控制能量,使系统输出变量y(t)跟踪yr(t)的变化。完全可观测的线性定常系统的状态方程和输出方程 :性能指标:(当tf时,变成无限时间跟踪器)这时与无限时间的状
16、态调节问题完全类似,有 若系统(a,b,c)是完全可控和可观测的,则最优控制为 2.5基于matlab的线性二次型最优控制设计:2.5.1有限时间状态调节器问题的最优控制matlab仿真1)连续系统二次型最优控制的matlab函数:在matalab工具箱中,提供了求解连续系统二次型最优控制的函数lqr()、lqr2()、lqry()。其调用格式为:k,s,e=lqr(a,b,q,r,n)k,s=lqr2(a,b,q,r,n)k,s,e=lqy(sys,q,r,n)其中,a为系统的状态矩阵;b为系统的输出矩阵;q为给定的半正定实对称常数矩阵;r为给定的正定对称常数矩阵;n代表更一般化性能指标中交
17、叉先进乘积项的加权项矩阵;k为最优反馈增益矩阵;s为对应riccati方程的唯一正定解p;e为矩阵a-bk的特征值。其中,lqry()函数用于求解二次型状态调节器的特例,是用输出反馈代替状态反馈,即其性能指标为: 。 这种二次型输出控制叫作次优控制。此外,上述问题要求有解,必须满足三个条件:(1) a,b是稳定的;(2) 且;(3) 在虚轴上不是非能观模式。当上述条件不满足时,则二次型最优控制无解,函数会显示警告信号。 2)实验内容:训练连续系统线性二次型最优控制的matlab 实现,操作和解题训练实验系统。实验系统如下:(1) (2)3)实验任务:(1)就实验实例,求出最优控制率,并用mat
18、lab编写好相应的仿真实验程序。(2)改变性能函数中的各项加权系数值,分析其对系统性能的影响。(3)在不同的权植下绘制系统的阶跃响应曲线,并根据曲线定性分析仿真结果。(4)分析仿真对象的仿真结果。4)实验结果及分析:(1)实验1:依题意有 a=0 00 1, b=10,当q=0,r=1时运行a=0 0;0 1; b=1;0;q=0 0;0 1; r=1;k,p,e=lqr(a,b,q,r)有如下结果: ? error using => lti.lqrthe plant model cannot be stabilized by feedback or the optimal design
19、problem is ill posed. 可见系统不可控,所以不能求出最优控制律。(2) 实验二:依题意有a=0 1 00 0 1-1 -4 -6,b=001,c=1 0 0>> a=0 1 0;0 0 1;-1 -4 -6;b=0;0;1;c=1 0 0;q=1 0 0;0 1 0;0 0 1;r=1;n=1;1;1;k,s,e=lqr(a,b,q,r,n)warning: the matrix q n;n' r should be positive semi-definite.> in lti.lqr at 87 in lqr at 40k = 1.000000
20、00000000 1.20752693268247 1.02958418865333s = 1.41505386536495 1.05916837730667 0.00000000000000 1.05916837730667 2.60674898797111 0.20752693268247 0.00000000000000 0.20752693268247 0.02958418865333e =-6.24725927987360 -0.39116245438986 + 0.40881820006912i -0.39116245438986 - 0.40881820006912i >&
21、gt; a=0 1 0;0 0 1;-1 -4 -6;b=0;0;1;q=0 0 0;0 0.5 0;0 0 0.5;r=1;n=1;1;1;k,s,e=lqr(a,b,q,r,n)warning: the matrix q n;n' r should be positive semi-definite.> in lti.lqr at 87 in lqr at 40k = 0.73205080756888 0.74305016090403 0.92720003477654s = -0.78479613846649 -1.00173758557414 -0.267949192431
22、12 -1.00173758557414 -0.87599356800765 -0.25694983909597 -0.26794919243112 -0.25694983909597 -0.07279996522346e =-6.20813492974947 -0.35953255251354 + 0.38695388524292i -0.35953255251354 - 0.38695388524292ii.通过比较,得到系统的最优轨线为:图2-1ii.不同权值对相应影响:(1) q1=1 0 0;0 1 0;0 0 1;r1=5时a1=0 1 0;0 0 1;-1 -4 -6;b1=0;
23、0;1;c1=1 0 0;d1=0;q1=1 0 0;0 1 0;0 0 1;r1=5;k1,p1,e1=lqr(a1,b1,q1,r1);sys1=ss(a1-b1*k1,b1*k1,c1,d1); (2)q2=10 0 0;0 1 0;0 0 1;r2=5时a2=0 1 0;0 0 1;-1 -4 -6;b2=0;0;1;c2=1 0 0;d2=0;q2=10 0 0;0 1 0;0 0 1;r2=5;k2,p2,e2=lqr(a2,b2,q2,r2);sys2=ss(a2-b2*k2,b2*k2,c2,d2);subplot(2,1,1);step(sys1)title('ste
24、p response of quadratic optimal control system');gridxlabel('time1-');ylabel('output y1=x1')subplot(2,1,2);step(sys2)title('step response of quadratic optimal control system');gridxlabel('time2-');ylabel('output y2=x1')2)相应的响应曲线:(1)q1=1 0 0;0 1 0;0 0 1;r1=
25、5; 图2-2(2)q2=10 0 0;0 1 0;0 0 1;r2=5时 图2-3(3)q1=0.1 0 0;0 1 0;0 0 1 ,r1=0.1 图2-4(4)q1=0.1 0 0;0 1 0;0 0 1 ,r1=1 图2-5(3)结果分析:a. 从图中可以知道,由于q矩阵不同,系统输出响应有较大的差异,这是因为输出仅仅与x1有关,因此在指标中加大x1的权值,表示控制u对x1的作用增强,因 此 建立时间短。当然a1太大,系统的超调也增大,因此,不能无限制的增加a1来缩短输出建立的时间。br值越大,则响应的比例也降得越多。r是u的加权矩阵,r的值大表示其对u的限制作用越强。2.5.2无限时
26、间跟踪问题的最优控制matlab仿真1)实验内容 性能指标为:2)实验结果及分析:(1)实验结果: 依题意可得矩阵a=0 10 0,b=01,c=1 0,首先检查一下系统的可观性和可控性。运行程序可得:n = 2system is controlledsystem is no observable系统可控但是不可观。知道了系统可控之后我们就可以放心的作下一步工作了,即解riccati方程。运行a=0 1;0 0;b=0;1;c=1 0;d=0;q=1 0;0 1r=1;k,p,e=lqr(a,b,q,r) 得到k =1.0 1.7321把矩阵q改为q=100 00 1同样的可以得到k = 10
27、.0000 4.5826运行m文件t32可以得到最优轨线的图形,程序代码如下所示。a=0 1;0 0;b=0;1;c=1 0;d=0;q=1 0;0 1;r=1;k=1.0000 1.7321;sys=ss(a-b*k,eye(2),eye(2),eye(2);t=0:0.01:8;x=initial(sys,1;0,t);x1=1 0 *x'x2=0 1 *x'subplot(2,1,1);plot(t,x1)gridxlabel('t(sec)');ylabel('x1')subplot(2,1,2);plot(t,x2) gridxlabe
28、l('t(sec)');ylabel('x2')图2-6图2-7位于上面的那图是r=100时的阶跃图形,下面那张是r=0.01时的阶跃图形。很明显的有r较大时,响应比较慢,而且超调量大,这是因为r对控制律u的作用是限制作用,当它越大时,输出受限制也就多,输出响应就比较慢。但是按这来推测的话应该超调量要小才对,实验结果超调量也增大了,这点出乎我的意料,这也是我目前还没法解决的问题,希望老师能够给予指导。(2)实验结果分析:a图2-6表示的是保持r不变,改变q值。上图的q值较小,其响应时间更慢。所以可以看出权值越大对系统的控制作用就越强。b. 图2-7表示的是保持q
29、值不变,改变r值。上图的r值较大。可以得出结论:r较大时,系统响应比较慢,而且超调量大,这是因为r对控制律u的作用是限制作用,当它越大时,输出受限制也就多,输出响应就比较慢。2.6线性二次型最优控制在倒立摆系统中的应用2.6.1倒立摆系统与线性二次型倒立摆系统是非线性、强藕合、多变量和自然不稳定的系统. 在控制过程中, 它能有效的反映控制理论中诸如系统稳定性、可控性、鲁棒性、系统收敛速度、随动性以及跟踪等问题, 是检验各种控制理论的理想模型. 线性二次型最优控制(linear quadratic regulator lqr) 问题在现代控制理论中占有非常重要的位置. 由于线性二次型(lq) 性
30、能指标易于分析、处理和计算,而且通过线性二次型最优设计方法得到的控制系统具有较好的鲁棒性与动态特性等优点,线性二次型在控制界得到普遍重视. 通过倒立摆lqr 最优控制系统设计与研究,并从实时控制效果出发,找出系统的动态响应与加权阵q 和r 之间的变化规律,并用于指导实践.2.6.2倒立摆系统分析研究对象是单级直线倒立摆gip-100-l ,它是一个单输入多输出的4 阶控制系统。1) 倒立摆系统模型:对所研究特定倒立摆系统进行受力分析可以得到系统的状态空间表达式为: xx = 0100000000010029.40 xx+0103u y=x=10000010xx+00u2)倒立摆稳定性分析:小车
31、位移和摆杆角度都是发散的, 倒立摆系统不稳定。3倒立摆系统能控性分析:系统的能控性是控制器设计的前提. 由能控性矩阵m = b ab an-1 b ,在matlab 中利用可控性矩阵的ctrb 命令来计算,可以得出rank(m) = 4 ,可知系统可控,因此可以进行控制器的设计。2.6.3lqr 控制器设计: 1)二次型最优控制原理: 设给定线性定常系统的状态方程为: 二次型性能指标函数:最优控制规律: 矩阵黎卡提微分方程:则最优反馈增益矩阵:2)lqr参数:由matlab 语句k = lqr ( a , b , q , r) , 取q =diag (1 000 ,0 ,70 ,0) , 求得
32、k = - 31. 623 , 20. 151 ,72. 718 ,13. 155 ,即为lqr 控制器控制器参数。2.6.4系统仿真:2-8倒立摆系统输出 2-9倒立摆系统各点输出图 仿真结果分析:可以看出,系统能较好地跟踪阶跃信号,摆杆的超调量足够小,稳态误差、上升时间与调整时间也符合设计指标要求. 这时如果再增大q ,系统的响应还会有所改善,但是在保证q 足够小并兼顾其它响应指标时,系统响应已经能够满足要求了.2.6.5加权矩阵对系统动态性能的影响不同加权矩阵,都可以使性能指标达到最优;但是,加权矩阵选取的不同,将使最优控制系统具有不同的动态性能.1)加权矩阵q 的研究理论上, q 阵元素取值范围是(0 ,+ ),但受计算位长和计算时间的限制, 取值不可能到无穷大. q 通常是对角线常阵,对角阵上的元素分别表示对相应误差分量的重视程度. 越是被重视的,希望它越小,相应的加权系数就越大.在设计过程中始终保持r 阵不变, 取r = 1 ,讨论q 阵的选取对系统性能的影响:随着小车位置权重的增加,小车位移系统阶跃响应超调不断减小,上升时间和调整时间也逐渐加快. 与此同时,也引进了一些振荡.2)加权矩阵q 和r 关系的研究从降低控制
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广安市消防员考试笔试试题(含答案)
- 智能汽车油耗分析软件创新创业项目商业计划书
- 2025年新能源商用车辆市场需求与应用场景下的政策扶持与风险防范报告
- 2025年工业互联网平台边缘计算硬件架构产业投资策略研究报告
- 2025年工业互联网平台边缘计算硬件架构在智能机器人中的应用与优化报告
- 2025年物联网设备安全漏洞防护策略与技术方案报告
- 2025年社交媒体平台舆情监测与危机公关的社交媒体营销策略创新
- 2025年工业机器人柔性制造系统在电子信息设备回收与再利用中的应用优化研究报告
- 2025年广播影视行业融合发展的政策环境与产业风险防范策略研究
- 民法典知识义务培训课件
- 无人机操控与维护专业教学标准(中等职业教育)2025修订
- 企业运费管理制度
- 2025至2030年中国橄榄苦苷行业市场竞争态势及发展趋向研判报告
- (2025)党校入党积极分子培训结业考试题库与答案
- 合伙买货车合同协议书
- T/CECS 10400-2024固废基胶凝材料
- T/BMPA 0001-2023再生水供用双方协商价格行为指南
- 《电生理治疗室速失常》课件
- 2024年高级养老护理员职业鉴定考试题库大全-下(多选、判断题)
- 【班风学风】《走进高二筑梦高考》高二开学第一课主题班会
- 食品合规管理中级 课件 上篇 第二章 食品合规标法义务及监管
评论
0/150
提交评论