




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十二章第十二章 最优控制理论与动态最优化最优控制理论与动态最优化 动态最优化的问题, 在自然科学和社会科学的很多领域中有着十分广泛的应用。 在经济 学中, 尤其在博弈论和宏观经济学中有着大量的应用。 研究动态最优化的数学工具有好几种, 如变分法、动态规划和最优控制理论等。我们在第十章中简要地介绍过动态规划,但是没有 介绍它的最优化原理。在本章我们来介绍变分法、动态规划的最优化原理和最优控制,重点 是最优控制理论。最优控制理论是数学上一个独立的学科,包含的内容很丰富。在本章我们 只能简要地最优控制理论的框架和主要的结论:Bellman 最优化原理,庞得里亚金 (Pontryagin) 极大值原理及其在宏观经济学中的应用。 12.1 最优控制问题的定义和示例最优控制问题的定义和示例 先看几个例子: 例例 12.1 飞船在月球软着陆问题飞船在月球软着陆问题 宇宙飞船靠发动机产生的与月球重力相反的推力 u(t)来控制飞船实现软着陆(落到月球 表面时速度为零) 。设飞船质量为 m(t),高度为 h(t),垂直速度为 v(t)0,月球的重力加速度 为 g(常加速) ,飞船自身质量和所带燃料质量为 M 及 F,则根据物理和力学的原理,飞船 的运动方程为:h tv tm v tum gm tk u k( )( ),( ),( )(0) = 。将飞船的高度,速度 和质量这三个物理量及其导数作为分量合并成向量的形式如下: v t um g x t m k u ( ) ( ) = 其中, h t x tv t m t ( ) ( )( ) ( ) = (12.1) 现在,设飞船从下列的初始状态出发: 0 0 h 0h x 0v 0v m 0M+F ( ) ( )( ) ( ) = (12.2) 并要求在某一个时刻 t 实现软着陆,即 h t v t( )0,( )0= (12.3) 设发动机的最大推动力为 a,即 u ta0( ) (12.4) 我们的目标是要求在实现软着陆时使燃料的消耗最小,即要求着陆时,飞船质量为最大: max ( )( )J um t= (12.5) PDF 文件使用 pdfFactory Pro 试用版本创建 于是问题归结为:求满足约束条件(12.4)的 u(t) , 使动态系统(12.1)从初始状态(12.2) 转移到终值条件(12.3) ,并使“性能指标”J(u)为最大。 例例 12.2 生产计划问题生产计划问题. 某企业制定从 t0到T的时间间隔内的生产计划。要选择适当的生产速率,使得在t0,T 时间内,既能保证市场供应,又要使花费的成本最低。设 x(t)为产品的库存量,d(t)为产品 的市场需求量,d(t) 0,u(t)表示生产速率。则库存量 x(t) 满足方程: dx t d tu tx tx dt 0 ( ) ( )( ),( )= + 0 0 = = (12.6) 其中,x0表示初始库存量。因为生产能力是有限的,所以u t ( )要受到下列条件的约束: 0 u tu0( ) (u0为常数) (12.7) 为保证商品的及时供应,即要使 0 x t0, tt T( ) , (12.8) 设生产的总成本为生产成本与库存成本之总和。单位时间的生产成本是生产速率 u(t) 的函数 h(u(t), 而单位时间、单位产品的库存费为 b,则在 t 时刻,单位时间的总成本为: L t x t u th u tb x t( , ( ), ( )( ( )( )=+, 故整个时段的总成本为: T t J uL t x t u t dt 0 ( )( , ( ), ( )= (12.9) 于是问题就归结为:求生产速率 u(t),使其满足约束条件(12.6) , () , (12.7) ,且库存量 x(t)满 足(12.8) ,并使作为“性能指标”的总成本 J(u)为最小。 最优控制问题的一般提法最优控制问题的一般提法 通过以上两个实例,可以看出最优控制问题有许多共同点。归纳起来,它们都具有如下 四个要素: (1) 受控对象的数学模型。 受控对象,即状态变量,都是由所谓状态方程描述的动态系统。一般可表为一个微分方 程: 00 x tf x tu ttx tx( )( ( ), ( ), ),( ) = (12.10) 其中x t ( )为状态向量状态向量,u为控制向量控制向量,x0为初始状态。方程(12.10)表示状态向量的运动 规律,称它为状态变量所遵循的运动规律的数学模型(微分方程) 。 (例 12.1 中为式(12.1) , PDF 文件使用 pdfFactory Pro 试用版本创建 和(12.2) ;) ;例 12.2 中为式(12.6) ) 。 (2) 目标集。 对系统进行控制都是为了达到某种目的。 例如,在例 12.1 中为式(12.3) ,在例 12.2 中为式(12.8) 。一般的控制目标集可表示为: 12 Sx gx t T0 gx t T0|( ( ),),( ( ),)= (12.11) (3) 容许控制。 在实际的控制系统中, 控制变量往往不能任意取值, 总要受到某种约束, 一般可表示为: u t( ( )0 或者 0 u tU, tt T( ) , (12.12) 其中U称为可行控制区域可行控制区域。在可行控制区域中的控制变量称为容许控制容许控制。在例 12.1 中为式 (12.4) ,在例 12.2 中为式(12.7) 。 (4) 性能指标。 为了衡量系统工作的好坏,要有一个度量标准。例 12.1 中是燃料的消耗,例 12.2 中是 总成本。这种度量的标准称为系统的性能指标性能指标(也称为性能指标泛函性能指标泛函、目标泛函目标泛函或代价代价 函数函数等) 。如例 12.1 中的性能指标形式为: Mayer 型型(末值型) : J uK x t T( )( ( ),)= 例 13.2 中的性能指标形式为: Lagrange 型型(积分型) : T t J uL t x t u t dt 0 ( )( , ( ), ( )= 更一般的可以是复合型复合型形式: Bolza 型型(复合型) : T t J uK x t TL t x t u t dt 0 ( )( ( ),)( , ( ), ( )=+ 综上所述,最优控制问题的一般提法是:已知受控系统的 状态方程和初始状态状态方程和初始状态:x tf x tu ttx tx 00 ( )( ( ), ( ), ), ( ) = (12.13) 目标集目标集: 12 Sx gx t T0 gx t T0|( ( ),),( ( ),)= (12.14) 控制域控制域: Uu tu t ( )| ( ( )0= (12.15) 性能指标性能指标: T t J uK x t TL t x t u t dt 0 ( )( ( ),)( , ( ), ( )=+ (12.16) 最优控制问题是要求一个容许控制 0 u tU, tt T( ) ,,使系统由初始状态 x0出 发,在某一时刻 T t 0,达到目标集 S,并使性能 J(u) 达到最小(或最大)值。 PDF 文件使用 pdfFactory Pro 试用版本创建 横截条件横截条件: 在目标集(也称终结状态集)式 12.14 中,可以是等式条件,譬如例 12.1 的式(12.3) ;也可以是不等式条件。又如,例 12.2 的式(12.8) 。如果终结状态是一个严 格的特定的终结状态,称之为固定终结点固定终结点;但大多数的终结状态可以有相当自由的选择, 称之为可变终结点可变终结点。在这种情况下,终结状态就变为最优选择的一部分。可变终结点问题 的共同特征是,决策者拥有比固定终结点的情况多一个自由度。然而,这个事实自动隐含 着在推导最优解时, 需要一个附加条件来确定所选的确切路径。 这种用来决定最优路径的 终结条件称之为横截条件横截条件。 开环控制与闭环控制开环控制与闭环控制 开环控制开环控制 是指所求出的最优控制规律是时间的函数u* = u* t ( ), 它在执行控制之前 已计算出来,在控制过程中,不论系统如何变化,都按预先算好的 u*(t) 进行控制。这种 控制的好处是控制设备较简单,便于实现。 但开环控制的一个很大缺点是抗干扰能力较 差,在整个控制过程中,一经开始就不能更改。 闭环控制闭环控制 是指所求出的最优控制规律是状态的函数u* = u* x t( ( ), 在控制过程中, 通过不断测量系统当前的状态,来确定当前最优控制u* = u* x t( ( )。在控制过程中,即 使出现干扰,系统仍可实现最优控制,因此闭环最优控制比开环最优控制性能好的多,当 然闭环最优控制所要求的控制设备较为复杂,实现的难度较大。 12.2 最优控制问题的解法之一:变分法 一、 变分法变分法。它是求泛函极值的古典方法,它要求的条件很强,使用范围较窄,使用起 来不方便。 二、 极大值原理极大值原理。它是贝尔曼和庞特里亚金等人在二十世纪五十年代提出的一种方法, 克服了变分法的缺点,是当前解最优控制问题的主要工具。 为了便于理解变分法,让我们先看一个例子。 例例 12.3 曲线的最短弧长问题曲线的最短弧长问题。 设给定两点 1122 A xyB xy(,),(,),yy x( )=是连接 A,B 两点的一条光滑曲线,如图图 12.1 所示。则曲线弧长公式为: 2 1 2 x x s y x1ydx( ( ) =+ 这时弧长是曲线 y(x)的泛函。设 y(x)为一阶连续可微的函数,则曲线的最短弧长问题就是一 PDF 文件使用 pdfFactory Pro 试用版本创建 个泛函极值问题,即求一条曲线(函数)y = y(x), 使该曲线的弧长为最短。用公式表达为 y x s y x () min( ( ) 。 问题是如何来求泛函极值呢? 我们知道,在高等数学中,求一个函数的极值, 导数起着重要的作用。一阶必要条件为一阶导数等于零。 图图 12.1 在求泛函极值时,相应的一个概念叫做变分变分,它起着重要的作用。 定义定义 设泛函J y x( ( ),当 y(x) 有一个改变量:y xy xyx( )( )( )= 0 0 ,若泛函所 对应的改变量为: ( )( )( )( )( )( ( )( )JJ yxy xJ yxL yxy xo y xy x=+ 000000 +,+, 其中, L yxy x( )( ) 0 0 , , 是关于 y x( ) 的连续线性泛函,而 ( ( )( )o y xy x, , 是关于 xxx y x 12 , max |( )| 的高阶无穷小,则称L yxy x( )( ) 0 0 , ,为泛函J在 y 0(x)处的变分 变分,记为, 0 yx JL yxy x ( ) |( )( )= 0 0 , , (12.17) 而称y xy xyx( )( )( )= 0 0 为 y(x)的变分的变分。 定理定理 12.1 设泛函J y x( ( )的变分存在,则它的变分为: JJ y xy x 0 ( ( )( )|= =+ (12.18) 证明证明:因为J y x( ( )的变分存在,所以对( )y x有: ( ( )( )( ( )( ( )( )( ( )( )J y xy xJ y xL y xy xy xy x+=,+o,+o, ( ( )( )( ( )( )L y xy xy xy x= ,+o,+o, , 故 J y xy x 0 ( ( )( )|= + J y xy xJ y x 0 ( ( )( )( ( ) lim + = 0 ( ( )( ) lim ( ( )( )max|( )| max|( )| x x y xy x L y xy xy x y x = o,o, ,+,+ L y xy xJ( ( ),( )= = 例例 12.4 设 y(x)为一阶连续可微函数,求泛函 PDF 文件使用 pdfFactory Pro 试用版本创建 12 2 0 J y xyxyx dx( ( )( )( ) =+ 的变分。 解解:由定理 12.1 , JJ y()| =+ =0=0 y y yyyydx| =+ 1 1 2222 =0=0 0 0 () +(+) () +(+) | yyyydx y yyydx =+ = 1 1 2222 =0=0 0 0 1 1 0 0 () +(+) () +(+) 2+22+2 泛函极值的泛函极值的必要必要条件条件。 我们知道可导函数在自变量定义域的内点处取得极值的必要条件为函数在该点的导 数为零。类似的可以得到泛函极值的必要条件。 定理定理 12.2 设泛函J y x( ( )存在变分,若J y x( ( )在 0 yx( )处取得极小(或极大)值, 则在 0 yx( )处有:J = 0 0。 证明证明:任意给定 y 的变分yy(0) ,为实变数,则J yy 0 0 ( +)( +)为的实函数。则 函数J yy 0 0 (+)(+)在=0=0处取得极值得必要条件为: J y0 0 ()|0 = + = y y 故有 JJ y0 |0 ()0 = + = =y=y。 若要给出泛函取得极值的充分条件,就要讨论泛函的二阶变分,即一阶变分的变分,记 为J 2 。 二阶变分的求法: 设泛函J y x( ( )的二阶变分存在,则yJ y xy x 2 2 0 2 ( ( )( )|= =+ 。 在例 12.3 中,目标泛函为 2 2 J y xyxyx dx( ( )( )( ) 1 1 0 0 =+=+,则其二阶变分为: PDF 文件使用 pdfFactory Pro 试用版本创建 2 2 ( )y xyyydx| 1 1 2222 =0=0 0 0( +) +(+) (+) +(+) ( )|2 y xyy 2 yyy dx = 1 1 =0=0 0 0 (+)+ (+) (+)+ (+) ( )( )2 y x2y xdx = 1 1 2222 0 0 () + ()() + () 定理定理 12.3 设泛函J y x( ( )的二阶变分存在,且在 0 yx( )处有J=0,则当 2 J 0 J 0 为常数,t 0, T 固定,求最优控制 u*(x)使 J 为最小。 解解 作 Hamilton 函数: 2 1 H=utu t 2 ( )( )+ ,则 正则方程: H xu = , PDF 文件使用 pdfFactory Pro 试用版本创建 伴随方程: H 0 x = = 初始条件: 00 x tx( ) = 横截条件: K Tax T x T ( ) ( ) = ( )=( )= 极值条件: H u+ =0 u = 解上述方程得, ( ), ( )( ) Tax T u tax T = = ( )( ) 代入状态方程,并求解得: 00 x tax Tttx( )( )()= +, 令 t = T 得, 0 0 x x T 1a Tt ( ) () = + 故最优控制为: 0 0 a x u* t 1a Tt ( ) () = + 最优轨线为: () ( ) () 00 0 0 a x tt x* tx 1a Tt =+ + 00000 0 a xttxax Tt 1a Tt ()() () + = + 0 0 1a Tt x 1a Tt () () + = + 12.3 动态动态规规划与划与庞得里亚金庞得里亚金极大值原理极大值原理 先来介绍一下动态规划。动态规划是一种分步多阶段决策的最优化方法。首先由 Bellman 在 20 世纪 50 年代建立和发展起来的。现已广泛应用于生产,资源配置,信息处理 等很多邻域。在本节中我们介绍动态规划主要是为了借以说明极大值原理之用。 所谓多阶段决策是指一种把决策过程按时间或空间的一定顺序分解为若干个阶段 (或步 骤)来决策。例如,在图图 12.2 中,整个决策过程有 N 个决策的控制变量 01N- 1 u u ,u,L。 且在每一段均有输入变量 xk ,控制变量 uk和输出变量 xk+1。输出变量 xk+1是由输入变量 xk 和控制变量 uk决定的,k = 0,1,2,N1。整个过程的状态变化规律从 x0开始经过 u0变化为 x1依次一直变化到 xN 就完全确定了。 PDF 文件使用 pdfFactory Pro 试用版本创建 我们来考虑一个一般的离散的线性系统。它的状态方程为: ( ) k 1kk0 xAxBu , k=0 1,2,N- - 1, x 0 x + =+=L, 式中 k xx k( )=为 n 维向量,A 为 n 阶方阵, k uu k( )=为 m 维向量,B 为 nm 阶矩阵。 设线性系统的性能指标泛函为 N1 kk k 1 JL x ,uk(, ) = =,我们的任务是要求得一个最优控 制 N1 * k k 1 u = ,使性能指标泛函 J 达到最大(或最小) 。当求得最优控制 N1 * k k 1 u = 后,将其代 入状态方程就可得到最优轨线 N * k k 1 x = 。为了说明求动态规划最优控制的解,先来看一个例 子。 例例 12.6 最优路径问题。 设从 A 点到 E 点之间有很多路径可走,每段路径的距离如图图 12.3 所示。现将全路分成 四段:ABCDE 1234 求最优路径问题(即最短路径问题)就是在每一段中选择一条路使其全路为最短。这是 一个四阶段的决策问题。Bellman 提出一种称为最优化原理的方法来解决此类问题: 解决动态规划的基本思路是逆推法,即从终点出发向前逆推。在图 12.3 中,我们从第 四段的 E 点开始逐段向前逆推。 PDF 文件使用 pdfFactory Pro 试用版本创建 在第四段中,从 D1,D2到 E 的距离分别为 4,3,记为 D1(4),D2(3); 逆推到第三段,从 C1,C2到 E 的最短距离分别为: C1 D1E 和 C1 D2E 的最短距离为 4,记为 C1(4); C2 D1E 和 C2 D2E 的最短距离为 5,记为 C2(5); 再逆推到第二段,从 B1,B2到 E 的最短距离分别为: B1C1E 和.B1 C2E 等的最短距离为 10,记为 B1(10), B2C1E 和.B2 C2E 等的最短距离为 8,记为 B2(8); 类似地,可算出 A 到 E 的最短距离为 13,记为 A1(13),它的路径为: AB2C1D2E 从本例可知,若 AB2C1D2E,是从 A 到 E 的最优路径,则 B2C1D2E 就 是从第二段起到 E 的最优路径。类似地,从第三段起到 E 的最优路径为 C1D2E;而从 第四段到 E 的最优路径为 D2E。这些最优路径都称为后部子决策过程的最优路径后部子决策过程的最优路径。因而 可以总结出动态规划的理论基础Bellman 最优化原理最优化原理。它的分析和表述如下: 设动态规划为图 12.5,这是一个 N 阶段的决策过程,对于第 k+1 阶段而言 xk是初始状 态,是前 k 阶段决策过程从 x0通过控制量 u0,u1,u2,uk1作用后所产生的结果。从第 k+1 阶段起到第 N 阶段的这 Nk 阶段的决策过程称为原决策过程的后部子决策过程后部子决策过程。 PDF 文件使用 pdfFactory Pro 试用版本创建 最优化原理可叙述如下: Bellman 最优化原理:最优化原理:最优控制的特征性质是:无论 xk及前 k+1 阶段的控制规律如何, 后部子决策过程的控制规律 u0,u1,u2,uk1对 xk必定为一个最优控制。 这个最优化原理对连续的动态过程也同样成立。 设连续的动态系统的性能指标泛函为: 0 T t u t JL x t ,u tt dt ( ) max ( )( ), = 其中 T 为终值时刻。状态方程和初始条件为: 00 xf x u t , x t= x( , , )() = 解决连续的动态规划问题一般都要用到逆推法。设状态变量为 x(t),控制变量为 u(t), 从初始时刻 t0到终端时刻 T 的最优控制问题的极大值函数为 M(x),即在最优控制下达到性 能指标极大的值函数: 00 TT tt u t M xL x t ,u tt dtL x* t ,u* tt dt = Jx ( ) ( )max ( )( ), ( )( ), *( )= 现在,先假设在 0 tt T , 和 x 的性能指标极大的值函数 M(x)都存在,则 Bellman 的 最优化原理可表述如下:动态规划的最优策略(控制)具有这样的性质,即不论给定时刻 t 的状态 x(t)是什么,其后部子过程的决策(控制)对于它所产生的结果来讲必然也是最优策 略(控制) 。 从直观上理解,这个原理是显而易见的。让我们用反证法来说明。若从时间 t 到 T 的过 程是最优控制,则其后部的子过程,即从时间 t1(t1t)到 T 的控制并不是最优的控制,那 么由假设, 必存在着从 t1到 T 的“更优的控制” ,因而整个过程的最优控制应当是:从 t 到 t1按原有的最优控制,而在 t1时刻以后将沿着“更优的控制”才对。这样控制过程与原来的 最优控制是显然不同的。这说明原来的最优控制并不是真正的最优控制,因而导出矛盾。 下面我们根据最优化原理来导出 值函数 M(x) 应该满足的条件。 设在状态时间空间里的最优路 径的图 12.6 中,有两个邻近的时间 点:t 和 t+t,其中t 是时间的增量, 相应的值函数从 M(x,t) 变到 M(x+x, t+t)。根据 Bellman 的最优化原理, PDF 文件使用 pdfFactory Pro 试用版本创建 性能指标泛函(即目标泛函)的变化由两部分组成: 第一部分由从 t 到 t+t,J 的增量J 是对 L(x, u ,t ) 从 t 到 t+t 的积分得到的; 第二部分是在 t+t 时的值函数 M(x+x, t+t), 所以 ( , )max ( ), ( ), ( ), ( ), max ( ), ( ), (), t+ tT tt+ t u t+ t tu M x tL x tu tt dt+L x tu tt dt L x tu tt dt+M x t+ tt+ t = = (12.30) 因为 L 是连续函数,故(12.30)中的积分可近似地写成( , , )()L x u tt+ot,其中 o(t)为 t 的高阶无穷小。于是 ( , )max ( , , ) (),() u M x tL x u tt+M x t+ tt+ tot=+ 假设 M 为自变量 x 和 t 的连续可微函数,因而 M 对t 取泰勒级数的一次展开得: xt M x t+ tt+ tM x,tMx,t x+Mx,ttot (),()()()() =+ + 其中 Mx , Mt分别为 M 对 x, t 的偏导数。将状态方程xf x u t( , , ) =代入上式得 i n xit u i 1 M x tL x u tt+M x tMx,t fx u tt+Mx ttot( , )max ( , , )( , )()( , , )( , )() = =+ 即 i n xit u i 1 0L x u ttMx,t fx u ttMx ttotmax ( , , )()( , , )( , )() = = + + 两边除t,并令t 0 得 i n xit t0u i 1 ot 0L x u tMx,t fx u tMx t t () max ( , , )()( , , )( , )lim = =+ 即 i n xit u i 1 L x u tMx,t f x u tMx t0max ( , , )()( , , )( , ) = += (12.31) 令 i ix x tMx,ti( , )(), =(或向量 x x tMx,t( , )()=) ,所以我们可以把x t( , )理解为 最优值函数对 x 的边际效应。令 Hamilton 函数为 ( , , , )( , , )()( , , ) ( , , )( , , ) ( , , )( , , ) i n xi i 1 n ii i 1 H x utL x u tMx,t f x u t =L x u tf x u t = L x u t f x u t = = =+ + + (12.32) 则式(12.31)改写为: PDF 文件使用 pdfFactory Pro 试用版本创建 t u 0H x utMx tmax( , , , )( , )=+ (12.33) 因为 t J Mx t t * ( , ) = 与 u 无关,故 u J H x ut t * max( , , , ) = 这个方程被称为连续型动态规划的 HamiltonJacobiBellman 方程。 综合上述分析,求最优控制的必要条件如下: 当u* 为 最 优 控 制 时 , 则 相 应 的 最 优 路 径x*(t) 和 伴 随 变 量*将 使 t H x utMx t( , , , )( , )+达到极大值 t u H x utMx tmax( , , , )( , )+。因此对任意其他的控 制 u(t)时,下列公式成立: tt H x* t u* t* t tM x* t tH x* t u t* t tM x* t t( ),( ),( ), )( ), )( ), ( ),( ), )( ), )+ 两边消去 t Mx* tt( ), )得 H x* tu* t* ttH x* tu t* tt( ),( ),( ), )( ), ( ),( ), ) (12.34) 为了完整地叙述极大值原理,还需得到伴随方程。注意到若给定最优轨线 x*,最优控 制 u*,将使式(12.33)中右端取得极大值,且其极大值为零。假设在最优轨线处有一个微 小的扰动x(t),令x tx* tx t( )( )( )=+ ,其中,|x(t)| 解解 由 HamiltonJacobiBellman 方程的(12.33)可得 max() rt22 u JJ 0eaxbuu tx =+ 这样我们的最优化条件为: rt J 02ebu x =+ ,或者 rt J ue /2b x = 代入上式得到 ()/ rt222rt2rt xtx 0eaxJ e/4bJJ e2b =+ 即 222rtrt xt 0axJ e/4be J=+ 猜解为(, ) - rt2 J x teAx=,其中 A 为待定常数,将它代入上式得到 /0AbrAa=+ 因此 / (/) 212 Arr4abb=+ PDF 文件使用 pdfFactory Pro 试用版本创建 于是我们就求得最优控制和最优轨线为 / / Atb 0 u*Axb x* = x e = 应该指出,由变分法,动态规划和最优控制理论所得到的必要条件都是一致的。 现在我们来介绍更一般形式的极大值原理。 设控制系统由下列的微分方程描述: 00 xf x u t x tx( , , ),( ) = x0为初始条件,u 为控制变量。 ,t 0, T。注意到,上述方程中 ( ), ( ), nm x tRu xR : nmn fRRRR为连续可微函数。令目标函数为: 0 T u t JF x u t dtS x TTmax( , , )( ( ),) =+ :;: nmn FRRRR S RRR 为连续可微函数。T 为终端时间。 在 t0,T上定义一个分段连续的允许控制 u(x),且满足 g x u t0( , , ) ,式中 : nmq g RRRR是 x 和 u 的可微函数,而且必须含有 u。g x u t0( , , ) 可以理解为 允许控制 u(x)所满足的关系式。终端状态集为: x TYX( )。 为了表述极大值原理,我们来定义 Hamilton 函数:: nmn HRRRRR H x utF x u tt f x u t( , )( , )( )( , ) =+ 其中 n E为行向量。再定义 Lagrange 函数: nmnq L RRRRRR L x utH x utt g x u t( , )( , )( ) ( , ) =+ 式中 q E为行向量,它的各个分量称为 Lagrange 乘子。伴随向量满足下列的微分方程: x Lx ut( , , , , ) = 极大值原理指出,u*为最优控制的必要条件是使下式中所有条件都能满足的*和 u*。 00 x*f x* u* t x* tx x TYX(, ),( ),( ) =; x Hx* u*t*(, *, ) = ; PDF 文件使用 pdfFactory Pro 试用版本创建 并带有终端条件 x TSx* T*( )( )和 x TSyxT0, yY *( ) *( )。 Hamilton 函数的极大值条件为: 0 H x* u*tH x* ut , u tttt T(, *, )(, , *, )( )( ), , 即对 0 tt T ,内的分段连续的允许控制 u 有 g xu t0( *, , ) ; 且对 Lagrange 乘子 *,要满足 u u* L 0 u = = 及互补的松弛条件:0 * g xut0*( *, *, ) =,。 在经济学中,很多性能指标函数x u( , )的值均为款项,而要使不同时期的款项能够相 加(或相减)就需要通过贴现来实现。设在不同时期的贴现率均为常数0,则t时刻的性 能指标函数和末端状态的现值分别为 t F x u tx u e( , , )( , ) = T S x TTx Te( ( ),)( ( ) = (例 12.7 就是这样的最优控制问题)于是,目标函数就可写为 T tT u 0 Jx u edtx Temax( , )( ( ) =+ (12.41) 并满足约束条件: 00 xf x u t x tx( , , ),( ) = (12.42) g x u t0( , , ) 对这个问题的标准的 Hamilton 函数和标准的 Lagrange 函数分别为: s ts Hx utex uf x u t( , , , )( , )( , , ) =+ (12.43) sss L x utH +g x u t( , , , )( , , )= (12.44) 标准的伴随变量 s 满足下列的微分方程: s s x sT xx =L TSx T Tex T( )( ( ),)( ( ) = (12.45) PDF 文件使用 pdfFactory Pro 试用版本创建 以上带有上标 S 是指在“标准”的情况。现在我们要引进现值的 Hamilton 函数和现值 的 Lagrange 函数。它们在解决经济学的问题时常常是很有用的。令现值的 Hamilton 函数 和现值的 Lagrange 函数分别为: H x utx uf x u t( , , , )( , )( , , )= + (12.46) 和 L x utH + g x u t( , , , , )( , , ) = (12.47) 注意到这里的 tsts e e, = = (12.48) 因为 t e0 , 在时间 t 相对于 u 使 Hs为极大等价于在时间 t 相对于 u 使现值的 Hamilton 函数为极大,因此,由式(12.48)得 ts ts ts eee = + = + (12.49) 上式右端第一项为;为了简化第二项,注意到式(12.45)的第一项为 s s x =L 。并将 式(12.47)对 x 求偏导数得 xxxxxx LH + g f g= + + 而 sss tss xxxxxx t xxx LH + ge f g e f g() =+ + =+ + 所以 st xx LeL = 因而式(12.49)右端的第二项为: stst xx eL e=L = 。于是式(12.49)及末端状 态为 x x L Tx T( )( ( ) = = (12.50) 最后,标准的 Lagrange 乘子s满足互补松弛条件,即 ss 0 g0, = 由式(12.48)知现值的 Lagrange 乘子 满足 0 g0, = (12.51) 总结上述结论如下:对最优控制问题: PDF 文件使用 pdfFactory Pro 试用版本创建 T t t u 0 00 Jx u edtx Te xf x u t x tx g x u t0 max( , )( ( ) ( , , ),( ) ( , , ) =+ = (12.52) 它取得最优控制的必要条件为满足下列条件x* u*,*: 0 x x x*f x* u* t x* 0 x Lx* u*t TSx* T (, ),( ) *(, *, ) *( )( ) = = = (12.53) 和 Hamilton 极大值条件: 0 u u* H x* u*tH x* ut g xu* t0 u tttt T L 0 u (, *, )(, , *, ) ( *, )( )( ), , = = (12.54) 及松弛条件: 0 *g xut0*( *, *, ) =, (12.55) 其中, H = x u + f x u,t LH g x u,t( , )( ,),( ,)=+。 例例 12.8 最优最优养老消费养老消费问题问题 考虑一个消费者的养老消费。 设w(0) = w0为他退休时的财富; w(t)为t时期的财富, c(t) 为他的消费率, T 为估计的余生年限, 并设 w(T) =0, U(c)为消费的效用函数, 设 U(c)=ln c(t), 为现贴率。消费者希望在他的有生之 T 年内,以消费总效用为最大的方式消费掉他的财 富,故他的目标函数为: TT tt 00 c t edtU c tedtmaxln ( )max( ( ) = 约束条件的状态方程为: 0 wwc w 0w,( ) = = 则他的现值的 Hamilton 函数为 Hcwcln()=+ 而伴随变量( ) t应满足下列的微分方程 PDF 文件使用 pdfFactory Pro 试用版本创建 w H = 0 = = tK( )=, K 为待定常数。 为了求最优控制 c(t),将现值的 Hamilton 函数对 c 求导 H1 0 cc = = 11 c K = 代入状态方程得 1 ww K = 解此一阶线性微分方程得 tt 0 1 w Tw ee1 K ( )() = 由终值条件w T0( ) = 可确定待定常数 K 为 t 0 1e K W = 所以,最优消费率为 0 -T w1 ct K1e *( ) = 伴随函数为: -T 0 1e tK W *( ) = 12.4 最优最优经济增经济增长的长的 Cass 模模型型 世界上大多数国家经济政策的主要目标之一, 是要使本国的经济取得持续的增长。 他们 认为这是解决国内很多问题的出路所在。 所以许多经济学家长期以来都在致力于建立宏观经 济增长的模型, 来帮助人们思考诸多的经济增长的问题: 经济增长的源泉是什么?经济增长 的路径的怎样的?能否实现最优增长?那些政策因素的变化将产生什么影响?等等。继 Solow 发表的经济增长理论以来, 经济增长理论已取得了很多成果, 目前还在不断地发展着。 下面来介绍一种 1965 年由 David Cass 提出的新古典经济增长模型。 一个国家的经济增长是指国家的生产能力的增长, 在理论上采用充分就业水平下产出量 的增加来衡量。假设生产函数YY K L(,)=为非负的连续函数,其中 K 为资本,L 为劳力均 与时间有关的变量。通常还要求生产函数 Y 是凹的、单调增的和一次齐次函数,即具有规 模报酬不变的。 我们还假设 L 以一个外生的常速 n0 增长, 而社会效用以一个常速 0 进 PDF 文件使用 pdfFactory Pro 试用版本创建 行时间折现。生产函数YY K L(, )=可以按“劳力人均”项加以重写。令人均产出和资本 劳力比率分别为: YK y, k = LL =, 生产函数可改写为: YY K LK y = = Y 1 =Y 1 kf k LLL (, ) ( ,)( , )( )= 满足 f 00 f 0 f 0( ),( ),( )= = 总产出分配给消费 C 和投资 I,所以,YCI=+。而资本的变化率取决于投资,故 dK KI dt =。设资本 K 的折旧率为 ,则 KIK = YCK = (12.56) 若改写为人均项,并注意到 ddLdk KLkkLknL+Lk dtdtdt () =+=,其中 1 dL n L
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 应急办安全培训文件课件
- 2024年金属非金属矿山安全作业试卷附完整答案详解(易错题)
- 2024年自考专业(计算机网络)模考模拟试题(考点提分)附答案详解
- 拿货欠款合同(标准版)
- 个人淘宝店铺转让合同(标准版)
- 强化训练人教版9年级数学上册《概率初步》专项训练练习题(含答案详解)
- 中考英语总复习资料2
- 2025年绿色金融债券发行市场趋势与投资价值研究报告
- 2025年工业碳捕获与封存(CCS)应用案例:技术、市场、政策三维分析报告
- 养老院防汛应急预案范文(32篇)
- 关于医院“十五五”发展规划(2026-2030)
- 软件测试升职述职报告
- 室内装饰测量放线专项方案
- 基于移动互联网的智慧观光巴士服务平台
- 一文了解华为MTL流程和LTC流程z1222
- 医院护理品管圈:提高新生儿喂养后体位摆放执行率
- 弹簧-锥形弹簧的计算
- 肾主生殖理论及肾性不孕
- 【家庭教育的不足对小学生心理健康的影响问题探讨6500字(论文)】
- 青少年软件编程(Scratch)三级考试题库(变量 克隆 画笔)
- 注浆加固技术课件
评论
0/150
提交评论