(管理科学与工程专业论文)离散随机动态系统生存决策方法研究.pdf_第1页
(管理科学与工程专业论文)离散随机动态系统生存决策方法研究.pdf_第2页
(管理科学与工程专业论文)离散随机动态系统生存决策方法研究.pdf_第3页
(管理科学与工程专业论文)离散随机动态系统生存决策方法研究.pdf_第4页
(管理科学与工程专业论文)离散随机动态系统生存决策方法研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(管理科学与工程专业论文)离散随机动态系统生存决策方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要经济管理领域中,存在大量随机动态系统,这些系统的演化有三个主要特点:非确定性、遵循一定的约束条件以及具有可调节性。由于存在着不确定性因素的作用或干扰,系统状态可能会在随机干扰作用1 - 越过生存域。对这类随机动态系统的生存决策问题,我们提出了决策的概率准则,决策的目的是使系统生存的可能性最大化。决策目标函数是一个概率表达式,在正态性的随机干扰下,通过对目标函数的简化及相应变换,利用确定性等价原理转换为确定性决策问题,可使离散线性随机系统生存决策问题得到求解。但是,在很多情况下,由于离散随机系统模型过于复杂,系统不一定是线性的,或正态性前提不满足时确定性等价原理不再有效,因此传统的解法对这类问题不再有效,必须考虑用新的求解方法来解决。人工智能的研究近年来取得了极大的进展,并迅速以其新颖丰富的思想和强有力的问题求解能力渗透到各个领域,其中也包括管理、经济、金融领域。本文提出了通过利用随机模拟的方法来计算决策准则函数值:利用遗传算法求解最优簧略序列;利用神经网络技术,得到最优函数的逼近函数,并将它们集成到动态规划方法之中,形成解决离散随机动态系统生存决策问题的智能化求解方法。关键词:离散随机动态系统、生存决策、随机模拟,遗传算法、神经网络,动态规划a b s t r a c ts t o c h a s t i cs y s t e m sw h o s ee v o l v e m e n th a st h r e ec h a r a c t e r i s t i c s :u n c e r t a i n t y ,a d j u s t a b i l i t ya n dk e e p i n gt os o m ec o n s t r a i n t sa r ew i d e s p r e a di nm a n ya r e a s ,e s p e c i a l l yi nt h ef i e l do fe c o n o m i c sa n dm a n a g e m e n tt h es t a t eo f t h es y s t e mc a nb eb e y o n do ft h ev i a b l ed o m a i nb e c a u s eo ft h es t o c h a s t i cd i s t u r b sa n du n c e r t a i n t i e st h u sw eb r i n go u tp r o b a b i l i t yc r i t e r i o no fv i a b l ed e c i s i o nm a k i n gf o rp r o b l e m so ft h e s es t o c h a s t i cs y s t e m s ,w h o s ea i mi st om a x i m i z et h ev i a b l ep r o b a b i l i t yo fs t o c h a s t i cs y s t e m sw ec a ns i m p l i f ya n dc h a n g et h ep r o b l e mi n t oad e t e r m i n a t eo n ew i t ht h ep r i n c i p l eo fd e t e r m i n i s t i ce q u a li ft h es t o c h a s t i cd i s t u r bi san o r m a lo n e b u tt h i sm e t h o di sn o ta l w a y sa v a i l a b l eb e c a u s es u c ha s s u m p t i o n sa sn o r m a l i t ya n dl i n e a rc a nn o ta l w a y sb es a t i s f i e dt h u si ti sn e c e s s a r yt ow o r ko u tas o r to fn e wm e t h o d i th a sb e e nm a d eg r e a tp r o g r e s si nr e s e a r c ho na r t i f i c i a li n t e l l i g e n c et h a ti sb e i n ga p p l i e dt om a n ya r e a ss u c ha st h ef i e l do fm a n a g e m e n ta n de c o n o m i c sw i t hi t sn o v e l t yi d e aa n dg r e a ta b i l i t yo f r e s o l v i n gp r o b l e m s i nt h ep a p e ls t o c h a s t i cs i m u l a t i o n ,g e n e t i ca l g o r i t h ma n da r t i f i c i a ln e u r a ln e t w o r ka r ec o m b i n e dw i t hd y n a m i cp r o g r a m m i n gw h i c hm a k e sas e to fi n t e l l i g e n c em e t h o d sf o rs o l v i n gv i a b l ed e c i s i o nm a k i n go fs t o c h a s t i cd y n a m i cs y s t e m s k e y w o r d s :d i s c r e t es t o c h a s t i cd y n a m i cs y s t e m s ,v i a b l ed e c i s i o n ,s t o c h a s t i cs i m u l a t i o n ,g e n e t i ca l g o r i t h m ,a r t i f i c i a ln e u r a ln e t w o r k ,d y n a m i cp r o g r a m m i n g独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果。也不包含为获得墨壅盘茎或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。学位论文作者签名:;蝴签字日期:。一吐年膨月日f学位论文版权使用授权书本学位论文作者完全了解鑫壅盘茎有关保留、使用学位论文的规定。特授权基壅盘堂可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。( 保密的学位论文在解密后适用本授权说明)天津人学硕l 学位论文第一章绪论1 1 确定系统与不确定系统系统是相互联系、相互作用的诸元素的综合体。一般来说,系统具有动态性。系统在时间上是有序的,在状态上是随着时问的变化而变化的,不是静止不变的,系统在运行中既要从其环境中输入物质和信息,又要不断地向其环境输出新的物质和信息,系统在这种运行中,也不断地改变着系统本身。从系统理论的观点来看,根据系统本身结构和参数是否确定以及系统与外界作用是否有必然的因果联系,可以将系统分成不同的两大类:一类是确定系统,另一类是不确定系统。确定系统当系统的结构和参数是确定的、已知的,作用于系统的输入信号( 包括扰动) 也是确定的,可以用数学分析式或图表确切表示。这种系统就是确定性系统。不确定系统如果系统本身的结构和参数是不确定的或者作用于该系统的信号不确定、不确实、模糊、不清楚时,这种系统就是不确定系统。不确定系统的不确定因素l 随机因素。由于条件提供的不充分或偶然事件的干扰。使得在条件与事件之间不能出现决定性的因果关系,从而在事件的出现与否上呈现出偶然性。比如在自然界,液体中的微观粒子在运动中的跳跃性、无定向性、无规则性通过浸没在液体中的小粒子的无规则运动表现出的随机性。2 模糊因素。由于事物的复杂性,事物的差异在中间过度呈现出亦此亦彼性,其界限不分明,难以识别分类,有关概念不能清楚地进行描述,也不能给出确定的评价标准。如控制方案的优劣等。3 灰色因素。由于外界干扰和接受系统的能力( 包括人的辨识能力) 的限制,人们往往只能获得事物的部分信息或信息的大致范围,而不知其全部信息。如灭滓大学硕士学位论文对于各利一控制指标的量化数据,我们一般不能获得该指标的全部数据,且所获得数据也只能反映某时刻的大致状态。4 未确知因素。这种不确定性主要不在于系统本身,而是山于决策者不能完全把握事物真实状态和数量关系,造成的纯主观的认识上的不确定性,在决策中就不能把其看成是确定的,而必须当作不确定性系统来对待。随机系统在不确定系统中,系统的不确定性有的具有统计规律或可用随机过程来描述,而有些是无法测量或无法知道其变化规律。具有统计规律或可用随机过程来描述的不确定系统,称为随机系统。在现实生活中,有许多系统可以看作是随机动态系统。例如,某市的交通管理系统就可以看作是一个随机动态系统。m1 2 随机控制系统的控制决策方法考虑到实际系统中存在的不确定性,不确定性控制系统的控制策略的选取往往取决于系统本身的类别和要求,也直接影响到系统变量的选取方式和选取结果。这种选取一方面要根据先验知识和专家经验,另一方面还要根据系统的特点,在理论分析的基础上来确定。一般地,不确定控制系统的控制决策方法可分为两类:现代控制策略和智能控制策略。1 2 1 现代控制策略现代控制策略和传统的确定性控制策略相比,由于考虑到了控制对象参数乃至结构的变化、非线性的影响,运行环境的改变以及环境干扰等不确定因素,因而可以更为满意的控制效果。现代控制策略包括随机控制策略、自适应控制策略、鲁棒控制策略等。p | 7 j1 2 1 1 随机控制策略当控制系统所处的环境存在随机不确定性因素干扰时,如噪声的作用,人们一般采用随机控制方法来进行系统设计和系统分析。通过该控制策略,能分析控制系统和系统变量的统计特征,研究如何实现参数最优化。并对随机控制系统给定一个性能指标,以寻求使性能指标最小的最优控制律。随机控制方法要求事先知道每个不确定量的统计特性,但在许多实际过程中,很难事先获得不确定量的统计特性,有时即使能得到它们的统计特性,但要进一步满足随机2天津人学顿 学位论文控制中的一些条件也是很困难的。1 2 。1 2 自适应控制策略自适应控制方法是一种对系统不断辨识、不断修正控制律的控制方法,通过对系统不断辨识,来获取不确定性的最新信息,进而和用这些信息来修正控制律,以达到控制的目的。这一方法的难点在于在线计算量丈,算法的收敛性难阻保证,闭环系统的性能难以分析,但该控制方法如能获得成功,则往往能获得较好的闭坏性能。自适应控制的目标是使控制系统对过程参数的变化,以及对未建模部分的动态过程不敏感。当动态过程变化时,自适应控制系统试图感受这变化并实时地调节控制器参数或控制策略。目前自适应研究的重点是研究参数漂移的补偿及自适应控制系统的鲁棒性。1 2 】3 鲁棒控制策略鲁棒性问题是控制系统中的一个具有普遍性的问题。控制系统的鲁棒性是指系统中存在不确定因素时,系统仍然保持工作性能的一种属性。鲁棒控制方法,有时也称为不确定系统的确定性分析方法,它的主要思想是:对不确定性系统利用不确定性的信息,这种信息只是有关不确定量的可能变化的范围,设计一个确定性的控制律,使得对允许范围内的所有不确定性,闭环系统具有所期望的性能。1 2 2 智能控制策略随着人类实践活动的深入,控制系统的不确定性( 包括对象的不确定性和环境的不确定性) 成了传统控制的最大挑战。为此,人们必须建立新的理论和方法。另一方面,人工智能研究取得了很大的发展,并以其强有力的问题求解能力渗透到控制领域。控制理论和人工智能相结合,产生了新型控制策略:智能控制策略。具有代表性的智能控制策略有:模糊控制策略、神经网络控制策略、遗传算法。1 2 2 1 模糊控制策略自从1 9 6 5 年美国加利福尼亚大学的z a d e h 教授创建模糊集理论和1 9 7 4 年英国的e h m a m d a n i 成功地将模糊控制应用于锅炉和蒸汽机控制、以来,模糊控制得以广泛发展并在现实中得以成功应用。其根源在于模糊逻辑本身提供了山专家构造语言信息并将其转化为控制策略的一种系统的推理方法,因而能够解决许多复杂雨无法建立精确的数学模型系统的控制问题,是处理推理系统和3天律大学颁十学位论文控制系统中不精确和不确定性的一种有效方法。从广义上讲,模糊控制是基于模糊推理,模仿人的思维方式,对难以建立精确数学模型的对象实施的一种控制。它是模糊数学同控制理论相结合的产物,同时也构成了智能控制的重要组成部分。模糊控制的突出特点在于:( 1 ) 控制系统的设计不要求知道被控对象的精确数学模型,只需要提供现场操作人员的经验知识及操作数据。( 2 ) 控制系统的鲁棒性强,适应于解决常规控制难以解决的非线性、时变及滞后系统。( 3 ) n i 吾言变量代替常规的数学变量,易于构造形成专家的“知识”。( 4 ) 控制推理采用“不精确推理”( a p p r o x i m a t er e a s o n i n g ) 。推理过程模仿人的思维过程,由于介入了人类的经验,因而能够处理复杂甚至“病态”系统。1 2 2 2 神经网络控制策略近年来,随蓿社会经济的发展,对控制系统的设计要求日益提高,传统的控制理论和方法已很难满足需要。神经网络控制以其独特的优点受到控制界的关注,在控制系统中得到日益广泛的应用。这主要来自以下三个方面:处理越来越复杂系统的需要实现越来越高的设计目标的需要在越来越不确定情况下进行控制的需要神经网络是由大量简单的神经元以一定的方式连接而成的。单个神经元的作用是实现输入到输出的一个非线性函数关系,它们之间广泛的连接组合就使得整个神经网络具有了复杂的非线性特性。神经网络控制策略将大量的信息隐含在其连接权值上,根据一定的学习算法调节权值,使神经网络实现从m 维空间到1 3 维空问复杂的非线性映射。神经网络之所以受到人们的普遍关注,是由于它具有本质的非线性特性、并行处理能力、强鲁棒性以及自组织学习的能力。这种控制原理很适合于不确定、复杂系统,它具有自适应、自学习、自组织的特点。1 2 2 3 遗传算法遗传算法和神经网络一样都是一种基于生物机制的方法,但它们又是完全不同的方法:神经网络模拟人的大脑机制,而遗传算法则是模拟生物的进化机制。其基本思想源于达尔文的进化论,将待求解问题转换成由个体组成的演化天津人学硕士学位论义群体和对该群体进行操作的一组遗传算予。整个系统按照达尔文的“物竞天择,适者生存”原则,经历生成、评价、选择、交叉、变异等演化操作直至搜索到最优鳃2 5 川。1 2 3 管理领域中不确定系统的决策不确定控制系统广泛存在于社会经济和管理领域,本文拟把注意力从工业领域转向社会经济领域,对社会经济领域中的不确定控制系统的控制决策问题进行研究是本文的重点。1 2 3 1 管理决策决策研究包括三个方面的问题:做出什么决策? 如何做出决策? 以及决策作得如何? 决策科学先驱西蒙( h a s i m o n ) 按照决策过程将上述三个问题归结于情报活动,设计活动,抉择活动和实施活动四个阶段之中。那么,什么是决策呢? 从狭义来说,决策就是做出决定的行为,或者说,为了解决某种问题从多种替代方案中选择一种行动方案的过程。这偏重于从“如何做出”决策的角度去理解决策,即前述得设计和抉择阶段。从广义来说,决策包括上述四个阶段,除了设计和抉择阶段外,还包括探求决策主题的情报阶段和决策的实施阶段。i 2 3 2 决策分类从不同角度研究决策便可以将决策归结为不同类型。按目标分类:根据目标的个数,可分为单目标决策和多目标决策。按决策者职能划分类:专业决策:指各类专业人员在职业标准的范围内根据自身或别人提供的经验和专门知识进行的判断和决策。管理决策:指企业事业单位的管理者特别是高层管理者的决策。公共决策:指国家行政管理机构和社会团体进行的决策。按决策问题的性质分类:可分为程式决策和非程式决策。现代程式化决策技术有运筹学,系统工程等,通过建构数学模型求出问题的最优解或满意解。同时,计算机管理信息系统,决策支持系统等也日益在程式化决策中起到重要作用。计算机技术的发展已影响到现代非程式化决策,如专家系统和人工智能技术,从模拟人类的思维过程出发探索改善非程式决策的能力,并已取得进展。灭津大学硕 。学位论义按决策的思维方式分类:理性决策:以逻辑思维为主的决策过程。行为决策:以直觉思维为主的决策过程。按决策环境划分:确定型:未来环境完全可测,人们知道将来会发生什么情况,可以获得精确可靠的数据作为决策依据。不确定型:未来环境出现某种状态的概率难以估计,甚至连可能出现的状态和相应的后果都不知道。风险型:未来环境有几种可能的状态和相应后果,人们得不到充分可靠的有关未来环境的信息,但可以预测每种状态和后果出现的概率。在社会经济系统中,确定性环境下的最优决策问题已经有如线性规划,非线性规划这类方法来解决,而一些涉及影响面广,层次高的问题多为风险型和不确定型决策,所以,决策理论着重研究风险型和不确定型决策。一些风险型决策可以通过确定性等价原理转换为确定性决策问题,但是,在很多情况下,由于系统模型过于复杂,以至于确定性等价原理也无法解决决策问题。这时人们往往求诸于计算机技术,通过人工智能技术来解决风险型和不确定型决策问题。1 2 3 3 风险型决策的特征风险型决策有如下基本特征:l 决策过程中存在两个以上的自然状态,而究竟会出现哪一种状态,决策者也不能控制,但可以事先知道各种自然状态出现的概率。2 存在决策希望达到的明确目标,例如收益最大或损失最小。3 存在多个可供决策者选择的方案。4 各个方案在不同自然状态下的结局可以计算出来。1 2 3 4 决策准则最大可能准则所谓最大可能准则,是在具有最大概率的状态下根掘收益值大小进行决策,6天泮大学硕士学位论文而小考虑其他状态。最大可能准则是基于概率论中关于状态的概率越大发生的可能性就越大的思想提出来的。由于最大可能状态也是仅以一定的概率出现,所以按这一准则进行决策具有一定的风险。期望值准爨q期望值准则是各可行方案在自然状态下的收益值的概率平均大小来决定各个方案的取舍。在使用期望值准则决策时,期望值并不代表必然能实现的数值。因此,在一次性决策中按期望值准则选择的方案,也不一定就是效果最好的方案。根据期望值准则进行决策也是要冒风险的。以上简要介绍了决策理论的轮廓。由于决策理论主要研究的是决策前期“做决定”阶段。因此它势必要回答两个问题;决策的准则是什么? 未来环境将会出现何种状态? 决策理论就是围绕准则和不确定状态这两个主题发展而来的。传统的风险型决策理论研究已经取得了许多成果,并且在经济管理领域中得到了广泛的应用。传统决策大多数以经济指标作为决策的目标不外乎使收益最大或是使花费最小。这种目标驱动的经济准则决策不具备强的鲁棒性。同时,还必须看到,随着社会实践的广度和深度的迅速扩展,尤其是管理、经济、金融领域,人们对系统复杂性的认识也更加全面而深入。一些复杂的决策问题其目标函数难以用数学式子表达:有些即使能够表达,但其中的参数也难以确定:另外,对有些随机动态系统,即使可以通过一些途径得到目标函数的最优解,然而在现实生活中。该解未必能够付诸实施。而有些复杂的决策系统,由于决策变量与目标约束很多,对于这些的复杂决策系统,人们提出了非经济准则的随机动态系统生存决策。1 3 随机动态系统的生存决策1 3 1 系统的生存约束系统的演化离不开环境的作用。环境对系统有两种相反的作用。给系统提供其生存发展所需要的空间、资源、激励或其他条件,是积极的作用、有利的作用。给系统施加约束、扰动、压力甚至危害系统的生存发展,是消极的作用、天津大学倾十学位论文不利的作用。这两种作用都会在系统的状态、特性、行为等方面打上环境的烙印。系统演化的方向受到环境作用的影响,并不是所有的演化都可能实现。系统演化要遵循一定的约束,我们称之为生存约束。生存约束主要表现在几个方面1 提供了系统生存和发展的条件。2 对系统有汰劣留良的作用。在一定的环境中,一些系统能够存在和发展,另一些系统不能够存在和发展,即环境保留一些系统,又排斥一些系统。这表明环境对系统有选择作用。环境把适应于自己的系统为良者保留下来,把不适应于自己的系统作为劣者淘汰掉。3 影响系统的结构选择。当环境变化到一定程度时,会影响系统的结构。如激光器,在外界输入的能量较低时,这时激光器就象一盏普通的灯,发出相位和方向都是无规则的自然光。当输入的能量增大到某一特定的阈值时,激光器发出了相位和方向都整齐一致的单色光激光。生物在漫长的进化过程中,随着环境的变迁,不断积累新的结构变异,来适应新的外部环境,并通过遗传信息,把这些变异了的结构传递给下一代。系统在发展变化中有许多可能的结构状态,环境选择那个与自己相适应的结构状态,使之稳定,成为现实。4 影响系统的功能选择。环境的变化会影响系统的功能。环境能否满足系统的输入与输出要求,是系统能否发挥功能的重要条件。1 3 2 确定性生存决策社会经济系统等复杂决策系统的演化具有不确定性、遵循生存约束条件和具有一定可调节性的特点,也就是说,系统演化具有多种可能性,在每一时刻有多条可能的演化轨迹,而且这些演化轨迹不是任意的,还必须遵循一定的生存约束条件,并且,即使在生存约束内,演化轨迹也不是自发的,存在一定的决策变量,可对演化轨迹进行调节。在确定性生存决策中,生存域是确定的,系统状态在生存域内运行。在某一时刻,系统状态处于生存域的边界,决策系统将选择决策变量,设法使系统状态重新回到生存域内。如果系统不能使生存状态回到生存域内,系统状态越过生存域,则决策失败从而使系统走向死亡。在社会经济系统中,由于决策变量与目标约束很多,往往得不到系统的最天津人学硕| 学位论文优。更多时候只能求得系统的满意解,有时甚至只要使得系统能够正常运行就可以了。有一些系统,虽可通过各种方法求得最优解,然而在实际的操作中却未必能够付诸实施。基于此,法国数学家a u b i n 及其他一些学者提出了基于微分包含的生存理论。国内外学者成功地将生存理论应用在了经济均衡分析,价格调整及微分对策等领域i 】”。在其他领域也取得了许多成果。例如:用生存理论的方法研究了股票系统均衡调控的问题,利用生存理论分析了房地产开发的宏观调控问题等h 。但是所有这些研究均是针对确定性系统进行的,而对于不确定性系统的生存理论的研究,只有h u b i n 对模糊微分包含系统有些初步结果卧”j ,然而在实际管理问题中,我们已经知道存在许多具有不确定性特点的系统。很显然,将生存理论的方法用于随机动态系统的决策研究,无论在理论上,还是在实际中都是非常有意义的。1 3 3 随机动态系统生存决策对于随机系统,由于存在着不确定性因素的作用或干扰,想使系统的状态永远在生存域中,实际上是做不到的,原因就是不确定性因素的干扰往往是无法准确预见的。对静态随机系统的决策问题研究,已经有了风险决策的处理方法。风险决策的前提是决策者对将发生的各事件的概率是已知的,决策的准则一般采用经济意义下的期望值作决策准则,仍然属于传统决策分析的范畴。而对随机动态系统,由于存在随机干扰,系统的状态,往往因随机干扰较大时会越过生存边界跑道生存域之外,按照确定型生存理论的观点,状态不在生存域中,系统也就不再生存,系统己消亡,也就无须对它进行决策和控制了。但是,实际上的系统仍然存在。例如,一个随机存储系统,如果生产对原材料的需求大于库存,按确定型生存理论的观点,此时系统不再生存了。但是实际上整个存储系统还存在,还要对它进行管理和控制。由此可见,以往的决策方法对于随机动态系统已不再适用了。我们必须研究一套瓿的适合于解决随机动态系统决策问题的理论方法。本文论述的随机动态系统生存决策理论和方法研究就是在这方面做出一些尝试。天津人学硕十学位论义2 1 引言第二章生存理论简介生存理论是近年来迅速发展起来的个研究不确定系统在各种约束条件下状态演变的数学方法。它采用微分包含描述系统的状态与约束间的联系,利用集值分析研究系统的演变,揭示了潜在的调节反馈,以保证从任意状态出发,系统至少存在一个生存解。生存理论为研究系统在约束条件下的控制带来了新的活力。本章主要介绍生存理论的基本概念,并阐述了生存理论的基本思想和内容。2 2 系统的生存演化与决策2 2 1 生存理论的基本概念微分包含是生存理论的基础,a u b i n 认为,通常的微分方程模型主要用于描述确定性系统,但对于经济、生物及社会等含不确定因素较多的系统则不一定合适,从数学角度看,这类宏观系统的模型不应该是微分方程,而是如下的微分包含:工( ,) f ( ,工( f ) l x ( f 。) = z 。( 2 2 1 )其中x 是某个线性赋范空间,f 是个集值映射。形如( 2 2 1 ) 的微分包含系统与控制论的目标不同,系统( 2 2 一1 ) 不追求系统发展的最优轨迹,而是要求系统随着外界环境的不断变化追求系统的可生存性。这与传统的优化原理有着本质差别。下面介绍几个生存理论的基本概念h 。定义【2 2 1 】集值映射设工,为度量空间,集值映射f :肖呻y 由f 的图g ,p ) 完全描述,它是乘积空间x y 的子集:g r ( f ) # 缸,y ) y f y e ,g ) o天律大学坝卜学位论艾称,g 1 是f 在点x 的映射或值。如果它的图非空,即至少存在个元素z e ,使得,g ) 非空,则称集值映射是非平凡的。如果所有的映像,( x ) 都非空,称f 是严格的。f 的定义域是使,& ) 非空的所有x 的子集:d 口m ( f ) := 扛x 1 f g ) 函f 的映像是当x 取遍时,( _ ) 的映像或值的著集:删( f ) := u f ( x )f 的逆射f 。是从y 到x 的集值映射:x f 。( y ) jg ,_ y ) eg r ( f )定义 2 - 2 - 2 1设k 是x 的一个子集,称系统( 2 2 1 ) 在k 上是生存的,是指对v 【o ,1 ,有系统( 2 2 一1 ) 的解x ( f ) k 。称为系统( 2 2 1 ) 的生存域。定义 2 - 2 3 】相依锥设z 为一个赋范空间,置为的一个非空子集,j k 。k 在上处的相依锥定义为:喇:= v x b 骥掣= o d x 0 ) 表示,到k 的距离,d x ( y ) := 受f 牡一y 相依锥即为从x 出发,指向k 内向的点的集合。2 2 2 生存演化与生存决策生存理论是法国数学家j e a u b i n 提出的大系统理论,用微分包含的形式描述了系统在生存域内的生存问题,为生物系统,经济系统,社会系统等领域的宏观演化研究提供了新的方法。其主要思想是:系统从某一初始状态开始在可生存域内变化,当变化到生存域的边缘,有离开生存域的趋势时,系统处于危机状态。如果系统能够以尽可能慢的方式控制自身的变化方向和速度,向生存域内变化,则回到可生存状态。当系统的变化不能够通过控制再指向生存域内时,系统将离开生存域,区域瓦解。所鸿生存就是要求系统状态时刻满足边界条件。系统的决策在于选择一系歹i j 策略使系统生存,决策的实质在于:确定决镱变量“,使系统存在于生存域j :天律大学硕士学位论文内。这就要求当系统轨迹在生存域内时,系统的决策是选择尽量便状态x ( j 较长时间地处于生存域内;当轨迹处在边界上时,系统的决策就要重新选择,设法使系统重新回到k 内,或放宽生存域,使在原来的“下,z ( ) 重新处于新的生存域k 3 k 内。如果上述决策方式均不能使x ( ) 回到生存域内,则预示着决策失败,系统轨迹走出生存域,即系统走向“死亡”。图2 1 给出了复杂系统生存演化与决策机制的示意图。如图所示,x 。表示系统的初始状态;x 。斗一表示第一次生存策略“,决定的轨迹:一叶x 表示系统在边界作结构调整,并在x 寻找新策略“2 ;z :寸x :表示第二次生存策略“,决定的轨迹;石:斗工;表示系统在边界作结构调整,并在工i 寻找新的策略;x :斗屯表示第三次生存策略虬决定的轨迹:屯表示没有生存策略时,在原生存域下系统走向“死亡”。在原生约束边界图2 1 生存演化和决策简图2 2 3 生存演化的三大特征生存理论作为一种系统理论,它为诸如经济学、生物学、认知科学、对策论等学科提供了研究和解决问题的全新理论指导和方法。之所以生存理论有如此广泛和深入的应用可以说在很大程度上要归结于它具备的三大特征:2 2 3 1 系统演化的不确定性非确定的演化机制意味着在每一时刻,系统存在多种可能的或可行的演化方向,这些演化依赖于系统在现在或过去的状态。因此,牛顿力学的演化概念对这类系统已不再适用,因为牛顿力学认为系统的演化是确定的,可预测的。灭滓大学颁十学位论文诚然,即使我们接受诸如生物学、经济学、社会学的宏观系统演化中存在确定性演化机制,我们也知道这类系统常常具有内在的不稳定性,而且我们发现许多完美的确定性系统也能展现出多种不同的运动轨迹,它们属于混沌系统。对这类系统的预测实际七是不可能的。因此,我们假设系统演化是不确定的。这种不确定性有许多特征:它可以归因于非随机的不确定性;或者归因于各种各样的干扰、扰动,甚至是由于不能完全理解系统状态而反映在系统模型中的误差。在许多情况下,系统的状态与特定的控制相关,而这些控制反过来又受系统状态的约束,即所谓“闭环系统”。例如:经济学中的价格、模式识别中的观念控制、神经网络中的神经接触点阵、微分对策中的策略,等等。2 2 3 2 生存约束的演化机制由于种种原因,并不是所有的演化都能够实现。也就是说,系统状态必须遵循一定的约束,我们称之为“生存约束”。这些约束包括生物系统演化中的平衡约束、经济系统中的资源约束、控制系统中的状态约束、对策论中的权利约束,等等。因此,我们的目标是选择那些在每一时刻都能满足生存约束的可生存解( v i a b l es o l u t i o n ) 。生存理论提供了系统演化的选择机制,即:描述了保证从系统的任一初始状态出发都至少存在一个可生存解的约束与系统状态之间的联系。这些定理还提供了调节过程( 反馈) ,以确保系统生存。更进一步,它可以随时改变,根据定的优序准则,改善系统状态的品质。与传统的优化理论不同的是,生存理论不需要一个全局决策者通过暂时的优化准则来决定系统的未来。而且,控制的系统也不是一次完成便可以决定全局的,而是要根据系统环境可能的演化来随时改变。这样才能保证系统演化遵循生存约束。另外,生存理论不需要了解将来,甚至不需要了解随机的自然性。这一点在不可能实证或所研究对象不具有周期性变化时尤其显得重要。例如:在生物学、经济学或其它此类系统中,系统的动态演化一旦消失就不能重造。因此,生存理论并不讨论将来及预测方面的东西。然而,生存理论的一些结论可以减少那些可能演化的选择,剔除不可能的将来事件,而且,可以为那些不符合任何合理的优化准则的演化行为作出解释。但是,生存理论通过约束的选择并不明了。从任一时刻,任一初始状态出发会有许多可生存解,包括平衡点。因此,需要设计更进一步的选择机制,即天律人学硬卜学位论文系统演化的第三个特征:惯性原则。2 2 3 3 系统演化的惯性原则前两个特征可以用d e m o c r i t u s 的一句名言来概括:“一切事物在宇宙中的牛存都是偶然的和必然的结果。”而系统演化的惯性原则则是最近在! :物演化上山e l r e d g e 和g o u l d 引入的“间断平衡”概念的一种数学表达。它反对给系统的状态分配目标这一技术趋势,也不认为存在一个决策者为了达到这种目的而能一举控制系统的状态。系统演化的惯性原则认为只有当系统的生存面临危机时才施加控制。实际上,只要系统的状态在生存集( 满足生存约束的状态集) 中,任何控制都可以起作用。因此,系统可以保存从过去继承来的控制。当控制保持不变时,系统状态会不断演化,可能会以一个“外向”速度到达生存边界,此时,系统处于一个危机时期。要想生存,系统必须选择一定的控制使状态返回生存集的内部。另一方面,如果生存约束也同时演化,解决危机的另一种方法就是放松生存约束,以便使系统状态位于新的生存集的内部。如果这一点无法实现的话,那么就意味着系统在结构上的战略调整失败,同样也导致系统“死亡”。一般而言,当系统生存出现危机时,存在许多选择方法来选择可生存控制。例如:在任何时刻系统的可生存控制都遵循最小速率原则,就是这种惯性原则的一个离例子,它被称为“重生存解”。重生存解可以看作是间断均衡的一种数学描述,它来源于经济学中的重趋势。图2 2 描述了系统演化的惯性原则。总之,建立在上述基础上的生存理论的生存演化机制,在于揭示隐含的反馈,这些反馈能够调节系统并可为改进系统的品质提供选择机制。图2 - 21 4天评人学颂士学位论文3 1 引言第三章离散线性随机系统生存决策决策理论就是围绕决策准则和不确定状态这两个主题发展而来的。传统的风险型决策理论多数以经济指标作为决策的目标,这种目标驱动的经济准则决策不具备强的鲁棒性。本章提出以使系统获得生存为目标的概率决策准则,并用极大值原理和动态规划方法求解随机动态系统的生存决策问题。最后给出离散线性随机动态系统生存决策方法在经济领域的应用举例。3 2 离散线性随机系统的生存决策方法当系统处于一定的区域内,能够正常运转时,称系统状态处于生存状态。这一区域称之为生存域,记为k ,k c r 4 是r “e o 的紧子集。此时系统状态x i k 。然而,由于随机因素的作用和干扰,系统的演化进程是不确定的,系统状态不可能永远处在生存域内。往往由于随机干扰过大,系统会越过生存边界跑到生存域之外。按照确定型生存理论的观点,系统状态不在生存域中,系统就不再生存,也就无须再对其进行控制和决策了。然而,对于一些实际的系统,虽然系统状态已不在生存域内运动,但系统仍然存在,还需要对其进行管理和控制”5 3 “。对于这种情况,虽然可以通过放松生存约束的办法来使系统的状态位于新的生存集的内部从而避免系统“死亡”。但是,对于实际系统而者,放松系统的生存约束往往意味着对系统的管理和控制要付出更高的成本。例如,股票市场作为经济运行机制的一个重要部分和重要的融资场所,本身并不追求什么最优目标,只要整个股市高效、稳定地运转,社会资金就会得到有效的利用,社会总资源也会达到优化配置。因此,国家对股票市场的宏观调控目标就是保持股市健康、良性地运转。但影响股票市场健康稳定运转的不确定因素有很多,在一些不确定因素的影响下,股市波动有可能偏离健康稳定运转的生存域。在这种情况下,仍需要对股票市场进行调控。由于股市的这种偏离正常生存域的天津大学硕士学位论文波动必然要影响到经济系统的运行从而导致调控成本的增加,而这是调控者不希糍看到的。因此,我们希望系统的状态尽量在生存域内运行。对这类随机动态系统的生存决策问题,我们提出了决策系统的概率准则。系统( 3 - 2 1 ) 是常见的离散线性随机系统,本章将只限于讨沦这种类型的离散随机系统模型:葺“= 一t + 毋“,+ 毫,i 一0 , 1 ,n 一1具中x ,月4 为打维状态同重; ,e r ”为脚维控制挟秉f 司量,月e r ,为常量阵;,n 。( “,z ) ,f l 。) 为独立同分布随机向量列,为常量,阵。+对离散线性随机系统鼍+ 1 a 而+ b u ,+ 毛f = 0 , 1 ,n 一1概率准则有以下不同的形式:山= 仁雕小| :i p r k e k 小n 隆猷) 其中:p r 表示事件f 1 的概率值。( 3 2 - 1 )b r “”均为正定( 3 - 2 - 2 )( 3 2 - 3 )( 3 2 4 )3 2 1 状态向量的分布密度函数弓l 理3 2 1设x 服从。( p ,三) ,a 为r x p 阶实数矩阵,b 为r 维实向量,作变换z = 爿x + b ,贝u z 服从n ,( 4 p + 6 ,彳一r ) 。这个性质称为正态分布在线性变换下具有不变性。g i 理3 2 2设x 为p 维随机向量,则r 服从| v ,( ,三) 的充要条件为对于任一p 维实数向量l y = r x ,为一元正态分布随机变量。引理3 - 2 3设为正定阵,则随机向量x 具有分布密度函数天津_ 人学颤i :学位论文m ;,d = 两高酽e x 一1 刊r g - ( x - p ) ( 3 - 2 - 5 )的充要条件为x 服从n 。,) 。令“:出,= c o v ( x ,一) ,对于式( 3 2 1 ) 所描述的离散线性随机系统,文献 1 推导出如下结果:定理3 - 2 一1 对于离散线性随机系统x 。= a x ,+ b u ,+ ,其中a 、b 为常量阵, 。n 。( 雎) 为”维随机变量, 鲁) 相互独立并且同分布,那么:( a ) x ,n 。( “,) ,( b ) l = a 1 2 ,+ b u ,+ ,川= a z a + ( 3 - 2 6 )其中i = 0 , 1 ,- 一,n 一1 ,o = x o ,o = 0( c ) 随机状态向量t 的密度函数为:f ( x ;2 i , e i ,= i 云南e x 一主c x 一声,7 _ c x 一,) ( 3 - 2 - 7 )3 2 2 概率准则和目标函数下面考虑第一神情形,。= z p r x ,e k ,利用定理3 - 2 1 ,可以将目标函数作等价变换。令则f 1xe k6 x ( 。) 2 o,足,”2 篓0j :一6 r ( j ) ,( x ;一,z 。一。一。,= 委n - i 肛,两椰e x r h ( x - p , ) r x 7 t ( x - 2 , ) d r令w = i 一;,上式等价为:8屯门出)甜m肛。f厶c亘p厶亘| f=山天律大学硕士学位论文忙萎正m w + p i ( t m= n 弘- i 州w ,两赤下,e x p ( 1 1 w 卜( 3 - 2 1 0 )3 2 3 最佳策略的存在性目标函数经相应的变换后,原问题就等价地表述为下列两个子问题:1 如何确定由式( 3 2 一l o ) 定义的函数i ,。存在最大值,并能得到一组 斗i 序列使得函数j 。达到最大值式。2 怎样找到一组决策方案每。) ,使得随机状态向量k ) 的期望值为“0 。对此有下列定理:引理3 - 2 4 :对于函数矗仁) ;e 。厂+ r k ( y ) a y ,其中x , y 皆为”维向量,如果g p )为强单峰函数,且( y ) 为单峰函数,则 b ) 必存在最大值。定理3 - 2 2 :函数山= 正6 r ( w + 地) ,;地,如的最大值必存在。证明:函数式2 善正,6 r ( w + ) 。工( w ;“,。如。上6 x “+ ) + s o ( w 枷+ 。“。6 x 一+ ) z ( w 枷+ 。吐。6 。w + 一) 。 一胁对于上式中的任何一项上。6 xw + ) ,枷,因为6 。) 为阶梯函数,而z )是密度函数,是强单峰的,根据引理,必存在? r ”,使得上。5 r 似+ ) z ( w 枷达到最大。并且6 。一) 与j c ( w ) 卷积之和非负,所以函数山= :6 。w + ) f , ( w ;i x ,伽的最大值必存在。考虑到问题的复杂性,要找到一组决策方案函。 ,使函数如的最大值存在,则必须满足某些特定的条件。我们考虑下述条件:定义3 - 2 一l :对于系统t “= a x ,+ b u ,其中x i e r ”为”维状态向量;“j r m 为1 1 1维控制决策向量,a 月,b 尺一均为常量阵;对于任意给定的初值芑。和终值i 三。及状态序列售,拦i 1 ,存在控制决策序列量,恐1 ,使系统在鲁, 的作用下有:1 f i = 薯,( i = 0 , 1 - ;) 则称系统0 ,b ) 是序列能达的。定理3 - 2 3 :对于离散随机系统x 。= 彳墨+ b u ,+ 毫。( f = 0 , 1 ,) ,若系统是依赖天津入学颀 掌位论文于序列缸一序列能达的,则必定可以找到控制决策序列e _使得:一il ,。= p r x ,e k )i = o达到最大。证明:略。3 2 4 最佳策略求解( 一)上面给出了最佳策略的存在性定理。下面再给出最佳策略的求解。3 2 4 1 动态规划求解设函数j 。的最大值为以,因为j 。= i 。乱以) z ( w ;“如21 以+ 胁) 二( 以如+ t t + l 。瓯p + a , ) t z 0 枷+ - + j :。d x ( w + 。) 厶一p ) 咖由式( 3 2 6 ) 可知i = 爿d + 砌o + ,l = a z o a7 + 所以,6 x ( w + l 。) ;跏= l 。颤( w + 彳心+ 曰+ ) z 加枷其值依赖于缸。,”。) ,同理可知j :占r ( w + :) t o 心新:i 。艿。( w 十a a + 口“+ ) 几( w 弦咿其值依赖于0 ,“) ,进而依赖于。,“,) 。如此递推下去,不难知道j 。依赖于。,”。,“l ,一,“。) 。则目标函数可记为厶= 兰l 氐( w + h ) ,( w 伽:山o 。,h ,“。) ( 3 - 2 - 1 1 )因此有9天津大学砸l 学傅论文根据最优性原理同理有;= l ,:如。) = m a xp ,红。,“。,l f l ,“。) i _ n a xm 占。( w + 肌) 五( 咖计+ 乩一“) j 扣m 。a x 6 k ( w 叫。) 兀( w 枷+ j :一l “) j :一;= n i ,& ( w + “) z ( w ) 咖+ j ;一:o :) 依此类推,可得动态规划递推方程表达式j ;一,= 吧警趣,& ( w + “) ;( w 弦w + ,j 叫+ ) )( 3 2 1 2 )其中:h “= 一“+ b u ,+ ,+ l = a y - ,a 7 + ,i = n i ,一,0 。根据式( 3 - 2 1 1 ) ,按照下列步骤可以求得似 序列。使得t ,。达到最大值,;。第一步:求解j 一。的值。这里不妨取以0 ,) = 0则l ,j o 一) = 罂j i 8 x ( w + i n _ i ) 一厶一( w v + 以。) 根据引理及定理( 3 - 2 - 2 ) ,m a x f 。酢w + 。) 一( w m 存在,且以0 。) = 0 ,所以自2 够确定4 一,的值并得到t ,? 0 。) 。第二步:求解:一:的值。j ;o 。) f m ,a 。x 1 醣(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论