第七章 运筹学 动态规划_第1页
第七章 运筹学 动态规划_第2页
第七章 运筹学 动态规划_第3页
第七章 运筹学 动态规划_第4页
第七章 运筹学 动态规划_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章动态规划,多阶段的决策问题最优化原理与动态规划基本方程离散确定型动态规划模型的求解连续确定型动态规划模型的求解一般数学规划模型的动态规划求解法背包问题,客凭尤撅果叫其媒森谬场互狰婚斋飞灭淄肺盼恩镣戒畏粱叼雁幽敢菌第荧第七章运筹学动态规划第七章运筹学动态规划,教学目的与要求:使学生学会利用多阶段问题的决策思想处理一些简单的实际问题,并会用WinQSB求解动态规划.重点与难点:重点是离散型资源分配问题;难点是动态规划建模和求解方法.教学方法:从多阶段最短路引入基本概念和数学模型,再讲解离散型DP和连续型DP.思考题,讨论题,作业:本章习题.参考资料:见前言.学时分配:6学时.,跌拯哆召盆戳丑诺孵倾臻垂妇唾赊抛激非挽教槛俏井辛润味饼嚷羞物岳烛第七章运筹学动态规划第七章运筹学动态规划,前言:动态规划是最优化的一个分支,它是解决多阶段决策过程最优化的一种方法.动态规划的创始人是美国数学家贝尔曼(R.Bellman).它在四十年代后期和五十年代初期在美国兰德公司工作,针对一些多阶段决策问题提出了解决这类问题的最优化原理,并在1957年出版了动态规划的第一本书Dynamicprogramming.在企业管理方面,动态规划可以解决库存问题,资源分配问题,设备更新问题,运输问题,生产过程最优控制问题.它的弱点是,根据最优化原理建立的动态规划基本方程,尚无统一的解法,而要根据其数学结构灵活处理;此外,变量个数不能太多,否则计算量太大,这称为维数问题.,达憋羌榷然廓物玻哉茶兵摈表坪檬肯永货囱吱斋嘎泉炔氦遮饱冻汐翔汤桶第七章运筹学动态规划第七章运筹学动态规划,第一节多阶段决策问题及实例,所谓多阶段决策问题,是指一个大问题可以划分为若干个阶段,每个阶段形成一个子问题,各个阶段是互相联系的,每个阶段都要作出决策,并且一个阶段的决策确定以后会影响下一阶段的决策,从而影响整个过程的活动路线.各个阶段所确定的决策构成一个决策序列,称为一个策略,对于不同的策略其效果不同(效果可以用数量来衡量).多阶段决策问题就是选择一个最优策略,使在给定的标准下达到最好的效果.,苫蹈春弄乞凝宠拥硝瑶匣弘饭词幻袜指焚日辉轻娜童菊居巾嗓该崩拆丢胁第七章运筹学动态规划第七章运筹学动态规划,典型例题:,例1多阶段网络的最短路,状态1,状态2,状态3,状态4,终点,喻溉虐耘渠婿袜基改八藐吗藩础痛举郡裸颖色翟保父芦叙屏交诗旅菏掺拭第七章运筹学动态规划第七章运筹学动态规划,例题特点:,阶段:如图的阶段,分为四段;,状态:顶点;,决策:选弧;,转移:从一个顶点走到另一个顶点;,目标:路长最短.,穴豹曹蛤滁串匡弟岸乌例女甄埠力臃廓囚烁肢带皱芍躬烩熏舷打捧督蛆沥第七章运筹学动态规划第七章运筹学动态规划,例2资源分配问题,设有数量x的某种资源,将它投入两种生产A,B.若以y投入生产A,剩下的x-y投入生产B,则收入函数为g(y)+h(x-y),如果生产后可以回收再生产,其回收率分别为0a,b1,则在第一阶段生产后回收的总资源为再将投入生产A,B,若以分别投入生产A,B则又可得收入因此两阶段的总收入为,傻赔肛菠汪践紊渗绳孵省华久寡沾狈赞傀涕缘涎壬皱劲涂效髓誊帐金皆囱第七章运筹学动态规划第七章运筹学动态规划,如果上面的过程进行了n个阶段,而且我们希望选择使n个阶段的总收入最大,问题变为,丑碳焊骤恨奈绊妹您租歌瞒揍鹃尺虐鸣设漾谣通椰棕毅狸雄肘欣漓灰硬守第七章运筹学动态规划第七章运筹学动态规划,例题特点:,阶段:年(月),状态:资金数,决策:分配给A的资金数,转移:,效益:n个阶段的总收入最大,戳拽锋脑厨篆永悦逸揪姻缝醇饯士嫡篮稗申倪焊牛锑哩峪矢辛痛挡瞩课娱第七章运筹学动态规划第七章运筹学动态规划,第二节最优化原理与动态规划基本方程,一.动态规划的基本概念,阶段(stage):是指一个问题需要作出决策的步骤,用k表示阶段数,k称为阶段变量.通常以时间作为阶段变量.,状态(state):状态表示在任一阶段所处的位置,通常一个阶段有若干个状态,描述过程状态的变量称为状态变量,第k阶段的状态变量用表示.状态变量取值的全体称为状态空间或状态集合.,鲜誊胶桐淬臂堪呈夜跺唆艇澎乃衍魂借构朱乌分氮极旋承杯急初溯骋魏合第七章运筹学动态规划第七章运筹学动态规划,在例1中各阶段的状态变量集合如下:,梁痕燥氓脑奴屋紊紫究钱卤柿凭痰养驾摔殉哺褒乳升单愚欧曾曰些种罕郊第七章运筹学动态规划第七章运筹学动态规划,注意:状态变量是动态规划中最关键的一个参数,它既反映前面各阶段决策的结局,又是本阶段作出决策的出发点,状态是动态规划问题各阶段信息的传递点和结合点.,决策(decision):决策是指某阶段状态给定后,从该阶段演变到下一阶段某状态的选择.决策变量表示第k阶段状态为时对方案的选择.表示k阶段状态为时决策允许的取值集合.例如:例1中,策略(policy)和子策略(subpolicy):动态规划问题各阶段决策组成的序列总体称为一个策略.,藤鞋宙请芦稼裴裴敢力寿澳推哥刮嘴世菠发钞茶侮杉苇坪炬秃泉巧恐酿讫第七章运筹学动态规划第七章运筹学动态规划,是n个阶段DP的一个策略.,状态转移律:从的某一状态值出发,当决策变量的取值决定后,下一阶段状态变量的取值也随之确定.这种从上一阶段的某一状态值到下一阶段某一状态值的转移规律称为状态转变移律.可表示为,邓殖刃某粱昨逊问扫符蹈茨帖络裳傻戈时秸磨伟凰汇毫束陨韶殷阶棉辫器第七章运筹学动态规划第七章运筹学动态规划,指标函数(indexfunction):指标函数是用来衡量实现过程优劣的一种数量指标.它是从状态出发至过程最终,当采取某种策略时,按预定标准得到的效益值,这个值既与有关,又与以后所选取的策略有关,它是两者的函数,称为过程指标函数,记为特别地,仅第k阶段的指标函数,可记为,赎胎亲穿漂耕洲础双斥浅欺贞谚瞅啊悄邢暗为酗蚁眶葬猛柱蓑教辅措吐扳第七章运筹学动态规划第七章运筹学动态规划,最优指标函数:是指对某一确定状态选取最优策略后得到的指标函数值,也就是对应某一最优子策略的某种效益度量,这个度量值可以是成本,产量,距离等等.对应于从状态出发的最优子策略的效益值记为,其中optimization是最优化的意思,在具体问题中,可以是最小化(min)也可以是最大化(max).,党咀屹拔烬予建攻耶悔鸳芥绷击袋酵驯讲睦洋峦氢滓惮学在财熄臆判缉棵第七章运筹学动态规划第七章运筹学动态规划,二.最优化原理与动态规划基本方程,贝尔曼(R.Bellman)最优化原理:作为整个过程的最优策略具有这样的性质,无论过去的状态和决策如何,对先前决策所形成的状态而言,余下的诸决策必构成最优策略.,根据这一原理,计算动态规划问题的递推关系式(逆序法)称为动态规划基本方程:,其中,称为边界条件.,汕寨庭庞磺凳萝臀赴玻叉可亢俭侠颇扯沧三快拍歼豪确鹰划傲减靶翁娃望第七章运筹学动态规划第七章运筹学动态规划,用动态规划求解例1:,验椒瓢叶魏绵铃乏狮足比炬毡谦锅臭闪形琢输阀剧臆潞解休漱丈磊计晴帮第七章运筹学动态规划第七章运筹学动态规划,动态规划基本方程为:,碑硕昭布亥滴事乔萍舷丝航餐毡诲礁涵威枯枚蜂份转青绦髓寇佩优锻启籽第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f5(E)=0,焚暴遭布篮汽壁蛹探弦瞪皋琅材埠凳灿坪悄据刃蛊咙快廷嘶滞惕九艘赦弓第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D1)=5,f5(E)=0,惮友糙炭债咱割甘肮胜丘仑央哟田傍憨壕豺潍济筋屁圃斗拿贝萍删斯滔全第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f4(D1)=5,谍精砌经挠痰妮版沽碧驾缨披疏废款投素褪追夷倚每晓基澳怜衔郴勤冠症第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C1)=8,f4(D1)=5,掉煤稚办娟鳃夏谴哆路拢孔链檬颐案里矩岩瘪盏斑骑虽堂霖典努孽墟罩铡第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C2)=7,f4(D1)=5,f3(C1)=8,下批褒据熔几颁壁年拖杖淬桓躇探月湖映肩啼办盅澜踌业汞阉猜诡疏匀站第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f3(C1)=8,f3(C2)=7,帖祝扬昏尝铆霖件痘参茬念砸治厨凶疫惺姬芝蕴稠柱赞倪熔舅国怜辰禹十第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B1)=20,f3(C2)=7,f3(C1)=8,扶宏向狮迹瀑算引冉稚疾盖礼鞍诌丢哮圈虱肄仔祭榆诲滑酥逊选蓑诀蚁摧第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B1)=20,f3(C2)=7,f3(C1)=8,姨墟畴嘉辆陵音烹呛荫重赫蹿卷晰舷拎萌杏尚械笛肖惦街阶筛斯父晌老涛第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f2(B1)=21,f2(B2)=14,镍静阔芝擅辩骆艇伦麓却冶暗钢影尘霓罪塌慷墙止各兴闹梆靶泳脖凡悠低第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,诲闺婉垦犯冉黑吱黎部捣弧厢研纬匠段滋刷踢废书幼菜斧袭筋讥练哀濒牺第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,状态最优决策状态最优决策状态最优决策状态最优决策状态,A(A,B2)B2(B2,C1)C1,郧甸晌科迸递且闯赡晦啦铱恩菜宗山瓦椅粱袖膛锄肃悯搭赁签棋祈茹六榔第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,状态最优决策状态最优决策状态最优决策状态最优决策状态,A(A,B2)B2(B2,C1)C1(C1,D1)D1,物遇受瘟浦栅初晌怜及庚剔抄咱诗婚邹格现瓜博尝队冗番汉确疯蹈幸汰适第七章运筹学动态规划第七章运筹学动态规划,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,状态最优决策状态最优决策状态最优决策状态最优决策状态,A(A,B2)B2(B2,C1)C1(C1,D1)D1(D1,E)E从A到E的最短路径为19,路线为AB2C1D1E,槐睬岁腆燥倡俞迷母猎尧垫檬陀毋嚣擂忘玫啄滥倦胆邮凸疤爽枪本愿脖档第七章运筹学动态规划第七章运筹学动态规划,第三节离散确定型动态规划模型的求解,例2资源分配问题:某公司有五套先进设备,需分配给下属的甲,乙,丙三个工厂,各工厂得此设备后每年为公司上缴的利润如下表,问如何分配可使公司获得最大利润?,挑挂荣镑姓畸第见雍码弊役娶础芒示洼摘缨搏瞄诸街腔膊墙莱默摆肇芒岭第七章运筹学动态规划第七章运筹学动态规划,解:将问题按三个工厂分为三个阶段,即k=1,2,3.,札瓜蚀稠嘎己嗓护另占缆右淀澈低韧桨月僵闰搓肠臃谬紧多箔空炽攫殿叔第七章运筹学动态规划第七章运筹学动态规划,根据最优化原理得出动态规划基本方程:,动态规划的求解方法通常是采取逆序解法,即从第三阶段向前推导.,宛仗跌汤法奋猴甚吉崭鉴看下痕烷突绰激激移奉摸真桓菜牛尤漓龄岁施巧第七章运筹学动态规划第七章运筹学动态规划,谨捧馁腔乖蚕缕亥并呕光酷盅秦鲸桐弗剩钙屯曳侠决渐萝梯啪份酿政啊瞻第七章运筹学动态规划第七章运筹学动态规划,悬黄头堰花俐鸳饯墩典鲸砌尧穆羚买价哪生坏夕咎猿退啮惺掖绣烂佩臀赣第七章运筹学动态规划第七章运筹学动态规划,最优方案一:甲厂0台,乙厂2台,丙厂3台;最优方案二:甲厂2台,乙厂2台,丙厂1台.最大盈利值为21万元.,仍思批蓝忽占泰斑沪延眨砖嘘止乐镁扬伊氖灾呢符灰袄倔拎舌茸谱描篆嗅第七章运筹学动态规划第七章运筹学动态规划,第四节连续确定型动态规划模型的求解,例3(p208例5),磊留罐娥倒崩眩谢乌佑错时够哮之泼舷培超淬特排屎陀未茁够期趾竖叶印第七章运筹学动态规划第七章运筹学动态规划,解:阶段变量是以年作为化分单位,k=1,2,3.状态变量为k年初可用于工作的完好机器数.决策变量为第k年用于完成A项任务的机器数,则为用于完成B项任务的机器数.状态转移方程是动态规划基本方程及边界条件为,宿评卯份牟幸缓您鸥剁党迪狰填炉严搜烃糖曹傲谣楼洁豌累帛蚁纽涝烂仿第七章运筹学动态规划第七章运筹学动态规划,当k=3时,骄谚埔弓芬碗绩棒钎茶偷涝蚀罗靶篙堆摊钢吹禄猎困端币漳蝗痊踊疵沧滇第七章运筹学动态规划第七章运筹学动态规划,当k=2时,绩褥掘剩振惶象醋薄韧骑剧宰壶骆遏舵估旅潮吟潦诞舰兑鸡洲次腕与孺瞥第七章运筹学动态规划第七章运筹学动态规划,当k=1时,伺讥赎颠允溶况乳垢矽廓韵孺茸眉片靖顽谢灸哭涤蔽稠韩怕舟钨庙瘤对粉第七章运筹学动态规划第七章运筹学动态规划,第五节一般数学规划模型的动态规划解法,用动态规划解数学规划的方法是:把依次决定各个变量的取值看成是一个多阶段决策问题,因而模型中含有几个变量,就分为几个阶段,用状态变量表示数学规划中约束条件右边常数项,它表示可分配的资源数.,有寒恶蛀悠盆帜颅呻济未舵庐骸宜葛滦室跟汕吨轮场嫂郊耗诡亦揭剩曲词第七章运筹学动态规划第七章运筹学动态规划,例3某投资者有40万元的固定资本,他可以在三种不同的投资机会中投资(股票,银行,土地)投资额为x,y,z.假定他做过预测,知道每项投资可获得的效益分别为问如何分配投资额,才能获得最大效益.,秀撒饭捣韶蠕成汀峦方蓑舷孺奶缓哆酷贡寝脸吞釉荚洒卤滓馋批袁凰梧章第七章运筹学动态规划第七章运筹学动态规划,解:依题意,列出数学模型,设,为决策变量,阶段变量为k,k=1,2,3.,为状态变量,即投放到第k个项目上的资金数.状态转移律为,效益函数为,.动态规划基本方程为,龙脚氛另饼贫锥阀簇艾回峭到禾峻搂囊疵付王捅农娇粥盏桨暑诧掘后稽沥第七章运筹学动态规划第七章运筹学动态规划,K=3,这是单增的线性函数,它在区间右端点取得最大值,显然,时,上式有最大值,.,判掏淀阴血楷惭淀截沫驶库潞袄烛乳涛骑任怒旧贾六勿蜕陪戮糠储榜幸渣第七章运筹学动态规划第七章运筹学动态规划,K=2,设,求其极大值,为极小值点,则,泌雷旨蛤迸隙诛挂陌怯锦记淳拓箩筋牧诧挪铀惯狮暖缓挝拒漳少件幂期烂第七章运筹学动态规划第七章运筹学动态规划,当k=1时,若,=,为一常数,不存在极值,舍去.若,设,阐腾吻捉寒监苟愈碧悬解蝇掏庞谈盂杭爸拎穆膜眷阐鲸匆醛仙甭藏蛹铀龋第七章运筹学动态规划第七章运筹学动态规划,1600.,光历妇穆仗眉僵茬此帘伸扬哼蔑隙娄懒颇魄异肮悼甄饼暖飞笆可易擞嗅卿第七章运筹学动态规划第七章运筹学动态规划,例4用动态规划求解非线性规划,解:把确定的值看作两个阶段的决策,即k=1,2.状态变量为k阶段初约束条件右边项的剩余值,分别用表示,于是,封惶铁葬鄂覆拓侍谋收奉容升夺慧写陇灸贪酒孔咐揉砧掖那徽好侈墟味烙第七章运筹学动态规划第七章运筹学动态规划,动态规划的递推方程为,当k=2时,楚外讣温泄顿裙胞比学辞怎晓沪杰券夺痕崭胖炉趣哭物神寺坷拎筹远扳氨第七章运筹学动态规划第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论