决策理论与方法讲义 二_第1页
决策理论与方法讲义 二_第2页
决策理论与方法讲义 二_第3页
决策理论与方法讲义 二_第4页
决策理论与方法讲义 二_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1邢立宁国防科技大学五院管理系Email:联系电话策理论与方法2多阶段决策序贯决策马尔可夫决策第10讲:序贯决策分析3在经济管理活动中,由于某些问题的特殊性,需要将活动过程分为若干个相互联系的阶段,在它的每一个阶段都需要做出决策,从而使整个过程达到最好的活动效果。当各个阶段决策确定后,就组成了一个决策系列,决定了整个过程的一条活动路线。把一个问题看作是一个前后关联的具有链状结构的多阶段过程就成为多阶段决策过程。多阶段决策问题1、多阶段决策4决策者需要做出时间上有先后之别的多次决策;前一次决策的选择将直接影响到后一次决策,后一次决策的状态取决于前一次决策的结果;决策者关心的是多次决策的总结果,而不是各次决策的即时后果(全程最优)。多阶段决策问题的特点1、多阶段决策5解决多阶段问题的主要方法:决策树方法动态规划方法多阶段决策分析的步骤:根据具体问题适当划分阶段;确定各阶段的状态变量,寻找多阶段之间的联系;由后到前用逆序法进行决策分析多阶段决策方法1、多阶段决策6某公司考虑是否花费4000元钱从某科研机构购买某项技术,然后产销新产品,如果买技术,可以进行大批(a1)、中批(a2)或小批生产(a3),可能出现的市场情况也分为畅销、一般和滞销三种情况。其收益矩阵如表6-1所示。应用举例1、多阶段决策7为了更准确地了解市场,在正式投产前可先生产少量产品试销。由于要增添少量生产设备等原因,试销费需要600元。由于试销前未做广告,顾客对产品不太了解,加之试销销量较小,试销结果很不准确。假设试销结果分为产品受欢迎(H1)、一般(H2)和不受欢迎(H3)三种,其准确度如表6-2。1、多阶段决策如不买此项技术,把这笔费用用在其他方面,在同样的时期可获利8000元。那么,该公司应该如何决策?(1)是否买技术?(2)如果买技术,是否采取试销办法?(3)如果不试销,应大批生产、中批生产还是小批生产?如果试销,又应该如何根据试销结果决定其行动?91、多阶段决策106-3试销结果下下的后验概概率1、多阶段决决策12有些决策问问题,在决决策后又产产生一些新新情况,需需要进行新新决策,接接着又有一一些新情况况,又需要要进行新决决策。这样样决策、新新情况、决决策…,就构成一个个系列,成为为系贯决策。。多阶段决策的的阶段数是确确定的,序贯贯决策的阶段段数是不确定定的,它依赖赖于执行决策策过程中所出出现的状况。。决策方法:决决策树2、序贯决策13产品检验问题题:如果进行行第一次抽样样后,除选择择检验还是不不检验之外,,还可以根据据前面抽样的的结果,考虑虑是否在进行行一次容量为为1的抽样。第二二次抽样完成成后,还可以以考虑容量为为1的第三次抽样样,------如果继续下去去,该抽样问问题形成一个个决策系列。。决策终止原则则:只要有一一个非经抽样样的行动的损损益值增加值值大于进行抽抽样的费用时时,决策序列列终止。2、序贯决策14例6-3设某石油勘探探队,在一片片估计能出油油的荒田钻探探,可以先做做地震试验,,然后决定钻钻井与否。或或者不做地震震试验,只凭凭经验决定钻钻井与否。做做地震试验的的费用为每次次30000元,钻井费用用为10000元。若钻井后后出油,这井井队可收入40000元;若不出油油就没有任何何收入。各种种情况下出油油的概率已估估计出,并标标在图6-2上。问钻井队队的决策者如如何做出决策策使收入的期期望为最大。。2、序贯决策152、序贯决策16例6-4设决策者的效效用曲线如图图6-5所示。试以最最大效用期望望值为决策准准则,对上例例进行决策。。2、序贯决策172、序贯决策18某工厂的产品品每1000件装成一箱出出售。每箱中中产品的次品品率有0.01、0.40、0.90三种可能,其其概率分别是是0.2、0.60、0.20。现在的问题是是:出厂前是是否要对产品品进行严格检检验,将次品品挑出。可以以选择的行动动有两个:整整箱检验,检检验费为每箱箱100元;整箱不检检验,但如果果顾客在使用用中发现次品品,每件次品品除调换为合合格品外还要要赔偿0.25元损失费。为了更好地做做出决定可以以先从一箱中中随机抽取1件作为样本检检验它。然后后根据这件产产品是否次品品再决定该箱箱是否要检验验,抽样成本本为4.20元,那么该厂厂应该如何决决策。这里要决策的的问题是:是是否抽检?如如果不抽检,,是否进行整整箱检验?如果抽检,应应如何根据抽抽检结果决定定行动?2、序贯决策19预测在本质上上就是利用预预测对象的历历史数据去推推知预测对象象的未来。在经济管理现现象中存在一一种“无后效效性”,即““系统在每一一时刻的状态态仅仅取决于于前一时刻的的状态,而与与其过去的历历史无关。””如:池塘里有有三张荷叶,,编号为1,2,3,假设有一只只青蛙随机地地在荷叶上跳跳来跳去,在在初始时刻,,它在2号荷叶上。在在时刻,它有有可能跳到1号或者3号荷叶上,也也有可能原地地不动。马尔可夫决策策问题3、马尔可夫决决策20把青蛙某时刻刻所在的荷叶叶称为青蛙所所处的状态,,青蛙在未来来处于什么状状态,只与它它现在所处的的状态无关,,与它以前所所处的状态无无关。这种性性质就是所谓谓的“无后效效性”,即马马尔可夫(Markov)性。对于某些情况况,知道预测测对象的当前前状态,希望望由此推知预预测对象的今今后状态,如如果这样的对对象在状态转转移过程中满满足马尔可夫夫性,则可以以利用随机过过程(stochasticprocess)的有关理论进进行预测。这这种预测技术术不需要太多多的历史数据据和资料,只只需要预测对对象最近和当当前的资料。。3、马尔可夫决决策21所谓马尔可夫夫链,就是一一种随机时间间系列,它在在将来取什么么值只与它现现在的取值有有关,而与它它过去取什么么值的历史情情况无关,即即无后效性。。具备这个性质质的离散性随随机过程,称称为马尔可夫夫链。马尔可夫链与与转移概率矩矩阵3、马尔可夫决决策22随机过程,,如如果对任意都都存在则称具具有马马尔可夫性。。3、马尔可夫决决策233、马尔可夫决决策24有些经济现象象本身就满足足马尔可夫性性。比如,考察产产品的销售情情况时,产品品销售从畅销销转而滞销或或者从滞销转转而畅销等显显然只与其当当前状态有关关;某产品的的市场占有率率发生变化,,即进行状态态转移时,也也只与当前状状态有关;机器设备从待待修到正常工工作或从正常常工作到待修修状态还是只只与机器设备备的当前状态态有关等。当当然也有很多多经济现象不不满足这种马马尔可夫性。。在这种情况下下,如能近似似满足马尔可可夫性,则也也能采用这种种预测方法。。反之,就不不能采用马尔尔可夫预测方方法。3、马尔可夫决决策25定义2:状态转移概概率马尔可夫链的的概率特性取取决于条件概概率在概率论中,,条件概率表达了由状态态B向状态A转移的概率,,简称为状态态转移概率。。的含义是,某某系统在时刻刻m处于状态Ei的条件下,时时刻m+k处于状态Ej的概率。3、马尔可夫决决策26某地区有A、B、C三家食品厂生生产同一食品品,有10000个用户(或购货点),假设在研究究期间无新用用户加入也无无老用户退出出,只有用户户的转移。已已知2007年5月份有5000户是A厂的顾客,4000户是B厂的顾客,1000户是C厂的顾客。6月份,A厂有4000户原来的顾客客,上月的顾顾客有500户转到B厂,50户转到C厂;B厂有3000户原来的顾客客,上月的顾顾客有200户转到A厂,800户转到C厂;C厂有800户原来的顾客客,上月的顾顾客有100户转到A厂,100户转到B厂。试计算其其状态转移概概率。3、马尔可夫决决策273、马尔可夫决决策283、马尔尔可夫夫决策策29将考察察对象象从一一个状状态转转移到到另一一个状状态的的转移移概率率按行行组成成一个个矩阵阵,称称此矩矩阵为为状态态转移移概率率矩阵阵。其其中称称为一步步转移移概率率矩阵阵。3、马尔尔可夫夫决策策30一步转转移概概率矩矩阵具具有性性质::3、马尔尔可夫夫决策策31k步转移移概率率矩阵阵:k步转移移概率率矩阵阵的性质质:3、马尔尔可夫夫决策策32状态转转移概概率矩矩阵3、马尔尔可夫夫决策策33例题::某经经济系系统有有三种种状态态(比如畅畅销、、一般般、滞滞销)。系统统状态态转移移情况况见表表6.2。试求求系统统2步转移移概率率矩阵阵。3、马尔尔可夫夫决策策3、马尔尔可夫夫决策策34例题::某经经济系系统有有三种种状态态(比如畅畅销、、一般般、滞滞销)。系统统状态态转移移情况况见表表6.2。试求求系统统2步转移移概率率矩阵阵。3、马尔尔可夫夫决策策35例6-5某企业业为使使技术术人员员具有有多方方面经经验,,实行行技术术人员员在技技术部部门、、生产产部门门的轮轮换工工作制制度。。轮换换办法法采取取随机机形式式,每每半年年轮换换一次次。初初始状状态,,即技技术人人员开开始是是在某某部门门工作作概率率用表表示,,j=1,2,3;表示处处于第第i个部门门的技技术人人员在在半年年后((一步步)转转移到到第j个部门门的概概率。。已知如果某某人开开始在在工程程技术术部门门工作作(部部门1),则则经过过2次转移移后他他在生生产部部门工工作((部门门2)的概概率是是多少少?3、马尔尔可夫夫决策策36例6-6某生产产商标标为α的产品品的厂厂商为为了与与另外外两个个生产产同类类产品品β和γ的厂家家竞争争,有有三种种可供供选择择的措措施::措施施1为发放放有奖奖债券券;措措施2为开展展广告告宣传传;措措施3为优质质售后后服务务。三三种方方案分分别实实施以以后,,经统统计调调查可可知,,该类类商品品的市市场占占有率率的转转移矩矩阵分分别是是已知三三种商商标的的商品品的月月总销销售量量为1000万件,,每件件可获获利1元。另另外,,三种种措施施的成成本费费分别别为150万,40万,30万。从从长远远利益益考虑虑,生生产商商标为为α的产品品的厂厂商应应该采采取何何种措措施??3、马尔尔可夫夫决策策37我国出出口某某种设设备,,在国国际市市场的的销售售状况况有两两种::畅销销和滞滞销。。畅销销时每每年可可获利利100万元,,滞销销时每每年仅仅获利利30万元。。以一一年为为一个个时期期,如如果不不采用用广告告措施施或采采取广广告措措施,,状态态的转转移矩矩阵分分另如如表6-5,表6-6所示。。确定上上一年年为畅畅销状状态,,每年年的广广告费费为15万元。。为了了保证证以后后三年年的利利润最最在化化,是是否否应该该采用用广告告措施施?畅销滞销畅销0.80.2滞销0.40.6表6-5不采取取广告告措施施畅销滞销畅销0.90.1滞销0.70.3表6-6不采取取广告告措施施3、马尔尔可夫夫决策策38我国出出口某某种设设备,,在国国际市市场的的销售售状况况有两两种::畅销销和滞滞销。。畅销销时每每年可可获利利100万元,滞销时时每年仅获利利30万元。以一年年为一个时期期,如果不采采用广告措施施或采取广告告措施,状态态的转移矩阵阵分另如表6-5,表6-6所示。如果每年是否否采取广告措措施可根据上上一年经营状状况决定,那那么,应该怎怎么决策?畅销滞销畅销0.80.2滞销0.40.6表6-5不采取广告措措施畅销滞销畅销0.90.1滞销0.70.3表6-6不采取广告措措施3、马尔可夫决决策391.某企业今年时时亏损单位。。新上任的厂厂长准备从明明年开始采取取改革方案

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论