第10讲-序贯决策分析01.ppt_第1页
第10讲-序贯决策分析01.ppt_第2页
第10讲-序贯决策分析01.ppt_第3页
第10讲-序贯决策分析01.ppt_第4页
第10讲-序贯决策分析01.ppt_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Email:xinglining04gfkd.mtn 联系电话决策理论与方法,多阶段决策 序贯决策 马尔可夫决策,第10讲:序贯决策分析,在经济管理活动中,由于某些问题的特殊性,需要将活动过程分为若干个相互联系的阶段,在它的每一个阶段都需要做出决策,从而使整个过程达到最好的活动效果。 当各个阶段决策确定后,就组成了一个决策系列,决定了整个过程的一条活动路线。 把一个问题看作是一个前后关联的具有链状结构的多阶段过程就成为多阶段决策过程。,多阶段决策问题,1、多阶段决策,决策者需要做出时间上有先后之别的多次决策; 前一次决策的选择将直接影响到后一次决策,后一次决策的状

2、态取决于前一次决策的结果; 决策者关心的是多次决策的总结果,而不是各次决策的即时后果(全程最优)。,多阶段决策问题的特点,1、多阶段决策,解决多阶段问题的主要方法: 决策树方法 动态规划方法,多阶段决策分析的步骤: 根据具体问题适当划分阶段; 确定各阶段的状态变量,寻找多阶段之间的联系; 由后到前用逆序法进行决策分析,多阶段决策方法,1、多阶段决策,某公司考虑是否花费4000元钱从某科研机构购买某项技术,然后产销新产品,如果买技术,可以进行大批(a1)、中批(a2)或小批生产(a3),可能出现的市场情况也分为畅销、一般和滞销三种情况。其收益矩阵如表6-1所示。,应用举例,1、多阶段决策,为了更

3、准确地了解市场,在正式投产前可先生产少量产品试销。由于要增添少量生产设备等原因,试销费需要600元。由于试销前未做广告,顾客对产品不太了解,加之试销销量较小,试销结果很不准确。假设试销结果分为产品受欢迎(H1)、一般(H2)和不受欢迎(H3)三种,其准确度如表6-2。,1、多阶段决策,如不买此项技术,把这笔费用用在其他方面,在同样的时期可获利8000元。那么,该公司应该如何决策? (1)是否买技术? (2)如果买技术,是否采取试销办法? (3)如果不试销,应大批生产、中批生产还是小批生产?如果试销,又应该如何根据试销结果决定其行动?,1、多阶段决策,6-3 试销结果下的后验概率,1、多阶段决策

4、,有些决策问题,在决策后又产生一些新情况,需要进行新决策,接着又有一些新情况,又需要进行新决策。这样决策、新情况、决策,就构成一个系列,成为系贯决策。 多阶段决策的阶段数是确定的,序贯决策的阶段数是不确定的,它依赖于执行决策过程中所出现的状况。 决策方法:决策树,2、序贯决策,产品检验问题:如果进行第一次抽样后,除选择检验还是不检验之外,还可以根据前面抽样的结果,考虑是否在进行一次容量为1的抽样。第二次抽样完成后,还可以考虑容量为1的第三次抽样,-如果继续下去,该抽样问题形成一个决策系列。 决策终止原则:只要有一个非经抽样的行动的损益值增加值大于进行抽样的费用时,决策序列终止。,2、序贯决策,

5、例63 设某石油勘探队,在一片估计能出油的荒田钻探,可以先做地震试验,然后决定钻井与否。或者不做地震试验,只凭经验决定钻井与否。做地震试验的费用为每次30000元,钻井费用为10000元。若钻井后出油,这井队可收入40000元;若不出油就没有任何收入。各种情况下出油的概率已估计出,并标在图62上。问钻井队的决策者如何做出决策使收入的期望为最大。,2、序贯决策,2、序贯决策,例64 设决策者的效用曲线如图65所示。试以最大效用期望值为决策准则,对上例进行决策。,2、序贯决策,2、序贯决策,某工厂的产品每1000件装成一箱出售。每箱中产品的次品率有0.01、0.40、0.90三种可能,其概率分别是

6、0.2、0.60、0.20。 现在的问题是:出厂前是否要对产品进行严格检验,将次品挑出。可以选择的行动有两个:整箱检验,检验费为每箱100元;整箱不检验,但如果顾客在使用中发现次品,每件次品除调换为合格品外还要赔偿0.25元损失费。 为了更好地做出决定可以先从一箱中随机抽取1件作为样本检验它。然后根据这件产品是否次品再决定该箱是否要检验,抽样成本为4.20元,那么该厂应该如何决策。 这里要决策的问题是:是否抽检?如果不抽检,是否进行整箱检验?如果抽检,应如何根据抽检结果决定行动?,2、序贯决策,预测在本质上就是利用预测对象的历史数据去推知预测对象的未来。 在经济管理现象中存在一种“无后效性”,

7、即“系统在每一时刻的状态仅仅取决于前一时刻的状态,而与其过去的历史无关。” 如:池塘里有三张荷叶,编号为1,2,3,假设有一只青蛙随机地在荷叶上跳来跳去,在初始时刻,它在2号荷叶上。在时刻,它有可能跳到1号或者3号荷叶上,也有可能原地不动。,马尔可夫决策问题,3、马尔可夫决策,把青蛙某时刻所在的荷叶称为青蛙所处的状态,青蛙在未来处于什么状态,只与它现在所处的状态无关,与它以前所处的状态无关。这种性质就是所谓的“无后效性”,即马尔可夫(Markov)性。 对于某些情况,知道预测对象的当前状态,希望由此推知预测对象的今后状态,如果这样的对象在状态转移过程中满足马尔可夫性,则可以利用随机过程(sto

8、chastic process)的有关理论进行预测。这种预测技术不需要太多的历史数据和资料,只需要预测对象最近和当前的资料。,3、马尔可夫决策,所谓马尔可夫链,就是一种随机时间系列,它在将来取什么值只与它现在的取值有关,而与它过去取什么值的历史情况无关,即无后效性。 具备这个性质的离散性随机过程,称为马尔可夫链。,马尔可夫链与转移概率矩阵,3、马尔可夫决策,随机过程 ,如果对任意 都存在 则称 具有马尔可夫性。,3、马尔可夫决策,3、马尔可夫决策,有些经济现象本身就满足马尔可夫性。 比如,考察产品的销售情况时,产品销售从畅销转而滞销或者从滞销转而畅销等显然只与其当前状态有关;某产品的市场占有率

9、发生变化,即进行状态转移时,也只与当前状态有关; 机器设备从待修到正常工作或从正常工作到待修状态还是只与机器设备的当前状态有关等。当然也有很多经济现象不满足这种马尔可夫性。 在这种情况下,如能近似满足马尔可夫性,则也能采用这种预测方法。反之,就不能采用马尔可夫预测方法。,3、马尔可夫决策,定义2:状态转移概率,马尔可夫链的概率特性取决于条件概率,在概率论中,条件概率,表达了由状态B向状态A转移的概率,简称为状态转移概率。,的含义是,某系统在时刻m处于状态 Ei的条件下,时刻m+k处于状态Ej的概率。,3、马尔可夫决策,某地区有A、B、C三家食品厂生产同一食品,有10000个用户(或购货点),假

10、设在研究期间无新用户加入也无老用户退出,只有用户的转移。已知2007年5月份有5000户是A厂的顾客,4000户是B厂的顾客,1000户是C厂的顾客。6月份,A厂有4000户原来的顾客,上月的顾客有500户转到B厂,50户转到C厂;B厂有3000户原来的顾客,上月的顾客有200户转到A厂,800户转到C厂;C厂有800户原来的顾客,上月的顾客有100户转到A厂,100户转到B厂。试计算其状态转移概率。,3、马尔可夫决策,3、马尔可夫决策,3、马尔可夫决策,将考察对象从一个状态转移到另一个状态的转移概率按行组成一个矩阵,称此矩阵为状态转移概率矩阵。其中称,为一步转移概率矩阵。,3、马尔可夫决策,

11、一步转移概率矩阵具有性质:,3、马尔可夫决策,k步转移概率矩阵:,k步转移概率矩阵的性质:,3、马尔可夫决策,状态转移概率矩阵,3、马尔可夫决策,例题:某经济系统有三种状态 (比如畅销、一般、滞销)。系统状态转移情况见表6.2。试求系统2步转移概率矩阵。,3、马尔可夫决策,3、马尔可夫决策,例题:某经济系统有三种状态 (比如畅销、一般、滞销)。系统状态转移情况见表6.2。试求系统2步转移概率矩阵。,3、马尔可夫决策,例65 某企业为使技术人员具有多方面经验,实行技术人员在技术部门、生产部门的轮换工作制度。轮换办法采取随机形式,每半年轮换一次。初始状态,即技术人员开始是在某部门工作概率用 表示,

12、j=1,2,3; 表示处于第i个部门的技术人员在半年后(一步)转移到第j个部门的概率。 已知,如果某人开始在工程技术部门工作(部门1),则经过2次转移后他在生产部门工作(部门2)的概率是多少?,3、马尔可夫决策,例66 某生产商标为的产品的厂商为了与另外两个生产同类产品和的厂家竞争,有三种可供选择的措施:措施1为发放有奖债券;措施2为开展广告宣传;措施3为优质售后服务。三种方案分别实施以后,经统计调查可知,该类商品的市场占有率的转移矩阵分别是,已知三种商标的商品的月总销售量为1000万件,每件可获利1元。另外,三种措施的成本费分别为150万,40万,30万。从长远利益考虑,生产商标为的产品的厂

13、商应该采取何种措施?,3、马尔可夫决策,我国出口某种设备,在国际市场的销售状况有两种:畅销和滞销。畅销时每年可获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告措施或采取广告措施,状态的转移矩阵分另如表65,表66所示。,确定上一年为畅销状态,每年的广告费为15万元。为了保证以后三年的利润最在化, 是否应该采用广告措施?,表65 不采取广告措施,表66 不采取广告措施,3、马尔可夫决策,38,我国出口某种设备,在国际市场的销售状况有两种:畅销和滞销。畅销时每年可获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告措施或采取广告措施,状态的转移矩阵分另如表65,表66所示。,如果每年是否采取广告措施可根据上一年经营状况决定,那么,应该怎么决策?,表65 不采取广告措施,表66 不采取广告措施,3、马尔可夫决策,1.某企业今年时亏损单位。新上任的厂长准备从明年开始采取改革方案A或B。以一年为一个时期,方案A(表610)和方案B(表611)的转移矩阵分别为,表610 方案A,表611 方案B,该厂为了以最大的概率在第3年实现盈利,厂长应该采取哪种方案?假定在三年内所采取的方案不变。,作业,2.某企业的某种商品的销售状态只分为畅销和滞销两种。每个时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论