对寝室违章电器问题的博弈分析_第1页
对寝室违章电器问题的博弈分析_第2页
对寝室违章电器问题的博弈分析_第3页
对寝室违章电器问题的博弈分析_第4页
对寝室违章电器问题的博弈分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

对卧室违规电器问题的博弈分析本文在张树民老师和李毅老师的指导下,吴开超老师的建议也得到启发,在此表示感谢。 当然是文责自负。沈鹏(西南财经大学2002级经济学基地班)内容摘要在现实的经济生活中,监督者往往通过对违反的被监督者施加高度处罚来实现政策目标。 但是现实常常证明这是无效的。 本文以“卧室违反电器问题”为切入点,运用博弈论分析了这一校园现象,解释了“高惩罚政策”为何在一定情况下无效,并提出了解决办法。 影响许多监督游戏问题的本质因素已经证实,监督者不仅仅是惩罚被监督者,而是游戏中参与者的信息结构。 通过对这一问题的分析,为小见大地上现实生活中存在的一些类似问题提供了解决思路。关键词高惩罚政策完全信息静态游戏混合战略纳什均衡序贯游戏逆归纳解1 .提出问题:为何“高罚政策”无效?学生在卧室里用电获得暂时的便利,但是以一定的概率引起火灾。 如果火灾真的发生了,结果是无法想象的。 调查显示,近年来国内高中频繁发生火灾,大多是因为学生在卧室不正当使用电器。 请看下面的资料2003年2月11日,中央民族大学8号大楼的学生宿舍发生火灾,在宿舍内拉电线的事情被调查。2003年2月19日武汉大学测绘校区四楼学生宿舍发生火灾,三十多间卧室被火灾抢劫,屋顶几乎塌陷。 起火的原因是电热毯的使用不当。2003年12月2日,北京交通大学宿舍大楼626室突然发生火灾,室内物品全部烧毁。 起火的原因是宿舍的女大学研究生说“发烧很快”烧开了热水。2003年12月23日,东北大学第四学生宿舍大楼219室突然发生火灾,一千多名女孩被困在大楼内。 起火的原因是219室的女孩使用了“发烧快”的热水。2004年3月6日,西安财经学院的4楼女子宿舍楼发生火灾,火灾从2楼宿舍燃烧,之后蔓延到3楼。 调查的火灾原因仍然违反学生用电。火灾造成了很大的损失。 国内各大学制定了相应的规定,以备未燃。 考虑到成本问题,学校不能每天进行全面检查。 但是,为了根除违规电器,很多高中将相关的校规和处罚条例与不定期检查配合执行,对被发现使用违规电器的学生给予严厉处分。 例如,西南财经大学学生宿舍管理规定第27条“给我连接电线,给电炉、热水器等违反电气的人以警告处分违反电力、火灾等造成的受害者,根据其情况的轻重,给予退学处分以严厉的警告处分,赔偿经济损失”这种“杀一儆百”的做法,学校通过“高惩罚政策”。 从最初的批判教育到现在的严厉处分,学校给予了学生最大的行政处罚。 但令人不解的是,学生们使用违法电器的欲望并没有减退。 前几天,根据西南财经大学学生校园可靠性的匿名问卷调查,六成以上的学生承认使用了违法的电器。 知道学校不定期检查,知道处分对自己有很大的负面影响,学生不由得问道为什么要为那个“小便利”而冒险。 为什么学校实施的“高罚政策”效率不高?二.说明问题违反电器游戏I接下来,我对现实情况进行模型化,通过完全信息静态游戏模型的违反电子游戏I,说明现实情况,说明监督者在一定条件下实施的“高惩罚政策”无效的原因。1 .模型设定(1)游戏的参加者:学校和全体学生。 为了简化分析,假设学生类型相同,参加者之间没有个人信息可以把全体学生视为参加者。(2)参加者的战略:对学生来说使用、不使用; 在学校不进行检查、检查(3)参加者的支付:学校的目标是以最低限度的成本消除学生使用违法电器的现象,学生也必须得到他们的认可为了不让自己被学校检查而使用。 假如学校防止或调查违法的电器收益,相反如果不能防止,学校就会有损失。 学校一次性全面检查整个学生宿舍的成本,只要检查就能防止学生使用非法电器的收入,不使用的收入,一旦调查,学生会受到的惩罚都是大于零的正数。 学校和学生面临的问题可以用下图所示的双变量行列表来记述。违反电器游戏I不使用检查不检查,(4)支付矩阵中的数值均为效用值。 各参加者的喜好关系满足冯诺依曼和摩根士丹的假设。2 .解决模型、所以,这是只有混合战略纳什均衡存在的非协调游戏。 对于学生来说,学校混合策略表示学生对学校选择策略的不确定性,并据此计算学生对学校混合策略的最佳反应。 学生以推定学校的概率选择检查,不以概率选择检查()的话,学校的混合战略为(,)。 学生选择“使用”的期待收益,学生选择“不使用”的期待收益。 “,”选择学生的混合策略,即学生使用违规电器的概率,选择不使用的概率。 学生的预期收益在混合战略纳什均衡下,指定学校战略,学生选择哪个战略没有差别。 因此,其值不随变化而变化。 事故同样,学校的预期收益要求如下:其中结论违规电器游戏I的混合战略纳什均衡是学校概率选择检测的学生随机选择使用违法的电器。 将求解后的均衡值代入式(1)和式(2)。 学校的预期收益可以追求的是学生的预期收益。3 .均衡解的分析在违规电器游戏I中,学生使用违规电器的概率只是有关系。 火灾的意思大家都知道,可以看作是外部给的。 那么,必须降低学生使用违法电器的概率,学校只能降低检查成本。 但在现实中,尽可能的幅度确实有限。 也就是说,学生总是以太低的概率使用违法的电器。 这是符合现实但令人沮丧的结论。从均衡解析中也可以发现各参加者的混合概率只依赖于其他参加者的支付参数这一重要事实。 对于任何混合战略纳什均衡,这个结论是一般的美埃里克拉斯博物馆: 博弈与信息,80-82页,北京:北京大学出版社,2003。 作者一般地导出了这个问题。的双曲馀弦值。 这也回答了本文最初提出的问题。 为什么学校的“高惩罚政策”无效。 学校为了限制学生的行为而提高惩罚程度,符合人们的直觉,学校决策者也以此直觉制定了高惩罚的政策,但是模型I的混合战略纳什均衡,学校只能最大限度地提高惩罚程度,减少学校自身进行检查的概率,减少学生使用违法电器的概率,也是学校的期待收益上述模型是完全信息静态博弈,为了从现实中理解以上结论,(1)假设混合战略纳什均衡已经存在。 (2)学校不改变检查概率,加大惩罚力度。 (3)学生观察到更高额的惩罚后,减少使用的概率。 (4)学校观察学生行为后,从成本角度降低检查概率(5)参加者重复(2)(3)(4)的过程,最后形成新的均衡。 学校和学生的游戏总是在混合战略纳什均衡存在的模式下运行,学校政策决定的变量不能进入学校自身的支付(学校不以处置学生为荣誉)。 所以,学校处置使用违法电器的学生,似乎很有威力,但仅仅这样是无法达到消除违法电器的政策目标的。在更现实的情况下,上述信息被完全假定常常是不令人满意的。 参加者在自己的效用评价中存在一定的个人信息。 也就是说,参加者明确知道自己的支付参数,但只能对其他参加者的支付参数进行大致的估计。 能够将表示这样的个人信息的随机变量导入模型中。 假设连续微密度函数和绝对连续的分布函数是独立的。 假设扰动微小,但模型是复杂的不完整信息静态博弈。 尽管如此,海桑尼(1973 )的结论表明前文的违法电器游戏I是有效的。 因为不确定性游戏纯战略均衡的均衡战略概率分布,当时参照的是收敛于确定性游戏均衡战略的概率分布(即混合战略纳什均衡):加马丁j .奥斯本美真实世界: 博弈论教程,39页,北京:中国社会科学出版社,2000.4页张维迎博弈论与信息经济学,273页,上海:上海人民出版社,1996的双曲馀弦值。 根据海桑尼的结论,混合战略纳什均衡的更加合理的解释,从长远来看,校验的概率是学生使用违法电器的人数的比例。在实际的世界中,监督者打算通过对违反的被监督者施加高度的处罚来达成政策目标。 但是,像违反电器问题一样,这种解决问题的想法常常是无效的。 像这样的例子太多了,游戏I的结论很有现实意义,不仅是为了冒着学生被处分的危险使用违法的电器,而且为什么运动员们必须冒着被禁赛的风险服用禁药,为什么很多恶意官员被杀也要贪污3 .解决问题非法电器游戏ii接下来,我稍微改变一下学校的战略,设计新型号的违法电器游戏ii,通过型号进行说明。 如果学校政策设计合适,校园违法电器问题就能完全解决。 结论本质上的变化不是惩罚程度的大小,而是信息结构的变化。1 .模型设定(1)游戏的参加者:学校和学生。 假设还是学生类型一样,没有个人信息。(2)游戏顺序:学校首先以一个比例对卧室进行抽样检查,学生观察学校的行为,选择是否使用使用违规电器。(3)参加者的支付:与违反电器游戏I基本相同。 但是,由于学校的战略发生了变化,检查成本假定如下设定。 代表学校检查之前组织的人工费(检查员的招募、检查任务的分配等),不会因检查卧室的数量而变化。 表示学校检查的边际成本。 返回到当时模型I的成本假设。(4)所有支付值都代表参加者的效用。 各参加者的喜好关系满足冯诺依曼和摩根士丹的假设。2 .解决模型违法电子游戏ii是学校首先选择一个值,学生接下来行动的逐次游戏。 用逆归纳法求解假设学校选择,学生的预期收益如下:当时,是增加函数,学生会选择了“使用”这一纯粹的战略。学校的预期收入如下:是的,是增加函数,学校在的范围内尽可能选择大的值的双曲馀弦值。当时,是减法函数,学生会选择了“不使用”这一纯粹的战略。学校的预期收入如下:是的是减函数,但学校在()的范围内选择尽可能小的值。 的双曲馀弦值。当时,学生们任意选择的值,学生的期待收益一定,游戏回到了违法电子游戏I。原因:结论违规电子游戏的逆归纳解是学校选择,从右侧入手,期待收益学生选择不使用违法电器的纯策略,期待收益。3.2点操作性说明第一,学校可以通过计算机完成随机抽样,每天详细发表当天的检查结果。 关键是保证随机性和透明度。 学生会通过观察学校的行动随时更新自己的信息,调整战略。 如果信息传播模糊,学生可能会追求最大化自身利益的冲动,怀疑学校是否严格执行政策,会偏离纳什均衡的战略,导致有效的损失。 第二,求得的逆归纳法有一个小缺陷。 通过实际操作,很难找到能够使学校期待收益最大化的值。 学校的选集是开放的,但是为了保证最大值的存在要求一个集合是有界的。 现代博弈论中收集问题一般通过以下“黑匣子操作”来解决。 可以根据某种出生过程来决定。 比如说,把那个出生地直接给了他。 这看起来像是这样鲁莽独断,但理论上比从右侧更接近的值更严格。 然而,在现实世界中,不同学生使用非法电器的效用评价存在微小差异,因此仍有部分学生使用非法电器。 通过以更大的值进行检查,至少对违反电器具有“特别喜好”的学生也能够选择不使用违反电器的纯粹的战略。 因此,用这种方法确定值在现实操作中是合理的。 收集问题只有理论意义,在实际操作中不重要。 在现实世界中,影响结果的因素不限于模型中抽象化的字符和关系。 游戏旨在消除模型中不现实而不重要的细节,简化为本质内容。 集体问题在这里,与被除去的细枝末节相比,也是极其次要的问题。4 .均衡解的分析反向摘要解表明,在模型ii中,学校提高惩罚程度对增进自己的预期收益是有效的。 从更苛刻的政策制定者的角度来看,即使学生们选择了没有使用过的纯粹的战略,也可能会对学校必须继续进行无用的检查感到不满。 但是我们也要注意:违规电子游戏ii的结果与违规电子游戏I相比,不减少学生的期望收益,增进学校的期望收益,达到了学校的政策目标,这已经是令人满意的帕累托改善。比较两种模式,很难看出学校的政策是如何相似的。 在模型I中,学校对卧室选择了不定期的随机检查,从长远来看,检查的概率在模型ii中,学校决定每天对学生的卧室进行抽样检查,但抽样的概率稍大。 但是,微小的政策变动改变了参与者的信息结构,改变了模型的本质,导致了结果的戏剧性变化。 学校不能改变学生的喜好,也不能将政策决定的变量纳入自己的支付中,但学校可以使用制度来改变游戏的“环境”。 在介绍博弈论的教科书中,这种外在的“环境”(或者是博弈规则)是外在的,但在现实的经济生活中,很多参加者都能够决定这种“环境”。 模特的学校就是这样参加者的代表。 解决这个问题的想法非常重要,但是经常被很多建模者忽视。 学校不仅在模型ii中加重了惩罚,而且通过其政策主导力,向学生表明了对学校来说检查是否无差别,并且达到了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论