环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf

上传人：朱*** IP属地：江西上传时间：2020-03-08 格式：PDF 页数：106 大小：4.72MB 积分：0 举报 版权申诉

已阅读5页，还剩101页未读，继续免费阅读

环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

华中科技大学博士学位论文环境污染监督博弈的动态性分析与控制策略姓名蔡玲如申请学位级别博士专业系统工程指导教师王红卫 2010 03 29 华中科技大学博士学位论文华中科技大学博士学位论文 I 摘摘要要政府对生产排污企业的监管机制是降低环境污染失控引起的风险和落实各项环境政策的关键环境污染问题的动态性和复杂性使得对它的预测和控制经常失效因此对环境污染监管机制的研究刻不容缓博弈论为解决环境问题中各种冲突关系提供了一种有效的理论工具然而目前利用传统博弈论分析环境问题主要关注博弈均衡的求解问题忽略了有限理性条件下动态博弈过程的不确定性近年来基于有限理性的演化博弈研究主要讨论演化稳定策略的存在性缺少对该问题相关控制策略的分析而针对环境污染中多人博弈问题现有文献主要从企业联合排污的合作角度分析忽略了企业之间普遍存在的竞争关系鉴于此本文尝试分析政府与生产排污企业之间监督博弈的动态演化过程利用惩罚策略对博弈过程的波动性进行优化控制抑制企业的超标排污行为本文以政府与生产排污企业之间的监督博弈演化过程为研究对象以优化惩罚策略为主要控制手段围绕博弈的动态性分析和稳定性控制展开研究文中利用博弈论对政府与生产排污企业之间长期的动态监督关系进行建模将动态系统分析工具与系统动力学计算机仿真手段相结合分析惩罚策略等环境政策对博弈过程和均衡的影响揭示博弈过程的动态性并尝试给出惩罚策略优化结构模式具体来说本文首先建立政府与生产排污企业之间混合战略博弈的系统动力学仿真模型在假设博弈参与者策略变化率与期望获益成正比的条件下分别分析了初始模型和信息延迟模型在初始模型中假设信息获取不存在延迟则博弈均衡需要经过多次博弈才能达到在信息延迟模型中针对博弈均衡的不可达提出了双重惩罚策略通过稳定性分析指出了模型的均衡状态为临界稳定任何微小的扰动都可能造成博弈均衡的不可达从而揭示博弈过程动态性研究的重要性接着考虑有限理性条件下政府与生产排污企业之间的监督博弈动态演化过程针对一般支付矩阵下不存在演化稳定策略的情况提出了罚款额度与污染程度相关的动态惩罚策略并通过理论分析和仿真证明了动态惩罚策略条件下演化稳定均衡的存在性随后进一步考虑政府对竞争条件下两个企业的监督博弈动态演化过程通过对多人不对称演化博弈过程的仿真分析指出罚款额度的惩罚系数 k 的大小与博弈过程的动态性密切相关一般惩罚策略能有效抑制环境污染而动态惩罚策略则在博弈过程波动性控制方面具有明显效果华中科技大学博士学位论文华中科技大学博士学位论文 II 以控制环境污染和抑制博弈过程波动性为目标本文最后优化惩罚策略模式结构分析了带停产整顿期 SOP 和不带停产整顿期 NSOP 的两种惩罚机制下政府与生产排污企业的微分博弈模型指出了优化的惩罚策略模式不仅与企业超标排污行为相关而且与政府环境监管部门的策略选择相关关键词关键词环境污染监督博弈控制策略惩罚策略优化动态性分析演化稳定策略多人不对称演化博弈华中科技大学博士学位论文华中科技大学博士学位论文 III Abstract The supervision mechanism of environmental regulation is critical to reduce the risk of the uncontrollable pollution and to ensure the performance of environment policies The dynamics and complexity of the environmental pollution commonly invalidates the prediction and control strategies in real life Therefore it is essential to investigate the environmental supervision mechanism Game theory is an effective methodology to resolve the conflicts on the environmental resources However the related ressarch works up to date mainly focus on finding the equilibrium states using traditional game theory regardless of the uncertainties induced by the bounded rationality in the dynamic gaming procedure The recent studies on the application of evolutionary game mostly pay attention to the existence of the Evolutionary Stable Strategy in spite of the discussion about the control strategies Researches on multi person game focused on the cooperative pollution firms neglecting the fact that the competitions between firms are more common Thus the objective of this thesis is to investigate the dynamic procedure of supervisory game and to optimize the penalty mechanism to control the over pollution behavior of firms This thesis investigates the dynamics analysis of evolutionary procedure of supervisory game and the optimization of punishment strategy as a control method The long term dynamic supervisory relationship between government and polluting firms is modelled using game theory The dynamic systems analysis methodology combined with System Dynamics SD are used to study the effects of environment policies especially the penalty mechanism on the Nash equilibrium and the complex dynamic gaming procedure An optimized punishment strategy is proposed in a differential game framework In particular this thesis firstly develops a System Dynamic model for mixed strategy game between the government and the polluting firm without or with the consideration of information delay For the case without information delay it takes both game players a long time to reach the Nash equilibrium For the case with information delay a double penalty is proposed to deal with the unreachable Nash equilibrium As a critical stable state the Nash equilibrium might be unreachable by any small perturbation So the dynamic analysis of paths to the equilibrium state is more significant than the Nash equilibrium itself Subsequently considering the bounded rational of decision makers the dynamic evolutionary procedure of two player asymmetric game model is investigated A dynamic 华中科技大学博士学位论文华中科技大学博士学位论文 IV penalty is suggested to deal with the problem that there does not exit evolutionary stable strategy ESS under the condition of static payoff matrix Theory analysis and computer simulation validate the dynamic penalty This thesis further considers the competitive relationships between the polluting firms The dynamic procedure of multi person asymmetric evolutionary game model is developed The penalty factor k which indicates the limit of fine is closely related with the volatility of the dynamic evolutionary procedure The static penalty has a better effect on the restrain of environmental pollution while the dynamic one can stabilize the fluctuation during the evolutionary game procedure Lastly it is considered within the framework of a differential game that the enforcement of regulator using an appropriate penalty can force a polluting firm to act in a socially optimal way Two different penalty mechanisms one with the suspension of production SOP and the other without SOP NSOP are discussed A completely restraining penalty CRP which relates to both players strategies is identified to reduce the probability of the firm s pollution behaviors Key words Environmental pollution supervisory game control strategy optimized punishment strategy dynamic analysis Evolutionary Stable Strategy multi person asymmetric evolutionary game 独创性声明独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果尽我所知除文中已经标明引用的内容外本论文不包含任何其他个人或集体已经发表或撰写过的研究成果对本文的研究做出贡献的个人和集体均已在文中以明确方式标明本人完全意识到本声明的法律结果由本人承担学位论文作者签名日期年月日学位论文版权使用授权书学位论文版权使用授权书本学位论文作者完全了解学校有关保留使用学位论文的规定即学校有权保留并向国家有关部门或机构送交论文的复印件和电子版允许论文被查阅和借阅本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索可以采用影印缩印或扫描等复制手段保存和汇编本学位论文保密在年解密后适用本授权书不保密请在以上方框内打学位论文作者签名指导教师签名日期年月日日期年月日本论文属于华中科技大学博士学位论文华中科技大学博士学位论文 1 1 绪论 1 1 问题的提出目的和意义环境危机正在越来越严重地制约着我国经济的发展改革开放以来中国工业化进程加快在经济高速发展的同时带来了严峻的环境污染和生态破坏问题 1 2 环境治理问题错综复杂国家环保部门花费了大量的人力物力却得不到根治反而出现污染反弹现象 3 Pigou 1920 将私人厂商生产所造成的环境破坏使社会福利受到损失的现象称为环境外部不经济性 4 环境污染的外部不经济性主要表现在企业或者个人任意利用环境要素产生自身利益而产生的环境成本却转嫁给了他人和社会环境质量不断的恶化源于其外部不经济性单纯通过污染治理并不能从根本上解决环境污染问题不管是采取市场经济手段如排污权交易还是行政法律手段来解决环境污染问题政府对企业生产排污的监管机制是关键一个设计完善的环境保护政策如果没有合理的监管机制保证其顺利实施同样难以达到预期目的因此一个完善的监管机制能有效降低环境污染失控引起的风险对真正落实各项环保政策起着非常重要的作用目前环境污染的最主要来源是各种工业生产排污因此政府环境监管部门的主要监督对象是各种生产排污的企业作为独立的经济个体生产排污企业会利用各种手段实现其利益最大化的目的包括决定是否超标排污及其程度将部分污染处理成本转嫁给他人和社会政府环境监管部门作为社会整体利益的代表完全对所有企业排污情况进行实时监控代价是十分高昂的因此政府环境监管部门只能通过对企业生产排污抽查的方式和制定相应的惩罚策略来避免企业超标排污行为造成的环境外部不经济性但是无论采取多么严厉的惩罚企业重复污染和政府监控失灵的情况却无法避免在环境污染问题中政府对生产排污企业的监管机制主要有两个特点一是在环境资源问题上以社会总体利益最大化为目标的政府与以个体经济利益最大化为目标的生产排污企业之间的利益冲突另外一个就是环境污染问题本身的动态性自从 19 世纪 80 年代 Hardin利用非合作博弈论揭示了环境的不断恶化是一种公地悲剧从此博弈论逐渐被广泛地应用于解决环境问题中各种冲突关系 5 随着环境污染问题研究的深入理性假设条件下的传统经济学分析手段所得到的结果已经难以合理地解释各种日益复杂的环境污染问题并提供决策指导首先环境污染问题本身的性质决定了动态性分析的重要性环境问题从研究对象的角度出发大致分为两类一类问题认为环境的破坏程度仅仅与污染的速度华中科技大学博士学位论文华中科技大学博士学位论文 2 相关不考虑累积污染量的破坏程度这一类问题从本质上来说是静态的另外一类问题比如气候变化大气二氧化碳加速臭氧消耗氟氯碳的累积生物物种的减少酸雨和海洋捕杀等关注的是污染在累积过程中造成的环境破坏因此利用传统的静态博弈模型分析政府与排污企业之间的监督关系所得到的分析结果和策略具有一定的局限性难以获得切实可行的环境污染控制策略其次环境污染问题的复杂性决定了动态博弈的有限理性由于环境资源本身的特点政府政策执行问题的复杂性和不同企业之间的理性差异导致博弈双方完全理性的条件在现实生活中是难以达到的在实际环境污染问题中政府环境监管部门与生产排污企业之间的监督博弈关系不仅是一个动态博弈也是一个长期的博弈博弈双方往往不可能在一开始就找到最优的策略而是在多次博弈过程中根据各自的目标和各种信息通过模仿变异等各种动态过程寻找优化策略因此博弈双方的有限理性和各种不确定性导致环境监管部门与生产排污企业之间博弈均衡和演化过程往往表现出复杂的动态性最后环境博弈问题的复杂动态性决定了将模型动态性分析与政策的计算机仿真相结合的必要性微分博弈演化博弈理论等为分析环境污染中监督机制问题提供了一种有效的动态模型分析框架但是由于数学工具的限制较复杂的获益函数在理论求解上显得非常困难尤其是当涉及到两个以上的博弈参与者时则只能借助计算机仿真进行辅助分析完全理性的传统经济学假设在环境污染这一类复杂的问题中是难以达到的传统博弈均衡理论给出的分析往往是考虑均衡存在与否而难以对不同初始状态下均衡的可达性作出分析各种环境政策和监管机制的效果并非短期就能看到效果因此有必要通过一定的模型分析和仿真来对其短期和长期的影响进行分析环境污染涉及的监管机制优化问题研究的关键是对政府环境监管部门与企业之间在环境资源利用上的利益冲突做长期的动态的分析由于环境资源污染的事后治理代价往往是事前预防开销的数倍政府环境监管部门不仅要考虑企业短期排污行为还要考虑企业长期排污习惯对于环境污染问题的影响因此利用博弈论分析政府环境监管部门与生产排污企业之间在环境污染问题上的利益冲突不应该只限于对一次性博弈结果或者短期博弈均衡等的预测更重要的是在比较稳定的环境下对其长期博弈过程的动力学行为的分析和预测基于博弈论的环境污染问题研究目前已经取得了一定的进展和成果但是从目前已知参考文献的研究水平来看尤其是国内仍然处于起步和摸索阶段环境污染动态博弈问题的分析思路和方法有待进一步突破因此本文尝试解决以下问题华中科技大学博士学位论文华中科技大学博士学位论文 3 1 监督博弈动态仿真分析通过对政府环境监管部门与生产排污企业之间的混合战略博弈进行动态建模仿真分析揭示传统 Nash 博弈均衡背后的动态性从而对现实生活中污染反弹现象作出合理解释分析提高惩罚力度降低抽查费用等策略对企业行为和环境污染水平的影响 2 监督博弈演化过程稳定性控制问题在复杂博弈环境中对政府环境监管部门与生产排污企业博弈模型进行演化稳定性分析从惩罚策略的角度提出控制策略有效降低环境污染失控引起的风险 3 惩罚策略制定和优化问题分析惩罚额度和结构模式对博弈过程和结果的影响从降低环境污染水平和稳定博弈过程波动性两方面对惩罚策略进行优化减低各种不确定因素和信息对各种环境政策实施的影响从而提高政府的监管效率 1 2 相关文献综述相关文献综述本文主要研究的对象是环境污染问题中政府环境监管部门与生产排污企业之间一类监督博弈的动力学行为及惩罚策略机制因此主要对博弈论在环境污染各种冲突问题的应用以及政府与企业之间的监督惩罚机制方面的研究进展作综述本节综述将分三部分展开环境污染问题中的博弈惩罚策略机制相关研究及环境污染其他问题相关研究 1 2 1 环境污染问题中的博弈环境污染问题从经济学角度出发是源于环境资源本身的外部不经济性因此单纯靠环境治污是难以解决该问题的环境污染问题的产生最主要的原因是企业自身利益最大化与社会整体利益之间的冲突而博弈论为解决环境污染问题提供了一种解决冲突的理论方法 6 7 1 完全理性条件下经典博弈理论与环境污染问题完全理性条件下经典博弈理论与环境污染问题传统博弈理论从理性人出发认为参与人都是行为最优化者有什么样的条件就会得出什么样的结果结果与条件是一一对应的并且系统会在均衡之间跳跃式的发展因而不需要也不必要对均衡过程进行分析所谓的动态过程即是指其信息传递参与人对信息的反应过程 a 资源获益分配问题与资源获益分配问题与公地悲剧公地悲剧合作博弈主要是研究人们达成合作时如何分配合作得到的收益即收益分配问题在 20 世纪 80 年代主要被用于解决和协调水资源冲突等方面如各种合作水利工程的费用公摊和获益分配问题 8 12 Kucukmehmetoglu and Guldman 2004 利用合作博弈论对三个国家对作为公共资源的河流的分配问题作了研究 13 华中科技大学博士学位论文华中科技大学博士学位论文 4 随着博弈理论的发展和应用领域的扩展研究者发现合作应该是理论的结果而并非前提应该以非合作博弈 non cooperative game 的方式建模描述合作的达成非合作博弈理论适用于更广泛的社会经济形式 14 15 非合作博弈论研究人们在利益相互影响的局势中如何决策使自己的收益最大即策略选择问题在环境问题中最著名的就是Hardin在 1968 年发表的关于公地悲剧 tragedy of the commons 的论文该论文指出了如果不对公共资源的使用加以限制而被自由使用则公共资源最终将被完全耗尽 16 吴伟 2001 参照公地悲剧从环境的污染和治理两个方面分析博弈的决策和决策的均衡问题结果发现环境作为公共资源被过度利用的同时作为公共物品的治理环境污染的物质总供给却不足两个方面作用的结果必然使环境污染日益严重 17 王冬梅 2004 阐述了博弈论的各种类型的基本理论在环境保护中的应用如生产排污企业之间对于环境资源保护的囚徒困境不同规模的生产企业的智猪博弈等 18 尽管非合作博弈论的应用前景为多数经济学家所看好然而美中不足的是一个博弈往往存在多个纳什均衡对于两人零和博弈而言多个均衡存在并没有太大的实质问题 19 但是在两人非零和博弈和多人博弈中均衡的选择问题就难以解决了当存在多个均衡时若期望一定达到某个纳什均衡则必须存在某种能够导致每个博弈方都预期到该均衡出现的机制 mechanism 20 b 环境污染中的动态博弈环境污染中的动态博弈环境污染动态博弈问题的应用从研究对象的特性大致可以分为两类一类是考虑环境的破坏程度仅仅与污染的速度相关而不考虑累积污染量的破坏程度即当问题的本质是静态的这一类的环境污染问题研究比较多的是针对囚徒困境合作问题的讨论主要是利用重复博弈 repeated game 进行分析 Tsutsui等人 1990 证明了在单阶段的双人对称博弈存在非线性马尔科夫均衡 Dockner 1993 和 Feichtinger 1993 将Tsutsui的结论应用于全球污染问题的分析 21 23 M ler 1991 发现当博弈的基本类型是囚徒困境的时候尽管合作可以产生帕累托最优结果而且每个国家一旦背叛合作或者在减少污染中搭顺风车都会面对面临严厉的惩罚但是合作以降低污染是难以实现的 24 Fudenberg and Tirole 1991 利用重复博弈分析囚徒困境模型是发现如果参与者知道彼此博弈不仅仅是一次他们有足够的耐心同时他们也无法预知博弈何时会结束时帕累托最优结果是可以达到的 25 Barrett 1994 和Carraro and Siniscalco 1993 研究扩展的囚徒困境模型时发现在单次博弈中部分博弈者的有限合作是存在均衡的 26 27 Batabyal 1995 1996 利用 Stackelberg动态博弈来描述具有先动优势的政府与排污企业之间的关系 28 29 华中科技大学博士学位论文华中科技大学博士学位论文 5 Thomas 1998 将遗传算法引入到该问题的动态博弈模型中以解决信息不完全和不完美带来的求解困难 Damania R 2001 利用重复博弈分析了政府环境法规对需求不确定条件下垄断企业策略影响结果征收排污税将会影响企业的财政结构并降低企业的市场竞争力 30 Zenkevich N and Zyatchin A 2007 利用重复博弈分析了共享排污权的三个企业之间排污量分配问题 31 在现实中政府往往难以直接观测到企业行为或者采用某种激励方法获得关于企业成本函数的相关信息时信息不完全和不完美使得博弈分析变得十分复杂 32 在重复博弈中博弈环境一般是假设不变的而在实际的环境污染问题中博弈环境并非一成不变的会随着博弈过程而自我演变成为其博弈结果另一类是考虑污染的累积过程中给环境带来的破坏目前此类环境问题比如气候变化大气二氧化碳加速臭氧消耗氟氯碳的累积生物物种的减少酸雨和海洋捕杀等博弈者关注的是污染的累积即污染的累积量是与博弈支付函数相关的大部分用微分博弈 differential game 来描述一般的动态博弈模型讨论的都是离散的博弈过程微分博弈将博弈理论扩展到连续时间上博弈参与者可以在无限小的时间段内改变自己的策略微分博弈适合用来描述连续博弈系统的动态演化过程近年来主要集中在跨国界污染问题酸雨博弈模型 33 34 35 博弈双方的合作不仅仅有利于总体获益的提高也能降低污染排放降低污染水平 36 但是如果合作能够促进合约双方获益的增加为什么在实际中各种环境公约却难以被大家遵守国家之间的不对称造成搭顺风车行为的产生是其原因之一不少学者尝试利用微分博弈从个体理性 Individual Rationality 的角度出发制订相应的环境公约以保证博弈过程中任何参与者合作的获益都不会低于违约的获益从而达到提高环境质量的目的 J rgensen and Zaccour 2001a 2001b 2003 建立了两个国家之间污染问题的微分博弈从个体理性 Individual Rationality 的角度出发制订相应的环境公约以保证博弈过程中任何参与者合作的获益都不会低于违约的获益从而达到提高环境质量的目的 37 39 Cabo et al 2006 在其基础上从经济协调的角度利用微分博弈研究建两个具有进出口贸易关系的不对称国家之间环境问题提出了一个考虑动态个体理性的环境公约 40 利用微分博弈分析问题在连续的时间上要直接描述博弈参与者彼此之间的最优策略反应关系在数学处理上往往存在一定的难度其应用的障碍之一就是在于求解困难目前主要的分析工具是Hamilton Jacobin理论然而一般情况下表现为复杂的偏微分方程组在状态变量规律比较复杂时其求解就非常困难因此模型一般还有各种严格的限制和假设微分博弈另外一个应用限制就是不容易清晰地考察策略的相互反应关系闭环均衡概念限制了博弈参与者的策华中科技大学博士学位论文华中科技大学博士学位论文 6 略空间复杂的策略又难以进行规范分析而当引入不完全信息时根本就无法求解均衡 41 2 有限理性条件下演化博弈与环境污染问题有限理性条件下演化博弈与环境污染问题进化博弈理论从有限理性的参与人群体出发认为参与人并不是行为最优化者系统达到均衡并不是瞬间可以完成的而需要一个复杂的渐进过程均衡结果是依赖于达到均衡的路径分析系统达到均衡的过程是理论的核心之所在有限理性指的是博弈参与者具有一定的统计分析能力和对不同策略获益的事后判断能力但是缺乏事前的预见和预测能力有限理性意味着 1 博弈的过程同时也是个学习的过程在学习中博弈参与者通过模仿与比较寻找优化策略 2 一般总有部分博弈参与者不会采用完全理性的均衡策略这是因为除了均衡总在不断地调整之外也存在博弈参与者找到了最优策略而又再次偏离的可能 c 哈林顿悖论与有限理性哈林顿悖论与有限理性 Harrington 1988 通过对美国 70 年代末 80 年代初包括Russell et al 1986 在内的关于监控执法和各种环境法律法规的执行情况研究分析对Becker s 1968 的理性犯罪理论提出了质疑他认为惩罚力度并非越严厉越有效限制惩罚的额度反而能提高执法机构的效率 42 43 这就是著名的哈林顿悖论不少文献在其理论基础上作进一步研究或者对悖论进行解释 44 49 Karine 2006 通过对挪威环境法规相关数据深入分析后认为哈林顿悖论只能作为一个假设而非事实 50 Harrison and Antweiler 2002 针对学术界提出的不少企业为减少对环境的影响而采取自愿环保行动一说采用加拿大国家污染排放记录数据考察了企业减少污染排放的动机结果发现企业减少污染排放并非是一种自愿行为而是受到政府管制和公众压力等各方面影响产生的结果 51 近年来不少学者也认为并非所有的环境资源问题都是公地悲剧人类社会中的个体行为不仅仅受到经济因素的影响同时也会考虑其他心理因素从而存在合作的可能 52 54 Yukari 2009 在此基础上将各种心理因素作为一种社会压力研究经济成本与社会压力平衡下的合作演化趋势 55 从Becker s的理性犯罪理论到哈林顿悖论不少文献通过实际数据和理论分析都说明了利用完全理性的传统经济学方法分析环境污染问题中的企业行为得到的结果与现实往往存在很大的差异随着博弈论的发展及应用领域的深入研究人们开始对传统经济博弈论中博弈者完全理性的假设条件产生质疑而博弈论在生物学领域的应用而发展起来的演化博弈理论为人们分析社会经济领域中各种复杂的动态长期冲突关系提供了一种新的思路 56 目前国外演化博弈论的研究主要集中在博弈演化稳定策略分析 57 61 华中科技大学博士学位论文华中科技大学博士学位论文 7 同时也出现了一些新的思路如博弈参与者一方模仿条件下的合作演化问题 62 64 演化博弈中个体的自适应学习机制等 65 67 这些文献在理论上都对演化博弈论作了进一步的研究其贡献使得演化博弈理论体系更加丰富并日趋完善与演化博弈理论相关的综述文献可以参见文献 68 69 演化博弈在环境污染问题方面的应用相对而言还比较少邱中华 2006 利用演化博弈论分析监察博弈模型通过复制动态方程的动态趋势及稳定性分析及基于雅可比矩阵的局部稳定分析法对监察博弈模型进行讨论分析结果表明该监察博弈模型的委托人和代理人在委托代理过程中行为策略的自发演化过程的所有均衡点都是鞍点没有进化稳定策略 70 卢方元 2007 用演化博弈论的方法分别对生产排污企业之间环保部门和生产排污企业之间相互作用时的策略选择行为进行分析 71 陶建格等人 2009 针对当前环境治理博弈研究中完全信息静态决策和理性决策等的局限性建立了一个环境治理的演化博弈模型分析了参与博弈主体的动态演变过程 72 Yukari 2009 认为在现实中群体中的个体并不仅仅从利益最大化角度选择策略同时也会受到来自各种社会压力和心理因素的影响将公众社会压力量化作为动态选择机制的一个影响因素利用演化博弈分析湖泊污染问题并讨论了各种如检举手段等社会因素对不同利益群体对称与非对称两种情况合作演化的影响 73 目前关于环境污染演化博弈分析主要针对两类群体之间包括企业与企业的对称博弈企业与政府的不对称博弈没有涉及到群体内部如果存在某种竞争机制的情况这主要是受到数学分析工具的限制大多数是在一般支付矩阵条件下对博弈模型的演化稳定策略存在性进行讨论对于各种环境政策及策略对演化博弈均衡的存在性的影响和博弈过程中可能出现的复杂动力学行为并没有加以考虑和分析 d 环境污染中多人博弈问题环境污染中多人博弈问题在环境污染问题中政府与企业之间的监督博弈模型还有一个主要的特点就是多参与者尤其是同一地区的企业之间的关系在经济和有限资源上可能是竞争关系但是从环境监管部门的角度他们却是联合污染的关系 Rosen J B 1965 将企业之间的这种联合污染关系描述为共轭约束博弈 coupled constraint games 并在一定的假设条件下求出博弈均衡解 74 Jacek B Krawczyk 2000 建立了同一流域多参与者的流域博弈模型 River Basin Game 并利用Nikaido Isoda函数法和松弛算法相结合在一定假设条件下求解其博弈均衡 75 这些文献都是从企业联合排污的角度来分析求解问题的博弈均衡也就是说从合作博弈的角度进行分析没有考虑现实中存在更为普遍的竞争情况即政府排污监督下企业之间竞争关系多人多类型博弈理论研究的瓶颈来源于数学工具的求解困难华中科技大学博士学位论文华中科技大学博士学位论文 8 演化博弈提供一种将博弈均衡与动态选择机制相结合的分析方法更适合用来对多人动态博弈的演化过程的分析演化均衡的稳定性分析需要动力系统的理论和方法由于一般的复制动态方程都是非线性的分析具有一定的困难即便简单的不完全信息情形下对于不对称支付矩阵的情况分析也是仅限于支付矩阵为不变常数的情况下并且对演化均衡稳定性分析后所提出的策略建议并没有很有效的实际应用价值也没有对演化博弈中均衡不稳定的情况下提出相应的有效控制策略因此随着研究问题的深入博弈参与者之间各种复杂的影响关系造成了模型求解的困难 76 因此对于此类问题的分析只有通过理论分析与计算机仿真相结合才能得到更好的决策支持对于离散模型和连续模型的计算机仿真存在一定的区别 77 比如对于类似问题的分析最大化原则对于离散问题并非总是适用的 78 即使是简单的函数非线性微分方程的求解也可能出现混沌 79 80 计算机仿真手段能更好的帮助我们发现博弈过程中可能出现的各种动力学行为而这些都是传统博弈Nash均衡理论不能说明的问题 e 博弈仿真与系统动力学博弈仿真与系统动力学演化博弈尤其是多人混合博弈问题的研究目前大多数文献都是采用基于多智能体 Multi Agent 的整体建模仿真来研究合作的涌现问题 81 84 该方法可以用来分析某种固定政策对个体决策行为的影响但是对于动态政策即某个策略随博弈个体决策行为变化而变化的情况基于多智能体的仿真方法就存在一定的困难和局限性从某种意义上讲博弈是一种决策者对对手信息和行动的决策反馈博弈中存在很多反馈的特性如双赢互惠 reciprocity 的概念相互依赖的策略 interdependent choices TFT tit for tat 策略等 85 87 美国麻省理工学院J W Forrester教授于 20 世纪50年代中期创立的系统动力学就是一种研究复杂系统中信息反馈行为有效的计算机仿真方法 88 SD能够从系统整体出发在系统内部寻找和研究相关影响因素注重系统的动态变化与因果影响是一种定性定量相结合的模拟方式能够在非完备信息状态下分析求解复杂问题 Don Hwan Kim 1997 利用系统动力学对一个执法者与违法者之间的混合战略动态博弈模型进行了建模仿真并对博弈过程的动力学行为做了一定分析在揭示了Nash均衡背后隐藏的动态过程的同时对传统静态博弈模型分析结论与现实中存在的矛盾现象作出了合理的解释 89 郑士源 2006 利用系统动力学通过模拟的方法求解完全信息和不完全信息情况下微分博弈的均衡策略将微分博弈转化为博弈的矩阵形式进而方便地求出局中人均衡策略 90 Petia 2000 等人利用SD建立了一个双寡头博弈模型来描述两个竞争者之间的关系其仿真结果表明模型在一定的参数变化条件下系统会出现霍普夫分歧系统收敛到一个有限华中科技大学博士学位论文华中科技大学博士学位论文 9 循环也可能出现类周期和混沌等复杂行为并非出现常规的均衡收敛 91 系统动力学为研究不完全信息条件下动态博弈的复杂演化过程提供了一种有效的辅助分析方法计算机仿真对解决各种环境污染问题提供了一种更为简便和直观的手段 1 2 2 惩罚策略机制研究国家制定各种环境政策来对环境资源进行管理而监管机制则是保证各项法令法规贯彻实施的关键没有一个完善有效的监管机制则难以达到预期执行效果要控制企业的生产排污对环境的影响除了对企业事前征收排污税外同时还必须对企业超标排污行为进行事后惩罚 92 关于惩罚策略研究的相关文献主要包括两类惩罚力度对企业行为的影响和惩罚模式的优化 1 惩罚力度对企业行为影响惩罚力度对企业行为影响关于罚款力度与违法行为之间的关系研究最早作为一个静态问题在一般的均衡框架下进行分析 93 95 Becker 1968 最开始研究惩罚与犯罪率之间的关系文章主要讨论加强立法的手段在静态模型下得到优化惩罚函数应该是违法获益的倍数同时也与监控力度成反比最后得出了最节约开销的策略就是提高惩罚力度减少监控力度 96 Tsebelis 1989 1990 1991 利用非合作博弈理论研究惩罚机制对违法对象的影响发现罚款力度的加大仅仅降低执法力度并不能降低违法频率 97 99 但是在实际的问题中提高罚款的额度却是执法者常常用来抑制违法频率的主要手段之一理论分析结果与现实生活的矛盾产生的原因之一源于静态博弈分析方法难以对政策实施的动态过程作出很好的解释各种环境政策和惩罚手段的实施和见效往往是一个长期的过程对于社会利益和企业行为有着短期和长期的不同效果因此应当动态地对其关系进行分析 Don Hwan Kim 1997 通过基于系统动力学的博弈仿真分析对Tsebelis的结论和现实的矛盾进行解释认为罚款额度的提高至少在短期内能够降低违法者的违法频率 89 Malik 1990b 和Stranlund and Dhanda 1999 研究了超标排污行为对排污交易权执行效果的影响认为排污水平与抽查概率和惩罚力度无关 100 101 Dasgupta et al 2001 和 Foulon et al 2002 从实证角度分析政府的监控执法在企业污染排放方面的作用说明了政府的抽查行为对于企业的超标排污具有一定的威慑作用 102 103 由于忽略了一部分策略对博弈双方获益的影响上述文献所得的结论有一定的局限性而本文第二章在对政府环境监管部门与排污企业之间的混合战略博弈分析和各种环境政策动态仿真结果发现惩罚额度的提高不仅能有效的在短期内抑制企业的超标排污行为同时在降低了博弈双方的均衡策略选择但是过高的罚款则会造成博弈过程的波动性从而带来污染失控的风险提高了政府环境监管部门决策的复杂性和不确定性华中科技大学博士学位论文华中科技大学博士学位论文 10 2 惩罚策略模式优化惩罚策略模式优化企业违法超标排污的现象是普遍存在的而且对于企业的违法行为并不存在一个清晰的惩罚模式或结构 Oljaca et al 1998 从实证的角度研究关于水污染方面的惩罚机制结构发现污染程度历史违法记录和企业规模都会影响其惩罚金额的大小 104 Polinsky and Shavell 1992 和Rousseau and Proost 2005 认为由于违法企业会通过各种手段来降低惩罚额度如隐瞒资产因此惩罚成本会随着罚款额度的增大而增加然而大部分惩罚成本往往假设与罚款尺寸大小无关 105 106 Canmen 2005 从政府与企业合作的角度出发假设企业可以选择污染净化技术以降低罚款时最优策略反而会引起更多企业的超标排污行为加重环境污染 107 根据Harrington 2003 的研究数据 Canmen 2008 提出一个优化的环境政策包括排污标准和抽查罚款概率而对超标排污企业的惩罚策略应该考虑两个部分一部分是与企业超标排污带来的环境污染破坏程度另一部分则是企业超标排污行为带来的生产经济利益和竞争优势等间接影响因素 108 109 上述文献从实证和理论对环境政策的优化和惩罚机制方面进行了一定的研究但是关于惩罚策略方面主要是对罚款额度进行讨论极少对惩罚策略的结构本质进行分析而Canmen 2008 提出的惩罚策略二元结构由于主要是从实证数据分析所得尽管为惩罚策略的设计提供了一定的参考意义但是仍然无法从理论分析判断该惩罚策略结构的有效性分析环境监管部门与生产排污企业之间的博弈关系不仅仅是为了分析建立模型进行预测更希望通过研究能够通过分析优化惩罚策略结构改变企业排污行为从而改善环境污染问题减低环境污染反弹的失控风险单纯的利用动态博弈分析和各种策略仿真是难以找到一个惩罚策略结构并按照不同的目标进行优化 Feichtinger 1983 利用微分博弈分析罪犯和警察之间的犯罪控制问题 110 Souam 2001 在静态和非对称信息的条件下讨论各种不同罚款范围下的最优犯罪控制策略 111 Evgenia Motchenkova 2008 在 Feichtinger模型的基础上分析欧洲与美国的现有反垄断惩罚策略并提出一个有效控制违法行为的惩罚策略该惩罚策略是关于违法力度和执法力度的函数 112 但是这些文献都仅仅考虑罚款对违法者的直接的获益影响而本文第 5 章考虑在环境污染这样一个具体问题背景下惩罚机制中不仅仅包括罚款还考虑企业因停产整顿而带来的影响条件下为了抑制企业的超标排污行为而对惩罚策略进行

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf

文档简介

温馨提示

最新文档

评论

环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf

文档简介

温馨提示

最新文档

评论

相关文档