环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf_第1页
环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf_第2页
环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf_第3页
环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf_第4页
环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf_第5页
已阅读5页,还剩101页未读 继续免费阅读

环境污染监督博弈的动态性分析与控制策略论文(PDF 106页).pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学 博士学位论文 环境污染监督博弈的动态性分析与控制策略 姓名 蔡玲如 申请学位级别 博士 专业 系统工程 指导教师 王红卫 2010 03 29 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 I 摘摘 要要 政府对生产排污企业的监管机制是降低环境污染失控引起的风险和落实各项环 境政策的关键 环境污染问题的动态性和复杂性使得对它的预测和控制经常失效 因此 对环境污染监管机制的研究刻不容缓 博弈论为解决环境问题中各种冲突关 系提供了一种有效的理论工具 然而 目前利用传统博弈论分析环境问题主要关注 博弈均衡的求解问题 忽略了有限理性条件下动态博弈过程的不确定性 近年来基 于有限理性的演化博弈研究主要讨论演化稳定策略的存在性 缺少对该问题相关控 制策略的分析 而针对环境污染中多人博弈问题 现有文献主要从企业 联合排污 的合作角度分析 忽略了企业之间普遍存在的 竞争 关系 鉴于此 本文尝试分 析政府与生产排污企业之间监督博弈的动态演化过程 利用惩罚策略对博弈过程的 波动性进行优化控制 抑制企业的超标排污行为 本文以政府与生产排污企业之间的监督博弈演化过程为研究对象 以优化惩罚 策略为主要控制手段 围绕博弈的动态性分析和稳定性控制展开研究 文中利用博 弈论对政府与生产排污企业之间长期的动态监督关系进行建模 将动态系统分析工 具与系统动力学计算机仿真手段相结合 分析惩罚策略等环境政策对博弈过程和均 衡的影响 揭示博弈过程的动态性 并尝试给出惩罚策略优化结构模式 具体来说 本文首先建立政府与生产排污企业之间混合战略博弈的系统动力学 仿真模型 在假设博弈参与者策略变化率与期望获益成正比的条件下 分别分析了 初始模型和信息延迟模型 在初始模型中假设信息获取不存在延迟 则博弈均衡需 要经过多次博弈才能达到 在信息延迟模型中 针对博弈均衡的不可达提出了双重 惩罚策略 通过稳定性分析指出了模型的均衡状态为临界稳定 任何微小的扰动都 可能造成博弈均衡的不可达 从而揭示博弈过程动态性研究的重要性 接着 考虑有限理性条件下政府与生产排污企业之间的监督博弈动态演化过程 针对一般支付矩阵下不存在演化稳定策略的情况 提出了罚款额度与污染程度相关 的动态惩罚策略 并通过理论分析和仿真证明了动态惩罚策略条件下演化稳定均衡 的存在性 随后 进一步考虑政府对竞争条件下两个企业的监督博弈动态演化过程 通过 对多人不对称演化博弈过程的仿真分析 指出罚款额度的惩罚系数 k 的大小与博弈 过程的动态性密切相关 一般惩罚策略能有效抑制环境污染 而动态惩罚策略则在 博弈过程波动性控制方面具有明显效果 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 II 以控制环境污染和抑制博弈过程波动性为目标 本文最后优化惩罚策略模式结 构 分析了带停产整顿期 SOP 和不带停产整顿期 NSOP 的两种惩罚机制下政府与生 产排污企业的微分博弈模型 指出了优化的惩罚策略模式不仅与企业超标排污行为 相关 而且与政府环境监管部门的策略选择相关 关键词 关键词 环境污染 监督博弈 控制策略 惩罚策略优化 动态性分析 演化稳定策 略 多人不对称演化博弈 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 III Abstract The supervision mechanism of environmental regulation is critical to reduce the risk of the uncontrollable pollution and to ensure the performance of environment policies The dynamics and complexity of the environmental pollution commonly invalidates the prediction and control strategies in real life Therefore it is essential to investigate the environmental supervision mechanism Game theory is an effective methodology to resolve the conflicts on the environmental resources However the related ressarch works up to date mainly focus on finding the equilibrium states using traditional game theory regardless of the uncertainties induced by the bounded rationality in the dynamic gaming procedure The recent studies on the application of evolutionary game mostly pay attention to the existence of the Evolutionary Stable Strategy in spite of the discussion about the control strategies Researches on multi person game focused on the cooperative pollution firms neglecting the fact that the competitions between firms are more common Thus the objective of this thesis is to investigate the dynamic procedure of supervisory game and to optimize the penalty mechanism to control the over pollution behavior of firms This thesis investigates the dynamics analysis of evolutionary procedure of supervisory game and the optimization of punishment strategy as a control method The long term dynamic supervisory relationship between government and polluting firms is modelled using game theory The dynamic systems analysis methodology combined with System Dynamics SD are used to study the effects of environment policies especially the penalty mechanism on the Nash equilibrium and the complex dynamic gaming procedure An optimized punishment strategy is proposed in a differential game framework In particular this thesis firstly develops a System Dynamic model for mixed strategy game between the government and the polluting firm without or with the consideration of information delay For the case without information delay it takes both game players a long time to reach the Nash equilibrium For the case with information delay a double penalty is proposed to deal with the unreachable Nash equilibrium As a critical stable state the Nash equilibrium might be unreachable by any small perturbation So the dynamic analysis of paths to the equilibrium state is more significant than the Nash equilibrium itself Subsequently considering the bounded rational of decision makers the dynamic evolutionary procedure of two player asymmetric game model is investigated A dynamic 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 IV penalty is suggested to deal with the problem that there does not exit evolutionary stable strategy ESS under the condition of static payoff matrix Theory analysis and computer simulation validate the dynamic penalty This thesis further considers the competitive relationships between the polluting firms The dynamic procedure of multi person asymmetric evolutionary game model is developed The penalty factor k which indicates the limit of fine is closely related with the volatility of the dynamic evolutionary procedure The static penalty has a better effect on the restrain of environmental pollution while the dynamic one can stabilize the fluctuation during the evolutionary game procedure Lastly it is considered within the framework of a differential game that the enforcement of regulator using an appropriate penalty can force a polluting firm to act in a socially optimal way Two different penalty mechanisms one with the suspension of production SOP and the other without SOP NSOP are discussed A completely restraining penalty CRP which relates to both players strategies is identified to reduce the probability of the firm s pollution behaviors Key words Environmental pollution supervisory game control strategy optimized punishment strategy dynamic analysis Evolutionary Stable Strategy multi person asymmetric evolutionary game 独创性声明独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果 尽我所知 除文中已经标明引用的内容外 本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果 对本文的研究做出贡献的个人和集体 均已在 文中以明确方式标明 本人完全意识到 本声明的法律结果由本人承担 学位论文作者签名 日期 年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留 使用学位论文的规定 即 学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版 允许论文被查阅和借阅 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索 可以采用影印 缩印或扫描等复制手段保存和汇编本学位论文 保 密 在 年解密后适用本授权书 不保密 请在以上方框内打 学位论文作者签名 指导教师签名 日期 年 月 日 日期 年 月 日 本论文属于 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 1 1 绪论 1 1 问题的提出 目的和意义 环境危机正在越来越严重地制约着我国经济的发展 改革开放以来 中国工业 化进程加快 在经济高速发展的同时 带来了严峻的环境污染和生态破坏问题 1 2 环境治理问题错综复杂 国家环保部门花费了大量的人力物力 却得不到根治 反 而出现 污染反弹 现象 3 Pigou 1920 将私人厂商生产所造成的环境破坏使社会 福利受到损失的现象 称为 环境外部不经济性 4 环境污染的外部不经济性主要 表现在企业或者个人任意利用环境要素产生自身利益 而产生的环境成本却转嫁给 了他人和社会 环境质量不断的恶化源于其 外部不经济性 单纯通过污染治理并 不能从根本上解决环境污染问题 不管是采取市场经济手段 如排污权交易 还是 行政法律手段来解决环境污染问题 政府对企业生产排污的监管机制是关键 一个 设计完善的环境保护政策 如果没有合理的监管机制保证其顺利实施 同样难以达 到预期目的 因此 一个完善的监管机制能有效降低环境污染失控引起的风险 对 真正落实各项环保政策起着非常重要的作用 目前 环境污染的最主要来源是各种 工业生产排污 因此政府环境监管部门的主要监督对象是各种生产排污的企业 作 为独立的经济个体 生产排污企业会利用各种手段实现其利益最大化的目的 包括 决定是否超标排污及其程度 将部分污染处理成本转嫁给他人和社会 政府环境监 管部门作为社会整体利益的代表 完全对所有企业排污情况进行实时监控代价是十 分高昂的 因此 政府环境监管部门只能通过对企业生产排污抽查的方式和制定相 应的惩罚策略来避免企业超标排污行为造成的环境外部不经济性 但是 无论采取 多么严厉的惩罚 企业重复污染和政府监控失灵的情况却无法避免 在环境污染问题中政府对生产排污企业的监管机制主要有两个特点 一是在环 境资源问题上 以社会总体利益最大化为目标的政府与以个体经济利益最大化为目 标的生产排污企业之间的利益冲突 另外一个就是环境污染问题本身的动态性 自 从 19 世纪 80 年代 Hardin利用非合作博弈论揭示了环境的不断恶化是一种 公地悲 剧 从此 博弈论逐渐被广泛地应用于解决环境问题中各种冲突关系 5 随着环境 污染问题研究的深入 理性假设条件下的传统经济学分析手段所得到的结果已经难 以合理地解释各种日益复杂的环境污染问题并提供决策指导 首先 环境污染问题本身的性质决定了动态性分析的重要性 环境问题从研究 对象的角度出发 大致分为两类 一类问题认为环境的破坏程度仅仅与污染的速度 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 2 相关 不考虑累积污染量的破坏程度 这一类问题从本质上来说是静态的 另外一 类问题 比如气候变化 大气二氧化碳加速 臭氧消耗 氟氯碳的累积 生物物 种的减少 酸雨和海洋捕杀等 关注的是污染在累积过程中造成的环境破坏 因此 利用传统的静态博弈模型分析政府与排污企业之间的监督关系所得到的分析结果和 策略具有一定的局限性 难以获得切实可行的环境污染控制策略 其次 环境污染问题的复杂性决定了动态博弈的有限理性 由于环境资源本身 的特点 政府政策执行问题的复杂性和不同企业之间的理性差异导致博弈双方完 全理性的条件在现实生活中是难以达到的 在实际环境污染问题中 政府环境监 管部门与生产排污企业之间的监督博弈关系不仅是一个动态博弈 也是一个长期的 博弈 博弈双方往往不可能在一开始就找到最优的策略 而是在多次博弈过程中 根据各自的目标和各种信息 通过模仿 变异等各种动态过程寻找优化策略 因 此 博弈双方的有限理性和各种不确定性导致环境监管部门与生产排污企业之间博 弈均衡和演化过程往往表现出复杂的动态性 最后 环境博弈问题的复杂动态性决定了将模型动态性分析与政策的计算机仿 真相结合的必要性 微分博弈 演化博弈理论等为分析环境污染中监督机制问题提 供了一种有效的动态模型分析框架 但是由于数学工具的限制 较复杂的获益函数 在理论求解上显得非常困难 尤其是当涉及到两个以上的博弈参与者时 则只能借 助计算机仿真进行辅助分析 完全理性的传统经济学假设在环境污染这一类复杂的 问题中是难以达到的 传统博弈均衡理论给出的分析往往是考虑均衡存在与否 而 难以对不同初始状态下均衡的可达性作出分析 各种环境政策和监管机制的效果并 非短期就能看到效果 因此有必要通过一定的模型分析和仿真来对其短期和长期的 影响进行分析 环境污染涉及的监管机制优化问题研究的关键是对政府环境监管部门与企业之 间在环境资源利用上的利益冲突做长期的动态的分析 由于环境资源污染的事后治 理代价往往是事前预防开销的数倍 政府环境监管部门不仅要考虑企业短期排污行 为 还要考虑企业长期排污习惯对于环境污染问题的影响 因此利用博弈论分析政 府环境监管部门与生产排污企业之间在环境污染问题上的利益冲突不应该只限于对 一次性博弈结果或者短期博弈均衡等的预测 更重要的是在比较稳定的环境下 对 其长期博弈过程的动力学行为的分析和预测 基于博弈论的环境污染问题研究目前 已经取得了一定的进展和成果 但是从目前已知参考文献的研究水平来看 尤其是 国内 仍然处于起步和摸索阶段 环境污染动态博弈问题的分析思路和方法有待进 一步突破 因此 本文尝试解决以下问题 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 3 1 监督博弈动态仿真分析 通过对政府环境监管部门与生产排污企业之间的 混合战略博弈进行动态建模仿真分析 揭示传统 Nash 博弈均衡背后的动态性 从而 对现实生活中 污染反弹 现象作出合理解释 分析提高惩罚力度 降低抽查费用 等策略对企业行为和环境污染水平的影响 2 监督博弈演化过程稳定性控制问题 在复杂博弈环境中 对政府环境监管 部门与生产排污企业博弈模型进行演化稳定性分析 从惩罚策略的角度提出控制策 略 有效降低环境污染失控引起的风险 3 惩罚策略制定和优化问题 分析惩罚额度和结构模式对博弈过程和结果的 影响 从降低环境污染水平和稳定博弈过程波动性两方面对惩罚策略进行优化 减 低各种不确定因素和信息对各种环境政策实施的影响 从而提高政府的监管效率 1 2 相关文献综述相关文献综述 本文主要研究的对象是环境污染问题中 政府环境监管部门与生产排污企业之 间一类监督博弈的动力学行为及惩罚策略机制 因此主要对博弈论在环境污染各种 冲突问题的应用以及政府与企业之间的监督惩罚机制方面的研究进展作综述 本节 综述将分三部分展开 环境污染问题中的博弈 惩罚策略机制相关研究及环境污染 其他问题相关研究 1 2 1 环境污染问题中的博弈 环境污染问题从经济学角度出发是源于环境资源本身的外部不经济性 因此单 纯靠环境治污是难以解决该问题的 环境污染问题的产生最主要的原因是企业自身 利益最大化与社会整体利益之间的冲突 而博弈论为解决环境污染问题提供了一种 解决冲突的理论方法 6 7 1 完全理性条件下经典博弈理论与环境污染问题完全理性条件下经典博弈理论与环境污染问题 传统博弈理论从理性人出发 认为参与人都是行为最优化者 有什么样的条件 就会得出什么样的结果 结果与条件是一一对应的 并且系统会在均衡之间跳跃式 的发展 因而不需要也不必要对均衡过程进行分析 所谓的动态过程即是指其信息 传递参与人对信息的反应过程 a 资源获益分配问题与资源获益分配问题与 公地悲剧 公地悲剧 合作博弈主要是研究人们达成合作时如何分配合作得到的收益 即收益分配问 题 在 20 世纪 80 年代主要被用于解决和协调水资源冲突等方面 如各种合作水利 工程的费用公摊和获益分配问题 8 12 Kucukmehmetoglu and Guldman 2004 利用合 作博弈论对三个国家对作为公共资源的河流的分配问题作了研究 13 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 4 随着博弈理论的发展和应用领域的扩展 研究者发现 合作应该是理论的结果 而并非前提 应该以非合作博弈 non cooperative game 的方式建模描述合作的达成 非合作博弈理论适用于更广泛的社会经济形式 14 15 非合作博弈论研究人们在利益 相互影响的局势中如何决策使自己的收益最大 即策略选择问题 在环境问题中最 著名的就是Hardin在 1968 年发表的关于 公地悲剧 tragedy of the commons 的论文 该论文指出了如果不对公共资源的使用加以限制 而被自由使用 则公共资源最终 将被完全耗尽 16 吴伟 2001 参照 公地悲剧 从环境的污染和治理两个方面分析 博弈的决策和决策的均衡问题 结果发现 环境作为公共资源被过度利用的同时 作 为公共物品的治理环境污染的物质总供给却不足 两个方面作用的结果必然使环境 污染日益严重 17 王冬梅 2004 阐述了博弈论的各种类型的基本理论在环境保护中 的应用 如生产排污企业之间对于环境资源保护的 囚徒困境 不同规模的生产企 业的 智猪博弈 等 18 尽管非合作博弈论的应用前景为多数经济学家所看好 然而 美中不足的是一 个博弈往往存在多个纳什均衡 对于两人零和博弈而言 多个均衡存在并没有太大 的实质问题 19 但是在两人非零和博弈和多人博弈中均衡的选择问题就难以解决了 当存在多个均衡时 若期望一定达到某个纳什均衡 则必须存在某种能够导致每个 博弈方都预期到该均衡出现的机制 mechanism 20 b 环境污染中的动态博弈环境污染中的动态博弈 环境污染动态博弈问题的应用从研究对象的特性大致可以分为两类 一类是考虑 环境的破坏程度仅仅与污染的速度相关 而不考虑累积污染量的破坏程度 即当问 题的本质是静态的 这一类的环境污染问题研究比较多的是针对 囚徒困境 合作 问题的讨论 主要是利用重复博弈 repeated game 进行分析 Tsutsui等人 1990 证明 了在单阶段的双人对称博弈存在非线性马尔科夫均衡 Dockner 1993 和 Feichtinger 1993 将Tsutsui的结论应用于全球污染问题的分析 21 23 M ler 1991 发 现当博弈的基本类型是囚徒困境的时候 尽管合作可以产生帕累托最优结果 而且 每个国家一旦背叛合作或者在减少污染中搭 顺风车 都会面对面临严厉的惩罚 但是合作以降低污染是难以实现的 24 Fudenberg and Tirole 1991 利用重复博弈分析 囚徒困境模型是发现 如果参与者知道彼此博弈不仅仅是一次 他们有足够的耐心 同时他们也无法预知博弈何时会结束时 帕累托最优结果是可以达到的 25 Barrett 1994 和Carraro and Siniscalco 1993 研究扩展的囚徒困境模型时发现 在单次 博弈中 部分博弈者的有限合作是存在均衡的 26 27 Batabyal 1995 1996 利用 Stackelberg动态博弈来描述具有先动优势的政府与排污企业之间的关系 28 29 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 5 Thomas 1998 将遗传算法引入到该问题的动态博弈模型中以解决信息不完全和不完 美带来的求解困难 Damania R 2001 利用重复博弈分析了政府环境法规对需求不确 定条件下垄断企业策略影响 结果征收排污税将会影响企业的财政结构并降低企业 的市场竞争力 30 Zenkevich N and Zyatchin A 2007 利用重复博弈分析了共享排 污权的三个企业之间排污量分配问题 31 在现实中 政府往往难以直接观测到企业 行为或者采用某种激励方法获得关于企业成本函数的相关信息时 信息不完全和不 完美使得博弈分析变得十分复杂 32 在重复博弈中 博弈环境一般是假设不变的 而在实际的环境污染问题中 博弈环境并非一成不变的 会随着博弈过程而自我演 变成为其博弈结果 另一类是考虑污染的累积过程中给环境带来的破坏 目前此类环境问题 比如 气候变化 大气二氧化碳加速 臭氧消耗 氟氯碳的累积 生物物种的减少 酸 雨和海洋捕杀等 博弈者关注的是污染的累积 即污染的累积量是与博弈支付函数 相关的 大部分用微分博弈 differential game 来描述 一般的动态博弈模型讨论的都 是离散的博弈过程 微分博弈将博弈理论扩展到连续时间上 博弈参与者可以在无 限小的时间段内改变自己的策略 微分博弈适合用来描述连续博弈系统的动态演化 过程 近年来主要集中在跨国界污染问题 酸雨博弈模型 33 34 35 博弈双方的合作 不仅仅有利于总体获益的提高 也能降低污染排放 降低污染水平 36 但是如果合 作能够促进合约双方获益的增加 为什么在实际中各种环境公约却难以被大家遵 守 国家之间的不对称造成搭 顺风车 行为的产生是其原因之一 不少学者尝试 利用微分博弈从个体理性 Individual Rationality 的角度出发制订相应的环境公约以 保证博弈过程中 任何参与者合作的获益都不会低于违约的获益 从而达到提高环 境质量的目的 J rgensen and Zaccour 2001a 2001b 2003 建立了两个国家之间污染 问题的微分博弈 从个体理性 Individual Rationality 的角度出发制订相应的环境公约 以保证博弈过程中 任何参与者合作的获益都不会低于违约的获益 从而达到提高 环境质量的目的 37 39 Cabo et al 2006 在其基础上 从经济协调的角度 利用微分 博弈研究建两个具有进出口贸易关系的不对称国家之间环境问题 提出了一个考虑 动态个体理性的环境公约 40 利用微分博弈分析问题 在连续的时间上要直接描述 博弈参与者彼此之间的最优策略反应关系在数学处理上往往存在一定的难度 其应 用的障碍之一就是在于求解困难 目前主要的分析工具是Hamilton Jacobin理论 然 而一般情况下表现为复杂的偏微分方程组 在状态变量规律比较复杂时 其求解就 非常困难 因此模型一般还有各种严格的限制和假设 微分博弈另外一个应用限制 就是不容易清晰地考察策略的相互反应关系 闭环均衡概念限制了博弈参与者的策 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 6 略空间 复杂的策略又难以进行规范分析 而当引入不完全信息时 根本就无法求 解均衡 41 2 有限理性条件下演化博弈与环境污染问题有限理性条件下演化博弈与环境污染问题 进化博弈理论从有限理性的参与人群体出发 认为参与人并不是行为最优化者 系统达到均衡并不是瞬间可以完成的 而需要一个复杂的渐进过程 均衡结果是依 赖于达到均衡的路径 分析系统达到均衡的过程是理论的核心之所在 有限理性 指的是博弈参与者具有一定的统计分析能力和对不同策略获益的事后判断能力 但 是缺乏事前的预见和预测能力 有限理性意味着 1 博弈的过程同时也是个学习的 过程 在学习中 博弈参与者通过模仿与比较寻找优化策略 2 一般总有部分博弈 参与者不会采用完全理性的均衡策略 这是因为除了均衡总在不断地调整之外 也 存在博弈参与者找到了最优策略而又再次偏离的可能 c 哈林顿悖论与有限理性哈林顿悖论与有限理性 Harrington 1988 通过对美国 70 年代末 80 年代初 包括Russell et al 1986 在内 的关于监控 执法和各种环境法律法规的执行情况研究分析 对Becker s 1968 的理 性犯罪理论提出了质疑 他认为惩罚力度并非越严厉越有效 限制惩罚的额度反而 能提高执法机构的效率 42 43 这就是著名的 哈林顿悖论 不少文献在其理论基 础上作进一步研究或者对悖论进行解释 44 49 Karine 2006 通过对挪威环境法规相 关数据深入分析后认为 哈林顿悖论 只能作为一个假设 而非事实 50 Harrison and Antweiler 2002 针对学术界提出的不少企业为减少对环境的影响而采取自愿环保行 动一说 采用加拿大国家污染排放记录数据考察了企业减少污染排放的动机 结果 发现企业减少污染排放并非是一种自愿行为 而是受到政府管制和公众压力等各方 面影响产生的结果 51 近年来不少学者也认为并非所有的环境资源问题都是 公地 悲剧 人类社会中的个体行为不仅仅受到经济因素的影响 同时也会考虑其他心理 因素 从而存在合作的可能 52 54 Yukari 2009 在此基础上 将各种心理因素作为 一种社会压力 研究经济成本与社会压力平衡下的合作演化趋势 55 从Becker s的 理性犯罪理论 到 哈林顿悖论 不少文献通过实际数据和理论分析都说明了利用 完全理性的传统经济学方法分析环境污染问题中的企业行为得到的结果与现实往往 存在很大的差异 随着博弈论的发展及应用领域的深入研究 人们开始对传统经济博弈论中博弈 者完全理性的假设条件产生质疑 而博弈论在生物学领域的应用而发展起来的演化 博弈理论为人们分析社会经济领域中各种复杂的动态长期冲突关系提供了一种新的 思路 56 目前 国外演化博弈论的研究主要集中在博弈演化稳定策略分析 57 61 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 7 同时也出现了一些新的思路 如博弈参与者一方模仿条件下的合作演化问题 62 64 演化博弈中个体的自适应学习机制等 65 67 这些文献在理论上都对演化博弈论作了 进一步的研究 其贡献使得演化博弈理论体系更加丰富并日趋完善 与演化博弈理 论相关的综述文献可以参见文献 68 69 演化博弈在环境污染问题方面的应用相对而言还比较少 邱中华 2006 利用演 化博弈论分析监察博弈模型 通过复制动态方程的动态趋势及稳定性分析及基于雅 可比矩阵的局部稳定分析法对监察博弈模型进行讨论 分析结果表明 该监察博弈 模型的委托人和代理人在委托代理过程中行为策略的自发演化过程的所有均衡点都 是鞍点 没有进化稳定策略 70 卢方元 2007 用演化博弈论的方法分别对生产排污 企业之间 环保部门和生产排污企业之间相互作用时的策略选择行为进行分析 71 陶建格等人 2009 针对当前环境治理博弈研究中完全信息 静态决策和理性决策等的 局限性 建立了一个环境治理的演化博弈模型 分析了参与博弈主体的动态演变过 程 72 Yukari 2009 认为在现实中 群体中的个体并不仅仅从利益最大化角度选择策 略 同时也会受到来自各种社会压力和心理因素的影响 将公众社会压力量化作为 动态选择机制的一个影响因素 利用演化博弈分析湖泊污染问题 并讨论了各种如 检举手段等社会因素对不同利益群体 对称与非对称两种情况 合作演化的影响 73 目前关于环境污染演化博弈分析主要针对两类群体之间 包括企业与企业的对 称博弈 企业与政府的不对称博弈 没有涉及到群体内部如果存在某种竞争机制的 情况 这主要是受到数学分析工具的限制 大多数是在一般支付矩阵条件下对博弈 模型的演化稳定策略存在性进行讨论 对于各种环境政策及策略对演化博弈均衡的 存在性的影响和博弈过程中可能出现的复杂动力学行为并没有加以考虑和分析 d 环境污染中多人博弈问题环境污染中多人博弈问题 在环境污染问题中政府与企业之间的监督博弈模型还有一个主要的特点就是多 参与者 尤其是同一地区的企业之间的关系 在经济和有限资源上可能是竞争关系 但是从环境监管部门的角度他们却是 联合 污染的关系 Rosen J B 1965 将企业 之间的这种 联合 污染关系描述为共轭约束博弈 coupled constraint games 并在一定 的假设条件下求出博弈均衡解 74 Jacek B Krawczyk 2000 建立了同一流域多参与 者的流域博弈模型 River Basin Game 并利用Nikaido Isoda函数法和松弛算法相结 合在一定假设条件下求解其博弈均衡 75 这些文献都是从 企业联合排污 的角度 来分析求解问题的博弈均衡 也就是说从合作博弈的角度进行分析 没有考虑现实 中存在更为普遍的竞争情况 即政府排污监督下企业之间 竞争关系 多人多类型 博弈理论研究的瓶颈来源于数学工具的求解困难 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 8 演化博弈提供一种将博弈均衡与动态选择机制相结合的分析方法 更适合用来 对多人动态博弈的演化过程的分析 演化均衡的稳定性分析需要动力系统的理论和 方法 由于一般的复制动态方程都是非线性的 分析具有一定的困难 即便简单的 不完全信息情形下 对于不对称支付矩阵的情况分析也是仅限于支付矩阵为不变常 数的情况下 并且对演化均衡稳定性分析后所提出的策略建议并没有很有效的实际 应用价值 也没有对演化博弈中均衡不稳定的情况下提出相应的有效控制策略 因 此 随着研究问题的深入 博弈参与者之间各种复杂的影响关系造成了模型求解的 困难 76 因此 对于此类问题的分析只有通过理论分析与计算机仿真相结合才能得 到更好的决策支持 对于离散模型和连续模型的计算机仿真存在一定的区别 77 比 如 对于类似问题的分析 最大化原则对于离散问题并非总是适用的 78 即使是简 单的函数 非线性微分方程的求解也可能出现混沌 79 80 计算机仿真手段能更好的 帮助我们发现博弈过程中可能出现的各种动力学行为 而这些都是传统博弈Nash均 衡理论不能说明的问题 e 博弈仿真与系统动力学博弈仿真与系统动力学 演化博弈 尤其是多人混合博弈问题的研究 目前大多数文献都是采用基于多 智能体 Multi Agent 的整体建模仿真来研究合作的涌现问题 81 84 该方法可以用来 分析某种固定政策对个体决策行为的影响 但是对于动态政策 即某个策略随博弈 个体决策行为变化而变化的情况 基于多智能体的仿真方法就存在一定的困难和局 限性 从某种意义上讲 博弈是一种决策者对对手信息和行动的决策反馈 博弈中 存在很多反馈的特性 如双赢互惠 reciprocity 的概念 相互依赖的策略 interdependent choices TFT tit for tat 策略等 85 87 美国麻省理工学院J W Forrester教授于 20 世 纪50年代中期创立的系统动力学就是一种研究复杂系统中信息反馈行为有效的计算 机仿真方法 88 SD能够从系统整体出发 在系统内部寻找和研究相关影响因素 注 重系统的动态变化与因果影响 是一种定性定量相结合的模拟方式 能够在非完备 信息状态下分析求解复杂问题 Don Hwan Kim 1997 利用系统动力学对一个执法者 与违法者之间的混合战略动态博弈模型进行了建模仿真 并对博弈过程的动力学行 为做了一定分析 在揭示了Nash均衡背后隐藏的动态过程的同时 对传统静态博弈 模型分析结论与现实中存在的矛盾现象作出了合理的解释 89 郑士源 2006 利用系 统动力学通过模拟的方法求解完全信息和不完全信息情况下微分博弈的均衡策略 将微分博弈转化为博弈的矩阵形式 进而方便地求出局中人均衡策略 90 Petia 2000 等人利用SD建立了一个双寡头博弈模型来描述两个竞争者之间的关系 其仿真结果 表明模型在一定的参数变化条件下 系统会出现霍普夫分歧 系统收敛到一个有限 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 9 循环 也可能出现类周期和混沌等复杂行为 并非出现常规的均衡收敛 91 系统动 力学为研究不完全信息条件下动态博弈的复杂演化过程提供了一种有效的辅助分析 方法 计算机仿真对解决各种环境污染问题提供了一种更为简便和直观的手段 1 2 2 惩罚策略机制研究 国家制定各种环境政策来对环境资源进行管理 而监管机制则是保证各项法令 法规贯彻实施的关键 没有一个完善有效的监管机制 则难以达到预期执行效果 要控制企业的生产排污对环境的影响 除了对企业 事前征收排污税 外 同时还 必须对企业超标排污行为进行 事后惩罚 92 关于惩罚策略研究的相关文献主要 包括两类 惩罚力度对企业行为的影响和惩罚模式的优化 1 惩罚力度对企业行为影响惩罚力度对企业行为影响 关于罚款力度与违法行为之间的关系研究最早作为一个静态问题在一般的均衡 框架下进行分析 93 95 Becker 1968 最开始研究惩罚与犯罪率之间的关系 文章主 要讨论加强立法的手段 在静态模型下得到优化惩罚函数应该是违法获益的倍数 同时也与监控力度成反比 最后得出了最节约开销的策略就是提高惩罚力度 减少 监控力度 96 Tsebelis 1989 1990 1991 利用非合作博弈理论研究惩罚机制对违法对 象的影响 发现罚款力度的加大仅仅降低执法力度 并不能降低违法频率 97 99 但 是在实际的问题中 提高罚款的额度却是执法者常常用来抑制违法频率的主要手段 之一 理论分析结果与现实生活的矛盾产生的原因之一源于静态博弈分析方法难以 对政策实施的动态过程作出很好的解释 各种环境政策和惩罚手段的实施和见效往 往是一个长期的过程 对于社会利益和企业行为有着短期和长期的不同效果 因此 应当动态地对其关系进行分析 Don Hwan Kim 1997 通过基于系统动力学的博弈仿 真分析对Tsebelis的结论和现实的矛盾进行解释 认为罚款额度的提高 至少在短期 内能够降低违法者的违法频率 89 Malik 1990b 和Stranlund and Dhanda 1999 研究 了超标排污行为对排污交易权执行效果的影响 认为排污水平与抽查概率和惩罚力 度无关 100 101 Dasgupta et al 2001 和 Foulon et al 2002 从实证角度分析政府的 监控执法在企业污染排放方面的作用 说明了政府的抽查行为对于企业的超标排污 具有一定的威慑作用 102 103 由于忽略了一部分策略对博弈双方获益的影响 上述 文献所得的结论有一定的局限性 而本文第二章在对政府环境监管部门与排污企业 之间的混合战略博弈分析和各种环境政策动态仿真 结果发现惩罚额度的提高 不 仅能有效的在短期内抑制企业的超标排污行为 同时在降低了博弈双方的均衡策略 选择 但是 过高的罚款 则会造成博弈过程的波动性 从而带来污染失控的风险 提高了政府环境监管部门决策的复杂性和不确定性 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 10 2 惩罚策略模式优化惩罚策略模式优化 企业违法超标排污的现象是普遍存在的 而且对于企业的违法行为并不存在一 个清晰的惩罚模式或结构 Oljaca et al 1998 从实证的角度研究关于水污染方面的 惩罚机制结构 发现污染程度 历史违法记录和企业规模都会影响其惩罚金额的大 小 104 Polinsky and Shavell 1992 和Rousseau and Proost 2005 认为由于违法企业会 通过各种手段来降低惩罚额度 如隐瞒资产 因此惩罚成本会随着罚款额度的增大 而增加 然而大部分惩罚成本往往假设与罚款尺寸大小无关 105 106 Canmen 2005 从政府与企业合作的角度出发 假设企业可以选择污染净化技术以降低罚款时 最 优策略反而会引起更多企业的超标排污行为 加重环境污染 107 根据Harrington 2003 的研究数据 Canmen 2008 提出 一个优化的环境政策包括 排污标准和抽查罚款 概率 而对超标排污企业的惩罚策略应该考虑两个部分 一部分是与企业超标排污 带来的环境污染破坏程度 另一部分则是企业超标排污行为带来的生产经济利益和 竞争优势等间接影响因素 108 109 上述文献从实证和理论对环境政策的优化和惩罚 机制方面进行了一定的研究 但是关于惩罚策略方面 主要是对罚款额度进行讨论 极少对惩罚策略的结构本质进行分析 而Canmen 2008 提出的惩罚策略二元结构由 于主要是从实证数据分析所得 尽管为惩罚策略的设计提供了一定的参考意义 但 是仍然无法从理论分析判断该惩罚策略结构的有效性 分析环境监管部门与生产排 污企业之间的博弈关系 不仅仅是为了分析建立模型进行预测 更希望通过研究能 够通过分析优化惩罚策略结构 改变企业排污行为 从而改善环境污染问题 减低 环境污染反弹的失控风险 单纯的利用动态博弈分析和各种策略仿真是难以找到一 个惩罚策略结构并按照不同的目标进行优化 Feichtinger 1983 利用微分博弈分析 罪犯和警察之间的犯罪控制问题 110 Souam 2001 在静态和非对称信息的条件下讨 论各种不同罚款范围下的最优犯罪控制策略 111 Evgenia Motchenkova 2008 在 Feichtinger模型的基础上分析欧洲与美国的现有反垄断惩罚策略 并提出一个有效控 制违法行为的惩罚策略 该惩罚策略是关于违法力度和执法力度的函数 112 但是这 些文献都仅仅考虑罚款对违法者的直接的获益影响 而本文第 5 章考虑在环境污染 这样一个具体问题背景下 惩罚机制中不仅仅包括罚款 还考虑企业因停产整顿而 带来的影响条件下 为了抑制企业的超标排污行为而对惩罚策略进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论