




已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
经济实验的控制与设计 经济实验的控制机理 经济实验是在可控的实验环境下 针对某一经济现象 通过控制某些条件 假设 来改变实验的环境或规则 并观察实验对象的行为 分析实验的结果 以检验 比较和完善经济理论并为政策决策提供依据 如何准确掌握和控制经济学实验中的规律 正确选择和激励实验对象 一直是实验经济学家努力追求的目标 下面首先介绍实验经济学家已形成共识的一些经济学实验的基本原理 我们将从讨论实验室实验 正式的理论模型以及和现实性之间的关系开始 然后介绍受控的经济环境和诱发价值理论 并探讨有关外部性或类似现象 最后向实验新手提出一些建议 第一节现实 模型和实验室实验 实验经济学的目的是通过受控实验对已有的经济理论进行检验 或通过实验发现经济规律 因此 在实验设计中首先要解决的问题是 在实验室中所进行的经济实验能否反映现实经济的运行 或者说 在实验室中运行的经济体系在多大程度上反映了 真实 的经济运行 除非你已经是一名经验丰富的实验者 否则在通常情况下新手在设计实验时的第一本能往往是追求一种对实验室环境的现实主义设计 他们总期望实验设计与真实的现实环境越接近越好 例如 如果实验者对证券市场感兴趣 他们可能会让一些实验对象扮演投资者 一些扮演场内经纪人 一些做专家 甚至要求所有人在实验中都遵循纽约证券交易所的规则 另一种情况是 操作实验的是一名理论工作者 那么他关注的焦点就是设计的实验能尽可能地反映理论模型的假设 同样以证券市场实验为例 他可能会抛开生活中经纪人 证券专家和证券交易所的规则 而设计出满足自己理论要求的规则 让实验对象的活动能在理论模型的框架内进行 他甚至会要求实验对象显示他们在拍卖中最佳的需求和供给时间 那么上面哪一种方法是正确的呢 是模拟现实还是模拟正式的理论模型 实际上以上想法都有片面性 设计实验 就是要从实验中得到某种有用的信息 使实验成为得到所需要的信息的最好手段 或为进一步深人研究打下基础 实验者的目标应该是进行这样的实验设计 它既能揭示所研究的相关问题 又有助于积累有益的经验 通常有效的实验设计所采用的经济系统和现实相比都相当简单 在某些方面甚至比有关的理论模型还要简单 Plott曾一针见血地指出 实验经济学通过简单的实验来比较和评估各种相互竞争的理论 这种比较和评估并不因简单实验没有完全模拟现实经济而影响其效力 简单性 正是经济学实验的长处 在实验室中预测能力相对差的理论应该被扬弃或者改进 而那些经受了实验室检验的模型和原理则可以被用于解释现实经济问题 事实上 要想在实验室里重现现实环境的复杂性是徒劳无益的 因为现实生活就像不规则的碎片 有无限的细节 它是自己最好的模型 不管你在实验室环境里如何努力地想将现实中的所有细节都考虑进去 但最终还是会有很多现实中的细节无法捕捉到 从这个意义上讲 完全与现实相符的模型是不存在的 在实验室环境中追求与现实完全相同的细节是绝无可能的 有时甚至在你的实验环境还远没有接近现实前 你可能就会发现自己的实验环境已经变得如此复杂 已很难或不可能分出原因和结果了 这反而违背了实验的初衷 还有一个实际的困难就是你的预算约束 这也会限制你的许多想法 一般说来 简单性能增加实验的可控性 因此应尽量去发现现实环境中最需要注意的地方 并用最简单的实验环境来表现 以资本市场为例 要想发现市场里是否存在着内部信息 假如实验者一开始就采用单个简单可交换的证券 并用一种适当的方法给交易者提供具有基本价值的内部信息 反而会掌握更多的东西 与此同时 在实验中试图复制理论模型中的精确的假设条件也往往是徒劳无益的 一个很现实的困难就是大多数正式的模型不考虑细节部分 实验工作者必须做出一些选择 这些选择对具体的行为而言是非常重要的 但是对理论而言却是非常武断的 举例来说 在一个理性预期模型中 理论上商人的订购活动是基于对市场出清价格的观察之上 那么在实验室中 是在商人订购之前还是订购之后宣布市场出清价格呢 无论选用什么方式实验都无法将正式的理论模型原原本本地复制出来 事实上 纵使实验者能成功地模拟出一个近似正式的理论模型假设条件的实验室系统 通常也并不能从中获得多大的收益 因为即使在形式上与理论模型所应有的结论完全符合 我们也不能说得到了该模型具有说明力的有力证据 模型和数据只能告诉我们在这个模型中没有明显的逻辑错误 这至多只能算是一个空洞的胜利 因为相对于数学分析或计算机模拟 实验室实验在检查逻辑错误方面并不是那么有效的 反过来 如果发现在实验中观察到的行为与一个具有逻辑有效性的理论模型不一致 你反而将面临以下批评 你的实验设计不恰当 或你的实验对象没有正确理解实验环境 或者兼而有之 因此 除非实验目的仅仅是为了证明一个模型的适用性或不适用性 否则人们从这样一次实验只能学到相当少的东西 但是如果在该模型的严格假定被放松的情形下 仍然能在实验环境中观察到与原来模型的预想相同的现象 那才是得到有关模型有说明力的强有力的证据 总之 由于受我们自身对经济理解的影响 对实验室实验价值的判断 不应以它对现实经济或理论形式的符合程度作为标准 第二节受控的经济环境 一 史密斯的微观经济系统经济学实验是在受控的经济环境中实施的 所谓经济环境是由各个经济主体以及经济主体间相互作用的经济制度组成的 经济制度详细规定了经济主体可采取的行动以及主体间的行为将产生的各种结果 这种经济制度本身可以通过实验控制达成 即可以用实验规则加以说明并实施 通过制度来控制实验说起来也很简单 就是实验者有最终的解释权并负责贯彻实施 1982年史密斯发表了一篇名为 作为实验科学的微观经济系统 的论文 在这篇论文中史密斯用环境和制度来定义一个微观经济系统 根据其理论 一个经济实验包含三个要素 一是环境 即参试人员所面对的一系列价值 成本结构 它包括代理人的初始禀赋 偏好和行为的成本 在实验中 实验者通过货币奖励来控制环境 二是制度 即实验者的行为所要遵循的规则 它主要包括参试人员所要发出的信息 如自己的出价和对对方出价的接受 控制这些信息在参试人员之间进行交换的规则 如哪些是公共信息 哪些是私人信息 和使这些信息形成最终的契约规则 如在什么情况下买卖双方可以成交 这些规则由实验设计者根据市场实际运行规则制定 三是可观察到的参试人员的行为 它是以环境和制度为自变量的一个函数 这三个要素的关系如下图 史密斯指出 实验经济学的一个基本目标是 创造一个可操作的微观经济环境 能保持对必要变量的控制 并且保证可以对有关变量进行测量 为此要设计适当的实验制度 控制微观经济系统中的元素 控制其中的一个变量 让它保持在一定的水平 或在不同点处于不同的水平 即实验要能观察和测量经济人i 被试对象 对信息的反应 以及由此反应得出的结果 就在这篇论文中史密斯提出了价值诱发理论 即有效 可控的经济实验所必须遵循的原则 单调性 凸显性 支配性 隐私性和并行性 例如 在市场实验中 买者和卖者是经济主体 而特定的市场制度是经济制度 在政治学实验中 投票者是主体 少数服从多数则是制度 对经济主体的要求可以用一些具有关联的经济特征来定义 例如偏好 生产技术 资源初始禀赋 信息结构等 实验对象有其自身固有的特征 但实验者想要验证具有某些特征的理论与已有的参加对象可能并不适合 作为一名实验经济学的新手 刚开始时可能认为实验对象的特征很难观察 更别说控制了 以下我们将介绍史密斯在1982年提出的价值诱发理论 看他是怎样为实验控制确定完整的条件的 而这些条件在现实中又很容易满足 二 价值诱发理论在经济学研究中 存在着许多不确定性因素 而所有的不确定性因素最终都归因于人的偏好的不确定性 在目前实验经济学的理论中 已较好地解决了在实验中对偏好的控制 这也成为经济实验区别于其他经济学研究方法的最主要的特点 在经济学实验中 我们可通过一个货币奖励系统结构和一个产权系统 以真实的货币对应抽象的实验结果的方式来实现对偏好的控制 简单地说 即对于实验中得到的结果 实验者会按照一定规则给被实验者一定的真实货币作为奖励 以此来刺激参试人员 使其具有与真实世界相同的偏好结构 为此 史密斯提出了价值诱发理论 价值诱发理论是指实验主持人可以用适当的报酬手段 诱发实验对象的特定特征 而实验对象本身的特征与此无关 使用报酬手段诱发经济主体的特征应满足以下条件 单调性 凸显性 支配性 隐私性和平行性 第一 单调性 monotonic 实验被试愿意接受报酬并做出真实的反映 同时 被试者认为报酬量越多越好 而且不会产生厌腻 在实验中利用本国货币做奖励媒介就可以很容易满足这一条件 第二 凸显性 有时也译为显著性 saliency 指实验对象所得到的奖励取决于他或她对体制规则所定义的行为的理解以及其他人的行为 即在实验中实验对象的行为与其报酬变动有显著性关系 足以向外界传达信息 例如 付给每个被实验者相同的20元实验参加费 这并不取决于实验对象在实验中的行为选择 因此就不满足凸显性 相反 实验对象在市场实验中赚取的利润所换算成的货币收入 则取决于实验对象在实验中的行为 因此满足凸显性 受控经济实验与问卷调查最大的区别就在于凸显性 在典型的问卷调查中 所要得到的是被调查者的个人特征 过去的行为或者可能的事 有的问卷调查还附加一些假设条件 例如 如果你的年薪超过10万元 你将如何投资 之类 并可能列举一些投资方式供选择 但这样取得的数据不是受控实验的数据 原因是它缺乏报酬的凸显性 因为问卷调查的付酬对每一个被调查者一视同仁 他的回答与他的报酬无关 没有刺激他必须真正表达自己偏好的动机 因而他可能出于某种个人原因而随意回答 第三 支配性 也译为主导性 dominance 指在一个实验中 参加者与其行为相联系的成本 或收益 是由实验者所定义的货币奖励结构支配的 即实验被试自己支配其做出行动所需的费用 第四 隐私性 Privacy 指实验的每个参加者只知道他们自己的支付信息 即支付信息是私人信息 他人的相关信息只能通过观察市场行为来推断 如同真实世界所做出的经济决策一样 在实验中每人获得自己决策的报酬 在实验中 实验对象经常对其他实验对象的报酬很介意 常常将自己的报酬与别人的报酬相比较 因此在某些实验中 要设法使实验对象对其他实验对象的报酬不了解或无法推断 这主要是为了使z因素 其他无法观测到的因素 中立化 史密斯称这一行为为 信息隐秘 实验者不应当去帮助或妨碍实验对象生成所希望的效果 作为实验主持者要避免表明实验的目的 应当使z的要素中立化 不过 隐私性并非对任何实验都合适 诸如那些需要完全信息的博弈理论模型的实验 第五 平行性 parallelism 指在一个实验室中所得到的实验结果一定可以在另外同样的实验中重现 其设计实验的主要方法也可以在类似实验中应用 更重要的是 结论也能在非实验室环境下的真实世界 条件与实验室的相似 中成立 在这些条件中 实验的支配性通常是最难实现的 这是因为偏好V以及其他因素z也许是实验者所无法观测到的 要满足支配性的条件 可以在具有凸显性的报酬 m增加的同时 让z因素中一些显而易见的要素保持不变 若能满足以上这些条件 则实验者就能实现对经济主体特征的控制 有了单调性 实验者就可以利用报酬手段实现自己的动机 有了凸显性 实验者就可以在实验对象与报酬之间建立明确的关系 史密斯认为 第一和第二个条件是要保证实验室具备天然的小规模微观经济环境 有了支配性 实验者就可以忽略其他事件的影响 并在实验室中实现所选择的关系 而隐私性则避免了参试者之间的相互影响 第三和第四个条件使经济学家能够控制实验中的微观经济 以验证微观经济行为 如果能满足这四个条件 则对于要让一个真实的经济主体做出真实的经济决定的实验来说是充分的 对于证实经济主体行为所满足条件的理论来说也是充分的 但如果要想将实验室的实验结果放在非实验室环境中 就要满足第五个条件 上述五个条件确立了实验经济学统一的研究方法 改变了之前实验经济学研究方法多种多样的状况 从根本上促进了实验经济学的发展 这些条件既能保证在实验中被实验者的行为尽可能与实验无关 也能在很大程度上保证实验与现实的一致性 三 实验的平行性在价值诱发理论中要求经济学实验具有平行性 这里我们对这个问题做进一步的探讨 一些经济学家总是质疑从实验室得到的实验结果究竟对实践有无指导作用 他们感觉实验数据似乎不能反映真实的情况 例如 有经验的商人往往习惯于处理大量的资金 而学生尚未接触社会 他们的思考方式是不同的 这些顽皮的学生也许会 也许不会对实验采取足够认真的态度 所以类似的关于资本市场的实验意义就不大 博姆 1984 在如何促进现场实验方面提出了这样一个议题 如果在一个 两个或三个实验室实验之中 我们能证实给定的一种机制的有效性 但是我们又怎么能因此肯定在第四个实验中当我们要由它做出一个重要决策时 它一定奏效呢 实际上 人们不仅仅是对经济学的实验存在怀疑 其他领域的实验者也曾经有过相似的困惑 当伽利略用力学原理说明天体运动时 就有人批评说 用吊灯的摆动或斜面上滚动的球的运动就能够说明万里之遥的行星的运动吗 用演绎逻辑的方法并不能从根本上驳斥这种怀疑 仅仅凭着你每天早晨看到太阳升起已经有20多年了 你也仍然无法推断出它明天是否一定会升起 但在实际生活中人们确实有信心认为太阳明天仍然会升起 这就是归纳法 根据归纳推论的一般原理 作为相关的基础条件若无实质性的变化 在新的环境下 行为的规律性不会改变 弗农 史密斯依据上述归纳原理的思想提出了 平行性 的概念 即 一个关于个人行动以及制度执行的命题 如果在实验室的微观经济中已被验证 那么在其他条件不变的同样状况下 在离开实验室的微观经济中仍然适用 依据平行性的思想 可以假定实验结果也适用于实验室的外部世界 但有人认为实验室的结果移到实验室之外 条件变了 则未必能成立 例如 有人认为在实验室模拟资本市场中得到的数据是 人为 的 在现实世界中交易者处理的资金数额巨大 而且他们都是专家 这与实验中的条件有很大不同 对这种批评 我们可以通过在实验中扩大被试群体 让一些有经验的人参加实验 同时增加有凸显性的报酬等方法来加以改善 事实上 如果真有人对实验持怀疑态度 那他就有这样一种责任 即明确指出外部世界的哪些不同条件将会改变在实验室中所观察到的结果 这样一来 通常专家就会设计和实施新的实验去检验人们所怀疑的东西 举例来说 过去有学者听到同事在争论实验资本市场数据都是人工编造的 在被进一步追问时 同事通常用实验中大量的交易者和现实生活中的冒风险的专业交易者进行对比说明了他们之间重要的不同之处 解决问题的合理办法就是在实验中让更多的人参与交易并聘请有经验的 或专门的 交易者参与实验 或者增加凸显性报酬 这样做是通过对实验的怀疑来促进建设性研究的开展 而不是陷入毫无结果的争论当中 出于科研的目的 简单和小范围的实验室环境相对于现场环境更加有效 Plott 1982 认为 提出问题的艺术在于能将对复杂问题的理解用简单的例子做比喻 根据定义 一般的理论和模型适用于所有特殊的案例 因此 一般的理论和模型也应该适用于实验室市场的特殊例子 当模型未能捕捉到在特殊案例中所观察到的现象时 它们将根据经验被修正或停用 在同一篇文章中 Plott也回答了对实验外部有效性的普遍疑问 他的观点是 即使实验室程序和自然发生的事件相比更为简单 它们在一定程度上也是一种真实 因为真实的人为真实的利益而参与进去 并且遵循了真实的规则 因此实验室程序也是准确的 因为参与者的兴趣是真实的 第三节对实验新手的建议 以上的价值诱发理论对初次做经济学实验的人来说应该会有不少启发 下面是对实验新手的一些建议 这些建议是关于经济实验的具体实施方面的 1 为了能在实验室里创造受控的经济实验 最好支付实验对象现金来激励他们 等级制对于学生群体也同样适用 大多数的报酬应该与实验对象在实验中的行为联系在一起 平均收益应该超过实验对象的平均机会成本 这样的一种报酬支付方式增加了单调性和凸显性 2 应寻找一些这样的实验对象 他们的机会成本很低 但是学习曲线却很陡峭 这样便能以低廉的成本取得支配性和凸显性 通常在校的大学生就是不错的实验对象群体 3 应创造一个尽可能简单的经济环境 这样你可以将焦点放在你要研究的问题上 实验的简单性反而有助于促进凸显性 同时你在解释自己的结论时能降低含糊性 为准确和清晰起见 必须小心地检查有关的实验指令或实验讲解 在排练或测验之中要再检查一下实验对象对此的理解能力 4 为增加支配性 应避免在实验指令中使用有导向性的语言 例如 在囚徒困境的实验中 将参试者的选择分为A和B要好于分为背叛和忠诚 采用中性语言给实验对象分派角色 设为买者和卖者或选手A和选手B要好于将角色分为独裁者和奴隶或对抗者 5 如果在实验中支配性成为问题 而你的预算又允许的情况下 你可以尝试增加一定比例的报酬 结果的系统改变表明了在低水平报酬下未能达到的支配性 6 为了保证研究是可行和正确的 你必须对自己的实验目标和实验对象的行为以及报酬情况保密 实验对象对所谓好 坏要素似乎有天生的敏感性偏好 当隐私没有被很好地保护时将危及实验的支配性 7 千万不要欺骗实验对象或对他们撒谎 的确在有的时候 社会心理学家会基于欺骗性实施一些有趣的实验 然而 实验经济学家要求完全的可信度 因为如果实验对象对宣称的行为和报酬的联系表示怀疑或者实验对象因担心可能的骗局而设置障碍 那么凸显性和支配性就会丧失 欺骗损害了你自己和其他实验者的可信度 并因此而降低实施实验控制的可能 当然 这些规则并不是一成不变的 在早期的试验性实验中使用不付报酬的实验对象反而有利 稍后将会对撰写实验指令的艺术 在什么情形下应恰当地保护隐私等做进一步的介绍 只有当你肯定你能理解实验中潜在的问题 并能说服大多数怀疑者你的理由是充分的时候 你才可以自由地去打破这些规则 经济学实验设计 经济学实验的组织一般有以下五个步骤 第一步是选取有趣的和重要的课题 选择实验要检验的理论或模型是什么 第二步是进行实验设计 根据所选择的课题设计实验内容 在实验设计中要注意减少次要变量的干扰 避免多变量混合作用 在实验中要对实验参与者给予货币的真实激励 并避免参与者之间的信息交流 第三步是实验前准备 根据所设计的实验确定被实验者 一般的经济学实验大多选择大学生参加 同时选择实验室设备 安排实验步骤 第四步是实验控制 实验控制应以实验设计为原则 在实验中要特别注意实验指令的讲解 实验的讲解应该向参与者明示可行的选择及报酬 清晰界定参与人可以利用和交流的信息等 第五步是分析数据以及报告实验结果等 并根据实验结果分析课题所要验证的命题 第四节实验的目的 不同的经济学实验会出于不同的目的 实验的目的决定了实验的设计和实施的方式 因此实验者在实验的每一步中都应该谨记自己的实验目的 有的实验是为做某项决策提供数据支持的 例如 Grether和Plott 1984 报导了一个在反托拉斯案件中为提供证据而设计的实验 Hong和Plott 1982 的实验是为美国州际贸易委员会的一项决策所做的研究 Alger 1988 Plott 1988 和Rassenti Reynolds以及Smith 1988 都曾为联邦能源管制委员会的决策开展过一系列实验 Roth 1987 称这些被设计成影响决策制定者的实验为 在王子的耳边耳语 当然 影响政策决策者并不是经济学实验唯一的目的 无数的实验室实验和现场实验的实施目的可能是为了怎样采用适当的方法来更好地影响消费者 选民和经理人士的决策 例如 Cohen 1992 通过实验发现美国的白人消费者对亚洲模式的立体声器材广告反响热烈 最近几本流行的商业杂志讨论了一种新型的现场技术 这种现场技术能对产品革新和广告活动的市场反应做出精确的测量 在美国 至少从1988年的总统竞选开始 选民对电视给出的竞选信息和竞选口号的反应的实验室研究已经在大多数竞选者的策略中发挥了重要的作用 例如 Torry和Stencel 1992 在华盛顿邮报上报导说 布什 奎尔的竞选活动通过关注焦点人群而得到巩固 其中废除审讯律师制度就是一个有效的拉选票的主题 为这样一种市场应用研究投下巨资 显然还在不断增加 说明这些市场应用研究的实验还是有很大的商业价值的 但是对于学术界 相对于短期的特定决策 学者们更关心的还是长期的发展远景 其中实验的一个学术目的就在于发现一些现存理论很少涉及的经验性规律 例如McCabe Rassenti和Smith 1993 以及Friedman 1993 就比较了几种市场制度的特性 对这些市场制度的理论特性的了解至今还很贫乏 Smith 1982 称这些实验为启发式实验 在其他一些领域 相反 不同的相互竞争的理论提供了不同预测 这时可通过实验帮助划分出每种理论的适用范围 例如 Fiorina和Plott 1978 通过实验探讨委员会决策 发现在16个模型中只有少数的模型和变量能与数据吻合 甚至可能只有一个模型是适用的 通过实验能够显示理论在什么样的条件下能解释数据 从而检验此理论的稳健性 Isaac和Smith 1985 所做的 寻找掠夺性定价策略 则是一个反例 Smith 1982 称以上的最后两类实验为边缘实验 boundaryexperiment 他将一系列试图为人类行为建立权威规则的实验比作 制定法律的过程 近年来 一些实验经济学家对实验的目的是对理论进行检验这一说法犹豫不决 因为从正式的观点看 一个理论是由一系列的公理或假设和定义构成 并且还包括一些通过对它们的逻辑推理所得出的结论 一个理论如果具有内在一致性 那么它在形式上也应是有效的 也就是说 如果这些结论真的是从假设中推导出来的 那么它们在表述上就不会相互矛盾 对于一种理论来说通过实验能学到什么呢 一些实验者 包括大多数心理学者 认为实验数据是检验假设有效性的途径 而这些关于人的行为的假设通常是理论的基础 其他的一些人 包括大多数经济学家 都会乐于承认大多数经济理论的行为假设不具有或者说不需要具有心理学上的描述有效性标准 descriptivevaliditycriterion 相反 他们认为一个理论即使在它的假设条件没有被严格满足 而它的结论却能较好地和实际行为吻合 与替代理论相比 这个理论仍有实际价值 实验科学家的特有的工作就是在一个大范围的相关环境中通过观察行为 寻找出规律 并且找出哪个理论能够最好地解释这些规律 这些工作可以称为 理论测试 或者更为精确地称为 看看哪个理论能够最好地组织数据 这是科学实验的一个最主要的目的 实验经济学家近年来对在人群中使用实验室方法 包括经济刺激 测试个人 先天或后天 的特性越来越有兴趣 例如测试人们是否愿意为环境的改善或风险的规避支付费用 Cummings Harrison Rutstrom 1992 一项新的实验技术是Forsythe等人于1992年提出的 为候选人设计的计算机化的仿真市场 它能够预测出每位候选人在选举中可能获得的得票率 一些实验者在过去的几十年中尝试在实验室里测量行为参数 或者是在实验室中模拟现实的经济过程 例如 Hoggatt 1959 就展示了能测量寡头垄断厂商的 反应函数 而Garman 1976 也尝试模拟纽约股票交易的过程 实验经济学家现在意识到行为参数经常因制度和环境的不同而变化 所以这种度量的外部有效性也是令人质疑 如同我们在上面所介绍的 实验者们不再将模拟 即在一定程度上尽可能地复制现场环境 看成是经济学实验的一个有用的目标 近来人们提出了一个相关的 但更适宜的实验目标 飞机工程师认为在尝试建造和试飞一架新飞机之前 在实验平台上进行小飞机模型的研究是非常有用的 同样 经济学家和政策制定者最近也发现把新制度引人实践之前 在实验室里对它们进行研究也是非常有用的 如果传统的中央计划经济体制的转型步伐加快 并且西方经济持续衰退 那么这种实验引发的制度变革的范围就会增大 最后 实验还有一个非常重要的教育目的 张伯伦 1948 所记录的经济学实验的最早用途主要就是教育 从20世纪80年代开始 经济学实验逐渐得到推广应用 随着经济学逐渐变成了可实验的科学 经济问题的实验示范也就自然而然地被引人中学和大学课程中 Walker Williams和他们在印第安纳大学的同事们 以及Wells和他在亚利桑那大学的同事们发展了很多以教育目的为主的经济学实验 综上所述 实验室的实验不仅可以为决策者提供数据支持 影响消费者 选民和经理人士的决策 还可以用来检验理论 发现新的经验规律 也可以用来作为经济学教学的辅助手段 有着广阔的应用前景 第五节实验设计 前面我们提到组织经济学实验是出于不同目的的需要 有的实验者关心的可能是买者和卖者的数量如何影响市场效率的问题 而有的实验者则关注于研究消费者是喜欢 改进型 产品还是 传统式样 的产品 但不管实验的目的是出于科学研究的需要或仅仅是纯商业性的目的 实验者可能只对少数变量的改变有兴趣 因为这些少数变量往往都是关键变量 不过一般情况下 实验者还是需要记录下那些自己只有少量兴趣或根本不感兴趣的变量的变化轨迹 因为它们也有可能影响实验的结果 实验设计的目的是为了减少次要变量的干扰 增强某一主要变量的作用 以及分辨不同变量的作用 即如何避免两个或多个变量的混合作用 compoundingeffect 实验的目的决定了哪些变量是关键的 哪些是多余的 我们把实验中作为主要目标加以控制的变量称为焦点变量 与目标无直接关系 把可能影响实验结果的变量称为干扰变量 在具体实验中 焦点变量和干扰变量的区分完全由实验的目的决定 例如 在关于寡头垄断的实验之中 买者的数量是一个关键的焦点变量 但是在测试消费者对新产品的反应实验中 这个相同的变量却成为多余的干扰变量 下面我们将会解释怎样通过实验设计突出焦点变量 降低干扰变量造成的模糊性 同时我们也会说明怎样设计能分解出不同变量影响的实验 也就是说 怎样去避免混淆两个或更多变量的作用 我们先介绍控制和随机化 这是正确的实验设计的基本成分 紧接着我们将详细介绍这些特殊的设计 并提出一些实际的建议 一 直接的实验控制 常量和处理变量在实验室里 实验者可直接控制许多变量 譬如可自由选择市场实验中的成本和价值参数以及交易规则 通过控制重要变量得到的是实验数据而非偶发事件数据 控制变量的一个重要方法是当同时存在两个或多个自变量时 为了获得每个自变量对因变量作用最确切的数据 应独立地变动每个自变量 控制一个变量最简单的方法是将它在一些合适的水平上设置为常量 例如在市场实验中 执行相同的双向拍卖交易制度 而另一种替代的方法是 为变量设置两个或更多的可以产生明显不同结果的水平 分别作为实验的不同部分 或者作为实验的子集 将变量值控制在所选择的水平上 例如 使用两组不同的成本参数 一组能导致高的弹性供给 另一组则产生缺乏弹性的供给 这种方法在医学实验中也很流行 将变量控制在两个或更多水平上的方法称为处理变量 例如 医学上的药物试验 要试验一种新的药物对某种疾病的疗效 可以将病人分成两组 对其中一组施用新药 甲组 而另一组则仍用旧药 乙组 经过一段时间 通过比较服用新旧两种药物后的情况 可以确定新药是否有显著性改进作用 不过 一种可能的情况是 如果甲组的患者较年轻 而乙组的患者较年老 则即使比较后发现甲组患者的病情比乙组患者的病情有显著的改善 我们也仍无法判断这一改善是因为药物还是因为与年龄相关的抗病能力所造成的 要解决两个或多个变量混合作用问题的办法是 随机化 randomization 即用随机的方法将所有参加试验的病人分成两组 再分别施予新旧药物 这样就可以排除药物之外的其他自变量对病情这一因变量的干扰作用 类似地 经济学实验也在许多场合通过使用 随机化 方法来减少次要自变量的干扰 增强某一主要因变量的作用 是将控制变量作为常量还是作为处置变量需要进行权衡 将越多的变量设为常量 则实验会变得比较简单并且费用较少 但实验者得到有关变量之间的直接作用和相互作用的信息也较少 因此变量选择要注意以下几点 1 所有可能控制的变量都应加以控制 2 将焦点变量作为处理变量加以控制 为明确起见 可以将变量的水平在较广的范围内进行分散 如果我们不对非线性效果感兴趣的话 使用两个水平较好 尽量避免使用中间水平 3 如果怀疑焦点变量与干扰变量之间有交互作用 可以考虑将干扰变量作为处理变量加以控制 一般取两个水平就行 4 要尽量避免实验程序的复杂化 尽量降低实验费用 为此 可将绝大多数的干扰变量看作常量加以控制 即使有很大影响的干扰变量 只要它与焦点变量的效果是相互独立的 也可以将其保持为常数 5 为使实验数据富有说服力 要尽量避免变量间的交互作用 变量之间的变化要保持独立 例如 在一个市场实验中 选择了两个变量作为处理变量 即市场制度和需求弹性 其中将市场制度分为两种 PO 明码标价 和DA 双向式拍卖 将需求弹性分为E 富有弹性 和I 缺乏弹性 尽管对两个变量进行了控制 但是如果实验中总是一起改变变量的话 比如一半时间是PO E的组合 另一半时间是DA I的组合 则会混淆它们的作用 但是若在实验中对每一种处理变量的组合 PO E PO I DA E和DA I 都进行相同时间长度的实验 各占1 4 则可以测量两个处理变量独立的影响 逻辑很简单 那就是 独立地改变所有的处理变量可以最清楚地识别它们各自的作用 见下图 二 间接的实验控制 随机选择在实验中 一些变量是很难控制或不可能控制的 比如 在农业实验中天气就是一个很重要 但无法控制的干扰变量 nuisance 这类情况偶尔在经济学实验中也会发生 比如一位学者回忆说一次实验中暴风雪妨碍了实验对象的到来 另一位学者则记得在一次早期计算机实验中眼睁睁地看着空调坏了 室内温度升到华氏一百度以上 对于实验经济学家来说 实验对象的心理期望通常是比天气更加重要 但同时也是无法控制的 类似潜在的重要的干扰变量还包括 实验对象个人反应的灵敏度及兴趣等 这些干扰变量实验人员甚至很难观察到 更谈不上对它们进行控制了 但如果对这些干扰变量不加以控制 它们若与焦点变量混淆 就容易引起推断错误 譬如 在某年中农业获得丰收的真正原因是采用了新品种 但人们可能会误以为是由于风调雨顺 又如 当富有弹性的供给参数在一个长时间实验的后期被引入 有效性可能会降低 但真正的原因却是实验对象的疲劳 问题是当影响是由一个无法控制的干扰变量引起时 实验者可能会把观察到的结果归结于焦点变量的作用 当实验者不能直接控制一些重要的干扰变量时 怎样避免问题被混淆 上面提供的建议给了我们一个暗示 被控制变量的独立可以避免问题的混淆 如果我们可以使不可控制的干扰变量与处理变量之间相互独立 就可以在一定程度上解决上述问题 随机选择提供了一种保证处理变量结果的独立 从而间接控制不可控 甚至是不可观察的 变量的方法 它的基本思想是以随机顺序分配处理变量所选择的水平 比如 在一个市场实验中 实验对象的个性和习惯是不可控的 并且总的说来是不可观察的干扰变量 因此在组织实验时 当实验对象到的时候 不要给早来的人分配卖者的角色 而给晚到的人分配买者的角色 随机分配任务 则实验者就可以自信地说买者和卖者之间利润的差别是由于他们角色的不同 而不是由于实验对象之间个性的不同 最简单有效的实验设计是完全随机化 即在实验中 每一个处理变量 或者是处理变量的组合 在实验的各局中以等概率分配 假设在上图实验中 为两个处理变量选择了一个完全随机化的实验设计 即在每局中实验者可以随机抛掷一个两面均匀的硬币 以0 25的概率选择PO E PO I DA E和DA I四个处理变量 局与局之间是相互独立的 如果实验进行的局数较多时 完全随机化是非常有效的 只有当实验的局数足够多 处理变量与不可控的干扰变量之间的正相关或负相关的概率趋于零时 才可以说它们两者之间是相互独立的 当随机化实验的次数较少时 处理变量与干扰变量之间偶尔会存在较大的相关关系 如果不可控的干扰变量在实验的各局间产生很小的变化 则完全随机化的设计就难以加以改进 当可控的干扰变量显著影响实验结果时 能够把控制与随机性恰当结合起来的实验设计会更加有效 因为它们可以从较少的实验局中得到相等的明确结果 这些实验设计保证了即使是在较少的实验局中 受控变量之间的相关系数也为零 随机块 randomblock 是这一类改进实验设计的统称 它与完全随机化实验的区别在于 一个或多个干扰变量是作为可控的处理变量而非随机变量 这类作为处理变量的干扰变量常常被称为障碍变量或块变量 blockingvariables 在一段实验内 实验的子集中 保持常量 而在不同实验段间是变化的 接下来我们将给出一个块变量和随机化的实例 三 针对实验对象自身的设计经典的男孩鞋子实验 Box和Hunter 1978 的目的是为了检验新的鞋底材料是否会比旧的材料更耐用 这个实验的焦点变量是鞋底的材料 将处理变量定在两个水平 旧和新 由于实验对象的不同动作和习惯 测得的鞋底状况有明显的差异 一些男孩终日懒散在家 而另一些则喜欢踩滑板车 他们用一只鞋子做刹车器 明智的实验设计是避免这些干扰变量与焦点变量相互作用的混淆 我们可以给每一个男孩一双鞋 一只鞋采用新的材料 另一只则用旧的材料 这样 在这个实验设计中实验对象本身就是一个块变量 因为他是诸如习惯和动作等干扰变量的集合体 并且左脚和右脚鞋底之间的测量状况成为相关的性能测量 焦点变量的随机分配降低了由于其他干扰变量 比如男孩滑板时是倾向于用左脚还是右脚刹车而引起的混淆 只在实验对象之间改变焦点变量水平的实验设计被笼统地称为实验对象间设计 而那些对每一个实验对象自身采用不同水平的实验设计被称为实验对象自身的设计 鞋子实验就是使用了一种特殊的实验对象自身的设计 它将所有的数据表示为配对鞋子材料的不同 根据鞋子不同配对的差别能灵敏地得出实验对象间差异是重要的干扰变量 在经济学实验中也可以运用同样的方法 比如 假设进行了一个选择实验 比较实验对象是愿意花钱赌博 WTP 还是愿意接受一个固定收益 WTA 如果想知道你设计的新的 明晰的 规则是否将使得WTP和WTA之间更加接近 则个体差别就是一个需要考虑的重要的干扰变量 比如 一些实验对象可能更加害怕风险 因而会给出较低的WTP和WTA值 所以就像在鞋子实验中那样引入一个针对实验对象自身的设计是比较恰当的 你可以随机地把每一个实验对象设为风险偏好者或风险厌恶者 并在每场赌博中分析实验对象间WTA和WTP的差别 通过这种方式就可以排除一个重要的潜在的干扰源 而要关注的指令的作用也会更加显著 四 其他有效的实验设计针对实验对象自身设计的思路可以派生出另外两种形式 其中一种是交叉设计 它是针对一个或一组实验对象 在实验的不同局之间 将一个处理变量控制在不同的水平上 如A和B 但一旦怀疑处理变量对持续几个实验局都有影响时 就应该考虑ABA的交叉设计 更简单的AB交叉设计将时间及学习效应同处理变量交叉在一起 假设在市场实验中 你的焦点变量是市场制度 A 双向式拍卖 B 买方拍卖 卖方是被动的 一组交易者的收敛行为可能会从一个交易时段持续到下一个交易时段 所以在一期实验中 你可能组织四个交易时段进行A式拍卖 接着组织八个交易时段进行B式拍卖 最后再组织四个交易时段进行A式拍卖 ABA 并在对应的交易期中 使用BAB设计作为补充 在A式拍卖的交易时段和B式拍卖的交易时段所观察到的平均绩效的差别将有效体现焦点变量的作用 另一种派生形式是双重试验 dualtrial 当个体或群体特征是一个重要的干扰变量时 它不失为一种有效的方法 比如J KagelandLevin 1986 怀疑在共同价值的第一价格拍卖中 first pricecommon value 个人随机信号及同组中其他出价者的行为会影响投标人的行为 为了清楚地验证焦点变量的作用 他们将组的规模设为S 小组 和L 大组 两个水平 使用双重拍卖 在实验者发出信号后 每一个实验对象提交两份出价 一份是针对小组拍卖的 另一份是针对大组拍卖的 双重拍卖的实验设计使得实验人员可以通过观察不同实验对象和不同交易阶段之间的出价的差别 即 BL BS 把组织规模大小的影响分离出去 当面临两个或更多的处理变量时 因子设计是一种可以把随机化和直接影响相结合的最重要和常见的方法 为了说明这一点 我们假设有两个处理变量 因子 factor 记为R和S 其中R有三个水平 高H high 中M medium 和低L low S有两个水平 高H和低L 在结果为3X2的因子设计中 六个处理变量LL LH ML MH HL和HH都进行了K次的试验 这样为了重复K 4次的实验设计 需要做3X2X4 24次子实验 在这里 随机性是必不可少的 在每一次重复的六个子实验里 实验人员必须随机安排六个处理变量 当条件合适时 因子设计比完全随机化更加有效 因为它保证了每一个处理变量 或组合 在实验中出现相同的次数 并且即使是对较少次数的重复试验 处理变量之间也是零相关的 在其他方面 这种方法可以帮助实验人员把处理变量的直接作用与交互作用区分开来 图5 2使用了3X2因子设计的例子来显示处理变量的直接作用和相互影响 纵轴是观察到的结果 如市场效率 第一个处理变量为R 如富有弹性的需求和供给 在横轴上表示 第二个处理变量是S 如报酬强度 payoffintensity 由标有S 高和S 低的曲线来表现 曲线自身与每一个处理变量假设结果的均值有关 当两条曲线平行时 说明在R和S之间没有相互作用 但是当两条曲线之间的距离变宽时 则表明R和S之间存在正的相互作用 由于与完全随机化的实验设计相比 在因子设计的实验中 实验人员在指定处理变量和一些实验疏漏 比如由于计算机的小故障或实验对象没有出现等 上犯的错误会严重地损害对数据的分析 因此随机化的实验设计比因子设计更好用 的确 如果这些问题是经常出现的 因子设计就不能同完全随机化设计区别开来 因子设计的另一个问题是随着因子个数的增加 所需要的实验次数也会迅速增加 例如假设为每一个处理变量只设置两个水平 即使这样 仅重复一次 如果是4个因素就需要进行16次试验 如果是8个因素 则需要做256次实验 这个问题是很严重的 因为在一些经济环境中有很多潜在的重要干扰变量 有组合爱好的统计学家们注意到通过对区组设计和因子设计增加对称性可以使理论更加有效 比如 使用四辆汽车测试四种轮胎品牌 a b c和d 时 实验人员不仅可以用通常的分块条件 即每辆汽车使用一种轮胎 也可以通过改变每辆测试车四个轮胎的种类来进行 比如 第一辆车以abcd的顺序安装轮胎 第二辆的顺序是dabc 第三辆的顺序是cdab 第四辆的顺序是bcda 这一实验设计 被称为拉丁方实验设计 Latinsquare 它还有更高维数的类似设计 被称为希腊 拉丁 Graceo Latin 设计和超希腊 拉丁 hyper Graceo Latin 设计 这样的设计很快就变得十分巴洛克 即精巧但是不实用 过于复杂 并且对于实验疏漏等问题也完全没有灵活性 感兴趣的同学可以找到许多有关实验设计更高级的书籍 大部分是1950 1970年期间出版的 在上面 我们主要参考了DanielFriedman Shyamsunder 1994 Box 1957 等人以及Campbell Stanley 1966 和Kirk 1982 等人的著作 五 实践建议对实验设计进行理论考虑时也要考虑其实践结果 在提出理论的同时 我们也对典型干扰变量 常量和处理变量的选择以及通常如何组织实验提供一些总体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 长安大学兴华学院《世界古代史上》2024-2025学年第一学期期末试卷
- 阜阳师范大学《数学建模方法及应用》2024-2025学年第一学期期末试卷
- 天津大学《路基与路面工程》2024-2025学年第一学期期末试卷
- 西安铁路职业技术学院《设计造型基础》2024-2025学年第一学期期末试卷
- 荆州职业技术学院《工程造价管理实训》2024-2025学年第一学期期末试卷
- 濮阳职业技术学院《社会保障学》2024-2025学年第一学期期末试卷
- 福州科技职业技术学院《通信原理》2024-2025学年第一学期期末试卷
- 防城港职业技术学院《小学教育专业导论》2024-2025学年第一学期期末试卷
- 昭通学院《会计案例分析》2024-2025学年第一学期期末试卷
- 四川工程职业技术学院《兽医内科学》2024-2025学年第一学期期末试卷
- GB/T 44230-2024政务信息系统基本要求
- DL-T 1160-2021 电站锅炉受热面电弧喷涂施工及验收规范
- 中国吸管机行业市场现状分析及竞争格局与投资发展研究报告2024-2034版
- (高清版)JTGT 3671-2021 公路交通安全设施施工技术规范
- DZ∕T 0214-2020 矿产地质勘查规范 铜、铅、锌、银、镍、钼(正式版)
- 应急管理信息化系统建设方案
- 场所安全控制程序范文(三篇)
- 脑梗死康复诊疗规范
- 刑事特情工作细则
- 利用人工智能技术提升医院临床决策
- 政府利用短视频平台宣传政策的成功案例分析
评论
0/150
提交评论