（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf

上传人：活*** IP属地：宁夏上传时间：2019-12-06 格式：PDF 页数：70 大小：6.98MB 积分：0 举报 版权申诉

（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf_第2页

（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf_第3页

（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf_第4页

（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf_第5页

已阅读5页，还剩65页未读，继续免费阅读

（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要。基于行为博弈理论的思想，本文分析了2 0 0 5 年至2 0 0 7 年我国上市公司股权分置改革中对价的均衡问题，并运用e w a 博弈学习模型对其进行了模拟分析。首先，文章简要介绍了本次股权分置改革，指出其核心问题是非流通股股东为获取上市流通的权利而向流通股股东支付对价。从博弈论的角度来看，其实质是非流通股股东和流通股股东之间关于对价的一个多阶段的最后通牒博弈，博弈均衡分析表明博弈规则使得博弈均衡有利于非流通股股东然后，运用行为博弈的思想，文章全面分析了本次股权分置改革对价博弈均衡的影响因素，并在此基础上用e w a 博弈学习思想研究了其对价均衡的形成机理，指出受认知偏差的影响，博弈参与者的策略学习将导致博弈均衡偏离理论的标准均衡。接着，文章以股权分置改革中采用纯送股方式支付对价的9 3 6 家a 股上市公司为样本，通过建立多元线性回归模型实证分析对价均衡的影响因素，实证结果表明博弈参与者存在锚定等认知偏差，博弈双方决策表现出非理性。行为博弈理论认为，参与者的策略学习行为将使得非理性的决策累积传递，最终导致偏离标准均衡的博弈均衡迅速形成。因此，文章最后仍以上述股改公司为样本，构建本次股改对价博弈的e w r a 博弈学习模型并对其进行数据模拟，模拟结果表明e w a 学习模型成功捕捉了对价均衡的形成过程，说明股权分置改革对价博弈是一个基于策略学习的博弈过程。模拟结果分析表明，决策双方博弈地位的不对等在很大程度上决定了不公平对价均衡的形成。同时歹模型参数分析表明博弈双方即非流通股股东和流通股股东具有极强的学习能力，但这种学习仅为对过去经验的纯策略学习。关键词：股权分置改革，对价均衡，行为博弈，e w a 学习 a b s t r a c t f r o mt h ev i e wo fb e h a v i o r a lg a m et h e o r y , w ea n a l y z e dt h e c o m p e n s a t i o ne q u i l i b r i u mp r o b l e mo ft h el i s t e dc o m p a n i e s n o n - t r a d a b l e s h a r e sr e f o r mi nc h i n af r o m2 0 0 5t o2 0 0 7 ，a n du s e de w al e a r n i n g m o d e lt os i m u l a t ei t se q u i l i b r i u mp r o c e s s f i r s t l y , w eb r i e f l yi n t r o d u c e dt h i sr e f o r m ，p o i n t i n go u ti t sc o r ei s s u e i st h ec o m p e n s a t i o np a i df r o mt h en o n - t r a d a b l e s h a r e h o l d e r st ot h e t r a d a b l es h a r e h o l d e r sf o rt h ec i r c u l a t i o nr i g h t s b a s e do ng a m et h e o r y , w ed e v e l o p e dt h a tt h i sr e f o r mi se q u a lt oam u l t i - s t a g eu l t i m a t u mg a m e a b o u tt h ec o m p e n s a t i o nb e t w e e nt h en o n - t r a d a b l es h a r e h o l d e r sa n dt h e t r a d a b l es h a r e h o l d e r s t h ee q u i l i b r i u ma n a l y s i ss h o w e dt h a tt h er u l e so f t h ec o m p e n s a t i o ng a m ew e r eh e l p f u lt ot h en o n - t r a d a b l es h a r e h o l d e r s s e c o n d l y , t a k i n g t h et h o u g h to fb e h a v i o r a lg a m et h e o r yi n t oa c c o u n t , w e t h o r o u g h l ya n a l y z e dt h eg a m ee q u i l i b r i u m s i n f l u e n c ef a c t o r s ，a n d a n a l y z e di t sf o r m a t i o nm e c h a n i s mu s i n ge w al e a r n i n gt h e o r y , w h i c h i n d i c a t e dt h a ta st h ei m p a c to fc o g n i t i v eb i a s ，t h ee q u i l i b r i u mm a yb e a w a yf r o mt h es t a n d a r de q u i l i b r i u md u et op l a y e r s s t r a t e g yl e a r n i n g t h i r d l y , w ed e v e l o p e dm u l t i p l el i n e a rr e g r e s s i o nm o d e l st od e m o n s t r a t e w h i c hf a c t o r sm a d et r u ei n f l u e n c eo nt h ec o m p e n s a t i o ne q u i l i b r i u m t h e d e m o n s t r a t i o nr e s u l t sf r o mas a m p l eo f9 3 6r e f o r m e df i r m ss h o w e dt h a t p l a y e r sb e h a v e di r r a t i o n a l l yb e c a u s eo f t h ea n c h o r i n ge f f e c t a c c o r d i n gt ob e h a v i o r a lg a m et h e o r y , i r r a t i o n a ld e c i s i o n - m a k i n g w i l lb et r a n s f e r r e dc u m u l a t i v e l yd u et op l a y e r s s t r a t o g yl e a r n i n ga n d f i n a l l ym a k et h ee q u i l i b r i u md e v i a t e df r o mt h es t a n d a r de q u i l i b r i u m f o r m e dq u i c k l y t h e r e f o r e ，w eu s e de w a l e a r n i n gm o d e l t os i m u l a t ei t s e q u i l i b r i u mp r o c e s s t h es i m u l a t i o nr e s u l t sf r o mt h es a r l l es a m p l e s h o w e dt h a tt h ee w al e a r n i n gm o d e ls u c c e s s f u l l y c a p t u r e d t h e e q u i l i b r i u m ，w h i c hi m p l i c a t e dt h a tt h ep r o c e s so ft h ec o m p e n s a t i o n g a m e w a sb a s e do n s t r a t e g yl e a r n i n g b ya n a l y z i n g t h em o d e l p a r a m e t e r s ，w e f o u n do u tt h a tb o t hn o n - t r a d a b l ea n dt r a d a b l e s h a r e h o l d e r sh a v es t r o n gl e a r n i n ga b i l i t yi nt h ed e c i s i o n - m a k i n g ，b u t w h i c hw a sj u s ta ni r r a t i o n a ll e a r n i n go fp u r es t r a t e g yf r o mh i s t o r y h e x p e r i e n c e ，a n dt h eu n f a i rp o w e ri nt h eg a m ew a st h ek e yr e a s o nl e a d i n g t ot h eu n f a i re q u i l i b r i u m k e yw o r d s ：t h er e f o r mo fn o n - t r a d a b l es h a r e ，t h ee q u i l i b r i u m o f c o m p e n s a t i o nr a t i o ，b e h a v i o r a lg a m et h e o r y , e w al e a r n i n g m 原创性声明本人声明，所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。论文主要是自己的研究所得，除了已注明的地方外，不包含其他人已经发表或撰写过的研究成果，也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献，已在论文的致谢语中作了说明。作者签名：埤关于学位论文使用授权说明本人了解中南大学有关保留、使用学位论文的规定，即：学校有权保留学位论文，允许学位论文被查阅和借阅；学校可以公布学位论文的全部或部分内容，可以采用复印、缩印或其他手段保存学位论文；学校可根据国家或湖南省有关部门的规定，送交学位论文。对以上规定中的任何一项，本人表示同意，并愿意提供使用。辄哗一名：堕隰盟一月生日中南大学硕士论文第一章导论第一章导论作为历史遗留的制度性缺陷，股权分置问题是我国证券市场中最基础、最关键的问题，在诸多方面制约着我国资本市场的规范发展和国有资产管理体制的根本性变革。因而，本次股权分置改革是我国证券市场发展史上具有划时代意义的事件，备受实务界和理论界的关注。深入剖析本次股权分置改革对价均衡的合理性及其形成原因，汲取经验教训，对发现市场规律、促进我国证券市场的进一步发展是极具重要意义的。 1 1 研究背景及意义股权分置，是指国有企业在实施公司化改革的过程中，受中国社会特殊经济制度的影响，将上市公司的股份人为地分割成流通股( 社会公众股) 和非流通股( 国有股和法人股) 两部分。上市公司的股权转让也就存在两种价格，即非流通股的协议转让价和流通股的竞价交易价格，后者远高于前者，造成我国股市同股不同价、同股不同权和同股不同利。为了解决这一问题，2 0 0 5 年4 月 2 9 日，中国证监会发布了关于上市公司股权分置改革试点有关问题的通知，股权分置改革工作正式启动【i l 。随着三一重工、金牛能源、紫江企业首批股权分置改革试点公司的成功实施，上市公司股权分置改革全面铺开。由于非流通股上市流通会降低流通股的市场价值，给流通股股东造成损失，中国证监会等五部委发布的关于上市公司股权分置改革的指导意见，明确规定用对价方式平衡股东利益1 2 1 据统计，截至2 0 0 7 年1 月4 日，沪深交易所公布了“批股权分置改革公司名单，两市共有1 3 0 3 家公司开始或完成股权分置改革。对价方案多以非流通股股东向流通股股东送股为主，沪深两市平均支付对价水平约l o 股送3 股。对价的实质是非流通股股东为获取流通权而向流通股股东支付的代价【3 】。对价的支付会引发流通股股东和非流通股股东之间的利益分配问题。但是，由于市场上对对价这一全新的概念缺乏科学统一的确定标准，难以界定对价方案的合理性，导致股权分置改革利益相关者制定对价决策时无所适从。就与对价相关问题的研究成为学术界与实务界关注的焦点，研究结果虽一致认为1 0 送3 的对价均衡不合理，但对导致不合理原因的探讨上至今仍未形成统一观点博弈论( g a m et h e o r y ) 是关于人们相互作用时如何行为的理论研究，并能通过策略选取的逻辑推理得出均衡策略指导实践。它以其普遍适用性和数学预中南大学硕士论文第一章导论测性而成为经济学的标准语言标准博弈均衡分析以理性人假说为前提，认为完全理性的经济人以最大化自身效益为原则进行决策。但许多著名的经济学家如s i m o n 4 1 、m r 0 5 1 、s a m u e l s o n 6 以及s e n 7 等认为：现实中人们不是完全理性，而是有限理性的。在有限理性下，由于个体的认知偏差等因素导致个体的最优决策并不可能一步实现。2 0 世纪9 0 年代以来，随着实验经济学的兴起，行为博弈论逐渐登上历史舞台。行为博弈论运用博弈实验的方法结合心理学研究成果分析和预测人们在策略决策时如何行为。它通过大量的博弈实验1 研究认为人们在策略决策时存在策略学习、公平思考等违背理性人假说的非理性行为，导致博弈均衡偏离标准博弈均衡，即导致不合理异象的普遍存在。从博弈论的角度看，本次股权分置改革的实质是非流通股股东和流通股股东之间关于非流通股流通权的讨价还价博弈。由于本次股权分置改革先试点实施而后再全面展开，并分批进行，在市场上缺乏统一的对价标准的情况下，第二批试点公司会参照第一批试点公司的对价方案，从中汲取经验教训，调整自身的策略；全面股改后各股改公司更是以试点公司和已实施股改的公司为参照，通过学习其对价方案而不断的调整自身的策略。而诸如最后通牒博弈实验等实验研究表明，有限理性的博弈参与者对历史策略的学习行为导致了博弈均衡会偏离标准博弈理论所预测的均衡。因而，存在认知偏差的博弈主体的有限理性的学习行为有可能对我国股权分置改革中对价均衡的形成过程产生重大影响。因此，本文希望将。有限理性的经济人一作为切入点，从行为博弈的角度出发，运用博弈学习理论，研究本次股权分置改革对价支付均衡的形成过程，分析其不合理性的形成原因，进而剖析博弈双方流通股股东和非流通股股东在经济活动中的决策特征。因此，本文的研究意义如下：首先，本文基于博弈的方法论，运用行为博弈理论的思想研究本次股权分置改革的对价均衡形成，一是对博弈论理论的拓展研究，二是对行为博弈论理论应用性的检验，三是对有限理性假设的检验。其次，本文将研究的视角放在股权分置改革的对价均衡上，纵观整个股权分置改革全程，有助子总结股权分置改革的经验教训，为政府相关部门进行下 1 最后通牒博弈( u l t i 删咖啪g a m c ) 实m ( t 早e ho u t h ，s c l u n i t t b e r g m 和s c h w a t z e ( 1 9 8 2 ) 4 2 提t h ，c a m e r e t 和 t h a l e r ( 1 9 9 5 ) i 4 l 、r o 瓤1 9 9 5 ) 重做了该实验【弼) 、独裁者博彝( d i c 埘婀凹m c ，乳悃岫e ( 1 9 9 4 ) 【“】等) 实验、礼物交换博弈( g i n 戗c h 锄静g a m e ，f e h “1 9 蚰尸5 l 等) 实验、信任博弈( t r i 域p m e 。b c 喀和d i c k h e m t ( 1 9 9 5 ) ) 实t 嗍) 2 中南大学硕士论文第一章导论一步市场改革工作制定相关政策方针时提供一定的指导作用。再次，分析股权分置改革对价均衡的形成，发现我国市场投资者各方博弈关系及影响其行为决策的非理性因素，有助于发现我国市场的规律，为我国市场监管、市场准入以及机构的设置等提供依据。 1 2 文献综述 1 2 1 股权分置改革关于对价的研究综述已有文献就本次股权分置改革搿对价圩问题的研究主要有：传统金融学学视角下的对价设计理论依据探讨、对价支付比例的理论计算模型以及对价支付合理与否的实证研究；行为金融学视角下对价支付非理性成因的探讨；基于博弈论的对价相关问题研究。简要如下图1 1 所示：一般研究方法叠厂传统金融学视角行为金融学视角对价设计理论依据；对价理论计算模型；对价支付合理与否的实证研究 d 认知偏差下的：锚定效应框定效应股利理论博弈论研究方法叠罗弋静态博弈论动态博弈论博弈机制研究合理对价标准研究不公平性原因分析图1 1 股权分置改革对价研究涉及的领域 1 、非博弈论视野下的股改对价研究。对价 ( c o m p e n s a t i o n ) 是英美合同法中的概念，意为一方为换取另一方做某事的承诺而向另一方支付的代价。从法律意义上看，对价强调的是一种等价有偿的允诺关系本次股改分置改革以“对价一的方式平衡股东间的利益，那么，非流通股股东为什么要支付对价，依据什么标准支付对价才公平合理? ( 1 ) 对价支付理论依据及理论计算模型魏建华( 2 0 0 5 ) 从对价与股东间的利益输送、流动性溢价和市场扩容的关 3 中南大学硕士论文第一章导论系说明了非流通股股东应向流通股股东支付对价嘲。尽管有学者认为对价的支付是对最初发行上市时非流通股超常溢价的一种矫正，对价补偿由对当初股票发行上市制度的系统性纠正和公司具体状况相关的差异补偿组成( 肖正根 ( 2 0 0 6 ) ) 9 1 ，构成对价支付的基础应该是“流动性溢价的流通股中的选择权，而不是对高溢价首次公开发行的补偿、对传递了虚假信息的补偿或是对承受股票市价下跌的补偿( 詹浩勇( 2 0 0 6 ) ) 【1 0 1 。瞿卫东( 2 0 0 5 ) 则认为流通股股价高于非流通股股价基于合理的“创业溢价一和不合理的“流通权溢价一，所以为保证流通股股东的利益不受损，非流通股股东需以对价的形式购买流通权【l l 】。张维( 2 0 0 5 ) 0 2 1 、丁志国( 2 0 0 6 ) f 1 3 】和陈永生( 2 0 0 6 ) 1 4 1 等众多学者亦认为对价不是对流通股股东过去损失的补偿，而是非流通股股东为购买流通权而需要向流通股股东支付成本。刘中学( 2 0 0 6 ) 将众多学者的观点归纳为股权分置溢价补偿论和流通权定价补偿论旧对比两种对价理论的本质区别，股权分置溢价补偿论主要基于流通股股东利益的考虑，更多强调的是历史因素，即历史上非流通股股东不合理剥夺了流通股股东多少，就应补偿多少，补偿后才能获得流通权。流通权定价补偿论则主要基于非流通股股东利益的考虑，这种观点摒弃了对历史过错的纠缠，更多强调的是未来因素，即全流通可能给流通股股东带来的伤害，强调以伤害程度作为确定对价的标准。至此，可以清晰的是，流通权定价补偿论为大多数学者所认同。除此之外，张道宏、吴渝( 2 0 0 6 ) 提出应该以实施全流通后的冲击成本应成为支付对价的主要依据【1 6 1 。理由是它能将非流通股股东的持股承诺或实际减持意愿体现在对价中。确定对价的理论依据不同，计算对价的理论模型就不同。廖其平等( 2 0 0 6 ) 总结了以下四种计算对价的方法：一是以两类股东认购股份的成本差异为基础；二是以非流通股股东获得的流通权价值为基础；三是以流通股股东受到的冲击成本为基础；四是以公司股权价值不变为基础【3 1 。李宁等( 2 0 0 5 ) 指出目前股改的企业中主要采用的对价测算方法有三种：溢价返还；公司价值不变；流通市值不变【1 7 1 具体来看，溢价返还法认为，股权分置条件下，公司股票发行时的市盈率明显超过了全流通状态下的合理水平，应将超出部分返还给流通股股东，据此可根据市盈率反推股价而后得出溢价部分；根据股改前后公司价值不变有，股改前的公司价值= 非流通股价值+ 流通股价值= 非流通股数每股净资产+ 流通股数当前流通股价= 股改后的公司 4 中南大学硕士论文第一章导论价值= 总股本x 股改后的合理股价，根据推得的股改后合理股价推出对价率；流通市值不变法认为，以国际成熟市场股价为标准，流通市值不应因股改而受损，据此可得对价率。但是，从实践操作上看，刘中学( 2 0 0 6 ) 认为利用总价值不变法确定对价相对更合理，同时，他在引入非流通股权合理溢价因子的基础上，推导出送股方式下的最低对价标准f 1 8 】。丁志国等( 2 0 0 6 ) 在政策中性原理和套利均衡理论下，以股改前后流通股和非流通股价值不变为原则，推导出股改的均衡对价公式【1 9 j ( 2 ) 对价的影响因素实证及其合理性判别与分析随着股改对价方案的不断出台，市场平均对价围绕1 0 送3 上下波动。理论上研究对价的度量标准逐渐与实证的方法相结合，试图探求影响对价的基本因素，为对价支付提供科学的依据。对价率是指非流通股股东支付给流通股股东的股份占流通股股东在改革前持有流通股份的比率，是一个相对量，市场参与者约定俗成为流通股每1 0 股得到的股数。廖其平( 2 0 0 6 ) 认为理论上对价率应受流通股比率、市净率、第一股东比率、机构持股比率、方案赞成率、换手率、波动率、净资产收益率等因素的影响，但通过对4 5 家已实施股权分置改革的上市公司对价水平影响因素分析，发现已实施的对价率与上述影响除赞成率外均不存在相关关系，各公司的对价支付表现出不合理性。张俊喜( 2 0 0 6 ) 认为对价支付应该参照公司基本面情况，即：公司规模、风险、股权结构( 总股本、非流通股比例、前1 0 大流通股股东持股比例等) 、盈利性( 每股收益、每股净资产等) 以及市场表现( 市盈率、市净率和收益的波动性等) ，但其通过对2 0 0 5 年初步完成股权分置改革的2 2 7 家上市公司的实证研究表明，对价率与非流通股比例和首发市盈率等显著正相关，却与盈利水平显著负相关 2 0 i 。苏卫东( 2 0 0 6 ) 通过对已实施股权分置改革的以送股方式支付对价的4 4 1 家上市公司对价率的实证分析得出，上市公司股改支付对价与股权集中度无关，与流通股比例呈正比，第一大股东为国家股、国有法人股的公司倾向于支付较高的对价【2 n 。 5 中南大学硕士论文第一章导论贺云龙( 2 0 0 6 ) 则通过对4 5 家试点上市公司6 种股改方案的实施对上市公司相关财务比率和理财目标函数的影响分析，得出缩股型方案可以使公司的每股收益和每股净资产上升，应是公司理性选择的股改方案圈。刘中学( 2 0 0 6 ) 和丁志国( 2 0 0 6 ) 则通过各自构建的理论对价支付模式说明“1 0 送3 一的对价支付不合理。总之，对价的支付方案没有综合反映公司基本面的情况，对价支付的理性程度不高。上述实证研究虽然指出了现行的对价支付存在不合理性，但都没有深入剖析不合理对价的原因。随后，有学者运用行为金融学的理论试图解释这种不合理现象的成因。袁磊( 2 0 0 6 ) 从行为金融理论的角度出发，认为股改方案对价的确定更多地取决于各方的博弈，投资者的行为方式和投资者是否理性，将影响对价方案的通过圆】文章指出，借鉴行为金融学的( 现金) 股利理论、“锚定行为、“沉淀成本效应一和材光环效应一以及信息不对称下投资者非理性情绪，对应的对价方案中是否包含现金、是否被修改过、上市公司的历史业绩以及对价股份是否来自送股( 或转增) 可能影响投资者对改革方案的判断。吴世农( 2 0 0 7 ) 应用锚定效应理论，对股权分置改革对价支付比例的形成机理进行了解释，指出此次股改公司所确定的对价存在“锚定和调整一的行为偏差，是一种并非完全理性的经济决策行为1 2 4 1 。 2 、博弈论视野下的股改对价研究肖正根( 2 0 0 6 ) 用博弈论分析了股权分置改革中非流通股股东和流通股股东之间的博弈关系阴，陈欣慰( 2 0 0 6 ) 认为股改博弈双方力量对比悬殊、对价方案由非流通股股东提出等股改机制导致了股改对价支付不合理，但。未完成股改，暂停再融资和股权激励改革一等相应政策，有利于纠正这种不合理性【2 5 1 。陈永生( 2 0 0 6 ) 就股改中对价的公平性进行了分析【1 4 1 。文章提出以股改增加的收益按持股比例在两类股东间进行分配来衡量方案的公平性。据此衡量己完成股改的对价方案发现对价率的不公平程度达8 0 6 。指出不公平的原因是对价谈判中双方力量的不平衡，买方处于完全垄断地位而卖方处于分散状态。丁志国等( 2 0 0 6 ) 从静态博弈论的角度分析了试点公司明显不合理的对价方案却高票通过的原因【1 9 1 。文章认为非流通股股东和流通股股东的博弈存在两个纳什均衡( o ，o ) 和( 0 ，z ) ，流通股股东在博弈中处于不利位置。同时指出，考虑到股改时机和成本，尽快解决股改对非流通股股东而言最为经济。 6 中南大学硕士论文第一章导论曾鸣( 2 0 0 6 ) 认为价格博弈是流通股股东和非流通股股东博弈的主要方面，其利益分割主要受对价水平和方案实施后的股价水平的影响刚。对价设计的估值标准不一和对价设计的随意性较大，使得流通股股东特别是中小投资者讨价还价困难。进一步分析影响对价和利益格局的博弈机制，认为缺乏市场化的博弈机制是影响目前对价和利益格局的原因，博弈过程中非流通股股东和流通股股东、流通股股东中机构投资者和中小投资者博弈力量失衡，使得公平对价和实现两类股东利益双赢困难。总之，已有文献从博弈论的角度分析，认为本次股改博弈机制、博弈双方力量对比失衡等因素导致了本次股权分置改革中不合理性的存在。 1 2 2 行为博弈学习模型研究综述博弈论( g a m et h e o r y ) 以其普遍适用性和数学预测性而成为经济学的标准语言。人们运用博弈论分析公司担忧其竞争对手如何行动的行为、分析员工在公司中的努力行为( 委托代理问题) 等。标准博弈论是基于理性人假说的，即人是自私自利的。正如g e o r g es f i o e r ( 1 9 8 1 ) 所说“当自私自利和广为人道的忠诚上的道德价值相冲突时，大多时候，事实上是大多数时候，自私自利理论将获胜。一但是，在最近2 0 年来，实验经济学家证实了一系列博弈，在这些博弈中参与者显示出了与标准博弈理论预测相违背的其他行为。如，通过 “最后通牒博弈 ( u l t i m a t u mg a m e ) 实验、独裁者博弈( d i c t a t o rg a m e ) 实验、礼物交换博弈( 酏e x c h a n g eg a m e ) 实验、信任博弈( t r u s tg a m e ) 实验等研究表明，博弈参与者存在与完全理性假设相违背的行为：利他、策略学习、公平思考等。解释这个异常行为的方法理论可以分为两个方面，一个是“公平假说一，另一个就是“学习假说一在解释这些现象的过程中，行为博弈论逐渐得到发展。公平假说因涉及心理因素难以定量研究，发展较为缓慢，而学习假说则运用参数模型从数学的角度出发进行定量研究，取得了较大的研究成果。德勒巴克( 2 0 0 3 ) 中提到，“学习不仅仅是个人在其一生中的经验产品，而且还包括那些沉淀于文化中的经验积累，积累起来的经验知识存量又会置于我们的学习中，并成为路径依赖、即过去对现在和未来的巨大影响的渊源，因此，学习成为了一种经过特定社会之文化过滤的累加过程，而文化决定着人们对损益的判断一大量研究表明在重复博弈试验过程中参与者存在学习行为。通过多次重复实验发现，重复博弈过程中，博弈者能了解博弈对手的行为特征、决策习惯，中南大学硕士论文第一章导论从而能在以后的博弈过程中根据其博弈历史来预测博弈对手未来的可能策略，参与者同样也可以从博弈对手以前与其他博弈者的博弈历史来学习其策略决策的行为习惯，形成博弈对手可能会如何行动的信念，甚至从其周围环境中的类似的博弈历史( 即社会文化) 来学习其策略决策的经验，形成博弈者自身如何行动会有可能达到最优化的信念，然后根据这些信念来调整自己的行动策略以最大化自己的收益。我们将这一行为称之为学习。意识到学习这一行为因素的影响后，经济学家尝试在博弈论的基础上引入学习因子建立学习模型( 1 e a r n i n g m o d e l ) 来研究相互作用过程中人们的策略选取问题。总的来说，学习模型放松了完全理性的假设，仍保持货币收益与效用相等。在学习模型假设下，参与者是有限理性，会逐渐学习选择策略。 2 0 世纪9 0 年代中期，已经有简单的学习模型能够解释特殊博弈中序惯选择的某些趋势。到2 0 世纪9 0 年代后期，简单的学习模型已经能够很好的捕捉实验数据中的某些趋势。自此以后，学习模型研究的焦点在于一个明确的参数模型如何能够解释相当广泛的博弈的均衡过程中更多的细节。根据学习模型的特征，我们可以将其分为三类：信念学习( b e l i e f l e a r r f i n g ) 、强化学习( r e i n f o r c e m e n tl e a r n i n g ) 、e w a 学习( 经验权重魅力值学习模型， e x p e r i m e n c e - w e i g h t e da t t r a c t i o nl e a r n i n g ，e w al e a r n i n g ) 。信念学习模型假定参与者根据过去的事件来更新他们认为别人会如何行动的信念，从而根据这些信念来决定哪种策略是最优的。一种广为接受的模型是 “虚拟行动一。在虚拟行动中，参与者始终记住另一个参与者以前采用的每种策略的相对频率。这些相对频率就是对那个参与者后面各期中行为的信念。参与者继而根据这些信念计算各种策略的期望支付，并以较高频率选择能获得较高期望支付的策略( c r a w f o r d , 1 9 9 5 ) 2 7 1 。虚拟行动对以前所有观察到的选择赋予相等的权重，相反的极端情况是古诺最优反应动态：即假设其他人会一再采用其近期使用最多的策略( c o u r n o t ， 1 8 3 8 ，1 9 6 0 ) 2 8 1 。古诺动态极为强调最近的经验，而忽略甚至不考虑以前的经验。相对于较早的经验，赋予最近的经验更高的权重，即为“加权虚拟行动一( c h e t m g 和f r i e d m a n , 1 9 9 7 ) 1 2 9 。强化学习模型忽视信念，假定各个策略被选择的概率或倾向不同，当策略被观察到成功或失败时，成功的策略将被加强，即其被选择的概率将加大( r o t h a n de r e v 1 9 9 5 ) p o 。参与者根据他们最近关于成功或失败的经验来调整他们选择策略的概率，参与人被假定按照下面规则行动“过去有用的策略在将来也会有用一，如在观察到策略成功或失败后，成功的策略会被加强即未来被使用的概 8 中南大学硕士论文第一章导论率被加大( b u s h 和m o s t e l l e r ( 1 9 5 5 ) ) 【3 。g a l e ，b i n m o r e 和s a m u e l s o n ( 1 9 8 5 ) 研究了对成功的参与人的模仿策略，在模仿的情形下，其他人的成功将影响参与人的选择策略【3 2 1 。强化学习模型被广泛应用于动物心理、人工智能等方面的研究( s u t t o n 和b a r t o ( 1 9 9 8 ) ) 3 3 】。一 c a m e r e r ，h o 和c h o n g ( 1 9 9 9 ) 在前人学习模型研究的基础上结合实验经验数据提出的e w a 学习模型是将两个广泛的学习模型( 即强化学习模型和信念学习模型) 混合而成【3 4 】在强化学习模型中只有选择策略的收益能更新策略吸引力和指导学习，在信念学习模型中，博弈方没有学习哪种策略运用最好，他们学习的是其他博弈者可能行动方案，然后运用这些更新的信念来改变魅力值，再决定哪种策略被选择。e w a 学习既考虑成功策略的影响，也考虑策略信念的影响，能轻松估计和解释其他模型漏掉的敏感特征，比强化学习和信念学习有更好的解释能力。 c a m e r e r 等通过大量不同博弈实验对比研究表明明了e w a 学习模型能够很好的捕捉博弈均衡的形成过程，如不完全信息下的重复博弈( c h o n g ，c a m e r e r 和h o ( 2 0 0 6 ) ) 3 5 1 ，考虑存在老练者教育行为的重复博弈( c a m e r e r ，h o 和c h o n g ( 2 0 0 2 ) ) 1 3 6 1 ，以及合作重复博弈( c a m e r e r 和h o ( 1 9 9 8 ) ) 阳。此外，c a m e r e r 等人不断完善e w a 模型，提出了s e l f - t u n i n ge w a 学习模型( h o ，c a m e r e r 和 c h o n g ( 2 0 0 7 ) 【3 明) 该模型用一个参数函数替代原来的6 0 p - - - 个参数，简化了原来的模型，同时具备与原e w a 模型相同的预测能力国内关于学习模型的研究主要是将强化学习模型用于自动化、人工智能方面( 俞星星，阎平凡( 1 9 9 7 ) 1 3 9 1 ；陈希，侯德文，朱祥玉( 2 0 0 5 ) 4 0 1 ；王仲民，岳宏( 2 0 0 5 ) ) h 1 1 1 3 本文的研究思路和结构框架基于实验经济学和心理学研究的行为博弈论研究已经普遍为人们所接受。 c a m e r e r ( 1 9 9 9 ) 提出的e w a 学习模型融合了信念学习模型和加强型学习模型，能够很好的捕捉博弈均衡过程。国内关于股权分置改革对价的合理确定标准、博弈论视野下对价均衡的形成过程已有相当的研究，但是仍未达到共识，可谓百家争鸣。此外，大量实证表明本次股权分置改革对价支付存在非理性，但对非理性的形成原因的解释还处在探讨阶段。截至目前尚无从行为博弈的角度来研究本次股改对价的均衡问题。 9 中南大学硕士论文第一章导论因此，本文拟从行为博弈的角度来研究本次股权分置改革对价均衡问题。本文研究思路是：全面考察本次股权分置改革各上市公司的对价方案，实证研究对价的影响因素，据此初步判断各公司的对价方案存在非理性。从博弈论的角度研究本次股权分置改革对价博弈均衡的形成机理，并运用博弈学习模型对其均衡的形成过程进行模拟，进而分析本次股权分置改革非理性对价均衡的形成原因，分析博弈双方流通股股东和非流通股股东的博弈决策特征，为我国市场监管、市场准入以及机构的设置等提供依据。基于上述研究思路，本文共分六章进行研究，结构安排如下：第一章：导论。提出本文的研究背景、目的及意义，综述本领域的研究现状，同时概述本文的研究思路及文章的结构安排。第二章：e w a 博弈学习机理介绍。详细阐述e w a 学习的基本思路、模型构建、参数涵义及参数估计方法，为后续模拟实证研究及决策特征分析提供理论基础。第三章：股权分置改革对价博弈均衡机理分析。首先简要描述股权分置改革、对价及其确定依据，而后从博弈论的角度阐述股权分置改革对价博弈机制，并分析其博弈均衡，然后从理论上分析影响对价博弈均衡的因素，认为受认知偏差的影响，博弈双方的对价决策可能表现出非理性，同时博弈双方因认知偏差而表现出策略学习行为，导致非理性因素的不断传递，加速博弈均衡的形成，最终导致博弈均衡偏离标准博弈理论所预测的均衡。为后续股权分置改革对价博弈均衡的影响因素实证研究以及e w a 学习模型模拟实证提供实践依据。第四章：股权分置改革对价博弈均衡的影响因素实证研究。基于第三章的理论影响因素分析提出实证假设，对本次股权分置改革对价博弈均衡进行实证检验，旨在证明本次股权分置改革对价博弈均衡的支付过程中，存在非理性的因素。第五章：基于e w a 学习模型的股权分置改革对价博弈均衡模拟。首先进行股权分置改革对价博弈均衡的e w a 学习建模，而后依据模型对本次股权分置改革对价博弈的策略选择过程进行模拟，得出模型参数。对模拟结果进行分析，解释非理性对价均衡的形成原因，进一步分析博弈双方的决策特征。第六章：结论与展望。总结全文，指出本文的创新之处，简要给出我国市场机制设置等方面的相应的建议和控制对策，并指出研究局限及进一步的研究方向。 1 0 中南大学硕士论文第二章e w a 学习模型及其算法第二章e w a 博弈学习模型及其算法绝大多数非合作博弈理论集中研究博弈中的均衡问题，尤其是纳什均衡 ( n a s he q u i l i b r i u m ) 及其精练，这就引发一个问题：为什么我们可以预期在一个博弈中观察到的行动与这些均衡中的某一个对应? 对均衡的传统解释是，均衡是在博弈的规则、参与者的理性以及参与者的收益函数都是共同知识的情况下，经由参与者的分析和自省所得出的结果。然而，不论是在概念上还是在实证上，这些理论都存在许多问题2 。学习模型为解释均衡如何产生提供了理论基础，学习模型认为：均衡是并非完全理性的参与者随着时间的推移寻求最优化这一过程的长期结果。学习模型主要分为三类：信念学习，强化学习及信念、强化学习模型的融合模型( e w a 学习模型) 。e w a 学习模型经大量博弈实验检验对人们经济活动的行为表现具有较好的解释力和预测力下面，我们将详细阐述e w a 学习模型的基本思路、模型及其参数涵义、参数估计。 2 1e w a 学习的基本思想 e w a 学习是经验权重魅力值学习( e x p e r i m e n c e w e i g h t e da t t r a c t i o nl e a r n i n g m o d e l ，e w al e a r n i n gm o d e l ) 的简写，它融合了强化学习理论和信念学习理论中加权虚拟行动理论的精髓。信念学习理论认为，博弈参与者会根据其他参与者先前行动的历史事件形成对别人会如何行动的信念，根据这些信念计算各种策略的期望收益，并以较高频率选择能获得较高期望收益的策略。信念学习理论主要有古诺最优反应 ( c o u r n o t , 【1 8 3 8 】) 、虚拟行动( b r o w n , r o b i n s o n ( 1 9 5 1 ) ) 【7 】以及加权虚拟行动 ( c h e u n g , f r i e n d m a n ( 1 9 9 7 ) ) 古诺最优反应中，参与者通过古诺调整过程来学习，其信念是认为对手会重复以前的策略，因此，简单地根据对手上一期行动来调整自己的策略，是一个短视的学习过程。虚拟行动中，参与者认为对手的策略服从一个固定的分布，最初参与者并不知道这个分布，而是随着博弈的进行通过学习才逐渐知道。参与者始终记住其他参与者以前采用的各种策略的相对频率，对其赋予相等的权重，以此作为参与者后面各期中行为的信念基础。加权虚拟行动中，参与者将观察到的对手的行动( 经验) 区别对待，相对于较 2 第一，当存在多个均衡时无法解释参与人是如何预期同一均衡g - ，假设。存在准确的关于支付函数和参与人理性的共同知识”的合理性。第三在大多数试验中，均衡理论可以较好解释后几轮试验，但很难解释前几轮试验中南大学硕士论文第二章e w a 学习模型及其算法早的经验，赋予最近的经验更高的权重。3 强化学习理论假定各个策略被选择的概率或倾向不同，当策略被观察到成功或失败时，成功的策略将被加强，即其被选择的概率将加大。强化模型的强化规则为：每个策略，时期的强化水平由上一期强化水平的一定权重和当期策略收益表示，如果该策略当期没有被采用，则不能被加强4 强化模型根据最近关于成功或失败的经验调整他们的选择概率，不需要丰富的经验，参与者仅仅被假设要求按照下面的规则行动：“过去有用的东西将来也会有用一。参与者只关注自己的选择和收益，而不考虑其他人的选择和收益。可以看出，信念学习理论忽略了参与者自己过去选择的成功策略的信息，而强化学习理论没有考虑其他参与者的历史行为，没有考虑参与者未选择策略的收益信息，事实上，当这些信息都可用时，参与者都会加以考虑。因而，c a m e r e r 和h o ( 1 9 9 9 ) 将这些信息加以利用，赋予每个策略一个“魅力值一( a t t r a c t i o n ) 5 ，用来表示策略被采用的概率大小，并通过3 个模型参数艿、p 建立了一在加权虚拟行动模型中用折扣因子p 来表示过去的经验的衰减( 0 p 而l g ，j ! ) 时，参与者 l 将因放弃策略砰的机会成本( 或者未选择策略砰的遗憾程度) 过大，而在以后的决策过程中选择策略，即露得到强化。 e w a 学习第二个关键的思想是如何控制策略魅力值( a t t r a c t i o n ) 的增长率

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf

文档简介

温馨提示

最新文档

评论

（管理科学与工程专业论文）基于ewa学习模型的股权分置改革对价博弈均衡研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档