




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
域的发展前景作了简要的展望。 关键词:量子博弈,策略空间,限制,纠缠,线性光学 i i a b s t r a c t g a m e t h e o r yi sw i d e l yu s e di ns o c i a ls c i e n c ea n db i o l o g y i ti s o n eo ft h e f o u n d a t i o n so fm o d e r ne c o n o m y i np h y s i c a lv i e w ,t h ep r o c e d u r eo fag a m e i sap r o c e s so fi n f o r m a t i o ni n - d e e d w ek n o wt h a tm i c r o s c o p i cp h y s i t s i s d e s c r i b e db yq u a n t u mt h e o r y w h e nt h em e d i u m i sam i c r o s c o p i cs y s t e m ,t h e i n f o r m a t i o ni sq u a n t u mi n f o r m a t i o n s og a m et h e o r ya n dq u a n t u mt h e o r y f o r m an e ws u b j e c t q u a n t u n lg a m et h e o r y , w h i c hh a sd i s p l a y e daw i d ep r o s p e c t o fa p p l i c a t i o n al o to fq u a n t u mi n f o r m a t i o np r o c e d u r ec a nb er e g a r d e da s q u a n t u mg a m e s ot h er e s e a r c h o fq u a n t u mg a m ei s h e l p f u lf o rq u a n t u m a l g o r i t h ma n dq u a n t u mc o m m u n i c a t i o n t h et h e s i sc o n s i s t so ff i v ec h a p t e r s i nc h a p t e ro d ew eb r i e f l yr e c a l lt h eb a - s i ct h e o r yo ft h eg a m ea n dq u a n t u m g a m e ,t h e nw e i n t r o d u c es o m es i g n i f i c a n t w o r k so ft h i sa s p e c t i nc h a p t e r t w o ,w es t u d y t h ei n f l u e n c eo ft h ec o n s t r a i n ti nt h ep a r a m e t e r s p a c eo nq u a n t u mg a m e s h a v i n gd e c o m p o s e ds u ( 2 ) o p e r a t o ri n t op r o d u c t o ft h r e er o t a t i o no p e r a t o r sa n dc o n t r o l l e do n ek i n do ft h e m ,w ei m p o s ea c o n s t r a i n to nt h ep a r a m e t e rs p a c eo ft h ep l a y e r s o p e r a t o r w ef i n dt h a tt h e c o n s t r a i n tc o u l dp r o v i d eat u n e rt om a k et h eb i l a t e r a lp a y o f f se q u a l ,s ot h a t t h em i s m a t c ho ft h ep l a y e r s a c t i o na tm u l t i e q u i l i b r i u mc o u l db ea v o i d e d w e a l s of i n dt h a tt h eg a m ee x h i b i t e da ni n t r i g u i n gs t r u c t u r ea saf u n c t i o no ft h e p a r a m e t e r o ft h ec o n t r o l l e do p e r a t o r s ,w h i c hi su s e f u lf o rm a k i n g g a m e m o d e l s i nc h a p t e rt h r e e ,w es t u d yt h eq u a n t u mg a m e sw h e r et h ep l a y e r sh a v e d i f f e r e n ts t r a t e g i cs p a c e s ( t h er e s t r i c t i o n st op l a y e r s s t r a t e g i cs p a c e sa r ed i f - f e r e n t ) w er e s t r i c t b o bt oc l a s s i c a l s t r a t e g i cs p a c ea n da l i c et o d i f f e r e n t q u a n t u mp u r es t r a t e g i cs p a c e s w ef i n dt h a tt h ep l a y e rw h o c a nu s eaq u a n r u m s t r a t e g i cs p a c ed o e sn o ta l w a y sp o s s e s sm o r ep a y o f f st h a nt h ep l a y e rw h o i sr e s t r i c t e dt oa p p l yo n l yc l a s s i c a ls t r a t e g i e s w ef i n dt h ec o n d i t i o no ft h e c l a s s i c a lp l a y e rg e t t i n gm o r ep a y o f f st h a nt h eq u a n t u mp l a y e r w ea l s of i n d t h eg a m ee x h i b i ti n t r i g u i n gs t r u c t u r e s i i i i nc h a p t e r f o u r ,w ep r e s e n ta l i n e a ro p t i c a lp r o p o s a lf o ri m p l e m e n t i n gt h e q u a n t u mg a m e s w ea l s og i v ea nu n i v e r s a ls c h e m ef o ri m p l e m e n t i n gt h eg a m e s b yu s i n ga n yq u a n t u mc o m p u t e r i nc h a p t e rf i v eas u m m a r yo ft h ew o r ka n da no u t l o o ko ft h i sa s p e c ta r e g i v e n k e y w o r d s :q u a n t u mg a m e ,s t r a t e g i cs p a c e s ,c o n s t r a i n t ,e n t a n g e l m e n t ,l i n e a r o p t i c s i v 第一章绪论 1 1 引言 博弈论 1 , 2 是应用数学的一个分支,它具有重要的理论意义和应 用价值,在经济学、社会科学以及进化生物学中有广泛的应用【3 ,4 。大 众对博弈的了解是从n a s h 在1 9 9 4 年获得诺贝尔经济学奖开始的。但 是现代博弈论的发展可以上溯到2 0 世纪初。1 9 2 8 年j o h n v o n n e u m a n n 给出了关于“两人零和”博弈的基本定理,十六年后他和0 m o r g e n s t e r n 共同发表了t h e o r y o fg a m e sa n de c o n o m i cb e b & v i o r 。此后,博弈论 得到很大的发展并已成为现代经济学的基础之一。 博弈理论与量子理论的结合,形成了一门新兴的交叉学科一 量子博弈论睁9 表面上看博弈与物理相去甚远,然而博弈过程本 质上是一个信息处理过程,这个信息处理过程一般包括博弈人之间 的信息交换以及对博弈结果的测量等。而信息处理过程是一个物理 过程,其根本属性应具有量子特性,特别是描叙生物进化的博弈本 身就是在分子水平上进行 1 0 】,那么其量子属性就更加明显了。量子 理论中的一个重要领域是量子信息 1 1 ,量子信息包括量子计算和 量子通信等方面的内容。因为量子计算和量子通信的诱人的计算加 速潜力【1 2 ,1 3 和通信保密性能 14 】,量子信息受到很多人的注意。博 弈过程是一个信息处理过程,所以许多量子信息处理过程可以看作 是“博弈”的过程例如,量子克隆可以认为是一个两人博弈嗍; 量子密码通信中,窃听过程可以认为是窃听者与信息发送者之间的 博弈。所以博弈的量子化可以对量子信息的研究有所帮助。博弈也 可以看作是一个算法,这一点在文献 1 6 中有很好的例子,该文用一 个很普通的博弈模型引出了一个量子纠错算法。另外,量子博弈也 为研究量子基本理论提供了一个新的手段。我们对于在娱乐时把扑 克或棋子换成原子或电子的市场可能性不感兴趣,但是在量子博弈 中出现的异于经典的现象正是我们想要得。建立一些抽象的简单的 模型对于基础理论的研究是大有益处的,量子博弈正好可以提供这 样一个模型。 量子博弈的发轫之作是m a y e r 1 6 】的关于投掷一枚硬币的不对称 博弈和e i s e r t 1 7 关于“囚徒窘境”的博弈。前者是两个参与者对一枚 放在暗箱里的“硬币”进行操作,这样的一个硬币被认为是一个二 态量子系统( 一个量子比特) ,规则是一方只能使用经典操作,要么 翻要么不翻,而另一方则可以执行量子操作,翻与不翻的叠加,该 博弈揭示了被允许执行量子操作的参与者在博弈中占有优势。后者 揭示了在量子化的博弈中窘境被打破。l m a r i n a t t o 和t w e b e r 研究 了性别对抗博弈 1 8 并给出了这个博弈的量子化模型的唯一均衡。 杜江峰小组在量子博弈方面做了很多工作。他们发现了在量子囚徒 窘境博弈中的相变情况 1 9 】并且用核磁共振量子计算机实现了该博 弈刚。关于囚徒窘境博弈的一个变种“双寡头博弈”他们也有了对 应的量子化实现方案 2 1 。另外,他们还研究了纠缠在多人量子博 弈中的作用【2 2 1 以及多人和多策略量子博弈 2 3 】。 s , c b e n j a m i n 和p m h a y d e n d 对多人量子博弈的研究表明在这类 博弈中可以有“相干的”平衡策略 2 4 。r k a y 等人第一次研究了博 弈的演化过程 2 5 发现“记忆力”m 的大小对于经典和量子博弈结 果的影响是不一样的。 1 2 经典博弈论介绍 博弈论在经济学领域有着广泛的应用,在介绍经典博弈论之前, 我们先看两个例子。 设想有两位投资者,如果共同投资一个较大的项目,他们可以获 得较大的回报。如果他们两个至少有一个抽出资金用于一个小项目 的投资,他肯定可以得到相应的回报,但这个回报比投资大项目相 比小的多。然而他这一做法使得大项目陷入困境,从而使另一投资 者蒙受损失。是冒一定的风险坚持较大项目以获得较大回报,还是 抽回资金投资小项目至少有个旱涝保收,这就需要投资者作出决策 并实施行动。 第二个例子名叫“囚徒窘境”,讲的是两个嫌疑犯作案后被警察 抓住,被分别关在不同的屋子里审讯。警察告诉他们:如果两个人 都坦白各判4 年;如果两个乔抵赖,因证据不足,各判2 年;如果其 中一人坦白,另一人抵赖,坦白的放出,抵赖的判刑5 年。对于两个 嫌疑犯来说,虽然最好的局面是两个都抵赖,证据不足,各判2 年, 博奔和e i s e r t 1 7 鬻。两蕊噶爱。礞罐菇? 酱耄堪嚆筛套墨毒嘲嘲 谦秀镬罐菌霄。镶蒋。葡笫堪磁:鹊舞藕并碡薷菰预喂罐并上 焉省聿孬舔i 并遗聿薛鬻ij 葡简凄鬲辩蔷傣薛黉墒罐粥! 瑾万 两崖黟荠纛;篇豁一再简葡铺鬻案崔 豳溉! 萄兰舞碡像罐镐i 毪 馐毯谢蔫警氰嗡激裂糍崮 菇该兹荔善褒憔釜籀一鼋删型,常萋 馕蒜簧秉馐毒m 谍罐越猫奄镬铺崩稍,l ? m a r i n a t t o 满t w e b e r 誊磐 霉薷霈绺器甾慕:i i :雾墨鬻甲挚念量菸嚣副兰扎鹭需茬蓄蠹器: 龆! 孛:亳熏落巨至苦嚣誊誊剽霉蕾雾擎起! 群蔑g 斋葶斧匡至南器 基晷磊曩辇雾引罴善寻i 1 9 ;登君藿雾遂蛭荟譬善育珏嚣型蠢薹藿隆 骤熏。鐾黍塞雾筵荐墨壁攀一攀竺差6 垡型零鑫臻。葬嫫喇望妻薹 型辇誊兽膏垡嚣塑盘;l ;i 。誉君i 张霉誊肄型霪了装挚售争合兽毒 曼罄 人和多策略量子博弈23】。scbeisin 和pmhlldend对多人量子博弈的研究表明在这类博弈中可以有“相干的 ”平衡策略14。rkg等人第一次研究了博弈的演化过程;发现“ 记忆力”m的大小对于经典和量子博弈结果的影响是不一样的。 耋;2 经典博弈论介绍 博弈论在经济学领域有着广泛的应用,在介绍经典博弈论之前, 我们先看两个例子。 设想有两位投资者,如果共同投资一个较大的项目,他们可以获 得较大的回报。如果他们两个至少有一个抽出资金用于一个小项目 的投资,他肯定可以得到相应的回报,但这个回报比投资大项目相 比小的多。然而他这一做法使得大项目陷入困境,从而使另一投资 者蒙受损失。是冒一定的风险坚持较大项目以获得较大回报,还是 抽回资金投资小项目至少有个旱涝保收,这就需要投资者作出决策 并实施行动。 第二个例子名叫“囚徒窘境”,讲的是两个嫌疑犯作案后被警察 抓住,被分别关在不同的屋子里审讯。警察告诉他们:如果两个人 都坦白各判4 年;如果两个乔抵赖,因证据不足,各判2 年;如果其 中一人坦白,另一人抵赖,坦白的放出,抵赖的判刑5 年。对于两个 嫌疑犯来说,虽然最好的局面是两个都抵赖,证据不足,各判2 年, x 个项目的多次投资,这样他们的策略可以是混合策略。收益的分配 是这样的,当两个公司都和对方合作时他们可以得到利润3 ;当双 方都背叛对方时得到的利润就因为相互的恶性竞争都降为1 ;当一 方合作而对方背叛时合作方有损失,利润为0 ,而背叛对方者得到 较高的利润5 。明显,在这样的获利矩阵下每个公司都会选取背叛 的,因为当a 公司选取合作时他的利润在。到3 之间,而选取背叛 时在1 到5 之间,基于对高利润的追求和对高风险的回避,很自然 每个公司都会选取背叛作为他的策略。这样就会形成一个稳定的均 衡,即n a 。s h 均衡,这时的联合策略点为n a s h 点。如果双方都取合作 策略我们称联合策略点为双赢点。双赢点的一般定义为:在该策略 剖_ l ;丁,在不降低对方收益的同时,任何一个参与者都不能提高其收 益。显然,在这里双赢点不是稳定点,每个公司都可以改变其策略 而使自己的收益增加。双方收益之和最大的联合策略点我们称之为 最佳点,在上面的例子中双赢点就是最佳点。事实上,以上的性质 只要r 、s 、t 、p 的取值符合一定要求就可以。严格计算得出关 系t r p s ,当t + s 曼2 r 时双赢点是最佳点。t + s 2 r 时 双赢点不是最佳点,一个例子是r 、s 、t 、p 分别取值3 、0 、 8 、1 ,也就是提高了一个公司合作另一个公司背叛时后者的利润, 比两个公司合作时的共同利润都大,在一些少数企业垄断的行业里 这种情况是普遍的。 1 3 量子博弈 1 9 9 9 年,j e n se i s e r t 等人研究了囚徒窘境的量子化模型 1 7 ,2 6 口 囚徒窘境的量子化模型如图1 1 所示。 这个模型包括三个部分: ( 1 ) 一个两量子比特的发生器,每一个参与者拥有一个比特; ( 2 ) 参与者的操作装置,允许参与者操作他那一个量子比特,这 些操作被认为是参与者的策略; ( 3 ) 一套测量装置,通过测量两个量子比特的最终状态来确定每 一位参与者的收益值。 每一个参与者对这三个部分都很清楚,并且不知道对方的操作 6 两参数幺正矩阵集合 叩川:r 8 孑 一s l n 差 s i 一。c s sg ) 中n1 日! - ;nr 毫”2 ;凌日_ 萌洲氛丑两h 一翔f o ,o j _ _ ,嚣锥 就垡孰一飘i 。u 2 一z 6 , 式j r 的遵渭厘蔼穗罐茎蒌列沥则当只傲用磊嚼曩帝劬侧馐奔刁 :蠢甬专每嚏;鬟絮填堆领研同的增幄出霸,当南意;藿哥稍垲;差一的纠 谚群参垤啃谤地研;蘩有点胡侧;蘩留碘噍顾丽同的皑屈出锄。超制, j 应该满足条件 j ,d o 动= 0 , ,西o q = 0 和限d o 蠢i = 0 。当以上对 易条件满足时,这个量子化博弈模型包含了参与者采用混合策略时 的经典囚徒窘境。j 可以写成了= e x p ( 竹dob 2 ) 其中7 【0 ,”l l ;是实 参数。事实上i ? 可以作为纠缠的度量。 e i s e r t 等人发现,当1 = 0 时博弈和它的经典对应有相同的性质, d o d 是占优策略,每个人收益都是1 。但是当博弈是最大纠缠时, 即7 = ”2 时,情况就完全不一样了。这时,d o d 不再是占优策略, 也不再是n a s h 均衡,每个参与者都可以通过单方面改变自己的策略 提高收益。这时出现的薪的均衡是qo 奄( 国= 痧;i ,z 2 ) ) ,而且是唯一 均衡,每个人的收益是3 ,这时窘境打破了。 文献 1 9 ,2 0 】进一步研究了博弈随着纠缠变化的规律。发现博弈表 现出有趣的结构变化,随着纠缠的变化博弈有一个类似“相变”特 性。下面我们简单的介绍一下具体情况。 7 在( 0 , l 2 】上有两个阈值q $ h l = a x c s i n 以万和协2 = a r c s i n 厄万, 它把整个纠缠的区域分为三段。 在第一个区域( o 1s 懈。) 中,博弈的n a s h 均衡是豆o d ,a l i c e 的收益为1 ,b o b 的也为1 。这和经典情况是一样的。所以在这个 区间中量子博弈并不比他的经典对应有任何的优越。 图1 2 给出了7 = t t h l 2 时a l i c e 的期望收益。 可以看出,不论b o b 采取任何策略( ) ,a l i c e 只有选择d 才能 使自己的收益最大化。博弈是对称的,所以b o b 也只有选择d 时才 能使自己的收益最大化。这一结论对整个0 7s 他。区域都成立, 所以当纠缠在此区域中博弈和其经典对应是狸同的。 8 图15 :博弈者采用均衡策略时a l i c e 的收益图在第二区“点线”表示 $ ( 国,d ) , “划线”表示$ ( 西,国) ( 本图来源于文献 2 0 d 。 博弈表现出和经典对应相同的性质;当。7s ”2 时,博弈是“量 子”的;当7 t h l 7 a r c s i n 妒万) 【1 9 博弈在纯策略意义上没有了n a s h 均衡 1 2 7 1 。 第二章公平限制策略空间对博弈的影响 2 1 限制的引入 在前一章中,我们主要讨论的策略空间并不能包括所有的二维 幺正操作,当然体现的量子博弈的性质也不完全。当把策略空间扩 大到普遍的二维幺正操作戈s u ( 2 ) 空间时,纯策略博弈在最大纠缠 情况下不再有n a s h 均衡点。 在文献 5 中,每个参与者的操作由下式表示 吣= ( ;:嚣鑫。i 痂e i zs 湖i n 冬) , ( 2 ,) 其中0 o ,”】,卢 一丌 州。用j = e x p ( i t # 。0 氏2 ) 引入纠缠,在 最大纠缠,也就是7 = ”2 时,当a l i c e 取任意策略o ( o 舟国时b o b 取 d r y ( 0 ,一n 1 丌2 一卢) 可以使a l i c e 收益为0 而自己的为5 ,反之亦然。所 以博弈没有n a s h 均衡点。 事实上任意的对一个单量子比特的幺正操作可以由连续的三个 幺正操作如( a ) 、廊( 口) 和惑( 卢) 以及一个相位因子e i 5 组成前面三 个分别为e x p ( i o b z 2 ) 、e x p ( i o b g 2 ) 和e x p ( i f l b :1 2 ) ,对应把量子比特绕 b l o c h 球的z 轴、y 轴和z 轴旋转。 这样二维幺正操作可以表示为: d = e i 5 r z ( 卢) 或( p ) 如( a ) 尝就s i 。- 譬譬) , 协。, 其中i 为a 或b 分别表示a l i c e 或b o b 。为了方便起见我们令a + 晟= 2 钱 啦一觑= 2 w i ,上式变为: 圳= ( 一e i v l c o 咖s 睾:蒜) 皿a , 1 3 对应于j 和d 分别为晚( o ,u ,o ) 和晚( ”,0 ,”) 。选取j = e x p ( i t d o ) 2 ) 。我 们只讨论在最大纠缠时的性质。简单的计算可知当a l i c e 任取d ( ”,u ,p ) 时,b o b 取扩+ ”2 ,u ,p + ”) 就能使a l i c e 的收益为0 而自己的收益 为5 。对于( 2 3 ) 式来说就是a l i c e 取痧( a ,犀,毋时b o b 取d ( + z 2 ,一声+ ”2 ,0 + ”) 。明显,( 1 2 ) 式的量子操作是( 2 3 ) 式的量子操作的一个子 空间,当我们要求o a = 触和。曰= 肋时,量子操作被限制在这个子 空间中,这时博弈有一个均衡点使双方收益都为3 。 这样的对s u ( 2 ) 操作的参数空间的限制能带来博弈的新的n a s h 均 衡使的窘境被打破。那么,如果我们强加更多限制在策略空间上,博 弈会出现什么有趣的性质呢? 显然,可能的限制是很多的,我们希 望找到的限制应该是较好实现,有一定的理论意义并且有很好的结 果。很好的结果是指量子博弈对于它的经典对应有一种优越性或有 截然不同性质。我们注意到如果对于z 轴的旋转为零角度时对y 轴 的旋转只能改变经典策略d 和c 上的几率幅。也就是说当对于z 轴 的旋转为零角度时对于y 轴的旋转相当于混合经典策略。对于引入 纠缠的j 来说,他和这样的对于y 轴的旋转操作是对易的因此, 这种情况下博弈与纠缠度无关。 既然一个任意的幺正操作可以分鹪为这两类幺正旋转操作,即 分别对应于绕b l o c h 球z 轴和y 轴的旋转,那我们让其中的对于z 轴 的旋转操作由第三者c h a r l e s 执行,这个第三者可以是建立博弈模型 的人,也可以是一个中间人,比如执行引入纠缠的操作的一方。当然 我们在公平博弈的前提下就必须要求这个第三者对双方的量子比特 执行相同的操作。现在我们把关于z 轴转动的操作由第三者执行, 把执行关于y 轴的转动的操作的权力留给a l i c e 和b o b 。这意味着参 数“和幻被a l i c e 和b o b 分别地同时决定,a a ,a b ,风和如被 c h a r l e s 确定。当c h a r l e s 变化他的参数时,他改变的是a l i c e 和b o b 的 策略空间在整个幺正策略空间中的位置。为了保证博弈的公平性, a a ,a b ,风和胁应该满足o = a b 和以= 阢。 图2 1 给出限制策略空间的量子博弈的模型,虚线内的操作由 c h a r l e s 执行。 1 4 图2 1 :限制策略空间的“囚徒窘境”量子博弈的模型 2 2 博弈随着限制的变化性质 我们研究的情况是c h a r l e s 的四个参数a 一,o b ,以和阢的取 值都相等的情况,也就是说使他们都等于x ,然后研究博弈随着x 的变化性质。 我们发现,x 在区间【o ,”2 】有两个阈值x - 和) ( 。,它把整个参数 区域分为三段。如果我们用表1 2 的数据,) ( ,和x 。可以表示为: x 1 = a r c 8 i n 川f = 可万, ) c 2 = 缸c s i n 、【4 a b + ( 4 a + b ) 2 1 6 a ( r t ) 】【( 8 ( r p ) ,( 2 5 ) 其中a = 兄一p b = t s 。在不同的各个区域博弈有不同的性质。下 面我们分别在各个区域讨论博弈的性质。 区域1 满足条件8 i n 2 x s i n 2 x 1 ,这时,当b o b 采用策略o b = 7 r 时,a l i c e 的收益仍然是式( 2 6 ) 。由于区间2 满足( s c o s 2 x + t s i n 2 x ) 1 5 、 r e g 。n3 a o g l o n lr e 9 由n2 、 x 1 x x 2n 2 图2 5 :n a s h 均衡下a l i c e 和b o b 的以参数) ( 为变量的收益函数图。 区域2 中,当n a s h 均衡( 0 a = 0 ,o b = ”) 被实现时虚线表示b o b 的收益,实线表示a l i c e 的收益;当n a s h 均衡( 0 a = 7 r ,0 b = 0 ) 被 实现时虚线表示a l i c e 的收益,实线表示b o b 的收益 2 3 讨论 一般来说,由于策略空间的扩大,参与者可以更为有效的进行博 弈,博弈会表现出更多的性质。经典的博弈应该为全空间的量子博 弈所包容,因为经典博弈的策略空间是量子博弈策略空间的一个子 空间。而我们把策略限制在原策略空间的一个特殊子空间时,在那 儿没有经典对应,我们发现博弈中的双方可以回避风险而得到较好 的收益。当然我们的讨论都是在最大纠缠下的,如果没有纠缠,博 弈和经典的混合博弈一样。以上的量子博弈中量子操作包括对各个 态叠加几率的改变和相对相位的改变两个部分,如果单纯地考虑几 率,那么量子博弈并不比经典的混合策略多出什么,至少在我们考 虑的这个模型中是这样。事实上单独的纠缠或相位对于我们的量子 博弈来说是没有意义的,如果不考虑相位,纠缠自己并不能在双方 的策略中建立有效的连接。同样,没有纠缠的话相位也不能对博弈 有任何影响。 1 9 第三章不公平限制策略空间对博弈的影响 3 1 不公平限制 1 9 9 9 年,m e y e r 提出的关于抛硬币问题的量子模型【1 6 显示了一 个参与者如何利用量子策略以绝对的优势赢得了博弈。m e y e r 研究 的博弈是不公平博弈,因为参与者有不同的策略空间。我们自然想 间:在“囚徒窘境”博弈中参与者有不同的策略空间时博弈有什么 样的性质。这一章的内容着重于此。 关于“囚徒窘境”博弈的大多研究着重于受限制的策略空间。而 且,大多数的研究是关于公平的博弈( 对所有参与者的策略空间的限 制是同样的) 。在本章中,我们研究参与者有不同的策略空间的量子 博弈( 对参与者策略空间的限制是不同的) 。我们发现能使用量子策 略空间的参与者不是总能获得比被限制仅能运用经典策略的参与者 更多收益。也就是说有较大策略空间的参与者并不总占有优势。这 个性质是不同于m e y e r 的抛硬币问题的。 我们知道在这个博弈模型中两个参与者是理性的。它意味着每 一个参与者只关心提高他自己的收益而不关心对方的收益。换一句 活说就是参与者不会在乎他的对手的收益多少,他只关心自己的收7 益。因此如果一个参与者,例如a l i c e ,执行一定的策略a ,那么b o b 将使用能使他收益最大的策略雪。我们称雪是对于a 的最佳策略。 如果对于b o b 使用策略雪a l i c e 的最佳策略仍然是a ,博弈就有n a s h 均衡( a ,亩) 。 我们感兴趣的是:一个参与者,比如说b o b ,被限制在经典的策 略空间z j ,d ) ,另一个参与者,a l i c e ,执行局域量子操作的情 况。它意味着b o b 的策略限于经典纯策略空间而a l i c e 的策略为量子 纯策略空间。 前边的讨论中我们知道了在公平博弈中量子策略空间有不同的 限制时博弈有不同的性质。那么在不公平博弈中当我们给a l i c e 不同 的限制时博弈有什么样的性质呢? 在这一章中我们分节详细讨论。 2 1 我们知遭任意的2 2 幺正矩阵能被写作为: 舳,蚴一( 卅e i ic 嗡o s 。譬e 矿- “i 。篓) , ( 3 t ) 其中下标i = a ,b 分别代表a l i c e 和b o b 。b o b 仅能执行经典操作意 味着c b 0 ,仲;0 和0 口 0 ,” 。当a l i c e 执行操作以( c a ,l p ,o a ) b o b 执行操作( o ,0 ,0 b ) 时,简单的计算可以得出: p c 。:k ( “) c o s 2 譬c o s 2 譬+ l ( ) s i n 2 譬s i n 2 譬一m ( “,) , :k ( “) c o s 2 譬s i n 2 譬+ 工( 妒a ) s i n 2 下o ac 。s 2 譬+ m ( 如,) , p d 。:k ( v a ) s l 2 了0 ac o s 2 了o b + l ( “) c 。8 2 譬s i r f l 譬一m ( m ,“) , p d d :( ( p a ) 8 i n 2 警s i n 2 譬十三( “) c o s 2 可0 ac 。s 2 下o b + m ( t p a , “) ,( 3 2 ) 其中函数k ,l 和m 分别为: k ( z ) = c o s 2 。+ s i n 2 c 0 8 2 ,y , 三( z ) = s i n 2 x s i n 2 7 , m ( ,9 ) = 2s i n y c o s x s i n 7 s i n ( 0 a 2 ) c o s ( 0 b 2 ) c o s ( c a 2 ) s i n ( 2 ) , 把( 3 2 ) 式代入式( 1 1 ) ,我们能容易地写出a l i c e 和b o b 的收益的 期待值作为“,蚍,0 a ,1 和0 丑的函数。 最后要交代的是在本章中我们采用( 3 ,0 ,5 ,1 ) 模型。 3 2 经典策略空间对一参数量子策略空间的情况 现在我们考虑a l i c e 可以拥有一参数策略空间的情况。这个一参 数策略空间即0 - a ( o ,o ,0 a ) 我们用既( “) 表示。事实上,这样的一个策 略空间类似于混合经典策略空间。假定b o b 选择策略j ,根据式3 2 , a l i c e 的收益为t $ a = 3 c 0 8 2 警+ 5 s i n 2i u a ,( 3 3 ) z 这样,a l i c e 将采用策略“= ”以期得到较高的收益5 。当a l i c e 使 用策略o a = ”去追求较大收益时b o b 的收益为$ 曰= s i n 2 ( o a 2 ) 。这 时b o b 的最佳策略为d 当b o b 采用策略d 时,a l i c e 的收益为 $ a :s i n 2 ( 9 b 2 ) 。a l i c e 的最佳策略仍为使钆= ”。这样,博弈有一个 n a s h 均衡( 钆= ”,幻= ”) ,收益分别为$ a = 1 和$ 口= 1 。 应该提到的是,在这种情况下博弈对于纠缠程度没有关系,这 一点可由了和以( “) o d ( 以( 卧) 0 0 ) 对任意的值都对易推出。因 此,a l i c e 在这个情况中根本没有优势,尽管她比b o b 有一个大的策 略空间。 3 3 经典策略空间对二参数量子策略空间的情况 在公平博弈中二参数量子策略空间是被关注最多的,因为在这 样的策略空间中窘境被打破。现在我们研究a l i c e 拥有两参数策略空 间以( c a ,0 ,o a ) 的情况,我们把这样的策略空间用既( “,钆) 标记。 假定b o b 选择策略j ,这时a l i c e 的收益为 s a3 ( c o s 2 “+ s i n 2 c a c o s 2 7 ) c o s 2 i o a + 5s i n 2 i o a + s i n 2 c a s i n 2 7 c o s 2 警( 3 4 ) 明显地,我们可以看出对于任意的,y ,a l i c e 的最佳策略为使“= ” 和c a = v 。当a l i c e 采用0 a = w ,“= v 这样的策略时,b o b 的收益为 $ 日= s i n 2 ( o 曰2 ) 。b o b 将采用= ”追求收益1 。假定b o b 选择d , a l i c e 的收益为 s a = 5s i n 2 7 s i n 2 “c o s 2 警+ s i n 2 警 ( 3 5 ) 简单的计算可以得出,对于7 ,y 。= a r c s i n v 琊,a l i c e 的最佳策略为 以( v ,”) 收益为1 这样,对于,y a r c s i n 狐万,不公平博弈有n a s h 均 衡( o a = 7 r ,“= v ,= ) ,收益为$ a = 1 和$ 日= l 。 根据式( 3 5 ) ,当b o b 采用策略使0 b = ”时,在,y a r c s i n 狐万情 况下,a l i c e 的最佳策略是以 2 ,o ) ,收益为5s i n 2 7 。当a l i c e 采用策 略嵋( ”2 ,o ) 时,b o b 的收益为 如= ( 2 c o s 2 ,y + 1 ) c o s 2 百u b + 5 c o s 2 7 s i n 2 等( 3 6 ) 对于,y 7 a x c s i n 们乃 区域中是一个n a s h 均衡。 2 3 $ a :s i n :( 2 ) 。a l i c e 的最佳策略仍为使钆= ”。这样,博弈有一个 n 船h 均衡( 钆= ”,幻= ”) ,收益分别为$ a = 1 和$ 口= 1 。 应该提到的是,在这种情况下博弈对于纠缠程度没有关系,这 一点可由了和以( “) o d ( 以( 卧) 0 0 ) 对任意的值都对易推出。因 此,a 1 i c e 在这个情况中根本没有优势,尽管她比b 0 b 有一个大的策 略空间。 3 3 经典策略空间对二参数量子策略空间的情况 在公平博弈中二参数量子策略空间是被关注最多的,因为在这 样的策略空间中窘境被打破。现在我们研究a l i c e 拥有两参数策略空 间以( “,o ,“) 的情况,我们把这样的策略空间用既( “,钆) 标记。 假定b o b 选择策略j ,这时a l i c e 的收益为 $ n = 3 ( c 。s 2 “+ s i n 2 扎c o s 2 7 ) c o s 2 警+ “n 2 警+ s i n 2 “s i n 2 7 c o s 2 警( 3 4 ) 明显地,我们可以看出对于任意的,y ,a l i c e 的最佳策略为使“= ” 和“= v 。当a 1 i c e 采用卧= w ,“= v 这样的策略时,b o b 的收益为 $ 日= s i n 2 ( 如2 ) 。b 0 b 将采用= ”追求收益1 。假定b o b 选择d , a 1 i c e 的收益为 $ a = 5s i n 2 7 s i n 2 “c o s 2 警+ s i n 2 警 ( 3 5 ) 简单的计算可以得出,对于7 ,y 。= ”c s i n 狐压,a 1 i c e 的最佳策略为 以( v ,”) 收益为1 这样,对于,y a r c s i n 狐万,不公平博弈有n 曲均 衡( 钆= 7 r ,“= v ,= ”) ,收益为$ a = 1 和$ 日= l 。 根据式( 3 5 ) ,当b o b 采用策略使= ”时,在,y a r c s i n 狐万情 况下,a l i c e 的最佳策略是以( ”2 ,o ) ,收益为5s i n 2 7 。当a l i c e 采用策 略嵋( ”2 ,o ) 时,b o b 的收益为 如= ( 2 c o s 2 ”1 ) c o s 2 警+ 5 c o s 2 7 s i n 2 等( 3 6 ) 对于,y 7 a r c s i n 们乃 区域中是一个n a s h 均衡。 2 3 o1 0 1 11 21 31 4 1 92 0 0叼pp 印印pp 1ppppppp 2p印pppppp 30 眵q p眵p 4pppp p 5p pp 6 锣pp 7pp 8 口 9 印p 1 0p 表3 1 :在不同的纠墟程度和b o b 的不同策略下,a l i c e 的最佳的策 略横向表示从0 到7 r 以步长7 r 2 0 值变化;纵向表示7 从o 到 了r 2 以步长丌2 0 值变化表示a l i c e 的最佳策略为以( 7 r 2 ,o ) ; 叼代表以( v ,7 r ) ;毒代表以( v ,”) 或者以( 丌2 ,o ) 。在标记上方 有一条短线的格子代表该处有n a s h 均衡 对于7 a r c s i n 、砺,当a l i c e 采用策略弼( ”2 ,o ) ,b 0 b 的最佳策 略为j 。假定b o b 选择策略f ,a l i c e 的最佳策略是既( v ,”) 。当a 1 i c e 采用策略叱( v ,丌) 时,b o b 的最佳策略是d 。根据式3 5 当b o b 采用 策略d ,a l i c e 的最佳策略是既( ”2 ,o ) 。因此,对于了 ”c s i n 、可j , 不管b 0 b 选则策略j 还是d 博弈都不能形成n ”h 均衡。 另一个有趣的情况是:a l i c e 的策略仍然为两参数操作,b o b 的 策略是“混合经典”策略。它意味着a i i c e 的策略由既( “,以) 表示b 0 b 的由( 如) 表示。 如果我们给定纠缠程度7 和b 0 b 的操作,我们很容易获得a 1 i c e 的期望收益作为他自己的操作的函数。在第3 1 蜃中我们描述了在不 公平博弈中,当= 3 ”4 ,7 = ”4 时a l i c e 的期望收益随着参数卧和 加的变化情况。从图中很容易找出a 1 i c e 的最佳策略为d j ( ”2 ,o ) 。在 其它的蚀和7 的情况下,我们也能作类似的讨论找到a ! i c e 的最佳策 略。 所以,我们能把a l i c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 7《兼爱》教学设计 2023-2024学年统编版高中语文选择性必修上册
- Unit 4 History and Traditions Reading for writing 教学设计-2024-2025学年高中英语人教版(2019)必修第二册
- 2025年信息技术全册教案
- 2025年中考地理试题分类汇编:我国的地理差异(第1期)原卷版
- 2025年药师肺炎考试题库及答案
- 小学二年级(下)语文第三单元检测卷4套+答案
- 2025年全国工业锅炉G1证理论考试题库(含答案)
- 小奥数启蒙题目及答案
- 常德助理医师考试真题及答案
- 2025煤炭和石油购销示范合同
- 班级纪律班会课件
- 防性侵防溺水防校园欺凌主题班会课件
- 粮食商贸公司管理制度
- 水平定向钻进管线铺设工程技术规范
- 水利安全风险防控“六项机制”与安全生产培训
- 跨境电商物流风险管理-全面剖析
- IP授权合作及衍生品开发协议
- 2025年小学五年体育试题及答案
- YS/T 3045-2022埋管滴淋堆浸提金技术规范
- 大中型企业安全生产标准化管理体系要求编制说明
- 养老院房屋租赁合同
评论
0/150
提交评论