




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文搐要 第1 i i 页 中文摘要 量子博弈论是研究博弈者使用具有量子性质的载体( 比如 粒子) 以及使用量子操作作为策略的情况下的博弈行为的一 门科学。研究表明,量子策略能够使博弈者获得比经典博弈 更好的收益和策略均衡。比如,对于经典的“囚徒困境刀博 弈,量子策略能够使两位博弈者摆脱经典博弈中的“困境刀, 而产生一个新的策略均衡,从而使得博弈者双方都能获得良好 的收益。由此可见,量子博弈论具有深入研究的价值。 一个基本粒子不但具有量子性质,同时也具有相对论性 质。当一个粒子以高速运动时,在一个静止系中的观察者将 会发现该粒子的自旋方向等量子特性发生改变;对于两个处 于纠缠态的粒子进行高速运动的情况,静止系中的观察者也 会观察到其纠缠度发生变化。这些量子特性在相对论情况下 的变化将对量子博弈产生重大的影响,从而可能改变量子博 弈的性质或产生新的策略均衡。 我们研究运动坐标系中的量子策略,以经典博弈论中的 “囚徒困境”为模型,并针对两粒子纠缠度,给出四个可以 决定纳什均衡的阈值。我们发现,对于相对仲裁者做不同运动 的博弈者,相对论操作可以增强或减弱该博弈的量子特性。 本文的结构是这样设置的: 第一章,介绍经典博弈论的历史、重要定理、命题,以及符 号规则等等。这部分是本文的理论基础,也是本文的根本出 发点。 第二章,介绍量子博弈论的研究进展以及常用方法,着重 介绍量子囚徒困境的研究情况。本文的理论模型即是量子囚 徒困境。 第三章,介绍单粒子自旋态以及量子纠缠在洛伦兹变换下 的性质,这是将量子囚徒困境相对论化的理论依据。 中国科学技术大学硕士学位论文 第l v 页中文捕要 第四章,详细论述本人在相对论量子博弈论方面的一些研 究工作,指出量子博弈论相对论化之后会产生一些值得研究 的有趣现象。 本文的主要创新点是:将已有的量子博弈模型一一量子囚 徒困境拓展到相对论量子情况,并对这种情况下可能产生的 新的策略均衡进行分析,从而探索出相对论效应对量子博弈 可能产生的影响。 对相对论量子博弈的研究,一方面有助于我们更进一步 理解博弈论的物理本质,另一方面也可以对远程博弈和不同 坐标系中的博弈行为起到指导作用。例如,在远程量子博弈 中,博弈者需要通过向仲裁者高速发射粒子进行博弈,这种 高速发射行为将改变粒子的自旋态和纠缠态,从而对博弈结 果产生影响。而这种影响正是相对论量子博弈所研究的范畴。 关键词:博弈论,囚徒困境,量子策略,量子纠缠,洛伦 兹变换,纳什均衡。 中国科学技术史学硕士学位论文 英文摘要第v 页 a b s t r a c t q u a n t u mg a m et h e o r yi so nt h ec a s ei nw h i c ht h ep l a y e r sm a k eu s eo fs o m e c a r r i e r sw h i c hh a v eq u a n t u mp r o p e r t i e s ( s u c ha sp a r t i c l e s ) a n da d o p tq u a n t u m o p e r - a t i o n sa ss t r a t e g i e s r e s e a r c h e ss h o wt h a tq u a n t u ms t r a t e g i e sc o u l dm a k et h ep l a y e r s g a i nb e t t e rp a y o f f sa n de q u i l i b r i at h a nc l a s s i c a ls t r a t e g i e s f o re x a m p l e ,a sf o rc l a s - s i c a l p r i s o n e r sd i l e m m a ,q u a n t u ms t r a t e g i e sw o u l dh e l pt h ep l a y e r se s c a p ef r o m t h ec l a s s i c a ld i l e m m a ,a n dh a v ean e we q u i l i b r i u m ,t h u s ,t h ep l a y e r sc a nh a v eb e t t e r p a y o f f s f r o mt h i sp o i n to fv i e w ,q u a n t u mg a m ew o r t h sf u r t h e rr e s e a r c h a ne l e m e n t a r yp a r t i c l eh a sq u a n t u mp r o p e r t i e s ,a sw e l la sr e l a t i v i s t i co n e s w h e n ap a r t i c l en i o v e sa tv e r yh i g hs p e e d ,a no b s e r v e ri nas t a t i cf r a m ew o u l df i n dt h a ts o m e p r o p e r t i e so ft h ep a r t i c l e ( s u c ha st h ed i r e c t i o no fs p i n ) c h a n g e ;w h e nt w oe n t a n g l e d p a r t i c l e sm o v ea tv e r yh i g hs p e e d ,t h eo b s e r v e rm a yf i n dt h ed e g r e eo fe n t a n g l e m e n to f t h et w op a r t i c l e sc h a n g e s t h e s ec h a n g e so nq u a n t u mp r o p e r t i e sm a yh a v es i g n i f i c a n t i m p a c to i lt h eg a m e ,t h u s ,t h e ym a yc h a n g et h eg a m ea n dg i v eb i r t ht os o m en e w e q u i l i b r i a w ei n v e s t i g a t eq u a n t u ms t r a t e g i e si nm o v i n gf r a m e sb yc o n s i d e r i n gp r i s o n e r s d i l e m m aa n dp r o p o s ef o u rt h r e s h o l d so f ,yf o rt w op l a y e r st od e t e r m i n et h e i rn a s h e q u i l i b r i a w e , f i n dt h a tt h er e l a t i v i s t i co p e r a t i o n sc o u l de n h a n c eo rd i m i n i s ht h e q u a n t u mf e a t u r e so ft h eg a m ef o rd i f f e r e n tp l a y e r sw h om o v ei nd i f f e r e n td i r e c t i o n s r e l a t i v et ot h ea r b i t e r t h es t r u c t u r eo ft h i sa r t i c l ei ss e ta sf o l l o w s : c h a p t e rii n t r o d u c e ss o m ea s p e c t so fc l a s s i c a lg a m et h e o r y ,s u c ha st h eh i s t o r y , i m p o r t a n tt h e o r e m s ,p r o p o s i t i o n s ,n o t a t i o nr u l e s ,a n ds oo n t h i sp a r ti st h ef o u n d a - t i o no ft h i sa r t i c l e ,a sw e l la st h ej u m p i n g o o f fp o i n t c h a p t e ri ii n t r o d u c e st h er e s e a r c h i n gd e v e l o p m e n to fq u a n t u mg a m et h e o r y , a sw e l la ss o m ec o m m o nm e t h o d s ,e s p e c i a l l yf o rt h er e s e a r c ho nq u a n t u mp r i s o n e r s 中国科学技术大学硕士学位论文 第v i 页英文捕要 d i l e m m a ,b e c a u s ei t i st h et h e o r e t i c a lm o d e li nt h i sa r t i c l e c h a p t e ri i ii n t r o d u c e st h ep r o p e r t i e so ft h es p i ns t a t eo fs i n g l ep a r t i c l ea n d q u a n t u me n t a n g l e m e n tu n d e rl o r e n t zt r a n s f o r m a t i o n ,w h i c hi st h et h e o r e t i c a lb a s i s t oe x t e n dq u a n t u mp r i s o n e r sd i l e m m ai n t or e l a t i v i s t i cc a s e c h a p t e ri vp a r t i c u l a r l ya d d r e s s e ss o m eo fm yw o r ko nr e l a t i v i s t i cq u a n t u m g a m et h e o r y , d e m o n s t r a t i n gs o m ei n t e r e s t i n gp h e n o m e n aw h i c hw o r t hf u r t h e rr e - s e a r c h t h em a i no r i g i n a lp o i n to ft h i sa r t i c l ei st oe x t e n dt h ee x i s t i n gm o d e lo fq u a n t u m g a m 争一q u a n t u mp r i s o n e r sd i l e m m at oar e l a t i v i s t i ca n dq u a n t u mc a s e ,a n dt oa n - a l y z et h en e ws t r a t e g ye q u i l i b r i aw h i c hm a ya p p e a ri nt h i ss i t u a t i o n ,t h u s ,t oe x p l o r e t h ei n f l u e n c et h a tt h er e l a t i v i s t i ce f f e c tm a yc a u s eo nq u a n t u mg a m e s t h er e s e a r c ho nr e l a t i v i s t i cq u a n t u mg a m e sc a nn o to n l yh e l pu su n d e r s t a n d t h ep h y s i c a le s s e n c e so fg a m et h e o r y , b u ta l s og u i d er e m o t eg a m e sa n dt h eg a m e s b e t w e e nd i f f e r e n tf r a m e s f o ri n s t a n c e ,i nar e m o t eg a m e ,p l a y e r ss h o u l de m i tt h e i r p a r t i c l e s ( a th i g hs p e e d ) t ot h ea r b i t e r ,a n dt h i sb e h a v i o rm a yc h a n g et h es p i n sa n d e n t a n g l e m e n to ft h ep a r t i c l e s ,w h i c hm a yh a v ei n f l u e n c eo nt h er e s u l to ft h eg a m e t h i si n f l u e n c ei sj u s tw h a tt h er e l a t i v i s t i cq u a n t u mg a m et h e o r ys h o u l dr e s e a r c h k e y w o r d s :g a m et h e o r y , p r i s o n e r sd i l e m m a ,q u a n t u ms t r a t e g i e s ,q u a n t u m e n t a n g l e m e n t ,l o r e n t zt r a n s f o r m a t i o n ,n a s he q u i l i b r i u m 中国科学技术太学硕士学位论文 中国科学技术大学学位论文原创性声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的 成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或 撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作 了明确的说明。 作者签名:签字日期: 加卵r b 中国科学技术大学学位论文授权使用声明 作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学 拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构 送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有 关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。本人提交的电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 | 毯公丌口保密(年) 作者签名: 签字日期:! ? :l 7 3 导师签名: 签字r 期:垒鱼盟:堡 第一章 经典博弈论简介第1 页 第一章经典博弈论简介 1 1 博弈的历史 夫博弈者,下棋也。原指古代先人下棋的游戏,即对弈,后引申为双方或多 方在一定的规则之下谋划采取策略以使己方获益的竞争活动。博弈早己渗透到人 们生活的方方面面,大到战争利领导人竞选,小到儿童玩的“石头、剪刀、布” 的游戏。然我泱泱中华虽行博弈之事已历数千载,终未能将其理论化,不亦惜 乎! 博弈的理论化,可追溯到上世纪二十年代。1 9 2 8 年冯讲意曼证明了博弈论 的基本原理,从而宣告了博弈论的正式诞生。1 9 4 4 年,冯诺意曼和摩根斯坦共 著的划时代巨著博弈论与经济行为将二人博弈推广到n 人博弈结构并将博弈 论系统地应川于经济领域,因此奠定了这一学科的基础和理论体系。谈到博弈论 不廊忽略博弈论天才纳什,他的开创性论文n 人博弈的均衡点( 1 9 5 0 ) ,非 合作博弈( 1 9 5 1 ) 等等影响深远,其中提出了纳什均衡的概念和证明了均衡存 在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。目前博弈 论已发展成一门较完善的学科。 1 2 博弈论的基本内容 1 2 1 博弈的要素 任何博弈都至少包含四个要素:博弈者( p l a y e r ) ,博弈规则( r u l e ) ,策略 集合( s t r a t e g ys e t ) 以及收益( p a y o f f ) 。以下分别介绍这些要素。 。 ( 1 ) 博弈者- ( p l a y e r ) :指参与博弈的决策主体,也就是参与者。只有在博弈 中存在利害关系并且真实参与博弈的人,才能成为博弈者。 ( 2 ) 策略集合( s t r a t e g ys e t ) :在一局博弈中,每个博弈者都能选择一些 可行的行动方案,这种方案不是某阶段的行动方案,而是指导整个博弈过程的 方案,一个博弈者的一个可行的自始至终全局筹划的行动方案,称为这个博弈 者的个策略。对丁一个博弈者来说,所有可选择的策略的集合,称为“策略 中国科学技术大学硕士学位论文 第2 页 第一章经典博弈论简介 集合”。如果在一个博弈中博弈者及其策略集合都是有限的,则称为“有限博 弈”,否则称为“无限博弈”。 ( 3 ) 博弈规则( r u l e ) :对博弈过程的具体规定,包括对博弈者应该获得何 种信息的规定、对博弈者采取策略顺序的规定、对博弈者采取策略之后可能获得 何种收益的规定,等等。 ( 4 ) 收益( p a y o f f ) :在每一局博弈中,博弈者通过选择策略参与博弈,由 此,或胜,或负,或平。无论胜、负、平,都将对每一个博弈者的利益有所影 响,这种影响就称为“收益”。而博弈者正是通过对可能获得的收益的比较,来 判断在一局博弈中应该采取何种策略。 1 2 2 博弈要素的数学表示方法 在计算中,博弈要素可以如下表示: ( 1 ) 博弈者:博弈者的集合可用人写字母j 表示,如有礼位博弈者,则可依 次表示为:i = l ,2 ,n ) 。也可州大写字母表示为博弈者a ,b ,c ,亦可刚具 体人名,如:甲、乙、丙,张三、李四如果要研究扎位博弈者中第i 位博 弈者的策略或收益,那么除第i 位以外的所有一1 ) 位蹲弈者的集合可用“一i ”标 记,为避免误会,需要强调的是这个标记并不表示其余( n 1 ) 位博弈者都要试图 “打败”第i 位博弈者。 ( 2 ) 策略集合:策略集合用人写字母s 表示,如第i 位博弈者的策略集合表示 为& ,a 的策略集合表示为乳,依此类推。如果第i 位博弈者的所有策略为z ,y ,z , 则其策略集合为& = z ,y ,孑) 。具体的策略定义为s 臼,它表示第i 博弈者的第j ;个策 略,那么就有5 n = z ,8 i 2 = y ,s i 3 = z 。“策略组合”是指所有参与者所选的策略 组成的一个向量,如果博弈者有佗位,那么策略组合向量就有礼维。例如,在一个 有三位博弈者的博弈中,某个策略组合为s = s l j ,s 2 k ,s z h ,即:第一位在其策略 集合中选择j 策略,第二位在其策略集合中选择赶策略,第三位在其策略集合中选 择危策略。在数学角度看,“策略组合”即是策略集合s = s 1x 岛氐的一个元 素,即s s 1x s 3 。若有扎位博弈者,则s s 1 玩岛。 ( 3 ) 博弈规则:博弈规则可用具体文字表述。 ( 4 ) 收益:在数学表示中,称收益为“收益函数”,可川字母让表示。如 有孔位博弈者参加博弈,则第i 位博弈者的收益函数取决于他她= 耷= 入以及其他( n 1 ) 位博弈者所采取的策略。用表示第i 位博弈者的收益函数,即可表示为地= s l ,s 2 ,s t ,s n ) 。 如果用大写字母“g ”表示一个博弈,那么一个博弈可表示为g = u i ( s l ,黾,s n ) ,如此,我们就称s :为博弈 者i 的严格优策略。 定义3 ( 严格优策略均衡) :在一个博弈g = 工,s ,t i _ 中,假如对于所有博 弈者i 米说,都有s :( i j r ) 为严格优策略,则每个博弈者的严格优策略的组合5 = ( s :,s ;,s 二) 就称为严格优策略均衡。 定义4 ( 纳什均衡,n a s he q u i l i b r i u m ) :在一个博弈g = f ,s ,札) 中,对于每 一位博弈者i = 1 ,2 ,礼,有策略组合5 = ( 8 1 ,s 矗) ,使得对于所有的s i 鼠, 均有 ( s ;,s 幺) 饥( 岛,5 :t ) , ( 1 4 1 ) 那么此策略组合s 慵虻称为纳什均衡( n a s he q u i l i b r i u m ) 。 1 4 2 命题 命题1 :假如在一个博弈g = ,s ,u ) 中,每个博弈者都存在严格优策略,则 这些严格优策略的组合一定是该博弈的唯一的均衡解。 证明:我们使用反证法。 假设一个博弈为g = 【j r ,s ,u ) ,其中每个博弈者都有严格优策略。根据定她, 可知严格优策略具有唯一性,否则某一位博弈者i 将会有至少两个严格优策略,我 们可以设它们为s :和s 萝。那么根据严格优策略的定义可知: 地( 霹,s i ) 讹( s 步,s 一 ) 讹( s 尹,s 一 ) u t ( s ;,s t ) ( 1 4 2 ) ( 1 4 3 ) 显然自相矛盾。所以严格优策略具有唯一性。由于严格优策略具有唯一性,而每 一位博弈者都被假设为理性的,那么显然每一位博弈者都会选择自己的严格优策 略,因而严格优策略组合一定是该博弈的唯一的均衡解。 由这个命题可知,如果博弈者只存在优策略而非严格优策略,那么该i 尊弈可 能不存在唯一的均衡解。 命题2 :如果一个 尊弈g = ,s ,u ) 存在严格优策略均衡s + = ( s i ,s :) ,则它 一定是纳什均衡,但反之不成立。 证明:使用反证法。 : 假设己知一个策略组合s + = ( s i ,s :) 是博弈g = ,s ,u ) 的严格优策略组 合,但它不是那是均衡,而假设另有一个策略组合s 社= ( s f ,s 茅) 为纳什均衡。 那么,根据严格优策略的定义,必然存在博弈者i = 1 ,2 ,n ,满足: u t ( s :,s 羔) u t ( 5 尹,s 耋) , ( 1 4 4 ) 而根据纳什均衡的定义,必然也有: 啦( s 尹,5 篓) 啦( s :,s 兰) , ( 1 4 5 ) 中国科学技术大学硕士学位论文 第5 页第一章经典博弈论简介 这显然是矛盾的。 至于“反之不成立”的说法,举一个范例即可证明。比如一种博弈叫做“斗 鸡博弈”。在这个博弈中,有两个人分别驾驶两辆车各自相向而行并准备急速对 撞。如果一方怕死而首先让道,那么让道的人就会被称为小鸡,会遭人嘲笑。如 果一方不怕死而不让道,那么他可以获得同行的尊重。事实上“斗鸡博弈”是在 飞车党中盛行的一种游戏。在斗鸡博弈中,如果两人都不让道,那么可能双方都 没命了,收益为一u ;如果主动让道,就会被同行嘲笑,收益为一1 0 ;如果不让道 而又存活下来,会被同行尊重,收益为+ 1 0 。该博弈可用图1 3 表示为: 图1 3 :“斗鸡博弈”博弈的表格表示。 由上表可知,斗鸡博弈存在纳什均衡,但不存在严格优策略均衡,由此证明 。反之不成立”。 本章参考文献 1r b m y e r s o n ,c a m et h e o r y :a na n a l y s i so fc o n f l i c t ,m i tp r e s s ,c a m b r i d g e ,m a ,1 9 9 1 【2 】2 d r e wf u d e n b e r ga n dj e a nt i r o l e ,g a m et h e o r y ,t h em i tp r e s s ,c a m b r i d g e ,m a ,1 9 9 1 【3 】姚国庆, 博弈论,南开人学出版社,i s b n :7 - 3 1 0 - 0 1 9 3 8 - 5 。 中国科学技术大学硕士学位论文 第二幸量子博弈论 第7 页 第二章量子博弈论 2 1 博弈论量子化的物理依据 人们可能不太理解为什么博弈论也可以量子化,因为博弈论似乎涉及的只是 经典世界中的个体之间的关系。事实上,根据现有的研究,一个 尊弈是经典还是 量子取决于博弈者所使用博弈载体。何谓载体? 载体就是博弈者对其采取策略以 完成博弈行为的物体,比如在赌陴中,载体即是骰子、纸牌之类的赌具。载体的 物理性质将决定博弈的性质,包括可采取的策略以及收益。那么,假如博弈的载 体是具有量子性质的基本粒子,那么该博弈就具有量子性质。因为对于具有量子 性质的载体,博弈者必须采取具有量子性质的操作,以此作为策略( 称为“量子 策略”,q u a n t u ms t r a t e g y ) 。 2 2 有关量子博弈论的一些研究 量子博弈论的研究方兴未艾,大约开始- 丁- 1 9 9 9 年前后。 1 9 9 9 年,d a v i da m e y e r 发表了一篇论文q u a n t u ms t r a t e g i e s 4 1 ,该文选择一个 两态粒子( 比如电子) 作为博弈载体,以经典“翻硬币博弈”作为模型,将该博 弈量子化,指出采取量子策略能够增加博弈者的期望收益。“翻硬币博弈”是这 样进行的:两个博弈者( a 和b ) 将一枚硬币置于一个盒子中,硬币有正反两面, 初始时正面朝上,但两人在博弈结束前都不能看到盒中硬币究竟哪一面朝上。两 位博弈者可以对便币采取的策略为翻一面或不翻。两位博弈者轮流对硬币采取策 略,要求两人采取策略的次数相同。最后,打开盒子,如果硬币正面向上,则判 定a 胜b 败;如果反面向上则判定a 败b 胜;胜方收益+ 1 ,败方收益1 。m e y e r 的这 篇论文显示,如果将硬币换成一个两态粒子,而博弈者可以使用幺正操作作为策 略,那么其期望收益将不低丁- 在经典翻硬币博弈中的期望收益。该文证明了三条 定理: 定理1 :在一个双人零和博弈中,一个使用优化量子策略的博弈者的期望收益至 少与他使用一个优化混合策略的期望收益相等。 定理2 :一个双人零和博弈没有( 量子,量子) 均衡。即:该博弈如果有均衡, 那么在该均衡中,至少有一方的策略是非量子的。 7 定理3 :一个双人零和博弈总有一个( 混合量子,混合量子) 均衡。 该文显示了量子策略在陴弈中的优越性,从而促进了量子博弈论的研究。 。 1 9 9 9 年,l i o rg o l d e n b e r g 等人发表论文q u a n t u mg a m b l i n g 5 】。该文同样针对翻 硬币博弈,使州具有正交两念的粒子作为博弈载体,提出一个双方协议进行量子 赌博,该协议允许两个相距很远的博弈者参加赌博游戏,并且该协议仍i r 能够体 现量子策略相对丁经典策略的优越性。 同样在1 9 9 9 年,j e n se i s e r t 等人发表论文q u a n t u mg a m e sa n dq u a n t u ms t r a t e - g i e s 6 1 ,使川自旋1 2 粒子作为载体,将著名的“凶徒凼境”量子化,并且指出, 量子策略能够使i 享弈者摆脱囚徒困境,而且相对丁经典策略而言,量子策略能够 中国科学技术土学硕士学位论文 第8 页 第二章量子博弈论 表2 1 :e i s e r t 论文中设置的囚徒困境博弈的收益表,其中,设r = 3 ( “r e w a r d ) ,p = l ( “p u n i s h m e n t ”) ,t = 5 ( “t e m p t a t i o n ”) ,以及5 = o ( “s u c k e r sp a y o f f ) 。策略g 为抗 塑! 塑皇里位囚徒合作( c o o p e r a t e ) ;策略d 为招供,即坦白过失( d e f e c t ) 。 b o b :cb o b :d a l i c e :c ( 3 , 3 )( 0 , 5 ) a l i c e :d ( 5 , 0 )( 1 ,1 ) 给予博弈者更高的划望收益。该文往学术界引起了较大的反响,针对该文进行讨 论的论文不少。本人的工作也是在该文的基础上进行的。有关这篇论文及其相关 的讨论,将在后面儿节作具体介绍。 2 0 0 1 年,h w a n g 等人受至l j g o l d e n b e r g 论文的启发,发表论文q u a n t u mg a m b l i n g u s i n gt w on o n o r t h o g o n a ls t a t e s 4 1 ,该文使h 具有诒正交态的粒子作为载体进行远 程博弈。作者指出,该博弈方案对于非纠缠攻击和纠缠攻击都是安全的。 以上是罗列一些具有代表性的关于量子博弈的文章,卜面主要介绍e i s e r t 等人 关于量子囚徒困境的二l 作。 2 3 量子囚徒困境 本节详细介绍一下j e n se i s e r t 等人发表丁1 9 9 9 年的论文q u a n t u mg a m e sa n d q u a n t u ms t r a t e g i e s 6 。 在该文中,作者将经典囚徒 尊弈的收益函数做了一些合理的修改,即把所有 收益都设为非零,这是为了方便计算和进行比较,如表2 1 所示。 这个博弈模型的物理层面包括以下三个方面:( 1 ) 有一个两比特的源,每个 比特分配给一个博弈者:( 2 ) 一套物理仪器,使得每位博弈者可以对各自的比 特进行物理操作已实现策略; ( 3 ) 有一台测量仪器( 该博弈的仲裁者所有) 使 得两位博弈者的比特可以被测量,以确定他们各自的收益。这三个方面都是公认 的,即两位博弈者以及仲裁者都明确地知道所有这些物理层面的丁作原理。 该博弈使用自旋1 2 粒子作为载体,一个粒子就是一个量子比特,它是一 个两念系统,于是在希尔伯特空间中选取一对互相正交的基矢i c ) = l ) = 1 、n 、 f :l 和l d ) = i 一;) = l 。l 来描述这个粒子的两态。在博弈初始状态,设 、o 。“ l 置两个粒子的初态均为i c ) ,即:f ,其中,第一项表示a l i c e ( a ) 的粒子的态, 第二项表示b o b ( b ) 的粒子的态。a l i c e 和b o b 通过量子操作可以是各自手中的粒 子的态在i c ) 雨i i d ) 之间变化,因此,在操作后,一个粒子的态可以表示为 咖) = 口i c ) + p i d ) ,l q l 2 + 蚓2 = l 。那么这个博弈的态空间可以表示为一个张量积空 间,该空间由i c o ,i c d ) ,i d c ) 和i d 功四个基欠张成,这些也是测量时所使用的 基矢。 我们将该博弈的初态定为l 讥) = 夕l ,此处夕是一个为两位障弈者所知的 幺正算符,它的作刚是将要分发给两位博弈者的博弈载体( 粒子) 纠缠起来。使 得它们在博弈中体现出量子特征。在一个公平的 尊弈中,了的矩阵表示必须是对 中国科学技术大学硕士学位论文 第二幸量子博弈论 第9 页 称的,即对于两位博弈者来说是可交换的。a l i c e 雨l b o b 的策略以和选白策略空 间它们是对a l i c e 和b o b 各自手上的q u b i t 所做的局域变换,而策略空间膛2 x 2 幺 正群的子集。 在a l i c e 和b o b 进行完各自的操作j 斤,博弈的态( 准确的说,是博弈载体的态, 为简便起见,以下统一称“博弈的态”) 变为( 以o ) 夕i c d ,然后a l i c e 和b o b 将 此态发送给测量仪器,该仪器由两部分组成:第一部分是一个可逆的两比特门了, 第二部分是一对s t e r n - g e r l a c h 仪,该仪有两个通道,由口= c ,d 表示。设定了= 歹t ,这实际上是一个解纠缠操作,将两个q u b i t 的纠缠解开,然后进行测量,这样 就不会在测量一个q u b i t 时影响到另一个q u b i t 的态。因此,最终测量的态是 i 妒,) = 了7 ( qu b ) 了i c c ) ( 2 3 1 ) 由丁量子论是概率性的理论,所以在测量之后,博弈者所获得的收益是期望收 益。a l i c e 和b o b 的期望收益分别为: s a = r p c c + p p d d + t p d c + s p c d s b = r p c c 4 - p p d d + s p d a + t p c d , 其中p 曲= i ( a b l 矽:) 1 2 ( o ,b = c ,d ) 是测量仪器显示口或6 的联合概率。 3 ,p = 1 ,s = 0 。该博弈由图2 1 表示: ic ) la ) ( 2 3 2 ) ( 2 3 3 ) 设定t = 5 ,r = 。,廿 i 纠 i 妒,) l 3 匕叫茸 1 图2 1 :量子囚徒困境过程。 将策略空间选定为两参数的2 2 幺正矩阵集 咖,= ( ! 篇e 一怒, 3 限定0 0 丌,0s 西丌2 。我们将经典的策略“抗拒”和“招供”定义如下: c 三u ( o ,o ) , d 兰u ( 丌,0 ) , ( 2 3 5 ) ( 2 3 6 ) 为了保证经典囚徒困境的性质能够得到真实反映,还需要补充下面的条件: f 夕,d d :0 ,夕,d 纠:0 0 0 , 【了,d d j2 ,【了,d 叫2 , 2 , 0 。b 乩 ( 2 3 7 ) 中国科学技术土学硕士学位论文 、二小叫 0 1 1 o 0 0 ,、 i i = d d 第1 0 页 第二幸量子博弈论 方程组( 2 3 7 ) z j 一个解是 夕= e x p t 啼。圆。,2 ,= ( 三三 一i 三3 1 蓟0 c o s 00 c o s n :) 。s , 一i s i n 孑l、 苦 l 、, ; 此处7 【0 ,7 r 2 1 是一个实参数,它表示一个博弈的纠缠程度。对于一个可分的( 即 不纠缠的) 博弈,7 = 0 ;对于一个最人纠缠的博弈,y = 7 r 2 。应注意此处所说 的纠缠是指a l i c e _ 手i l b o b 的 尊弈载体( q u b i t ) 的纠缠。以下通过a l i c e 的两种收益论 证量子博弈的优越性。 如图2 2 所示为1 = 0 ( 即纯经典) 时a l i c e 的收益。由图中可知,对于b o b 的 任意策略驴b ,当a l i c e 选择策略d 时其收益最大。由于博弈是对称的,该结论对 于b o b 来说也是类似的。因此d o d 就是该博弈的均衡。事实上,可分的( 1 = 0 ) 量子博弈并不表现出任何优u 丁经典博弈的性质。 dd $ a 图2 2 :1 = 0 时a l i c e 的收益图。在该图中,选择一种参数使得策略巩和都依 赖于这个单一的参数w f - 1 ,1 1 :我们设定= f j r 7 r ,o ) ,叫【0 ,1 1 以及u a = u ( 0 ,一伽7 r 2 ) ,伽f l ,0 ) 。对于b o b 亦如此。招供d 对应w = l ,抗拒c 对应w = 0 , 纯量子策略q 对应伽= - 1 。之所以这样设定参数是因为a l i c e $ 1 b o b 每人都有各自 的咖和口,即:咖a ,双,砂b ,铀,这四个参数不可能同时h j 一个三维图形来显示,所 以采取这种参数设定方法,既便丁构图,也能够将具有代表性的策略展示出来。 对于7 = ,r 2 ,情况就人不相同了。此时两个载体处于最人纠缠状态,这 在经典领域是没有对应物的。图2 3 所示为7 = 7 r 2 时a l i c e 的收益。假i 发b o b 选 择d ,a l i c e 的最佳选择是 q 三u ( o ,7 r 2 ) ,q = ,i0 、 loi 夕 中国科学技术大学硕士学位论文 ( 2 3 9 ) ! 2 n 1 o 疏o c 1一 第二章量子博弈论 第1 1 页 假设b o b 选择0 ,a l i c e 幂j 最佳策略为d 。因此,a l i c e 没有最优策略。由丁该 尊弈是 对称的,这个结- 论对b o b 亦成立。那么在这种情况下d d 不再是严格优策略均 衡。 $ a dd 图2 3 :一r = 丌2 时a l i c e 的收益图。在该图中,参数的选择与图2 2 相同。 从图2 3 可知,d0d 不再是纳什均衡,因为博弈者可以通过单方面背离策 略d 从而增加收益。然而,另一个纳什均衡国。国出现了,它能使得a l i c e 和b o b 的 收益为:$ a ( 国,0 ) = $ b ( 0 ,国) = 3 。事实上,对于所有的口【o ,丌】,【0 ,7 r 2 】,均 有s ai o ( e ,) ,国i = c o s 2 ( 8 2 ) ( 3 s i n 2 + c o s 2 ) 3 :类似的,对于所有0 s ,均 有$ b ( 国,以) $ b ( 国,o ) ,冈此每个博弈者不能通过单方面背离 国而获得更多 收益。由此可知,qo 国是唯一的均衡。 更有趣的是,句 国具有p a x e t oo p t i m a l 的性质。所谓p a r e t oo p t i m a l 是指:一 个博弈者不可能通过背离这一对策略以求增加自己的收益而不减少对方的收益, 也就是说,假如两位博弈者所选择的策略组成p a r e t oo p t i m a l ,那么假如其中一方 想增加自己的收益而改变策略,就必须损人利己。从上面的分析可以知道,量子 策略可以使博弈者逃离囚徒困境。 以上讨论的是公平博弈的情况,即两位博弈者可以从相同的策略空间中选取策 略。那么对于不公平博弈有会如何呢? 假设a l i c e 的策略空间仍是s ,而b o b 只能选 择经典策略,即:他能选择的策略为( o b ,o ) ,跆【0 ,州。在这种情况卜,a l i c e 的 最佳策略是 1;1、 m 兰u ( 7 r 1 2 ,丌2 ) = 去i ,1 , ( 2 3 1 0 ) v z 一l _ 1 该策略能使a l i c e 获得至少r = 3 收益,冈为对于所有目 【0 ,丌1 ,均 有$ al m ,u ( o ,0 ) l 3 ,而使得b o b 的收益为$ bl m ,0 ( o ,0 ) i :2 ,如图2 4 ( a ) 所 示。因此,如果在个非公平博弈中a l i c e 能够确定b o b 采耳x o ( o ,0 ) 策略的话,她 总应该采取i :j f 作为她的最优策略。 更有趣的是研究a l i c e 的收益随初态i 讥) 的纠缠度,y 的变化关系。在赢得非公平 中国科学技术大学硕士学位论文 第1 2 页 第二幸量子博弈论 0 ,l 图2 4 :量子与经典策略的对比:( a ) 当b o b 采取策略( 铀,o ) 而a 1 i c e 分别采取0 ( 实 线) 、d ( 点虚线) 以及庇( 短虚线) 时,a l i c e 的收益随如的变化趋势。( b ) 随着 纠缠系数,y 的变化,a l i c e 的期望收益的变化曲线( 假定a l i c e 在非公平博弈中始终 获胜) 。 博弈的前提一f ,a l i c e 的最小期望收益由。f 式给出: m = m a x m i n “( 以,) ( 2 3 1 1 ) c “sc ,b = u ( 口,o ) 考虑m 随纠缠度7 【0 ,7 r 2 】的变化,很明显m ( o ) = 1 r m ( 刀- 2 ) = 3 。图2 4 ( b ) 显 示m 是关于m 的单调增函数,当初态是最大纠缠态时,a l i c e 的期望收益最大。此 外,当纠缠度火于阈值m = a r c s i n ( i v 信) 0 4 6 4 0 f f ,a l i c e :不 以d 为最优策略, 而应该选择国。事实上,关于这方面的讨论,d u 等人做了更详尽的分析,将在后 面几节中介绍。 2 4 针对j e i s e r t 等人文章的评论 2 0 0 1 年,s c b e n j a m i n $ 1 p m h a y d e n 发表一篇评论【2 3 1 ,指出j e i s e r t 等人提出 的量子博弈模型存在一个漏洞,即:博弈者可以使h j 以作为策略却不能使刚以, 因此该博弈模型是有偏颇的。针对这个评论,j e i s e r t 等人进行了回答f 2 4 】一个 博弈的解在不同的策略空间中有不同的性质,在原文中,作者已经考虑了一个保 迹正定映射集合。在这种情况下存在很多均衡点,其中一个特殊的均衡点是使得 双方受益为( 2 2 5 ,2 2 5 ) 。事实上,博弈的解依赖于策略空间的定义,纳什均衡也依 赖于策略空间的定义,但这仅仅是策略空间的定义问题,不影响已定义的策略之 间的优劣比较。 2 0 0 2 年,s j v b , ne n k 和r p i k e 发表评论f 2 1 1 指出e i s e r t 文章的不足之处: ( 1 ) 操作q 只不过是操作c 和d 的叠加,与经典策略并没有本质l 又:别。 ( 2 )
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年湖北省中级养老护理资格真题附答案
- 衡水中学模拟试题及答案
- 甘孜社工考试试题及答案
- 托班服务协议书标准版5篇
- 湖北省咸宁市华师元一赤壁学校2025-2026学年高一上学期9月月考地理试题(原卷版)
- 社工考试全真模拟试题及答案
- 2025年海洋能发电与海水淡化系统在海洋旅游业中的应用前景研究报告
- 2025年卫生职称培训考试题及答案
- 2025年健康管理师慢性病患者健康管理方案评估试卷答案及解析
- 2025年神经外科手术常规操作规范试题答案及解析
- 工程结算审核服务方案技术标
- 公司驾驶业务外包管理办法
- 店中店合作协议
- AKAIEWI5000电吹管快速入门(中文说明书)
- 炉外精炼-RH读本
- 部编版语文小学五年级下册第一单元集体备课(教材解读)
- 《数学文化》课程教学大纲
- 动物类折纸eric马头实拍
- 模具设计与制造授课全张课件
- 心血管内科常见疾病诊疗常规
- 深基坑边坡稳定性计算书
评论
0/150
提交评论