版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年娃娃石头剪子布测试题及答案
一、单项选择题(每题2分,共20分)1.在“娃娃石头剪子布”博弈中,若双方同时随机出招且概率均等,则娃娃对石头的期望收益为A.-1 B.0 C.1 D.22.当引入“情绪记忆”机制后,娃娃胜率提高的核心原因是A.增大了纯策略空间 B.降低了对手预测精度 C.提高了支付矩阵维度 D.减少了纳什均衡数量3.若支付矩阵满足零和性质,则下列说法正确的是A.存在唯一纯策略纳什均衡 B.双方最优策略必为混合策略 C.总收益恒为零 D.娃娃策略与石头策略完全对称4.在重复进行100局的实验中,若对手采用“胜留败转”启发式,娃娃最佳应对是A.固定出娃娃 B.周期性循环 C.高频反击石头 D.随机扰动+贝叶斯更新5.当“娃娃”被设定为可进化策略时,其复制动态方程中不出现哪一变量A.群体比例 B.支付差异 C.突变率 D.贴现因子6.若将“石头”赋予防御属性(对娃娃伤害减半),则新的支付矩阵属于A.对称零和 B.非对称非零和 C.对称非零和 D.非对称零和7.在实验经济学中,测量被试“策略熵”最常用的指标是A.香农熵 B.基尼系数 C.赫芬达尔指数 D.分形维数8.当娃娃与石头双方同时采用Q-learning时,收敛到纳什均衡的条件是A.学习率恒为1 B.探索率线性递减 C.贴现因子小于0.5 D.状态空间无限9.若规则改为“五局三胜制”,则先胜一局者的最优后续策略倾向A.更保守 B.更激进 C.不变 D.随机化10.在“娃娃石头剪子布”的量子版本里,纠缠态的作用是A.消除混合策略 B.实现先动优势 C.提高社会总收益 D.降低策略相关性二、填空题(每空2分,共20分)11.在经典零和支付下,娃娃胜石头时收益为+1,败时为______。12.若对手策略分布为(石头0.5,剪子0.3,娃娃0.2),则娃娃的期望收益是______。13.复制动态方程中,策略增长率与______成正比。14.当引入“情绪温度”参数T→∞时,策略选择趋近于______分布。15.实验数据显示,人类出招具有______阶滞后相关性,可被机器学习捕捉。16.若采用“后悔匹配”算法,更新依据是______与虚拟收益之差。17.在演化稳定策略(ESS)定义中,要求变异策略侵入后的极限比例趋于______。18.量子博弈中,J算子控制______角度,从而调节策略纠缠度。19.若支付矩阵对称且对角线为0,则博弈称为______博弈。20.当贴现因子δ=0.9时,无限重复博弈的平均折现收益公式为______。三、判断题(每题2分,共20分)21.娃娃石头剪子布不存在纯策略纳什均衡。22.在混合策略均衡下,各纯策略的期望收益必相等。23.若一方能观测对方微表情,则博弈转化为完全信息动态博弈。24.演化稳定策略一定是纳什均衡,反之亦然。25.增加“平局重赛”规则会提高社会总福利。26.Q-learning在零和博弈中必然收敛到Stackelberg解。27.当突变率μ>0时,复制动态系统不会出现极限环。28.在实验中被试出招序列通过Lempel-Ziv检验即可视为完全随机。29.量子策略的经典对应极限即为原混合策略。30.若支付矩阵斜对称,则博弈值必为零。四、简答题(每题5分,共20分)31.简述“情绪记忆”机制如何打破传统混合策略均衡。32.说明复制动态方程中“极限环”出现的经济含义。33.概括实验经济学中测量人类“随机性错觉”的两种方法。34.解释量子纠缠为何能在零和博弈中实现正和结果。五、讨论题(每题5分,共20分)35.结合行为经济学,讨论“胜留败转”启发式在真实金融市场中的异同。36.若将娃娃石头剪子布用于分配稀缺公共资源,如何设计机制避免策略操纵?37.当AI对手使用深度强化学习时,人类应如何重塑自身策略空间以保持竞争力?38.探讨在元宇宙场景中引入NFT奖励后,博弈均衡与社会福利的变动方向。答案与解析一、单项选择题1.B 2.B 3.C 4.D 5.D 6.B 7.A 8.B 9.A 10.C二、填空题11.-1 12.0.1 13.支付差异 14.均匀 15.一 16.实际收益 17.0 18.相位 19.对称零和 20.(1-δ)Σδ^(t-1)π_t三、判断题21.√ 22.√ 23.√ 24.× 25.√ 26.× 27.× 28.× 29.√ 30.√四、简答题31.情绪记忆记录对手历史胜负后的情绪标签,使娃娃能预测对方下一招概率偏移,从而偏离1/1/1混合比例,打破均衡。32.极限环意味着群体策略比例周期性震荡,表明系统无稳定ESS,解释现实市场中策略风格的轮动现象。33.方法一:Lempel-Ziv复杂度检验序列可压缩性;方法二:贝叶斯变化点检测寻找主观切换节点,两者均揭示人类误以为自己随机实则可预测。34.纠缠使双方策略不再独立,支付函数出现交叉项,可在保持零和名义下通过协调减少双方同时高损失概率,实现期望收益之和大于零。五、讨论题35.金融市场中的“处置效应”与“胜留败转”类似:盈利头寸过早平仓,亏损头寸过久持有。差异在于资产价格具有趋势延续,而石头剪子布无自相关性,需引入动量修正。36.可设计“策略封存”机制:参与者提前提交不可更改的混合策略哈希,事后公开验证;配合Vickrey-Clarke-Groves支付,使真实报告成为占优策略,从而抑制操纵。37.人类应缩小策略空间维度,采用高阶元策略:先以随机探针获取AI价值网络,再插入“反价值”状态,利用AI
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 1040.4-2026塑料拉伸性能的测定第4部分:各向同性和正交各向异性纤维增强复合材料的试验条件
- GB/T 47620-2026集中空调冷(热)源机组系统能效试验方法
- 2026年幼儿园秋季户外活动计划小班
- BLE配对码爆破检测报告
- 2026年幼儿园安全乘坐电梯活动方案
- 2026年策略产品经理实践指南
- 重庆化工职业学院《计算机综合实践-数字媒体技术和专业融合》2026-2027学年第一学期期末试卷含解析
- 汽车微孔锂电铜箔全球前9强生产商排名及市场份额(by QYResearch)
- 某化工厂反应釜操作安全制度
- 食品厂安全执行办法
- 互联网保险业务营销宣传管理细则考试题及答案
- 一年级下册数学乐考材料-遨游太空探索奥秘【课件】
- 2025年护肤品行业白皮书
- JG/T 286-2010低温辐射电热膜
- 学校老师闭环管理制度
- 军校心理测试题目及答案
- T/TMAC 048-2022城市轨道交通车站环境检测方法
- 《地中海贫血》课件
- 银行金融知识小课堂课件
- 中国超级工程丛书课件
- GB/T 1040.1-2025塑料拉伸性能的测定第1部分:总则
评论
0/150
提交评论