《骗子酒吧》的博弈论讨论
博弈论既是现代数学的一个新分支,也是运筹学中的一个重要学科。
博弈论主要包括以下几个要素:
-
玩家:在竞争或游戏中,每个拥有决策权的参与者称为玩家。只有两个玩家的游戏称为“二人游戏”,而超过两个玩家的游戏称为“多人游戏”。
-
策略:在游戏中,每个玩家都有一整套可行的行动计划。策略不仅仅是针对特定阶段的计划,而是指导整个行动的综合计划。如果玩家的策略数量是有限的,则称为“有限游戏”;否则称为“无限游戏”。
-
收益:游戏结束时的结果称为收益。每个玩家的收益不仅取决于他们自己选择的策略,还取决于所有其他玩家选择的策略。因此,每个玩家的“收益”是所有玩家选择的策略集合的函数。
-
结果:对于游戏参与者来说,存在一个游戏结果。
在《骗子酒吧》中,玩家是参与者,策略涉及根据之前的出牌和其他玩家的行为选择打牌或挑战,而收益/结果决定了一个人是强迫其他人拿枪还是自己拿枪。
博弈论中的一些有趣概念:
- 纳什均衡 纳什均衡指的是所有参与者面临一种情境,在这种情境下,他们当前的策略在考虑其他策略时是最优的。在纳什均衡下,没有理性的参与者会单方面改变他们的策略。
著名的“囚徒困境”就是这一概念的典型例子。两个小偷被分别审问。如果两人都认罪,各自将被判8年;如果一人认罪而另一人否认,认罪者将被释放,而否认者将被判10年;如果两人都否认,各自将被判1年。
在这个困境中,“互相背叛”是一个纳什均衡。当A背叛时,B的最佳策略是背叛;当B背叛时,A的最佳策略也是背叛。尽管这个结果对他们来说是最糟糕的,但个体的理性驱使他们走向这个均衡。
- 零和游戏: 在零和游戏中,在严格竞争的情况下,一个玩家的收益恰好等于另一个玩家的损失,总和始终为“零”。没有合作以实现互利的可能性。
显然,《骗子酒吧》中的游戏是零和游戏——必须有赢家和输家,没有互相胜利的可能。
让我们分析《骗子酒吧》的扑克模式:
策略空间:
- 诚实游戏:打牌并声明真实的牌值(A、K、Q)。优点包括游戏流畅且没有生命风险;缺点包括可能错过出牌机会。
- 欺骗游戏:打牌时声明虚假的牌值。这一策略可能获得优势,但如果被抓住则面临俄罗斯轮盘的风险。
应对策略:
- 挑战策略:玩家可以挑战其他人的声明。成功的挑战会将说谎者逼入俄罗斯轮盘;失败的挑战可能损害信任。
- 不挑战策略:接受他人的声明可以保持游戏流畅,但可能允许欺骗成功。
收益分析: 诚实游戏收益:
- 面对诚实对手:稳定的游戏过程,逐渐积累优势
- 面对成功的说谎者:当前局势可能处于劣势
欺骗游戏收益:
- 如果成功:快速的战术优势
- 如果被抓:面临俄罗斯轮盘的风险,可能导致游戏结束的后果
挑战收益:
- 直接收益:成功的挑战可能消除竞争对手或耗尽他们的安全出手
- 声誉收益:建立作为熟练玩家的形象
- 游戏控制收益:能够影响游戏的节奏和方向
挑战风险:
- 直接风险:如果挑战失败则面临俄罗斯轮盘
- 信任损害:失败的挑战会损害信誉
- 策略暴露:可能暴露战略倾向
纳什均衡分析:
- 纯策略纳什均衡
- 全诚实策略:可以形成均衡,因为偏离的风险是俄罗斯轮盘
- 全欺骗策略(理论上):可能存在但在实践中不稳定
-
混合策略纳什均衡 假设两个玩家的诚实游戏概率分别为p和q: E1 = pq × Rhh + p(1-q) × Rhl + (1-p)q × Rlh + (1-p)(1-q) × Rll 其中R代表各种收益组合。
-
贝叶斯考虑 玩家使用贝叶斯推理更新对对手诚实性的信念,基于:
- 欺骗的先验概率
- 牌的分布知识
- 行为线索
- 声明模式
例如,如果已经打出了许多A,那么新的A声明可能会增加估计的欺骗概率,从而通过贝叶斯期望收益计算影响挑战决策。