《說謊者酒吧》的博弈論討論
博弈論是現代數學的一個新分支,也是運籌學中的一個重要學科。
博弈論主要包括以下幾個要素:
-
玩家:在競爭或遊戲中,每個擁有決策權的參與者稱為玩家。只有兩名玩家的遊戲稱為「雙人遊戲」,而超過兩名玩家的遊戲則稱為「多人遊戲」。
-
策略:在遊戲中,每位玩家都有一整套可行的行動計劃。策略不僅僅是針對特定階段的計劃,而是指導整個行動的綜合計劃。如果玩家的策略數量是有限的,則稱為「有限遊戲」;否則,則稱為「無限遊戲」。
-
報酬:遊戲結束時的結果稱為報酬。每位玩家的報酬不僅取決於他們自己選擇的策略,還取決於所有其他玩家所選擇的策略。因此,每位玩家的「報酬」是所有玩家所選策略集合的函數。
-
結果:對於遊戲參與者來說,存在一個遊戲結果。
在《說謊者酒吧》中,玩家是參與者,策略涉及根據之前的出牌和其他玩家的行動選擇打牌或挑戰,而報酬/結果則決定一個人是強迫其他人拿槍還是自己拿槍。
博弈論中的一些有趣概念:
- 奈許均衡 奈許均衡指的是所有參與者面對一種情況,在這種情況下,他們當前的策略在考慮到其他人的策略後是最優的。在奈許均衡下,沒有理性的參與者會單方面改變自己的策略。
著名的「囚徒困境」就是這一概念的例子。兩名小偷被分開審問。如果兩人都認罪,每人獲刑8年;如果一人認罪而另一人否認,認罪者將被釋放,而否認者則獲刑10年;如果兩人都否認,每人獲刑1年。
在這個困境中,「互相背叛」是一種奈許均衡。當A背叛時,B的最佳策略是背叛;當B背叛時,A的最佳策略也是背叛。儘管這一結果對他們來說是最糟的,但個體的理性驅使他們達成這一均衡。
- 零和遊戲: 在零和遊戲中,在嚴格競爭的情況下,一名玩家的獲利恰好等於另一名玩家的損失,總和始終為「零」。沒有合作以獲得互利的可能性。
顯然,《說謊者酒吧》中的遊戲是零和遊戲——必須有贏家和輸家,沒有互相獲勝的可能性。
讓我們分析《說謊者酒吧》的撲克模式:
策略空間:
- 誠實遊戲:打牌並宣告真實的牌值(A、K、Q)。優勢包括遊戲流暢且無生命風險;劣勢包括可能錯過出牌機會。
- 欺騙遊戲:打牌並宣告虛假的牌值。這一策略可能獲得優勢,但如果被抓到則有冒險的風險。
應對策略:
- 挑戰策略:玩家可以挑戰其他人的宣告。成功的挑戰會迫使說謊者進入俄羅斯輪盤;失敗的挑戰可能損害信任。
- 不挑戰策略:接受他人的宣告可以保持遊戲流暢,但可能會讓欺騙成功。
報酬分析: 誠實遊戲的報酬:
- 面對誠實的對手:穩定的遊戲過程,逐步建立優勢
- 面對成功的說謊者:當前情況下可能處於劣勢
欺騙遊戲的報酬:
- 如果成功:快速的戰術優勢
- 如果被抓:面臨俄羅斯輪盤的風險,可能導致遊戲結束的後果
挑戰的報酬:
- 直接利益:成功的挑戰可能消除競爭對手或耗盡他們的安全出手
- 名譽利益:建立作為技術高超玩家的形象
- 遊戲控制利益:能夠影響遊戲的節奏和方向
挑戰的風險:
- 直接風險:如果挑戰失敗則面臨俄羅斯輪盤
- 信任損害:失敗的挑戰會損害可信度
- 策略暴露:可能揭示戰略傾向
奈許均衡分析:
- 純策略奈許均衡
- 全誠實策略:可以形成均衡,因為偏離的風險是俄羅斯輪盤
- 全欺騙策略(理論上):可能存在但在實踐中不穩定
-
混合策略奈許均衡 假設兩名玩家的誠實遊戲概率為p和q: E1 = pq × Rhh + p(1-q) × Rhl + (1-p)q × Rlh + (1-p)(1-q) × Rll 其中R代表各種報酬組合。
-
貝葉斯考量 玩家根據以下因素使用貝葉斯推理更新對對手誠實性的信念:
- 欺騙的先驗概率
- 牌的分佈知識
- 行為線索
- 宣告模式
例如,如果已經打出了許多A,新的A宣告可能會增加估計的欺騙概率,通過貝葉斯期望報酬計算影響挑戰決策。