การอภิปรายทฤษฎีเกมจากบาร์ของคนโกหก
ทฤษฎีเกมเป็นสาขาใหม่ของคณิตศาสตร์สมัยใหม่และเป็นสาขาที่สำคัญในงานวิจัยด้านการดำเนินงาน
ทฤษฎีเกมประกอบด้วยองค์ประกอบหลักดังต่อไปนี้:
-
ผู้เล่น: ในการแข่งขันหรือเกม ผู้เข้าร่วมแต่ละคนที่มีอำนาจในการตัดสินใจเรียกว่า ผู้เล่น เกมที่มีผู้เล่นเพียงสองคนเรียกว่า "เกมสองคน" ในขณะที่เกมที่มีผู้เล่นมากกว่าสองคนเรียกว่า "เกมหลายคน"
-
กลยุทธ์: ในเกม ผู้เล่นแต่ละคนมีชุดแผนการดำเนินการที่เป็นไปได้ทั้งหมด กลยุทธ์ไม่ใช่แค่แผนสำหรับช่วงเวลาที่เฉพาะเจาะจง แต่เป็นแผนที่ครอบคลุมซึ่งชี้นำการดำเนินการทั้งหมด หากผู้เล่นมีจำนวนกลยุทธ์ที่จำกัด จะเรียกว่า "เกมจำกัด" มิฉะนั้นจะเรียกว่า "เกมไม่จำกัด"
-
ผลตอบแทน: ผลลัพธ์ในตอนท้ายของเกมเรียกว่าผลตอบแทน ผลตอบแทนของผู้เล่นแต่ละคนขึ้นอยู่กับกลยุทธ์ที่เลือกของตนเองและกลยุทธ์ที่เลือกโดยผู้เล่นคนอื่น ๆ ด้วย ดังนั้น "ผลตอบแทน" ของผู้เล่นแต่ละคนจึงเป็นฟังก์ชันของชุดกลยุทธ์ที่เลือกโดยผู้เล่นทั้งหมด
-
ผลลัพธ์: สำหรับผู้เข้าร่วมเกม จะมีผลลัพธ์ของเกมเกิดขึ้น
ในบาร์ของคนโกหก ผู้เล่นคือผู้เข้าร่วม กลยุทธ์เกี่ยวข้องกับการเลือกเล่นไพ่หรือท้าทายตามการเล่นก่อนหน้าและการกระทำของผู้เล่นคนอื่น และผลตอบแทน/ผลลัพธ์จะกำหนดว่าผู้ใดจะบังคับให้ผู้อื่นหยิบปืนหรือหยิบมันเอง
แนวคิดที่น่าสนใจในทฤษฎีเกม:
- สมดุลของแนช สมดุลของแนชหมายถึงสถานการณ์ที่ผู้เข้าร่วมทั้งหมดเผชิญกับสถานการณ์ที่กลยุทธ์ปัจจุบันของพวกเขาเป็นกลยุทธ์ที่ดีที่สุดเมื่อพิจารณาจากกลยุทธ์ของผู้อื่น ในสมดุลของแนช ไม่มีผู้เข้าร่วมที่มีเหตุผลคนใดจะเปลี่ยนกลยุทธ์ของตนเองโดยลำพัง
"ปัญหาของนักโทษ" ที่มีชื่อเสียงเป็นตัวอย่างของแนวคิดนี้ นักขโมยสองคนถูกสอบสวนแยกกัน หากทั้งคู่สารภาพ ทั้งคู่จะถูกจำคุก 8 ปี; หากคนหนึ่งสารภาพในขณะที่อีกคนปฏิเสธ คนที่สารภาพจะได้รับการปล่อยตัวในขณะที่คนที่ปฏิเสธจะถูกจำคุก 10 ปี; หากทั้งคู่ปฏิเสธ ทั้งคู่จะถูกจำคุก 1 ปี
ในปัญหานี้ "การทรยศซึ่งกันและกัน" เป็นสมดุลของแนช เมื่อ A ทรยศ กลยุทธ์ที่ดีที่สุดของ B คือการทรยศ; เมื่อ B ทรยศ กลยุทธ์ที่ดีที่สุดของ A ก็เช่นกัน แม้ว่าผลลัพธ์นี้จะเลวร้ายที่สุดสำหรับพวกเขาโดยรวม แต่ความมีเหตุผลส่วนบุคคลทำให้พวกเขาไปสู่สมดุลนี้
- เกมผลรวมศูนย์: ในเกมผลรวมศูนย์ ภายใต้การแข่งขันที่เข้มงวด ผลกำไรของผู้เล่นคนหนึ่งจะเท่ากับการสูญเสียของอีกคนหนึ่ง โดยที่ผลรวมทั้งหมดจะเป็น "ศูนย์" ไม่มีความเป็นไปได้ในการร่วมมือเพื่อประโยชน์ร่วมกัน
ชัดเจนว่า เกมในบาร์ของคนโกหกเป็นเกมผลรวมศูนย์ - จะต้องมีผู้ชนะและผู้แพ้ โดยไม่มีความเป็นไปได้ของชัยชนะร่วมกัน
มาวิเคราะห์โหมดโป๊กเกอร์ของบาร์ของคนโกหก:
พื้นที่กลยุทธ์:
- การเล่นอย่างซื่อสัตย์: การเล่นไพ่และประกาศค่าจริง (A, K, Q) ข้อดีรวมถึงการเล่นที่ราบรื่นโดยไม่มีความเสี่ยงต่อชีวิต; ข้อเสียรวมถึงการพลาดโอกาสในการเล่น
- การเล่นอย่างหลอกลวง: การเล่นไพ่ในขณะที่ประกาศค่าที่ไม่จริง กลยุทธ์นี้อาจได้เปรียบ แต่มีความเสี่ยงจากการเล่นรูเล็ตหากถูกจับได้
กลยุทธ์การตอบสนอง:
- กลยุทธ์การท้าทาย: ผู้เล่นสามารถท้าทายการประกาศของผู้อื่น การท้าทายที่ประสบความสำเร็จจะบังคับให้คนโกหกต้องเล่นรูเล็ต; การท้าทายที่ล้มเหลวอาจทำให้ความเชื่อมั่นเสียหาย
- กลยุทธ์ไม่ท้าทาย: การยอมรับการประกาศของผู้อื่นจะรักษาการเล่นที่ราบรื่น แต่ก็อาจทำให้การหลอกลวงประสบความสำเร็จ
การวิเคราะห์ผลตอบแทน: ผลตอบแทนจากการเล่นอย่างซื่อสัตย์:
- กับคู่ต่อสู้ที่ซื่อสัตย์: การเล่นที่ราบรื่นพร้อมการสร้างข้อได้เปรียบอย่างค่อยเป็นค่อยไป
- กับคนโกหกที่ประสบความสำเร็จ: อาจมีข้อเสียในสถานการณ์ปัจจุบัน
ผลตอบแทนจากการเล่นอย่างหลอกลวง:
- หากประสบความสำเร็จ: ข้อได้เปรียบทางยุทธวิธีอย่างรวดเร็ว
- หากถูกจับได้: ความเสี่ยงจากการเล่นรูเล็ต อาจส่งผลให้เกมจบลง
ผลตอบแทนจากการท้าทาย:
- ผลประโยชน์โดยตรง: การท้าทายที่ประสบความสำเร็จอาจกำจัดคู่แข่งหรือทำให้การยิงที่ปลอดภัยของพวกเขาลดลง
- ผลประโยชน์ด้านชื่อเสียง: สร้างภาพลักษณ์ในฐานะผู้เล่นที่มีทักษะ
- ผลประโยชน์ในการควบคุมเกม: ความสามารถในการมีอิทธิพลต่อจังหวะและทิศทางของเกม
ความเสี่ยงจากการท้าทาย:
- ความเสี่ยงโดยตรง: รูเล็ตหากการท้าทายล้มเหลว
- ความเสียหายต่อความเชื่อมั่น: การท้าทายที่ล้มเหลวทำให้ความน่าเชื่อถือเสียหาย
- การเปิดเผยกลยุทธ์: อาจเปิดเผยแนวโน้มทางกลยุทธ์
การวิเคราะห์สมดุลของแนช:
- สมดุลกลยุทธ์บริสุทธิ์
- กลยุทธ์ทั้งหมดซื่อสัตย์: สามารถสร้างสมดุลได้เนื่องจากการเบี่ยงเบนมีความเสี่ยงจากการเล่นรูเล็ต
- กลยุทธ์ทั้งหมดหลอกลวง (ทฤษฎี): เป็นไปได้แต่ไม่เสถียรในทางปฏิบัติ
-
สมดุลกลยุทธ์ผสม สมมติว่าผู้เล่นสองคนมีความน่าจะเป็น p และ q สำหรับการเล่นอย่างซื่อสัตย์: E1 = pq × Rhh + p(1-q) × Rhl + (1-p)q × Rlh + (1-p)(1-q) × Rll โดยที่ R แทนค่าผลตอบแทนที่แตกต่างกัน
-
การพิจารณาเบย์เซียน ผู้เล่นอัปเดตความเชื่อเกี่ยวกับความซื่อสัตย์ของคู่ต่อสู้โดยใช้การอนุมานแบบเบย์เซียนตาม:
- ความน่าจะเป็นก่อนหน้าของการหลอกลวง
- ความรู้เกี่ยวกับการแจกไพ่
- สัญญาณพฤติกรรม
- รูปแบบการประกาศ
ตัวอย่างเช่น หากมีการเล่นเอซจำนวนมาก การประกาศเอซใหม่อาจเพิ่มความน่าจะเป็นในการหลอกลวงที่ประเมินไว้ ซึ่งจะมีผลต่อการตัดสินใจท้าทายผ่านการคำนวณผลตอบแทนที่คาดหวังแบบเบย์เซียน