วันศุกร์ที่ 12 ธันวาคม พ.ศ. 2557

ทฤษฎีเกม

ในทางคณิตศาสตร์ ทฤษฎีเกม (อังกฤษ: game theory) เป็นการจำลองสถานการณ์ทางกลยุทธ์ หรือเกมคณิตศาสตร์ ซึ่งความสำเร็จในการตัดสินใจของแต่ละบุคคลขึ้นอยู่กับทางเลือกของบุคคลอื่น แต่ละฝ่ายต่างก็พยายามแสวงหาผลตอบแทนให้ได้มากที่สุด
   " ถ้าเราพูดถึงกลยุทธ์ก็นึกถึง Red Alert หรือ Starcraft รูปแบบการเล่นจะแบบ บังคับยูนิค สร้างฐานและการจัดการวางแผน เพื่อนำไปสู่ชัยชนะ "

ผู้เริ่มศึกษาทฤษฎีเกมในระยะแรกคือ จอห์น ฟอน นอยมันน์ และออสการ์ มอร์เกินสเติร์น โดยได้ตีพิมพ์ตำรา Theory of Games and Economic Behavior ใน พ.ศ. 2487 ต่อมา จอห์น แนชได้พัฒนาการศึกษาในด้านนี้และได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จากการนำทฤษฎีเกมไปประยุกต์ใช้ในด้านเศรษฐศาสตร์ นอกจากแนชแล้ว มีนักทฤษฎีเกมคนอื่นอีกเจ็ดคนที่ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์



รูปแบบของเกม

     เกมที่ทฤษฎีเกมศึกษาประกอบด้วยผู้เล่นจำนวนหนึ่ง และทางเลือก (หรือกลยุทธ์) สำหรับผู้เล่นแต่ละคนที่จะสามารถเลือกได้ และรายละเอียดผลตอบแทนเมื่อนำกลยุทธ์ของผู้เล่นทั้งหมดมาคิดรวมกัน เกมความร่วมมือส่วนใหญ่อยู่ในรูปของแบบลักษณะเฉพาะ (characteristic function form) ขณะที่เกมรูปแบบครอบคลุมและรูปแบบปกติใช้นิยามเกมไม่ร่วมมือ

เกมรูปแบบครอบคลุม

แผนภาพต้นไม้แสดงทางเลือกในการตัดสินใจ  

 
 จากข้างต้น เป็นเกมที่ผู้เล่นแต่ละคนตัดสินใจเลือกทางเลือกต่าง ๆ ตามลำดับ โดยผู้เล่นจะทราบถึงการตัดสินใจของผู้เล่นอีกฝ่ายในตาก่อนหน้า สามารถเขียนเกมประเภทนี้ได้ในรูปแผนภาพต้นไม้ โดยตั้งต้นที่จุดเริ่มแรก และจบที่จุดสิ้นสุดของเกม ซึ่งสามารถมีได้หลายจุด มีการใช้จุดยอดแทนสถานะที่มีทางเลือกในการตัดสินใจของผู้เล่น และใช้เส้นแทนทางเลือกของผู้เล่นในตาถัดไป

วิธีเล่น
 มีผู้เล่นสองคน ผู้เล่น 1 ตัดสินใจเลือกก่อนระหว่าง ทางเลือก F และทางเลือก U จากนั้นผู้เล่น 2 ซึ่งทราบถึงการตัดสินใจของผู้เล่น 1 ตัดสินใจเลือกระหว่าง ทางเลือก A และทางเลือก R โดยมีผลตอบแทนที่ได้แสดงไว้ด้านล่าง เช่น ถ้าผู้เล่น 1 เลือก U และผู้เล่น 2 เลือก A ผลตอบแทนที่ได้คือ ผู้เล่น 1 ได้ 8 และผู้เล่น 2 ได้ 2 การเล่นแบบนี้ก็นำไปสู่รูปแบบเกมมากมาย

เกมหลายชนิด เช่น หมากรุก ทิก-แทก-โท ก็ถือว่าเป็นเกมรูปแบบครอบคลุม จึงสามารถหาวิธีที่ดีที่สุดในการเล่นเกมเหล่านี้ได้ โดยการใช้แผนภาพต้นไม้


เกมรูปแบบปกติ

ภาพของเกมรูปแบบปกติ

 

เกมรูปแบบปกติ เป็นเกมที่ผู้เล่นไม่ทราบถึงการตัดสินใจของผู้เล่นคนอื่น นิยมเขียนแสดงเกมในรูปแบบตาราง ซึ่งมักจะใช้ในกรณีที่มีผู้เล่น 2 คน โดยผู้เล่นคนหนึ่งจะแทนการตัดสินใจด้วยแถวต่าง ๆ และผู้เล่นอีกคนหนึ่งแทนการตัดสินใจด้วยคอลัมน์ต่าง ๆ

วิธีเล่น
ผู้เล่น 1 มีทางเลือก 2 ทาง คือ บน และ ล่าง ส่วนผู้เล่น 2 มีทางเลือก 2 ทาง คือ ซ้าย และ ขวา จุดตัดของแถวและคอลัมน์จะแสดงถึงผลตอบแทนที่ผู้เล่นทั้งสองได้รับ เช่น ถ้าผู้เล่น 1 เลือก บน และผู้เล่น 2 เลือก ซ้าย ผลตอบแทนที่ได้คือ ผู้เล่น 1 ได้ 4 และผู้เล่น 2 ได้ 3

ชนิดของเกม

เกมร่วมมือ และเกมไม่ร่วมมือ

เกมร่วมมือเป็นเกมที่ผู้เล่นแต่ละฝ่ายสามารถตกลงกันได้เพื่อให้ได้รับผล ตอบแทนรวมที่ดีที่สุด โดยจะถือว่าผู้เล่นที่ร่วมมือกันจะเป็นผู้เล่นฝ่ายเดียวกันและจะปฏิบัติตาม ข้อตกลงที่ได้ตกลงกันไว้ ซึ่งแตกต่างจากเกมไม่ร่วมมือที่ผู้เล่นแต่ละฝ่ายไม่สามารถตกลงผลตอบแทนกัน ได้เลย จะต้องตัดสินใจโดยใช้ผลตอบแทนของตนเป็นหลักเท่านั้น

เกมสมมาตร และเกมไม่สมมาตร

เกมสมมาตรเป็นเกมที่ผลตอบแทนที่ได้รับขึ้นกับการตัดสินใจของตนเองและคน อื่นเท่านั้น โดยไม่ขึ้นกับว่าใครจะเป็นผู้เล่นเกมนี้ จึงมีกลยุทธในการเล่นที่เหมือนกันสำหรับผู้เล่นทุกคน เกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทางที่มีชื่อเสียงจำนวนมากจัดอยุ่ในประเภทนี้ เช่น เกมความลำบากใจของนักโทษ เกมไก่ตื่น และเกมความร่วมใจ
เกมไม่สมมาตรจะมีกลยุทธในการเล่นที่แตกต่างกันออกไปสำหรับผู้เล่นแต่ละคน เช่นเกมในภาพถือว่าเป็นเกมไม่สมมาตร ถึงแม้กลยุทธในการเล่นที่ดีที่สุดจะเป็นกลยุทธเดียวกันก็ตาม

เกมผลรวมศูนย์ และเกมผลรวมไม่เป็นศูนย์

 เกมผลรวมศูนย์เป็นกรณีเฉพาะของเกมผลรวมคงที่ ซึ่งเป็นเกมในลักษณะที่ผลรวมของผลตอบแทนที่ได้ของผู้เล่นจะเป็นค่าคงที่ เช่น การแบ่งปันผลกำไร หรือเกมที่มีผู้ชนะและผู้แพ้ เช่น หมากรุก หมากล้อม ก็ถือว่าเป็นเกมผลรวมศูนย์เช่นกัน ในการเขียนเกมในรูปแบบตารางที่มีผู้เล่นสองคนจึงสามารถละไว้โดยเขียนเพียงผล ตอบแทนของผู้เล่นเพียงคนเดียวได้ และกลยุทธในการตัดสินใจให้ได้ผลตอบแทนมากที่สุดจะเป็นวิธีเดียวกับที่ทำให้ ฝ่ายตรงข้ามได้ผลตอบแทนน้อยที่สุด


           เกมส่วนมากที่นักทฤษฎีเกมศึกษามักจะเป็นเกมผลรวมไม่เป็นศูนย์ เนื่องจากในความเป็นจริง ผลลัพธ์ที่ได้ไม่จำเป็นต้องคงที่เสมอไป ขึ้นอยู่กับแนวทางการตัดสินใจของแต่ละฝ่าย ดังนั้น การได้รับผลตอบแทนมากที่สุดจึงไม่จำเป็นต้องทำให้ฝ่ายตรงข้ามได้ผลตอบแทน น้อยที่สุด

 จากข้างต้นที่กล่าวมานั้นเป็นแค่ทฤษฎีเกมเบื้องต้นที่เป็นต้นแบบให้มีเกม หรือนำไปประยุกใช้ในชีวิตประจำวันได้


ตัวอย่างเกมที่มีชื่อเสียง

 Prisoner's dilemma, Chicken ,Stag hunt


เกมความลำบากใจของนักโทษ (Prisoner's dilemma) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง แนวคิดของเกมนี้ได้สร้างขึ้นโดย เมอร์ริล ฟลูด และ เมลวิน เดรชเชอร์ ใน พ.ศ. 2493 โดยมีลักษณะเป็นเกมที่ผู้เล่นทั้งสองฝ่ายพยายามเลือกทางเลือกที่ได้ผลตอบแทน มากที่สุด แต่กลับทำให้ผลตอบแทนรวมที่ได้ต่ำลง มีสถานการณ์ดังนี้

คนร้ายสองคนคือ A และ B ถูกตำรวจจับและถูกแยกไปสอบปากคำทีละคน ตำรวจไม่สามารถดำเนินคดีกับคนร้ายทั้งสองได้ทันทีเพราะไม่มีพยาน คนร้ายแต่ละคนมีทางเลือกสองทางคือ รับสารภาพ และไม่รับสารภาพ ถ้าคนร้ายคนหนึ่งรับสารภาพแต่อีกคนไม่รับ ตำรวจจะกันคนที่รับสารภาพไว้เป็นพยานและปล่อยตัวไป และจะส่งฟ้องคนที่ไม่รับสารภาพซึ่งมีโทษจำคุก 20 ปี ถ้าทั้งสองคนรับสารภาพ จะได้รับการลดโทษเหลือจำคุกคนละ 8 ปี แต่ถ้าทั้งสองคนไม่รับสารภาพ ตำรวจจะสามารถส่งฟ้องได้เพียงข้อหาเล็กน้อยเท่านั้นซึ่งมีโทษจำคุก 1 ปี
 
 
 
เกมไก่ตื่น (Chicken) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง มีสถานการณ์ดังนี้
ผู้เล่นสองคนขับรถด้วยความเร็วสูงเข้าหากัน ฝ่ายที่หักหลบรถก่อนจะเป็นผู้แพ้ แต่ถ้าผู้เล่นทั้งสองฝ่ายไม่หักหลบรถ รถจะชนกันและจะทำให้ผู้เล่นทั้งสองฝ่ายเกิดความเสียหายอย่างมาก

เกมแห่งความร่วมมือ เกมแห่งความร่วมมือ (Stag hunt) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง ซึ่งเป็นทางเลือกระหว่างทางที่ปลอดภัยกับการให้ความร่วมมือกับอีกฝ่าย มีสถานการณ์ดังนี้

Stag hunt

ผู้เล่นสองคนต้องการเลือกล่าสัตว์ชนิดหนึ่งระหว่างกวางกับกระต่าย ซึ่งกวางมีราคาดีกว่ากระต่ายมาก แต่ก็ล่าบากกว่าเช่นกัน จำเป็นต้องใช้สองคนร่วมมือกันจึงจะล่าได้ ในขณะที่กระต่ายมีราคาต่ำแต่ล่าได้ง่าย สามารถล่าได้โดยใช้เพียงคนเดียว