如何看懂局、預測對手的下一步？學會「奈許均衡」做出合理的選擇｜幕僚的賽局力(三)

在上一篇文章中，我介紹了什麼是賽局，以及囚犯困境這個經典的賽局案例。

我想你也明白了身處於這樣的賽局結構時，該如何破解困境？可以如何透過制度的設計來扭轉整個局面，往我們期望的方向發展？

事實上，賽局結構有許多不同的樣貌，像是協調賽局、膽小鬼賽局、棋盤賽局等等，而囚犯困境只是其中一種相對好理解的賽局類型。但不論是哪一種賽局結構，在掌握結構的全貌之後，我們必須先找出賽局中的參與者會做出什麼樣的選擇、為什麼會做出這樣的選擇？我們才有機會進一步找到改變賽局的手段。

掌握賽局只是基本，改變賽局往我們期望的結果才是最終的目的。

孫子兵法中有句「知彼知己者，百戰不殆」正是這個概念。不過，你可能很納悶：我怎麼會知道其他人的選擇呢？即使我問了，對方也不見得會告訴我；如果用猜的，萬一錯了怎麼辦？

的確，學會賽局並不表示你擁有一顆水晶球，知道未來可能發生的一切。

但也不是完全不可預測，至少我們可以利用模型推估找出可能的選項組合、做出最合適的選擇。要做到這一點，就必須先了解「奈許均衡」這個在賽局理論中非常重要的觀點。透過奈許均衡，我們可以找出讓賽局維持平衡的選項組合，也就是賽局中的所有參與者，最有機會做出的選項組合是什麼？

描繪賽局過程，便能預測對方的利己行動

奈許均衡：雙方都做出最利已的舉動，使賽局達成一種均衡狀態

奈許均衡，是諾貝爾經濟學獎得主、美國數學家奈許（John F. Nash）所提出的。

他認為只要賽局的結構可以被描繪出來，就能找出符合奈許均衡的選項組合，這是雙方都認為做出對自己最有利的舉動，而使得賽局維持一種均衡的狀態。我們只要確認了奈許均衡所在的位置，就能知道雙方最有機會做出的選項是什麼。

舉例來說，在囚犯困境中，兩個囚犯之所以都會做出認罪的選擇，是因為這是符合奈許均衡下的最佳選項，也就是「雙方都做出對自己而言最有利的舉動」的選項組合。

那麼，該如何找出奈許均衡所在的位置呢？就以囚犯困境為例來說明吧！

第一步，根據囚犯困境的條件，我們可以畫出賽局的結構如下

第二步，從囚犯A或囚犯B任何一人開始進行合理選項的推論。

首先，站在囚犯A的立場來思考，會有兩種假設的可能性：

假設囚犯B選擇不認罪，那麼囚犯A選擇認罪的報酬是「無罪」，而選擇不認罪的報酬是「一年」刑期，所以選擇認罪對囚犯A是較有利的，我們在這個「無罪」上面畫個紅色圈圈。
假設囚犯B選擇認罪，那麼囚犯A選擇認罪的報酬是「五年」刑期，而選擇不認罪的報酬則是「死刑」，所以選擇認罪對囚犯A是較有利的，我們在這個「五年」上面畫個紅色圈圈。

這時候，站在囚犯A的立場，無論囚犯B的選擇是什麼，自己選擇「認罪」都會是最有利於自己的選項。

其次，換站在囚犯B的立場來思考

假設囚犯A選擇不認罪，那麼囚犯B選擇認罪的報酬是「無罪」，而選擇不認罪的報酬是「一年」刑期；選擇認罪對囚犯B是較有利的，我們在這個「無罪」上面畫個藍色圈圈。
假設囚犯A選擇認罪，那麼囚犯B選擇認罪的報酬是「五年」刑期，而選擇不認罪的報酬則是「死刑」，所以選擇認罪對囚犯B是較有利的，我們在這個「五年」上面畫個藍色圈圈。

現在，我們也完成了站在囚犯B的立場，會做出那些有利於自己的選項。