賽局理論,是一種行動規劃與執行的科學。
它能預測賽局中的玩家會發展出何種策略,以及他們可能會採取的策略。在賽局中,每個人都會先考量對手可能採取的行動,然後再選擇自己的最佳應對選項。
在賽局中,我們都希望領先對手一步。
如果事先知道了彼此的選擇,或許我們會更願意選擇雙贏的選項;但可惜的是,真實世界裡大多不會知道對方的選擇,這時候我們又該如何做出選擇呢?假設彼此都願意雙贏、還是選擇獨贏呢?也有可能在彼此猜忌的情況下,做出了最糟的選擇、兩敗俱傷。
這就是賽局有趣的地方。
許多人接觸賽局,都是從經典的案例「囚犯困境」開始了解的。囚犯困境,說明了雙方合作可以有更好的結果,卻因為無法合作而選擇對自己更好的選項,最後相互背叛。
但你可能不知道,囚犯困境是有機會被打破的,怎麼做到?就讓我用這個經典案例讓你知道賽局的基本概念與運作機制,以及如何運用到真實世界中尋求破局之道?
囚犯困境:為什麼會做出損人不利己的選擇?
這個故事是這樣的:有兩個強盜被逮捕了。但是因為能確認犯罪的證據不足,所以警方將兩個囚犯隔離到不同的房間,試圖用利誘的方式突破他們的心防,使兩個人都認罪。警方在隔離偵訊時,對兩個囚犯都提出了相同的條件
1. 如果兩個人都認罪了,各判五年的刑期。
2. 如果兩個人都不認罪,則各會被判刑一年。
3. 如果只有一人認罪,那麼認罪的將獲釋、另一位會被判死刑。
你認為這兩個人會如何選擇?
直覺來看,選擇合作都不認罪會是最佳策略,因為只會被判刑一年。但是這是最經不起考驗的選項;事實上,在利益的驅使下,他們會做出背叛對方的選擇,結果就是雙方都認罪。為什麼會這樣?
我們可以從賽局來看這兩個囚犯會如何做出選擇?
想要分析兩個囚犯之間的利害關係,我們可以利用一個 2 X 2 的表格,整理出所有可能發生的情況,就像你現在看到的這張表格
當囚犯 A 選擇不認罪、囚犯 B 也選擇不認罪時,彼此都是判刑一年,這就是他們在這樣的選項下所獲得的報酬。
當囚犯 A 選擇不認罪,而囚犯 B 選擇認罪時,囚犯 A 會判死刑,而囚犯 B 會獲判無罪。
同樣的道理,我們可以看到當囚犯 A 選擇認罪,而囚犯 B 選擇認罪、與不認罪的情況下各自會獲得的報酬。
在理解了賽局的結構之後,接下來我們來分析這兩個囚犯會做出什麼樣的選擇
首先從囚犯 A 的觀點來看:
假設囚犯 B 選擇不認罪,如果自己選擇認罪的話,對方就會判死刑,而自己會獲判無罪;但如果自己選擇不認罪的話,雙方都會獲得一年的刑期。所以,在囚犯 B 選擇不認罪的假設下,自己選擇認罪才是最合理的選項。
那麼假設囚犯 B 選擇認罪呢?如果自己選擇認罪,雙方都會被判刑 5 年的刑期;但如果自己選擇不認罪,自己就會被判死刑,而對方會獲判無罪。所以,在囚犯 B 選擇認罪的假設下,自己選擇認罪會是最合理的選擇。
這時候你發現了什麼?無論囚犯 B 選擇認罪、或不認罪,囚犯 A 都清楚選擇認罪是對自己最有利的。反過來站在囚犯 B 的立場,也是如此。
不論囚犯 A 選擇認罪或不認罪,自己的最佳選項就是認罪。
在經過這樣的思考之後,我們可以合理的預測兩個囚犯都會做出認罪的選擇。怎麼會這樣?明明不認罪才是對雙方最好的選項,但是為何各自都會做出認罪的選擇呢?
這就是著名的「囚犯困境」,這個困境就是「明知道對雙方有更好的選項,但就是不能選它」
明明合作更好,為何會選擇彼此背叛?
你一定覺得這兩個囚犯很笨吧!
明明只要合作都不認罪就可以各判刑一年,怎麼會選擇認罪呢?但是,請再看一次條件,想想看:如果你是其中一位囚犯,會選擇不認罪嗎?
選擇不認罪,其實伴隨著極大的風險;如果對方背叛了自己、選擇了認罪,那麼自己就會被判死刑。一旦有了這樣的想法,就會認為選擇認罪,最多判刑五年;但選擇不認罪,有可能判刑一年或死刑。如果是你,會願意冒這個風險嗎?
「這就是玩家視角與全局視角的不同。」
從賽局整體的全局視角來看,我們很容易找出彼此合作都不認罪,才是最好的選擇;但是從玩家、也就是囚犯的視角來看,選擇背叛對方才是對自己最好的選擇。
有句話「當局者迷」就是這個意思。
在現實生活中,這樣的囚犯困境時常出現。比方說,先前當疫情升溫時,就會出現搶購口罩、衛生紙與民生用品的情況,即使你知道只要大家配合、人人都夠用,但就是有人會選擇搶購。
這是因為他們擔心,萬一別人選擇搶購,自己就可能買不到;而媒體上搶購一空的新聞與照片,會更進一步強化這樣的風險印象。所以,這些人就做出了不合作的選擇,先搶先贏。
另一個例子,則是施打疫苗。
從整體來看,大家都施打可以獲得最好的防護效果,但多數人會選擇不施打,一方面這是因為對於施打疫苗副作用的恐慌,另一方面認為別人打了也能降低疫情傳染的風險,所以做出了不施打比較好的選擇。
這些情況,我們都可以從賽局結構看出來,其中的玩家可能會做出的合理選擇。
知道了選擇,我們只能束手無策嗎?
所以呢?知道了囚犯會選擇背叛、知道了大家會選擇搶口罩、不施打疫苗,又能怎麼樣?我們能做什麼嗎?
當然可以!
了解賽局的目的,不只是知道對方或自己會做出什麼樣的選擇,我們也能尋求機會做出突破與改變。
還記得我在前一篇文章提到,懂得賽局理論,我們可以做到 3 件事
1. 掌握賽局的結構,也就是問題整體的樣貌。
2. 預測可能發生的未來,也就是在賽局中的參與者接下來會採取什麼樣的行動?
3. 找到適當的應對方案。
到目前為止,我們已經完成了前兩件事。釐清了賽局的結構、也知道了賽局中的參與者接下來會採取的行動。關鍵是第三步,如何找到適當的應對方案?
在囚犯困境中,如果我是囚犯,只能選擇認罪或不認罪兩個選項;而警方藉由交換條件的設計,使得囚犯最終會選擇認罪,這是警方最希望看到的。但是,如果我是這兩個囚犯的老大、幕後主謀,不希望他們做出背叛的行為,而是彼此合作都不認罪,又該怎麼做呢?
我可以想辦法改變遊戲規則,扭轉這兩個囚犯的合理選擇。要改變遊戲規則,就要先了解遊戲規則是什麼?以及遊戲規則如何驅使參與者做出行動?
在囚犯困境中的遊戲規則,就是這 3 條:
1. 如果兩個人都認罪了,各判五年的刑期。
2. 如果兩個人都不認罪,則各會被判刑一年。
3. 如果只有一人認罪,那麼認罪的將獲釋、另一位會被判死刑。
而這 3 個條件,之所以會驅使囚犯做出認罪的選擇,是因為滿足了兩個驅動條件
驅動條件 1 、認罪的誘惑>不認罪的報酬
驅動條件 2、不認罪的犧牲>認罪的懲罰
在驅動條件 1 中,不認罪的報酬會獲判一年的刑期,而認罪的誘惑是無罪釋放。所以囚犯會傾向於認罪。而在驅動條件 2 中,認罪的懲罰是判刑五年,但是不認罪的犧牲卻是判死刑。所以囚犯也會傾向於認罪。
驅動條件 1,可以理解為哪一個選擇的好處比較大;驅動條件 2,則可以理解為哪一個選擇的壞處比較小。在利弊權衡下,很自然地會做出好處大、壞處小的選擇,也就是認罪。
知道驅動條件,轉變為對自己有利的局面
怎麼做?改變條件,將「不認罪」扭轉為好處較大、壞處較小的選項。
在驅動條件 1 中,如果我是囚犯的老大,知道警方的伎倆,就會事先告訴囚犯,當你們被逮捕時,只要堅決不認罪,我會照顧你的家人,不管你有沒有獲釋都會獲得一大筆錢,藉此來提高不認罪的報酬;另一方面,也囚犯知道,如果你選擇了認罪,在你被釋放後,就會因為背叛而被人幹掉,而我也無法保證你家人的平安,藉此來降低認罪的誘惑。
當我降低了認罪的誘惑、提高了不認罪的報酬,就能扭轉驅動條件一對囚犯的影響,轉而傾向選擇不認罪。
那麼在驅動條件 2 中,又該如何扭轉呢?首先,是提高認罪的懲罰,除了剛剛提到認罪後,即使你被釋放也會被幹掉、家人也無法保證平安之外;兄弟就是要講義氣,這樣的文化也會增加背叛的心理懲罰。
其次,是降低不認罪的犧牲,除了前述的只要你不認罪,我會照顧你的家人、獲得一大筆錢之外,也讓囚犯知道,即使你因為另一位囚犯的背叛而判了死刑,我也會為你報仇的。
而在這樣的前提下,我相信你們兩位都不會選擇背叛,而做出認罪的選擇的,藉此進一步降低不認罪的犧牲與風險。如此一來,也扭轉了驅動條件二對囚犯的影響,轉而傾向選擇不認罪。
這就是透過制度設計,來扭轉囚犯在囚犯困境中的選擇,從選擇認罪是合理的選項,轉變為選擇不認罪才是合理的選項。
回到生活中的案例,如果你是政府,該如何改變大家搶購口罩的行為呢?同樣是透過制度的設計,來扭轉驅動條件。在這個情境中的驅動條件是:
驅動條件 1、搶購的誘惑>不搶購的報酬
驅動條件 2、不搶購的犧牲>搶購的懲罰
所以政府會採行一連串的行動,比方說實名制限購、徵召口罩業者成立國家隊、低於市價,加上官方文宣,目的主要是聚焦在降低搶購的誘惑、不搶購的犧牲;另一方面提高不搶購的報酬、以及搶購的懲罰上,則是透過文宣來建立民眾的素養意識、強化心理認同。
能不能讓所有賽局內的參與者都做出不搶購的選擇,取決於制度設計的強度。不過,在推出口罩實名制與徵召口罩業者的產能之後,等同於封殺了檯面上「搶購」的選項了;其它的制度設計在於安撫與穩定民眾的作用居多。
當我們用賽局結構來看待這些,是不是覺得能看懂這些施策背後的考量與目的了呢?同樣地,如果我們看懂了這些,或許就能及早做出採購、或是對於搶購不那麼恐慌,甚至是做出因應的對策。現在,你是不是對賽局更有興趣了呢?
對於幕僚角色來說,時常需要看懂局面,做出得體的應對;更重要的是,當局面不利於我方時,又該如何做出行動來改變局面?
看懂局,更要知道如何改變局、營造有利局面
在我們的生活與工作中,存在著許多因為囚犯困境的賽局,可能是因為一開始的制度設計不當、或是彼此間的角色利益與信任不足,而導致這種明知道合作比較好,卻不會做出合作的選擇,甚至反而做出損人不利己的決定。
這是因為賽局結構的驅動力,使得賽局內的參與者在做利益權衡時,做出對自己有利的合理選擇;與從賽局上方來看整體局勢的最佳選項,是截然不同的。
改變驅動力,就能影響賽局。
這就好像我們在看籃球賽時,有時會覺得明明有比較好的傳球或出手選項,怎麼會沒有看到,而做出令人匪夷所思、糟糕透頂的決定呢?這就是局內視角與局外視角的差異。該怎麼破解或避免這種局面呢?就是看懂局、找出球員可能做出的選項,然後透過教練戰術的設計與場上指揮官的指示,來引導或改變驅動力,讓雙方球員做出自己期望的行動選項。
所以,現在你應該對於什麼是賽局理論、以及賽局的作用有更進一步的了解。
光是看懂局是不夠的,我們更希望能進一步造勢、利用制度設計,來影響整個局,改變所有人所採取的行動,往我們所期望的方向進展。
在下一篇文章中,我將告訴你確認賽局結構後,如何預測賽局中的人將會採取的行動選項。
專欄全系列文章:【幕僚的賽局力】
推薦文章: