囚徒困境:你會背叛你的朋友嗎?博弈論和納什均衡(二)

各位同學大家好!我是李永樂老師,今天我們繼續漫談博弈論。今天是第二期,上一期的內容大家可以點選這裡。

大家聽說過囚徒困境嗎?有兩個小偷集體作案,然後被警察捉住。

警察對兩個人分別審訊,並且告訴他們政策:

如果兩個人都坦白交代作案過程和贓物去向,就可以定罪,兩個人各判3年。

如果一個人交代另一個不交代,那麼一樣可以定罪。但是交代的人從寬處罰,批評教育就釋放。不交代的人從嚴處罰,判5年。

如果兩個人都不交代,沒法定罪,每個人只能各判1年。

我們把兩個人的收益情況寫在下面,由於判刑是不好的,所以收益寫作負的。

這時,A和B會做什麼選擇呢?

這時,A和B會做什麼選擇呢?

首先我們考慮A的決策。

A會想:我如何才能獲得更大收益呢?

如果B坦白了,那麼我坦白就會判3年,我抗拒就會判5年,為了讓自己收益更大,我應該坦白;

如果B抗拒了,我坦白會判0年,我抗拒會判1年,我還是應該坦白。

所以,無論B如何做,A都應該選擇坦白,這樣自己的收益最大。

同樣,B也會這樣想:無論A如何做,B都應該坦白,收益才最大。

因此,最終兩個人都會坦白。而且此時,沒有任何一方願意單方面改變決策,因為一旦單方面改變決策,就會造成自己的收益下降。這個都坦白的策略就稱為納什均衡點。

兩個人都坦白各判3年,兩個人都抗拒各判1年,集體最優解顯然是兩個人都抗拒。但是,納什均衡點卻不在這裡。這就說明個人理性產生的納什均衡結果未必是集體最優解。

囚徒困境與開車夾塞的例子很像。如果大家都不夾塞,是整體的最優解,但是按照納什均衡理論,任何一個司機都會考慮:無論別人是否夾塞,我夾塞都可以使自己的收益變大。於是最終大家都會夾塞,加劇擁堵,反而不如大家都不加塞走的快。

經濟學上講:市場的供給和需求是平衡的,而且,在平衡時,商品的價格往往會等於商家的成本。這是為什麼呢?其實也是囚徒困境。

假如一件商品的成本是100元,其他廠商都賣150元,那我賣149元就能獨佔全部市場,對我是有利的。可是其他廠商也會這麼想,他們會賣148元,於是在囚徒困境中,大家都會以成本價100元銷售,每一個廠商都只能獲得自己勞動所對應的利潤,而無法獲得超額利潤。

那麼,有沒有辦法使個人最優變成集體最優呢?方法就是共謀。

兩個小偷在作案之前可以說好,咱們如果進去了,一定都抗拒。如果你這一次敢反悔,那就是不守規矩,出來之後道上的人一定會加倍償還給你。如果這個小偷還想以後繼續作案,他一定不敢與行規作對,他會死不招供。在多次博弈過程中,共謀是可能的。但是如果這個小偷想幹完這一票就走,共謀就是不牢靠的。

在商業領域,也可以依靠共謀完成價格鎖定。比如上游廠家在給分銷商供貨時,有可能會簽署最低價格協議,避免價格戰,但這種方法有時候無法阻止分銷商偷偷降價。

於是有時候我們會看到某些大型商場有這樣的廣告:如果在我們商場買的東西比別人家貴了,無條件退差價。看起來,這句話的意思看起來好像是讓利給消費者。但實際上,這是在告訴其他商家:不要想著依靠價格戰戰勝我,你要是敢降價,我也跟著降,你降多少我也降多少,大家兩敗俱傷,何必呢?這種情況下,對手往往也不會幹這種費力不討好的事,而是會按照同樣的價格出售商品,這就形成了共謀。

在社會領域,共謀是靠法律完成的。大家約定的共謀結論就是法律,如果有人不按照約定做,就會受到法律的懲罰。通過這種方式保證最終決策從個人最優的納什均衡點變為集體最優點。執法部門經常說:執法必嚴,違法必究,目的就是為了震懾所有人,讓大家形成共謀。讓大家知道如果不按規矩做事,雖然可以獲得短期利益,在長期必定會受到懲罰,只有這樣才能讓躲避開無效的納什均衡點。

有時候,抓住一個小偷的成本可能比小偷偷的錢還要多,可是為什麼我們還一定要抓住他呢?因為假如有人發現破壞了規矩也沒事,那麼整個社會就將會奔向囚徒困境之中,這時再想重塑秩序,就非常困難了。

博弈論中還有哪些有趣的例子?關注我,聽我繼續漫談博弈論。

相關文章

地震之前,有哪些徵兆?

地震之前,有哪些徵兆?

各位同學大家好!我是李永樂老師。 當地時間2月6日凌晨4點,土耳其和敘利亞邊界地區發生了7.8級大地震,目前已經造成接近3萬人死亡,7萬人受...