囚徒困境 纳什均衡(囚徒困境纳什均衡怎么计算)
1、若囚徒们不互相合作,则无法脱离困境。囚徒困境,英語:',囚犯兩難是博弈论的非零和博弈中具代表性的例子,反映個人最佳選擇並非群體的最佳選擇,且在一个群体中,个人做出理性选择却往往导致集体的非理性。雖然這是一個理論上的情境,但現實中的價格競爭等也會出現類似情況。單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。
2、在重复的囚徒困境中,博弈被反复地进行。因而参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗行为被受到惩罚的威胁所制止,从而导向一个较好的的结果。
3、当次数接近无限,纳什均衡趋向于。當囚徒們可以互相溝通時,彼此合作可為全體帶來最佳利益,縮短刑期,但在無法溝通時,出賣同伙可為自己帶來更多的利益,無罪開釋,同時同伙把自己招出來可為他帶來利益。所以,互相出賣,反而能獲得最大利益。實際上,執法機構不可能設立如此情境來誘使囚徒招供,因為囚徒必須考慮刑期以外的因素,出賣同伙會受到報復等,則不能只以刑期作考量,所以是一個理論上的情境。
4、1950年,由就職於兰德公司的和擬定出相關困境的理論,後來由顧問以囚徒方式阐述,並命名为「囚徒困境」。经典的囚徒困境如下:。
5、警方逮捕甲、乙两名嫌疑犯,但沒有足够证据指控二人有罪。於是警方分开囚禁嫌疑犯,分别和二人见面,并向雙方提供以下相同的选择:。若一人認罪並作证對方,相關術語稱「背叛」對方,而對方保持沉默,此人将即時獲释,沉默者将判監10年。若二人都保持沉默,相關術語稱互相「合作」,则二人同樣判监半年。
囚徒困境 纳什均衡(囚徒困境纳什均衡怎么计算)
1、若二人都互相检举,互相「背叛」,則二人同樣判監5年。如同博弈论的其他例證,囚徒困境假定每個參與者,即「囚徒」,都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2、囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短。兩名囚徒由於隔絕監禁,並不知道對方选择;而即使他们能交谈,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。
3、試設想困境中兩名理性囚徒會如何作出選擇:。若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。二人面對的情況一樣,所以二人的理性思考都会得出相同的结论——选择背叛。
4、背叛是兩種策略之中的支配性策略。因此,这場博弈中唯一可能達到的纳什均衡,就是雙方参与者都背叛對方,結果二人同樣服刑5年。
5、这場博弈的纳什均衡,顯然不是顧及團體利益的解决方案。以全体利益而言,如果两个参与者都合作保持沉默,兩人都只會被判刑半年,总体利益更高,結果也比兩人背叛對方、判刑5年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。