筆者印象之中,最先學到有關賽局理論,是國中的時候,當時國文老師舉我國歷史上「以下駟對上駟」而贏得勝利故事,只是當時年紀小,不懂這也是賽局的一種;在戰國時代,田忌與齊威王賽馬,比較優劣勢,田忌的馬不如齊威王,不過田忌善用賽馬規則,第一局以下駟對齊威王上駟,慘敗;第二局以上駟對齊威王中駟,險勝;第三局以中駟對齊威王下駟,險勝。總結形成二勝一負,結果是田忌勝出。
賽局理論(game theory)是一種分析的工具,它研究「怎樣以數學模型模擬理性決策者之間的衝突與合作。」(邁爾森,1992年)「由於衝突與合作的結果依賴於所有人所作的選擇,每一個決策者都企圖預測其他人可能的抉擇,以決定自己最佳決策,如何合理的進行這些相互依存的戰略策劃便是賽局理論的主題。」(簡明不列顛百科全書,1984年)。現代賽局理論對於擴展和精練戰略思想上的一般論述具有重大影響。因此,它成為經濟學極其有用的分析工具。
其實賽局理論的應用不限於特定領域,在社會科學的其他領域,例如:經濟學、政治學、法學、社會學等,都具有相當的重要性。以政治學為例,現代政治學試圖以數學模型模擬選舉過程、候選人的策略、以及其他政治、經濟發展過程,這些政治形勢的共同特點是,任何個體行動者(選民、議員、黨派或國家)的決策,都取決於其他行動者的決策及其相應後果。
賽局理論與現代社會科學的發展密切相關。目前,在美國各主要大學,「賽局理論」不僅是經濟學系的重要課程,而且是其他社會科學各學系的熱門課程。固然閱讀絕大多數賽局理論都需要具備相應的數學知識,但只要你對此一理論感興趣,無論你是否具備相應數學知識,仍然可以嘗試去閱讀它、理解它,最後再來運用它。
賽局理論包括兩個主要部分:合作賽局(co-operative game theory)與非合作賽局理論(non-operative game theo-ry)。二者基本差別在於,非合作賽局理論的分析單位是參加賽局的局中人(player),合作賽局理論的分析單位是群體(group),更準確地說它是一種聯合體(coalition)。參與非合作賽局的局中人利用一切可能的機會,最大限度地獲取個人利益。雖然他們可能合作,但這樣做的前提是合作必須符合所有局中人的利益,任何局中人在其他局中人不破壞協定的情形下,自行破壞合作是不理智的,因為他會遭到報復,而使處境惡化。合作賽局理論討論群體(或聯合體)利益怎樣實現,而不涉及局中人的聯合怎樣影響賽局結局。
在非合作賽局理論中,賽局有兩種不同的表述形式,最簡單的一種叫「策略型賽局」(strategic form games )或「常規型賽局」(normal form game )。這種形式的賽局模型包括四個組成部分:1.有兩個參賽者。2.完整的遊戲規則,且必須嚴格遵守。3.由已知的遊戲規則和個人的認知與實力,每一個局中人從頭到尾視對手的走法和戰略來決定自己的佈局和走法。4.每一個參賽者只有三種結果,輸、贏或平手(和局)。
舉例來說,兒童們常玩的「剪刀、石頭、布」遊戲,通常有兩個局中人(兒童甲、兒童乙),每人每次可以從剪刀、石頭、布中任選一種,這三種供選擇的事物代表局中人可能採取的策略,遊戲的結局有三種:甲贏、乙贏或平局;遊戲結局取決於局中人所採取的策略,由於兩人對局,每位局中人有三種可能採取的策略,因而,兩人採取策略的不同組合構成了3乘3的矩陣方格,行、列代表甲、乙不同的策略,方格內的兩個數字代表甲、乙所得的報酬,這種賽局模型有兩個特點,第一、這是兩人賽局,可用二惟表格(a two-dimensional table)描述賽局模型。第二、無論遊戲結局如何,兩人所得的報酬總和都是零,因此,稱此賽局模型為零和賽局(從理論上看,總和是否為零關係不大,最重要的是總和等於一個常數。因此,人們常用「常數和賽局」代替「零和賽局」)。
如果是三人賽局(甲、乙、丙),每人有三項策略可以選擇:1、2、3。計算報酬的方法十分簡單,用4乘以三人所選策略中最小的數字,再減去代表每人所選策略的數目。
非合作賽局理論中,賽局的第二種表述形式為展開型。在展開型策略中,研究重點是局中人採取行動的時間及採取行動時所掌握的信息。展開型賽局(extensive form games)模型有兩項規則,第一、每一個結點至少是一個箭頭的起點,大多數結點同時是某個箭頭的終點。第二、從任何結點逆箭頭移動,都不可能重新返回初始節點,因為逆向移動的唯一終點是初始結點,上述規則,展開型賽局模型成樹枝狀。
而那許均衡(Nash equilibrium)是一種策略組合,每位局中人各自選擇策略,一旦實現那許平衡,任何局中人都不再企圖改變策略(如果有人改變策略,他的所得報酬必然減少)。它的主要特徵是,如果其他人已確定策略,任何人透過現實那許平衡,都可以最大限度地獲取自身利益。「那許均衡」的內涵,可說「局中人雖不完全滿意,但還可以接受。」以下幾個例子與讀者分享。
例一,囚徒困境( prisoners」 dilemma),這個例子的創造本身就部分地奠定了非合作賽局理論的基礎,它可以作為實際生活中許多現象的一個抽象概括,它幾乎是賽局理論中必舉例子,囚徒困境講的是兩個嫌疑犯(A、B)作案後被警察抓到,兩名嫌疑(A、B)犯分別關在不同的房間審訊,警方告訴他們:如果兩人都坦白,各求刑5年;如果兩人都抵賴,各求刑一年(或許因證據不足);如果其中一人坦白,另一人抵賴,坦白的釋放,不坦白的求刑10年。
這個賽局裡,每位囚徒都有兩種策略:坦白或抵賴。這個賽局裡,那許均衡就是(坦白,坦白);事實上這裡(坦白,坦白)不僅是那許均衡,而且是一個優勢策略(dominant strategy)的均衡,就是說,不論對方如何選擇,囚徒的最適切選擇就是坦白。比如說,如果B不坦白,A坦白的話被釋放出來,不坦白的話被求刑一年,所以坦白比不坦白好;如果B坦白,A也坦白,各求刑5年,不坦白的話求刑10年,所以坦白還是比不坦白好,這樣,坦白就是A的優勢策略;同樣,坦白也是B的優勢策略,結果是囚徒A、B都選擇坦白,各求刑5年。
囚徒困境反映了一個很深刻的問題,這就是個體理性與集體理性的矛盾,如果兩個人都抵賴,各求刑1年,顯然比都坦白各求刑5年好,但這個柏拉圖改進(Pareto improve-ment)辦不到,因為它不滿足個體理性的需求,(抵賴,抵賴)不是那許均衡,換個角度看,即使兩個囚徒在被警察抓住之前建立一個攻守同盟(死不坦白),這個攻守同盟也沒有用,因為它不構成那許均衡,沒有人有誘因遵守協定。
例二、智豬賽局(boxed pigs),這個例子講的是,豬圈裡有兩隻豬,一隻大豬,一隻小豬。豬圈的一頭放置一個豬食槽,另一頭安裝一個按鈕,控制著豬食的供應,每頂一次按鈕,就會有10個單位的豬食進槽,但誰去頂按鈕,就要支付兩個單位的成本。若大豬先到,大豬吃到9個單位,小豬只能吃到一個單位;若同時到,大豬吃到7個單位,小豬吃到3個單位;若小豬先到,大豬吃到6個單位,小豬吃到4個單位。
在這個例子中,什麼是那許均衡?首先我們注意到,不論大豬選擇頂按鈕還是等待,小豬的最適切選擇都是等待。等待是小豬的優勢策略。(待續)
淺談「賽局理論」/陳寶明
- 2006-09-04