具體命名方式如下 1旁邊的點為A,兩個2旁邊的點從左到右為B,C
四個3旁邊的點從左到右為D,E,F,G
這裏利用逆向歸納法,(P1,P2,P分別3代表1,2,3三個玩家)
(1)先看以D為起點的子博弈,此時P3選擇L3的利得為3,R3的利得為4,所以均衡狀態下P3會選擇R3
(2)再看以E為起點的子博弈,此時P3選擇L3的利得為7,R3的利得為3,所以均衡狀態下P3會選擇L3
(3)此時我們可以分析以B為起點的子博弈,根據(1),(2)的分析可知,此時P2選擇L2的利得為3,R2的利得為4,所以均衡狀態下P2會選擇R2。
(4)根據(1)(2)(3)的結論我們可以知道P1選擇L1時,其利得為2。(此時的路徑為L1-R2-L3)
(5)由於F和G點相連,故以C點為起點的子博弈不是壹個動態博弈,而是壹個靜態博弈。此時我們可以發現對於P2來說R2嚴優於L2(選擇R2後,P2的最小利得為7,而選擇L2後,P2的最大利得為6),所以在均衡狀態下P2會選擇L2。此時P3的最佳反應為選擇L3。
(6)根據(5)的結論我們可以知道P1選擇R1時,其利得為8。(此時的路徑為R1-R2-L3)
(7)對比(4)和(6)的結論我們可以知道,在均衡狀態下P1會選擇R1。
綜合上述結論得:
均衡策略為:
P1:選擇R1
P2:若P1選擇L1,則選擇R2;若P1選擇R1,則選擇R2
P3:若P1選擇L1且P2選擇L2,則選擇R3;若P1選擇L1且P2選擇R2,則選擇L3;若P1選擇R1,則選擇L3
此時的均衡路徑為R1-R2-L3,且P1,P2,P3的利得分別為8,9,8