本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * B6 t/ w. X p3 u
) D7 o. D! G7 ?% e& d$ m) K
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* H7 {# e3 j: i6 k3 }& o. j' B( M* X
以下三个定义:6 ]7 B" ^6 e5 w+ V3 D
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ) s0 I! e9 n- W/ u1 B: l3 A3 k/ g
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 |8 x: [: l3 F# B- O% `/ \$ x3 j
所谓的双方优势策略则是指双方利益总和最大的策略。
, t/ I3 U9 c8 Z F$ }6 W1 j; n2 I: @[编辑本段]严格优势策略举例分析" z2 J! l. q$ Y+ r- Y* v
一、经典的囚徒困境
% j. c; x3 Y; G 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
3 d9 @8 ]. W1 x9 B k 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 U( p- D) D0 j% `9 c! o- g+ y
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
: M9 N- G4 p$ Z- g; o3 N7 ] 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 W7 y3 X0 C, v, `, H" }$ q
若二人都互相检举(互相“背叛”),则二人同样判监2年。8 F3 F' |- ^) M
9 [' @1 w: A0 G# |用表格概述如下:9 k( t6 p# `0 L$ E; b
8 m8 ?6 B% q$ J 甲沉默(合作) 甲认罪(背叛) ( ^9 j& z0 K0 S+ s6 q7 j
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 . Q; u$ j2 J, x, a } I G: D
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ w4 ]) G$ I6 d. V$ p p8 y% D
0 _1 \: M% j0 e8 n; q 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 @, S- p6 A% q( E, A
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 r E1 D; _! U 若对方沉默、背叛会让我获释,所以会选择背叛。 : n+ N$ D! k8 H5 Y8 |- _7 K
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' n3 \% w; l5 Q% d( P 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 O. W) D8 F, E! E4 _6 v9 y# M
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 X& Q/ q7 i T5 K/ { 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. B8 }0 u J0 w2 p1 E3 C[编辑本段]二、智猪博弈理论) [( `& c9 z- a6 z% ~. `
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 3 R0 ~0 x( C" J3 y# U% l5 r0 W7 g
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 G- y1 ~/ F7 V: k2 [ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 s! }- Y) i4 b' }5 j5 e" ^+ q 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 ]4 c+ d' p. Y2 q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" b6 @7 r# W% j0 ^0 F; o 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 g- B6 c, i; {! _
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 W4 U7 ~+ `% U
% r$ Q: G1 P* P) B" M
三、关于企业价格策略7 Z: ]& @8 ?+ \. c. A
R6 X' i8 q) o8 f
7 v% g7 u( N1 J/ w6 i( k: W 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" o- ^5 q+ o# v% I4 V) ~' v) E" h 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ ]* h' e0 C1 R1 n) B c( ^( R4 G 以下三个定义:# r- v! p: j4 e+ M: h ?8 y( T+ e7 c9 B
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ R, K' ?( ^6 V 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 S) S4 b6 d6 l* d( L7 h3 f
所谓的双方优势策略则是指双方利益总和最大的策略。 ' I2 q5 j; H/ ?& z2 \
[编辑本段]严格优势策略举例分析4 a% b& s9 z, Z& p; a$ w9 N# K& J1 d
一、经典的囚徒困境
# x+ }: `: f u+ H2 j- h( ` 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 o' `) s( @% S5 F 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) p. I" q% V. c+ {+ S0 C. s
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 U# v) P0 A- L7 W w3 x: v 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : }" P2 p, p% _' H+ N$ L
若二人都互相检举(互相“背叛”),则二人同样判监2年。
' n- j" k+ {& h # {' a0 }0 r6 y: {: y6 m
用表格概述如下:3 c# H0 U; _: p$ h3 K7 |
6 T! e9 T+ K) M. S
甲沉默(合作) 甲认罪(背叛)
% b, N, K5 G+ h9 ]# z* H乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 2 ^/ S7 D8 } e% }
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. ^% p: s8 M5 ?" R' M) G( V' C5 @
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 \% i3 u% U/ L! r. m
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" N& B. j$ }2 T( _1 f: m 若对方沉默、背叛会让我获释,所以会选择背叛。 2 f. l- j- G5 Y/ |/ D9 i
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 C4 C- Z: Q, l) \% }* T
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" E# S, L# ?' u0 W" W 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % L2 L" `5 Z3 N
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 c) f0 k# i+ Q2 S3 ^3 b0 x
[编辑本段]二、智猪博弈理论& i: A8 }, G" C7 C6 g" i
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' ~. L1 ~4 B9 G( J7 G( @7 W 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 h: Y3 S. D( J4 E* j0 D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 Z$ J7 v4 d* c* B# H) `8 Z9 R7 t
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 K* y8 @2 P/ g “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" o$ [" f, G0 S1 ?2 @4 l. f 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* l5 V: E P2 l3 R3 V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 v- p4 c( q+ e: C9 d! W) L \
! T' F! s5 q3 g3 F/ K5 ?; A三、关于企业价格策略; ]2 |1 f2 z/ G$ i: i& y
* d2 b, T% N, i6 e% R
% f7 L( X7 i- N+ V: W, j8 E! g# n9 p 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 ~$ [+ I e l2 I. K 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" @1 L* n& t2 W Z/ L8 t
以下三个定义:
+ P+ Z$ X% \- z. \ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * q& K+ p( F& |6 a
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ E' x3 J. H2 |* c 所谓的双方优势策略则是指双方利益总和最大的策略。
$ n" k( y/ ~* d1 K( o5 N! u[编辑本段]严格优势策略举例分析
' X `6 D% O. k, W 一、经典的囚徒困境
3 _1 r3 p0 E* H 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 f7 c3 A( C% |7 h
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
+ U/ Q' Q4 e3 L" E) i 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 g6 O# p# R8 t, x' q7 g
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ ~& V" Q, s y4 B2 K, y: ? 若二人都互相检举(互相“背叛”),则二人同样判监2年。
) M0 j) x0 Z3 t B" D- l& ], a
8 s; c# d. d* c$ L用表格概述如下: L0 Q% f8 ^- {9 P& V
- t+ o5 W7 ?) d \6 U) ? 甲沉默(合作) 甲认罪(背叛)
9 b4 m0 c% J, _$ A- A/ C乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" X2 o3 x* E8 b- g; a: a乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 ~3 ~' ?* K# Z7 ^6 G8 G8 I" J! L1 I* A# K- n4 n. O, M
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % {" w G. ~3 p: e' M
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( S+ E, `+ B0 \& K% Z
若对方沉默、背叛会让我获释,所以会选择背叛。
6 Q5 ~! u* j! \0 }2 X% Z6 N( Z 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( L0 J+ l: Y& |: T# Y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 , e) r5 u" ~% c. Q9 J
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 " _: A! y9 y! ]9 O1 x
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 K" z# A9 P" }. u _ U[编辑本段]二、智猪博弈理论2 ^" Z+ b6 b) e- C9 k! ]
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - a# s$ |( [2 P7 \( b) C
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! Y; M5 b4 F/ u, m
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 e8 ^1 x" \) w7 {0 t" M8 t 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ P! G$ t) _- _+ ]. B- S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . G: Z' r7 r# d: J! A
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * d5 a4 E6 i7 v' z& M
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 H- r' i% S6 Q ]3 L/ P! h! E% `
8 d! X, y7 R- T) [) J" {
三、关于企业价格策略
\, {/ Q! @: S# {) g7 a8 q2 h/ b7 u/ j& b( H8 G9 g* x" D
. H( ~& a n% w4 I( `" a 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / y/ Z! L7 ], W0 L$ T
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 R/ U) H4 S( v- G" E# v# X" j, e/ r
以下三个定义:
2 f+ }0 G& x/ K* S 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# {' e( p2 X5 E2 O+ S0 x4 _3 l 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 p" ]# f( T# @! F. B, l* p4 l 所谓的双方优势策略则是指双方利益总和最大的策略。 * o6 s* w( m! }' z X1 k) e" u
[编辑本段]严格优势策略举例分析6 c- h+ t0 P3 K. ^
一、经典的囚徒困境
* j) T7 O$ {; X7 L: Y+ A3 ^7 }0 V 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + f- O$ X. [2 l3 s0 _; O2 A( }- f6 x
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - m o* f' `2 D0 Q$ X+ h0 R
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ E; x2 E( q* ~& m$ V" r% j: L, W 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# |4 R/ I+ [0 ?$ w- x/ S5 b' c2 I" S 若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ n# Q8 }) Q& b
- u. B" E6 T' T( z( E; `用表格概述如下:
2 X" n' k0 @! r( V# g8 n6 j2 x0 i6 ^
甲沉默(合作) 甲认罪(背叛)
- C5 z3 C' w G) l- \6 O乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 3 y* x+ q$ v1 b5 r) L+ ]
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 S6 P: Q* O; y5 S2 N ^
! y# d& J; A3 G8 J/ _. W4 ^, \ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ Q, E& D$ C8 H" n/ a2 }% O
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 2 P( c( i1 Q. k- d5 D2 b
若对方沉默、背叛会让我获释,所以会选择背叛。
, m: {% h* a7 d8 U: ]( Y* W5 I5 X/ H. e 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
e) m: `# g3 W1 e& {, ] 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. r4 V* ]. D& f/ e, m2 ?! g1 o+ a 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 H% a" d. e6 ]% M 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( X6 ?( O! ]2 Z6 r; ?9 ~- W[编辑本段]二、智猪博弈理论: m5 W9 c) k( A- g2 _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 i& s) N _& B8 N 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! B' g* s: A6 o8 K Z
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# Q% Z* G* J, r, ~" X5 C+ A 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 ^7 h3 F! _' V
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 u j. C6 Z2 R* a
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
V* x: {3 F7 C4 ? 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 d }& Q1 ~3 X& ] 6 {, `! Z5 q5 P1 K
三、关于企业价格策略/ g v& N1 t& E! i, `, @
( ~/ ]4 V& S- E; R4 m2 R# E1 v
& a6 T) @6 M1 r8 U 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! p1 H2 u1 \' w9 q( G% Y
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |