关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
3 d, m1 k3 z% @8 k* h- d+ i' @5 Y) `8 a( c% d3 r6 x
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* i! m$ h. V3 R: F/ Z; G: ~9 P
  以下三个定义:
9 ~- C9 g+ e# M  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " U: `: ]+ p: [0 ]$ S/ E) i
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ V) M  L7 R& k6 n  所谓的双方优势策略则是指双方利益总和最大的策略。  
4 `. q1 ~5 C! D7 I[编辑本段]严格优势策略举例分析. T$ S3 \) u6 v
  一、经典的囚徒困境
# }0 G0 c# G+ e& n; p8 r  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 [3 N7 V/ }' Z6 j3 o$ F5 J( ]' Y
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 5 b8 d- j  v/ H2 E
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% c! @2 u4 p( S* ]6 `- R9 J  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) H8 X5 C; f, Y1 t. A' a  R3 m5 p  若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 @0 e, e) o) Z/ v  
3 [' u4 }: _2 n. F; O; R3 I用表格概述如下:
" D/ |9 D7 S: C* ], S, ]  I  {' @' ^- S9 ~/ d+ ~$ _5 d" m: ]% x
    甲沉默(合作)  甲认罪(背叛)  
6 A3 V5 z' N% i" B9 v2 a/ C乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
: j1 m* A8 `" W6 g- e乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  + P4 I( v: j7 C+ N" m. p! F/ e
3 I* F% T! ~7 L$ O. E: E
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" m+ z* h* u6 X7 W5 G3 b+ \  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ B! g/ k% b) L( L
  若对方沉默、背叛会让我获释,所以会选择背叛。
. j% B% F* T/ F  d  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 C5 W* B+ y  H
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。   I: f% Q7 n, c- Z2 M. J
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 Y0 _2 u' J/ I7 {- Y; u  }# A  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ A, t; I4 \% _9 N: [! `* \[编辑本段]二、智猪博弈理论1 [. s, ?8 x# A# Z4 q8 }
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + r) u% r. B3 l# F2 P1 t) C
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + z8 E' g, f) I. G! M7 p
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 `) {2 r7 C/ G9 t, q
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . w  K$ t3 v1 q4 U3 o/ r
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 z1 }3 w, ~3 T$ H+ j  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 5 f) {/ ~4 u- r
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' n4 Y) o* p' F5 J% \  
1 T6 l" g- B/ I2 N三、关于企业价格策略$ h6 p  {7 T4 Y6 |7 n) j

, ^8 e  A# m# E; G) l9 p  
4 I# X% E& H2 p1 S3 l6 \8 ?  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; t0 F" O5 q. V4 a- b
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, U" r6 @5 |7 s% Y
  以下三个定义:
3 o2 b% b! ~  N6 U  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 @6 |$ m! A, q' N' b  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ j7 g# ^" P/ ?1 `  所谓的双方优势策略则是指双方利益总和最大的策略。  
; j8 m$ c" C" G) o' b[编辑本段]严格优势策略举例分析: t9 ]2 a. v* C5 J6 g, R# a: Q6 ~% P4 b
  一、经典的囚徒困境
9 L1 T% c# |' \" w; g  {5 u4 _  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
  {. X7 X; H/ h9 |% X3 b  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 Y" F' P' q, M& A. i( R
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 r/ `) P" G+ Z  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ; M6 ^& V/ E4 ]9 ?* V
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 S5 C. c+ P) f. c' \6 V  
- A* Z$ w9 j: g" G% b: B& k用表格概述如下:
5 `, F! ]# t& ?/ f8 E3 L% z. C5 w/ Y, s
    甲沉默(合作)  甲认罪(背叛)  
; {; @5 O/ F- Z+ ~2 \% k乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  0 j1 [2 W2 V2 ]+ M' S( l
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 Q. E3 ]  K$ ^  U0 Q' w5 P

4 K( ~* O1 l! {' d4 U  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : T1 w0 L& w% R( O
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
. B) {- K# E, O% [( l0 v: f  若对方沉默、背叛会让我获释,所以会选择背叛。 1 s8 z% Z3 @& w7 F1 ]
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% w* G6 `1 U/ A* H  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ n$ Y4 _- y9 z0 w5 [; C  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 q" J' j! @4 [' l' K/ l7 j
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; Q, r7 s) K7 K2 I2 x: U. ~# O% q[编辑本段]二、智猪博弈理论  `) Q. N7 C$ Z+ ^
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
) o' A- ]) `, {) `; P  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. I7 A% M2 l" I* [7 r" r3 x5 d: u  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ) O. R7 O, B5 q+ x, d1 k
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 }/ g! W/ G) l* z  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
5 U7 Q. m% R- T  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % L( v  `: v# o0 m
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 O7 I) t: r: J2 F# {, K7 ?
  
. f0 Q# Q, `" a/ z7 ?9 r8 W5 ~$ o, }* b三、关于企业价格策略
0 d4 v! N& H' N( }- p
/ m8 K1 e9 z8 q  o) R  S0 a& X  0 G" H6 |1 J5 w
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; Z$ p8 H+ K6 J# B  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
; a9 e' o2 L+ l  以下三个定义:$ z: y) F8 z' y6 J) A
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 b0 [, \; a" |. P
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( `4 a, I: }7 V6 H0 j! {9 b
  所谓的双方优势策略则是指双方利益总和最大的策略。  , _- [6 M/ `" O' C4 t; L
[编辑本段]严格优势策略举例分析
, c+ q3 y2 v% E2 N3 T$ b  一、经典的囚徒困境
/ A1 V9 c6 j7 ~5 s  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" x, `) K# n% d" l  t9 c  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / e7 z7 K2 C) w2 |+ C) Z  Y, c& F
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 S+ I' q$ E- \& i8 z' O% a
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& `( T; E7 e( w. R9 H+ _  若二人都互相检举(互相“背叛”),则二人同样判监2年。. K: i% H3 d! W9 r3 j
  
* s* K/ D1 @) [- h4 k! q  B: t5 F用表格概述如下:
7 Q1 U/ t$ S: [2 |6 T$ `3 y% ]# i9 Q  v* n) c) E0 b
    甲沉默(合作)  甲认罪(背叛)  
' E& G. y4 f  ~: t. {" s2 r  i乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  : h8 m5 ?$ ^0 L7 ]' D
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  6 m1 m0 S) J, G  a% f
0 d$ z: I2 P7 `+ Z: a) w
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
6 P4 @+ Q1 L: p- {! x3 ^" K  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 r# n$ V: x" x2 G+ n- N# _
  若对方沉默、背叛会让我获释,所以会选择背叛。 - ^$ o3 t( |' W
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ G4 Q& F7 i1 ]6 \! o% x  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; T8 p  e' H& l8 O  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 0 i* ]& T$ B+ C4 X- W
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* @% D" j# Y9 D& [
[编辑本段]二、智猪博弈理论
% {3 ]& y/ J" J: _% {* M* I  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   q: }# E7 @" p$ z3 g  U: _
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 " {6 O- k/ u) @7 H( Y: [
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* V3 [. `7 K0 Z+ u0 i  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , h! X2 ^! E  `  N0 a
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
+ d6 @, q7 G( z  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / q0 m- l3 ?9 H: y0 o
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ |2 h) ?+ U+ M- a  
& n2 g. Q- f. v2 R三、关于企业价格策略% E* Z3 |+ B5 ~- J5 V1 |
# H" h# [- @8 a+ B
  
6 K: [$ S5 y8 M5 e1 v! q  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; ~0 p: @5 B% y( y7 q# X& J; E- P* q) G  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' i3 t  g" V2 J* B" C5 l# L( a) q  以下三个定义:  O  h  y  [& h, M4 Y2 X7 W! Q
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 - y/ J' K. j  v8 p' m7 U0 T$ i" X
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 : V! [* m. P6 Z  r1 [
  所谓的双方优势策略则是指双方利益总和最大的策略。  * j. u: o. v( P- F# ]
[编辑本段]严格优势策略举例分析
# I8 w, b/ u  x; V1 l& f9 ?  一、经典的囚徒困境
+ A/ C; ?9 \4 X( m! l% X/ Q/ P1 k  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ M7 ^/ \: y. F) V$ ?# l  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & ~: S+ m' x; u5 G
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 A( n3 }3 i$ C0 H
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , Q, O) R& V9 B/ s. z$ w  m
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
0 ?; m5 V3 q0 w5 r5 p  
& X* F5 O* l- ^: F$ K用表格概述如下:2 e6 v* Q( n$ P& n3 z
8 @/ v. J; t: b$ H
    甲沉默(合作)  甲认罪(背叛)  
0 m7 e$ U8 G1 L乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
8 Z; b+ v4 K' L: a$ |' T乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  # b, G" Q5 i# q6 ]# y
% K" m/ P5 X) H0 y) H
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) K( u+ A! w) k* U: R  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ ]; Z0 @" Q9 d0 I8 S) H* W
  若对方沉默、背叛会让我获释,所以会选择背叛。 , \2 X& v+ G% z0 b
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 r: n: t2 ~# h& g. p  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& S. p$ K4 q3 }, \# U  n  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 \& `  C# E+ u7 j, U% e& q: Q" E
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 y  A- [: c9 n4 N9 i* O) A[编辑本段]二、智猪博弈理论
" M7 j" e" \9 ^, L  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 1 Y( l' n% F: d! l
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, H: u' p3 s+ F3 e+ R7 z9 W  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 e" J' K# m7 b+ i. _  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ M, c' |% R6 t8 C# ~' r9 x( z
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) O4 M3 h' g& Z
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * p1 q, B3 s; p
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 r- S; h: x+ i! t3 ^  
- l  ^& S1 z6 E* h三、关于企业价格策略
+ e- Y# |* K# g/ v" ~; E7 D7 w
# C; G5 ^" n2 ?) ~  
2 |) f' Z& a9 U  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 s% `1 C# ~' M& k' q
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )