博弈论概论
博弈论的定义
博弈论研究的是在相互依赖的情况下的理性行为。博弈论是分析一群有战略行为的理性个体之间相互作用的正式方法。最初,它解决的是零和游戏,在这种游戏中,一个人的收获会导致其他参与者的损失。
一个理性的人采取的行动是由他或她的目标组成的。相互依赖意味着任何参与者都受到他人行为的影响,他的行为必须依赖于对他人反应的预测。一个人要决定做什么,就必须决定其他人将如何行动。这一决定需要了解他人的目标以及可供他们选择的方法。
博弈论已被用于定价、产量、产品开发、产品推广等业务场景的决策。
博弈论的例子
- 买方和卖方谈判价格
- 公司及其竞争对手
- 拍卖
- 囚徒困境
博弈论中的合作通常是通过一种非零和博弈来分析的,这种博弈称为囚徒困境。这幅画最初是由在兰德公司工作的梅里尔·弗勒德和梅尔文·德雷舍于1950年裱起来的。艾伯特·w·塔克(Albert W. Tucker)用徒刑奖励规范了这个游戏,并将其命名为“囚徒困境”(Prisoner’s Dilemma)。
一个犯罪团伙的两名成员被捕入狱。每个囚犯都被单独监禁,彼此之间没有任何联系。检察官缺乏足够的证据在主要指控上判定这两人有罪。他们希望以较轻的罪名判处两人一年监禁。与此同时,检方向每个囚犯提供一项交易。每个囚犯都有这样的机会:要么通过作证证明对方犯下了罪行来出卖对方,要么通过保持沉默来与对方合作。报价是:
- 如果甲乙双方都背叛对方,他们都会被判两年徒刑
- 如果A背叛B,但B保持沉默,A将被释放,B将服刑3年(反之亦然)
- 如果A和B都保持沉默,他们都只会(以较轻的罪名)服刑一年
博弈中的两个参与者可以在两种策略中做出选择,即“合作”或“背叛”。他的观点是,当双方都合作时,双方都能获益,但如果只有一方合作,叛变的一方将获得更多。如果双方都有缺陷,双方都输了。
囚徒困境的例子
下表显示了囚徒困境博弈的收益。
经济学家认为囚徒困境游戏是零和的,因为存在没有合作:当两个都缺陷时,每个都得到0,或者当其中一个合作时,叛逃者得到(+10),合作者得到(-10),共0。
如果两个配合,将有一个正的收益:每个人得到5,共10。合作的收益(5)小于单方面叛变的收益(10),因此总是存在叛变的诱惑。
A的行动/ B的行动 | 合作 | 缺陷 |
合作 | 相当不错的(+ 5) | 坏(-10) |
缺陷 | 好(+ 10) | 平庸的(0) |
连续移动游戏
囚徒困境博弈是指双方同时行动的博弈。还有另一种游戏类型,即玩家按照特定的顺序走自己的棋,即顺序棋。
顺序棋博弈例子
在这个顺序博弈中,参与人A是市场的新进入者。他有两个选择:
他可以进入市场,也可以退出市场。
玩家B已经进入了市场,如果玩家A进入,他可以选择迎合他的竞争对手而不提高价格,或者发动价格战。
对玩家A来说,合乎逻辑的做法是进入市场,因为他知道,如果他加入,玩家B会选择“容纳”并获得(1)的收益,而不是试图发起价格战并获得(-1)。
对于参与人A来说,(1)的收益比(0)的收益好,即退出市场的收益。

纳什均衡
纳什均衡是以小约翰·福布斯·纳什。纳什均衡是指一个博弈者以最优的方式进行博弈,并且正确地猜测到另一个博弈者会怎么做。换句话说,每个参与人通过假设其他参与人的行动来采取最佳对策。在纳什均衡中,假设每个参与人都知道平衡其他玩家的策略,没有人会因为改变自己的策略而得到任何东西。
纳什均衡的例子
一个协调游戏:
左 | 正确的 | |
向上 | 1, - 1 | 2、0 |
下来 | 1, - 1 | 1, - 1 |
玩家1:如果参与人1假设参与人2会选择左,参与人1会选择下来
如果参与人1假设参与人2会选择正确的,参与人1会选择向上
球员2:如果参与人2假设参与人1会选择向上,参与人2会选择正确的
如果参与人2假设参与人1会选择下来,参与人2就会无动于衷左或正确的
很容易确定这个博弈在(左下)和(右上)有两个纳什均衡。这两种策略的收益都是每个参与人的最佳对策。