博弈论概论

博弈论的定义

博弈论研究的是在相互依赖的情况下的理性行为。博弈论是分析一群有战略行为的理性个体之间相互作用的正式方法。最初,它解决的是零和游戏,在这种游戏中,一个人的收获会导致其他参与者的损失。

一个理性的人采取的行动是由他或她的目标组成的。相互依赖意味着任何参与者都受到他人行为的影响,他的行为必须依赖于对他人反应的预测。一个人要决定做什么,就必须决定其他人将如何行动。这一决定需要了解他人的目标以及可供他们选择的方法。

博弈论已被用于定价、产量、产品开发、产品推广等业务场景的决策。

博弈论的例子

  • 买方和卖方谈判价格
  • 公司及其竞争对手
  • 拍卖
  • 囚徒困境

博弈论中的合作通常是通过一种非零和博弈来分析的,这种博弈称为囚徒困境。这幅画最初是由在兰德公司工作的梅里尔·弗勒德和梅尔文·德雷舍于1950年裱起来的。艾伯特·w·塔克(Albert W. Tucker)用徒刑奖励规范了这个游戏,并将其命名为“囚徒困境”(Prisoner’s Dilemma)。

一个犯罪团伙的两名成员被捕入狱。每个囚犯都被单独监禁,彼此之间没有任何联系。检察官缺乏足够的证据在主要指控上判定这两人有罪。他们希望以较轻的罪名判处两人一年监禁。与此同时,检方向每个囚犯提供一项交易。每个囚犯都有这样的机会:要么通过作证证明对方犯下了罪行来出卖对方,要么通过保持沉默来与对方合作。报价是:

  • 如果甲乙双方都背叛对方,他们都会被判两年徒刑
  • 如果A背叛B,但B保持沉默,A将被释放,B将服刑3年(反之亦然)
  • 如果A和B都保持沉默,他们都只会(以较轻的罪名)服刑一年

博弈中的两个参与者可以在两种策略中做出选择,即“合作”或“背叛”。他的观点是,当双方都合作时,双方都能获益,但如果只有一方合作,叛变的一方将获得更多。如果双方都有缺陷,双方都输了。

囚徒困境的例子

下表显示了囚徒困境博弈的收益。

经济学家认为囚徒困境游戏是零和的,因为存在没有合作:当两个都缺陷时,每个都得到0,或者当其中一个合作时,叛逃者得到(+10),合作者得到(-10),共0。

如果两个配合,将有一个正的收益:每个人得到5,共10。合作的收益(5)小于单方面叛变的收益(10),因此总是存在叛变的诱惑。

A的行动/ B的行动 合作 缺陷
合作 相当不错的(+ 5) 坏(-10)
缺陷 好(+ 10) 平庸的(0)

连续移动游戏

囚徒困境博弈是指双方同时行动的博弈。还有另一种游戏类型,即玩家按照特定的顺序走自己的棋,即顺序棋。

顺序棋博弈例子

在这个顺序博弈中,参与人A是市场的新进入者。他有两个选择:

他可以进入市场,也可以退出市场。

玩家B已经进入了市场,如果玩家A进入,他可以选择迎合他的竞争对手而不提高价格,或者发动价格战。

对玩家A来说,合乎逻辑的做法是进入市场,因为他知道,如果他加入,玩家B会选择“容纳”并获得(1)的收益,而不是试图发起价格战并获得(-1)。

对于参与人A来说,(1)的收益比(0)的收益好,即退出市场的收益。

顺序棋博弈例子

纳什均衡

纳什均衡是以小约翰·福布斯·纳什。纳什均衡是指一个博弈者以最优的方式进行博弈,并且正确地猜测到另一个博弈者会怎么做。换句话说,每个参与人通过假设其他参与人的行动来采取最佳对策。在纳什均衡中,假设每个参与人都知道平衡其他玩家的策略,没有人会因为改变自己的策略而得到任何东西。

纳什均衡的例子

一个协调游戏:

正确的
向上 1, - 1 2、0
下来 1, - 1 1, - 1

玩家1:如果参与人1假设参与人2会选择,参与人1会选择下来

如果参与人1假设参与人2会选择正确的,参与人1会选择向上

球员2:如果参与人2假设参与人1会选择向上,参与人2会选择正确的

如果参与人2假设参与人1会选择下来,参与人2就会无动于衷正确的

很容易确定这个博弈在(左下)和(右上)有两个纳什均衡。这两种策略的收益都是每个参与人的最佳对策。

留下你的评论

您的电子邮件地址将不会被公布。必填字段被标记*

相关文章