2020-09-15课程笔记10 分钟读完 (大约 1571 个字) 0次访问

CMSC 5728 Decision Analysis & Game Theory - Lecture 02

Minimax Theorem
Nash’s Theorem
Pareto Optimal
Cournot Model of Duopoly

Games With no Saddle Points

当没有 saddle points，如下图所示

此时就P1和P2就需要做出一些策略，称之为 Mixed Strategies。每个玩家都会分配一定的概率选择某个策略，如下图所示

此时，

当 P1 选择 A 的时候：A = 1/3(4) + 2/3(0) = 4/3

当 P1 选择 B 的时候：B = 1/3(-5) + 2/3(3) = 1/3

显然此时选择 A 的收益会更大一些。但是这只是只考虑 P1 的情况，实际上 P2 的选择也会对 P1 有影响，我们继续看。

P2 设使用 C 策略的概率为 x，使用 D 的概率为 ( 1 - x )。此时，

当 P1 选择 A 的时候：A = x(4) + (1-x)(0) = 4x

当 P1 选择 B 的时候：B = x(-5) + (1-x)(3) = 3 - 8x

4x = 3 - 8x，x = 1/4，P1 的 payoff 为 1。

反过来，P1 也有理性，P1 也会做出一些策略的选择

当 P2 选择 C 的时候：C = x(-4) + (1-x)(5) = 5 - 9x

当 P2 选择 D 的时候：D = x(0) + (1-x)(-3) = -3 + 3x

5 - 9x = -3 + 3x，x = 2/3，P2 的 payoff 为 -1。

Two-person Non-zero Sum Games

玩家之间并非一定要对立对抗，也可以互相合作，如下图所示，矩阵中会有两个量，分别代表 P1 跟 P2 的损益。

但是这样会造成一个问题，Zero-sum game 的解决方法就是找 saddle points，但是 Non-zero sum game可能会有如下两种情况

左边这种情况，P1 跟 P2 都找到了对各自利益最大化的点，即（5，4）。但是右边这种情况会形成一个循环，P1 认为对自己利益最大的点 P2 不认可，反之 P1 也不认可。此时就需要一个新的解决方法，Nash’s Theorem

Nash’s Theorem

在博弈论中，如果每个参与者都选择了自己的策略，并且没有玩家可以透过改变策略而其他参与者保持不变而获益，那么当前的策略选择的集合及其相应的结果构成了纳什均衡。——维基百科

根据 Nash’s Theorem 得出的游戏结果是一个 NEP（Nash Equilibrium Point纳什均衡点），任何 saddle point 也是 NEP。

The Prisoner’s Dilemma 囚徒困境

Nash’s Theorem 著名的例子就是囚徒困境

S 为 Silence 保持沉默，C 为 confess 招供。由图可知，当两人都保持沉默时是对两人都是最好的情况，都只判刑2年。但是双方是不能交流的，如果自己保持沉默，对方招供了，那么对方将仅判1年，而自己将判10年。因此，两个犯人都会为了争取尽可能最小的判刑时间，而都选择招供，这个点就是 NEP。

Paroto Optimal

在没有使任何人境况变坏的前提下，使得至少一个人变得更好，这就是帕雷托改善。帕雷托最优的状态就是不可能再有更多的帕雷托改善的状态；换句话说，不可能在不使任何其他人受损的情况下再改善某些人的境况。

需要指出的是，帕雷托最优只是各种理想态标准中的“最低标准”。也就是说，一种状态如果尚未达到帕雷托最优，那么它一定是不理想的，因为还存在改进的余地，可以在不损害任何人的前提下使某一些人的福利得到提高。但是一种达到了帕雷托最优的状态并不一定真的很“理想”。——维基百科

如上图所示，（2，2）、（10，1）、（1，10）都是 Paroto Optimal。

Cournot Model of Duopoly

古诺寡头竞争的假设

两个寡头厂商生产的产品是同质或无差别的；
每个厂商都根据对手的策略采取行动，并假定对手会继续这样做，据此来做出自己的决策；
为方便起见，假定每个厂商的边际成本为常数，并假设每个厂商的需求函数是线形的；
两个厂商都通过调整产量来实现各自利润的最大化；
两个厂商不存在任何正式的或非正式的串谋行为。

边际成本亦作增量成本，指的是每增产一单位的产品所造成的总成本的增量。这个概念表明每一单位的产品的成本与总产品量有关。比如，仅生产一辆汽车的成本是极其巨大的，而生产第101辆汽车的成本就低得多，而生产第10000汽车的成本就更低了。但是，考虑到机会成本，随着生产量的增加，边际成本可能会增加。——维基百科