2020-09-22课程笔记13 分钟读完 (大约 1961 个字) 0次访问

CMSC 5728 Decision Analysis & Game Theory - Lecture 03

Game Trees (Extensive form)
The Cournot Duopoly Model
The Stackelberg Duopoly Model

Game Trees (Extensive form)

顺序游玩
- 玩家轮流做出选择
- 玩家可以选择之前的选择
游戏被表示成一棵树
- 每个非叶子节点代表一些玩家的决策
- 边缘代表可用选择
可以被转换为矩阵 matrix game （Normal form）
每个飞叶子节点代表一些玩家的决策点
边缘代表可用的选择（可能是无限的）
完美信息 Perfect information
- 没有任何两个参与人同时行动，并且所有后行动者能确切知道前行动者选择了什么行动

例子：房地产开发博弈

假设

由于规模经济的限定，在一个特定地区只能容纳一个开发商去进行房地产开发
A 和 B 两个开发商决定是否对该地区的房地产进行开发
A 具有优先行动的权力，B在观察到A的行动后决定自己的下一步行动

支付向量

如果 A 和 B 同时选择开发，激烈的竞争将导致两败俱伤，每家仅获得 -3 的支付
如果 A 和 B 两家中的一家选择开发，另外一家选择不开发，则开发的一家将获得 1 的支付，而不开发的一家获得 0 的支付
如果两家都不开发，则其支付分别为 0

房地产开发博弈的扩展式表述（博弈树）

含义

A 选择开发，B 在观察到 A 选择开发后仍然选择开发，则 A 和 B 的支付分别为 -3，-3
A 选择开发，B 在观察到 A 选择开发后选择不开发，则 A 获得 1 的支付，而 B 获得 0的支付
A 选择不开发，B 在观察到 A 选择不开发后，选择开发，则 A 的支付为 0，B 的支付为 1
A 选择不开发，B 在观察到 A 选择不开发后，仍然选择不开发，则 A 和 B 的支付分别为 0 和 0

问题：如何求解上述博弈（完美信息动态）的 NE ?

把扩展式转化为标准式，然后利用 NE 的定义寻找 NE

B 的纯战略

不论 A 开发还是不开发，B 开发，记为（开发，开发）。含义：不论博弈到达 B 的哪一个信息集，B 都选择开发
A 开发，B 开发；A 不开发，B 不开发，记为（开发，不开发）。含义：博弈到达左信息集（A开发），B 选择开发；博弈到达右信息集（A 不开发)，B 选择不开发
A 开发，B 不开发；A 不开发，B 开发，记为（不开发，开发）。含义：博弈到达左信息集（A 开发），B 选择不开发；博弈到达右信息集（A 不开发），B 选择开发
不论 A 开发还是不开发，B 都不开发，记为（不开发，不开发）。含义：不论博弈到达 B 的哪一个信息集，B 都选择不开发

		B
		（开，开）	（开，不开）	（不开，开）	（不开，不开）
A	开发	-3, -3	-3, -3	1, 0	1, 0
	不开发	0, 1	0, 0	0, 1	0, 0

不可置信战略 Incredible threat

B 在决策前可以清楚地看到 A 的选择
如果 A 选择开发，B 的最优选择是不开发
如果 A 选择不开发，B 的最优选择是开发，而不是不开发
因此（不开发，不开发）是 B 的不可置信战略，该 NE 不合理

剔除完美信息博弈不合理 NE 的逻辑：只有当一个站略规定的行动规则在所有可能的情况下都是最优时，它才是一个合理的战略

在完美信息动态博弈中，会有部分 NE 包含不可置信的战略，精练 NE 的思路就是利用扩展式表述剔除包含不可置信战略 NE

子博弈精练 Subgame perfect（SPNE）

（完美信息博弈中），每一个决策结及其后续结构成一个子博弈
博弈本身构成自身的一个子博弈

房地产开发博弈中的三个子博弈

自身
两个只有开发商 B 决策的单人博弈

SPNE：一个战略组合

它是整个博弈的 NE
其相关行动规则在每一子博弈上都是 NE
在所有可能的路径上到达均衡，不仅包括均衡路径（equilibrium path，一个特

定的NE决定的原博弈树上唯一的一条路径），还包括所有其他在不同子博弈中

的分支路径（非均衡路径）

求解 SPNE 思路

寻找整个博弈的可能NE(可以通过把扩展式转化为标准式表述实现)
在每一个子博弈(博弈的分支路径)验证可能的NE是否达到均衡
剔除只在某些分支路径达到均衡，而在另一些分支路径无法达到均衡的NE

案例分析

(不开发，(开发，开发))：

在子博弈B1中，B的最优战略是不开发
在子博弈B2中，B的最优战略是开发
NE (不开发，(开发，开发))中B的均衡战略(开发，开发)在子博弈B2上构成NE，但在子博弈B1上不构成NE
上述NE不是一个SPNE

(开发，(不开发，开发))：

B的均衡战略(不开发，开发)(如果A 开发，B不开发；如果A不开发，B开发) 无论在子博弈B1还是子博弈B2上都构成 NE
上述NE构成开发博弈唯一的SPNE
“A开发，B不开发”成为开发博弈唯一合理的均衡结果

小结：SPNE 与 NE 的关系

SPNE是NE在完美信息博弈中的精练(refinement)解概念(引入参与人行动的先后顺序)
SPNE一定是NE
但NE不一定都是SPNE

逆向归纳法 backward induction

一种求解 SPNE 的简便方法

以开发博弈为例

首先在从最后一个决策结开始的子博弈中寻找该博弈中的NE
只有B决策的单人博弈B1和B2
B1:已知A选择开发，B的最优选择是不开发(开发的支付-3低于不开发的支付 0)
剔除不可置信的战略开发
B2:已知A选择不开发，B的最优选择是开发(开发的支付1高于不开发的支付0)
剔除不可置信的战略不开发
在博弈进入B的决策阶段，B的最优行动规则: (不开发，开发)
含义:如果A在第一阶段选择开发，B在第二阶段选择不开发;如果A在第一阶段选择不开发，B在第二阶段选择开发
一个新的博弈:第二阶段单人博弈的均衡战略和初始结A的行动共同构成
只有开发商A在决策
A在第一阶段的最优战略:开发(A选择开发的支付1高于选择不开发的支付0)
A在第一阶段理性预期到B在第二阶段的最优战略，A第一阶段的最优选择是开发

开发博弈的扩展式表述及其SPNE结果

#决策论与博弈论