CMSC 5728 Decision Analysis & Game Theory - Lecture 04
- The Cournot Duopoly Model
- Bertrand Model of Duopoly
- The Stackelberg Duopoly Model
- Sequential Bargaining
- Bank Runs
- War of Attrition
The Cournot Duopoly Model
考虑两个公司通过生产商品来进行市场竞争
公司会选择生产多少件商品,比如公司 i 生产 qi 件商品
每件商品的生产成本是 c
我们让两公司总产品量为 Q = q1 + q2
市场价格取决于 Q
这里的 Q0 是市场饱和点,当两公司生产的产品越多,Q 越接近 Q0,那么整体的价格就会下降,P0 大概就是原始市场价格。
公司 i 的 payoff 是
公司1的解决方案
公司1需要针对公司2的所有可能性进行考虑,最好的方式就是最大化 πi (q1, q2)
解得
我们需要通过以下式子检验这是最好的而不是最坏的
还需要检验
总体解决方案
同样地,公司2的解决方案为
一个 pure strategy NE 是 (q1*, q2*),里面是对对方最好的回应策略,所我们需要解决
解得
每个公司的 payoff
与垄断对比
在垄断的情况下,payoff 是
解得
因为 qm < 2qc*,每一个产品的价格在垄断里面会高于有竞争的市场,说明竞争对顾客有利
与 cartel 对比
假设两家公司组成 cartel 并且同意以 q1 = q2 = qm* / 2 的价格生产,那么 payoff 就是
高于 Cournot 的 payoff,并且顾客的价格与垄断市场相同
这个结论是不稳定的,因为 cartel 最好的对策是
我们不是说 cartel 是不可能的,只是说 cartel 在 cournot 模型下不会发生
Bertrand Model of Duopoly
考虑一个不同的案例,公司1跟公司2生产的产品选择不同的价格
顾客对公司1的需求量为
这里 a 就是随便一个数。b 保证这两个 price 的变化和 demand 的需求变化不是1比1。
假设生产产品没有固定的成本,边际成本固定为 c,c < a
两个公司同时行动
公司 i 的收益函数为
对于每个公司 i,(p1*, p2*) 是一个 NE,pi* 解得
对公司 i 的优化解决方案是
求解两个等式,解得
案例
背景
两家公司生产同一件产品,每家生产的边际成本都为 c,每个公司 i 需要选择销售价格 pi ∈ [0, 1]。假设需求曲线是线性的,即 Q(p) = 1 - p,其中 p = min(p1, p2)。换句话说,如果公司设定不一样的价格,那么所有的消费者都是从价格最低的公司那里购买商品。如果两家公司的价格相等,那么它们就会平分市场。我们令 qi 为对公司 i 的需求,那么可以表示为
假设两家公司都是理性的并且它们都想要最大化利益。公司 i 的获利表示为
最优反应分析
如果公司 j 选择价格 pj,那么公司 i 的最优价格?
- 如果公司 i 选择价格 pi = pj,那么它们平分市场
- 如果公司 i 的价格略低于 pj,那么它将得到整个市场
- 如果 pj > c,使得公司 i 能够以略低于 pj 的价格得到正利润,并以此价格独享全部市场
- 如果 Pj = c,那么公司 i 就会选择 pi = pj,因为如果 pi 再小的话就会是负利润,再大的话也会失去市场
- 如果 pj < c,那么公司 i 就会选择比 pj 高的价格,以保证没有顾客
纳什均衡点为 (c, c)
The Stackelberg Duopoly Model
- 与 Cournot model 类似,有两家公司,每家公司确定产量和相同的市场价格
- 然而,有一个决定顺序:公司1先决定然后到公司2。我们假设每个公司想要最大化它的收益
解决方案
- 我们首先用反向归纳法,通过针对 q1 每个可能值,找到公司2的最佳响应 q2(q1),来找到子博弈完美 NE。
- 假设公司1知道公司2的最佳响应,我们找到公司1的最佳响应 q1(q2),从而找到这个游戏的 NE
公司2 的收益
通过求解下面的式子可以找到对 q1 选择的最佳响应
解得
公司1基于 q2(q1) 的最佳响应选择 q1,公司1的 payoff
通过
可以找到公司1 最大化它的收益在
NE 是
Note
先选择的优势:因为 q1* > q2*,这意味着
在 Stackbelberg duopoly 下,商品的价格比 Cournot duopoly 低。
Sequential Bargaining
- 在第一阶段,P1 建议占用资源的 s1,将 1 - s1 留给 P2。
- P2 接受(游戏结束)或拒绝(游戏继续)。
- 在第二阶段,P2 建议 P1 占用资源的 s2,将 1- s2 留给 P2。
- P1 接受(游戏结束)或拒绝(游戏继续)
- 在第三阶段,P1 接受 s 的资源,P2 接受 1 - s 的资源,0 < s < 1
折扣因子 0 < δ < 1
解决方案
如果到了第二阶段,P1 会选择 s2 或者接受 δs。P1 接受 s2 的条件是 s2 ≥ δs。P2 在第二阶段的考虑就是:
- 接受 1 - δs (通过提供 s2 = δs 给P1)或
- 接受 δ (1 - s) 在第三阶段
因为 1 - δ > δ ( 1 - s),P2 在第二阶段的最优选择是 s2* = δ,此时 P1 会接受。
接着再往上到第一阶段,此时 P1 会面临一个选择,P2 在第一阶段只有下面两种情况才会接受:
- 1 - s1 ≥ δ (1 - s2*) ,或
- s1 ≤ 1 - δ (1 - s2*)
P1 在第一阶段的考虑就是:
- 接受 1 - δ (1 - s2*) = 1 - δ (1 - δs),或
- 接受 δs2* = (s^2)s
因为 1 - δ (1 - δs) > (s^2)s,所以 P1 在第一阶段的最优选择就是 s1* = 1 - δ (1 - δs)
该游戏在第一阶段的解决方案就是 (s1*, 1 - s1*),s1* = 1 - δ (1 - δs)
扩展为无限轮次
- 截断无限轮次为有限轮次,并应用有限轮次中的逻辑
- 如果达到第三阶段的游戏,则与第一阶段开始的游戏相同
- 让 SH 成为收益最高玩家 P1 可以在整个游戏的任何 backwards-induction 结果中实现
让 SH 作为 P1 在第三阶段的 payoff
P1 在第一阶段的 payoff 可以作为一个方程 f(SH)
但是 SH 一直是第一阶段最高可能的 payoff,所以 f(SH) = SH。唯一 s 满足 f(s) = s 的是
解决方案就是,在第一阶段,P1 提供
给 P2,并且 P2 会接受。
Bank Runs
两个投资者各自将存款 D 存入银行
银行投资了一个项目。如果在项目到期前清算,则返回 2r,其中 D > r > D / 2。如果项目成熟,则返回 2R,其中 R > D。
投资者可以在日期 1(项目成熟之前),或日期 2(项目成熟之后)退出。
该游戏的流程:
- 如果两个投资者都在日期 1 提款,每个都收到 r,游戏结束
- 如果只有一个人在日期 1 提款,则该投资者获得 D,另一个人获得 2r - D,游戏结束
- 如果两个人都在日期 2退出,则每个人都收到 R,游戏结束
- 如果只有一个人在日期 2 退出,该投资者获得 2R - D,另一个人获得 D,游戏结束
- 如果两个人均未在日期 2 退出,则银行向每个人返回 R,游戏结束
分析
考虑日期 2,因为 R > D(并且 2R - D > R),”withdraw” strictly dominates “don’t”,我们有一个唯一的 NE,(R, R)。对于日期 1,
因为 r < D(并且 2r - D < r),我们有两个纯策略 NE,且第二个 NE 更优
- both withdraw (r, r)
- both don’t withdraw (R, R)
Tariffs and Imperfect Competition
- 定义两个国家 i = 1, 2,每个国家设定每个产品的关税比例 ti
- 一个公司生产的产品用于国内消费与国外出口
- 顾客可以从国内公司或国外公司购买产品
- 国家 i 的市场清算价格为 P(Q1) = a - Qi,Qi 是国家 i 的市场总量
- 在国家 i 的公司提供 hi(ei) 单位的产品给本地(国外)的市场。i.e. Qi = hi + ej
- 公司 i 的生产成本是 Ci(hi, ei) = c(hi + ei) 并且它支付 tjei 的税给国家 j
分析
首先,政府同时选择税率 t1 跟 t2。公司观察到税率,同时决定 (h1, e1) 与 (h2, e2)。给公司跟政府 payoff:
公司 i 的盈利
政府 i 的盈利
这里的 1/2Qi^2 代表在国家 i 的居民的利益,首先 Qi 代表产品总量,我们需要更多的产品以让价格下降
第二阶段
假设政府选择了 t1 跟 t2,如果 ( h1*, e1*, h2*, e2* ) 是公司 1 和公司 2 的NE,公司 i 需要解决
重新安排分为两个分离的优化
假设 ej* ≤ a - c 并且 hj* ≤ a -c - tj,我们有
解得
第一阶段
在第一阶段,政府 i 的 payoff 是
因为 hi* (ei*) 是 ti (tj) 的一个函数
如果 (t1*, t2*) 是一个 NE,每个政府解
解决该最优问题,我们可以得到
这是一个对每个政府的 dominant strategy
代入 ti*,我们得到
小结
在子博弈完美结果中,每个市场的总数量为 5( a - c ) / 9。但是如果两个政府合作,它们会寻求社会最优点,并解决以下优化问题
解得 t1* = t2* = 0(无税率),并且总数量为 2 (a - c ) / 3。
因此,对于以上游戏,我们有一个唯一 NE,并且是社会效率低下的。
War of Attrition
有两个参与者争夺价值 v 的资源
每个玩家的策略是选择持续时间 ti,其中 ti ∈ [0, 无限]。
三个假设
- 竞赛成本仅与持续时间有关
- 持续时间最长的玩家将获得所有资源
- 每个玩家支付的费用与选择最短持续时间成正比,即,持续时间最短的玩家会在它的持续时间结束后退出,那么另一位玩家赢得了所有的资源,但由于在该持续时间内有竞争力,所以会损失该部分的钱
两位玩家的 payoff:
一个纯策略 NE 是 t1* = v / c 并且 t2* = 0,给定
这是一个 NE 因为对于 P1:
给定
对于 P2:
那么
其他 NE
第二个纯策略 NE 是:t1* = 0 并且 t2* = v / c。给定
与前面的分析类似
混合策略 NE 参考教科书