2020-11-04课程笔记8 分钟读完 (大约 1128 个字) 0次访问

CMSC 5728 Decision Analysis & Game Theory - Lecture 09

The Chebyshev Inequality

Sub-Gaussian：对于所有 λ ∈ R，一个随机变量 X 是 σ-sub-Gaussian 的话，那么

上述定义是说 X 是有限的并且被所有 λ 所限制
不是所有随机变量都是 σ-sub-Gaussian。例如，如果 X 是 exponential R.V.，它的概率密度函数是，对于 x ≥ 0，我们有
值得重要一提的是，σ-sub-Gaussian 随机变量的尾部衰减至少与平均值为 0 且方差一样的 Gaussian 的尾部衰减一样快，这是限制 sub-Gaussian R.V. 的关键

如果 X 是一个 σ-sub-Gaussian R.V.，那么对于任意 ε ≥ 0，我们有

使用类似的方法，同样也可以获得 left tail probability 的限制，即，P(X ≤ -ε)。通过使用 union bound，P(A ∪ B) ≤ P(A) + P(B)，我们有

现在我们想要 tail probability 很小。此外，我们还要在这个概率中表达 ε，我们令，转换可得。所以我们可以将 two-sided tail 限制为

上面的表达式更有吸引力，因为当 δ 很小时，它表明至少在 1 - δ 的概率，随机变量 X 在以下区间内

如果 X 是 σ-sub-Gaussian R.V.，那么 X 的均值是 E[X] = 0，并且 X 的方差是 V[X] ≤ σ^2

如果 X 是σ-sub-Gaussian R.V.，那么对于任意 c ∈ R，非零 scaled 随机变量 cX 是 |c|σ-sub-Gaussian R.V.

如果 X1 和 X2 是两个独立随机变量，Xi 是 σi-sub-Gaussian (i ∈ {1, 2})，那么 X1 + X2 是

如果 X1, X2, …, Xn 是 IID RVs 并且每个都是σ-sub-Gaussian随机变量，那么 X1 + X2 + ··· + Xn 是

如何联系起 MAB？
考虑仅一个 arm，这个 arm 的收益由 E 建立，比方说，Bernoulli 随机变量的结果为 0（失败）或1（获胜），使得获胜的概率为 μ。我们的目标是估计平均获胜（即 μ）然后我们使用 unbiased estimator 。我们想要通过一些有限的观察来得到
这可以通过以下引理来说明