TCS Homework 10

10.1

题目

(a) 设 XX 为一个取值于 [0,1][0, 1] 的随机变量。证明若 E(X)=ϵ\mathbb{E}(X) = \epsilon,则

Pr(Xϵ2)ϵ2.\Pr \left( X \geq \frac{\epsilon}{2} \right) \geq \frac{\epsilon}{2}.

(b) 设 X0X \geq 0 为一个随机变量。证明

Pr(X=0)Var(X)(E(X))2.\Pr(X = 0) \leq \frac{\text{Var}(X)}{\left(\mathbb{E}(X)\right)^2}.

解答

(a) 设 X[0,1]X \in [0, 1]E[X]=ϵ\mathbb{E}[X] = \epsilon。我们的目标是证明 Pr(Xϵ2)ϵ2\Pr \left( X \geq \frac{\epsilon}{2} \right) \geq \frac{\epsilon}{2}
假设反证法,即 Pr(Xϵ2)<ϵ2\Pr \left( X \geq \frac{\epsilon}{2} \right) < \frac{\epsilon}{2}。那么:

E[X]=E[XXϵ2]Pr(Xϵ2)+E[XX<ϵ2]Pr(X<ϵ2).\mathbb{E}[X] = \mathbb{E}\left[X \mid X \geq \frac{\epsilon}{2}\right] \Pr\left(X \geq \frac{\epsilon}{2}\right) + \mathbb{E}\left[X \mid X < \frac{\epsilon}{2}\right] \Pr\left(X < \frac{\epsilon}{2}\right).

由于 X1X \leq 1 且在第二项中 X<ϵ2X < \frac{\epsilon}{2},有:

ϵ1ϵ2+ϵ2(1ϵ2).\epsilon \leq 1 \cdot \frac{\epsilon}{2} + \frac{\epsilon}{2} \cdot \left( 1 - \frac{\epsilon}{2} \right).

简化:

ϵϵ2+ϵ2ϵ24    ϵϵϵ24,\epsilon \leq \frac{\epsilon}{2} + \frac{\epsilon}{2} - \frac{\epsilon^2}{4} \implies \epsilon \leq \epsilon - \frac{\epsilon^2}{4},

这导致矛盾(除非 ϵ=0\epsilon = 0)。因此,Pr(Xϵ2)ϵ2\Pr \left( X \geq \frac{\epsilon}{2} \right) \geq \frac{\epsilon}{2}

(b) 对于 X0X \geq 0,证明 Pr(X=0)Var(X)(E[X])2\Pr(X = 0) \leq \frac{\text{Var}(X)}{(\mathbb{E}[X])^2}
使用切比雪夫不等式,令 μ=E[X]\mu = \mathbb{E}[X]

Pr(Xμμ)Var(X)μ2.\Pr(|X - \mu| \geq \mu) \leq \frac{\text{Var}(X)}{\mu^2}.

由于 X0X \geq 0,当 X=0X = 0 时,有 Xμμ|X - \mu| \geq \mu。因此:

Pr(X=0)Pr(Xμμ)Var(X)μ2.\Pr(X = 0) \leq \Pr(|X - \mu| \geq \mu) \leq \frac{\text{Var}(X)}{\mu^2}.

10.2

题目

设 RandomSign(n) 是一个向量分布,其中每个向量包含 nn 个条目,且每个条目独立地以概率 12\frac{1}{2} 选择为 ±1\pm 1。抽取 mm 个向量 v(1),v(2),,v(m)\mathbf{v}^{(1)}, \mathbf{v}^{(2)}, \ldots, \mathbf{v}^{(m)} \sim RandomSign(n)。定义归一化向量 w(i)=v(i)/n\mathbf{w}^{(i)} = \mathbf{v}^{(i)} / \sqrt{n},使得对所有 i=1,2,,mi = 1, 2, \ldots, mw(i)=1\|\mathbf{w}^{(i)}\| = 1。证明以下结论:
(a) 对所有 iji \neq j,内积 w(i),w(j)=kwk(i)wk(j)\left\langle \mathbf{w}^{(i)}, \mathbf{w}^{(j)} \right\rangle = \sum_k \mathbf{w}_k^{(i)} \mathbf{w}_k^{(j)} 以高概率很小。即:

Pr(w(i),w(j)δ)exp(Ω(δ2n)).\Pr\left( \left| \left\langle \mathbf{w}^{(i)}, \mathbf{w}^{(j)} \right\rangle \right| \geq \delta \right) \leq \exp\left(-\Omega(\delta^2 n)\right).

(b) 存在某个 m=exp(Ω(δ2n))m = \exp(\Omega(\delta^2 n)),使得这 mm 个向量以高概率两两近似正交。更精确地:

Pr(w(i),w(j)δ 对所有 ij 成立)0.99.\Pr\left( \left| \left\langle \mathbf{w}^{(i)}, \mathbf{w}^{(j)} \right\rangle \right| \leq \delta \text{ 对所有 } i \neq j \text{ 成立} \right) \geq 0.99.

(注:通过概率方法,这证明了在 Rn\mathbb{R}^n 中存在指数级多的近似正交单位向量,尽管最多只有 nn 个严格正交向量。)

解答

(a) 对于 iji \neq j,考虑 w(i),w(j)=1nk=1nvk(i)vk(j)\left\langle \mathbf{w}^{(i)}, \mathbf{w}^{(j)} \right\rangle = \frac{1}{n} \sum_{k=1}^{n} v_k^{(i)} v_k^{(j)}。每项 vk(i)vk(j)v_k^{(i)} v_k^{(j)}±1\pm 1 且均值为 0。由 Hoeffding 不等式:

Pr(1nk=1nvk(i)vk(j)δ)2exp(δ2n2)=exp(Ω(δ2n)).\Pr\left( \left| \frac{1}{n} \sum_{k=1}^{n} v_k^{(i)} v_k^{(j)} \right| \geq \delta \right) \leq 2 \exp\left(-\frac{\delta^2 n}{2}\right) = \exp\left(-\Omega(\delta^2 n)\right).

(b) 令 m=exp(cδ2n)m = \exp(c \delta^2 n)(其中 c>0c > 0 足够小)。共有 (m2)\binom{m}{2} 个向量对。由联合界:

Pr(ij:w(i),w(j)δ)(m2)exp(Ω(δ2n)).\Pr\left( \exists i \neq j : \left| \left\langle \mathbf{w}^{(i)}, \mathbf{w}^{(j)} \right\rangle \right| \geq \delta \right) \leq \binom{m}{2} \exp(-\Omega(\delta^2 n)).

选择 m=exp(cδ2n)m = \exp(c \delta^2 n),右侧上界化为 exp(2cδ2nΩ(δ2n))\exp(2c \delta^2 n - \Omega(\delta^2 n))。当 cc 足够小时,该上界 0.01\leq 0.01,因此有 Pr(所有向量对满足 w(i),w(j)δ)0.99\Pr(\text{所有向量对满足 } \left| \left\langle \mathbf{w}^{(i)}, \mathbf{w}^{(j)} \right\rangle \right| \leq \delta) \geq 0.99

10.3

题目

随机图分布 RandomGraph(n,p)\text{RandomGraph}(n,p) 表示具有 nn 个顶点的随机图分布,其中对于任意顶点对 u,vu,v,边 {u,v}\{u,v\} 以概率 pp 独立 地被选为图的边。对服从该分布的随机图 GRandomGraph(n,p)G \sim \text{RandomGraph}(n,p),证明以下结论:

(a) 若 p=o(n2/3)p = o(n^{-2/3}),则

limnPr(G 包含一个 4-团)=0.\lim_{n \to \infty} \Pr(G \text{ 包含一个 } 4\text{-团}) = 0.

(b) 若 p=ω(n2/3)p = \omega(n^{-2/3}),则

limnPr(G 不包含 4-团)=0.\lim_{n \to \infty} \Pr(G \text{ 不包含 } 4\text{-团}) = 0.

(提示:使用 10.1 的 a) 部分,并需仔细计算当顶点集 AABB 满足 AB2|A \cap B| \geq 2 时,44-团同时在 AABB 上出现的概率。)

解答

(a) 设 p=o(n2/3)p = o(n^{-2/3})44-团数量的期望为:

E[X]=(n4)p6n424p6=o(1).\mathbb{E}[X] = \binom{n}{4} p^6 \approx \frac{n^4}{24} p^6 = o(1).

由马尔可夫不等式:Pr(X1)E[X]0\Pr(X \geq 1) \leq \mathbb{E}[X] \to 0

(b) 设 A\mathcal{A} 为所有可能的 4-团对应的顶点集(即所有 4-元子集),则:

X=AAIA,X = \sum_{A \in \mathcal{A}} I_A,

其中 IAI_A 是指示变量(当 AA 形成 4-团时为 1,否则为 0)。

  1. 期望计算

    E[X]=(n4)p(42)=(n4)p6n424p6.\mathbb{E}[X] = \binom{n}{4} p^{\binom{4}{2}} = \binom{n}{4} p^6 \approx \frac{n^4}{24} p^6.

    p=ω(n2/3)p = \omega(n^{-2/3}),有 n4p6n^4 p^6 \to \infty,故 E[X]\mathbb{E}[X] \to \infty.

  2. 方差计算

    Var(X)=E[X2](E[X])2=A,BA(E[IAIB]E[IA]E[IB]).\text{Var}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 = \sum_{A,B \in \mathcal{A}} \left( \mathbb{E}[I_A I_B] - \mathbb{E}[I_A] \mathbb{E}[I_B] \right).

    根据 AB=k|A \cap B| = kk=0,1,2,3,4k = 0,1,2,3,4) 分类求和:

    • k=4k=4(相同团)A=BA=B,贡献为 (n4)p6\binom{n}{4} p^6.
    • k=3k=3(共享 3 顶点)
      数量:(n3)(31)(n41)=O(n4)\binom{n}{3} \binom{3}{1} \binom{n-4}{1} = O(n^4)(选 3 个共享顶点,再选 AA 中剩余 1 顶点,最后选 BB 中剩余 1 顶点)。
      概率:E[IAIB]=p9\mathbb{E}[I_A I_B] = p^{9}(因 AB=5|A \cup B| = 5 个顶点,需 (52)=10\binom{5}{2} = 10 条边,但共享的 3-团已固定,实际需新增 3 条边,共 (32)+3+3=9\binom{3}{2} + 3 + 3 = 9 条边)。
      贡献阶:O(n4p9)O(n^4 p^9).
    • k=2k=2(共享 2 顶点)
      数量:(n2)(n22)(n42)=O(n6)\binom{n}{2} \binom{n-2}{2} \binom{n-4}{2} = O(n^6)(选 2 个共享顶点,再选 AA 中剩余 2 顶点,最后选 BB 中剩余 2 顶点)。
      概率:E[IAIB]=p11\mathbb{E}[I_A I_B] = p^{11}(因 AB=6|A \cup B| = 6 个顶点,需 (62)=15\binom{6}{2} = 15 条边,但共享的 2-团贡献 (22)=1\binom{2}{2} = 1 条边,且 AABB 各自剩余部分无公共边,总边数 6+61=116 + 6 - 1 = 11)。
      贡献阶:O(n6p11)O(n^6 p^{11}).
    • k=0,1k=0,1(低阶项)
      数量 O(n7)O(n^7)O(n8)O(n^8),概率 p12p^{12},贡献 o(n6p11)o(n^6 p^{11})(因 p=o(1)p = o(1))。
  3. 主导项分析
    比较各项与 (E[X])2n8p12(\mathbb{E}[X])^2 \approx n^8 p^{12}:

    • k=2k=2 项:O(n6p11)n8p12=O(1n2p)\dfrac{O(n^6 p^{11})}{n^8 p^{12}} = O\left( \dfrac{1}{n^2 p} \right)
    • k=3k=3 项:O(n4p9)n8p12=O(1n4p3)\dfrac{O(n^4 p^9)}{n^8 p^{12}} = O\left( \dfrac{1}{n^4 p^3} \right)
    • k=4k=4 项:(n4)p6n8p12=O(1n4p6)\dfrac{\binom{n}{4} p^6}{n^8 p^{12}} = O\left( \dfrac{1}{n^4 p^6} \right)
    • k=0,1k=0,1 项:o(1n2p)o\left( \dfrac{1}{n^2 p} \right)

    p=ω(n2/3)p = \omega(n^{-2/3}),有 n2pn^2 p \to \infty,故:

    Var(X)(E[X])2=O(1n2p)+o(1n2p)0.\frac{\text{Var}(X)}{(\mathbb{E}[X])^2} = O\left( \frac{1}{n^2 p} \right) + o\left( \frac{1}{n^2 p} \right) \to 0.

  4. 应用概率界
    由问题 1(b) 结论:

    Pr(X=0)Var(X)(E[X])20,\Pr(X = 0) \leq \frac{\text{Var}(X)}{(\mathbb{E}[X])^2} \to 0,

    limnPr(不包含 4-团)=0\lim_{n \to \infty} \Pr(\text{不包含 } 4\text{-团}) = 0.


TCS Homework 10
https://xiao-ao-jiang-hu.github.io/2025/05/31/tcs/tcs-hw-10/
作者
wst
发布于
2025年5月31日
许可协议