TCS Lec10总结

第一部分:NL = coNL (Immerman-Szelepcsényi 定理)

目标:证明非确定性对数空间类 NL 在补集下封闭(即 NL = coNL)。
核心策略:证明问题 NOPATH(给定图 GG 和两点 s,ts, t,判断是否存在路径从 sstt)属于 NL。

关键步骤

  1. 定义关键函数
    • path(G, s, t):判断是否存在 sts \to t 路径。
    • rdr_d:从 ss 出发、长度不超过 dd 的可达节点数量。
  2. 引理 1:若存在 NL 机器计算 path,则存在 NL 机器计算 rr(总可达节点数)。
    • 证明思路:通过遍历所有节点,用 path 检查可达性并计数。
  3. 引理 2:若存在 NL 机器计算 rdr_d,则存在 NL 机器计算 path_{d+1}(路径长度 d+1\leq d+1)。
    • 证明思路:利用 rdr_d 和迭代过程验证路径存在性。
  4. 迭代计算 rdr_d
    • 初始化 r0=1r_0 = 1(仅 ss 可达)。
    • 用 NL 机器从 rdr_d 计算 rd+1r_{d+1}:检查节点是否与 RdR_d(长度 d\leq d 的可达集)中的节点有边。
  5. 最终 NTM 设计
    • 计算 rnr_n(所有可达节点数)。
    • path_n(G, s, t) = No 则接受(即无路径),否则拒绝。

结论NOPATH ∈ NL,从而 NL = coNL。

第二部分:概率论基础

1. 历史背景

  • 起源于赌博问题(如 de Méré 问题:掷骰子出现至少一个 6 的概率)。
  • 未完成赌局问题:Pascal 和 Fermat 的通信推动概率论早期发展。

2. 基本概念

  • 样本空间 SS:有限集合(如 nn 枚硬币的 outcomes S={0,1}nS = \{0,1\}^n)。
  • 事件 ASA \subseteq S:子集,概率定义为 Pr(A)=xAPr(x)\Pr(A) = \sum_{x \in A} \Pr(x)
  • 概率公理
    • Pr(x)[0,1]\Pr(x) \in [0,1],且 xSPr(x)=1\sum_{x \in S} \Pr(x) = 1
    • ABA \subseteq B,则 Pr(A)Pr(B)\Pr(A) \leq \Pr(B)
  • 并集概率Pr(AB)=Pr(A)+Pr(B)Pr(AB)\Pr(A \cup B) = \Pr(A) + \Pr(B) - \Pr(A \cap B)
  • Union Bound(关键工具)

    Pr(j=1mAj)j=1mPr(Aj).\Pr\left( \bigcup_{j=1}^m A_j \right) \leq \sum_{j=1}^m \Pr(A_j).

3. 条件概率与独立性

  • 条件概率Pr(BA)=Pr(AB)Pr(A)\Pr(B|A) = \frac{\Pr(A \cap B)}{\Pr(A)}(以 AA 为新样本空间)。
  • 链式法则

    Pr(ABC)=Pr(A)Pr(BA)Pr(CAB).\Pr(A \cap B \cap C) = \Pr(A) \cdot \Pr(B|A) \cdot \Pr(C|A \cap B).

  • 独立性Pr(AB)=Pr(A)Pr(B)\Pr(A \cap B) = \Pr(A)\Pr(B),等价于 Pr(BA)=Pr(B)\Pr(B|A) = \Pr(B)(当 Pr(A)>0\Pr(A) > 0)。

4. 经典问题

  • 生日悖论
    • mm 人在 N=365N=365 天的生日均不同的概率:

      Pr(no collision)=k=1m1(1kN)em(m1)/(2N).\Pr(\text{no collision}) = \prod_{k=1}^{m-1} \left(1 - \frac{k}{N}\right) \approx e^{-m(m-1)/(2N)}.

    • m23m \approx 23 时,概率降至 50%\sim 50\%
  • 应用:密码学中的生日攻击(如寻找 SHA-1 哈希碰撞,N=2160N=2^{160})。

第三部分:随机变量与期望

1. 随机变量(RV)

  • 函数 X:SRX: S \to \mathbb{R}(如硬币翻转的汉明权重 X(x)=xiX(x) = \sum x_i)。
  • 期望E(X)=xPr(x)X(x)\mathbb{E}(X) = \sum_{x} \Pr(x) X(x)
  • 线性期望(核心工具)

    E(jXj)=jE(Xj).\mathbb{E}\left( \sum_j X_j \right) = \sum_j \mathbb{E}(X_j).

  • 独立 RV 的乘积期望E(jXj)=jE(Xj)\mathbb{E}\left( \prod_j X_j \right) = \prod_j \mathbb{E}(X_j)(要求独立性)。

2. 经典分布

分布 描述 期望 方差
二项分布 nn 次伯努利试验成功次数 npnp np(1p)np(1-p)
几何分布 首次成功所需试验次数 1p\frac{1}{p} 1pp2\frac{1-p}{p^2}
高斯分布 概率密度 ϕ(x)=12πex2/2\phi(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2} 旋转不变性

3. 赠券收集问题

  • 目标:集齐 nn 种赠券所需抽取次数的期望。
  • 分解X=i=1nXiX = \sum_{i=1}^n X_i,其中 XiGeometric(1i1n)X_i \sim \text{Geometric}\left(1 - \frac{i-1}{n}\right)
  • 期望E(X)=nk=1n1k=nHnnlnn\mathbb{E}(X) = n \sum_{k=1}^n \frac{1}{k} = nH_n \approx n \ln nHnH_n 为调和数)。

第四部分:集中不等式(Tail Bounds)

1. Markov 不等式

  • 对非负 RV XXPr(Xt)E(X)t\Pr(X \geq t) \leq \frac{\mathbb{E}(X)}{t}
    应用:赠券收集问题中 Pr(X100nHn)0.01\Pr(X \geq 100nH_n) \leq 0.01

2. Chebyshev 不等式

  • 依赖方差:Pr(Xμt)Var(X)t2\Pr(|X - \mu| \geq t) \leq \frac{\text{Var}(X)}{t^2}
    适用场景:二阶矩(方差)已知的问题(如两两独立 RV)。

3. Chernoff 界(指数衰减)

  • Hoeffding 界(有界 RV):

    Pr(Xμt)2exp(2t2(biai)2).\Pr(|X - \mu| \geq t) \leq 2 \exp\left(-\frac{2t^2}{\sum (b_i - a_i)^2}\right).

  • 乘性形式(Bernoulli RV):

    Pr(X(1+ε)μ)exp(ε22+εμ).\Pr(X \geq (1+\varepsilon)\mu) \leq \exp\left(-\frac{\varepsilon^2}{2+\varepsilon} \mu\right).

  • 应用:采样估计成功率 pp 时,样本量 n12ε2ln(2/δ)n \geq \frac{1}{2\varepsilon^2} \ln(2/\delta) 可保证误差 ε\leq \varepsilon(置信度 1δ1-\delta)。

第五部分:概率方法

核心思想:用概率证明组合对象的存在性。

  • Ramsey 数下界(Erdős, 1947)
    • 定理:若 (nk)21(k2)<1\binom{n}{k} \cdot 2^{1 - \binom{k}{2}} < 1,则 R(k,k)>nR(k,k) > n
    • 证明:对 KnK_n 随机红蓝染色,用 Union Bound 证无边集 KkK_k 全同色的概率 <1<1,故存在无单色 KkK_k 的染色。

TCS Lec10总结
https://xiao-ao-jiang-hu.github.io/2025/05/28/tcs/tcs-10/
作者
wst
发布于
2025年5月28日
许可协议