TCS Lec11总结

1. 随机算法案例

1.1 随机搜索算法

问题定义：
输入：长度为 $n$ 的二进制串 $x$ ，其中恰有 $n/4$ 个位置为 1。
输出：一个满足 $x_i = 1$ 的位置 $i$ 。
确定性算法：
- 顺序扫描：最坏情况（如 $x = 0^{3n/4}1^{n/4}$ ) 时间复杂度 $\Omega(n)$ 。
随机算法：
- 重复采样随机位置 $i \sim \text{Unif}([n])$ ，直到找到 1。
- 分析：
  - 单次成功概率 $p = 1/4$ 。
  - 运行时间服从几何分布，期望值 $\mathbb{E}[T] = 1/p = 4 = O(1)$ 。
- 关键结论：对任意输入，期望时间复杂度为 $O(1)$ 。

1.2 矩阵乘法验证（Freivalds 算法）

问题定义：
给定 $n \times n$ 矩阵 $A, B, C$ ，验证 $AB \overset{?}{=} C$ 。
算法：
重复 $k$ $k$ 次：
1. 生成随机向量 $v \in \{0,1\}^n$ （均匀分布）。
2. 计算 $d = A(Bv) - Cv$ 。
3. 若 $d \neq \vec{0}$ ，输出 “No”。
  若所有迭代通过，输出 “Yes”。
正确性证明：
- 若 $AB = C$ ：恒输出 “Yes”（错误率 $0$ ）。
- 若 $AB \neq C$ $A B \neq = C$ ：设 $D = AB - C \neq 0$ $D = A B - C \neq = 0$ ，存在非零元素 $D_{i,j}$ $D_{i, j}$ 。
  - 分析分量 $d_i = \sum_k D_{i,k}v_k = D_{i,j}v_j + s$ （ $s$ 为其他项和）。
  - 错误条件： $d_i = 0$ 。
    $\Pr(d_i = 0) = \underbrace{\Pr(v_j = 0)}_{1/2} \cdot \Pr(s=0) + \underbrace{\Pr(D_{i,j}v_j = -s)}_{\leq 1/2} \cdot \Pr(s \neq 0) \leq \frac{1}{2}.$
  - 故 $\Pr(\text{输出 "Yes"}) \leq (1/2)^k = 2^{-k}$ 。
复杂度： $O(kn^2)$ （优于直接计算 $O(n^\omega)$ ， $\omega \geq 2.37$ ）。

1.3 MAX-CUT 近似算法

问题定义：
给定图 $G=(V,E)$ ，求最大割（NP-难问题）。
随机算法：
- 为每个顶点随机分配 $0$ 或 $1$ （均匀分布），割边为 $x_u \neq x_v$ 的边。
- 期望割大小：
  $\mathbb{E}[\text{size}] = \sum_{\{u,v\} \in E} \Pr(x_u \neq x_v) = \frac{|E|}{2} \geq \frac{1}{2} \text{OPT}.$
去随机化：
- 成对独立哈希函数：
  在随机算法去随机化（Derandomization）中，成对独立哈希函数族（Pairwise Independent Hash Family）是关键工具。

完全独立性的计算代价过高

在 MAX-CUT 随机算法中，为每个顶点独立随机分配比特（0/1）需要 $n$ 个独立随机比特。
可能赋值方案共 $2^n$ 种（指数级），无法在多项式时间内枚举所有解。
算法只需保证每条边被割的概率为 $1/2$ （即 $\Pr[x_u \neq x_v] = \frac{1}{2}$ )。
但完全独立性要求所有顶点赋值全局独立，计算代价过高。

成对独立性的充分性
- 定义：
  - 函数族 $\mathcal{H} = \{ h: U \to R \}$ 是成对独立的，若对任意不同输入 $x_1 \neq x_2 \in U$ 和任意输出 $y_1, y_2 \in R$ ：
    $\Pr_{h \in \mathcal{H}} \left[ h(x_1) = y_1 \land h(x_2) = y_2 \right] = \frac{1}{|R|^2}.$
  - 性质：对任意 $x_1 \neq x_2$ ，事件 $h(x_1) = y_1$ 和 $h(x_2) = y_2$ 相互独立。
- 关键观察：
  - MAX-CUT 的割大小仅依赖边端点的比特差异：
    $\text{size} = \sum_{\{u,v\} \in E} \mathbf{1}_{[h(u) \neq h(v)]}.$
  - 只需保证每条边的割事件（即 $h(u) \neq h(v)$ ）概率为 $1/2$ ，且边间两两独立（无需全局独立）。
高效构造与多项式大小
- 构造方法（以顶点集 $V$ $V$ 为例）：
  - 设顶点用 $k = \log n$ 位编码（ $U = \{0,1\}^k$ ），输出 $R = \{0,1\}$ 。
  - 定义哈希函数：
    $h_{a,b}(x) = a \cdot x + b \mod 2 \quad (a \in \{0,1\}^k, b \in \{0,1\}).$
  - 函数族大小： $|\mathcal{H}| = 2^{k+1} = 2n = O(n)$ （多项式级）。
- 成对独立性证明：
  - 固定 $x_1 \neq x_2$ ，需证 $\forall y_1, y_2 \in \{0,1\}$ ：
    $\Pr_{a,b} \left[ a \cdot x_1 + b = y_1 \land a \cdot x_2 + b = y_2 \right] = \frac{1}{4}.$
  - 方程组：
    $\begin{cases} a \cdot x_1 + b = y_1 \\ a \cdot x_2 + b = y_2 \end{cases} \implies a \cdot (x_1 - x_2) = y_1 - y_2 \pmod{2}.$
  - 因 $x_1 \neq x_2$ ，存在坐标 $i$ 使得 $x_{1,i} \neq x_{2,i}$ 。
    对固定 $a$ 的其他分量， $a_i$ 有唯一解满足方程（概率 $1/2$ ），且 $b$ 由 $a$ 唯一确定（概率 $1$ ）。
    故联合概率为 $\frac{1}{2} \times \frac{1}{2} = \frac{1}{4}$ 。
去随机化的实现
- 算法步骤：
  1. 枚举所有 $h_{a,b} \in \mathcal{H}$ （共 $2n$ 个函数）。
  2. 对每个 $h_{a,b}$ ，计算割大小 $\text{size}_{a,b} = \sum_{\{u,v\} \in E} \mathbf{1}_{[h_{a,b}(u) \neq h_{a,b}(v)]}$ 。
  3. 输出最大割。
- 正确性保证：
  - 对每条边 $\{u,v\}$ ：
    $\Pr_{h \in \mathcal{H}} \left[ h(u) \neq h(v) \right] = \frac{1}{2} \quad (\text{由成对独立性导出}).$
  - 期望割大小：
    $\mathbb{E}[\text{size}] = \sum_{\{u,v\} \in E} \frac{1}{2} = \frac{|E|}{2}.$
  - 存在性：期望为 $|E|/2$ → 必存在某个 $h_{a,b}$ 满足 $\text{size}_{a,b} \geq \frac{|E|}{2}$ 。
- 复杂度优势：
  - 时间： $O(n) \times O(|E|) = O(n^3)$ （多项式时间）。
  - 空间：每个顶点赋值仅依赖 $a, b$ 和自身标签，可并行计算。

为什么更弱独立性足够？——本质原因
随机算法的去随机化常依赖以下事实：

目标函数为线性（如割大小是边割事件的线性组合）。
期望的线性性（Linearity of Expectation）：
$\mathbb{E}\left[\sum_{\{u,v\} \in E} \mathbf{1}_{\text{cut}}\right] = \sum_{\{u,v\} \in E} \mathbb{E}[\mathbf{1}_{\text{cut}}].$
期望计算仅需边缘概率：
- 对每条边 $e$ ，只需 $\Pr[\text{割 } e] = \frac{1}{2}$ 。
- 无需高阶联合事件概率（如三条边同时被割的概率）。

→ 成对独立性已足够保证边缘概率正确，且能高效构造。

1.4 素性测试

Fermat 测试：
- 依据：若 $n$ 质数，则 $\forall a: a^n \equiv a \pmod{n}$ 。
- 缺陷：Carmichael 数（如 $561$ ) 满足条件但为合数。
Rabin-Miller 算法：
- 步骤：对 $n=2^k q+1$ ，检查序列 $a^q, a^{2q}, \dots, a^{2^k q} \pmod{n}$ 是否以 $1$ 结尾且前驱为 $-1$ 。
- 错误率：若 $n$ 合数， $\Pr(\text{通过}) \leq 1/4$ （Rabin 证明）。
AKS 算法 (2002)：
确定性多项式时间算法（但随机算法更高效）。

2. BPP 类：定义与性质

2.1 基本定义

概率图灵机：
非确定性图灵机，每步有两个随机选择（概率 $1/2$ ），路径概率为 $2^{-\text{随机步数}}$ 。
BPP 类：
语言 $L \in \text{BPP}$ 当且仅当存在多项式时间概率图灵机 $M$ 满足：
$\begin{cases} x \in L & \implies \Pr[M \text{ accepts } x] \geq 2/3, \\ x \notin L & \implies \Pr[M \text{ accepts } x] \leq 1/3. \end{cases}$
等价定义：存在多项式时间验证器 $V$ 使得
$x \in L \iff \Pr_{r \in \{0,1\}^{p(|x|)}} [V(x,r) = 1] \geq 2/3.$

2.2 误差缩减

定理：对任意 $L \in \text{BPP}$ 和多项式 $q$ ，存在概率机 $M'$ 在时间 $\text{poly}(n)$ 内以错误率 $\leq 2^{-q(n)}$ 判定 $L$ 。
证明：
- 独立运行原算法 $k = O(q(n))$ 次，取多数结果。
- 由 Chernoff 界，错误概率 $\leq e^{-c k} \leq 2^{-q(n)}$ （ $c>0$ 为常数）。

2.3 BPP 与电路复杂性（P/poly）

BPP与电路复杂性：详细展开

1. 非均匀计算模型：P/poly类

1.1 电路模型基础

电路定义：
- 由布尔门（AND, OR, NOT）组成的有向无环图
- 输入：n个布尔变量
- 输出：1个布尔值
- 大小：电路中门的数量
有限函数计算：
- 对每个输入长度n，函数 $f_n: \{0,1\}^n \to \{0,1\}$
- $f_n \in \text{SIZE}_n(s)$ 当存在大小≤s的电路计算 $f_n$

1.2 扩展到无限语言

语言 $L \subseteq \{0,1\}^*$ ：
- 对应函数序列 $\{f_n\}$ ，其中 $f_n(x) = L(x)$ 当 $|x| = n$
非均匀复杂度类：
- $L \in \text{SIZE}(T(n))$ 当存在电路族 $\{C_n\}$ 满足：
  $\begin{cases} \forall n, C_n \text{ 计算 } f_n \\ \exists n_0, \forall n \geq n_0, |C_n| \leq T(n) \end{cases}$
P/poly定义：

$\text{P/poly} = \bigcup_{c \in \mathbb{N}} \text{SIZE}(n^c)$

多项式大小电路族计算的语言类

1.3 P与P/poly的关系

特性	P类	P/poly类
计算模型	单一图灵机	电路族（每个输入长度不同电路）
均匀性	是（同一机器处理所有输入）	否（不同尺寸输入用不同电路）
包含关系	$\text{P} \subseteq \text{P/poly}$	$\text{P} \subsetneq \text{P/poly}$
非可计算问题	不包含	包含（如硬编码不可判定问题的答案）

反例说明严格包含：
定义语言：

$L = \{ 1^n \mid \text{第 } n \text{ 个图灵机在空输入上停机} \}$

$L \in \text{P/poly}$ ：对每个n，电路硬编码答案（0或1）
$L \notin \text{RE}$ ：图灵停机问题不可判定 → $L \notin \text{P}$

2. BPP ⊆ P/poly 的证明

2.1 定理核心思想

若 $L \in \text{BPP}$ ，则存在多项式大小电路族计算 $L$ ，证明分三步：

步骤1：误差缩减

设原始BPP算法错误概率 $\epsilon = 1/3$
通过k次独立重复并取多数结果，错误概率降至 $\epsilon' \leq e^{-ck}$ (Chernoff界)
特别取 $k = n+1$ ，则：
$\epsilon' \leq e^{-c(n+1)} < \frac{1}{10} \cdot 2^{-n} \quad (\text{对足够大c})$

步骤2：并集界与存在性

固定输入长度n，记输入空间 $|\{0,1\}^n| = 2^n$
对每个输入x，错误概率：
$\Pr_r[M'(x,r) \neq L(x)] < \delta = \frac{1}{10} \cdot 2^{-n}$
存在性论证：
$\Pr_r[\exists x: M'(x,r) \neq L(x)] \leq \sum_x \Pr_r[M'(x,r) \neq L(x)] < 2^n \cdot \delta = \frac{1}{10} < 1$
⇒ 存在固定随机串 $r^*$ 使得：
$\forall x \in \{0,1\}^n: M'(x, r^*) = L(x)$

步骤3：电路构造

对每个n，硬编码 $r^*$ （长度 $m = \text{poly}(n)$ )
构造电路 $C_n$ $C_{n}$ 模拟 $M'(\cdot, r^*)$ $M^{'} (\cdot, r^{*})$
- 因 $M'$ 是确定性多项式时间算法
- 标准电路模拟：时间 $T(n)$ → 电路大小 $O(T(n)^2)$

3. BPP 与复杂性理论

3.1 Sipser-Gács 定理：P = NP ⇒ P = BPP

目标：证明若 $\text{P} = \text{NP}$ ，则 $\text{BPP} = \text{P}$ 。
证明概要：
1. 误差缩减：设 $L \in \text{BPP}$ $L \in BPP$ ，有验证器 $V$ $V$ ，错误率 $\leq 2^{-m-2}$ $\leq 2^{- m - 2}$ （ $m = |r|$ $m = ∣ r ∣$ ）。
  - 定义集合 $S_x = \{ r \mid V(x,r) = 1 \}$ ：
    $\begin{cases} x \in L & \implies |S_x| \geq (1 - 2^{-m-2}) \cdot 2^m > 2^{m-1}, \\ x \notin L & \implies |S_x| \leq 2^{-2} = 1/4. \end{cases}$
2. 覆盖引理：若 $|S| \geq 2^{m-1}$ $∣ S ∣ \geq 2^{m - 1}$ ，则 $\exists s_1, \dots, s_{2m}$ $\exists s_{1}, \dots, s_{2 m}$ 使得 $\bigcup_{i=1}^{2m} (S \oplus s_i) = \{0,1\}^m$ $⋃_{i = 1}^{2 m} (S \oplus s_{i}) = {0, 1}^{m}$ 。
  - 证明（概率法）：
    - 随机选取 $s_i$ ，对固定 $z \in \{0,1\}^m$ ：
      $\Pr[z \notin S \oplus s_i] = 1 - \frac{|S|}{2^m} \leq \frac{1}{2}.$
    - 故 $\Pr[z \text{ 未被覆盖}] \leq (1/2)^{2m} = 2^{-2m}$ 。
    - 并集界： $\Pr[\exists z \text{ 未被覆盖}] \leq 2^m \cdot 2^{-2m} = 2^{-m} < 1$ 。
3. 量词消去：
  - 定义谓词 $\phi(x; s_1, \dots, s_{2m}) := \forall r\, \exists i: V(x, r \oplus s_i) = 1$ 。
  - 若 $x \in L$ ，则 $\exists s_1, \dots, s_{2m}$ 使 $\phi$ 真。
  - 若 $x \notin L$ ，则 $\forall s_1, \dots, s_{2m}$ ， $\phi$ 假。
  - 因 $\phi$ 是 $\Pi_2$ 公式，且 $\text{P} = \text{NP}$ 可推出多项式时间判定 $\phi$ ，故 $L \in \text{P}$ 。

3.2 硬度与随机性（Impagliazzo-Wigderson 定理）

定理：
若存在 $L \in \text{E} = \text{DTIME}(2^{O(n)})$ 和 $\delta > 0$ ，使得对充分大 $n$ ， $L$ 在 $n$ 位输入的电路复杂度 $\geq 2^{\delta n}$ ，则 $\text{P} = \text{BPP}$ 。
内涵：指数时间问题的电路下界可推导出去随机化。

3.3 BPP 在复杂性谱中的位置

已知包含关系：
$\text{P} \subseteq \text{BPP} \subseteq \begin{cases} \text{P/poly}, \\ \text{EXP} = \text{DTIME}(2^{\text{poly}(n)}). \end{cases}$
开放问题：
1. $\text{BPP} \overset{?}{=} \text{P}$ （广泛认为成立）。
2. $\text{BPP} \overset{?}{=} \text{NEXP}$ （认为不成立，但未证明）。
与 NP 的关系：
- 若 NP-难问题 $\in \text{BPP}$ ，则 $\text{NP} \subseteq \text{BPP}$ 。
- 若 $\text{P} = \text{NP}$ ，则 $\text{P} = \text{BPP}$ （Sipser-Gács 定理）。

可能的世界观：

情形	关系
预期	$\text{P} = \text{BPP} \subsetneq \text{NP} \subseteq \text{EXP}$
BPP 极大	$\text{P} \subsetneq \text{NP} \subseteq \text{BPP} = \text{EXP}$
P 极大	$\text{P} = \text{NP} = \text{BPP} \subsetneq \text{EXP}$

tcs

#tcs

TCS Lec11总结

https://xiao-ao-jiang-hu.github.io/2025/05/28/tcs/tcs-11/

作者

wst

发布于

2025年5月28日

许可协议

TCS Lec12总结上一篇

TCS Lec10总结下一篇