10.1
题目
(a) 设 X 为一个取值于 [0,1] 的随机变量。证明若 E(X)=ϵ,则
Pr(X≥2ϵ)≥2ϵ.
(b) 设 X≥0 为一个随机变量。证明
Pr(X=0)≤(E(X))2Var(X).
解答
(a) 设 X∈[0,1] 且 E[X]=ϵ。我们的目标是证明 Pr(X≥2ϵ)≥2ϵ。
假设反证法,即 Pr(X≥2ϵ)<2ϵ。那么:
E[X]=E[X∣X≥2ϵ]Pr(X≥2ϵ)+E[X∣X<2ϵ]Pr(X<2ϵ).
由于 X≤1 且在第二项中 X<2ϵ,有:
ϵ≤1⋅2ϵ+2ϵ⋅(1−2ϵ).
简化:
ϵ≤2ϵ+2ϵ−4ϵ2⟹ϵ≤ϵ−4ϵ2,
这导致矛盾(除非 ϵ=0)。因此,Pr(X≥2ϵ)≥2ϵ。
(b) 对于 X≥0,证明 Pr(X=0)≤(E[X])2Var(X)。
使用切比雪夫不等式,令 μ=E[X]:
Pr(∣X−μ∣≥μ)≤μ2Var(X).
由于 X≥0,当 X=0 时,有 ∣X−μ∣≥μ。因此:
Pr(X=0)≤Pr(∣X−μ∣≥μ)≤μ2Var(X).
10.2
题目
设 RandomSign(n) 是一个向量分布,其中每个向量包含 n 个条目,且每个条目独立地以概率 21 选择为 ±1。抽取 m 个向量 v(1),v(2),…,v(m)∼ RandomSign(n)。定义归一化向量 w(i)=v(i)/n,使得对所有 i=1,2,…,m 有 ∥w(i)∥=1。证明以下结论:
(a) 对所有 i=j,内积 ⟨w(i),w(j)⟩=∑kwk(i)wk(j) 以高概率很小。即:
Pr(∣∣∣⟨w(i),w(j)⟩∣∣∣≥δ)≤exp(−Ω(δ2n)).
(b) 存在某个 m=exp(Ω(δ2n)),使得这 m 个向量以高概率两两近似正交。更精确地:
Pr(∣∣∣⟨w(i),w(j)⟩∣∣∣≤δ 对所有 i=j 成立)≥0.99.
(注:通过概率方法,这证明了在 Rn 中存在指数级多的近似正交单位向量,尽管最多只有 n 个严格正交向量。)
解答
(a) 对于 i=j,考虑 ⟨w(i),w(j)⟩=n1∑k=1nvk(i)vk(j)。每项 vk(i)vk(j) 为 ±1 且均值为 0。由 Hoeffding 不等式:
Pr(∣∣∣∣∣n1k=1∑nvk(i)vk(j)∣∣∣∣∣≥δ)≤2exp(−2δ2n)=exp(−Ω(δ2n)).
(b) 令 m=exp(cδ2n)(其中 c>0 足够小)。共有 (2m) 个向量对。由联合界:
Pr(∃i=j:∣∣∣⟨w(i),w(j)⟩∣∣∣≥δ)≤(2m)exp(−Ω(δ2n)).
选择 m=exp(cδ2n),右侧上界化为 exp(2cδ2n−Ω(δ2n))。当 c 足够小时,该上界 ≤0.01,因此有 Pr(所有向量对满足 ∣∣⟨w(i),w(j)⟩∣∣≤δ)≥0.99。
10.3
题目
设 随机图分布 RandomGraph(n,p) 表示具有 n 个顶点的随机图分布,其中对于任意顶点对 u,v,边 {u,v} 以概率 p 独立 地被选为图的边。对服从该分布的随机图 G∼RandomGraph(n,p),证明以下结论:
(a) 若 p=o(n−2/3),则
n→∞limPr(G 包含一个 4-团)=0.
(b) 若 p=ω(n−2/3),则
n→∞limPr(G 不包含 4-团)=0.
(提示:使用 10.1 的 a) 部分,并需仔细计算当顶点集 A 和 B 满足 ∣A∩B∣≥2 时,4-团同时在 A 和 B 上出现的概率。)
解答
(a) 设 p=o(n−2/3)。4-团数量的期望为:
E[X]=(4n)p6≈24n4p6=o(1).
由马尔可夫不等式:Pr(X≥1)≤E[X]→0。
(b) 设 A 为所有可能的 4-团对应的顶点集(即所有 4-元子集),则:
X=A∈A∑IA,
其中 IA 是指示变量(当 A 形成 4-团时为 1,否则为 0)。
-
期望计算:
E[X]=(4n)p(24)=(4n)p6≈24n4p6.
由 p=ω(n−2/3),有 n4p6→∞,故 E[X]→∞.
-
方差计算:
Var(X)=E[X2]−(E[X])2=A,B∈A∑(E[IAIB]−E[IA]E[IB]).
根据 ∣A∩B∣=k(k=0,1,2,3,4) 分类求和:
- k=4(相同团):A=B,贡献为 (4n)p6.
- k=3(共享 3 顶点):
数量:(3n)(13)(1n−4)=O(n4)(选 3 个共享顶点,再选 A 中剩余 1 顶点,最后选 B 中剩余 1 顶点)。
概率:E[IAIB]=p9(因 ∣A∪B∣=5 个顶点,需 (25)=10 条边,但共享的 3-团已固定,实际需新增 3 条边,共 (23)+3+3=9 条边)。
贡献阶:O(n4p9).
- k=2(共享 2 顶点):
数量:(2n)(2n−2)(2n−4)=O(n6)(选 2 个共享顶点,再选 A 中剩余 2 顶点,最后选 B 中剩余 2 顶点)。
概率:E[IAIB]=p11(因 ∣A∪B∣=6 个顶点,需 (26)=15 条边,但共享的 2-团贡献 (22)=1 条边,且 A 与 B 各自剩余部分无公共边,总边数 6+6−1=11)。
贡献阶:O(n6p11).
- k=0,1(低阶项):
数量 O(n7) 或 O(n8),概率 p12,贡献 o(n6p11)(因 p=o(1))。
-
主导项分析:
比较各项与 (E[X])2≈n8p12:
- k=2 项:n8p12O(n6p11)=O(n2p1)
- k=3 项:n8p12O(n4p9)=O(n4p31)
- k=4 项:n8p12(4n)p6=O(n4p61)
- k=0,1 项:o(n2p1)
由 p=ω(n−2/3),有 n2p→∞,故:
(E[X])2Var(X)=O(n2p1)+o(n2p1)→0.
-
应用概率界:
由问题 1(b) 结论:
Pr(X=0)≤(E[X])2Var(X)→0,
故 limn→∞Pr(不包含 4-团)=0.