Tao–Vu · 加性组合学 · 第 7 章 Littlewood–Offord 问题

7.4 逆 Littlewood–Offord 结果Inverse Littlewood–Offord results

本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 定理 / 证明 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。

本节目标前几节做的是正向(direct)问题:先假设步长 \(v=(v_1,\dots,v_n)\) 有某种性质,再推出“随机和落在某一点的概率”很。本节反过来——这就是逆向(inverse)问题:先假设“随机和高度集中在某点”(概率很),反推 \(v\) 必须长成什么结构。结论会是:这些 \(v_i\) 几乎都挤进一个又矮又小的“广义等差级数”(generalized arithmetic progression, GAP)里。
先复习几个记号

从正向到逆向:先看两个“取逆否”的例子

在前几节我们考虑的是正向 Littlewood–Offord 结果:对步长 \(v=(v_1,\dots,v_n)\) 作某些假设,作为结论得到集中概率 \(P\big(X_v^{(\mu)}=x\big)\) 的某种上界。在许多应用中,更有意思的是建立逆向 Littlewood–Offord 结果:假设集中概率有一个下界,并由此推出 \(v\) 的某种结构性质。当然,每个正向结果都可以通过取逆否命题变成一个逆向结果。

例如,由推论 7.13 我们知道:若 \(v_1,\dots,v_n\) 落在一个无挠群 \(Z\) 中,且对某个 \(0<\mu\le1\) 与某个 \(x\in Z\) 有 \[P\big(X_v^{(\mu)}=x\big)\ \ge\ \frac{1}{\sqrt{\mu k}},\] 则 \(v_1,\dots,v_n\) 中至多有 \(O(k)\) 个是非零的。

类似地,由推论 7.16 可见:若 \(v_1,\dots,v_n\) 是正整数,且对某个 \(0<\mu\le1\) 与 \(x\in\mathbb Z\),集中概率 \(P\big(X_v^{(\mu)}=x\big)\) 远大于 \(\mu^{-1/2}n^{-3/2}\),则其中至少有两个 \(v_j\) 相等(事实上容易证明:必有大量的对 \((v_i,v_j)\) 彼此相等)。

怎么读这两个例子它们都是“集中概率大 ⇒ 步长有结构”的雏形:
  1. 第一个:和如果非常爱往某一点跑,那么真正在“搅动”这个和的非零步必然不多(最多 \(O(k)\) 个),其余都是 \(0\)——这是最朴素的“结构”。
  2. 第二个:若全是正整数还能高度集中,那一定出现了重复值。直觉是:互不相同的正整数会让 \(\pm\) 求和散得很开(取值很多),难以集中;要想集中,就得靠重复的值“对消”出同一个数。
这两条只是逆否,结构信息还很弱。下面要做的是给出更强的结构——把 \(v_i\) 直接装进一个小 GAP。

现在我们考虑能给出步长 \(v_1,\dots,v_n\) 更多结构的逆向 Littlewood–Offord 定理。本节的结果可与逆和集估计(inverse sum set estimates)类比:在后者中,我们假设某集合 \(A\) 有较小的倍增常数,并由此推出 \(A\) 的某种结构信息,例如 \(A\) 被包含在一个等差级数之内。为简单起见,我们将聚焦于 \(\mu=1\) 的情形(不过可以借助推论 7.12 或引理 7.14 之类的结果,把它推广到更一般的 \(\mu\))。

动机:广义等差级数让集中概率变大(例 7.19)

让我们从一个 \(\max_x P(X_v^{(1)}=x)\) 很大的例子开始。正是这个例子构成了我们这些结果的主要动机。

例 7.19 设 \(P\) 是 \(Z\) 中一个秩为 \(d\)(常数)、体积为 \(V\) 的对称广义等差级数。设 \(v_1,\dots,v_n\) 是 \(P\) 中(不必互异的)\(n\) 个元素。那么和 \(\sum_{i=1}^n \eta_i v_i\) 取值落在广义等差级数 \(nP\) 之中,而 \(nP\) 的体积为 \(n^d V\)。由鸽笼原理即得 \[\max_x P\big(X_v^{(1)}=x\big)\ \ge\ n^{-d}V^{-1}.\tag{7.6}\]
大级数 \(nP\):体积 \(n^dV\) 小级数 \(P\):体积 \(V\) 所有的和 \(\sum\eta_iv_i\) 都落进 \(nP\); 点数有 \(2^n\) 个, 格子只有 \(n^dV\) 格, 必有一格被砸 \(\ge\) 总数/格数 次
例 7.19 的图像:每个 \(v_i\) 都在小级数 \(P\) 里,\(\pm\) 组合后的和必落在放大 \(n\) 倍的 \(nP\) 里。鸽笼原理:把全部和(共 \(2^n\) 种符号选择)塞进 \(nP\) 的 \(n^dV\) 个格点中,最热门的那一格至少被命中 \(1/(n^dV)\) 的比例,于是得到下界 (7.6)。

上面的例子表明:若 \(v\) 的元素属于一个秩小、体积小的广义等差级数,则 \(P_\mu(v)\) 就大。我们自然希望它的逆命题也成立,即:

本节要支持的猜想若 \(P_\mu(v)\) 大,则 \(v\) 的元素属于一个秩小、体积小的广义等差级数。

下面我们给出几个支持这一论断的结果。先给一个简单但相当弱的结果。

第一步结果:装进一个 \(d\) 维立方体(命题 7.20)

命题 7.20 设 \(v=(v_1,\dots,v_n)\) 是加法群 \(Z\) 中的一个元组,\(Z\) 要么无挠(torsion-free),要么是奇数阶有限群。若对某个 \(x\in Z\) 与某个 \(d\ge0\) 有 \(P\big(X_v^{(1)}=x\big)>2^{-d-1}\),则所有步长 \(v_1,\dots,v_n\) 都被包含在一个 \(d\) 维立方体 \[[-1,1]^d\cdot(w_1,\dots,w_d)=\{m_1w_1+\cdots+m_dw_d:\ m_i\in\{-1,0,1\}\}\] 之中。
证明. 假设结论不成立。则由引理 4.35,\(v\) 必含有一个长度为 \(d+1\) 的非相关子词(dissociated subword)\(w=(w_1,\dots,w_{d+1})\)。通过对那些与 \(w\) 无关的变量取条件,我们得到 \[2^{-d-1}\ <\ P\big(X_v^{(1)}=x\big)\ \le\ \sup_{y\in Z}P\big(X_w^{(1)}=y\big).\] 另一方面,由于 \(w\) 是非相关的,且 \(Z\) 没有 \(2\)-挠(即没有非零元满足 \(2z=0\)),故 \(X_w^{(1)}\) 中所有的(符号)和两两不同,于是 \(P\big(X_w^{(1)}=y\big)\le 2^{-d-1}\)。这就与上式矛盾。
为什么这条证明成立——逐步拆解
  1. 反证起手。假设 \(v\) 装不进任何 \(d\) 维立方体。引理 4.35 翻译成人话:装不进 \(d\) 维立方体,就一定能找出 \(d+1\) 个步长 \(w_1,\dots,w_{d+1}\),它们“互相独立”到极致——任何系数取自 \(\{-1,0,1\}\) 的组合 \(\sum m_i w_i\) 都给出不同的值(这就是“非相关 dissociated”)。
  2. 条件化(conditioning)。把和拆成“和 \(w\) 有关的部分”\(+\)“其余部分”。固定其余部分后,要让总和等于 \(x\),只剩下 \(w\) 那部分要等于某个 \(y\)。所以命中 \(x\) 的概率不超过 \(w\) 那部分命中最热门点 \(y\) 的概率。
  3. 非相关 ⇒ 分得很开。\(w\) 有 \(d+1\) 个元,符号选择共 \(2^{d+1}\) 种。非相关保证这 \(2^{d+1}\) 个和全不相同(这里要用 \(Z\) 无 \(2\)-挠,否则 \(w_i\) 与 \(-w_i\) 可能相等而撞车)。既然 \(2^{d+1}\) 个等可能的结果互不相同,单点概率最多 \(2^{-(d+1)}\)。
  4. 撞出矛盾。于是 \(P(X_v^{(1)}=x)\le 2^{-d-1}\),与假设 \(>2^{-d-1}\) 冲突。所以最初的反设不成立,\(v\) 必能装进 \(d\) 维立方体。
\(w_1\) \(w_2\) \(d=2\) 的立方体 \([-1,1]^2\cdot(w_1,w_2)\) 共 \(3^2=9\) 个格点; 所有步长 \(v_i\) 都落在这 9 个点中。 条件越苛刻(概率门槛越高), 维数 \(d\) 越小,盒子越紧。
\(d=2\) 时立方体 \([-1,1]^2\cdot(w_1,w_2)\) 就是 \(3\times3\) 的格点(系数取 \(-1,0,1\))。命题 7.20 说:集中概率超过 \(2^{-d-1}\) 这个门槛,就能用 \(d\) 个方向 \(w_1,\dots,w_d\) 把全部步长框住。

在实践中,这个命题用处不大,因为立方体的维数 \(d\) 可能相当大(典型情形约为 \(\log n\))。然而,可以通过增大边长降低维数,并允许少量例外的步长 \(v_j\) 落在所得级数之外。

第二步结果:降维、放长、容许少量例外(命题 7.21)

命题 7.21 设 \(Z\) 要么无挠,要么是奇数阶有限群。对任意整数 \(d\ge1\),存在一个正常数 \(\delta_d\),使得下述结论成立。设 \(k\ge2\) 为整数,\(x\in Z\),\(v=(v_1,\dots,v_n)\) 是 \(Z\) 中的元组。则或者 \[P\big(X_v^{(1)}=x\big)\ \le\ \delta_d\,k^{-d},\] 或者存在 \(Z\) 中一个级数 \(P=[-k,k]^{d-1}\cdot(w_1,\dots,w_{d-1})\),使得除至多 \(k^2\) 个例外的下标 \(j\in[1,n]\) 之外,都存在 \(a_0\in[1,k]\) 满足 \(a_0 v_j\in P\)。

注意,推论 7.13(取 \(\mu=1\))可看作本命题 \(d=1\) 的情形,而命题 7.20 可看作 \(k=1\) 的极限情形。当然,应取 \(k<\sqrt n\),以免结论变得空洞。

命题在说什么——直观先行
证明. 称一个元组 \((w_1,\dots,w_r)\) 是 \(k\)-非相关的(\(k\)-dissociated),如果级数 \([-k,k]^r\cdot(w_1,\dots,w_r)\) 是正常的。我们用下述算法构造一个 \(k\)-非相关元组 \((w_1,\dots,w_r)\),其中 \(0\le r\le d\)。

假设我们在某步 \(r\le d-1\) 终止。那么我们得到一个 \(k\)-非相关的 \(r\)-元组 \((w_1,\dots,w_r)\),但使 \((w_1,\dots,w_r,v_j)\) 为 \(k\)-非相关的 \(v_j\) 至多只有 \(k^2\) 个。展开定义,这表明:除至多 \(k^2\) 个 \(v_j\) 之外,都存在 \(a_0\in[1,k]\) 使得 \(a_0 v_j\in Q-Q\),其中 \(Q:=[0,k]^r\cdot(w_1,\dots,w_r)\) 且 \(r\le d-1\)。把若干个“占位”向量添加到 \(w_j\) 中,即得结论。

现在证明:我们确实必定在某步 \(r\le d-1\) 终止。(反证)假设我们到达了第 \(d\) 步。那么我们有一个 \(k\)-非相关元组 \((w_1,\dots,w_d)\),使得 \[P\big(X_v^{(1)}=x\big)\ \le\ P\Big(X^{(1/4d)}_{\,w_1^{k^2}\cdots w_d^{k^2}}=0\Big).\] 令 \(\Gamma\subset\mathbb Z^d\) 为格 \[\Gamma:=\{(m_1,\dots,m_d)\in\mathbb Z^d:\ m_1w_1+\cdots+m_dw_d=0\},\] 则利用独立性可写出 \[P\big(X_v^{(1)}=x\big)\ \le\ P\Big(X^{(1/4d)}_{\,w_1^{k^2}\cdots w_d^{k^2}}=0\Big)\ =\ \sum_{(m_1,\dots,m_d)\in\Gamma}\ \prod_{j=1}^d P\big(X^{(1/4d)}_{1^{k^2}}=m_j\big),\tag{7.8}\] 其中 \(X^{(1/4d)}_{1^{k^2}}=\eta_1+\cdots+\eta_{k^2}\)。

现在使用一个体积装填(volume-packing)论证。一个涉及二项式公式的简单计算(或对参数 \(k^2\) 作归纳)表明:表达式 \(P\big(X^{(1/4d)}_{1^{k^2}}=m\big)\) 关于 \(m\) 是偶函数,且对正的 \(m\) 递减。当 \(|m|\le k\) 时它还是 \(\Theta_d(1/k)\)(这可由斯特林公式 (1.52),或由推论 7.13 及方差、单调性的考量看出)。于是我们有 \[P\big(X^{(1/4d)}_{1^{k^2}}=m\big)\ =\ O_d\!\Big(\frac1k\sum_{m'\in m+(-k/2,\,k/2)}P\big(X^{(1/4d)}_{1^{k^2}}=m'\big)\Big),\] 从而由 (7.8) 得 \[P\big(X_v^{(1)}=x\big)\ \le\ O_d\!\Big(k^{-d}\!\!\sum_{(m_1,\dots,m_d)\in\Gamma}\ \sum_{(m_1',\dots,m_d')\in(m_1,\dots,m_d)+(-k/2,\,k/2)^d}\ \prod_{j=1}^d P\big(X^{(1/4d)}_{1^{k^2}}=m_j'\big)\Big).\] 由于 \((w_1,\dots,w_d)\) 是 \(k\)-非相关的,落在 \(\Gamma\) 中的所有 \((m_1,\dots,m_d)\) 都互不相同,因而它们各自加上 \((-k/2,k/2)^d\) 后所得的小盒子互不重叠。于是我们断定 \[P\big(X_v^{(1)}=x\big)\ \le\ O_d\!\Big(k^{-d}\!\!\sum_{(m_1,\dots,m_d)\in\mathbb Z^d}\ \prod_{j=1}^d P\big(X^{(1/4d)}_{1^{k^2}}=m_j\big)\Big).\] 但由并集界(union bound)有 \[\sum_{(m_1,\dots,m_d)\in\mathbb Z^d}\ \prod_{j=1}^d P\big(X^{(1/4d)}_{1^{k^2}}=m_j\big)\ =\ 1.\] 为完成证明,把命题中的常数 \(\delta_d\) 取为大于 \(O_d(k^{-d})\) 中隐藏常数即可。

把证明的两条主线讲清楚这个证明分两块:先跑一个贪心算法不停往 \((w_1,\dots,w_r)\) 里加向量;再证它不可能跑满 \(d\) 步,否则概率会被压到 \(\le\delta_d k^{-d}\)。
  1. 算法在干嘛?每一步都试图找一个新方向 \(v_j\),让加进来后仍保持 \(k\)-非相关(即新的级数仍“正常”、不塌缩)。只要还能找到 \(\ge k^2\) 个这样的 \(v_j\),就挑一个“最优”的(让目标概率不降)加进去。
  2. 算法停下时(\(r\le d-1\))= 好情形。停下意味着“能扩张方向的 \(v_j\) 不到 \(k^2\) 个”。剩下的绝大多数 \(v_j\) 都不能扩张,这恰恰说明它们(的某个 \(\le k\) 倍)被已有的 \(w_1,\dots,w_r\) 张成的小级数 \(Q-Q\) 捕获——这正是命题要的结构。维数 \(r\le d-1\),正好。
  3. 算法停不下来(跑满 \(d\) 步)= 坏情形,要排除。若真凑齐了 \(d\) 个 \(k\)-非相关方向 \(w_1,\dots,w_d\),把概率展开成在格 \(\Gamma\) 上的求和 (7.8)。
  4. 体积装填的核心一招。单个一维分布 \(P(X^{(1/4d)}_{1^{k^2}}=m)\) 在 \(|m|\le k\) 这段内大小约 \(1/k\),所以一个点的概率 \(\approx\) 把它周围 \(k\) 宽的小区间概率摊平平均。乘到 \(d\) 维,就是把 \(\Gamma\) 上每个点替换成它周围 \(k\times\cdots\times k\) 的小盒。
  5. 不重叠 ⇒ 求和 \(\le1\)。\(k\)-非相关保证 \(\Gamma\) 里的点彼此隔得够远,小盒互不重叠,于是把它们并起来不会超过整个 \(\mathbb Z^d\) 上的总和,而后者由并集界恰等于 \(1\)。多出来的 \(k^{-d}\) 因子就是结论里的 \(\delta_d k^{-d}\)。这与“到达第 \(d\) 步”所隐含的概率大相矛盾,故算法必在 \(r\le d-1\) 处终止。
第0步:\(r=0\),空元组 第1步:能扩张的 \(v_j\) 有几个? (加进去仍 \(k\)-非相关) \(\ge k^2\) 第2步:择优加入 \(r\to r+1\) 回到第1步 \( 若 \(r\le d-1\):得到结构(好情形) 余下 \(v_j\) 的某个 \(\le k\) 倍落入 \(Q-Q\) 若跑满 \(r=d\):体积装填导出矛盾 → 不可能
命题 7.21 证明里的贪心算法。绿色循环不断加入新方向,直到没有足够多(\(\ge k^2\) 个)可扩张的步长为止;终止于 \(r\le d-1\) 时给出结构(红框)。而“跑满 \(d\) 步”被体积装填论证排除(灰框)。
绿点 = 格 \(\Gamma\) 的点 绿盒 = 边长 \(k\) 的小盒 \(k\)-非相关 ⇒ 绿点彼此 \(\ge k\) 远 ⇒ 小盒不重叠 并起来 \(\le\) 全空间总和 \(=1\)
体积装填的几何图像(这里画 \(d=2\))。把 \(\Gamma\) 上每个点的概率“摊”到它周围边长 \(k\) 的小盒里;非相关保证小盒互不重叠,故总和 \(\le1\),于是 \(P(X_v^{(1)}=x)\le O_d(k^{-d})\)。

去掉 \(a_0\):完整的逆 Littlewood–Offord 定理(定理 7.22)

上述命题中的 \(a_0\) 因子有些不尽如人意。多花一些力气,可以去掉这个因子,但代价是把级数稍微放大一些。

定理 7.22(逆 Littlewood–Offord 定理)[366] 设 \(0<\mu<1\),并设 \(\alpha\) 与 \(A\) 是任意正常数。则存在一个常数 \(B=B(\mu,\alpha,A)\),使得下述结论成立。假设 \(v=(v_1,\dots,v_n)\) 是一个由有理数组成的元组,满足 \(\max_x P\big(X_v^{\mu}=x\big)\ge n^{-A}\)。则存在一个由有理数组成、秩至多为 \(B\)、体积至多为 \(n^B\) 的广义等差级数 \(P\),它包含 \(v\) 中除至多 \(B n^\alpha\) 个元素以外的全部元素。

定理 7.22 的证明颇为冗长,但它是命题 7.21 证明的一个改良。详情见 [366]。

和命题 7.21 的差别

相对 Halász 不等式的逆定理(定理 7.23)

对相对 Halász 不等式(引理 7.14),在 [365] 中也得到了一个精神类似的逆定理:

定理 7.23(逆 Halász 不等式)[365] 设 \(Z\) 要么无挠,要么是奇素数阶循环群。设 \(v=(v_1,\dots,v_n)\) 是 \(Z\) 中的元组,并设 \(\varepsilon_0>\varepsilon_1>0\) 满足 \[P\big(X_v^{(1)}=0\big)\ \ge\ \varepsilon_1\,P\big(X_v^{(1/4-\varepsilon_0/100)}=0\big)\] 以及 \[P\big(X_v^{(1)}=0\big)\ \ge\ \Big(\tfrac34+2\varepsilon_0\Big)^{n}.\] 则存在一个正常的级数 \(P\),其秩为 \(O_{\varepsilon_0,\varepsilon_1}(1)\)、体积为 \(O_{\varepsilon_0,\varepsilon_1}\!\Big(\dfrac{1}{P\big(X_v^{(1)}=0\big)}\Big)\),且包含 \(v_1,\dots,v_n\)。

事实上,还得到了一些额外的结构信息,即:\(v_1,\dots,v_n\) 大部分被包含在级数 \(P\) 的“”(core)之中,并且……

两个条件各管什么 (原文此处转入更精细的“核”结构讨论,本节摘录至此。)

返回 全书目录