Tao–Vu · 加性组合学 · 第 2 章 和集估计

2.6 对称集与不平衡部分和集Symmetry sets and imbalanced partial sum sets

本页为译文 + 讲解合一:黑色正文为忠实翻译;彩色框(目标 / 定义 / 引理 / 定理 / 例 / 分步推演)与配图为帮助理解而加的详解,逐步推演、举例、画图,不用比喻。

本节目标前面的 Balog–Szemerédi–Gowers(BSG)定理只在两个集合 \(A,B\) 大小相近时好用。本节要处理“一边大、一边小”的不平衡情形:当 \(|A|\) 远大于 \(|B|\)、而它们的加性能量 \(\E(A,B)\) 又接近最大可能值时,能否还得到结构信息?答案是:只要肯付出关于比值 \(|A|/|B|\) 的对数式(即 \((|A|/|B|)^\varepsilon\) 形)小损失,仍能得到一个近似群 \(H\),使得 \(A\) 近似是 \(H\) 的若干平移之并、而 \(B\) 近似落在 \(H\) 的单个平移里。为此本节引入对称集 \(\Sym_\alpha(A)\) 这一核心工具。

2.6.0 问题从哪里来

Balog–Szemerédi–Gowers 定理在研究加性能量 \(\E(A,B)\) 接近 \(|A|^{3/2}|B|^{3/2}\) 的两个加性集合 \(A,B\) 时是一件非常强大的工具;然而由 (2.7) 我们看到,这种情形只在 \(|A|\) 与 \(|B|\) 大小相当时才会出现。于是留下一个问题:当 \(|A|\gg|B|\)(比方说)、而 \(\E(A,B)\) 接近由 (2.7) 给出的上界 \(|A||B|^2\) 时,会发生什么?由 (2.8),这个问题有一个特殊子情形,即 \(|A+B|\) 或 \(|A-B|\) 与 \(|A|\) 相当的情形。

为什么“能量大”等价于“和集小” 回忆两条基本不等式(本节反复用到): 于是若 \(|A+B|\approx|A|\)(且 \(|A|\ge|B|\)),则 \(\E(A,B)\gtrsim\dfrac{|A|^2|B|^2}{|A|}=|A||B|^2\),正好顶到上界。这就是为什么“和集 \(|A+B|\) 与 \(|A|\) 相当”是“能量接近最大”的一个特例。

注意,命题 2.2 已经回答了极端情形:当 \(|A+B|=|A|\) 或 \(|A-B|=|A|\)(等价地 \(\E(A,B)=|A||B|^2\);见习题 2.3.22)时的情况。然而 Ruzsa 的一个例子 [297] 表明,当 \(|A|\) 与 \(|B|\) 相差极其悬殊时,情况会变糟(见习题)。

不过,如果我们准备好承受关于比值 \(|A|/|B|\) 的对数型损失(更确切地说,是形如 \((|A|/|B|)^\varepsilon\) 的损失,其中 \(\varepsilon\) 可取得很小),那么就能恢复一套合理的理论。仿照命题 2.2,我们期望:若 \(|A+B|\) 与 \(|A|\) 相当,或 \(\E(A,B)\) 接近 \(|A||B|^2\),则应当存在一个近似群 \(H\),使得 \(A\) 近似是 \(H\) 的若干平移之并,而 \(B\) 近似包含在 \(H\) 的单个平移之中。实现这一点正是本节的主要目标。

目标:找到近似群 \(H\) 大集合 A ≈ H 的许多平移之并 x+H 小集合 B ≈ 落在单个平移里
本节要证明的结构图景(定理 2.35 与推论 2.36):付出 \((|A|/|B|)^\varepsilon\) 的小损失后,大集合 \(A\) 被近似群 \(H\) 的多块平移覆盖,小集合 \(B\) 被压进一块平移 \(x+H\)。

在极端情形 \(|A+B|=|A|\) 或 \(\E(A,B)=|A||B|^2\) 中,近似群 \(H\) 事实上是一个精确的群,并且在命题 2.2 的证明里它被构造为较大集合 \(A\) 的对称群 \(\Sym_1(A)\)。在一般情形下,这个对称群很可能是平凡的(只剩零元)。然而,一个更一般的概念仍然有用。

2.6.1 对称集

定义 2.32(对称集 Symmetry sets)设 \((A,Z)\) 为加性集合。对任意非负实数 \(\alpha\ge0\),定义阈值为 \(\alpha\) 的对称集 \(\Sym_\alpha(A)\subseteq Z\) 为 \[\Sym_\alpha(A):=\{h\in Z:\ |A\cap(A+h)|\ge\alpha|A|\}.\]

注意 \(\Sym_1(A)=\{h\in Z:\ A+h=A\}\) 正是命题 2.2 证明中所用的那个对称群。其他对称集一般不是群,但它们仍然是对称的(即 \(-\Sym_\alpha(A)=\Sym_\alpha(A)\)),并且含有原点;它们还满足嵌套性质:当 \(\alpha\ge\beta\) 时 \(\Sym_\alpha(A)\subseteq\Sym_\beta(A)\)。同样清楚的是,对一切 \(0<\alpha\le1\) 有 \(\Sym_\alpha(A)\subseteq A-A\)。又因为当 \(\alpha>1\) 时 \(\Sym_\alpha(A)\) 为空、当 \(\alpha\le0\) 时它等于整个 \(Z\),所以我们将主要把注意力限制在非平凡区域 \(0<\alpha\le1\)。

例:把定义算到底取 \(A=\{0,1,2,3,4\}\subset\mathbb Z\),\(|A|=5\)。\(h\) 越大,平移 \(A+h\) 与 \(A\) 的重叠越少:
\(h\)0±1±2±3±4其他
\(|A\cap(A+h)|\)543210
门槛 \(\alpha|A|=5\alpha\),只保留计数 \(\ge5\alpha\) 的 \(h\):
  1. \(\alpha=1\):门槛 \(5\),仅 \(h=0\)。\(\Sym_1(A)=\{0\}\)(这里确为群,但很平凡)。
  2. \(\alpha=0.7\):门槛 \(3.5\),需计数 \(\ge4\),即 \(h=0,\pm1\)。\(\Sym_{0.7}(A)=\{-1,0,1\}\)。
  3. \(\alpha=0.5\):门槛 \(2.5\),需计数 \(\ge3\),即 \(h=0,\pm1,\pm2\)。\(\Sym_{0.5}(A)=\{-2,-1,0,1,2\}\)。
随 \(\alpha\) 变小,对称集逐渐变大,且每个都关于 \(0\) 对称、含 \(0\)——这正是“对称、含原点、嵌套”三条性质的具体写照。
-2-1012 \(\Sym_1=\{0\}\) \(\Sym_{0.7}=\{-1,0,1\}\) \(\Sym_{0.5}=\{-2,-1,0,1,2\}\) 阈值 \(\alpha\) 越小,对称集越大(嵌套)
对 \(A=\{0,1,2,3,4\}\):三个对称集层层嵌套 \(\Sym_1\subseteq\Sym_{0.7}\subseteq\Sym_{0.5}\),全都关于原点对称。

对称集的大小与加性能量挂钩

我们现在把这些对称集的大小与加性能量联系起来。由引理 2.9 我们有 \[\E(A,A)=\sum_{h\in A-A}|A\cap(A+h)|^2,\] 于是对任意 \(0<\alpha\le1\),利用粗略界:当 \(h\in\Sym_\alpha(A)\) 时 \(|A\cap(A+h)|\le|A|\)、当 \(h\notin\Sym_\alpha(A)\) 时 \(|A\cap(A+h)|\le\alpha|A|\),我们得到 \[\alpha^2|A|^2\,|\Sym_\alpha(A)|\ \le\ \E(A,A)\ \le\ \alpha^2|A|^2\,|A-A|+|A|^2\,|\Sym_\alpha(A)|,\] 这表明只要能量大,\(\Sym_\alpha(A)\) 就应当大。特别地,由 (2.7) 我们有 \[|\Sym_\alpha(A)|\le|A|/\alpha^2.\tag{2.21}\]

  1. 下界:只保留 \(h\in\Sym_\alpha(A)\) 的那些项,每项 \(|A\cap(A+h)|^2\ge(\alpha|A|)^2=\alpha^2|A|^2\),共 \(|\Sym_\alpha(A)|\) 项,故 \(\E(A,A)\ge\alpha^2|A|^2|\Sym_\alpha(A)|\)。
  2. 上界:把求和拆成“\(h\in\Sym_\alpha\)”与“\(h\notin\Sym_\alpha\)”两部分。前者每项 \(\le|A|^2\),至多 \(|\Sym_\alpha(A)|\) 项;后者每项 \(\le\alpha^2|A|^2\),至多 \(|A-A|\) 项。相加即得。
  3. 得 (2.21):用 \(\E(A,A)\le|A|^3\)(即 (2.7) 取 \(A=B\))配合下界 \(\alpha^2|A|^2|\Sym_\alpha(A)|\le|A|^3\),两边除以 \(\alpha^2|A|^2\)。
用上例验证夹逼仍取 \(A=\{0,1,2,3,4\}\)。先算能量 \(\E(A,A)=\sum_h|A\cap(A+h)|^2=5^2+2(4^2+3^2+2^2+1^2)=25+2\cdot30=85\)(确实 \(\le|A|^3=125\));又 \(|A-A|=9\)。取 \(\alpha=0.5\),\(|\Sym_{0.5}|=5\):
下界 \(\alpha^2|A|^2|\Sym_\alpha|=0.25\cdot25\cdot5=31.25\le 85\) ✓;
上界 \(\alpha^2|A|^2|A-A|+|A|^2|\Sym_\alpha|=0.25\cdot25\cdot9+25\cdot5=56.25+125=181.25\ge85\) ✓。
而 (2.21) 给 \(|\Sym_{0.5}|\le|A|/\alpha^2=5/0.25=20\),确含 \(5\)。

现在设 \(A,B\) 是加性群 \(Z\) 中的加性集合。再次由引理 2.9 我们有 \[\E(A,B)=\sum_{b,b'\in B}|A\cap(A+b-b')|,\] 于是对任意 \(0<\alpha\le1\) 有 \[\E(A,B)\le|B|^2\,\alpha|A|+|A|\cdot\bigl|\{(b,b')\in B:\ b-b'\in\Sym_\alpha(A)\}\bigr|.\] 特别地,如果 \(\E(A,B)\ge2\alpha|A||B|^2\),那么我们便可断定存在一个基数 \(|G|\ge\alpha|B|^2\) 的集合 \(G\subset B\times B\),使得 \[B\overset{G}{-}B\subseteq\Sym_\alpha(A).\tag{2.22}\]

把 (2.22) 推出来
  1. 对每对 \((b,b')\),若差 \(b-b'\notin\Sym_\alpha(A)\),按定义 \(|A\cap(A+b-b')|<\alpha|A|\);这种坏对至多 \(|B|^2\) 个,合计贡献 \(<\alpha|A||B|^2\)。
  2. 故 \(|A|\cdot|\{(b,b'):b-b'\in\Sym_\alpha(A)\}|\ge\E(A,B)-\alpha|A||B|^2\ge2\alpha|A||B|^2-\alpha|A||B|^2=\alpha|A||B|^2\)。
  3. 两边除以 \(|A|\):好对的个数 \(\ge\alpha|B|^2\)。把这些好对取作图 \(G\),则 \(|G|\ge\alpha|B|^2\),而每条边的差 \(b-b'\) 都落在 \(\Sym_\alpha(A)\) 里,即 \(B\overset{G}{-}B\subseteq\Sym_\alpha(A)\)。
这里 \(B\overset{G}{-}B:=\{b-b':(b,b')\in G\}\) 是部分差集:只允许沿图 \(G\) 的边作差。

乍一看,现在似乎可以应用对称版的 Balog–Szemerédi–Gowers 定理了。然而,\(A\) 远大于 \(B\) 这一事实意味着 \(B\overset{G}{-}B\) 可能远大于 \(B\)(把 (2.22) 与 (2.21) 比较:(2.21) 允许对称集大到 \(|A|/\alpha^2\),远超 \(|B|\))。为绕开这一困难,我们需要迭代这个构造,并利用 \(\Sym_\alpha(A)\) “像一个群一样”这一性质。这在 \(\alpha=1\) 时已经很清楚——此时 \(\Sym_1(A)\) 确实是一个真正的群;下面的引理表明,对小于 \(1\) 的 \(\alpha\),这一行为在近似意义下依然保持。

2.6.2 对称集“近似成群”

引理 2.33设 \(A\) 为加性集合。则当 \(\varepsilon,\varepsilon'>0\) 时有 \[\Sym_{1-\varepsilon}(A)+\Sym_{1-\varepsilon'}(A)\subseteq\Sym_{1-\varepsilon-\varepsilon'}(A).\tag{2.23}\] 此外,若 \(0<\alpha\le1\) 且 \(S\subseteq\Sym_\alpha(A)\) 为非空集合,则存在一个集合 \(G\subseteq S\times S\),满足 \[|G|\ge\alpha^2|S|^2/2,\tag{2.24}\] 使得 \[S\overset{G}{-}S\subseteq\Sym_{\alpha^2/2}(A).\tag{2.25}\]

证明. 为验证第一个论断,注意若 \(x\in\Sym_{1-\varepsilon}(A)\) 且 \(y\in\Sym_{1-\varepsilon'}(A)\),则 \[|(A+x)\setminus A|=|A|-|A\cap(A+x)|\le\varepsilon|A|\] 且 \[|(A+x)\setminus(A+x+y)|=|A|-|A\cap(A+y)|\le\varepsilon'|A|,\] 于是 \[|A\cap(A+x+y)|\ge|(A+x)\cap A\cap(A+x+y)|\ge(1-\varepsilon-\varepsilon')|A|,\] 这就证明了 (2.23)。

为什么三重交还剩这么多关键是“扔掉两个小坏块”的计数。集合 \(A+x\) 有 \(|A|\) 个元素;
  1. 要它落进 \(A\):被挡在外面的只有 \((A+x)\setminus A\),至多 \(\varepsilon|A|\) 个(因 \(x\) 几乎是对称)。
  2. 要它再落进 \(A+x+y\):被挡在外面的是 \((A+x)\setminus(A+x+y)\)。把这块整体平移 \(-x\),等于 \(A\setminus(A+y)\),至多 \(\varepsilon'|A|\) 个(因 \(y\) 几乎是对称)。
  3. 从 \(A+x\) 的 \(|A|\) 个元素里至多挖掉这两块,故三重交 \((A+x)\cap A\cap(A+x+y)\) 至少剩 \(|A|-\varepsilon|A|-\varepsilon'|A|=(1-\varepsilon-\varepsilon')|A|\)。而这正是 \(A\cap(A+x+y)\) 的一个子集(去掉了第一个 \(A+x\) 的限制只会更大),所以 \(x+y\) 是阈值 \(1-\varepsilon-\varepsilon'\) 的对称元。
直观结论:两个“几乎对称”的平移叠加,仍然几乎对称,只是误差相加、阈值下降一点点。

现在证明第二个论断。由 \(S\) 的定义,对每个 \(x\in S\),至少存在 \(\alpha|A|\) 个元素 \(a\in A\) 使得 \(a+x\in A\)。对所有 \(x\) 求和便得 \[\sum_{a\in A}|\{x\in S:\ a+x\in A\}|\ge\alpha|A||S|.\] 应用 Cauchy–Schwarz,我们推出 \[\sum_{(x,y)\in S\times S}|\{a\in A:\ a+x,\,a+y\in A\}|=\sum_{a\in A}|\{x\in S:\ a+x\in A\}|^2\ge\alpha^2|A||S|^2.\] 若我们令 \(G\subseteq S\times S\) 为所有满足 \[|\{a\in A:\ a+x,\,a+y\in A\}|\ge\alpha^2|A|/2\] 的对 \((x,y)\),则有 \[|A||G|\ge\sum_{(x,y)\in G}|\{a\in A:a+x,a+y\in A\}|\ge\alpha^2|A||S|^2-\frac{\alpha^2|A|}{2}|S|^2,\] 这给出 (2.24)。又若 \((x,y)\in G\),则由 \(G\) 的定义 \(|A\cap(A+x-y)|\ge\alpha^2|A|/2\),这给出 (2.25)。

第二论断的逻辑链
  1. 平均:每个 \(x\in S\) 都让 \(\ge\alpha|A|\) 个 \(a\) 满足 \(a+x\in A\),交换求和次序得总量 \(\ge\alpha|A||S|\)。
  2. Cauchy–Schwarz 升幂:对每个 \(a\) 记 \(f(a)=|\{x\in S:a+x\in A\}|\)。\(\sum_a f(a)^2\ge(\sum_a f(a))^2/|A|\ge\alpha^2|A||S|^2\)。而 \(\sum_a f(a)^2\) 恰好等于“共同邻居对”的总数 \(\sum_{(x,y)}|\{a:a+x,a+y\in A\}|\)。
  3. 剔除稀疏对:共同邻居少于 \(\alpha^2|A|/2\) 的对至多贡献 \(\tfrac{\alpha^2|A|}{2}|S|^2\);剩下的“稠密对”集合 \(G\) 满足 \(|A||G|\ge\alpha^2|A||S|^2-\tfrac{\alpha^2|A|}{2}|S|^2=\tfrac{\alpha^2|A|}{2}|S|^2\),即 \(|G|\ge\alpha^2|S|^2/2\)。
  4. 稠密 ⇒ 对称:稠密对 \((x,y)\) 有 \(\ge\alpha^2|A|/2\) 个 \(a\) 同时满足 \(a+x,a+y\in A\)。令 \(a'=a+y\),则 \(a'\) 与 \(a'+(x-y)=a+x\) 都在 \(A\) 中,故 \(|A\cap(A+x-y)|\ge\alpha^2|A|/2\),即差 \(x-y\in\Sym_{\alpha^2/2}(A)\)。这正是 (2.25)。
代价记账:阈值从 \(\alpha\) 掉到 \(\alpha^2/2\)——这就是后面定理里递推 \(\alpha_{j+1}=\alpha_j^2/2\) 的来源。

2.6.3 一条技术引理:二进鸽笼

在着手主定理之前,我们需要一条技术性引理,用来把部分差集 \(A\overset{G}{-}A\) 的纤维(fibers)\(\{(a,a')\in G:a-a'=x\}\) 的大小均匀化

引理 2.34(二进鸽笼原理 Dyadic pigeonhole principle)设 \(A\) 为加性集合,\(G\subset A\times A\) 满足 \(|G|\ge\alpha|A|^2\) 且 \(|A\overset{G}{-}A|\le L|A|\),其中 \(0<\alpha<1\),\(L\ge1\)。则存在 \(G\) 的子集 \(G'\),满足 \[|G'|\gtrsim\frac{\alpha}{1+\log\frac1\alpha+\log L}\,|A|^2\] 以及 \[|\{(a,a')\in G':\ a-a'=x\}|\ge\frac{|G'|}{2|A\overset{G}{-}A|}\quad\text{对所有 }x\in A\overset{G'}{-}A.\]

重要的是要注意,对 \(L\) 的依赖仅以对数方式进入。

这条引理在做什么部分差集里,不同的差 \(x\) 出现的次数(纤维大小)可能极不均匀:有的差被很多对 \((a,a')\) 命中,有的只被一两对命中。引理 2.34 说:只要丢掉一小部分边(且只损失一个对数因子),就能挑出一个子图 \(G'\),使得它产生的每一个差都被相当多的对命中(纤维大小有统一下界)。这一“均匀性”是后面把估计逐层传递所必需的。

证明. 令 \(D\) 为所有满足 \[|\{(a,a')\in G:\ a-a'=x\}|\ge\frac{\alpha|A|^2}{2L|A|}=\frac{\alpha|A|}{2L}\] 的 \(x\) 之集合(于是 \(D\) 是“流行差”的集合),并令 \(\tilde G\) 为 \(G\) 中那些 \(a-a'\in D\) 的对 \((a,a')\)。则 \[|G\setminus\tilde G|\le\frac{\alpha}{2L}|A|\cdot|A\overset{G}{-}A|\le\alpha|A|^2/2,\] 因此 \(|\tilde G|\ge\alpha|A|^2/2\)。另一方面,我们有粗略上界 \[|\{(a,a')\in\tilde G:\ a-a'=x\}|\le\sum_{a'\in A}|\{a\in A:\ a=x+a'\}|\le|A|.\] 于是若令 \(M\) 为使得 \(2^{-M}<\frac{\alpha}{2L}\) 成立的最小整数,我们可以把 \(\tilde G\) 分拆为 \(\tilde G=G_1\cup\dots\cup G_M\),其中 \(G_m:=\{(a,a')\in\tilde G:\ a-a'\in D_m\}\),而 \[D_m:=\Bigl\{x\in A\overset{\tilde G}{-}A:\ 2^{-m}|A|<|\{(a,a')\in\tilde G:\ a-a'=x\}|\le2^{-m+1}|A|\Bigr\}.\] 由鸽笼原理,存在 \(1\le m\le M\) 使得 \[|G_m|\ge\frac1M|G|\ge\frac{\alpha}{C\bigl(1+\log\frac1\alpha+\log L\bigr)}|A|^2.\] 由 \(D_m\) 的定义,我们有 \[\frac{|G_m|}{2^{-m+1}|A|}\le|D_m|\le\frac{|G_m|}{2^{-m}|A|};\] 由于 \(D_m=A\overset{G_m}{-}A\),我们因此看到对所有 \(x\in A\overset{G_m}{-}A\) \[|\{(a,a')\in G':\ a-a'=x\}|\ge2^{-m}|A|\ge\frac{|G'|}{2|A\overset{G}{-}A|}.\] 取 \(G':=G_m\),论断随之成立。

把所有差 \(x\) 按纤维大小分进二进层 \(D_m\),挑最肥的一层 纤维大小 \(D_1\) \(D_2\) \(D_m\)★ \(D_{m+1}\) \(D_M\) ★ 这一层包含的 边数最多 (占总数的 \(\ge1/M\))
二进鸽笼:每个差按其纤维大小落在某个 \([2^{-m}|A|,2^{-m+1}|A|]\) 区间 \(D_m\) 里。层数 \(M=O(\log\frac{L}{\alpha})\) 只有对数个,故某一层 \(D_m\) 至少占总边数的 \(1/M\)。在该层内,每个差的纤维大小都在同一个 \(2\) 倍范围里——这就是“均匀化”。

2.6.4 主定理:非对称 BSG

现在我们给出本节的主定理。

定理 2.35(非对称 Balog–Szemerédi–Gowers 定理)设 \(A,B\) 是加性群 \(Z\) 中的加性集合,满足 \(\E(A,B)\ge2\alpha|A||B|^2\) 且 \(|A|\le L|B|\),其中 \(L\ge1\),\(0<\alpha\le1\)。设 \(\varepsilon>0\)。则存在 \(Z\) 中的一个 \(O_\varepsilon(\alpha^{-O_\varepsilon(1)}L^\varepsilon)\)-近似群 \(H\)、\(Z\) 中一个基数为 \(|X|=O_\varepsilon(\alpha^{-O_\varepsilon(1)}L^\varepsilon|A|/|H|)\) 的加性集合 \(X\)(使得 \(|A\cap(X+H)|=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|A|)\)),以及一个 \(x\in Z\),使得 \(|B\cap(x+H)|=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|B|)\)。

反方向观察:若本定理的结论成立,则 \(\E(A,B)=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-O(\varepsilon)}|A||B|^2)\)(见本节末习题 2.6.3)。因此本定理在 \(\alpha\) 的多项式损失以及 \(L^\varepsilon\)(其中 \(\varepsilon\) 可任意小)的意义下是尖锐的;习题 2.6.1 中的例子经改造可以表明这种损失是必要的(习题 2.6.2)。

读定理:每个量在管什么 一句话:把“能量大”翻译成“\(A\) 是 \(H\) 的多块平移、\(B\) 是 \(H\) 的一块平移”,损失只是 \((|A|/|B|)^\varepsilon\)。

证明的主线索

证明. 直接套用定理 2.31 会损失太多个 \(L\) 的幂。诀窍在于:把 \(B\) 嵌入一条不断增长的集合序列 \(B_0,B_1,B_2,\dots\) 中,其中每个 \(B_j\)(粗略地说)是前一个的部分差集,再用鸽笼原理表明在某一阶段比值 \(|B_{j+1}|/|B_j|\) 被 \(L\) 的一个小幂所控制。这样便可以以可接受的损失应用定理 2.31,并由此推出本定理。(这一证法受到 [40] 中类似论证的启发。)

我们转入细节。方便起见,使用 Landau 记号 \(O()\) 与 \(\Omega()\) 的一个变体,它能吸收 \(\alpha\) 与 \(\log L\) 的因子(我们把它们看作相对接近 \(1\))。若 \(X,Y\) 是非负量、\(j\) 是一个参数,我们说 \(X=\tilde O_j(Y)\) 或 \(Y=\tilde\Omega_j(X)\),如果有形如 \[X\le C(j)\,\alpha^{-C(j)}\,Y\,\log^{C(j)}L\] 的估计,其中 \(C(j)>0\) 只依赖于 \(j\)。

令 \(J=J(\varepsilon)\gg1\) 为一待定的大整数。令 \(1>\alpha_1>\dots>\alpha_{J+1}>0\) 为递归定义的序列:\(\alpha_1:=\alpha\) 且 \(\alpha_{j+1}:=\alpha_j^2/2\)(对一切 \(1\le j\le J\))。由归纳法可见 \(\alpha_j=\tilde\Omega_j(1)\)。我们断言可以找到 \(Z\) 中一列加性集合 \(B_0,B_1,\dots,B_J,B_{J+1}\),具有以下性质。

\(B_0=B\) \(B_1\) \(B_j\) \(B_{J+1}\) 部分差集 部分差集 阈值 \(\alpha_1=\alpha\) \(\alpha_2=\alpha_1^2/2\) \(\alpha_j\downarrow\) \(\alpha_{J+1}\) 很小 迭代链:每步取部分差集,集合变大、阈值变小、都仍裹在对称集里
定理 2.35 证明的骨架。每个 \(B_{j+1}\) 是 \(B_j\) 的部分差集(沿图 \(G_j\)),都被裹在对称集 \(\Sym_{\alpha_j}(A)\) 中(性质 2.26);阈值按 \(\alpha_{j+1}=\alpha_j^2/2\) 递减,集合规模在 \(|B|\) 与 \(\alpha_j^{-2}L|B|\) 之间(性质 2.27)。链足够长后,相邻两项的比值必有一处很小。

我们如下构造 \(B_j\)。令 \(B_0:=B\)。由 (2.22) 接着用引理 2.34,我们可以构造 \(G_0\subseteq B_0\times B_0\) 与 \(B_1:=B_0\overset{G_0}{-}B_0\),使之满足 (2.26)、(2.28)、(2.29)、(2.30)。由于 \(B_0\overset{G_0}{-}B_0\) 中的每个元素至多能由 \(G\) 中的一对以 \(|B_0|\) 种方式表示,我们有 \[|B_1|=|B_0\overset{G_0}{-}B_0|\ge|G_0|/|B_0|=\tilde\Omega_j(|B|),\] 这就是 (2.27) 中的下界;上界则由 (2.26) 与 (2.21) 得到。

接下来,归纳地假设对某个 \(1\le j\le J\) 已经选好 \(B_j\subseteq\Sym_{\alpha_j}(A)\)。应用引理 2.33(取 \(S:=B_j\))接着用引理 2.34,并利用 (2.27) 中已得到的基数界以及 \(\alpha_j\) 的构造 \(\alpha_{j+1}:=\alpha_j^2/2\),我们便能找到 \(G_j\subseteq B_j\times B_j\) 与 \(B_{j+1}:=B_j\overset{G_j}{-}B_j\),使之满足 (2.26)、(2.28)、(2.29)、(2.30)。这就闭合了归纳,于是我们能构造出所有 \(0\le j\le J+1\) 的 \(B_j\),并类似地得到所有 \(1\le j\le J\) 的 \(G_j\)。

把递推串起来
  1. (2.22) 提供起点:能量大 ⇒ 部分差集 \(B_0\overset{G_0}{-}B_0\) 落进 \(\Sym_\alpha(A)\)。
  2. 引理 2.33 提供递推:若 \(B_j\subseteq\Sym_{\alpha_j}(A)\),则其部分差集落进 \(\Sym_{\alpha_j^2/2}(A)=\Sym_{\alpha_{j+1}}(A)\),于是 \(B_{j+1}\subseteq\Sym_{\alpha_{j+1}}(A)\),性质 (2.26) 一直保持。
  3. 引理 2.34 提供均匀化:每步都把纤维大小拉齐,保证 (2.30) 那样的逐点下界,使估计能往回传。
  4. 规模被夹住:下界来自 \(|B_{j+1}|\ge|G_j|/|B_j|\)(每个差至多重复 \(|B_j|\) 次);上界来自 \(B_{j+1}\subseteq\Sym_{\alpha_{j+1}}(A)\) 与 (2.21),即 \(|B_{j+1}|\le|A|/\alpha_{j+1}^2\le\alpha_{j+1}^{-2}L|B|\)。这正是 (2.27)。

现在到了关键的一步(它解释了为什么我们要把上述过程迭代如此多次)。由 (2.27) 与鸽笼原理,存在 \(1\le j\le J\) 使得 \[|B_{j+1}|=\tilde O_J\!\left(L^{O(1/J)}|B_j|\right);\] 要点在于我们设法把 \(L\) 替换成了小得多的量 \(L^{O(1/J)}\)。现在若应用 (2.29)、(2.28) 与定理 2.31,我们便能找到一个 \(\tilde O_J(L^{O(1/J)})\)-近似群 \(H\),其基数为 \[|H|=\tilde O_J\!\left(L^{O(1/J)}|B_j|\right)\tag{2.31}\] 以及一个 \(x_j\in Z\),使得 \[|B_j\cap(H+x_j)|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_j|\right)\tag{2.32}\] 其中 \(C_0\) 是某个绝对常数。

“缩小 \(L\)”这一步的算术从 \(B_0=B\) 到 \(B_{J+1}\),每一项的规模都在 \([\,\tilde\Omega(|B|),\ \alpha_j^{-2}L|B|\,]\) 之间,即整条链的总放大倍数至多约 \(L\)(连乘)。把这总放大写成 \(J\) 个相邻比值之积 \[\frac{|B_{J+1}|}{|B_0|}=\prod_{j=0}^{J}\frac{|B_{j+1}|}{|B_j|}\lesssim L\quad(\text{忽略 }\alpha,\log L).\] \(J+1\) 个正因子之积 \(\lesssim L\),则其中至少有一个因子 \(\lesssim L^{1/(J+1)}=L^{O(1/J)}\)。这正是鸽笼:把一个 \(L\) 倍的总放大摊到 \(J\) 步里,必有一步只放大 \(L^{O(1/J)}\) 倍。\(J\) 越大,这一步越温和——只要 \(J\) 足够大,\(L^{O(1/J)}\) 就接近 \(1\),定理 2.31 在这一步的损失便可接受。

把 \(H\) 与 \(B\)、\(A\) 联系起来

剩下的是把 \(H\) 与 \(B\) 以及 \(A\) 联系起来。我们从 \(B\) 开始。由 (2.32) 与 (2.30)(其中 \(j\) 换成 \(j-1\))我们有 \[|\{(b,b')\in G_{j-1}:\ b-b'\in B_j\cap(H+x_j)\}|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|^2\right),\] 于是特别地 \[|\{(b,b')\in B_{j-1}\times B_{j-1}:\ b\in H+x_j+b'\}|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|^2\right).\] 因此由鸽笼原理,存在某个 \(b'\) 使得 \[|\{b\in B_{j-1}:\ b\in H+x_j+b'\}|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|\right).\] 于是若令 \(x_{j-1}:=x_j+b'\),则有 \[|B_{j-1}\cap(H+x_{j-1})|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|\right).\tag{2.33}\]

现在我们对“\(j\) 换成 \(j-1\)、(2.32) 换成 (2.33)”重复这一论证。如此至多迭代 \(J\) 次,我们最终找到一个 \(x=x_0\in Z\),使得 \[|B\cap(H+x)|=\tilde\Omega_J\!\left(L^{-C_0/J}|B|\right),\] 只要 \(J\)(依赖于 \(\varepsilon\))取得足够大,这就给出了对 \(B\) 所需的控制。

为什么能从 \(B_j\) 回退到 \(B\)
  1. \(B_j\) 由 \(B_{j-1}\) 的部分差集得到:\(B_j\) 里的每个 \(x\) 形如 \(b-b'\)(\((b,b')\in G_{j-1}\))。把 (2.32) 里“\(B_j\) 落进 \(H+x_j\)”的那部分元素回拉,得到 \(G_{j-1}\) 中大量满足 \(b-b'\in H+x_j\) 的边,即 \(b\in H+x_j+b'\)。
  2. 对 \(b'\) 用鸽笼:既然这种 \((b,b')\) 对很多,必有某个固定的 \(b'\) 配上很多个 \(b\)。把该 \(b'\) 吸收进平移量,令 \(x_{j-1}=x_j+b'\),就把“\(B_{j-1}\) 的大块落进 \(H+x_{j-1}\)”立了起来。
  3. 逐级下降 \(j\to j-1\to\dots\to0\),每级只掉一个 \(L^{-C_0/J}\) 因子,至多 \(J\) 级,总损失 \(L^{-C_0}\) 一类的可控量,最终落到 \(B_0=B\)。

剩下的是控制 \(A\)。由 (2.32)、(2.31) 与 (2.26),我们有 \[|\{y\in H+x_j:\ y\in\Sym_{\alpha_j}(A)\}|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H|\right),\] 从而由 \(\Sym_{\alpha_j}(A)\) 与 \(\alpha_j\) 的定义 \[|\{(a,y)\in A\times(H+x_j):\ a+y\in A\}|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H||A|\right).\] 我们把它改写为 \[\sum_{x\in x_j+A}|A\cap(H+x)|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H||A|\right).\] 我们因此能找到 \(x_j+A\) 的一个子集 \(X_0\),其基数为 \[|X_0|=\tilde\Omega_J\!\left(L^{-O(1/J)}|A|\right)\tag{2.34}\] 使得 \[|A\cap(H+x)|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H|\right)\quad\text{对所有 }x\in X_0.\]

现在我们使用一个类似于证明 Ruzsa 覆盖引理(引理 2.14)时所用的论证。令 \(X\) 为 \(X_0\) 的一个子集,使得诸集合 \(\{H+x:x\in X\}\) 两两不交,且关于集合包含关系是极大的。则我们有 \[|A\cap(H+X)|=\sum_{x\in X}|A\cap(H+x)|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H||X|\right).\tag{2.35}\] 另一方面,若 \(y\in X_0\),则由 \(X\) 的极大性,存在 \(x\in X\) 使得 \(x+H\) 与 \(y+H\) 相交。换句话说,\(X_0\) 被 \(X+H-H\) 覆盖,因而(由于 \(H\) 是 \(\tilde O(L^{O(1/J)})\)-近似群) \[|X_0|\le|X||H-H|=\tilde O\!\left(|X|L^{O(1/J)}|H|\right).\tag{2.36}\] 合并 (2.34)、(2.35)、(2.36),我们看到 \(X\) 满足所有所需的性质,只要 \(J\) 依赖于 \(\varepsilon\) 取得足够大。

极大不交族 \(\{H+x:x\in X\}\):既不重叠,又把 \(X_0\) 全罩住 H+x₁H+x₂ H+x₃H+x₄ 极大 ⇒ 任何想再加入的 \(H+y\) 必与某个已选块相交 ⇒ \(X_0\subseteq X+H-H\)
Ruzsa 覆盖式论证:选出两两不交的平移块直到无法再加(极大)。不交性给出下界 (2.35)(块数 \(|X|\) 不会太多);极大性给出上界 (2.36)(\(X_0\) 被 \(X+H-H\) 覆盖,块数也不会太少)。两头一夹,\(X\) 既能罩住 \(A\) 的大部分、数量又恰好 \(\approx|A|/|H|\)。

上述定理也可以写成一个类似定理 2.29 的形式:

推论 2.36设 \(A,B\) 是具有共同环绕群的加性集合,满足 \(\E(A,B)\ge2\alpha|A||B|^2\) 且 \(|A|\le L|B|\),其中 \(L\ge1\),\(0<\alpha\le1\)。设 \(\varepsilon>0\)。则存在子集 \(A'\subseteq A\) 与 \(B'\subseteq B\),使得 \[|A'|=\Omega_\varepsilon\!\left(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|A|\right),\] \[|B'|=\Omega_\varepsilon\!\left(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|B|\right),\] \[|A+nB'-mB'|=O_\varepsilon\!\left(\alpha^{-O_\varepsilon(1)}L^{(n+m)\varepsilon}|A|\right)\quad\text{对所有整数 }n,m\ge0.\]

证明. 应用定理 2.35,并令 \(A':=A\cap(X+H)\) 与 \(B':=B\cap(x+H)\)。

推论在说什么定理 2.35 给出了近似群 \(H\);推论 2.36 把它翻译成更易用的“两块大子集 \(A',B'\)”的语言。因为 \(A'\subseteq X+H\) 是 \(H\) 的几块平移、\(B'\subseteq x+H\) 是一块平移,对它们反复作和/差仍困在 \(H\) 的少数几块平移里,所以 \(|A+nB'-mB'|\) 只比 \(|A|\) 大一个 \(L^{(n+m)\varepsilon}\) 因子——每多做一次加减,只付一份 \(L^\varepsilon\) 的小费用。这正是“不平衡部分和集”受控的精确陈述。

由于 (2.8),上述结果对“\(|A+B|\le K|A|\) 且 \(|A|\) 远大于 \(|B|\)”这一情形给出了一些部分结果,不过这些结果相当弱。一旦我们在第 6.5 节发展出 Plünnecke 不等式,就将给出关于该问题的一个更好的结果。

2.6.5 习题

习题
  1. 2.6.1 [297] 设 \(n\) 为一个大整数,令 \(Z:=\mathbb Z^{2n}\)。设 \(A\) 为加性集合 \[A:=\{(x_1,x_2,\dots,x_{2n})\in\mathbb Z^{2n}:\ x_1+\dots+x_{2n}=n;\ x_1,\dots,x_{2n}\ge0\},\] 并令 \(B:=\{e_1,\dots,e_{2n}\}\)。证明 \(|B|=2n\),\(|A|=(27/4)^{n+o(1)}\),\(|A+B|=O(|A|)\),但 \(|A-B|\ge n|A|\)。(你可能会发现 Stirling 公式 (1.52) 有用。)
  2. 2.6.2 改造习题 2.6.1,以表明在定理 2.35 中不能取 \(\varepsilon=0\)。
  3. 2.6.3 设 \(A,B\) 为加性集合,\(\varepsilon>0\)、\(0<\alpha<1\)、\(L\ge1\) 使得定理 2.35 的结论成立。推出 \(\E(A,B)=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-O(\varepsilon)}|A||B|^2)\)。
  4. 2.6.4 设 \(A\) 为加性集合。通过改造引理 2.13 的证明,建立不等式 \[|A-A+n\Sym_\alpha(A)|\le\frac{\delta[A]^{n+1}}{\alpha^n}|A|\] 对所有整数 \(n\ge0\) 与所有 \(0<\alpha<1\) 成立。
  5. 2.6.5 [220] 设 \(A\) 为加性集合,使得 \(A-A\) 不是群。证明存在 \(h\in A-A\) 使得 \(1\le|A\cap(A+h)|\le|A|/2\)。(提示:用反证法,并对某个略大于 \(1/2\) 的 \(\alpha\) 分析 \(\Sym_\alpha(A)\)。)特别地推出:若 \(|A-A|<\tfrac32|A|\),则 \(A-A\) 是群。注意例子 \(A=\{0,1\}\subset\mathbb Z\) 表明常数 \(\tfrac32\) 不能改进;也可以把这个例子做大,例如取 \(\{0,1\}\) 与一个有限群的笛卡尔积。关于 \(A-A\) 的更精细估计,见定理 5.5 与推论 5.6。
  6. 2.6.6 设 \(A,B\) 为具有共同环绕群的加性集合,满足 \(|A+B|\le K|A|\) 且 \(|A|\le L|B|\),其中 \(K,L\ge1\)。设 \(\varepsilon>0\)。证明存在一个 \(O_\varepsilon(K^{O_\varepsilon(1)}L^\varepsilon)\)-近似群 \(H\),使得 \(B\) 包含在 \(H\) 的一个平移中,而 \(A\) 包含在至多 \(O_\varepsilon(K^{O_\varepsilon(1)}L^\varepsilon|A|/|H|)\) 个 \(H\) 的平移中;把这与命题 2.2 比较。(提示:应用定理 2.35 与 Ruzsa 覆盖引理(引理 2.14)。)
  7. 2.6.7 设 \(A\) 为加性集合,\(B\) 为 \(A\) 的子集,满足 \(|B|\ge(1-\varepsilon)|A|\)(\(0<\varepsilon<1\))。证明 \[\Sym_{\alpha/(1-\varepsilon)}(B)\subseteq\Sym_\alpha(A)\subseteq\Sym_{(\alpha-2\varepsilon)/(1-\varepsilon)}(B)\] 对每个 \(\alpha\in\mathbb R\) 成立。

返回 全书目录