Tao–Vu · 加性组合学 · 第 2 章和集估计

2.6　对称集与不平衡部分和集Symmetry sets and imbalanced partial sum sets

本页为译文 + 讲解合一：黑色正文为忠实翻译；彩色框（目标 / 定义 / 引理 / 定理 / 例 / 分步推演）与配图为帮助理解而加的详解，逐步推演、举例、画图，不用比喻。

本节目标前面的 Balog–Szemerédi–Gowers（BSG）定理只在两个集合 \(A,B\) 大小相近时好用。本节要处理“一边大、一边小”的不平衡情形：当 \(|A|\) 远大于 \(|B|\)、而它们的加性能量 \(\E(A,B)\) 又接近最大可能值时，能否还得到结构信息？答案是：只要肯付出关于比值 \(|A|/|B|\) 的对数式（即 \((|A|/|B|)^\varepsilon\) 形）小损失，仍能得到一个近似群 \(H\)，使得 \(A\) 近似是 \(H\) 的若干平移之并、而 \(B\) 近似落在 \(H\) 的单个平移里。为此本节引入对称集 \(\Sym_\alpha(A)\) 这一核心工具。

2.6.0　问题从哪里来

Balog–Szemerédi–Gowers 定理在研究加性能量 \(\E(A,B)\) 接近 \(|A|^{3/2}|B|^{3/2}\) 的两个加性集合 \(A,B\) 时是一件非常强大的工具；然而由 (2.7) 我们看到，这种情形只在 \(|A|\) 与 \(|B|\) 大小相当时才会出现。于是留下一个问题：当 \(|A|\gg|B|\)（比方说）、而 \(\E(A,B)\) 接近由 (2.7) 给出的上界 \(|A||B|^2\) 时，会发生什么？由 (2.8)，这个问题有一个特殊子情形，即 \(|A+B|\) 或 \(|A-B|\) 与 \(|A|\) 相当的情形。

为什么“能量大”等价于“和集小” 回忆两条基本不等式（本节反复用到）：

能量上界 (2.7)：对任意 \(A,B\)，\(\E(A,B)\le|A||B|^2\)（当 \(|A|\ge|B|\) 时这是较紧的那个上界；特别地取 \(A=B\) 得 \(\E(A,A)\le|A|^3\)）。直觉：固定一对 \((b,b')\in B\times B\)，方程 \(a-a'=b'-b\) 在 \(A\times A\) 中至多有 \(|A|\) 个解，故四元组总数 \(\le|B|^2|A|\)。
能量下界 (2.8)（来自 Cauchy–Schwarz）：\(\E(A,B)\ge\dfrac{|A|^2|B|^2}{|A+B|}\)，对 \(|A-B|\) 同理。

于是若 \(|A+B|\approx|A|\)（且 \(|A|\ge|B|\)），则 \(\E(A,B)\gtrsim\dfrac{|A|^2|B|^2}{|A|}=|A||B|^2\)，正好顶到上界。这就是为什么“和集 \(|A+B|\) 与 \(|A|\) 相当”是“能量接近最大”的一个特例。

注意，命题 2.2 已经回答了极端情形：当 \(|A+B|=|A|\) 或 \(|A-B|=|A|\)（等价地 \(\E(A,B)=|A||B|^2\)；见习题 2.3.22）时的情况。然而 Ruzsa 的一个例子 [297] 表明，当 \(|A|\) 与 \(|B|\) 相差极其悬殊时，情况会变糟（见习题）。

不过，如果我们准备好承受关于比值 \(|A|/|B|\) 的对数型损失（更确切地说，是形如 \((|A|/|B|)^\varepsilon\) 的损失，其中 \(\varepsilon\) 可取得很小），那么就能恢复一套合理的理论。仿照命题 2.2，我们期望：若 \(|A+B|\) 与 \(|A|\) 相当，或 \(\E(A,B)\) 接近 \(|A||B|^2\)，则应当存在一个近似群 \(H\)，使得 \(A\) 近似是 \(H\) 的若干平移之并，而 \(B\) 近似包含在 \(H\) 的单个平移之中。实现这一点正是本节的主要目标。

本节要证明的结构图景（定理 2.35 与推论 2.36）：付出 \((|A|/|B|)^\varepsilon\) 的小损失后，大集合 \(A\) 被近似群 \(H\) 的多块平移覆盖，小集合 \(B\) 被压进一块平移 \(x+H\)。

在极端情形 \(|A+B|=|A|\) 或 \(\E(A,B)=|A||B|^2\) 中，近似群 \(H\) 事实上是一个精确的群，并且在命题 2.2 的证明里它被构造为较大集合 \(A\) 的对称群 \(\Sym_1(A)\)。在一般情形下，这个对称群很可能是平凡的（只剩零元）。然而，一个更一般的概念仍然有用。

2.6.1　对称集

定义 2.32（对称集 Symmetry sets）设 \((A,Z)\) 为加性集合。对任意非负实数 \(\alpha\ge0\)，定义阈值为 \(\alpha\) 的对称集 \(\Sym_\alpha(A)\subseteq Z\) 为 \[\Sym_\alpha(A):=\{h\in Z:\ |A\cap(A+h)|\ge\alpha|A|\}.\]

注意 \(\Sym_1(A)=\{h\in Z:\ A+h=A\}\) 正是命题 2.2 证明中所用的那个对称群。其他对称集一般不是群，但它们仍然是对称的（即 \(-\Sym_\alpha(A)=\Sym_\alpha(A)\)），并且含有原点；它们还满足嵌套性质：当 \(\alpha\ge\beta\) 时 \(\Sym_\alpha(A)\subseteq\Sym_\beta(A)\)。同样清楚的是，对一切 \(0<\alpha\le1\) 有 \(\Sym_\alpha(A)\subseteq A-A\)。又因为当 \(\alpha>1\) 时 \(\Sym_\alpha(A)\) 为空、当 \(\alpha\le0\) 时它等于整个 \(Z\)，所以我们将主要把注意力限制在非平凡区域 \(0<\alpha\le1\)。

例：把定义算到底取 \(A=\{0,1,2,3,4\}\subset\mathbb Z\)，\(|A|=5\)。\(h\) 越大，平移 \(A+h\) 与 \(A\) 的重叠越少：

\(h\)	0	±1	±2	±3	±4	其他
\(\|A\cap(A+h)\|\)	5	4	3	2	1	0

门槛 \(\alpha|A|=5\alpha\)，只保留计数 \(\ge5\alpha\) 的 \(h\)：

\(\alpha=1\)：门槛 \(5\)，仅 \(h=0\)。\(\Sym_1(A)=\{0\}\)（这里确为群，但很平凡）。
\(\alpha=0.7\)：门槛 \(3.5\)，需计数 \(\ge4\)，即 \(h=0,\pm1\)。\(\Sym_{0.7}(A)=\{-1,0,1\}\)。
\(\alpha=0.5\)：门槛 \(2.5\)，需计数 \(\ge3\)，即 \(h=0,\pm1,\pm2\)。\(\Sym_{0.5}(A)=\{-2,-1,0,1,2\}\)。

随 \(\alpha\) 变小，对称集逐渐变大，且每个都关于 \(0\) 对称、含 \(0\)——这正是“对称、含原点、嵌套”三条性质的具体写照。

对 \(A=\{0,1,2,3,4\}\)：三个对称集层层嵌套 \(\Sym_1\subseteq\Sym_{0.7}\subseteq\Sym_{0.5}\)，全都关于原点对称。

对称集的大小与加性能量挂钩

我们现在把这些对称集的大小与加性能量联系起来。由引理 2.9 我们有 \[\E(A,A)=\sum_{h\in A-A}|A\cap(A+h)|^2,\] 于是对任意 \(0<\alpha\le1\)，利用粗略界：当 \(h\in\Sym_\alpha(A)\) 时 \(|A\cap(A+h)|\le|A|\)、当 \(h\notin\Sym_\alpha(A)\) 时 \(|A\cap(A+h)|\le\alpha|A|\)，我们得到 \[\alpha^2|A|^2\,|\Sym_\alpha(A)|\ \le\ \E(A,A)\ \le\ \alpha^2|A|^2\,|A-A|+|A|^2\,|\Sym_\alpha(A)|,\] 这表明只要能量大，\(\Sym_\alpha(A)\) 就应当大。特别地，由 (2.7) 我们有 \[|\Sym_\alpha(A)|\le|A|/\alpha^2.\tag{2.21}\]

下界：只保留 \(h\in\Sym_\alpha(A)\) 的那些项，每项 \(|A\cap(A+h)|^2\ge(\alpha|A|)^2=\alpha^2|A|^2\)，共 \(|\Sym_\alpha(A)|\) 项，故 \(\E(A,A)\ge\alpha^2|A|^2|\Sym_\alpha(A)|\)。
上界：把求和拆成“\(h\in\Sym_\alpha\)”与“\(h\notin\Sym_\alpha\)”两部分。前者每项 \(\le|A|^2\)，至多 \(|\Sym_\alpha(A)|\) 项；后者每项 \(\le\alpha^2|A|^2\)，至多 \(|A-A|\) 项。相加即得。
得 (2.21)：用 \(\E(A,A)\le|A|^3\)（即 (2.7) 取 \(A=B\)）配合下界 \(\alpha^2|A|^2|\Sym_\alpha(A)|\le|A|^3\)，两边除以 \(\alpha^2|A|^2\)。

用上例验证夹逼仍取 \(A=\{0,1,2,3,4\}\)。先算能量 \(\E(A,A)=\sum_h|A\cap(A+h)|^2=5^2+2(4^2+3^2+2^2+1^2)=25+2\cdot30=85\)（确实 \(\le|A|^3=125\)）；又 \(|A-A|=9\)。取 \(\alpha=0.5\)，\(|\Sym_{0.5}|=5\)：
下界 \(\alpha^2|A|^2|\Sym_\alpha|=0.25\cdot25\cdot5=31.25\le 85\) ✓；
上界 \(\alpha^2|A|^2|A-A|+|A|^2|\Sym_\alpha|=0.25\cdot25\cdot9+25\cdot5=56.25+125=181.25\ge85\) ✓。
而 (2.21) 给 \(|\Sym_{0.5}|\le|A|/\alpha^2=5/0.25=20\)，确含 \(5\)。

现在设 \(A,B\) 是加性群 \(Z\) 中的加性集合。再次由引理 2.9 我们有 \[\E(A,B)=\sum_{b,b'\in B}|A\cap(A+b-b')|,\] 于是对任意 \(0<\alpha\le1\) 有 \[\E(A,B)\le|B|^2\,\alpha|A|+|A|\cdot\bigl|\{(b,b')\in B:\ b-b'\in\Sym_\alpha(A)\}\bigr|.\] 特别地，如果 \(\E(A,B)\ge2\alpha|A||B|^2\)，那么我们便可断定存在一个基数 \(|G|\ge\alpha|B|^2\) 的集合 \(G\subset B\times B\)，使得 \[B\overset{G}{-}B\subseteq\Sym_\alpha(A).\tag{2.22}\]

把 (2.22) 推出来

对每对 \((b,b')\)，若差 \(b-b'\notin\Sym_\alpha(A)\)，按定义 \(|A\cap(A+b-b')|<\alpha|A|\)；这种坏对至多 \(|B|^2\) 个，合计贡献 \(<\alpha|A||B|^2\)。
故 \(|A|\cdot|\{(b,b'):b-b'\in\Sym_\alpha(A)\}|\ge\E(A,B)-\alpha|A||B|^2\ge2\alpha|A||B|^2-\alpha|A||B|^2=\alpha|A||B|^2\)。
两边除以 \(|A|\)：好对的个数 \(\ge\alpha|B|^2\)。把这些好对取作图 \(G\)，则 \(|G|\ge\alpha|B|^2\)，而每条边的差 \(b-b'\) 都落在 \(\Sym_\alpha(A)\) 里，即 \(B\overset{G}{-}B\subseteq\Sym_\alpha(A)\)。

这里 \(B\overset{G}{-}B:=\{b-b':(b,b')\in G\}\) 是部分差集：只允许沿图 \(G\) 的边作差。

乍一看，现在似乎可以应用对称版的 Balog–Szemerédi–Gowers 定理了。然而，\(A\) 远大于 \(B\) 这一事实意味着 \(B\overset{G}{-}B\) 可能远大于 \(B\)（把 (2.22) 与 (2.21) 比较：(2.21) 允许对称集大到 \(|A|/\alpha^2\)，远超 \(|B|\)）。为绕开这一困难，我们需要迭代这个构造，并利用 \(\Sym_\alpha(A)\) “像一个群一样”这一性质。这在 \(\alpha=1\) 时已经很清楚——此时 \(\Sym_1(A)\) 确实是一个真正的群；下面的引理表明，对小于 \(1\) 的 \(\alpha\)，这一行为在近似意义下依然保持。

2.6.2　对称集“近似成群”

引理 2.33设 \(A\) 为加性集合。则当 \(\varepsilon,\varepsilon'>0\) 时有 \[\Sym_{1-\varepsilon}(A)+\Sym_{1-\varepsilon'}(A)\subseteq\Sym_{1-\varepsilon-\varepsilon'}(A).\tag{2.23}\] 此外，若 \(0<\alpha\le1\) 且 \(S\subseteq\Sym_\alpha(A)\) 为非空集合，则存在一个集合 \(G\subseteq S\times S\)，满足 \[|G|\ge\alpha^2|S|^2/2,\tag{2.24}\] 使得 \[S\overset{G}{-}S\subseteq\Sym_{\alpha^2/2}(A).\tag{2.25}\]

证明. 为验证第一个论断，注意若 \(x\in\Sym_{1-\varepsilon}(A)\) 且 \(y\in\Sym_{1-\varepsilon'}(A)\)，则 \[|(A+x)\setminus A|=|A|-|A\cap(A+x)|\le\varepsilon|A|\] 且 \[|(A+x)\setminus(A+x+y)|=|A|-|A\cap(A+y)|\le\varepsilon'|A|,\] 于是 \[|A\cap(A+x+y)|\ge|(A+x)\cap A\cap(A+x+y)|\ge(1-\varepsilon-\varepsilon')|A|,\] 这就证明了 (2.23)。

为什么三重交还剩这么多关键是“扔掉两个小坏块”的计数。集合 \(A+x\) 有 \(|A|\) 个元素；

要它落进 \(A\)：被挡在外面的只有 \((A+x)\setminus A\)，至多 \(\varepsilon|A|\) 个（因 \(x\) 几乎是对称）。
要它再落进 \(A+x+y\)：被挡在外面的是 \((A+x)\setminus(A+x+y)\)。把这块整体平移 \(-x\)，等于 \(A\setminus(A+y)\)，至多 \(\varepsilon'|A|\) 个（因 \(y\) 几乎是对称）。
从 \(A+x\) 的 \(|A|\) 个元素里至多挖掉这两块，故三重交 \((A+x)\cap A\cap(A+x+y)\) 至少剩 \(|A|-\varepsilon|A|-\varepsilon'|A|=(1-\varepsilon-\varepsilon')|A|\)。而这正是 \(A\cap(A+x+y)\) 的一个子集（去掉了第一个 \(A+x\) 的限制只会更大），所以 \(x+y\) 是阈值 \(1-\varepsilon-\varepsilon'\) 的对称元。

直观结论：两个“几乎对称”的平移叠加，仍然几乎对称，只是误差相加、阈值下降一点点。

现在证明第二个论断。由 \(S\) 的定义，对每个 \(x\in S\)，至少存在 \(\alpha|A|\) 个元素 \(a\in A\) 使得 \(a+x\in A\)。对所有 \(x\) 求和便得 \[\sum_{a\in A}|\{x\in S:\ a+x\in A\}|\ge\alpha|A||S|.\] 应用 Cauchy–Schwarz，我们推出 \[\sum_{(x,y)\in S\times S}|\{a\in A:\ a+x,\,a+y\in A\}|=\sum_{a\in A}|\{x\in S:\ a+x\in A\}|^2\ge\alpha^2|A||S|^2.\] 若我们令 \(G\subseteq S\times S\) 为所有满足 \[|\{a\in A:\ a+x,\,a+y\in A\}|\ge\alpha^2|A|/2\] 的对 \((x,y)\)，则有 \[|A||G|\ge\sum_{(x,y)\in G}|\{a\in A:a+x,a+y\in A\}|\ge\alpha^2|A||S|^2-\frac{\alpha^2|A|}{2}|S|^2,\] 这给出 (2.24)。又若 \((x,y)\in G\)，则由 \(G\) 的定义 \(|A\cap(A+x-y)|\ge\alpha^2|A|/2\)，这给出 (2.25)。♦

第二论断的逻辑链

平均：每个 \(x\in S\) 都让 \(\ge\alpha|A|\) 个 \(a\) 满足 \(a+x\in A\)，交换求和次序得总量 \(\ge\alpha|A||S|\)。
Cauchy–Schwarz 升幂：对每个 \(a\) 记 \(f(a)=|\{x\in S:a+x\in A\}|\)。\(\sum_a f(a)^2\ge(\sum_a f(a))^2/|A|\ge\alpha^2|A||S|^2\)。而 \(\sum_a f(a)^2\) 恰好等于“共同邻居对”的总数 \(\sum_{(x,y)}|\{a:a+x,a+y\in A\}|\)。
剔除稀疏对：共同邻居少于 \(\alpha^2|A|/2\) 的对至多贡献 \(\tfrac{\alpha^2|A|}{2}|S|^2\)；剩下的“稠密对”集合 \(G\) 满足 \(|A||G|\ge\alpha^2|A||S|^2-\tfrac{\alpha^2|A|}{2}|S|^2=\tfrac{\alpha^2|A|}{2}|S|^2\)，即 \(|G|\ge\alpha^2|S|^2/2\)。
稠密 ⇒ 对称：稠密对 \((x,y)\) 有 \(\ge\alpha^2|A|/2\) 个 \(a\) 同时满足 \(a+x,a+y\in A\)。令 \(a'=a+y\)，则 \(a'\) 与 \(a'+(x-y)=a+x\) 都在 \(A\) 中，故 \(|A\cap(A+x-y)|\ge\alpha^2|A|/2\)，即差 \(x-y\in\Sym_{\alpha^2/2}(A)\)。这正是 (2.25)。

代价记账：阈值从 \(\alpha\) 掉到 \(\alpha^2/2\)——这就是后面定理里递推 \(\alpha_{j+1}=\alpha_j^2/2\) 的来源。

2.6.3　一条技术引理：二进鸽笼

在着手主定理之前，我们需要一条技术性引理，用来把部分差集 \(A\overset{G}{-}A\) 的纤维（fibers）\(\{(a,a')\in G:a-a'=x\}\) 的大小均匀化。

引理 2.34（二进鸽笼原理 Dyadic pigeonhole principle）设 \(A\) 为加性集合，\(G\subset A\times A\) 满足 \(|G|\ge\alpha|A|^2\) 且 \(|A\overset{G}{-}A|\le L|A|\)，其中 \(0<\alpha<1\)，\(L\ge1\)。则存在 \(G\) 的子集 \(G'\)，满足 \[|G'|\gtrsim\frac{\alpha}{1+\log\frac1\alpha+\log L}\,|A|^2\] 以及 \[|\{(a,a')\in G':\ a-a'=x\}|\ge\frac{|G'|}{2|A\overset{G}{-}A|}\quad\text{对所有 }x\in A\overset{G'}{-}A.\]

重要的是要注意，对 \(L\) 的依赖仅以对数方式进入。

这条引理在做什么部分差集里，不同的差 \(x\) 出现的次数（纤维大小）可能极不均匀：有的差被很多对 \((a,a')\) 命中，有的只被一两对命中。引理 2.34 说：只要丢掉一小部分边（且只损失一个对数因子），就能挑出一个子图 \(G'\)，使得它产生的每一个差都被相当多的对命中（纤维大小有统一下界）。这一“均匀性”是后面把估计逐层传递所必需的。

证明. 令 \(D\) 为所有满足 \[|\{(a,a')\in G:\ a-a'=x\}|\ge\frac{\alpha|A|^2}{2L|A|}=\frac{\alpha|A|}{2L}\] 的 \(x\) 之集合（于是 \(D\) 是“流行差”的集合），并令 \(\tilde G\) 为 \(G\) 中那些 \(a-a'\in D\) 的对 \((a,a')\)。则 \[|G\setminus\tilde G|\le\frac{\alpha}{2L}|A|\cdot|A\overset{G}{-}A|\le\alpha|A|^2/2,\] 因此 \(|\tilde G|\ge\alpha|A|^2/2\)。另一方面，我们有粗略上界 \[|\{(a,a')\in\tilde G:\ a-a'=x\}|\le\sum_{a'\in A}|\{a\in A:\ a=x+a'\}|\le|A|.\] 于是若令 \(M\) 为使得 \(2^{-M}<\frac{\alpha}{2L}\) 成立的最小整数，我们可以把 \(\tilde G\) 分拆为 \(\tilde G=G_1\cup\dots\cup G_M\)，其中 \(G_m:=\{(a,a')\in\tilde G:\ a-a'\in D_m\}\)，而 \[D_m:=\Bigl\{x\in A\overset{\tilde G}{-}A:\ 2^{-m}|A|<|\{(a,a')\in\tilde G:\ a-a'=x\}|\le2^{-m+1}|A|\Bigr\}.\] 由鸽笼原理，存在 \(1\le m\le M\) 使得 \[|G_m|\ge\frac1M|G|\ge\frac{\alpha}{C\bigl(1+\log\frac1\alpha+\log L\bigr)}|A|^2.\] 由 \(D_m\) 的定义，我们有 \[\frac{|G_m|}{2^{-m+1}|A|}\le|D_m|\le\frac{|G_m|}{2^{-m}|A|};\] 由于 \(D_m=A\overset{G_m}{-}A\)，我们因此看到对所有 \(x\in A\overset{G_m}{-}A\) \[|\{(a,a')\in G':\ a-a'=x\}|\ge2^{-m}|A|\ge\frac{|G'|}{2|A\overset{G}{-}A|}.\] 取 \(G':=G_m\)，论断随之成立。♦

二进鸽笼：每个差按其纤维大小落在某个 \([2^{-m}|A|,2^{-m+1}|A|]\) 区间 \(D_m\) 里。层数 \(M=O(\log\frac{L}{\alpha})\) 只有对数个，故某一层 \(D_m\) 至少占总边数的 \(1/M\)。在该层内，每个差的纤维大小都在同一个 \(2\) 倍范围里——这就是“均匀化”。

2.6.4　主定理：非对称 BSG

现在我们给出本节的主定理。

定理 2.35（非对称 Balog–Szemerédi–Gowers 定理）设 \(A,B\) 是加性群 \(Z\) 中的加性集合，满足 \(\E(A,B)\ge2\alpha|A||B|^2\) 且 \(|A|\le L|B|\)，其中 \(L\ge1\)，\(0<\alpha\le1\)。设 \(\varepsilon>0\)。则存在 \(Z\) 中的一个 \(O_\varepsilon(\alpha^{-O_\varepsilon(1)}L^\varepsilon)\)-近似群 \(H\)、\(Z\) 中一个基数为 \(|X|=O_\varepsilon(\alpha^{-O_\varepsilon(1)}L^\varepsilon|A|/|H|)\) 的加性集合 \(X\)（使得 \(|A\cap(X+H)|=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|A|)\)），以及一个 \(x\in Z\)，使得 \(|B\cap(x+H)|=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|B|)\)。

反方向观察：若本定理的结论成立，则 \(\E(A,B)=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-O(\varepsilon)}|A||B|^2)\)（见本节末习题 2.6.3）。因此本定理在 \(\alpha\) 的多项式损失以及 \(L^\varepsilon\)（其中 \(\varepsilon\) 可任意小）的意义下是尖锐的；习题 2.6.1 中的例子经改造可以表明这种损失是必要的（习题 2.6.2）。

读定理：每个量在管什么

\(H\) 是近似群：\(|H+H|\le K|H|\)，这里 \(K=O_\varepsilon(\alpha^{-O_\varepsilon(1)}L^\varepsilon)\)，即结构的“倍增常数”只带 \(L^\varepsilon\) 的小损失。
\(B\) 几乎被压进单块：\(|B\cap(x+H)|\) 占 \(B\) 的一个 \(L^{-\varepsilon}\) 比例（仅丢对数式损失）。
\(A\) 几乎被 \(H\) 的 \(|X|\) 块平移覆盖：覆盖到 \(A\) 的一个 \(L^{-\varepsilon}\) 比例，块数 \(|X|\approx|A|/|H|\)（即恰好够铺满，没有浪费）。

一句话：把“能量大”翻译成“\(A\) 是 \(H\) 的多块平移、\(B\) 是 \(H\) 的一块平移”，损失只是 \((|A|/|B|)^\varepsilon\)。

证明的主线索

证明. 直接套用定理 2.31 会损失太多个 \(L\) 的幂。诀窍在于：把 \(B\) 嵌入一条不断增长的集合序列 \(B_0,B_1,B_2,\dots\) 中，其中每个 \(B_j\)（粗略地说）是前一个的部分差集，再用鸽笼原理表明在某一阶段比值 \(|B_{j+1}|/|B_j|\) 被 \(L\) 的一个小幂所控制。这样便可以以可接受的损失应用定理 2.31，并由此推出本定理。（这一证法受到 [40] 中类似论证的启发。）

我们转入细节。方便起见，使用 Landau 记号 \(O()\) 与 \(\Omega()\) 的一个变体，它能吸收 \(\alpha\) 与 \(\log L\) 的因子（我们把它们看作相对接近 \(1\)）。若 \(X,Y\) 是非负量、\(j\) 是一个参数，我们说 \(X=\tilde O_j(Y)\) 或 \(Y=\tilde\Omega_j(X)\)，如果有形如 \[X\le C(j)\,\alpha^{-C(j)}\,Y\,\log^{C(j)}L\] 的估计，其中 \(C(j)>0\) 只依赖于 \(j\)。

令 \(J=J(\varepsilon)\gg1\) 为一待定的大整数。令 \(1>\alpha_1>\dots>\alpha_{J+1}>0\) 为递归定义的序列：\(\alpha_1:=\alpha\) 且 \(\alpha_{j+1}:=\alpha_j^2/2\)（对一切 \(1\le j\le J\)）。由归纳法可见 \(\alpha_j=\tilde\Omega_j(1)\)。我们断言可以找到 \(Z\) 中一列加性集合 \(B_0,B_1,\dots,B_J,B_{J+1}\)，具有以下性质。

\(B_0=B\)，且对所有 \(1\le j\le J+1\) 有 \[B_j\subseteq\Sym_{\alpha_j}(A).\tag{2.26}\]
对所有 \(0\le j\le J+1\) 有 \[\alpha_j^{-2}L|B|\ge|B_j|=\tilde\Omega_j(|B|).\tag{2.27}\]
对所有 \(0\le j\le J\)，存在 \(G_j\subseteq B_j\times B_j\) 使得 \[|G_j|=\tilde\Omega_j(|B_j|^2)\tag{2.28}\] 且 \[B_{j+1}=B_j\overset{G_j}{-}B_j.\tag{2.29}\] 此外，对所有 \(x\in B_{j+1}\) 有 \[|\{(b,b')\in G_j:\ b-b'=x\}|=\tilde\Omega_j\!\left(\frac{|B_j|^2}{|B_{j+1}|}\right).\tag{2.30}\]

定理 2.35 证明的骨架。每个 \(B_{j+1}\) 是 \(B_j\) 的部分差集（沿图 \(G_j\)），都被裹在对称集 \(\Sym_{\alpha_j}(A)\) 中（性质 2.26）；阈值按 \(\alpha_{j+1}=\alpha_j^2/2\) 递减，集合规模在 \(|B|\) 与 \(\alpha_j^{-2}L|B|\) 之间（性质 2.27）。链足够长后，相邻两项的比值必有一处很小。

我们如下构造 \(B_j\)。令 \(B_0:=B\)。由 (2.22) 接着用引理 2.34，我们可以构造 \(G_0\subseteq B_0\times B_0\) 与 \(B_1:=B_0\overset{G_0}{-}B_0\)，使之满足 (2.26)、(2.28)、(2.29)、(2.30)。由于 \(B_0\overset{G_0}{-}B_0\) 中的每个元素至多能由 \(G\) 中的一对以 \(|B_0|\) 种方式表示，我们有 \[|B_1|=|B_0\overset{G_0}{-}B_0|\ge|G_0|/|B_0|=\tilde\Omega_j(|B|),\] 这就是 (2.27) 中的下界；上界则由 (2.26) 与 (2.21) 得到。

接下来，归纳地假设对某个 \(1\le j\le J\) 已经选好 \(B_j\subseteq\Sym_{\alpha_j}(A)\)。应用引理 2.33（取 \(S:=B_j\)）接着用引理 2.34，并利用 (2.27) 中已得到的基数界以及 \(\alpha_j\) 的构造 \(\alpha_{j+1}:=\alpha_j^2/2\)，我们便能找到 \(G_j\subseteq B_j\times B_j\) 与 \(B_{j+1}:=B_j\overset{G_j}{-}B_j\)，使之满足 (2.26)、(2.28)、(2.29)、(2.30)。这就闭合了归纳，于是我们能构造出所有 \(0\le j\le J+1\) 的 \(B_j\)，并类似地得到所有 \(1\le j\le J\) 的 \(G_j\)。

把递推串起来

(2.22) 提供起点：能量大 ⇒ 部分差集 \(B_0\overset{G_0}{-}B_0\) 落进 \(\Sym_\alpha(A)\)。
引理 2.33 提供递推：若 \(B_j\subseteq\Sym_{\alpha_j}(A)\)，则其部分差集落进 \(\Sym_{\alpha_j^2/2}(A)=\Sym_{\alpha_{j+1}}(A)\)，于是 \(B_{j+1}\subseteq\Sym_{\alpha_{j+1}}(A)\)，性质 (2.26) 一直保持。
引理 2.34 提供均匀化：每步都把纤维大小拉齐，保证 (2.30) 那样的逐点下界，使估计能往回传。
规模被夹住：下界来自 \(|B_{j+1}|\ge|G_j|/|B_j|\)（每个差至多重复 \(|B_j|\) 次）；上界来自 \(B_{j+1}\subseteq\Sym_{\alpha_{j+1}}(A)\) 与 (2.21)，即 \(|B_{j+1}|\le|A|/\alpha_{j+1}^2\le\alpha_{j+1}^{-2}L|B|\)。这正是 (2.27)。

现在到了关键的一步（它解释了为什么我们要把上述过程迭代如此多次）。由 (2.27) 与鸽笼原理，存在 \(1\le j\le J\) 使得 \[|B_{j+1}|=\tilde O_J\!\left(L^{O(1/J)}|B_j|\right);\] 要点在于我们设法把 \(L\) 替换成了小得多的量 \(L^{O(1/J)}\)。现在若应用 (2.29)、(2.28) 与定理 2.31，我们便能找到一个 \(\tilde O_J(L^{O(1/J)})\)-近似群 \(H\)，其基数为 \[|H|=\tilde O_J\!\left(L^{O(1/J)}|B_j|\right)\tag{2.31}\] 以及一个 \(x_j\in Z\)，使得 \[|B_j\cap(H+x_j)|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_j|\right)\tag{2.32}\] 其中 \(C_0\) 是某个绝对常数。

“缩小 \(L\)”这一步的算术从 \(B_0=B\) 到 \(B_{J+1}\)，每一项的规模都在 \([\,\tilde\Omega(|B|),\ \alpha_j^{-2}L|B|\,]\) 之间，即整条链的总放大倍数至多约 \(L\)（连乘）。把这总放大写成 \(J\) 个相邻比值之积 \[\frac{|B_{J+1}|}{|B_0|}=\prod_{j=0}^{J}\frac{|B_{j+1}|}{|B_j|}\lesssim L\quad(\text{忽略 }\alpha,\log L).\] \(J+1\) 个正因子之积 \(\lesssim L\)，则其中至少有一个因子 \(\lesssim L^{1/(J+1)}=L^{O(1/J)}\)。这正是鸽笼：把一个 \(L\) 倍的总放大摊到 \(J\) 步里，必有一步只放大 \(L^{O(1/J)}\) 倍。\(J\) 越大，这一步越温和——只要 \(J\) 足够大，\(L^{O(1/J)}\) 就接近 \(1\)，定理 2.31 在这一步的损失便可接受。

把 \(H\) 与 \(B\)、\(A\) 联系起来

剩下的是把 \(H\) 与 \(B\) 以及 \(A\) 联系起来。我们从 \(B\) 开始。由 (2.32) 与 (2.30)（其中 \(j\) 换成 \(j-1\)）我们有 \[|\{(b,b')\in G_{j-1}:\ b-b'\in B_j\cap(H+x_j)\}|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|^2\right),\] 于是特别地 \[|\{(b,b')\in B_{j-1}\times B_{j-1}:\ b\in H+x_j+b'\}|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|^2\right).\] 因此由鸽笼原理，存在某个 \(b'\) 使得 \[|\{b\in B_{j-1}:\ b\in H+x_j+b'\}|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|\right).\] 于是若令 \(x_{j-1}:=x_j+b'\)，则有 \[|B_{j-1}\cap(H+x_{j-1})|=\tilde\Omega_J\!\left(L^{-C_0/J}|B_{j-1}|\right).\tag{2.33}\]

现在我们对“\(j\) 换成 \(j-1\)、(2.32) 换成 (2.33)”重复这一论证。如此至多迭代 \(J\) 次，我们最终找到一个 \(x=x_0\in Z\)，使得 \[|B\cap(H+x)|=\tilde\Omega_J\!\left(L^{-C_0/J}|B|\right),\] 只要 \(J\)（依赖于 \(\varepsilon\)）取得足够大，这就给出了对 \(B\) 所需的控制。

为什么能从 \(B_j\) 回退到 \(B\)

\(B_j\) 由 \(B_{j-1}\) 的部分差集得到：\(B_j\) 里的每个 \(x\) 形如 \(b-b'\)（\((b,b')\in G_{j-1}\)）。把 (2.32) 里“\(B_j\) 落进 \(H+x_j\)”的那部分元素回拉，得到 \(G_{j-1}\) 中大量满足 \(b-b'\in H+x_j\) 的边，即 \(b\in H+x_j+b'\)。
对 \(b'\) 用鸽笼：既然这种 \((b,b')\) 对很多，必有某个固定的 \(b'\) 配上很多个 \(b\)。把该 \(b'\) 吸收进平移量，令 \(x_{j-1}=x_j+b'\)，就把“\(B_{j-1}\) 的大块落进 \(H+x_{j-1}\)”立了起来。
逐级下降 \(j\to j-1\to\dots\to0\)，每级只掉一个 \(L^{-C_0/J}\) 因子，至多 \(J\) 级，总损失 \(L^{-C_0}\) 一类的可控量，最终落到 \(B_0=B\)。

剩下的是控制 \(A\)。由 (2.32)、(2.31) 与 (2.26)，我们有 \[|\{y\in H+x_j:\ y\in\Sym_{\alpha_j}(A)\}|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H|\right),\] 从而由 \(\Sym_{\alpha_j}(A)\) 与 \(\alpha_j\) 的定义 \[|\{(a,y)\in A\times(H+x_j):\ a+y\in A\}|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H||A|\right).\] 我们把它改写为 \[\sum_{x\in x_j+A}|A\cap(H+x)|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H||A|\right).\] 我们因此能找到 \(x_j+A\) 的一个子集 \(X_0\)，其基数为 \[|X_0|=\tilde\Omega_J\!\left(L^{-O(1/J)}|A|\right)\tag{2.34}\] 使得 \[|A\cap(H+x)|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H|\right)\quad\text{对所有 }x\in X_0.\]

现在我们使用一个类似于证明 Ruzsa 覆盖引理（引理 2.14）时所用的论证。令 \(X\) 为 \(X_0\) 的一个子集，使得诸集合 \(\{H+x:x\in X\}\) 两两不交，且关于集合包含关系是极大的。则我们有 \[|A\cap(H+X)|=\sum_{x\in X}|A\cap(H+x)|=\tilde\Omega_J\!\left(L^{-O(1/J)}|H||X|\right).\tag{2.35}\] 另一方面，若 \(y\in X_0\)，则由 \(X\) 的极大性，存在 \(x\in X\) 使得 \(x+H\) 与 \(y+H\) 相交。换句话说，\(X_0\) 被 \(X+H-H\) 覆盖，因而（由于 \(H\) 是 \(\tilde O(L^{O(1/J)})\)-近似群） \[|X_0|\le|X||H-H|=\tilde O\!\left(|X|L^{O(1/J)}|H|\right).\tag{2.36}\] 合并 (2.34)、(2.35)、(2.36)，我们看到 \(X\) 满足所有所需的性质，只要 \(J\) 依赖于 \(\varepsilon\) 取得足够大。♦

Ruzsa 覆盖式论证：选出两两不交的平移块直到无法再加（极大）。不交性给出下界 (2.35)（块数 \(|X|\) 不会太多）；极大性给出上界 (2.36)（\(X_0\) 被 \(X+H-H\) 覆盖，块数也不会太少）。两头一夹，\(X\) 既能罩住 \(A\) 的大部分、数量又恰好 \(\approx|A|/|H|\)。

上述定理也可以写成一个类似定理 2.29 的形式：

推论 2.36设 \(A,B\) 是具有共同环绕群的加性集合，满足 \(\E(A,B)\ge2\alpha|A||B|^2\) 且 \(|A|\le L|B|\)，其中 \(L\ge1\)，\(0<\alpha\le1\)。设 \(\varepsilon>0\)。则存在子集 \(A'\subseteq A\) 与 \(B'\subseteq B\)，使得 \[|A'|=\Omega_\varepsilon\!\left(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|A|\right),\] \[|B'|=\Omega_\varepsilon\!\left(\alpha^{O_\varepsilon(1)}L^{-\varepsilon}|B|\right),\] \[|A+nB'-mB'|=O_\varepsilon\!\left(\alpha^{-O_\varepsilon(1)}L^{(n+m)\varepsilon}|A|\right)\quad\text{对所有整数 }n,m\ge0.\]

证明. 应用定理 2.35，并令 \(A':=A\cap(X+H)\) 与 \(B':=B\cap(x+H)\)。♦

推论在说什么定理 2.35 给出了近似群 \(H\)；推论 2.36 把它翻译成更易用的“两块大子集 \(A',B'\)”的语言。因为 \(A'\subseteq X+H\) 是 \(H\) 的几块平移、\(B'\subseteq x+H\) 是一块平移，对它们反复作和/差仍困在 \(H\) 的少数几块平移里，所以 \(|A+nB'-mB'|\) 只比 \(|A|\) 大一个 \(L^{(n+m)\varepsilon}\) 因子——每多做一次加减，只付一份 \(L^\varepsilon\) 的小费用。这正是“不平衡部分和集”受控的精确陈述。

由于 (2.8)，上述结果对“\(|A+B|\le K|A|\) 且 \(|A|\) 远大于 \(|B|\)”这一情形给出了一些部分结果，不过这些结果相当弱。一旦我们在第 6.5 节发展出 Plünnecke 不等式，就将给出关于该问题的一个更好的结果。

2.6.5　习题

习题

2.6.1 [297] 设 \(n\) 为一个大整数，令 \(Z:=\mathbb Z^{2n}\)。设 \(A\) 为加性集合 \[A:=\{(x_1,x_2,\dots,x_{2n})\in\mathbb Z^{2n}:\ x_1+\dots+x_{2n}=n;\ x_1,\dots,x_{2n}\ge0\},\] 并令 \(B:=\{e_1,\dots,e_{2n}\}\)。证明 \(|B|=2n\)，\(|A|=(27/4)^{n+o(1)}\)，\(|A+B|=O(|A|)\)，但 \(|A-B|\ge n|A|\)。（你可能会发现 Stirling 公式 (1.52) 有用。）
2.6.2 改造习题 2.6.1，以表明在定理 2.35 中不能取 \(\varepsilon=0\)。
2.6.3 设 \(A,B\) 为加性集合，\(\varepsilon>0\)、\(0<\alpha<1\)、\(L\ge1\) 使得定理 2.35 的结论成立。推出 \(\E(A,B)=\Omega_\varepsilon(\alpha^{O_\varepsilon(1)}L^{-O(\varepsilon)}|A||B|^2)\)。
2.6.4 设 \(A\) 为加性集合。通过改造引理 2.13 的证明，建立不等式 \[|A-A+n\Sym_\alpha(A)|\le\frac{\delta[A]^{n+1}}{\alpha^n}|A|\] 对所有整数 \(n\ge0\) 与所有 \(0<\alpha<1\) 成立。
2.6.5 [220] 设 \(A\) 为加性集合，使得 \(A-A\) 不是群。证明存在 \(h\in A-A\) 使得 \(1\le|A\cap(A+h)|\le|A|/2\)。（提示：用反证法，并对某个略大于 \(1/2\) 的 \(\alpha\) 分析 \(\Sym_\alpha(A)\)。）特别地推出：若 \(|A-A|<\tfrac32|A|\)，则 \(A-A\) 是群。注意例子 \(A=\{0,1\}\subset\mathbb Z\) 表明常数 \(\tfrac32\) 不能改进；也可以把这个例子做大，例如取 \(\{0,1\}\) 与一个有限群的笛卡尔积。关于 \(A-A\) 的更精细估计，见定理 5.5 与推论 5.6。
2.6.6 设 \(A,B\) 为具有共同环绕群的加性集合，满足 \(|A+B|\le K|A|\) 且 \(|A|\le L|B|\)，其中 \(K,L\ge1\)。设 \(\varepsilon>0\)。证明存在一个 \(O_\varepsilon(K^{O_\varepsilon(1)}L^\varepsilon)\)-近似群 \(H\)，使得 \(B\) 包含在 \(H\) 的一个平移中，而 \(A\) 包含在至多 \(O_\varepsilon(K^{O_\varepsilon(1)}L^\varepsilon|A|/|H|)\) 个 \(H\) 的平移中；把这与命题 2.2 比较。（提示：应用定理 2.35 与 Ruzsa 覆盖引理（引理 2.14）。）
2.6.7 设 \(A\) 为加性集合，\(B\) 为 \(A\) 的子集，满足 \(|B|\ge(1-\varepsilon)|A|\)（\(0<\varepsilon<1\)）。证明 \[\Sym_{\alpha/(1-\varepsilon)}(B)\subseteq\Sym_\alpha(A)\subseteq\Sym_{(\alpha-2\varepsilon)/(1-\varepsilon)}(B)\] 对每个 \(\alpha\in\mathbb R\) 成立。

返回全书目录

2.6.0 问题从哪里来

2.6.1 对称集

对称集的大小与加性能量挂钩

2.6.2 对称集“近似成群”

2.6.3 一条技术引理：二进鸽笼

2.6.4 主定理：非对称 BSG