Tao–Vu · 加性组合学 · 第 4 章傅里叶分析方法

4.7　和集中的等差级数Progressions in sum sets

本页为译文 + 高中讲解合一：黑色正文为忠实翻译；彩色框（目标 / 例 / 分步推演）与配图为面向高中生的详解，逐步推演、举例、画图，不用比喻。本节是全书较难的部分，讲解会把每一步的直觉与动机尽量讲清楚。

本节目标一个集合 \(A\) 本身可能没有很长的等差数列；但当我们把它“加厚”成和集（如 \(A+B\)、\(A+A+A\)、\(2A-2A\)）后，里面就一定能找到相当长的等差数列（乃至广义等差级数）。本节用傅里叶分析把这件事证明出来：关键在于这些和集上有“傅里叶变换很好”的函数（即 \(1_A*1_B\)、\(1_A*1_A*1_A\)、\(1_A*1_A*1_{-A}*1_{-A}\) 这些卷积），它们把“频率集中”翻译成“包含长级数”。

引言：从 Szemerédi 定理说起

加性组合学的一块基石是 Szemerédi 定理。该定理的一种形式断言：若 \(A\) 是区间 \([1,N]\) 中一个具有正密度 \(\alpha\) 的子集，则 \(A\) 包含一个长度为 \(f(N,\alpha)\) 的等差数列，其中当 \(\alpha\) 固定、\(N\to\infty\) 时 \(f\) 趋于无穷。我们将在第 10 章与第 11 章更详细地讨论这一结果，但这里先指出：作为 \(N\) 的函数，\(f\) 趋于无穷的速度非常慢。

在本节中，我们将证明：如果把加性集合 \(A\) 替换为一个更大的集合，例如 \(A+B\)、\(A+A+A\) 或 \(2A-2A\)，那么我们就能在这些集合内部定位到显著更长的等差级数。其手段是利用那些“支撑在这些集合上、且傅里叶变换性质很好”的函数，具体地说就是 \(1_A*1_B\)、\(1_A*1_A*1_A\) 以及 \(1_A*1_A*1_{-A}*1_{-A}\)。

符号约定（速查）

\(Z=Z_N\)：\(N\) 个元素的循环群（即模 \(N\) 的整数）。
\(1_A\)：集合 \(A\) 的指示函数（属于 \(A\) 取 \(1\)，否则取 \(0\)）。
\(f*g\)：卷积，\((f*g)(x)=\sum_{y}f(y)g(x-y)\)。它的支撑就是和集：\(\mathrm{supp}(1_A*1_B)=A+B\)。
\(\mathbb P_Z(A)=|A|/N\)：\(A\) 在 \(Z\) 中的密度。
\(\hat f(\xi)\)：傅里叶变换；\(e(\xi\cdot x)=e^{2\pi i\,\xi x/N}\)。
\(\|t\|_{\mathbf R/\mathbf Z}\)：\(t\) 到最近整数的距离。
\(\mathrm{Spec}_\alpha(A)=\{\xi:|\widehat{1_A}(\xi)|\ge\alpha\,\mathbb P_Z(A)\}\)：\(A\) 的 \(\alpha\)-谱（傅里叶系数较大的那些频率）。
\(\mathrm{Bohr}(S,\rho)=\{x:\|\eta\cdot x\|_{\mathbf R/\mathbf Z}<\rho\ \forall\eta\in S\}\)：以 \(S\) 为频率集、半径为 \(\rho\) 的 Bohr 集。
\(E(A,A)\)：加性能量，数“\(a+b=c+d\)”的四元组个数。

4.7.1　Chang 定理：\(2A-2A\) 中的广义级数

为说明上述思想，我们从 Chang 的一个定理开始（它基于 Ruzsa 的早期工作 [295]），它表明在 \(2A-2A\) 内部存在一个大的广义等差级数；这个定理将是 Freiman 定理的一种表述形式中的关键成分（见定理 5.30）。

定理 4.42（Chang 定理）[48] 设 \(K,N\ge 1\)。设 \(A\) 是循环群 \(Z=Z_N\) 中的一个加性集合，满足 \(E(A,A)\ge |A|^3/K\)。则存在一个真广义级数 \(P\subseteq 2A-2A\)，其秩至多为 \(O\!\big(K(1+\log\tfrac1{\mathbb P_Z(A)})\big)\)，且大小满足 \[\tag{4.41} |P|\ \ge\ \Big[O\big(K(1+\log\tfrac1{\mathbb P_Z(A)})\big)\Big]^{-O\big(K(1+\log\frac1{\mathbb P_Z(A)})\big)}\,N . \] 此外，我们可以选取 \(P\) 为对称的（\(-P=P\)）。

从 (2.8) 注意到：假设 \(E(A,A)\ge |A|^3/K\) 在 \(|A+A|\le K|A|\) 或 \(|A-A|\le K|A|\) 时自动成立；因此本定理涵盖了倍增常数小或 Ruzsa 直径小的集合。另一方面，由平凡下界 \(E(A,A)\ge |A|^2\) 可知，取 \(K=1/\mathbb P_Z(A)\) 时该假设总是满足，但代价高昂，因为 (4.41) 对 \(K\) 的依赖是指数级的。反过来，如果 \(A\) 具有小倍增，那么即便 \(A\) 是 \(Z\) 中相当稀疏的子集，本定理也能高效地应用。

为什么是 \(2A-2A\) 而不是 \(A\) 本身单个集合 \(A\) 可能完全没有长等差数列（例如取 \(A\) 为某种“无结构”的稀疏集）。但 \(2A-2A=A+A-A-A\) 是“四重和差”，它对应卷积 \(1_A*1_A*1_{-A}*1_{-A}\)，其傅里叶系数是 \(|\widehat{1_A}(\xi)|^4\ge 0\) —— 全部非负！非负性使我们能把“谱很大”直接翻译成“和集很大且包含长级数”。这正是把 \(A\) 加厚成 \(2A-2A\) 的好处。

证明. 令 \(\alpha:=1/(2K^{1/2})\)。由命题 4.39，我们有 \[\mathrm{Bohr}\big(\mathrm{Spec}_\alpha(A),\tfrac12\big)\ \subseteq\ 2A-2A .\] 另一方面，由引理 4.36，我们可以找到一组频率 \(S:=\{\eta_1,\dots,\eta_d\}\)，其规模为 \[d=|S|=O\!\Big(\alpha^{-2}\big(1+\log\tfrac1{\mathbb P_Z(A)}\big)\Big)=O\!\Big(K\big(1+\log\tfrac1{\mathbb P_Z(A)}\big)\Big),\] 使得 \[\mathrm{Spec}_\alpha(A)\ \subseteq\ [-1,1]^d\cdot(\eta_1,\dots,\eta_d).\] 由三角不等式，这蕴含 \[\mathrm{Bohr}\big(S,\tfrac1{6d}\big)\ \subseteq\ \mathrm{Bohr}\big(\mathrm{Spec}_\alpha(A),\tfrac16\big).\] 应用命题 4.23，我们看到 \(\mathrm{Bohr}(S,\tfrac1{6d})\) 包含一个秩为 \(d\) 的真对称级数，其基数为 \[|P|\ \ge\ \frac{(1/6d)^d}{d}\,N\ \ge\ \Big[O\big(K(1+\log\tfrac1{\mathbb P_Z(A)})\big)\Big]^{-O\big(K(1+\log\frac1{\mathbb P_Z(A)})\big)}\,N,\] 结论得证。♦

把证明的逻辑链拆开看这条证明本质上是一串“集合包含关系”的接力，每一环把上一环往“更具体、更可见的级数”推进一步：

能量大 ⟹ 谱外可控：取 \(\alpha\sim 1/\sqrt K\)。命题 4.39 说，凡是“在谱 \(\mathrm{Spec}_\alpha(A)\) 方向上转动很小的点 \(x\)”都落在 \(2A-2A\) 里。即 \(\mathrm{Bohr}(\mathrm{Spec}_\alpha(A),\tfrac12)\subseteq 2A-2A\)。
谱被装进低维盒子：引理 4.36（Chang 谱引理）说谱虽可能有很多点，却能被 \(d\) 个频率 \(\eta_1,\dots,\eta_d\) 的整系数组合 \([-1,1]^d\cdot(\eta_1,\dots,\eta_d)\) 覆盖，且 \(d\) 只有 \(O(K\log\frac1{\mathbb P_Z(A)})\) 这么小。
换成 \(d\) 个频率的 Bohr 集：只用这 \(d\) 个“基频” \(S\)、把半径缩到 \(\tfrac1{6d}\)，得到的更小 Bohr 集 \(\mathrm{Bohr}(S,\tfrac1{6d})\) 仍被夹在前者里。
Bohr 集里挖出级数：命题 4.23 保证一个 \(d\) 个频率、半径 \(\tfrac1{6d}\) 的 Bohr 集里能装下一个秩 \(d\)、大小 \(\sim (1/6d)^d N\) 的真级数 \(P\)。
这个 \(P\) 落在 \(2A-2A\) 内，秩与大小即为所求。♦

证明是一条“层层内嵌”的包含链：最外是和集 \(2A-2A\)，往里依次是两个 Bohr 集，最里挖出一个真级数 \(P\)。每一层都被前一层包住，所以 \(P\) 最终落在 \(2A-2A\) 中。

4.7.2　只用三个加项：定理 4.43

在上面定理的证明中（更确切地说，在命题 4.39 的证明中），我们利用了 \(1_A*1_A*1_{-A}*1_{-A}\) 具有非负傅里叶系数 \(|\widehat{1_A}(\xi)|^4\) 这一事实。然而，事实证明：只要对论证稍作修改，我们便不需要傅里叶系数的非负性，而且实际上只需要三个加项而非四个：

定理 4.43 [149] 设 \(K,N\ge 1\)。设 \(A_1,A_2,A_3\) 是 \(Z_N\) 中的加性集合，满足 \(|A_1|=|A_2|=|A_3|\) 且 \(|A_1+A_2+A_3|\le K|A_1|\)。则存在一个真级数 \(P\subseteq A_1+A_2+A_3\)，其秩至多为 \(O\!\big(K^2(1+\log\tfrac1{\mathbb P_Z(A_1)})\big)\)，且大小满足 \[\tag{4.42} |P|\ \ge\ \Big[O\big(K(1+\log\tfrac1{\mathbb P_Z(A_1)})\big)\Big]^{-O\big(K^2(1+\log\frac1{\mathbb P_Z(A_1)})\big)}\,N . \]

当然，我们可以把假设推广到处理基数互不相同的集合 \(A_1,A_2,A_3\)，但这样定理的陈述会变得有些繁琐，故此处不予追究。

证明. 我们改编 [117] 中的一些论证。考虑非负函数 \(f:=1_{A_1}*1_{A_2}*1_{A_3}\)。由 (4.10) 我们有 \(\mathbb E_Z f=\mathbb P_Z(A_1)^3\)。另一方面， \[\mathbb P_Z(\mathrm{supp}(f))=\mathbb P_Z(A_1+A_2+A_3)=K\,\mathbb P_Z(A_1).\] 由鸽笼原理，于是可以找到一个元素 \(x_0\in A_1+A_2+A_3\)，使得 \(f(x_0)\ge \mathbb P_Z(A_1)^2/K\)。如有必要，通过平移其中一个 \(A_j\)，可设 \(x_0=0\)，于是 \(f(0)\ge \mathbb P_Z(A_1)^2/K\)。其次，由 (4.9) 我们观察到 \(\hat f(\xi)=\widehat{1_{A_1}}(\xi)\,\widehat{1_{A_2}}(\xi)\,\widehat{1_{A_3}}(\xi)\)。由 (4.4)、Cauchy–Schwarz、(4.16) 与 (4.24)，对任意 \(x\in Z\) 我们有 \[ \begin{aligned} |f(x)-f(0)|&=\Big|\sum_{\xi\in Z}\widehat{1_{A_1}}(\xi)\widehat{1_{A_2}}(\xi)\widehat{1_{A_3}}(\xi)\big(e(\xi\cdot x)-1\big)\Big|\\ &\le \sum_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,|\widehat{1_{A_2}}(\xi)|\,|\widehat{1_{A_3}}(\xi)|\,|e(\xi\cdot x)-1|\\ &\le \Big(\sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,|e(\xi\cdot x)-1|\Big)\,\|1_{A_2}\|_{L^2(Z)}\,\|\widehat{1_{A_3}}\|_{L^2(Z)}\\ &=\mathbb P_Z(A_1)\,\sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,|e(\xi\cdot x)-1|\\ &\le 2\pi\,\mathbb P_Z(A_1)\,\sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}. \end{aligned} \] 把它与我们对 \(f(0)\) 的下界、以及 \(f\) 的支撑结合起来，我们看出 \[ \Big\{x\in Z:\ \sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}<\mathbb P_Z(A_1)/2\pi K\Big\}\ \subseteq\ A_1+A_2+A_3 . \] 由于当 \(\xi\in\mathrm{Spec}_{1/2\pi K}(A_1)\) 之外时 \(|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}<\mathbb P_Z(A_1)/2\pi K\) 自动满足，我们得到 \[ \Big\{x\in Z:\ \sup_{\xi\in \mathrm{Spec}_{1/2\pi K}(A_1)}|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}<\mathbb P_Z(A_1)/2\pi K\Big\}\ \subseteq\ A_1+A_2+A_3 . \] 此外，由于对所有非零 \(\xi\) 有 \(|\widehat{1_{A_1}}(\xi)|\le \mathbb P_Z(A_1)\)，我们得到（例如） \[ \mathrm{Bohr}\big(\mathrm{Spec}_{1/2\pi K}(A_1),\,1/2\pi K\big)\ \subseteq\ A_1+A_2+A_3 . \] 但由引理 4.36，我们可以找到 \(d=O\!\big(K^2(1+\log\tfrac1{\mathbb P_Z(A_1)})\big)\) 以及频率 \(S:=\{\eta_1,\dots,\eta_d\}\subset Z\)，使得 \[\mathrm{Spec}_{1/2\pi K}(A_1)\ \subseteq\ [-1,1]^d\cdot(\eta_1,\dots,\eta_d),\] 从而由三角不等式 \[ \mathrm{Bohr}\big(S,\,1/2\pi d K\big)\ \subseteq\ \mathrm{Bohr}\big(\mathrm{Spec}_{1/2\pi K}(A_1),\,1/2\pi K\big)\ \subseteq\ A_1+A_2+A_3 . \] 应用命题 4.23，我们可以在 \(\mathrm{Bohr}(S,1/2\pi dK)\) 中定位一个秩为 \(d\) 的真级数 \(P\)，其基数至少为 \[ |P|\ \ge\ \frac{(1/2dK)^d}{d^d}\,N\ \ge\ \big(CK(1+\log(1/\mathbb P_Z(A_1)))\big)^{-CK^2(1+\log(1/\mathbb P_Z(A_1)))}\,N, \] 结论得证。♦

证明的两步直觉

找一个“胖点”再平移到原点：\(f=1_{A_1}*1_{A_2}*1_{A_3}\) 的平均值是 \(\mathbb P_Z(A_1)^3\)，而它只在 \(A_1+A_2+A_3\)（大小 \(\approx K|A_1|\)）上非零。把“总质量”按鸽笼分到这么多点上，必有一点 \(x_0\) 的取值 \(\ge \mathbb P_Z(A_1)^2/K\)。平移后设它在 \(0\)，于是 \(f(0)\) 很大。
\(f\) 在原点附近“几乎不变” ⟹ 附近的点也在和集里：上面那串不等式说明，只要 \(x\) 让所有“大频率”\(\xi\) 的相位 \(\|\xi\cdot x\|_{\mathbf R/\mathbf Z}\) 都很小，那么 \(|f(x)-f(0)|\) 就比 \(f(0)\) 小，于是 \(f(x)>0\)，即 \(x\in\mathrm{supp}(f)=A_1+A_2+A_3\)。“所有大频率相位都小的 \(x\)”正好组成一个 Bohr 集 —— 它整个被装进了和集里。
剩下的与定理 4.42 相同：把 Bohr 集换成 \(d\) 个基频，再用命题 4.23 在里面挖出真级数 \(P\)。♦

注意：这里 \(\|\widehat{1_{A_2}}\|_{L^2},\|\widehat{1_{A_3}}\|_{L^2}\) 这两个加项用 Plancherel（即 \(L^2\) 范数）一次性吃掉，只剩第三个加项 \(\widehat{1_{A_1}}\) 在外面“自由活动”，被用来控制谱外的小傅里叶系数 —— 这就是“三个加项就够”的原因。

4.7.3　只有两个加项：Bourgain 定理

上述论证至关重要地依赖于有三个或更多加项；粗略地说，其中两个加项用 Plancherel 定理处理掉，剩下至少一个加项可以自由地利用其在谱之外的傅里叶系数之小。对于两个集合之和，这套论证会严重失效^[1]。尽管如此，我们仍然有可能在形如 \(A+B\) 的集合中得到相对较大的级数，因为函数 \(1_A*1_B\) 的傅里叶系数仍具有 \(\ell^1\) 型的控制。我们沿用 Bourgain [36] 的论证。我们首先给出一个建立级数存在性的方便判据。

引理 4.44（几乎周期性蕴含长级数）[36] 设 \(f:Z\to\mathbf R^+\) 是加性群 \(Z\) 上的一个非负随机变量，设 \(J\ge 1\) 为整数，并设 \(r\in Z\) 满足 \[\mathbb E_Z\max_{1\le j\le J}|T^{jr}f-f|<\mathbb E_Z f,\] 其中 \(T^{jr}f(x):=f(x-jr)\) 是 \(f\) 沿 \(jr\) 的平移。则 \(\mathrm{supp}(f)\) 包含一个长度为 \(J+1\)、公差为 \(r\) 的等差数列 \(a+[0,J]\cdot r\)。

证明. 由鸽笼原理，存在 \(x\in Z\) 使得 \[\max_{1\le j\le J}|T^{jr}f(x)-f(x)|0\)。结论得证。♦

判据的几何含义：若 \(f\) 把它的各个平移本 \(T^{jr}f\) 都“拖得不多”，则存在某点 \(x\) 处 \(f\) 与全部平移本同时为正，即 \(f(x),f(x-r),\dots,f(x-Jr)\) 全大于 \(0\)。这恰说明支撑集 \(\mathrm{supp}(f)\) 中含一条公差 \(r\)、长 \(J+1\) 的等差数列。

为应用此引理，我们需要估计形如 \(\mathbb E_Z\max_{1\le j\le J}|T^{jr}f-f|\) 的表达式。当 \(f\) 的傅里叶变换支撑在一个非结合（dissociated）集合上时，这件事很容易做到：

引理 4.45 [36] 设 \(S\subseteq Z\) 为非结合集合，设 \(f\) 是满足 \(\mathrm{supp}(\hat f)\subseteq S\) 的随机变量。则对任意非空平移集合 \(H\subset Z\) 我们有 \[\Big\|\max_{h\in H}|T^h f|\Big\|_{L^2(Z)}=O\big((1+\log|H|)^{1/2}\big)\,\|f\|_{L^2(Z)}.\]

证明. 设 \(p>2\) 为待定的大指数。则 \[ \begin{aligned} \Big\|\max_{h\in H}|T^h f|\Big\|_{L^2(Z)} &\le \Big\|\max_{h\in H}|T^h f|\Big\|_{L^p(Z)} \le \Big\|\big(\textstyle\sum_{h\in H}|T^h f|^p\big)^{1/p}\Big\|_{L^p(Z)}\\ &=\Big(\sum_{h\in H}\|T^h f\|_{L^p(Z)}^p\Big)^{1/p} \le |H|^{1/p}\,\|f\|_{L^p(Z)}\\ &\le |H|^{1/p}\,S(p)\,\|f\|_{L^2(Z)} =O\big(|H|^{1/p}\sqrt p\big)\,\|f\|_{L^2(Z)} \end{aligned} \] 其中用到了 Rudin 不等式（引理 4.33）。结论现在通过设 \(p:=O(1+\log|H|)\) 而得证。♦

为什么取 \(p=O(\log|H|)\)估计里有两个互相拉扯的因子：\(|H|^{1/p}\) 随 \(p\) 增大而变小（趋于 \(1\)），而 \(\sqrt p\) 随 \(p\) 增大而变大。要让乘积 \(|H|^{1/p}\sqrt p\) 尽量小，就在两者之间取平衡：令 \(p\approx\log|H|\)，则 \(|H|^{1/p}=e^{(\log|H|)/p}\approx e\) 为常数，乘积约为 \(\sqrt{\log|H|}\)，这正是结论里的 \((1+\log|H|)^{1/2}\)。
Rudin 不等式 \(\|f\|_{L^p}\le S(p)\|f\|_{L^2}\)（对谱在非结合集上的 \(f\)，\(S(p)=O(\sqrt p)\)）是关键：它把高阶范数 \(L^p\) 反控回 \(L^2\)，代价只是 \(\sqrt p\)。

通过把此引理与引理 4.35 结合，我们可以在 \(\mathrm{supp}(\hat f)\) 不是非结合集、但 \(\hat f\) 在大小上一致时得到一个估计：

引理 4.46 [36] 设 \(f\) 为随机变量，设 \(J,d>1\)。假设存在整数 \(m\) 使得对所有 \(\xi\in\mathrm{supp}(\hat f)\) 有 \(2^m\le|\hat f(\xi)|\le 2^{m+1}\)。则可以找到一个基数为 \(|S|=d\) 的集合 \(S\subset Z\)，使得对所有 \(r\in Z\) 有 \[ \mathbb E_Z\max_{1\le j\le J}|T^{jr}f-f|=O\!\left(\Big(\sum_{\xi\in\mathrm{supp}(\hat f)}|\hat f(\xi)|\Big)\Big(\sqrt{\tfrac{\log J}{d}}+Jd\max_{\eta\in S}\|\eta\cdot r\|_{\mathbf R/\mathbf Z}\Big)\right). \]

证明. 应用引理 4.35，我们可以写 \[\mathrm{supp}(\hat f)=D_1\cup\cdots\cup D_k\cup R,\] 其中 \(D_1,\dots,D_k\) 是基数为 \(d+1\) 的不相交非结合集合，而 \(R\subseteq[-1,1]^d\cdot(\eta_1,\dots,\eta_d)\)（对某个 \(S=\{\eta_1,\dots,\eta_d\}\subset Z\)）。利用傅里叶变换，我们可以相应地分解 \(f=f_{D_1}+\cdots+f_{D_k}+f_R\)。由引理 4.45，对任意 \(1\le i\le k\)， \[ \begin{aligned} \mathbb E_Z\max_{1\le j\le J}|T^{jr}f_{D_i}-f_{D_i}| &\le 2\,\Big\|\max_{0\le j\le J}|T^{jr}f_{D_i}|\Big\|_{L^2(Z)} \le O\big(\log^{1/2}J\,\|f_{D_i}\|_{L^2(Z)}\big)\\ &=O\Big(\log^{1/2}J\big(\textstyle\sum_{\xi\in D_i}|\hat f(\xi)|^2\big)^{1/2}\Big) \le O\Big(\sqrt{\tfrac{\log J}{d}}\sum_{\xi\in D_i}|\hat f(\xi)|\Big), \end{aligned} \] 这要归功于一致性假设 \(2^m\le|\hat f(\xi)|\le 2^{m+1}\)。此外，由三角不等式、(4.24) 与关于 \(R\) 的假设，我们有 \[ \begin{aligned} \Big\|\max_{1\le j\le J}|T^{jr}f_R-f_R|\Big\|_{L^1(Z)} &\le \Big\|\max_{1\le j\le J}\sum_{\xi\in R}|\hat f(\xi)|\times|e(x+jr,\xi)-e(\xi\cdot x)|\Big\|_{L^1(Z)}\\ &\le \sum_{\xi\in R}|\hat f(\xi)|\max_{1\le j\le J}|e(jr,\xi)-1|\\ &\le 2\pi Jd\sum_{\xi\in R}|\hat f(\xi)|\max_{\eta\in S}\|\eta\cdot r\|_{\mathbf R/\mathbf Z}. \end{aligned} \] 用三角不等式把这些估计加起来，结论得证。♦

引理 4.46 在做什么它把 \(f\) 的频率支撑切成两类来处理：

非结合的几块 \(D_1,\dots,D_k\)：每块上用引理 4.45（Rudin），得到 \(\sqrt{\log J/d}\) 的“小波动”。块越大（\(d\) 越大），相对波动越小。
低维盒子里的余项 \(R\)：它被 \(d\) 个基频 \(S\) 的整组合覆盖；它的波动由各基频在 \(r\) 方向的转角 \(\|\eta\cdot r\|_{\mathbf R/\mathbf Z}\) 控制 —— 只要选 \(r\) 让这些转角都极小，这部分就可以忽略。

于是“总波动 \(\le\) 小项 \(+\) 可调小的项”，为下一步选 \(r\) 留出了空间。

现在我们可以证明 Bourgain 定理了。

定理 4.47（Bourgain）[36] 设 \(N\ge 1\) 为素数，设 \(A,B\) 是 \(Z_N\) 中的加性集合，满足 \(|A|,|B|\ge\delta N\)，其中 \(C\big(\tfrac{\log\log N}{\log N}\big)^3<\delta\le 1\)（\(C>1\) 为某个大的绝对常数）。则 \(A+B\) 包含一个长度至少为 \(\exp\!\big((\delta\log N)^{1/3}\big)\) 的真等差数列。

证明. 可设 \(N\) 很大。通过从 \(A,B\) 中删去元素并在必要时增大 \(\delta\)，可设 \(\mathbb P_Z(A)=\mathbb P_Z(B)=\delta\)。令 \(f:=1_A*1_B\)，并设待定的 \(\exp\!\big((\delta\log N)^{1/3}\big)\le J0\) 成立。若我们取 \(M:=C\log J\) 与 \(d:=C\delta^{-2}\log J\)（\(C\) 充分大），则显然第一项与第三项都将小于 \(c\delta/3\)（回忆 \(J\gg 1/\delta\)），于是只需找到 \(r\neq 0\) 使得 \[\max_{\eta\in S}\|\eta\cdot r\|_{\mathbf R/\mathbf Z}<\frac{c\delta}{3Jd}<\frac{c'\delta^3}{J\log J},\] 其中 \(c'>0\) 是另一个小绝对常数。利用引理 4.20，只要 \[2^{-|S|}\Big(\frac{c'\delta^3}{J\log J}\Big)^{|S|}N>1\] 这件事就可能办到。但由于 \[|S|\le dM=O(\delta^{-2}\log^2 J),\] 我们看到，通过设 \(J:=\exp\!\big(c''(\delta\log N)^{1/3}\big)\)（\(c''\) 适当小），并利用关于 \(\delta\) 的下界假设，便可达成上式。结论得证。♦

证明的总览：参数怎样卡上的整条证明就是一场“预算分配”：总波动必须小于 \(\delta^2\)（这样引理 4.44 才给出长级数）。把波动分成三笔账，逐笔压到 \(\delta\) 量级以下：

Rudin 项 \(\delta\sqrt{\log J/d}\)：取 \(d\approx\delta^{-2}\log J\)，使 \(\sqrt{\log J/d}\approx\delta\)，于是此项 \(\approx\delta^2\) 量级（再乘小常数 \(c/3\)）。
误差项 \(J\,2^{-M/2}\delta\)：取 \(M\approx C\log J\)，则 \(2^{-M/2}=J^{-C/2}\) 远小于 \(1/J\)，此项被压垮。
转角项 \(\delta\cdot Jd\max_\eta\|\eta\cdot r\|\)：这是唯一需要“挑 \(r\)”的项。要让它小，须找一个公共 \(r\)，使 \(|S|\) 个频率 \(\eta\) 同时几乎整除 \(r\)。引理 4.20（一种 Dirichlet/鸽笼型结果）保证：只要 \(2^{-|S|}(\text{阈值})^{|S|}N>1\)，这样的 \(r\) 就存在。
最后定 \(J\)：把 \(|S|\le dM=O(\delta^{-2}\log^2 J)\) 代入第 3 步的可行性条件，解出 \(J\) 能取到 \(\exp\!\big(c''(\delta\log N)^{1/3}\big)\)。这就是级数长度里那个 \((\delta\log N)^{1/3}\) 指数的来源。

对 \(\delta\) 的下界 \(C(\log\log N/\log N)^3<\delta\) 恰好保证第 4 步的不等式 \(2^{-|S|}(\cdots)^{|S|}N>1\) 有解。

Bourgain 证明的核心动作：按傅里叶系数 \(|\hat f(\xi)|\) 的大小把全部频率分成对数级数量的层 \(\Delta_0,\Delta_1,\dots\)（每层内系数大小一致，可用引理 4.46），再把系数极小的频率全归入误差层 \(\Sigma_{\mathrm{err}}\)（直接粗暴丢掉）。分层后每层都好估，合起来即得总波动的上界。

4.7.4　后续进展与一个反例

长度 \(\exp\!\big((\delta\log N)^{1/3}\big)\) 最近被 Green [149] 改进到 \(\exp\!\big((\delta\log N)^{1/2}\big)\)（并把对 \(\delta\) 的条件略微放宽到 \(C\big(\tfrac{\log\log N}{\log N}\big)^2<\delta\)），其方法是一个有趣的变分傅里叶论证，这里我们简要勾勒如下。出发点是习题 4.3.12：取一个固定密度 \(\mathbb P_Z(E)=\beta\)（\(\beta\) 待定）的非空集合 \(E\)，它与 \(A+B\) 不相交，并在上述约束下使某个量 \(\mathbb E u\) 最小；习题 4.3.12 于是给出该量 \(\mathbb E u\) 的一个下界。然后考虑 \(E\) 的 \(\alpha\)-谱 \(\Delta_\alpha(E)\)（\(\alpha\) 待定），并用引理 4.36 把这个谱装进一个级数 \([-1,1]^d\cdot(\eta_1,\dots,\eta_d)\)（对某个不太大的频率集 \(S=\{\eta_1,\dots,\eta_d\}\)）。接着，从 \(E\) 中（随机地）移除少量元素，并用 \(Z\) 的一般元素替换它们；由引理 4.16，这以高概率缩小了 \(E\) 的傅里叶偏差。再接着，把这些新的一般元素沿 \(\mathrm{Bohr}(S,\rho)\) 中某个合适元素平移（\(\rho\) 适当小），试图把它们全部移到 \(A+B\) 之外。这一操作若成功，将不会显著影响 \(E\) 在大谱 \(\Delta_\alpha(E)\) 上的傅里叶变换，因而仍应缩小 \(E\) 的傅里叶偏差。但这与 \(E\) 的构造（最小性）矛盾。于是，必定无法把某个一般元素移到 \(A+B\) 之外，这意味着 \(A+B\) 必然包含 \(\mathrm{Bohr}(S,\rho)\) 的一个平移。由此并结合命题 4.23，便在 \(A+B\) 内部建立了一个大级数。关于更多细节（如参数 \(\beta,\alpha,\rho\) 的选取），见 [149]。

另一方面，Ruzsa [290] 的一个例子表明：即便 \(\delta\) 接近 \(1/2\)，仍能找到一些集合，其 \(A+A\) 不包含任何长度为 \(\exp\!\big((\log N)^{2/3}\big)\) 的级数。

三个指数放在一起看

Bourgain（定理 4.47）：\(A+B\) 必含长 \(\ge\exp\!\big((\delta\log N)^{1/3}\big)\) 的级数。
Green 改进：可提升到 \(\exp\!\big((\delta\log N)^{1/2}\big)\)。
Ruzsa 反例：存在 \(A\)（\(\delta\approx 1/2\)），其 \(A+A\) 不含长 \(\exp\!\big((\log N)^{2/3}\big)\) 的级数。

由于 \(1/2<2/3\)，可知真实答案的指数夹在 \(1/2\) 与 \(2/3\) 之间——下界 \(\exp((\log N)^{1/2})\) 与上界 \(\exp((\log N)^{2/3})\) 之间仍有间隙，这是一个未完全解决的问题。

迭代和集内部的等差数列已在 [350] 中被深入研究；我们将在第 12 章详细讨论。

^[1] 这与 Goldbach 猜想有相似之处。弱猜想——每个充分大的奇数都是三个素数之和——已用傅里叶方法解决；而强猜想——每个充分大的偶数都是两个素数之和——仍然悬而未决，并且很可能无法用纯傅里叶分析方法处理。其根源正是“两个加项”与“三个加项”的本质差别：三个加项时，可用 Plancherel 处理两个、留一个自由利用；两个加项时则没有这种余地。

习题

4.7.1 [149] 设 \(A_1,A_2,A_3\subset[1,N]\) 是整数加性集合，满足 \(|A_1|=|A_2|=|A_3|\ge\delta N\)（对某 \(0<\delta<1/2\)）。证明 \(A_1+A_1\) 包含一个长度至少为 \(\exp\!\big((\delta\log N)^{1/3}-O(\log\log N)\big)\) 的真等差数列；\(A_1+A_2+A_3\) 包含一个长度至少为 \(O\!\big(\delta^{O(1)}N^{\delta^2/\log(1/\delta)}\big)\) 的真等差数列；并且 \(2A_1-2A_1\) 包含一个长度至少为 \(O\!\big(\delta^{O(1)}N^{\delta/\log(1/\delta)}\big)\) 的真等差数列。（提示：把 \(A_1,A_2,A_3\) 嵌入某素数 \(2N
4.7.2 [349] 设 \(P\) 是无挠加性群中的一个真等差数列，设 \(A,B\) 是 \(P\) 中的加性集合，满足 \(|A|,|B|>(1-\varepsilon)|P|\)（对某 \(0<\varepsilon<1/4\)）。证明 \(A+B\) 包含一个长度至少为 \((2-4\varepsilon)|P|-1\) 的真等差数列。（提示：考虑 \(P+P\) 中那些至少有 \(2\varepsilon|P|\) 种表示为 \(P\) 中元素之和的元素。）

返回全书目录

引言：从 Szemerédi 定理说起

4.7.1 Chang 定理：\(2A-2A\) 中的广义级数

4.7.2 只用三个加项：定理 4.43

4.7.3 只有两个加项：Bourgain 定理

4.7.4 后续进展与一个反例

习题

4.7.1　Chang 定理：\(2A-2A\) 中的广义级数

4.7.2　只用三个加项：定理 4.43

4.7.3　只有两个加项：Bourgain 定理

4.7.4　后续进展与一个反例