本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本节是全书较难的部分,讲解会把每一步的直觉与动机尽量讲清楚。
本节目标一个集合 \(A\) 本身可能没有很长的等差数列;但当我们把它“加厚”成和集(如 \(A+B\)、\(A+A+A\)、\(2A-2A\))后,里面就一定能找到相当长的等差数列(乃至广义等差级数)。本节用傅里叶分析把这件事证明出来:关键在于这些和集上有“傅里叶变换很好”的函数(即 \(1_A*1_B\)、\(1_A*1_A*1_A\)、\(1_A*1_A*1_{-A}*1_{-A}\) 这些卷积),它们把“频率集中”翻译成“包含长级数”。
引言:从 Szemerédi 定理说起
加性组合学的一块基石是 Szemerédi 定理。该定理的一种形式断言:若 \(A\) 是区间 \([1,N]\) 中一个具有正密度 \(\alpha\) 的子集,则 \(A\) 包含一个长度为 \(f(N,\alpha)\) 的等差数列,其中当 \(\alpha\) 固定、\(N\to\infty\) 时 \(f\) 趋于无穷。我们将在第 10 章与第 11 章更详细地讨论这一结果,但这里先指出:作为 \(N\) 的函数,\(f\) 趋于无穷的速度非常慢。
在本节中,我们将证明:如果把加性集合 \(A\) 替换为一个更大的集合,例如 \(A+B\)、\(A+A+A\) 或 \(2A-2A\),那么我们就能在这些集合内部定位到显著更长的等差级数。其手段是利用那些“支撑在这些集合上、且傅里叶变换性质很好”的函数,具体地说就是 \(1_A*1_B\)、\(1_A*1_A*1_A\) 以及 \(1_A*1_A*1_{-A}*1_{-A}\)。
符号约定(速查)
- \(Z=Z_N\):\(N\) 个元素的循环群(即模 \(N\) 的整数)。
- \(1_A\):集合 \(A\) 的指示函数(属于 \(A\) 取 \(1\),否则取 \(0\))。
- \(f*g\):卷积,\((f*g)(x)=\sum_{y}f(y)g(x-y)\)。它的支撑就是和集:\(\mathrm{supp}(1_A*1_B)=A+B\)。
- \(\mathbb P_Z(A)=|A|/N\):\(A\) 在 \(Z\) 中的密度。
- \(\hat f(\xi)\):傅里叶变换;\(e(\xi\cdot x)=e^{2\pi i\,\xi x/N}\)。
- \(\|t\|_{\mathbf R/\mathbf Z}\):\(t\) 到最近整数的距离。
- \(\mathrm{Spec}_\alpha(A)=\{\xi:|\widehat{1_A}(\xi)|\ge\alpha\,\mathbb P_Z(A)\}\):\(A\) 的 \(\alpha\)-谱(傅里叶系数较大的那些频率)。
- \(\mathrm{Bohr}(S,\rho)=\{x:\|\eta\cdot x\|_{\mathbf R/\mathbf Z}<\rho\ \forall\eta\in S\}\):以 \(S\) 为频率集、半径为 \(\rho\) 的 Bohr 集。
- \(E(A,A)\):加性能量,数“\(a+b=c+d\)”的四元组个数。
4.7.1 Chang 定理:\(2A-2A\) 中的广义级数
为说明上述思想,我们从 Chang 的一个定理开始(它基于 Ruzsa 的早期工作 [295]),它表明在 \(2A-2A\) 内部存在一个大的广义等差级数;这个定理将是 Freiman 定理的一种表述形式中的关键成分(见定理 5.30)。
定理 4.42(Chang 定理)[48] 设 \(K,N\ge 1\)。设 \(A\) 是循环群 \(Z=Z_N\) 中的一个加性集合,满足 \(E(A,A)\ge |A|^3/K\)。则存在一个真广义级数 \(P\subseteq 2A-2A\),其秩至多为 \(O\!\big(K(1+\log\tfrac1{\mathbb P_Z(A)})\big)\),且大小满足
\[\tag{4.41}
|P|\ \ge\ \Big[O\big(K(1+\log\tfrac1{\mathbb P_Z(A)})\big)\Big]^{-O\big(K(1+\log\frac1{\mathbb P_Z(A)})\big)}\,N .
\]
此外,我们可以选取 \(P\) 为对称的(\(-P=P\))。
从 (2.8) 注意到:假设 \(E(A,A)\ge |A|^3/K\) 在 \(|A+A|\le K|A|\) 或 \(|A-A|\le K|A|\) 时自动成立;因此本定理涵盖了倍增常数小或 Ruzsa 直径小的集合。另一方面,由平凡下界 \(E(A,A)\ge |A|^2\) 可知,取 \(K=1/\mathbb P_Z(A)\) 时该假设总是满足,但代价高昂,因为 (4.41) 对 \(K\) 的依赖是指数级的。反过来,如果 \(A\) 具有小倍增,那么即便 \(A\) 是 \(Z\) 中相当稀疏的子集,本定理也能高效地应用。
为什么是 \(2A-2A\) 而不是 \(A\) 本身单个集合 \(A\) 可能完全没有长等差数列(例如取 \(A\) 为某种“无结构”的稀疏集)。但 \(2A-2A=A+A-A-A\) 是“四重和差”,它对应卷积 \(1_A*1_A*1_{-A}*1_{-A}\),其傅里叶系数是 \(|\widehat{1_A}(\xi)|^4\ge 0\) —— 全部非负!非负性使我们能把“谱很大”直接翻译成“和集很大且包含长级数”。这正是把 \(A\) 加厚成 \(2A-2A\) 的好处。
证明. 令 \(\alpha:=1/(2K^{1/2})\)。由命题 4.39,我们有
\[\mathrm{Bohr}\big(\mathrm{Spec}_\alpha(A),\tfrac12\big)\ \subseteq\ 2A-2A .\]
另一方面,由引理 4.36,我们可以找到一组频率 \(S:=\{\eta_1,\dots,\eta_d\}\),其规模为
\[d=|S|=O\!\Big(\alpha^{-2}\big(1+\log\tfrac1{\mathbb P_Z(A)}\big)\Big)=O\!\Big(K\big(1+\log\tfrac1{\mathbb P_Z(A)}\big)\Big),\]
使得
\[\mathrm{Spec}_\alpha(A)\ \subseteq\ [-1,1]^d\cdot(\eta_1,\dots,\eta_d).\]
由三角不等式,这蕴含
\[\mathrm{Bohr}\big(S,\tfrac1{6d}\big)\ \subseteq\ \mathrm{Bohr}\big(\mathrm{Spec}_\alpha(A),\tfrac16\big).\]
应用命题 4.23,我们看到 \(\mathrm{Bohr}(S,\tfrac1{6d})\) 包含一个秩为 \(d\) 的真对称级数,其基数为
\[|P|\ \ge\ \frac{(1/6d)^d}{d}\,N\ \ge\ \Big[O\big(K(1+\log\tfrac1{\mathbb P_Z(A)})\big)\Big]^{-O\big(K(1+\log\frac1{\mathbb P_Z(A)})\big)}\,N,\]
结论得证。♦
把证明的逻辑链拆开看这条证明本质上是一串“集合包含关系”的接力,每一环把上一环往“更具体、更可见的级数”推进一步:
- 能量大 ⟹ 谱外可控:取 \(\alpha\sim 1/\sqrt K\)。命题 4.39 说,凡是“在谱 \(\mathrm{Spec}_\alpha(A)\) 方向上转动很小的点 \(x\)”都落在 \(2A-2A\) 里。即 \(\mathrm{Bohr}(\mathrm{Spec}_\alpha(A),\tfrac12)\subseteq 2A-2A\)。
- 谱被装进低维盒子:引理 4.36(Chang 谱引理)说谱虽可能有很多点,却能被 \(d\) 个频率 \(\eta_1,\dots,\eta_d\) 的整系数组合 \([-1,1]^d\cdot(\eta_1,\dots,\eta_d)\) 覆盖,且 \(d\) 只有 \(O(K\log\frac1{\mathbb P_Z(A)})\) 这么小。
- 换成 \(d\) 个频率的 Bohr 集:只用这 \(d\) 个“基频” \(S\)、把半径缩到 \(\tfrac1{6d}\),得到的更小 Bohr 集 \(\mathrm{Bohr}(S,\tfrac1{6d})\) 仍被夹在前者里。
- Bohr 集里挖出级数:命题 4.23 保证一个 \(d\) 个频率、半径 \(\tfrac1{6d}\) 的 Bohr 集里能装下一个秩 \(d\)、大小 \(\sim (1/6d)^d N\) 的真级数 \(P\)。
- 这个 \(P\) 落在 \(2A-2A\) 内,秩与大小即为所求。♦
证明是一条“层层内嵌”的包含链:最外是和集 \(2A-2A\),往里依次是两个 Bohr 集,最里挖出一个真级数 \(P\)。每一层都被前一层包住,所以 \(P\) 最终落在 \(2A-2A\) 中。
4.7.2 只用三个加项:定理 4.43
在上面定理的证明中(更确切地说,在命题 4.39 的证明中),我们利用了 \(1_A*1_A*1_{-A}*1_{-A}\) 具有非负傅里叶系数 \(|\widehat{1_A}(\xi)|^4\) 这一事实。然而,事实证明:只要对论证稍作修改,我们便不需要傅里叶系数的非负性,而且实际上只需要三个加项而非四个:
定理 4.43 [149] 设 \(K,N\ge 1\)。设 \(A_1,A_2,A_3\) 是 \(Z_N\) 中的加性集合,满足 \(|A_1|=|A_2|=|A_3|\) 且 \(|A_1+A_2+A_3|\le K|A_1|\)。则存在一个真级数 \(P\subseteq A_1+A_2+A_3\),其秩至多为 \(O\!\big(K^2(1+\log\tfrac1{\mathbb P_Z(A_1)})\big)\),且大小满足
\[\tag{4.42}
|P|\ \ge\ \Big[O\big(K(1+\log\tfrac1{\mathbb P_Z(A_1)})\big)\Big]^{-O\big(K^2(1+\log\frac1{\mathbb P_Z(A_1)})\big)}\,N .
\]
当然,我们可以把假设推广到处理基数互不相同的集合 \(A_1,A_2,A_3\),但这样定理的陈述会变得有些繁琐,故此处不予追究。
证明. 我们改编 [117] 中的一些论证。考虑非负函数 \(f:=1_{A_1}*1_{A_2}*1_{A_3}\)。由 (4.10) 我们有 \(\mathbb E_Z f=\mathbb P_Z(A_1)^3\)。另一方面,
\[\mathbb P_Z(\mathrm{supp}(f))=\mathbb P_Z(A_1+A_2+A_3)=K\,\mathbb P_Z(A_1).\]
由鸽笼原理,于是可以找到一个元素 \(x_0\in A_1+A_2+A_3\),使得 \(f(x_0)\ge \mathbb P_Z(A_1)^2/K\)。如有必要,通过平移其中一个 \(A_j\),可设 \(x_0=0\),于是 \(f(0)\ge \mathbb P_Z(A_1)^2/K\)。
其次,由 (4.9) 我们观察到 \(\hat f(\xi)=\widehat{1_{A_1}}(\xi)\,\widehat{1_{A_2}}(\xi)\,\widehat{1_{A_3}}(\xi)\)。由 (4.4)、Cauchy–Schwarz、(4.16) 与 (4.24),对任意 \(x\in Z\) 我们有
\[
\begin{aligned}
|f(x)-f(0)|&=\Big|\sum_{\xi\in Z}\widehat{1_{A_1}}(\xi)\widehat{1_{A_2}}(\xi)\widehat{1_{A_3}}(\xi)\big(e(\xi\cdot x)-1\big)\Big|\\
&\le \sum_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,|\widehat{1_{A_2}}(\xi)|\,|\widehat{1_{A_3}}(\xi)|\,|e(\xi\cdot x)-1|\\
&\le \Big(\sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,|e(\xi\cdot x)-1|\Big)\,\|1_{A_2}\|_{L^2(Z)}\,\|\widehat{1_{A_3}}\|_{L^2(Z)}\\
&=\mathbb P_Z(A_1)\,\sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,|e(\xi\cdot x)-1|\\
&\le 2\pi\,\mathbb P_Z(A_1)\,\sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}.
\end{aligned}
\]
把它与我们对 \(f(0)\) 的下界、以及 \(f\) 的支撑结合起来,我们看出
\[
\Big\{x\in Z:\ \sup_{\xi\in Z}|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}<\mathbb P_Z(A_1)/2\pi K\Big\}\ \subseteq\ A_1+A_2+A_3 .
\]
由于当 \(\xi\in\mathrm{Spec}_{1/2\pi K}(A_1)\) 之外时 \(|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}<\mathbb P_Z(A_1)/2\pi K\) 自动满足,我们得到
\[
\Big\{x\in Z:\ \sup_{\xi\in \mathrm{Spec}_{1/2\pi K}(A_1)}|\widehat{1_{A_1}}(\xi)|\,\|\xi\cdot x\|_{\mathbf R/\mathbf Z}<\mathbb P_Z(A_1)/2\pi K\Big\}\ \subseteq\ A_1+A_2+A_3 .
\]
此外,由于对所有非零 \(\xi\) 有 \(|\widehat{1_{A_1}}(\xi)|\le \mathbb P_Z(A_1)\),我们得到(例如)
\[
\mathrm{Bohr}\big(\mathrm{Spec}_{1/2\pi K}(A_1),\,1/2\pi K\big)\ \subseteq\ A_1+A_2+A_3 .
\]
但由引理 4.36,我们可以找到 \(d=O\!\big(K^2(1+\log\tfrac1{\mathbb P_Z(A_1)})\big)\) 以及频率 \(S:=\{\eta_1,\dots,\eta_d\}\subset Z\),使得
\[\mathrm{Spec}_{1/2\pi K}(A_1)\ \subseteq\ [-1,1]^d\cdot(\eta_1,\dots,\eta_d),\]
从而由三角不等式
\[
\mathrm{Bohr}\big(S,\,1/2\pi d K\big)\ \subseteq\ \mathrm{Bohr}\big(\mathrm{Spec}_{1/2\pi K}(A_1),\,1/2\pi K\big)\ \subseteq\ A_1+A_2+A_3 .
\]
应用命题 4.23,我们可以在 \(\mathrm{Bohr}(S,1/2\pi dK)\) 中定位一个秩为 \(d\) 的真级数 \(P\),其基数至少为
\[
|P|\ \ge\ \frac{(1/2dK)^d}{d^d}\,N\ \ge\ \big(CK(1+\log(1/\mathbb P_Z(A_1)))\big)^{-CK^2(1+\log(1/\mathbb P_Z(A_1)))}\,N,
\]
结论得证。♦
证明的两步直觉
- 找一个“胖点”再平移到原点:\(f=1_{A_1}*1_{A_2}*1_{A_3}\) 的平均值是 \(\mathbb P_Z(A_1)^3\),而它只在 \(A_1+A_2+A_3\)(大小 \(\approx K|A_1|\))上非零。把“总质量”按鸽笼分到这么多点上,必有一点 \(x_0\) 的取值 \(\ge \mathbb P_Z(A_1)^2/K\)。平移后设它在 \(0\),于是 \(f(0)\) 很大。
- \(f\) 在原点附近“几乎不变” ⟹ 附近的点也在和集里:上面那串不等式说明,只要 \(x\) 让所有“大频率”\(\xi\) 的相位 \(\|\xi\cdot x\|_{\mathbf R/\mathbf Z}\) 都很小,那么 \(|f(x)-f(0)|\) 就比 \(f(0)\) 小,于是 \(f(x)>0\),即 \(x\in\mathrm{supp}(f)=A_1+A_2+A_3\)。“所有大频率相位都小的 \(x\)”正好组成一个 Bohr 集 —— 它整个被装进了和集里。
- 剩下的与定理 4.42 相同:把 Bohr 集换成 \(d\) 个基频,再用命题 4.23 在里面挖出真级数 \(P\)。♦
注意:这里 \(\|\widehat{1_{A_2}}\|_{L^2},\|\widehat{1_{A_3}}\|_{L^2}\) 这
两个加项用 Plancherel(即 \(L^2\) 范数)一次性吃掉,只剩
第三个加项 \(\widehat{1_{A_1}}\) 在外面“自由活动”,被用来控制谱外的小傅里叶系数 —— 这就是“三个加项就够”的原因。
4.7.3 只有两个加项:Bourgain 定理
上述论证至关重要地依赖于有三个或更多加项;粗略地说,其中两个加项用 Plancherel 定理处理掉,剩下至少一个加项可以自由地利用其在谱之外的傅里叶系数之小。对于两个集合之和,这套论证会严重失效[1]。尽管如此,我们仍然有可能在形如 \(A+B\) 的集合中得到相对较大的级数,因为函数 \(1_A*1_B\) 的傅里叶系数仍具有 \(\ell^1\) 型的控制。我们沿用 Bourgain [36] 的论证。我们首先给出一个建立级数存在性的方便判据。
引理 4.44(几乎周期性蕴含长级数)[36] 设 \(f:Z\to\mathbf R^+\) 是加性群 \(Z\) 上的一个非负随机变量,设 \(J\ge 1\) 为整数,并设 \(r\in Z\) 满足
\[\mathbb E_Z\max_{1\le j\le J}|T^{jr}f-f|<\mathbb E_Z f,\]
其中 \(T^{jr}f(x):=f(x-jr)\) 是 \(f\) 沿 \(jr\) 的平移。则 \(\mathrm{supp}(f)\) 包含一个长度为 \(J+1\)、公差为 \(r\) 的等差数列 \(a+[0,J]\cdot r\)。
证明. 由鸽笼原理,存在 \(x\in Z\) 使得
\[\max_{1\le j\le J}|T^{jr}f(x)-f(x)|0\)。结论得证。♦
判据的几何含义:若 \(f\) 把它的各个平移本 \(T^{jr}f\) 都“拖得不多”,则存在某点 \(x\) 处 \(f\) 与全部平移本同时为正,即 \(f(x),f(x-r),\dots,f(x-Jr)\) 全大于 \(0\)。这恰说明支撑集 \(\mathrm{supp}(f)\) 中含一条公差 \(r\)、长 \(J+1\) 的等差数列。
为应用此引理,我们需要估计形如 \(\mathbb E_Z\max_{1\le j\le J}|T^{jr}f-f|\) 的表达式。当 \(f\) 的傅里叶变换支撑在一个非结合(dissociated)集合上时,这件事很容易做到:
引理 4.45 [36] 设 \(S\subseteq Z\) 为非结合集合,设 \(f\) 是满足 \(\mathrm{supp}(\hat f)\subseteq S\) 的随机变量。则对任意非空平移集合 \(H\subset Z\) 我们有
\[\Big\|\max_{h\in H}|T^h f|\Big\|_{L^2(Z)}=O\big((1+\log|H|)^{1/2}\big)\,\|f\|_{L^2(Z)}.\]
证明. 设 \(p>2\) 为待定的大指数。则
\[
\begin{aligned}
\Big\|\max_{h\in H}|T^h f|\Big\|_{L^2(Z)}
&\le \Big\|\max_{h\in H}|T^h f|\Big\|_{L^p(Z)}
\le \Big\|\big(\textstyle\sum_{h\in H}|T^h f|^p\big)^{1/p}\Big\|_{L^p(Z)}\\
&=\Big(\sum_{h\in H}\|T^h f\|_{L^p(Z)}^p\Big)^{1/p}
\le |H|^{1/p}\,\|f\|_{L^p(Z)}\\
&\le |H|^{1/p}\,S(p)\,\|f\|_{L^2(Z)}
=O\big(|H|^{1/p}\sqrt p\big)\,\|f\|_{L^2(Z)}
\end{aligned}
\]
其中用到了 Rudin 不等式(引理 4.33)。结论现在通过设 \(p:=O(1+\log|H|)\) 而得证。♦
为什么取 \(p=O(\log|H|)\)估计里有两个互相拉扯的因子:\(|H|^{1/p}\) 随 \(p\) 增大而变小(趋于 \(1\)),而 \(\sqrt p\) 随 \(p\) 增大而变大。要让乘积 \(|H|^{1/p}\sqrt p\) 尽量小,就在两者之间取平衡:令 \(p\approx\log|H|\),则 \(|H|^{1/p}=e^{(\log|H|)/p}\approx e\) 为常数,乘积约为 \(\sqrt{\log|H|}\),这正是结论里的 \((1+\log|H|)^{1/2}\)。
Rudin 不等式 \(\|f\|_{L^p}\le S(p)\|f\|_{L^2}\)(对谱在非结合集上的 \(f\),\(S(p)=O(\sqrt p)\))是关键:它把高阶范数 \(L^p\) 反控回 \(L^2\),代价只是 \(\sqrt p\)。
通过把此引理与引理 4.35 结合,我们可以在 \(\mathrm{supp}(\hat f)\) 不是非结合集、但 \(\hat f\) 在大小上一致时得到一个估计:
引理 4.46 [36] 设 \(f\) 为随机变量,设 \(J,d>1\)。假设存在整数 \(m\) 使得对所有 \(\xi\in\mathrm{supp}(\hat f)\) 有 \(2^m\le|\hat f(\xi)|\le 2^{m+1}\)。则可以找到一个基数为 \(|S|=d\) 的集合 \(S\subset Z\),使得对所有 \(r\in Z\) 有
\[
\mathbb E_Z\max_{1\le j\le J}|T^{jr}f-f|=O\!\left(\Big(\sum_{\xi\in\mathrm{supp}(\hat f)}|\hat f(\xi)|\Big)\Big(\sqrt{\tfrac{\log J}{d}}+Jd\max_{\eta\in S}\|\eta\cdot r\|_{\mathbf R/\mathbf Z}\Big)\right).
\]
证明. 应用引理 4.35,我们可以写
\[\mathrm{supp}(\hat f)=D_1\cup\cdots\cup D_k\cup R,\]
其中 \(D_1,\dots,D_k\) 是基数为 \(d+1\) 的不相交非结合集合,而 \(R\subseteq[-1,1]^d\cdot(\eta_1,\dots,\eta_d)\)(对某个 \(S=\{\eta_1,\dots,\eta_d\}\subset Z\))。利用傅里叶变换,我们可以相应地分解 \(f=f_{D_1}+\cdots+f_{D_k}+f_R\)。由引理 4.45,对任意 \(1\le i\le k\),
\[
\begin{aligned}
\mathbb E_Z\max_{1\le j\le J}|T^{jr}f_{D_i}-f_{D_i}|
&\le 2\,\Big\|\max_{0\le j\le J}|T^{jr}f_{D_i}|\Big\|_{L^2(Z)}
\le O\big(\log^{1/2}J\,\|f_{D_i}\|_{L^2(Z)}\big)\\
&=O\Big(\log^{1/2}J\big(\textstyle\sum_{\xi\in D_i}|\hat f(\xi)|^2\big)^{1/2}\Big)
\le O\Big(\sqrt{\tfrac{\log J}{d}}\sum_{\xi\in D_i}|\hat f(\xi)|\Big),
\end{aligned}
\]
这要归功于一致性假设 \(2^m\le|\hat f(\xi)|\le 2^{m+1}\)。此外,由三角不等式、(4.24) 与关于 \(R\) 的假设,我们有
\[
\begin{aligned}
\Big\|\max_{1\le j\le J}|T^{jr}f_R-f_R|\Big\|_{L^1(Z)}
&\le \Big\|\max_{1\le j\le J}\sum_{\xi\in R}|\hat f(\xi)|\times|e(x+jr,\xi)-e(\xi\cdot x)|\Big\|_{L^1(Z)}\\
&\le \sum_{\xi\in R}|\hat f(\xi)|\max_{1\le j\le J}|e(jr,\xi)-1|\\
&\le 2\pi Jd\sum_{\xi\in R}|\hat f(\xi)|\max_{\eta\in S}\|\eta\cdot r\|_{\mathbf R/\mathbf Z}.
\end{aligned}
\]
用三角不等式把这些估计加起来,结论得证。♦
引理 4.46 在做什么它把 \(f\) 的频率支撑切成两类来处理:
- 非结合的几块 \(D_1,\dots,D_k\):每块上用引理 4.45(Rudin),得到 \(\sqrt{\log J/d}\) 的“小波动”。块越大(\(d\) 越大),相对波动越小。
- 低维盒子里的余项 \(R\):它被 \(d\) 个基频 \(S\) 的整组合覆盖;它的波动由各基频在 \(r\) 方向的转角 \(\|\eta\cdot r\|_{\mathbf R/\mathbf Z}\) 控制 —— 只要选 \(r\) 让这些转角都极小,这部分就可以忽略。
于是“总波动 \(\le\) 小项 \(+\) 可调小的项”,为下一步选 \(r\) 留出了空间。
现在我们可以证明 Bourgain 定理了。
定理 4.47(Bourgain)[36] 设 \(N\ge 1\) 为素数,设 \(A,B\) 是 \(Z_N\) 中的加性集合,满足 \(|A|,|B|\ge\delta N\),其中 \(C\big(\tfrac{\log\log N}{\log N}\big)^3<\delta\le 1\)(\(C>1\) 为某个大的绝对常数)。则 \(A+B\) 包含一个长度至少为 \(\exp\!\big((\delta\log N)^{1/3}\big)\) 的真等差数列。
证明. 可设 \(N\) 很大。通过从 \(A,B\) 中删去元素并在必要时增大 \(\delta\),可设 \(\mathbb P_Z(A)=\mathbb P_Z(B)=\delta\)。令 \(f:=1_A*1_B\),并设待定的 \(\exp\!\big((\delta\log N)^{1/3}\big)\le J0\) 成立。若我们取 \(M:=C\log J\) 与 \(d:=C\delta^{-2}\log J\)(\(C\) 充分大),则显然第一项与第三项都将小于 \(c\delta/3\)(回忆 \(J\gg 1/\delta\)),于是只需找到 \(r\neq 0\) 使得
\[\max_{\eta\in S}\|\eta\cdot r\|_{\mathbf R/\mathbf Z}<\frac{c\delta}{3Jd}<\frac{c'\delta^3}{J\log J},\]
其中 \(c'>0\) 是另一个小绝对常数。利用引理 4.20,只要
\[2^{-|S|}\Big(\frac{c'\delta^3}{J\log J}\Big)^{|S|}N>1\]
这件事就可能办到。但由于
\[|S|\le dM=O(\delta^{-2}\log^2 J),\]
我们看到,通过设 \(J:=\exp\!\big(c''(\delta\log N)^{1/3}\big)\)(\(c''\) 适当小),并利用关于 \(\delta\) 的下界假设,便可达成上式。结论得证。♦
证明的总览:参数怎样卡上的整条证明就是一场“预算分配”:总波动必须小于 \(\delta^2\)(这样引理 4.44 才给出长级数)。把波动分成三笔账,逐笔压到 \(\delta\) 量级以下:
- Rudin 项 \(\delta\sqrt{\log J/d}\):取 \(d\approx\delta^{-2}\log J\),使 \(\sqrt{\log J/d}\approx\delta\),于是此项 \(\approx\delta^2\) 量级(再乘小常数 \(c/3\))。
- 误差项 \(J\,2^{-M/2}\delta\):取 \(M\approx C\log J\),则 \(2^{-M/2}=J^{-C/2}\) 远小于 \(1/J\),此项被压垮。
- 转角项 \(\delta\cdot Jd\max_\eta\|\eta\cdot r\|\):这是唯一需要“挑 \(r\)”的项。要让它小,须找一个公共 \(r\),使 \(|S|\) 个频率 \(\eta\) 同时几乎整除 \(r\)。引理 4.20(一种 Dirichlet/鸽笼型结果)保证:只要 \(2^{-|S|}(\text{阈值})^{|S|}N>1\),这样的 \(r\) 就存在。
- 最后定 \(J\):把 \(|S|\le dM=O(\delta^{-2}\log^2 J)\) 代入第 3 步的可行性条件,解出 \(J\) 能取到 \(\exp\!\big(c''(\delta\log N)^{1/3}\big)\)。这就是级数长度里那个 \((\delta\log N)^{1/3}\) 指数的来源。
对 \(\delta\) 的下界 \(C(\log\log N/\log N)^3<\delta\) 恰好保证第 4 步的不等式 \(2^{-|S|}(\cdots)^{|S|}N>1\) 有解。
Bourgain 证明的核心动作:按傅里叶系数 \(|\hat f(\xi)|\) 的大小把全部频率分成对数级数量的层 \(\Delta_0,\Delta_1,\dots\)(每层内系数大小一致,可用引理 4.46),再把系数极小的频率全归入误差层 \(\Sigma_{\mathrm{err}}\)(直接粗暴丢掉)。分层后每层都好估,合起来即得总波动的上界。
4.7.4 后续进展与一个反例
长度 \(\exp\!\big((\delta\log N)^{1/3}\big)\) 最近被 Green [149] 改进到 \(\exp\!\big((\delta\log N)^{1/2}\big)\)(并把对 \(\delta\) 的条件略微放宽到 \(C\big(\tfrac{\log\log N}{\log N}\big)^2<\delta\)),其方法是一个有趣的变分傅里叶论证,这里我们简要勾勒如下。出发点是习题 4.3.12:取一个固定密度 \(\mathbb P_Z(E)=\beta\)(\(\beta\) 待定)的非空集合 \(E\),它与 \(A+B\) 不相交,并在上述约束下使某个量 \(\mathbb E u\) 最小;习题 4.3.12 于是给出该量 \(\mathbb E u\) 的一个下界。然后考虑 \(E\) 的 \(\alpha\)-谱 \(\Delta_\alpha(E)\)(\(\alpha\) 待定),并用引理 4.36 把这个谱装进一个级数 \([-1,1]^d\cdot(\eta_1,\dots,\eta_d)\)(对某个不太大的频率集 \(S=\{\eta_1,\dots,\eta_d\}\))。接着,从 \(E\) 中(随机地)移除少量元素,并用 \(Z\) 的一般元素替换它们;由引理 4.16,这以高概率缩小了 \(E\) 的傅里叶偏差。再接着,把这些新的一般元素沿 \(\mathrm{Bohr}(S,\rho)\) 中某个合适元素平移(\(\rho\) 适当小),试图把它们全部移到 \(A+B\) 之外。这一操作若成功,将不会显著影响 \(E\) 在大谱 \(\Delta_\alpha(E)\) 上的傅里叶变换,因而仍应缩小 \(E\) 的傅里叶偏差。但这与 \(E\) 的构造(最小性)矛盾。于是,必定无法把某个一般元素移到 \(A+B\) 之外,这意味着 \(A+B\) 必然包含 \(\mathrm{Bohr}(S,\rho)\) 的一个平移。由此并结合命题 4.23,便在 \(A+B\) 内部建立了一个大级数。关于更多细节(如参数 \(\beta,\alpha,\rho\) 的选取),见 [149]。
另一方面,Ruzsa [290] 的一个例子表明:即便 \(\delta\) 接近 \(1/2\),仍能找到一些集合,其 \(A+A\) 不包含任何长度为 \(\exp\!\big((\log N)^{2/3}\big)\) 的级数。
三个指数放在一起看
- Bourgain(定理 4.47):\(A+B\) 必含长 \(\ge\exp\!\big((\delta\log N)^{1/3}\big)\) 的级数。
- Green 改进:可提升到 \(\exp\!\big((\delta\log N)^{1/2}\big)\)。
- Ruzsa 反例:存在 \(A\)(\(\delta\approx 1/2\)),其 \(A+A\) 不含长 \(\exp\!\big((\log N)^{2/3}\big)\) 的级数。
由于 \(1/2<2/3\),可知真实答案的指数夹在 \(1/2\) 与 \(2/3\) 之间——下界 \(\exp((\log N)^{1/2})\) 与上界 \(\exp((\log N)^{2/3})\) 之间仍有
间隙,这是一个未完全解决的问题。
迭代和集内部的等差数列已在 [350] 中被深入研究;我们将在第 12 章详细讨论。
[1] 这与 Goldbach 猜想有相似之处。弱猜想——每个充分大的奇数都是三个素数之和——已用傅里叶方法解决;而强猜想——每个充分大的偶数都是两个素数之和——仍然悬而未决,并且很可能无法用纯傅里叶分析方法处理。其根源正是“两个加项”与“三个加项”的本质差别:三个加项时,可用 Plancherel 处理两个、留一个自由利用;两个加项时则没有这种余地。
习题
习题
- 4.7.1 [149] 设 \(A_1,A_2,A_3\subset[1,N]\) 是整数加性集合,满足 \(|A_1|=|A_2|=|A_3|\ge\delta N\)(对某 \(0<\delta<1/2\))。证明 \(A_1+A_1\) 包含一个长度至少为 \(\exp\!\big((\delta\log N)^{1/3}-O(\log\log N)\big)\) 的真等差数列;\(A_1+A_2+A_3\) 包含一个长度至少为 \(O\!\big(\delta^{O(1)}N^{\delta^2/\log(1/\delta)}\big)\) 的真等差数列;并且 \(2A_1-2A_1\) 包含一个长度至少为 \(O\!\big(\delta^{O(1)}N^{\delta/\log(1/\delta)}\big)\) 的真等差数列。(提示:把 \(A_1,A_2,A_3\) 嵌入某素数 \(2N
- 4.7.2 [349] 设 \(P\) 是无挠加性群中的一个真等差数列,设 \(A,B\) 是 \(P\) 中的加性集合,满足 \(|A|,|B|>(1-\varepsilon)|P|\)(对某 \(0<\varepsilon<1/4\))。证明 \(A+B\) 包含一个长度至少为 \((2-4\varepsilon)|P|-1\) 的真等差数列。(提示:考虑 \(P+P\) 中那些至少有 \(2\varepsilon|P|\) 种表示为 \(P\) 中元素之和的元素。)
返回 全书目录