Tao–Vu · 加性组合学 · 第 11 章 k>3 的 Szemerédi 定理

11.2　阻碍均匀性的硬障碍Hard obstructions to uniformity

本页为译文 + 高中讲解合一：黑色正文为忠实翻译；彩色框（目标 / 定义 / 定理 / 例 / 分步推演）与配图为面向高中生的详解，逐步推演、举例、画图，不用比喻。

本节目标上一节定义了 Gowers 均匀性范数 \(\|f\|_{U^d}\)，它衡量一个函数“有多随机、多无结构”。本节要回答一个反问题：如果一个函数不均匀（\(\|f\|_{U^{k-2}}\) 很大），那它身上一定藏着什么结构？答案是：它必定与某个多项式相位 \(e(\phi)\) 高度相关。把这个“反演定理”做得足够强，就能证明长度为 \(k\) 的 Szemerédi 定理。本节先用 \(k=3\)（线性相位）热身，再讲 \(k=4\)（二次相位）——并展示一个关键的“坏消息”：在循环群 \(\mathbb{Z}_N\) 上，全局二次相位还不够，必须引入局部二次相位。

本节考虑如下反问题（inverse problem）：设 \(f:Z\to\mathbb{C}\) 是一个模长不超过 \(1\) 的函数，它未能成为 \(k-2\) 阶 Gowers 均匀的，譬如对某个 \(0<\delta\le 1\) 有 \(\|f\|_{U^{k-2}(Z)}\ge\delta\)。那么我们能由此断定 \(f\) 具有怎样的结构信息？事实证明，对这个问题给出足够强的回答，将导向长度为 \(k\) 的等差数列的 Szemerédi 定理的一个证明。这正是 Gowers 在 [137]、[138] 中证明 Szemerédi 定理所采用的策略，其重心在于尽可能强地获得 \(U^{k-2}(Z)\) 范数的反演定理。在 11.4 节中我们将描述一种略有不同的途径：它得到的反演定理弱得多（也更易证明），但仍足以推出 Szemerédi 定理（只是定量界差很多）。

11.2.1　热身：\(k=3\) 的样板情形

\(k=3\) 的情形提供了一个很好的样板。由 (11.9) 我们看到，若 \(\|f\|_{U^2(Z)}\ge\delta\)，则 \(\|f\|_{u^2(Z)}\ge\delta^2\)，从而存在一个线性相位函数 \(g(x):=e(\xi\cdot x)\)，它与 \(f\) 有较大的内积：\(|\langle f,g\rangle_{L^2(Z)}|\ge\delta^2\)。这一事实，结合 (11.8)，可用来给出命题 10.10 或命题 10.11 的一个变体；后者又可分别用在密度增量论证或能量增量论证中，从而证明 Szemerédi 定理的 \(k=3\) 情形——正如 10.2 节、10.3 节以及 10.5 节中所做的那样。我们可以把这些线性相位函数看作是阻碍“一阶 Gowers 均匀性”的障碍：刚才看到，一阶 Gowers 均匀性的失效蕴含了与某个线性相位函数的相关；反过来，(11.9) 中的另一个不等式则表明，与某个线性相位函数相关蕴含了一阶 Gowers 均匀性的缺失。

例：把 \(k=3\) 的逻辑捋顺

这里“相位”指的是模长恒为 \(1\) 的复数 \(e(\theta):=e^{2\pi i\theta}\)。“线性相位”就是 \(g(x)=e(\xi\cdot x)\)，它在 \(x\) 上以匀速旋转。逻辑链条是一个双向的等价：

“不均匀 \(\Rightarrow\) 有结构”：\(\|f\|_{U^2}\ge\delta\)（说明 \(f\) 不够随机）\(\Rightarrow\) 存在线性相位 \(g\) 与 \(f\) 相关，\(|\langle f,g\rangle|\ge\delta^2\)（说明 \(f\) 里藏着一段匀速旋转）。
“有结构 \(\Rightarrow\) 不均匀”：反过来，若 \(f\) 与某个线性相位相关，则 \(f\) 必然不是一阶均匀的。
所以“线性相位”恰好就是阻碍一阶均匀性的全部障碍。证 \(k=3\) 的 Szemerédi 定理，只需抓住这一个障碍，反复做密度增量即可。

这个样板情形，结合习题 11.1.12 中的观察，提示我们：更一般地，\(k-2\) 阶 Gowers 均匀性的缺失，应当与一个“在某种意义下是 \(k-2\) 次多项式”的相位函数的相关性挂钩。这一想法可以精确化如下。

11.2.2　多项式相位与多项式偏倚

定义 11.5（多项式偏倚 polynomial bias）设 \(Z\) 是一个有限加性群，\(\phi:Z\to\mathbb{R}/\mathbb{Z}\) 是一个相位函数。对任意 \(h\in Z\)，定义作用在 \(\phi\) 上的差分算子 \((h\cdot\nabla)\) 为 \[(h\cdot\nabla)\phi(x):=\phi(x+h)-\phi(x).\] 有时我们会在 \(\nabla\) 上加下标 \(\nabla_x\)，以强调所差分的变量（当 \(\phi\) 还依赖于别的变量时）。若 \(d\ge 1\)，则称 \(\phi\) 为次数小于 \(d\) 的相位多项式（phase polynomial of degree less than \(d\)），如果 \[(h_1\cdot\nabla_x)\cdots(h_d\cdot\nabla_x)\phi(x)=0\quad\text{对所有 }x,h_1,\dots,h_d\in Z.\] 次数小于 \(2\) 的相位多项式称为线性的，次数小于 \(3\) 的称为二次的，依此类推。若 \(f:Z\to\mathbb{C}\) 是一个函数，则定义 \(f\) 的 \(d\) 次多项式偏倚为 \[\|f\|_{u^d(Z)}:=\sup_{\phi}\big|\langle f,e(\phi)\rangle_{L^2(Z)}\big|=\sup_{\phi}\big|\mathbb{E}_{x\in Z}\,f(x)e(-\phi(x))\big|,\] 其中 \(\phi\) 取遍所有次数小于 \(d\) 的相位多项式。

更一般地，若 \(B\subset Z\) 非空，则称 \(\phi:B\to\mathbb{R}/\mathbb{Z}\) 是 \(B\) 上次数小于 \(d\) 的局部多项式相位函数，如果 \[(h_1\cdot\nabla_x)\cdots(h_d\cdot\nabla_x)\phi(x)=0\quad\text{只要 }x+[0,1]^d\cdot(h_1,\dots,h_d)\subseteq B,\] 并随之定义 \[\|f\|_{u^d(B)}:=\sup_{\phi}\big|\langle f,e(\phi)\rangle_{L^2(B)}\big|=\sup_{\phi}\big|\mathbb{E}_{x\in B}\,f(x)e(-\phi(x))\big|,\] 其中 \(\phi\) 取遍所有在 \(B\) 上次数小于 \(d\) 的局部多项式相位函数。

把“差分算子”和“相位多项式”讲透

差分算子 \((h\cdot\nabla)\) 就是离散版的求导：把 \(x\) 挪动一步 \(h\)，看相位变了多少。关键事实是：对普通多项式而言，求一次（差分）一次降一次。我们用最熟悉的二次函数 \(p(x)=x^2\) 来看（这里取 \(h=1\)）：

原函数：\(p(x)=x^2\)。
差一次：\((1\cdot\nabla)p(x)=(x+1)^2-x^2=2x+1\)——降为一次。
差两次：\((1\cdot\nabla)(2x+1)=\big(2(x+1)+1\big)-(2x+1)=2\)——降为常数。
差三次：\((1\cdot\nabla)\,2=2-2=0\)——归零。

所以“三次差分恒为零”\(\iff\)“次数 \(\le 2\)（即次数小于 \(3\)）”。定义 11.5 把这个再熟悉不过的现象搬到了任意有限群上，并允许在不同方向 \(h_1,\dots,h_d\) 上各差一次。一个 \(d\) 重差分恒为零，就把“\(\phi\) 是次数小于 \(d\) 的多项式”这件事说清楚了——而且不需要群上本来就有“乘法”或“幂”。

“次数小于 \(3\)（即二次）” \(\iff\) “第三次差分全为 \(0\)”。定义 11.5 中的 \((h_1\cdot\nabla)\cdots(h_d\cdot\nabla)\phi=0\) 就是这张表的群上推广。

为说明此定义，首先注意到次数小于 \(1\) 的相位多项式只有常数 \(\phi(x)=c\)，于是 \[\|f\|_{u^1(Z)}=|\mathbb{E}(f)|=\|f\|_{U^1(Z)}.\tag{11.10}\] 因此 \(\|\cdot\|_{u^1(Z)}\) 是一个半范数。对 \(d>1\)，容易验证 \(\|\cdot\|_{u^d(Z)}\) 是一个真正的范数。例如，由习题 4.1.4，次数小于 \(2\) 的相位多项式只有线性相位 \(\phi(x)=\xi\cdot x+c\)，于是 \(u^2\) 范数的定义与 (10.5) 中给出的定义吻合。特别地，我们仍然有关系式 (11.9)。

更一般地，\(u^d(Z)\) 与 \(U^d(Z)\) 范数关系密切，享有相同的对称性。例如，若 \(\phi\) 是次数小于 \(d\) 的相位多项式，则容易验证 \[\|f\,e(-\phi)\|_{u^d(Z)}=\|f\|_{u^d(Z)};\qquad \|f\,e(-\phi)\|_{U^d(Z)}=\|f\|_{U^d(Z)}.\tag{11.11}\] 特别地，由 (11.7) 我们有 \[|\mathbb{E}_{x\in Z}f(x)e(-\phi(x))|=\|f\,e(-\phi)\|_{U^1(Z)}\le\|f\,e(-\phi)\|_{U^d(Z)}=\|f\|_{U^d(Z)},\] 于是对 \(\phi\) 取上确界便得 \[\|f\|_{u^d(Z)}\le\|f\|_{U^d(Z)}.\] 因此，与一个次数小于 \(d\) 的相位函数相关，蕴含了 \(d-1\) 阶 Gowers 均匀性的缺失。鉴于 (11.10)、(11.9)，人们可以期望逆命题也成立，即 \(d-1\) 阶 Gowers 均匀性的缺失蕴含与某个次数小于 \(d\) 的相位的相关。朝这个方向的一个鼓舞人心的迹象是恒等式 \[\|e(\phi)\|_{U^d(Z)}^{2^d}=\mathbb{E}_{x,h_1,\dots,h_d\in Z}\,e\big((h_1\cdot\nabla_x)\cdots(h_d\cdot\nabla_x)\phi(x)\big),\tag{11.12}\] 其验证留作习题。这表明（尽管并未真正证明）：一个函数具有大的 \(U^d(Z)\) 范数，当且仅当其相位“近似地”是次数小于 \(d\) 的多项式。上述命题于是就成为一个断言：一个近似为 \(d\) 次多项式的相位，事实上与一个真正的 \(d\) 次多项式相关。这样的断言应当让人想起 Balog–Szemerédi–Gowers 定理（定理 2.29）——事实上，该定理在建立诸如此类的事实时扮演了关键角色。

为什么 (11.12) 是“鼓舞人心的迹象”

把 (11.12) 看清楚：左边是相位函数 \(e(\phi)\) 的 \(U^d\) 范数（的 \(2^d\) 次方）；右边是对 \(\phi\) 做 \(d\) 重差分后再取相位的平均。

若 \(\phi\) 是真正次数小于 \(d\) 的多项式，则 \(d\) 重差分 \(\equiv 0\)，右边的指数全是 \(e(0)=1\)，平均为 \(1\)，故 \(\|e(\phi)\|_{U^d}=1\)（最大）。
反之若 \(\|e(\phi)\|_{U^d}\) 很大（接近 \(1\)），说明 \(d\) 重差分 \(e(\cdots)\) 的平均很大，即 \(d\) 重差分“多半接近 \(0\)”——也就是 \(\phi\) “近似地”是多项式。
难点正在于“近似多项式”\(\Rightarrow\)“与真多项式相关”这一步。这一步并非显然，需要 Balog–Szemerédi–Gowers 这类“把近似结构提纯成真结构”的重型工具。

11.2.3　有限域情形的 \(U^3\) 反演定理（\(k=4\)）

当 \(Z\) 是小阶有限域上的向量空间、且 \(k=4\) 时，我们可以把这些猜想肯定地形式化如下。

定理 11.6（\(U^3(\mathbb{F}^n)\) 的反演定理）[137],[160]设 \(Z\) 是有限域 \(\mathbb{F}\) 上的向量空间，\(f:Z\to\mathbb{C}\) 模长不超过 \(1\)，且对某个 \(0<\eta\le 1\) 有 \(\|f\|_{U^3(Z)}\ge\eta\)。则存在子空间 \(W\subset Z\)，满足 \[\dim_{\mathbb{F}}(W)\ge\dim_{\mathbb{F}}(Z)-O\!\big(\eta^{-O(1)}\big),\tag{11.13}\] 使得 \[\mathbb{E}_{y\in Z}\,\|f\|_{u^3(y+W)}=\Omega\!\big(\eta^{O(1)}\big).\tag{11.14}\] 特别地，存在 \(y\in Z\) 使得 \(\|f\|_{u^3(y+W)}\ge\Omega(\eta^{O(1)})\)。

这个反演定理的证明相当冗长，用到了前几章的技术，并大量倚重 Fourier 分析方法与 van der Corput 引理（引理 11.3），将推迟到下一节给出。我们指出，上述引文中的论文并未完全处理 \(\mathbb{F}\) 的特征为 \(2\) 的情形，那需要 Samorodnitsky 的一个额外观察（私人通信）。暂且承认它，我们现在便可对向量空间 \(Z\) 在 \(k=4\) 情形证明 Szemerédi 定理。事实上，这个反演定理使我们既能给出密度增量证明，也能给出能量增量证明。密度增量证明基于下面的命题，它类似于（虽然在某些方面比之略弱）引理 10.15。

命题 11.7（均匀性缺失蕴含密度增量）设 \(Z\) 是奇素数阶有限域 \(\mathbb{F}\) 上的向量空间，\(f:Z\to\mathbb{C}\) 模长不超过 \(1\)，满足 \(\mathbb{E}_Z(f)=0\) 且对某个 \(0<\eta\le 1\) 有 \(\|f\|_{U^3(Z)}\ge\eta\)。则存在 \(Z\) 的子空间 \(Z'\)，满足 \[\dim_{\mathbb{F}}(Z')\ge\tfrac12\dim(Z)-O\!\big(\eta^{-O(1)}\big),\] 以及一点 \(x_0\in Z\)，使得 \[\Big|\mathbb{E}_{x\in x_0+Z'}f(x)\Big|\ge\Omega\!\big(\eta^{O(1)}\big).\]

证明. 由定理 11.6 可找到满足维数界 (11.13) 与相关界 (11.14) 的子空间 \(W\)。又注意到，若哪怕对单独一个 \(y\in Z\) 有 \(|\mathbb{E}_{y+W}(f)|\ge\Omega(\eta^{O(1)})\)，我们就已完成证明，因此可设对给定的绝对常数 \(c,C>0\) 有 \(|\mathbb{E}_{y+W}(f)|\le c\eta^C\)。由于还有 \[\mathbb{E}_{y\in Z}\,\mathbb{E}_{y+W}(f)=\mathbb{E}_Z(f)=0,\] 我们得到 \[\mathbb{E}_{y\in Z}|\mathbb{E}_{y+W}(f)|=2\,\mathbb{E}_{y\in Z}\max(\mathbb{E}_{y+W}(f),0)\le 2c\eta^C,\] 于是由 (11.14)（适当选取常数 \(c,C\)）有 \[\mathbb{E}_{y\in Z}\Big(\|f\|_{u^3(y+W)}-2|\mathbb{E}_{y+W}(f)|\Big)=\Omega\!\big(\eta^{O(1)}\big).\]

特别地可找到 \(y\in Z\) 使得 \(\|f\|_{u^3(y+W)}\ge 2|\mathbb{E}_{y+W}(f)|+\Omega(\eta^{O(1)})\)。必要时把 \(f\) 平移 \(y\)，可取 \(y=0\)。
由 \(u^3\) 范数的定义及习题 11.2.6，可找到自伴线性算子 \(M:W\to W\) 与 \(\xi\in W\) 使得 \[\big|\mathbb{E}_{x\in W}f(x)e(-Mx\cdot x)e(-\xi\cdot x)\big|\ge 2|\mathbb{E}_W(f)|+\Omega(\eta^{O(1)}).\] 这里 \(Mx\cdot x+\xi\cdot x\) 正是一个二次相位。
量 \(Mx\cdot x+\xi\cdot x\) 至多取 \(|\mathbb{F}|\) 个值。于是把 \(W\) 划分为 \(|\mathbb{F}|\) 个水平集 \(S_1,\dots,S_{|\mathbb{F}|}\)，每个形如 \(\{x\in W:Mx\cdot x+\xi\cdot x=\text{常数}\}\)。由三角不等式 \[\sum_{j=1}^{|\mathbb{F}|}|\mathbb{E}_x 1_{S_j}(x)f(x)|\ge 2\sum_{j=1}^{|\mathbb{F}|}\mathbb{E}_W(1_{S_j}(x)f(x))+\Omega(\eta^{O(1)}),\] 进而由恒等式 \(\max(y,0)=(|y|+y)/2\)， \[\sum_{j=1}^{|\mathbb{F}|}\max\big(\mathbb{E}_x 1_{S_j}(x)f(x),0\big)>\Omega(\eta^{O(1)}),\] 故由鸽巢原理可找到 \(j\) 使得 \(\mathbb{E}_x 1_{S_j}(x)f(x)>\Omega(\eta^{O(1)})\,\mathbb{P}_W(S_j)\)。
现在需把二次曲面 \(S_j\) 划分为仿射空间。先观察到存在 \(W\) 的子空间 \(U\)，维数 \[\dim_{\mathbb{F}}(U)\ge\tfrac12\dim_{\mathbb{F}}(W)-\tfrac32\ge\tfrac12\dim_{\mathbb{F}}(W)-O(\eta^{-O(1)}),\] 且关于 \(M\) 是零化的（null）：见习题 4.3.16。把 \(S_j\) 沿 \(U\) 的陪集分裂，由鸽巢原理存在某陪集 \(x_1+U\) 使得 \[\mathbb{E}_{x\in x_1+U}1_{S_j}(x)f(x)>\Omega(\eta^{O(1)})\,\mathbb{P}_{x_1+U}(S_j),\] 于是特别地 \(S_j\cap(x_1+U)\) 非空，且 \(|\mathbb{E}_{x\in S_j\cap(x_1+U)}f(x)|>\Omega(\eta^{O(1)})\)。
在零空间的陪集 \(x_1+U\) 上工作的妙处在于：此时 \(Mx\cdot x+\xi\cdot x\) 关于 \(x\) 变成了线性的。因此 \(S_j\) 与 \(x_1+U\) 的交集是 \(x_1+U\) 中余维数至多为 \(1\) 的仿射子空间 \(x_0+Z'\)。结论得证。♦

二次相位 \(Mx\cdot x\) 一般是弯曲的；但在 \(M\) 的零空间 \(U\) 的一个陪集上，\(x\mapsto Mx\cdot x\) 退化为线性，弯曲的曲面被“拉直”成仿射子空间——\(f\) 在其上有密度增量。

像 Roth 定理证明中那样迭代此命题，最终可推出界 \[r_4(\mathbb{F}^n)=O\!\Big(\frac{|\mathbb{F}|^n}{\log^c n}\Big)\tag{11.15}\] 对所有 \(n>1\) 及某个绝对常数 \(c\) 成立。也可以改写 10.5 节的能量增量论证，把“拟周期”的概念替换为“由有界个数的二次相位函数所决定”，不过这样得到的 \(r_4(\mathbb{F}^n)\) 的界相当差。改写定理 10.27 中的论证可稍有改进，得到界 \[r_4(\mathbb{F}^n)=O\!\Big(\frac{|\mathbb{F}|^n}{n^c}\Big);\] 见 [161]。上述反演理论很可能可推广到更高的 \(k\) 值，但在实施中存在若干技术困难，截至本书写作时尚未实现。

11.2.4　坏消息：循环群上需要局部二次相位

鉴于反演 \(U^3\) 途径在有限域情形的成功，人们自然会想知道：类似的反演定理对其他群（例如循环群 \(\mathbb{Z}_N\)）是否成立。这里会遇到一个有趣的现象，即：\(\mathbb{Z}_N\) 上的二次相位函数并不构成阻碍二阶 Gowers 均匀性的完整障碍集合。一个例子如下。

命题 11.8（Furstenberg–Weiss 例子）设 \(N\) 是一个大整数，\(M:=\lfloor\sqrt{N}\rfloor\)，\(\alpha\) 是一个满足丢番图条件 \(\|n\alpha\|_{\mathbb{R}/\mathbb{Z}}=\Omega(n^{-C})\)（对某个常数 \(C>0\)）的无理数。定义函数 \(f:\mathbb{Z}_N\to\mathbb{C}\) 为：当 \(x\in[0,M/10)+M\cdot[0,M/10)\) 时 \(f(x):=e(\alpha x^2/M^2)\)，否则 \(f(x):=0\)。则 \(\|f\|_{U^3(\mathbb{Z}_N)}=\Omega(1)\)，但 \(\|f\|_{u^3(\mathbb{Z}_N)}=o_{N\to\infty;\alpha}(1)\)。

正如其名，这个例子本质上是 Furstenberg 和 Weiss [126] 发现的，尽管他们用的语言与这里所呈现的大不相同（他们为四重回归构造了一个特征因子，它并非由二次本征函数给出）。

先看清这个反例的“盒子”结构

取 \(N=10000\)，则 \(M=\lfloor\sqrt{N}\rfloor=100\)，\(M/10=10\)。把每个 \(x\in\{0,1,\dots,N-1\}\) 唯一写成 \(x=yM+z\)，\(z\in[0,M)\) 是“个位段”，\(y=\lfloor x/M\rfloor\) 是“高位段”。集合 \(P:=[0,M/10)+M\cdot[0,M/10)\) 就是要求 \(y,z\) 都落在 \([0,10)\) 里——这是一个 \(10\times 10\) 的方盒，只占满群的极小一角。\(f\) 在盒内是二次相位 \(e(\alpha x^2/M^2)\)，盒外为 \(0\)。

\(P\) 是 \(y,z\in[0,M/10)\) 的小方盒。\(f\) 的相位在盒内沿 \(y\) 方向像 \(\alpha y^2\) 一样二次增长——这是一种只在盒内成立的“局部二次”结构，无法被任何全局二次相位捕捉。

证明（梗概）. 可把 \(f(x)=e(\phi(x))1_P(x)\) 写出，其中 \(P:=[0,M/10)+M\cdot[0,M/10)\) 是等差数列（方盒），\(\phi\) 是相位函数 \(\phi(x):=\alpha x^2/M^2\)。

容易验证 \(\phi\) 在 \(P\) 上是局部二次的，从而由 (11.11)、(11.7) \[\|f\|_{U^3(\mathbb{Z}_N)}=\|1_P\|_{U^3(\mathbb{Z}_N)}\ge\|1_P\|_{U^1(\mathbb{Z}_N)}=\mathbb{P}_{\mathbb{Z}_N}(P)=\Omega(1).\] 另一方面，由于 \(f\) 模长不超过 \(1\)，有 \(\|f\|_{U^3(\mathbb{Z}_N)}\le 1\)。故 \(\|f\|_{U^3(\mathbb{Z}_N)}=\Theta(1)\)（即 \(\Omega(1)\)），如所言。
为证第二个论断，由习题 11.2.2 可知，只需证明对所有整数 \(c_0,c_1,c_2\)， \[\mathbb{E}_{x\in\mathbb{Z}_N}\,e\big(\phi(x)+(c_2x^2+c_1x+c_0)/N\big)1_P(x)=o_{N\to\infty;\alpha}(1).\]
把 \(x=yM+z\)（\(y,z\in[0,M/10)\)）代入，只需证明 \[\mathbb{E}_{y,z\in[0,M/10)}\,e\big(\alpha y^2+(c_2(yM+z)^2+c_1(yM+z)+c_0)/N\big)=o_{N\to\infty;\alpha}(1).\]
估计此和有两种选择。其一：在 \(y\) 变量上两次施用 van der Corput 引理（习题 11.2.9，取 \(H_1=M^{1-\varepsilon}\)、\(H_2=M^{1-2\varepsilon}\)，\(\varepsilon\) 小），归结为证明 \[\mathbb{E}_{h_1\in[1,H_1],h_2\in[1,H_2]}\,e\big(2(\alpha+c_2M^2)h_1h_2\big)=o_{N\to\infty;\alpha}(1);\] 其二：在 \(y\) 变量上施用一次 van der Corput 引理、在 \(z\) 变量上施用一次，归结为证明 \[\mathbb{E}_{h_1\in[1,H_1],h_2\in[1,H_2]}\,e\big(2c_2Mh_1h_2\big)=o_{N\to\infty;\alpha}(1).\]
这两个界都不关于 \(c_2\) 一致成立，但事实证明两者中总有一个成立：当 \(c_2M\) 不在距某个分母至多为 \(M^{O(\varepsilon)}\) 的有理数 \(M^{-2+O(\varepsilon)}\) 范围内时（“次要弧”情形），后者成立；在其互补的“主要弧”情形，前者成立。这些界的精确验证需要丢番图逼近的一些基本工具，但我们略去，因为它有些繁琐。♦

这个例子表明：除了在有限域情形出现的全局二次相位障碍之外，我们现在还必须考虑局部二次相位障碍——它们只定义在群中一个适当的等差数列（譬如 \([0,M/10)+M\cdot[0,M/10)\)）上。另一种做法是用 Bohr 集替换等差数列，二者当然密切相关（参见 4.4 节）。这种设定下一个典型的反演定理如下。

定理 11.9（\(U^3(Z)\) 的反演定理）[160]设 \(Z\) 是一个奇数阶有限加性群，\(f:Z\to\mathbb{C}\) 模长不超过 \(1\)，满足 \(\|f\|_{U^3(Z)}\ge\eta\)。则在 \(G\) 中存在一个正则 Bohr 集 \(B:=B(S,\rho)\)，满足 \(|S|\le O(\eta^{-O(1)})\) 且 \(\rho=\Omega(\eta^{O(1)})\)，使得 \[\mathbb{E}_{y\in Z}\,\|f\|_{u^3(y+B)}=\Omega\!\big(\eta^{O(1)}\big).\tag{11.16}\] 特别地，存在 \(y\in Z\) 使得 \(\|f\|_{u^3(y+B)}=\Omega(\eta^{O(1)})\)。

此定理的证明类似于我们下文给出的定理 11.6 的证明，但更复杂一些，因为我们必须用（正则）Bohr 集而非子空间来工作（这最终源于对任意群应用 Chang 定理（定理 4.42）的一个版本）。它随后可用来证明：

命题 11.10（均匀性缺失蕴含密度增量）[137],[138]设 \(Z=\mathbb{Z}_N\) 是奇素数阶循环群，\(f:Z\to\mathbb{C}\) 模长不超过 \(1\)，满足 \(\mathbb{E}_Z(f)=0\) 且对某个 \(0<\eta\le 1\) 有 \(\|f\|_{U^3(Z)}\ge\eta\)。若 \(N\ge\exp(O(\eta^{-O(1)}))\)，则 \(Z\) 中存在一个真等差数列 \(P\)，其长度为 \(|P|=\Omega(N^c)\)（对某个绝对常数 \(0

这一结果最早由 Gowers¹ [137]、[138] 建立，他并未直接证明一个反演定理。然而，[160] 中定理 11.9 的证明方法几乎完全建立在 [137] 中用来建立命题 11.10 的技术之上。通过通常的迭代论证，此命题可用来建立界 \[r_4(\mathbb{Z}_N)=O\!\Big(\frac{N}{(\log\log N)^c}\Big)\] 对某个绝对常数 \(0

脚注 1[137] 中的原始论证对 \(\mathbb{E}_{x\in P}f(x)\) 是关于 \(\eta\) 的指数依赖而非多项式依赖，最终导致 \(r_4(\mathbb{Z}_N)\) 的较弱界 \(O\!\big(\tfrac{N}{(\log\log\log N)^c}\big)\)。这是由于依赖了 Freiman 定理而非 Chang–Bogolyubov 型定理；问题在于所采用的 Freiman 定理（本质上是定理 5.32）在一个不利的位置遭受了指数损失。

习题

11.2.1　证明 (11.11)。
11.2.2　设 \(\mathbb{Z}_N\) 是循环群（因而也是一个环），\(\phi:\mathbb{Z}_N\to\mathbb{R}/\mathbb{Z}\) 是次数小于 \(d\) 的相位多项式。证明存在 \(c_0,c_1,\dots,c_{d-1}\in\mathbb{Z}_N\) 使得 \(\phi(x)=(c_{d-1}x^{d-1}+\cdots+c_1x+c_0)/N\) 对所有 \(x\in\mathbb{Z}_N\) 成立，其中映射 \(x\mapsto x/N\) 以显然的方式从 \(\mathbb{Z}_N\) 定义到 \(\mathbb{R}/\mathbb{Z}\)。反之，每个这种形式的函数都是次数小于 \(d\) 的相位多项式。因此在循环群情形，相位多项式的概念退化为通常的多项式定义。
11.2.3　证明 (11.12)。（你可能需要反射其中一些变量或取共轭，以消去 \((-1)^d\) 因子。）
11.2.4　设 \(f:Z\to\mathbb{C}\) 模长不超过 \(1\)，\(d\ge 1\)。证明 \(\|f\|_{u^d(Z)},\|f\|_{U^d(Z)}\le 1\)，并且 \(\|f\|_{u^d(Z)}=1\) 当且仅当 \(\|f\|_{U^d(Z)}=1\)。

返回全书目录

11.2.1 热身：\(k=3\) 的样板情形

11.2.2 多项式相位与多项式偏倚

11.2.3 有限域情形的 \(U^3\) 反演定理（\(k=4\)）

11.2.4 坏消息：循环群上需要局部二次相位

习题

11.2.1　热身：\(k=3\) 的样板情形

11.2.2　多项式相位与多项式偏倚

11.2.3　有限域情形的 \(U^3\) 反演定理（\(k=4\)）

11.2.4　坏消息：循环群上需要局部二次相位