11.2 阻碍均匀性的硬障碍Hard obstructions to uniformity
本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 定义 / 定理 / 例 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。
本节考虑如下反问题(inverse problem):设 \(f:Z\to\mathbb{C}\) 是一个模长不超过 \(1\) 的函数,它未能成为 \(k-2\) 阶 Gowers 均匀的,譬如对某个 \(0<\delta\le 1\) 有 \(\|f\|_{U^{k-2}(Z)}\ge\delta\)。那么我们能由此断定 \(f\) 具有怎样的结构信息?事实证明,对这个问题给出足够强的回答,将导向长度为 \(k\) 的等差数列的 Szemerédi 定理的一个证明。这正是 Gowers 在 [137]、[138] 中证明 Szemerédi 定理所采用的策略,其重心在于尽可能强地获得 \(U^{k-2}(Z)\) 范数的反演定理。在 11.4 节中我们将描述一种略有不同的途径:它得到的反演定理弱得多(也更易证明),但仍足以推出 Szemerédi 定理(只是定量界差很多)。
11.2.1 热身:\(k=3\) 的样板情形
\(k=3\) 的情形提供了一个很好的样板。由 (11.9) 我们看到,若 \(\|f\|_{U^2(Z)}\ge\delta\),则 \(\|f\|_{u^2(Z)}\ge\delta^2\),从而存在一个线性相位函数 \(g(x):=e(\xi\cdot x)\),它与 \(f\) 有较大的内积:\(|\langle f,g\rangle_{L^2(Z)}|\ge\delta^2\)。这一事实,结合 (11.8),可用来给出命题 10.10 或命题 10.11 的一个变体;后者又可分别用在密度增量论证或能量增量论证中,从而证明 Szemerédi 定理的 \(k=3\) 情形——正如 10.2 节、10.3 节以及 10.5 节中所做的那样。我们可以把这些线性相位函数看作是阻碍“一阶 Gowers 均匀性”的障碍:刚才看到,一阶 Gowers 均匀性的失效蕴含了与某个线性相位函数的相关;反过来,(11.9) 中的另一个不等式则表明,与某个线性相位函数相关蕴含了一阶 Gowers 均匀性的缺失。
这里“相位”指的是模长恒为 \(1\) 的复数 \(e(\theta):=e^{2\pi i\theta}\)。“线性相位”就是 \(g(x)=e(\xi\cdot x)\),它在 \(x\) 上以匀速旋转。逻辑链条是一个双向的等价:
- “不均匀 \(\Rightarrow\) 有结构”:\(\|f\|_{U^2}\ge\delta\)(说明 \(f\) 不够随机)\(\Rightarrow\) 存在线性相位 \(g\) 与 \(f\) 相关,\(|\langle f,g\rangle|\ge\delta^2\)(说明 \(f\) 里藏着一段匀速旋转)。
- “有结构 \(\Rightarrow\) 不均匀”:反过来,若 \(f\) 与某个线性相位相关,则 \(f\) 必然不是一阶均匀的。
- 所以“线性相位”恰好就是阻碍一阶均匀性的全部障碍。证 \(k=3\) 的 Szemerédi 定理,只需抓住这一个障碍,反复做密度增量即可。
这个样板情形,结合习题 11.1.12 中的观察,提示我们:更一般地,\(k-2\) 阶 Gowers 均匀性的缺失,应当与一个“在某种意义下是 \(k-2\) 次多项式”的相位函数的相关性挂钩。这一想法可以精确化如下。
11.2.2 多项式相位与多项式偏倚
更一般地,若 \(B\subset Z\) 非空,则称 \(\phi:B\to\mathbb{R}/\mathbb{Z}\) 是 \(B\) 上次数小于 \(d\) 的局部多项式相位函数,如果 \[(h_1\cdot\nabla_x)\cdots(h_d\cdot\nabla_x)\phi(x)=0\quad\text{只要 }x+[0,1]^d\cdot(h_1,\dots,h_d)\subseteq B,\] 并随之定义 \[\|f\|_{u^d(B)}:=\sup_{\phi}\big|\langle f,e(\phi)\rangle_{L^2(B)}\big|=\sup_{\phi}\big|\mathbb{E}_{x\in B}\,f(x)e(-\phi(x))\big|,\] 其中 \(\phi\) 取遍所有在 \(B\) 上次数小于 \(d\) 的局部多项式相位函数。
差分算子 \((h\cdot\nabla)\) 就是离散版的求导:把 \(x\) 挪动一步 \(h\),看相位变了多少。关键事实是:对普通多项式而言,求一次(差分)一次降一次。我们用最熟悉的二次函数 \(p(x)=x^2\) 来看(这里取 \(h=1\)):
- 原函数:\(p(x)=x^2\)。
- 差一次:\((1\cdot\nabla)p(x)=(x+1)^2-x^2=2x+1\)——降为一次。
- 差两次:\((1\cdot\nabla)(2x+1)=\big(2(x+1)+1\big)-(2x+1)=2\)——降为常数。
- 差三次:\((1\cdot\nabla)\,2=2-2=0\)——归零。
所以“三次差分恒为零”\(\iff\)“次数 \(\le 2\)(即次数小于 \(3\))”。定义 11.5 把这个再熟悉不过的现象搬到了任意有限群上,并允许在不同方向 \(h_1,\dots,h_d\) 上各差一次。一个 \(d\) 重差分恒为零,就把“\(\phi\) 是次数小于 \(d\) 的多项式”这件事说清楚了——而且不需要群上本来就有“乘法”或“幂”。
为说明此定义,首先注意到次数小于 \(1\) 的相位多项式只有常数 \(\phi(x)=c\),于是 \[\|f\|_{u^1(Z)}=|\mathbb{E}(f)|=\|f\|_{U^1(Z)}.\tag{11.10}\] 因此 \(\|\cdot\|_{u^1(Z)}\) 是一个半范数。对 \(d>1\),容易验证 \(\|\cdot\|_{u^d(Z)}\) 是一个真正的范数。例如,由习题 4.1.4,次数小于 \(2\) 的相位多项式只有线性相位 \(\phi(x)=\xi\cdot x+c\),于是 \(u^2\) 范数的定义与 (10.5) 中给出的定义吻合。特别地,我们仍然有关系式 (11.9)。
更一般地,\(u^d(Z)\) 与 \(U^d(Z)\) 范数关系密切,享有相同的对称性。例如,若 \(\phi\) 是次数小于 \(d\) 的相位多项式,则容易验证 \[\|f\,e(-\phi)\|_{u^d(Z)}=\|f\|_{u^d(Z)};\qquad \|f\,e(-\phi)\|_{U^d(Z)}=\|f\|_{U^d(Z)}.\tag{11.11}\] 特别地,由 (11.7) 我们有 \[|\mathbb{E}_{x\in Z}f(x)e(-\phi(x))|=\|f\,e(-\phi)\|_{U^1(Z)}\le\|f\,e(-\phi)\|_{U^d(Z)}=\|f\|_{U^d(Z)},\] 于是对 \(\phi\) 取上确界便得 \[\|f\|_{u^d(Z)}\le\|f\|_{U^d(Z)}.\] 因此,与一个次数小于 \(d\) 的相位函数相关,蕴含了 \(d-1\) 阶 Gowers 均匀性的缺失。鉴于 (11.10)、(11.9),人们可以期望逆命题也成立,即 \(d-1\) 阶 Gowers 均匀性的缺失蕴含与某个次数小于 \(d\) 的相位的相关。朝这个方向的一个鼓舞人心的迹象是恒等式 \[\|e(\phi)\|_{U^d(Z)}^{2^d}=\mathbb{E}_{x,h_1,\dots,h_d\in Z}\,e\big((h_1\cdot\nabla_x)\cdots(h_d\cdot\nabla_x)\phi(x)\big),\tag{11.12}\] 其验证留作习题。这表明(尽管并未真正证明):一个函数具有大的 \(U^d(Z)\) 范数,当且仅当其相位“近似地”是次数小于 \(d\) 的多项式。上述命题于是就成为一个断言:一个近似为 \(d\) 次多项式的相位,事实上与一个真正的 \(d\) 次多项式相关。这样的断言应当让人想起 Balog–Szemerédi–Gowers 定理(定理 2.29)——事实上,该定理在建立诸如此类的事实时扮演了关键角色。
把 (11.12) 看清楚:左边是相位函数 \(e(\phi)\) 的 \(U^d\) 范数(的 \(2^d\) 次方);右边是对 \(\phi\) 做 \(d\) 重差分后再取相位的平均。
- 若 \(\phi\) 是真正次数小于 \(d\) 的多项式,则 \(d\) 重差分 \(\equiv 0\),右边的指数全是 \(e(0)=1\),平均为 \(1\),故 \(\|e(\phi)\|_{U^d}=1\)(最大)。
- 反之若 \(\|e(\phi)\|_{U^d}\) 很大(接近 \(1\)),说明 \(d\) 重差分 \(e(\cdots)\) 的平均很大,即 \(d\) 重差分“多半接近 \(0\)”——也就是 \(\phi\) “近似地”是多项式。
- 难点正在于“近似多项式”\(\Rightarrow\)“与真多项式相关”这一步。这一步并非显然,需要 Balog–Szemerédi–Gowers 这类“把近似结构提纯成真结构”的重型工具。
11.2.3 有限域情形的 \(U^3\) 反演定理(\(k=4\))
当 \(Z\) 是小阶有限域上的向量空间、且 \(k=4\) 时,我们可以把这些猜想肯定地形式化如下。
这个反演定理的证明相当冗长,用到了前几章的技术,并大量倚重 Fourier 分析方法与 van der Corput 引理(引理 11.3),将推迟到下一节给出。我们指出,上述引文中的论文并未完全处理 \(\mathbb{F}\) 的特征为 \(2\) 的情形,那需要 Samorodnitsky 的一个额外观察(私人通信)。暂且承认它,我们现在便可对向量空间 \(Z\) 在 \(k=4\) 情形证明 Szemerédi 定理。事实上,这个反演定理使我们既能给出密度增量证明,也能给出能量增量证明。密度增量证明基于下面的命题,它类似于(虽然在某些方面比之略弱)引理 10.15。
- 特别地可找到 \(y\in Z\) 使得 \(\|f\|_{u^3(y+W)}\ge 2|\mathbb{E}_{y+W}(f)|+\Omega(\eta^{O(1)})\)。必要时把 \(f\) 平移 \(y\),可取 \(y=0\)。
- 由 \(u^3\) 范数的定义及习题 11.2.6,可找到自伴线性算子 \(M:W\to W\) 与 \(\xi\in W\) 使得 \[\big|\mathbb{E}_{x\in W}f(x)e(-Mx\cdot x)e(-\xi\cdot x)\big|\ge 2|\mathbb{E}_W(f)|+\Omega(\eta^{O(1)}).\] 这里 \(Mx\cdot x+\xi\cdot x\) 正是一个二次相位。
- 量 \(Mx\cdot x+\xi\cdot x\) 至多取 \(|\mathbb{F}|\) 个值。于是把 \(W\) 划分为 \(|\mathbb{F}|\) 个水平集 \(S_1,\dots,S_{|\mathbb{F}|}\),每个形如 \(\{x\in W:Mx\cdot x+\xi\cdot x=\text{常数}\}\)。由三角不等式 \[\sum_{j=1}^{|\mathbb{F}|}|\mathbb{E}_x 1_{S_j}(x)f(x)|\ge 2\sum_{j=1}^{|\mathbb{F}|}\mathbb{E}_W(1_{S_j}(x)f(x))+\Omega(\eta^{O(1)}),\] 进而由恒等式 \(\max(y,0)=(|y|+y)/2\), \[\sum_{j=1}^{|\mathbb{F}|}\max\big(\mathbb{E}_x 1_{S_j}(x)f(x),0\big)>\Omega(\eta^{O(1)}),\] 故由鸽巢原理可找到 \(j\) 使得 \(\mathbb{E}_x 1_{S_j}(x)f(x)>\Omega(\eta^{O(1)})\,\mathbb{P}_W(S_j)\)。
- 现在需把二次曲面 \(S_j\) 划分为仿射空间。先观察到存在 \(W\) 的子空间 \(U\),维数 \[\dim_{\mathbb{F}}(U)\ge\tfrac12\dim_{\mathbb{F}}(W)-\tfrac32\ge\tfrac12\dim_{\mathbb{F}}(W)-O(\eta^{-O(1)}),\] 且关于 \(M\) 是零化的(null):见习题 4.3.16。把 \(S_j\) 沿 \(U\) 的陪集分裂,由鸽巢原理存在某陪集 \(x_1+U\) 使得 \[\mathbb{E}_{x\in x_1+U}1_{S_j}(x)f(x)>\Omega(\eta^{O(1)})\,\mathbb{P}_{x_1+U}(S_j),\] 于是特别地 \(S_j\cap(x_1+U)\) 非空,且 \(|\mathbb{E}_{x\in S_j\cap(x_1+U)}f(x)|>\Omega(\eta^{O(1)})\)。
- 在零空间的陪集 \(x_1+U\) 上工作的妙处在于:此时 \(Mx\cdot x+\xi\cdot x\) 关于 \(x\) 变成了线性的。因此 \(S_j\) 与 \(x_1+U\) 的交集是 \(x_1+U\) 中余维数至多为 \(1\) 的仿射子空间 \(x_0+Z'\)。结论得证。♦
像 Roth 定理证明中那样迭代此命题,最终可推出界 \[r_4(\mathbb{F}^n)=O\!\Big(\frac{|\mathbb{F}|^n}{\log^c n}\Big)\tag{11.15}\] 对所有 \(n>1\) 及某个绝对常数 \(c\) 成立。也可以改写 10.5 节的能量增量论证,把“拟周期”的概念替换为“由有界个数的二次相位函数所决定”,不过这样得到的 \(r_4(\mathbb{F}^n)\) 的界相当差。改写定理 10.27 中的论证可稍有改进,得到界 \[r_4(\mathbb{F}^n)=O\!\Big(\frac{|\mathbb{F}|^n}{n^c}\Big);\] 见 [161]。上述反演理论很可能可推广到更高的 \(k\) 值,但在实施中存在若干技术困难,截至本书写作时尚未实现。
11.2.4 坏消息:循环群上需要局部二次相位
鉴于反演 \(U^3\) 途径在有限域情形的成功,人们自然会想知道:类似的反演定理对其他群(例如循环群 \(\mathbb{Z}_N\))是否成立。这里会遇到一个有趣的现象,即:\(\mathbb{Z}_N\) 上的二次相位函数并不构成阻碍二阶 Gowers 均匀性的完整障碍集合。一个例子如下。
正如其名,这个例子本质上是 Furstenberg 和 Weiss [126] 发现的,尽管他们用的语言与这里所呈现的大不相同(他们为四重回归构造了一个特征因子,它并非由二次本征函数给出)。
取 \(N=10000\),则 \(M=\lfloor\sqrt{N}\rfloor=100\),\(M/10=10\)。把每个 \(x\in\{0,1,\dots,N-1\}\) 唯一写成 \(x=yM+z\),\(z\in[0,M)\) 是“个位段”,\(y=\lfloor x/M\rfloor\) 是“高位段”。集合 \(P:=[0,M/10)+M\cdot[0,M/10)\) 就是要求 \(y,z\) 都落在 \([0,10)\) 里——这是一个 \(10\times 10\) 的方盒,只占满群的极小一角。\(f\) 在盒内是二次相位 \(e(\alpha x^2/M^2)\),盒外为 \(0\)。
- 容易验证 \(\phi\) 在 \(P\) 上是局部二次的,从而由 (11.11)、(11.7) \[\|f\|_{U^3(\mathbb{Z}_N)}=\|1_P\|_{U^3(\mathbb{Z}_N)}\ge\|1_P\|_{U^1(\mathbb{Z}_N)}=\mathbb{P}_{\mathbb{Z}_N}(P)=\Omega(1).\] 另一方面,由于 \(f\) 模长不超过 \(1\),有 \(\|f\|_{U^3(\mathbb{Z}_N)}\le 1\)。故 \(\|f\|_{U^3(\mathbb{Z}_N)}=\Theta(1)\)(即 \(\Omega(1)\)),如所言。
- 为证第二个论断,由习题 11.2.2 可知,只需证明对所有整数 \(c_0,c_1,c_2\), \[\mathbb{E}_{x\in\mathbb{Z}_N}\,e\big(\phi(x)+(c_2x^2+c_1x+c_0)/N\big)1_P(x)=o_{N\to\infty;\alpha}(1).\]
- 把 \(x=yM+z\)(\(y,z\in[0,M/10)\))代入,只需证明 \[\mathbb{E}_{y,z\in[0,M/10)}\,e\big(\alpha y^2+(c_2(yM+z)^2+c_1(yM+z)+c_0)/N\big)=o_{N\to\infty;\alpha}(1).\]
- 估计此和有两种选择。其一:在 \(y\) 变量上两次施用 van der Corput 引理(习题 11.2.9,取 \(H_1=M^{1-\varepsilon}\)、\(H_2=M^{1-2\varepsilon}\),\(\varepsilon\) 小),归结为证明 \[\mathbb{E}_{h_1\in[1,H_1],h_2\in[1,H_2]}\,e\big(2(\alpha+c_2M^2)h_1h_2\big)=o_{N\to\infty;\alpha}(1);\] 其二:在 \(y\) 变量上施用一次 van der Corput 引理、在 \(z\) 变量上施用一次,归结为证明 \[\mathbb{E}_{h_1\in[1,H_1],h_2\in[1,H_2]}\,e\big(2c_2Mh_1h_2\big)=o_{N\to\infty;\alpha}(1).\]
- 这两个界都不关于 \(c_2\) 一致成立,但事实证明两者中总有一个成立:当 \(c_2M\) 不在距某个分母至多为 \(M^{O(\varepsilon)}\) 的有理数 \(M^{-2+O(\varepsilon)}\) 范围内时(“次要弧”情形),后者成立;在其互补的“主要弧”情形,前者成立。这些界的精确验证需要丢番图逼近的一些基本工具,但我们略去,因为它有些繁琐。♦
这个例子表明:除了在有限域情形出现的全局二次相位障碍之外,我们现在还必须考虑局部二次相位障碍——它们只定义在群中一个适当的等差数列(譬如 \([0,M/10)+M\cdot[0,M/10)\))上。另一种做法是用 Bohr 集替换等差数列,二者当然密切相关(参见 4.4 节)。这种设定下一个典型的反演定理如下。
此定理的证明类似于我们下文给出的定理 11.6 的证明,但更复杂一些,因为我们必须用(正则)Bohr 集而非子空间来工作(这最终源于对任意群应用 Chang 定理(定理 4.42)的一个版本)。它随后可用来证明:
这一结果最早由 Gowers1 [137]、[138] 建立,他并未直接证明一个反演定理。然而,[160] 中定理 11.9 的证明方法几乎完全建立在 [137] 中用来建立命题 11.10 的技术之上。通过通常的迭代论证,此命题可用来建立界
\[r_4(\mathbb{Z}_N)=O\!\Big(\frac{N}{(\log\log N)^c}\Big)\]
对某个绝对常数 \(0 返回 全书目录习题