Tao–Vu · 加性组合学 · 第 11 章 k>3 的 Szemerédi 定理

11.5 无穷遍历论方法The infinitary ergodic approach

本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演 / 自测)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本节是全章里最“抽象”的一节——它把数论里的算术级数问题翻译成“一个空间不断被搬动,问它什么时候会回到出发点附近”的动力学问题。讲解会把每一个新名词背后的直觉拆开讲清。

本节目标介绍 Furstenberg 用遍历论(ergodic theory)证明 Szemerédi 定理的核心思想。这套方法的证明最短、最优雅,代价是需要一套关于无限测度空间的机器,而且很难从中提取出定量的数值上界。要回答的中心问题是:把一个集合反复“平移 \(n,2n,\dots\)”,它与自己的交集什么时候必然非空?这就是多重回归(multiple recurrence)

在本节中,我们讨论 Furstenberg 用无穷遍历论方法证明 Szemerédi 定理时所依据的一些想法。这些论证是证明该定理最短、最优雅的途径,但也需要一定量的、关于无限测度空间的工具。此外,从这些方法中提取出定量上界是相当困难的。由于这里的技术与本书其余部分的技术相当脱节,我们不给出完整细节,而是把读者引向文献 [122]。然而,这里发展出来的洞见,对于本章中若干有限型(finitary)论证的发展是必不可少的,最值得一提的是 Szemerédi 定理的有限型遍历证明,以及关于素数中算术级数的 Green–Tao 定理。

为什么要“翻译”成动力系统原来的问题是:一个正密度的整数集合 \(A\) 里一定有长为 \(k\) 的算术级数。Furstenberg 的惊人发现是:这等价于一个看上去完全不同的陈述——任意一个“测度保持系统”反复搬动后,一块正测度的集合必然多重地回到自身附近。把组合问题换成动力学问题后,就能借用遍历论里成熟而强大的工具(如 von Neumann 遍历定理)来攻击它。

测度保持系统

定义一个测度保持系统(measure-preserving system)为:一个(可能是无限的)空间 \(X\),配上一个 \(\sigma\)-代数 \(\mathcal{B}\)、一个 \(\mathcal{B}\) 上的概率测度 \(P_X\),以及一个双射 \(T:X\to X\),使得 \(T\) 的所有幂次 \(T^n\)(\(n\in\mathbb{Z}\))都是测度保持的,亦即对所有 \(A\in\mathcal{B}\) 都有 \[P_X(T^nA)=P_X(A).\] 在这种无限的背景下,\(\sigma\)-代数不能被严格地看作一个划分;它是一族对可数并、交、补封闭,并且包含 \(\varnothing\) 与 \(X\) 的集合。我们以通常的方式,在从 \(X\) 到 \(\mathbb{R}\) 的有界可测函数上定义期望 \(E_X\),并在这些函数上定义平移算子 \(T^n\) 为 \[T^nf(x):=f(T^{-n}x).\] 为了稍微简化记号,本节中我们只处理实值函数,而不处理复值函数。

把四个零件逐一翻译
  1. 空间 \(X\):所有“可能的状态”组成的集合。可以是一个圆、一个环面,甚至是“无穷多枚硬币的全部投掷结果”。
  2. 测度 \(P_X\):给 \(X\) 的每个(可测)子集分配一个“占比/概率”,全空间的占比是 \(1\)。它代替了有限集合里的“元素个数 / 总数”。
  3. 变换 \(T\):把每个状态搬到另一个状态的规则,可逆。\(T^n\) 表示连续搬 \(n\) 次(\(n\) 为负就反向搬)。
  4. 测度保持:搬动不改变任何集合的“占比”。这正对应整数平移 \(x\mapsto x+1\) 不改变集合的密度这一事实。
函数上的平移为什么用 \(T^{-n}\)?因为我们想让“把图样搬过去”和“把坐标系搬回来”一致:在新点 \(x\) 处的值,等于在旧点 \(T^{-n}x\) 处的原值。这样 \(T^n(T^mf)=T^{n+m}f\) 才成立。
例 11.20(圆周平移 Circle shift) 设 \(X\) 是单位圆 \(\mathbb{R}/\mathbb{Z}\),配 Lebesgue 测度;设 \(T\) 是平移 \(Tx=x+\alpha\),其中 \(\alpha\in\mathbb{R}\) 固定。这个系统的动力学行为取决于 \(\alpha\) 是有理数还是无理数;例如前者时平移 \(T\) 是周期的,而后者时不是。然而在两种情形下都有如下几乎周期性(almost periodicity):给定 \(X\) 上任一有界可测函数,平移族 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2(X)\) 中是预紧的(pre-compact)。特别地,给定任意 \(\varepsilon\),对无穷多个 \(n\) 都有 \(\|T^nf-f\|_{L^2(X)}\le\varepsilon\)。正因为这个性质,我们说这个测度保持系统是紧的(compact)
x Tx=x+α T²x 每步转固定角度 α,图样几乎原样不动 → 紧系统 无理 α:永不重复, 但稠密地铺满圆 有理 α=p/q:q 步 后精确回到原点
圆周平移:每次转固定角度。无论转多少次,函数的“形状”几乎不变(只是整体转了个角度),所以平移族在 \(L^2\) 中挤在一个紧致的小范围里。这是最“规整”的系统。
例 11.21(斜平移 Skew shift) 设 \(X\) 是环面 \((\mathbb{R}/\mathbb{Z})\times(\mathbb{R}/\mathbb{Z})\),配 Lebesgue 测度;设 \(T\) 是斜平移 \[T(x,y):=(x+\alpha,\;y+x),\] 其中 \(\alpha\in\mathbb{R}\) 固定。注意轨道 \(T^n(x,y)\) 在 \(x\) 分量上是 \(n\) 的线性函数,但在 \(y\) 分量上是 \(n\) 的二次函数。这个系统是紧的,但它包含一个非平凡的紧因子(compact factor),即由所有形如 \(A\times(\mathbb{R}/\mathbb{Z})\) 的集合组成的 \(\sigma\)-代数 \(\mathcal{B}_0\),其中 \(A\) 是 \(\mathbb{R}/\mathbb{Z}\) 中的 Borel 可测集。(换句话说,\(\mathcal{B}_0\)-可测的函数恰好是那些不依赖 \(y\) 变量的函数。)这个因子与前面提到的圆周平移同构。事实证明,斜平移是圆周平移的一个相对紧扩张(relatively compact extension),不过我们这里不会精确地量化这意味着什么,只指出:如果 \(f\) 是 \((\mathbb{R}/\mathbb{Z})\times(\mathbb{R}/\mathbb{Z})\) 上的光滑函数,那么轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(\mathcal{B}_0\) 的每一条纤维 \(\{x=\text{常数}\}\)(赋予显然的一维测度)上构成一个预紧集。
n x 分量:线性(圆周平移那一层) y 分量:二次(多出来的一层) 底层是圆周平移;y 这层“盖”在它上面 → 2 步系统
斜平移有两层结构:底层 \(x\) 像圆周平移(1 步),上层 \(y\) 多出一个二次项。把上层“压扁、只看 \(x\)”就回到圆周平移,所以圆周平移是它的因子,而它是圆周平移的“相对紧扩张”。这正对应后面 \(\mathcal{Z}_0\subset\mathcal{Z}_1\subset\mathcal{Z}_2\) 的塔状结构。
例 11.22(Bernoulli 平移 Bernoulli shift) 现在考虑无限单位立方体 \(X:=[0,1]^{\mathbb{Z}}\),即无限二元序列 \((\omega_n)_{n\in\mathbb{Z}}\) 的全体,配通常的乘积拓扑与 Borel \(\sigma\)-代数 \(\mathcal{B}\)。设 \(B\subset X\) 表示满足 \(\omega_0=1\) 的序列组成的“柱集(cylinder)”,并设 \(T\) 为平移算子 \(T^h(\omega_n)_{n\in\mathbb{Z}}:=(\omega_{n+h})_{n\in\mathbb{Z}}\)。利用 Kolmogorov 扩张定理(或 Carathéodory 扩张定理加 Tychonoff 定理),我们可以找到 \(X\) 上的一个测度 \(P\),使得只要 \(h_1,\dots,h_m\) 是互异的整数,就有 \[P(T^{h_1}B\cap\cdots\cap T^{h_m}B)=2^{-m}.\] 通俗地说,可以把这个系统看作对应于无穷多次抛硬币的概率空间——每个整数 \(h\) 对应一枚硬币;事件 \(T^hB\) 就是“第 \(h\) 枚硬币正面朝上”,而平移算子对应把所有硬币的编号整体加 \(1\)。这里的行为与紧情形完全不同;事实上,如果 \(f\) 有界可测且均值为零,则可以证明当 \(n\to\infty\) 时 \(\langle T^nf,f\rangle_{L^2(X)}\to 0\)。具有这种性质的系统称为强混合的(strongly mixing)
T H T H H T H 第 0 枚(粗框):ω₀=1 ⇔ 落在柱集 B 内 平移 = 整排硬币编号挪一格;各枚独立 → 强混合(毫无记忆)
Bernoulli 平移:每枚硬币独立。两次相隔很远的平移之间几乎不相关,所以 \(\langle T^nf,f\rangle\to 0\)。它和圆周平移是两个极端:一个“毫无记忆”,一个“几乎不变”。真实系统介于两者之间,这正是分析的难点。

Furstenberg 多重回归定理

Furstenberg 通过证明如下等价表述,推导出了 Szemerédi 定理。

定理 11.23(Furstenberg 多重回归定理)[121][125][122]设 \((X,\mathcal{B},P,T)\) 是一个测度保持系统,\(f:X\to\mathbb{R}^+\) 是一个非负有界可测函数,且 \(E(f)>0\)。那么对所有 \(k\ge 1\) 都有 \[\liminf_{N\to\infty}\;\mathbb{E}_{1\le n\le N}\,E_X\big(f\cdot T^nf\cdots T^{(k-1)n}f\big)>0.\]
这条式子在说什么取 \(f=1_A\)(集合 \(A\) 的示性函数)。那么乘积 \(f\cdot T^nf\cdots T^{(k-1)n}f\) 在点 \(x\) 处等于 \(1\),当且仅当 \(x,T^{-n}x,\dots,T^{-(k-1)n}x\) 全都落在 \(A\) 里。于是 \[E_X\big(1_A\cdot T^n1_A\cdots T^{(k-1)n}1_A\big)=P\big(A\cap T^nA\cap\cdots\cap T^{(k-1)n}A\big).\] 定理断言:把这个交集的测度对 \(n\) 取平均,下极限严格大于零。也就是说,存在“正比例”那么多的步长 \(n\),使得一个点 \(x\) 与它被 \(T\) 反复搬动后的 \(k\) 个位置同时落进 \(A\)。这正是“等差排列”在动力学里的化身:\(x,T^nx,T^{2n}x,\dots\) 就是公差为 \(n\) 的“级数”。
集合 A(正测度) x Tⁿx T²ⁿx k=3:等步长 n 的三个点同时落进 A — 对正比例个 n 成立
多重回归就是把“算术级数 \(a,a+n,a+2n\) 全在 \(A\) 里”翻译成“点 \(x\) 及其搬动 \(T^nx,T^{2n}x\) 全在 \(A\) 里”。\(\liminf>0\) 保证了这种好步长 \(n\) 占正比例,于是必然存在。

从 Szemerédi 定理推出本定理是相当容易的;我们把它留作习题。反过来,从 Furstenberg 定理推出 Szemerédi 定理则要略微棘手一些,需要一些测度论工具:

假定定理 11.23 来证明定理 10.1(梗概). 反设我们能找到一个具有正上密度、却不含长为 \(k\) 的级数的集合 \(A\subseteq\mathbb{Z}\)。于是可以找到一列趋于无穷的整数 \(N_1,N_2,\dots\),使得 \(\liminf_{j\to\infty}P_{[-N_j,N_j]}(A)>0\)。现在用 Hahn–Banach 定理,在有界实值序列 \((c_j)_{j=1}^\infty\) 上构造一个线性泛函 \(\lambda\),使得 \[\liminf_{j\to\infty}c_j\;\le\;\lambda\big((c_j)_{j=1}^\infty\big)\;\le\;\limsup_{j\to\infty}c_j.\] 现在考虑无限单位立方体 \(X:=[0,1]^{\mathbb{Z}}\),即无限二元序列 \((\omega_n)_{n\in\mathbb{Z}}\) 的全体,配通常的乘积拓扑与 Borel \(\sigma\)-代数 \(\mathcal{B}\)。设 \(B\subset X\) 表示满足 \(\omega_0=1\) 的序列组成的柱集,\(T\) 为平移算子 \(T^h(\omega_n)_{n\in\mathbb{Z}}:=(\omega_{n+h})_{n\in\mathbb{Z}}\)。利用 Kolmogorov 扩张定理(或 Carathéodory 扩张定理加 Tychonoff 定理),可以找到 \(X\) 上的测度 \(P\),使得对所有 \(h_1,\dots,h_m\in\mathbb{Z}\) 都有 \[P(T^{h_1}B\cap\cdots\cap T^{h_m}B)=\lambda\Big(\big(P_{[-N_j,N_j]}((A+h_1)\cap\cdots\cap(A+h_m))\big)_{j=1}^\infty\Big).\] 特别地我们看到 \(P(B)>0\)。把定理 11.23 应用于 \(f=1_B\),便得出:至少对一个非零的 \(n\) 有 \(P(B\cap T^nB\cap\cdots\cap T^{(k-1)n}B)>0\),这蕴含 \(A\) 含有长为 \(k\) 的级数——与假设矛盾。
这个证明的精髓:把整数集“随机化”成一个动力系统
  1. 整数集 \(A\) 给了我们一族“密度”\(P_{[-N_j,N_j]}(\cdots)\)。但这些密度只是数列,没有现成的极限。
  2. Hahn–Banach 造出的 \(\lambda\) 是一个“广义极限”:它对任意有界数列都给出一个夹在 \(\liminf\) 与 \(\limsup\) 之间的值,从而充当极限。
  3. 把 \(\lambda\) 套在“平移后的交集密度”上,恰好定义出立方体 \(X\) 上一个相容的概率测度 \(P\)(柱集的概率确定整个测度)。这一步把整数世界搬进了动力系统世界
  4. 在新世界里,“\(A\) 含 \(k\)-级数”对应“柱集 \(B\) 多重回归”。Furstenberg 定理保证多重回归发生,于是 \(A\) 必有级数,矛盾。
关键魔法是:组合学里“求数列极限”这种麻烦事,被 Hahn–Banach 一次性化解,换来了一个干净的概率空间。

遍历论中的 Gowers 一致性范数

可以用与前几节类似的方式来证明多重回归定理。例如,存在 Gowers 一致性范数 \(\|f\|_{U^d(X)}\) 的一个类比,对有界可测的 \(f\) 归纳地定义为 \(\|f\|_{U^0(X)}:=E_X(f)\) 以及 \[\|f\|_{U^d(X)}:=\Big(\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}\,\|f\cdot T^nf\|_{U^{d-1}(X)}^{2^{d-1}}\Big)^{1/2^d}.\] (这个极限的存在性由 von Neumann 遍历定理保证;见 [185]。)可以验证这些 \(U^d\) 范数满足与其有限型对应物类似的性质;见 [185],但有一个关键区别:现在完全有可能存在非零的函数 \(f\) 其 \(U^d\) 范数为零。我们有一个重要的广义 von Neumann 定理 (11.8) 的类比,即 \[\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}\,E_X\big(f_0\cdot T^nf_1\cdots T^{(k-1)n}f_{k-1}\big)=0,\] 只要 \(f_0,\dots,f_{k-1}\) 是有界可测函数,且其中至少有一个 \(f_j\) 的 \(U^{k-1}\) 范数为零。因此,\(U^{k-1}\) 范数为零的函数对回归的影响可以忽略不计。

直觉:把函数拆成“结构”与“噪声”这条广义 von Neumann 定理说的是:在那个多重平均里,只要有一个因子是“伪随机的”(\(U^{k-1}\) 范数为零),整个平均就趋于零。换句话说——
  1. 把任意 \(f\) 写成 \(f=(\text{结构部分})+(\text{噪声部分})\),其中噪声部分的 \(U^{k-1}\) 范数为零。
  2. 展开多重乘积时,任何含噪声因子的项都贡献 \(0\)。
  3. 于是只剩下“全是结构部分”的那一项有贡献。证明回归,只需对结构部分证明即可。
这与有限型证明里“一致性 vs. 反一致性”的二分法是完全平行的。

特征因子 \(\mathcal{Z}_{k-2}\)

再一次,注意力转向一致性的障碍(obstructions to uniformity)。事实证明,在无穷的背景下,这些障碍有一个相当漂亮的刻画。令 \(U^{k-1}(X)^*\) 表示所有使得下面表达式有限的有界函数 \(f\) 之空间: \[\|f\|_{U^{k-1}(X)^*}:=\sup\big\{|E_X(fg)|:\|g\|_{U^{k-1}(X)}\le 1\big\}.\] 事实证明(见 [185])存在唯一的 \(\sigma\)-代数 \(\mathcal{Z}_{k-2}\),使得 \(U^{k-1}(X)^*\) 在 \(L^2\) 拓扑下的闭包,恰好由那些关于 \(\mathcal{Z}_{k-2}\) 可测的平方可积函数组成;因而 \(\mathcal{Z}_{k-2}\) 就是 \(U^{k-1}(X)\) 范数的万有特征因子(universal characteristic factor)。作为推论,可以精确地刻画哪些函数是 \(k-1\) 阶 Gowers 一致的: \[\|f\|_{U^{k-1}(X)}=0\iff E(f\,|\,\mathcal{Z}_{k-2})=0.\] 这里条件期望 \(f\mapsto E(f\,|\,\mathcal{Z}_{k-2})\) 定义为到 \(\mathcal{Z}_{k-2}\)-可测函数空间的 \(L^2\)-正交投影。

特征因子 = 决定回归的“最小信息层”把 \(\mathcal{Z}_{k-2}\) 想成对状态空间的一种“粗看”:只记录决定回归的关键信息,忽略其余细节。上面的等价式说:一个函数对回归无贡献(\(U^{k-1}\) 范数为零),当且仅当它在这层粗看里平均下来等于零。于是要证回归,只需把 \(f\) 投影到 \(\mathcal{Z}_{k-2}\) 上,对投影证明即可——因为误差 \(f-E(f\,|\,\mathcal{Z}_{k-2})\) 的 \(U^{k-1}(X)\) 范数为零,从而无关紧要。所以问题归结为:尽可能彻底地看懂因子 \(\mathcal{Z}_{k-2}\) 长什么样

上述讨论的一个推论是:为了证明 Furstenberg 回归定理,只需在附加假设“\(f\) 是 \(\mathcal{Z}_{k-2}\)-可测的”之下证明它即可(因为误差 \(f-E(f\,|\,\mathcal{Z}_{k-2})\) 的 \(U^{k-1}(X)\) 范数为零,故无关紧要)。要做到这一点,尽可能理解 \(\mathcal{B}\) 的因子 \(\mathcal{Z}_{k-2}\) 显然是至关重要的。

事实证明,因子 \(\mathcal{Z}_0\) 是 \(X\) 中不变集的空间,即 \(\mathcal{Z}_0:=\{A\in\mathcal{B}:TA=A\}\)。这本质上就是 von Neumann 遍历定理,我们把它留作习题。因子 \(\mathcal{Z}_1\) 称为 Kronecker 因子,它由所有几乎周期函数生成,或等价地,由平移算子 \(T\) 的特征函数(eigenfunctions)生成。更高的因子更难明确描述。然而,不太困难地可以证明(例如见 [121][185][236];一个密切相关的结果在 [386] 中):每个因子 \(\mathcal{Z}_{d+1}\) 都是前一个因子 \(\mathcal{Z}_d\) 的一个相对紧扩张(事实上是最大的相对紧扩张)。这究竟意味着什么有点难以精确描述,但大致是说:对于一个 \(\mathcal{Z}_{d+1}\)-可测的稠密集合中的 \(f\),轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 相对于 \(\mathcal{Z}_d\) 是预紧的——通俗地说,当把它限制在 \(\mathcal{Z}_d\) 的每个“原子”或“纤维”上时它是预紧的。这些断言的严格表述见 [122](它需要测度分解的理论)。利用一些测度论与分析的工具,以及一个与 van der Waerden 定理密切相关的组合论证,[121][125] 中证明了:如果 Furstenberg 回归定理对某个因子 \(\mathcal{Z}_d\) 成立,那么它对相对紧扩张 \(\mathcal{Z}_{d+1}\) 也成立;这类似于命题 11.19。这一事实结合前面的讨论,便得出 Furstenberg 回归定理,从而得出 Szemerédi 定理。

𝒵₀ :不变集(最粗)— von Neumann 遍历定理 𝒵₁ :Kronecker 因子 — 几乎周期 / 圆周平移 𝒵₂ :2 步幂零系统 / 斜平移 𝒵_{k-2} :(k−2) 步幂零系统 每层都是下一层的“相对紧扩张”(多加一层结构)
因子塔:\(\mathcal{Z}_0\subseteq\mathcal{Z}_1\subseteq\mathcal{Z}_2\subseteq\cdots\subseteq\mathcal{Z}_{k-2}\)。底层最粗(只看不变集),每往上一层就“多盖一层结构”,恰好对应圆周平移→斜平移这种从 1 步到 2 步的升级。证明策略:先在最底层证回归,再逐层(用类似 van der Waerden 的论证)把它“抬”上去。
为什么逐层往上抬就能成功
  1. 地基:在 \(\mathcal{Z}_0\) 上,回归本质上是平凡的(von Neumann 遍历定理)。
  2. 归纳步:假设回归在 \(\mathcal{Z}_d\) 上已成立。因为 \(\mathcal{Z}_{d+1}\) 只是在 \(\mathcal{Z}_d\) 上“相对紧地”多盖一层(每条纤维上的轨道挤在紧集里),可以借助类似 van der Waerden 定理的组合论证把回归从下层提升到上层。
  3. 封顶:有限步后到达 \(\mathcal{Z}_{k-2}\),而这一层已经捕获了 \(U^{k-1}\) 的全部障碍,于是回归对一般 \(f\) 成立。
这套“先理解最简单的结构系统,再用扩张逐级递推”的思路,是整个遍历方法的骨架。

Host–Kra、Ziegler 与幂零系统

近来,Host–Kra [185](以及随后 Ziegler [386])在理解因子 \(\mathcal{Z}_{k-2}\) 方面取得了重大进展。(严格地说,Ziegler 处理的是 \(\mathcal{Z}_{k-2}\) 的一个略有不同的变体 \(\mathcal{Y}_{k-2}\);两者的比较见 [236]。)事实证明,因子 \(\mathcal{Z}_{k-2}\) 同构于 \((k-2)\) 步幂零系统(nilsystems)逆极限;换句话说,是一个系统 \((G/\Gamma,\mathcal{B},T,P)\),其中 \(G\) 是一个 \((k-2)\) 阶幂零 Lie 群,\(\Gamma\) 是 \(G\) 的一个余紧子群,\(\mathcal{B}\) 是通常的 Borel 代数,\(T\) 是某个左平移算子 \(T:x\mapsto gx\)(\(g\in G\) 固定),而 \(P\) 是归一化的 Haar 测度。例如,例 11.20 中的圆周平移是一个 1 步幂零系统,而斜平移则同构于一个 2 步幂零系统。这些对 \(\mathcal{Z}_{k-2}\) 的刻画大致类似于 11.2 节讨论的“困难型”逆定理;关于 \(k=4\) 情形的进一步讨论见 [160]。正如那些困难型逆定理导致 Szemerédi 定理更好的定量结果一样,这里给出的对 \(\mathcal{Z}_{k-2}\) 的刻画导致了更强的回归定理;例如,它们可以用来把 Furstenberg 回归定理中的下极限替换为极限,并且实际上得到更强的结果:平均值 \(\mathbb{E}_{1\le n\le N}T^nf\cdots T^{(k-1)n}f\) 在 \(L^2\) 范数下收敛到一个非零(且在某种程度上可显式描述)的函数。见 [185][386]。当前的一个研究方向是发展并简化这些遍历论结果(它们目前的证明相当困难且冗长),并厘清它们与 Fourier 分析方法、组合方法中类似进展之间的联系。

幂零系统是什么、为什么自然“幂零群”是比交换群略复杂、但仍然受控的一类群(多次取换位子后归零)。一个 \(d\) 步幂零系统恰好对应着“\(d\) 次多项式式的相位”——圆周平移给出线性相位 \(e^{2\pi i n\alpha}\)(1 步),斜平移给出二次相位(2 步)。Host–Kra–Ziegler 的深刻结论是:决定 \(k\)-项算术级数计数的全部结构,恰好就是这些 \((k-2)\) 步幂零系统,别无其他。这就是“逆定理”在动力学侧的完美对应物:高阶 Fourier 分析里看到的“多项式相位”,在这里现身为幂零流形上的平移。

遍历方法能证明的更强结果

遍历方法非常适合建立比 Szemerédi 定理更强的组合结果,其中若干至今尚未用其他方法证明。我们在此描述其中一些。

定理 11.24(多维 Szemerédi 定理)[123]设 \(d\ge 1\),\(A\subset\mathbb{Z}^d\) 满足 \(\limsup_{N\to\infty}P_{[-N,N]^d}(A)>0\)。那么对任意 \(v_1,\dots,v_k\in\mathbb{Z}^d\),存在无穷多对 \((a,r)\in\mathbb{Z}^d\times\mathbb{Z}^+\),使得 \[a+rv_1,\;\dots,\;a+rv_k\in A.\]
a a+rv₁ a+rv₂ 任意给定的形状(如直角三角形 的顶点配置 v₁,…,v_k) 放大 r 倍、平移到 a 后 整体落进正密度集 A
一维的“等差三点”升级为多维的“任意几何配置”:给定一组方向向量 \(v_1,\dots,v_k\),正密度集 \(A\) 里必含这组配置的某个放大平移副本 \(a+rv_1,\dots,a+rv_k\)。Szemerédi 定理是它取 \(d=1,\,v_i=i\) 的特例。
定理 11.25(多项式 Szemerédi 定理)[23]设 \(P_1,\dots,P_k:\mathbb{Z}\to\mathbb{Z}\) 是把整数映到整数的多项式,满足 \(P_1(0)=\cdots=P_k(0)=0\)。设 \(A\subset\mathbb{Z}\) 具有正上密度。那么存在无穷多对 \((a,r)\),使得 \[a+P_1(r),\;\dots,\;a+P_k(r)\in A.\]
举个具体例子取 \(k=2\),\(P_1(r)=0,\;P_2(r)=r^2\)。定理断言:任意正密度集 \(A\) 中存在无穷多对 \((a,r)\),使 \(a\) 与 \(a+r^2\) 同时在 \(A\) 里——也就是 \(A\) 里有两个相差完全平方数的元素。注意这里间隔不再是等差,而是沿着多项式 \(r^2\) 取值,这是普通 Szemerédi 定理完全够不着的。条件 \(P_i(0)=0\) 保证 \(r=0\) 时所有点重合到 \(a\),从而配置“从 \(A\) 内部长出来”。
定理 11.26(密度型 Hales–Jewett 定理)[124]设 \(n\ge 1\),\(0<\delta\le 1\)。那么存在一个整数 \(d=d(n,\delta)\ge 1\),使得若 \(A\) 是 \([0,n-1]^d\) 的任一基数 \(|A|\ge\delta n^d\) 的子集,则 \(A\) 含有一个长为 \(n\) 的真组合直线(proper combinatorial line)\(a+[0,n-1]\cdot v\),其中 \(a\in[0,n-1]^d\),\(v\in[0,1]^d\)。
组合直线的样子在 \(n\) 进制、\(d\) 位的“词”空间 \([0,n-1]^d\) 里,一条组合直线是这样得到的一组 \(n\) 个词:选定若干“活动坐标”(由 \(v\) 中为 \(1\) 的位置标记),让它们一起从 \(0\) 同步增长到 \(n-1\),其余坐标固定不变。例如 \(n=3,d=2\) 时,\((0,1),(1,1),(2,1)\) 是一条直线(第一位活动、第二位固定为 \(1\))。密度型 Hales–Jewett 说:只要 \(A\) 占的比例不低于 \(\delta\),维数 \(d\) 一旦足够大,\(A\) 里就一定能找到一整条这样的直线。它是这些定理中最强的之一——多维 Szemerédi 等都能由它推出。

进一步的精细化还包括:对上述定理所构造的对 \((a,r)\) 给出附加的结构信息,以及各种极限的收敛性;此外,目前有大量工作在把对 \(U^k\) 范数及多重回归之特征因子的描述,推广到这些更复杂的回归定理上。遗憾的是,对这些激动人心的进展作一个完整的综述,已远超本书的范围。

习题

习题
  1. 11.5.1 证明:对固定的 \(k\),定理 11.1 蕴含同一 \(k\) 值的定理 11.23。
  2. 11.5.2(Poincaré 回归定理) 仅用鸽笼原理与初等测度论,证明 \(k=2\) 情形的定理 11.23。
  3. 11.5.3(von Neumann 遍历定理) 设 \((X,\mathcal{B},P,T)\) 是测度保持系统。证明:空间 \(\{f\in L^2(X):Tf=f\}\) 与 \(\{Tf-f:f\in L^2(X)\}\) 是 \(L^2(X)\) 的互补正交子空间。由此推出:若 \(\mathcal{Z}_0:=\{A\in\mathcal{B}:TA=A\}\),则对任意 \(f\in L^2(X)\),\(\mathbb{E}_{1\le n\le N}T^nf\) 在 \(L^2(X)\) 中收敛到 \(E(f\,|\,\mathcal{Z}_0)\),且 \(\|f\|_{U^1(Z)}=\|E(f\,|\,\mathcal{Z}_0)\|_{L^2(X)}\)。注意当系统是遍历的(即 \(\mathcal{Z}_0=\{\varnothing,X\}\))时这些结果会简化,因为此时 \(E(f\,|\,\mathcal{Z}_0)\) 就是 \(E_X(f)\)。特别地此时 \(\|f\|_{U^1(Z)}=|E_X(f)|\),与有限型情形一样。
  4. 11.5.4(Khintchine 回归定理) 设 \(A\) 是测度保持系统 \((X,\mathcal{B},P,T)\) 的一个子集。证明:对每个 \(\varepsilon>0\),存在无穷多个 \(n\in\mathbb{Z}\) 使得 \(P(A\cap T^nA)\ge P(A)^2-\varepsilon\)。(提示:给 \(\|\mathbb{E}_{1\le n\le N}1_{T^nA}\|_{L^2(Z)}\) 求上、下界。或者用 von Neumann 遍历定理。)证明:若把 \(P(A)^2-\varepsilon\) 换成 \(P(A)^2+\varepsilon\),则无论 \(P(A)\) 与 \(\varepsilon\) 多小,定理都不成立。自然会猜想 \(P(A\cap T^nA\cap\cdots\cap T^{(k-1)n}A)\ge P(A)^k-\varepsilon\) 对无穷多个 \(n\) 成立;在附加遍历性假设下,这对 \(k=1,2,3,4\) 为真,但对 \(k>4\) 不成立,见 [22]。
  5. 11.5.5 设 \((X,\mathcal{B},P,T)\) 是紧测度保持系统(即只要 \(f\) 有界可测,轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2\) 中预紧)。在此特殊情形下证明 Furstenberg 回归定理。(与命题 10.35 或命题 11.19 的 \(k=3\) 证明对照。)
  6. 11.5.6 设 \((X,\mathcal{B},P,T)\) 是弱混合测度保持系统,即只要 \(f\) 有界、可测、期望为零,就有 \(\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}|\langle T^nf,f\rangle_{L^2(X)}|^2=0\)。(这比强混合弱,强混合要求在同样假设下 \(\lim_{n\to\infty}\langle T^nf,f\rangle=0\)。)证明:\(\|f\|_{U^{k-1}(X)}=0\) 当且仅当 \(E_X(f)=0\),并在此特殊情形下建立 Furstenberg 回归定理。
  7. 11.5.7 设 \((X,\mathcal{B},P,T)\) 是测度保持系统,\(f\) 有界可测。证明:若 \(f\) 是几乎周期的(即轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2(X)\) 中预紧),则只要 \(g\) 有界、可测且 \(U^2(X)\) 范数为零,就有 \(E_X(fg)=0\)。与习题 11.4.8 对照。
  8. 11.5.8 设 \((X,\mathcal{B},P,T)\) 是测度保持系统。令 \(\mathcal{Z}_1\) 是使所有几乎周期函数都可测的最小 \(\sigma\)-代数。设 \(f\) 有界可测,证明:\(\|f\|_{U^2(X)}=0\) 当且仅当 \(E(f\,|\,\mathcal{Z}_1)=0\)。(提示:“仅当”部分由上一题得出。对“当”的部分,构造对偶函数 \(D_2f:=\lim_{N\to\infty}\mathbb{E}_{-N\le n\le N}T^nf\,E_X(f\,T^nf\,|\,\mathcal{Z}_0)\),并证明该函数……)

返回 全书目录