Tao–Vu · 加性组合学 · 第 11 章 k>3 的 Szemerédi 定理

11.5　无穷遍历论方法The infinitary ergodic approach

本页为译文 + 高中讲解合一：黑色正文为忠实翻译；彩色框（目标 / 例 / 分步推演 / 自测）与配图为面向高中生的详解，逐步推演、举例、画图，不用比喻。本节是全章里最“抽象”的一节——它把数论里的算术级数问题翻译成“一个空间不断被搬动，问它什么时候会回到出发点附近”的动力学问题。讲解会把每一个新名词背后的直觉拆开讲清。

本节目标介绍 Furstenberg 用遍历论（ergodic theory）证明 Szemerédi 定理的核心思想。这套方法的证明最短、最优雅，代价是需要一套关于无限测度空间的机器，而且很难从中提取出定量的数值上界。要回答的中心问题是：把一个集合反复“平移 \(n,2n,\dots\)”，它与自己的交集什么时候必然非空？这就是多重回归（multiple recurrence）。

在本节中，我们讨论 Furstenberg 用无穷遍历论方法证明 Szemerédi 定理时所依据的一些想法。这些论证是证明该定理最短、最优雅的途径，但也需要一定量的、关于无限测度空间的工具。此外，从这些方法中提取出定量上界是相当困难的。由于这里的技术与本书其余部分的技术相当脱节，我们不给出完整细节，而是把读者引向文献 [122]。然而，这里发展出来的洞见，对于本章中若干有限型（finitary）论证的发展是必不可少的，最值得一提的是 Szemerédi 定理的有限型遍历证明，以及关于素数中算术级数的 Green–Tao 定理。

为什么要“翻译”成动力系统原来的问题是：一个正密度的整数集合 \(A\) 里一定有长为 \(k\) 的算术级数。Furstenberg 的惊人发现是：这等价于一个看上去完全不同的陈述——任意一个“测度保持系统”反复搬动后，一块正测度的集合必然多重地回到自身附近。把组合问题换成动力学问题后，就能借用遍历论里成熟而强大的工具（如 von Neumann 遍历定理）来攻击它。

测度保持系统

定义一个测度保持系统（measure-preserving system）为：一个（可能是无限的）空间 \(X\)，配上一个 \(\sigma\)-代数 \(\mathcal{B}\)、一个 \(\mathcal{B}\) 上的概率测度 \(P_X\)，以及一个双射 \(T:X\to X\)，使得 \(T\) 的所有幂次 \(T^n\)（\(n\in\mathbb{Z}\)）都是测度保持的，亦即对所有 \(A\in\mathcal{B}\) 都有 \[P_X(T^nA)=P_X(A).\] 在这种无限的背景下，\(\sigma\)-代数不能被严格地看作一个划分；它是一族对可数并、交、补封闭，并且包含 \(\varnothing\) 与 \(X\) 的集合。我们以通常的方式，在从 \(X\) 到 \(\mathbb{R}\) 的有界可测函数上定义期望 \(E_X\)，并在这些函数上定义平移算子 \(T^n\) 为 \[T^nf(x):=f(T^{-n}x).\] 为了稍微简化记号，本节中我们只处理实值函数，而不处理复值函数。

把四个零件逐一翻译

空间 \(X\)：所有“可能的状态”组成的集合。可以是一个圆、一个环面，甚至是“无穷多枚硬币的全部投掷结果”。
测度 \(P_X\)：给 \(X\) 的每个（可测）子集分配一个“占比/概率”，全空间的占比是 \(1\)。它代替了有限集合里的“元素个数 / 总数”。
变换 \(T\)：把每个状态搬到另一个状态的规则，可逆。\(T^n\) 表示连续搬 \(n\) 次（\(n\) 为负就反向搬）。
测度保持：搬动不改变任何集合的“占比”。这正对应整数平移 \(x\mapsto x+1\) 不改变集合的密度这一事实。

函数上的平移为什么用 \(T^{-n}\)？因为我们想让“把图样搬过去”和“把坐标系搬回来”一致：在新点 \(x\) 处的值，等于在旧点 \(T^{-n}x\) 处的原值。这样 \(T^n(T^mf)=T^{n+m}f\) 才成立。

例 11.20（圆周平移 Circle shift）设 \(X\) 是单位圆 \(\mathbb{R}/\mathbb{Z}\)，配 Lebesgue 测度；设 \(T\) 是平移 \(Tx=x+\alpha\)，其中 \(\alpha\in\mathbb{R}\) 固定。这个系统的动力学行为取决于 \(\alpha\) 是有理数还是无理数；例如前者时平移 \(T\) 是周期的，而后者时不是。然而在两种情形下都有如下几乎周期性（almost periodicity）：给定 \(X\) 上任一有界可测函数，平移族 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2(X)\) 中是预紧的（pre-compact）。特别地，给定任意 \(\varepsilon\)，对无穷多个 \(n\) 都有 \(\|T^nf-f\|_{L^2(X)}\le\varepsilon\)。正因为这个性质，我们说这个测度保持系统是紧的（compact）。

圆周平移：每次转固定角度。无论转多少次，函数的“形状”几乎不变（只是整体转了个角度），所以平移族在 \(L^2\) 中挤在一个紧致的小范围里。这是最“规整”的系统。

例 11.21（斜平移 Skew shift）设 \(X\) 是环面 \((\mathbb{R}/\mathbb{Z})\times(\mathbb{R}/\mathbb{Z})\)，配 Lebesgue 测度；设 \(T\) 是斜平移 \[T(x,y):=(x+\alpha,\;y+x),\] 其中 \(\alpha\in\mathbb{R}\) 固定。注意轨道 \(T^n(x,y)\) 在 \(x\) 分量上是 \(n\) 的线性函数，但在 \(y\) 分量上是 \(n\) 的二次函数。这个系统不是紧的，但它包含一个非平凡的紧因子（compact factor），即由所有形如 \(A\times(\mathbb{R}/\mathbb{Z})\) 的集合组成的 \(\sigma\)-代数 \(\mathcal{B}_0\)，其中 \(A\) 是 \(\mathbb{R}/\mathbb{Z}\) 中的 Borel 可测集。（换句话说，\(\mathcal{B}_0\)-可测的函数恰好是那些不依赖 \(y\) 变量的函数。）这个因子与前面提到的圆周平移同构。事实证明，斜平移是圆周平移的一个相对紧扩张（relatively compact extension），不过我们这里不会精确地量化这意味着什么，只指出：如果 \(f\) 是 \((\mathbb{R}/\mathbb{Z})\times(\mathbb{R}/\mathbb{Z})\) 上的光滑函数，那么轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(\mathcal{B}_0\) 的每一条纤维 \(\{x=\text{常数}\}\)（赋予显然的一维测度）上构成一个预紧集。

斜平移有两层结构：底层 \(x\) 像圆周平移（1 步），上层 \(y\) 多出一个二次项。把上层“压扁、只看 \(x\)”就回到圆周平移，所以圆周平移是它的因子，而它是圆周平移的“相对紧扩张”。这正对应后面 \(\mathcal{Z}_0\subset\mathcal{Z}_1\subset\mathcal{Z}_2\) 的塔状结构。

例 11.22（Bernoulli 平移 Bernoulli shift）现在考虑无限单位立方体 \(X:=[0,1]^{\mathbb{Z}}\)，即无限二元序列 \((\omega_n)_{n\in\mathbb{Z}}\) 的全体，配通常的乘积拓扑与 Borel \(\sigma\)-代数 \(\mathcal{B}\)。设 \(B\subset X\) 表示满足 \(\omega_0=1\) 的序列组成的“柱集（cylinder）”，并设 \(T\) 为平移算子 \(T^h(\omega_n)_{n\in\mathbb{Z}}:=(\omega_{n+h})_{n\in\mathbb{Z}}\)。利用 Kolmogorov 扩张定理（或 Carathéodory 扩张定理加 Tychonoff 定理），我们可以找到 \(X\) 上的一个测度 \(P\)，使得只要 \(h_1,\dots,h_m\) 是互异的整数，就有 \[P(T^{h_1}B\cap\cdots\cap T^{h_m}B)=2^{-m}.\] 通俗地说，可以把这个系统看作对应于无穷多次抛硬币的概率空间——每个整数 \(h\) 对应一枚硬币；事件 \(T^hB\) 就是“第 \(h\) 枚硬币正面朝上”，而平移算子对应把所有硬币的编号整体加 \(1\)。这里的行为与紧情形完全不同；事实上，如果 \(f\) 有界可测且均值为零，则可以证明当 \(n\to\infty\) 时 \(\langle T^nf,f\rangle_{L^2(X)}\to 0\)。具有这种性质的系统称为强混合的（strongly mixing）。

Bernoulli 平移：每枚硬币独立。两次相隔很远的平移之间几乎不相关，所以 \(\langle T^nf,f\rangle\to 0\)。它和圆周平移是两个极端：一个“毫无记忆”，一个“几乎不变”。真实系统介于两者之间，这正是分析的难点。

Furstenberg 多重回归定理

Furstenberg 通过证明如下等价表述，推导出了 Szemerédi 定理。

定理 11.23（Furstenberg 多重回归定理）[121][125][122]设 \((X,\mathcal{B},P,T)\) 是一个测度保持系统，\(f:X\to\mathbb{R}^+\) 是一个非负有界可测函数，且 \(E(f)>0\)。那么对所有 \(k\ge 1\) 都有 \[\liminf_{N\to\infty}\;\mathbb{E}_{1\le n\le N}\,E_X\big(f\cdot T^nf\cdots T^{(k-1)n}f\big)>0.\]

这条式子在说什么取 \(f=1_A\)（集合 \(A\) 的示性函数）。那么乘积 \(f\cdot T^nf\cdots T^{(k-1)n}f\) 在点 \(x\) 处等于 \(1\)，当且仅当 \(x,T^{-n}x,\dots,T^{-(k-1)n}x\) 全都落在 \(A\) 里。于是 \[E_X\big(1_A\cdot T^n1_A\cdots T^{(k-1)n}1_A\big)=P\big(A\cap T^nA\cap\cdots\cap T^{(k-1)n}A\big).\] 定理断言：把这个交集的测度对 \(n\) 取平均，下极限严格大于零。也就是说，存在“正比例”那么多的步长 \(n\)，使得一个点 \(x\) 与它被 \(T\) 反复搬动后的 \(k\) 个位置同时落进 \(A\)。这正是“等差排列”在动力学里的化身：\(x,T^nx,T^{2n}x,\dots\) 就是公差为 \(n\) 的“级数”。

多重回归就是把“算术级数 \(a,a+n,a+2n\) 全在 \(A\) 里”翻译成“点 \(x\) 及其搬动 \(T^nx,T^{2n}x\) 全在 \(A\) 里”。\(\liminf>0\) 保证了这种好步长 \(n\) 占正比例，于是必然存在。

从 Szemerédi 定理推出本定理是相当容易的；我们把它留作习题。反过来，从 Furstenberg 定理推出 Szemerédi 定理则要略微棘手一些，需要一些测度论工具：

假定定理 11.23 来证明定理 10.1（梗概）. 反设我们能找到一个具有正上密度、却不含长为 \(k\) 的级数的集合 \(A\subseteq\mathbb{Z}\)。于是可以找到一列趋于无穷的整数 \(N_1,N_2,\dots\)，使得 \(\liminf_{j\to\infty}P_{[-N_j,N_j]}(A)>0\)。现在用 Hahn–Banach 定理，在有界实值序列 \((c_j)_{j=1}^\infty\) 上构造一个线性泛函 \(\lambda\)，使得 \[\liminf_{j\to\infty}c_j\;\le\;\lambda\big((c_j)_{j=1}^\infty\big)\;\le\;\limsup_{j\to\infty}c_j.\] 现在考虑无限单位立方体 \(X:=[0,1]^{\mathbb{Z}}\)，即无限二元序列 \((\omega_n)_{n\in\mathbb{Z}}\) 的全体，配通常的乘积拓扑与 Borel \(\sigma\)-代数 \(\mathcal{B}\)。设 \(B\subset X\) 表示满足 \(\omega_0=1\) 的序列组成的柱集，\(T\) 为平移算子 \(T^h(\omega_n)_{n\in\mathbb{Z}}:=(\omega_{n+h})_{n\in\mathbb{Z}}\)。利用 Kolmogorov 扩张定理（或 Carathéodory 扩张定理加 Tychonoff 定理），可以找到 \(X\) 上的测度 \(P\)，使得对所有 \(h_1,\dots,h_m\in\mathbb{Z}\) 都有 \[P(T^{h_1}B\cap\cdots\cap T^{h_m}B)=\lambda\Big(\big(P_{[-N_j,N_j]}((A+h_1)\cap\cdots\cap(A+h_m))\big)_{j=1}^\infty\Big).\] 特别地我们看到 \(P(B)>0\)。把定理 11.23 应用于 \(f=1_B\)，便得出：至少对一个非零的 \(n\) 有 \(P(B\cap T^nB\cap\cdots\cap T^{(k-1)n}B)>0\)，这蕴含 \(A\) 含有长为 \(k\) 的级数——与假设矛盾。♦

这个证明的精髓：把整数集“随机化”成一个动力系统

整数集 \(A\) 给了我们一族“密度”\(P_{[-N_j,N_j]}(\cdots)\)。但这些密度只是数列，没有现成的极限。
Hahn–Banach 造出的 \(\lambda\) 是一个“广义极限”：它对任意有界数列都给出一个夹在 \(\liminf\) 与 \(\limsup\) 之间的值，从而充当极限。
把 \(\lambda\) 套在“平移后的交集密度”上，恰好定义出立方体 \(X\) 上一个相容的概率测度 \(P\)（柱集的概率确定整个测度）。这一步把整数世界搬进了动力系统世界。
在新世界里，“\(A\) 含 \(k\)-级数”对应“柱集 \(B\) 多重回归”。Furstenberg 定理保证多重回归发生，于是 \(A\) 必有级数，矛盾。

关键魔法是：组合学里“求数列极限”这种麻烦事，被 Hahn–Banach 一次性化解，换来了一个干净的概率空间。

遍历论中的 Gowers 一致性范数

可以用与前几节类似的方式来证明多重回归定理。例如，存在 Gowers 一致性范数 \(\|f\|_{U^d(X)}\) 的一个类比，对有界可测的 \(f\) 归纳地定义为 \(\|f\|_{U^0(X)}:=E_X(f)\) 以及 \[\|f\|_{U^d(X)}:=\Big(\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}\,\|f\cdot T^nf\|_{U^{d-1}(X)}^{2^{d-1}}\Big)^{1/2^d}.\] （这个极限的存在性由 von Neumann 遍历定理保证；见 [185]。）可以验证这些 \(U^d\) 范数满足与其有限型对应物类似的性质；见 [185]，但有一个关键区别：现在完全有可能存在非零的函数 \(f\) 其 \(U^d\) 范数为零。我们有一个重要的广义 von Neumann 定理 (11.8) 的类比，即 \[\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}\,E_X\big(f_0\cdot T^nf_1\cdots T^{(k-1)n}f_{k-1}\big)=0,\] 只要 \(f_0,\dots,f_{k-1}\) 是有界可测函数，且其中至少有一个 \(f_j\) 的 \(U^{k-1}\) 范数为零。因此，\(U^{k-1}\) 范数为零的函数对回归的影响可以忽略不计。

直觉：把函数拆成“结构”与“噪声”这条广义 von Neumann 定理说的是：在那个多重平均里，只要有一个因子是“伪随机的”（\(U^{k-1}\) 范数为零），整个平均就趋于零。换句话说——

把任意 \(f\) 写成 \(f=(\text{结构部分})+(\text{噪声部分})\)，其中噪声部分的 \(U^{k-1}\) 范数为零。
展开多重乘积时，任何含噪声因子的项都贡献 \(0\)。
于是只剩下“全是结构部分”的那一项有贡献。证明回归，只需对结构部分证明即可。

这与有限型证明里“一致性 vs. 反一致性”的二分法是完全平行的。

特征因子 \(\mathcal{Z}_{k-2}\)

再一次，注意力转向一致性的障碍（obstructions to uniformity）。事实证明，在无穷的背景下，这些障碍有一个相当漂亮的刻画。令 \(U^{k-1}(X)^*\) 表示所有使得下面表达式有限的有界函数 \(f\) 之空间： \[\|f\|_{U^{k-1}(X)^*}:=\sup\big\{|E_X(fg)|:\|g\|_{U^{k-1}(X)}\le 1\big\}.\] 事实证明（见 [185]）存在唯一的 \(\sigma\)-代数 \(\mathcal{Z}_{k-2}\)，使得 \(U^{k-1}(X)^*\) 在 \(L^2\) 拓扑下的闭包，恰好由那些关于 \(\mathcal{Z}_{k-2}\) 可测的平方可积函数组成；因而 \(\mathcal{Z}_{k-2}\) 就是 \(U^{k-1}(X)\) 范数的万有特征因子（universal characteristic factor）。作为推论，可以精确地刻画哪些函数是 \(k-1\) 阶 Gowers 一致的： \[\|f\|_{U^{k-1}(X)}=0\iff E(f\,|\,\mathcal{Z}_{k-2})=0.\] 这里条件期望 \(f\mapsto E(f\,|\,\mathcal{Z}_{k-2})\) 定义为到 \(\mathcal{Z}_{k-2}\)-可测函数空间的 \(L^2\)-正交投影。

特征因子 = 决定回归的“最小信息层”把 \(\mathcal{Z}_{k-2}\) 想成对状态空间的一种“粗看”：只记录决定回归的关键信息，忽略其余细节。上面的等价式说：一个函数对回归无贡献（\(U^{k-1}\) 范数为零），当且仅当它在这层粗看里平均下来等于零。于是要证回归，只需把 \(f\) 投影到 \(\mathcal{Z}_{k-2}\) 上，对投影证明即可——因为误差 \(f-E(f\,|\,\mathcal{Z}_{k-2})\) 的 \(U^{k-1}(X)\) 范数为零，从而无关紧要。所以问题归结为：尽可能彻底地看懂因子 \(\mathcal{Z}_{k-2}\) 长什么样。

上述讨论的一个推论是：为了证明 Furstenberg 回归定理，只需在附加假设“\(f\) 是 \(\mathcal{Z}_{k-2}\)-可测的”之下证明它即可（因为误差 \(f-E(f\,|\,\mathcal{Z}_{k-2})\) 的 \(U^{k-1}(X)\) 范数为零，故无关紧要）。要做到这一点，尽可能理解 \(\mathcal{B}\) 的因子 \(\mathcal{Z}_{k-2}\) 显然是至关重要的。

事实证明，因子 \(\mathcal{Z}_0\) 是 \(X\) 中不变集的空间，即 \(\mathcal{Z}_0:=\{A\in\mathcal{B}:TA=A\}\)。这本质上就是 von Neumann 遍历定理，我们把它留作习题。因子 \(\mathcal{Z}_1\) 称为 Kronecker 因子，它由所有几乎周期函数生成，或等价地，由平移算子 \(T\) 的特征函数（eigenfunctions）生成。更高的因子更难明确描述。然而，不太困难地可以证明（例如见 [121][185][236]；一个密切相关的结果在 [386] 中）：每个因子 \(\mathcal{Z}_{d+1}\) 都是前一个因子 \(\mathcal{Z}_d\) 的一个相对紧扩张（事实上是最大的相对紧扩张）。这究竟意味着什么有点难以精确描述，但大致是说：对于一个 \(\mathcal{Z}_{d+1}\)-可测的稠密集合中的 \(f\)，轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 相对于 \(\mathcal{Z}_d\) 是预紧的——通俗地说，当把它限制在 \(\mathcal{Z}_d\) 的每个“原子”或“纤维”上时它是预紧的。这些断言的严格表述见 [122]（它需要测度分解的理论）。利用一些测度论与分析的工具，以及一个与 van der Waerden 定理密切相关的组合论证，[121][125] 中证明了：如果 Furstenberg 回归定理对某个因子 \(\mathcal{Z}_d\) 成立，那么它对相对紧扩张 \(\mathcal{Z}_{d+1}\) 也成立；这类似于命题 11.19。这一事实结合前面的讨论，便得出 Furstenberg 回归定理，从而得出 Szemerédi 定理。

因子塔：\(\mathcal{Z}_0\subseteq\mathcal{Z}_1\subseteq\mathcal{Z}_2\subseteq\cdots\subseteq\mathcal{Z}_{k-2}\)。底层最粗（只看不变集），每往上一层就“多盖一层结构”，恰好对应圆周平移→斜平移这种从 1 步到 2 步的升级。证明策略：先在最底层证回归，再逐层（用类似 van der Waerden 的论证）把它“抬”上去。

为什么逐层往上抬就能成功

地基：在 \(\mathcal{Z}_0\) 上，回归本质上是平凡的（von Neumann 遍历定理）。
归纳步：假设回归在 \(\mathcal{Z}_d\) 上已成立。因为 \(\mathcal{Z}_{d+1}\) 只是在 \(\mathcal{Z}_d\) 上“相对紧地”多盖一层（每条纤维上的轨道挤在紧集里），可以借助类似 van der Waerden 定理的组合论证把回归从下层提升到上层。
封顶：有限步后到达 \(\mathcal{Z}_{k-2}\)，而这一层已经捕获了 \(U^{k-1}\) 的全部障碍，于是回归对一般 \(f\) 成立。

这套“先理解最简单的结构系统，再用扩张逐级递推”的思路，是整个遍历方法的骨架。

Host–Kra、Ziegler 与幂零系统

近来，Host–Kra [185]（以及随后 Ziegler [386]）在理解因子 \(\mathcal{Z}_{k-2}\) 方面取得了重大进展。（严格地说，Ziegler 处理的是 \(\mathcal{Z}_{k-2}\) 的一个略有不同的变体 \(\mathcal{Y}_{k-2}\)；两者的比较见 [236]。）事实证明，因子 \(\mathcal{Z}_{k-2}\) 同构于 \((k-2)\) 步幂零系统（nilsystems）的逆极限；换句话说，是一个系统 \((G/\Gamma,\mathcal{B},T,P)\)，其中 \(G\) 是一个 \((k-2)\) 阶幂零 Lie 群，\(\Gamma\) 是 \(G\) 的一个余紧子群，\(\mathcal{B}\) 是通常的 Borel 代数，\(T\) 是某个左平移算子 \(T:x\mapsto gx\)（\(g\in G\) 固定），而 \(P\) 是归一化的 Haar 测度。例如，例 11.20 中的圆周平移是一个 1 步幂零系统，而斜平移则同构于一个 2 步幂零系统。这些对 \(\mathcal{Z}_{k-2}\) 的刻画大致类似于 11.2 节讨论的“困难型”逆定理；关于 \(k=4\) 情形的进一步讨论见 [160]。正如那些困难型逆定理导致 Szemerédi 定理更好的定量结果一样，这里给出的对 \(\mathcal{Z}_{k-2}\) 的刻画导致了更强的回归定理；例如，它们可以用来把 Furstenberg 回归定理中的下极限替换为极限，并且实际上得到更强的结果：平均值 \(\mathbb{E}_{1\le n\le N}T^nf\cdots T^{(k-1)n}f\) 在 \(L^2\) 范数下收敛到一个非零（且在某种程度上可显式描述）的函数。见 [185][386]。当前的一个研究方向是发展并简化这些遍历论结果（它们目前的证明相当困难且冗长），并厘清它们与 Fourier 分析方法、组合方法中类似进展之间的联系。

幂零系统是什么、为什么自然“幂零群”是比交换群略复杂、但仍然受控的一类群（多次取换位子后归零）。一个 \(d\) 步幂零系统恰好对应着“\(d\) 次多项式式的相位”——圆周平移给出线性相位 \(e^{2\pi i n\alpha}\)（1 步），斜平移给出二次相位（2 步）。Host–Kra–Ziegler 的深刻结论是：决定 \(k\)-项算术级数计数的全部结构，恰好就是这些 \((k-2)\) 步幂零系统，别无其他。这就是“逆定理”在动力学侧的完美对应物：高阶 Fourier 分析里看到的“多项式相位”，在这里现身为幂零流形上的平移。

遍历方法能证明的更强结果

遍历方法非常适合建立比 Szemerédi 定理更强的组合结果，其中若干至今尚未用其他方法证明。我们在此描述其中一些。

定理 11.24（多维 Szemerédi 定理）[123]设 \(d\ge 1\)，\(A\subset\mathbb{Z}^d\) 满足 \(\limsup_{N\to\infty}P_{[-N,N]^d}(A)>0\)。那么对任意 \(v_1,\dots,v_k\in\mathbb{Z}^d\)，存在无穷多对 \((a,r)\in\mathbb{Z}^d\times\mathbb{Z}^+\)，使得 \[a+rv_1,\;\dots,\;a+rv_k\in A.\]

一维的“等差三点”升级为多维的“任意几何配置”：给定一组方向向量 \(v_1,\dots,v_k\)，正密度集 \(A\) 里必含这组配置的某个放大平移副本 \(a+rv_1,\dots,a+rv_k\)。Szemerédi 定理是它取 \(d=1,\,v_i=i\) 的特例。

定理 11.25（多项式 Szemerédi 定理）[23]设 \(P_1,\dots,P_k:\mathbb{Z}\to\mathbb{Z}\) 是把整数映到整数的多项式，满足 \(P_1(0)=\cdots=P_k(0)=0\)。设 \(A\subset\mathbb{Z}\) 具有正上密度。那么存在无穷多对 \((a,r)\)，使得 \[a+P_1(r),\;\dots,\;a+P_k(r)\in A.\]

举个具体例子取 \(k=2\)，\(P_1(r)=0,\;P_2(r)=r^2\)。定理断言：任意正密度集 \(A\) 中存在无穷多对 \((a,r)\)，使 \(a\) 与 \(a+r^2\) 同时在 \(A\) 里——也就是 \(A\) 里有两个相差完全平方数的元素。注意这里间隔不再是等差，而是沿着多项式 \(r^2\) 取值，这是普通 Szemerédi 定理完全够不着的。条件 \(P_i(0)=0\) 保证 \(r=0\) 时所有点重合到 \(a\)，从而配置“从 \(A\) 内部长出来”。

定理 11.26（密度型 Hales–Jewett 定理）[124]设 \(n\ge 1\)，\(0<\delta\le 1\)。那么存在一个整数 \(d=d(n,\delta)\ge 1\)，使得若 \(A\) 是 \([0,n-1]^d\) 的任一基数 \(|A|\ge\delta n^d\) 的子集，则 \(A\) 含有一个长为 \(n\) 的真组合直线（proper combinatorial line）\(a+[0,n-1]\cdot v\)，其中 \(a\in[0,n-1]^d\)，\(v\in[0,1]^d\)。

组合直线的样子在 \(n\) 进制、\(d\) 位的“词”空间 \([0,n-1]^d\) 里，一条组合直线是这样得到的一组 \(n\) 个词：选定若干“活动坐标”（由 \(v\) 中为 \(1\) 的位置标记），让它们一起从 \(0\) 同步增长到 \(n-1\)，其余坐标固定不变。例如 \(n=3,d=2\) 时，\((0,1),(1,1),(2,1)\) 是一条直线（第一位活动、第二位固定为 \(1\)）。密度型 Hales–Jewett 说：只要 \(A\) 占的比例不低于 \(\delta\)，维数 \(d\) 一旦足够大，\(A\) 里就一定能找到一整条这样的直线。它是这些定理中最强的之一——多维 Szemerédi 等都能由它推出。

进一步的精细化还包括：对上述定理所构造的对 \((a,r)\) 给出附加的结构信息，以及各种极限的收敛性；此外，目前有大量工作在把对 \(U^k\) 范数及多重回归之特征因子的描述，推广到这些更复杂的回归定理上。遗憾的是，对这些激动人心的进展作一个完整的综述，已远超本书的范围。

习题

11.5.1　证明：对固定的 \(k\)，定理 11.1 蕴含同一 \(k\) 值的定理 11.23。
11.5.2（Poincaré 回归定理）　仅用鸽笼原理与初等测度论，证明 \(k=2\) 情形的定理 11.23。
11.5.3（von Neumann 遍历定理）　设 \((X,\mathcal{B},P,T)\) 是测度保持系统。证明：空间 \(\{f\in L^2(X):Tf=f\}\) 与 \(\{Tf-f:f\in L^2(X)\}\) 是 \(L^2(X)\) 的互补正交子空间。由此推出：若 \(\mathcal{Z}_0:=\{A\in\mathcal{B}:TA=A\}\)，则对任意 \(f\in L^2(X)\)，\(\mathbb{E}_{1\le n\le N}T^nf\) 在 \(L^2(X)\) 中收敛到 \(E(f\,|\,\mathcal{Z}_0)\)，且 \(\|f\|_{U^1(Z)}=\|E(f\,|\,\mathcal{Z}_0)\|_{L^2(X)}\)。注意当系统是遍历的（即 \(\mathcal{Z}_0=\{\varnothing,X\}\)）时这些结果会简化，因为此时 \(E(f\,|\,\mathcal{Z}_0)\) 就是 \(E_X(f)\)。特别地此时 \(\|f\|_{U^1(Z)}=|E_X(f)|\)，与有限型情形一样。
11.5.4（Khintchine 回归定理）　设 \(A\) 是测度保持系统 \((X,\mathcal{B},P,T)\) 的一个子集。证明：对每个 \(\varepsilon>0\)，存在无穷多个 \(n\in\mathbb{Z}\) 使得 \(P(A\cap T^nA)\ge P(A)^2-\varepsilon\)。（提示：给 \(\|\mathbb{E}_{1\le n\le N}1_{T^nA}\|_{L^2(Z)}\) 求上、下界。或者用 von Neumann 遍历定理。）证明：若把 \(P(A)^2-\varepsilon\) 换成 \(P(A)^2+\varepsilon\)，则无论 \(P(A)\) 与 \(\varepsilon\) 多小，定理都不成立。自然会猜想 \(P(A\cap T^nA\cap\cdots\cap T^{(k-1)n}A)\ge P(A)^k-\varepsilon\) 对无穷多个 \(n\) 成立；在附加遍历性假设下，这对 \(k=1,2,3,4\) 为真，但对 \(k>4\) 不成立，见 [22]。
11.5.5　设 \((X,\mathcal{B},P,T)\) 是紧测度保持系统（即只要 \(f\) 有界可测，轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2\) 中预紧）。在此特殊情形下证明 Furstenberg 回归定理。（与命题 10.35 或命题 11.19 的 \(k=3\) 证明对照。）
11.5.6　设 \((X,\mathcal{B},P,T)\) 是弱混合测度保持系统，即只要 \(f\) 有界、可测、期望为零，就有 \(\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}|\langle T^nf,f\rangle_{L^2(X)}|^2=0\)。（这比强混合弱，强混合要求在同样假设下 \(\lim_{n\to\infty}\langle T^nf,f\rangle=0\)。）证明：\(\|f\|_{U^{k-1}(X)}=0\) 当且仅当 \(E_X(f)=0\)，并在此特殊情形下建立 Furstenberg 回归定理。
11.5.7　设 \((X,\mathcal{B},P,T)\) 是测度保持系统，\(f\) 有界可测。证明：若 \(f\) 是几乎周期的（即轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2(X)\) 中预紧），则只要 \(g\) 有界、可测且 \(U^2(X)\) 范数为零，就有 \(E_X(fg)=0\)。与习题 11.4.8 对照。
11.5.8　设 \((X,\mathcal{B},P,T)\) 是测度保持系统。令 \(\mathcal{Z}_1\) 是使所有几乎周期函数都可测的最小 \(\sigma\)-代数。设 \(f\) 有界可测，证明：\(\|f\|_{U^2(X)}=0\) 当且仅当 \(E(f\,|\,\mathcal{Z}_1)=0\)。（提示：“仅当”部分由上一题得出。对“当”的部分，构造对偶函数 \(D_2f:=\lim_{N\to\infty}\mathbb{E}_{-N\le n\le N}T^nf\,E_X(f\,T^nf\,|\,\mathcal{Z}_0)\)，并证明该函数……）

返回全书目录