11.5 无穷遍历论方法The infinitary ergodic approach
本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演 / 自测)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本节是全章里最“抽象”的一节——它把数论里的算术级数问题翻译成“一个空间不断被搬动,问它什么时候会回到出发点附近”的动力学问题。讲解会把每一个新名词背后的直觉拆开讲清。
在本节中,我们讨论 Furstenberg 用无穷遍历论方法证明 Szemerédi 定理时所依据的一些想法。这些论证是证明该定理最短、最优雅的途径,但也需要一定量的、关于无限测度空间的工具。此外,从这些方法中提取出定量上界是相当困难的。由于这里的技术与本书其余部分的技术相当脱节,我们不给出完整细节,而是把读者引向文献 [122]。然而,这里发展出来的洞见,对于本章中若干有限型(finitary)论证的发展是必不可少的,最值得一提的是 Szemerédi 定理的有限型遍历证明,以及关于素数中算术级数的 Green–Tao 定理。
测度保持系统
定义一个测度保持系统(measure-preserving system)为:一个(可能是无限的)空间 \(X\),配上一个 \(\sigma\)-代数 \(\mathcal{B}\)、一个 \(\mathcal{B}\) 上的概率测度 \(P_X\),以及一个双射 \(T:X\to X\),使得 \(T\) 的所有幂次 \(T^n\)(\(n\in\mathbb{Z}\))都是测度保持的,亦即对所有 \(A\in\mathcal{B}\) 都有 \[P_X(T^nA)=P_X(A).\] 在这种无限的背景下,\(\sigma\)-代数不能被严格地看作一个划分;它是一族对可数并、交、补封闭,并且包含 \(\varnothing\) 与 \(X\) 的集合。我们以通常的方式,在从 \(X\) 到 \(\mathbb{R}\) 的有界可测函数上定义期望 \(E_X\),并在这些函数上定义平移算子 \(T^n\) 为 \[T^nf(x):=f(T^{-n}x).\] 为了稍微简化记号,本节中我们只处理实值函数,而不处理复值函数。
- 空间 \(X\):所有“可能的状态”组成的集合。可以是一个圆、一个环面,甚至是“无穷多枚硬币的全部投掷结果”。
- 测度 \(P_X\):给 \(X\) 的每个(可测)子集分配一个“占比/概率”,全空间的占比是 \(1\)。它代替了有限集合里的“元素个数 / 总数”。
- 变换 \(T\):把每个状态搬到另一个状态的规则,可逆。\(T^n\) 表示连续搬 \(n\) 次(\(n\) 为负就反向搬)。
- 测度保持:搬动不改变任何集合的“占比”。这正对应整数平移 \(x\mapsto x+1\) 不改变集合的密度这一事实。
Furstenberg 多重回归定理
Furstenberg 通过证明如下等价表述,推导出了 Szemerédi 定理。
从 Szemerédi 定理推出本定理是相当容易的;我们把它留作习题。反过来,从 Furstenberg 定理推出 Szemerédi 定理则要略微棘手一些,需要一些测度论工具:
- 整数集 \(A\) 给了我们一族“密度”\(P_{[-N_j,N_j]}(\cdots)\)。但这些密度只是数列,没有现成的极限。
- Hahn–Banach 造出的 \(\lambda\) 是一个“广义极限”:它对任意有界数列都给出一个夹在 \(\liminf\) 与 \(\limsup\) 之间的值,从而充当极限。
- 把 \(\lambda\) 套在“平移后的交集密度”上,恰好定义出立方体 \(X\) 上一个相容的概率测度 \(P\)(柱集的概率确定整个测度)。这一步把整数世界搬进了动力系统世界。
- 在新世界里,“\(A\) 含 \(k\)-级数”对应“柱集 \(B\) 多重回归”。Furstenberg 定理保证多重回归发生,于是 \(A\) 必有级数,矛盾。
遍历论中的 Gowers 一致性范数
可以用与前几节类似的方式来证明多重回归定理。例如,存在 Gowers 一致性范数 \(\|f\|_{U^d(X)}\) 的一个类比,对有界可测的 \(f\) 归纳地定义为 \(\|f\|_{U^0(X)}:=E_X(f)\) 以及 \[\|f\|_{U^d(X)}:=\Big(\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}\,\|f\cdot T^nf\|_{U^{d-1}(X)}^{2^{d-1}}\Big)^{1/2^d}.\] (这个极限的存在性由 von Neumann 遍历定理保证;见 [185]。)可以验证这些 \(U^d\) 范数满足与其有限型对应物类似的性质;见 [185],但有一个关键区别:现在完全有可能存在非零的函数 \(f\) 其 \(U^d\) 范数为零。我们有一个重要的广义 von Neumann 定理 (11.8) 的类比,即 \[\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}\,E_X\big(f_0\cdot T^nf_1\cdots T^{(k-1)n}f_{k-1}\big)=0,\] 只要 \(f_0,\dots,f_{k-1}\) 是有界可测函数,且其中至少有一个 \(f_j\) 的 \(U^{k-1}\) 范数为零。因此,\(U^{k-1}\) 范数为零的函数对回归的影响可以忽略不计。
- 把任意 \(f\) 写成 \(f=(\text{结构部分})+(\text{噪声部分})\),其中噪声部分的 \(U^{k-1}\) 范数为零。
- 展开多重乘积时,任何含噪声因子的项都贡献 \(0\)。
- 于是只剩下“全是结构部分”的那一项有贡献。证明回归,只需对结构部分证明即可。
特征因子 \(\mathcal{Z}_{k-2}\)
再一次,注意力转向一致性的障碍(obstructions to uniformity)。事实证明,在无穷的背景下,这些障碍有一个相当漂亮的刻画。令 \(U^{k-1}(X)^*\) 表示所有使得下面表达式有限的有界函数 \(f\) 之空间: \[\|f\|_{U^{k-1}(X)^*}:=\sup\big\{|E_X(fg)|:\|g\|_{U^{k-1}(X)}\le 1\big\}.\] 事实证明(见 [185])存在唯一的 \(\sigma\)-代数 \(\mathcal{Z}_{k-2}\),使得 \(U^{k-1}(X)^*\) 在 \(L^2\) 拓扑下的闭包,恰好由那些关于 \(\mathcal{Z}_{k-2}\) 可测的平方可积函数组成;因而 \(\mathcal{Z}_{k-2}\) 就是 \(U^{k-1}(X)\) 范数的万有特征因子(universal characteristic factor)。作为推论,可以精确地刻画哪些函数是 \(k-1\) 阶 Gowers 一致的: \[\|f\|_{U^{k-1}(X)}=0\iff E(f\,|\,\mathcal{Z}_{k-2})=0.\] 这里条件期望 \(f\mapsto E(f\,|\,\mathcal{Z}_{k-2})\) 定义为到 \(\mathcal{Z}_{k-2}\)-可测函数空间的 \(L^2\)-正交投影。
上述讨论的一个推论是:为了证明 Furstenberg 回归定理,只需在附加假设“\(f\) 是 \(\mathcal{Z}_{k-2}\)-可测的”之下证明它即可(因为误差 \(f-E(f\,|\,\mathcal{Z}_{k-2})\) 的 \(U^{k-1}(X)\) 范数为零,故无关紧要)。要做到这一点,尽可能理解 \(\mathcal{B}\) 的因子 \(\mathcal{Z}_{k-2}\) 显然是至关重要的。
事实证明,因子 \(\mathcal{Z}_0\) 是 \(X\) 中不变集的空间,即 \(\mathcal{Z}_0:=\{A\in\mathcal{B}:TA=A\}\)。这本质上就是 von Neumann 遍历定理,我们把它留作习题。因子 \(\mathcal{Z}_1\) 称为 Kronecker 因子,它由所有几乎周期函数生成,或等价地,由平移算子 \(T\) 的特征函数(eigenfunctions)生成。更高的因子更难明确描述。然而,不太困难地可以证明(例如见 [121][185][236];一个密切相关的结果在 [386] 中):每个因子 \(\mathcal{Z}_{d+1}\) 都是前一个因子 \(\mathcal{Z}_d\) 的一个相对紧扩张(事实上是最大的相对紧扩张)。这究竟意味着什么有点难以精确描述,但大致是说:对于一个 \(\mathcal{Z}_{d+1}\)-可测的稠密集合中的 \(f\),轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 相对于 \(\mathcal{Z}_d\) 是预紧的——通俗地说,当把它限制在 \(\mathcal{Z}_d\) 的每个“原子”或“纤维”上时它是预紧的。这些断言的严格表述见 [122](它需要测度分解的理论)。利用一些测度论与分析的工具,以及一个与 van der Waerden 定理密切相关的组合论证,[121][125] 中证明了:如果 Furstenberg 回归定理对某个因子 \(\mathcal{Z}_d\) 成立,那么它对相对紧扩张 \(\mathcal{Z}_{d+1}\) 也成立;这类似于命题 11.19。这一事实结合前面的讨论,便得出 Furstenberg 回归定理,从而得出 Szemerédi 定理。
- 地基:在 \(\mathcal{Z}_0\) 上,回归本质上是平凡的(von Neumann 遍历定理)。
- 归纳步:假设回归在 \(\mathcal{Z}_d\) 上已成立。因为 \(\mathcal{Z}_{d+1}\) 只是在 \(\mathcal{Z}_d\) 上“相对紧地”多盖一层(每条纤维上的轨道挤在紧集里),可以借助类似 van der Waerden 定理的组合论证把回归从下层提升到上层。
- 封顶:有限步后到达 \(\mathcal{Z}_{k-2}\),而这一层已经捕获了 \(U^{k-1}\) 的全部障碍,于是回归对一般 \(f\) 成立。
Host–Kra、Ziegler 与幂零系统
近来,Host–Kra [185](以及随后 Ziegler [386])在理解因子 \(\mathcal{Z}_{k-2}\) 方面取得了重大进展。(严格地说,Ziegler 处理的是 \(\mathcal{Z}_{k-2}\) 的一个略有不同的变体 \(\mathcal{Y}_{k-2}\);两者的比较见 [236]。)事实证明,因子 \(\mathcal{Z}_{k-2}\) 同构于 \((k-2)\) 步幂零系统(nilsystems)的逆极限;换句话说,是一个系统 \((G/\Gamma,\mathcal{B},T,P)\),其中 \(G\) 是一个 \((k-2)\) 阶幂零 Lie 群,\(\Gamma\) 是 \(G\) 的一个余紧子群,\(\mathcal{B}\) 是通常的 Borel 代数,\(T\) 是某个左平移算子 \(T:x\mapsto gx\)(\(g\in G\) 固定),而 \(P\) 是归一化的 Haar 测度。例如,例 11.20 中的圆周平移是一个 1 步幂零系统,而斜平移则同构于一个 2 步幂零系统。这些对 \(\mathcal{Z}_{k-2}\) 的刻画大致类似于 11.2 节讨论的“困难型”逆定理;关于 \(k=4\) 情形的进一步讨论见 [160]。正如那些困难型逆定理导致 Szemerédi 定理更好的定量结果一样,这里给出的对 \(\mathcal{Z}_{k-2}\) 的刻画导致了更强的回归定理;例如,它们可以用来把 Furstenberg 回归定理中的下极限替换为极限,并且实际上得到更强的结果:平均值 \(\mathbb{E}_{1\le n\le N}T^nf\cdots T^{(k-1)n}f\) 在 \(L^2\) 范数下收敛到一个非零(且在某种程度上可显式描述)的函数。见 [185][386]。当前的一个研究方向是发展并简化这些遍历论结果(它们目前的证明相当困难且冗长),并厘清它们与 Fourier 分析方法、组合方法中类似进展之间的联系。
遍历方法能证明的更强结果
遍历方法非常适合建立比 Szemerédi 定理更强的组合结果,其中若干至今尚未用其他方法证明。我们在此描述其中一些。
进一步的精细化还包括:对上述定理所构造的对 \((a,r)\) 给出附加的结构信息,以及各种极限的收敛性;此外,目前有大量工作在把对 \(U^k\) 范数及多重回归之特征因子的描述,推广到这些更复杂的回归定理上。遗憾的是,对这些激动人心的进展作一个完整的综述,已远超本书的范围。
习题
- 11.5.1 证明:对固定的 \(k\),定理 11.1 蕴含同一 \(k\) 值的定理 11.23。
- 11.5.2(Poincaré 回归定理) 仅用鸽笼原理与初等测度论,证明 \(k=2\) 情形的定理 11.23。
- 11.5.3(von Neumann 遍历定理) 设 \((X,\mathcal{B},P,T)\) 是测度保持系统。证明:空间 \(\{f\in L^2(X):Tf=f\}\) 与 \(\{Tf-f:f\in L^2(X)\}\) 是 \(L^2(X)\) 的互补正交子空间。由此推出:若 \(\mathcal{Z}_0:=\{A\in\mathcal{B}:TA=A\}\),则对任意 \(f\in L^2(X)\),\(\mathbb{E}_{1\le n\le N}T^nf\) 在 \(L^2(X)\) 中收敛到 \(E(f\,|\,\mathcal{Z}_0)\),且 \(\|f\|_{U^1(Z)}=\|E(f\,|\,\mathcal{Z}_0)\|_{L^2(X)}\)。注意当系统是遍历的(即 \(\mathcal{Z}_0=\{\varnothing,X\}\))时这些结果会简化,因为此时 \(E(f\,|\,\mathcal{Z}_0)\) 就是 \(E_X(f)\)。特别地此时 \(\|f\|_{U^1(Z)}=|E_X(f)|\),与有限型情形一样。
- 11.5.4(Khintchine 回归定理) 设 \(A\) 是测度保持系统 \((X,\mathcal{B},P,T)\) 的一个子集。证明:对每个 \(\varepsilon>0\),存在无穷多个 \(n\in\mathbb{Z}\) 使得 \(P(A\cap T^nA)\ge P(A)^2-\varepsilon\)。(提示:给 \(\|\mathbb{E}_{1\le n\le N}1_{T^nA}\|_{L^2(Z)}\) 求上、下界。或者用 von Neumann 遍历定理。)证明:若把 \(P(A)^2-\varepsilon\) 换成 \(P(A)^2+\varepsilon\),则无论 \(P(A)\) 与 \(\varepsilon\) 多小,定理都不成立。自然会猜想 \(P(A\cap T^nA\cap\cdots\cap T^{(k-1)n}A)\ge P(A)^k-\varepsilon\) 对无穷多个 \(n\) 成立;在附加遍历性假设下,这对 \(k=1,2,3,4\) 为真,但对 \(k>4\) 不成立,见 [22]。
- 11.5.5 设 \((X,\mathcal{B},P,T)\) 是紧测度保持系统(即只要 \(f\) 有界可测,轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2\) 中预紧)。在此特殊情形下证明 Furstenberg 回归定理。(与命题 10.35 或命题 11.19 的 \(k=3\) 证明对照。)
- 11.5.6 设 \((X,\mathcal{B},P,T)\) 是弱混合测度保持系统,即只要 \(f\) 有界、可测、期望为零,就有 \(\lim_{N\to\infty}\mathbb{E}_{1\le n\le N}|\langle T^nf,f\rangle_{L^2(X)}|^2=0\)。(这比强混合弱,强混合要求在同样假设下 \(\lim_{n\to\infty}\langle T^nf,f\rangle=0\)。)证明:\(\|f\|_{U^{k-1}(X)}=0\) 当且仅当 \(E_X(f)=0\),并在此特殊情形下建立 Furstenberg 回归定理。
- 11.5.7 设 \((X,\mathcal{B},P,T)\) 是测度保持系统,\(f\) 有界可测。证明:若 \(f\) 是几乎周期的(即轨道 \(\{T^nf:n\in\mathbb{Z}\}\) 在 \(L^2(X)\) 中预紧),则只要 \(g\) 有界、可测且 \(U^2(X)\) 范数为零,就有 \(E_X(fg)=0\)。与习题 11.4.8 对照。
- 11.5.8 设 \((X,\mathcal{B},P,T)\) 是测度保持系统。令 \(\mathcal{Z}_1\) 是使所有几乎周期函数都可测的最小 \(\sigma\)-代数。设 \(f\) 有界可测,证明:\(\|f\|_{U^2(X)}=0\) 当且仅当 \(E(f\,|\,\mathcal{Z}_1)=0\)。(提示:“仅当”部分由上一题得出。对“当”的部分,构造对偶函数 \(D_2f:=\lim_{N\to\infty}\mathbb{E}_{-N\le n\le N}T^nf\,E_X(f\,T^nf\,|\,\mathcal{Z}_0)\),并证明该函数……)
返回 全书目录