10.5 一个遍历论的论证An ergodic argument
本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 定义 / 命题 / 引理 / 例 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本节是全书较难的一节,讲解会尽量把每一步的直觉与动机讲清楚。
1977 年,Furstenberg [121] 给出了 Szemerédi 定理(从而也包括 Roth 定理)一个惊艳的新证明,所用的是遍历论(ergodic theory)的方法,而非傅里叶分析或组合学。该论证依赖的算术结构非常少,几乎完全建立在对移位算子 \(T x := x+1\) 之混合(mixing)性质的分析之上。正因如此,它非常灵活,并已导出 Szemerédi 定理的若干影响深远的推广,其中一些我们将在下一章讨论。
Furstenberg 最初的遍历论论证在本质上是无穷的(infinitary),它处理整数集 \(\mathbb{Z}\),并实际上把这些整数嵌入到一个抽象的保测系统 \((X,\mathcal{B},T,\mu)\) 之中。在该论证的若干版本里,要用到选择公理(以 Zorn 引理的面目出现)来获得这个保测系统的某种合适的结构分解。然而最近,人们在建立这一论证的有限版本方面取得了进展:此时人们在一个具体而有限的保测系统中工作,例如带标准移位 \(Tx := x+1\) 的循环群 \(\mathbb{Z}_N\)。这些有限版的论证受到了 Szemerédi 正则性引理(将在下一节引入)的启发,虽然比起优雅的无穷版论证要显得繁杂一些,却能给出 \(r_k(\mathbb{Z}_N)\) 的显式(尽管很弱)的定量界。此外,这些有限版的遍历论论证在 Green–Tao 关于素数中等差数列的定理的证明中起到了关键作用。
本节我们给出 Roth 定理的一个有限版遍历论证明,采用 [358] 中的表述。这个证明并不是完全遍历论的,因为我们会借用傅里叶变换;不过在下一章我们会讨论如何去掉对傅里叶变换的这种依赖(从而把论证推广到更高的 \(k\))。我们将要建立的精确结果是:
这里 \(Z\) 是一个有限交换群(你可以一直想成 \(\mathbb{Z}_N\),即 \(\{0,1,\dots,N-1\}\) 上的模 \(N\) 加法)。各记号含义:
- \(\mathbb{E}_Z(f)=\dfrac{1}{|Z|}\sum_{x\in Z}f(x)\) 是 \(f\) 的平均值;\(\mathbb{E}_Z(f)\ge\delta\) 表示 \(f\) “平均不小”。若 \(f=1_A\) 是某集合 \(A\) 的示性函数,这就是说 \(A\) 的密度不小于 \(\delta\)。
- \(\Lambda_3(f,g,h):=\mathbb{E}_{x,h\in Z}\,f(x)\,g(x+h)\,h(x+2h)\) 是计数三项等差数列 \((x,x+h,x+2h)\) 的(加权、归一化)三线性形式。当 \(f=g=h=1_A\) 时,\(\Lambda_3(f,f,f)\) 正是 \(A\) 中三项等差数列所占的比例。
- \(\Omega_\delta(1)\) 表示“被一个只依赖 \(\delta\)(不依赖群 \(Z\) 大小)的正常数从下方界住”。
所以定理说的就是:只要 \(f\) 平均不小,三项等差数列的计数就有一个不随群变大而消失的正下界——这正是 Roth 定理(密度为正的集合必含三项等差数列)的函数化、定量化版本。
当然,这比纯傅里叶分析方法(例如定理 10.31)所能得到的结论要弱一些,但其证明颇为不同,并且更易于推广到更高的 \(k\)。特别地,它把前几节的密度增量论证替换成了一个能量增量论证。在前面的论证里,人们构造出一系列对象(等差数列或 Bohr 集),使 \(f\) 在其上的密度越来越大;而这里,我们构造的是一系列 \(\sigma\)-代数或分划,使 \(f\) 相对于它们的能量越来越大。这最终导出一个对 \(f\) 的“低复杂度”逼近 \(f_{U^\perp}\),其中误差 \(f_U:=f-f_{U^\perp}\) 在线性意义下是一致的(linearly uniform),从而对 \(\Lambda_3(f,f,f)\) 的影响微乎其微。这个低复杂度逼近 \(f_{U^\perp}\) 结果是几乎周期的,这将导出 \(\Lambda_3(f_{U^\perp},f_{U^\perp},f_{U^\perp})\) 的一个下界。
几乎周期性
下面进入细节,从几乎周期性的定义开始。为方便起见,我们借助傅里叶变换来定义这一概念,尽管这并非本质(见习题)。
称函数 \(f:Z\to\mathbb{C}\) 是 \(K\)-拟周期的(\(K\)-quasiperiodic),若存在频率 \(\xi_1,\dots,\xi_K\in Z\)(可以重复)以及复数 \(c_1,\dots,c_K\),满足 \(|c_1|,\dots,|c_K|\le 1\),使得 \(f=\sum_{j=1}^{K}c_j e_{\xi_j}\),换言之 \[f(x)=\sum_{j=1}^{K}c_j\,e(x\cdot\xi_j).\]
称函数 \(f:Z\to\mathbb{C}\) 是 \((K,\sigma)\)-几乎周期的(\((K,\sigma)\)-almost periodic),若存在一个 \(K\)-拟周期函数 \(g\),使得 \(\|f-g\|_{L^2(Z)}\le\sigma\)。
这里 \(e_\xi(x):=e(\xi\cdot x)=e^{2\pi i\,\xi x/N}\) 是一个波(特征标 character)。它绕单位圆均匀地转,是最“规则、可预测”的函数。
- \(K\)-拟周期=最多用 \(K\) 个波(频率)线性组合出来。\(K\) 越小,函数越“简单、低复杂度”。例如 \(f(x)=\frac12 e(x/N)+\frac12 e(-x/N)=\cos(2\pi x/N)\) 是 \(2\)-拟周期的。
- \((K,\sigma)\)-几乎周期=在 \(L^2\) 距离 \(\sigma\) 之内能用 \(K\) 个波逼近。允许有一个小误差 \(g\),误差的“能量” \(\|f-g\|_{L^2}\) 不超过 \(\sigma\)。
关键直觉:波在合适的平移下几乎不变。若 \(h\) 使得每个 \(e(\xi_j h)\approx 1\),则 \(f(x+h)\approx f(x)\)。这正是“几乎周期”一词的来历,也是后面“递归性/有很多等差数列”的源头。
一个关键观察是:当 \(K\) 不太大、\(\sigma\) 足够小时,定理 10.33 对几乎周期函数是容易证明的。更精确地,我们有:
此命题应与引理 4.44 相比较。这里的一个要点是:对 \(\sigma\) 的“足够小”这一条件不涉及 \(K\)。这对我们很重要,因为 \(K\) 最终会比 \(\sigma\) 大得多。
- 选好平移 \(h\)。 Bohr 集 \(\mathrm{Bohr}_Z(S,\rho)=\{h:\ \|\xi_j\cdot h\|_{\mathbb{R}/\mathbb{Z}}\le\rho\ \forall j\}\) 收集了所有“几乎不动每个波”的平移 \(h\)。对这种 \(h\),每个 \(e(h\cdot\xi_j)\) 与 \(1\) 只差 \(O(\rho)\)。
- 波几乎不动 ⇒ 函数几乎不动。 因为 \(f\) 由这 \(K\) 个波(加小误差)拼成,平移 \(h\) 后每个波只动 \(O(\rho)\),\(K\) 个波合起来动 \(O(K\rho)\),再加误差项,得 \(\|T^{jh}f-f\|_{L^2}\le O(K\rho)+2\sigma\)。
- 三个因子都 \(\approx f\)。 于是 \(f(x)\,f(x+h)\,f(x+2h)\approx f(x)^3\),对 \(x\) 取平均得到 \(\ge\delta^3-(\text{小误差})\)。误差由 \(K\rho\) 和 \(\sigma\) 控制;因为 \(\sigma<\delta^3/8\),它至多吃掉一半,剩 \(\tfrac12\delta^3-O(K\rho)\)。
- 从“好的 \(h\)”过渡到“所有 \(h\)”。 上面只对 Bohr 集里的 \(h\) 成立。但 Bohr 集在 \(Z\) 中的密度 \(\ge\rho^{K}\)(每个频率独立地切出比例约 \(\rho\) 的 \(h\)),且被积量非负,于是对全体 \(h\) 取平均时至少保留 \(\rho^K\) 倍。
- 选半径。 取 \(\rho\sim\delta/K\) 使 \(O(K\rho)\) 不超过 \(\tfrac14\delta^3\),得 \(\Lambda_3\gtrsim\rho^K\delta^3=(\delta/K)^K\delta^3\)。注意这个下界随 \(K\) 增大会变得很小,但只要 \(K\) 有界,它就是依赖 \(\delta\) 的正常数。
核心分解
为在一般情形下建立定理 10.33,现在需要用一个几乎周期函数去逼近任意函数 \(f\)。事实上我们将建立下面这条基本命题:
- “反一致”分量 \(f_{U^\perp}\) 满足界 \(0\le f_{U^\perp}\le 1\) 与 \(\mathbb{E}_Z f_{U^\perp}=\mathbb{E}_Z f\),并且是 \((K,\sigma)\)-几乎周期的;
- “一致”分量 \(f_U\) 满足傅里叶一致性估计 \(\displaystyle\|f_U\|_{u^2(Z)}\le\frac{1}{F(\sigma,K)}\)。
这条命题一个引人注目的特点是:可以通过让 \(F\) 增长得任意快,从而使对 \(f_U\) 的一致性控制任意强。为此付出的代价是:\(K\) 的上界随之大幅恶化。
- \(\|f_U\|_{u^2(Z)}=\|\widehat{f_U}\|_{\ell^\infty(Z)}=\sup_{\xi}|\widehat{f_U}(\xi)|\) 是 \(f_U\) 的最大傅里叶系数。这个数小,意味着 \(f_U\) 不与任何单个波有显著相关——这正是“一致/伪随机”的含义。后面的命题 10.11 会告诉我们:傅里叶一致的函数对 \(\Lambda_3\) 的贡献可以忽略。
- \(f_{U^\perp}\) 是“反一致”的:它恰好是由少数波拼成的结构化部分(几乎周期)。它保持了 \(f\) 的非负性、上界 \(1\) 以及平均值。
- 所以这条分解就是把任意 \(f\) 干净地切成“可计数的结构” + “可忽略的噪声”。这正是上面那张总体结构图所做的拆分。
我们将在本节余下的部分证明命题 10.36。现在先看看它如何推出定理 10.33。我们以 \(\sigma:=\delta^3/8\) 应用此命题,\(F\) 稍后选定。由命题 10.35 有 \[\Lambda_3(f_{U^\perp},f_{U^\perp},f_{U^\perp})=\Omega\!\big((\delta/K)^K\delta^3\big).\] 由于 \(f,f_{U^\perp}\) 都在 \(0\) 与 \(1\) 之间,\(f_U\) 的大小被 \(1\) 界住。应用傅里叶一致性估计与命题 10.11,我们得出 \[\Lambda_3(f,f,f)-\Lambda_3(f_{U^\perp},f_{U^\perp},f_{U^\perp})=O\!\Big(\frac{1}{F(\sigma,K)}\Big).\] 于是若选 \(F\) 增长得足够快,便可把误差项吸收进主项,得出 \[\Lambda_3(f,f,f)=\Omega\!\big((\delta/K)^K\delta^3\big).\] 由于 \(K=O_{\sigma,F}(1)=O_\delta(1)\),结论成立。
- 命题 10.35 给结构块 \(f_{U^\perp}\) 一个正下界 \(c(\delta,K)=\Omega((\delta/K)^K\delta^3)\)。
- 命题 10.11 + 一致性估计给出:换成完整的 \(f\),计数只改变 \(O(1/F(\sigma,K))\)。
- 注意 \(K\) 一旦确定,下界 \(c(\delta,K)\) 就固定了;而我们事后可以把 \(F\) 选得足够大,使 \(1/F(\sigma,K)\le\tfrac12 c(\delta,K)\)。误差被吃掉一半,主项仍为正。
- 这就是为什么命题 10.36 允许“\(F\) 任意快”如此重要:它让我们能在知道 \(K\) 之后再把噪声压到任意小。
余下的就是证明命题 10.36。可以直接应用傅里叶变换来证明它(这本质上是 [34] 的做法);但我们将采用一种更具遍历论色彩的方法,它更容易推广到更长的等差数列。这里的一个关键工具是条件期望。
事实证明,某些 \(\sigma\)-代数 \(\mathcal{B}\) 是“紧致的”,意思是诸如 \(\mathbb{E}(f|\mathcal{B})\) 这样的条件期望自动是几乎周期的。这一点的一个精确表述是:
现在证明后一条性质。注意到 \(f\) 是至多 \(O(1/\varepsilon)\) 个示性函数 \(1_{A_{a,b,\varepsilon,\alpha}}\) 的、系数有界的线性组合,因此只需对这 \(O(1/\varepsilon)\) 个非平凡的示性函数证明该论断。当 \(\sigma\ge 1\) 时论断平凡;并且通过把 \(\sigma\) 用最接近的 \(2\) 的幂来逼近,我们看到只需对 \(\sigma=2^{-n}\)(\(n\ge 0\) 为整数)验证论断。由 Borel–Cantelli 引理,于是只需对每个 \(n\ge 1\) 及 \(a,b\in\mathbb{Z}\) 证明 \[\mathbb{P}\big(1_{A_{a,b,\varepsilon,\alpha}}\text{ 是 }(O_{\varepsilon,n}(1),O(2^{-n}))\text{-几乎周期的}\big)=1-O(\varepsilon 2^{-n}).\]
固定 \(n,a,b\)。改写 \[1_{A_{a,b,\varepsilon,\alpha}}(x)=1_Q\!\Big(\frac{e(x\cdot\xi)}{\varepsilon}-a-bi-\alpha\Big).\] 设 \(B\) 为正方形 \(Q\) 边界的 \(\varepsilon 2^{-3n}\)-邻域。由 Urysohn 引理再接以 Weierstrass 逼近定理,我们可以写 \[1_Q(z)=P_{n,\varepsilon}(z)+O(1_B(z))+O(2^{-n}),\] 其中 \(P_{n,\varepsilon}(z)\) 是一个仅依赖于 \(n\) 的、关于 \(z\) 与 \(\bar z\) 的多项式。我们得出 \[1_{A_{a,b,\varepsilon,\alpha}}(x)=P_{n,\varepsilon}\!\Big(\frac{e(x\cdot\xi)}{\varepsilon}-a-bi-\alpha\Big)+O\!\Big(\mathbb{I}\big(\tfrac{e(x\cdot\xi)}{\varepsilon}-a-bi-\alpha\in B\big)\Big)+O(2^{-n}).\tag{10.21}\] 右端第一项容易验证是 \(O_{n,\varepsilon}(1)\)-拟周期的。一次一阶矩方法的应用很容易表明 \[\mathbb{E}\,\Big\|\mathbb{I}\big(\tfrac{e(x\cdot\xi)}{\varepsilon}-a-bi-\alpha\in B\big)\Big\|_{L^2(Z)}^2=O(\varepsilon 2^{-3n}),\] 因此由 Markov 不等式可见 (10.21) 中第二项以 \(1-O(\varepsilon 2^{-n})\) 的概率具有 \(O(2^{-n})\) 的 \(L^2(Z)\) 范数。于是我们看到 \(1_{A_{a,b,\varepsilon,\alpha}}\) 以 \(1-O(\varepsilon 2^{-n})\) 的概率是 \((O_{n,\varepsilon}(1),O(2^{-n}))\)-拟周期的,正如所欲。♦
把波 \(e_\xi(x)\) 看成一个在复平面单位圆上的点。\(\mathcal{B}_{\varepsilon,\xi}\) 就是按 \(e_\xi(x)\) 落进哪个边长约 \(\varepsilon\) 的小方格来给 \(x\) 分类:落进同一格的 \(x\) 归为同一个原子。
- 圆周被约 \(O(1/\varepsilon)\) 个小格覆盖,所以只有 \(O(1/\varepsilon)\) 个非空原子。
- 同一格内 \(e_\xi\) 的取值差不超过 \(O(\varepsilon)\),所以“在每格上取平均”得到的阶梯函数与 \(e_\xi\) 相差 \(O(\varepsilon)\)——这就是 (10.20),即该分划“近似包含”了波 \(e_\xi\)。
- 随机平移 \(\alpha\) 是技术手段:让格子边界恰好落在 \(e_\xi\) 取值密集处的“倒霉概率”很小,从而每个示性函数都能被多项式 \(P_{n,\varepsilon}\)(少数波)很好逼近,只有边界附近 \(O(2^{-n})\) 的误差。这就是“紧致 ⇒ 几乎周期”。
可以把它推广到由多个特征标生成的 \(\sigma\)-代数:
能量增量:核心引理
命题 10.36 之证明的核心,现在归结于下面这条关键引理。我们把 \(\mathcal{B}\) 关于 \(f\) 的能量 \(\mathcal{E}_f(\mathcal{B})\) 定义为 \[\mathcal{E}_f(\mathcal{B}):=\|\mathbb{E}(f|\mathcal{B})\|_{L^2(Z)}^2=\mathbb{E}_{x\in Z}\big|\mathbb{E}(f|\mathcal{B})(x)\big|^2.\]
- \(\mathcal{E}_f(\mathcal{B})=\|\mathbb{E}(f|\mathcal{B})\|_2^2\) 衡量“当前分划 \(\mathcal{B}\) 已经抓住了 \(f\) 多少”。由于条件期望是正交投影,\(0\le\mathcal{E}_f(\mathcal{B})\le\|f\|_2^2\le 1\),并且分划越细,能量越大(投影到更大的子空间)。
- 条件 \(\|f-\mathbb{E}(f|\mathcal{B})\|_{u^2}\ge\mu\) 是说:抹平后剩下的残差 \(f-\mathbb{E}(f|\mathcal{B})\) 仍与某个波 \(e_\xi\) 显著相关(最大傅里叶系数 \(\ge\mu\))。也就是“还没一致”。
- 引理说:把这个波对应的分划 \(\mathcal{B}_{\varepsilon,\xi}\) 并进来,能量必定跳升至少 \(\mu^2/4\)。直觉:分划学会了一个它原先看不见的方向,自然抓住了更多 \(f\)。
- 找到相关的波。 \(\|\cdot\|_{u^2}=\sup_\xi|\widehat{\cdot}(\xi)|\) 大,等价于与某个波 \(e_\xi\) 的内积 \(\ge\mu\)。
- 波几乎被新分划抓住。 由 (10.20),加进 \(\mathcal{B}_{\varepsilon,\xi}\) 后,\(e_\xi\) 与它在新分划上的条件期望只差 \(O(\varepsilon)\)。所以用 \(\mathbb{E}(e_\xi|\cdots)\) 替换 \(e_\xi\),内积只损失 \(2\varepsilon<\mu/2\),仍 \(\ge\mu/2\)。
- 把残差换成投影差。 恒等式(投影的正交性)让我们把 \(f-\mathbb{E}(f|\mathcal{B})\) 替换成两次投影之差 \(\mathbb{E}(f|\mathcal{B}\vee\mathcal{B}_{\varepsilon,\xi})-\mathbb{E}(f|\mathcal{B})\),这正是“新增的能量”那部分。
- Cauchy–Schwarz + 勾股。 内积 \(\ge\mu/2\),而 \(\|\mathbb{E}(e_\xi|\cdots)\|_2\le 1\),故投影差的范数 \(\ge\mu/2\),平方 \(\ge\mu^2/4\)。由勾股定理,这个平方恰是能量的增量 \(\mathcal{E}_f(\mathcal{B}\vee\mathcal{B}_{\varepsilon,\xi})-\mathcal{E}_f(\mathcal{B})\)。
命题 10.36 的证明:双重循环算法
现在我们已有足够的工具来证明命题 10.36。
- 第 0 步。 初始化 \(\mathcal{B}=\{\varnothing,Z\}\)。
- 第 1 步。 设 \(K\) 为使 \(\mathbb{E}(f|\mathcal{B})\) 成为 \((K,\sigma/2)\)-几乎周期的最小整数。(由傅里叶反演公式知 \(K\) 有限。)令 \(\mathcal{B}':=\mathcal{B}\);于是平凡地有 \(\mathcal{E}_f(\mathcal{B}')\le\mathcal{E}_f(\mathcal{B})+\sigma^2/4\)。
- 第 2 步。 若 \[\|f-\mathbb{E}(f|\mathcal{B}')\|_{u^2(Z)}\le\frac{1}{F(\sigma,K)},\] 则终止算法。若不然,则可以 \(\varepsilon:=\dfrac{1}{4F(\sigma,K)}\) 应用引理 10.40,得到一个新的 \(\sigma\)-代数 \(\mathcal{B}'':=\mathcal{B}'\vee\mathcal{B}_{\varepsilon,\xi}\)(对某个 \(\xi\in Z\)),使得 \[\mathcal{E}_f(\mathcal{B}'')\ge\mathcal{E}_f(\mathcal{B}')+\frac{1}{4F(\sigma,K)^2}.\]
- 第 3 步。 若 \[\mathcal{E}_f(\mathcal{B}'')\le\mathcal{E}_f(\mathcal{B})+\sigma^2/4,\] 则令 \(\mathcal{B}':=\mathcal{B}''\) 并返回第 2 步。若反之 \[\mathcal{E}_f(\mathcal{B}'')>\mathcal{E}_f(\mathcal{B})+\sigma^2/4,\] 则令 \(\mathcal{B}=\mathcal{B}''\) 并返回第 1 步。
观察:每次从第 3 步返回第 2 步时,能量 \(\mathcal{E}_f(\mathcal{B}')\) 至少增加 \(\dfrac{1}{4F(\sigma,K)^2}\),而 \(K\) 不变。另一方面,由于 \(f\) 有界,\(\mathcal{E}_f(\mathcal{B}')\) 在 \(0\) 与 \(1\) 之间变化。因此在终止或返回第 1 步之前,最多只能从第 3 步返回第 2 步 \(4F(\sigma,K)^2\) 次。此外,每次从第 3 步返回第 1 步时,能量 \(\mathcal{E}_f(\mathcal{B})\) 至少增加 \(\sigma^2/4\),所以最多只能从第 3 步返回第 1 步 \(4/\sigma^2\) 次。于是这个算法在有限步后终止。
这时若令 \(f_{U^\perp}:=\mathbb{E}(f|\mathcal{B}')\) 与 \(f_U:=f-\mathbb{E}(f|\mathcal{B}')\),则有 \(f=f_U+f_{U^\perp}\),有 \(\|f_U\|_{u^2(Z)}\le\dfrac{1}{F(\sigma,K)}\),有 \(0\le f_{U^\perp}\le 1\),以及 \(\mathbb{E}_Z f_{U^\perp}=\mathbb{E}_Z f\)。最后,由构造有 \(\mathcal{E}_f(\mathcal{B}')\le\mathcal{E}_f(\mathcal{B})+\sigma^2/4\),从而由勾股定理 \(\|f_{U^\perp}-\mathbb{E}(f|\mathcal{B})\|_{L^2(Z)}\le\sigma/2\)。由于由构造 \(\mathbb{E}(f|\mathcal{B})\) 是 \((K,\sigma/2)\)-几乎周期的,我们得出 \(f_{U^\perp}\) 是 \((K,\sigma)\)-几乎周期的。
剩下唯一需要验证的是 \(K=O_{\sigma,F}(1)\)。注意在每个阶段,\(\mathcal{B}\) 与 \(\mathcal{B}'\) 都是有限多个形如 \(\mathcal{B}_{\varepsilon,\xi}\) 的 \(\sigma\)-代数之并(join)。特别地,推论 10.39 对这些 \(\sigma\)-代数适用。一个简单的归纳论证随即表明:在迭代的每个阶段,\(\mathcal{B}\) 与 \(\mathcal{B}'\) 都是至多 \(O_{\sigma,F}(1)\) 个 \(\sigma\)-代数之并,所涉参数 \(\varepsilon\) 从下方被 \(\Omega_{\sigma,F}(1)\) 界住,而参数 \(K\) 始终从上方被 \(O_{\sigma,F}(1)\) 界住。结论成立。♦
- 内层循环(第 2↔3 步):把当前 \(K\) 固定,疯狂细分分划。 只要残差还不一致(\(u^2\) 范数大),引理 10.40 就让能量每次跳 \(\ge\dfrac{1}{4F^2}\)。能量被 \(1\) 封顶,所以内层最多跑 \(4F^2\) 次。
- 外层循环(回第 1 步):能量一旦累计涨过 \(\sigma^2/4\),就重置 \(K\)。 因为能量整体只能从 \(0\) 涨到 \(1\),每次外层涨 \(\ge\sigma^2/4\),所以外层最多 \(4/\sigma^2\) 次。两层都有限 ⇒ 算法必停。
- 停下来的那一刻,恰好两全其美。 终止条件保证 \(f_U=f-f_{U^\perp}\) 的 \(u^2\) 范数 \(\le 1/F\)(足够一致);而 \(f_{U^\perp}=\mathbb{E}(f|\mathcal{B}')\) 与某个 \((K,\sigma/2)\)-几乎周期的 \(\mathbb{E}(f|\mathcal{B})\) 只差 \(\sigma/2\),故自身是 \((K,\sigma)\)-几乎周期的(结构化)。
- 为什么要分内外两层? 因为“一致”的标准 \(1/F(\sigma,K)\) 依赖于 \(K\),而细分会让 \(K\) 变化。两层结构保证:要么 \(K\) 不变而能量稳涨(内层),要么 \(K\) 重置但只发生有限次(外层)。最终 \(K\) 被锁定在 \(O_{\sigma,F}(1)=O_\delta(1)\)。
习题
- 10.5.1 设 \(f,g:Z\to\mathbb{C}\) 的大小都被 \(1\) 界住,且对某个 \(0<\sigma\le 1\) 都是 \((K,\sigma)\)-几乎周期的。证明 \(f+g\) 是 \((2K,2\sigma)\)-几乎周期的,并且 \(fg\) 是 \((K^2,4\sigma)\)-几乎周期的。
- 10.5.2 设 \(f:Z\to\mathbb{C}\) 是 \((K,\sigma)\)-几乎周期的。证明可以用至多 \(O_{K,\sigma}(1)\) 个在 \(L^2(Z)\) 度量下半径为 \(2\sigma\) 的球覆盖集合 \(\{T^hf:h\in Z\}\subset L^2(Z)\)。由此推出 \[\mathbb{P}_{h\in Z}\big(\|T^hf-f\|_{L^2(Z)}\le 4\sigma\big)=\Omega_{K,\sigma}(1),\] 这或许有助于解释“几乎周期”这一术语。关于本结果的一个逆命题,见下面的习题 10.5.5。
- 10.5.3 设 \(\xi_1,\dots,\xi_n\) 为 \(Z\) 的一个非结合(dissociated)子集。利用 Rudin 不等式(引理 4.33),证明
\[\mathbb{P}_{h\in Z}\Big(\sum_{j=1}^{n}|e(\xi_j\cdot h)-1|^2
- 10.5.4 设 \(f:Z\to\mathbb{C}\) 满足 \(\|f\|_{L^2(Z)}=\|\hat f\|_{\ell^2(Z)}\ge 4\sigma\) 且 \(\|\hat f\|_{\ell^\infty(Z)}\le\delta\sigma\)(对某些 \(\sigma,\delta>0\))。建立界 \[\mathbb{P}_{h\in Z}\Big(\sum_{\xi\in Z}|e(\xi\cdot h)-1|^2\,|\hat f(\xi)|^2<4\sigma^2\Big)=O(\delta^c)\] (其中 \(c>0\) 为某个绝对常数)。(提示:归一化 \(\|\hat f\|_{\ell^2(Z)}=1\),从而 \(\sigma\le 1/4\),然后令 \(\xi_1,\dots,\xi_n\) 为以概率分布 \(|\hat f(\xi)|^2\) 取值的独立同分布随机变量。证明 \(\xi_1,\dots,\xi_n\) 以概率 \(1-O(2^n\delta)\) 是非结合的,并把 (10.22) 与一阶矩方法结合应用。最后对 \(n\) 优化。)
返回 全书目录