10.2 小挠率情形The small torsion case
本页为译文 + 讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演)与配图为面向高中生的详解,逐步把直觉与每一步动机讲清楚,不用比喻。
我们现在运用上述傅里叶分析方法与密度增量论证,来证明 Roth 定理的下述简单特例。
- \(p\)-挠群:群里每个元素 \(x\) 都满足 \(px=\underbrace{x+x+\cdots+x}_{p\ \text{个}}=0\)。最典型的例子是 \(\mathbf F_p^n\),即 \(n\) 个分量、每个分量取自 \(\{0,1,\dots,p-1\}\)、按模 \(p\) 逐分量相加的向量空间。它既是群,又是域 \(\mathbf F_p\) 上的向量空间——这一“向量空间结构”正是本节论证比一般群容易的根源。
- \(r_3(Z)\):\(Z\) 中不含任何三项等差数列的子集所能达到的最大元素个数。这里“三项等差数列”指三个互不相同的 \(x,x+d,x+2d\)(\(d\neq0\)),即“真”等差数列。
- 当 \(Z=\mathbf F_p^n\) 时 \(|Z|=p^n\),于是 \(\log_p|Z|=n\),不等式 (10.12*) 就是 \(r_3(\mathbf F_p^n)<\dfrac{3}{n}\,p^n\),也就是说“无三项等差数列的子集,密度小于 \(3/n\)”。
我们现在开始证明命题 10.12。可以把 \(Z\) 视为域 \(\mathbf F_p\) 上的向量空间。反设我们能找到密度 \(\mathbf P_Z(A)\ge\dfrac{3}{\log_p|Z|}\) 的集合 \(A\subset Z\),使其不含长度为 \(3\) 的真等差数列。由推论 10.10 我们已经知道 \(A\) 必定表现出线性偏差,即 \(\|A\|_u\) 较大。为了利用这一事实,我们需要把线性偏差转化为更有用的结构性质。这一转化由下述引理完成。
- 把 \(Z=\mathbf F_p^n\) 想成一个 \(n\) 维空间。余维数为 \(1\) 的子空间 \(Z'\) 就是一张 \((n-1)\) 维“超平面”(过原点),它把整个 \(Z\) 切成 \(p\) 张平行的 \((n-1)\) 维薄片,每张薄片是一个陪集 \(x_0+Z'\)。
- \(\|f\|_{u^2(Z)}\) 度量 \(f\) 的“线性偏差”有多大——\(f\) 越偏离均匀、越能被某个线性相位 \(e(\xi\cdot y)\) 抓住,这个量就越大。
- 结论是:只要 \(f\) 有偏差,就一定能找到一张薄片,\(f\) 在它上面的平均值不小于偏差量的一半。换句话说,分析性质(“有偏差”)被翻译成了结构性质(“在某张超平面薄片上偏高”)。
- 抓住偏差方向。 偏差量 \(\|f\|_{u^2}\) 的定义保证:有一个非零频率 \(\xi\) 与相位 \(\theta\),让加权平均 \(\operatorname{Re}\,\mathbf E_y f(y)e(\xi\cdot y+\theta)\) 恰好等于这个偏差量。这是“偏差”最原始的含义——\(f\) 与某个线性波 \(e(\xi\cdot y+\theta)\) 有非零的相关。
- 加上常数 1。 因为 \(\mathbf E_Z(f)=0\),给括号里添一个常数 \(1\) 不改变平均值(\(\mathbf E_y f(y)\cdot 1=0\)),于是把 \(e(\cdots)\) 换成 \(e(\cdots)+1\),等式照样成立。这一步的目的见注记 10.16:让权重非负。
- 权重在薄片上是常数。 当 \(x\) 在 \(Z'=\{\xi\}^\perp\) 内变动时 \(\xi\cdot x=0\),所以 \(e(\xi\cdot y+\theta)\) 只依赖于 \(y\) 落在哪张薄片 \(x_0+Z'\) 上。于是整张薄片共用同一个权重 \(\operatorname{Re}(e(\xi\cdot x_0+\theta)+1)\)。
- 把平均拆成“先片内、后片间”。 先在每张薄片内对 \(f\) 求平均,得到片平均 \(\mathbf E_{x\in x_0+Z'}f(x)\);再带着非负权重对各薄片求平均,总和仍等于 \(\|f\|_{u^2}\)。
- 抽屉原理。 一堆非负权重乘以片平均,加起来 \(\ge\|f\|_{u^2}\),那必有一项 \(\ge\|f\|_{u^2}\)。由于权重 \(\le 2\),对应的片平均就 \(\ge\tfrac12\|f\|_{u^2}\)。♦
我们现在可以运用 Roth 的密度增量论证来证明命题 10.12。
- 推论 10.10 说“无三项等差数列 \(\Rightarrow\) 偏差大”,给出 \(\|A\|_u\ge \mathbf P_Z(A)^2-\tfrac{1}{|Z|}\ge \tfrac{9}{n^2}-\tfrac{1}{|Z|}\)。
- 引理 10.15 把这份偏差兑换成片上密度增量 \(\tfrac12\|A\|_u\),于是 \(\mathbf P_{x_0+Z'}(A)\ge \tfrac3n+\tfrac12\bigl(\tfrac{9}{n^2}-\tfrac{1}{|Z|}\bigr)\)。
- 因 \(|Z|=p^n\ge n^2\),那个 \(-\tfrac{1}{2|Z|}\) 至多吃掉 \(\tfrac{1}{2n^2}\),剩下 \(\ge\tfrac3n+\tfrac{4}{n^2}\)。
- 再核对 \(\tfrac3n+\tfrac{4}{n^2}\ge\tfrac{3}{n-1}\):两边通分等价于 \(n^2-4n\ge0\),即 \(n\ge4\)(正是 \(n>3\))。于是“升一级密度、降一维”的循环可以一直进行,直到维数掉到 \(n\le3\) 的平凡情形,矛盾出现。
一个非常类似的论证也能在此情形下确立 Varnavides 定理:
- 分解 \(f\)。 把 \(f\) 拆成常数部分 \(f_{U^\perp}=\mathbf E_Z(f)\)(“反一致”主项,即平均密度)与零均值的涨落 \(f_U=f-\mathbf E_Z(f)\)(“一致”部分)。常数部分自身贡献的三项等差数列计数恰为 \(\mathbf E_Z(f)^3\)。
- 两种可能。 要么 \(\Lambda_3(f,f,f)\) 已经够大(\(\ge\mathbf E_Z(f)^3/9\)),直接收工;要么它与主项相差很大,说明涨落 \(f_U\) 起了大作用。
- 消项。 把差 \(\Lambda_3(f,f,f)-\Lambda_3(f_{U^\perp},f_{U^\perp},f_{U^\perp})\) 用伸缩和拆成三项。凡是“常数 + 常数 + 零均值涨落”的项都为零(常数在三项等差数列平均下与零均值函数解耦),只剩 \(\Lambda_3(f_U,f,f)\) 一项较大。
- 大计数 \(\Rightarrow\) 大偏差。 因为 \(\Lambda_3(f_U,f,f)\) 大、且 \(f\le1\),命题 10.11 把它兑换为 \(f_U\) 的偏差下界 \(\|f_U\|_{u^2}\ge 4\mathbf E_Z(f)^2/9\)。
- 密度增量 + 降维归纳。 引理 10.15 把偏差变成某张薄片上的密度抬升:限制到 \(Z'\) 上的 \(g\) 密度涨到 \(\ge\mathbf E_Z(f)+\tfrac49\mathbf E_Z(f)^2\)。代数核对 \(\tfrac{6}{\mathbf E_{Z'}(g)}\le\tfrac{6}{\mathbf E_Z(f)}-2\),于是归纳给出 \(g\) 的计数 \(\ge p^2 p^{-6/\mathbf E_Z(f)}\);最后用 \(Z'\) 是 \(Z\) 的 \(p\) 倍指数子空间这一事实,把 \(g\) 的计数折回 \(f\) 的计数(系数 \(p^{-2}\)),刚好抵消那个 \(p^2\)。♦
一个引人注目的现象是:上述类型的下界,即使把有界性条件 \(f\le 1\) 换成更一般的条件 \(f\le\nu\),只要包络权 \(\nu\) 足够伪随机,下界依然成立。这一现象(本质上最早见于 [212]、[147])在 [158] 中被表述得更为明确,那里提出了一条转移原理。该原理本是为研究任意长度 \(k\) 的等差数列、并以遍历论语言表述的;但在 \(k=3\) 时存在一条平行的傅里叶分析版本,并在 [159] 中得到发展。我们下面在 \(p\)-挠群的随机子集这一特殊语境中,给出该结果的一个简化表述。具体地,我们将证明:
我们现在开始证明定理 10.18。我们需要命题 10.17 的如下推广,其中 \(f\) 不再以 \(1\) 为界,而是以一个“伪随机测度”为界,并且还满足某些傅里叶界。
把“界 \(f\le1\)”换成“界 \(f\le\nu\)”意味着什么命题 10.17 要求函数被常数 \(1\) 卡住。但研究素数这类稀疏集合时,做不到这一点——它们密度趋于 \(0\)。补救办法是先把 \(f\) 嵌进一个“包络测度” \(\nu\)(满足 \(f\le\nu\)),只要 \(\nu\) 足够伪随机(它的非零频率傅里叶系数都很小,即 (10.8)),就能把命题 10.17 的下界几乎原样搬过来。代价是右端多出一个误差项 \(-7M^3\log_p^{1-3/q}(1/\eta)\),当 \(\eta\) 极小时这个误差可忽略。\(\eta=0\)(即 \(\nu\equiv1\))时误差为零,正好退化回命题 10.17。证明. 我们可设 \(Z\) 是 \(\mathbf F_p\) 上配有例 4.2 双线性型的向量空间。令 \(\alpha:=M/\log_p^{1/q}\dfrac1\eta\)。回忆 \(f\) 的谱 \(\operatorname{Spec}_\alpha(f)\subseteq Z\),定义为 \[ \operatorname{Spec}_\alpha(f):=\{\xi\in Z:\ |\hat f(\xi)|\ge\alpha\}. \] 由假设 (10.7) 与 Chebyshev 不等式,我们有 \[ |\operatorname{Spec}_\alpha(f)|\le M^q/\alpha^q=\log_p\frac1\eta. \tag{10.9}\] 于是若令 \(V=\operatorname{Spec}_\alpha(f)^\perp\) 为 \(\operatorname{Spec}_\alpha(f)\) 的正交补,则 \(V\) 是 \(Z\) 的子空间,且 \[ |V^\perp|\le p^{|\operatorname{Spec}_\alpha(f)|}\le\frac1\eta. \tag{10.10}\] 我们把 \(f\) 分裂为 \(f=f_U+f_{U^\perp}\),其中 \(f_U:=f-f*\dfrac{1_V}{\mathbf P_Z(V)}\) 是 \(f\) 的“一致”分量,而 \(f_{U^\perp}:=f*\dfrac{1_V}{\mathbf P_Z(V)}\) 是“反一致”分量。这使我们能把 \(\Lambda_3(f,f,f)\) 分裂为八项: \[ \Lambda_3(f,f,f)=\Lambda_3(f_U,f_U,f_U)+\cdots+\Lambda_3(f_{U^\perp},f_{U^\perp},f_U)+\Lambda_3(f_{U^\perp},f_{U^\perp},f_{U^\perp}). \] 思路是用命题 10.17 对最后一项取下界,用 (10.6) 对其余七项取量级界。 我们先控制 \(f_{U^\perp}\)。由于 \(f\) 逐点被 \(\nu\) 所界,运用 Poisson 求和公式(习题 4.1.7)以及 (10.10)、(10.8),我们得到 \[ f_{U^\perp}(x)=f*\frac{1_V}{\mathbf P_Z(V)}(x)\le \nu*\frac{1_V}{\mathbf P_Z(V)}(x)=\sum_{\xi\in V^\perp}\hat\nu(\xi)e(\xi\cdot x)\le 1+|V^\perp|\sup_{\xi\in V^\perp\setminus0}|\hat\nu(\xi)|\le 1+\frac1\eta\cdot\eta=2. \] 我们因而看到 \(f_{U^\perp}\) 上方以 \(2\) 为界。它也是非负的,且由 (4.10) 有 \(\mathbf E_Z(f_{U^\perp})=\mathbf E_Z(f)\)。于是由命题 10.17(对 \(f_{U^\perp}/2\) 应用)得 \[ \Lambda_3(f_{U^\perp},f_{U^\perp},f_{U^\perp})\ \ge\ 8\,p^{-12/\mathbf E_Z(f)}. \] 现在考虑其余各项。再次由 Poisson 求和公式,我们有 \[ \hat f_{U^\perp}=\hat f\,1_{V^\perp}\qquad\text{与}\qquad \hat f_U=\hat f\,(1-1_{V^\perp}). \] 特别地有 \[ \|\hat f_U\|_{l^q(Z)},\ \|\hat f_{U^\perp}\|_{l^q(Z)}\le M. \] 此外,由于 \(V^\perp\) 包含 \(\operatorname{Spec}_\alpha(f)\),我们看到 \[ \sup_{\xi\in Z}|\hat f_U(\xi)|\le\alpha. \] 应用 (10.6) 与 Hölder 不等式,我们得到 \[ |\Lambda_3(f_U,f_{U^\perp},f_{U^\perp})|\le M^q\alpha^{3-q}=M^3\log_p^{\,1-3/q}\frac1\eta, \] 对其余六个待估的 \(\Lambda_3(\cdot)\) 表达式也类似。结论得证。♦定理 10.20 的几何:大于阈值 \(\alpha\) 的少数大频率(谱)拼成可控的反一致主项 \(f_{U^\perp}\);其余小频率拼成傅里叶意义下很小的一致项 \(f_U\),对三项等差数列计数的贡献可忽略。 注记 10.21 上述转移论证的策略是:找出 \(Z\) 的一个相当粗的划分(此处即 \(V\) 的诸陪集)来对其取平均,从而造出 \(f\) 的一个性质良好的逼近 \(f_{U^\perp}\),而 \(f\) 与 \(f_{U^\perp}\) 之间的误差 \(f_U\)(在傅里叶意义下)一致到可以忽略不计。这一理念在 [150] 中被定量地展开,那里得到了 Szemerédi 正则性引理的一个算术版本。本推论中的假设 (10.7) 看似限制性很强,但在许多情形下,人们可以通过利用 \(\nu\) 的伪随机性质来控制 \(\hat f\) 的 \(l^q\) 范数,或至少控制 \(f\) 的谱 \(\operatorname{Spec}_\alpha(f)\)。例如,有:
引理 10.22(Tomas–Stein 论证) 设 \(Z\) 是有限加性群,又设 \(\nu:Z\to\mathbf R^+\) 与 \(f:Z\to\mathbf C\) 满足 (10.8) 对某个 \(\eta\) 成立,且对一切 \(x\in Z\) 有 \(|f(x)|\le\nu(x)\)。对任意 \(\alpha>0\),令 \(\operatorname{Spec}_\alpha(f):=\{\xi\in Z:\ |\hat f(\xi)|\ge\alpha\}\)。则 \[ |\operatorname{Spec}_\alpha(f)|\le 4/\alpha^2 \] 对一切 \(\alpha\ge2\eta^{1/2}\) 成立。注记 10.23 此估计应与 (4.37) 相比较;要点在于这里并未假设 \(f\) 有任何 \(L^2\) 界,否则此类估计将由 Plancherel 定理直接得出。这里所用的正交性论证,在傅里叶变换的限制理论中起着根本作用,综述见例如 [356]。它也与解析数论中的大筛法不等式密切相关。证明. 对每个 \(\xi\in\operatorname{Spec}_\alpha(f)\),令 \(c(\xi):=\operatorname{sgn}(\hat f(\xi))\)。则有 \[ \sum_{\xi\in\operatorname{Spec}_\alpha(f)}\hat f(\xi)\overline{c(\xi)}=\sum_{\xi\in\operatorname{Spec}_\alpha(f)}|\hat f(\xi)|\ \ge\ \alpha|\operatorname{Spec}_\alpha(f)|. \] 但左端可改写为 \[ \mathbf E_Z\Bigl(f\,\overline{\textstyle\sum_{\xi\in\operatorname{Spec}_\alpha(f)}c(\xi)e_\xi}\Bigr). \] 由于 \(|f|\le\nu\),我们可用 Cauchy–Schwarz 不等式而得 \[ \alpha|\operatorname{Spec}_\alpha(f)|\le \mathbf E_Z(\nu)^{1/2}\,\mathbf E_Z\Bigl(\nu\,\bigl|\textstyle\sum_{\xi\in\operatorname{Spec}_\alpha(f)}c(\xi)e_\xi\bigr|^2\Bigr)^{1/2}. \] 由于 \(\mathbf E_Z(\nu)=\hat\nu(0)\le1+\eta\le2\),我们因而推出 \[ \mathbf E_Z\Bigl(\nu\,\bigl|\textstyle\sum_{\xi\in\operatorname{Spec}_\alpha(f)}c(\xi)e_\xi\bigr|^2\Bigr)\ \ge\ \tfrac12\,\alpha^2|\operatorname{Spec}_\alpha(f)|^2. \] 我们可以把左端展开为 \[ \sum_{\xi,\xi'\in\operatorname{Spec}_\alpha(f)}c(\xi)\overline{c(\xi')}\,\mathbf E_Z(\nu\,e_\xi\overline{e_{\xi'}})=\sum_{\xi,\xi'\in\operatorname{Spec}_\alpha(f)}c(\xi)\overline{c(\xi')}\,\hat\nu(\xi-\xi'). \] 但由于 \(|c(\xi)|=1\) 且 \(|\hat\nu(\xi-\xi')|\le\eta+\mathbf I(\xi-\xi'=0)\),我们推出 \[ \tfrac12\,\alpha^2|\operatorname{Spec}_\alpha(f)|^2\le \sum_{\xi,\xi'\in\operatorname{Spec}_\alpha(f)}\bigl(\eta+\mathbf I(\xi-\xi'=0)\bigr)\le \eta|\operatorname{Spec}_\alpha(f)|^2+|\operatorname{Spec}_\alpha(f)|. \] 由于 \(\alpha\ge2\eta^{1/2}\),我们有 \(\eta|\operatorname{Spec}_\alpha(f)|^2\le\tfrac14\alpha^2|\operatorname{Spec}_\alpha(f)|^2\),结论随之得证。♦
- 把谱里的频率“对齐相位”。 给每个大频率 \(\xi\) 配一个单位复数 \(c(\xi)=\operatorname{sgn}(\hat f(\xi))\),让 \(\hat f(\xi)\overline{c(\xi)}=|\hat f(\xi)|\) 变成正实数。对谱求和得到下界 \(\ge\alpha\cdot|\operatorname{Spec}_\alpha(f)|\)。
- 翻译成物理空间的内积。 这个和等于 \(f\) 与“纯频率叠加” \(\sum c(\xi)e_\xi\) 的内积。
- 用 \(|f|\le\nu\) 加 Cauchy–Schwarz。 既然没有 \(f\) 的 \(L^2\) 界,就借助 \(\nu\) 当权重,把内积上界化成 \(\mathbf E_Z(\nu)^{1/2}\) 乘以一个加权 \(L^2\) 量。
- 展开加权 \(L^2\) 量。 平方展开后出现 \(\hat\nu(\xi-\xi')\)。伪随机性 (10.8) 说:非对角项 \((\xi\neq\xi')\) 都 \(\le\eta\),对角项 \((\xi=\xi')\) 贡献 \(1\)。于是该量 \(\le\eta|\operatorname{Spec}|^2+|\operatorname{Spec}|\)。
- 门槛 \(\alpha\ge2\eta^{1/2}\) 吃掉非对角项。 此时 \(\eta|\operatorname{Spec}|^2\) 至多是 \(\tfrac14\alpha^2|\operatorname{Spec}|^2\),与左端 \(\tfrac12\alpha^2|\operatorname{Spec}|^2\) 对消后只剩 \(|\operatorname{Spec}|\) 一项主导,整理即得 \(|\operatorname{Spec}_\alpha(f)|\le4/\alpha^2\)。♦
把 \(\sum_{\xi,\xi'}\hat\nu(\xi-\xi')\) 看作一张表:对角线是结实的 1,其余格子在伪随机性下都 \(\le\eta\)。门槛 \(\alpha\ge2\eta^{1/2}\) 保证非对角总和翻不起浪,于是谱不可能太大。 我们现在可以证明定理 10.18 了。
定理 10.18 之证明. 我们可以假设 \(|Z|\) 充分大(依赖于 \(\delta,p\)),因为否则结论是空洞的。我们将把 \(o_{|Z|\to\infty;\,p}(1)\) 简记为 \(o(1)\)。由推论 1.9,我们有 \(\mathbf P_Z(B)=\tau+O(|Z|^{-1/5})\)(比方说)以概率 \(1-o(1)\) 成立;特别地 \(B\) 非空。又若令 \(\nu:=1_B/\tau\),则由引理 4.16(把其中的 \(A\) 换成 \(Z\))我们有 \[ \sup_{\xi\in Z\setminus0}|\hat\nu(\xi)|=O\!\left(|Z|^{-1/5}\right) \] 同样以概率 \(1-o(1)\) 成立。将此与我们对 \(\mathbf P_Z(B)\) 的密度界结合,我们因而有 \[ \sup_{\xi\in Z}|\hat\nu(\xi)-\mathbf I(\xi=0)|=O\!\left(|Z|^{-1/5}\right) \tag{10.11}\] 以概率 \(1-o(1)\) 成立。今后我们将在这些事件上取条件。 设 \(\delta=\delta(|Z|,p)<1\) 是一个随 \(|Z|\to\infty\) 非常缓慢地衰减到零的小量(即 \(\delta=o(1)\));只需证明:当 \(\delta\) 衰减得足够缓慢、且在前述事件上取条件时,\(B\) 的每个相对密度 \(|A|/|B|\ge\delta\) 的子集 \(A\) 都含有一个长度为 \(3\) 的真等差数列。证明思路收束(本节到此为止)本节的 PDF 在此处中止(论证在后续小节继续)。但脉络已经清楚:
- 造伪随机包络。 取 \(\nu=1_B/\tau\)。随机集合 \(B\) 的傅里叶系数(除零频外)以高概率极小,故 \(\nu\) 满足伪随机性 (10.11),其中 \(\eta=O(|Z|^{-1/5})\) 微乎其微。
- 套用转移定理。 对 \(B\) 的高相对密度子集 \(A\),令 \(f=1_A\),它满足 \(f\le\nu\)。再用引理 10.22(Tomas–Stein)控制谱、从而验证 (10.7)。
- 得三项等差数列计数下界。 定理 10.20 给出 \(\Lambda_3(f,f,f)\ge 8p^{-12/\mathbf E_Z(f)}-\)(极小误差)。由于误差项含 \(\eta\) 极小,下界为正,于是 \(A\) 中三项等差数列的数量正比于一个正常数——多到足以保证存在真等差数列(退化项数量可忽略)。这就把命题 10.17 那种“稠密集合里必有许多三项等差数列”的结论,转移到了稀疏但伪随机背景下的相对稠密集合上。
返回 全书目录