Tao–Vu · 加性组合学 · 第 9 章 代数方法

9.7 Stepanov 方法Stepanov’s method

本页为译文 + 讲解合一:黑色正文为忠实翻译;彩色框(目标 / 定义 / 引理 / 定理 / 例 / 分步推演)与配图为面向初学者的详解,逐步推演、举例、画图,不用比喻。本节较难,讲解会把每一步的动机讲清楚。

本节目标固定一个有限域 \(F\) 与它乘法群 \(F^\times\) 的一个子群 \(G\)。\(G\) 在乘法上结构非常清楚(就是“开 \(h\) 次方的像”)。但本节真正关心的是 \(G\) 的加法结构——比如 \(G\) 与它的平移 \(G+x\) 能重叠多少、\(G\) 的“加性能量”有多大。Stepanov 方法给出一种纯代数的手段:用线性代数构造一个“稀疏”的多项式,让它在我们想控制的那些点上高阶为零;再用“多项式零点个数不超过次数”这一基本事实,反过来逼出这些点的个数上界。本节用它证明三件事:(1) Heath–Brown–Konyagin 关于 \(|\Lambda(\xi)|\) 分布的定理 9.41;(2) 子集加性能量的界(引理 9.44);(3) 一个和积估计(定理 9.45)。

在本节中我们固定一个有限域 \(F\),并固定 \(F^\times\) 的一个乘法子群 \(G\)。\(G\) 的乘法结构可以被明确地确定:

引理 9.39 设 \(G\) 是 \(F^\times\) 的一个子群。则 \(|G|\) 整除 \(|F^\times|\);因此对某个 \(h\ge 1\) 有 \(|F^\times|=|F|-1=|G|h\)。此外有如下显式公式 \[\begin{equation}\tag{9.15}G=\bigl\{x\in F^\times:\ x^{|G|}=1\bigr\}=\bigl\{y^{h}:\ y\in F^\times\bigr\},\end{equation}\] 并且若以 \(G^\perp\subseteq F^\times\) 记正交补群 \(G^\perp:=\{\xi\in F^\times:\ \xi^{h}=1\}\),则 \(G^\perp\) 给 \(G\) 的各个乘法陪集 \(x\cdot G\) 编了号。事实上,若对每个 \(\xi\in G^\perp\) 定义 \[G_\xi:=\bigl\{x\in F^\times:\ x^{|G|}=\xi\bigr\},\] 则诸集合 \(\{G_\xi:\xi\in G^\perp\}\) 构成 \(F^\times\) 的一个划分,并且对一切 \(x\in F^\times\) 有 \(x\cdot G=G_{x^{|G|}}\)。

这条引理的容易验证留作练习 9.7.1。

为什么成立(直觉)关键是 \(F^\times\) 是一个 \(|F|-1\) 阶的循环群
  1. 循环群的子群阶整除群阶,故 \(|G|\mid |F^\times|\),记商为 \(h\)。
  2. 把每个 \(x\in F^\times\) 映到 \(x^{|G|}\)。这是一个群同态,它的核恰好是满足 \(x^{|G|}=1\) 的元素,即 \(G\)(因为循环群里每个阶都恰有一个对应子群)。这就给出 \(G=\{x:x^{|G|}=1\}\)。同态的像则是所有 \(h\) 次方 \(y^{h}\),又因为 \(\dim\) 配平也等于 \(G\),于是第二个等号 \(G=\{y^{h}\}\) 也成立。
  3. 映射 \(x\mapsto x^{|G|}\) 的像是 \(\{\xi:\xi^{h}=1\}=G^\perp\)(一个 \(h\) 阶群)。\(x^{|G|}=\xi\) 的解集 \(G_\xi\) 正是 \(G\) 的一个陪集(同一同态、同一纤维),所以 \(F^\times\) 被分成 \(h\) 个等大的陪集 \(G_\xi\),每块大小 \(|G|\)。
\(F^\times\)(共 \(|G|h\) 个元素)= 划分成 \(h\) 个陪集 \(G_\xi\) \(G_1=G\) \(x^{|G|}=1\) \(G_{\xi_2}\) \(x^{|G|}=\xi_2\) \(G_{\xi_3}\) \(\cdots\) \(G_{\xi_h}\)
同态 \(x\mapsto x^{|G|}\) 把 \(F^\times\) 拍到 \(h\) 个值 \(\xi\in G^\perp\) 上;每个值的原像 \(G_\xi\) 是 \(G\) 的一个陪集,大小都是 \(|G|\)。这就是 \(F^\times\) 被 \(G^\perp\) “编号”划分的图景。

然而在本节中我们更关心理解 \(G\) 的加法结构。量化这种结构的一个方便方式是借助下面定义的集合 \(\Lambda(\xi)\subset F\):对每个 \(\xi\in G^\perp\),

定义(集合 \(\Lambda(\xi)\))对 \(\xi\in G^\perp\), \[\Lambda(\xi):=\bigl\{x\in F:\ x^{|G|}=(x-1)^{|G|}=\xi\bigr\}=G_\xi\cap(G_\xi+1).\] 显然当 \(\xi\) 取遍 \(G^\perp\) 时这些集合两两不相交。
把定义读懂\(x\in\Lambda(\xi)\) 要求两件事同时成立:\(x\) 所在的陪集编号是 \(\xi\)(即 \(x^{|G|}=\xi\),也就是 \(x\in G_\xi\)),而且 \(x-1\) 所在的陪集编号是 \(\xi\)(即 \(x-1\in G_\xi\),也就是 \(x\in G_\xi+1\))。所以 \(\Lambda(\xi)=G_\xi\cap(G_\xi+1)\) 数的是“自己和它减 1 都落在同一陪集 \(G_\xi\) 里”的那些 \(x\)。这正是把加法平移(减 \(1\))和乘法陪集(同一个 \(\xi\))扣在一起的量——所以它能反映 \(G\) 的加法结构。
具体算一遍:\(F=\mathbb F_{13}\),\(G=\) 二次剩余取 \(p=13\),令 \(G\) 为全体非零二次剩余(平方数): \[G=\{1,3,4,9,10,12\},\qquad |G|=6,\quad h=\tfrac{12}{6}=2.\] 于是 \(G^\perp=\{\xi:\xi^{2}=1\}=\{1,12\}\)(注意 \(12\equiv-1\))。对每个 \(x\),\(x^{6}=1\)(当 \(x\) 是剩余)或 \(x^{6}=12\)(当 \(x\) 是非剩余)。所以 \(G_1=G\)(剩余),\(G_{12}=\{2,5,6,7,8,11\}\)(非剩余)。逐个检验“\(x\) 与 \(x-1\) 是否同类”:
\(x\)\(x\) 类\(x-1\)\(x-1\) 类同类?属于
4剩余3剩余✓ \(\Lambda(1)\)
10剩余9剩余✓ \(\Lambda(1)\)
6非剩余5非剩余✓ \(\Lambda(12)\)
7非剩余6非剩余✓ \(\Lambda(12)\)
8非剩余7非剩余✓ \(\Lambda(12)\)
其余 \(x\) 的 \(x\) 与 \(x-1\) 不同类,被剔除。结论: \[\Lambda(1)=\{4,10\},\quad |\Lambda(1)|=2;\qquad \Lambda(12)=\{6,7,8\},\quad |\Lambda(12)|=3.\] 注意 \(2+3=5=|G|-1\),这正好预演了下面引理 9.40 的第一条等式。

这些集合与 \(G\) 的加法结构的关系,体现在下面这个容易验证的恒等式中:

恒等式 (9.16) \[\begin{equation}\tag{9.16}\bigl|G\cap(G+x)\bigr|=\bigl|\Lambda(\xi^{-1})\bigr|\qquad\text{只要 }\xi\in G^\perp,\ x\in G_\xi,\ g\in G.\end{equation}\] (详见练习 9.7.2。)
这条恒等式在说什么左边 \(|G\cap(G+x)|\) 数的是:\(G\) 与它平移 \(x\) 后的副本 \(G+x\) 有多少个公共元素——这是衡量“\(G\) 有多少加法重合”的最直接的量。恒等式说:这个重合数只依赖于 \(x\) 落在哪个陪集 \(G_\xi\)(不依赖具体的 \(x\)),且恰等于 \(|\Lambda(\xi^{-1})|\)。于是“理解 \(G\) 的加法重合”就被翻译成了“理解诸 \(|\Lambda(\xi)|\) 的大小”——这就是为什么本节要死磕 \(|\Lambda(\xi)|\) 的上界。

作为 (9.16) 的推论,我们有如下恒等式,其验证留作练习 9.7.3。

引理 9.40 我们有 \[\sum_{\xi\in G^\perp}|\Lambda(\xi)|=\Bigl|\bigcup_{\xi\in G^\perp}\Lambda(\xi)\Bigr|=|G|-1,\] 以及 \[E(G,G)=|G|^2+|G|\sum_{\xi\in G^\perp}|\Lambda(\xi)|^2,\] 其中 \(E(G,G)\) 是 \(G\) 的加性能量。若 \(-1\in G^\perp\),则对一切 \(\xi\in G^\perp\) 有 \(|\Lambda(-\xi)|=|\Lambda(\xi)|\)。
用 \(\mathbb F_{13}\) 例子核对两条等式
  1. 第一条:\(\sum_\xi|\Lambda(\xi)|=|\Lambda(1)|+|\Lambda(12)|=2+3=5\),而 \(|G|-1=6-1=5\)。吻合。直觉:\(\bigcup_\xi\Lambda(\xi)\) 收集所有“\(x\) 与 \(x-1\) 同陪集”的 \(x\);等价地数“\(G\) 内相邻的对”,结果恰是 \(|G|-1\)。
  2. 第二条(加性能量):\(\sum_\xi|\Lambda(\xi)|^2=2^2+3^2=13\),故公式给出 \(E(G,G)=|G|^2+|G|\cdot 13=36+6\cdot13=36+78=114\)。直接按定义 \(E(G,G)=\#\{(a,b,c,d)\in G^4:a-b=c-d\}\) 暴力数也正好得到 \(114\)。完全吻合。
这说明:把每个 \(|\Lambda(\xi)|\) 压小,就能把 \(E(G,G)\) 压小——加性能量越小,\(G\) 的加法结构越“分散”。

在文献 [337] 中,Stepanov 引入了一种方法,用以控制涉及 \(G\) 及诸如 \(|\Lambda(\xi)|\) 这类相关对象的各种加性表达式。为简单起见,我们仅把注意力限制在对 \(|\Lambda(\xi)|\) 求上界这一任务上,所采取的路线遵循 [180]。其思想是:用初等线性代数构造一个稀疏的多项式 \(P\),使它在若干个集合 \(\Lambda(\xi)\) 上高阶为零。然后应用诸如引理 9.26 一类的工具来得到一个非平凡的界。我们用 Heath–Brown 与 Konyagin 的下述结果来演示这一方法,它给出了关于诸 \(|\Lambda(\xi)|\) 大小的分布信息。

Stepanov 方法的总思路(务必先抓住)我们想说“那些点(即各 \(\Lambda(\xi)\) 里的元素)不能太多”。直接数很难。换个角度:
  1. 造一个非零多项式 \(P\),让它在我们关心的所有点 \(x\in\bigcup_{\xi}\Lambda(\xi)\) 上都以阶 \(A\) 为零(即 \((x)\) 是 \(P\) 的 \(A\) 重根)。
  2. 线性代数保证 \(P\) 存在且稀疏:把候选多项式张成一个维数为 \(AB^2\) 的线性空间 \(V\);“在这些点处 \(A\) 阶为零”是一组线性条件,条件个数 \(\approx |\,\cdot\,|A^2\),只要它少于 \(\dim V=AB^2\),就必有非零解。
  3. 数零点:一个非零多项式在 \(F\) 中(含重数)的零点数不超过它的次数 \(\deg P\)。每个目标点贡献 \(A\) 重,于是 \[A\cdot(\text{目标点总数})\le \deg P,\] 从而把目标点的个数压到 \(\le \deg(P)/A\)。
难点全在第 1、2 步:怎样让 \(P\) 既“次数低”(便于第 3 步)又“在足够多点上高阶为零”(便于得到强的界)。这要靠 \(t^{|G|}\) 在 \(G\) 上取常值这一特性,把高次幂“折叠”掉。
定理 9.41 [180] 设 \(F=\mathbb F_p\) 是素数阶有限域,\(G\) 是 \(F^\times\) 的乘法子群。\(G^\perp\) 与 \(\Lambda\) 如上定义。则对任意满足 \(|\Xi|=O(|F|^3/|G|^4)\) 的集合 \(\Xi\subseteq G^\perp\),有 \[\sum_{\xi\in\Xi}|\Lambda(\xi)|=O\!\left(\min\!\bigl(|G|,\ |G|^{2/3}|\Xi|^{2/3}\bigr)\right).\]
证明. 令 \(0c^{-100}\),否则结论平凡。类似地可假设 \(\Xi\) 非空且 \(|\Xi|\le c^{100}|F|^3/|G|^4\);因为当 \(|\Xi|=\Omega(|F|^3/|G|^4)\) 时,把 \(\Xi\) 划分成 \(O(1)\) 个大小至多 \(c^{100}|F|^3/|G|^4\) 的子集,再对每块用结论即可。 当 \(|\Xi|=\Omega(|G|^{1/2})\) 时,结论已可由引理 9.40 推出(因为那时 \(\min\) 取 \(|G|\),而 \(\sum|\Lambda(\xi)|\le|G|-1\)),故可设 \(|\Xi|
引理 9.42 \(V\) 在 \(F\) 上的线性维数恰好是 \(AB^2\)。
证明. 反设 \(V\) 的维数小于 \(AB^2\)。则可找到不全为零的系数 \(c_{a,b,b'}\in F\),使得 \[\sum_{0\le a
引理 9.42 的逻辑(稀疏 vs 高阶零点)把 \(b'=0\) 的那部分挑出来后得到的是一个只用了 \(t^a t^{b|G|}\) 这些单项式的多项式:指数形如 \(a+b|G|\),\(a至多 \(AB\) 个不同单项式(“稀疏”)。引理 9.26 这一类结果说:一个非零、只含 \(N\) 个单项式的多项式,不可能在某点处有 \(N\) 阶(或更高)的零点。这里若它在 \(t=1\) 处有 \(|G|\) 阶零点,就需要 \(\ge|G|\) 个单项式;但我们只有 \(AB<|G|\) 个——矛盾。所以系数不可能不全为零,即 \(\dim V=AB^2\)。换句话说:这些生成元线性无关,空间确实“够大”,第 2 步才有解的余地。

接着我们利用这一大维数,去找到一个在 \(\bigcup_{\xi\in\Xi}\Lambda(\xi)\) 上高阶为零的多项式。

引理 9.43 \(V\) 包含一个非零多项式 \(P\),它在 \(\bigcup_{\xi\in\Xi}\Lambda(\xi)\) 的所有元素处都以阶 \(A\) 为零。
证明. 这里采用代数几何的视角、借助交换环来处理会比较方便。令 \(R\) 为由不定元 \(t,t^{-1},s,s^{-1},r,\varepsilon\) 在 \(F\) 上生成的交换环,并施加约束 \[\begin{equation}\tag{9.19}tt^{-1}=ss^{-1}=1;\ \ s=t-1;\ \ t^{|G|}=s^{|G|}=r;\ \ \prod_{\xi\in\Xi}(r-\xi)=0;\ \ \varepsilon^{A}=0;\end{equation}\] 换言之,\(R\) 是多项式环 \(F[t,t^{-1},s,s^{-1},r,\varepsilon]\) 对由如下多项式生成的理想作商所得: \[tt^{-1}-1,\ ss^{-1}-1,\ s-t+1,\ t^{|G|}-r,\ s^{|G|}-r,\ \prod_{\xi\in\Xi}(r-\xi),\ \varepsilon^{A}.\] 设 \(\iota:F[t]\to R\) 为把 \(t\) 映到 \(t+\varepsilon\) 的环同态。我们将证明像 \(\iota(V)\) 的线性维数严格小于 \(AB^2\)。由引理 9.42,这将迫使存在一个非零多项式 \(P\in V\) 使得 \(\iota(P)=0\);也就是说我们能找到 \(Q_1,\dots,Q_7\in F[t,t^{-1},s,s^{-1},r,\varepsilon]\) 使得对任意不定元 \(t,t^{-1},s,s^{-1},r,\varepsilon\) 有 \[\begin{aligned}P(t+\varepsilon)=\ &Q_1(tt^{-1}-1)+Q_2(ss^{-1}-1)+Q_3(s-t+1)\\ &+Q_4\bigl(t^{|G|}-r\bigr)+Q_5\bigl(s^{|G|}-r\bigr)+Q_6\prod_{\xi\in\Xi}(r-\xi)+Q_7\,\varepsilon^{A}.\end{aligned}\] 将其限制到 \(r:=\xi\in\Xi\)、\(t:=x\in\Lambda(\xi)\subset F^\times\)、\(s:=x-1\in F^\times\)、\(t^{-1}:=x^{-1}\in F^\times\)、\(s^{-1}:=(x-1)^{-1}\in F^\times\)、\(\varepsilon\in F\),注意此时前六个约束全部成立而归零,于是得到 \[P(x+\varepsilon)=Q_7\bigl(x,x^{-1},x-1,(x-1)^{-1},\xi,\varepsilon\bigr)\,\varepsilon^{A},\] 这表明 \(P\) 在 \(x\) 处以阶 \(A\) 为零,而 \(x\) 是 \(\bigcup_{\xi\in\Xi}\Lambda(\xi)\) 中任意一个元素。 剩下要做的是给 \(\iota(V)\) 的线性维数定界。注意这个空间由诸多项式 \[\iota\bigl(t^{a}t^{b|G|}(t-1)^{b'|G|}\bigr)=(t+\varepsilon)^{a}(t+\varepsilon)^{b|G|}(s+\varepsilon)^{b'|G|}\] 生成。但由 \((t+\varepsilon)^{b|G|}\) 的 Taylor 展开并利用约束 (9.19),我们有 \[\begin{aligned}(t+\varepsilon)^{b|G|}&=t^{b|G|}\left(1+\binom{b|G|}{1}t^{-1}\varepsilon+\binom{b|G|}{2}t^{-2}\varepsilon^{2}+\cdots\right)\\ &=r^{b}\left(1+\binom{b|G|}{1}t^{-1}\varepsilon+\cdots+\binom{b|G|}{A-1}t^{-A+1}\varepsilon^{A-1}\right).\end{aligned}\] (这里既用了 \(t^{|G|}=r\) 把首项 \(t^{b|G|}\) 换成 \(r^{b}\),又用了 \(\varepsilon^{A}=0\) 把展开在 \(\varepsilon^{A-1}\) 处截断。)特别地,我们看到 \((t+\varepsilon)^{b|G|}\) 在 \(R\) 中等于一个关于 \(t,t^{-1},s,s^{-1},r,\varepsilon\) 的、次数为 \(O(A)\) 的多项式表达式。对 \((t+\varepsilon)^{a}\) 与 \((s+\varepsilon)^{b'|G|}\) 也类似。于是 \(\iota(V)\) 落在“关于 \(t,t^{-1},s,s^{-1},r,\varepsilon\) 且次数至多 \(O(A)\) 的多项式”所张成的空间里。提出一个公分母 \((ts)^{-O(A)}\),便得到一个“关于 \(t,s,r,\varepsilon\) 且次数至多 \(O(A)\)”的多项式空间。变量 \(s\) 可用 \(s=t-1\)(见 (9.19))消去;变量 \(r\) 的次数被限制为至多 \(|\Xi|\)(同样由 (9.19) 中 \(\prod_{\xi\in\Xi}(r-\xi)=0\),其次数为 \(|\Xi|\))。这表明 \(\iota(V)\) 的维数至多是 \(O(|\Xi|A^2)\),由 (9.17)(其中 \(A^2|\Xi|\le cAB^2\)),它确实小于 \(V\) 的维数 \(AB^2\),正如所需。
引理 9.43 用环 \(R\) 在做什么这一步看着抽象,核心其实就是把第 2 步“线性条件个数 \(<\) 维数”的计数干净地完成:
  1. 环 \(R\) 把所有约束(\(s=t-1\)、\(t^{|G|}=s^{|G|}=r\)、\(r\) 只取 \(\Xi\) 中的值、\(\varepsilon^A=0\))一次性编码进去。这些约束正是 \(\Lambda(\xi)\) 中元素 \(x\) 所满足的关系。
  2. 同态 \(\iota:t\mapsto t+\varepsilon\) 把“\(P\) 在 \(x\) 处 \(A\) 阶为零”翻译成“\(P(t+\varepsilon)\) 在 \(R\) 中是 \(\varepsilon^A\) 的倍数”,即 \(\iota(P)=0\)。
  3. 关键的尺寸比较:约束让幂次 \(t^{b|G|}=r^b\) 被“折叠”,再被 \(\varepsilon^A=0\) 截断,于是 \(\iota(V)\) 只活在一个维数 \(O(|\Xi|A^2)\) 的小空间里。因为 \(O(|\Xi|A^2)
一句话:“目标点的约束太少,候选多项式太多,于是必有满足全部约束的非零 \(P\)。”

设 \(P\) 如引理 9.43 所给。由于 \(P\in V\),我们有 \(\deg(P)\le A+2|G|B<|F|\),这要归功于 (9.17)(\(V\) 的生成元次数至多 \(A-1+(B-1)|G|+(B-1)|G|

收尾的算术(第 3 步落地)\(P\) 在 \(\bigcup_{\xi\in\Xi}\Lambda(\xi)\) 的每个点处都是 \(A\) 重根,这些点共 \(\sum_{\xi\in\Xi}|\Lambda(\xi)|\) 个、且两两不同,故按重数算零点至少 \(A\sum_{\xi}|\Lambda(\xi)|\) 个。它不能超过 \(\deg P\le A+2|G|B\)。两边除以 \(A\): \[\sum_{\xi\in\Xi}|\Lambda(\xi)|\le 1+\frac{2|G|B}{A}=O\!\left(1+\frac{|G|B}{A}\right).\] 代回 \(A=c^{10}|G|^{2/3}|\Xi|^{-1/3}\)、\(B=c|G|^{1/3}|\Xi|^{1/3}\) 得 \(|G|B/A=O(|G|^{2/3}|\Xi|^{2/3})\),与前面 \(|\Xi|=\Omega(|G|^{1/2})\) 时的 \(O(|G|)\) 合并即得定理。
数轴 \(F\) ×A×A×A×A 每个目标点都是 \(A\) 重根 \(A\cdot(\#\text{点})\le\deg P\le A+2|G|B\)
蓝点是 \(\bigcup_{\xi\in\Xi}\Lambda(\xi)\) 中的元素,每个都是非零多项式 \(P\) 的 \(A\) 重根。重数累加不能超过次数,于是点数被 \((A+2|G|B)/A\) 卡住——这就是 Stepanov 方法“以代数压计数”的落点。

定理 9.41 已经可以用来给出关于 \(G\) 的非平凡和集界,例如通过控制加性能量 \(E(G,G)\)。事实上我们还能控制 \(G\) 的子集 \(A\) 的加性能量 \(E(A,A)\):

引理 9.44 [44] 设 \(F=\mathbb F_p\) 是素数阶有限域,\(G\) 是 \(F^\times\) 中阶为 \(|G|=O(|F|^{3/4})\) 的乘法子群。设 \(A\) 是 \(G\) 中的一个加性集。则有 \[\begin{equation}\tag{9.20}E(A,A)=O\!\bigl(|G|\,|A|^{3/2}\bigr).\end{equation}\] 把它与 (2.7) 比较可知,当 \(|A|\ge|G|^{2/3}\) 时这个界是非平凡的。另见推论 2.62。
“非平凡”是什么意思加性能量的平凡上界是 \(E(A,A)\le|A|^3\)(即 (2.7) 量级)。新界 \(O(|G||A|^{3/2})\) 只有在它更小时才有用,即 \(|G||A|^{3/2}<|A|^3\Leftrightarrow|G|<|A|^{3/2}\Leftrightarrow|A|>|G|^{2/3}\)。这正是引理里给出的门槛 \(|A|\ge|G|^{2/3}\)。
证明. 对每个 \(\xi\in G^\perp\),定义计数函数 \(\alpha(\xi)\) 为 \[\alpha(\xi):=\bigl|\{(a_1,a_2)\in A\times A:\ a_1-a_2\in G_\xi\}\bigr|.\] 我们观察到 \[\begin{aligned}E(A,A)&=\bigl|\{(a_1,a_2,a_3,a_4)\in A^4:\ a_1-a_2=a_3-a_4\}\bigr|\\ &=|A|^2+\sum_{\xi\in G^\perp}\bigl|\{(a_1,a_2,a_3,a_4)\in A^4:\ a_1-a_2=a_3-a_4\in G_\xi\}\bigr|\\ &\le|A|^2+\sum_{\xi\in G^\perp}\alpha(\xi)\,\sup_{d\in G_\xi}\bigl|\{(g_1,g_2)\in G\times G:\ g_1-g_2=d\}\bigr|\\ &=|A|^2+\sum_{\xi\in G^\perp}\alpha(\xi)\,|\Lambda(\xi^{-1})|\end{aligned}\] 这最后一步要归功于 (9.16)。由于 \(|A|^2=|A|^{1/2}|A|^{3/2}=O(|G||A|^{3/2})\),故只需证明 \[\sum_{\xi\in G^\perp}\alpha(\xi)\,|\Lambda(\xi^{-1})|=O\!\bigl(|G||A|^{3/2}\bigr).\] 由恒等式 \(\sum_{\xi\in G^\perp}\alpha(\xi)=|A|^2\)(每对 \((a_1,a_2)\) 的差 \(a_1-a_2\) 恰落在某一个 \(G_\xi\) 里,外加差为 \(0\) 的情形,这给出 \(\sum\alpha=|A|^2\)),我们看出只需证明 \[\sum_{\substack{\xi\in G^\perp\\ |\Lambda(\xi^{-1})|\ge|G||A|^{-1/2}}}\alpha(\xi)\,|\Lambda(\xi^{-1})|=O\!\bigl(|G||A|^{3/2}\bigr)\] (因为 \(|\Lambda(\xi^{-1})|<|G||A|^{-1/2}\) 的那部分贡献 \(\le|G||A|^{-1/2}\sum_\xi\alpha(\xi)=|G||A|^{-1/2}\cdot|A|^2=|G||A|^{3/2}\),已经够小)。但由 (9.16) 我们还有平凡界 \[\alpha(\xi)\le|A|\sup_{g_1\in G}\bigl|\{g_2\in G:\ g_1-g_2\in G_\xi\}\bigr|=|A|\,|\Lambda(\xi^{-1})|,\] 于是只需证明 \[\sum_{\substack{\xi\in G^\perp\\ |\Lambda(\xi^{-1})|\ge|G||A|^{-1/2}}}|\Lambda(\xi^{-1})|^2=O\!\bigl(|G||A|^{1/2}\bigr).\] 但若把 \(G^\perp=\{\xi_1,\dots,\xi_M\}\) 按 \(|\Lambda(\xi_j^{-1})|\) 的递减顺序排列,则由定理 9.41 有 \[j\,\bigl|\Lambda(\xi_j^{-1})\bigr|=O\!\left(\min\!\bigl(|G|,\ |G|^{2/3}j^{2/3}\bigr)\right)\quad\text{对一切 }1\le j\le M,\] 这蕴含 \[\sum_{\substack{\xi\in G^\perp\\ |\Lambda(\xi^{-1})|\ge|G||A|^{-1/2}}}|\Lambda(\xi^{-1})|^2=\sum_{j=O(|A|^{3/2}/|G|)}O\!\left(|G|^{2/3}j^{2/3}/j\right)^2=O\!\bigl(|G||A|^{1/2}\bigr),\] 正如所需。
为什么把 \(j\Lambda(\xi_j^{-1})\) 排序就够了把 \(|\Lambda|\) 从大到小排成第 \(1,2,\dots\) 名后,对前 \(j\) 名取并集用定理 9.41(取 \(\Xi=\) 前 \(j\) 个 \(\xi\))得 \(j\cdot|\Lambda(\xi_j^{-1})|\le\sum_{i\le j}|\Lambda(\xi_i^{-1})|=O(|G|^{2/3}j^{2/3})\),即 \(|\Lambda(\xi_j^{-1})|=O(|G|^{2/3}j^{-1/3})\)。
  1. 门槛 \(|\Lambda(\xi_j^{-1})|\ge|G||A|^{-1/2}\) 配上这个上界给出 \(|G|^{2/3}j^{-1/3}\ge|G||A|^{-1/2}\),即 \(j\le|A|^{3/2}/|G|\)。所以只有前 \(O(|A|^{3/2}/|G|)\) 名进入求和。
  2. 每项 \(|\Lambda(\xi_j^{-1})|^2=O(|G|^{4/3}j^{-2/3})\)。求和 \(\sum_{j\le J}j^{-2/3}=O(J^{1/3})\),取 \(J=|A|^{3/2}/|G|\) 得 \(O((|A|^{3/2}/|G|)^{1/3})=O(|A|^{1/2}|G|^{-1/3})\)。
  3. 乘起来:\(|G|^{4/3}\cdot|A|^{1/2}|G|^{-1/3}=|G|\,|A|^{1/2}\)。正是目标。
直觉:定理 9.41 限制了“大的 \(|\Lambda|\) 不能太多”,于是平方和被少数几个大项主导、整体可控。

作为一个推论,我们现在可以给出一个和积估计,它在某种程度上改进了 2.8 节中的结果。

定理 9.45 [44] 设 \(F=\mathbb F_p\) 是素数阶有限域,\(A\) 是 \(F^\times\) 中的一个加性集。令 \(Q[A]=\dfrac{A-A}{(A-A)\setminus 0}\) 为 \(A\) 的商集(如定义 2.49)。则存在 \(\xi\in Q[A]\) 使得 \[|A+\xi\cdot A|\ge c\,\min\!\left(|F|,\ \frac{|A|^{5/2}}{|A\pm A|},\ \frac{|A|^3}{|A\cdot A|}\right),\] 对正负号 \(\pm\) 的任一种取法均成立。
证明. 若 \(|A|\ge|F|^{1/2}\),则结论由推论 2.51 给出,故设 \(|A|<|F|^{1/2}\)。令 \(D\) 为流行商之集 \[D:=\left\{d\in F^*:\ \bigl|\{(a',a'')\in A\times A:\ a'/a''=d\}\bigr|\ge\frac{2|A|^2}{9|A\cdot A|}\right\},\] 并令 \(G\) 为由 \(D\) 生成的乘法群。则由练习 2.6.10 的乘法版本,存在 \(G\) 的某个陪集 \(\xi_0\cdot G\)(\(\xi_0\in F^*\))使得 \(|A\cap(\xi_0\cdot G)|\ge|A|/3\)。通过用 \(\xi_0\) 去除 \(A\),可不妨设 \(\xi_0=1\)。

引理 9.46 设 \(H\subseteq G\) 为满足下式的那些 \(\xi\in G\) 之集: \[|A+\xi\cdot A|\ge\min\!\left(\frac{|A|^2|G|}{|A|^2+|G|},\ \frac{2|A|^3}{9|A\cdot A|}\right).\] 则 \(H\cap Q[A]\) 非空。
证明. 反设 \(H\) 与 \(Q[A]\) 不相交。由练习 2.8.4,存在某个 \(\xi\in G\) 使得 \(|A+\xi\cdot A|\ge\frac{|A|^2|G|}{|A|^2+|G|}\),因此 \(H\) 非空。于是 \(G\setminus Q[A]\) 非空,并且也是 \(G\) 的一个真子集(因为 \(1\in Q[A]\cap G\))。其次观察到:若 \(\xi\in G\setminus Q[A]\) 且 \(d\in D\),则由引理 2.50,和 \(A+\xi\cdot A\) 中的各项两两不同,从而 \[|A+(\xi d)\cdot A|\ge|A|\,|A\cap(d\cdot A)|\ge\frac{2|A|^2}{9|A\cdot A|}.\] 这表明 \(D\cdot(G\setminus Q[A])\subseteq H\)。由于 \(H\subseteq G\) 且 \(H\) 与 \(Q[A]\) 不相交,我们得出 \(D\cdot(G\setminus Q[A])\subseteq G\setminus Q[A]\);又因为 \(D\) 生成 \(G\),这就推出 \(G\cdot(G\setminus Q[A])\subseteq G\setminus Q[A]\)。但这与前面观察到的“\(G\setminus Q[A]\) 是 \(G\) 的真非空子集”相矛盾。
引理 9.46 的反证为何成立这是一个漂亮的“群论 + 反证”论证:
  1. 若 \(G\setminus Q[A]\) 在乘 \(D\) 之下不变(\(D\cdot(G\setminus Q[A])\subseteq G\setminus Q[A]\)),由于 \(D\) 生成整个 \(G\),整个 \(G\) 乘进去也跑不出 \(G\setminus Q[A]\),即它是 \(G\) 的一个非空“吸收子集”。
  2. 但 \(G\) 的一个在群乘法下封闭、又被整个群吸收的非空子集只能是 \(G\) 自己——这与“它是真子集”冲突。
  3. 冲突的根源就是假设“\(H\) 与 \(Q[A]\) 不相交”。所以 \(H\cap Q[A]\) 必非空:存在既是流行商方向、又使 \(A+\xi\cdot A\) 大的 \(\xi\)。

设 \(\xi\) 如上述引理所给;于是 \[|A+\xi\cdot A|\ge c\,\min\!\left(|G|,\ |A|^2,\ \frac{|A|^3}{|A\cdot A|}\right).\] 注意由于 \(|A\cdot A|\ge|A|\),我们可以从右端丢掉 \(|A|^2\) 这一项(因为 \(|A|^3/|A\cdot A|\le|A|^2\))。至此,除非对某个小的 \(c>0\) 有 \(|G|\le c|A|^{5/2}/|A\pm A|\),否则我们已经完成证明。

最后一步在收什么尾到这里已得到 \(|A+\xi\cdot A|\ge c\min(|G|,|A|^3/|A\cdot A|)\)。要证的目标里有三项 \(\min(|F|,|A|^{5/2}/|A\pm A|,|A|^3/|A\cdot A|)\):
  • \(|A|^3/|A\cdot A|\) 这一项已被上式覆盖;
  • \(|F|\) 这一项在 \(|A|\ge|F|^{1/2}\) 的开头情形已处理;
  • 只剩 \(|A|^{5/2}/|A\pm A|\) 这一项:当 \(|G|\) 本身就 \(\ge c|A|^{5/2}/|A\pm A|\) 时,\(\min(|G|,\dots)\) 自动覆盖它;故只需另行处理 \(|G|\le c|A|^{5/2}/|A\pm A|\) 的小群情形(这一情形要动用前面引理 9.44 对加性能量的界),即原文此处所指的“除非 …… 否则已完成”。

返回 全书目录