Tao–Vu · 加性组合学 · 第 2 章和集估计

2.8　初等和积估计Elementary sum-product estimates

本页为译文 + 高中讲解合一：黑色正文为忠实翻译；彩色框（目标 / 例 / 分步推演）与配图为面向高中生的详解，逐步推演、举例、画图，不用比喻。本节是全章最难的部分之一，我们会把每一步的动机讲清楚。

本节目标前面几节只研究加法结构（和集 \(A+A\) 多大）。本节把加法与乘法同时考虑：一个集合 \(A\) 能不能同时对加法和乘法都“几乎封闭”（即 \(A+A\) 和 \(A\cdot A\) 都不比 \(A\) 大多少）？答案是：基本上不能——除非 \(A\) 本身差不多就是一个子环 / 子域。这就是著名的和积现象（sum-product phenomenon）。本节将把它在域上彻底说清楚（定理 2.55）。

先建立直觉：和与积此消彼长

取两种典型集合，亲手感受“不能同时小”。

等差数列 \(A=\{1,2,3,\dots,N\}\)：和集很小，\(A+A=\{2,3,\dots,2N\}\)，只有 \(2N-1\) 个元素（约 \(2|A|\)）。但积集 \(A\cdot A\)（所有乘积 \(ij\)）却很大，约 \(N^2/(\log N)^{c}\) 个——几乎是平方级。
等比数列 \(A=\{2,4,8,\dots,2^{N}\}\)：积集很小，\(A\cdot A=\{2^2,2^3,\dots,2^{2N}\}\)，只有 \(2N-1\) 个。但和集 \(A+A\) 却很大（不同的二进制和几乎都不相等），约 \(\binom{N+1}{2}\) 个。

一个对加法“好”，另一个对乘法“好”，但都不能两头都好。要两头都好，唯一的办法是 \(A\) 本身带有“环”的结构（既能加又能乘且不跑出去），比如 \(A\) 是一个子域。这就是本节要证明的精确版本。

我们现在讨论关于交换环 \(Z\) 的一个子集 \(A\) 的和集与积集的若干结果，从而把前几节中的加法理论与乘法理论结合起来（为简单起见，乘法仍保持交换）。这里的问题是：分析一个集合 \(A\) 能在多大程度上同时近似地对加法与乘法封闭。当然，发生这种情形的一种方式是 \(A\) 本身就是 \(Z\) 的一个子环；看起来，在忽略平凡改动（如删去若干元素、添加少量新元素、或对集合作伸缩）之后，这本质上是唯一的例子，尽管目前我们只在 \(Z\) 是域的情形下才有这一原则的令人满意而完整的刻画（定理 2.55）。在某些方面，这里的理论其实比和集理论更容易，因为我们可以同时利用由 \(A+A\) 之小与 \(A\cdot A\) 之小所产生的两种相当不同的结构，从而得出结论。与本章其余部分一样，我们的讨论针对一般的域，并特别强调有限域 \(Z_p\)。我们指出，对于实域 \(\mathbb{R}\)，已知有好得多的结果，见 8.3、8.5 节。

本节中 \(Z\) 始终表示一个交换环，\(Z^{*}\) 表示 \(Z\) 中那些不是零因子的元素；它们在 \(Z\) 中构成一个乘法的、可消去的交换幺半群（monoid）。当 \(Z\) 是域时情形理解得要好得多（尤其见下面的定理 2.55）；这种情形下我们将把域记作 \(F\)（而非 \(Z\)），把 \(F^{\times}\)（而非 \(F^{*}=F\setminus\{0\}\)）记作以强调 \(F^{\times}\) 此时是一个乘法群。在域的框架下，一个基本概念是商集（quotient set），它是除环的商域概念的算术对应物。

2.8.1　商集 Q[A]

定义 2.49（商集）设 \(A\) 是域 \(F\) 的有限子集且 \(|A|\ge 2\)。则 \(A\) 的商集 \(Q[A]\) 定义为 \[Q[A]:=\frac{A-A}{(A-A)\setminus 0}:=\left\{\frac{a-b}{c-d}\ :\ a,b,c,d\in A;\ c\ne d\right\}.\] 我们还令 \(Q[A]^{\times}:=Q[A]\setminus 0\) 为 \(Q[A]\) 中的可逆元。

注意到 \(Q[A]\) 同时包含 \(0\) 与 \(1\)，并且在加法取反与乘法取逆下都对称，即 \(Q[A]=-Q[A]\) 且 \(Q[A]^{\times}=(Q[A]^{\times})^{-1}\)。它还在 \(A\) 的平移与伸缩下不变，即对所有 \(x\in F\) 与 \(\lambda\in F^{\times}\) 有 \(Q[A]=Q[A+x]=Q[\lambda\cdot A]\)。从几何上看，\(Q[A]\) 可视为连接 \(A\times A\) 中各点的直线的斜率之集。

把 \(A\times A\) 看成平面上的点阵（这里 \(A=\{0,1,2\}\)）。任取两点连一条直线，其斜率就是某个 \(\dfrac{d-b}{c-a}\)。所有这种斜率（连同 \(0\)）构成 \(Q[A]\)。\(Q[A]\) 越“大”，说明 \(A\) 的点排得越“乱”、方向越多。

商集之所以与和积估计相关，在于下面这个平凡却根本的观察：

引理 2.50设 \(A\) 是域 \(F\) 的有限子集且 \(|A|\ge 2\)，又设 \(x\in F\)。则 \[|A+x\cdot A|=|A|^{2}\quad\Longleftrightarrow\quad x\notin Q[A].\]

证明. 我们有 \(|A+x\cdot A|=|A|^{2}\) 当且仅当映射 \((a,b)\mapsto a+xb\) 在 \(A\times A\) 上是单射。这又当且仅当对一切相异的 \((a,b),(c,d)\in A\times A\) 都有 \(a+xb\ne c+xd\)；经过一点代数变形，这等价于断言 \(x\notin Q[A]\)。♦

把证明拆成最小步骤

\(|A+x\cdot A|\) 最多是 \(|A|^2\)（因为 \(A+x\cdot A\) 至多由 \(|A|\times|A|\) 个和 \(a+xb\) 构成）。它恰等于 \(|A|^2\) 当且仅当这些和互不相同，即映射 \((a,b)\mapsto a+xb\) 单射。
映射不单射，意味着存在相异的 \((a,b)\ne(c,d)\) 使 \(a+xb=c+xd\)，即 \(a-c=x(d-b)\)。
若 \(b=d\) 则 \(a=c\)，与“相异”矛盾；故必 \(b\ne d\)，于是 \(x=\dfrac{a-c}{d-b}\in Q[A]\)。
反过来，任何 \(x\in Q[A]\)（某条斜率）都能造出这样的碰撞。所以“单射 \(\Leftrightarrow x\notin Q[A]\)”，即 \(|A+x\cdot A|=|A|^2 \Leftrightarrow x\notin Q[A]\)。

直觉：把 \(x\) 想成一个“倾斜方向”。若这个方向不是 \(A\) 内部已有的任何斜率，那么把 \(A\) 与“倾斜后的 \(A\)”相加就不会发生重叠，和集达到最大可能 \(|A|^2\)。

这有一个直接推论：

推论 2.51若 \(A\) 是有限域 \(F\) 的子集且 \(|A|>|F|^{1/2}\)，则 \(Q[A]=F\)。

为什么

若 \(Q[A]\ne F\)，则存在 \(x\in F\setminus Q[A]\)，由引理 2.50 得 \(|A+x\cdot A|=|A|^2>|F|\)。但 \(A+x\cdot A\subseteq F\)，元素个数不可能超过 \(|F|\)，矛盾。故 \(Q[A]=F\)。

注意条件 \(|A|>|F|^{1/2}\) 是绝对精确（sharp）的，只需考虑 \(A\) 是 \(F\) 的一个指数为 \(2\) 的子域的情形即可看出（此时 \(|A|=|F|^{1/2}\) 而 \(Q[A]=A\ne F\)）。

引理 2.50 还有另一个重要推论：它给出了一个判据，在此判据下 \(Q[A]\) 是 \(F\) 的一个子域。

推论 2.52设 \(A\) 是域 \(F\) 的有限子集，\(|A|\ge 2\)，且 \[|A+Q[A]\cdot Q[A]\cdot A|,\quad |A+(Q[A]+Q[A])\cdot A|\ <\ |A|^{2}.\] 则 \(Q[A]\) 是 \(F\) 的一个子域。

本推论可与习题 2.6.5 对照。

证明. 由引理 2.50 及假设，我们看出 \(Q[A]\cdot Q[A]\subseteq Q[A]\) 且 \(Q[A]+Q[A]\subseteq Q[A]\)。（理由：若某 \(y\in Q[A]\cdot Q[A]\) 却 \(y\notin Q[A]\)，则 \(|A+y\cdot A|=|A|^2\)；但 \(A+y\cdot A\subseteq A+Q[A]\cdot Q[A]\cdot A\)，于是后者 \(\ge|A|^2\)，与假设矛盾。第二个包含同理。）特别地 \(Q[A]^{\times}\cdot Q[A]^{\times}=Q[A]^{\times}\)。由于 \(Q[A]\) 有限且含 \(0,1\)，由命题 2.7 知 \(Q[A]\) 是一个加法群；类似地，由该命题的乘法版本知 \(Q[A]^{\times}\) 是一个乘法群。结论得证。♦

阶段小结“判 \(Q[A]\) 是子域”=“证两件封闭性 \(+\) 与 \(\times\)”。而封闭性又被翻译成“某些表达式的集合不太大（小于 \(|A|^2\)）”。于是整个证明策略变成：先把 \(A\) 换成一个性质很好的子集 \(A'\)，使得 \(A'\) 的一切多项式/有理表达式都不大，再用本推论断定 \(Q[A']\) 是子域。下面两条引理就是为“换成好子集”作准备。

2.8.2　换成好子集：Katz–Tao 引理

为了使用上述推论，我们需要控制 \(A\) 的有理表达式，例如 \(A+Q[A]\cdot Q[A]\cdot A\)。与诸如推论 2.23 那样的和集估计作类比，人们也许首先期望：一旦 \(|A+A|\le K|A|\) 且 \(|A\cdot A|\le K|A|\)，那么 \(A\) 的一切多项式或有理表达式的基数都被 \(CK^{C}|A|\) 控制。然而事实并非如此，即便把 \(A\) 标准化为含 \(0\) 与 \(1\) 也不行。要看出这点，考虑 \(A=G\cup\{x\}\)，其中 \(G\) 是 \(F\) 的一个子域而 \(x\notin G\)。则容易验证 \(|A+A|,|A\cdot A|<2|A|\)，但 \(|A\cdot A+A\cdot A|\ge(|A|-1)^{2}\)，因为 \(A\cdot A+A\cdot A\) 含有 \(G+x\cdot G\)，由引理 2.50 知后者大小为 \(|G|^{2}\)。这个例子与前一节出现的例子相似，并以相似的方式解决，即从 \(A\) 过渡到 \(A\) 的一个子集。

看懂这个“反例”

设 \(G\) 是一个有 \(n\) 个元素的子域，\(A=G\cup\{x\}\)，\(x\notin G\)，于是 \(|A|=n+1\)。

\(A+A\)：\(G+G=G\)（子域对加法封闭），再加上含 \(x\) 的少数几项（\(G+x\) 共 \(n\) 个，以及 \(x+x=2x\)），所以 \(|A+A|\) 约为 \(2n<2|A|\)，很小。
\(A\cdot A\)：\(G\cdot G=G\)，加上 \(x\cdot G\)（\(n\) 个）与 \(x^2\)，所以 \(|A\cdot A|\) 也约为 \(2n<2|A|\)，很小。
但 \(A\cdot A+A\cdot A\supseteq G+x\cdot G\)。由引理 2.50（取“\(x\)”为本例的 \(x\notin G=Q[G]\)），\(|G+x\cdot G|=|G|^2=n^2\)，巨大！

结论：\(A+A\) 与 \(A\cdot A\) 都小，并不能保证更复杂的表达式（如 \(A\cdot A+A\cdot A\)）也小。罪魁就是那个孤立的 \(x\)。补救办法：扔掉坏元素，过渡到一个干净的子集 \(A'\)（这里就是 \(G\) 本身）。

引理 2.53（Katz–Tao 引理）[199],[41] 设 \(Z\) 是交换环，\(A\subseteq Z^{*}\) 是有限非空子集，使得对某个 \(K\ge 1\) 有 \(|A+A|\le K|A|\) 且 \(|A\cdot A|\le K|A|\)。则存在 \(A\) 的一个子集 \(A'\) 使得 \[|A'|\ge \frac{|A|}{2K}-1\qquad\text{且}\qquad |A'\cdot A'-A'\cdot A'|=O\!\left(K^{O(1)}|A'|\right).\]

注意此引理在任意交换环中都成立，而不仅仅在域中。要求 \(A\) 的元素都不是零因子，在域的情形下并不严重（必要时只需把原点 \(0\) 从 \(A\) 中移走），但在其它交换环中是一个非平凡的要求。

证明. 我们采用 [41] 中的论证。可设 \(|A|>10K\)（例如），否则结论平凡。考虑 \(A\) 的诸伸缩 \(\{a\cdot A:a\in A\}\)。由于 \(a\in Z^{*}\)，\(a\cdot A\) 与 \(A\) 有相同的基数。特别地有 \[\sum_{x\in A\cdot A}\sum_{a\in A}\mathbf 1_{a\cdot A}(x)=|A|^{2}.\] 由于 \(|A\cdot A|\le K|A|\)，可应用 Cauchy–Schwarz 不等式得 \[\sum_{x\in A\cdot A}\left(\sum_{a\in A}\mathbf 1_{a\cdot A}(x)\right)^{2}\ge \frac{|A|^{3}}{K}.\] 将其重新整理为 \[\sum_{a,b\in A}\big|(a\cdot A)\cap(b\cdot A)\big|\ge \frac{|A|^{3}}{K}.\] 由鸽笼原理，可找到一个 \(b\in A\) 使得 \[\sum_{a\in A}\big|(a\cdot A)\cap(b\cdot A)\big|\ge \frac{|A|^{2}}{K}.\] 固定这个 \(b\)。令 \(A'\) 为一切满足 \(|(a\cdot A)\cap(b\cdot A)|\ge \dfrac{|A|}{2K}\) 的 \(a\in A\) 之集，则 \[\sum_{a\in A'}\big|(a\cdot A)\cap(b\cdot A)\big|\ge \frac{|A|^{2}}{2K},\] 从而 \(|A'|\ge\dfrac{|A|}{2K}\)。必要时把 \(A'\) 缩小一个元素，可设 \(b\in A'\)。

现在回忆 Ruzsa 距离 \(d(A,B):=\log\dfrac{|A-B|}{|A|^{1/2}|B|^{1/2}}\)，并注意当 \(a\) 不是零因子时 \(d(a\cdot A,a\cdot B)=d(A,B)\)。于是 \(d(A,A)\le 2d(A,-A)=2\log K\)，从而 \[d(a\cdot A,a\cdot A)=d(b\cdot A,b\cdot A)=d(A,A)\le 2\log K\quad\text{对一切 }a\in A'.\] 由于 \((a\cdot A)\cap(b\cdot A)\) 是 \(a\cdot A\) 与 \(b\cdot A\) 的一个大子集，可算得 \[d\big(a\cdot A,\,a\cdot A\cap b\cdot A\big),\ d\big(b\cdot A,\,a\cdot A\cap b\cdot A\big)=O(1+\log K),\] 于是由 Ruzsa 三角不等式 \[d(a\cdot A,\,b\cdot A)=O(1+\log K)\quad\text{对一切 }a\in A'.\tag{2.41}\] 对其作伸缩，得到 \[d(a_1a_2\cdot A,\,ba_2\cdot A),\ d(ba_2\cdot A,\,b^{2}\cdot A)=O(1+\log K)\quad\text{对一切 }a_1,a_2\in A',\] 从而再由 Ruzsa 三角不等式 \[d(a_1a_2\cdot A,\,b^{2}\cdot A)=O(1+\log K)\quad\text{对一切 }a_1,a_2\in A'.\tag{2.42}\]

为继续推进，我们需要把 \(A'\) 中的元素“求逆”。对任意 \(a\in A'\)，令 \(\hat a:=\prod_{a'\in A'\setminus\{a\}}a'\in Z^{*}\)。把 (2.41)（其中 \(a\) 换成 \(a_3\)）用 \(a_1a_2\prod_{a'\in A'\setminus\{a_3,b\}}a'\) 作伸缩（\(a_1,a_2,a_3\in A'\)），得到 \[d(a_1a_2\hat b\cdot A,\,a_1a_2\hat a_3\cdot A)=O(1+\log K)\quad\text{对一切 }a_1,a_2,a_3\in A'.\] 另一方面，对 (2.42) 作伸缩有 \[d(a_1a_2\hat b\cdot A,\,b^{2}\hat b\cdot A)=O(1+\log K)\quad\text{对一切 }a_1,a_2,a_3\in A'.\] 应用 Ruzsa 三角不等式，于是 \[d(a_1a_2\hat a_3\cdot A,\,a_1'a_2'\hat a_3'\cdot A)=O(1+\log K)\quad\text{对一切 }a_1,a_2,a_3,a_1',a_2',a_3'\in A',\] 从而 \[\big|a_1a_2\hat a_3\cdot A-a_1'a_2'\hat a_3'\cdot A\big|=O(K^{O(1)})|A|.\] 因此 \[\sum_{x,y\in A'\cdot A'\cdot \hat A'}\big|x\cdot A-y\cdot A\big|=O(K^{O(1)})\,|A|\,|A'\cdot A'\cdot \hat A'|^{2},\] 其中 \(\hat A':=\{\hat a:a\in A'\}\)。但由于 \(|A\cdot A|\le K|A|\) 且 \(|A'|\ge\dfrac{|A|}{2K}-1\)，由和集估计的乘法版本（在由可消去交换幺半群 \(Z^{*}\) 生成的形式乘法群中工作）得 \(|A'\cdot A'\cdot \hat A'|=O(K^{O(1)}|A|)\)。于是 \[\sum_{x,y\in A'\cdot A'\cdot \hat A'}\big|x\cdot A-y\cdot A\big|\le O(K^{O(1)}|A'|^{3}).\] 把左边改写为 \[\sum_{z\in Z}\big|\{(x,y):\exists\,a,b\in A\ \text{使}\ z=xa-yb\}\big|.\] 记 \(\omega:=\prod_{a\in A'}a\)，并注意：每当 \(a_1,a_2,a_3,a_4\in A'\) 时，数 \(\omega(a_1a_2-a_3a_4)\) 至少有 \(|A'|^{2}\) 个形如 \(xa-yb\)（\(x,y\in A'\cdot A'\cdot\hat A'\)，\(a,b\in A'\)，且 \((x,y)\) 互异）的表示，这归功于恒等式 \[\omega(a_1a_2-a_3a_4)=(a_1a_2\hat a)\,a-(a_3a_4\hat b)\,b.\] （因为 \(\hat a\cdot a=\omega\)，故 \((a_1a_2\hat a)a=a_1a_2\omega\)，同理另一项。让 \((a,b)\) 跑遍 \(A'\times A'\)，便得 \(|A'|^2\) 个表示。）于是 \[\big|\omega\cdot(A'\cdot A'-A'\cdot A')\big|=O(K^{O(1)}|A'|),\] 而由于 \(\omega\in Z^{*}\)，结论得证。♦

把这段长证明的脉络抓住

制造重叠：所有伸缩 \(a\cdot A\) 都落在小集合 \(A\cdot A\) 里，元素总数 \(|A|^2\) 却挤在 \(\le K|A|\) 个位置上，由 Cauchy–Schwarz 必有大量两两交叠。
鸽笼挑出一个好的 \(b\)：存在某个 \(b\) 使得很多 \(a\cdot A\) 与 \(b\cdot A\) 交得很大；这些 \(a\) 组成好子集 \(A'\)。
翻译成 Ruzsa 距离：交得大 \(\Rightarrow\) 距离近。反复用三角不等式，把“所有 \(a\cdot A\) 彼此都近”逐步升级为“\(A'\) 的二次、三次乘积伸缩彼此都近”。
求逆 + 恒等式收尾：用 \(\hat a\) 模拟“除法”，再用恒等式把 \(A'\cdot A'-A'\cdot A'\) 的元素表示出来，配合乘法和集估计算出它很小。

对上述论证作一点修改，还能给出下面的命题，可视为推论 2.23 在和积框架下的变体；其证明留作习题 2.8.1。

引理 2.54[43] 设 \(Z\) 是交换环，\(A\subseteq Z^{*}\) 是有限非空集合，使得 \(|A\cdot A-A\cdot A|\le K|A|\)。则对一切 \(k\ge 1\) 有 \[|A^{k}-A^{k}|\le K^{O(k)}|A|,\] 其中 \(A^{k}=A\cdot\ldots\cdot A\) 是 \(A\) 的 \(k\) 重积集。

2.8.3　和积型 Freiman 定理

现在我们可以对域中那些加法倍增常数与乘法倍增常数都小的有限子集进行分类（至多相差多项式因子）：

定理 2.55（和积版 Freiman 定理）设 \(A\) 是域 \(F\) 的有限非空子集，\(K\ge 1\)。则下列命题在“至多相差常数”的意义下等价——即若第 \(j\) 条对某绝对常数 \(C_j\) 成立，则第 \(k\) 条也对某依赖于 \(C_j\) 的绝对常数 \(C_k\) 成立：

\(|A+A|\le C_1K^{C_1}|A|\) 且 \(|A\cdot A|\le C_1K^{C_1}|A|\)；
或者 \(|A|\le C_2K^{C_2}\)，或者存在 \(F\) 的子域 \(G\)、非零元 \(x\in F\) 以及 \(F\) 中的集合 \(X\)，使得 \(|G|\le C_2K^{C_2}|A|\)、\(|X|\le C_2K^{C_2}\)，且 \(A\subseteq x\cdot G\cup X\)。

这是对 [43]、[44] 中一个结果的略微加强。

定理在说什么（用大白话）“\(A\) 的加法和乘法都几乎封闭” \(\Longleftrightarrow\) “\(A\) 要么小得可忽略，要么几乎就是一个子域（被伸缩 \(x\) 后）外加少量杂质 \(X\)”。也就是：和积都小的集合，本质上只有“子域”这一种。这正是本节开头那张直觉图的精确化。

证明. 我们只证正向蕴含（(i)\(\Rightarrow\)(ii)），容易的反向蕴含留作习题 2.8.2。把 \(C_1K^{C_1}\) 重新记作 \(K\)，于是可设 \(|A+A|\le K|A|\) 且 \(|A\cdot A|\le K|A|\)。可设 \(|A|\ge C_0K^{C_0}\)（\(C_0\) 为某大绝对常数），否则结论平凡。也可毫无困难地把 \(0\) 从 \(A\) 中移除，于是可设 \(A\subseteq F^{*}\)。

应用引理 2.53 与引理 2.54，可找到 \(A\) 的子集 \(A'\)，满足 \(|A'|=\Omega(K^{-O(1)}|A|)\) 且对一切 \(k\ge 1\) 有 \(|(A')^{k}-(A')^{k}|=O(K)^{O(k)}|A'|\)。由推论 2.23 这蕴含 \[|n(A')^{k}-m(A')^{k}|\le O(K)^{O_{k,n,m}(1)}|A'|\quad\text{对一切 }n,k,m\ge 1.\tag{2.43}\] 必要时用一个非零因子对 \(A'\) 作伸缩，可设 \(1\in A'\)（注意定理的假设与结论在此类伸缩下不变）。现在可把 \(0\) 加回到 \(A\) 与 \(A'\) 中而不影响 (2.43)。

现在应用推论 2.52。令 \(D:=(A'-A')\setminus\{0\}\) 与 \(G:=Q[A']=(A'-A')/D\)。利用通分（最低公分母），观察到 \[A'+G\cdot G\cdot A'\subseteq\frac{A'\cdot D\cdot D-(A'-A')\cdot(A'-A')\cdot A'}{D^{2}}\subseteq\frac{4(A')^{3}-4(A')^{3}}{D^{2}}.\] 另一方面，由 (2.43) 有 \(|(4(A')^{3}-4(A')^{3})\cdot D^{2}|=O(K^{O(1)}|A'|)\)，故由推论 2.12 的乘法版本得 \[|A'+G\cdot G\cdot A'|=O(K^{O(1)}|A'|)<|A'|^{2}\] （只要 \(C_0\) 足够大）。类似的论证给出 \(|A'+(G+G)\cdot A'|=O(K^{O(1)}|A'|)<|A'|^{2}\)。应用推论 2.52，便知 \(G\) 实际上是一个域。

现取 \(A'\) 的一个非零元 \(x\)，以及 \(A'\) 的一个元素 \(y\)。则对一切 \(a\in A'\) 有 \((a-y)/x\in Q[A']=G\)，于是 \[A'\subseteq x\cdot G+y.\] 从而 \[x\cdot G+y=A'+x\cdot G\subseteq A'+A'\cdot Q[A'],\] 进而 \[(x\cdot G+y)^{2}\subseteq (A'+A'\cdot Q[A'])^{2}.\] 但与前面一样，用 (2.43) 与推论 2.12 的论证给出 \(|(A'+A'\cdot Q[A'])^{2}|=O(K^{O(1)}|A'|)\le O(K^{O(1)}|G|)\)。直接计算表明，除非 \(y\in x\cdot G\)，否则 \(|(x\cdot G+y)^{2}|\ge|G|^{2}\)。于是（若 \(C_0\) 足够大）可取 \(y\in x\cdot G\)。因为 \(A'\) 含 \(1\)，故得 \(A'\subseteq G\)。

由于 \(|A+A'|\le K|A|=O(K^{O(1)}|A'|)\)，可应用 Ruzsa 覆盖引理（引理 2.14），用 \(O(K^{O(1)})\) 个 \(A'-A'\) 的平移覆盖 \(A\)，从而用 \(O(K^{O(1)})\) 个 \(G\) 的平移覆盖 \(A\)。用此引理的乘法版本（必要时暂时把不可逆的 \(0\) 从 \(A\) 中移走）的类似论证，可用 \(O(K^{C})\) 个 \(G\) 的伸缩覆盖 \(A\)。另一方面，当 \(x\ne 1\) 时有 \(|(G\cdot x)\cap(G+y)|\le 1\)。于是 \(|A\setminus G|=O(K^{O(1)})\)，结论得证。♦

本定理蕴含：若 \(A\) 不与 \(F\) 的某个子域相交，则 \(A+A\) 与 \(A\cdot A\) 中至少有一个是大的：

推论 2.56（和积估计）[43],[44] 设 \(A\) 是域 \(F\) 的有限非空子集，并设 \(K\ge 1\) 使得：不存在 \(F\) 的基数 \(|G|\le K|A|\) 的有限子域 \(G\) 与 \(x\in F\) 满足 \(|A\setminus(x\cdot G)|\le K\)。则或者 \(|A|=O(K^{O(1)})\)，或者 \[|A+A|+|A\cdot A|=\Omega(K^{c}|A|)\] 对某绝对常数 \(c>0\) 成立。

注记 2.57在 \(F\) 没有有限子域这一特例下，我们于是得到 \[|A+A|+|A\cdot A|=\Omega(|A|^{1+\varepsilon})\] 对某绝对常数 \(\varepsilon>0\) 成立；当 \(F=\mathbb{R}\) 时此结果首先由 Erdős 与 Szemerédi [91] 得到。在实直线的框架下，[91] 中实际上猜想上述估计中的 \(\varepsilon\) 可取得任意接近 \(1\)。关于 \(\varepsilon\) 的最新数值，见定理 8.15。

2.8.4　F_p 上的和积估计与乘法子群

在素数阶域 \(F=F_p\) 这一特例中（它除 \(\{1\}\) 与 \(F_p\) 之外没有别的子域），我们得到：

推论 2.58（\(F_p\) 上的和积估计）[43],[44] 设 \(A\) 是 \(F_p\) 的非空子集，则 \[|A+A|+|A\cdot A|=\Omega\!\Big(\min\big(|A|,\,|F_p|/|A|\big)^{c}\,|A|\Big)\] 对某绝对常数 \(c>0\) 成立。

读懂 \(\min(|A|,\,p/|A|)\)

这一项体现“两头都不行”：

当 \(A\) 较小（\(|A|\le\sqrt p\)）时，\(\min=|A|\)，于是 \(|A+A|+|A\cdot A|\gtrsim|A|^{1+c}\)，与实数情形类似——增长由 \(A\) 自身大小驱动。
当 \(A\) 较大（\(|A|>\sqrt p\)）时，\(\min=p/|A|\)，因为整个域只有 \(p\) 个元素，集合再大也封顶；此时增长由“剩余空间” \(p/|A|\) 驱动。
两种情形在 \(|A|\approx\sqrt p\) 处交接，那里增长最强。

若 \(H\) 是 \(F_p\) 的任意非空子集，则对一切 \(k\ge 2\) 有 \[kH^{k}+kH^{k},\quad (kH^{k})\cdot(kH^{k})\ \subseteq\ k^{2}H^{k^{2}}\] （此处 \(kH^{k}\) 表示 \(k\) 重积集 \(H^{k}\) 的 \(k\) 重和集）。于是对 \(B:=kH^{k}\) 应用推论 2.58 得 \[|k^{2}H^{k^{2}}|=\Omega\!\Big(\min\big(|kH^{k}|,\,p/|kH^{k}|\big)^{c}\,|kH^{k}|\Big)\] 对某绝对常数 \(c>0\) 成立。我们可以迭代此估计（从 \(k=2\) 开始反复平方），从而建立：

推论 2.59设 \(H\) 是 \(F_p\) 的任意非空子集，\(A,\delta>0\)。则存在整数 \(k=k(A,\delta)\ge 1\) 使得 \[|kH^{k}|=\Omega_{A,\delta}\!\big(\min(|H|^{A},\,p^{1-\delta})\big).\]

我们把此推论的证明留作习题。利用第 4 章的引理 4.10，这里实际上可取 \(\delta=0\)，但我们此处不需要这一事实。在 \(H\) 是 \(F_p\) 的乘法子群这一特例中，有 \(H^{k}=H\)，于是推论 2.59 给出 \[|kH|=\Omega_{A,\delta}\!\big(\min(|H|^{A},\,p^{1-\delta})\big).\] 因此乘法子群具有相当迅速的加法扩张。事实证明，对近似群也能做类似的事情：

定理 2.60[40] 设 \(H\) 是 \(F_p\) 的非空子集，使得 \(|H^{2}|\le K|H|\)，又设 \(A,\delta>0\)。则存在整数 \(k=k(A,\delta)\ge 1\) 使得 \[|kH|=\Omega_{A,\delta}\!\Big(K^{-O_{A,\delta}(1)}\min(|H|^{A},\,p^{1-\delta})\Big).\]

此结果可由推论 2.59 与下面的命题推出；我们把精确的推导留作习题。

命题 2.61设 \(F\) 是任意域，\(H\subset F^{\times}\) 是可逆域元构成的有限非空子集，使得对某 \(K\ge 1\) 有 \(|H^{2}|\le K|H|\)。设 \(k\ge 1\) 与 \(L\ge 1\) 使得 \(kH\) 满足如下“加法不扩张”性质：对 \(H\) 的任意基数 \(|H'|\ge\dfrac{1}{2K}|H|\) 的子集 \(H'\) 都有 \(|2kH|\le L|kH'|\)。则存在 \(H\) 的一个基数 \(|H'|\ge\dfrac{1}{2K}|H|\) 的子集 \(H'\) 使得对一切 \(j\ge 1\) \[|j(H')^{j}|=O_{j}\!\Big((1+\log|H|)^{j^{2}}\,K^{O(j^{2})}\,L^{O(j^{2})}\,|kH|\Big).\]

证明. 由习题 2.3.24 的乘法版本，可找到 \(H'\subset H\)，满足 \(|H'|\ge\dfrac{1}{2K}|H|\)，以及 \(h_0\in H'\)，使得对一切 \(h\in H'\) 有 \(|(h\cdot H)\cap(h_0\cdot H)|\ge\dfrac{1}{2K}|H|\)。经伸缩可标准化 \(h_0=1\)。由加法不扩张性质得 \[|2kH|\le L\,|k((h\cdot H)\cap H)|\le L\,|A_h|\quad\text{对一切 }h\in H',\] 其中 \(A_h:=k(h\cdot H)\cap kH\)。由于 \[|kH+A_h|\le|2kH|;\qquad |k(h\cdot H)+A_h|\le|2k(h\cdot H)|=|2kH|,\] 我们得到 Ruzsa 距离估计 \(d(kH,-A_h),\ d(k(h\cdot H),-A_h)\le\log L\)，从而由三角不等式 \[d(kH,\,k(h\cdot H))\le 2\log L.\tag{2.44}\] 现在转而控制某个 \(j\) 的 \(j(H')^{j}\)。首先注意 \[|(H')^{2}|\le|H^{2}|\le K|H|\le 2K^{2}|H'|,\] 故由习题 2.3.10 的乘法类比有 \(|(H')^{2}\cdot(H')^{-1}|=O\!\big(K^{O(1)}|H'|\big)\)。然后可应用习题 1.1.8 的乘法版本，得到一个集合 \(X\subset(H')^{2}\cdot(H')^{-1}\)，其基数 \(|X|=O(K^{O(1)}(1+\log|H|))\)，使得 \((H')^{2}\subset X\cdot H'\)，从而 \((H')^{j}\subset X^{j-1}\cdot H'\)。于是由鸽笼原理可界定 \[|j(H')^{j}|\le|j(X^{j-1}H')|\le|X|^{j(j-1)}\,|x_1\cdot H'+\cdots+x_j\cdot H'|\] 对某 \(x_1,\dots,x_j\in X^{j-1}\) 成立；因此只需证明 \[|x_1\cdot H'+\cdots+x_j\cdot H'|=O_{j}\!\big(L^{O(j^{2})}|kH|\big).\] 由于 \(xH'\) 含于 \(k(xH')\) 的某个平移中，我们有较粗的估计 \[|x_1\cdot H'+\cdots+x_j\cdot H'|\le|jB|,\] 其中 \(B:=k(x_1\cdot H)\cup\cdots\cup k(x_j\cdot H)\)。但诸 \(x_i\) 都是 \(O(j)\) 个来自 \(H'\) 与 \((H')^{-1}\) 的元素之积。反复应用 (2.44) 与三角不等式，得 \[d(k(x_i\cdot H),\,k(x_{i'}\cdot H))\le O(j\log L)\quad\text{对一切 }1\le i,i'\le j,\] 从而 \(d(B,B)\le O(j\log L)+O(\log j)\)。由习题 2.3.10 得 \(|jB|=O_{j}(L^{O(j^{2})}|B|)\)，结论得证。♦

把推论 2.60 与非对称 Balog–Szemerédi–Gowers 定理结合，我们能证明 \(F_p\) 的乘法子群不可能具有高的加法能量：

推论 2.62设 \(H\) 是 \(F_p\) 的乘法子群，使得对某 \(0<\delta\le 1\) 有 \(|H|\ge p^{\delta}\)。则存在仅依赖于 \(\delta\) 的 \(\varepsilon=\varepsilon(\delta)>0\)，使得对一切满足 \(1\le|A|\le p^{1-\delta}\) 的 \(A\subseteq F_p\)，只要 \(p\)（依赖于 \(\delta\)）充分大，就有 \[E(A,H)\le p^{-\varepsilon}|A||H|^{2}.\]

证明. 设 \(\varepsilon'=\varepsilon'(\delta)>0\) 为待定的小数，\(\varepsilon=\varepsilon(\varepsilon',\delta)>0\) 为更小的待定数。反设存在集合 \(A\) 使得 \(E(A,H)\ge p^{-\varepsilon}|A||H|^{2}\)。应用推论 2.36（取 \(L:=p\)，并把其中的 \(\varepsilon\) 换成 \(\varepsilon'\)），可找到（若 \(\varepsilon\) 关于 \(\varepsilon'\) 充分小）\(H\) 的子集 \(H'\)，基数为 \[|H'|=\Omega_{\varepsilon'}\!\big(p^{-\varepsilon'/2}|H|\big),\] 使得对一切 \(k\) 有 \[|kH'|\le|A+kH'|=O_{\varepsilon',k}\!\big(p^{k\varepsilon'/2}|A|\big).\] 由于 \(H\) 是乘法子群，故 \(|H'\cdot H'|\le|H^{2}|=|H|=O_{\varepsilon'}(p^{\varepsilon'/2}|H'|)\)。又因 \(|H|\ge p^{\delta}\)，还可看出（若 \(\varepsilon'\) 关于 \(\delta\) 充分小）对某仅依赖于 \(\delta\) 的 \(A\) 有 \(|H'|^{A}\ge p^{1-\delta/2}\)。于是可应用推论 2.60（把其中的 \(\delta\) 换成 \(\delta/2\)），断定对某依赖于 \(\delta\) 的充分大的 \(k\) 有 \[|kH'|=\Omega_{\varepsilon',\delta}\!\big(p^{\,1-\delta/2-O_{\delta}(\varepsilon')}\big).\] 若 \(\varepsilon'\) 关于 \(\delta\) 充分小，且 \(p\) 充分大，这就给出矛盾。♦

我们将把它应用于乘法子群上的指数和；见定理 4.41。关于此估计的一个变体，见引理 9.44。

2.8.5　推广与公开问题

对于更一般的交换环，乃至（通过把这些论证与前一节的论证结合起来）非交换环，获得此类估计似乎是颇有意义的。在这个方向上，Bourgain 建立了：

定理 2.63[41] 设 \(p\) 是大素数，\(A\) 是交换环 \(F_p\times F_p\)（赋以乘积结构 \((a,b)\cdot(c,d)=(ac,bd)\)）的子集，使得 \(|A|\ge p^{\delta}\) 且对某 \(\delta,\varepsilon>0\) 有 \(|A+A|,|A\cdot A|\le p^{\varepsilon}|A|\)。则存在 \(F_p\times F_p\) 的一个集合 \(G\)，满足 \(|G|\le p^{O_{\delta}(\varepsilon)}|A|\) 且 \(|A\cap G|\ge p^{-O_{\delta}(\varepsilon)}|A|\)，其中 \(G\) 是下列对象之一：

整个空间 \(G=F_p\times F_p\)；
一条水平线 \(G=F_p\times\{a\}\)，对某 \(a\in F_p\)；
一条竖直线 \(G=\{a\}\times F_p\)，对某 \(a\in F_p\)；
一条直线 \(G=\{(x,ax):x\in F_p\}\)，对某 \(a\in F_p^{\times}\)。

定理 2.63 说：在 \(F_p\times F_p\) 中，和积都小的集合必有正比例的元素落在这四种几何对象之一上。注意斜线 \(\{(x,ax)\}\) 恰是“对角子环”，与定理 2.55 中“子域”的角色对应。

我们在习题中给出这一命题的证明梗概。这并不像定理 2.55 那样是对“具有小和积”的集合的完整刻画——特别是，它没有处理 \(A\) 非常小的情形——但已足以控制数论与密码学中若干重要的指数和。见 [41]、[40]。

当环境交换环是整数环 \(Z=\mathbb{Z}\) 时，获得好的和积估计这一问题吸引了大量兴趣。Erdős 与 Szemerédi [91] 在此情形下猜想：对一切 \(\varepsilon>0\)、一切 \(k\ge 2\) 以及一切加性集合 \(A\subset\mathbb{Z}\)，有 \[|kA|+|A^{k}|=\Omega_{k,\varepsilon}\!\big(|A|^{k-\varepsilon}\big).\tag{2.45}\] 即便是 \(k=2\) 的情形也尚未解决（并被认为极其困难）；这一 \(k=2\) 的情形目前已对所有 \(\varepsilon>\dfrac{8}{11}\) 得到验证，见定理 8.15。在通向 (2.45) 的另一方向上，Bourgain 与 Chang [42] 最近的一个结果表明：对每个 \(m>1\)，存在整数 \(k=k(m)\ge 1\) 使得 \[|kA|+|A^{k}|=\Omega_{m}\!\big(|A|^{m}\big)\tag{2.46}\] 对一切加性集合 \(A\subset\mathbb{Z}\) 成立。这最后一个结果颇为深刻，特别地，它用到了一个精巧的“按尺度归纳（induction on scales）”论证，并结合了若干定量的 Freiman 型定理。

习题

练习

2.8.1 [41] 修改引理 2.53 的证明以证明引理 2.54。（提示：首先多次运用三角不等式，对一切 \(x,y\in A^{k}\cdot\hat A\) 得到对 \(|x\cdot A-y\cdot A|\) 的控制。）
2.8.2 证明定理 2.55 中剩下的那个蕴含（即反向蕴含）。
2.8.3 由定理 2.55 推出推论 2.56 与推论 2.58。
2.8.4 [44],[43] 设 \(A,A',B\) 是域 \(F\) 的非空子集，且 \(0\notin B\)。用一阶矩方法证明：存在 \(\xi\in B\) 使得 \[E(A,\xi\cdot A')\le\frac{|A|^{2}|A'|^{2}}{|B|}+|A||A'|,\] 并由 (2.8) 推出 \[|A+\xi\cdot A'|\ge\frac{|A||A'||B|}{|A||A'|+|B|}.\]
2.8.5 [44] 设 \(A\) 是有限域 \(F\) 的子集且 \(|A|>|F|^{1/2}\)。证明 \[|(A-A)\cdot A+(A-A)\cdot A|\ge\sup_{x\in F}|A+x\cdot A|\ge\frac{|F|}{2},\] 并由此推出 \[F=(A-A)\cdot A+(A-A)\cdot A+(A-A)\cdot A+(A-A)\cdot A.\] （提示：第一个不等式易由推论 2.51 得到；第二个不等式用习题 2.8.4。）
2.8.6 （Croot，私人通讯）设 \(A\) 是有限域 \(F\) 的子集，使得对某整数 \(k\ge 2\) 有 \(|A|>|F|^{1/k}\)。证明 \(|Q[A]|\ge|F|^{1/(k-1)}\)；这显然推广了推论 2.51。（提示：利用映射 \((a_1,\dots,a_k)\mapsto x_1a_1+\cdots+x_ka_k\) 对任意 \(x_1,\dots,x_k\in F\) 都不是单射这一事实。）
2.8.7 [43] 设 \(A\) 是域 \(F\) 的子集，使得对某 \(\varepsilon>0\) 有 \(|A|\ge|F|^{\varepsilon}\)。证明存在仅依赖于 \(\varepsilon\) 的整数 \(k=k(\varepsilon)>1\)，使得 \(k(A^{k})-k(A^{k})=G\) 为 \(F\) 的某子域 \(G\)。（利用习题 2.8.5 或引理 4.10。）
2.8.8 [41] 设 \(F_p\) 是素数阶 \(p\) 的域，\(Z=F_p\times F_p\)。设 \(A\subseteq Z\)，使得对某 \(0<\delta<1\) 与 \(a,b\in F_p\) 有 \(|A\cap(\{a\}\times F_p)|\ge p^{\delta}\) 且 \(|A\cap(\{b\}\times F_p)|\ge p^{\delta}\)。证明对某 \(k=k(\delta)>0\) 有 \(k(A^{k})-k(A^{k})=Z\)。（提示：用习题 2.8.7。）
2.8.9 [41] 设 \(F_p,Z\) 如习题 2.8.8，\(\pi_1:Z\to F_p\)、\(\pi_2:Z\to F_p\) 为坐标投影。设 \(A\subseteq Z\) 使得对某 \(0<\delta<1\) 有 \(|\pi_1(A)|,|\pi_2(A)|\ge p^{\delta}\)，且 \(\pi_1,\pi_2\) 中至少有一个不是单射。证明对某 \(k=k(\delta)>0\) 有 \(k(A^{k})-k(A^{k})=Z\)。（提示：由习题 2.8.8，只需找到某个 \(k'\) 使 \(k'(A^{k'})-k'(A^{k'})\) 与某条水平线或竖直线有大的交。）
2.8.10 [41] 设 \(F_p,Z,\pi_1,\pi_2\) 如习题 2.8.8、2.8.9。设 \(A\subseteq Z\) 使得对某 \(0<\delta<1\) 有 \(|\pi_1(A)|,|\pi_2(A)|\ge p^{\delta}\)。证明：或者 \(A\) 含于某条直线 \(\{(x,ax):x\in F_p\}\)（对某 \(a\in F_p^{\times}\)），或者对某 \(k=k(\delta)>0\) 有 \(k(A^{k})-k(A^{k})=Z\)。（提示：由习题 2.8.7 可归约到 \(\pi_1(A)=\pi_2(A)=F_p\) 的情形；再依 \(\pi_1\) 或 \(\pi_2\) 在 \(2A-2A\) 上是否单射分情形讨论。）
2.8.11 [41] 用习题 2.8.10 及引理 2.53、2.54 推出定理 2.63。（在处理零因子 \(\{0\}\times F_p\cup F_p\times\{0\}\) 时需稍加小心。）
2.8.12 设 \(Z\) 是交换环，\(A_1,A_2,A_3,A_4\) 是 \(Z^{\times}\) 的子集，使得 \(|A_1|=|A_2|=|A_3|=|A_4|=N\) 且 \(|A_1\cdot A_2-A_3\cdot A_4|\le KN\)。证明对一切 \(j=1,2,3,4\) 有 \(|A_j\cdot A_j-A_j\cdot A_j|\le K^{O(1)}N\)。此引理使我们能把上面若干结果推广到“把单一集合 \(A\) 换成若干个基数相当的集合”的框架。
2.8.13 证明推论 2.59。
2.8.14 用推论 2.59 与命题 2.61 证明定理 2.60。（提示：取 \(k\) 等于 \(2\) 的一个大方幂，取 \(L\) 等于 \(|H|\) 的一个小方幂。若命题 2.61 的假设满足，则可用 \(|j(H')^{j}|\) 给 \(|kH|\) 下界，而后者可用推论 2.59 控制；若不满足，则可对 \(H\) 的某大子集 \(H'\) 用 \(L|kH'|\) 给 \(|2kH|\) 下界，此时把 \(k\) 换成 \(k/2\)、\(H\) 换成 \(H'\) 并重复论证。如此进行，最终或通过把命题 2.61 与推论 2.59 结合、或通过累积足够多的 \(L\) 的方幂，便得到 \(|kH|\) 或 \(|2kH|\) 的好下界。）
2.8.15 [40] 证明推论 2.62 的如下变体：对任意 \(\delta>0\) 存在 \(\varepsilon>0\)，使得每当 \(H,A\) 是 \(F_p\) 的子集且 \(|H|\ge p^{\delta}\)、\(|H\cdot H|\le p^{\varepsilon}|H|\)、\(1<|A|
2.8.16 [18] 设 \(A\) 是 \(F_p\) 中的加性集合，使得对某 \(\delta>0\) 有 \(|A|0\) 使得 \[\big|\{(a,b,c,d,e,f)\in A^{6}:ab+c=de+f\}\big|=O_{\varepsilon,\delta}(|A|^{5-\varepsilon}).\] （提示：把 Balog–Szemerédi–Gowers 定理的加法形式与乘法形式一并使用，并结合推论 2.58。）此估计在 [18] 中被用来证明：映射 \(X\mapsto X_1\cdot X_2+X_3\)（其中 \(X_1,X_2,X_3\) 是 \(X\) 的独立试验）对 \(F_p\) 中的随机变量的迭代在某种意义下收敛到均匀分布，这在随机数生成中有应用。

返回全书目录

2.8.1 商集 Q[A]

2.8.2 换成好子集：Katz–Tao 引理

2.8.3 和积型 Freiman 定理

2.8.4 Fp 上的和积估计与乘法子群

2.8.5 推广与公开问题

习题

2.8.1　商集 Q[A]

2.8.2　换成好子集：Katz–Tao 引理

2.8.3　和积型 Freiman 定理

2.8.4　F_p 上的和积估计与乘法子群

2.8.5　推广与公开问题