12.1 引言Introduction
本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本章较难,讲解会尽量把每一步的直觉和动机讲清楚。
和集比任意集合更有结构
贯穿本书的一个总主题是:和集 \(A+B\) 比任意的集合 \(A,B\) 更有结构;尤其是,迭代和集(iterated sum set)
\[lA=\{a_1+\dots+a_l:a_i\in A_i\}\]随着 \(l\) 变大应当变得越来越有结构。这种现象的一个例子是引理 4.13,它表明:若 \(A\) 的傅里叶偏差(Fourier bias)很小,则 \(lA\) 会很快铺满整个所在的群。(另见习题 4.3.12,那里给出了和集特殊结构的相关演示。)
- \(2A=A+A=\{0,1,2,3,4,6\}\)——已经几乎填满了 \([0,6]\),只缺一个 \(5\)。
- \(3A=\{0,1,2,3,\dots,9\}\) 去掉个别点后,越来越接近一整段连续区间。
- 继续加下去,\(lA\) 会变成一整段从某处到某处的连续整数(即步长为 \(1\) 的等差数列),只在两端有少量缺口。
只看密度时能找到的等差数列很短
再看另一个例子。设 \(A\) 是 \([1,n]\) 的一个子集(\(n\) 很大),并以 \(A\) 中所含最长等差数列的长度作为它“有多少结构”的度量。如果 \(A\) 除了“稠密”之外没有任何结构,譬如 \(|A|\ge 0.99n\),那么我们能说的就不多了。即便是 Gowers 给出的 Szemerédi 定理的强有力定量版本 \((11.23)\),也只能保证存在一条长度为 \(\Omega(\log\log\log\log\log n)\) 的等差数列。对于立方体(cube)情形稍好一些(也更简单):引理 10.49 保证 \(A\) 含有一个维数为 \(\Omega(\log\log n)\) 的真立方体,不过这离 \([1,n]\) 内立方体的最大可能维数 \(\Omega(\log n)\) 仍很远。
- 哪怕 \(n\) 是宇宙级别的天文数字,\(\log n\) 已经不大;再套四五层 \(\log\),结果几乎是个常数。
- 所以“只知道 \(A\) 很稠密”这个条件,几乎保证不了任何像样长度的等差数列——这正是 Szemerédi 定理虽然深刻、定量结论却很弱的写照。
- 本章的好消息是:一旦改去考察和集 \(lA\) 而不是 \(A\) 本身,能保证的等差数列长度会戏剧性地变长。
改看和集,情况显著改善
然而,一旦取和集,情况就明显改善了。首先,若 \(A\subset[1,n]\) 的基数至少为 \(0.99n\),则容易看出 \(A+A\) 或 \(A-A\) 含有一条长度为 \(0.98n\) 的等差数列。这当然是相当极端的情形;更一般地,若 \(A\subset[1,n]\) 满足 \(|A|\ge\delta n\),则 Bourgain 定理(定理 4.47)表明 \(A+A\) 与 \(A-A\) 含有长度至少为 \(\exp\!\big(c_\delta(\log^{1/3}n)\big)\) 的真等差数列。对于 \(3A\) 与 \(2A-A\),习题 4.7.1 表明这些集合事实上含有长度为 \(\Omega_\delta\!\big(n^{\Omega_\delta(1)}\big)\) 的真等差数列;而定理 4.43 表明这些集合含有秩为 \(O_\delta(1)\)、体积为 \(\Omega_\delta(n)\) 的真广义等差数列。对于 \(2A-2A\),Chang 定理(定理 4.42)给出类似结果,但对 \(\delta\) 的依赖更好。
- \(O(g)\):“至多是 \(g\) 量级”(有上界常数倍)。
- \(\Omega(g)\):“至少是 \(g\) 量级”(有下界常数倍)。
- \(\Theta(g)\):上下都被 \(g\) 量级夹住,即“恰好是 \(g\) 量级”。
- 下标如 \(\Omega_\delta,\,O_d\):表示其中隐藏的常数可以依赖于 \(\delta\)(或 \(d\))。
不过这些结果要求 \(A\) 在所在区间 \([1,n]\) 内相当稠密;即便是 Chang 定理,也要求 \(A\) 的密度达到 \(\Omega\!\big(\tfrac{\log\log n}{\log n}\big)\) 才有非平凡内容。若 \(A\) 比这更稀疏,人们仍可追问:当 \(l\) 变大时,像 \(lA\) 这样的和集会发生什么?可以相当容易地证明(见习题):对固定的 \(A\subset\mathbb{Z}\) 与很大的 \(l\),\(lA\) 本质上会凝聚成一条长的等差数列,外加边界处一些可忽略的项。对于其他的群,情况略有不同(同样见习题);注意,与 \(l\) 较小时的情况不同,当 \(l\) 变得很大时,Freiman 同态会少得多,因此对于不同构的所在群,无法刻画 \(l\to\infty\) 时 \(lA\) 的渐近行为。在这个方向上更深入的结果可参见 [260]、[261]。
把问题量化:函数 \(f(m,l,n)\)
现在我们提一个更定量的问题。设给定正整数 \(l,m,n\),满足 \(2\le m\le n\)(\(m=1\) 的情形太退化,不予考虑)。如果 \(A\) 是 \([1,n]\) 的任意一个基数 \(|A|=m\) 的子集,关于 \(lA\) 的结构我们能说些什么?更确切地说,在 \(lA\) 中能找到的最大等差数列(或广义等差数列)有多长?由前面的讨论,当 \(l\) 较大时我们预期能找到相当长的等差数列。例如,由 Lev 的工作 [226],有如下结果:
- “\(A\) 不包含于任何步长大于 \(1\) 的等差数列”:意思是 \(A\) 里的元素的最大公差结构就是 \(1\)。比如 \(A=\{2,4,6\}\) 全在步长 \(2\) 的数列里,就被排除;这种集合相加只会得到偶数,永远填不满一段连续整数。要求“步长为 \(1\)”才能指望和集铺成连续区间。
- “\(l\ge 2(n-1)/(|A|-2)\)”:\(A\) 越大(\(|A|\) 越大),需要的相加次数 \(l\) 越少。这与直觉一致——元素越多,缝隙越容易填满。
- 结论 \([m+1,m+n]\) 是一段长度为 \(n\) 的完整连续区间,这是最强意义上的“等差数列”(步长 \(1\))。
事实上还有更精确的陈述;见 [227]。Sárközy 较早的工作 [307] 建立了如下较弱的结果:
我们将在下文中把该定理作为更一般结果的特例来证明。
- 取 \(A=[1,m]=\{1,2,\dots,m\}\),则 \(|A|=m\)。
- 把 \(l\) 个 \(A\) 中的元素相加,最小是 \(1+1+\dots+1=l\),最大是 \(m+\dots+m=lm\),中间每个整数都取得到。所以 \[lA=[l,\,lm]=\{l,l+1,\dots,lm\}.\]
- 这是一段连续区间,长度恰为 \(lm-l+1\approx lm\)。它本身就是 \(lA\) 中最长的等差数列。
我们可以把上述定理换一种说法。对任意满足 \(2\le m\le n\) 的 \(l,m,n\),定义 \(f(m,l,n)\) 为最大的整数,使得对 \([1,n]\) 中每一个基数 \(|A|\ge m\) 的子集 \(A\),\(lA\) 都含有一条长度为 \(f(m,l,n)\) 的真等差数列。现在的问题就是:对各种 \(m,l,n\) 的取值,确定 \(f(m,l,n)\) 的大小。定理 12.2 断言:只要 \(lm\ge Cn\),就有 \(f(m,l,n)=\Omega(lm)\)。事实上在此情形下 \(f(m,l,n)=\Theta(lm)\),这可由考虑集合 \(A=[1,m]\) 看出。
当 \(m\) 较小时上界骤降
当 \(m\) 相对于 \(n/l\) 较大时,这就对问题给出了令人满意的回答。现在自然要问:阈值 \(n/l\) 是否是精确的?当 \(m\) 落到这个阈值以下时,\(f(m,l,n)\) 会怎样?结果表明,此时 \(f(m,l,n)\) 的上界会急剧下降:
- 取基数 \(b=2lm\)。集合 \(A=\{x_0+x_1\cdot b:\ x_0,x_1\in[1,m]\}\)。也就是把数对 \((x_0,x_1)\) 写成“个位 \(x_0\)、‘\(b\) 位’\(x_1\)”的 \(b\) 进制数。
- 因为 \(x_0,x_1\le m
- 把 \(l\) 个这样的数相加:每个坐标分别相加,落在 \([l,lm]\) 内。由于 \(lm仍然不发生进位,所以 \[lA=\{y_0+y_1\cdot b:\ y_0,y_1\in[l,lm]\},\] 对应一个 \([l,lm]\times[l,lm]\) 的二维网格。
- 这个映射保持加法关系(即 \(2\) 阶 Freiman 同态),所以 \(lA\) 中的等差数列与网格里的等差数列一一对应。而二维网格 \([l,lm]^2\) 里最长的等差数列就是一整行(或一整列),长度 \(lm-l+1\)。
由这条引理(以及一个平凡的观察:\(f(m,l,n)\) 关于 \(m\) 单调递增),我们看到存在常数 \(c_d\)(\(d=1,2,3,\dots\))使得:只要 \(m\le c_d\,\dfrac{n}{l^{\,d-1}}\),就有 \[f(m,l,n)=O\big(l\,m^{1/d}\big).\] 因此 \(f(m,l,n)\) 的上界在 \(m\) 接近各点 \(n/l,\ n/l^{2},\ n/l^{3},\dots\) 处呈现出阈值跳变的行为。颇为引人注目的是,这些阈值在相差常数的意义下是精确的:
注意定理 12.2 已经给出了本定理 \(d=1\) 的情形。把它与前面的讨论结合起来,我们看到:只要 \[C_d\,\frac{n}{l^{d}}\ \le\ m\ \le\ c_d\,\frac{n}{l^{\,d-1}},\] 就有 \(f(m,l,n)=\Theta_d\!\big(l\,m^{1/d}\big)\)。这就解决了在 \(m\) 远离各阈值 \(n/l,\,n/l^{2},\dots\) 且不太小的前提下,确定 \(f(m,l,n)\) 量级的问题。各阈值附近的精确行为仍不清楚,可能很难解决。
- \(m\ge n/l\) 时:\(f=\Theta(lm)\)(指数 \(1/d\) 中 \(d=1\))。
- \(n/l^2\le m\le n/l\) 时:\(f=\Theta(l\,m^{1/2})\)(\(d=2\))。
- \(n/l^3\le m\le n/l^2\) 时:\(f=\Theta(l\,m^{1/3})\)(\(d=3\))。
- ……每跨过一个阈值 \(n/l^{d}\),指数就从 \(1/d\) 退到 \(1/(d{+}1)\),保证的等差数列变短。
证明思路与后续推广
我们将在接下来的几节中证明定理 12.4(从而也证明定理 12.2)。一个关键观察是:在相差常数的意义下,只需考虑 \(l\) 为 \(2\) 的幂的情形,此时可以把 \(lA\) 视为倍增运算 \(A\to A+A\) 的迭代。这赋予问题一种“动力系统”的味道——我们要分析一个集合在倍增映射作用下的演化过程。随后我们讨论各种推广与变体,特别是限制和集 \[l^{*}A:=\{a_1+\dots+a_l:\ a_1,\dots,a_l\in A\ \text{两两不同}\}\] 以及有限和集 \[FS(A):=\bigcup_{l=0}^{\infty}l^{*}(A)=\Big\{\sum_{x\in B}x:\ B\subset A,\ 0\le|B|<\infty\Big\}.\]
- 普通和集 \(2A=A+A\) 允许重复用同一元素,如 \(1+1=2\);故 \(2A=\{2,3,4,5,6,8\}\)。
- 限制和集 \(2^{*}A\) 要求两个加数不同:\(1+2=3,\ 1+4=5,\ 2+4=6\),故 \(2^{*}A=\{3,5,6\}\)。
- 有限和集 \(FS(A)\) 把 \(A\) 的所有子集之和都收进来:\(\varnothing\to0\),单元素 \(\to1,2,4\),双元素 \(\to3,5,6\),三元素 \(\to7\)。故 \(FS(A)=\{0,1,2,3,4,5,6,7\}\)。
返回 全书目录