Tao–Vu · 加性组合学 · 第 8 章 关联几何

8.5 其他域上的和积问题The sum-product problem in other fields

本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。

本节目标前面几节里,“和积问题”是在实数 \(\mathbb{R}\) 上讨论的:一个实数有限集 \(A\),它的和集 \(A+A\) 与积集 \(A\cdot A\) 不可能同时都很小。本节要把这个现象搬到别的数系上去——主要是复数 \(\mathbb{C}\)。难点在于:实数的证明用到了 Szemerédi–Trotter 关联定理,而那条定理的实数证明依赖“交叉数”技巧,到了复数上不再适用。本节展示 Solymosi 的一个巧妙做法:用双重计数(同一个量从两个角度去数)绕开关联定理,直接得到复数版的和积估计,而且这套办法对四元数、矩阵等更多数系也奏效。

和积问题的一个自然推广,是考虑来自 \(\mathbb{R}\) 以外的域与环中的集合。其中一个例子(把 \(\mathbb{R}\) 换成素数 \(p\) 对应的 \(\mathbb{Z}_p\))已在前面某一章中讨论过。在本节中,我们考虑把 \(\mathbb{R}\) 换成复数的情形。

攻克这个问题的一条途径,是先证明一个复数版的 Szemerédi–Trotter 定理,然后照搬定理 8.14 与定理 8.15 的证明。虽然人们相信 Szemerédi–Trotter 定理的结论对复直线与复点也成立,但证明它并不容易,因为使用交叉数(crossing number)的那套技术不再适用(不过可参看 Tóth [368] 最近的一项宣告)。

在下文中,我们将展示:借助一个巧妙的双重计数论证,可以把 Elekes 的结果推广到复数。事实上,这个论证(归功于 Solymosi [325])对另外几个数域同样有效(见证明末尾的注记)。

先认清记号
定理 8.24 [325] 对任意有限非空的复数集合 \(A,B,Q\),有 \[\tag{8.6}|A+B|\cdot|A\cdot Q|=\Omega\!\left(|A|^{3/2}\,|B|^{1/2}\,|Q|^{1/2}\right).\]

令 \(Q=B=A\),立即得到 \[|A+A|\cdot|A\cdot A|=\Omega\!\left(|A|^{5/2}\right),\] 以及(由“两个正数之和不小于它们几何平均的两倍”这一基本不等式) \[|A+A|+|A\cdot A|=\Omega\!\left(|A|^{5/4}\right),\] 因此本定理推广了定理 8.14。

例:两条推论是怎么来的 设 \(X=|A+A|\),\(Y=|A\cdot A|\)。把 \(Q=B=A\) 代入 \((8.6)\):右边的 \(|A|^{3/2}|A|^{1/2}|A|^{1/2}=|A|^{5/2}\),于是 \[XY=\Omega\!\left(|A|^{5/2}\right).\] 再用算术–几何平均不等式 \(X+Y\ge 2\sqrt{XY}\): \[X+Y\ge 2\sqrt{XY}=\Omega\!\left(\sqrt{|A|^{5/2}}\right)=\Omega\!\left(|A|^{5/4}\right).\] 这正是“和集与积集不能同时小”的复数版定量陈述:若 \(|A+A|\) 和 \(|A\cdot A|\) 都接近最小值 \(|A|\),乘积就只有 \(|A|^2\) 量级,与 \(|A|^{5/2}\) 矛盾。

证明的核心想法

这套证明在干什么 我们要去数一种叫“好四元组”\((a,a',b,q)\) 的对象的总数 \(N\),然后从两个方向估计 \(N\): 同一个 \(N\) 被夹在中间,两头一比,就逼出 \((8.6)\)。这就是“双重计数”。
证明. 我们可以假设 \(|A|\ge 2\) 且 \(0\notin Q\)(否则结论平凡或可平移化归)。由初等代数可知,映射 \[(a,a',b,q)\;\longmapsto\;(a+b,\;a'+b,\;a q,\;a' q)\] 是从 \(A\times A\times B\times Q\) 到 \((A+B)\times(A+B)\times(A\cdot Q)\times(A\cdot Q)\) 的单射(一对一),只要我们排除对角线 \(a=a'\) 的情形。

仅凭这一观察,只能得到平凡的下界 \(|A+B|\cdot|A\cdot Q|=\Omega\!\left(|A|\,|B|^{1/2}\,|Q|^{1/2}\right)\)。但我们可以做得更好,办法是利用一个直观的观察:若 \(a'\) 离 \(a\) 很近,则 \(a'+b\) 也离 \(a+b\) 很近,且 \(a q\) 离 \(a' q\) 很近。

为什么那个映射是单射 给定像 \((s_1,s_2,p_1,p_2)=(a+b,\,a'+b,\,aq,\,a'q)\),能不能把 \(a,a',b,q\) 反解出来?
  1. \(s_1-s_2=(a+b)-(a'+b)=a-a'\)。
  2. \(p_1-p_2=aq-a'q=(a-a')q\)。
  3. 因为排除了对角线,\(a-a'\neq 0\),于是 \(q=\dfrac{p_1-p_2}{s_1-s_2}\) 被唯一确定。
  4. 有了 \(q\),由 \(a=p_1/q\) 定出 \(a\),再由 \(b=s_1-a\) 定出 \(b\),最后 \(a'=s_2-b\)。
所以四元组被它的像唯一决定——这正是上界论证要反复用到的“可逆性”。
平凡下界为什么是 \(\Omega(|A||B|^{1/2}|Q|^{1/2})\) 单射意味着定义域的大小 \(\le\) 值域里被用到的部分的大小,即 \[|A|(|A|-1)\,|B|\,|Q|\;\le\;|A+B|^2\cdot|A\cdot Q|^2.\] 两边开平方,\(\;|A+B|\cdot|A\cdot Q|\ge\sqrt{|A|(|A|-1)|B||Q|}=\Omega(|A||B|^{1/2}|Q|^{1/2})\)。 这个下界的指数是 \(|A|^1\),而我们想要的是更强的 \(|A|^{3/2}\)。差距正是靠“最近邻很近”这条额外信息补上的。

最近邻与“好四元组”

更确切地说,对每个 \(a\in A\),定义它的最近邻 \(a'\) 为 \(A\setminus\{a\}\) 中使距离 \(|a-a'|\) 最小的元素。(若最近邻的候选不止一个,任取其一。)我们把 \((a,a')\) 称为一个相邻对(neighboring pair),于是一共有 \(|A|\) 个相邻对。注意提醒:若 \((a,a')\) 是相邻对,\((a',a)\) 未必也是相邻对。

a a′ 每个点 a 都画一支箭头指向它的最近邻 a′;箭头未必互相对应
复数就是复平面上的点。每个 \(a\) 有一个离它最近的 \(a'\),构成相邻对 \((a,a')\)。共 \(|A|\) 个相邻对。

称四元组 \((a,a',b,q)\) 为好的(good),如果 \((a,a')\) 是相邻对、\(b\in B\)、\(q\in Q\),并且满足以下两条邻近性条件: \[\tag{8.7}\bigl|\{u\in A+B:\ |a+b-u|\le|a-a'|\}\bigr|\ \le\ \frac{28\,|A+B|}{|A|},\] 以及 \[\tag{8.8}\bigl|\{v\in A\cdot Q:\ |aq-v|\le|aq-a'q|\}\bigr|\ \le\ \frac{28\,|A\cdot Q|}{|A|}.\] 不正式地说,\((8.7)\) 与 \((8.8)\) 断言:\(a'+b\) 是 \(a+b\) 在 \(A+B\) 中一个相当近的邻居,类似地 \(a'q\) 是 \(aq\) 在 \(A\cdot Q\) 中一个相当近的邻居。我们将对 \(N\)(好四元组的个数)施加双重计数论证。

条件 (8.7) 在说什么 固定 \(a,a',b\)。在和集 \(A+B\) 里,以点 \(a+b\) 为中心、以 \(|a-a'|\) 为半径画一个小圆盘。\((8.7)\) 说:落在这个小圆盘里的 \(A+B\) 元素不超过 \(\dfrac{28|A+B|}{|A|}\) 个——即 \(a+b\) 附近不太拥挤。注意半径 \(|a-a'|\) 很小(因为 \(a'\) 是 \(a\) 的最近邻),所以这是“\(a'+b\) 距 \(a+b\) 只隔着很少几个 \(A+B\) 点”的精确说法。\((8.8)\) 对积集 \(A\cdot Q\) 是同样的意思。

第一步:下界(好四元组很多)

先建立下界。对每个 \(a\in A\),令 \[D_a:=\{z\in\mathbb{C}:\ |z-a|\le|a'-a|\}\] 为以 \(a\) 为圆心、\(|a'-a|\) 为半径的圆盘。一个简单的几何论证(留作习题 8.5.1)表明:任何一个复数 \(z\) 至多被这些圆盘中的七个所包含。特别地,对任意 \(b\in B\) 有 \[\sum_{a\in A}\bigl|\{u\in A+B:\ |a+b-u|\le|a-a'|\}\bigr|=\sum_{z\in A+B-b}\bigl|\{a\in A:\ z\in D_a\}\bigr|\le 7\,|A+B|,\] 类似地,对任意 \(q\in Q\) 有 \[\sum_{a\in A}\bigl|\{v\in A\cdot Q:\ |aq-v|\le|aq-a'q|\}\bigr|=\sum_{z\in A\cdot Q/q}\bigl|\{a\in A:\ z\in D_a\}\bigr|\le 7\,|A\cdot Q|.\]

这两步求和怎么换序的 看第一条等式。把内层那个计数 \(\{u\in A+B:|a+b-u|\le|a-a'|\}\) 里的 \(u\) 换成 \(z:=u-b\),则 \(z\in A+B-b\),而条件 \[|a+b-u|=|a-(u-b)|=|a-z|\le|a-a'|=|a'-a|\] 恰好就是 \(z\in D_a\)。于是 \[\sum_{a\in A}\#\{u:\dots\}=\sum_{a\in A}\#\{z\in A+B-b:z\in D_a\}=\sum_{z\in A+B-b}\#\{a\in A:z\in D_a\}.\] 最后一个等号只是把“先对 \(a\) 后对 \(z\)”改成“先对 \(z\) 后对 \(a\)”地数同一批 \((a,z)\) 配对。由“每个 \(z\) 至多在 7 个 \(D_a\) 里”,内层 \(\le 7\),而 \(z\) 的取值不超过 \(|A+B|\) 种,故总和 \(\le 7|A+B|\)。第二条等式把 \(v\) 换成 \(z:=v/q\)、用 \(|aq-v|=|q|\,|a-z|\) 同理可得。
z 围着 z 的圆心 a 两两相隔角度 ≥ 60°,故至多 6 个再加 z 自身落在某盘上 → 至多 7 个
习题 8.5.1 的几何事实:若 \(z\) 同时落在 \(D_a\) 与 \(D_{a'}\) 中(\(a,a',z\) 互不相同),则 \(a,a'\) 关于 \(z\) 张成的夹角至少 \(60^\circ\)。绕一圈 \(360^\circ\) 最多塞下 \(6\) 个这样的圆心,故任一点至多被 \(7\) 个圆盘覆盖。

因此,若固定 \(b\) 与 \(q\),并在 \(A\) 中均匀随机地选取 \(a\),则对 Markov 不等式的一次简单应用表明:\((a,a',b,q)\) 是好的概率至少为 \(1/2\)。这说明 \[\tag{8.9}N\ \ge\ |B|\,|Q|\,\frac{|A|}{2}.\]

Markov 不等式怎么给出概率 ≥ 1/2 固定 \(b,q\),在 \(A\) 里随机取 \(a\)(每个概率 \(1/|A|\))。
  1. 记随机变量 \(X=\bigl|\{u\in A+B:|a+b-u|\le|a-a'|\}\bigr|\)。它的平均值就是上面那条和式除以 \(|A|\): \[\mathbb{E}[X]=\frac{1}{|A|}\sum_{a\in A}X\le\frac{7|A+B|}{|A|}.\]
  2. Markov 不等式:对非负 \(X\),\(\Pr\bigl(X\ge 4\,\mathbb{E}[X]\bigr)\le\tfrac14\)。取阈值 \(\dfrac{28|A+B|}{|A|}=4\cdot\dfrac{7|A+B|}{|A|}\ge 4\,\mathbb{E}[X]\),故条件 \((8.7)\) 失败的概率 \(\le\tfrac14\)。
  3. 同理条件 \((8.8)\) 失败的概率 \(\le\tfrac14\)。
  4. 两者至少一个失败的概率 \(\le\tfrac14+\tfrac14=\tfrac12\),于是两条同时成立(即四元组是好的)的概率 \(\ge\tfrac12\)。
  5. 对固定 \(b,q\),好的 \(a\) 至少有 \(\tfrac12|A|\) 个;再对所有 \(b\in B,\,q\in Q\) 求和,便得 \(N\ge|B||Q|\cdot\tfrac{|A|}{2}\)。

第二步:上界(好四元组不会太多)

现在建立上界。回忆前面所述:四元组 \((a,a',b,q)\) 被四元组 \((a+b,\,a'+b,\,aq,\,a'q)\) 唯一决定。其中 \(a+b\) 有 \(|A+B|\) 种选择,\(aq\) 有 \(|A\cdot Q|\) 种选择。对固定的 \(a+b\),由 \((8.7)\) 可知,\(A+B\) 中比 \(a'+b\) 更靠近、或与之等距于 \(a+b\) 的元素至多有 \(\dfrac{28|A+B|}{|A|}\) 个,因而 \(a'+b\) 的取值至多有 \(\dfrac{28|A+B|}{|A|}\) 种。类似地,\(a'q\) 的取值至多有 \(\dfrac{28|A\cdot Q|}{|A|}\) 种。这给出上界 \[\tag{8.10}N\ \le\ |A+B|\cdot\frac{28|A+B|}{|A|}\cdot|A\cdot Q|\cdot\frac{28|A\cdot Q|}{|A|}.\] 把它与下界结合,即得所要的结论。

把两头合起来,凑出指数 3/2 下界 \((8.9)\) 与上界 \((8.10)\) 夹住同一个 \(N\): \[|B||Q|\frac{|A|}{2}\ \le\ N\ \le\ 28^2\,\frac{|A+B|^2\,|A\cdot Q|^2}{|A|^2}.\] 两端整理(\(28^2=784\)): \[|A+B|^2\,|A\cdot Q|^2\ \ge\ \frac{|A|^3\,|B|\,|Q|}{1568}.\] 开平方: \[|A+B|\cdot|A\cdot Q|\ \ge\ \frac{1}{\sqrt{1568}}\,|A|^{3/2}\,|B|^{1/2}\,|Q|^{1/2}=\Omega\!\left(|A|^{3/2}|B|^{1/2}|Q|^{1/2}\right).\] 注意指数从平凡下界的 \(|A|^1\) 升到了 \(|A|^{3/2}\),多出来的半个幂正是“最近邻很近 ⇒ 像也很近 ⇒ \(a'+b,a'q\) 的可能取值很少”这条信息贡献的。
为什么要数“好四元组”而不是全部四元组 若直接数全部四元组(不要求好),上界就只能用“\(a'+b\) 有 \(|A+B|\) 种、\(a'q\) 有 \(|A\cdot Q|\) 种”,得到 \(N\le|A+B|^2|A\cdot Q|^2\),配上平凡下界 \(N\ge|A|(|A|-1)|B||Q|\),只能回到弱的 \(|A|^1\) 估计。“好”的限制把 \(a'+b\) 的种数从 \(|A+B|\) 砍到 \(\tfrac{28|A+B|}{|A|}\)(相当于除以 \(|A|\)),正是这次“砍价”让上界更小、从而逼出更强的下界。下界一侧则用几何(7 个圆盘)保证“好”的四元组依然占了一半,没被砍太狠。
注记 8.25 类似的论证对四元数以及其他超复数同样有效。一般地,设 \(T\) 与 \(Q\) 是一组相似变换(similarity transformations),\(A\) 是空间中的一组点,使得:从任一四元组 \(\bigl(t(p_1),\,t(p_2),\,q(p_1),\,q(p_2)\bigr)\) 都能唯一确定出 \(t\in T\)、\(q\in Q\) 与 \(p_1\neq p_2\in A\),则 \[c\,|A|^{3/2}\,|T|^{1/2}\,|Q|^{1/2}\ \le\ |T(A)|\cdot|Q(A)|,\] 其中常数 \(c\) 只依赖于空间的维数。
注记 8.25 与定理 8.24 的对应 在复数情形里:把“加上 \(b\)”看成平移变换 \(t\)(属于 \(T\),对应集合 \(B\)),把“乘以 \(q\)”看成放缩–旋转变换 \(q\)(属于 \(Q\))——它们都是复平面的相似变换。点集就是 \(A\)。于是 \(T(A)=A+B\)、\(Q(A)=A\cdot Q\),上面的抽象不等式正好退化为定理 8.24。把“相似变换”换成更高维空间里的相似变换,同一证明框架(最近邻 + 圆盘覆盖 + 双重计数)就给出四元数等数系的结果,只是“一点至多被几个球覆盖”的那个常数随维数变化,故 \(c\) 依赖维数。

矩阵上的和积问题

作为本节的结尾,让我们描述 Chang 最近的一项结果,她研究了矩阵的和积问题 [51]。

定理 8.26 存在一个随 \(n\to\infty\) 而趋于无穷的函数 \(\psi(n)\),使得下述成立。设 \(d\) 为固定整数,\(A\) 为一个由 \(d\times d\) 实矩阵组成的有限集合,且对 \(A\) 中任意两个不同元素 \(M\) 与 \(M'\),都有 \(\det(M-M')\neq 0\)。则 \[|A+A|+|A\cdot A|\ \ge\ \psi(|A|)\,|A|.\]
定理 8.27 对每个 \(d\),存在正常数 \(\delta=\delta(d)\),使得下述成立。设 \(A\) 为一个由 \(d\times d\) 实对称矩阵组成的有限集合。则 \[|A+A|+|A\cdot A|\ \ge\ |A|^{1+\delta}.\]

这两条定理的证明比这里给出的更为复杂,细节请读者参看 [51]。

两条矩阵定理在说什么、有何不同 可见“结构假设越强(对称),能证出的下界越好(指数严格大于 1)”。
A(d×d 矩阵集) M, M′, … A+A:所有 M+M′ (逐项相加) A·A:所有 M M′ (矩阵相乘)
矩阵版和积问题:由同一个矩阵集 \(A\) 生成的和集 \(A+A\) 与积集 \(A\cdot A\),两者大小之和有下界。定理 8.26、8.27 给出不同假设下的不同下界。

习题

习题 8.5.1 沿用定理 8.24 证明中的记号,证明:每个复数至多被七个圆盘 \(D_a\) 所包含。(提示:证明若 \(z\) 同时含于 \(D_a\) 与 \(D_{a'}\) 中,且 \(a,a',z\) 互不相同,则 \(a,a'\) 关于 \(z\) 张成的夹角至少为 \(60^\circ\)。)
习题 8.5.1 的思路
  1. 设 \(z\in D_a\cap D_{a'}\),即 \(|z-a|\le|a-(a\text{ 的最近邻})|\) 且 \(|z-a'|\le|a'-(a'\text{ 的最近邻})|\)。由“最近邻是最近的”这一定义,可推出 \(|a-a'|\ge|z-a|\) 且 \(|a-a'|\ge|z-a'|\)(因为 \(a'\) 不比 \(a\) 自己的最近邻更近、反之亦然)。
  2. 于是在三角形 \(z\,a\,a'\) 中,边 \(aa'\) 是最长边。最长边所对的角(即 \(z\) 处的角 \(\angle a z a'\))是最大角,故 \(\angle aza'\ge 60^\circ\)(三角形内角和 \(180^\circ\),最大角不小于平均的 \(60^\circ\))。
  3. 把所有“含 \(z\) 的圆盘”对应的圆心 \(a\) 画在 \(z\) 周围:它们两两关于 \(z\) 的夹角都 \(\ge 60^\circ\)。绕 \(z\) 一圈总共 \(360^\circ\),最多容纳 \(\lfloor 360^\circ/60^\circ\rfloor=6\) 个互成 \(\ge60^\circ\) 的方向。再算上可能恰好有某个圆心 \(a=z\)(此时 \(z\in D_a\) 自动成立)的退化情形,总数至多 \(7\)。
这正是下界论证里“一点至多被 7 个圆盘覆盖”所依据的几何事实。

返回 全书目录