Tao–Vu · 加性组合学 · 第 5 章 逆和集定理

5.2 向量空间中的和集Sum sets in vector spaces

本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本节是全书较难的一节,讲解会把每一步的直觉与动机讲清楚。

本节目标我们已经知道(引理 5.3):对整数集合,和集 \(A+B\) 最小可以小到 \(|A|+|B|-1\)。本节要问的是:如果 \(A+B\) 是“高维的”——它撑不进一个低维的平面里——那么 \(A+B\) 还能这么小吗? 答案是不能。维数(这里精确化为秩 rank)越高,和集就被迫越大。我们将利用整数群里没有、但实向量空间里有的工具——凸性(凸包、极点、超平面分割)——把这个“维数迫使和集变大”的现象量化成一串不等式。

我们现在研究在一个实有限维向量空间 \(V\) 中,和集的最小可能大小。这里要用到诸如凸性之类、在其他群里不易获得的概念。当然,由于 \(V\) 含有一份 \(\mathbb{Z}\) 的拷贝(即一条等差数列方向),由引理 5.3 我们知道 \(|A+B|\) 可以小到 \(|A|+|B|-1\)。然而,如果已知 \(A+B\) 是高维的——换句话说,它不被包含在某个低维的仿射向量空间(一个线性子空间的平移)里——那么我们可以做得比这更好。

我们从 \(A=B\) 的情形开始,它要稍微容易一些。定义 \(V\) 的一个子集 \(A\) 的 \(\operatorname{rank}(A)\) 为使得 \(A\) 被包含在某个 \(d\) 维仿射空间里的最小的 \(d\)。

秩 = 1:全在一条直线上 秩 = 2:撑开一个平面,进不了任何直线
秩 \(=d\) 表示“这堆点最少需要一个 \(d\) 维平面才装得下”。秩越大,点越“铺得开”。注意:仿射空间允许平移,所以判断秩时不必管原点在哪。
引理 5.13(Freiman 引理)设 \(A\) 是有限维向量空间 \(V\) 中的一个加性集合,并设 \(\operatorname{rank}(A)\ge d\)(对某个 \(d\ge 1\))。则 \[\tag{5.11'}|A+A|\ge (d+1)\,|A|-\frac{d(d+1)}{2}.\]
先理解结论 当 \(d=1\) 时不等式给出 \(|A+A|\ge 2|A|-1\),这正是一维(直线上)等差数列的经典下界。当 \(d=2\) 时给出 \(|A+A|\ge 3|A|-3\):一个真正“铺开成平面”的点集,其和集至少是 \(3\) 倍规模(减一个小常数)。维数每升高一档,系数 \(d+1\) 就涨一格——这就是“高维迫使和集变大”的精确版本。
证明. 我们对 \(d\) 作归纳。若 \(d=1\),结论由定理 5.5 给出(一维 Freiman 型不等式)。故设 \(d\ge 2\) 且结论对 \(d-1\) 已成立。现在固定 \(d\),再对 \(|A|\) 作归纳。当 \(|A|=1\) 时结论平凡成立(空洞地真),故设 \(|A|\ge 2\) 且结论对更小的集合 \(A\) 已成立。

取 \(a\in A\) 为 \(A\) 的任意一个极点;即 \(a\) 是 \(A\) 的凸包上的一个顶点。令 \(A':=A\setminus\{a\}\)。我们分两种情形。

情形一:\(\operatorname{rank}(A')\ge d\)。 则由(对 \(|A|\) 的)归纳假设, \[|A'+A'|\ge (d+1)|A'|-\frac{d(d+1)}{2}.\] 由于 \(a\) 落在 \(A'\) 的凸包之外且 \(\operatorname{rank}(A')\ge d\),必定存在(用贪心算法)\(A'\) 的至少 \(d\) 个极点 \(x_1,\dots,x_d\),它们从 \(a\) “可见”,意思是连接 \(a\) 到 \(x_1,\dots,x_d\) 的线段都落在 \(A'\) 的凸包之外。特别地,我们看到 \(d+1\) 个点 \[a,\ \frac{a+x_1}{2},\ \dots,\ \frac{a+x_d}{2}\] 落在 \(A'\) 的凸包之外,从而尤其落在 \(\tfrac12\cdot(A'+A')\) 之外。把它放大 \(2\) 倍,便看到 \(a+a,\ a+x_1,\ \dots,\ a+x_d\) 都与 \(A'+A'\) 不相交。于是 \[|A+A|\ge (d+1)+|A'+A'|\ge (d+1)|A|-\frac{d(d+1)}{2},\] 从而闭合了归纳。

情形二:\(\operatorname{rank}(A')< d\)。 则 \(A'\) 被包含在一个 \(d-1\) 维仿射空间 \(W\) 中。因为 \(\operatorname{rank}(A)\ge d\),所以 \(a\notin W\)。这意味着 \(2a\)、\(a+W\)、\(2W\) 两两不相交;从而 \(a+a\)、\(a+A'\)、\(A'+A'\) 两两不相交;于是 \[|A+A|\ge 1+(|A|-1)+|A'+A'|.\] 但因为 \(\operatorname{rank}(A)\ge d\),我们有 \(\operatorname{rank}(A')=\operatorname{rank}(A\setminus\{a\})\ge d-1\),故由(对 \(d\) 的)归纳, \[|A'+A'|\ge d|A'|-\frac{d(d-1)}{2}=d|A|-\frac{d(d+1)}{2},\] 结论再次由归纳得出。

把情形一画出来(\(d=2\))
A′ 的凸包 a(新极点) x₁ x₂ (a+x₁)/2 (a+x₂)/2
\(d=2\):从 \(A'\) 之外的极点 \(a\) 出发,能“看见”至少 \(2\) 个 \(A'\) 的极点 \(x_1,x_2\)。于是 \(a,\ \tfrac{a+x_1}{2},\ \tfrac{a+x_2}{2}\) 共 \(3=d+1\) 个点都在 \(\tfrac12(A'+A')\) 之外,放大两倍就得到 \(A+A\) 比 \(A'+A'\) 至少多出 \(d+1\) 个新和。
归纳的直觉:每次从 \(A\) 里拿掉一个极点 \(a\),集合规模少 \(1\),但和集至少少 \(d+1\)(情形一)——所以反过来加回这个极点,和集每次至少多 \(d+1\) 个,累积起来系数就是 \(d+1\)。
  1. 外层归纳变量是秩 \(d\):\(d=1\) 是已知的(定理 5.5)。
  2. 内层归纳变量是集合大小 \(|A|\):每次剥掉一个极点 \(a\)。
  3. 剥掉后若秩不掉(情形一),用凸性找到 \(d+1\) 个新和;若秩掉了一档(情形二),\(a\) 跳出了 \(A'\) 所在的低维平面,照样腾出一整层新和。
  4. 两种情形都恰好补足系数 \(d+1\),归纳闭合。

两个集合 \(A,B\) 的情形

现在我们考虑 \(V\) 中两个集合 \(A,B\) 之和的问题。为把问题说精确,暂时对任意 \(n\ge 1\)、\(t\ge 0\)、\(d\ge 0\),定义量 \(S(d,n,t)\) 为 \(|A+B|\) 的最小可能值,其中 \(A,B\) 取遍有限维向量空间 \(V\) 中的所有加性集合,满足 \(|A|\ge n\)、\(|B|\ge n-t\)、\(\operatorname{rank}(A+B)\ge d\)。由于 \(|A+B|\ge |A|\),我们有平凡界 \[\tag{5.12}S(d,n,t)\ge n.\] 然而这个界一般并不精确,我们随后会改进它。我们首先需要一条引理,用以分析 \(A+B\) 在 \(A\) 与 \(B\) 的极点附近的行为,类似于引理 5.13 的证明中所用的那种。

读懂记号 \(S(d,n,t)\) 把 \(n\) 想成 \(|A|\) 的下界、\(n-t\) 想成 \(|B|\) 的下界,所以 \(t=|A|-|B|\) 量度“两集合大小相差多少”。\(d\) 是和集被迫具有的秩。\(S(d,n,t)\) 就是:在“\(A\) 不小于 \(n\)、\(B\) 不小于 \(n-t\)、和集至少 \(d\) 维”这三条约束下,和集大小再怎么省也省不过的那个值。下面要建立 \(S\) 的递推,再解出闭形式。
引理 5.14设 \(A,B\) 是有限维向量空间 \(V\) 中的加性集合,使得 \(A\) 与 \(B\) 都含有 \(0\),并设 \(0\) 是 \(A\cup B\) 的凸包上的一个顶点。令 \(A':=A\setminus\{0\}\)、\(B':=B\setminus\{0\}\),以及 \(C:=(A'\cup B')\setminus(A'+B')\)。则 \(A+B\) 落在由 \(C\) 张成的 \(V\) 的子空间中。
证明. 不失一般性可取 \(V=\mathbb{R}^n\)。由 Hahn–Banach 定理,存在线性泛函 \(\varphi:V\to\mathbb{R}\) 使得对所有 \(x\in(A\cup B)\setminus 0\) 都有 \(\varphi(x)>0\)(这是因为 \(0\) 是凸包顶点,可用一张支撑超平面把 \(0\) 之外的点全推到正侧)。我们要证明 \(A+B\) 的每个元素 \(x\) 都落在 \(C\) 的张成中。对 \(\varphi(x)\) 的取值(在 \(\varphi\) 于 \(A\cup B\) 上取到的有限个值中,按从小到大的次序)作归纳。若 \(\varphi(x)=0\),则 \(x=0\),无需证明。现设 \(\varphi(x)>0\) 且结论对更小的 \(\varphi(x)\) 值已成立。

若 \(x\in A'+B'\),则可写 \(x=a+b\),其中 \(a\in A'\)、\(b\in B'\)。但由于 \(\varphi(x)=\varphi(a)+\varphi(b)\) 且 \(\varphi(a),\varphi(b)>0\),我们看到 \(\varphi(a),\varphi(b)\) 都严格小于 \(\varphi(x)\),结论由归纳得出(\(a,b\) 各自落在 \(C\) 的张成中)。剩下唯一的情形是 \(\varphi(x)>0\) 且 \(x\notin A'+B'\)。但既然 \(x\in A+B\),这就推出 \(x\in C\)(即 \(x\) 落在 \(A'\cup B'\) 里却不在 \(A'+B'\) 里),证毕。

支撑超平面(φ=0) φ 增大 → 0 A′,B′(φ>0) A′+B′(φ 更大)
因 \(0\) 是凸包顶点,可取泛函 \(\varphi\) 使其余所有点的 \(\varphi\) 值都为正。和集元素 \(\varphi\) 值更大,可逐层(按 \(\varphi\) 值从小到大)归纳分解;分解不下去的那些点恰好属于 \(C\),它们张成的子空间装下整个 \(A+B\)。
命题 5.15设 \(d\ge 1\)、\(n\ge 2\)、\(t\le n-2\)。则 \[S(d,n,t)\ge \min\bigl(S(d,n-1,t)+d+1,\ S(d-1,n-1,t)+n,\ S(d-1,n-1,t-1)+n-t\bigr).\]
证明. 设 \(A,B\) 如 \(S(d,n,t)\) 定义中所取;注意 \(A,B\) 至少含两个元素。由于 \(A,B\) 有限,可找到一个在 \(A\cup B\) 上单射的线性泛函 \(\varphi:V\to\mathbb{R}\)(事实上随机取一个 \(\varphi\) 即可)。由单射性,存在唯一的 \(a_0\in A\) 在 \(A\) 上极小化 \(\varphi\),即对所有 \(a\in A\setminus a_0\) 有 \(\varphi(a)>\varphi(a_0)\)。类似地有 \(b_0\in B\) 在 \(B\) 上极小化 \(\varphi\)。必要时平移 \(A,B\),可设 \(a_0=b_0=0\)。于是 \(A,B\) 现在都含 \(0\),若定义 \(A':=A\setminus\{0\}\)、\(B':=B\setminus\{0\}\),则 \(\varphi\) 在 \(A'\) 与 \(B'\) 上严格为正。特别地 \(\varphi\) 在 \(A'+B'\) 上严格为正,从而 \(A'+B'\) 不含 \(0\)。

由引理 5.14(此时 \(0\) 确为 \(A\cup B\) 的凸包顶点), \[|(A'\cup B')\setminus(A'+B')|\ge d,\] 从而(由于 \(0\) 在 \(A+B\) 中但不在 \(A'\)、\(B'\) 或 \(A'+B'\) 中) \[|A+B|\ge |A'+B'|+d+1.\]

设 \(c+W\) 表示 \(A'+B'\) 的仿射张成,其中 \(c\in V\),\(W\) 是 \(V\) 的线性子空间。若我们知道 \(\operatorname{rank}(A'+B')=\dim(W)\ge d\),便可断定 \(|A'+B'|\ge S(d,n-1,t)\),于是(结合上式)便得第一项,证毕。故可设 \(\dim(W)\le d-1\)。于是任取 \(a_1\in A'\)、\(b_1\in B'\),则有 \(A'\subseteq a_1+W\)、\(B'\subseteq b_1+W\)。从而 \(A'+B'\) 被包含在 \(W,a_1,b_1\) 的张成中。由假设(\(\operatorname{rank}(A+B)\ge d\) 而 \(\dim W\le d-1\)),这意味着 \(a_1,b_1\) 中至少有一个落在 \(W\) 之外。

下面依据 \(a_1,b_1\) 相对 \(W\) 的位置分几种情形。

情形一:\(a_1,b_1\) 模 \(W\) 线性无关。 则 \(A=\{0\}\cup A'\) 落在 \(\{0,a_1\}+W\) 中,从而与落在 \(\{b_1,a_1+b_1\}+W\) 中的 \(A'+B'\) 不相交;于是 \[|A+B|\ge |A'+B'|+|A|\ge |A'+B'|+n.\] 另一方面 \(\operatorname{rank}(A'+B')\ge \operatorname{rank}(A+B)-1\ge d-1\),这给出 \(|A'+B'|\ge S(d-1,n-1,t)\)。本情形结论(第二项)成立。

情形二:\(a_1,b_1\) 模 \(W\) 线性相关,且 \(b_1\notin W\)。 则 \(A\subseteq a_1+W\) 与 \(A'+B'\subseteq a_1+b_1+W\) 不相交,而 \(0\) 既与 \(A'\) 不相交(按定义),也与 \(A'+B'\) 不相交(前述)。于是 \[|A+B|\ge 1+|A'|+|A'+B'|\ge n+|A'+B'|.\] 另一方面,由于 \(A'+B'\) 被包含在 \(W\) 与 \(b_1\) 的张成中,\(\operatorname{rank}(A'+B')=\dim(W)\ge \operatorname{rank}(A+B)-1\ge d-1\),故 \(|A'+B'|\ge S(d-1,n-1,t)\)。结论(第二项)再次成立。

情形三(剩余):\(b_1\in W\)。 由前面的讨论,这迫使 \(a_1\notin W\)。则 \(A'+B'\) 与 \(B\) 不相交,于是 \[|A+B|\ge |B|+|A'+B'|\ge (n-t)+|A'+B'|.\] 但由于 \(\operatorname{rank}(A'+B')\ge \operatorname{rank}(A+B)-1\ge d-1\),我们有 \(|A'+B'|\ge S(d-1,n-1,t-1)\),结论(第三项)再次成立。

三种情形的几何图
情形一:a₁,b₁ 独立 0 b₁ a₁ A 在两条横线,和集另成两条 情形二:b₁∉W 0 A⊂a₁+W A′+B′ 0、A、A′+B′ 三块错开 情形三:b₁∈W B⊂W A′+B′ B 与 A′+B′ 错开
三种情形都在做同一件事:找到几块互不相交的部分(顶点 \(0\)、\(A\) 或 \(B\) 的本体、和集 \(A'+B'\)),把它们的大小加起来。区别只在哪两块能保证不相交,以及残余和集的秩降了多少。
推论 5.16对任意 \(n\ge 1\)、\(t\ge 0\)、\(d\ge 0\),有 \[S(d,n,t)\ge \sum_{n-d\le r\le n} r\;-\;\sum_{1\le s\le t}\min(s,d).\]
证明. 当 \(d=0\)、\(n=1\) 或 \(r\ge n-1\)(即 \(d\) 退化或区间退化)等情形可由 (5.12) 直接验证,故可限于 \(d\ge 1\)、\(n\ge 2\)、\(t\le n-2\)。我们对正量 \(n+d+t\) 作归纳,归纳地假设结论对所有更小的 \(n+d+t\) 已成立。于是把命题 5.15 的三项分别用归纳假设展开:

第一项: \[S(d,n-1,t)+d+1\ge \sum_{n-d-1\le r\le n-1} r-\sum_{1\le s\le t}\min(s,d)+d+1=\sum_{n-d\le r\le n} r-\sum_{1\le s\le t}\min(s,d),\] 这里用到把求和下端从 \(n-d-1\) 抬到 \(n-d\)、上端从 \(n-1\) 抬到 \(n\),恰好补进一个 \(d+1\)。

第二项: \[S(d-1,n-1,t)+n\ge \sum_{n-d\le r\le n-1} r-\sum_{1\le s\le t}\min(s,d-1)+n\ge \sum_{n-d\le r\le n} r-\sum_{1\le s\le t}\min(s,d),\] 这里用到 \(\min(s,d-1)\le\min(s,d)\)。

第三项: \[S(d-1,n-1,t-1)+n-t\ge \sum_{n-d\le r\le n-1} r-\sum_{1\le s\le t-1}\min(s,d-1)+n-t\ge \sum_{n-d\le r\le n} r-\sum_{1\le s\le t}\min(s,d),\] 这里用到恒等式 \(\sum_{1\le s\le t}\min(s,d)=\sum_{1\le s\le t-1}\min(s,d-1)+t\)。

三项都不小于目标右端,故结论由命题 5.15 得出。

这个不等式在许多情形下是精确的,尽管已有一些利用与 Brunn–Minkowski 不等式(定理 3.16)相关技术的改进;见相关文献。作为该不等式的一个推论,我们得到下面对引理 5.13 的推广:

定理 5.17设 \(V\) 为有限维向量空间,\(d\ge 0\),\(A,B\) 为 \(V\) 中的加性集合,满足 \(\operatorname{rank}(A+B)\ge d\),则 \[|A+B|\ge |A|+d\,|B|-\frac{d(d+1)}{2}.\]
证明. 在推论 5.16 中取 \(n:=|A|\)、\(t:=|A|-|B|\),并利用平凡界 \(\min(s,d)\le d\)(故 \(\sum_{1\le s\le t}\min(s,d)\le dt\))。注意 \[\sum_{n-d\le r\le n} r=(d+1)n-\frac{d(d+1)}{2},\] (这是 \(d+1\) 个连续整数之和),故 \[|A+B|\ge (d+1)n-\frac{d(d+1)}{2}-dt=n+d(n-t)-\frac{d(d+1)}{2}.\] 代入 \(n-t=|B|\) 即得所欲。
两点核对
  1. 取 \(A=B\),则 \(t=|A|-|B|=0\),定理 5.17 给出 \(|A+A|\ge|A|+d|A|-\tfrac{d(d+1)}{2}=(d+1)|A|-\tfrac{d(d+1)}{2}\),正是引理 5.13——所以这确实是 5.13 的推广。
  2. 系数的不对称性:\(|A|\) 前是 \(1\),\(|B|\) 前是 \(d\)。这反映了 \(A\) 是“较大”的那个集合(\(|A|\ge|B|\)),高维带来的放大倍率挂在较小集合 \(|B|\) 上。

小倍增、平行体与 Freiman 立方体引理

我们现在回到向量空间中具有小倍增的加性集合。把向量空间 \(V\) 中的一个 \(d\)-平行体(\(d\)-parallelepiped)\(P\) 定义为任何形如 \[P=a+I\cdot v_1+\cdots+I\cdot v_d\] 的集合,其中 \(v_1,\dots,v_d\) 是 \(V\) 中的向量(不必线性无关),\(a\in V\),而 \(I=\{x\in\mathbb{R}:-1\le x\le 1\}\) 是闭单位区间。\(2^d\) 个点 \[a+\{-1,1\}\cdot v_1+\cdots+\{-1,1\}\cdot v_d\] (可能带重数)称为这个 \(d\)-平行体的角点(corners),\(a\) 是其中心;注意这些角点构成一个秩为 \(d\)、维数为 \((2,\dots,2)\) 的等差进程,它可能是真的也可能不是真的。

中心 a v₁ v₂ a−v₁−v₂ a+v₁−v₂ a+v₁+v₂ a−v₁+v₂
\(d=2\) 的平行体:中心 \(a\) 加上 \(\pm v_1\pm v_2\) 的全部 \(4=2^2\) 种符号组合就是 \(4\) 个角点。一般 \(d\) 维有 \(2^d\) 个角点。把每个 \(\pm\) 看成对每个方向“取两端中的一端”,角点就是 \(\{-1,1\}^d\) 标号的等差进程。

一个值得注意的事实,称为 Freiman 立方体引理,是说:如果 \(d\) 维向量空间中的加性集合 \(A\) 有小倍增,那么存在一个 \(d\)-平行体,它含有 \(A\) 的一大部分,且其角点都落在集合 \(A\) 内。这对一般的集合 \(A\) 当然不成立,例如考虑 \(\mathbb{Z}^2\subset\mathbb{R}^2\) 中的集合 \(\{(n,n^2):-N\le n\le N\}\) 即可看出。为证明 Freiman 立方体引理,我们先证一条对归纳有用的辅助引理。

{(n, n²) : −N ≤ n ≤ N}:弯曲,没有任何大的平行四边形落在点上
抛物线上的点 \((n,n^2)\) 倍增并不小(\(A+A\) 很大),所以立方体引理的“小倍增”前提不满足;它确实找不到角点都在 \(A\) 里的大平行体。可见“小倍增”这个条件是必需的。
引理 5.18设 \(V\) 为 \(d\) 维向量空间,\(W\) 为 \(V\) 的一个 \(d-r\) 维线性子空间(某 \(0对称加性集合(即 \(-A=A\)),令 \(K=\sigma[A]=|A+A|/|A|\) 为倍增常数。则存在一个角点落在 \(A\) 内、中心为 \(0\) 的 \(r\)-平行体 \(P\),使得 \[|A\cap(P+W)|\ge (9K)^{-2^{\,r-1}+1}\,|A|.\]
证明. 我们对余维 \(r\) 作归纳。

\(r=1\)。 不失一般性可取 \(V\) 为欧氏空间 \(\mathbb{R}^d\)。令 \(v_1\) 为 \(A\) 中使量 \(\operatorname{dist}(v_1,W)\) 最大的元素;则容易看出 \(1\)-平行体 \(P=0+I\cdot v_1\) 满足所需性质(这里利用 \(A\) 的对称性,把 \(P\) 的两个角点 \(\pm v_1\) 都放进 \(A\))。

\(r\ge 2\),且结论对所有更小的 \(r\) 已成立。 把 \(W\) 放进一个 \(d-1\) 维超平面 \(H\subset V\) 中,\(H\) 把 \(V\) 分成超平面 \(H\) 与两个开半空间 \(H_-,H_+\)。由鸽巢原理,三个集合 \(A\cap H\)、\(A\cap H_-\)、\(A\cap H_+\) 中有一个的基数至少是 \(|A|/3\)。

先设 \(|A\cap H|\ge |A|/3\)。则对(把 \(V\) 换成 \(H\)、\(d\) 换成 \(d-1\) 的)归纳假设应用,可找到一个角点落在 \(A\cap H\subseteq H\) 内、中心为 \(0\) 的 \(r-1\)-平行体 \(P\subset H\subset V\),使得 \[|A\cap(P+W)|\ge |(A\cap H)\cap(P+W)|\ge (9K)^{-2^{\,r-2}+1}\,|A|/3\ge (9K)^{-2^{\,r-1}+1}\,|A|.\] 结论随之得出,只需给 \(P\) 添加一个哑向量 \(v_r=0\) 把它补成 \(r\)-平行体。

不失一般性,剩下要考虑 \(|A\cap H_+|\ge |A|/3\) 的情形。由于 \(|2(A\cap H_+)|\le |2A|\le K|A|\),我们得到 \(\sigma[A\cap H_+]\le 3K\)。由练习 2.3.14,可得一个关于某中心 \(a=x/2\) 对称的子集 \(F\)(即 \(F=x-F\)),满足 \(|F|\ge |A|/9K\) 且 \(\sigma[F]\le 9K^2\)。由于 \(F\) 整个含于半空间 \(H_+\),其对称中心 \(a\in H_+\),特别地 \(a\notin W\)。现令 \(W'\) 为由 \(W\) 与 \(a\) 张成的 \(d-r+1\) 维线性空间,并对(把 \(A\) 换成 \(F-a\)、\(K\) 换成 \(9K^2\)、\(W\) 换成 \(W'\)、\(r\) 换成 \(r-1\) 的)归纳假设应用。这让我们找到一个中心为 \(a\)、角点落在 \(F\) 内的 \(r-1\)-平行体 \(P'=a+I\cdot v_1+\cdots+I\cdot v_{r-1}\),使得 \[|F\cap(P'+W')|\ge (81K^2)^{-2^{\,r-2}+1}\,|F|\ge (9K)^{-2^{\,r-1}+1}\,|A|.\]

现在令 \(P\) 为 \(r\)-平行体 \(I\cdot a+I\cdot v_1+\cdots+I\cdot v_{r-1}\);由于 \(F\) 与 \(-F\) 都含于 \(A\)(\(A\) 对称),我们看到 \(P\) 的角点都落在 \(A\) 内,且 \(P\) 当然以原点为中心。要完成证明,我们需要证明 \[|A\cap(P+W)|\ge |F\cap(P'+W')|.\]

为证此,我们用一个滑动论证,利用 \(A\) 与 \(F\) 的对称性。把 \(W'=W'_{>0}\cup W'_{\le 0}\) 拆开,其中 \(W'_{>0}\) 是 \(W'\) 中以 \(W\) 为边界、含 \(a\) 的开半空间,\(W'_{\le 0}\) 是 \(W'\) 中以 \(W\) 为边界、不含 \(a\) 的闭半空间。则 \[\begin{aligned}|F\cap(P'+W')|&=|F\cap(P'+W'_{>0})|+|F\cap(P'+W'_{\le 0})|\\&=|(F-2a)\cap(P'+W'_{>0}-2a)|+|F\cap(P'+W'_{\le 0})|\\&=|(-F)\cap(P'+W'_{>0}-2a)|+|F\cap(P'+W'_{\le 0})|\\&=\bigl|[(-F)\cap(P'+W'_{>0}-2a)]\cup[F\cap(P'+W'_{\le 0})]\bigr|,\end{aligned}\] 这里用到 \(F\) 关于 \(a\) 对称(故 \(F-2a=-F\)),以及 \(F\) 与 \(-F\) 不相交(一个落在 \(H_+\),另一个落在 \(H_-\))。于是只需证明集合 \(-F\cap(P'+W'_{>0}-2a)\) 与 \(F\cap(P'+W'_{\le 0})\) 都落在 \(A\cap(P+W)\) 中。它们落在 \(A\) 中是显然的,因为 \(A\) 同时含 \(F\) 与 \(-F\)。又注意到 \((P'+W'_{>0}-2a)\subseteq -(P'+W'_{\le 0})\),因为 \(P'\) 关于 \(a\) 对称。于是只剩证明 \(F\cap(P'+W'_{\le 0})\subseteq P+W\)。但由于 \(F=2a-F\) 落在 \(H_+\),\(P'\) 的角点落在 \(F\) 内,而 \(W\) 落在 \(H\) 中,我们看到 \(F\) 与 \(P'+W\) 都落在 \(H\) 与 \(2a+H\) 之间的薄板里。从而 \(F\cap(P'+W'_{\le 0})\) 落在集合 \(P-\{ta:0\le t\le 2\}+W=P+W\) 中,结论得证。

引理 5.18 的归纳骨架
  1. 目标:在“逐渐增高的余维 \(r\)”上,找到角点在 \(A\)、中心在 \(0\) 的小平行体,使得它在 \(W\) 方向的“柱体” \(P+W\) 仍抓住 \(A\) 的一个固定比例。
  2. \(r=1\):取离 \(W\) 最远的点 \(v_1\),对称性保证 \(\pm v_1\) 都在 \(A\) 里,一根线段就够。
  3. \(r\ge 2\):用一张超平面 \(H\) 把空间切三块(\(H,H_+,H_-\)),鸽巢挑出占 \(1/3\) 的一块;落在 \(H\) 上就直接降维归纳,落在半空间就先用练习 2.3.14 取对称子集 \(F\),再降一维归纳。
  4. 每降一维,比例代价从 \((9K)^{\,-2^{r-2}+1}\) 变成 \((9K)^{\,-2^{r-1}+1}\)——指数大约翻倍,这就是最终立方体引理里出现 \(2^d\) 的来源。

作为推论我们得到:

推论 5.19(Freiman 立方体引理)设 \(A\) 为 \(d\) 维向量空间 \(V\) 中的加性集合,\(K=\sigma[A]\) 为倍增常数。则存在一个角点落在 \(A\) 内的 \(d\)-平行体 \(P\),使得 \[|A\cap P|\ge (3K)^{-2^{\,d}}\,|A|.\]
证明. 由练习 2.3.14,可取对称子集,使其 \(\sigma[F]\le K^2\)。然后对它应用引理 5.18,取 \(W=\{0\}\)、\(r=d\) 即可。

从线性控制到对数控制:Freiman 的 \(2^d\) 定理

引理 5.13 大致表明:若 \(A\) 是向量空间中的加性集合,则 \(\operatorname{rank}(A)\) 被倍增常数 \(\sigma[A]\) 的一个线性函数所控制。下面这条引人注目的定理表明:如果愿意从 \(A\) 过渡到 \(A\) 的一个显著子集,那么事实上可以用倍增常数的一个对数函数来控制秩。

定理 5.20(Freiman \(2^d\) 定理)设 \(d\ge 1\),\(A\) 为向量空间 \(V\) 中倍增常数 \(K=\sigma[A]<2^d\) 的加性集合。则存在 \(A\) 的子集 \(A'\),满足 \(\operatorname{rank}(A')
为什么是“对数控制” 把条件 \(K<2^d\) 反过来读:只要倍增常数 \(K\) 给定,取 \(d\) 略大于 \(\log_2 K\)(使 \(2^d>K\)),就能把 \(A\) 的一个固定比例子集压进秩 \(秩 \(\lesssim \log_2 K\)。相比引理 5.13 的“秩 \(\lesssim K\)”,对数控制要强得多——代价是只对 \(A\) 的一个子集成立。
证明. 固定 \(d\),对 \(K\) 作归纳。当 \(K\le 1\) 时结论空洞地成立。现设 \(K>1\) 且结论对所有 \(K\le K-\varepsilon(d,K)\)(某 \(\varepsilon(d,K)>0\),且当 \(K\) 在任一紧区间 \(\{1\le K\le 2^d-\delta\}\) 中时 \(\varepsilon\) 有正的下界)的值已成立;若能在这样的假设下证出结论,则由标准的连续性论证,结论无条件成立(满足定理的 \(K\) 之集合是开的、闭的,且含 \(1\))。

固定 \(A,V,K\),令 \(\varepsilon=\varepsilon(d,K)\) 稍后选定。若存在子集 \(A''\subset A\) 满足 \(|A''|\ge \tfrac{\varepsilon}{K}|A|\) 且 \(\sigma[A'']\le K-\varepsilon\),则把归纳假设用到 \(A''\)(\(K\) 换成 \(K-\varepsilon\))即得结论。故可假设:只要 \(|A''|\le \tfrac{\varepsilon}{K}|A|\),就有 \(\sigma[A'']\ge K-\varepsilon\)。特别地我们看到 \[\tag{5.13}|2A''|\ge K|A''|-\varepsilon|A|\quad\text{对所有非空 }A''\subseteq A\] (分别处理 \(A''\) 小与 \(A''\) 大两种情况)。若约定此时 \(2\varnothing=\varnothing\),则它对 \(A''=\varnothing\) 也成立。

令 \(r=\operatorname{rank}(A)\)。不失一般性可设 \(V\) 是 \(r\) 维的,否则把 \(V\) 限制到 \(A\) 的仿射张成(并平移到原点)。若 \(A\) 很小,比如 \(|A|\le 10K^2\),则取 \(A'\) 为单点即可,故设 \(|A|>10K^2\)。由引理 5.13 得 \(r\le K\)(即秩被倍增线性控制)。我们事实上要证明 \(A\) 上的假设迫使 \(r

我们断言 (5.13) 蕴含界 \[\tag{5.14}|A\cap W|=O(\varepsilon|A|)\] 对 \(V\) 中所有仿射超平面 \(W\) 成立。要看出这一点,注意 \(W\) 把 \(V\) 分成超平面 \(W\) 与两个开半空间 \(W_-,W_+\)。由于 \(A\) 满秩,\(A\cap W_+\)、\(A\cap W_-\) 中至少一个非空。设 \(A\cap W_+\) 非空。令 \(a\) 为 \(A\cap W_+\) 中到 \(W\) 距离最小的点。由 \(W,W_-,W_+\) 的凸性与不相交性可观察到:中点集 \(\tfrac12\cdot 2(A\cap W)\)、\(\tfrac12\cdot 2(A\cap W_+)\)、\(\tfrac12\cdot(a+(A\cap W))\)、\(\tfrac12\cdot 2(A\cap W_-)\) 两两不相交。由于这些集合都含于 \(\tfrac12\cdot 2A\),我们得到 \[|2(A\cap W)|+|2(A\cap W_+)|+|A\cap W|+|2(A\cap W_-)|\le |2A|=K|A|.\] 对左边的各倍增项应用 (5.13)(并注意 \(|A\cap W|+|A\cap W_+|+|A\cap W_-|=|A|\)),即得 (5.14)。

接下来,对 \(A\) 应用 Freiman 立方体引理,得到一个角点落在 \(A\) 内的 \(r\)-平行体 \(P\),使得 \[\tag{5.15}|A\cap P|=\Omega_K(|A|).\] 把它与 (5.14) 比较,可见 \(P\) 不可能含于某个仿射超平面(只要 \(\varepsilon\) 取得足够小)。由于平行体 \(P\) 有 \(2r\le 2K\) 个面,每个面都落在某仿射超平面上,于是以 \(\operatorname{int}(P)\) 记 \(P\) 的内部,有 \[|A\cap\operatorname{int}(P)|\ge |A\cap P|-O(K\varepsilon|A|).\] 若以 \(Q\) 记 \(P\) 的 \(2^r\) 个角点,我们观察到诸集合 \(\{x+\operatorname{int}(P):x\in Q\}\) 两两不相交;于是 \[\tag{5.16}|2(A\cap P)|\ge 2^r|A\cap\operatorname{int}(P)|\ge 2^r|A\cap P|-O(2^r K\varepsilon|A|).\]

\(P\) 在 \(V\) 中的补集 \(V\setminus P\) 可划分为至多 \(2r\) 个(无界)凸区域 \(B_1\cup\cdots\cup B_{2r}\)(练习 5.2.4)。由凸性与不相交性观察到,中点集 \(\tfrac12\cdot 2(A\cap B_j)\) 彼此不相交、且都与 \(2(A\cap P)\) 不相交。于是 \[|2A|\ge \sum_{j=1}^{2r}|2(A\cap B_j)|+|2(A\cap P)|.\] 对各项应用 (5.13) 与 (5.14),得 \[|2(A\cap P)|\le K|A\cap P|+2r\varepsilon|A|.\] 把它与 (5.16)、(5.15) 结合,并用 \(r\le K\),得到 \[2^r\le K+O_K(\varepsilon).\] 由于 \(K<2^d\),只要把 \(\varepsilon\) 取得依赖于 \(K\) 与 \(d\) 而足够小,便得 \(r

int(P) x+int(P) x+int(P) B₁ B₂…
关键的两笔:(1) 把内部 \(\operatorname{int}(P)\) 平移到各个角点 \(x\in Q\),得到 \(2^r\) 份互不相交的拷贝,所以 \(|2(A\cap P)|\) 至少是 \(2^r\) 倍——这逼出因子 \(2^r\);(2) 补集 \(V\setminus P\) 切成若干凸块,配合 (5.13)(5.14) 又把 \(|2(A\cap P)|\) 从上面压到约 \(K\) 倍。两头一夹得 \(2^r\le K+O_K(\varepsilon)\),于是 \(2^r<2^d\),即 \(r

关于 \(\Omega_{d,K}(\cdot)\) 记号中常数的依赖关系等进一步讨论,可参见相关文献。

练习

练习 5.2.1–5.2.4
  1. 5.2.1 证明:把引理 5.13 中的 \(A+A\) 换成差集 \(A-A\),结论仍然成立。
  2. 5.2.2 设 \(d\ge 1\),\(B:=\{0,1\}^d\subseteq\mathbb{R}^d\),\(A\) 为 \(B\) 的凸包的一个加性子集(即 \(A\) 落在实心单位立方体 \(\{(x_1,\dots,x_d):0\le x_1,\dots,x_d\le 1\}\) 中)。证明 \[|A+B|\ge \bigl(\sqrt2-o_{d\to\infty}(1)\bigr)^d\,|A|.\] (提示:先化归到 \(A\subseteq B\) 的情形,再进一步化归到 \(A\) 由那些 \(n_1+\cdots+n_d\) 为定值的元素 \((n_1,\dots,n_d)\in\{0,1\}^d\) 构成的情形。然后类似地限制 \(B\) 的元素,应用覆盖原理与 Stirling 公式 (1.52)。先做下一题的反例会有帮助。)
  3. 5.2.3 证明练习 5.2.2 中的常数 \(\sqrt2\) 不可改进:取 \(A\) 等于那些满足 \(n_1+\cdots+n_d=\lfloor d/2\rfloor\) 的元素 \((n_1,\dots,n_d)\in B\)。
  4. 5.2.4 设 \(V\) 为 \(r\) 维向量空间,\(P\) 为 \(V\) 中一个不含于任何超平面的 \(r\)-平行体。证明 \(V\setminus P\) 是 \(2r\) 个无界凸区域之并(不必为开集)。

返回 全书目录