8.2 塞迈雷迪–特罗特定理The Szemerédi–Trotter theorem
本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。
什么是“关联”
给定一个有限的点集 \(P\) 和一个有限的直线集 \(L\),一个基本问题是估计 \(P\) 与 \(L\) 之间的关联数(number of incidences) \[ I(P,L):=\bigl|\{(p,l)\in P\times L:\ p\in l\}\bigr|. \] 也就是统计有多少对“(点, 线)”满足该点正好落在该线上。显然,我们可以毫不费力地让 \(I(P,L)\) 小到 \(0\)(把所有线都画在没有点的地方即可),所以有趣的问题是:在 \(|P|\) 与 \(|L|\) 的大小固定时,最大化 \(I(P,L)\) 能达到多少。
- \(\ell_1\) 上的点:\(A,B,C\),贡献 \(3\) 个关联对 \((A,\ell_1),(B,\ell_1),(C,\ell_1)\)。
- \(\ell_2\) 上的点:\(C,D\),贡献 \(2\) 个关联对 \((C,\ell_2),(D,\ell_2)\)。
- 合计 \(I(P,L)=3+2=5\)。注意 \(C\) 同时落在两条线上,被算了两次——这正是“关联”计的是(点,线)对,而不是点本身。
当然有一个平凡的界 \(I(P,L)\le |P||L|\)(每个点最多和每条线关联一次)。不费力还能把它进一步改进为 \[ I(P,L)\le \min\bigl(|P|^{1/2}|L|+|P|,\ |L|^{1/2}|P|+|L|\bigr); \tag{8.2}\] 见习题。在文献 [348] 中,塞迈雷迪(Szemerédi)与特罗特(Trotter)证明了下面这个更强的估计,它在相差一个常数因子的意义下是最优的。
主定理
现在构造一个图 \(G=G(P,E)\):它的顶点就是 \(P\) 中的点;两点 \(a,b\) 之间连一条边,当且仅当从 \(a\) 到 \(b\) 的开线段落在 \(L\) 的某条直线上,并且其内部不含 \(P\) 中任何点。换言之,沿着某条直线,把相邻的两个点用边连起来。
我们对边数 \(|E|\) 施行双重计数法。观察:若 \(L\) 中一条直线 \(l\) 含 \(P\) 中 \(k\ge 1\) 个点,则 \(l\) 给 \(E\) 贡献 \(k-1\) 条边(\(k\) 个点排成一串,相邻配对得 \(k-1\) 条)。对所有 \(l\in L\) 求和,得 \[ |E|=I(P,L)-|L|. \] (因为 \(\sum_l k_l = I(P,L)\),而每条线减去的那个 \(1\) 合计为 \(|L|\)。)
另一方面,图 \(G\) 有一个“天然画法”(tautological drawing):把 \(P\) 中每个顶点画在它本来的位置,把边 \([a,b]\) 画成从 \(a\) 到 \(b\) 的线段。由于 \(L\) 中任意两条直线至多相交于一点,我们得到交叉数满足 \[ \mathrm{cross}(G)\le |L|^2. \] 对 \(G\) 应用交叉数不等式(上一节的结论:要么 \(|E|\le 4|V|\),要么 \(\mathrm{cross}(G)\ge |E|^3/(64|V|^2)\)),其中 \(|V|=|P|\),于是:要么 \(|E|\le 4|P|\),要么 \[ |L|^2\ge \mathrm{cross}(G)\ge \frac{|E|^3}{64|P|^2}\ \Longrightarrow\ |E|\le 4|P|^{2/3}|L|^{2/3}. \] 因此 \(|E|\le \max\bigl(4|P|,\,4|P|^{2/3}|L|^{2/3}\bigr)\)。结合 \(I(P,L)=|E|+|L|\),即得所证(\(\max\) 不超过两项之和,故得 \(4|P|^{2/3}|L|^{2/3}+4|P|+|L|\))。♦
- 下界方向(从关联出发):把每条富含点的直线拆成相邻点对,边数恰好 \(=I(P,L)-|L|\)。所以关联多 ⇔ 边多。
- 上界方向(从平面图出发):这张图画在平面上,两条直线最多交一次,所以交叉总数 \(\le |L|^2\),受 \(|L|\) 的强力限制。
- 交叉数不等式当桥梁:它说“边一多,交叉必爆炸(\(\sim |E|^3/|P|^2\))”。把交叉压在 \(|L|^2\) 以内,就反推出 \(|E|\) 不能太大。
- 边数被卡住,关联数 \(=|E|+|L|\) 也就被卡住了。
- 平凡界:\(I\le |P||L|=10^{12}\)。
- 改进界 (8.2):约 \(|P|^{1/2}|L|=10^3\cdot 10^6=10^9\)。
- 塞迈雷迪–特罗特:主项 \(4|P|^{2/3}|L|^{2/3}=4\cdot(10^6)^{2/3}(10^6)^{2/3}=4\cdot10^4\cdot10^4=4\times10^8\)。
由定理推出的推论
现在我们从定理导出若干推论。第一个是直接结论(留作习题),它能让我们估计有多少条直线是“富的”——所谓富,是指它含有给定点集 \(P\) 中许多元素。
- \(k=10\):至多约 \(10^8/10^3=10^5\) 条富线。
- \(k=100\):至多约 \(10^8/10^6=10^2\) 条。
- \(k=1000\):至多约 \(10^8/10^9=0.1\),即几乎不存在含 \(1000\) 点的直线。
接下来,我们估计“被一条富线连接的点对”有多少。
对上述论证做一个简单修改(留作习题),还能控制那些不在过富直线上的共线三元组:
把它特别应用到笛卡儿积 \(P=A\times B\)(\(A,B\) 是实数集,\(|A|=|B|=m\)):此时 \(|P|=m^2\),且没有任何直线能与 \(P\) 相交超过 \(|P|^{1/2}=m\) 个点(一条直线在网格 \(A\times B\) 上每个横坐标至多取一点,故至多 \(m\) 点)。由此立得
推广到曲线
把塞迈雷迪–特罗特定理从直线推广到更一般的曲线是件容易的事。
- \(\alpha\):控制“交叉总数”\(\le \alpha|L|^2\),进入交叉数不等式那一头。
- \(\beta\):控制“两点能被多少条曲线同时穿过”,影响把曲线拆成图的边的方式。
作为该定理的一个应用,我们证明 Andrews [13] 的下述著名结果。
我们对 \(P\) 与 \(\mathcal{F}\) 之间的关联数施行双重计数。一方面,广义塞迈雷迪–特罗特定理给出这些关联的上界为 \(O(m^{4/3})\)(把 \(|P|=\Theta(m)\)、\(|\mathcal{F}|=m\) 代入主项 \(|P|^{2/3}|L|^{2/3}=m^{2/3}m^{2/3}=m^{4/3}\))。另一方面,每一条 \(\partial C\) 的平移恰好通过 \(n\) 个格点(因为原 \(n\) 边形有 \(n\) 个顶点落在格点上,平移后仍是 \(n\) 个),故关联数至少为 \(nm\)。比较两个界: \[ nm \le O(m^{4/3})\ \Longrightarrow\ n=O(m^{1/3})\ \Longrightarrow\ m=\Omega(n^3), \] 即所求。♦
- \(n=10\):内部至少约 \(c\cdot 10^3=1000c\) 个格点。
- \(n=20\):至少约 \(c\cdot 20^3=8000c\) 个——边数翻倍,内部格点至少翻 \(8\) 倍。
- 直觉:要想用格点顶点拼出边数很多的凸多边形,每条边的方向(向量)必须各不相同且越来越长,于是多边形被迫“撑得很大”,把大量格点圈进内部。
一个重要的公开问题
一个重要的公开问题是:把塞迈雷迪–特罗特定理推广到其他域上的平面,例如复平面 \(\mathbb{C}^2\) 或有限域平面 \(\mathbb{F}_p^2\)。粗糙的估计 (8.2) 在所有这些情形都成立(它只用到“两点定一线、两线交一点”,对任意域都对),但人们希望改进这个界。在 \(\mathbb{F}_p^2\) 的情形已经证明:对所有 \(\delta>0\) 以及某个依赖 \(\delta\) 的 \(\varepsilon(\delta)>0\),只要 \(|P|,|L|\le p^{2-\delta}\),就有 \[ I(P,L)=O_\delta\!\left(\max(|P|,|L|)^{3/2-\varepsilon(\delta)}\right); \] 见 [43]、[44]。该论证的主要原料是和积估计(推论 2.58)与 Balog–Szemerédi–Gowers 定理(定理 2.29)。
习题
- 8.2.1 仅用基本事实“两个不同的点确定至多一条线”“两条不同的线相交于至多一点”,配合柯西–施瓦茨不等式,证明 (8.2)。注意该论证对任意域都成立,而不止 \(\mathbb{R}\)。在域为 \(\mathbb{F}_p^2\) 的情形,证明当 \(|P|=|L|=p^2\) 或 \(|P|=|L|=p^4\) 时该界可达到最优。
- 8.2.2 设给定 \(n,m\ge 1\)。找出一个点集 \(P\) 与直线集 \(L\) 的例子,使得 \(|P|=n\)、\(|L|=m\),且 \(P,L\) 间的关联数为 \(\Omega(n^{2/3}m^{2/3}+n+m)\),从而表明塞迈雷迪–特罗特定理在相差常数因子意义下最优。(提示:考虑形如 \(P=[1,a]\times[1,ab]\) 的点集,并取不同的参数 \(a,b\)。)
- 8.2.3 证明推论 8.5。
- 8.2.4 证明推论 8.8。
- 8.2.5 设 \(P\) 为有限点集,\(k\ge 2\)。证明 \[ \bigl|\{(p,l):\ p\in P;\ l\text{ 是直线};\ p\in l;\ |l\cap P|\ge k\}\bigr| = O\!\left(\frac{|P|^2}{k^2}+|P|\log|P|\right). \]
- 8.2.6(Beck 定理)[19] 设 \(P\) 为有限点集。证明:要么存在一条直线关联 \(P\) 中 \(\Omega(|P|)\) 个点,要么存在 \(\Omega(|P|^2)\) 条直线,每条都恰好关联 \(P\) 中两个点。
- 8.2.7(Sylvester–Gallai 定理) 设 \(P\) 为有限点集,且并非所有点都共线。证明:存在一条直线恰好含 \(P\) 中两个点。(提示:最小化量 \(\mathrm{dist}(p,l)\),其中 \(l\) 是含两个或更多 \(P\) 中点的直线,\(p\in P\setminus l\)。用初等几何证明该量仅当 \(l\) 恰含 \(P\) 中两点时才取到最小。)
- 8.2.8 证明定理 8.10。(提示:用习题 8.1.5。)
- 8.2.9 设 \(\gamma\) 为 \(\mathbb{R}^2\) 中一条严格凸曲线。证明对所有 \(R\ge 1\) 及所有格 \(\Gamma\),有 \(|(R\cdot\gamma)\cap\Gamma|=O_\gamma(R^{2/3})\)。
- 8.2.10 设 \(\gamma\) 为 \(\mathbb{R}^2\) 中一条严格凸曲线,\(A\) 为 \(\mathbb{R}^2\) 中有限集。证明 \(\bigl|\{(a,a')\in A\times A:\ a-a'\in\gamma\}\bigr|=O(|A|^{4/3})\)。由此推出 \(\bigl|\{|x-y|:\ x,y\in A\}\bigr|=\Omega(|A|^{2/3})\)。
返回 全书目录