3.3 凸体Convex bodies
本页为译文 + 讲解合一:黑色正文为忠实翻译;彩色框(目标 / 定义 / 定理 / 引理 / 推论 / 例 / 分步推演)与配图为帮助理解而加的详解,逐步推演、举例、画图,不用比喻。
现在我们来回顾一下 \(\mathbb{R}^d\) 中凸体(convex bodies)理论的一部分内容;在某种意义上,凸体是广义等差数列(generalized arithmetic progressions)的连续类比。这当然是一个极其广阔的领域,我们只能局限于其中很小的一部分结果,即与这类集合的加性理论、覆盖引理(covering lemmas),以及加法与体积之间的关系有关的那些结果。
我们用 \(\operatorname{mes}(A)\) 表示 \(\mathbb{R}^d\) 中集合 \(A\) 的体积(measure,测度)。为了避免可测性带来的麻烦,我们大多只考虑有界开集 \(A\)。若 \(A\subseteq\mathbb{R}^d\) 且 \(\lambda\in\mathbb{R}\),我们用 \(\lambda\cdot A\) 表示伸缩(dilation) \[\lambda\cdot A:=\{\lambda x:x\in A\}.\] 注意有 \[\operatorname{mes}(\lambda A)=|\lambda|^{d}\operatorname{mes}(A).\]
回忆一下:\(\mathbb{R}^d\) 中的集合 \(A\) 称为凸的(convex),若只要 \(x,y\in A\) 且 \(0\le\theta\le1\),就有 \((1-\theta)x+\theta y\in A\);等价地,一个集合是凸的当且仅当 \[a\cdot A+b\cdot A=(a+b)\cdot A\] 对一切实数 \(a,b\ge0\) 成立(习题 3.3.3)。特别地,对任意整数 \(n\) 有 \(nA=|n|\cdot A\)。若 \(A\) 是凸的、开的、非空的且有界的,就称 \(A\) 为一个凸体(convex body)。
- “点定义”说:任取两点的加权平均仍在 \(A\) 内。
- “集合定义” \(a\cdot A+b\cdot A=(a+b)\cdot A\) 说:把 \(A\) 放大 \(a\) 倍的点,加上 \(A\) 放大 \(b\) 倍的点,得到的恰好就是 \(A\) 放大 \(a+b\) 倍——不多也不少。
- 包含 \((a+b)\cdot A\subseteq a\cdot A+b\cdot A\) 对任何集合都成立(取同一个点 \(x\):\((a+b)x=ax+bx\))。真正用到凸性的是反方向:要把 \(ax+by\)(一般是两个不同点)写成 \((a+b)z\) 的形式,需要 \(z=\frac{a}{a+b}x+\frac{b}{a+b}y\) 落在 \(A\) 里——这正是点定义里的加权平均。完整证明留作习题 3.3.3。
特别地我们看到,如果 \(A\) 是凸体,那么 \[\tag{3.4}\operatorname{mes}(A+A)=\operatorname{mes}(2\cdot A)=2^{d}\operatorname{mes}(A),\] 所以凸体具有很小的倍增常数(doubling constant)。
- 取 \(a=b=1\) 代入凸性的集合定义:\(1\cdot A+1\cdot A=(1+1)\cdot A\),即 \(A+A=2\cdot A\)。这一步只对凸集成立;一般集合只有 \(2\cdot A\subseteq A+A\)。
- 再用伸缩的体积公式:\(\operatorname{mes}(2\cdot A)=2^{d}\operatorname{mes}(A)\)。
- 所以倍增比 \(\dfrac{\operatorname{mes}(A+A)}{\operatorname{mes}(A)}=2^{d}\)。对照离散:一个秩为 \(d\) 的真广义等差数列也有 \(|A+A|\approx 2^{d}|A|\)(引理 3.10),这正是“凸体 ↔ 广义等差数列”这条类比的一个体现。
至于 \(A-A\)(差集),我们可以借助下面的引理。
它的证明是把引理 2.6 的证明作适当修改而得,留作习题(习题 3.3.1)。由此引理(取 \(A=C\) 且 \(B=-A\))以及 (3.4),我们得到 \[\tag{3.5}\operatorname{mes}(A-A)\le 4^{d}\operatorname{mes}(A);\] 请把这些界与引理 3.10 作比较。关于 (3.5) 的一个略微改进,参见习题 3.4.6。在相反的方向上,Brunn–Minkowski 不等式(下文定理 3.16)将给出 \(\operatorname{mes}(A-A)\ge 2^{d}\operatorname{mes}(A)\)。
- 在引理 3.12 中令 \(C=A\) 且 \(B=-A\),不等式变为 \[\operatorname{mes}(A-A)\,\operatorname{mes}(-A)\le\operatorname{mes}\!\big(A-(-A)\big)\,\operatorname{mes}\!\big((-A)-A\big).\]
- 注意 \(\operatorname{mes}(-A)=\operatorname{mes}(A)\)(取 \(\lambda=-1\),体积乘 \(|{-1}|^{d}=1\));又 \(A-(-A)=A+A\),\((-A)-A=-(A+A)\),二者体积都等于 \(\operatorname{mes}(A+A)\)。于是 \[\operatorname{mes}(A-A)\,\operatorname{mes}(A)\le\operatorname{mes}(A+A)^{2}.\]
- 对凸体用 (3.4):\(\operatorname{mes}(A+A)=2^{d}\operatorname{mes}(A)\),代入得 \[\operatorname{mes}(A-A)\,\operatorname{mes}(A)\le\big(2^{d}\operatorname{mes}(A)\big)^{2}=4^{d}\operatorname{mes}(A)^{2}.\]
- 两边除以 \(\operatorname{mes}(A)>0\),即得 \(\operatorname{mes}(A-A)\le 4^{d}\operatorname{mes}(A)\)。
若凸体 \(A\) 满足 \(A=-A\),就称它是对称的(symmetric);因此对我们而言,对称总是关于原点的对称。下面这条 John 的定理,本质上把所有凸体(无论对称与否)都分类到了一个(依赖于维数的)常数因子之内。
现在我们先限于 \(A\) 对称的情形。注意,如果 \(A\) 包含 \(B_d+y_0\),那么由对称性它也包含 \(B_d-y_0\),从而包含 \(B_d\)——因为 \(B_d\) 落在 \(B_d+y_0\) 与 \(B_d-y_0\) 的凸包之中。为完成此情形下的证明,我们还需证明 \(A\) 被包含于 \(\sqrt d\cdot B_d\)。反设 \(A\) 不被包含于 \(\sqrt d\cdot B_d\);不失一般性(并利用 \(A\) 为开集的假设),我们可以假设 \(re_1\in A\) 对某个 \(r>\sqrt d\) 成立,其中 \(e_1\) 是第一个基向量。现在由初等几何观察到:若 \(\omega\) 是 \(B_d\) 边界上任一点,且它与 \(e_1\) 的夹角 \(\angle(\omega,e_1)<\arctan(\sqrt{r^2-1})\),则连接 \(\omega\) 与 \(re_1\) 的线段与 \(B_d\) 不相交(也不相切);又由于 \(B_d\) 与 \(re_1\) 都落在凸集 \(A\) 内,我们便看出 \(\omega\) 也落在开集 \(A\) 内。由对称性,当 \(\angle(\omega,-e_1)<\arctan(\sqrt{r^2-1})\) 时同样成立。
现在我们把球 \(B_d\) 作一个 \(\varepsilon\) 的微扰。设 \(\delta>0\) 为一个小数,\(\varepsilon>0\) 为更小的数,考虑椭球 \(L_{\varepsilon,\delta}(B_d)\),其中 \[L_{\varepsilon,\delta}(x_1,\dots,x_d):=\big((1+(d-1+\delta)\varepsilon)x_1,\,(1-\varepsilon)x_2,\,\dots,\,(1-\varepsilon)x_d\big).\] 当 \(\varepsilon=0\) 时,\(L_{\varepsilon,\delta}(B_d)\) 就是 \(B_d\)。现在考察 \(L_{\varepsilon,\delta}(B_d)\) 如何随 \(\varepsilon\) 演变。该变换的行列式为 \((1+(d-1+\delta)\varepsilon)(1-\varepsilon)^{d-1}\),它在 \(\varepsilon=0\) 处有正的 \(\varepsilon\)-导数。因此对充分小的 \(\varepsilon\)(依赖于 \(\delta\)),\(L_{\varepsilon,\delta}(B_d)\) 的体积比 \(B_d\) 更大。下面我们检验:\(L_{\varepsilon,\delta}(B_d)\) 表面上哪些点离原点胀出,哪些点缩进。一个简单的计算表明,对 \(B_d\) 边界上任一点 \(\omega=(\omega_1,\dots,\omega_d)\),导数 \[\frac{d}{d\varepsilon}\Big\|L_{\varepsilon,\delta}(\omega)\Big\|^2\Big|_{\varepsilon=0},\] (其中 \(\|(y_1,\dots,y_d)\|^2:=y_1^2+\dots+y_d^2\))是负的,除非 \[(d-1+\delta)\omega_1^2-\omega_2^2-\dots-\omega_d^2\ge0,\] 换句话说除非 \[\angle(\omega,\pm e_1)\le\arctan(\sqrt{d-1+\delta}).\] 但若 \(\delta\) 取得足够小(依赖于 \(r\)),由前面的讨论,这块区域整个落在 \(A\) 的内部之中。于是对足够小的 \(\varepsilon\),\(L_{\varepsilon,\delta}(B_d)\) 完全包含在 \(A\) 内,却拥有更大的体积,这与 \(B_d\) 的极大性矛盾,于是证毕(对称情形)。
现在设 \(A\) 不对称。这种情形下我们可作平移使 \(y_0=0\)。于是同样有 \(B_d\subseteq A\),而任务变为证明 \(A\subseteq d\cdot B_d\)。再次反设 \(re_1\in A\) 对某个 \(r>d\) 成立;这同样意味着 \(B_d\) 边界上每个满足 \(\angle(\omega,e_1)<\arctan(\sqrt{r^2-1})\) 的点 \(\omega\) 都落在 \(A\) 的内部。现在令 \(\delta,\varepsilon>0\),考虑椭球
\[L_{\varepsilon,\delta}(x_1,\dots,x_d)+(d-1+\delta)\varepsilon e_1;\]
同样,若 \(\varepsilon\) 充分小,此椭球的体积比 \(B_d\) 更大。并且我们看到
\[\frac{d}{d\varepsilon}\Big\|L_{\varepsilon,\delta}(\omega)+(d-1+\delta)\varepsilon e_1\Big\|^2\Big|_{\varepsilon=0}\]
是负的,除非
\[(d-1+\delta)\omega_1^2+(d-1+\delta)\omega_1-\omega_2^2-\dots-\omega_d^2\ge0,\]
利用 \(\|\omega\|=1\) 可将其改写为
\[\big((d+\delta)\omega_1-1\big)(\omega_1+1)\ge0,\]
或等价地
\[\angle(\omega,e_1)\le\arctan\!\big(\sqrt{(d+\delta)^2-1}\big).\]
我们像对称情形那样论证,只要 \(\delta\) 选得使 \(d+\delta
- 找最大椭球。在 \(A\) 内所有椭球中,挑体积最大的那个 \(E\)。紧性保证它存在,开集保证它非退化(\(L\) 可逆)。
- 标准化。用 \(L^{-1}\) 把 \(E\) 拉回成单位球 \(B_d\)(结论在可逆线性变换下不变,所以这样做不损失一般性)。于是 \(B_d\subseteq A\),内球到手。
- 反证外球。假设 \(A\) 伸出了外球(有点 \(re_1\),\(r\) 太大)。因为 \(A\) 凸且含 \(B_d\) 与 \(re_1\),所以 \(re_1\) 附近一个锥形区域里的球面点也都进了 \(A\)。
- 造一个更大的椭球。构造 \(L_{\varepsilon,\delta}\):沿 \(e_1\) 方向拉长一点、其余方向压扁一点。行列式(体积)的导数为正,所以体积变大;而胀出原点的那些球面点恰好落在第 3 步那个锥形区域内(即仍在 \(A\) 里)。于是新椭球更大却仍在 \(A\) 内,与“\(B_d\) 已是最大”矛盾。
- 结论。矛盾说明 \(A\) 伸不出外球,即 \(A\subseteq\sqrt d\cdot B_d\)(对称)或 \(A\subseteq d\cdot B_d\)(一般)。常数差别来自:对称情形外球能取小一些。
作为定理 3.13 的一个推论,我们看到:若 \(A\) 是凸体,则可以用相对少量的 \(A\) 的副本来覆盖 \(A+A\) 或 \(A-A\): \[\tag{3.6}A\pm A\ \text{可被}\ O(d)^{d}\ \text{个}\ A\ \text{的平移所覆盖}.\] 这立刻从下面的几何观察得到:\(d\cdot B_d+d\cdot B_d=2d\cdot B_d\) 可被 \(O(d)^{d}\) 个 \(B_d\) 的平移覆盖。若 \(A\) 对称,我们可以稍作改进。在 \(A\) 是立方体或长方体的特殊情形,显然 \(A\pm A\) 可被 \(2^{d}\) 个 \(A\) 的平移覆盖(参见引理 3.10),但一般情形不能指望如此;例如若 \(A\) 是 \(\mathbb{R}^2\) 中的圆盘,则需要 六个 \(A\) 的副本才能覆盖 \(A\pm A\)。在一般情形,我们将需要下面这条引理 2.14 的连续版本。
此引理的证明与引理 2.14 几乎完全相同,留作习题(习题 3.3.2)。作为推论,对对称凸体我们可以改进 (3.6):
- 第一论断。在引理 3.14 里取“被覆盖者 \(B\)”为 \(\lambda\cdot A\)、“覆盖工具 \(A\)”仍为 \(A\)。需要的副本数 \(\le\dfrac{\operatorname{mes}(\lambda\cdot A+A)}{\operatorname{mes}(A)}\)。由凸性 \(\lambda\cdot A+A=(\lambda+1)\cdot A\),体积为 \((\lambda+1)^{d}\operatorname{mes}(A)\),故比值为 \((\lambda+1)^{d}\)。覆盖工具是 \(A-A\)。
- 第三论断(对称时)。对称凸体满足 \(A-A=A+A=2\cdot A\)。把第一论断用于 \(2\lambda\) 取代 \(\lambda\):\(2\lambda\cdot A\) 被 \((2\lambda+1)^{d}\) 个 \(A-A=2\cdot A\) 的平移覆盖。两边一起按 \(1/2\) 缩小,\(\lambda\cdot A\) 就被 \((2\lambda+1)^{d}\) 个 \(A\) 的平移覆盖。
- 第二论断。设 \(\lambda\ge\mu\),则 \(\lambda\cdot A-\mu\cdot A\subseteq \lambda\cdot A-\lambda\cdot A=\lambda\cdot(A-A)\)(用 \(\mu\le\lambda\))。集合 \(A-A\) 本身是对称凸体,对它用第三论断(以 \(\lambda\) 作伸缩系数)即得 \((2\lambda+1)^{d}=(2\max(\lambda,\mu)+1)^{d}\) 个 \(A-A\) 的平移。
请注意,这里得到的所有的界都倾向于关于 \(d\) 呈指数增长,甚至更糟。因此,当用凸体理论去获得明确的估计时,常常重要的是把维数 \(d\) 保持得尽可能低,即便代价是让某些其他参数比本来必要的更大。关于凸体的和集与覆盖估计的进一步讨论,参见 [250]。
我们还没有看到两个不相关的凸体 \(A\) 与 \(B\) 的和或差会发生什么。这里的关系由 Brunn–Minkowski 不等式给出,这正是我们接下来要讨论的内容。
习题
- 3.3.1. 证明引理 3.12。
- 3.3.2. 证明引理 3.14。
- 3.3.3. 验证所给凸性的两个定义确实等价。
- 3.3.4. 设 \(A\) 是 \(\mathbb{R}^d\) 的有界开子集。证明:\(A\) 是凸的当且仅当 \(2A=2\cdot A\);且 \(A\) 是凸且对称的当且仅当 \(2A=-2\cdot A\)。
- 3.3.5. 对任意 \(s>0\),设 \(\Gamma(s):=\int_0^{\infty}e^{-x}x^{s-1}\,dx\) 表示 Gamma 函数。证明:对一切 \(s>0\) 有 \(\Gamma(s+1)=s\Gamma(s)\);对一切 \(d\ge1\) 有 \(\Gamma(d)=(d-1)!\);\(\Gamma(1/2)=\sqrt\pi\);并且对一切大的 \(s\) 有 Stirling 公式 \[\tag{3.7}\log\Gamma(s)=s\log s-s+O(\log s).\] (提示:使用 (1.52) 以及 \(\Gamma\) 函数的单调性。)
- 3.3.6. 设 \(B_d\) 是 \(\mathbb{R}^d\) 中的单位球。通过在直角坐标与极坐标两种方式下计算积分 \(\int_{\mathbb{R}^d}e^{-\pi|x|^2}\,dx\),并利用上一题,建立体积公式 \[\tag{3.8}\operatorname{mes}(B_d)=\frac{\Gamma(3/2)^{d}2^{d}}{\Gamma(d/2+1)}=(2\pi e+o(1))^{d/2}d^{-d/2}.\]
- 3.3.7. 设 \(O_d\) 是由 \(\mathbb{R}^d\) 中 \(\pm e_1,\dots,\pm e_d\) 的凸包给出的八面体(octahedron)。证明 \(\operatorname{mes}(O_d)=2^{d}/d!=(2e+o(1))^{d}d^{-d}\)。于是在高维中,八面体远小于外接它的球 \(B_d\),而后者又远小于外接的立方体。
- 3.3.8. 证明定理 3.13 中的常数 \(d\) 与 \(\sqrt d\) 不能被改进。(对非对称情形,取 \(A\) 为 \(d\)-单纯形(\(\mathbb{R}^d\) 中 \(d\) 个点的凸包,实为 \(d+1\) 个顶点);对对称情形,取 \(A\) 为立方体。)
- 3.3.9. 若 \(A\) 与 \(A'\) 是 \(\mathbb{R}^d\) 中两个对称凸体,证明存在可逆线性变换 \(T:\mathbb{R}^d\to\mathbb{R}^d\) 使得 \(A\subseteq T(A')\subseteq d\cdot A\)。
返回 全书目录