1.9 薄华林基Thin Waring bases
本页为译文 + 讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演 / 注记)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本节是全章的高潮,把前面发展的概率工具(尤其是 1.7 节的多项式集中不等式)用来回答一个非常具体的数论问题,建议先把下面的“本节目标”读懂。
从“存在薄基”到“经典基里藏着薄基”
回忆:\(k\) 阶薄基(thin basis of order \(k\))是指一个集合 \(B\subset\mathbb N\),使得对所有充分大的 \(n\) 都有 \(r_{k,B}(n)=O(\log n)\)。上面已经证明的定理 1.15 断言:\(\mathbb N\) 含有任意阶的薄基。鉴于像平方数、素数这样的经典基(classical bases)如此丰富,自然要提出如下问题:
注意,西顿(Sidon)最初的问题可以看成本问题在 \(k=2\)、\(A=\mathbb N\) 时的特例。由 (1.21) 我们知道,一个薄基 \(B\) 享有如下的上下界:
\[|B\cap[0,N]|=\Omega_k\!\left(N^{1/k}\right);\qquad |B\cap[0,N]|=O_k\!\left(N^{1/k}\log^{1/k}N\right)\]对一切充分大的 \(N\) 成立。于是我们可以考虑问题 1.46 的如下较弱版本:
- 从 \(M\) 个元素里取 \(k\) 个(可重复)来求和,最多产生 \(\binom{M+k-1}{k}=O_k(M^k)\) 个不同的和。
- 这些和必须覆盖 \(0,1,\dots,N\) 共约 \(N\) 个目标值(基的资格要求),所以 \(O_k(M^k)\ge N\)。
- 反解得 \(M\ge \Omega_k(N^{1/k})\)。这就是下界 \(|B\cap[0,N]|=\Omega_k(N^{1/k})\) 的直觉来源——太稀疏就当不了基。
华林基上的已知结果
问题 1.47 已经针对华林基 \(\mathbb N^{\wedge r}=\{0^r,1^r,2^r,\dots\}\) 被深入研究,尤其是在 \(r=2\) 的情形 [90, 56, 387, 388, 384, 331]。对这些基,已知:若 \(k\) 充分大(依赖于 \(r\)),则 \(\mathbb N^{\wedge r}\) 是 \(k\) 阶基,并且进一步有
\[\tag{1.42} r_{k,\mathbb N^{\wedge r}}(n)=\Theta_{k,r}\!\left(n^{\frac{k}{r}-1}\right);\]注意这与 (1.21) 是相容的。
- 每个 \(x_j\) 的取值范围是 \(0\le x_j\le n^{1/r}\)(因为单个 \(x_j^r\le n\))。
- 不加约束时 \((x_1,\dots,x_k)\) 是一个边长约 \(n^{1/r}\) 的 \(k\) 维方块里的格点,共约 \((n^{1/r})^k=n^{k/r}\) 个。
- 约束 \(x_1^r+\dots+x_k^r=n\) 是一个方程,把维数从 \(k\) 降到 \(k-1\),相当于在解数上"除以"一个量级 \(n^{1/r}\cdot n^{-1/r}\cdots\);精确算下来,落在这张曲面附近的格点约为 \(n^{k/r}\big/ n=n^{\frac{k}{r}-1}\)。
- 于是表示数 \(r_{k,\mathbb N^{\wedge r}}(n)=\Theta_{k,r}(n^{k/r-1})\)。当 \(k\) 增大,这个数随 \(n\) 增长得越来越快——表示极其富余,正好留出"删点瘦身"的空间。
Choi、Erdős 与 Nathanson 在 [56] 中证明:\(\mathbb N^{\wedge 2}\)(即平方数集)含有一个 \(4\) 阶子基 \(B\),使得对一切 \(N>1\) 与一切 \(\varepsilon>0\) 都有 \(|B\cap[0,N]|=O_\varepsilon(N^{1/3+\varepsilon})\)。这被 Zöllner [387, 388] 推广:他证明对任意 \(k\ge 4\),都存在一个 \(k\) 阶子基 \(B\subset\mathbb N^{\wedge 2}\),使得对任意 \(\varepsilon>0\) 与 \(N>1\) 都有 \(|B\cap[0,N]|=O_{k,\varepsilon}(N^{1/k+\varepsilon})\)。这个界后来被进一步加强为 \(|B\cap[0,N]|=O_k(N^{1/k}\log^{1/k}N)\);由 (1.21) 我们知道,除了那个对数因子之外,这个界是最优的。Spencer 在 [331] 中给出了 Wirsing 关于 \(k=4\) 情形结果的一个简短证明。
对 \(r\ge 3\),已知的结果要少得多。1980 年,Nathanson [259] 证明 \(\mathbb N^{\wedge r}\) 含有某个阶的子基,其密度为 \(o(N^{1/r})\)。在同一篇论文里,他提出了问题 1.47 在 \(A=\mathbb N^{\wedge r}\) 时的一个特例。
在 [379] 中,Vu 对 \(A=\mathbb N^{\wedge r}\)(任意 \(r\ge 1\))肯定地回答了问题 1.46(从而也回答了问题 1.47):
- 每个充分大的 \(n\) 仍能写成 \(B\) 里 \(k\) 个平方数之和(\(B\) 还是 \(k\) 阶基);
- 这样的写法数目 \(r_{k,B}(n)=O(\log n)\)(薄);
- 留下的元素在 \([0,N]\) 里只有约 \(N^{1/k}\log^{1/k}N\) 个——已逼近理论下限 \(N^{1/k}\)。
核心命题:随机子集几乎必然是薄基
正如定理 1.15 是命题 1.44 的推论一样,定理 1.48 是下述命题的直接推论。
- 要使 \(n\) 能表示,需要 \(x_1^r+\dots+x_k^r=n\) 这样的 \(k\)-元组中,至少有一组的 \(k\) 个元素全部被保留。
- 一组被全部保留的概率约为 \(\prod_{j=1}^k P(x_j^r\in B)\approx \prod_j C x_j^{r/k-1}\log^{1/k}x_j\)。
- 把这个乘积对所有 \(\Theta(n^{k/r-1})\) 个 \(k\)-元组求和,得到期望表示数 \(E(Y_n)\)。代入概率后量纲恰好抵消掉那个 \(n^{k/r-1}\),只剩下 \(C^k\log n\) 量级(见下文 (1.43))。
- 所以期望 \(\approx C^k\log n\):取 \(C\) 大可保证 \(\ge1\)(基的资格),而 \(\log n\) 的增长正是"薄"所要求的上界。指数 \(\tfrac{r}{k}-1\) 是负的,意味着越大的数被保留的概率越小——大数本来表示就多,要删得更狠。
- \(t_x=\mathbb I(x^r\in B)\) 是独立的 \(0/1\) 随机变量(第 \(x\) 个 \(r\) 次方数是否被保留)。
- \(Y_n=\sum_A\prod_{x\in A}t_x\) 数的是"全部元素都被保留"的合法 \(k\)-元组数,正是表示数 \(R(n)\) 的主部。
- 取期望时 \(E(t_x)=P(x^r\in B)\),乘积展开就出现 \(C^k\prod x_j^{r/k-1}\log^{1/k}x_j\)。
- (1.43) 是纯粹的计数/积分引理:那一堆负指数幂在约束曲面上求和恰好等于常数量级 \(\Theta_{r,k}(1)\),这正是把 \(n^{k/r-1}\) 抵消干净、只留 \(\log n\) 的技术核心。
- 取 \(r=2,k=4\)。把 \(\mathbb N^{\wedge 2}\) 中第 \(x\) 个平方数以概率 \(\min(Cx^{2/4-1}\log^{1/4}x,1)=\min(Cx^{-1/2}\log^{1/4}x,1)\) 保留。随着 \(x\) 增大,这个概率是增大还是减小?这与"大数表示太多、要删得更狠"是否一致?
- 说明:为什么薄基在 \([0,N]\) 中的元素个数不可能少于常数倍 \(N^{1/k}\)?(提示:用上文"\(M\) 个元素最多产生 \(O_k(M^k)\) 个和"。)
- 在命题 1.50 的期望式中,把每个 \(x_j\) 都近似看成 \(n^{1/r}\),元组数近似看成 \(n^{k/r-1}\),验证 \(C^k\cdot n^{k/r-1}\cdot (n^{1/r})^{k(r/k-1)}\cdot(\log n)\) 化简后确实约为 \(C^k\log n\)。
返回 全书目录