1.10 附录:素数的分布Appendix: the distribution of the primes
本页为译文 + 高中讲解合一:黑色正文为忠实翻译;彩色框(目标 / 例 / 分步推演 / 注记)与配图为面向高中生的详解,逐步推演、举例、画图,不用比喻。本节是数论附录,核心是几条关于“素数有多密”的初等估计,证明出奇地漂亮,请耐心跟随每一步动机。
本章中有若干结果依赖于关于素数集合 \[P=\{2,3,5,\dots\}\] 之分布的一些事实。这个集合的分布当然是解析数论中一个研究得非常透彻的课题,其中最基本的结果之一便是素数定理(prime number theorem): \[\tag{1.44}|P\cap[1,n]|=(1+o(1))\,\frac{n}{\log n}.\] 一个等价的表述是:若 \(p_k\) 表示第 \(k\) 个素数,则 \(p_k=(1+o(1))\,k\log k\)。著名的、至今仍未解决的黎曼猜想(Riemann hypothesis)等价于下面这个更强的论断:对任意 \(\varepsilon>0\), \[\tag{1.45}|P\cap[1,n]|=\int_2^{n}\frac{dx}{\log x}+O_\varepsilon\!\left(n^{1/2+\varepsilon}\right),\] 或等价地说,对任意 \(\varepsilon>0\) 有 \(p_k=k\log k+O_\varepsilon\!\left(k^{1/2+\varepsilon}\right)\)。
素数定理相当深刻,这里不予证明。本附录中我们呈现一些相关的结果,其中大多数都有出人意料地初等而优美的证明。由于它们在本质上属于数论而非概率,我们选择把这些结果放在本章的附录里。
我们从 Chebyshev 与 Mertens 的一些经典估计开始。按照惯例,当对变量 \(p\) 求和时,\(p\) 理解为表示一个素数。
- (1.46):把素数的“对数”加起来,约为 \(n\)。等价于 \(\prod_{p\le n}p\approx e^{n}\),即素数之积大约是 \(e^n\)——这给出了素数“不太少”的下界感。
- (1.47):加权 \(1/p\) 后再乘 \(\log p\),结果约为 \(\log n\)。这是通向 (1.48) 的跳板。
- (1.48):最有名的一条——素数倒数之和发散,且增长速度恰为 \(\log\log n\)。它比“调和级数 \(\sum 1/k\approx\log n\) 发散”更强地告诉我们素数有多稠密。
命题 1.51 的证明
第一步:证明 (1.46)
证明. 我们首先证明 (1.46)。不失一般性,可设 \(n\) 为 \(2\) 的幂。考虑二项式系数 \(\binom{2n}{n}\)。由 Pascal 公式(即 \(\sum_{k}\binom{2n}{k}=2^{2n}=4^n\),而 \(\binom{2n}{n}\) 只是其中一项)我们知道 \[\binom{2n}{n}\le 4^n.\] 另一方面,显然每个介于 \(n\) 与 \(2n\) 之间的素数都整除 \(\binom{2n}{n}\)。因此 \[\prod_{n
♦
取对数即把“乘积 \(\le 4^n\)”变成“对数之和 \(\le n\log4=O(n)\)”。
第二步:证明 (1.47)
现在我们证明 (1.47)。这是一个类似的论证,但围绕阶乘 \(n!\) 而非 \(\binom{2n}{n}\) 展开。注意到整除 \(n!\) 的素数只能是那些不超过 \(n\) 的素数。对每个素数 \(p\le n\),介于 \(1\) 与 \(n\) 之间能被 \(p\) 整除的数有 \(\lfloor n/p\rfloor\) 个,能被 \(p^2\) 整除的有 \(\lfloor n/p^2\rfloor\) 个,依此类推。因此 \[\tag{1.49}n!=\prod_{p\le n}p^{\,\lfloor n/p\rfloor+\lfloor n/p^2\rfloor+\cdots}.\] 对两边取对数,并应用 Stirling 公式(习题 1.10.1),我们得到 \[n\log n+O(n)=\sum_{p\le n}\bigl(\lfloor n/p\rfloor+\lfloor n/p^2\rfloor+\cdots\bigr)\log p.\] 由于 \[\lfloor n/p\rfloor+\lfloor n/p^2\rfloor+\cdots=\frac{n}{p}+O(1)+O\!\left(\frac{n}{p^2}\right),\] 经过一些整理,我们得出 \[n\log n+O(n)=\sum_{p\le n}\frac{n\log p}{p}+\sum_{p\le n}O(\log p)+\sum_{p\le n}O\!\left(\frac{n\log p}{p^2}\right).\] 由于 \(\sum_k\frac{\log k}{k^2}\) 收敛,最后一项是 \(O(n)\)。结合 (1.46)(它给出 \(\sum_{p\le n}O(\log p)=O(n)\)),结论随之得到。♦
- 是 \(p\) 倍数的因子各至少贡献 \(1\) 个 \(p\),这样的因子有 \(\lfloor n/p\rfloor\) 个。
- 是 \(p^2\) 倍数的因子额外再贡献 \(1\) 个 \(p\)(因为它含 \(p^2\)),这样的因子有 \(\lfloor n/p^2\rfloor\) 个。
- 是 \(p^3\) 倍数的再额外贡献 \(1\) 个,\(\dots\) 如此累加。
- 第一项 \(\lfloor n/p\rfloor=\dfrac np+O(1)\),因为去掉小数部分最多差 \(1\)。
- 剩下的尾巴 \(\lfloor n/p^2\rfloor+\lfloor n/p^3\rfloor+\cdots\le \dfrac n{p^2}+\dfrac n{p^3}+\cdots=\dfrac{n/p^2}{1-1/p}=O\!\left(\dfrac n{p^2}\right)\)(几何级数)。
第三步:用 Abel 求和法从 (1.47) 推出 (1.48)
我们将利用 Abel 求和技巧从 (1.47) 推出 (1.48),即把一个关于素数的部分和改写成另一些部分和的平均。由微积分基本定理注意到 \[\frac{1}{p}=\frac{\log p}{p}\cdot\frac{1}{\log p}=\frac{\log p}{p}\int_p^{\infty}\frac{dt}{t\log^2 t}=\frac{\log p}{p}\int_1^{\infty}I(t>p)\,\frac{dt}{t\log^2 t},\] 因而 \[\sum_{p\le n}\frac{1}{p}=\sum_{p\le n}\frac{\log p}{p}\int_1^{\infty}I(t>p)\,\frac{dt}{t\log^2 t}.\] 交换求和与积分的次序,我们得到 \[\sum_{p\le n}\frac{1}{p}=\int_1^{\infty}\Bigl(\sum_{p\le t}\frac{\log p}{p}\Bigr)\frac{dt}{t\log^2 t}.\] 应用 (1.47),我们得到 \[\sum_{p\le n}\frac{1}{p}=\int_1^{\infty}\bigl(\log t+O(1)\bigr)\frac{dt}{t\log^2 t}.\] 由于 \(\dfrac{\log t}{t\log^2 t}=\dfrac{1}{t\log t}\) 的原函数是 \(\log\log t\),而 \(\dfrac{1}{t\log^2 t}\) 是绝对可积的,结论随之得到。♦
- 恒等式:\(\displaystyle\int_p^\infty\frac{dt}{t\log^2 t}=\Bigl[-\frac{1}{\log t}\Bigr]_p^\infty=\frac{1}{\log p}\)。所以 \(\dfrac{\log p}{p}\cdot\dfrac{1}{\log p}=\dfrac1p\),等式成立。
- 引入指示函数:把下限 \(p\) 写成 \(\int_1^\infty I(t>p)\,(\cdots)\),这样积分下限统一为 \(1\),便于交换次序。
- 交换求和与积分:原来是“先对每个 \(p\) 积分、再求和”;交换后是“先在固定 \(t\) 处把满足 \(p
- 代入 (1.47):内层和 \(=\log t+O(1)\),于是积分变成 \(\int_1^\infty(\log t+O(1))\frac{dt}{t\log^2 t}\)。
- 算积分:主项 \(\int\frac{\log t}{t\log^2 t}dt=\int\frac{dt}{t\log t}=\log\log t\),从 \(\sim\) 到 \(n\) 给出 \(\log\log n\);误差项 \(\int O(1)\frac{dt}{t\log^2t}\) 收敛,是 \(O(1)\)。合起来 \(\sum_{p\le n}\frac1p=\log\log n+O(1)\)。
素数在区间中的分布
我们现在转向一个关于素数在区间中分布的更深刻的事实。
此类结果最早由 Hoheisel [183] 给出;这里所述形式归功于 Ingham [188]。注意,本定理可由黎曼猜想 (1.45) 立即推出。然而,本定理也可以不使用黎曼猜想而证明,只需用到关于黎曼 \(\zeta\) 函数零点分布的一些较弱(但仍非常不平凡)的事实:参见 [170]。我们指出,如果只追求 \(|P\cap[n-x,n)|\) 的上界,那么可以用相对初等的筛法来确立该论断。常数 \(2/3\) 已被降低(当前纪录是 \(7/12\),见 [187]、[178])。然而,对这里的应用而言,任何小于 \(1\) 的指数都已足够。
我们现在把这条定理与 Abel 求和法结合,建立一些关于素数求和的进一步估计。
证明. 我们先证明 (1.50)。由微积分基本定理,对一切 \(p\in P\cap[1,n-n^{2/3})\) 有
\[\frac{1}{n-p}=\int_1^{\infty}I\bigl(p\in[n-x,\,n-n^{2/3})\bigr)\frac{1}{x^2}\,dx,\]
因而
\[\sum_{p\in P\cap[1,\,n-n^{2/3})}\frac{1}{n-p}=\int_1^{\infty}\bigl|P\cap[n-x,\,n-n^{2/3})\bigr|\,\frac{dx}{x^2}.\]
当 \(x\le n^{2/3}\) 时被积函数为零。当 \(n^{2/3}
- 恒等式:当 \(a=n-p>0\) 时,\(\displaystyle\int_a^\infty\frac{dx}{x^2}=\frac1a=\frac{1}{n-p}\)。用指示函数 \(I(p\in[n-x,n-n^{2/3}))\) 把下限 \(x\ge n-p\) 表达出来。
- 交换次序:求和与积分交换后,内层变成“对固定 \(x\),落在 \([n-x,n-n^{2/3})\) 里的素数个数”,即 \(|P\cap[n-x,n-n^{2/3})|\)。
- 分段用定理 1.53:按 \(x\) 的大小把积分分成三段—— \(x\le n^{2/3}\) 区间为空、被积函数为 \(0\);中段与右段用定理 1.53 把素数个数换成 \(\Theta(\cdot/\log n)\)。
- 逐段积分相加:主要贡献来自 \(n^{2/3}
n\) 那段贡献也是 \(O(1)\)。合起来 (1.50) 成立。 - (1.51) 顺带得到:在求和范围内 \(n-p\) 介于 \(n^{2/3}\) 与 \(n\) 之间,故 \(\log(n-p)\) 总是在 \(\tfrac23\log n\) 与 \(\log n\) 之间,即 \(\Theta(\log n)\)。把这个公共因子提出来乘上 (1.50),就得到 (1.51) 的 \(\Theta(\log n)\)。
习题
返回 全书目录