Waring 问题:渐近公式Waring's problem: the asymptotic formula
我们回到处理 Waring 问题的工作起点,也就是第 2 章的 (2.7):
\[ r(N)=\int_0^1 (T(\alpha))^s e(-N\alpha)\,d\alpha, \tag{4.1} \]其中 \(T(\alpha)\) 是 (2.5) 中那个从 \(1\) 到 \(P\) 求和的指数和,且 \(P\ge[N^{1/k}]\)。没有必要把 \(P\) 取得比所需更大,所以我们取 \(P=[N^{1/k}]\)。渐近公式中的主项将被证明具有 \(N^{s/k-1}\),亦即 \(P^{s-k}\) 的量级;事实上,只要任何简单的渐近公式成立,它就必须如此,因为这是 \(P\) 的唯一一个与下述事实相容的幂次:\(x_1,\dots,x_s\) 各有 \(P^s\) 种取法,而和 \(x_1^k+\dots+x_s^k\) 表示的是至多 \(P^k\) 量级的数。
于是,凡是对积分 (4.1) 的贡献能被证明严格低于 \(P^{s-k}\) 量级的那些 \(\alpha\) 取值集合,我们都可以略去。我们假设 \(s\ge 2^k+1\),若把被积表达式的绝对值看作
\[ |T(\alpha)|^{s-2^k}\,|T(\alpha)|^{2^k}, \]那么由引理 3.2 可知:凡是满足 \(|T(\alpha)|\ll P^{1-\delta}\)(其中 \(\delta>0\) 为某固定数)的任何 \(\alpha\) 集合都可以略去。为得到这样一个 \(\alpha\) 集合,我们将使用引理 3.1。
处理 Waring 问题及类似问题的工作中,一般性方案是把 \(\alpha\) 的取值分为两个集合:主弧(major arcs),它对渐近公式中的主项有贡献;以及次弧(minor arcs),它的贡献按上面所述方式估计,归入误差项。两个集合之间精确的分界线,在很大程度上取决于手头有哪些可用的辅助结果,并且在某种程度上可能因人的偏好而异。一般而言,处理主弧有一些强有力的(虽然略嫌繁复的)方法可用,而问题的关键在于次弧。在任何具体问题中,一旦找到了一种能成功处理次弧的方法,人们通常会发现:在该方法所允许的范围内尽可能扩大次弧是方便的,这样可以减少处理主弧所需的工作量(尽管这部分工作可能相对直接)。在本章的处理中,与本课题其他场合常见的情形相比,我们可以把主弧取得数目较少且长度较短。
围绕每个有理数 \(a/q\)(既约形式),我们放置一个区间
\[ \mathfrak{M}_{a,q}:\quad |\alpha-a/q|\lt P^{-k+\delta}, \tag{4.2} \]并且对下述 \(q,a\) 都这样做:
\[ 1\le q\le P^{\delta},\quad 1\le a\le q,\quad (a,q)=1. \tag{4.3} \]这些区间不重叠,因为它们的中心之间的距离至少为 \(P^{-2\delta}\),而这远大于区间的长度。此外,除右端的 \(1/1\) 处那个区间的右半部分外,这些区间都包含在 \(0\le\alpha\le 1\) 内;为方便起见,我们设想把那个区间向左平移一个量 \(1\),使它落到 \(\alpha=0\) 的右侧。区间 \(\mathfrak{M}_{a,q}\) 就是主弧,它们关于 \([0,1]\) 的补集构成次弧,其全体记作 \(\mathfrak{m}\)。在这些定义中,\(\delta\) 是某个固定的小正数。可以指出:在 Hardy–Littlewood 方法的许多应用中,(4.2) 中 \(\mathfrak{M}_{a,q}\) 的长度会带有一个因子 \(q^{-1}\) 以及 \(P\) 的某个负幂;但此处不需要这个因子,省略它是一个轻微的简化。
可以指出:除了诉诸 Dirichlet 定理之外,我们也可以利用连分数的一个简单性质:若取 \(a/q\) 为满足 \(q\le P^{k-\delta}\) 的 \(\alpha\) 的最后一个渐近分数,我们同样会得到 (4.4)。
现在我们把注意力转向主弧 \(\mathfrak{M}_{a,q}\)。这里 \(\alpha\) 非常接近 \(a/q\),且 \(q\) 相对较小。如果 (4.2) 中 \(P\) 的指数取的是 \(-k-\delta\) 而非 \(-k+\delta\),则 \(T(\alpha)\) 在 \(\mathfrak{M}_{a,q}\) 上将几乎是常数,因为那时我们应有
\[ \left|\alpha x^k-\frac{a}{q}x^k\right|\lt P^{-k-\delta}P^k=P^{-\delta}. \]当然,情形并非如此,但尽管如此,弧 \(\mathfrak{M}_{a,q}\) 是如此之短,以至于 \(T(\alpha)\) 在该区间上的变化相对平缓。它究竟如何变化,可由下面的引理看出。
我们需要估计对 \(y\) 求和与对应的积分之差。就目前的目的而言,一个很粗糙的论证就足够好了。若 \(f(y)\) 是任何可微函数,则有 \[ |f(\eta)-f(y)|\le\tfrac{1}{2}\max|f'(\eta)|\quad\text{当 }|\eta-y|\le\tfrac{1}{2}. \] 因此,把任何区间 \(A\lt \eta\lt B\) 划分为长度为 \(1\) 的若干小区间外加两段可能的残余区间,我们得到 \[ \left|\int_A^B f(\eta)\,d\eta-\sum_{A\lt y\lt B}f(y)\right|\ll(B-A)\max|f'(\eta)|+\max|f(\eta)|. \] 在我们的情形,\(f(\eta)=e(\beta(q\eta+z)^k)\),因而 \[ \max|f'(\eta)|\ll q|\beta|P^{k-1},\quad \max|f(\eta)|=1. \] 又 \(B-A\ll P/q\)。因此,把对 \(y\) 的求和换成对 \(\eta\) 的积分所产生的误差是 \[ \ll Pq^{-1}q|\beta|P^{k-1}+1\ll P^{\delta}, \] 因为由 (4.2) 有 \(|\beta|\lt P^{-k+\delta}\)。乘以 \(q\)(它 \(\le P^{\delta}\))以便处理外层对 \(z\) 的求和,我们便得到 (4.5) 中的误差项。∎
稍后在引理 9.1 中,我们将遇到一种更有效的、用对应积分替换求和的方法。
还需估计 (4.11) 中误差项的影响。在 \(|\beta|\lt P^{-k+\delta}\) 上积分后,它变为 \(\ll P^{s-k-1+3\delta}\)。对 \(a\le q\) 与 \(q\le P^{\delta}\) 求和后,它变为 \(P^{s-k-1+5\delta}\),由于 \(\delta\) 很小,这就是 (4.8) 中所给的形式。∎
这称为将 \(N\) 表示为 \(s\) 个正整数 \(k\) 次幂之和这一问题的奇异级数(singular series)。若 \(s\ge 2^k+1\),则该级数绝对收敛,且关于 \(N\) 一致收敛;因为由引理 3.1 的推论我们有(其中 \(K=2^{k-1}\)):
\[ |(q^{-1}S_{a,q})^s e(-Na/q)|\ll q^{-s/K+\varepsilon}\ll q^{-2-1/K+\varepsilon}. \]稍后我们将证明:在更宽松的条件 \(s\ge 2k+1\) 下,同样的结论也成立。
由级数 \(\mathfrak{S}(N)\) 的绝对收敛性,以及刚刚为 \(J(P^{\delta})\) 所证的结果,我们可以在 (4.15) 中把 \(\mathfrak{S}(P^{\delta},N)\) 换成 \(\mathfrak{S}(N)\),并把 \(J(P^{\delta})\) 换成 \(J\),所产生的误差都是允许的。我们还可以把 \(P\) 换成 \(N^{1/k}\),误差也允许,这便给出 (4.13),只是其中 \(C_{k,s}=J\) 的证明尚未完成。\(J\) 的确切值或许并不重要,但我们需要知道 \(J>0\)。
为求出 \(J\),我们从下述事实出发: \[ \int_{-\lambda}^{\lambda}e(\mu\gamma)\,d\gamma=\frac{\sin 2\pi\lambda\mu}{\pi\mu}. \] 因此 \[ \begin{aligned} k^s J&=\lim_{\lambda\to\infty}\int_0^1\cdots\int_0^1(\zeta_1\cdots\zeta_s)^{-1+1/k}\frac{\sin 2\pi\lambda(\zeta_1+\cdots+\zeta_s-1)}{\pi(\zeta_1+\cdots+\zeta_s-1)}\,d\zeta_1\cdots d\zeta_s\\ &=\lim_{\lambda\to\infty}\int_0^s\phi(u)\frac{\sin 2\pi\lambda(u-1)}{\pi(u-1)}\,du, \end{aligned} \] 其中 \[ \phi(u)=\int_0^1\cdots\int_0^1\{\zeta_1\cdots\zeta_{s-1}(u-\zeta_1-\cdots-\zeta_{s-1})\}^{-1+1/k}\,d\zeta_1\cdots d\zeta_{s-1}, \] 积分取遍满足 \(u-1\lt \zeta_1+\cdots+\zeta_{s-1}\lt u\) 的那些 \(\zeta_1,\dots,\zeta_{s-1}\)。这里我们已经把变量从 \(\zeta_s\) 换成了 \(u\),其中 \(\zeta_1+\cdots+\zeta_s=u\)。
现在我们回忆有限区间上的 Fourier 积分定理,它指出1:在某些条件下, \[ \lim_{\lambda\to\infty}\int_A^B\phi(u)\frac{\sin 2\pi\lambda(u-C)}{\pi(u-C)}\,du=\phi(C), \] 只要 \(A\lt C\lt B\)。假定这是可应用的,我们推出 \[ \begin{aligned} k^s J&=\phi(1)\\ &=\int_0^1\cdots\int_0^1\{\zeta_1\cdots\zeta_{s-1}(1-\zeta_1-\cdots-\zeta_{s-1})\}^{-1+1/k}\,d\zeta_1\cdots d\zeta_{s-1}, \end{aligned} \] 其中积分取遍满足 \(0\lt \zeta_1+\cdots+\zeta_{s-1}\lt 1\) 的那些 \(\zeta_1,\dots,\zeta_{s-1}\)。最后这个定积分是一个 \(s-1\) 个变量的积分,它是 Dirichlet 所求出的一类积分的一个实例;它确实是 Euler 积分 \[ B(p,q)=\int_0^1 x^{p-1}(1-x)^{q-1}\,dx=\frac{\Gamma(p)\Gamma(q)}{\Gamma(p+q)} \] 的一个直接推广。我们有2 \[ \phi(1)=\frac{\Gamma(1/k)^s}{\Gamma(s/k)}, \] 因而 \[ J=\left(\frac{1}{k}\right)^s\frac{\Gamma(1/k)^s}{\Gamma(s/k)}=\frac{\Gamma(1+1/k)^s}{\Gamma(s/k)}. \] Fourier 积分定理成立的一个充分条件是 \(\phi(u)\) 应当是有界变差的。为验证这一点,令 \(\zeta_j=ut_j\)。那么 \(\phi(u)\) 等于 \[ u^{s/k-1}\int_0^{1/u}\cdots\int_0^{1/u}\{t_1\cdots t_{s-1}(1-t_1-\cdots-t_{s-1})\}^{-1+1/k}\,dt_1\cdots dt_{s-1}, \] 其中积分取遍满足 \(1-1/u\lt t_1+\cdots+t_{s-1}\lt 1\) 的那些 \(t_1,\dots,t_{s-1}\)。当 \(u\) 增大时积分区域收缩,而被积函数不含 \(u\)。因此 \(\phi(u)\) 是 \(u^{-1+s/k}\) 与 \(u\) 的一个正的单调递减函数之积,从而是一个有界变差函数。这就完成了证明。∎
在渐近公式 (4.13) 中,可以把第一个因子 \(C_{k,s}N^{s/k-1}\) 看作度量了方程
\[ x_1^k+\cdots+x_s^k=N,\quad x_1>0,\dots,x_s>0 \]在实数中解的"密度";它是某超曲面这一部分的 \((s-1)\) 维测度。换一种说法,它(在可忽略的误差范围内)是区域
\[ N-\tfrac{1}{2}\lt x_1^k+\cdots+x_s^k\lt N+\tfrac{1}{2},\quad x_1>0,\dots,x_s>0 \]的 \(s\) 维体积。第二个因子 \(\mathfrak{S}(N)\) 可以看作一个补偿因子,用以反映这样一个事实:整数的 \(k\) 次幂并不像实数的 \(k\) 次幂那样均匀分布,因为前者受到同余限制的约束。(\(\mathfrak{S}(N)\) 与同余之间的关系将在下一节中浮现。)于是,我们从渐近公式中得出的结论,用略嫌含糊的话来说就是:把一个大数表示为 \(s\) 个正整数 \(k\) 次幂之和的表示数,渐近地由这两种影响所主导,前提是 \(s\) 大于 \(k\) 的某个函数。