Davenport · Analytic Methods for Diophantine Equations

奇异级数(续)The singular series continued

我们现在来证明在第3.1引理的推论中提到的那个结果,即

\[ |S_{a,q}| \ll q^{1-1/k}. \tag{6.1} \]

这蕴含了

\[ |A(q)| \ll q^{1-s/k}, \]

由此可知,若 \(s \geq 2k+1\),则奇异级数绝对收敛。第5章的 (5.8) 以及引理5.2的推论,在同一条件下也都成立。

引理 6.1. 若 \(a \not\equiv 0 \pmod p\) 且 \(\delta = (k, p-1)\),则 \[ |S_{a,p}| \leq (\delta - 1) p^{1/2}. \tag{6.2} \]
证. 由于 \(x^k \equiv m \pmod p\) 与 \(x^\delta \equiv m \pmod p\) 具有相同个数的解,我们有 \[ S_{a,p} = \sum_x e\!\left(\frac{a}{p} x^\delta\right). \] 设 \(\chi\) 是一个阶为 \(\delta\) 的原特征(模 \(p\))。那么 \(x^\delta \equiv t \pmod p\) 的解的个数为 \[ 1 + \chi(t) + \cdots + \chi^{\delta-1}(t). \] 因此 \[ S_{a,p} = \sum_t \left\{ 1 + \chi(t) + \cdots + \chi^{\delta-1}(t) \right\} e\!\left(\frac{a}{p} t\right), \tag{6.3} \] 其中此处(以及本证明中其他地方)求和都是对模 \(p\) 的一个完全剩余系进行的。来自方括号中项 1 的那个和为 0,因为 \(a \not\equiv 0 \pmod p\)。

若 \(\psi\) 是任何一个非主特征(模 \(p\)),则称和 \[ T(\psi) = \sum_t \psi(t) e\!\left(\frac{at}{p}\right) \] 为高斯和(Gauss sum),以纪念这类和在高斯的分圆论工作中所起的重要作用。我们可以很容易地证明 \(|T(\psi)| = p^{1/2}\),如下所示。我们有 \[ |T(\psi)|^2 = \sum_t \sum_u \psi(t) \overline{\psi}(u) e\!\left(\frac{a}{p}(t-u)\right). \] 这里我们可以略去 \(u = 0\),因为 \(\psi(0) = 0\)。把变量从 \(t\) 换成 \(v\),其中 \(t \equiv vu \pmod p\),我们得到 \[ |T(\psi)|^2 = \sum_v \sum_{u \neq 0} \psi(v) e\!\left(\frac{au}{p}(v-1)\right). \] 内层和当 \(v = 1\) 时为 \(p-1\),否则为 \(-\psi(v)\)。因此 \[ |T(\psi)|^2 = p\psi(1) - \sum_v \psi(v) = p. \] 这就是前面所述的结果。在 (6.3) 中对 \(\psi = \chi, \ldots, \chi^{\delta-1}\) 应用此结果,我们便得到 (6.2)。

注. (6.2) 在 \(p = 2\)(于是 \(\delta = 1\))时仍然成立,但此时它是平凡的,因为 \(a = 1\) 且 \(S_{1,2} = 1 + e^{i\pi} = 0\)。
引理 6.2. 设 \(a \not\equiv 0 \pmod p\) 且 \(p \nmid k\)。那么,对于 \(1 \lt \nu \leq k\), \[ S_{a,p^\nu} = p^{\nu-1}, \tag{6.4} \] 而对于 \(\nu > k\), \[ S_{a,p^\nu} = p^{k-1} S_{a,p^{\nu-k}}. \tag{6.5} \]
证. 在定义 \[ S_{a,p^\nu} = \sum_{x=0}^{p^\nu - 1} e\!\left(\frac{a}{p^\nu} x^k\right) \] 中,我们令 \(x = p^{\nu-1} y + z\),其中 \(0 \leq y \lt p\),\(0 \leq z \lt p^{\nu-1}\)。那么 \[ x^k \equiv z^k + k p^{\nu-1} z^{k-1} y \pmod{p^\nu}, \] 因为 \(2(\nu-1) \geq \nu\)。因此 \[ S_{a,p^\nu} = \sum_{z=0}^{p^{\nu-1}-1} \sum_{y=0}^{p-1} e\!\left(\frac{az^k}{p^\nu} + \frac{akz^{k-1}y}{p}\right). \] 由于 \(ak \not\equiv 0 \pmod p\),内层和为 0,除非 \(z \equiv 0 \pmod p\),此时它等于 \(p\)。因此,若 \(z = pw\), \[ S_{a,p^\nu} = p \sum_{w=0}^{p^{\nu-2}-1} e\!\left(\frac{aw^k}{p^{\nu-k}}\right). \] 若 \(\nu \leq k\),则最后这个和中所有项都为 1,于是得到 \(S_{a,p^\nu} = p^{\nu-1}\)。若 \(\nu > k\),一般项是 \(w\) 的周期函数,周期为 \(p^{\nu-k}\),因而 \[ S_{a,p^\nu} = p \, p^{k-2} S_{a,p^{\nu-k}}. \] 这就证明了这两个结果。(再次注意 \(p\) 可以等于 2。)
引理 6.3. 引理6.2的第二个结果在 \(p \mid k\) 时也成立。
证. 像之前一样令 \(k = p^\tau k_0\),并注意由于 \(\nu > k\),我们有 \[ \nu > p^\tau k_0 \geq 2^\tau \geq \tau + 1, \] 因而 \(\nu \geq \tau + 2\)。事实上,\(k \geq \tau + 2\),因为当 \(\tau = 1\) 时 \(k \geq 6\)。

我们修改前面的证明,令 \[ x = p^{\nu-\tau-1} y + z, \qquad 0 \leq y \lt p^{\tau+1}, \qquad 0 \leq z \lt p^{\nu-\tau-1}. \] 我们将要证明 \[ x^k \equiv z^k + k p^{\nu-\tau-1} z^{k-1} y \pmod p. \tag{6.6} \] 假定这一点,则证明可以像之前一样完成。因为这样一来 \[ S_{a,p^\nu} = \sum_{z=0}^{p^{\nu-\tau-1}-1} \sum_{y=0}^{p^{\tau+1}-1} e\!\left(\frac{az^k}{p^\nu} - \frac{ak_0 z^{k-1} y}{p}\right), \] 并且内层和同样为 0,除非 \(z \equiv 0 \pmod p\),因而 \[ \begin{aligned} S_{a,p^\nu} &= p^{\tau+1} \sum_{w=0}^{p^{\nu-\tau-2}-1} e\!\left(\frac{aw^k}{p^{\nu-k}}\right) \\ &= p^{\tau+1} p^{k-\tau-2} S_{a,p^{\nu-k}}. \end{aligned} \] 这就证明了 (6.5)。还需证明同余式 (6.6)。只需证明 \[ (z + p^{\nu-\tau-1} y)^{p^\tau} \equiv z^{p^\tau} + p^{\nu-1} z^{p^\tau - 1} y \pmod{p^\nu} \] 即可,因为接下来把两边升到 \(k_0\) 次方不会带来任何困难。令 \(\nu - \tau - 1 = \lambda\),我们要证明 \[ (z + p^\lambda y)^{p^\tau} \equiv z^{p^\tau} + p^{\lambda + \tau} z^{p^\tau - 1} y \pmod{p^{\lambda+\tau+1}}. \tag{6.7} \] 这并不像看上去那样显然,因为并非 \((A+B)^{p^\tau}\) 展开式中的所有二项式系数都能被 \(p^\tau\) 整除。然而,我们可以分阶段证明此结果(换句话说,对 \(\tau\) 作归纳)。我们首先证明 \[ (z + p^\lambda y)^p \equiv z^p + p^{\lambda+1} z^{p-1} y \pmod{p^{\lambda+2}} \tag{6.8} \] 其中要求 \(\lambda \geq 1\)(当 \(p > 2\) 时)或 \(\lambda \geq 2\)(当 \(p = 2\) 时)。二项式展开中唯一需要检验的项是最后一项;对此我们需要 \(\lambda p \geq \lambda + 2\),而当 \(p > 2\) 且 \(\lambda \geq 1\) 时,或当 \(p = 2\) 且 \(\lambda \geq 2\) 时,这是成立的。

最后,(6.7) 通过对 (6.8) 的重复应用而得出;在下一阶段我们得到 \[ \begin{aligned} (z + p^\lambda y)^{p^2} &= (z^p + p^{\lambda+1} z^{p-1} y_1)^p \\ &\equiv z^{p^2} + p^{\lambda+2} z^{p^2-1} y_1 \pmod{p^{\lambda+3}} \\ &\equiv z^{p^2} + p^{\lambda+2} z^{p^2-1} y \pmod{p^{\lambda+3}}, \end{aligned} \] 其中 \(y_1 \equiv y \pmod p\),并且我们在此用 \(\lambda+1\) 替代 \(\lambda\) 应用了 (6.8)。论证继续下去,便给出 (6.7)。

当 \(\lambda = \nu - \tau - 1\) 时,关于 \(\lambda\) 的条件得到满足。我们已经看到 \(\nu - \tau - 1 \geq 1\),而如前所注,若 \(p = 2\) 则有 \(\nu \geq k+1 \geq \tau + 3\)。因此证明完成。

引理 6.4. 当 \((a,q) = 1\) 时,\(|S_{a,q}| \ll q^{1-1/k}\)。
证. 令 \(T(a,q) = q^{-1+1/k} S_{a,q}\)。我们要证明 \(T(a,q)\) 有一个与 \(q\) 无关的界。若 \(q = p_1^{\nu_1} p_2^{\nu_2} \cdots\),则由引理5.1证明中 \(S_{a,q}\) 的乘性性质, \[ T(a,q) = T(a_1, p_1^{\nu_1}) T(a_2, p_2^{\nu_2}) \cdots, \] 其中 \(a_1, a_2, \ldots\) 取适当的值,每一个都与相应的 \(p^\nu\) 互素。由引理6.2的第二部分以及引理6.3,我们有 \[ T(a, p^\nu) = T(a, p^{\nu-k}) \] 对 \(\nu > k\) 成立,于是我们可以假定所有 \(\nu_i\) 都 \(\leq k\)。

由引理6.1, \[ T(a,p) \leq k p^{1/2} p^{-(1-1/k)} \leq k p^{-1/6}, \] 而由引理6.2的第一部分, \[ T(a,p^\nu) = p^{\nu-1} p^{-\nu(1-1/k)} \leq 1 \qquad \text{当 } 1 \lt \nu \leq k. \] 因此 \(T(a,p^\nu) \leq 1\),除非可能在 \(\nu = 1\) 且 \(p \leq k^6\) 的情形。于是 \[ T(a,q) \leq \prod_{p \leq k^6} (k p^{-1/6}), \] 而右边的数与 \(q\) 无关。

定理 6.1. 若 \(s \geq 2k+1\),则奇异级数 \(\mathfrak{S}(N)\) 以及乘积 \(\prod_p \chi(p)\) 绝对收敛,并且 \[ \mathfrak{S}(N) \geq C_1(k,s) > 0 \] 若 \(s \geq 2k+1\)(\(k\) 为奇数)或 \(s \geq 4k\)(\(k\) 为偶数)。
证. 绝对收敛性如前所述得出,只需用引理6.4代替引理3.1的推论;而最后的断言由引理5.6及引理5.2的推论得出。

定理6.1表明,就奇异级数本身而言(除 \(k=4\) 外),在改进条件 \(s \geq 2k+1\) 使其成立方面不会有任何困难。困难的关键在于次弧(minor arcs),而不在奇异级数。

注. 哈代(Hardy)与李特尔伍德(Littlewood)证明了奇异级数,以 \[ \sum_{q=1}^{\infty} A(q) \] 的形式,当 \(s \geq 4\) 时绝对收敛,对乘积形式也同样成立。其要旨在于确保对 \(a\) 求和时所发生的抵消,即 \[ \sum_{\substack{a=1 \\ (a,q)=1}}^{q} (q^{-1} S_{a,q})^s e\!\left(\frac{-Na}{q}\right). \] 然而,这种绝对收敛对 \(N\) 不再是一致的。若取 \(q^{-1} S_{a,q}\) 的绝对值,则定理6.1中的条件 \(s \geq 2k+1\) 是最优的(best possible)。

一个有趣的问题是:奇异级数之和 \(\mathfrak{S}(N)\) 是如何随 \(N\) 波动的。每个因子 \(\chi(p)\) 主要取决于 \(N\) 所属的剩余类(模 \(p^7\))。随 \(N\) 波动最大的因子是那些 \(p\) 整除 \(k\) 的因子,但那些 \(p-1\) 与 \(k\) 有较大公因子的因子也可能波动得相当可观。

在他们早期的论文中,哈代与李特尔伍德主要使用 \(\mathfrak{S}(N)\) 的用指数和 \(S_{a,q}\) 表示的定义,而不是用同余式(模 \(p^\nu\))的表达式。在 P.N. II [38] 中,他们必须证明 \(\mathfrak{S}(N)\) 在 \(k=4\)、\(s=21\) 情形下有正下界。在此情形下波动最大的因子 \(\chi(p)\) 是 \(\chi(2)\) 和 \(\chi(5)\);所有其他因子之积与 1 相差不大。他们发现 \(\chi(5)\) 在约 0.7 与 1.3 之间变化。但 \(\chi(2)\) 的变化幅度约为 200 倍。哈代与李特尔伍德证明了(在所提及的特定情形下) \[ \begin{aligned} \chi(2) =\ & 1 - 1.3307 \cos\frac{(2N-5)\pi}{16} + 0.415 \cos\frac{(6N+1)\pi}{16} \\ & - 0.3793 \cos\frac{(2N+3)\pi}{8} + \varepsilon(N), \end{aligned} \] 其中 \(|\varepsilon(N)| \lt 0.002\)。可以验证,当 \(N \equiv 2\) 或 \(3 \pmod{16}\) 时,\(\chi(2)\) 变得非常小(但仍为正)。当 \(N \equiv 10\) 或 \(11 \pmod{16}\) 时它相对较大。这些结果对应于这样一个事实:\(x^4 \equiv 0\) 或 \(1 \pmod{16}\),因而在 \(x_1^4 + \cdots + x_{21}^4 \equiv N \pmod{16}\) 中对 \(x_1, \ldots, x_{21}\) 的选择,在前一种情形下要比后一种情形下受到更多的限制。