Davenport · Analytic Methods for Diophantine Equations

奇异级数（续）The singular series continued

我们现在来证明在第3.1引理的推论中提到的那个结果，即

\[ |S_{a,q}| \ll q^{1-1/k}. \tag{6.1} \]

这蕴含了

\[ |A(q)| \ll q^{1-s/k}, \]

由此可知，若 \(s \geq 2k+1\)，则奇异级数绝对收敛。第5章的 (5.8) 以及引理5.2的推论，在同一条件下也都成立。

引理 6.1. 若 \(a \not\equiv 0 \pmod p\) 且 \(\delta = (k, p-1)\)，则 \[ |S_{a,p}| \leq (\delta - 1) p^{1/2}. \tag{6.2} \]

证. 由于 \(x^k \equiv m \pmod p\) 与 \(x^\delta \equiv m \pmod p\) 具有相同个数的解，我们有 \[ S_{a,p} = \sum_x e\!\left(\frac{a}{p} x^\delta\right). \] 设 \(\chi\) 是一个阶为 \(\delta\) 的原特征（模 \(p\)）。那么 \(x^\delta \equiv t \pmod p\) 的解的个数为 \[ 1 + \chi(t) + \cdots + \chi^{\delta-1}(t). \] 因此 \[ S_{a,p} = \sum_t \left\{ 1 + \chi(t) + \cdots + \chi^{\delta-1}(t) \right\} e\!\left(\frac{a}{p} t\right), \tag{6.3} \] 其中此处（以及本证明中其他地方）求和都是对模 \(p\) 的一个完全剩余系进行的。来自方括号中项 1 的那个和为 0，因为 \(a \not\equiv 0 \pmod p\)。

若 \(\psi\) 是任何一个非主特征（模 \(p\)），则称和 \[ T(\psi) = \sum_t \psi(t) e\!\left(\frac{at}{p}\right) \] 为高斯和（Gauss sum），以纪念这类和在高斯的分圆论工作中所起的重要作用。我们可以很容易地证明 \(|T(\psi)| = p^{1/2}\)，如下所示。我们有 \[ |T(\psi)|^2 = \sum_t \sum_u \psi(t) \overline{\psi}(u) e\!\left(\frac{a}{p}(t-u)\right). \] 这里我们可以略去 \(u = 0\)，因为 \(\psi(0) = 0\)。把变量从 \(t\) 换成 \(v\)，其中 \(t \equiv vu \pmod p\)，我们得到 \[ |T(\psi)|^2 = \sum_v \sum_{u \neq 0} \psi(v) e\!\left(\frac{au}{p}(v-1)\right). \] 内层和当 \(v = 1\) 时为 \(p-1\)，否则为 \(-\psi(v)\)。因此 \[ |T(\psi)|^2 = p\psi(1) - \sum_v \psi(v) = p. \] 这就是前面所述的结果。在 (6.3) 中对 \(\psi = \chi, \ldots, \chi^{\delta-1}\) 应用此结果，我们便得到 (6.2)。∎

注. (6.2) 在 \(p = 2\)（于是 \(\delta = 1\)）时仍然成立，但此时它是平凡的，因为 \(a = 1\) 且 \(S_{1,2} = 1 + e^{i\pi} = 0\)。

引理 6.2. 设 \(a \not\equiv 0 \pmod p\) 且 \(p \nmid k\)。那么，对于 \(1 \lt \nu \leq k\)， \[ S_{a,p^\nu} = p^{\nu-1}, \tag{6.4} \] 而对于 \(\nu > k\)， \[ S_{a,p^\nu} = p^{k-1} S_{a,p^{\nu-k}}. \tag{6.5} \]

证. 在定义 \[ S_{a,p^\nu} = \sum_{x=0}^{p^\nu - 1} e\!\left(\frac{a}{p^\nu} x^k\right) \] 中，我们令 \(x = p^{\nu-1} y + z\)，其中 \(0 \leq y \lt p\)，\(0 \leq z \lt p^{\nu-1}\)。那么 \[ x^k \equiv z^k + k p^{\nu-1} z^{k-1} y \pmod{p^\nu}, \] 因为 \(2(\nu-1) \geq \nu\)。因此 \[ S_{a,p^\nu} = \sum_{z=0}^{p^{\nu-1}-1} \sum_{y=0}^{p-1} e\!\left(\frac{az^k}{p^\nu} + \frac{akz^{k-1}y}{p}\right). \] 由于 \(ak \not\equiv 0 \pmod p\)，内层和为 0，除非 \(z \equiv 0 \pmod p\)，此时它等于 \(p\)。因此，若 \(z = pw\)， \[ S_{a,p^\nu} = p \sum_{w=0}^{p^{\nu-2}-1} e\!\left(\frac{aw^k}{p^{\nu-k}}\right). \] 若 \(\nu \leq k\)，则最后这个和中所有项都为 1，于是得到 \(S_{a,p^\nu} = p^{\nu-1}\)。若 \(\nu > k\)，一般项是 \(w\) 的周期函数，周期为 \(p^{\nu-k}\)，因而 \[ S_{a,p^\nu} = p \, p^{k-2} S_{a,p^{\nu-k}}. \] 这就证明了这两个结果。（再次注意 \(p\) 可以等于 2。）∎

引理 6.3. 引理6.2的第二个结果在 \(p \mid k\) 时也成立。

证. 像之前一样令 \(k = p^\tau k_0\)，并注意由于 \(\nu > k\)，我们有 \[ \nu > p^\tau k_0 \geq 2^\tau \geq \tau + 1, \] 因而 \(\nu \geq \tau + 2\)。事实上，\(k \geq \tau + 2\)，因为当 \(\tau = 1\) 时 \(k \geq 6\)。

我们修改前面的证明，令 \[ x = p^{\nu-\tau-1} y + z, \qquad 0 \leq y \lt p^{\tau+1}, \qquad 0 \leq z \lt p^{\nu-\tau-1}. \] 我们将要证明 \[ x^k \equiv z^k + k p^{\nu-\tau-1} z^{k-1} y \pmod p. \tag{6.6} \] 假定这一点，则证明可以像之前一样完成。因为这样一来 \[ S_{a,p^\nu} = \sum_{z=0}^{p^{\nu-\tau-1}-1} \sum_{y=0}^{p^{\tau+1}-1} e\!\left(\frac{az^k}{p^\nu} - \frac{ak_0 z^{k-1} y}{p}\right), \] 并且内层和同样为 0，除非 \(z \equiv 0 \pmod p\)，因而 \[ \begin{aligned} S_{a,p^\nu} &= p^{\tau+1} \sum_{w=0}^{p^{\nu-\tau-2}-1} e\!\left(\frac{aw^k}{p^{\nu-k}}\right) \\ &= p^{\tau+1} p^{k-\tau-2} S_{a,p^{\nu-k}}. \end{aligned} \] 这就证明了 (6.5)。还需证明同余式 (6.6)。只需证明 \[ (z + p^{\nu-\tau-1} y)^{p^\tau} \equiv z^{p^\tau} + p^{\nu-1} z^{p^\tau - 1} y \pmod{p^\nu} \] 即可，因为接下来把两边升到 \(k_0\) 次方不会带来任何困难。令 \(\nu - \tau - 1 = \lambda\)，我们要证明 \[ (z + p^\lambda y)^{p^\tau} \equiv z^{p^\tau} + p^{\lambda + \tau} z^{p^\tau - 1} y \pmod{p^{\lambda+\tau+1}}. \tag{6.7} \] 这并不像看上去那样显然，因为并非 \((A+B)^{p^\tau}\) 展开式中的所有二项式系数都能被 \(p^\tau\) 整除。然而，我们可以分阶段证明此结果（换句话说，对 \(\tau\) 作归纳）。我们首先证明 \[ (z + p^\lambda y)^p \equiv z^p + p^{\lambda+1} z^{p-1} y \pmod{p^{\lambda+2}} \tag{6.8} \] 其中要求 \(\lambda \geq 1\)（当 \(p > 2\) 时）或 \(\lambda \geq 2\)（当 \(p = 2\) 时）。二项式展开中唯一需要检验的项是最后一项；对此我们需要 \(\lambda p \geq \lambda + 2\)，而当 \(p > 2\) 且 \(\lambda \geq 1\) 时，或当 \(p = 2\) 且 \(\lambda \geq 2\) 时，这是成立的。

最后，(6.7) 通过对 (6.8) 的重复应用而得出；在下一阶段我们得到 \[ \begin{aligned} (z + p^\lambda y)^{p^2} &= (z^p + p^{\lambda+1} z^{p-1} y_1)^p \\ &\equiv z^{p^2} + p^{\lambda+2} z^{p^2-1} y_1 \pmod{p^{\lambda+3}} \\ &\equiv z^{p^2} + p^{\lambda+2} z^{p^2-1} y \pmod{p^{\lambda+3}}, \end{aligned} \] 其中 \(y_1 \equiv y \pmod p\)，并且我们在此用 \(\lambda+1\) 替代 \(\lambda\) 应用了 (6.8)。论证继续下去，便给出 (6.7)。

当 \(\lambda = \nu - \tau - 1\) 时，关于 \(\lambda\) 的条件得到满足。我们已经看到 \(\nu - \tau - 1 \geq 1\)，而如前所注，若 \(p = 2\) 则有 \(\nu \geq k+1 \geq \tau + 3\)。因此证明完成。∎

引理 6.4. 当 \((a,q) = 1\) 时，\(|S_{a,q}| \ll q^{1-1/k}\)。

证. 令 \(T(a,q) = q^{-1+1/k} S_{a,q}\)。我们要证明 \(T(a,q)\) 有一个与 \(q\) 无关的界。若 \(q = p_1^{\nu_1} p_2^{\nu_2} \cdots\)，则由引理5.1证明中 \(S_{a,q}\) 的乘性性质， \[ T(a,q) = T(a_1, p_1^{\nu_1}) T(a_2, p_2^{\nu_2}) \cdots, \] 其中 \(a_1, a_2, \ldots\) 取适当的值，每一个都与相应的 \(p^\nu\) 互素。由引理6.2的第二部分以及引理6.3，我们有 \[ T(a, p^\nu) = T(a, p^{\nu-k}) \] 对 \(\nu > k\) 成立，于是我们可以假定所有 \(\nu_i\) 都 \(\leq k\)。

由引理6.1， \[ T(a,p) \leq k p^{1/2} p^{-(1-1/k)} \leq k p^{-1/6}, \] 而由引理6.2的第一部分， \[ T(a,p^\nu) = p^{\nu-1} p^{-\nu(1-1/k)} \leq 1 \qquad \text{当 } 1 \lt \nu \leq k. \] 因此 \(T(a,p^\nu) \leq 1\)，除非可能在 \(\nu = 1\) 且 \(p \leq k^6\) 的情形。于是 \[ T(a,q) \leq \prod_{p \leq k^6} (k p^{-1/6}), \] 而右边的数与 \(q\) 无关。∎

定理 6.1. 若 \(s \geq 2k+1\)，则奇异级数 \(\mathfrak{S}(N)\) 以及乘积 \(\prod_p \chi(p)\) 绝对收敛，并且 \[ \mathfrak{S}(N) \geq C_1(k,s) > 0 \] 若 \(s \geq 2k+1\)（\(k\) 为奇数）或 \(s \geq 4k\)（\(k\) 为偶数）。

证. 绝对收敛性如前所述得出，只需用引理6.4代替引理3.1的推论；而最后的断言由引理5.6及引理5.2的推论得出。∎

定理6.1表明，就奇异级数本身而言（除 \(k=4\) 外），在改进条件 \(s \geq 2k+1\) 使其成立方面不会有任何困难。困难的关键在于次弧（minor arcs），而不在奇异级数。

注. 哈代（Hardy）与李特尔伍德（Littlewood）证明了奇异级数，以 \[ \sum_{q=1}^{\infty} A(q) \] 的形式，当 \(s \geq 4\) 时绝对收敛，对乘积形式也同样成立。其要旨在于确保对 \(a\) 求和时所发生的抵消，即 \[ \sum_{\substack{a=1 \\ (a,q)=1}}^{q} (q^{-1} S_{a,q})^s e\!\left(\frac{-Na}{q}\right). \] 然而，这种绝对收敛对 \(N\) 不再是一致的。若取 \(q^{-1} S_{a,q}\) 的绝对值，则定理6.1中的条件 \(s \geq 2k+1\) 是最优的（best possible）。

一个有趣的问题是：奇异级数之和 \(\mathfrak{S}(N)\) 是如何随 \(N\) 波动的。每个因子 \(\chi(p)\) 主要取决于 \(N\) 所属的剩余类（模 \(p^7\)）。随 \(N\) 波动最大的因子是那些 \(p\) 整除 \(k\) 的因子，但那些 \(p-1\) 与 \(k\) 有较大公因子的因子也可能波动得相当可观。

在他们早期的论文中，哈代与李特尔伍德主要使用 \(\mathfrak{S}(N)\) 的用指数和 \(S_{a,q}\) 表示的定义，而不是用同余式（模 \(p^\nu\)）的表达式。在 P.N. II [38] 中，他们必须证明 \(\mathfrak{S}(N)\) 在 \(k=4\)、\(s=21\) 情形下有正下界。在此情形下波动最大的因子 \(\chi(p)\) 是 \(\chi(2)\) 和 \(\chi(5)\)；所有其他因子之积与 1 相差不大。他们发现 \(\chi(5)\) 在约 0.7 与 1.3 之间变化。但 \(\chi(2)\) 的变化幅度约为 200 倍。哈代与李特尔伍德证明了（在所提及的特定情形下） \[ \begin{aligned} \chi(2) =\ & 1 - 1.3307 \cos\frac{(2N-5)\pi}{16} + 0.415 \cos\frac{(6N+1)\pi}{16} \\ & - 0.3793 \cos\frac{(2N+3)\pi}{8} + \varepsilon(N), \end{aligned} \] 其中 \(|\varepsilon(N)| \lt 0.002\)。可以验证，当 \(N \equiv 2\) 或 \(3 \pmod{16}\) 时，\(\chi(2)\) 变得非常小（但仍为正）。当 \(N \equiv 10\) 或 \(11 \pmod{16}\) 时它相对较大。这些结果对应于这样一个事实：\(x^4 \equiv 0\) 或 \(1 \pmod{16}\)，因而在 \(x_1^4 + \cdots + x_{21}^4 \equiv N \pmod{16}\) 中对 \(x_1, \ldots, x_{21}\) 的选择，在前一种情形下要比后一种情形下受到更多的限制。