Davenport · Analytic Methods for Diophantine Equations

三次型Cubic forms

我们现在着手证明:一个具有整系数的齐次三次方程

\[ \begin{equation}\tag{13.1} C(x_1,\dots,x_n)=0, \end{equation} \]

当 \(n\ge 17\) 时,总能在整数 \(x_1,\dots,x_n\)(不全为 \(0\))中求解。第一个这样的结果,附带条件 \(n\ge 32\),于 1957 年被证明 [21];改进后的结果在 1962 年初被发现 [20]。1963 年我证明了条件 \(n\ge 16\) 已经足够 [22],但这需要一个性质上颇为特殊、超出 \(n\ge 17\) 所需的更细致的论证。

Mordell 于 1937 年 [61] 指出,存在九个变量的三次型不表示零,因而条件 \(n\ge 10\) 对于 (13.1) 总可解而言是必不可少的。Mordell 的例子基于一个三次域的范数型的性质。如果 \(p\) 是一个在该域中不分解的素数,那么范数型 \(N(x,y,z)\) 永远不能被 \(p\) 整除,除非 \(x,y,z\) 都能被 \(p\) 整除。由此容易推出,方程

\[ N(x_1,x_2,x_3)+pN(x_4,x_5,x_6)+p^2 N(x_7,x_8,x_9)=0 \]

除平凡解外,没有整数解 \(x_1,\dots,x_9\)。事实上,我们还可以进一步断言:相应的模 \(p^3\) 的同余式除了所有变量都 \(\equiv 0 \pmod p\) 之外没有解。一个简单的例子可由取 \(p=7\) 并令

\[ N(x,y,z)=x^3+2y^3+4z^3-6xyz \]

给出,这正是由 \(\sqrt[3]{2}\) 生成的域的范数型。一个与上述类似的构造,给出了 \(k^2\) 个变量中 \(k\) 次齐次不可解方程的例子。

关于三次方程的定理的证明分为若干章,每一章在很大程度上是自成一体的。我们从考虑与一个三次型相关联的指数和开始。写

\[ C(\mathbf{x})=C(x_1,\dots,x_n)=\sum_i\sum_j\sum_k c_{ijk}\,x_i x_j x_k, \]

其中各求和指标从 \(1\) 跑到 \(n\),系数 \(c_{ijk}\) 是整数,并且我们可以假设 \(c_{ijk}\) 是关于 \(i,j,k\) 的对称函数。设 \(P\) 是一个大的正整数。设 \(\mathfrak{B}\) 是 \(n\) 维空间中一个固定的盒子,即由 \(n\) 个区间构成的笛卡尔积

\[ x_j'\lt x_j\le x_j'',\quad (1\le j\le n). \]

仅为方便起见,我们假设 \(x_j''-x_j'\lt 1\)。令

\[ S(\alpha)=\sum_{P\mathfrak{B}}e\!\left(\alpha C(x_1,\dots,x_n)\right), \]

其中求和遍历盒子 \(P\mathfrak{B}\) 中的所有整点,盒子 \(P\mathfrak{B}\) 由下式给出

\[ Px_j'\lt x_j\le Px_j'',\quad (1\le j\le n). \]

设 \(\mathcal{N}(P)\) 表示 \(P\mathfrak{B}\) 中满足 (13.1) 的整点 \(\mathbf{x}\) 的个数。则

\[ \begin{equation}\tag{13.2} \mathcal{N}(P)=\int_0^1 S(\alpha)\,d\alpha. \end{equation} \]

我们的目标(原则上)是证明:通过适当选取盒子 \(\mathfrak{B}\),当 \(P\to\infty\) 时 \(\mathcal{N}(P)\) 有一个渐近公式,其中主项的阶为 \(P^{n-3}\)。实际上这并不总是成立。我们 将要 得到的,是一个看似自相矛盾的结果:该渐近公式在 (13.1) 不可解(从而 \(\mathcal{N}(P)=0\))的假设下成立!这对我们的目的而言已经足够,因为它将证明 (13.1) 是可解的。

\(|S(\alpha)|\) 的平凡估计是 \(P^n\)。我们首先研究:若对于某个特定的 \(\alpha\),有

\[ \begin{equation}\tag{13.3} |S(\alpha)|\ge P^{n-K}, \end{equation} \]

会发生什么,其中 \(K\) 是某个正数。最终,正如前几章那样,我们的目标是能够从 \(\alpha\) 的集合中去掉任何对积分贡献的量低于 \(P^{n-3}\) 阶的子集。

第一步是证明 Weyl 不等式的一个推广。对于任意两点 \(\mathbf{x},\mathbf{y}\),我们定义一组 \(n\) 个双线性型:

\[ B_j(\mathbf{x}\,|\,\mathbf{y})=\sum_i\sum_k c_{ijk}\,x_i y_k,\quad (1\le j\le n). \]
引理 13.1. 假设 (13.3) 蕴含 \[ \sum_{|\mathbf{x}|\lt P}\sum_{|\mathbf{y}|\lt P}\prod_{j=1}^{n}\min\!\left(P,\ \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\|^{-1}\right)\ \gg\ P^{3n-4K}. \]
证. 我们有 \[ \begin{aligned} |S(\alpha)|^2 &=\sum_{\mathbf{z}\in P\mathfrak{B}}\sum_{\mathbf{z}'\in P\mathfrak{B}}e\!\left(\alpha C(\mathbf{z}')-\alpha C(\mathbf{z})\right)\\ &=\sum_{\mathbf{z}\in P\mathfrak{B}}\sum_{\mathbf{y}+\mathbf{z}\in P\mathfrak{B}}e\!\left(\alpha C(\mathbf{y}+\mathbf{z})-\alpha C(\mathbf{z})\right). \end{aligned} \] 对任意的 \(\mathbf{z}\),盒子 \(P\mathfrak{B}-\mathbf{z}\) 包含于 \(|\mathbf{y}|\lt P\) 之内。因此 \[ |S(\alpha)|^2\le\sum_{|\mathbf{y}|\lt P}\left|\sum_{\mathbf{z}\in\mathcal{R}(\mathbf{y})}e\!\left(\alpha C(\mathbf{y}+\mathbf{z})-\alpha C(\mathbf{z})\right)\right|, \] 其中 \(\mathcal{R}(\mathbf{y})\) 表示盒子 \(P\mathfrak{B}\) 与 \(P\mathfrak{B}-\mathbf{y}\) 的公共部分。由 Cauchy 不等式, \[ |S(\alpha)|^4\ll P^n\sum_{|\mathbf{y}|\lt P}\left|\sum_{\mathbf{z}\in\mathcal{R}(\mathbf{y})}e\!\left(\alpha C(\mathbf{y}+\mathbf{z})-\alpha C(\mathbf{z})\right)\right|^2. \]

我们现在对内层求和重复上述论证。其平方不超过

\[ \sum_{|\mathbf{x}|\lt P}\left|\sum_{\mathbf{z}\in\mathcal{S}(\mathbf{x},\mathbf{y})}e\!\left(\alpha\big(C(\mathbf{z}+\mathbf{x}+\mathbf{y})-C(\mathbf{z}+\mathbf{x})-C(\mathbf{z}+\mathbf{y})+C(\mathbf{z})\big)\right)\right|, \] 其中 \(\mathcal{S}(\mathbf{x},\mathbf{y})\) 是依赖于 \(\mathbf{x}\) 和 \(\mathbf{y}\) 的关于 \(\mathbf{z}\) 的盒子,其各棱边长度小于 \(P\)。我们有 \[ \alpha\big(C(\mathbf{z}+\mathbf{x}+\mathbf{y})-C(\mathbf{z}+\mathbf{x})-C(\mathbf{z}+\mathbf{y})+C(\mathbf{z})\big) =6\alpha\sum_{i,j,k}c_{ijk}x_i y_k z_j+\phi =6\alpha\sum_j z_j B_j(\mathbf{x}\,|\,\mathbf{y})+\phi, \] 其中 \(\phi\) 不涉及 \(\mathbf{z}\)。由一个现已熟悉的估计, \[ \left|\sum_{\mathbf{z}\in\mathcal{S}(\mathbf{x},\mathbf{y})}e\!\left(6\alpha\sum_j B_j(\mathbf{x}\,|\,\mathbf{y})z_j\right)\right| \ll\prod_{j=1}^{n}\min\!\left(P,\ \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\|^{-1}\right). \] 代入前面的不等式中,并结合 (13.3),即得结论。
注. 在估计一个指数和时,看一看平凡估计给出什么,以判断(如果有的话)损失了多少(永远地损失了),是一种有用的预防措施。在当前情形中,对乘积中始终取 \(P\) 作为最小值,则 \(|S(\alpha)|^4\) 的平凡估计将是 \(P^{4n}\),这是令人满意的。
引理 13.2. 假设 (13.3) 蕴含:满足1 \[ \begin{equation}\tag{13.4} |\mathbf{x}|\lt P,\quad |\mathbf{y}|\lt P,\quad \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\|\lt P^{-1},\quad (1\le j\le n), \end{equation} \] 的整点对 \(\mathbf{x},\mathbf{y}\) 的个数 \[ \gg P^{2n-4K}(\log P)^{-n}. \]
证. 设 \(Y(\mathbf{x})\) 表示对给定的 \(\mathbf{x}\) 满足 (13.4) 的点 \(\mathbf{y}\) 的个数。于是,对任意满足 \(0\le r_j\lt P\) 的整数 \(r_1,\dots,r_n\),使每个坐标都落在某个长度为 \(P\) 的指定区间内、并满足 \[ \frac{r_j}{P}\le\{6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\}\lt \frac{r_j+1}{P},\quad (1\le j\le n) \] 的整点 \(\mathbf{y}\) 的个数不能超过 \(Y(\mathbf{x})\),其中 \(\{\theta\}\) 表示任意实数 \(\theta\) 的小数部分。因为若 \(\mathbf{y}'\) 是这样一个点,而 \(\mathbf{y}\) 是任意这样的点,我们应有 \(|\mathbf{y}-\mathbf{y}'|\lt P\) 以及 \[ \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y}-\mathbf{y}')\|\lt P^{-1},\quad (1\le j\le n). \] 因此 \(\mathbf{y}\) 的可能性不能超过 \(Y(\mathbf{x})\) 个。(注意在 (13.4) 中允许 \(\mathbf{y}=\mathbf{0}\)。)

将立方体 \(|\mathbf{y}|\lt P\) 划分为 \(2^n\) 个边长为 \(P\) 的立方体,我们得到

\[ \sum_{|\mathbf{y}|\lt P}\prod_{j=1}^{n}\min\!\left(P,\ \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\|^{-1}\right) \ll Y(\mathbf{x})\sum_{r_1=0}^{P-1}\cdots\sum_{r_n=0}^{P-1}\min\!\left(P,\ \frac{P}{r_j},\ \frac{P}{r_j-1}\right) \ll Y(\mathbf{x})(P\log P)^n. \] 将其代入引理 13.1 的结论中,给出 \[ (P\log P)^n\sum_{|\mathbf{x}|\lt P}Y(\mathbf{x})\gg P^{3n-4K}. \] 由于 \(\sum Y(\mathbf{x})\) 即为满足 (13.4) 的点对 \(\mathbf{x},\mathbf{y}\) 的个数,结论随之成立。
注. 由于满足 (13.4) 的点对 \(\mathbf{x},\mathbf{y}\) 个数的平凡估计是 \(P^{2n}\),我们放弃了一个因子 \((\log P)^n\)。但这并不重要。
引理 13.3. 设 \(\theta\) 与 \(P\) 无关且满足 \(0\lt \theta\lt 1\)。假设 (13.3) 蕴含:满足 \[ \begin{equation}\tag{13.5} |\mathbf{x}|\lt P^\theta,\quad |\mathbf{y}|\lt P^\theta,\quad \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\|\lt P^{-3+2\theta}, \end{equation} \] 的整点对 \(\mathbf{x},\mathbf{y}\) 的个数 \[ \gg P^{2n\theta-4K}(\log P)^{-n}. \]
证. 我们将通过两次应用引理 12.6 得到结论。首先把 \(\mathbf{x}\) 看作 (13.4) 中固定的,并考虑整点 \(\mathbf{y}\) 的个数。关于 \(\mathbf{y}\) 的不等式是 \[ \begin{equation}\tag{13.6} \left\{ \begin{aligned} &|y_1|\lt P,\dots,|y_n|\lt P,\\ &|L_1(\mathbf{y})-u_{n+1}|\lt P^{-1},\dots,|L_n(\mathbf{y})-u_{2n}|\lt P^{-1}, \end{aligned} \right. \end{equation} \] 其中 \(L_j(\mathbf{y})=6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\),而 \(u_{n+j}\) 是最接近 \(L_j(\mathbf{y})\) 的整数。形式 \(L_j(\mathbf{y})\) 满足前一章的对称性条件,因为 \(L_j\) 中 \(y_k\) 的系数是 \(6\alpha\sum_i c_{ijk}x_i\),它在交换 \(j\) 与 \(k\) 时保持不变。我们将引理 12.6 应用于此,以 \(y_1,\dots,y_n\) 代 \(u_1,\dots,u_n\),并取 \[ a=P,\quad Z_2=1,\quad Z_1=P^{-1+\theta}. \] 当 \(Z_2=1\) 时,引理 12.6 的不等式即上面的不等式 (13.6)。设这些不等式有 \(N(\mathbf{x})\) 个关于 \(\mathbf{y}\) 的解。当取 \(Z=Z_1\) 时,引理 12.6 的不等式变为 \[ |y_1|\lt P^\theta,\dots,|y_n|\lt P^\theta,\quad |L_1(\mathbf{y})-u_{n+1}|\lt P^{-2+\theta},\dots,|L_n(\mathbf{y})-u_{2n}|\lt P^{-2+\theta}. \] 因此这些不等式关于 \(\mathbf{y}\) 的解的个数 \[ \gg N(\mathbf{x})\,P^{-n(1-\theta)}. \] 于是满足 \[ \begin{equation}\tag{13.7} |\mathbf{x}|\lt P,\quad |\mathbf{y}|\lt P^\theta,\quad \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\|\lt P^{-2+\theta} \end{equation} \] 的点对 \(\mathbf{x},\mathbf{y}\) 的个数 \[ \gg P^{-n(1-\theta)}\sum_{|\mathbf{x}|\lt P}N(\mathbf{x})\gg P^{n+n\theta-4K}(\log P)^{-n}, \] 此处用到了引理 13.2。

现在我们进行一个类似的论证,但固定 \(\mathbf{y}\) 而让 \(\mathbf{x}\) 变化。对每个 \(\mathbf{y}\),条件 (13.7) 即为

\[ \begin{aligned} &|x_1|\lt P,\dots,|x_n|\lt P,\\ &|M_1(\mathbf{x})-u_{n+1}|\lt P^{-2+\theta},\dots,|M_n(\mathbf{x})-u_{2n}|\lt P^{-2+\theta}, \end{aligned} \] 其中 \(M_j(\mathbf{x})=B_j(\mathbf{y}\,|\,\mathbf{x})\),而 \(u_{n+j}\) 现在是最接近 \(M_j(\mathbf{x})\) 的整数。这些是引理 12.6 中取 \[ a=P^{\frac{3}{2}-\frac{1}{2}\theta},\quad Z=Z_2=P^{-\frac{1}{2}+\frac{1}{2}\theta} \] 的不等式。我们取 \(Z_1=P^{-\frac{3}{2}+\frac{3}{2}\theta}\)。于是引理告诉我们, \[ |x_1|\lt P^\theta,\dots,|x_n|\lt P^\theta,\quad |M_1(\mathbf{x})-u_{n+1}|\lt P^{-3+2\theta},\dots,|M_n(\mathbf{x})-u_{2n}|\lt P^{-3+2\theta} \] 的解的个数 \(\gg P^{-n(1-\theta)}N_1(\mathbf{y})\),其中 \(N_1(\mathbf{y})\) 表示对给定的 \(\mathbf{y}\),(13.7) 的解的个数。因此满足 (13.5) 的整点对 \(\mathbf{x},\mathbf{y}\) 的个数 \[ \gg P^{-n+n\theta}\sum_{|\mathbf{y}|\lt P^\theta}N_1(\mathbf{y})\gg P^{-n+n\theta}P^{n+n\theta-4K}(\log P)^{-n}, \] 由此即得结论。
引理 13.4. 设 \(\theta\) 与 \(P\) 无关且满足 \(0\lt \theta\lt 1\)。设 \(\varepsilon\) 是任意小的固定正数。那么,或者

(A) 存在多于 \(P^{n\theta+\varepsilon}\) 个满足 \[ \begin{equation}\tag{13.8} |\mathbf{x}|\lt P^\theta,\quad |\mathbf{y}|\lt P^\theta,\quad B_j(\mathbf{x}\,|\,\mathbf{y})=0,\quad (1\le j\le n) \end{equation} \] 的整点对 \(\mathbf{x},\mathbf{y}\);

或者

(B) 对每个 \(\alpha\),假设 \[ \begin{equation}\tag{13.9} |S(\alpha)|\ge P^{n-\frac{1}{4}n\theta+\varepsilon} \end{equation} \] 蕴含 \(\alpha\) 有一个有理逼近 \(a/q\) 使得 \[ \begin{equation}\tag{13.10} (a,q)=1,\quad 1\le q\ll P^{2\theta},\quad |q\alpha-a|\lt P^{-3+2\theta}. \end{equation} \]

证. 我们在 (13.3) 中取 \(K=\tfrac{1}{4}n\theta-\varepsilon\),使得它与 (13.9) 相同。由引理 13.3,存在 \[ \gg P^{2n\theta-4K}(\log P)^{-n}\gg P^{n\theta+\varepsilon} \] 个满足 (13.5) 的整点对 \(\mathbf{x},\mathbf{y}\)。如果对所有这些点都有 \(B_j(\mathbf{x}\,|\,\mathbf{y})=0\) 对一切 \(j\) 成立,那么选项 (A) 成立。如果不然,那么对某个点对 \(\mathbf{x},\mathbf{y}\)(在 (13.5) 中)及某个 \(j\),我们有 \(B_j(\mathbf{x}\,|\,\mathbf{y})\ne 0\) 以及 \[ \|6\alpha B_j(\mathbf{x}\,|\,\mathbf{y})\|\lt P^{-3+2\theta}. \] 取 \(q=6|B_j(\mathbf{x}\,|\,\mathbf{y})|\),并取 \(a\) 为最接近 \(\alpha q\) 的整数。则 \[ |q\alpha-a|\lt P^{-3+2\theta}. \] 此外, \[ q\ll|B_j(\mathbf{x}\,|\,\mathbf{y})|\ll\sum_{i,k}|c_{ijk}||x_i||y_k|\ll|\mathbf{x}||\mathbf{y}|\ll P^{2\theta}. \] 我们未必有 \((a,q)=1\),但通过从 \(q\) 和 \(a\) 中去掉任何公因子即可保证这一点。于是我们得到选项 (B)。
注. 可以看出选项 A 并不涉及 \(\alpha\)。它本质上也不涉及 \(\theta\),因为若我们令 \(R=P^\theta\),则其断言为:满足 \[ \begin{equation}\tag{13.11} |\mathbf{x}|\lt R,\quad |\mathbf{y}|\lt R,\quad B_j(\mathbf{x}\,|\,\mathbf{y})=0,\quad (1\le j\le n) \end{equation} \] 的点对 \(\mathbf{x},\mathbf{y}\) 的个数大于 \(R^{n+\varepsilon'}\)(对某个固定的 \(\varepsilon'>0\))。于是选项 A 关系到三次型的一个内禀性质。注意,如果我们愿意,可以从 (13.11) 中排除 \(\mathbf{x}=\mathbf{0}\) 和 \(\mathbf{y}=\mathbf{0}\),因为这类点对的个数 \(\ll R^n\)。

选项 B 给出了一个原则上与我们在前几章中已经熟悉的情形类似的局面。它将使我们能够在第 15 章中令人满意地估计由一大类 \(\alpha\) 对 \(\int_0^1 S(\alpha)\,d\alpha\) 所作的贡献,并留给我们相对较少的若干短区间,在其上我们可以逼近 \(S(\alpha)\)。

  1. 此处我们对任意点 \(\mathbf{x}\) 记 \(|\mathbf{x}|=\max(|x_1|,\dots,|x_n|)\)。这与第 12 章的记号不同,在那里 \(|\mathbf{x}|\) 表示点 \(\mathbf{x}\) 到原点的距离。然而,对我们的目的而言,这种差别无关紧要。