Davenport · Analytic Methods for Diophantine Equations

三次型：双线性方程Cubic forms: bilinear equations

我们现在研究引理 13.4 的备择情形 A，即：对于某个任意大的 \(R\)，存在多于 \(R^{n+\varepsilon}\) 对整点 \(\mathbf{x},\mathbf{y}\)，满足 \(0\lt |\mathbf{x}|\lt R\)、\(0\lt |\mathbf{y}|\lt R\) 以及

\[ B_j(\mathbf{x}\,|\,\mathbf{y})=0,\quad(1\le j\le n).\tag{14.1} \]

按照刚才所作的注记，我们已经排除了 \(\mathbf{x}=\mathbf{0}\) 与 \(\mathbf{y}=\mathbf{0}\)。在本章中（本章是自足的），我们将证明：这蕴涵存在一个整点 \(\mathbf{z}\neq\mathbf{0}\)，使得 \(C(\mathbf{z})=0\)。事实上，稍弱的假设即已足够，即：存在多于 \(AR^n\) 对 \(\mathbf{x},\mathbf{y}\)，其中 \(A\) 大于 \(n\) 的某个函数。但使用 \(\varepsilon\) 会使叙述更简洁。

对于任意一个特定的 \(\mathbf{x}\)，方程 (14.1) 是关于 \(\mathbf{y}=(y_1,\dots,y_n)\) 的 \(n\) 个线性方程，其行列式为

\[ H(\mathbf{x})=\det\left(\sum_{i=1}^{n}c_{ijk}x_i\right),\quad(1\le j,k\le n).\tag{14.2} \]

这是三次型 \(C(\mathbf{x})\) 的 Hessian。它是关于 \(\mathbf{x}\) 的一个 \(n\) 次型；或者更确切地说，应称为表观次数为 \(n\) 的型，因为它可能恒等于零。我们必须首先证明：若 \(C(\mathbf{x})\) 不表示零，则它不可能恒为零。

引理 14.1. 若对所有非零整点 \(\mathbf{x}\neq\mathbf{0}\) 都有 \(C(\mathbf{x})\neq 0\)，则 \(H(\mathbf{x})\) 不恒等于零。

证. 假设 \(H(\mathbf{x})\equiv 0\) 恒成立。设 \(n-r\)（其中 \(r\ge 1\)）为 \(H(\mathbf{x})\) 的恒等秩；也就是说，假设 (14.2) 中矩阵的所有 \(n-r+1\) 阶子行列式都关于 \(\mathbf{x}\) 恒等于零，但存在某个 \(n-r\) 阶的子行列式不恒为零。为叙述方便，设最后这个行列式（记作 \(\Delta\)）位于左上角。那么方程 (14.1) 中的前 \(n-r\) 个就蕴涵了其余所有的方程，因为后面诸行与前 \(n-r\) 行线性相关。设 \(\Delta_j\) 表示将 \(\Delta\) 的第 \(j\) 列替换为第 \((n-r+1)\) 列后所得的行列式。那么方程 \(B_j(\mathbf{x}\,|\,\mathbf{y})=0\) 的一个特解由下式给出：

\[ y_1=\Delta_1,\dots,y_{n-r}=\Delta_{n-r},\;y_{n-r+1}=-\Delta,\;y_{n-r+2}=\dots=0. \]

（这由 Cramer 法则得出：我们求解前 \(n-r\) 个方程，令 \(y_{n-r+1}=1,\;y_{n-r+2}=0,\dots\)，再整体乘以 \(-\Delta\)。）

在此解中，\(y_1,\dots,y_n\) 是 \(x_1,\dots,x_n\) 的、具有整系数的型，它们并非全部恒等于零，因为 \(\Delta\) 不恒为零。我们有

\[ B_j(\mathbf{x}\,|\,\mathbf{y})=\sum_{i,k}c_{ijk}x_i y_k=0 \]

关于 \(x_1,\dots,x_n\) 恒成立。现在我们把 \(x_1,\dots,x_n\) 视为连续变量，并对任意 \(x_\nu\) 微分此恒等式，得到

\[ \sum_k c_{\nu jk}y_k+\sum_{i,k}c_{ijk}x_i\frac{\partial y_k}{\partial x_\nu}=0 \]

对所有 \(j\) 与 \(\nu\) 成立。乘以 \(y_j\) 并对 \(j\) 求和，并注意到

\[ \sum_i\sum_j c_{ijk}x_i y_j=0 \]

对所有 \(k\) 成立。我们得到

\[ \sum_{j,k}c_{\nu jk}y_j y_k=0 \]

对所有 \(\nu\) 成立。这特别地蕴涵 \(C(\mathbf{y})=0\)。若我们现在取 \(\mathbf{x}\) 为任意一个使 \(\mathbf{y}\neq\mathbf{0}\) 的整点（这是可能的，因为 \(\mathbf{y}\) 不恒为 \(\mathbf{0}\)），便与假设矛盾。这就证明了该引理。∎

上一引理表明：那些使得线性方程 \(B_j(\mathbf{x}\,|\,\mathbf{y})=0\) 关于 \(\mathbf{y}\) 有非零解的点 \(\mathbf{x}\)，满足非恒等的方程 \(H(\mathbf{x})=0\)。于是满足 \(0\lt |\mathbf{x}|\lt R\) 的这种整点的个数为 \(\ll R^{n-1}\)。我们接下来通过证明如下结论来推广此结果：对于 \(r=1,\dots,n-1\)，满足 \(0\lt |\mathbf{x}|\lt R\) 且使诸方程关于 \(\mathbf{y}\) 有 \(r\) 个线性无关解的整点 \(\mathbf{x}\) 的个数为 \(\ll R^{n-r}\)。已证明的结果即为 \(r=1\) 的情形。

先处理一个初等代数几何的问题是方便的。

引理 14.2. 设

\[ f_1(\mathbf{x}),\dots,f_N(\mathbf{x}) \]

是关于 \(x_1,\dots,x_n\) 的、具有整系数的型，并假设 \(N\) 以及 \(f_1,\dots,f_N\) 的（公共）次数关于 \(n\) 有界。假设对于某个任意大的 \(R\)，存在一个整点集 \(\mathcal{X}\)，其中的 \(\mathbf{x}\) 满足

\[ 0\lt |\mathbf{x}|\lt R,\qquad f_1(\mathbf{x})=0,\dots,f_N(\mathbf{x})=0, \]

并假设 \(\mathcal{X}\) 中有多于 \(R^{n-r+\varepsilon}\) 个点。那么，对于 \(\mathcal{X}\) 中的某个点 \(\mathbf{x}\)，存在数 \(T_{i\rho},D_{\rho\nu}\)，使得在该点处

\[ \frac{\partial f_i}{\partial x_\nu}=\sum_{\rho=1}^{r-1}T_{i\rho}D_{\rho\nu}, \]

对 \(i=1,\dots,N\) 与 \(\nu=1,\dots,n\) 成立。

注. 关于 \(\partial f_i/\partial x_\nu\) 的这些方程，等价于断言：矩阵 \(\partial f_i/\partial x_\nu\)（\(i=1,\dots,N\)，\(\nu=1,\dots,n\)）的秩 \(\le r-1\)。这由初等矩阵理论得出。

证. 方程 \(f_1(\mathbf{x})=0,\dots,f_N(\mathbf{x})=0\) 在 \(n\) 维空间（或 \((n-1)\) 维射影空间）中定义了一个代数簇。这样的簇可表示为若干绝对不可约簇之并，而在当前假设下，这些不可约簇的个数关于 \(n\) 有界。因此存在这些绝对不可约簇之一，记作 \(\mathcal{V}\)，它包含 \(\mathcal{X}\) 中多于 \(R^{n-r+\frac12\varepsilon}\) 个点。

把绝对不可约簇 \(\mathcal{V}\) 视为复空间中的一个点集，与它相联系的是其维数 \(s\)。我们只需要 \(s\) 的下述性质：不可约簇 \(\mathcal{V}\) 可分解为有限多个部分，使得在每一部分上，\(x_1,\dots,x_n\) 中有 \(s\) 个是独立变量，而另外 \(n-s\) 个是它们的单值可微函数。

由此可知，\(\mathcal{V}\) 包含 \(\ll R^s\) 个满足 \(|\mathbf{x}|\lt R\) 的整点 \(\mathbf{x}\)，因为这 \(s\) 个坐标中的每一个都有 \(\ll R\) 种可能。与前面关于 \(\mathcal{X}\) 在 \(\mathcal{V}\) 上点数的陈述相比较，可知

\[ s\ge n-r+1. \]

现在考虑 \(\mathcal{X}\) 在 \(\mathcal{V}\) 上任一点的邻域。我们可设这里 \(x_{s+1},\dots,x_n\) 是 \(x_1,\dots,x_s\) 的单值可微函数。设 \(f(x_1,\dots,x_n)\) 为在 \(\mathcal{V}\) 上处处为零的任意可微函数。那么，对恒等式 \(f=0\) 关于 \(x_\nu\)（\(\nu=1,\dots,s\)）微分，得到

\[ f^{(\nu)}+f^{(s+1)}\frac{\partial x_{s+1}}{\partial x_\nu}+\dots+f^{(n)}\frac{\partial x_n}{\partial x_\nu}=0, \]

其中当 \(x_1,\dots,x_n\) 为独立变量时 \(f^{(j)}=\partial f/\partial x_j\)。于是对 \(\nu=1,\dots,s\) 我们有

\[ \begin{aligned} f^{(\nu)}&=\sum_{\rho=1}^{n-s}f^{(s+\rho)}\left(-\frac{\partial x_{s+\rho}}{\partial x_\nu}\right)\\ &=\sum_{\rho=1}^{n-s}f^{(s+\rho)}D_{\rho,\nu}, \end{aligned} \]

记作如此。若对 \(\nu>s\) 定义 \(D_{\rho,\nu}\) 为

\[ D_{\rho,\nu}=\begin{cases}1&\text{若 }s+\rho=\nu,\\0&\text{否则,}\end{cases} \]

则同样的关系对 \(\nu=s+1,\dots,n\) 也成立。因此

\[ f^{(\nu)}(\mathbf{x})=\sum_{\rho=1}^{n-s}T_\rho(f)D_{\rho,\nu} \]

对 \(\nu=1,\dots,n\) 成立，其中 \(T_\rho(f)=f^{(s+\rho)}\)。注意到数 \(D_{\rho,\nu}\) 与 \(f\) 无关，而数 \(T_\rho(f)\) 与 \(\nu\) 无关。这就证明了命题中的结论，因为 \(n-s\le r-1\)，且这些关系在 \(\mathcal{V}\) 上任一点成立，特别在 \(\mathcal{X}\) 在 \(\mathcal{V}\) 上的任一点成立。∎

引理 14.3. 设对所有非零整点 \(\mathbf{x}\neq\mathbf{0}\) 都有 \(C(\mathbf{x})\neq 0\)。那么，满足 \(0\lt |\mathbf{x}|\lt R\) 且使双线性方程 \(B_j(\mathbf{x}\,|\,\mathbf{y})=0\) 关于 \(\mathbf{y}\) 恰有 \(r\) 个线性无关解的整点 \(\mathbf{x}\) 的个数小于 \(R^{n-r+\varepsilon}\)。

证. 所讨论的点是那些使矩阵 \(\left(\sum_i c_{ijk}x_i\right)\) 的秩恰为 \(r\) 的点。只需考虑整点集 \(\mathcal{X}\)：其中某个特定的 \(n-r\) 阶子行列式 \(\neq 0\)，而所有 \(n-r+1\) 阶子行列式均为 \(0\)，并证明 \(\mathcal{X}\) 中点的个数小于 \(R^{n-r+\varepsilon}\)。假设 \(\mathcal{X}\) 中点的个数 \(\ge R^{n-r+\varepsilon}\)。那么我们就处于引理 14.2 的情形之下，其中 \(f_1(\mathbf{x}),\dots,f_N(\mathbf{x})\) 是全部 \(n-r+1\) 阶子行列式。

对于 \(\mathcal{X}\) 中的任意点 \(\mathbf{x}\)，我们可以构造双线性方程的 \(r\) 个线性无关解 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(r)}\)，正如引理 14.1 的证明中那样，把这些点的坐标取为某些 \(n-r\) 阶的子行列式。（在那个证明中，我们只需要一个解，是取 \(y_{n-r+1}=-\Delta,\;y_{n-r+2}=\dots=0\) 得到的；但推广到 \(r\) 个解是显然的。）

现在考虑当 \(\mathbf{x}\) 为任意点（实的或复的）、\(\mathbf{y}^{(p)}\) 如上所述时，\(B_j(\mathbf{x}\,|\,\mathbf{y}^{(p)})\) 的值。此值将是开头所提矩阵的某个 \(n-r+1\) 阶子行列式。（有时它会是一个有两行相同的 \(n-r+1\) 阶子行列式，但这无关紧要。）于是对任意点 \(\mathbf{x}\)，我们有恒等式

\[ \sum_{i,k}c_{ijk}x_i y_k^{(p)}=\Delta_{j,p}(\mathbf{x}), \]

其中 \(\Delta_{j,p}(\mathbf{x})\) 是某个 \(n-r+1\) 阶子行列式。当然，若 \(\mathbf{x}\) 在 \(\mathcal{X}\) 中，则所有 \(\Delta_{j,p}\) 都为零。

在上述恒等式中，\(x_1,\dots,x_n\) 是独立变量。关于 \(x_\nu\) 微分给出

\[ \sum_k c_{\nu jk}y_k^{(p)}+\sum_{i,k}c_{ijk}x_i\frac{\partial y_k^{(p)}}{\partial x_\nu}=\Delta_{j,p}^{(\nu)}(\mathbf{x}), \]

其中右端的上标 \((\nu)\) 表示偏导数。乘以 \(y_j^{(q)}\)（\(1\le q\le r\)）并对 \(j\) 求和。我们得到

\[ \sum_{j,k}c_{\nu jk}y_k^{(p)}y_j^{(q)}+\sum_k\Delta_{k,q}\frac{\partial y_k^{(p)}}{\partial x_\nu}=\sum_j y_j^{(q)}\Delta_{j,p}^{(\nu)}(\mathbf{x}). \]

现在考虑由 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(r)}\) 张成的 \(r\) 维线性空间中的任意一点 \(\mathbf{Y}\)，记作

\[ \mathbf{Y}=\sum_{p=1}^{r}K_p\mathbf{y}^{(p)}. \]

对于此点，我们有

\[ \begin{aligned} \sum_{j,k}c_{\nu jk}Y_j Y_k+\sum_{p=1}^{r}\sum_{q=1}^{r}K_p K_q\sum_k\Delta_{k,q}\frac{\partial y_k^{(p)}}{\partial x_\nu} &=\sum_{p=1}^{r}\sum_{q=1}^{r}K_p K_q\sum_j y_j^{(q)}\Delta_{j,p}^{(\nu)}\\ &=\sum_{p=1}^{r}\sum_j A_{j,p}\Delta_{j,p}^{(\nu)}, \end{aligned} \]

记作如此。这对 \(\nu=1,\dots,n\) 成立。取 \(\mathbf{x}\) 为引理 14.2 中所找到的那些点之一。对于此点（从现在起它被固定），我们有 \(\Delta_{k,q}=0\) 对所有 \(k\) 与 \(q\) 成立，且

\[ \Delta_{j,p}^{(\nu)}=\sum_{\rho=1}^{r-1}T_{j,p,\rho}D_{\rho,\nu}. \]

因此

\[ \sum_{j,k}c_{\nu jk}Y_j Y_k=\sum_{p=1}^{r}\sum_j A_{j,p}\sum_{\rho=1}^{r-1}T_{j,p,\rho}D_{\rho,\nu}. \]

最后，乘以 \(Y_\nu=\sum_{\sigma=1}^{r}K_\sigma y_\nu^{(\sigma)}\) 并对 \(\nu\) 求和。我们得到

\[ C(\mathbf{Y})=\sum_{p=1}^{r}\sum_j A_{j,p}\sum_{\sigma=1}^{r}\sum_{\rho=1}^{r-1}K_\sigma y_\nu^{(\sigma)}T_{j,p,\rho}D_{\rho,\nu}. \]

现在选取数 \(K_1,\dots,K_r\) 使其满足

\[ \sum_{\sigma=1}^{r}K_\sigma\sum_\nu y_\nu^{(\sigma)}D_{\rho,\nu}=0,\quad(1\le\rho\le r-1). \]

这是关于 \(r\) 个未知数的 \(r-1\) 个线性方程，因而有一个 \(K_1,\dots,K_r\) 不全为零的解。又因为系数可设为有理的，我们可以取 \(K_1,\dots,K_r\) 为整数。于是 \(\mathbf{Y}\) 是一个非 \(\mathbf{0}\) 的整点，因为 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(r)}\) 线性无关（这是由于点 \(\mathbf{x}\) 在 \(\mathcal{X}\) 中）。我们得到 \(C(\mathbf{Y})=0\)，与假设矛盾，这就证明了结论。∎

注. 须注意，在上述证明中，\(K_1,\dots,K_r\) 的选取并未涉及数 \(A_{j,p}\)。否则推理将是谬误的，因为这些数本身依赖于 \(K_1,\dots,K_r\)。

引理 14.4. 引理 13.4 的备择情形 A 蕴涵 \(C(\mathbf{x})\) 表示 \(0\)。

证. 若 \(C(\mathbf{x})\) 不表示零，则引理 14.1 与引理 14.3 蕴涵：存在 \(\ll R^{n-r+\varepsilon}\) 个点 \(\mathbf{x}\)，使得双线性方程关于 \(\mathbf{y}\) 恰有 \(r\) 个线性无关解。因此存在 \(\ll R^{n+\varepsilon}\) 对满足 \(0\lt |\mathbf{x}|\lt R\)、\(0\lt |\mathbf{y}|\lt R\) 的整点对 \(\mathbf{x},\mathbf{y}\) 满足这些双线性方程。但这与备择情形 A 矛盾，因为我们可以把现在的 \(\varepsilon\) 取为（比方说）备择情形 A 中 \(\varepsilon\) 的一半。（事实上，正如前面所注记的，本证明表明 \(\mathbf{x},\mathbf{y}\) 对的个数为 \(\ll R^n\)。）∎