Davenport · Analytic Methods for Diophantine Equations

三次型:双线性方程Cubic forms: bilinear equations

我们现在研究引理 13.4 的备择情形 A,即:对于某个任意大的 \(R\),存在多于 \(R^{n+\varepsilon}\) 对整点 \(\mathbf{x},\mathbf{y}\),满足 \(0\lt |\mathbf{x}|\lt R\)、\(0\lt |\mathbf{y}|\lt R\) 以及

\[ B_j(\mathbf{x}\,|\,\mathbf{y})=0,\quad(1\le j\le n).\tag{14.1} \]

按照刚才所作的注记,我们已经排除了 \(\mathbf{x}=\mathbf{0}\) 与 \(\mathbf{y}=\mathbf{0}\)。在本章中(本章是自足的),我们将证明:这蕴涵存在一个整点 \(\mathbf{z}\neq\mathbf{0}\),使得 \(C(\mathbf{z})=0\)。事实上,稍弱的假设即已足够,即:存在多于 \(AR^n\) 对 \(\mathbf{x},\mathbf{y}\),其中 \(A\) 大于 \(n\) 的某个函数。但使用 \(\varepsilon\) 会使叙述更简洁。

对于任意一个特定的 \(\mathbf{x}\),方程 (14.1) 是关于 \(\mathbf{y}=(y_1,\dots,y_n)\) 的 \(n\) 个线性方程,其行列式为

\[ H(\mathbf{x})=\det\left(\sum_{i=1}^{n}c_{ijk}x_i\right),\quad(1\le j,k\le n).\tag{14.2} \]

这是三次型 \(C(\mathbf{x})\) 的 Hessian。它是关于 \(\mathbf{x}\) 的一个 \(n\) 次型;或者更确切地说,应称为表观次数为 \(n\) 的型,因为它可能恒等于零。我们必须首先证明:若 \(C(\mathbf{x})\) 不表示零,则它不可能恒为零。

引理 14.1. 若对所有非零整点 \(\mathbf{x}\neq\mathbf{0}\) 都有 \(C(\mathbf{x})\neq 0\),则 \(H(\mathbf{x})\) 不恒等于零。
证. 假设 \(H(\mathbf{x})\equiv 0\) 恒成立。设 \(n-r\)(其中 \(r\ge 1\))为 \(H(\mathbf{x})\) 的恒等秩;也就是说,假设 (14.2) 中矩阵的所有 \(n-r+1\) 阶子行列式都关于 \(\mathbf{x}\) 恒等于零,但存在某个 \(n-r\) 阶的子行列式不恒为零。为叙述方便,设最后这个行列式(记作 \(\Delta\))位于左上角。那么方程 (14.1) 中的前 \(n-r\) 个就蕴涵了其余所有的方程,因为后面诸行与前 \(n-r\) 行线性相关。设 \(\Delta_j\) 表示将 \(\Delta\) 的第 \(j\) 列替换为第 \((n-r+1)\) 列后所得的行列式。那么方程 \(B_j(\mathbf{x}\,|\,\mathbf{y})=0\) 的一个特解由下式给出:

\[ y_1=\Delta_1,\dots,y_{n-r}=\Delta_{n-r},\;y_{n-r+1}=-\Delta,\;y_{n-r+2}=\dots=0. \]

(这由 Cramer 法则得出:我们求解前 \(n-r\) 个方程,令 \(y_{n-r+1}=1,\;y_{n-r+2}=0,\dots\),再整体乘以 \(-\Delta\)。)

在此解中,\(y_1,\dots,y_n\) 是 \(x_1,\dots,x_n\) 的、具有整系数的型,它们并非全部恒等于零,因为 \(\Delta\) 不恒为零。我们有

\[ B_j(\mathbf{x}\,|\,\mathbf{y})=\sum_{i,k}c_{ijk}x_i y_k=0 \]

关于 \(x_1,\dots,x_n\) 恒成立。现在我们把 \(x_1,\dots,x_n\) 视为连续变量,并对任意 \(x_\nu\) 微分此恒等式,得到

\[ \sum_k c_{\nu jk}y_k+\sum_{i,k}c_{ijk}x_i\frac{\partial y_k}{\partial x_\nu}=0 \]

对所有 \(j\) 与 \(\nu\) 成立。乘以 \(y_j\) 并对 \(j\) 求和,并注意到

\[ \sum_i\sum_j c_{ijk}x_i y_j=0 \]

对所有 \(k\) 成立。我们得到

\[ \sum_{j,k}c_{\nu jk}y_j y_k=0 \]

对所有 \(\nu\) 成立。这特别地蕴涵 \(C(\mathbf{y})=0\)。若我们现在取 \(\mathbf{x}\) 为任意一个使 \(\mathbf{y}\neq\mathbf{0}\) 的整点(这是可能的,因为 \(\mathbf{y}\) 不恒为 \(\mathbf{0}\)),便与假设矛盾。这就证明了该引理。

上一引理表明:那些使得线性方程 \(B_j(\mathbf{x}\,|\,\mathbf{y})=0\) 关于 \(\mathbf{y}\) 有非零解的点 \(\mathbf{x}\),满足非恒等的方程 \(H(\mathbf{x})=0\)。于是满足 \(0\lt |\mathbf{x}|\lt R\) 的这种整点的个数为 \(\ll R^{n-1}\)。我们接下来通过证明如下结论来推广此结果:对于 \(r=1,\dots,n-1\),满足 \(0\lt |\mathbf{x}|\lt R\) 且使诸方程关于 \(\mathbf{y}\) 有 \(r\) 个线性无关解的整点 \(\mathbf{x}\) 的个数为 \(\ll R^{n-r}\)。已证明的结果即为 \(r=1\) 的情形。

先处理一个初等代数几何的问题是方便的。

引理 14.2.

\[ f_1(\mathbf{x}),\dots,f_N(\mathbf{x}) \]

是关于 \(x_1,\dots,x_n\) 的、具有整系数的型,并假设 \(N\) 以及 \(f_1,\dots,f_N\) 的(公共)次数关于 \(n\) 有界。假设对于某个任意大的 \(R\),存在一个整点集 \(\mathcal{X}\),其中的 \(\mathbf{x}\) 满足

\[ 0\lt |\mathbf{x}|\lt R,\qquad f_1(\mathbf{x})=0,\dots,f_N(\mathbf{x})=0, \]

并假设 \(\mathcal{X}\) 中有多于 \(R^{n-r+\varepsilon}\) 个点。那么,对于 \(\mathcal{X}\) 中的某个点 \(\mathbf{x}\),存在数 \(T_{i\rho},D_{\rho\nu}\),使得在该点处

\[ \frac{\partial f_i}{\partial x_\nu}=\sum_{\rho=1}^{r-1}T_{i\rho}D_{\rho\nu}, \]

对 \(i=1,\dots,N\) 与 \(\nu=1,\dots,n\) 成立。

注. 关于 \(\partial f_i/\partial x_\nu\) 的这些方程,等价于断言:矩阵 \(\partial f_i/\partial x_\nu\)(\(i=1,\dots,N\),\(\nu=1,\dots,n\))的秩 \(\le r-1\)。这由初等矩阵理论得出。
证. 方程 \(f_1(\mathbf{x})=0,\dots,f_N(\mathbf{x})=0\) 在 \(n\) 维空间(或 \((n-1)\) 维射影空间)中定义了一个代数簇。这样的簇可表示为若干绝对不可约簇之并,而在当前假设下,这些不可约簇的个数关于 \(n\) 有界。因此存在这些绝对不可约簇之一,记作 \(\mathcal{V}\),它包含 \(\mathcal{X}\) 中多于 \(R^{n-r+\frac12\varepsilon}\) 个点。

把绝对不可约簇 \(\mathcal{V}\) 视为复空间中的一个点集,与它相联系的是其维数 \(s\)。我们只需要 \(s\) 的下述性质:不可约簇 \(\mathcal{V}\) 可分解为有限多个部分,使得在每一部分上,\(x_1,\dots,x_n\) 中有 \(s\) 个是独立变量,而另外 \(n-s\) 个是它们的单值可微函数。

由此可知,\(\mathcal{V}\) 包含 \(\ll R^s\) 个满足 \(|\mathbf{x}|\lt R\) 的整点 \(\mathbf{x}\),因为这 \(s\) 个坐标中的每一个都有 \(\ll R\) 种可能。与前面关于 \(\mathcal{X}\) 在 \(\mathcal{V}\) 上点数的陈述相比较,可知

\[ s\ge n-r+1. \]

现在考虑 \(\mathcal{X}\) 在 \(\mathcal{V}\) 上任一点的邻域。我们可设这里 \(x_{s+1},\dots,x_n\) 是 \(x_1,\dots,x_s\) 的单值可微函数。设 \(f(x_1,\dots,x_n)\) 为在 \(\mathcal{V}\) 上处处为零的任意可微函数。那么,对恒等式 \(f=0\) 关于 \(x_\nu\)(\(\nu=1,\dots,s\))微分,得到

\[ f^{(\nu)}+f^{(s+1)}\frac{\partial x_{s+1}}{\partial x_\nu}+\dots+f^{(n)}\frac{\partial x_n}{\partial x_\nu}=0, \]

其中当 \(x_1,\dots,x_n\) 为独立变量时 \(f^{(j)}=\partial f/\partial x_j\)。于是对 \(\nu=1,\dots,s\) 我们有

\[ \begin{aligned} f^{(\nu)}&=\sum_{\rho=1}^{n-s}f^{(s+\rho)}\left(-\frac{\partial x_{s+\rho}}{\partial x_\nu}\right)\\ &=\sum_{\rho=1}^{n-s}f^{(s+\rho)}D_{\rho,\nu}, \end{aligned} \]

记作如此。若对 \(\nu>s\) 定义 \(D_{\rho,\nu}\) 为

\[ D_{\rho,\nu}=\begin{cases}1&\text{若 }s+\rho=\nu,\\0&\text{否则,}\end{cases} \]

则同样的关系对 \(\nu=s+1,\dots,n\) 也成立。因此

\[ f^{(\nu)}(\mathbf{x})=\sum_{\rho=1}^{n-s}T_\rho(f)D_{\rho,\nu} \]

对 \(\nu=1,\dots,n\) 成立,其中 \(T_\rho(f)=f^{(s+\rho)}\)。注意到数 \(D_{\rho,\nu}\) 与 \(f\) 无关,而数 \(T_\rho(f)\) 与 \(\nu\) 无关。这就证明了命题中的结论,因为 \(n-s\le r-1\),且这些关系在 \(\mathcal{V}\) 上任一点成立,特别在 \(\mathcal{X}\) 在 \(\mathcal{V}\) 上的任一点成立。

引理 14.3. 设对所有非零整点 \(\mathbf{x}\neq\mathbf{0}\) 都有 \(C(\mathbf{x})\neq 0\)。那么,满足 \(0\lt |\mathbf{x}|\lt R\) 且使双线性方程 \(B_j(\mathbf{x}\,|\,\mathbf{y})=0\) 关于 \(\mathbf{y}\) 恰有 \(r\) 个线性无关解的整点 \(\mathbf{x}\) 的个数小于 \(R^{n-r+\varepsilon}\)。
证. 所讨论的点是那些使矩阵 \(\left(\sum_i c_{ijk}x_i\right)\) 的秩恰为 \(r\) 的点。只需考虑整点集 \(\mathcal{X}\):其中某个特定的 \(n-r\) 阶子行列式 \(\neq 0\),而所有 \(n-r+1\) 阶子行列式均为 \(0\),并证明 \(\mathcal{X}\) 中点的个数小于 \(R^{n-r+\varepsilon}\)。假设 \(\mathcal{X}\) 中点的个数 \(\ge R^{n-r+\varepsilon}\)。那么我们就处于引理 14.2 的情形之下,其中 \(f_1(\mathbf{x}),\dots,f_N(\mathbf{x})\) 是全部 \(n-r+1\) 阶子行列式。

对于 \(\mathcal{X}\) 中的任意点 \(\mathbf{x}\),我们可以构造双线性方程的 \(r\) 个线性无关解 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(r)}\),正如引理 14.1 的证明中那样,把这些点的坐标取为某些 \(n-r\) 阶的子行列式。(在那个证明中,我们只需要一个解,是取 \(y_{n-r+1}=-\Delta,\;y_{n-r+2}=\dots=0\) 得到的;但推广到 \(r\) 个解是显然的。)

现在考虑当 \(\mathbf{x}\) 为任意点(实的或复的)、\(\mathbf{y}^{(p)}\) 如上所述时,\(B_j(\mathbf{x}\,|\,\mathbf{y}^{(p)})\) 的值。此值将是开头所提矩阵的某个 \(n-r+1\) 阶子行列式。(有时它会是一个有两行相同的 \(n-r+1\) 阶子行列式,但这无关紧要。)于是对任意点 \(\mathbf{x}\),我们有恒等式

\[ \sum_{i,k}c_{ijk}x_i y_k^{(p)}=\Delta_{j,p}(\mathbf{x}), \]

其中 \(\Delta_{j,p}(\mathbf{x})\) 是某个 \(n-r+1\) 阶子行列式。当然,若 \(\mathbf{x}\) 在 \(\mathcal{X}\) 中,则所有 \(\Delta_{j,p}\) 都为零。

在上述恒等式中,\(x_1,\dots,x_n\) 是独立变量。关于 \(x_\nu\) 微分给出

\[ \sum_k c_{\nu jk}y_k^{(p)}+\sum_{i,k}c_{ijk}x_i\frac{\partial y_k^{(p)}}{\partial x_\nu}=\Delta_{j,p}^{(\nu)}(\mathbf{x}), \]

其中右端的上标 \((\nu)\) 表示偏导数。乘以 \(y_j^{(q)}\)(\(1\le q\le r\))并对 \(j\) 求和。我们得到

\[ \sum_{j,k}c_{\nu jk}y_k^{(p)}y_j^{(q)}+\sum_k\Delta_{k,q}\frac{\partial y_k^{(p)}}{\partial x_\nu}=\sum_j y_j^{(q)}\Delta_{j,p}^{(\nu)}(\mathbf{x}). \]

现在考虑由 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(r)}\) 张成的 \(r\) 维线性空间中的任意一点 \(\mathbf{Y}\),记作

\[ \mathbf{Y}=\sum_{p=1}^{r}K_p\mathbf{y}^{(p)}. \]

对于此点,我们有

\[ \begin{aligned} \sum_{j,k}c_{\nu jk}Y_j Y_k+\sum_{p=1}^{r}\sum_{q=1}^{r}K_p K_q\sum_k\Delta_{k,q}\frac{\partial y_k^{(p)}}{\partial x_\nu} &=\sum_{p=1}^{r}\sum_{q=1}^{r}K_p K_q\sum_j y_j^{(q)}\Delta_{j,p}^{(\nu)}\\ &=\sum_{p=1}^{r}\sum_j A_{j,p}\Delta_{j,p}^{(\nu)}, \end{aligned} \]

记作如此。这对 \(\nu=1,\dots,n\) 成立。取 \(\mathbf{x}\) 为引理 14.2 中所找到的那些点之一。对于此点(从现在起它被固定),我们有 \(\Delta_{k,q}=0\) 对所有 \(k\) 与 \(q\) 成立,且

\[ \Delta_{j,p}^{(\nu)}=\sum_{\rho=1}^{r-1}T_{j,p,\rho}D_{\rho,\nu}. \]

因此

\[ \sum_{j,k}c_{\nu jk}Y_j Y_k=\sum_{p=1}^{r}\sum_j A_{j,p}\sum_{\rho=1}^{r-1}T_{j,p,\rho}D_{\rho,\nu}. \]

最后,乘以 \(Y_\nu=\sum_{\sigma=1}^{r}K_\sigma y_\nu^{(\sigma)}\) 并对 \(\nu\) 求和。我们得到

\[ C(\mathbf{Y})=\sum_{p=1}^{r}\sum_j A_{j,p}\sum_{\sigma=1}^{r}\sum_{\rho=1}^{r-1}K_\sigma y_\nu^{(\sigma)}T_{j,p,\rho}D_{\rho,\nu}. \]

现在选取数 \(K_1,\dots,K_r\) 使其满足

\[ \sum_{\sigma=1}^{r}K_\sigma\sum_\nu y_\nu^{(\sigma)}D_{\rho,\nu}=0,\quad(1\le\rho\le r-1). \]

这是关于 \(r\) 个未知数的 \(r-1\) 个线性方程,因而有一个 \(K_1,\dots,K_r\) 不全为零的解。又因为系数可设为有理的,我们可以取 \(K_1,\dots,K_r\) 为整数。于是 \(\mathbf{Y}\) 是一个非 \(\mathbf{0}\) 的整点,因为 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(r)}\) 线性无关(这是由于点 \(\mathbf{x}\) 在 \(\mathcal{X}\) 中)。我们得到 \(C(\mathbf{Y})=0\),与假设矛盾,这就证明了结论。

注. 须注意,在上述证明中,\(K_1,\dots,K_r\) 的选取并未涉及数 \(A_{j,p}\)。否则推理将是谬误的,因为这些数本身依赖于 \(K_1,\dots,K_r\)。
引理 14.4. 引理 13.4 的备择情形 A 蕴涵 \(C(\mathbf{x})\) 表示 \(0\)。
证. 若 \(C(\mathbf{x})\) 不表示零,则引理 14.1 与引理 14.3 蕴涵:存在 \(\ll R^{n-r+\varepsilon}\) 个点 \(\mathbf{x}\),使得双线性方程关于 \(\mathbf{y}\) 恰有 \(r\) 个线性无关解。因此存在 \(\ll R^{n+\varepsilon}\) 对满足 \(0\lt |\mathbf{x}|\lt R\)、\(0\lt |\mathbf{y}|\lt R\) 的整点对 \(\mathbf{x},\mathbf{y}\) 满足这些双线性方程。但这与备择情形 A 矛盾,因为我们可以把现在的 \(\varepsilon\) 取为(比方说)备择情形 A 中 \(\varepsilon\) 的一半。(事实上,正如前面所注记的,本证明表明 \(\mathbf{x},\mathbf{y}\) 对的个数为 \(\ll R^n\)。)