一般齐次方程:Birch 定理General homogeneous equations: Birch's theorem
现在我们转向一般的齐次方程,也就是不必属于此前所考虑的加性类型的方程。设 \(f(x_1,\dots,x_n)\) 是一个整系数的、次数为 \(k\) 的齐次多项式,我们称之为一个型(form)。我们关心的是
\[ f(x_1,\dots,x_n)=0 \]在整数 \(x_1,\dots,x_n\)(不全为 0)中的可解性。由于齐次性,我们可以允许系数和变量取有理数而不取整数,这不改变问题的实质。一个显然的必要条件是:该方程必须在实数中可解,且解不全为 0。
当 \(k=2\),即 \(f\) 是一个二次型时,可以借助"配方法"把一般的型表示为加性型。由二次型的经典理论可知,对于可解性显然必要的同余条件——即对每个素数幂 \(p^\nu\),条件 \(f\equiv 0\ (\mathrm{mod}\ p^\nu)\) 在并非所有变量都被 \(p\) 整除的情况下可解,再加上型 \(f\) 必须是不定的这一条件——也是充分的。这些同余条件只对一个有限素数集 \(p\) 才有意义,该集合依赖于系数;并且必须要求这些同余式有一个使 \(x_1,\dots,x_n\) 不全被 \(p\) 整除的解;这里 \(\nu\) 也由系数确定。当 \(n\ge 5\) 时这些同余条件总能满足,相应地我们便有 Meyer (1883) 的著名定理:五个或更多变量中的不定二次型总能非平凡地表示零。
对于 \(k>2\),一般的型比加性型一般得多。例如,若 \(k=3\),则一般型中有 \(\tfrac16 n(n+1)(n+2)\) 个独立系数,而由于对 \(n\) 个
变量作的一个线性变换只有 \(n^2\) 个系数,显然几乎不可能作什么简化。
与一般型相关的一个重要问题是退化性(degeneration)。称 \(n\) 个变量中的一个型是退化的,如果存在一个从 \(x_1,\dots,x_n\) 到 \(y_1,\dots,y_n\) 的非奇异线性变换,使得变换后的型只涉及 \(y_1,\dots,y_{n-1}\);也就是说,所有含 \(y_n\) 的项的系数都消失。退化性是一个绝对的性质,意思是:若一个型不会被某个特定域(例如有理数域)中系数的代换所退化,则在该域被扩张后它仍然不会退化。用我们的记号,必须有 \(\partial f/\partial y_n=0\) 恒成立;而若 \(C_j\) 是 \(y_n\) 在 \(x_j\) 中的系数,这就等价于
\[ C_1\frac{\partial f}{\partial x_1}+\cdots+C_n\frac{\partial f}{\partial x_n}=0 \]恒成立。这个恒等式表示关于系数 \(C_1,\dots,C_n\) 的有限多个线性关系,而如果这些关系总能被满足,那么它们就能在原来的域中被满足。
然而,从当前问题——即表示零——的角度看,我们总可以假设 \(f\) 是非退化的;因为若 \(f\) 如上所述退化,那么对应于解 \(y_1=\cdots=y_{n-1}=0,\ y_n=1\),就有一个 \(x_1,\dots,x_n\) 不全为 0 的解。
朝着求解一般齐次方程方向迈出第一步实质性进展的是 R. Brauer [9]。他证明:对于系数和变量在任意域中的方程,一个次数为 \(k\) 的齐次方程的可解性,可以从每一个次数 \(\le k\) 的加性方程组的可解性推出。但为了在最终的方程组中得到合理多的变量数,原方程中变量的个数必须取得极其庞大。该定理本身在有理数域中不能成功应用,因为在那些加性方程之中会有一些偶次的,而若它们的系数符号全相同,这些方程肯定不可解。然而,Brauer 定理在 \(p\) 进数域中适用,并确立了一个函数 \(n_1(k,h)\) 的存在性,使得在 \(n\) 个变量中任意 \(h\) 个次数 \(\le k\)、具有 \(p\) 进系数的齐次方程组,只要 \(n\ge n_1(k,h)\),便在 \(p\) 进数中可解。
这一领域中最简单的问题是单个三次方程的问题。Lewis 教授 [56] 最先证明了存在一个绝对常数 \(n_0\),使得任何 \(n\) 个变量中
带有理系数的三次方程,只要 \(n\ge n_0\),便在有理数中可解。他通过用基于代数数论的论证去补充 Brauer 的结果,从而推出了这一点。
不久之后,Birch [5] 证明了一个更一般的定理,即:每个齐次方程组,只要其中各方程都是奇次的,并且 \(n\) 超过依赖于这些次数的某个函数,便可解。这个定理就是本章的主题。
在以其全部一般性证明 Birch 定理之前,我打算先就最简单的情形——单个三次方程——来说明方法。我们将会发现,为了从加性三次方程组的可解性推出一般三次方程的可解性,需要去求解某些线性方程组。后者的可解性由定理 8.1 保证,只要变量个数至少为 \(k^2(2k-1)+1=46\)。(实际上 8 个变量就够了,但这需要特殊的论证。)正如 Brauer 的方法那样——Birch 的方法是它的一个巧妙改进——在从一般型过渡到加性型的过程中,存在相当大的变量浪费。
设 \(f(x_1,\dots,x_n)\) 是一个三次型。我们说:\(f\) 表示 \(g(y_1,\dots,y_m)\)(其中 \(m\le n\)),如果存在 \(n\) 个关于 \(y_1,\dots,y_m\) 的线性型,其秩为 \(m\),使得当用这些线性型替换 \(x_1,\dots,x_n\) 时,得到
\[ f(x_1,\dots,x_n)=g(y_1,\dots,y_m) \]关于 \(y_1,\dots,y_m\) 恒成立。证明的基本思想是:证明 \(f\) 表示一个如下类型的型
\begin{equation}\tag{11.1} a_0 t_0^3+g_1(t_1,\dots,t_m). \end{equation}只要 \(n\) 超过某个仅依赖于 \(m\) 的数。
写
\[ f(\mathbf{x})=f(x_1,\dots,x_n)=\sum_i\sum_j\sum_k c_{ijk}x_ix_jx_k, \]其中各求和从 1 到 \(n\),且 \(c_{ijk}\) 是三个下标的对称函数。对三个点 \(\mathbf{x},\mathbf{y},\mathbf{z}\) 定义三线性函数 \(T(\mathbf{x}\,|\,\mathbf{y}\,|\,\mathbf{z})\):
\[ T(\mathbf{x}\,|\,\mathbf{y}\,|\,\mathbf{z})=\sum_i\sum_j\sum_k c_{ijk}x_iy_jz_k. \]我们任取 \(m\) 个线性无关的点 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(m)}\),它们具有整(或有理)坐标,并考虑关于一个未知点 \(\mathbf{y}\) 的方程
\[ T(\mathbf{y}\,|\,\mathbf{y}^{(p)}\,|\,\mathbf{y}^{(q)})=0,\quad 1\le p\le q\le m \]这是关于 \(\mathbf{y}\) 的 \(n\) 个坐标的 \(\tfrac12 m(m+1)\) 个线性方程。如果 \(n>\tfrac12 m(m+1)\),则存在一个满足它们的、异于原点的点 \(\mathbf{y}\)。称这样的一个点为 \(\mathbf{y}^{(0)}\),我们便有
\[ T(\mathbf{y}^{(0)}\,|\,\mathbf{y}^{(p)}\,|\,\mathbf{y}^{(q)})=0 \]对 \(1\le p\le q\le m\) 成立。
如果点 \(\mathbf{y}^{(0)},\mathbf{y}^{(1)},\dots,\mathbf{y}^{(m)}\) 线性相关,那么(因为后 \(m\) 个是线性无关的)我们应当有
\[ \mathbf{y}^{(0)}=c_1\mathbf{y}^{(1)}+\cdots+c_m\mathbf{y}^{(m)} \]其中 \(c_1,\dots,c_m\) 是有理数。但那时
\[ T(\mathbf{y}^{(0)}\,|\,\mathbf{y}^{(0)}\,|\,\mathbf{y}^{(0)})=\sum_{p=1}^m\sum_{q=1}^m c_pc_q\,T(\mathbf{y}^{(0)}\,|\,\mathbf{y}^{(p)}\,|\,\mathbf{y}^{(q)})=0, \]由此 \(f(\mathbf{y}^{(0)})=0\),从而给出了所求的解。
于是我们可以假设这 \(m+1\) 个点线性无关。变换
\[ x_j=t_0y_j^{(0)}+t_1y_j^{(1)}+\cdots+t_my_j^{(m)},\quad(1\le j\le n) \]的秩为 \(m+1\),并把 \(f\) 表示为 \(t_0,t_1,\dots,t_m\) 的一个型。在这个型中 \(t_0t_pt_q\) 的系数是 \(T(\mathbf{y}^{(0)}\,|\,\mathbf{y}^{(p)}\,|\,\mathbf{y}^{(q)})\),故当 \(1\le p\le q\le m\) 时它为 0。因此新的型具有下列形状
\[ a_0t_0^3+t_0^2(b_1t_1+\cdots+b_mt_m)+g_1(t_1,\dots,t_m), \]其中不含 \(t_0\) 的一次项。如果 \(b_1,\dots,b_m\) 全为 0,我们便得到一个所求类型 (11.1) 的型。如果不然,设 \(b_m\ne 0\),我们令
\[ t_m=-\frac{1}{b_m}(b_1t_1+\cdots+b_{m-1}t_{m-1}) \]从而得到一个类型 (11.1) 的型,但其中 \(m\) 被 \(m-1\) 代替。于是,只要 \(n>\tfrac12 m(m+1)\),\(f\) 就表示一个类型 (11.1) 的型。我们可以假设 \(a_0\ne 0\),因为若 \(a_0=0\),则对应于 \(t_0=1,\ t_1=\cdots=t_m=0\),存在一个 \(x_1,\dots,x_n\) 的解。
我们看到,只要取 \(n\) 足够大,就可以让 \(m\) 任意大。同样,我们也可以对新的型 \(g(t_1,\dots,t_m)\) 重复这一过程,该型可假设不表示零。由此可知,存在一个函数 \(n_0(s)\),使得若 \(n\ge n_0(s)\),则型 \(f\) 表示一个如下类型的型
\[ b_1u_1^3+\cdots+b_su_s^3. \]由定理 8.1,只要 \(s\ge s_0\,(=46,\ \text{比方说})\),相应的齐次方程便有非平凡解,从而当 \(n\ge n_0(s_0)\) 时原方程可解。
现在我们来证明 Birch 的一般定理:
注意我们断言的比"存在无穷多个解"更强;这是为了在归纳证明中方便。
对一个次数为 \(R\) 的型 \(f(x_1,\dots,x_n)\),我们定义 \(R\) 个点 \(\mathbf{x}^{(1)},\dots,\mathbf{x}^{(R)}\) 的一个多重线性函数: \[ f(x_1,\dots,x_n)=\sum c_{i_1,\dots,i_R}x_{i_1}\dots x_{i_R}, \] \[ M(\mathbf{x}^{(1)}\,|\,\cdots\,|\,\mathbf{x}^{(R)})=\sum c_{i_1,\dots,i_R}x_{i_1}^{(1)}\dots x_{i_R}^{(R)}. \]
我们先选取 \(h\) 个线性无关的点 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(h)}\)。设 \(\mathcal{Y}\) 是由它们生成的 \(h\) 维线性空间。考虑方程 \[ M(\underbrace{\mathbf{y}\,|\,\cdots\,|\,\mathbf{y}}_{\rho}\,|\,\mathbf{y}^{(p_1)}\,|\,\cdots\,|\,\mathbf{y}^{(p_{R-\rho})})=0, \] 其中 \(\rho\) 取从 1 到 \(R-2\) 的所有奇数值,而 \(p_1,\dots,p_{R-\rho}\) 取从 1 到 \(h\) 的所有值。这些方程的总数小于 \(Rh^R\)。它们每一个关于 \(\mathbf{y}\) 都是次数 \(\le R-2\) 的奇次方程。因此,由归纳假设(对 \(m=1\) 的情形),只要 \(n\ge n_0(R,h)\),这些方程在 \(\mathbf{y}\) 中就有一个非零解。记这样的一个解为 \(\mathbf{y}^{(0)}\)。我们现在有 \[ M(\underbrace{\mathbf{y}^{(0)}\,|\,\cdots\,|\,\mathbf{y}^{(0)}}_{\rho}\,|\,\underbrace{\mathbf{y}\,|\,\cdots\,|\,\mathbf{y}}_{R-\rho})=0 \] 对 \(\mathcal{Y}\) 中所有 \(y\) 以及所有奇数 \(\rho\le R-2\) 成立。
\(\mathcal{Y}\) 中一个任意点 \(\mathbf{y}\) 具有形式 \[ u_1\mathbf{y}^{(1)}+\cdots+u_h\mathbf{y}^{(h)}. \]
现在考虑方程 \[ M(\underbrace{\mathbf{y}^{(0)}\,|\,\cdots\,|\,\mathbf{y}^{(0)}}_{R-\sigma}\,|\,\underbrace{\mathbf{y}\,|\,\cdots\,|\,\mathbf{y}}_{\sigma})=0, \] 其中 \(\sigma\) 取从 1 到 \(R-2\) 的所有奇数值,而 \(\mathbf{y}\) 是 \(\mathcal{Y}\) 中任意点。这些是关于 \(u_1,\dots,u_h\) 的次数 \(\le R-2\) 的奇次方程,其个数 \(\lt R\)。再由归纳假设,给定任何 \(\ell\),只要 \(h\ge h_0(R,\ell)\),这些方程将被 \(\mathcal{Y}\) 的某个 \(\ell+1\) 维有理线性子空间中的所有点满足。把这个线性子空间
记为 \(\mathcal{Y}_1\)。我们可以不失一般性地假设 \(\mathcal{Y}_1\) 由 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(\ell+1)}\) 生成。我们便有 \[ M(\underbrace{\mathbf{y}^{(0)}\,|\,\cdots\,|\,\mathbf{y}^{(0)}}_{\tau}\,|\,\underbrace{\mathbf{y}\,|\,\cdots\,|\,\mathbf{y}}_{R-\tau})=0 \] 对所有 \(\tau=1,\dots,R-1\) 以及 \((\ell+1)\) 维空间 \(\mathcal{Y}_1\) 中所有 \(\mathbf{y}\) 成立。为保证这一点,我们只需假设 \(n\ge n_1(R,\ell)\)。
如果 \(\mathbf{y}^{(0)}\) 在由 \(\mathbf{y}^{(1)},\dots,\mathbf{y}^{(\ell+1)}\) 生成的子空间 \(\mathcal{Y}_1\) 中,我们可以通过去掉其中一个生成点(比方说 \(\mathbf{y}^{(\ell+1)}\)),得到 \(\mathcal{Y}_1\) 的一个 \(\ell\) 维子空间 \(\mathcal{Y}_2\),它不含 \(\mathbf{y}^{(0)}\)。现在点 \(\mathbf{y}^{(0)},\mathbf{y}^{(1)},\dots,\mathbf{y}^{(\ell)}\) 是线性无关的。线性变换 \[ x_j=t_0y_j^{(0)}+t_1y_j^{(1)}+\cdots+t_\ell y_j^{(\ell)},\quad(1\le j\le n) \] 的秩为 \(\ell+1\),并给出 \(f(\mathbf{x})=g(t_0,\dots,t_\ell)\),比方说。在 \(g\) 中 \(t_0^\tau t_{p_1}\cdots t_{p_{R-\tau}}\) 的系数(其中各 \(p_j\) 从 1 到 \(\ell\))是 \[ M(\underbrace{\mathbf{y}^{(0)}\,|\,\cdots\,|\,\mathbf{y}^{(0)}}_{\tau}\,|\,\mathbf{y}^{(p_1)}\,|\,\cdots\,|\,\mathbf{y}^{(p_{R-\tau})})=0, \] 而这对 \(\tau=1,\dots,R-1\) 以及任意选取的 \(p_1,\dots,p_{R-\tau}\) 都成立。因此 \[ g(t_0,\dots,t_\ell)=a_0t_0^R+g_1(t_1,\dots,t_\ell). \]
于是,对任何 \(\ell\),只要 \(n\ge n_1(R,\ell)\),\(f\) 就表示一个上述类型的型。重复这一论证可证明 \(f\) 表示一个如下类型的型 \[ \underbrace{a_0t_0^R+b_0u_0^R+\cdots}_{s}, \] 只要 \(n\ge n_2(R,s)\)。由引理 11.1,把后一型令为 0 所得的齐次方程,其解包含一个 \(m\) 维线性空间,只要 \(s\ge\Phi(R,m)\)。因此原方程的解包含一个 \(m\) 维线性空间,只要 \(n\ge n_2(R,\Phi(R,m))\)。这就证明了单个次数为 \(R\) 的方程所要的结果。
现在设有 \(h\) 个方程 \(f_{r_1}=0,\dots,f_{r_h}=0\),其中每个 \(r_j\le R\)。我们对 \(h\) 作归纳来证明结果,\(h=1\) 的情形即我们刚刚证明的。给定 \(m_1\),由定理对 \(h=1\) 的情形,存在一个 \(m_1\) 维有理线性空间,在其上 \(f_{r_h}=0\),只要 \(n\ge\Psi(r_h;m_1)\)。我们可以把这个线性空间的点表示为 \[ v_1\mathbf{x}^{(1)}+\cdots+v_{m_1}\mathbf{x}^{(m_1)}. \]
对这些点,型 \(f_{r_1},\dots,f_{r_{h-1}}\) 成为 \(v_1,\dots,v_{m_1}\) 中的型。由 \(h-1\) 的情形,存在一个 \(m\) 维线性空间,在其上它们全部消失,只要 \(m_1\ge\Psi(r_1,\dots,r_{h-1};m)\)。因此所有这些型在该空间上消失,于是定理的 \(h\) 情形成立,并有 \[ \Psi(r_1,\dots,r_h;m)=\Psi(r_h;\Psi(r_1,\dots,r_{h-1};m)). \] 这就完成了证明。∎
当我们把每个系数与每个变量用 \(K\) 的一组基 \(\{1,\theta,\dots,\theta^{\nu-1}\}\)(其中 \(\nu\) 是 \(K\) 的次数,\(\theta\) 是一个生成元)线性地表示出来时,每个方程都等价于 \(\nu\) 个具有相同次数、带有理系数与变量的方程。
我们接下来的目标将是证明一个更精确的结果,它关于使单个齐次三次方程可解所需的变量个数。在工作过程中,我们将需要数的几何中的一些结果,因此我们将以对这一主题某些方面的叙述作为开始。