圆锥曲线及其方程
椭圆的标准方程
a2x2+b2y2=1(a,b>0)当 a=b=r 时,这个方程表示圆
x2+y2=r2(r>0)双曲线的标准方程
a2x2−b2y2=1(a,b>0)a2y2−b2x2=1(a,b>0)抛物线的标准方程
y2=2pxx2=2py
圆锥曲线的一般方程
圆锥曲线的一般方程是一个关于 x,y 的二次方程
Ax2+By2+2Cxy+2Dx+2Ex+F=0(1)之所以有部分项的前面有系数 2,是为了方便用高等代数的形式来表示,即
[xy1]ACDCBEDEFxy1=0(2)圆锥曲线的形状判定
旋转变换矩阵
R=[cosθsinθ−sinθcosθ]它是一个正交矩阵,这意味着
RR⊤=R⊤R=I又因为逆矩阵的定义
RR−1=R−1R=I所以
R−1=R⊤
正交变换
正交矩阵对应的变换称为正交变换。两个向量经过正交变换后
由此可知,对于曲线(乃至曲面甚至更高维度的超曲面),作正交变换,形状一定不变!
我们所熟知的反比例函数图像为什么是双曲线,是因为
xy=k的两条渐近线分别为 x 轴和 y 轴。作变量变换
[uv]=[2222−2222][xy]反解出
[xy]=[22−222222][uv]代入原方程得
(22u+22v)(−22u+22v)v2−u22kv2−2ku2=k=2k=1同样,对勾函数(也称为双勾函数)的图像也是双曲线,是因为
y=x+xk的两条渐近线分别为
x=0y=x作变量变换
[uv]=[cos8πsin8π−sin8πcos8π][xy]由角平分线第二定理,可以快速计算出 8π 的正弦值为
sin8π⟹cos8π=sin4π⋅2+11=1−22=1−sin28π=2−21接着,求出旋转变换的逆矩阵即可反解出 x,y,代入原式即可证明。

矩阵相似对角化
系数矩阵
P=ACDCBEDEF是一个实对称矩阵,所以它必定可相似对角化,即存在可逆矩阵 Q,使得
Q−1PQP=λ1λ2λ3∼λ1λ2λ3其中,λ1, λ2, λ3 为特征值。相似的矩阵具有相同的特征值,它刻画了特征向量的伸缩倍数。
注意这里的 λ1, λ2 是直接对 x,y 作用的,它们共同影响了圆锥曲线的形状。下面我们就来进行深入分析。
圆锥曲线的不变量
圆锥曲线一共有如下 3 个不变量
I1I2I3=tr(ACCB)=A+B=det(ACCB)=AB−C2=detACDCBEDEF其中,I2 是重要的判断圆锥曲线形状的依据。若
[ACCB]∼[λ1λ2]作为对角矩阵的特征值,不妨设 λ1<λ2,那么
- 若 0<λ1<λ2, 则该圆锥曲线是椭圆。
- 若 λ1<0<λ2, 则该圆锥曲线是双曲线。
- 若 0=λ1<λ2,则该圆锥曲线是抛物线。
并且,可以确定椭圆或双曲线的离心率为
e=1−λ2λ1⎩⎨⎧=0圆∈(0,1)椭圆=1抛物线∈(1,+∞)双曲线又因为任意方阵 A 的所有特征值之积等于 A 的行列式,即
i∏λi=detA所以
$$
I_2 = AB - C^2 \begin{cases}
< 0 \quad \text{双曲线} \
= 0 \quad \text{抛物线} \
0 \quad \text{椭圆}
\end{cases}
$$
为什么不用 I3 来判断圆锥曲线的形状呢?
注意在系数矩阵中,是包含比二次项次数更低的一次项和常数项的。在比二次项次数更低的分量上进行线性运算,只能是维度更低的运算,例如平移、投影等。低维运算对高维特征没有影响。
研究圆锥曲线的形状,二次齐次式是关键。在三维空间乃至更高维度也是如此,归根结底是二次齐次式。这也是为什么要定义二次型的原因。
二次曲面及其方程
从二维升至三维后,情况虽然变得更为复杂,但是总有一些根本的不变量和规律。首先,我们先直观地感受一下二次曲面的种类和分类。
椭球面
a2x2+b2y2+c2z2=1(a,b,c>0)
特别地,当 a=b=c=r 时,方程表示球面
x2+y2+z2=r2(r>0)由于双曲线和抛物线不是封闭曲线,所以它们不可能形成类似于球面的封闭曲面。
椭圆锥面
a2x2+b2y2=z2(a,b>0)
特别地,当 a=b=r 时,方程表示圆锥面
r2x2+r2y2=z2(r>0)二次柱面
圆锥曲线沿某个坐标轴运动的轨迹就形成了二次柱面,即
a2x2+b2y2a2x2−b2y2y2=1(a,b>0)=1(a,b>0)=2px
双曲面
双曲线沿其不同的对称轴旋转的轨迹形成了不同的双曲面,包括单叶双曲面和双叶双曲面,即
a2x2+b2y2−c2z2a2x2−b2y2−c2z2=1(a,b,c>0)=1(a,b,c>0)
抛物面
椭圆和双曲线的标准方程都是二次齐次式,它们可以在更高的三维空间中和抛物线相结合,形成椭圆抛物面和双曲抛物面(马鞍面)。
a2x2+b2y2a2x2−b2y2=z(a,b>0)=z(a,b>0)
二次曲面的一般方程
通过类比推理,二次曲面的一般方程是一个关于 x,y,z 的二次方程。用高等代数的形式表示就是
[xyz1]ADEGDBFHEFCJGHJKxyz1=0同理,二次齐次式的系数矩阵
ADEDBFEFC是判断二次曲面类型的关键。当维度升高后,有必要引入一套更加规范化的理论,这就是二次型。
二次型
f(x1,x2,⋯,xn)=[x1x2⋯xn]a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮annx1x2⋮xn=x⊤Ax通过二次型的定义,可以将 n 维空间的任意一个超二次曲面的方程和一个 n 阶对称矩阵对应起来。
矩阵合同
两个矩阵 A,B 合同,即
A≃B等价于,存在一个可逆矩阵 Q,使得
Q⊤AQ=B二次型在可逆变换前后,矩阵合同。又因为二次型和实对称矩阵一一对应,所以任何二次型的系数矩阵一定和一个对角矩阵合同。
矩阵等价、合同、相似
顾名思义,“等价、合同、相似”,直观的感受是需要满足的条件越来越多,满足后者则一定满足前者。然而,实际情况会更复杂一些。
两个矩阵等价,说明它们的秩相等。这意味着,向量组线性相关,可以互相线性表示。
两个矩阵合同,说明它们在秩相等的基础上,正负惯性指数相等。
两个矩阵相似,说明它们不光正负惯性指数相等,而且还有相同的特征值。
上述关于相似和合同的结论仅仅只是在实对称矩阵上才成立。对于一般的 n 阶方阵,合同和相似没有任何关系,但它们都一定能推出等价。
标准形
只含平方项的二次型被称为二次型的标准形,即
f(x1,x2,⋯,xn)=[x1x2⋯xn]λ1λ2⋱λnx1x2⋮xn=λ1x12+λ2x22+⋯+λnxn2任何二次型都可以通过正交变换化为标准形。具体步骤如下:
- 求特征值和特征向量
- 确定齐次线性方程的基础解系
- 施密特正交化、单位化,得到正交变换矩阵
我们再回到二维平面中,定义二次型
f(x,y)=ax2+by2=k(k>0)
- 若 a>0,b>0,二次型表示椭圆。
- 若 ab<0,二次型表示双曲线。
由于抛物线的方程不是二次齐次式,按上述定义无法通过二次型表示抛物线。参考前文的内容,不难发现,一般的二次多项式若表示抛物线,须满足
I2I3=det(ACCB)=AB−C2=0=detACDCBEDEF=0类似地,在三维空间中,定义二次型
f(x,y,z)=ax2+by2+cz2=k(k⩾0)
- 若 a,b,c 都大于 0,二次型表示椭球面。
- 若 a,b,c 有且仅有一个小于 0,二次型表示单叶双曲面。
- 若 a,b,c 有且仅有两个小于 0,二次型表示双叶双曲面。
- 若 abc=0,二次型是一个柱面。
- 若 a,b,c 不都同号,且 k=0,二次型表示椭圆锥面。
同样地,上述二次齐次式无法表示抛物面。可以用类似二维平面的方法,通过二次曲面的不变量来判断。
规范形和惯性指数
通过上述分析,我们发现二次型的标准形的正负是一个重要指标。通过可逆变换(不能是正交变换),可以把二次型化为规范形。
二次型的规范形经过伸缩变换,特征值发生了变化,且取值范围只能是 {1,−1,0}。大于 0 的特征值个数称为正惯性指数,小于 0 的特征值个数称为负惯性指数。
正定二次型
如果一个二次型的特征值都大于 0,即正惯性指数 p=n,那么该二次型就是一个正定二次型。显然,椭圆、椭球面都是正定二次型,双曲线、双曲面都是不定二次型。
不难发现,不论是二维平面的椭圆,还是三维空间的椭球面,它们具有一个共同的特点:封闭。这意味着,如果一个多元函数是正定的,那么它必然存在最优解。这在凸优化等领域得到广泛应用。