线性代数
值域和零空间
设矩阵 A∈Rm×n,A 的值域是指 Rm 中能够写成 A 的列向量的线性组合的所有向量的集合,即
R(A)={Ax∣x∈Rn}值域 R(A) 是 Rm 的子空间,它的维数是 A 的秩,记作 rankA。A 的秩一定不会大于 m 和 n 的较小值。当 rankA=min{m,n} 时,称 A 为满秩矩阵。
A 的零空间(或核)是指被 A 映射成零的所有向量 x 的集合,即
N(A)={x∣Ax=0}正交补
V⊥={x∣∀z∈V,z⊤x=0}有如下结论恒成立:
V⊥⊥=VA 导出的正交分解
N(A)=R(A⊤)⊥对称特征值分解
设 A 为 n 阶实对称矩阵,则 A 可以因式分解为
A=QΛQ⊤其中 Q∈Rn×n 是正交矩阵,满足 Q⊤Q=I,而 Λ=diag(λ1,⋯,λn)。实数 λi 是 A 的特征值,是特征多项式 det(sI−A) 的根,Q 的列向量构成 A 的一组正交特征向量。
通常我们将特征值按从大到小排序,用 λi(A) 表示第 i 大特征值。最大特征值记作 λ1(A)=λmax(A),最小特征值记作 λn(A)=λmin(A)。
特征值具有如下性质:
detAtrA=i=1∏nλi=i=1∑nλi矩阵不等式
λmax(A)=x=0supx⊤xx⊤Ax,λmin(A)=x=0infx⊤xx⊤Ax特别地,对 ∀x,我们有
λmin(A)x⊤x⩽x⊤x⩽λmax(A)x⊤x正定矩阵
若矩阵 A 对 ∀x=0,有 x⊤Ax>0 成立,则称矩阵 A 正定,记作 A≻0。显然,A≻0 的充要条件是 λmin(A)>0。
同理,半正定(非负定)、负定、半负定(非正定)矩阵的定义类似。本文从略。
对称平方根
A1/2=Qdiag(λ11/2,⋯,λn1/2)Q⊤平方根 A1/2 是矩阵方程 X2=A 的唯一的对称半正定的解。
广义特征值分解
两个对称矩阵 (A,B)∈Sn×Sn 的广义特征值定义为多项式 det(sB−A) 的根。
奇异值分解
设 A∈Rm×n,rankA=r,那么 A 可以因式分解为
A=UΣV⊤其中 U∈Rm×r 满足 U⊤U=I,V∈Rn×r 满足 V⊤V=I,而 Σ=diag(σ1,⋯,σr) 满足
σ1⩾σ2⩾⋯⩾σr>0称为 A 的奇异值分解(SVD)。U 的列向量称为 A 的左奇异向量,V 的列向量称为 A 的右奇异向量,而 σi 称为奇异值。奇异值分解可以写成
A=i=1∑rσiuivi⊤伪逆
设 A=UΣV⊤ 为 A∈m×n 的奇异值分解,rankA=r,则 A 的伪逆为
A†=VΣ−1U⊤∈Rn×m伪逆可以用于求解最小二乘、最小范数、二次规划以及(Euclid)投影这些问题。
Schur 补
考虑进行以下划分的矩阵 X∈Sn
X=[AB⊤BC]其中 A∈Sk。如果 detA=0,矩阵
S=C−B⊤A−1B被称为 A 在 X 中的 Schur 补。Schur 补出现于很多重要的公式和定理中,例如
detX=detAdetS分块矩阵求逆
考虑如下分块矩阵方程:
[AB⊤BC][xy]=[uv]假设 detA=0。将方程中的 x 消去,解得
y=S−1(v−B⊤A−1u)将 y 代入原方程,解得
x=(A−1+A−1BS−1B⊤A−1)u−A−1BS−1v于是我们可以得到分块矩阵的求逆公式:
[AB⊤BC]−1=[A−1+A−1BS−1B⊤A−1−S−1B⊤A−1−A−1BS−1S−1]