在「A1章」中我们提到:
实际上,任意复矩阵酉交相似于复对角矩阵的充要条件就是其是正规矩阵。
证明
充分性:
已知 $\boldsymbol A^{\rm H} \boldsymbol A = \boldsymbol A \boldsymbol A ^{\rm H}$,和分解式 $\boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol T$(舒尔定理),也就有 $\boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol U = \boldsymbol T^{\rm H}$。
有 $\boldsymbol T^{\rm H}\boldsymbol T = \boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol U \boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol A^{\rm H} \boldsymbol U = \boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol U \boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol U = \boldsymbol T\boldsymbol T^{\rm H}$。依 $(\boldsymbol T^{\rm H} \boldsymbol T){[k, k]} = \sum{i=1}^k |t_{[i, k]}|^2$,$(\boldsymbol T \boldsymbol T^{\rm H}){[k, k]} = \sum{i=k}^N |t_{[k, i]}|^2$。得 $\sum_{i=1}^k |t_{[i, k]}|^2 = \sum_{i=k}^N |t_{[k, i]}|^2$。
此式可以用于逐渐推导。考虑 $k= 1$ 可以得到 $|t_{[1, 1]}|^2 = \sum_{i=1}^N |t_{[1, i]}|^2$ 故 $\sum_{s=2}^N |t_{[1, s]}|^2 = 0$,即第一行除了第一项都是 0。
考虑 $k= 2$ 可以得到 $|t_{[1, 2]}|^2 + |t_{[2, 2]}|^2 = \sum_{i=2}^N |t_{[2, i]}|^2$,而已论证 $t_{[1, 2]}=0$,故同理,第二行除了第二项,后面的都是 0……一直到最后一行,故 $\boldsymbol T$ 为对角矩阵 $\boldsymbol \Lambda$。
必要性:
- 已有 $\boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol \Lambda$($\boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol U = \boldsymbol \Lambda^{\rm H}$)。如前所述,复对角矩阵是正规矩阵有 $\boldsymbol \Lambda^{\rm H} \boldsymbol \Lambda = \boldsymbol \Lambda \boldsymbol \Lambda ^{\rm H}$,即 $\boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol U\boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol U ^{\rm H}\boldsymbol A \boldsymbol U\boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol U$,得 $\boldsymbol U ^{\rm H} \boldsymbol A^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol U ^{\rm H}\boldsymbol A \boldsymbol A^{\rm H} \boldsymbol U$,消去得 $\boldsymbol A^{\rm H} \boldsymbol A = \boldsymbol A \boldsymbol A^{\rm H}$。
同样地,这也说明正规矩阵 $\Leftrightarrow$ 有 $N$ 个两两酉交的单位特征向量。
证明:只需证酉交相似于复对角矩阵的矩阵 $\Leftrightarrow$ 有 $N$ 个两两酉交的单位特征向量。
$\Rightarrow$:
- 分解式 $\boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol \Lambda$ 得 $\boldsymbol A \boldsymbol U = \boldsymbol U\boldsymbol \Lambda$,即 $\boldsymbol A \boldsymbol u_i = \lambda_i\boldsymbol u_i \ (i \in [1, n])$。
- 因 $\boldsymbol U$ 为酉交矩阵,因而 $\boldsymbol A$ 确有 $N$ 个两两酉交的单位特征向量。
$\Leftarrow$(证略)。
另一推论:正规矩阵属于不同特征值的特征向量一定互相正交。
i. 谱分解的定义
将 $\boldsymbol U ^{\rm H} \boldsymbol A \boldsymbol U = \boldsymbol \Lambda$ 得到的 $\boldsymbol A = \boldsymbol U \boldsymbol \Lambda \boldsymbol U ^{\rm H}$ 写作下式,即为谱分解【TODO:需要图解】。
$$ \boldsymbol A = \sum_{i=1}^N \lambda_i \boldsymbol u_i \boldsymbol u^{\rm H}_i $$
ii. 成分矩阵的性质
其中关于 $\boldsymbol u_i \boldsymbol u^{\rm H}_i$ 这个由单位向量张成的矩阵(称为成分矩阵或者分量),有如下性质:
iii. 谱分解的转移性质
iv. 谱分解作为线性变换的性质
i. 定义 F-范数
定义任意矩阵(可非方)$\boldsymbol X$ 的 Frobenius 范数的定义如下:
$$ \| \boldsymbol X \|F^2 = \sum{i=1}^R \sum_{j=1}^C |x_{ij}|^2 = {\rm tr} \, \boldsymbol X \boldsymbol X^{\rm H} = {\rm tr} \, \boldsymbol X^{\rm H} \boldsymbol X $$
其明显拥有正定性,可以开方。
ii. F-范数要用到的性质
如果同阶矩阵酉交即 $\boldsymbol A ^{\rm H} \boldsymbol B = \boldsymbol O$,那么 $\| \boldsymbol A +\boldsymbol B \|_F^2 = \| \boldsymbol A \|_F^2 + \| \boldsymbol B \|_F^2$。
证明
$$ \begin{align*}
\| \boldsymbol A +\boldsymbol B \|_F^2
&= {\rm tr} (\boldsymbol A +\boldsymbol B)^{\rm H} (\boldsymbol A +\boldsymbol B) \\
&= {\rm tr} (\boldsymbol A^{\rm H} \boldsymbol A + \boldsymbol B^{\rm H} \boldsymbol B + \boldsymbol A^{\rm H} \boldsymbol B + \boldsymbol B^{\rm H} \boldsymbol A)\\
&= {\rm tr} (\boldsymbol A^{\rm H} \boldsymbol A + \boldsymbol B^{\rm H} \boldsymbol B ) \\
&= {\rm tr} (\boldsymbol A^{\rm H} \boldsymbol A) + {\rm tr} (\boldsymbol B^{\rm H} \boldsymbol B ) \\
&= \| \boldsymbol A \|_F^2 + \| \boldsymbol B \|_F^2
\end{align*} $$
可以推广到更多个互相两两酉交的同阶矩阵的和也有类似的关系。
数乘关系:$\forall \, k \in {\mathbb C}, \, \| k \boldsymbol X \|_F = |k| \cdot \| \boldsymbol X \|_F$。
证明
$\| k \boldsymbol X \|_F^2
= \sum_{i=1}^R \sum_{j=1}^C |kx_{ij}|^2
= |k|^2 \sum_{i=1}^R \sum_{j=1}^C |x_{ij}|^2
= |k|^2 \cdot \| \boldsymbol X \|_F^2$。
iii. 正规矩阵的 F-范数
= \| \boldsymbol \Lambda \|F = \sqrt{\sum{i=1}^N |\lambda_{i}|^2}$。
> **证明**
>
>
> 通过 $\\| \\boldsymbol X \\|_F = \\| \\boldsymbol X^{\\rm H} \\|_F$ 即 ${\\rm tr} \\, \\boldsymbol X \\boldsymbol X^{\\rm H} = {\\rm tr} \\, \\boldsymbol X^{\\rm H} \\boldsymbol X$:
>
> $$
> \\begin{align*}
>
> \\| \\boldsymbol A \\|_F^2
>
> &= \\left\\| \\boldsymbol U \\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H} \\right\\|_F^2
>
> = {\\rm tr} ( \\boldsymbol U \\boldsymbol \\Lambda^{\\rm H} \\boldsymbol U ^{\\rm H} \\boldsymbol U \\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H} )
>
> = {\\rm tr} ( \\boldsymbol U \\boldsymbol \\Lambda^{\\rm H} \\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H} ) \\\\
>
> &= {\\rm tr} ((\\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H})^{\\rm H} (\\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H}))
>
> = {\\rm tr} ((\\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H}) (\\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H})^{\\rm H}) \\\\
>
> &= {\\rm tr} (\\boldsymbol \\Lambda \\boldsymbol U ^{\\rm H} \\boldsymbol U \\boldsymbol \\Lambda^{\\rm H} )
>
> = {\\rm tr} (\\boldsymbol \\Lambda \\boldsymbol \\Lambda^{\\rm H} )
>
> = \\sum_{i=1}^N |\\lambda_{i}|^2
>
> \\end{align*}
> $$
>