对某实数据集 $\boldsymbol X_{N \times M}$($M$ 列,每列是一个 $N$ 维样本 $\boldsymbol x^{(m)}$)而言:
i. 均值向量
有各维度均值 $\mu_i \ (i \in [1, N] \cap \Z)$ 的定义与求法:
$$ \mu_i = {\rm E}(X_i) = \frac 1M \sum_{m=1}^{M} x^{(m)}_i $$
故有均值向量为:
$$ \boldsymbol \mu = \frac 1M \sum_{m=1}^{M} \boldsymbol x^{(m)} $$
ii. 协方差矩阵
有任意两维度间协方差 $\Sigma_{i, j} \ (i, j \in [1, N] \cap \Z)$ 的定义与求法:
$$ \begin{align*}
\Sigma_{i, j} &= {\rm Cov} (X_i, X_j) = {\rm E}((X_i - \mu_i)(X_j - \mu_j)) \\ &= \frac 1M \sum_{m=1}^M (x_i^{(m)} - \mu_i) (x_j^{(m)} - \mu_j)
\end{align*} $$
故协方差矩阵如下(可验证):
$$ \boldsymbol \Sigma = \frac 1M \sum_{m=1}^M (\boldsymbol x^{(m)} - \boldsymbol \mu)(\boldsymbol x^{(m)} - \boldsymbol \mu)^{\rm T} $$
协方差矩阵显然是一个实对称矩阵。
i. 协方差矩阵的半正定性
作协方差矩阵的夹心糖式 $\boldsymbol x^{\rm T} \boldsymbol \Sigma \boldsymbol x \ (\boldsymbol x \in \R)$,显然结果是实数,还可以如下展开:
$$ \begin{align*}
\boldsymbol x^{\rm T} \boldsymbol \Sigma \boldsymbol x
&= \frac 1M \sum_{m=1}^M \boldsymbol x^{\rm T}(\boldsymbol x^{(m)} - \boldsymbol \mu)(\boldsymbol x^{(m)} - \boldsymbol \mu)^{\rm T} \boldsymbol x \\
&= \frac 1M \sum_{m=1}^M ((\boldsymbol x^{(m)} - \boldsymbol \mu)^{\rm T} \boldsymbol x)^{\rm T} ((\boldsymbol x^{(m)} - \boldsymbol \mu)^{\rm T} \boldsymbol x)
\end{align*} $$
显然 $(\boldsymbol x^{(m)} - \boldsymbol \mu)^{\rm T} \boldsymbol x \in \R$,故 $\boldsymbol x^{\rm T} \boldsymbol \Sigma \boldsymbol x = \frac 1M \sum_{m=1}^M ((\boldsymbol x^{(m)} - \boldsymbol \mu)^{\rm T} \boldsymbol x)^2 \ge 0$ 显然有半正定性。
ii. 协方差矩阵在什么时候有正定性