证明:
- 令降维后的 $\boldsymbol Y$ 被中心化,即 $\sum_{i=1}^{|X|} \boldsymbol y_i = \boldsymbol 0$。
- 可以得知 $\sum_{i=1}^{|X|} b_{ij} = (\sum_{i=1}^{|X|} \boldsymbol y_i)^{\rm T} \boldsymbol y_j =0$,据对称性又有 $\sum_{j=1}^{|X|} b_{ij} = 0$。
- $\sum_{i=1}^{|X|} b_{ii} = {\rm tr} \ \boldsymbol B$,其本质是 ${\rm tr} \ \boldsymbol B = \sum_{i=1}^{|X|} \| \boldsymbol y_i \|^2$。
- 对距离作展开可得 $d_{ij}^2 = \|\boldsymbol y_i \|^2 + \| \boldsymbol y_j \|^2 -2 \boldsymbol y_i^{\rm T} \boldsymbol y_j = b_{ii} + b_{jj} - 2 b_{ij}$。可得如下公式:
- $|X| d_{\cdot j}^2 = \sum_{i=1}^{|X|} d_{ij}^2 = \sum_{i=1}^{|X|} b_{ii} + \sum_{i=1}^{|X|} b_{jj}- 2 \sum_{i=1}^{|X|} b_{ij} = {\rm tr} \ \boldsymbol B + |X|b_{jj} - 0$。
- $|X| d_{i\cdot}^2 = \sum_{j=1}^{|X|} d_{ij}^2 = \sum_{j=1}^{|X|} b_{ii} + \sum_{j=1}^{|X|} b_{jj}- 2 \sum_{j=1}^{|X|} b_{ij} = |X|b_{ii} + {\rm tr} \ \boldsymbol B - 0$。
- $|X|^2 d_{\cdot \cdot}^2 = \sum_{i=1}^{|X|} \sum_{j=1}^{|X|} d_{ij}^2 = |X|\sum_{i=1}^{|X|} b_{ii} + \sum_{i=1}^{|X|} {\rm tr} \ \boldsymbol B = 2|X| {\rm tr} \ \boldsymbol B$。
- 观察距离展开式缺的就是一个 $b_{ii} + b_{jj}$,而上述公式可以构成 $b_{ii} + b_{jj} = d_{i \cdot}^2 + d_{\cdot j}^2 - d_{\cdot \cdot}^2$。
- 代入距离展开式得 $d_{ij}^2 = d_{i \cdot}^2 + d_{\cdot j}^2 - d_{\cdot \cdot}^2 - 2b_{ij}$。原式得证。
求得内积矩阵 $\boldsymbol B$ 之后,接下来就可以求 $\boldsymbol Y$。两者间的关系是 $\boldsymbol B = \boldsymbol Y^{\rm T} \boldsymbol Y$。
对对称矩阵 $\boldsymbol B$ 作正交分解 $\boldsymbol B = \boldsymbol V \boldsymbol \Lambda \boldsymbol V^{\rm T}$,其中 $\boldsymbol \Lambda$ 是各特征值构成的对角矩阵。于是:
$$ \boldsymbol B = (\boldsymbol \Lambda^{\frac 12 } \boldsymbol V^{\rm T})^{\rm T} (\boldsymbol \Lambda^{\frac 12 } \boldsymbol V^{\rm T}), \ \ \ \ \ \boldsymbol Y = \boldsymbol \Lambda^{\frac 12 } \boldsymbol V^{\rm T} $$
其中虽然 $\boldsymbol \Lambda \in \R ^{|X| \times |X|}$,但是 $\boldsymbol B$ 的非零特征值数目应不会超过 $D$ 个。
因为 $\boldsymbol X \in \R^{D \times |X|}$,显然 ${\rm r} (\boldsymbol Y) \le {\rm r} (\boldsymbol X) \le D$,又 $\boldsymbol B = \boldsymbol Y^{\rm T} \boldsymbol Y$,故 ${\rm r}(\boldsymbol B) \le D$。