\( \newcommand{\bm}[1]{\boldsymbol{#1}} \) \( \newcommand{\textnormal}[1]{\textrm{#1}} \)

4.5 Interpretación de las componentes principales

Para interpretar las componentes principales, \(\bm{z}=(z_1,\ldots,z_d)^\prime{}\), es preciso relacionarlas con las variables originales, \(\bm{x}\). El instrumento natural para establecer esta relación consiste en calcular la covarianza o la correlación entre las componentes y las variables originales \(\bm{x}\). Lo obtenemos a continuación.

\[\textnormal{Cov}(\bm{x},z_k)=\textnormal{Cov}(\bm{x}, \bm{v_k}^{\prime}\bm{x})=\textnormal{Cov}(\bm{x},\bm{x})\bm{v_k}=\bm\Sigma \bm{v_k}=\lambda_k \bm{v_k}.\]

La notación matricial nos permite calcularlas para todas a la vez

\[\textnormal{Cov}(\bm{x},\bm{z})=\textnormal{Cov}(\bm{x}, \bm{V}^{\prime}\bm{x})=\textnormal{Cov}(\bm{x},\bm{x})\bm{V}=\bm\Sigma \bm{V}=\bm{V}\bm\Lambda.\]

En particular para una variable \(x_j\) y una componente \(z_k\):

\[\textnormal{Cov}(x_j,z_k)=\lambda_k v_{jk}.\]

Se trata por tanto de la varianza de la componente \(z_k\) multiplicada por el coeficiente \(v_{jk}\), que acompaña a \(x_j\) en la construcción de \(z_k\). El coeficiente de correlación será

\[\textnormal{Corr}(x_j,z_k)=\frac{\textnormal{Cov}(x_j,z_k)}{\sqrt{\textnormal{Var}(x_j) \textnormal{Var}(z_k)}} =\frac{v_{jk}}{\sigma_j}\sqrt{\lambda_k}.\]

En notación matricial,

\[\begin{aligned} \textnormal{Corr}(\bm{x},\bm{z})&=\mbox{diag}\left(1/\sigma_1,\ldots,1/\sigma_d\right) \bm{V} \bm\Lambda \mbox{diag}\left(1/\sqrt{\lambda_1},\ldots, 1/\sqrt{\lambda_d}\right)\\ &= \mbox{diag}(1/\sigma_1,\ldots,1/\sigma_d) \bm{V} \bm\Lambda^{1/2}. \end{aligned}\]

Se interpretará cada componente principal en función de las variables originales que estén correlacionadas con dicha componente. Asimismo, el signo de cada correlación permite valorar qué variables van en el sentido de la componente y cuáles en sentido opuesto.