A.1 Distribución normal multivariante
Un vector aleatorio \(d\)-dimensional \(\bm{x}\) tiene distribución normal multivariante con vector de medias \(\bm{\mu}\) y matriz de covarianzas \(\bm\Sigma\) si su función de densidad viene dada por
\[f(\bm{x})=\frac{1}{(\sqrt{2\pi})^d\left|\bm\Sigma\right|^{1/2}}e^\frac{{-(\bm{x}-\bm{\mu})^\prime\bm{\Sigma}^{-1}(\bm{x}-\bm{\mu})}}{2}.\] Decimos en este caso que \(\bm{x}\) tiene distribución \(N_d(\bm{\mu},\bm\Sigma)\).
A.1.1 Propiedades de la distribución normal multivariante
Presentamos a continuación algunas propiedades conocidas de la distribución normal multivariante.
Sean \(a_1,\ldots,a_d\) constantes y consideremos la combinación lineal \(z=a_1x_1+\ldots+a_dx_d=\bm{a}^\prime\bm{x}.\) Si \(\bm{x}\) es \(N_d(\bm{\mu},\bm\Sigma)\), entonces \(z\) es \(N(\bm{a}^\prime\bm{\mu}, \bm{a}^\prime\bm{\Sigma}\bm{a})\).
Si \(\bm{A}\) es una matriz \(k\times d\) de rango \(k\) (siendo \(k\leq d\)), entonces las \(k\) combinaciones lineales en \(\bm{A}\bm{x}\) tienen distribución normal multivariante, es decir, si \(\bm{x}\) es \(N_d(\bm{\mu},\bm\Sigma)\), entonces \(\bm{A}\bm{x}\) es \(N_k(\bm{A}\bm{\mu}, \bm{A}\bm{\Sigma}\bm{A}^\prime)\).
Recordamos que si \(\bm{x}\) es \(N_d(\bm{\mu},\bm\Sigma)\), entonces \(\bm{z}=\bm{\Sigma^{-1/2}}(\bm{x}-\bm\mu)\) tiene distribución \(N_d(\bm{0},\bm{I_d}).\) Además,
\[\bm{z}^\prime{}\bm{z}=\sum_{i=1}^dz_i^2\] es la suma de los cuadrados de \(d\) variables normales estándar e independientes y, por lo tanto, tiene distribución \(\chi_d^2\). Es decir
\[(\bm{x}-\bm\mu)^\prime{}\bm{\Sigma}^{-1}(\bm{x}-\bm\mu) \textnormal{ tiene distribución } \chi_d^2.\]
Cualquier subconjunto de variables de un vector \(\bm{x}\) con distribución normal \(N_d(\bm{\mu},\bm\Sigma)\), tiene a su vez distribución normal (con vector de medias y matriz de covarianzas correspondiente a la partición de \(\bm{x}\)). Por ejemplo, si \(\bm{x_1}=(x_1,\ldots,x_p)^\prime{}\) denota el subvector de las primeras \(p\) componentes de \(\bm{x}\) y \(\bm{x_2}=(x_{p+1},\ldots,x_d)^\prime{}\) denota el subvector con las restantes \(d-p\) componentes, podemos escribir:
\[\bm{x}=\left( \begin{array}{c} \bm{x_1}\\ \bm{x_2} \end{array} \right),\ \ \ \bm{\mu}=\left(\begin{array}{c}\bm{\mu_1}\\ \bm{\mu_2}\end{array}\right),\ \ \ \bm{\Sigma}=\left(\begin{array}{cc}\bm{\Sigma_{11}}&\bm{\Sigma_{12}}\\ \bm{\Sigma_{21}}&\bm{\Sigma_{22}}\end{array}\right).\] Además
\[\bm{x_1} \textnormal{ tiene distribución } N_p(\bm{\mu_1},\bm{\Sigma_{11}}),\]
\[\bm{x_2} \textnormal{ tiene distribución } N_{d-p}(\bm{\mu_2},\bm{\Sigma_{22}}).\] En particular cada componente \(x_i\) del vector \(\bm{x}\) (\(i=1,\ldots,d\)) tiene distribución \(N(\mu_i,\sigma_i^2)\). Es importante notar que el recíproco no es cierto, es decir, si la densidad de cada \(x_i\) es normal no se sigue necesariamente que \(\bm{x}\) sea normal multivariante.
Consideremos ahora un vector particionado en dos subvectores \(\bm{x}\) de dimensión \(p\times 1\) e \(\bm{y}\) de dimensión \(q\times 1\), de forma que:
\[\left(\begin{array}{c} \bm{x}\\ \bm{y} \end{array} \right) \textnormal{ tiene distribución } N_{p+q}\left(\left(\begin{array}{c} \bm{\mu_x}\\ \bm{\mu_y} \end{array}\right),\left(\begin{array}{cc}\bm{\Sigma_{xx}}&\bm{\Sigma_{xy}}\\ \bm{\Sigma_{yx}}&\bm{\Sigma_{yy}}\end{array}\right)\right).\]
Los subvectores \(\bm{x}\) e \(\bm{y}\) son independientes si y sólo si \(\bm{\Sigma_{xy}}=\bm{0}\).
Si \(\bm{x}\) e \(\bm{y}\) no son independientes, entonces \(\bm{\Sigma_{xy}}\neq\bm{0}\) y la distribución condicional del vector \(\bm{x}\) dados los valores del vector \(\bm{y}\) también es normal (\(p\)-dimensional) con vector de medias
\[E(\bm{x}/\bm{y})=\bm{\mu_x}+\bm{\Sigma_{xy}}\bm{\Sigma_{yy}}^{-1}(\bm{y}-\bm{\mu_y})\] y con matriz de covarianzas
\[\bm{\Sigma_{x/y}}=\bm{\Sigma_{xx}}-\bm{\Sigma_{xy}}\bm{\Sigma_{yy}}^{-1}\bm{\Sigma_{yx}}.\]
Si \(\bm{x}\) e \(\bm{y}\) son vectores con distribución normal, tienen la misma dimensión \(p\times 1\) y son independientes, entonces
\[\bm{x}+\bm{y}\textnormal{ tiene distribución } N_p(\bm{\mu_x}+\bm{\mu_y},\bm{\Sigma_{xx}}+\bm{\Sigma_{yy}}).\]
\[\bm{x}-\bm{y}\textnormal{ tiene distribución } N_p(\bm{\mu_x}-\bm{\mu_y},\bm{\Sigma_{xx}}+\bm{\Sigma_{yy}}).\]