\( \newcommand{\bm}[1]{\boldsymbol{#1}} \) \( \newcommand{\textnormal}[1]{\textrm{#1}} \)

2.2 Contrastes multivariantes versus contrastes univariantes

Antes de presentar resultados sobre contrastes multivariantes deberíamos discutir brevemente cual es la motivación para plantear contrastes multivariantes en lugar de (o junto con) contrastes univariantes. Consideremos como ejemplo un contraste acerca del vector de medias \(\bm\mu=(\mu_1,\ldots,\mu_d)^\prime{}\).

Ejemplo. Un estudio sobre Psicología educativa pretende analizar si las notas medias obtenidas por estudiantes universitarios en dos tests de inteligencia diferentes fueron iguales a 100. El primer test está orientado fundamentalmente a la valoración de habilidades aritméticas y el segundo a la valoración de habilidades de memoria.

Denotaremos por \(\bm{x}=(x_1,x_2)^\prime{}\) el vector aleatorio bidimensional correspondiente a las notas de los dos tests. Parece claro que las medidas de habilidad analizadas estarán interrelacionadas y, por lo tanto, es más natural contrastar si la media \(\bm\mu=(\mu_1,\mu_2)^\prime\) del vector \(\bm{x}\) es igual a \(\bm{\mu_0}=(100,100)^\prime{}\) que contrastar de forma individual si la nota media de cada uno de los tests \(\mu_i\) es igual a 100. Es decir, nos gustaría contrastar la hipótesis nula \(H_0:\bm{\mu}=\bm{\mu_0}\), siendo \(\bm{\mu_0}=(100,100)^\prime{}\).

Además de que los contrastes univariantes ignoran la correlación entre variables, lo cual en muchas ocasiones no es deseable (como se comenta en el ejemplo anterior), existen otros motivos por los que puede ser más conveniente plantear contrastes multivariantes. El uso de contrastes univariantes tiende a inflar el error de tipo I, que denotamos por \(\alpha\). Volvemos al ejemplo sobre los tests de inteligencia. Si para contrastar la hipótesis nula \(H_0:\bm{\mu}=\bm{\mu_0}\) planteamos dos contrastes individuales de nivel \(\alpha=0.05\), entonces está claro que rechazaremos \(H_0\) si rechazamos al menos uno de los dos contrastes individuales. Pero bajo \(H_0\) (suponiendo que las variables fuesen independientes),

\[\begin{aligned} P(\textnormal{al menos un rechazo individual})&=1-P(\textnormal{ningún rechazo individual})\\ &=1-(1-0.05)^2\\ &=0.0975.\end{aligned}\]

Es decir, al plantear el problema a través de contrastes individuales aumentamos la probabilidad del error de tipo I. Este inconveniente se hace más patente al aumentar la dimensión \(d\). Además los test multivariantes resultan en muchos casos más potentes (capaces de rechazar \(H_0\) cuando es falsa).