6.1 Dos grupos con distribuciones conocidas
Suponemos la existencia de dos grupos \(G_1\) y \(G_2\), definidos de manera inequívoca. Consideramos un vector aleatorio \(\bm{x}\) que presenta funciones de densidad o de probabilidad \(f_1\) si el individuo procede del grupo \(G_1\) y \(f_2\) si procede del grupo \(G_2\). Utilizaremos el valor observado del vector aleatorio \(\bm{x}\) para decidir si un individuo pertenece a uno u otro grupo. Esto supone dividir el soporte del vector \(\bm{x}\) mediante una partición en dos regiones \(R_1\) y \(R_2\): \(R=R_1\cup R_2\) y \(R_1\cap R_2=\emptyset\), de modo que clasificaremos al individuo en el grupo \(G_1\) si \(\bm{x}\in R_1\) y en el grupo \(G_2\) si \(\bm{x}\in R_2\). En realidad, la regla discriminante anterior sería una regla determinista, de modo que una definición general de regla discriminante, que incluya la posibilidad de aleatorización, sería la siguiente.
Definición 6.1 Una regla discriminante (aleatorizada) es una aplicación
\[\begin{array}{rccl} \varphi : & R & \longrightarrow & [0,1] \\ & \bm{x} & \longrightarrow & \varphi(\bm{x})=P(\mbox{Clasificar en }G_1/\bm{x}=\bm{x}). \end{array}\]
Una regla discriminante no aleatorizada es de la forma
\[\varphi(\bm{x})=\left\{\begin{array}{ll} 1 & \mbox{si } \bm{x}\in R_1, \\ 0 & \mbox{si } \bm{x}\in R_2. \end{array}\right.\]
En el procedimiento de clasificación podemos cometer dos tipos de errores: clasificar a un individuo que procede del grupo \(G_1\) en el grupo \(G_2\), y clasificar a un individuo del grupo \(G_2\) en el grupo \(G_1\). Las probabilidades condicionales de cada uno de estos errores son
\[P(2/1)=\int \left(1-\varphi(\bm{x})\right)f_1(\bm{x})\,d\bm{x}\ \ \ \ \ \ \mbox{y} \ \ \ \ \ \ P(1/2)=\int \varphi(\bm{x}) f_2(\bm{x})\,d\bm{x}\] donde las integrales son sumas en el caso discreto. Si la regla discriminante es no aleatorizada, entonces las probabilidades anteriores se pueden expresar así:
\[P(2/1)=\int_{R_2} f_1(\bm{x})\,d\bm{x}\ \ \ \ \ \ \mbox{y} \ \ \ \ \ \ P(1/2)=\int_{R_1} f_2(\bm{x})\,d\bm{x}.\]
Nótese cómo el problema discriminante se puede encuadrar dentro de la teoría de la decisión. Un paso más en esta dirección nos conduce a la comparación de reglas discriminantes.
Definición 6.2 Una regla discriminante \(\varphi\) es preferible a otra \(\varphi'\) si
\[P_{\varphi}(2/1)\leq P_{\varphi'}(2/1)\] y
\[P_{\varphi}(1/2)\leq P_{\varphi'}(1/2).\]
Nota. La relación “ser preferible” es una relación de orden parcial.
Definición 6.3 Una regla discriminante se dice admisible si no hay ninguna otra regla discriminante que sea preferible (estrictamente) a ella. Por “preferible estrictamente” entendemos que, además de ser preferible, en alguno de los dos errores de clasificación sea estrictamente mejor.
Teorema 6.1 Sea \(f_1\) la función de densidad o de probabilidad, según el caso, del vector aleatorio \(\bm{x}\) condicionada al grupo \(G_1\) y \(f_2\) la correspondiente función de densidad o probabilidad condicionada al grupo \(G_2\).
Las reglas discriminantes de la forma
\[\varphi(\bm{x})=\left\{ {\displaystyle \begin{array}{ll} 1 & \mbox{si }\ {\displaystyle \frac{f_1(\bm{x})}{f_2(\bm{x})} > c, } \\ \gamma(\bm{x}) & \mbox{si }\ {\displaystyle \frac{f_1(\bm{x})}{f_2(\bm{x})} = c,} \\ 0 & \mbox{si }\ {\displaystyle \frac{f_1(\bm{x})}{f_2(\bm{x})} < c.} \end{array}}\right.\] son admisibles. Además, son las únicas reglas admisibles.
Dem. Es la misma que para el Lema de Neyman-Pearson, en el caso del contraste de una hipótesis nula simple frente a una alternativa simple.
En lo que sigue veremos cómo distintos criterios permiten la elección de una regla discriminante.