\( \newcommand{\bm}[1]{\boldsymbol{#1}} \) \( \newcommand{\textnormal}[1]{\textrm{#1}} \)

7.1 Métodos jerárquicos.

Como ya se expresó en la introducción, los métodos jerárquicos parten de una matriz de distancia entre individuos, y en base a ella pretenden un agrupamiento de los individuos a distintos niveles. En el nivel más bajo cada grupo estaría formado por individuos, mientras que los grupos a niveles superiores serían el resultado de agregar grupos de niveles inferiores. Los algoritmos que se emplean para crear esta jerarquía pueden ser de dos tipos:

Aglomerativos

Partiendo de los individuos, se construyen grupos formados por individuos, para después construir grupos, mediante la agregación de los grupos ya formados en etapas anteriores.

Divisivos

Partiendo del grupo total formado por todos los individuos, se genera una división en subgrupos (generalmente en dos), que más adelante vuelven a ser subdivididos.

Nos centraremos en los algoritmos aglomerativos, que son los más comunes. El algoritmo constaría de los siguientes pasos:

  • Paso 1 (Comienzo): Se definen los grupos o clusters \(C_1,\ldots,C_n\), que está formados cada uno por un individuo.

  • Paso 2: Se buscan los dos grupos \(C_i\) y \(C_j\) que estén más próximos, se juntan y consecuentemente se reduce el número de grupos.

  • Paso 3: Se recalculan las distancias de todos los demás grupos al nuevo grupo, formado al juntar \(C_i\) y \(C_j\).

  • Paso 4: Si el número de grupos es uno, se detiene el algoritmo. En otro caso, se vuelve al paso 2.

En este algoritmo queda por determinar cómo se efectúa el paso 3. De hecho, bajo esta misma estructura del algoritmo aglomerativo, los métodos concretos se diferencian en cómo resuelven este paso. Hay variadas formas de hacerlo, pero vamos a mencionar las tres que consideramos principales.

Método del mínimo:

Consiste en definir \(d(C_k,C_i\cup C_j)=\min\{d(C_k,C_i),d(C_k,C_j)\}\), donde \(d(C_r,C_s)\) denota la distancia del grupo \(C_r\) al grupo \(C_s\). Esto es equivalente a definir la distancia entre dos grupos así:

\[d(C_r,C_s)=\min_{i\in C_r, j\in C_s} d_{ij}\] siendo \(d_{ij}\) la distancia entre los individuos \(i\) y \(j\), que en este caso pertenecen a los grupos \(C_r\) y \(C_s\), respectivamente.

Método del máximo:

Consiste en definir \(d(C_k,C_i\cup C_j)=\max\{d(C_k,C_i),d(C_k,C_j)\}\). En este caso es equivalente a definir la distancia entre dos grupos como la mayor distancia entre sus individuos:

\[d(C_r,C_s)=\max_{i\in C_r, j\in C_s} d_{ij}.\]

Método del promedio:

Consiste en definir \(d(C_k,C_i\cup C_j)=\frac{n_i}{n_i+n_j} d(C_k,C_i)+ \frac{n_j}{n_i+n_j} d(C_k,C_j)\), siendo \(n_i\) y \(n_j\) el número de individuos en los grupos \(C_i\) y \(C_j\), respectivamente. Es equivalente a definir la distancia entre dos grupos como el promedio de las distancias entre sus individuos:

\[d(C_r,C_s)=\frac{1}{n_r n_s} \sum_{i\in C_r, j\in C_s} d_{ij}.\]