Hierarchical Clustering (Agrupamiento Jerárquico)

Hierarchical Clustering (Agrupamiento Jerárquico)

Es un método de aprendizaje no supervisado utilizado para agrupar datos en grupos jerárquicamente organizados según su similitud.

El proceso se basa en la construcción de un dendrograma, que es un árbol jerárquico que visualiza cómo se agrupan los datos.

Existen dos enfoques principales: el aglomerativo, que comienza con cada dato como un grupo individual y los fusiona secuencialmente, y el divisivo, que parte de un único grupo y lo divide en subconjuntos.

La similitud entre datos se mide mediante métricas como la distancia euclidiana, Manhattan o el coseno, dependiendo de las características específicas del conjunto de datos.

La elección del criterio de vinculación, como single-linkage, complete-linkage o average-linkage, afecta directamente la formación de los grupos en el dendrograma.

Es útil en aplicaciones de exploración de datos, segmentación de clientes, análisis genómico y agrupación de imágenes.

Una ventaja clave es que no requiere especificar previamente el número de grupos, aunque puede ser sensible al ruido y a las características de los datos.

Entradas Relacionadas

Subir