Agrupamiento K-Means

File0.7600880621425075.png

Es un algoritmo de aprendizaje no supervisado utilizado para agrupar un conjunto de datos en un número predefinido de clústeres basado en características comunes.

Asigna cada punto de los datos al clúster cuya media está más cercana, minimizando la suma de las distancias cuadradas entre los puntos y el centroide del clúster.

Los centroides se ajustan iterativamente hasta que las asignaciones de los puntos a los clústeres ya no cambien o se alcance un criterio de convergencia.

Es sensible a la selección inicial de los centroides, por lo que diferentes ejecuciones pueden dar resultados distintos si la inicialización es aleatoria.

Es ampliamente utilizado en tareas como segmentación de clientes, clasificación de imágenes y análisis exploratorio de datos.

Requiere de antemano conocer el número de clústeres a calcular, lo que puede ser un desafío si no se tiene una idea clara de la estructura de los datos.

Entradas Relacionadas

Subir