One-hot encoding

One-hot encoding

Es una técnica de preprocesamiento utilizada para convertir datos categóricos en una representación numérica comprensible para modelos de aprendizaje automático.

Consiste en transformar cada categoría única de una variable en una secuencia binaria, donde solo uno de los valores es 1 y el resto son 0.

Esta codificación evita que los modelos interpreten relaciones jerárquicas entre los valores categóricos, como podría suceder al usar números enteros para representarlos.

Es especialmente útil para trabajar con variables categóricas nominales que no tienen un orden inherente.

Aunque efectiva, puede aumentar la dimensionalidad de los datos de manera significativa, especialmente cuando se trabaja con un gran número de categorías.

Entradas Relacionadas

Subir