Codificación One-Hot

Es una técnica de preprocesamiento ampliamente utilizada para convertir datos categóricos en un formato numérico que los algoritmos de machine learning puedan interpretar.
Funciona representando cada categoría única de una variable como un vector binario, donde todas las posiciones son ceros excepto una, que indica la categoría correspondiente.
Por ejemplo, para tres categorías posibles como "Rojo", "Verde" y "Azul", se crearía una codificación como "Rojo = [1, 0, 0]", "Verde = [0, 1, 0]" y "Azul = [0, 0, 1]".
Es especialmente útil para trabajar con clasificadores que no manejan bien datos categóricos directamente, como redes neuronales.
En casos con un alto número de categorías, puede aumentar drásticamente la dimensionalidad de los datos, lo que puede requerir un manejo eficiente para evitar problemas de memoria o rendimiento.