Generalización Cruzada

Una técnica utilizada para evaluar la capacidad de un modelo de aprendizaje automático de generalizar su desempeño a datos no vistos, evitando el sobreajuste.
Divide el conjunto de datos en varios subconjuntos o pliegues, entrenando el modelo en algunos de ellos y evaluándolo en los restantes de forma cíclica.
Permite maximizar el uso del conjunto de datos disponible al garantizar que cada instancia se utilice tanto para entrenamiento como para evaluación.
Ofrece una métrica más estable y representativa del rendimiento del modelo en comparación con una simple división del conjunto de datos en entrenamiento y prueba.
Es especialmente útil en escenarios con conjuntos de datos pequeños, donde es crucial aprovechar al máximo la información disponible.
Optimiza la selección de hiperparámetros y modelos al proporcionar retroalimentación robusta sobre el ajuste y la capacidad predictiva.