Gini (Índice de Gini)
![Gini (Índice de Gini)](https://iartificial.blog/wp-content/uploads/2024/12/file0.097134261284606-800x800.png)
El Índice de Gini es una métrica utilizada para evaluar la pureza de un nodo en un árbol de decisión.
Es una medida de impureza o diversidad que permite determinar qué tan homogénea es la distribución de clases en un conjunto de datos.
Su valor varía entre 0 y 1, donde 0 representa máxima pureza (todas las muestras en el nodo pertenecen a una sola clase) y 1 indica máxima impureza (las clases están distribuidas de forma equitativa).
El cálculo del Índice de Gini considera la probabilidad de que un elemento seleccionado aleatoriamente sea clasificado incorrectamente si se asigna la etiqueta predominante del nodo.
Es comúnmente utilizado en algoritmos como CART (Classification and Regression Trees) para seleccionar la división más adecuada en cada paso de construcción del árbol.
Su simplicidad y eficiencia lo hacen preferido en comparación con otras métricas similares, como la ganancia de información en determinados contextos.
Entradas Relacionadas