Operación de Pooling
Operación que se utiliza comúnmente en redes neuronales convolucionales (CNN) para reducir las dimensiones de las representaciones espaciales de los datos, como imágenes o matrices.
Consiste en aplicar una función de resumen, como el máximo (max pooling) o el promedio (average pooling), a subconjuntos de la matriz de entrada, generalmente en regiones cuadradas o rectangulares llamadas ventanas.
Ayuda a disminuir la cantidad de parámetros y el costo computacional del modelo, lo que contribuye a minimizar el riesgo de sobreajuste y a acelerar el proceso de entrenamiento.
Además, conserva las características más importantes de los datos, como bordes o patrones relevantes, al eliminar información redundante o menos significativa.
Normalmente se implementa con un tamaño de ventana y un valor de "stride" que determinan cómo se desliza la ventana sobre la matriz de entrada.
La operación introduce invariancia espacial, permitiendo que la red sea más robusta ante pequeñas translaciones o deformaciones en los datos de entrada.
Entradas Relacionadas