Máquina Boltzmann

Máquina Boltzmann

Es un modelo generativo estocástico utilizado en el aprendizaje profundo y el aprendizaje no supervisado, inspirado en principios de la termodinámica y la mecánica estadística.

Se basa en un sistema de unidades binarias conectadas, donde se asignan probabilidades a diferentes configuraciones de estas unidades para modelar distribuciones complejas de datos.

Permite capturar patrones y relaciones latentes en los datos al aprender una representación compacta de los mismos, optimizando una función de energía.

Incluye una arquitectura con capas visibles que interactúan con los datos de entrada y capas ocultas que modelan características latentes, separadas típicamente en una estructura no dirigida.

Utiliza un proceso de aprendizaje basado en la minimización de la energía del sistema, ajustando los pesos entre las unidades mediante métodos como contraste divergente o estimadores de gradiente.

Es especialmente relevante en tareas como la reducción dimensional, la generación de muestras sintéticas, y preprocesamiento de datos en redes neuronales profundas.

Su eficiencia en aprendizaje puede verse limitada en aplicaciones prácticas debido a su costoso cálculo de normalización y la dificultad en la implementación de cadenas de Markov eficientes para estimar distribuciones.

Entradas Relacionadas

Subir