Latent Semantic Indexing (Indexación Semántica Latente)

Método matemático que utiliza álgebra lineal para analizar y descomponer grandes conjuntos de textos, con el objetivo de identificar relaciones semánticas entre términos y conceptos.
Se basa en la descomposición en valores singulares (SVD) para reducir la dimensionalidad de las representaciones de texto, lo que facilita la identificación de patrones latentes en los datos.
Es ampliamente utilizado en tareas de procesamiento del lenguaje natural, como recuperación de información, clasificación de textos y análisis de datos no estructurados.
Su funcionamiento permite agrupar documentos y palabras en un espacio semántico común, destacando similitudes incluso cuando no comparten términos exactos.
Es limitado en su capacidad para capturar significados complejos, pues no considera ni el orden de las palabras ni las estructuras gramaticales.