Indexación de estructura semántica latente


La indexación de la estructura semántica latente ( LaSSI ) es una técnica para calcular la similitud química derivada del análisis semántico latente (LSA).

LaSSI fue desarrollado en Merck & Co. y patentado en 2007 [1] por Richard Hull, Eugene Fluder, Suresh Singh, Robert Sheridan, Robert Nachbar y Simon Kearsley.

LaSSI es similar a LSA en que involucra la construcción de una matriz de ocurrencia a partir de un corpus de elementos y la aplicación de descomposición de valor singular a esa matriz para derivar características latentes. Lo que difiere es que la matriz de ocurrencia representa la frecuencia de descriptores químicos bidimensionales y tridimensionales (en lugar de términos del lenguaje natural) que se encuentran dentro de una base de datos química de estructuras químicas. Este proceso deriva conceptos de estructura química latente que se pueden utilizar para calcular similitudes químicas y relaciones estructura-actividad para el descubrimiento de fármacos .