Mascot (software)


Mascot es un motor de búsqueda de software que utiliza datos de espectrometría de masas para identificar proteínas a partir de bases de datos de secuencias de péptidos . [1] [2] La mascota es ampliamente utilizada por centros de investigación de todo el mundo. Mascot utiliza un algoritmo de puntuación probabilístico para la identificación de proteínas que se adaptó del algoritmo MOWSE . Mascot está disponible gratuitamente para su uso en el sitio web de Matrix Science. [3] Se requiere una licencia para uso interno donde se pueden incorporar más funciones.

MOWSE fue uno de los primeros algoritmos desarrollados para la identificación de proteínas utilizando huellas dactilares de masa de péptidos . [4] Fue desarrollado originalmente en 1993 como una colaboración entre Darryl Pappin del Imperial Cancer Research Fund (ICRF) y Alan Bleasby del Science and Engineering Research Council (SERC). MOWSE se distingue de otros algoritmos de identificación de proteínas en el sentido de que produce una puntuación basada en la probabilidad para la identificación. También fue el primero en tener en cuenta la distribución no uniforme de péptidostamaños, causados ​​por la digestión enzimática de una proteína que se necesita para el análisis de espectrometría de masas. Sin embargo, MOWSE solo era aplicable a búsquedas de huellas dactilares en masa de péptidos y dependía de bases de datos precompiladas que eran inflexibles con respecto a modificaciones postraduccionales y enzimas distintas de la tripsina. Para superar estas limitaciones, aprovechar los sistemas multiprocesador y agregar funcionalidad de búsqueda no enzimática, David Perkins, del Imperial Cancer Research Fund, comenzó el desarrollo nuevamente desde cero. Las primeras versiones se desarrollaron para los sistemas Silicon Graphics Irix y Digital Unix. Finalmente, este software se denominó Mascot y, para llegar a un público más amplio, David Creasy y John Cottrell crearon una empresa de bioinformática externa llamada Matrix Science para desarrollar y distribuir Mascot.Existen versiones de software heredadas para Tru64, Irix, AIX, Solaris, Microsoft Windows NT4 y Microsoft Windows 2000. Mascot ha estado disponible como un servicio gratuito en el sitio web de Matrix Science desde 1999 y ha sido citado en la literatura científica más de 5,000 veces. Matrix Science sigue trabajando para mejorar la funcionalidad de Mascot.

Mascot identifica proteínas interpretando datos de espectrometría de masas. El método experimental predominante para la identificación de proteínas es un enfoque ascendente, en el que una muestra de proteína se digiere típicamente con tripsina para formar péptidos más pequeños. Si bien la mayoría de las proteínas son demasiado grandes, los péptidos generalmente se encuentran dentro del rango de masa limitado que puede medir un espectrómetro de masas típico. Los espectrómetros de masas miden los pesos moleculares de los péptidos en una muestra. Mascot luego compara estos pesos moleculares con una base de datos de péptidos conocidos. El programa escinde cada proteína en la base de datos de búsqueda especificada in silico de acuerdo con reglas específicas dependiendo de la enzima de escisiónutilizado para la digestión y calcula la masa teórica de cada péptido. Mascot luego calcula una puntuación basada en la probabilidad de que los péptidos de una muestra coincidan con los de la base de datos de proteínas seleccionada. Cuantos más péptidos identifique Mascot de una proteína en particular, mayor será la puntuación de Mascot para esa proteína.


Gráfico de densidad de probabilidad
La imagen superior es un ejemplo de un gráfico de puntuación de proteína Mascot. El gráfico inferior ilustra una distribución de probabilidad para comparar. En ambas imágenes, el área marcada en verde resalta el 95% del área de la función de densidad de probabilidad . Las puntuaciones a la derecha del área sombreada en verde tienen una probabilidad de menos del 5% de ocurrir al azar.