Predecirproteína


PredictProtein (PP) es un servicio automático que busca bases de datos de secuencias públicas actualizadas, crea alineaciones y predice aspectos de la estructura y la función de las proteínas. Los usuarios envían una secuencia de proteínas y reciben un único archivo con los resultados de las comparaciones de bases de datos y los métodos de predicción. PP entró en línea en 1992 en el Laboratorio Europeo de Biología Molecular ; desde 1999 opera desde la Universidad de Columbia y en 2009 se trasladó a la Technische Universität München. Aunque muchos servidores han implementado aspectos particulares, PP sigue siendo el servidor público más utilizado para la predicción de estructuras: se han atendido más de 1,5 millones de solicitudes de usuarios en 104 países; más de 13000 usuarios enviaron 10 o más consultas diferentes. Las páginas web del PP están reflejadas en 17 países de 4 continentes. El sistema está optimizado para satisfacer las demandas de los experimentadores sin experiencia en bioinformática. Esto implicaba que nos centráramos en incorporar solo métodos de alta calidad e intentáramos cotejar los resultados omitiendo los menos fiables o menos importantes.

El intento de 'pre-digerir' tanta información como sea posible para simplificar la interpretación de los resultados es un pilar único de PP. Por ejemplo, de forma predeterminada, PP devuelve solo aquellas proteínas que se encuentran en la base de datos que es muy probable que tengan una estructura similar a la proteína de consulta. [1] Las predicciones particulares, como las de hélices de membrana, regiones de bobina enrollada, péptidos señal y señales de localización nuclear, no se devuelven si se encuentran por debajo de los umbrales de probabilidad dados.

Los usuarios reciben un único archivo de salida con los siguientes resultados. Búsquedas en bases de datos: las secuencias similares se notifican y alinean mediante un BLAST estándar por pares, [2] una búsqueda iterada de PSI-BLAST. [3] Aunque las búsquedas BLAST por pares son idénticas a las que se pueden obtener del sitio NCBI, el PSI-BLAST iterado se realiza en una base de datos cuidadosamente filtrada para evitar la acumulación de falsos positivos durante la iteración. [4] [5] Una búsqueda estándar de motivos funcionales en la base de datos PROSITE. [6] PP ahora también identifica límites putativos para dominios estructurales a través del procedimiento CHOP. Métodos de predicción de estructuras: estructura secundaria, accesibilidad de solventes y hélices de membrana predichas por los programas PHD y PROF, [7][8] hebras de membrana predichas por PROFtmb, [9] regiones enrolladas por COILS, [10] y contactos entre residuos a través de PROFcon, [11] regiones de baja complejidad marcadas por SEG [12] y regiones largas sin regular estructura secundaria se identifican por NORSp,. [13] [14] Los programas PHD/PROF solo están disponibles a través de PP. La forma particular en que PP itera automáticamente las búsquedas de PSI-BLAST y la forma en que decidimos qué incluir en las familias de secuencias también es exclusiva de PP. Los aspectos particulares de la función que actualmente están integrados explícitamente en PP están relacionados de alguna manera con la localización subcelular: detectamos señales de localización nuclear a través de PredictNLS, [15][16] predecimos la localización independientemente de las señales de orientación a través de LOCnet; [17] y anotaciones de homología con proteínas implicadas en el control del ciclo celular. [18]

El servicio web PredictProtein está disponible en www.predictprotein.org. Los usuarios pueden enviar una secuencia de aminoácidos y obtener a cambio un conjunto de anotaciones automáticas para la secuencia enviada. El servicio está respaldado por una base de datos de resultados precalculados que agilizan el tiempo de interacción.