Phyre


De Wikipedia, la enciclopedia libre
  (Redirigido desde Phyre2 )
Saltar a navegación Saltar a búsqueda

Phyre y Phyre2 ( P rotein H omology / Analog Y R ecognition E ngine; pronunciado como 'fuego') son servicios gratuitos basados ​​en la web para la predicción de la estructura de las proteínas . [1] [2] [3] Phyre se encuentra entre los métodos más populares para la predicción de la estructura de las proteínas y se ha citado más de 1500 veces. [4] Al igual que otras técnicas de reconocimiento de homología remota (ver subprocesamiento de proteínas ), es capaz de generar modelos de proteínas fiables con regularidad cuando se utilizan otros métodos ampliamente utilizados como PSI-BLASTno poder. Phyre2 ha sido diseñado para garantizar una interfaz fácil de usar para usuarios inexpertos en métodos de predicción de estructura de proteínas. Su desarrollo está financiado por el Consejo de Investigación en Biotecnología y Ciencias Biológicas . [5]

Descripción

Los servidores Phyre y Phyre2 predicen la estructura tridimensional de una secuencia de proteínas utilizando los principios y técnicas del modelado de homología . Debido a que la estructura de una proteína está más conservada en la evolución que su secuencia de aminoácidos, una secuencia de proteína de interés (la diana) puede modelarse con una precisión razonable en una secuencia muy lejanamente relacionada de estructura conocida (la plantilla), siempre que la relación entre el objetivo y la plantilla se puede discernir a través de la alineación de secuencia . Actualmente, los métodos más potentes y precisos para detectar y alinear secuencias relacionadas de forma remota se basan en perfiles o modelos de Markov ocultos.(HMM). Estos perfiles / HMM capturan la propensión mutacional de cada posición en una secuencia de aminoácidos basándose en mutaciones observadas en secuencias relacionadas y pueden considerarse como una "huella digital evolutiva" de una proteína en particular.

Normalmente, se compilan las secuencias de aminoácidos de un conjunto representativo de todas las estructuras proteicas tridimensionales conocidas, y estas secuencias se procesan escaneando una gran base de datos de secuencias de proteínas. El resultado es una base de datos de perfiles o HMM, uno para cada estructura 3D conocida. Una secuencia de usuario de interés se procesa de manera similar para formar un perfil / HMM. Este perfil de usuario luego se escanea contra la base de datos de perfiles utilizando técnicas de alineación perfil-perfil o HMM-HMM. Estas alineaciones también pueden tener en cuenta patrones de elementos de estructura secundaria predichos o conocidos y pueden puntuarse utilizando varios modelos estadísticos. Consulte la predicción de la estructura de las proteínas para obtener más información.

El primer servidor Phyre se lanzó en junio de 2005 y utiliza un algoritmo de alineación perfil-perfil basado en la matriz de puntuación específica de la posición de cada proteína . [6] El servidor Phyre2 se lanzó al público en febrero de 2011 como reemplazo del servidor Phyre original y proporciona funcionalidad adicional sobre Phyre, una interfaz más avanzada, una biblioteca plegable completamente actualizada y utiliza el paquete HHpred / HHsearch para la detección de homología, entre otras mejoras.

Uso estándar

Después de pegar una secuencia de aminoácidos de proteína en el formulario de envío de Phyre o Phyre2, un usuario normalmente esperará entre 30 minutos y varias horas (dependiendo de factores como la longitud de la secuencia, el número de secuencias homólogas y la frecuencia y duración de las inserciones y deleciones) para una predicción para completar. Se envía al usuario un correo electrónico que contiene información resumida y la estructura prevista en formato PDB junto con un enlace a una página web de resultados. La pantalla de resultados de Phyre2 se divide en tres secciones principales, que se describen a continuación.

Predicción de estructura secundaria y desorden

Ejemplo de salida Phyre2 para estructura secundaria y predicción de desorden

La secuencia de proteínas enviada por el usuario se escanea primero contra una gran base de datos de secuencias utilizando PSI-BLAST . El perfil generado por PSI-BLAST es luego procesado por el programa de predicción de la estructura secundaria de la red neuronal PsiPred [7] y el predictor de trastornos de proteínas Disopred. [8] La presencia prevista de hélices alfa, cadenas beta y regiones desordenadas se muestra gráficamente junto con una barra de confianza codificada por colores.

Análisis de dominio

Ejemplo de salida de Phyre2 que muestra varios dominios y un visor de modelo emergente

Muchas proteínas contienen múltiples dominios proteicos . Phyre2 proporciona una tabla de coincidencias de plantillas codificadas por colores según la confianza e indicando la región de la secuencia de usuario que coincide. Esto puede ayudar en la determinación de la composición del dominio de una proteína.

Información detallada de la plantilla

Ejemplo de tabla de información detallada de la plantilla Phyre2

La tabla de resultados principal en Phyre2 proporciona estimaciones de confianza, imágenes y enlaces a los modelos predichos tridimensionales e información derivada de la base de datos de clasificación estructural de proteínas (SCOP) o del banco de datos de proteínas (PDB), según la fuente de la plantilla detectada. Para cada coincidencia, un enlace lleva al usuario a una vista detallada de la alineación entre la secuencia del usuario y la secuencia de la estructura tridimensional conocida.

Vista de alineación

Ejemplo Phyre2 vista detallada de la alineación entre una secuencia de usuario y una estructura de proteína conocida.

La vista de alineación detallada permite al usuario examinar residuos alineados individuales, coincidencias entre elementos de estructura secundaria previstos y conocidos y la capacidad de alternar información con respecto a patrones de conservación de secuencia y confianza de estructura secundaria. Además, Jmol se utiliza para permitir la visualización interactiva en 3D del modelo de proteína.

Mejoras en Phyre2

Phyre2 utiliza una biblioteca de pliegues que se actualiza semanalmente a medida que se resuelven nuevas estructuras. Utiliza una interfaz más actualizada y ofrece funciones adicionales sobre el servidor Phyre como se describe a continuación.

Funcionalidad adicional

Procesamiento por lotes

La función de procesamiento por lotes permite a los usuarios enviar más de una secuencia a Phyre2 cargando un archivo de secuencias en formato FASTA . De forma predeterminada, los usuarios tienen un límite de 100 secuencias en un lote. Este límite se puede aumentar poniéndose en contacto con el administrador. Los trabajos por lotes se procesan en segundo plano con la potencia informática gratuita a medida que está disponible. Por lo tanto, los trabajos por lotes a menudo tomarán más tiempo que los trabajos enviados individualmente, pero esto es necesario para permitir una distribución justa de los recursos informáticos a todos los usuarios de Phyre2.

Uno a uno subprocesos

El subproceso uno a uno le permite cargar una secuencia que desee modelar Y la plantilla en la que modelarla. Los usuarios a veces tienen una secuencia de proteínas que desean modelar en una plantilla específica de su elección. Esto puede ser, por ejemplo, una estructura recién resuelta que no está en la base de datos Phyre2 o debido a alguna información biológica adicional que indica que la plantilla elegida produciría un modelo más preciso que el (s) elegido (s) automáticamente por Phyre2.

Backphyre

En lugar de predecir la estructura 3D de una secuencia de proteínas, a menudo los usuarios tienen una estructura resuelta y están interesados ​​en determinar si existe una estructura relacionada en un genoma de interés. En Phyre2, una estructura de proteína cargada se puede convertir en un modelo de Markov oculto y luego escanear contra un conjunto de genomas (más de 20 genomas en marzo de 2011). Esta funcionalidad se llama "BackPhyre" para indicar cómo se utiliza Phyre2 a la inversa.

Phyrealarm

A veces, Phyre2 no puede detectar coincidencias confiables con estructuras conocidas. Sin embargo, la base de datos de la biblioteca de pliegues aumenta en aproximadamente 40-100 nuevas estructuras cada semana. Entonces, aunque puede que no haya plantillas decentes esta semana, es posible que las haya en las próximas semanas. Phyrealarm permite a los usuarios enviar una secuencia de proteínas para que se escanee automáticamente con las nuevas entradas agregadas a la biblioteca de pliegues cada semana. Si se detecta un resultado seguro, el usuario recibe una notificación automática por correo electrónico junto con los resultados de la búsqueda de Phyre2. Los usuarios también pueden controlar el nivel de cobertura de alineación y la confianza en la coincidencia requerida para activar una alerta por correo electrónico.

3DLigandSite

Phyre2 está acoplado al servidor 3DLigandSite [9] para la predicción del sitio de unión a proteínas. 3DLigandSite ha sido uno de los servidores de mejor rendimiento para la predicción de sitios de enlace en la Evaluación crítica de técnicas para la predicción de estructuras de proteínas (CASP) en ( CASP 8 y CASP 9). Los modelos seguros producidos por Phyre2 (confianza> 90%) se envían automáticamente a 3DLigandSite.

Predicción de topología transmembrana

El programa memsat_svm [10] se utiliza para predecir la presencia y topología de las hélices transmembrana presentes en la secuencia de la proteína del usuario.

Modelado de varias plantillas

Phyre2 permite a los usuarios elegir el modelado 'Intensivo' desde la pantalla principal de envío. Este modo:

  • Examina la lista de aciertos y aplica heurísticas para seleccionar plantillas que maximicen la cobertura y la confianza de la secuencia.
  • Construye modelos para cada plantilla seleccionada.
  • Utiliza estos modelos para proporcionar restricciones de distancia por pares que se ingresan en la herramienta de modelado ab initio y de múltiples plantillas Poing. [11]
  • Poing sintetiza la proteína del usuario en el contexto de estas limitaciones de distancia, modeladas por resortes. Las regiones para las que no hay información de plantilla se modelan mediante el modelo físico simplificado ab initio de Poing.
  • El modelo completo generado por Poing se combina con las plantillas originales como entrada para MODELLER .

Aplicaciones

Las aplicaciones de Phyre y Phyre2 incluyen la predicción de la estructura de proteínas, la predicción de funciones, la predicción de dominios, la predicción de límites de dominios, la clasificación evolutiva de proteínas, la guía de mutagénesis dirigida al sitio y la resolución de estructuras cristalinas de proteínas mediante reemplazo molecular .

Hay dos recursos vinculados que utilizan las predicciones de Phyre para el análisis basado en la estructura de variantes de sentido erróneo que suelen resultar de polimorfismos de un solo nucleótido .

  • PhyreRisk es una base de datos que mapea variantes genéticas a estructuras de proteínas experimentales y predichas por Phyre. La página de proteínas muestra las estructuras experimentales y predichas. Los usuarios pueden mapear variantes a partir de coordenadas genéticas o de proteínas. [12]
  • Missense3D es una herramienta que proporciona un informe estereoquímico sobre el efecto de una variante sin sentido en la estructura de la proteína. Los usuarios pueden cargar sus propias variantes y coordenadas, incluidas las estructuras PDB y los modelos predichos por Phyre. [13]

Historia

Phyre y Phyre2 son los sucesores del sistema de predicción de la estructura de la proteína 3D-PSSM [14] que tiene más de 1400 citas hasta la fecha. [15] 3D-PSSM fue diseñado y desarrollado por Lawrence Kelley [16] y Bob MacCallum [17] en el Laboratorio de modelado biomolecular [18] del Cancer Research UK . Phyre y Phyre2 eran Lawrence Kelley en el grupo de bioinformática estructural , [19] Imperial College London . Los componentes de los sistemas Phyre y Phyre2 fueron desarrollados por Benjamin Jefferys, [20] Alex Herbert, [21] y Riccardo Bennett-Lovsey. [22]Michael Sternberg supervisó la investigación y el desarrollo de ambos servidores .

Referencias

  1. ^ Lawrence Kelley; Riccardo Bennett-Lovsey; Alex Herbert; Kieran Fleming. "Phyre: motor de reconocimiento de homología / analogía de proteínas" . Grupo de Bioinformática Estructural, Imperial College, Londres . Consultado el 22 de abril de 2011 .
  2. ^ Lawrence Kelley; Benjamin Jefferys. "Phyre2: Motor de reconocimiento de homología / analogía de proteínas V 2.0" . Grupo de Bioinformática Estructural, Imperial College, Londres . Consultado el 22 de abril de 2011 .
  3. ^ Kelley, LA; Sternberg, MJE (2009). "Predicción de la estructura de proteínas en la Web: un estudio de caso utilizando el servidor Phyre" (PDF) . Protocolos de la naturaleza . 4 (3): 363–71. doi : 10.1038 / nprot.2009.2 . hdl : 10044/1/18157 . PMID 19247286 . S2CID 12497300 .   
  4. ^ Número de resultados devueltos de una búsqueda en Google Scholar (búsqueda de Google Scholar)
  5. ^ "Ayuda: Acerca de PHYRE2" . Servidor de reconocimiento de pliegues de proteínas PHYRE . El trabajo de desarrollo del servidor web Phyre2 está respaldado por una subvención de recursos y herramientas de BBSRC
  6. ^ Bennett-Lovsey, RM; Herbert, AD; Sternberg, MJE; Kelley, LA (2007). "Explorando los extremos del espacio secuencia / estructura con reconocimiento de pliegues conjuntos en el programa Phyre". Proteínas: estructura, función y bioinformática . 70 (3): 611-25. doi : 10.1002 / prot.21688 . PMID 17876813 . S2CID 23530683 .  
  7. ^ McGuffin, LJ; Bryson, K .; Jones, DT (2000). "El servidor de predicción de la estructura de la proteína PSIPRED" . Bioinformática . 16 (4): 404–5. doi : 10.1093 / bioinformatics / 16.4.404 . PMID 10869041 . 
  8. ^ Jones, DT; Ward, JJ (2003). "Predicción de regiones desordenadas en proteínas a partir de matrices de puntuación específicas de posición". Proteínas: estructura, función y genética . 53 : 573–8. doi : 10.1002 / prot.10528 . PMID 14579348 . S2CID 6081008 .  
  9. ^ Wass, MN; Kelley, LA; Sternberg, MJE (2010). " Sitio 3DLigand : predicción de sitios de unión de ligando utilizando estructuras similares" . Investigación de ácidos nucleicos . 38 (Problema del servidor web): W469 – W473. doi : 10.1093 / nar / gkq406 . PMC 2896164 . PMID 20513649 .  
  10. ^ Jones, DT (2007). "Mejora de la precisión de la predicción de la topología de proteínas transmembrana utilizando información evolutiva" . Bioinformática . 23 (5): 538–44. doi : 10.1093 / bioinformatics / btl677 . PMID 17237066 . 
  11. ^ Jefferys, BR; Kelley, LA; Sternberg, MJE (2010). "El plegamiento de proteínas requiere control de masas en una celda simulada" . Revista de Biología Molecular . 397 (5): 1329–38. doi : 10.1016 / j.jmb.2010.01.074 . PMC 2891488 . PMID 20149797 .  
  12. Ofoegbu, Tochukwu C .; David, Alessia; Kelley, Lawrence A .; Mezulis, Stefans; Islam, Suhail A .; Mersmann, Sophia F .; Strömich, Léonie; Vakser, Ilya A .; Houlston, Richard S .; Sternberg, Michael JE (2019). "PhyreRisk: una aplicación web dinámica para unir genómica, proteómica y datos estructurales 3D para guiar la interpretación de variantes genéticas humanas" . Revista de Biología Molecular . 431 (13): 2460–2466. doi : 10.1016 / j.jmb.2019.04.043 . ISSN 0022-2836 . PMC 6597944 . PMID 31075275 .   
  13. ^ Ittisoponpisan, Sirawit; Islam, Suhail A .; Khanna, Tarun; Alhuzimi, Eman; David, Alessia; Sternberg, Michael JE (2019). "¿Pueden las estructuras 3D de proteínas predichas proporcionar conocimientos fiables sobre si las variantes de sentido erróneo están asociadas a enfermedades?" . Revista de Biología Molecular . 431 (11): 2197–2212. doi : 10.1016 / j.jmb.2019.04.009 . ISSN 0022-2836 . PMC 6544567 . PMID 30995449 .   
  14. ^ Kelley, LA; MacCallum, RM; Sternberg, MJE (2000). "Anotación genómica mejorada mediante perfiles estructurales en el programa 3D-PSSM". Revista de Biología Molecular . 299 (2): 501–522. doi : 10.1006 / jmbi.2000.3741 . PMID 10860755 . 
  15. ^ Número de resultados devueltos de una búsqueda en Google Scholar. (Búsqueda de Google Académico)
  16. ^ Dr. Lawrence Kelley
  17. ^ Dr. Bob Maccallum
  18. ^ "Laboratorio de modelado biomolecular" . Archivado desde el original el 29 de septiembre de 2011 . Consultado el 9 de marzo de 2011 .
  19. ^ Grupo de bioinformática estructural
  20. ^ "Dr. Benjamin Jefferys" . Archivado desde el original el 18 de abril de 2011 . Consultado el 28 de marzo de 2011 .
  21. ^ Dr. Alex Herbert [ enlace muerto permanente ]
  22. ^ Dr. Riccardo Bennett-Lovsey
Obtenido de " https://en.wikipedia.org/w/index.php?title=Phyre&oldid=1022346096 "