En biología molecular, STRING ( herramienta de búsqueda para la recuperación de genes / proteínas que interactúan ) es una base de datos biológica y un recurso web de interacciones proteína-proteína conocidas y predichas . [1] [2] [3] [4] [5] [6]
Contenido | |
---|---|
Descripción | Herramienta de búsqueda para la recuperación de genes / proteínas que interactúan |
Contacto | |
Centro de Investigación | Consorcio Académico |
Cita primaria | PMID 30476243 |
Acceso | |
Sitio web | STRING sitio web |
URL de descarga | url |
URL del servicio web | descansar |
Diverso | |
Versión | 11.0b (octubre de 2020) |
La base de datos STRING contiene información de numerosas fuentes, incluidos datos experimentales, métodos de predicción computacional y colecciones de textos públicos. Es de libre acceso y se actualiza periódicamente. El recurso también sirve para resaltar los enriquecimientos funcionales en listas de proteínas proporcionadas por el usuario, utilizando una serie de sistemas de clasificación funcional como GO , Pfam y KEGG . La última versión 11b contiene información sobre aproximadamente 24,5 millones de proteínas de más de 5000 organismos. STRING ha sido desarrollado por un consorcio de instituciones académicas que incluyen CPR , EMBL , KU , SIB , TUD y UZH .
Uso
Las redes de interacción proteína-proteína son un ingrediente importante para la comprensión de los procesos celulares a nivel del sistema. Estas redes se pueden utilizar para filtrar y evaluar datos genómicos funcionales y para proporcionar una plataforma intuitiva para anotar las propiedades estructurales, funcionales y evolutivas de las proteínas. La exploración de las redes de interacción predichas puede sugerir nuevas direcciones para la investigación experimental futura y proporcionar predicciones entre especies para un mapeo de interacciones eficiente. [7]
Características
Los datos se ponderan e integran y se calcula una puntuación de confianza para todas las interacciones de proteínas. Los resultados de las diversas predicciones computacionales se pueden inspeccionar desde diferentes vistas designadas. Hay dos modos de STRING: modo proteína y modo COG . Las interacciones predichas se propagan a proteínas en otros organismos para los que se ha descrito interacción por inferencia de ortología . Hay una interfaz web disponible para acceder a los datos y ofrecer una descripción general rápida de las proteínas y sus interacciones. Hay disponible un complemento para que cytoscape use datos de STRING. Otra posibilidad para acceder a los datos STRING es utilizar la interfaz de programación de aplicaciones (API) mediante la construcción de una URL que contenga la solicitud.
Fuentes de datos
Como muchas otras bases de datos que almacenan el conocimiento de la asociación de proteínas, STRING importa datos de interacciones proteína-proteína derivadas experimentalmente a través de la conservación de la literatura. Además, STRING también almacena interacciones predichas computacionalmente de: (i) extracción de texto de textos científicos, (ii) interacciones calculadas a partir de características genómicas e (iii) interacciones transferidas de organismos modelo basados en ortología. [8]
Todas las interacciones predichas o importadas se comparan con una referencia común de asociación funcional como lo anota KEGG (Enciclopedia de genes y genomas de Kyoto).
Datos importados
STRING importa el conocimiento de la asociación de proteínas de las bases de datos de interacción física y las bases de datos del conocimiento de la vía biológica curada ( MINT , HPRD , BIND , DIP , BioGRID , KEGG , Reactome , IntAct , EcoCyc , NCI-Nature Pathway Interaction Database , GO ). Se proporcionan enlaces a los datos de origen de los respectivos repositorios experimentales y recursos de la base de datos.
Extracción de textos
Se analiza una gran cantidad de textos científicos ( SGD , OMIM , FlyBase , PubMed ) para buscar co-ocurrencias estadísticamente relevantes de nombres de genes.
Datos predichos
- Vecindad: un contexto genómico similar en diferentes especies sugiere una función similar de las proteínas.
- Eventos de fusión-fisión: es muy probable que las proteínas que se fusionan en algunos genomas estén unidas funcionalmente (como en otros genomas donde los genes no están fusionados).
- Ocurrencia: las proteínas que tienen una función similar o una ocurrencia en la misma vía metabólica, deben expresarse juntas y tener un perfil filogenético similar .
- Coexpresión: asociación prevista entre genes basada en patrones observados de expresión simultánea de genes.
Referencias
- ^ Szklarczyk, Damian; Gable, Annika L .; Lyon, David; Junge, Alexander; Wyder, Stefan; Huerta-Cepas, Jaime; Simonovic, Milán; Doncheva, Nadezhda T .; Morris, John H .; Bork, Peer; Jensen, Lars J. (8 de enero de 2019). "STRING v11: redes de asociación proteína-proteína con mayor cobertura, apoyando el descubrimiento funcional en conjuntos de datos experimentales de todo el genoma" . Investigación de ácidos nucleicos . 47 (D1): D607 – D613. doi : 10.1093 / nar / gky1131 . ISSN 1362-4962 . PMC 6323986 . PMID 30476243 .
- ^ Szklarczyk, Damian; Morris, John H .; Cook, Helen; Kuhn, Michael; Wyder, Stefan; Simonovic, Milán; Santos, Alberto; Doncheva, Nadezhda T .; Roth, Alexander; Bork, Peer; Jensen, Lars J. (4 de enero de 2017). "La base de datos STRING en 2017: redes de asociación proteína-proteína con control de calidad, ampliamente accesible" . Investigación de ácidos nucleicos . 45 (D1): D362 – D368. doi : 10.1093 / nar / gkw937 . ISSN 1362-4962 . PMC 5210637 . PMID 27924014 .
- ^ Szklarczyk D, Franceschini A, Wyder S, Forslund K, Heller D, Huerta-Cepas J, Simonovic M, Roth A, Santos A, Tsafou KP, Kuhn M, Bork P, Jensen LJ, von Mering C (2015). "STRING v10: redes de interacción proteína-proteína, integradas sobre el árbol de la vida" . Ácidos nucleicos Res . 43 (Problema de la base de datos): D447–52. doi : 10.1093 / nar / gku1003 . PMC 4383874 . PMID 25352553 .
- ^ Franceschini A, Szklarczyk D, Frankild S, Kuhn M, Simonovic M, Roth A, Lin J, Minguez P, Bork P, von Mering C, Jensen LJ (2013). "STRING v9.1: redes de interacción proteína-proteína, con mayor cobertura e integración" . Ácidos nucleicos Res . 41 (Problema de la base de datos): D808–15. doi : 10.1093 / nar / gks1094 . PMC 3531103 . PMID 23203871 .
- ^ Szklarczyk D, Franceschini A, Kuhn M, Simonovic M, Roth A, Minguez P, Doerks T, Stark M, Muller J, Bork P, Jensen LJ, von Mering C (2011). "La base de datos STRING en 2011: redes de interacción funcional de proteínas, globalmente integradas y puntuadas" . Ácidos nucleicos Res . 39 (Problema de la base de datos): D561–8. doi : 10.1093 / nar / gkq973 . PMC 3013807 . PMID 21045058 .
- ^ Snel, B; Lehmann, G; Bork, P y Huynen, MA (2000). "STRING: un servidor web para recuperar y mostrar la vecindad de un gen que ocurre repetidamente" . Ácidos nucleicos Res . 28 (18): 3442–4. doi : 10.1093 / nar / 28.18.3442 . PMC 110752 . PMID 10982861 .
- ^ Schwartz, AS; Yu, J; Gardenour, KR; Finley Jr; RL y Ideker, T (2008). "Estrategias rentables para completar el interactoma" . Métodos de la naturaleza . 6 (1): 55–61. doi : 10.1038 / nmeth.1283 . PMC 2613168 . PMID 19079254 .
- ^ Wodak, SJ; Pu, S; Vlasblom, J y Séraphin, B (2009). "Desafíos y recompensas de la proteómica de interacción" . Proteómica de células mol . 8 (1): 3–18. doi : 10.1074 / mcp.R800014-MCP200 . PMID 18799807 .
enlaces externos
- STRING sitio
- Sitio web STITCH , base de datos relacionada sobre interacciones de proteínas con moléculas pequeñas