OrthoDB [1] [2] [3] [4] presenta un catálogo de genes codificadores de proteínas ortólogos en vertebrados , artrópodos , hongos , plantas y bacterias . La ortología se refiere al último ancestro común de la especie en consideración y, por lo tanto, OrthoDB delinea explícitamente los ortólogos en cada radiación principal a lo largo de la filogenia de la especie. La base de datos de ortólogos presenta descriptores de proteínas disponibles, junto con Gene Ontology e InterPro.atributos, que sirven para proporcionar anotaciones descriptivas generales de los grupos ortólogos y facilitan la consulta integral de la base de datos de ortología. OrthoDB también proporciona rasgos evolutivos computados de ortólogos, como perfiles de pérdida y duplicación de genes, tasas de divergencia, grupos de hermanos y arquitecturas intrón-exón de genes.
Contenido | |
---|---|
Descripción | Catálogo de Ortólogos . |
Contacto | |
Centro de Investigación | Instituto Suizo de Bioinformática |
Laboratorio | Grupo de Genómica Evolutiva Computacional |
Autores | Evgenia V. Kriventseva |
Cita primaria | Kriventseva y col. (2015) [1] |
Fecha de lanzamiento | 2007 |
Acceso | |
Sitio web | www |
URL de descarga | https://www.orthodb.org/?page=filelist |
Punto final de Sparql | sparql |
Diverso | |
Licencia | CC-BY-3.0 |
En genómica comparada, no se puede subestimar la importancia de la escala. Como la delineación de la ortología genética requiere experiencia específica y considerables recursos computacionales, la escala es algo que los grupos de investigación individuales no especializados no pueden lograr por sí mismos. OrthoDB logra esta desafiante tarea , con conjuntos muy completos de especies y varias características únicas, como las extensas anotaciones funcionales y evolutivas de grupos ortólogos, con la integración de muchos enlaces útiles a otras bases de datos líderes en el mundo que se centran en capturar información sobre genes. función. Ningún genoma puede existir como una fuente de datos útil sin análisis comparativos extensos con otros genomas: OrthoDB proporciona un recurso de importancia crítica para la genómica comparativa para toda la comunidad de investigadores, desde aquellos interesados en grandes cuestiones evolutivas hasta aquellos que se centran en las funciones biológicas específicas de genes individuales. .
Metodología
La ortología se define en relación con el último ancestro común de la especie considerada, determinando así la naturaleza jerárquica de las clasificaciones ortólogas. Esto se aborda explícitamente en OrthoDB mediante la aplicación del procedimiento de delineación de ortología en cada punto de radiación principal de la filogenia considerada. La implementación de OrthoDB emplea un algoritmo de agrupación de Best-Reciprocal-Hit (BRH) basado en comparaciones de secuencias de proteínas de todos contra todos Smith-Waterman . El preprocesamiento del conjunto de genes selecciona la transcripción de codificación de proteínas más larga de genes empalmados alternativamente y de copias de genes muy similares. El procedimiento triangula los BRH para construir progresivamente los clústeres y requiere una superposición de alineación de secuencia mínima general para evitar la caminata de dominio. Estos grupos centrales se amplían aún más para incluir todos los parálogos dentro de las especies más estrechamente relacionados y las copias de genes muy similares identificadas previamente.
Contenido de datos
La base de datos contiene unas 600 especies eucariotas y más de 3600 bacterias [1] procedentes de Ensembl , UniProt , NCBI , FlyBase y varias otras bases de datos. El muestreo cada vez mayor de genomas secuenciados aporta una descripción más clara de la mayoría de las genealogías de genes que facilitarán hipótesis informadas sobre la función de los genes en genomas recién secuenciados.
Ejemplos de estudios que han empleado datos de OrthoDB incluyen análisis comparativos de la evolución del repertorio de genes , [5] [6] comparaciones de genes de desarrollo de moscas de la fruta y mosquitos , [7] análisis de cambios inducidos por la harina de sangre o infecciones en la expresión génica en mosquitos , [8] [9] [10] análisis de la evolución de la producción de leche en mamíferos , [11] y la evolución del gen y del genoma del mosquito . [12] Otros estudios que citan OrthoDB se pueden encontrar en PubMed y Google Scholar .
Actuación
OrthoDB se ha desempeñado consistentemente bien en evaluaciones comparativas junto con otros procedimientos de delineación de ortología . Los resultados se compararon con árboles de referencia para tres familias de proteínas bien conservadas [13] y con un conjunto más grande de familias de proteínas curadas. [14]
BUSCO
B enchmarking conjuntos de U NIVERSAL Si ngle- C opy O rthologs [15] - grupos de ortólogos se seleccionan de OrthoDB para las clasificaciones de nivel raíz de artrópodos, vertebrados, metazoos, hongos, y otros grandes clados. Se requiere que los grupos contengan ortólogos de una sola copia en al menos el 90% de las especies (en otras, se pueden perder o duplicar), y las especies que faltan no pueden ser todas del mismo clado. Las especies con pérdidas o duplicaciones frecuentes se eliminan de la selección a menos que ocupen una posición clave en la filogenia. Por lo tanto, se espera que los BUSCO se encuentren como ortólogos de copia única en cualquier genoma secuenciado recientemente del clado filogenético apropiado, y se pueden usar para analizar genomas secuenciados recientemente para evaluar su completitud relativa. La herramienta de evaluación BUSCO y los conjuntos de datos (accesibles aquí ) se están utilizando ampliamente en muchos proyectos de genómica, y la mayoría de los editores de revistas ahora requieren evaluaciones de calidad antes de aceptar nuevas publicaciones de genoma.
notas y referencias
- ^ a b c Kriventseva EV, Tegenfeldt F, Petty TJ, Waterhouse RM, Simão FA, Pozdnyakov IA, Ioannidis P, Zdobnov EM (enero de 2015). "OrthoDB v8: actualización del catálogo jerárquico de ortólogos y el software libre subyacente" . Ácidos nucleicos Res . 43 (Problema de la base de datos): D250–6. doi : 10.1093 / nar / gku1220 . PMC 4383991 . PMID 25428351 .
- ^ Waterhouse RM, Tegenfeldt F, Li J, Zdobnov EM, Kriventseva EV (enero de 2013). "OrthoDB: un catálogo jerárquico de ortólogos de animales, hongos y bacterias" . Ácidos nucleicos Res . 41 (Problema de la base de datos): D358–65. doi : 10.1093 / nar / gks1116 . PMC 3531149 . PMID 23180791 .
- ^ Waterhouse RM, Zdobnov EM, Tegenfeldt F, Li J, Kriventseva EV (enero de 2011). "OrthoDB: el catálogo jerárquico de ortólogos eucariotas en 2011" . Ácidos nucleicos Res . 39 (Problema de la base de datos): D283–8. doi : 10.1093 / nar / gkq930 . PMC 3013786 . PMID 20972218 .
- ^ Kriventseva EV, Rahman N, Espinosa O, Zdobnov EM (enero de 2008). "OrthoDB: el catálogo jerárquico de ortólogos eucariotas" . Ácidos nucleicos Res . 36 (Problema de la base de datos): D271–5. doi : 10.1093 / nar / gkm845 . PMC 2238902 . PMID 17947323 .
- ^ Waterhouse RM, Zdobnov EM, Kriventseva EV (enero de 2011). "Correlacionar rasgos de retención de genes, divergencia de secuencia, duplicabilidad y esencialidad en vertebrados, artrópodos y hongos" . Genome Biol. Evol . 3 : 75–86. doi : 10.1093 / gbe / evq083 . PMC 3030422 . PMID 21148284 .
- ^ Hase T, Niimura Y, Tanaka H (2010). "La diferencia en la duplicabilidad de genes puede explicar la diferencia en la estructura general de las redes de interacción proteína-proteína entre eucariotas" . BMC Evol. Biol . 10 : 358. doi : 10.1186 / 1471-2148-10-358 . PMC 2994879 . PMID 21087510 .
- ^ Behura SK, Haugen M, Flannery E, Sarro J, Tessier CR, Severson DW, Duman-Scheel M (2011). "Análisis genómico comparativo de Drosophila melanogaster y genes de desarrollo de mosquitos vectoriales" . PLOS ONE . 6 (7): e21504. Código bibliográfico : 2011PLoSO ... 621504B . doi : 10.1371 / journal.pone.0021504 . PMC 3130749 . PMID 21754989 .
- ^ Bonizzoni M, Dunn WA, Campbell CL, Olson KE, Dimon MT, Marinotti O, James AA (2011). "Análisis de RNA-seq de cambios inducidos por la sangre en la expresión génica en la especie de mosquito vector, Aedes aegypti" . BMC Genomics . 12 : 82. doi : 10.1186 / 1471-2164-12-82 . PMC 3042412 . PMID 21276245 .
- ^ Pinto SB, Lombardo F, Koutsos AC, Waterhouse RM, McKay K, An C, Ramakrishnan C, Kafatos FC, Michel K (2009). "Descubrimiento de moduladores de Plasmodium por análisis de todo el genoma de hemocitos circulantes en Anopheles gambiae" . Proc Natl Acad Sci USA . 106 (50): 21270–5. Código Bibliográfico : 2009PNAS..10621270P . doi : 10.1073 / pnas.0909463106 . PMC 2783009 . PMID 19940242 .
- ^ Bartholomay LC, Waterhouse RM, Mayhew GF, Campbell CL, Michel K, Zou Z, Ramirez JL, Das S, Alvarez K, Arensburger P, Bryant B, Chapman SB, Dong Y, Erickson SM, Karunaratne SH, Kokoza V, Kodira CD , Pignatelli P, Shin SW, Vanlandingham DL, Atkinson PW, Birren B, Christophides GK, Clem RJ, Hemingway J, Higgs S, Megy K, Ranson H, Zdobnov EM, Raikhel AS, Christensen BM, Dimopoulos G, Muskavitch MA (2010 ). "Patogenómica de Culex quinquefasciatus y metanálisis de respuestas de infección a diversos patógenos" . Ciencia . 330 (6000): 88–90. Código Bibliográfico : 2010Sci ... 330 ... 88B . doi : 10.1126 / science.1193162 . PMC 3104938 . PMID 20929811 .
- ^ Lemay DG, Lynn DJ, Martin WF, Neville MC, Casey TM, Rincon G, Kriventseva EV, Barris WC, Hinrichs AS, Molenaar AJ, Pollard KS, Maqbool NJ, Singh K, Murney R, Zdobnov EM, Tellam RL, Medrano JF , Alemán JB, Rijnkels M (2009). "El genoma de la lactancia bovina: conocimientos sobre la evolución de la leche de mamíferos" . Genome Biol . 10 (4): R43. doi : 10.1186 / gb-2009-10-4-r43 . PMC 2688934 . PMID 19393040 .
- ^ Neafsey DE, Waterhouse RM, Abai MR, Aganezov SS, Alekseyev MA, Allen JE, Amon J, Arcà B, Arensburger P, Artemov G, Assour LA, Basseri H, Berlin A, Birren BW, Blandin SA, Brockman AI, Burkot TR , Burt A, Chan CS, Chauve C, Chiu JC, Christensen M, Costantini C, Davidson VL, Deligianni E, Dottorini T, Dritsou V, Gabriel SB, Guelbeogo WM, Hall AB, Han MV, Hlaing T, Hughes DS, Jenkins AM, Jiang X, Jungreis I, Kakani EG, Kamali M, Kemppainen P, Kennedy RC, Kirmitzoglou IK, Koekemoer LL, Laban N, Langridge N, Lawniczak MK, Lirakis M, Lobo NF, Lowy E, MacCallum RM, Mao C, Maslen G, Mbogo C, McCarthy J, Michel K, Mitchell SN, Moore W, Murphy KA, Naumenko AN, Nolan T, Novoa EM, O'Loughlin S, Oringanje C, Oshaghi MA, Pakpour N, Papathanos PA, Peery AN, Povelones M, Prakash A, Price DP, Rajaraman A, Reimer LJ, Rinker DC, Rokas A, Russell TL, Sagnon N, Sharakhova MV, Shea T, Simão FA, Simard F, Slotman MA, Somboon P, Stegniy V, Struchiner CJ , Thomas GW, Tojo M, Topalis P, Tubio JM, Unger MF, Vontas J, Walton C, Wilding CS, Willis JH, Wu YC, Yan G, Zdobnov EM, Zhou X, Catteruccia F, Christophides GK, Collins FH, Cornman RS, Crisanti A, Donnelly MJ, Emrich SJ, Fontaine MC, Gelbart W, Hahn MW, Hansen IA, Howell PI, Kafatos FC, Kellis M, Lawson D, Louis C, Luckhart S, Muskavitch MA, Ribeiro JM, Riehle MA, Sharakhov IV, Tu Z, Zwiebel LJ, Besansky NJ (enero de 2015). "Vectores de la malaria altamente evolutivos: los genomas de 16 mosquitos Anopheles" . Ciencia . 347 (6217): 62176. Bibcode : 2015Sci ... 347 ... 43N . doi : 10.1126 / science.1258522 . PMC 4380271 . PMID 25554792 .
- ^ Boeckmann B, Robinson-Rechavi M, Xenarios I, Dessimoz C (septiembre de 2011). "Marco conceptual y estudio piloto para comparar bases de datos filogenómicas basadas en árboles de genes de referencia" . Breve. Bioinform . 12 (5): 423–35. doi : 10.1093 / bib / bbr034 . PMC 3178055 . PMID 21737420 .
- ^ http://eggnog.embl.de/orthobench OrthoBench]
Trachana K, Larsson TA, Powell S, Chen WH, Doerks T, Muller J, Bork P (octubre de 2011). "Métodos de predicción de ortología: una evaluación de la calidad utilizando familias de proteínas curadas" . BioEssays . 33 (10): 769–80. doi : 10.1002 / bies.201100062 . PMC 3193375 . PMID 21853451 . - ^ Simão FA, Waterhouse RM, Ioannidis P, Kriventseva EV, Zdobnov EM (junio de 2015). "BUSCO: evaluación del ensamblaje del genoma y la completitud de la anotación con ortólogos de una sola copia" . Bioinformática . 31 (19): 3210–2. doi : 10.1093 / bioinformatics / btv351 . PMID 26059717 .
Ver también
- Homología (biología)
- Filogenia
- Lista de bases de datos biológicas
enlaces externos
- Página web oficial