En biología evolutiva , secuencias conservadas son idénticos o similares secuencias de ácidos nucleicos ( ADN y ARN ) o proteínas a través de especies ( ortólogos secuencias ), o dentro de un genoma ( paralogous secuencias ), o entre el donante y receptor taxones ( secuencias xenologous ). La conservación indica que una secuencia se ha mantenido por selección natural .
Una secuencia altamente conservada es aquella que se ha mantenido relativamente sin cambios muy atrás en el árbol filogenético y, por lo tanto, muy atrás en el tiempo geológico . Los ejemplos de secuencias altamente conservadas incluyen los componentes de ARN de los ribosomas presentes en todos los dominios de la vida, las secuencias de homeobox muy extendidas entre los eucariotas y el ARNtm en las bacterias . El estudio de la conservación de secuencias se solapa con los campos de la genómica , la proteómica , la biología evolutiva , la filogenética , la bioinformática y las matemáticas .
Historia
El descubrimiento del papel del ADN en la herencia y las observaciones de Frederick Sanger de la variación entre insulinas animales en 1949, [2] llevaron a los primeros biólogos moleculares a estudiar la taxonomía desde una perspectiva molecular. [3] [4] Los estudios realizados en la década de 1960 utilizaron técnicas de hibridación de ADN y reactividad cruzada de proteínas para medir la similitud entre proteínas ortólogas conocidas , como la hemoglobina [5] y el citocromo c . [6] En 1965, Émile Zuckerkandl y Linus Pauling introdujeron el concepto de reloj molecular , [7] proponiendo que las tasas constantes de reemplazo de aminoácidos podrían usarse para estimar el tiempo desde que dos organismos divergieron . Si bien las filogenias iniciales coincidían estrechamente con el registro fósil , las observaciones de que algunos genes parecían evolucionar a diferentes ritmos llevaron al desarrollo de teorías de la evolución molecular . [3] [4] La comparación de Margaret Dayhoff de 1966 de las secuencias de ferrodoxina mostró que la selección natural actuaría para conservar y optimizar las secuencias de proteínas esenciales para la vida. [8]
Mecanismos
Durante muchas generaciones, las secuencias de ácidos nucleicos en el genoma de un linaje evolutivo pueden cambiar gradualmente con el tiempo debido a mutaciones y deleciones aleatorias . [9] [10] Las secuencias también pueden recombinarse o eliminarse debido a reordenamientos cromosómicos . Las secuencias conservadas son secuencias que persisten en el genoma a pesar de tales fuerzas y tienen tasas de mutación más lentas que la tasa de mutación de fondo. [11]
La conservación puede ocurrir en secuencias de ácidos nucleicos codificantes y no codificantes . Se cree que las secuencias de ADN altamente conservadas tienen valor funcional, aunque se comprende poco el papel de muchas secuencias de ADN no codificantes altamente conservadas. [12] [13] El grado de conservación de una secuencia puede verse afectado por distintas presiones de selección , su robustez a la mutación, el tamaño de la población y la deriva genética . Muchas secuencias funcionales también son modulares y contienen regiones que pueden estar sujetas a presiones de selección independientes , tales como dominios de proteínas . [14]
Secuencia de codificación
En las secuencias codificantes, la secuencia de aminoácidos y ácidos nucleicos puede conservarse en diferentes grados, ya que la degeneración del código genético significa que las mutaciones sinónimas en una secuencia codificante no afectan la secuencia de aminoácidos de su producto proteico. [15]
Las secuencias de aminoácidos se pueden conservar para mantener la estructura o función de una proteína o dominio. Las proteínas conservadas sufren menos reemplazos de aminoácidos , o es más probable que sustituyan aminoácidos con propiedades bioquímicas similares . [16] Dentro de una secuencia, los aminoácidos que son importantes para el plegamiento , la estabilidad estructural o que forman un sitio de unión pueden estar más altamente conservados. [17] [18]
La secuencia de ácido nucleico de un gen que codifica una proteína también puede conservarse mediante otras presiones selectivas. El sesgo de uso de codones en algunos organismos puede restringir los tipos de mutaciones sinónimos en una secuencia. Las secuencias de ácido nucleico que causan una estructura secundaria en el ARNm de un gen codificante pueden seleccionarse en contra, ya que algunas estructuras pueden afectar negativamente a la traducción, o conservarse cuando el ARNm también actúa como un ARN funcional no codificante. [19] [20]
Sin codificación
Las secuencias no codificantes importantes para la regulación génica , como los sitios de unión o reconocimiento de ribosomas y factores de transcripción , pueden conservarse dentro de un genoma. Por ejemplo, el promotor de un gen u operón conservado también puede conservarse. Al igual que con las proteínas, también se pueden conservar los ácidos nucleicos que son importantes para la estructura y función del ARN no codificante (ncRNA). Sin embargo, la conservación de la secuencia en los ncRNA es generalmente deficiente en comparación con las secuencias que codifican proteínas, y los pares de bases que contribuyen a la estructura o función a menudo se conservan en su lugar. [21] [22]
Identificación
Las secuencias conservadas se identifican típicamente mediante enfoques bioinformáticos basados en la alineación de secuencias . Los avances en la secuenciación de ADN de alto rendimiento y la espectrometría de masas de proteínas han aumentado sustancialmente la disponibilidad de secuencias de proteínas y genomas completos para la comparación desde principios de la década de 2000. [23] [24]
Búsqueda de homología
Las secuencias conservadas pueden identificarse mediante búsqueda de homología , utilizando herramientas como BLAST , HMMER , OrthologR , [25] e Infernal. [26] Las herramientas de búsqueda de homología pueden tomar una secuencia de proteína o ácido nucleico individual como entrada, o utilizar modelos estadísticos generados a partir de múltiples alineaciones de secuencias de secuencias relacionadas conocidas. Los modelos estadísticos como los HMM de perfil y los modelos de covarianza de ARN que también incorporan información estructural, [27] pueden ser útiles cuando se buscan secuencias más distantes. Luego, las secuencias de entrada se alinean con una base de datos de secuencias de individuos relacionados u otras especies. A continuación, las alineaciones resultantes se puntúan basándose en el número de aminoácidos o bases coincidentes y en el número de espacios o deleciones generadas por la alineación. Pueden identificarse sustituciones conservadoras aceptables usando matrices de sustitución tales como PAM y BLOSUM . Se supone que las alineaciones de puntuación alta proceden de secuencias homólogas. La conservación de una secuencia puede inferirse mediante la detección de homólogos muy similares en un amplio rango filogenético. [28]
Alineación de múltiples secuencias
Pueden usarse múltiples alineamientos de secuencia para visualizar secuencias conservadas. El formato CLUSTAL incluye una clave de texto sin formato para anotar columnas conservadas de la alineación, que denota secuencia conservada (*), mutaciones conservadoras (:), mutaciones semiconservadoras (.) Y mutaciones no conservadoras () [30] Logotipos de secuencia también puede mostrar la secuencia conservada al representar las proporciones de caracteres en cada punto de la alineación por altura. [29]
Alineación del genoma
También se pueden usar alineaciones de genoma completo (WGA) para identificar regiones altamente conservadas entre especies. Actualmente, la precisión y escalabilidad de las herramientas WGA sigue siendo limitada debido a la complejidad computacional de lidiar con reordenamientos, regiones repetidas y el gran tamaño de muchos genomas eucariotas. [32] Sin embargo, las WGA de 30 o más bacterias estrechamente relacionadas (procariotas) son ahora cada vez más factibles. [33] [34]
Sistemas de puntuación
Otros enfoques utilizan medidas de conservación basadas en pruebas estadísticas que intentan identificar secuencias que mutan de manera diferente a una tasa de mutación de fondo esperada (neutra).
El marco GERP (Genomic Evolutionary Rate Profiling) puntúa la conservación de secuencias genéticas en todas las especies. Este enfoque estima la tasa de mutación neutra en un conjunto de especies a partir de una alineación de secuencia múltiple y luego identifica las regiones de la secuencia que exhiben menos mutaciones de las esperadas. A continuación, se asignan puntuaciones a estas regiones basándose en la diferencia entre la tasa de mutación observada y la tasa de mutación de fondo esperada. Una puntuación de GERP alta indica entonces una secuencia muy conservada. [35] [36]
LIST [37] [38] (Identidad local e impuestos compartidos) se basa en la suposición de que las variaciones observadas en especies estrechamente relacionadas con el ser humano son más significativas cuando se evalúa la conservación en comparación con las de especies lejanamente relacionadas. Por lo tanto, LIST utiliza la identidad de alineación local alrededor de cada posición para identificar secuencias relevantes en la alineación de secuencia múltiple (MSA) y luego estima la conservación en función de las distancias taxonómicas de estas secuencias al ser humano. A diferencia de otras herramientas, LIST ignora el recuento / frecuencia de variaciones en el MSA.
Aminode [39] combina múltiples alineamientos con análisis filogenético para analizar cambios en proteínas homólogas y producir un gráfico que indique las tasas locales de cambios evolutivos. Este enfoque identifica las Regiones Evolutivamente Restringidas en una proteína, que son segmentos que están sujetos a selección purificadora y típicamente son críticos para la función normal de la proteína.
Otros enfoques como PhyloP y PhyloHMM incorporan métodos filogenéticos estadísticos para comparar distribuciones de probabilidad de tasas de sustitución, lo que permite la detección tanto de conservación como de mutación acelerada. Primero, se genera una distribución de probabilidad de fondo del número de sustituciones que se espera que ocurran para una columna en una alineación de secuencia múltiple, basada en un árbol filogenético . Las relaciones evolutivas estimadas entre las especies de interés se utilizan para calcular la importancia de cualquier sustitución (es decir, una sustitución entre dos especies estrechamente relacionadas puede ser menos probable que ocurra que otras lejanamente relacionadas y, por lo tanto, más significativa). Para detectar la conservación, se calcula una distribución de probabilidad para un subconjunto de la alineación de secuencia múltiple y se compara con la distribución de fondo mediante una prueba estadística, como una prueba de razón de verosimilitud o una prueba de puntuación . Los valores P generados a partir de la comparación de las dos distribuciones se utilizan luego para identificar regiones conservadas. PhyloHMM utiliza modelos ocultos de Markov para generar distribuciones de probabilidad. El paquete de software PhyloP compara distribuciones de probabilidad utilizando una prueba de razón de verosimilitud o una prueba de puntuación , así como un sistema de puntuación similar al GERP. [40] [41] [42]
Conservación extrema
Elementos ultraconservados
Los elementos ultraconservados o UCE son secuencias que son muy similares o idénticas en múltiples agrupaciones taxonómicas . Estos se descubrieron por primera vez en vertebrados , [43] y posteriormente se han identificado dentro de taxones muy diferentes. [44] Si bien el origen y la función de las UCE no se conocen bien, [45] se han utilizado para investigar divergencias profundas en amniotas , [46] insectos , [47] y entre animales y plantas . [48]
Genes universalmente conservados
Los genes más conservados son los que se pueden encontrar en todos los organismos. Estos consisten principalmente en los ncRNA y las proteínas necesarias para la transcripción y traducción , que se supone que se han conservado del último ancestro común universal de toda la vida. [49]
Los genes o familias de genes que se han encontrado universalmente conservados incluyen factores de elongación de unión a GTP , metionina aminopeptidasa 2 , serina hidroximetiltransferasa y transportadores de ATP . [50] Los componentes de la maquinaria de transcripción, como la ARN polimerasa y las helicasas , y de la maquinaria de traducción, como los ARN ribosómicos , los ARNt y las proteínas ribosómicas también se conservan universalmente. [51]
Aplicaciones
Filogenética y taxonomía
Los conjuntos de secuencias conservadas se utilizan a menudo para generar árboles filogenéticos , ya que se puede suponer que los organismos con secuencias similares están estrechamente relacionados. [52] La elección de secuencias puede variar según el alcance taxonómico del estudio. Por ejemplo, los genes más conservados, como el ARN 16S y otras secuencias ribosómicas, son útiles para reconstruir relaciones filogenéticas profundas e identificar filos bacterianos en estudios de metagenómica . [53] [54] Las secuencias que se conservan dentro de un clado pero que sufren algunas mutaciones, como los genes domésticos , se pueden utilizar para estudiar las relaciones entre especies. [55] [56] [57] La región del espaciador interno transcrito (ITS), que se requiere para espaciar los genes de ARNr conservados pero experimenta una rápida evolución, se usa comúnmente para clasificar hongos y cepas de bacterias de rápida evolución. [58] [59] [60] [61]
Investigación médica
Dado que las secuencias altamente conservadas a menudo tienen funciones biológicas importantes, pueden ser un punto de partida útil para identificar la causa de enfermedades genéticas . Muchos trastornos metabólicos congénitos y enfermedades de almacenamiento lisosómico son el resultado de cambios en genes conservados individuales, lo que resulta en enzimas faltantes o defectuosas que son la causa subyacente de los síntomas de la enfermedad. Las enfermedades genéticas pueden predecirse identificando secuencias que se conservan entre humanos y organismos de laboratorio como ratones [62] o moscas de la fruta , [63] y estudiando los efectos de la eliminación de estos genes. [64] Los estudios de asociación de todo el genoma también se pueden utilizar para identificar variaciones en secuencias conservadas asociadas con enfermedades o resultados de salud. En la enfermedad de Alzehimer se han descubierto más de dos docenas de nuevos loci potenciales de susceptibilidad [65] [66].
Anotación funcional
La identificación de secuencias conservadas se puede utilizar para descubrir y predecir secuencias funcionales tales como genes. [67] Las secuencias conservadas con una función conocida, como los dominios de proteínas, también se pueden usar para predecir la función de una secuencia. Las bases de datos de dominios proteicos conservados como Pfam y Conserved Domain Database pueden usarse para anotar dominios funcionales en genes codificantes de proteínas pronosticados. [68]
Ver también
- Biología evolutiva del desarrollo
- Sitio de segregación
- Alineación de secuencia
- Software de alineación de secuencias
- UCbase
- Elemento ultraconservado
Referencias
- ^ "Preguntas frecuentes de Clustal # Símbolos" . Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
- ^ Sanger, F. (24 de septiembre de 1949). "Diferencias de especies en insulina" . Naturaleza . 164 (4169): 529. Bibcode : 1949Natur.164..529S . doi : 10.1038 / 164529a0 . PMID 18141620 . S2CID 4067991 .
- ^ a b Marmur, J; Falkow, S; Mandel, M (octubre de 1963). "Nuevos enfoques de la taxonomía bacteriana". Revisión anual de microbiología . 17 (1): 329–372. doi : 10.1146 / annurev.mi.17.100163.001553 . PMID 14147455 .
- ^ a b Ritmo, NR; Sapp, J .; Goldenfeld, N. (17 de enero de 2012). "Filogenia y más allá: significado científico, histórico y conceptual del primer árbol de la vida" . Actas de la Academia Nacional de Ciencias . 109 (4): 1011–1018. Código bibliográfico : 2012PNAS..109.1011P . doi : 10.1073 / pnas.1109716109 . PMC 3268332 . PMID 22308526 .
- ^ Zuckerlandl, Emile ; Pauling, Linus B. (1962). "Enfermedad molecular, evolución y heterogeneidad genética". Horizontes en bioquímica : 189–225.
- ^ Margoliash, E (octubre de 1963). "Estructura primaria y evolución del citocromo C" . Proc Natl Acad Sci USA . 50 (4): 672–679. Código Bibliográfico : 1963PNAS ... 50..672M . doi : 10.1073 / pnas.50.4.672 . PMC 221244 . PMID 14077496 .
- ^ Zuckerkandl, E; Pauling, LB (1965). Divergencia evolutiva y convergencia en proteínas . Evolución de genes y proteínas . págs. 96-166. doi : 10.1016 / B978-1-4832-2734-4.50017-6 . ISBN 9781483227344.
- ^ Eck, RV; Dayhoff, MO (15 de abril de 1966). "Evolución de la estructura de ferredoxina basada en reliquias vivientes de secuencias de aminoácidos primitivos". Ciencia . 152 (3720): 363–366. Código bibliográfico : 1966Sci ... 152..363E . doi : 10.1126 / science.152.3720.363 . PMID 17775169 . S2CID 23208558 .
- ^ Kimura, M (17 de febrero de 1968). "Tasa evolutiva a nivel molecular". Naturaleza . 217 (5129): 624–626. Código Bibliográfico : 1968Natur.217..624K . doi : 10.1038 / 217624a0 . PMID 5637732 . S2CID 4161261 .
- ^ King, JL; Jukes, TH (16 de mayo de 1969). "Evolución no darwiniana". Ciencia . 164 (3881): 788–798. Código Bibliográfico : 1969Sci ... 164..788L . doi : 10.1126 / science.164.3881.788 . PMID 5767777 .
- ^ Kimura, M; Ohta, T (1974). "Sobre algunos principios que gobiernan la evolución molecular" . Proc Natl Acad Sci USA . 71 (7): 2848–2852. Código Bibliográfico : 1974PNAS ... 71.2848K . doi : 10.1073 / pnas.71.7.2848 . PMC 388569 . PMID 4527913 .
- ^ Asthana, Saurabh; Roytberg, Mikhail; Stamatoyannopoulos, John; Sunyaev, Shamil (28 de diciembre de 2007). Brudno, Michael (ed.). "Análisis de la conservación de la secuencia en la resolución de nucleótidos" . PLOS Biología Computacional . 3 (12): e254. Código bibliográfico : 2007PLSCB ... 3..254A . doi : 10.1371 / journal.pcbi.0030254 . ISSN 1553-7358 . PMC 2230682 . PMID 18166073 .
- ^ Cooper, GM; Brown, CD (1 de febrero de 2008). "Calificando la relación entre conservación de secuencias y función molecular" . Investigación del genoma . 18 (2): 201–205. doi : 10.1101 / gr.7205808 . ISSN 1088-9051 . PMID 18245453 .
- ^ Gilson, Amy I .; Marshall-Christensen, Ahmee; Choi, Jeong-Mo; Shakhnovich, Eugene I. (2017). "El papel de la selección evolutiva en la dinámica de la evolución de la estructura de la proteína" . Revista biofísica . 112 (7): 1350-1365. arXiv : 1606.05802 . Código bibliográfico : 2017BpJ ... 112.1350G . doi : 10.1016 / j.bpj.2017.02.029 . PMC 5390048 . PMID 28402878 .
- ^ Hunt, Ryan C .; Simhadri, Vijaya L .; Iandoli, Matthew; Sauna, Zuben E .; Kimchi-Sarfaty, Chava (2014). "Exposición de mutaciones sinónimos". Tendencias en Genética . 30 (7): 308–321. doi : 10.1016 / j.tig.2014.04.006 . PMID 24954581 .
- ^ Zhang, Jianzhi (2000). "Tasas de sustituciones de nucleótidos no sinónimos conservadores y radicales en genes nucleares de mamíferos" . Revista de evolución molecular . 50 (1): 56–68. Código Bibliográfico : 2000JMolE..50 ... 56Z . doi : 10.1007 / s002399910007 . ISSN 0022-2844 . PMID 10654260 . S2CID 15248867 .
- ^ Sousounis, Konstantinos; Haney, Carl E; Cao, Jin; Sunchu, Bharat; Tsonis, Panagiotis A (2012). "Conservación de la estructura tridimensional en proteínas no homólogas o no relacionadas" . Genómica humana . 6 (1): 10. doi : 10.1186 / 1479-7364-6-10 . ISSN 1479-7364 . PMC 3500211 . PMID 23244440 .
- ^ Kairys, Visvaldas; Fernandes, Miguel X. (2007). "SitCon: visualización de conservación de residuos del sitio de unión y herramienta de secuenciación de función de proteína" . Revista Internacional de Química Cuántica . 107 (11): 2100–2110. Código bibliográfico : 2007IJQC..107.2100K . doi : 10.1002 / qua.21396 . ISSN 0020-7608 .
- ^ Chamary, JV; Hurst, Laurence D (2005). "Evidencia para la selección de mutaciones sinónimas que afectan la estabilidad de la estructura secundaria del ARNm en mamíferos" . Biología del genoma . 6 (9): R75. doi : 10.1186 / gb-2005-6-9-r75 . PMC 1242210 . PMID 16168082 .
- ^ Wadler, CS; Vanderpool, CK (27 de noviembre de 2007). "Una función dual para un ARN pequeño bacteriano: SgrS realiza la regulación dependiente del emparejamiento de bases y codifica un polipéptido funcional" . Actas de la Academia Nacional de Ciencias . 104 (51): 20454–20459. Código Bibliográfico : 2007PNAS..10420454W . doi : 10.1073 / pnas.0708102104 . PMC 2154452 . PMID 18042713 .
- ^ Johnsson, Per; Lipovich, Leonard; Grandér, Dan; Morris, Kevin V. (marzo de 2014). "Conservación evolutiva de ARN largos no codificantes; secuencia, estructura, función" . Biochimica et Biophysica Acta (BBA) - Temas generales . 1840 (3): 1063–1071. doi : 10.1016 / j.bbagen.2013.10.035 . PMC 3909678 . PMID 24184936 .
- ^ Freyhult, EK; Bollback, JP; Gardner, PP (6 de diciembre de 2006). "Exploración de la materia oscura genómica: una evaluación crítica del rendimiento de los métodos de búsqueda de homología en ARN no codificante" . Investigación del genoma . 17 (1): 117-125. doi : 10.1101 / gr.5890907 . PMC 1716261 . PMID 17151342 .
- ^ Margulies, EH (1 de diciembre de 2003). "Identificación y caracterización de secuencias conservadas de especies múltiples" . Investigación del genoma . 13 (12): 2507-2518. doi : 10.1101 / gr.1602203 . ISSN 1088-9051 . PMC 403793 . PMID 14656959 .
- ^ Edwards, John R .; Ruparel, Hameer; Ju, Jingyue (2005). "Secuenciación de ADN por espectrometría de masas". Investigación de mutaciones / Mecanismos fundamentales y moleculares de mutagénesis . 573 (1–2): 3–12. doi : 10.1016 / j.mrfmmm.2004.07.021 . PMID 15829234 .
- ^ Drost, Hajk-Georg; Gabel, Alexander; Grosse, Ivo; Quint, Marcel (1 de mayo de 2015). "Evidencia para el mantenimiento activo de patrones de reloj de arena filotranscriptómicos en embriogénesis animal y vegetal" . Biología Molecular y Evolución . 32 (5): 1221-1231. doi : 10.1093 / molbev / msv012 . ISSN 0737-4038 . PMC 4408408 . PMID 25631928 .
- ^ Nawrocki, EP; Eddy, SR (4 de septiembre de 2013). "Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas" . Bioinformática . 29 (22): 2933-2935. doi : 10.1093 / bioinformatics / btt509 . PMC 3810854 . PMID 24008419 .
- ^ Eddy, SR; Durbin, R (11 de junio de 1994). "Análisis de secuencia de ARN mediante modelos de covarianza" . Investigación de ácidos nucleicos . 22 (11): 2079–88. doi : 10.1093 / nar / 22.11.2079 . PMC 308124 . PMID 8029015 .
- ^ Trivedi, Rakesh; Nagarajaram, Hampapathalu Adimurthy (2020). "Matrices de puntuación de sustitución para proteínas: una descripción general". Ciencia de las proteínas . 29 (11): 2150–2163. doi : 10.1002 / pro.3954 . ISSN 0961-8368 . PMC 7586916. PMID 32954566 .
- ^ a b "Weblogo" . UC Berkeley . Consultado el 30 de diciembre de 2017 .
- ^ "Preguntas frecuentes de Clustal # Símbolos" . Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
- ^ "Navegador ECR" . Navegador ECR . Consultado el 9 de enero de 2018 .
- ^ Earl, Dent; Nguyen, Ngan; Hickey, Glenn; Harris, Robert S .; Fitzgerald, Stephen; Beal, Kathryn; Seledtsov, Igor; Molodtsov, Vladimir; Raney, Brian J .; Clawson, Hiram; Kim, Jaebum; Kemena, Carsten; Chang, Jia-Ming; Erb, Ionas; Poliakov, Alexander; Hou, Minmei; Herrero, Javier; Kent, William James; Solovyev, Victor; Querido, Aaron E .; Ma, Jian; Notredame, Cedric; Brudno, Michael; Dubchak, Inna; Haussler, David; Paten, Benedict (diciembre de 2014). "Alignathon: una evaluación competitiva de métodos de alineación del genoma completo" . Investigación del genoma . 24 (12): 2077–2089. doi : 10.1101 / gr.174920.114 . PMC 4248324 . PMID 25273068 .
- ^ Rouli, L .; Merhej, V .; Fournier, P.-E .; Raoult, D. (septiembre de 2015). "El pangenoma bacteriano como nueva herramienta para el análisis de bacterias patógenas" . Nuevos microbios y nuevas infecciones . 7 : 72–85. doi : 10.1016 / j.nmni.2015.06.005 . PMC 4552756 . PMID 26442149 .
- ^ Méric, Guillaume; Yahara, Koji; Mageiros, Leonardos; Pascoe, Ben; Maiden, Martin CJ; Jolley, Keith A .; Sheppard, Samuel K .; Bereswill, Stefan (27 de marzo de 2014). "Un enfoque pangenoma de referencia a la genómica bacteriana comparativa: identificación de nuevos marcadores epidemiológicos en Campylobacter patógeno" . PLOS ONE . 9 (3): e92798. Código bibliográfico : 2014PLoSO ... 992798M . doi : 10.1371 / journal.pone.0092798 . PMC 3968026 . PMID 24676150 .
- ^ Cooper, GM (17 de junio de 2005). "Distribución e intensidad de la restricción en la secuencia genómica de mamíferos" . Investigación del genoma . 15 (7): 901–913. doi : 10.1101 / gr.3577405 . PMC 1172034 . PMID 15965027 .
- ^ "Laboratorio de Sidow - GERP" .
- ^ Nawar Malhis; Steven JM Jones; Jörg Gsponer (2019). "Medidas mejoradas para la conservación evolutiva que aprovechan las distancias taxonómicas" . Comunicaciones de la naturaleza . 10 (1): 1556. Bibcode : 2019NatCo..10.1556M . doi : 10.1038 / s41467-019-09583-2 . PMC 6450959 . PMID 30952844 .
- ^ Nawar Malhis; Matthew Jacobson; Steven JM Jones; Jörg Gsponer (2020). "LISTA-S2: clasificación basada en taxonomía de mutaciones deletéreas sin sentido entre especies" . Investigación de ácidos nucleicos . 48 (W1): W154 – W161. doi : 10.1093 / nar / gkaa288 . PMC 7319545 . PMID 32352516 .
- ^ Chang KT, Guo J, di Ronza A, Sardiello M (enero de 2018). "Aminodo: identificación de limitaciones evolutivas en el proteoma humano" . Sci. Rep . 8 (1): 1357. Bibcode : 2018NatSR ... 8.1357C . doi : 10.1038 / s41598-018-19744-w . PMC 5778061 . PMID 29358731 .
- ^ Pollard, KS; Hubisz, MJ; Rosenbloom, KR; Siepel, A. (26 de octubre de 2009). "Detección de tasas de sustitución no neutra en filogenias de mamíferos" . Investigación del genoma . 20 (1): 110-121. doi : 10.1101 / gr.097857.109 . PMC 2798823 . PMID 19858363 .
- ^ "PHAST: Inicio" .
- ^ Fan, Xiaodan; Zhu, Jun; Schadt, Eric E; Liu, junio S (2007). "Poder estadístico de phylo-HMM para la detección de elementos conservados evolutivamente" . BMC Bioinformática . 8 (1): 374. doi : 10.1186 / 1471-2105-8-374 . PMC 2194792 . PMID 17919331 .
- ^ Bejerano, G. (28 de mayo de 2004). "Elementos ultraconservados en el genoma humano". Ciencia . 304 (5675): 1321-1325. Código Bibliográfico : 2004Sci ... 304.1321B . CiteSeerX 10.1.1.380.9305 . doi : 10.1126 / science.1098119 . PMID 15131266 . S2CID 2790337 .
- ^ Siepel, A. (1 de agosto de 2005). "Elementos conservados evolutivamente en genomas de vertebrados, insectos, gusanos y levaduras" . Investigación del genoma . 15 (8): 1034-1050. doi : 10.1101 / gr.3715005 . PMC 1182216 . PMID 16024819 .
- ^ Harmston, N .; Baresic, A .; Lenhard, B. (11 de noviembre de 2013). "El misterio de la conservación extrema no codificante" . Transacciones filosóficas de la Royal Society B: Ciencias biológicas . 368 (1632): 20130021. doi : 10.1098 / rstb.2013.0021 . PMC 3826495 . PMID 24218634 .
- ^ Faircloth, BC; McCormack, JE; Crawford, NG; Harvey, MG; Brumfield, RT; Glenn, TC (9 de enero de 2012). "Elementos ultraconservados anclan miles de marcadores genéticos que abarcan múltiples escalas de tiempo evolutivas" . Biología sistemática . 61 (5): 717–726. doi : 10.1093 / sysbio / sys004 . PMID 22232343 .
- ^ Faircloth, Brant C .; Branstetter, Michael G .; White, Noor D .; Brady, Seán G. (mayo de 2015). "El enriquecimiento objetivo de elementos ultraconservados de artrópodos proporciona una perspectiva genómica sobre las relaciones entre himenópteros" . Recursos de ecología molecular . 15 (3): 489–501. doi : 10.1111 / 1755-0998.12328 . PMC 4407909 . PMID 25207863 .
- ^ Reneker, J .; Lyons, E .; Conant, GC; Pires, JC; Freeling, M .; Shyu, C.-R .; Korkin, D. (10 de abril de 2012). "Elementos multiespecies idénticos largos en genomas de plantas y animales" . Actas de la Academia Nacional de Ciencias . 109 (19): E1183 – E1191. doi : 10.1073 / pnas.1121356109 . PMC 3358895 . PMID 22496592 .
- ^ Isenbarger, Thomas A .; Carr, Christopher E .; Johnson, Sarah Stewart; Finney, Michael; Church, George M .; Gilbert, Walter; Zuber, Maria T .; Ruvkun, Gary (14 de octubre de 2008). "Los segmentos del genoma más conservados para la detección de vida en la Tierra y otros planetas". Orígenes de la vida y evolución de las biosferas . 38 (6): 517–533. Código bibliográfico : 2008OLEB ... 38..517I . doi : 10.1007 / s11084-008-9148-z . PMID 18853276 . S2CID 15707806 .
- ^ Harris, JK (12 de febrero de 2003). "El núcleo genético del antepasado universal" . Investigación del genoma . 13 (3): 407–412. doi : 10.1101 / gr.652803 . PMC 430263 . PMID 12618371 .
- ^ Ban, Nenad; Beckmann, Roland; Cate, Jamie HD; Dinman, Jonathan D; Dragón, François; Ellis, Steven R; Lafontaine, Denis LJ; Lindahl, Lasse; Liljas, Anders; Lipton, Jeffrey M; McAlear, Michael A; Moore, Peter B; Noller, Harry F; Ortega, Joaquín; Panse, Vikram Govind; Ramakrishnan, V; Spahn, Christian MT; Steitz, Thomas A; Tchorzewski, Marek; Tollervey, David; Warren, Alan J; Williamson, James R; Wilson, Daniel; Yonath, Ada; Yusupov, Marat (febrero de 2014). "Un nuevo sistema para nombrar proteínas ribosomales" . Opinión actual en biología estructural . 24 : 165-169. doi : 10.1016 / j.sbi.2014.01.002 . PMC 4358319 . PMID 24524803 .
- ^ Gadagkar, Sudhindra R .; Rosenberg, Michael S .; Kumar, Sudhir (15 de enero de 2005). "Inferir filogenias de especies de múltiples genes: árbol de secuencia concatenado versus árbol de genes de consenso". Revista de Zoología Experimental Parte B: Evolución Molecular y del Desarrollo . 304B (1): 64–74. doi : 10.1002 / jez.b.21026 . PMID 15593277 .
- ^ Ludwig, W; Schleifer, KH (octubre de 1994). "Filogenia bacteriana basada en análisis de secuencia de ARNr 16S y 23S" . Reseñas de Microbiología FEMS . 15 (2–3): 155–73. doi : 10.1111 / j.1574-6976.1994.tb00132.x . PMID 7524576 .
- ^ Abrazo, Laura A .; Baker, Brett J .; Anantharaman, Karthik; Brown, Christopher T .; Probst, Alexander J .; Castelle, Cindy J .; Butterfield, Cristina N .; Hernsdorf, Alex W .; Amano, Yuki; Ise, Kotaro; Suzuki, Yohey; Dudek, Natasha; Relman, David A .; Finstad, Kari M .; Amundson, Ronald; Thomas, Brian C .; Banfield, Jillian F. (11 de abril de 2016). "Una nueva visión del árbol de la vida" . Microbiología de la naturaleza . 1 (5): 16048. doi : 10.1038 / nmicrobiol.2016.48 . PMID 27572647 .
- ^ Zhang, Liqing; Li, Wen-Hsiung (febrero de 2004). "Los genes domésticos de mamíferos evolucionan más lentamente que los genes específicos de tejido" . Biología Molecular y Evolución . 21 (2): 236–239. doi : 10.1093 / molbev / msh010 . PMID 14595094 .
- ^ Clermont, O .; Bonacorsi, S .; Bingen, E. (1 de octubre de 2000). "Determinación rápida y sencilla del grupo filogenético de Escherichia coli" . Microbiología aplicada y ambiental . 66 (10): 4555–4558. doi : 10.1128 / AEM.66.10.4555-4558.2000 . PMC 92342 . PMID 11010916 .
- ^ Kullberg, Morgan; Nilsson, Maria A .; Arnason, Ulfur; Harley, Eric H .; Janke, Axel (agosto de 2006). "Genes de limpieza para el análisis filogenético de las relaciones euterias" . Biología Molecular y Evolución . 23 (8): 1493-1503. doi : 10.1093 / molbev / msl027 . PMID 16751257 .
- ^ Schoch, CL; Seifert, KA; Huhndorf, S .; Robert, V .; Spouge, JL; Levesque, CA; Chen, W .; Bolchacova, E .; Voigt, K .; Crous, PW; Miller, AN; Wingfield, MJ; Aime, MC; An, K.-D .; Bai, F.-Y .; Barreto, RW; Begerow, D .; Bergeron, M.-J .; Blackwell, M .; Boekhout, T .; Bogale, M .; Boonyuen, N .; Burgaz, AR; Buyck, B .; Cai, L .; Cai, Q .; Cardinali, G .; Chaverri, P .; Coppins, BJ; Crespo, A .; Cubas, P .; Cummings, C .; Damm, U .; de Beer, ZW; de Hoog, GS; Del-Prado, R .; Dentinger, B .; Dieguez-Uribeondo, J .; Divakar, PK; Douglas, B .; Dueñas, M .; Duong, TA; Eberhardt, U .; Edwards, JE; Elshahed, MS; Fliegerova, K .; Furtado, M .; García, MA; Ge, Z.-W .; Griffith, GW; Griffiths, K .; Groenewald, JZ; Groenewald, M .; Grube, M .; Gryzenhout, M .; Guo, L.-D .; Hagen, F .; Hambleton, S .; Hamelin, RC; Hansen, K .; Harrold, P .; Heller, G .; Herrera, C .; Hirayama, K .; Hirooka, Y .; Ho, H.-M .; Hoffmann, K .; Hofstetter, V .; Hognabba, F .; Hollingsworth, PM; Hong, S.-B .; Hosaka, K .; Houbraken, J .; Hughes, K .; Huhtinen, S .; Hyde, KD; James, T .; Johnson, EM; Johnson, JE; Johnston, PR; Jones, EBG; Kelly, LJ; Kirk, PM; Knapp, DG; Koljalg, U .; Kovacs, GM; Kurtzman, CP; Landvik, S .; Leavitt, SD; Liggenstoffer, AS; Liimatainen, K .; Lombard, L .; Luangsa-ard, JJ; Lumbsch, HT; Maganti, H .; Maharachchikumbura, SSN; Martin, diputado; Mayo, TW; McTaggart, AR; Methven, AS; Meyer, W .; Moncalvo, J.-M .; Mongkolsamrit, S .; Nagy, LG; Nilsson, RH; Niskanen, T .; Nyilasi, I .; Okada, G .; Okane, I .; Olariaga, I .; Otte, J .; Papp, T .; Park, D .; Petkovits, T .; Pino-Bodas, R .; Quaedvlieg, W .; Raja, HA; Redecker, D .; Rintoul, TL; Ruibal, C .; Sarmiento-Ramirez, JM; Schmitt, I .; Schussler, A .; Shearer, C .; Sotome, K .; Stefani, FOP; Stenroos, S .; Stielow, B .; Stockinger, H .; Suetrong, S .; Suh, S.-O .; Sung, G.-H .; Suzuki, M .; Tanaka, K .; Tedersoo, L .; Telleria, MT; Tretter, E .; Untereiner, WA; Urbina, H .; Vagvolgyi, C .; Vialle, A .; Vu, TD; Walther, G .; Wang, Q.-M .; Wang, Y .; Weir, BS; Weiss, M .; Blanco, MM; Xu, J .; Yahr, R .; Yang, ZL; Yurkov, A .; Zamora, J.-C .; Zhang, N .; Zhuang, W.-Y .; Schindel, D. (27 de marzo de 2012). "Región del espaciador transcrito interno ribosómico nuclear (ITS) como un marcador de código de barras de ADN universal para hongos" . Actas de la Academia Nacional de Ciencias . 109 (16): 6241–6246. doi : 10.1073 / pnas.1117018109 . PMC 3341068 . PMID 22454494 .
- ^ Hombre, SM; Kaakoush, NO; Octavia, S .; Mitchell, H. (26 de marzo de 2010). "La región espaciadora transcrita interna, una nueva herramienta para su uso en la diferenciación de especies y delimitación de relaciones sistemáticas dentro del género Campylobacter" . Microbiología aplicada y ambiental . 76 (10): 3071-3081. doi : 10.1128 / AEM.02551-09 . PMC 2869123 . PMID 20348308 .
- ^ Ranjard, L .; Poly, F .; Lata, J.-C .; Mougel, C .; Thioulouse, J .; Nazaret, S. (1 de octubre de 2001). "Caracterización de comunidades de suelo bacterianas y fúngicas por huellas dactilares de análisis de espaciador intergénico ribosómico automatizado: variabilidad biológica y metodológica" . Microbiología aplicada y ambiental . 67 (10): 4479–4487. doi : 10.1128 / AEM.67.10.4479-4487.2001 . PMC 93193 . PMID 11571146 .
- ^ Bidé, Philippe; Barbut, Frédéric; Lalande, Valérie; Burghoffer, Béatrice; Petit, Jean-Claude (junio de 1999). "Desarrollo de un nuevo método de PCR-ribotipado basado en secuenciación de genes de ARN ribosómico" . Cartas de Microbiología FEMS . 175 (2): 261–266. doi : 10.1111 / j.1574-6968.1999.tb13629.x . PMID 10386377 .
- ^ Ala, Ugo; Piro, Rosario Michael; Grassi, Elena; Damasco, cristiano; Silengo, Lorenzo; Oti, Martin; Provero, Paolo; Di Cunto, Ferdinando; Tucker-Kellogg, Greg (28 de marzo de 2008). "Predicción de genes de enfermedades humanas mediante análisis de coexpresión conservada entre humanos y ratones" . PLOS Biología Computacional . 4 (3): e1000043. Código Bibliográfico : 2008PLSCB ... 4E0043A . doi : 10.1371 / journal.pcbi.1000043 . PMC 2268251 . PMID 18369433 .
- ^ Pandey, UB; Nichols, CD (17 de marzo de 2011). "Modelos de enfermedades humanas en Drosophila melanogaster y el papel de la mosca en el descubrimiento de fármacos terapéuticos" . Revisiones farmacológicas . 63 (2): 411–436. doi : 10.1124 / pr.110.003293 . PMC 3082451 . PMID 21415126 .
- ^ Huang, Hui; Invierno, Eitan E; Wang, Huajun; Weinstock, Keith G; Xing, Heming; Goodstadt, Leo; Stenson, Peter D; Cooper, David N; Smith, Douglas; Albà, M Mar; Ponting, Chris P; Fechtel, Kim (2004). "Conservación evolutiva y selección de ortólogos de genes de enfermedades humanas en los genomas de rata y ratón" . Biología del genoma . 5 (7): R47. doi : 10.1186 / gb-2004-5-7-r47 . PMC 463309 . PMID 15239832 .
- ^ Ge, Dongliang; Fellay, Jacques; Thompson, Alexander J .; Simon, Jason S .; Shianna, Kevin V .; Urban, Thomas J .; Heinzen, Erin L .; Qiu, ping; Bertelsen, Arthur H .; Muir, Andrew J .; Sulkowski, Mark; McHutchison, John G .; Goldstein, David B. (16 de agosto de 2009). "La variación genética en IL28B predice el aclaramiento viral inducido por el tratamiento de la hepatitis C". Naturaleza . 461 (7262): 399–401. Código Bibliográfico : 2009Natur.461..399G . doi : 10.1038 / nature08309 . PMID 19684573 . S2CID 1707096 .
- ^ Bertram, L. (2009). "Estudios de asociación de todo el genoma en la enfermedad de Alzheimer" . Genética molecular humana . 18 (R2): R137 – R145. doi : 10.1093 / hmg / ddp406 . PMC 2758713 . PMID 19808789 .
- ^ Kellis, Manolis; Patterson, Nick; Endrizzi, Matthew; Birren, Bruce; Lander, Eric S. (15 de mayo de 2003). "Secuenciación y comparación de especies de levadura para identificar genes y elementos reguladores". Naturaleza . 423 (6937): 241-254. Código bibliográfico : 2003Natur.423..241K . doi : 10.1038 / nature01644 . PMID 12748633 . S2CID 1530261 .
- ^ Marchler-Bauer, A .; Lu, S .; Anderson, JB; Chitsaz, F .; Derbyshire, MK; DeWeese-Scott, C .; Fong, JH; Geer, LY; Geer, RC; Gonzales, NR; Gwadz, M .; Hurwitz, DI; Jackson, JD; Ke, Z .; Lanczycki, CJ; Lu, F .; Marchler, GH; Mullokandov, M .; Omelchenko, MV; Robertson, CL; Song, JS; Thanki, N .; Yamashita, RA; Zhang, D .; Zhang, N .; Zheng, C .; Bryant, SH (24 de noviembre de 2010). "CDD: una base de datos de dominio conservado para la anotación funcional de proteínas" . Investigación de ácidos nucleicos . 39 (Base de datos): D225 – D229. doi : 10.1093 / nar / gkq1189 . PMC 3013737 . PMID 21109532 .