De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La genómica es un campo interdisciplinario de la biología que se centra en la estructura, función, evolución, mapeo y edición de genomas . Un genoma es el conjunto completo de ADN de un organismo , incluidos todos sus genes. A diferencia de la genética , que se refiere al estudio de genes individuales y sus roles en la herencia, la genómica apunta a la caracterización y cuantificación colectiva de todos los genes de un organismo, sus interrelaciones e influencia en el organismo. [1] Los genes pueden dirigir la producción de proteínas.con la ayuda de enzimas y moléculas mensajeras. A su vez, las proteínas forman estructuras corporales, como órganos y tejidos, y controlan las reacciones químicas y transportan señales entre las células. La genómica también implica la secuenciación y análisis de genomas mediante el uso de secuenciación de ADN de alto rendimiento y bioinformática para ensamblar y analizar la función y estructura de genomas completos. [2] [3] Los avances en genómica han desencadenado una revolución en la investigación basada en descubrimientos y en la biología de sistemas para facilitar la comprensión incluso de los sistemas biológicos más complejos, como el cerebro. [4]

El campo también incluye estudios de fenómenos intragenómicos (dentro del genoma) como epistasis (efecto de un gen sobre otro), pleiotropía (un gen que afecta a más de un rasgo), heterosis (vigor híbrido) y otras interacciones entre loci y alelos dentro el genoma. [5]

Historia [ editar ]

Etimología [ editar ]

Del griego ΓΕΝ [6] gen , "gen" (gamma, épsilon, nu, épsilon) que significa "convertirse, crear, crear, nacer" y variantes posteriores: genealogía, génesis, genética, genic, genómero, genotipo, género, etc. . Mientras que la palabra genoma (del alemán Genom , atribuido a Hans Winkler ) estaba en uso en inglés ya en 1926, [7] el término genómica fue acuñado por Tom Roderick, un genetista del Laboratorio Jackson ( Bar Harbor, Maine ). , bebiendo cerveza en una reunión celebrada en Maryland sobre el mapeo del genoma humano en 1986. [8]

Esfuerzos de secuenciación temprana [ editar ]

Tras la confirmación de Rosalind Franklin de la estructura helicoidal del ADN, la publicación de James D. Watson y Francis Crick de la estructura del ADN en 1953 y la publicación de Fred Sanger de la secuencia de aminoácidos de la insulina en 1955, la secuenciación de ácidos nucleicos se convirtió en un objetivo importante de los primeros biólogos moleculares . [9] En 1964, Robert W. Holley y sus colegas publicaron la primera secuencia de ácido nucleico jamás determinada, la secuencia de ribonucleótidos del ARN de transferencia de alanina . [10] [11] Ampliando este trabajo, Marshall Nirenbergy Philip Leder revelaron la naturaleza triplete del código genético y pudieron determinar las secuencias de 54 de 64 codones en sus experimentos. [12] En 1972, Walter Fiers y su equipo del Laboratorio de Biología Molecular de la Universidad de Gante ( Gante , Bélgica ) fueron los primeros en determinar la secuencia de un gen: el gen de la proteína de la cubierta del bacteriófago MS2 . [13] El grupo de Fiers amplió su trabajo con la proteína de la cubierta MS2, determinando la secuencia de nucleótidos completa del bacteriófago MS2-RNA (cuyo genoma codifica solo cuatro genes en 3569 pares de bases[bp]) y Simian virus 40 en 1976 y 1978, respectivamente. [14] [15]

Se desarrolló la tecnología de secuenciación de ADN [ editar ]

Walter Gilbert
Frederick Sanger y Walter Gilbert compartieron la mitad del Premio Nobel de Química de 1980 por desarrollar de forma independiente métodos para la secuenciación del ADN.

Además de su trabajo fundamental sobre la secuencia de aminoácidos de la insulina, Frederick Sanger y sus colegas desempeñaron un papel clave en el desarrollo de técnicas de secuenciación de ADN que permitieron el establecimiento de proyectos integrales de secuenciación del genoma. [5] En 1975, él y Alan Coulson publicaron un procedimiento de secuenciación utilizando ADN polimerasa con nucleótidos radiomarcados que llamó la técnica Plus y Minus . [16] [17] Esto involucró dos métodos estrechamente relacionados que generaron oligonucleótidos cortos con extremos 3 'definidos. Estos podrían fraccionarse mediante electroforesis en poliacrilamida.gel (llamado electroforesis en gel de poliacrilamida) y se visualiza mediante autorradiografía. El procedimiento podía secuenciar hasta 80 nucleótidos de una vez y supuso una gran mejora, pero seguía siendo muy laborioso. Sin embargo, en 1977 su grupo pudo secuenciar la mayoría de los 5.386 nucleótidos del bacteriófago monocatenario φX174 , completando el primer genoma basado en ADN completamente secuenciado. [18] El perfeccionamiento del método Plus y Minus dio como resultado la terminación de la cadena, o método Sanger (ver más abajo ), que formó la base de las técnicas de secuenciación de ADN, mapeo del genoma, almacenamiento de datos y análisis bioinformático más ampliamente utilizado en el siguiente cuarto de siglo de investigación. [19][20] En el mismo año, Walter Gilbert y Allan Maxam de la Universidad de Harvard desarrollaron de forma independiente elmétodo Maxam-Gilbert (también conocido como el método químico ) de secuenciación de ADN, que implica la escisión preferencial de ADN en bases conocidas, un método menos eficiente. [21] [22] Por su trabajo pionero en la secuenciación de ácidos nucleicos, Gilbert y Sanger compartieron la mitad del Premio Nobel de Química de1980con Paul Berg ( ADN recombinante ).

Genomas completos [ editar ]

El advenimiento de estas tecnologías dio como resultado una rápida intensificación del alcance y la velocidad de finalización de los proyectos de secuenciación del genoma . La primera secuencia completa del genoma de un orgánulo eucariota , la mitocondria humana (16.568 pb, aproximadamente 16.6 kb [kilobase]), se informó en 1981, [23] y los primeros genomas de cloroplasto siguieron en 1986. [24] [25] En 1992. , se secuenció el primer cromosoma eucariota , el cromosoma III de la levadura de cerveza Saccharomyces cerevisiae (315 kb). [26] El primer organismo de vida libre en ser secuenciado fue el de Haemophilus influenzae.(1,8 Mb [megabase]) en 1995. [27] Al año siguiente, un consorcio de investigadores de laboratorios de América del Norte , Europa y Japón anunció la finalización de la primera secuencia completa del genoma de un eucariota, S. cerevisiae (12,1 Mb) , y desde entonces los genomas se han seguido secuenciando a un ritmo de crecimiento exponencial. [28] En octubre de 2011 , las secuencias completas están disponibles para: 2.719 virus , 1.115 arqueas y bacterias y 36 eucariotas , de los cuales aproximadamente la mitad son hongos . [29] [30]

El número de proyectos de genoma ha aumentado a medida que las mejoras tecnológicas continúan reduciendo el costo de secuenciación. (A) Crecimiento exponencial de las bases de datos de secuencias del genoma desde 1995. (B) El costo en dólares estadounidenses (USD) para secuenciar un millón de bases. (C) El costo en USD para secuenciar un genoma de 3000 Mb (tamaño humano) en una escala de transformación logarítmica.

La mayoría de los microorganismos cuyos genomas se han secuenciado por completo son patógenos problemáticos , como Haemophilus influenzae , que ha provocado un sesgo pronunciado en su distribución filogenética en comparación con la amplitud de la diversidad microbiana. [31] [32] De las otras especies secuenciadas, la mayoría fueron elegidas porque eran organismos modelo bien estudiados o prometían convertirse en buenos modelos. La levadura ( Saccharomyces cerevisiae ) ha sido durante mucho tiempo un organismo modelo importante para la célula eucariota , mientras que la mosca de la fruta Drosophila melanogaster ha sido una herramienta muy importante (especialmente en la genética premolecular temprana ). El gusanoCaenorhabditis elegans es un modelo simple de uso frecuente para organismos multicelulares . El pez cebra Brachydanio rerio se utiliza para muchos estudios de desarrollo a nivel molecular, y la planta Arabidopsis thaliana es un organismo modelo para las plantas con flores. El pez globo japonés ( Takifugu rubripes ) y el pez globo verde manchado ( Tetraodon nigroviridis ) son interesantes debido a sus genomas pequeños y compactos, que contienen muy poco ADN no codificante en comparación con la mayoría de las especies. [33] [34] El perro mamífero ( Canis familiaris ), [35]La rata marrón ( Rattus norvegicus ), el ratón ( Mus musculus ) y el chimpancé ( Pan troglodytes ) son animales modelo importantes en la investigación médica. [22]

El Proyecto Genoma Humano completó un borrador del genoma humano a principios de 2001, lo que generó mucha fanfarria. [36] Este proyecto, completado en 2003, secuenció el genoma completo para una persona específica, y en 2007 esta secuencia se declaró "terminada" (menos de un error en 20.000 bases y todos los cromosomas ensamblados). [36] En los años transcurridos desde entonces, se han secuenciado los genomas de muchos otros individuos, en parte bajo los auspicios del Proyecto 1000 Genomas , que anunció la secuenciación de 1.092 genomas en octubre de 2012. [37]La finalización de este proyecto fue posible gracias al desarrollo de tecnologías de secuenciación dramáticamente más eficientes y requirió el compromiso de importantes recursos bioinformáticos de una gran colaboración internacional. [38] El análisis continuo de datos genómicos humanos tiene profundas repercusiones políticas y sociales para las sociedades humanas. [39]

La revolución "ómica" [ editar ]

Esquema general que muestra las relaciones del genoma , transcriptoma , proteoma y metaboloma ( lipidoma ).

El neologismo ómico en idioma inglés se refiere informalmente a un campo de estudio en biología que termina en -ómica , como la genómica, la proteómica o la metabolómica . El sufijo relacionado -oma se utiliza para abordar los objetos de estudio de dichos campos, como el genoma , el proteoma o el metaboloma respectivamente. El sufijo -ome, tal como se utiliza en biología molecular, se refiere a una totalidad de algún tipo; de manera similar, la ómica ha llegado a referirse generalmente al estudio de conjuntos de datos biológicos grandes y completos. Si bien el crecimiento en el uso del término ha llevado a algunos científicos (Jonathan Eisen , entre otros [40] ) para afirmar que se ha sobrevendido [41] , refleja el cambio de orientación hacia el análisis cuantitativo del surtido completo o casi completo de todos los componentes de un sistema. [42] En el estudio de las simbiosis , por ejemplo, los investigadores que antes se limitaban al estudio de un único producto genético ahora pueden comparar simultáneamente el complemento total de varios tipos de moléculas biológicas. [43] [44]

Análisis del genoma [ editar ]

Una vez que se ha seleccionado un organismo, los proyectos de genoma involucran tres componentes: la secuenciación del ADN, el ensamblaje de esa secuencia para crear una representación del cromosoma original y la anotación y análisis de esa representación. [5]

Descripción general de un proyecto de genoma. Primero, se debe seleccionar el genoma, lo que involucra varios factores, incluidos el costo y la relevancia. En segundo lugar, la secuencia se genera y ensambla en un centro de secuenciación determinado (como BGI o DOE JGI ). En tercer lugar, la secuencia del genoma está anotada en varios niveles: ADN, proteínas, vías genéticas o comparativamente.

Secuenciación [ editar ]

Históricamente, la secuenciación se realizaba en centros de secuenciación , instalaciones centralizadas (que van desde grandes instituciones independientes como el Joint Genome Institute, que secuencia decenas de terabases al año, hasta instalaciones centrales de biología molecular locales) que contienen laboratorios de investigación con la costosa instrumentación y el apoyo técnico necesarios. Sin embargo, a medida que la tecnología de secuenciación continúa mejorando, una nueva generación de secuenciadores de sobremesa de respuesta rápida y eficaz ha llegado al alcance del laboratorio académico promedio. [45] [46] En general, los enfoques de secuenciación del genoma se dividen en dos categorías amplias, secuenciación de escopeta y secuenciación de alto rendimiento (o de próxima generación ).[5]

Secuencia de escopeta [ editar ]

Un analizador genético ABI PRISM 3100. Estos secuenciadores capilares automatizaron los primeros esfuerzos de secuenciación del genoma a gran escala.

La secuenciación de escopeta es un método de secuenciación diseñado para el análisis de secuencias de ADN de más de 1000 pares de bases, hasta e incluyendo cromosomas completos. [47] Se nombra por analogía con el patrón de disparo cuasialeatorio de rápida expansión de una escopeta . Dado que la secuenciación de electroforesis en gel solo se puede usar para secuencias bastante cortas (100 a 1000 pares de bases), las secuencias de ADN más largas deben dividirse en pequeños segmentos aleatorios que luego se secuencian para obtener lecturas . Se obtienen múltiples lecturas superpuestas para el ADN diana realizando varias rondas de esta fragmentación y secuenciación. Los programas de computadora luego usan los extremos superpuestos de diferentes lecturas para ensamblarlos en una secuencia continua. [47] [48] La secuenciación por escopeta es un proceso de muestreo aleatorio que requiere un muestreo excesivo para garantizar que un nucleótido determinado esté representado en la secuencia reconstruida; el número medio de lecturas por las que se sobremuestrea un genoma se denomina cobertura . [49]

Durante gran parte de su historia, la tecnología subyacente a la secuenciación por escopeta fue el método clásico de terminación de cadena o ' método Sanger ', que se basa en la incorporación selectiva de didesoxinucleótidos de terminación de cadena por la ADN polimerasa durante la replicación del ADN in vitro . [18] [50] Recientemente, la secuenciación rápida ha sido suplantada por métodos de secuenciación de alto rendimiento , especialmente para análisis genómicos automatizados a gran escala . Sin embargo, el método Sanger sigue siendo de amplio uso, principalmente para proyectos de menor escala y para obtener lecturas de secuencias de ADN contiguas especialmente largas (> 500 nucleótidos). [51]Los métodos de terminación de cadena requieren una plantilla de ADN monocatenario, un cebador de ADN , una ADN polimerasa , desoxinucleosidetrifosfatos normales (dNTP) y nucleótidos modificados (didesoxiNTP) que terminan la elongación de la cadena de ADN. Estos nucleótidos que terminan la cadena carecen de un grupo 3'- OH requerido para la formación de un enlace fosfodiéster entre dos nucleótidos, lo que hace que la ADN polimerasa cese la extensión del ADN cuando se incorpora un ddNTP. Los ddNTP se pueden marcar de forma radiactiva o fluorescente para su detección en secuenciadores de ADN . [5] Normalmente, estas máquinas pueden secuenciar hasta 96 muestras de ADN en un solo lote (ejecución) en hasta 48 ejecuciones al día. [52]

Secuenciación de alto rendimiento [ editar ]

La alta demanda de secuenciación de bajo costo ha impulsado el desarrollo de tecnologías de secuenciación de alto rendimiento que paralelizan el proceso de secuenciación, produciendo miles o millones de secuencias a la vez. [53] [54] La secuenciación de alto rendimiento tiene como objetivo reducir el costo de la secuenciación del ADN más allá de lo que es posible con los métodos estándar de terminación por colorante. En la secuenciación de rendimiento ultra alto, se pueden ejecutar en paralelo hasta 500.000 operaciones de secuenciación por síntesis. [55] [56]

Sistema Illumina Genome Analyzer II. Las tecnologías de Illumina han establecido el estándar para la secuenciación masiva en paralelo de alto rendimiento. [45]

El método de secuenciación de colorantes de Illumina se basa en terminadores de colorantes reversibles y fue desarrollado en 1996 en el Instituto de Investigación Biomédica de Ginebra, por Pascal Mayer y Laurent Farinelli. [57] En este método, las moléculas de ADN y los cebadores se unen primero en un portaobjetos y se amplifican con polimerasa.de modo que se forman colonias clonales locales, inicialmente denominadas "colonias de ADN". Para determinar la secuencia, se añaden cuatro tipos de bases terminadoras reversibles (bases RT) y se eliminan por lavado los nucleótidos no incorporados. A diferencia de la pirosecuenciación, las cadenas de ADN se extienden un nucleótido a la vez y la adquisición de imágenes se puede realizar en un momento retrasado, lo que permite capturar conjuntos muy grandes de colonias de ADN mediante imágenes secuenciales tomadas con una sola cámara. El desacoplamiento de la reacción enzimática y la captura de imágenes permite un rendimiento óptimo y una capacidad de secuenciación teóricamente ilimitada; con una configuración óptima, el rendimiento final del instrumento depende únicamente de la tasa de conversión A / D de la cámara. La cámara toma imágenes de los etiquetados con fluorescencianucleótidos, luego el tinte junto con el bloqueador terminal 3 'se elimina químicamente del ADN, lo que permite el siguiente ciclo. [58]

Un enfoque alternativo, la secuenciación de semiconductores de iones , se basa en la química de replicación del ADN estándar. Esta tecnología mide la liberación de un ión de hidrógeno cada vez que se incorpora una base. Un micropocillo que contiene ADN molde se inunda con un solo nucleótido , si el nucleótido es complementario a la hebra molde, se incorporará y se liberará un ion hidrógeno. Esta versión activa un sensor de iones ISFET . Si un homopolímero está presente en la secuencia molde, se incorporarán múltiples nucleótidos en un solo ciclo de inundación, y la señal eléctrica detectada será proporcionalmente más alta. [59]

Montaje [ editar ]

Las lecturas superpuestas forman contigs; contigs y huecos de longitud conocida forman andamios.
Lecturas finales emparejadas de datos de secuenciación de próxima generación mapeados a un genoma de referencia.
Las lecturas de secuencias múltiples y fragmentadas deben ensamblarse sobre la base de sus áreas superpuestas.

El ensamblaje de secuencias se refiere a alinear y fusionar fragmentos de una secuencia de ADN mucho más larga para reconstruir la secuencia original. [5] Esto es necesario ya que la tecnología de secuenciación de ADN actual no puede leer genomas completos como una secuencia continua, sino que lee pequeñas piezas de entre 20 y 1000 bases, dependiendo de la tecnología utilizada. Las tecnologías de secuenciación de tercera generación como PacBio o Oxford Nanopore generan rutinariamente lecturas de secuenciación> 10 kb de longitud; sin embargo, tienen una alta tasa de error de aproximadamente el 15 por ciento. [60] [61] Por lo general, los fragmentos cortos, llamados lecturas, son el resultado de la secuenciación rápida del ADN genómico , otranscripciones de genes ( EST ). [5]

Enfoques de montaje [ editar ]

El ensamblaje se puede categorizar ampliamente en dos enfoques: ensamblaje de novo , para genomas que no son similares a ninguno de los secuenciados en el pasado, y ensamblaje comparativo, que utiliza la secuencia existente de un organismo estrechamente relacionado como referencia durante el ensamblaje. [49] En relación con el ensamblaje comparativo, el ensamblaje de novo es computacionalmente difícil ( NP-hard ), lo que lo hace menos favorable para las tecnologías NGS de lectura corta. Dentro de lo de novoParadigma de ensamblaje hay dos estrategias principales para el ensamblaje, estrategias de ruta euleriana y estrategias de consenso de diseño de superposición (OLC). En última instancia, las estrategias de OLC intentan crear una ruta hamiltoniana a través de un gráfico de superposición, lo que es un problema NP difícil. Las estrategias de ruta euleriana son computacionalmente más manejables porque intentan encontrar una ruta euleriana a través de un gráfico de deBruijn. [49]

Terminando [ editar ]

Los genomas terminados se definen por tener una única secuencia contigua sin ambigüedades que representen cada replicón . [62]

Anotación [ editar ]

El ensamblaje de la secuencia de ADN solo tiene poco valor sin un análisis adicional. [5] La anotación del genoma es el proceso de adjuntar información biológica a las secuencias y consta de tres pasos principales: [63]

  1. Identificar porciones del genoma que no codifican proteínas.
  2. identificar elementos en el genoma , un proceso llamado predicción genética , y
  3. adjuntando información biológica a estos elementos.

Las herramientas de anotación automática intentan realizar estos pasos en sí mismo , a diferencia de la anotación manual (también conocida como curación), que implica la experiencia humana y una posible verificación experimental. [64] Idealmente, estos enfoques coexisten y se complementan entre sí en la misma canalización de anotaciones (ver también más abajo ).

Tradicionalmente, el nivel básico de anotación es usar BLAST para encontrar similitudes y luego anotar genomas basados ​​en homólogos. [5] Más recientemente, se agrega información adicional a la plataforma de anotaciones. La información adicional permite a los anotadores manuales deconvolucionar las discrepancias entre genes que reciben la misma anotación. Algunas bases de datos utilizan información del contexto del genoma, puntuaciones de similitud, datos experimentales e integraciones de otros recursos para proporcionar anotaciones del genoma a través de su enfoque de subsistemas. Otras bases de datos (por ejemplo, Ensembl ) se basan tanto en fuentes de datos seleccionadas como en una variedad de herramientas de software en su canal de anotación automatizada del genoma. [65] Anotación estructuralConsiste en la identificación de elementos genómicos, principalmente ORF y su localización, o estructura genética. La anotación funcional consiste en adjuntar información biológica a elementos genómicos.

Secuenciación de canalizaciones y bases de datos [ editar ]

La necesidad de reproducibilidad y gestión eficiente de la gran cantidad de datos asociados con los proyectos del genoma significa que las tuberías computacionales tienen aplicaciones importantes en genómica. [66]

Áreas de investigación [ editar ]

Genómica funcional [ editar ]

La genómica funcional es un campo de la biología molecular que intenta hacer uso de la gran cantidad de datos producidos por proyectos genómicos (como proyectos de secuenciación del genoma ) para describir funciones e interacciones de genes (y proteínas ). La genómica funcional se centra en los aspectos dinámicos, como la transcripción , traducción y las interacciones proteína-proteína , en contraposición a los aspectos estáticos de la información genómica, como la secuencia de ADN.o estructuras. La genómica funcional intenta responder preguntas sobre la función del ADN a nivel de genes, transcripciones de ARN y productos proteicos. Una característica clave de los estudios de genómica funcional es su enfoque de genoma completo para estas preguntas, que generalmente implica métodos de alto rendimiento en lugar de un enfoque más tradicional "gen por gen".

Una rama importante de la genómica todavía se ocupa de secuenciar los genomas de varios organismos, pero el conocimiento de los genomas completos ha creado la posibilidad para el campo de la genómica funcional , que se ocupa principalmente de los patrones de expresión génica durante diversas condiciones. Las herramientas más importantes aquí son los microarrays y la bioinformática .

Genómica estructural [ editar ]

Un ejemplo de una estructura de proteína determinada por el Midwest Center for Structural Genomics.

La genómica estructural busca describir la estructura tridimensional de cada proteína codificada por un genoma dado . [67] [68] Este enfoque basado en el genoma permite un método de alto rendimiento para la determinación de la estructura mediante una combinación de enfoques experimentales y de modelado . La principal diferencia entre la genómica estructural y la predicción estructural tradicionales que la genómica estructural intenta determinar la estructura de cada proteína codificada por el genoma, en lugar de centrarse en una proteína en particular. Con las secuencias de genoma completo disponibles, la predicción de la estructura se puede hacer más rápidamente a través de una combinación de enfoques experimentales y de modelado, especialmente porque la disponibilidad de un gran número de genomas secuenciados y estructuras de proteínas previamente resueltas permiten a los científicos modelar la estructura de las proteínas en las estructuras de las proteínas previamente resueltas. homólogos. La genómica estructural implica adoptar una gran cantidad de enfoques para la determinación de la estructura, incluidos los métodos experimentales que utilizan secuencias genómicas o enfoques basados ​​en modelos basados ​​en la secuencia o la homología estructural.a una proteína de estructura conocida o basada en principios químicos y físicos para una proteína sin homología con ninguna estructura conocida. A diferencia de la biología estructural tradicional , la determinación de la estructura de una proteína a través de un esfuerzo de genómica estructural a menudo (pero no siempre) se produce antes de que se conozca la función de la proteína. Esto plantea nuevos desafíos en bioinformática estructural , es decir, determinar la función de las proteínas a partir de su estructura 3D . [69]

Epigenómica [ editar ]

La epigenómica es el estudio del conjunto completo de modificaciones epigenéticas del material genético de una célula, conocido como epigenoma . [70] Las modificaciones epigenéticas son modificaciones reversibles en el ADN o las histonas de una célula que afectan la expresión génica sin alterar la secuencia del ADN (Russell 2010 p. 475). Dos de las modificaciones epigenéticas más caracterizadas son la metilación del ADN y la modificación de histonas . Las modificaciones epigenéticas juegan un papel importante en la expresión y regulación génica, y están implicadas en numerosos procesos celulares como la diferenciación / desarrollo y la tumorigénesis . [70] El estudio de la epigenética a nivel mundial ha sido posible sólo recientemente gracias a la adaptación de ensayos genómicos de alto rendimiento. [71]

Metagenómica [ editar ]

La secuenciación ambiental de escopeta (ESS) es una técnica clave en metagenómica. (A) Muestreo del hábitat; (B) filtrar partículas, típicamente por tamaño; (C) Lisis y extracción de ADN; (D) clonación y construcción de bibliotecas; (E) secuenciar los clones; (F) secuencia del montaje en contigs y andamios.

La metagenómica es el estudio de los metagenomas , material genético recuperado directamente de muestras ambientales . El campo amplio también puede denominarse genómica ambiental, ecogenómica o genómica comunitaria. Mientras tradicional microbiología y microbiana secuenciación del genoma dependen cultivadas clonales culturas , gen temprano del medio ambiente de secuenciación clonado genes específicos (a menudo el 16S rRNA genes) para producir un perfil de la diversidad en una muestra natural. Ese trabajo reveló que la gran mayoría de la biodiversidad microbiana se había perdido por los cultivosmétodos. [72] Estudios recientes utilizan secuenciación de Sanger "escopeta" o pirosecuenciación masivamente paralela para obtener muestras en gran parte no sesgadas de todos los genes de todos los miembros de las comunidades muestreadas. [73] Debido a su poder para revelar la diversidad previamente oculta de la vida microscópica, la metagenómica ofrece una lente poderosa para ver el mundo microbiano que tiene el potencial de revolucionar la comprensión de todo el mundo viviente. [74] [75]

Sistemas modelo [ editar ]

Virus y bacteriófagos [ editar ]

Los bacteriófagos han jugado y siguen jugando un papel clave en la genética bacteriana y la biología molecular . Históricamente, se utilizaron para definir la estructura y la regulación de los genes. Además, el primer genoma en ser secuenciado fue un bacteriófago . Sin embargo, la investigación sobre bacteriófagos no lideró la revolución de la genómica, que está claramente dominada por la genómica bacteriana. Solo muy recientemente se ha vuelto prominente el estudio de los genomas de bacteriófagos, lo que permite a los investigadores comprender los mecanismos subyacentes a los fagos.evolución. Las secuencias del genoma de bacteriófagos pueden obtenerse mediante secuenciación directa de bacteriófagos aislados, pero también pueden derivarse como parte de genomas microbianos. Análisis de los genomas bacterianos ha demostrado que una cantidad sustancial de ADN microbiano consiste en prophage secuencias y prophage-elementos similares. [76] Una extracción de base de datos detallada de estas secuencias ofrece información sobre el papel de los profagos en la configuración del genoma bacteriano: En general, este método verificó muchos grupos de bacteriófagos conocidos, lo que lo convierte en una herramienta útil para predecir las relaciones de los profagos de los genomas bacterianos. [77] [78]

Cianobacterias [ editar ]

En la actualidad, hay 24 cianobacterias para las que se dispone de una secuencia del genoma total. 15 de estas cianobacterias provienen del medio marino. Se trata de seis cepas de Prochlorococcus , siete cepas marinas de Synechococcus , Trichodesmium erythraeum IMS101 y Crocosphaera watsonii WH8501 . Varios estudios han demostrado cómo estas secuencias podrían utilizarse con mucho éxito para inferir importantes características ecológicas y fisiológicas de las cianobacterias marinas. Sin embargo, hay muchos más proyectos de genoma en curso, entre ellos hay más aislados de Prochlorococcus y Synechococcus marino , Acaryochloris.y Prochloron , las cianobacterias filamentosas fijadoras de N2 Nodularia spumigena , Lyngbya aestuarii y Lyngbya majuscula , así como bacteriófagos que infectan las cianobacerias marinas. Por lo tanto, el creciente cuerpo de información del genoma también se puede aprovechar de una manera más general para abordar problemas globales mediante la aplicación de un enfoque comparativo. Algunos ejemplos nuevos y emocionantes de progreso en este campo son la identificación de genes para los ARN reguladores, la comprensión del origen evolutivo de la fotosíntesis o la estimación de la contribución de la transferencia horizontal de genes a los genomas que se han analizado. [79]

Aplicaciones de la genómica [ editar ]

La genómica ha proporcionado aplicaciones en muchos campos, incluida la medicina , la biotecnología , la antropología y otras ciencias sociales . [39]

Medicina genómica [ editar ]

Las tecnologías genómicas de próxima generación permiten a los médicos y a los investigadores biomédicos aumentar drásticamente la cantidad de datos genómicos recopilados en grandes poblaciones de estudio. [80] Cuando se combina con nuevos enfoques informáticos que integran muchos tipos de datos con datos genómicos en la investigación de enfermedades, esto permite a los investigadores comprender mejor las bases genéticas de la respuesta a los medicamentos y la enfermedad. [81] [82] Los primeros esfuerzos para aplicar el genoma a la medicina incluyeron los de un equipo de Stanford dirigido por Euan Ashley, que desarrolló las primeras herramientas para la interpretación médica de un genoma humano. [83] [84] [85] Por ejemplo, All of UsEl programa de investigación tiene como objetivo recopilar datos de la secuencia del genoma de 1 millón de participantes para convertirse en un componente crítico de la plataforma de investigación de la medicina de precisión. [86]

Biología sintética y bioingeniería [ editar ]

El crecimiento del conocimiento genómico ha permitido aplicaciones cada vez más sofisticadas de la biología sintética . [87] En 2010, investigadores del Instituto J. Craig Venter anunciaron la creación de una especie de bacteria parcialmente sintética , Mycoplasma laboratorium , derivada del genoma de Mycoplasma genitalium . [88]

Genómica de poblaciones y conservación [ editar ]

La genómica de poblaciones se ha desarrollado como un campo de investigación popular, en el que se utilizan métodos de secuenciación genómica para realizar comparaciones a gran escala de secuencias de ADN entre poblaciones, más allá de los límites de los marcadores genéticos, como losproductos de PCR de corto alcanceo los microsatélites utilizados tradicionalmente en la genética de poblaciones . La genómica de poblaciones estudia losefectos de todo el genoma para mejorar nuestra comprensión de la microevolución, de modo que podamos conocer lahistoria filogenética y la demografía de una población. [89] Los métodos de genómica de poblaciones se utilizan para muchos campos diferentes, incluida la biología evolutiva ,ecología , biogeografía , biología de la conservación y ordenación pesquera . De manera similar, la genómica del paisaje se ha desarrollado a partir de la genética del paisaje para utilizar métodos genómicos para identificar las relaciones entre los patrones de variación ambiental y genética.

Los conservacionistas pueden utilizar la información recopilada por secuenciación genómica para evaluar mejor los factores genéticos clave para la conservación de especies, como la diversidad genética de una población o si un individuo es heterocigoto para un trastorno genético hereditario recesivo. [90] Mediante el uso de datos genómicos para evaluar los efectos de los procesos evolutivos y para detectar patrones de variación en una población determinada, los conservacionistas pueden formular planes para ayudar a una especie determinada sin que queden desconocidas tantas variables como las que no se abordan con los enfoques genéticos estándar . [91]

Ver también [ editar ]

  • Genómica cognitiva
  • Genómica computacional
  • Epigenómica
  • Genómica funcional
  • GeneCalling , una tecnología de creación de perfiles de ARNm
  • Genómica de la domesticación
  • Genética en la ficción
  • Glicomicos
  • Inmunomica
  • Metagenómica
  • Patogenómica
  • Genómica personal
  • Proteómica
  • Transcriptómica
  • Psicogenómica
  • Secuenciación del genoma completo
  • Thomas Roderick

Referencias [ editar ]

  1. ^ "Definiciones de la OMS de genética y genómica" . Organización Mundial de la Salud.
  2. ^ Conceptos de genética (10ª ed.). San Francisco: Pearson Education. 2012. ISBN 978-0-321-72412-0.
  3. ^ Culver KW, Labow MA (8 de noviembre de 2002). "Genómica" . En Robinson R (ed.). Genética . Biblioteca de Ciencias Macmillan. Macmillan Reference USA. ISBN 978-0-02-865606-9.
  4. ^ Kadakkuzha BM, Puthanveettil SV (julio de 2013). "Genómica y proteómica en la resolución de la complejidad del cerebro" . Biosistemas moleculares . 9 (7): 1807–21. doi : 10.1039 / C3MB25391K . PMC 6425491 . PMID 23615871 .  
  5. ↑ a b c d e f g h i Pevsner J (2009). Bioinformática y genómica funcional (2ª ed.). Hoboken, Nueva Jersey: Wiley-Blackwell. ISBN 978-0-470-08585-1.
  6. ^ Liddell HG, Scott R (2013). Léxico intermedio griego-inglés . Martino Fine Books. ISBN 978-1-61427-397-4.
  7. ^ "Genoma, n" . Diccionario de Inglés de Oxford (Tercera ed.). Prensa de la Universidad de Oxford. 2008 . Consultado el 1 de diciembre de 2012 .(requiere suscripción)
  8. ^ Yadav SP (diciembre de 2007). "La integridad en el sufijo -omics, -omes y la palabra om" . Revista de Técnicas Biomoleculares . 18 (5): 277. PMC 2392988 . PMID 18166670 .  
  9. ^ Ankeny RA (junio de 2003). "Secuenciación del genoma de nematodo a humano: cambiar métodos, cambiar la ciencia". Esfuerzo . 27 (2): 87–92. doi : 10.1016 / S0160-9327 (03) 00061-9 . PMID 12798815 . 
  10. ^ Holley RW, Everett GA, Madison JT, Zamir A (mayo de 1965). "Las secuencias de nucleótidos en la levadura transfieren ácido ribonucleico alanina" (PDF) . La Revista de Química Biológica . 240 (5): 2122–8. doi : 10.1016 / S0021-9258 (18) 97435-1 . PMID 14299636 .  
  11. ^ Holley RW, Apgar J, Everett GA, Madison JT, Marquisee M, Merrill SH, Penswick JR, Zamir A (March 1965). "Structure of a ribonucleic acid". Science. 147 (3664): 1462–5. Bibcode:1965Sci...147.1462H. doi:10.1126/science.147.3664.1462. PMID 14263761. S2CID 40989800.
  12. ^ Nirenberg M, Leder P, Bernfield M, Brimacombe R, Trupin J, Rottman F, O'Neal C (May 1965). "RNA codewords and protein synthesis, VII. On the general nature of the RNA code". Proceedings of the National Academy of Sciences of the United States of America. 53 (5): 1161–8. Bibcode:1965PNAS...53.1161N. doi:10.1073/pnas.53.5.1161. PMC 301388. PMID 5330357.
  13. ^ Min Jou W, Haegeman G, Ysebaert M, Fiers W (May 1972). "Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein". Nature. 237 (5350): 82–8. Bibcode:1972Natur.237...82J. doi:10.1038/237082a0. PMID 4555447. S2CID 4153893.
  14. ^ Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, et al. (April 1976). "Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene". Nature. 260 (5551): 500–7. Bibcode:1976Natur.260..500F. doi:10.1038/260500a0. PMID 1264203. S2CID 4289674.
  15. ^ Fiers W, Contreras R, Haegemann G, Rogiers R, Van de Voorde A, Van Heuverswyn H, Van Herreweghe J, Volckaert G, Ysebaert M (May 1978). "Complete nucleotide sequence of SV40 DNA". Nature. 273 (5658): 113–20. Bibcode:1978Natur.273..113F. doi:10.1038/273113a0. PMID 205802. S2CID 1634424.
  16. ^ Tamarin RH (2004). Principles of genetics (7 ed.). London: McGraw Hill. ISBN 978-0-07-124320-9.
  17. ^ Sanger F (1980). "Nobel lecture: Determination of nucleotide sequences in DNA" (PDF). Nobelprize.org. Retrieved 2010-10-18.
  18. ^ a b Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (February 1977). "Nucleotide sequence of bacteriophage phi X174 DNA". Nature. 265 (5596): 687–95. Bibcode:1977Natur.265..687S. doi:10.1038/265687a0. PMID 870828. S2CID 4206886.
  19. ^ Kaiser O, Bartels D, Bekel T, Goesmann A, Kespohl S, Pühler A, Meyer F (December 2003). "Whole genome shotgun sequencing guided by bioinformatics pipelines--an optimized approach for an established technique". Journal of Biotechnology. 106 (2–3): 121–33. doi:10.1016/j.jbiotec.2003.08.008. PMID 14651855.
  20. ^ Sanger F, Nicklen S, Coulson AR (December 1977). "DNA sequencing with chain-terminating inhibitors". Proceedings of the National Academy of Sciences of the United States of America. 74 (12): 5463–7. Bibcode:1977PNAS...74.5463S. doi:10.1073/pnas.74.12.5463. PMC 431765. PMID 271968.
  21. ^ Maxam AM, Gilbert W (February 1977). "A new method for sequencing DNA". Proceedings of the National Academy of Sciences of the United States of America. 74 (2): 560–4. Bibcode:1977PNAS...74..560M. doi:10.1073/pnas.74.2.560. PMC 392330. PMID 265521.
  22. ^ a b Darden L, James Tabery (2010). "Molecular Biology". In Zalta EN (ed.). The Stanford Encyclopedia of Philosophy (Fall 2010 ed.).
  23. ^ Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, et al. (April 1981). "Sequence and organization of the human mitochondrial genome". Nature. 290 (5806): 457–65. Bibcode:1981Natur.290..457A. doi:10.1038/290457a0. PMID 7219534. S2CID 4355527.(subscription required)
  24. ^ Shinozaki K, Ohme M, Tanaka M, Wakasugi T, Hayashida N, Matsubayashi T, et al. (September 1986). "The complete nucleotide sequence of the tobacco chloroplast genome: its gene organization and expression". The EMBO Journal. 5 (9): 2043–2049. doi:10.1002/j.1460-2075.1986.tb04464.x. PMC 1167080. PMID 16453699.
  25. ^ Ohyama K, Fukuzawa H, Kohchi T, Shirai H, Sano T, Sano S, et al. (1986). "Chloroplast gene organization deduced from complete sequence of liverwort Marchantia polymorpha chloroplast DNA". Nature. 322 (6079): 572–574. Bibcode:1986Natur.322..572O. doi:10.1038/322572a0. S2CID 4311952.
  26. ^ Oliver SG, van der Aart QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D, Antoine G, Anwar R, Ballesta JP, Benit P (May 1992). "The complete DNA sequence of yeast chromosome III". Nature. 357 (6373): 38–46. Bibcode:1992Natur.357...38O. doi:10.1038/357038a0. PMID 1574125. S2CID 4271784.
  27. ^ Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, et al. (July 1995). "Whole-genome random sequencing and assembly of Haemophilus influenzae Rd". Science. 269 (5223): 496–512. Bibcode:1995Sci...269..496F. doi:10.1126/science.7542800. PMID 7542800. S2CID 10423613.
  28. ^ Goffeau A, Barrell BG, Bussey H, Davis RW, Dujon B, Feldmann H, Galibert F, Hoheisel JD, Jacq C, Johnston M, Louis EJ, Mewes HW, Murakami Y, Philippsen P, Tettelin H, Oliver SG (October 1996). "Life with 6000 genes". Science. 274 (5287): 546, 563–7. Bibcode:1996Sci...274..546G. doi:10.1126/science.274.5287.546. PMID 8849441. S2CID 211123134.(subscription required)
  29. ^ "Complete genomes: Viruses". NCBI. 17 November 2011. Retrieved 2011-11-18.
  30. ^ "Genome Project Statistics". Entrez Genome Project. 7 October 2011. Retrieved 2011-11-18.
  31. ^ Zimmer C (29 December 2009). "Scientists Start a Genomic Catalog of Earth's Abundant Microbes". The New York Times. ISSN 0362-4331. Retrieved 2012-12-21.
  32. ^ Wu D, Hugenholtz P, Mavromatis K, Pukall R, Dalin E, Ivanova NN, et al. (December 2009). "A phylogeny-driven genomic encyclopaedia of Bacteria and Archaea". Nature. 462 (7276): 1056–60. Bibcode:2009Natur.462.1056W. doi:10.1038/nature08656. PMC 3073058. PMID 20033048.
  33. ^ "Human gene number slashed". BBC. 20 October 2004. Retrieved 2012-12-21.
  34. ^ Yue GH, Lo LC, Zhu ZY, Lin G, Feng F (April 2006). "The complete nucleotide sequence of the mitochondrial genome of Tetraodon nigroviridis". DNA Sequence. 17 (2): 115–21. doi:10.1080/10425170600700378. PMID 17076253. S2CID 21797344.
  35. ^ National Human Genome Research Institute (14 July 2004). "Dog Genome Assembled: Canine Genome Now Available to Research Community Worldwide". Genome.gov. Retrieved 2012-01-20.
  36. ^ a b McElheny V (2010). Drawing the map of life : inside the Human Genome Project. New York NY: Basic Books. ISBN 978-0-465-04333-0.
  37. ^ Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, Kang HM, Marth GT, McVean GA (November 2012). "An integrated map of genetic variation from 1,092 human genomes". Nature. 491 (7422): 56–65. Bibcode:2012Natur.491...56T. doi:10.1038/nature11632. PMC 3498066. PMID 23128226.
  38. ^ Nielsen R (October 2010). "Genomics: In search of rare human variants". Nature. 467 (7319): 1050–1. Bibcode:2010Natur.467.1050N. doi:10.1038/4671050a. PMID 20981085.
  39. ^ a b Barnes B, Dupré J (2008). Genomes and what to make of them. Chicago: University of Chicago Press. ISBN 978-0-226-17295-8.
  40. ^ Eisen JA (July 2012). "Badomics words and the power and peril of the ome-meme". GigaScience. 1 (1): 6. doi:10.1186/2047-217X-1-6. PMC 3617454. PMID 23587201.
  41. ^ Hotz RL (13 August 2012). "Here"s an Omical Tale: Scientists Discover Spreading Suffix". Wall Street Journal. ISSN 0099-9660. Retrieved 2013-01-04.
  42. ^ Scudellari M (1 October 2011). "Data Deluge". The Scientist. Retrieved 2013-01-04.
  43. ^ Chaston J, Douglas AE (August 2012). "Making the most of "omics" for symbiosis research". The Biological Bulletin. 223 (1): 21–9. doi:10.1086/BBLv223n1p21. PMC 3491573. PMID 22983030.
  44. ^ McCutcheon JP, von Dohlen CD (August 2011). "An interdependent metabolic patchwork in the nested symbiosis of mealybugs". Current Biology. 21 (16): 1366–72. doi:10.1016/j.cub.2011.06.051. PMC 3169327. PMID 21835622.
  45. ^ a b Baker M (14 September 2012). "Benchtop sequencers ship off" (Blog). Nature News Blog. Retrieved 2012-12-22.
  46. ^ Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, Bertoni A, Swerdlow HP, Gu Y (July 2012). "A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers". BMC Genomics. 13: 341. doi:10.1186/1471-2164-13-341. PMC 3431227. PMID 22827831.
  47. ^ a b Staden R (June 1979). "A strategy of DNA sequencing employing computer programs". Nucleic Acids Research. 6 (7): 2601–10. doi:10.1093/nar/6.7.2601. PMC 327874. PMID 461197.
  48. ^ Anderson S (July 1981). "Shotgun DNA sequencing using cloned DNase I-generated fragments". Nucleic Acids Research. 9 (13): 3015–27. doi:10.1093/nar/9.13.3015. PMC 327328. PMID 6269069.
  49. ^ a b c Pop M (July 2009). "Genome assembly reborn: recent computational challenges". Briefings in Bioinformatics. 10 (4): 354–66. doi:10.1093/bib/bbp026. PMC 2691937. PMID 19482960.
  50. ^ Sanger F, Coulson AR (May 1975). "A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase". Journal of Molecular Biology. 94 (3): 441–8. doi:10.1016/0022-2836(75)90213-2. PMID 1100841.
  51. ^ Mavromatis K, Land ML, Brettin TS, Quest DJ, Copeland A, Clum A, et al. (2012). Liu Z (ed.). "The fast changing landscape of sequencing technologies and their impact on microbial genome assemblies and annotation". PLOS ONE. 7 (12): e48837. Bibcode:2012PLoSO...748837M. doi:10.1371/journal.pone.0048837. PMC 3520994. PMID 23251337.
  52. ^ Illumina, Inc. (28 February 2012). An Introduction to Next-Generation Sequencing Technology (PDF). San Diego, California, USA: Illumina, Inc. p. 12. Retrieved 2012-12-28.
  53. ^ Hall N (May 2007). "Advanced sequencing technologies and their wider impact in microbiology". The Journal of Experimental Biology. 210 (Pt 9): 1518–25. doi:10.1242/jeb.001370. PMID 17449817.
  54. ^ Church GM (January 2006). "Genomes for all". Scientific American. 294 (1): 46–54. Bibcode:2006SciAm.294a..46C. doi:10.1038/scientificamerican0106-46. PMID 16468433.
  55. ^ ten Bosch JR, Grody WW (November 2008). "Keeping up with the next generation: massively parallel sequencing in clinical diagnostics". The Journal of Molecular Diagnostics. 10 (6): 484–92. doi:10.2353/jmoldx.2008.080027. PMC 2570630. PMID 18832462.
  56. ^ Tucker T, Marra M, Friedman JM (August 2009). "Massively parallel sequencing: the next big thing in genetic medicine". American Journal of Human Genetics. 85 (2): 142–54. doi:10.1016/j.ajhg.2009.06.022. PMC 2725244. PMID 19679224.
  57. ^ Kawashima EH, Farinelli L, Mayer P (12 May 2005). "Method of nucleic acid amplification". Retrieved 2012-12-22.
  58. ^ Mardis ER (2008). "Next-generation DNA sequencing methods" (PDF). Annual Review of Genomics and Human Genetics. 9: 387–402. doi:10.1146/annurev.genom.9.081307.164359. PMID 18576944. Archived from the original (PDF) on 2013-05-18. Retrieved 2013-01-04.
  59. ^ Davies K (2011). "Powering Preventative Medicine". Bio-IT World (September–October).
  60. ^ https://www.pacb.com/
  61. ^ "Oxford Nanopore Technologies".
  62. ^ Chain PS, Grafham DV, Fulton RS, Fitzgerald MG, Hostetler J, Muzny D, et al. (October 2009). "Genomics. Genome project standards in a new era of sequencing". Science. 326 (5950): 236–7. Bibcode:2009Sci...326..236C. doi:10.1126/science.1180614. PMC 3854948. PMID 19815760.
  63. ^ Stein L (July 2001). "Genome annotation: from sequence to biology". Nature Reviews. Genetics. 2 (7): 493–503. doi:10.1038/35080529. PMID 11433356. S2CID 12044602.
  64. ^ Brent MR (January 2008). "Steady progress and recent breakthroughs in the accuracy of automated genome annotation" (PDF). Nature Reviews. Genetics. 9 (1): 62–73. doi:10.1038/nrg2220. PMID 18087260. S2CID 20412451. Archived from the original (PDF) on 2013-05-29. Retrieved 2013-01-04.
  65. ^ Flicek P, Ahmed I, Amode MR, Barrell D, Beal K, Brent S, et al. (January 2013). "Ensembl 2013". Nucleic Acids Research. 41 (Database issue): D48–55. doi:10.1093/nar/gks1236. PMC 3531136. PMID 23203987.
  66. ^ Keith JM (2008). Keith JM (ed.). Bioinformatics. Methods in Molecular Biology. 453. pp. v–vi. doi:10.1007/978-1-60327-429-6. ISBN 978-1-60327-428-9. PMID 18720577.
  67. ^ Marsden RL, Lewis TA, Orengo CA (March 2007). "Towards a comprehensive structural coverage of completed genomes: a structural genomics viewpoint". BMC Bioinformatics. 8: 86. doi:10.1186/1471-2105-8-86. PMC 1829165. PMID 17349043.
  68. ^ Brenner SE, Levitt M (January 2000). "Expectations from structural genomics". Protein Science. 9 (1): 197–200. doi:10.1110/ps.9.1.197. PMC 2144435. PMID 10739263.
  69. ^ Brenner SE (October 2001). "A tour of structural genomics" (PDF). Nature Reviews. Genetics. 2 (10): 801–9. doi:10.1038/35093574. PMID 11584296. S2CID 5656447.
  70. ^ a b Francis RC (2011). Epigenetics : the ultimate mystery of inheritance. New York: WW Norton. ISBN 978-0-393-07005-7.
  71. ^ Laird PW (March 2010). "Principles and challenges of genomewide DNA methylation analysis". Nature Reviews. Genetics. 11 (3): 191–203. doi:10.1038/nrg2732. PMID 20125086. S2CID 6780101.
  72. ^ Hugenholtz P, Goebel BM, Pace NR (September 1998). "Impact of culture-independent studies on the emerging phylogenetic view of bacterial diversity". Journal of Bacteriology. 180 (18): 4765–74. doi:10.1128/JB.180.18.4765-4774.1998. PMC 107498. PMID 9733676.
  73. ^ Eisen JA (March 2007). "Environmental shotgun sequencing: its potential and challenges for studying the hidden world of microbes". PLOS Biology. 5 (3): e82. doi:10.1371/journal.pbio.0050082. PMC 1821061. PMID 17355177.
  74. ^ Marco D, ed. (2010). Metagenomics: Theory, Methods and Applications. Caister Academic Press. ISBN 978-1-904455-54-7.
  75. ^ Marco D, ed. (2011). Metagenomics: Current Innovations and Future Trends. Caister Academic Press. ISBN 978-1-904455-87-5.
  76. ^ Canchaya C, Proux C, Fournous G, Bruttin A, Brüssow H (June 2003). "Prophage genomics". Microbiology and Molecular Biology Reviews. 67 (2): 238–76, table of contents. doi:10.1128/MMBR.67.2.238-276.2003. PMC 156470. PMID 12794192.
  77. ^ McGrath S, van Sinderen D, eds. (2007). Bacteriophage: Genetics and Molecular Biology (1st ed.). Caister Academic Press. ISBN 978-1-904455-14-1.
  78. ^ Fouts DE (November 2006). "Phage_Finder: automated identification and classification of prophage regions in complete bacterial genome sequences". Nucleic Acids Research. 34 (20): 5839–51. doi:10.1093/nar/gkl732. PMC 1635311. PMID 17062630.
  79. ^ Herrero A, Flores E, eds. (2008). The Cyanobacteria: Molecular Biology, Genomics and Evolution (1st ed.). Caister Academic Press. ISBN 978-1-904455-15-8.
  80. ^ Hudson KL (September 2011). "Genomics, health care, and society". The New England Journal of Medicine. 365 (11): 1033–41. doi:10.1056/NEJMra1010517. PMID 21916641.
  81. ^ O'Donnell CJ, Nabel EG (December 2011). "Genomics of cardiovascular disease". The New England Journal of Medicine. 365 (22): 2098–109. doi:10.1056/NEJMra1105239. PMID 22129254.
  82. ^ Lu YF, Goldstein DB, Angrist M, Cavalleri G (July 2014). "Personalized medicine and human genetic diversity". Cold Spring Harbor Perspectives in Medicine. 4 (9): a008581. doi:10.1101/cshperspect.a008581. PMC 4143101. PMID 25059740.
  83. ^ Ashley, Euan A; Butte, Atul J; Wheeler, Matthew T; Chen, Rong; Klein, Teri E; Dewey, Frederick E; Dudley, Joel T; Ormond, Kelly E; Pavlovic, Aleksandra; Morgan, Alexander A; Pushkarev, Dmitry; Neff, Norma F; Hudgins, Louanne; Gong, Li; Hodges, Laura M; Berlin, Dorit S; Thorn, Caroline F; Sangkuhl, Katrin; Hebert, Joan M; Woon, Mark; Sagreiya, Hersh; Whaley, Ryan; Knowles, Joshua W; Chou, Michael F; Thakuria, Joseph V; Rosenbaum, Abraham M; Zaranek, Alexander Wait; Church, George M; Greely, Henry T; Quake, Stephen R; Altman, Russ B (May 2010). "Clinical assessment incorporating a personal genome". The Lancet. 375 (9725): 1525–1535. doi:10.1016/S0140-6736(10)60452-7. PMC 2937184. PMID 20435227.
  84. ^ Dewey, Frederick E.; Chen, Rong; Cordero, Sergio P.; Ormond, Kelly E.; Caleshu, Colleen; Karczewski, Konrad J.; Whirl-Carrillo, Michelle; Wheeler, Matthew T.; Dudley, Joel T.; Byrnes, Jake K.; Cornejo, Omar E.; Knowles, Joshua W.; Woon, Mark; Sangkuhl, Katrin; Gong, Li; Thorn, Caroline F.; Hebert, Joan M.; Capriotti, Emidio; David, Sean P.; Pavlovic, Aleksandra; West, Anne; Thakuria, Joseph V.; Ball, Madeleine P.; Zaranek, Alexander W.; Rehm, Heidi L.; Church, George M.; West, John S.; Bustamante, Carlos D.; Snyder, Michael; Altman, Russ B.; Klein, Teri E.; Butte, Atul J.; Ashley, Euan A. (15 September 2011). "Phased Whole-Genome Genetic Risk in a Family Quartet Using a Major Allele Reference Sequence". PLOS Genetics. 7 (9): e1002280. doi:10.1371/journal.pgen.1002280. PMC 3174201. PMID 21935354.
  85. ^ Dewey, Frederick E.; Grove, Megan E.; Pan, Cuiping; Goldstein, Benjamin A.; Bernstein, Jonathan A.; Chaib, Hassan; Merker, Jason D.; Goldfeder, Rachel L.; Enns, Gregory M.; David, Sean P.; Pakdaman, Neda; Ormond, Kelly E.; Caleshu, Colleen; Kingham, Kerry; Klein, Teri E.; Whirl-Carrillo, Michelle; Sakamoto, Kenneth; Wheeler, Matthew T.; Butte, Atul J.; Ford, James M.; Boxer, Linda; Ioannidis, John P. A.; Yeung, Alan C.; Altman, Russ B.; Assimes, Themistocles L.; Snyder, Michael; Ashley, Euan A.; Quertermous, Thomas (12 March 2014). "Clinical Interpretation and Implications of Whole-Genome Sequencing". JAMA. 311 (10): 1035–45. doi:10.1001/jama.2014.1717. PMC 4119063. PMID 24618965.
  86. ^ "NIH-funded genome centers to accelerate precision medicine discoveries". National Institutes of Health: All of Us Research Program. National Institutes of Health.
  87. ^ Church GM, Regis E (2012). Regenesis : how synthetic biology will reinvent nature and ourselves. New York: Basic Books. ISBN 978-0-465-02175-8.
  88. ^ Baker M (May 2011). "Synthetic genomes: The next step for the synthetic genome". Nature. 473 (7347): 403, 405–8. Bibcode:2011Natur.473..403B. doi:10.1038/473403a. PMID 21593873. S2CID 205064528.
  89. ^ Luikart, G.; England, P. R.; Tallmon, D.; Jordan S.; Taberlet P. (2003). "The Power and Promise of Population Genomics: From Genotyping to Genome Typing". Nature Reviews (4): 981-994
  90. ^ Frankham R (1 September 2010). "Challenges and opportunities of genetic approaches to biological conservation". Biological Conservation. 143 (9): 1922–1923. doi:10.1016/j.biocon.2010.05.011.
  91. ^ Allendorf FW, Hohenlohe PA, Luikart G (October 2010). "Genomics and the future of conservation genetics". Nature Reviews. Genetics. 11 (10): 697–709. doi:10.1038/nrg2844. PMID 20847747. S2CID 10811958.

Further reading[edit]

  • Lesk AM (2017). Introduction to Genomics (3rd ed.). New York: Oxford University Press. p. 544. ISBN 978-0-19-107085-3. ASIN 0198754833.
  • Stunnenberg HG, Hubner NC (2014). "Genomics meets proteomics: identifying the culprits in disease". Human Genetics. 133 (6): 689–700. doi:10.1007/s00439-013-1376-2. PMC 4021166. PMID 24135908.
  • Shibata T (2012). "Cancer genomics and pathology: all together now". Pathology International. 62 (10): 647–59. doi:10.1111/j.1440-1827.2012.02855.x. PMID 23005591. S2CID 27886018.
  • Roychowdhury S, Chinnaiyan AM (2016). "Translating cancer genomes and transcriptomes for precision oncology". CA: A Cancer Journal for Clinicians. 66 (1): 75–88. doi:10.3322/caac.21329. PMC 4713245. PMID 26528881.
  • Vadim N G, Zhang Y (2013). "Chapter 16 Comparative Genomics Analysis of the Metallomes". In Banci L (ed.). Metallomics and the Cell. Metal Ions in Life Sciences. 12. Springer. doi:10.1007/978-94-007-5561-10_16 (inactive 2021-01-14). ISBN 978-94-007-5560-4.CS1 maint: DOI inactive as of January 2021 (link) electronic-book ISBN 978-94-007-5561-1 ISSN 1559-0836 electronic-ISSN 1868-0402

External links[edit]

  • Annual Review of Genomics and Human Genetics
  • BMC Genomics: A BMC journal on Genomics
  • Genomics journal
  • Genomics.org: An openfree genomics portal.
  • NHGRI: US government's genome institute
  • JCVI Comprehensive Microbial Resource
  • KoreaGenome.org: The first Korean Genome published and the sequence is available freely.
  • GenomicsNetwork: Looks at the development and use of the science and technologies of genomics.
  • Institute for Genome Sciences: Genomics research.
  • MIT OpenCourseWare HST.512 Genomic Medicine A free, self-study course in genomic medicine. Resources include audio lectures and selected lecture notes.
  • ENCODE threads explorer Machine learning approaches to genomics. Nature (journal)
  • Global map of genomics laboratories
  • Genomics: Scitable by nature education