De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

En genética , una etiqueta de secuencia expresada ( EST ) es una subsecuencia corta de una secuencia de ADNc . [1] Las tecnologías ecológicamente racionales se pueden utilizar para identificar transcripciones de genes y son fundamentales en el descubrimiento de genes y en la determinación de secuencias de genes. [2] La identificación de tecnologías ecológicamente racionales ha avanzado rápidamente, con aproximadamente 74,2 millones de tecnologías ecológicamente racionales disponibles ahora en bases de datos públicas (por ejemplo, GenBank 1 de enero de 2013, todas las especies).

Una EST resulta de la secuenciación de un solo disparo de un ADNc clonado . Los ADNc usados ​​para la generación de EST son típicamente clones individuales de una biblioteca de ADNc . La secuencia resultante es un fragmento de calidad relativamente baja cuya longitud está limitada por la tecnología actual a aproximadamente 500 a 800 nucleótidos . Debido a que estos clones consisten en ADN que es complementario al ARNm, las tecnologías ecológicamente racionales representan porciones de genes expresados. Pueden representarse en bases de datos como secuencias de ADNc / ARNm o como complemento inverso del ARNm, la hebra molde .

Se pueden mapear tecnologías ecológicamente racionales en ubicaciones cromosómicas específicas utilizando técnicas de mapeo físico , como mapeo híbrido de radiación , mapeo Happy o FISH . Alternativamente, si se ha secuenciado el genoma del organismo que originó la EST, se puede alinear la secuencia de EST con ese genoma usando una computadora.

La comprensión actual del conjunto de genes humanos (a partir de 2006 ) incluye la existencia de miles de genes basados ​​únicamente en la evidencia EST. En este sentido, las tecnologías ecológicamente racionales se han convertido en una herramienta para refinar las transcripciones previstas para esos genes, lo que conduce a la predicción de sus productos proteicos y, en última instancia, de su función. Además, la situación en la que se obtienen esas tecnologías ecológicamente racionales (tejido, órgano, enfermedad, por ejemplo, cáncer ) proporciona información sobre las condiciones en las que actúa el gen correspondiente. Las tecnologías ecológicamente racionales contienen suficiente información para permitir el diseño de sondas precisas para microarrays de ADN que luego se pueden utilizar para determinar los perfiles de expresión génica .

Algunos autores utilizan el término "EST" para describir genes para los que existe poca o ninguna información adicional además de la etiqueta. [3]

Historia [ editar ]

En 1979, los equipos de Harvard y Caltech ampliaron la idea básica de hacer copias de ADN de ARNm in vitro para amplificar una biblioteca de estos en plásmidos bacterianos. [4]

En 1982, Greg Sutcliffe y colaboradores exploraron la idea de seleccionar clones aleatorios o semialeatorios de una biblioteca de ADNc de este tipo para la secuenciación. [5]

En 1983, Putney et al. 178 clones secuenciados de una biblioteca de ADNc de músculo de conejo. [6]

En 1991, Adams y sus colaboradores acuñaron el término EST e iniciaron una secuenciación más sistemática como proyecto (comenzando con 600 ADNc cerebrales). [2]

Fuentes de datos y anotaciones [ editar ]

dbEST [ editar ]

DbEST es una división de Genbank establecida en 1992. En cuanto a GenBank , los datos en dbEST son enviados directamente por laboratorios de todo el mundo y no están curados.

EST contigs [ editar ]

Debido a la forma en que se secuencian las tecnologías ecológicamente racionales, muchas etiquetas de secuencia expresadas distintas son a menudo secuencias parciales que corresponden al mismo ARNm de un organismo. En un esfuerzo por reducir el número de etiquetas de secuencia expresadas para análisis de descubrimiento de genes posteriores , varios grupos ensamblaron etiquetas de secuencia expresadas en contigs EST . Ejemplos de recursos que proporcionan contigs EST incluyen: índices de genes TIGR, [7] Unigene, [8] y STACK [9]

La construcción de EST contigs no es trivial y puede producir artefactos (contigs que contienen dos productos génicos distintos). Cuando la secuencia completa del genoma de un organismo está disponible y las transcripciones están anotadas, es posible evitar el ensamblaje de contig y hacer coincidir directamente las transcripciones con las tecnologías ecológicamente racionales. Este enfoque se utiliza en el sistema TissueInfo (ver más abajo) y facilita la vinculación de las anotaciones en la base de datos genómica con la información de tejido proporcionada por los datos EST.

Información sobre tejidos [ editar ]

Los análisis de alto rendimiento de tecnologías ecológicamente racionales a menudo encuentran desafíos similares en la gestión de datos. Un primer desafío es que la procedencia de tejidos de las bibliotecas de EST se describe en un lenguaje sencillo en dbEST. [10] Esto hace que sea difícil escribir programas que puedan determinar sin ambigüedades que dos bibliotecas EST fueron secuenciadas del mismo tejido. De manera similar, las condiciones de enfermedad para el tejido no se anotan de una manera computacionalmente amigable. Por ejemplo, el origen del cáncer de una biblioteca a menudo se mezcla con el nombre del tejido (por ejemplo, el nombre del tejido " glioblastoma " indica que la biblioteca EST se secuenció a partir de tejido cerebral y la enfermedad es cáncer). [11]Con la notable excepción del cáncer, la condición de la enfermedad a menudo no se registra en las entradas dbEST. El proyecto TissueInfo se inició en 2000 para ayudar con estos desafíos. El proyecto proporciona datos seleccionados (actualizados a diario) para eliminar la ambigüedad del origen del tejido y el estado de la enfermedad (cáncer / no cáncer), ofrece una ontología tisular que vincula tejidos y órganos mediante relaciones "es parte de" (es decir, formaliza el conocimiento de que el hipotálamo es parte del cerebro , y ese cerebro es parte del sistema nervioso central) y distribuye software de código abierto para vincular anotaciones de transcripciones de genomas secuenciados a perfiles de expresión tisular calculados con datos en dbEST. [12]

Ver también [ editar ]

  • La expresion genica
  • ADN complementario (ADNc)
  • transcriptómica
  • Clones de ADNc de IMAGEN
  • Secuenciación del genoma completo (WGS)

Referencias [ editar ]

  1. ^ Ficha técnica de tecnologías ecológicamente racionales . Centro Nacional de Información Biotecnológica .
  2. ^ a b Adams MD, Kelley JM, Gocayne JD, et al. (Junio ​​de 1991). "Secuenciación complementaria de ADN: etiquetas de secuencia expresada y proyecto del genoma humano". Ciencia . 252 (5013): 1651–6. doi : 10.1126 / science.2047873 . PMID  2047873 . S2CID  13436211 .
  3. ^ dbEST
  4. ^ Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (diciembre de 1979). "Uso de una biblioteca de ADNc para estudios sobre la evolución y expresión del desarrollo de las familias multigénicas de corion" . Celular . 18 (4): 1303–16. doi : 10.1016 / 0092-8674 (79) 90241-1 . PMID 519770 . 
  5. ^ Sutcliffe JG, Milner RJ, Bloom FE, Lerner RA (agosto de 1982). "Secuencia común de 82 nucleótidos única para el ARN cerebral" . Proc Natl Acad Sci USA . 79 (16): 4942–6. doi : 10.1073 / pnas.79.16.4942 . PMC 346801 . PMID 6956902 .  
  6. ^ Putney SD, Herlihy WC, Schimmel P (1983). "Una nueva troponina T y clones de cDNA para 13 proteínas musculares diferentes, encontrados por secuenciación de escopeta". Naturaleza . 302 (5910): 718–21. doi : 10.1038 / 302718a0 . PMID 6687628 . S2CID 4364361 .  
  7. ^ Lee Y, Tsai J, Sunkara S, et al. (Enero de 2005). "Los índices de genes TIGR: agrupación y ensamblaje de EST y genes conocidos e integración con genomas eucariotas" . Ácidos nucleicos Res . 33 (Problema de la base de datos): D71–4. doi : 10.1093 / nar / gki064 . PMC 540018 . PMID 15608288 .  
  8. ^ Stanton JA, Macgregor AB, Green DP (2003). "Identificación de la expresión génica enriquecida en tejidos en tejidos de ratón utilizando la base de datos NIH UniGene". Appl Bioinform . 2 (3 supl.): S65–73. PMID 15130819 . 
  9. ^ Christoffels A, van Gelder A, Greyling G, Miller R, Hide T, Hide W (enero de 2001). "PILA: Alineación de etiquetas de secuencia y base de conocimientos de consenso" . Ácidos nucleicos Res . 29 (1): 234–8. doi : 10.1093 / nar / 29.1.234 . PMC 29830 . PMID 11125101 .  
  10. ^ Skrabanek L, Campagne F (noviembre de 2001). "TissueInfo: identificación de alto rendimiento de los perfiles de expresión tisular y la especificidad" . Ácidos nucleicos Res . 29 (21): E102–2. doi : 10.1093 / nar / 29.21.e102 . PMC 60201 . PMID 11691939 .  
  11. ^ Campagne F, Skrabanek L (2006). "La minería de etiquetas de secuencia expresada identifica marcadores de cáncer de interés clínico" . BMC Bioinformática . 7 : 481. doi : 10.1186 / 1471-2105-7-481 . PMC 1635568 . PMID 17078886 .  
  12. ^ : institute for computational biomedicine :: TissueInfo Archivado el 4 de junio de 2008 en Wayback Machine

Enlaces externos [ editar ]

  • "Tecnologías ecológicamente racionales: descubrimiento de genes más fácil" . Science Primer . NCBI. 29 de marzo de 2004. Archivado desde el original el 28 de febrero de 2007.
  • Poncio, Joan U .; Wagner, Lukas; Schuler, Gregory D. (2003) [2002]. "21 UniGene: una vista unificada del transcriptoma § Etiquetas de secuencia expresada (EST)" . En McEntyre, J; Ostell, J (eds.). Manual del NCBI [Internet] . Centro Nacional de Información Biotecnológica. NBK21101. Esta publicación se proporciona solo como referencia histórica y la información puede estar desactualizada
  • Friedel, CC1; Jahn, KH; Sommer, S; Rudd, S; Mewes, HW; Tetko, IV (15 de abril de 2005). "Máquinas de vectores de apoyo para la separación de colecciones EST mixtas de patógenos vegetales basadas en el uso de codones (ECLAT)" . Bioinformática . 21 (8): 1383–8. doi : 10.1093 / bioinformática / bti200 . PMID  15585526 .
    • "ECLAT" . MIPS . Archivado desde el original el 27 de septiembre de 2008. Servidor para la clasificación de tecnologías ecológicamente racionales de grupos de EST mixtos (de plantas infectadas con hongos) mediante el uso de codones
  • "dbEST" . GenBank .
    • "resumen dbEST" . GenBank . 1 de enero de 2013. Archivado desde el original el 7 de junio de 2019.
  • Ranganathan, Shoba. "Bioinformática" .
    • "Recursos web para análisis y datos EST" . Archivado desde el original el 29 de agosto de 2007.

Información del tejido [ editar ]

  • "TissueInfo" . Wiki .
  • "TissueInfo" . Archivado desde el original el 4 de junio de 2008. Procedencia de tejidos EST curada, ontología de tejidos, software de código abierto
  • Skrabanek L, Campagne F (1 de noviembre de 2001). "TissueInfo: identificación de alto rendimiento de los perfiles de expresión tisular y la especificidad" . Ácidos nucleicos Res . 29 (21): E102–2. doi : 10.1093 / nar / 29.21.e102 . PMC  60201 . PMID  11691939 .