La anotación de polimorfismo de un solo nucleótido ( anotación SNP ) es el proceso de predecir el efecto o la función de un SNP individual utilizando herramientas de anotación SNP. En la anotación SNP, la información biológica se extrae, recopila y muestra en una forma clara susceptible de consulta. La anotación funcional de SNP se realiza típicamente en base a la información disponible sobre secuencias de proteínas y ácidos nucleicos . [1]
Clasificación | Bioinformática |
---|---|
Subclasificación | Polimorfismo de nucleótido simple |
Tipo de herramientas utilizadas | Herramientas de anotación funcional |
Otros temas relacionados | Proyecto Genoma , Genómica |
Introducción
![](http://wikiimg.tojsiabtv.com/wikipedia/commons/thumb/f/f8/Relationships_Among_SNP_Predictions.png/220px-Relationships_Among_SNP_Predictions.png)
Los polimorfismos de un solo nucleótido (SNP) desempeñan un papel importante en los estudios de asociación de todo el genoma porque actúan como biomarcadores primarios . Los SNP son actualmente el marcador de elección debido a su gran número en prácticamente todas las poblaciones de individuos. La ubicación de estos biomarcadores puede ser tremendamente importante en términos de predecir la importancia funcional, el mapeo genético y la genética de poblaciones . [3] Cada SNP representa un cambio de nucleótidos entre dos individuos en una ubicación definida. Los SNP son la variante genética más común que se encuentra en todos los individuos con un SNP cada 100 a 300 pb en algunas especies . [4] Dado que existe una gran cantidad de SNP en el genoma , existe una clara necesidad de priorizar los SNP de acuerdo con su efecto potencial para acelerar el genotipado y el análisis. [5]
Anotar un gran número de SNP es un proceso difícil y complejo, que necesita métodos computacionales para manejar un conjunto de datos tan grande. Se han desarrollado muchas herramientas disponibles para la anotación de SNP en diferentes organismos: algunas de ellas están optimizadas para su uso con organismos densamente muestreados para SNP (como los humanos ), pero actualmente hay pocas herramientas disponibles que no sean de especies específicas o que no sean compatibles con modelos. datos del organismo. La mayoría de las herramientas de anotación de SNP proporcionan supuestos efectos deletéreos de los SNP que se predicen computacionalmente. Estas herramientas examinan si un SNP reside en regiones genómicas funcionales como exones, sitios de empalme o sitios reguladores de la transcripción, y predicen los posibles efectos funcionales correspondientes que el SNP puede tener utilizando una variedad de enfoques de aprendizaje automático. Pero las herramientas y los sistemas que priorizan los SNP funcionalmente significativos, adolecen de pocas limitaciones: en primer lugar, examinan los supuestos efectos deletéreos de los SNP con respecto a una única función biológica que proporciona solo información parcial sobre la importancia funcional de los SNP. En segundo lugar, los sistemas actuales clasifican a los SNP en grupos neutrales o perjudiciales. [6]
Muchos algoritmos de anotación se centran en variantes de un solo nucleótido (SNV), consideradas más raras que los SNP, según se define por su frecuencia de alelos menores (MAF). [7] [8] Como consecuencia, los datos de entrenamiento para los métodos de predicción correspondientes pueden ser diferentes y, por lo tanto, se debe tener cuidado de seleccionar la herramienta adecuada para un propósito específico. Para los propósitos de este artículo, "SNP" se utilizará para referirse tanto a SNP como a SNV, pero los lectores deben tener en cuenta las diferencias.
Anotación SNP
![](http://wikiimg.tojsiabtv.com/wikipedia/commons/thumb/f/f3/SNPannotation1.png/220px-SNPannotation1.png)
Para la anotación SNP, se utilizan muchos tipos de información genética y genómica. Según las diferentes funciones utilizadas por cada herramienta de anotación, los métodos de anotación SNP pueden dividirse aproximadamente en las siguientes categorías:
Anotación basada en genes
La información genómica de los elementos genómicos circundantes se encuentra entre la información más útil para interpretar la función biológica de una variante observada. La información de un gen conocido se utiliza como referencia para indicar si la variante observada reside en un gen o cerca de él y si tiene el potencial de alterar la secuencia de la proteína y su función. La anotación basada en genes se basa en el hecho de que las mutaciones no sinónimas pueden alterar la secuencia de la proteína y que la mutación del sitio de corte y empalme puede alterar el patrón de corte y empalme de la transcripción. [9]
Anotación basada en conocimiento
La anotación de la base de conocimientos se realiza en función de la información del atributo del gen, la función de la proteína y su metabolismo . En este tipo de anotación se da más énfasis a la variación genética que interrumpe el dominio de función de la proteína, la interacción proteína-proteína y la vía biológica . La región no codificante del genoma contiene muchos elementos reguladores importantes que incluyen promotor , potenciador y aislante, cualquier tipo de cambio en esta región reguladora puede cambiar la funcionalidad de esa proteína. [10] La mutación en el ADN puede cambiar la secuencia del ARN y luego influir en la estructura secundaria del ARN , el reconocimiento de la proteína de unión al ARN y la actividad de unión del miARN. [11] [12]
Anotación funcional
Este método identifica principalmente la función variante basándose en la información de si los loci variantes están en la región funcional conocida que alberga señales genómicas o epigenómicas. La función de las variantes no codificantes es amplia en términos de la región genómica afectada e implican en casi todos los procesos de regulación génica desde el nivel transcripcional hasta el postraduccional [13].
Regulación de genes transcripcionales
El proceso de regulación de genes transcripcionales depende de muchos factores espaciales y temporales en el núcleo, tales como estados de cromatina globales o locales, posicionamiento de nucleosomas, unión de TF, actividades potenciadoras / promotoras. Las variantes que alteran la función de cualquiera de estos procesos biológicos pueden alterar la regulación génica y provocar anomalías fenotípicas. [14] Las variantes genéticas que se encuentran en la región reguladora distal pueden afectar el motivo de unión de los TF, los reguladores de la cromatina y otros factores de transcripción distal, que alteran la interacción entre el potenciador / silenciador y su gen diana. [15]
Splicing alternativo
El empalme alternativo es uno de los componentes más importantes que muestran la complejidad funcional del genoma. El empalme modificado tiene un efecto significativo sobre el fenotipo que es relevante para la enfermedad o el metabolismo de fármacos. Se puede producir un cambio en el empalme modificando cualquiera de los componentes de la maquinaria de empalme, como los sitios de empalme o los potenciadores o silenciadores de empalme. [16] La modificación en el sitio de corte y empalme alternativo puede conducir a una forma de proteína diferente que mostrará una función diferente. Los seres humanos utilizan aproximadamente 100.000 proteínas diferentes o más, por lo que algunos genes deben ser capaces de codificar mucho más que una sola proteína. El empalme alternativo ocurre con más frecuencia de lo que se pensaba anteriormente y puede ser difícil de controlar; los genes pueden producir decenas de miles de transcripciones diferentes, lo que requiere un nuevo modelo de gen para cada empalme alternativo.
Procesamiento de ARN y regulación postranscripcional
Las mutaciones en la región no traducida (UTR) afectan muchas regulaciones postranscripcionales . Se requieren características estructurales distintivas para que muchas moléculas de ARN y elementos reguladores que actúan en cis ejecuten funciones efectivas durante la regulación génica. Los SNV pueden alterar la estructura secundaria de las moléculas de ARN y luego interrumpir el plegamiento adecuado de los ARN, como el plegamiento de ARNt / ARNm / lncARN y las regiones de reconocimiento de unión de miARN. [17]
Traducción y modificaciones postraduccionales
La variante de un solo nucleótido también puede afectar a los elementos reguladores que actúan en cis en los ARNm para inhibir / promover el inicio de la traducción. El cambio en la región de los codones sinónimos debido a la mutación puede afectar la eficiencia de la traducción debido a los sesgos de uso de los codones. El alargamiento de la traducción también se puede retrasar por mutaciones a lo largo de la rampa del movimiento ribosómico. En el nivel postraduccional, las variantes genéticas pueden contribuir a la proteostasis y las modificaciones de los aminoácidos. Sin embargo, los mecanismos del efecto de la variante en este campo son complicados y solo hay unas pocas herramientas disponibles para predecir el efecto de la variante en las modificaciones relacionadas con la traducción. [18]
Función proteica
No sinónimo es la variante en los exones que cambian la secuencia de aminoácidos codificada por el gen, incluidos los cambios de una sola base y los indeles sin desplazamiento de marco. Se ha investigado en profundidad la función de las variantes no sinónimas en la proteína y se han desarrollado muchos algoritmos para predecir la deletérea y la patogénesis de las variantes de un solo nucleótido (SNV). Las herramientas bioinformáticas clásicas, como SIFT, Polyphen y MutationTaster , predicen con éxito la consecuencia funcional de la sustitución no sinónima. [19] [20] [21] [22] El servidor web PopViz proporciona un enfoque centrado en los genes para visualizar las puntuaciones de predicción del daño por mutación (CADD, SIFT, PolyPhen-2) o la genética de la población (frecuencia de alelos menores) frente a las posiciones de los aminoácidos de todas las variantes codificantes de un determinado gen humano. [23] PopViz también está entrecruzado con la base de datos UniProt, donde se puede encontrar la información del dominio de proteínas, y para luego identificar las variantes deletéreas predichas, caen en estos dominios de proteínas en la gráfica de PopViz. [23]
Conservación evolutiva y selección de la naturaleza
Se utilizaron enfoques de genómica comparativa para predecir las variantes relevantes para la función bajo el supuesto de que el locus genético funcional debería conservarse en diferentes especies a una distancia filogenética extensa. Por otro lado, algunos rasgos adaptativos y las diferencias de población son impulsados por selecciones positivas de variantes ventajosas, y estas mutaciones genéticas son funcionalmente relevantes para fenotipos específicos de la población. La predicción funcional del efecto de las variantes en diferentes procesos biológicos es fundamental para identificar el mecanismo molecular de las enfermedades / rasgos y dirigir la validación experimental. [24]
Lista de herramientas de anotación SNP disponibles
Para anotar la gran cantidad de datos NGS disponibles, actualmente hay disponible una gran cantidad de herramientas de anotación SNP. Algunos de ellos son específicos de SNP específicos, mientras que otros son más generales. Algunas de las herramientas de anotación de SNP disponibles son las siguientes SNPeff, Predictor de efecto variante de Ensembl (VEP), ANNOVAR, FATHMM, PhD-SNP, PolyPhen-2, SuSPect, F-SNP, AnnTools, SeattleSeq, SNPit, SCAN, Snap, SNPs & GO LS-SNP, Snat, TREAT, TRAMS, Maviant, MutationTaster , SNPdat, Snpranker, NGS - SNP, SVA, VARIANT, SIFT, LIST-S2, PhD-SNP y FAST-SNP. Las funciones y enfoques utilizados en las herramientas de anotación de SNP se enumeran a continuación.
Herramientas | Descripción | Uso de recursos externos | URL del sitio web | Referencias |
---|---|---|---|---|
PhyreRisk | Mapas de variantes genéticas en estructuras de proteínas experimentales y predichas | Predictor de efecto variante , UniProt , Protein Data Bank , SIFTS , Phyre2 para estructuras predichas | http://phyrerisk.bc.ic.ac.uk/home | [25] |
Missense3D | Informa el impacto estructural de una variante de sentido erróneo en PDB y coordenadas de proteínas proporcionadas por el usuario. Desarrollado para ser aplicable a estructuras de proteínas experimentales y predichas. | Protein Data Bank , Phyre2 para estructuras predichas | http://www.sbg.bio.ic.ac.uk/~missense3d/ | [26] |
SNPeff | SnpEff anota variantes basadas en sus ubicaciones genómicas y predice los efectos de codificación. Utiliza un enfoque de bosque de intervalo | ENSEMBL, UCSC y basado en organismos, por ejemplo, FlyBase, WormBase y TAIR | http://snpeff.sourceforge.net/SnpEff_manual.html | [27] |
Conjunto VEP | Determina los efectos de las variantes (SNP, inserciones, deleciones, CNV o variantes estructurales) sobre genes, transcripciones, proteínas y regiones reguladoras. | dbSNP, RefSeq, UniProt, COSMIC, PDBe, 1000 genomas, gnomAD, PubMed | https://www.ensembl.org/info/docs/tools/vep/index.html | [28] |
ANNOVAR | Esta herramienta es adecuada para identificar un pequeño subconjunto de variantes funcionalmente importantes. Utiliza un enfoque de predicción de mutaciones para la anotación | UCSC, RefSeq y Ensembl | http://annovar.openbioinformatics.org/ | [29] |
Jannovar | Esta es una herramienta y biblioteca para la anotación del genoma. | RefSeq, Ensembl, UCSC, etc. | https://github.com/charite/jannovar | [30] |
PhD-SNP | Método basado en SVM que utiliza información de secuencia recuperada por el algoritmo BLAST. | UniRef90 | http://snps.biofold.org/phd-snp/ | [31] |
PolyPhen-2 | Adecuado para predecir efectos dañinos de mutaciones sin sentido. Utiliza la conservación de la secuencia, la estructura para modelar la posición de la sustitución de aminoácidos y la anotación SWISS-PROT | UniProt | http://genetics.bwh.harvard.edu/pph2/ | [32] |
MutationTaster | Adecuado para predecir los efectos dañinos de todas las mutaciones intragénicas (nivel de ADN y proteínas), incluido InDels. | Ensembl, 1000 Genomes Project, ExAC, UniProt, ClinVar, phyloP, phastCons, nnsplice, polyadq (...) | http://www.mutationtaster.org/ | [33] |
Sospechar | Un predictor entrenado en SVM de los efectos dañinos de las mutaciones sin sentido. Utiliza información de conservación de secuencia, estructura y red (interactoma) para modelar el efecto fenotípico de la sustitución de aminoácidos. Acepta archivo VCF | UniProt, PDB, Phyre2 para estructuras predichas, DOMINE y STRING para interactome | http://www.sbg.bio.ic.ac.uk/suspect/index.html | [34] |
F-SNP | Predice computacionalmente SNP funcionales para estudios de asociación de enfermedades. | PolyPhen, SIFT, SNPeffect, SNPs3D, LS-SNP, ESEfinder, RescueESE, ESRSearch, PESX, Ensembl, TFSearch, Consite, GoldenPath, Ensembl, KinasePhos, OGPET, Sulfinator, GoldenPath | http://compbio.cs.queensu.ca/F-SNP/ | [35] |
AnnTools | Diseño para Identificar novedosos y SNP / SNV, INDEL y SV / CNV. AnnTools busca superposiciones con elementos reguladores, loci asociados a enfermedades / rasgos, duplicaciones segmentarias conocidas y regiones propensas a artefactos | dbSNP, UCSC, GATK refGene, GAD, listas publicadas de variación genómica estructural común, base de datos de variantes genómicas, listas de TFB conservados, miARN | http://anntools.sourceforge.net/ | [36] |
SNPit | Analiza la posible importancia funcional de los SNP derivados de estudios de asociación de todo el genoma | dbSNP, EntrezGene, UCSC Browser, HGMD, ECR Browser, Haplotter, SIFT | - / - | [37] |
ESCANEAR | Utiliza anotaciones físicas y funcionales para categorizar según su posición relativa a los genes y según los patrones de desequilibrio de ligamiento (LD) y los efectos sobre los niveles de expresión | - / - | http://www.scandb.org/newinterface/about.html | [38] |
QUEBRAR | Un método basado en redes neuronales para la predicción de los efectos funcionales de SNP no sinónimos | Ensembl, UCSC, Uniprot, UniProt, Pfam, DAS-CBS, MINT, BIND, KEGG, TreeFam | http://www.rostlab.org/services/SNAP | [39] |
SNP y GO | Método basado en SVM que utiliza información de secuencia, anotación de ontología genética y cuando está disponible la estructura de la proteína. | UniRef90, GO, PANTHER, PDB | http://snps.biofold.org/snps-and-go/ | [40] |
LS-SNP | Mapea nsSNP en secuencias de proteínas, rutas funcionales y modelos comparativos de estructura de proteínas | UniProtKB, navegador del genoma, dbSNP, PD | http://www.salilab.org/LS-SNP | [41] |
TRATAR | TREAT es una herramienta para facilitar la navegación y la extracción de las variantes tanto de la resecuenciación dirigida como de la secuenciación completa del exoma. | - / - | http://ndc.mayo.edu/mayo/research/biostat/stand-alone-packages.cfm | [42] |
SNPdat | Adecuado para especies no específicas o datos de organismos de apoyo que no son modelo. SNPdat no requiere la creación de bases de datos relacionales locales ni el procesamiento previo de archivos de entrada obligatorios | - / - | https://code.google.com/p/snpdat/downloads/ | [43] |
NGS - SNP | Anotar SNP comparando el aminoácido de referencia y el aminoácido no de referencia con cada ortólogo | Ensembl, NCBI y UniProt | http://stothard.afns.ualberta.ca/downloads/NGS-SNP/ | [44] |
SVA | Función biológica prevista para variantes identificadas | NCBI RefSeq, Ensembl, bases de datos de variaciones, UCSC, HGNC, GO, KEGG, HapMap, 1000 Genomes Project y DG | http://www.svaproject.org/ | [45] |
VARIANTE | VARIANT aumenta el alcance de la información fuera de las regiones codificantes al incluir toda la información disponible sobre regulación, estructura del ADN, conservación, presiones evolutivas, etc. Las variantes reguladoras constituyen una causa reconocida, pero aún inexplorada, de patologías | dbSNP, 1000 genomas, variantes relacionadas con enfermedades de GWAS, OMIM, COSMIC | http://variant.bioinfo.cipf.es/ | [46] |
TAMIZAR | SIFT es un programa que predice si una sustitución de aminoácidos afecta la función de las proteínas. SIFT utiliza la homología de secuencia para predecir si una sustitución de aminoácidos afectará la función de la proteína | PROT / TrEMBL, o NCBI's | http://blocks.fhcrc.org/sift/SIFT.html | [47] |
LISTA-S2 | LIST-S2 (Identidad local e impuestos compartidos, específicos de la especie) se basa en el supuesto de que las variaciones observadas en especies estrechamente relacionadas son más significativas cuando se evalúa la conservación en comparación con las de especies lejanamente relacionadas. | Taxonomía UniProt SwissProt / TrEMBL y NCBI | https://gsponerlab.msl.ubc.ca/software/list/ | [48] [49] |
FAST-SNP | Un servidor web que permite a los usuarios identificar y priorizar de manera eficiente los SNP de alto riesgo de acuerdo con sus riesgos fenotípicos y supuestos efectos funcionales. | NCBI dbSNP, Ensembl, TFSearch, PolyPhen, ESEfinder, RescueESE, FAS-ESS, SwissProt, UCSC Golden Path, NCBI Blast y HapMap | http://fastsnp.ibms.sinica.edu.tw/ | [50] |
PANTERA | PANTHER relaciona la evolución de la secuencia de proteínas con la evolución de funciones específicas de proteínas y roles biológicos. La fuente de secuencias de proteínas se utilizó para construir los árboles genealógicos de proteínas y utilizó un paso de curación manual asistido por computadora para definir mejor los grupos de familias de proteínas. | STKE, KEGG, MetaCyc, FREX y Reactome | http://www.pantherdb.org/ | [51] |
Meta-SNP | Meta predictor basado en SVM que incluye 4 métodos diferentes. | PhD-SNP, PANTHER, SIFT, SNAP | http://snps.biofold.org/meta-snp | [52] |
PopViz | Visualización centrada en genes integrativa e interactiva de la genética de poblaciones y puntuaciones de predicción de daños por mutación de variantes de genes humanos | gnomAD, Ensembl, UniProt, OMIM, UCSC, CADD, EIGEN, LINSIGHT, SIFT, PolyPhen-2, | http://shiva.rockefeller.edu/PopViz/ | [23] |
Algoritmos usados en herramientas de anotación
Las herramientas de anotación de variantes utilizan algoritmos de aprendizaje automático para predecir anotaciones de variantes. Las diferentes herramientas de anotación utilizan diferentes algoritmos. Los algoritmos comunes incluyen:
- Intervalo / bosque aleatorio, por ejemplo, MutPred, SNPeff
- Redes neuronales, por ejemplo , SNAP
- Soporta máquinas vectoriales, por ejemplo, PhD-SNP, SNP y GO
- Clasificación bayesiana, por ejemplo, PolyPhen-2
Comparación de herramientas de anotación variantes
Hay una gran cantidad de herramientas de anotación de variantes disponibles para la anotación de variantes. La anotación de diferentes herramientas no siempre coincide entre sí, ya que las reglas definidas para el manejo de datos difieren entre aplicaciones. Francamente, es imposible realizar una comparación perfecta de las herramientas disponibles. No todas las herramientas tienen la misma entrada y salida ni la misma funcionalidad. A continuación se muestra una tabla de las principales herramientas de anotación y su área funcional.
Herramientas | Fichero de entrada | Archivo de salida | SNP | INDEL | CNV | WEB o Programa | Fuente | |
---|---|---|---|---|---|---|---|---|
AnnoVar | VCF, pileup, CompleteGenomics, GFF3-SOLiD, SOAPsnp, MAQ, CASAVA | TXT | sí | sí | sí | Programa | [53] | |
Jannovar | VCF | VCF | sí | sí | sí | Programa Java | [54] | |
SNPeff | VCF, pileup / TXT | VCF, TXT, HTML | sí | sí | No | Programa | [55] | |
Conjunto VEP | Ensembl predeterminado (coordenadas), VCF, identificadores de variantes, HGVS, SPDI, regiones de estilo REST | VCF, VEP, TXT, JSON | sí | sí | sí | Web, secuencia de comandos Perl, API REST | [56] | |
AnnTools | VCF, pileup, TXT | VCF | sí | sí | No | No | [57] | |
SeattleSeq | VVCF, MAQ, CASAVA, CAMA GATK | VCF, SeattleSeq | sí | sí | No | Web | [58] | |
VARIANTE | VCF, GFF2, CAMA | informe web, TXT | sí | sí | sí | Web | [59] |
[60]
Solicitud
Las diferentes anotaciones capturan diversos aspectos de la función variante. [61] El uso simultáneo de anotaciones funcionales múltiples y variadas podría mejorar el poder de análisis de asociación de variantes raras de estudios de secuenciación del exoma completo y del genoma completo . [62]
Conclusiones
La próxima generación de servidores web de anotaciones SNP puede aprovechar la creciente cantidad de datos en los recursos bioinformáticos centrales y utilizar agentes inteligentes para obtener datos de diferentes fuentes según sea necesario. Desde el punto de vista del usuario, es más eficiente enviar un conjunto de SNP y recibir los resultados en un solo paso, lo que hace que los metaservidores sean la opción más atractiva. Sin embargo, si las herramientas de anotación SNP brindan datos heterogéneos que cubren la secuencia, estructura, regulación, vías, etc., también deben proporcionar marcos para integrar datos en un algoritmo (s) de decisión y medidas de confianza cuantitativas para que los usuarios puedan evaluar qué datos son relevantes y que no son.
Referencias
- ^ Aubourg S, Rouzé P (2001). "Anotación del genoma". Plant Physiol. Biochem . 29 (3–4): 181–193. doi : 10.1016 / S0981-9428 (01) 01242-6 .
- ^ Karchin R (enero de 2009). "Herramientas de próxima generación para la anotación de SNP humanos" . Sesiones informativas en bioinformática . 10 (1): 35–52. doi : 10.1093 / bib / bbn047 . PMC 2638621 . PMID 19181721 .
- ^ Shen TH, Carlson CS, Tarczy-Hornoch P (agosto de 2009). "SNPit: un sistema de integración de datos federado con el propósito de anotación funcional SNP" . Métodos y programas informáticos en biomedicina . 95 (2): 181–9. doi : 10.1016 / j.cmpb.2009.02.010 . PMC 2680224 . PMID 19327864 .
- ^ NC Oraguzie, EHA Rikkerink, SE Gardiner, HN de Silva (eds.), "Asignación de asociaciones en plantas", Springer, 2007
- ^ Capriotti E, Nehrt NL, Kann MG, Bromberg Y (julio de 2012). "Bioinformática para la interpretación del genoma personal" . Sesiones informativas en bioinformática . 13 (4): 495–512. doi : 10.1093 / bib / bbr070 . PMC 3404395 . PMID 22247263 .
- ^ PH Lee, H. Shatkay, "Clasificación de polimorfismos de un solo nucleótido por posibles efectos deletéreos",Laboratorio de biología computacional y aprendizaje automático, Escuela de Computación, Queen's University, Kingston, ON, Canadá
- ^ "Polimorfismo de nucleótido único" , Wikipedia , 12 de agosto de 2019 , consultado el 3 de septiembre de 2019.
- ^ "Frecuencia de alelos menores" , Wikipedia , 12 de agosto de 2019 , consultado el 3 de septiembre de 2019.
- ^ MJ Li, J. Wang, "Tendencia actual de anotar la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs. 1-9
- ^ Wang Z, Gerstein M, Snyder M (enero de 2009). "RNA-Seq: una herramienta revolucionaria para la transcriptómica" . Nature Reviews Genética . 10 (1): 57–63. doi : 10.1038 / nrg2484 . PMC 2949280 . PMID 19015660 .
- ^ Halvorsen M, Martin JS, Broadaway S, Laederach A (agosto de 2010). "Mutaciones asociadas a enfermedades que alteran el conjunto estructural del ARN" . PLOS Genetics . 6 (8): e1001074. doi : 10.1371 / journal.pgen.1001074 . PMC 2924325 . PMID 20808897 .
- ^ Wan Y, Qu K, Zhang QC, Flynn RA, Manor O, Ouyang Z, Zhang J, Spitale RC, Snyder MP, Segal E, Chang HY (enero de 2014). "Paisaje y variación de la estructura secundaria del ARN en el transcriptoma humano" . Naturaleza . 505 (7485): 706–9. Código bibliográfico : 2014Natur.505..706W . doi : 10.1038 / nature12946 . PMC 3973747 . PMID 24476892 .
- ^ Sauna ZE, Kimchi-Sarfaty C (agosto de 2011). "Comprender la contribución de mutaciones sinónimas a la enfermedad humana". Nature Reviews Genética . 12 (10): 683–91. doi : 10.1038 / nrg3051 . PMID 21878961 . S2CID 8358824 .
- ^ Li MJ, Yan B, Sham PC, Wang J (mayo de 2015). "Exploración de la función de variantes genéticas en las regiones genómicas no codificantes: enfoques para identificar variantes reguladoras humanas que afectan la expresión génica" . Sesiones informativas en bioinformática . 16 (3): 393–412. doi : 10.1093 / bib / bbu018 . PMID 24916300 .
- ^ French JD, Ghoussaini M, Edwards SL, Meyer KB, Michailidou K, Ahmed S, et al. (Abril 2013). "Las variantes funcionales en el locus de riesgo 11q13 para el cáncer de mama regulan la expresión de ciclina D1 a través de potenciadores de largo alcance" . Revista Estadounidense de Genética Humana . 92 (4): 489–503. doi : 10.1016 / j.ajhg.2013.01.002 . PMC 3617380 . PMID 23540573 .
- ^ Faber K, Glatting KH, Mueller PJ, Risch A, Hotz-Wagenblatt A (2011). "Predicción de todo el genoma de SNP modificadores de empalme en genes humanos utilizando una nueva tubería de análisis llamada AASsites" . BMC Bioinformática . 12 Suppl 4 (Suppl 4): S2. doi : 10.1186 / 1471-2105-12-s4-s2 . PMC 3194194 . PMID 21992029 .
- ^ Kumar V, Westra HJ, Karjalainen J, Zhernakova DV, Esko T, Hrdlickova B, Almeida R, Zhernakova A, Reinmaa E, Võsa U, Hofker MH, Fehrmann RS, Fu J, Withoff S, Metspalu A, Franke L, Wijmenga C (2013). "La variación genética asociada a enfermedades humanas afecta la expresión de ARN no codificante intergénico grande" . PLOS Genetics . 9 (1): e1003201. doi : 10.1371 / journal.pgen.1003201 . PMC 3547830 . PMID 23341781 .
- ^ MJ Li, J. Wang, "Tendencia actual de anotar la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs. 1-9
- ^ J. Wu, R. Jiang, "Predicción del polimorfismo de un solo nucleótido no sinónimo perjudicial para las enfermedades humanas", The Scientific World Journal, 2013, 10 páginas
- ^ Sim NL, Kumar P, Hu J, Henikoff S, Schneider G, Ng PC (julio de 2012). "Servidor web SIFT: predecir los efectos de las sustituciones de aminoácidos en las proteínas" . Investigación de ácidos nucleicos . 40 (Problema del servidor web): W452–7. doi : 10.1093 / nar / gks539 . PMC 3394338 . PMID 22689647 .
- ^ Adzhubei IA, Schmidt S, Peshkin L, Ramensky VE, Gerasimova A, Bork P, Kondrashov AS, Sunyaev SR (abril de 2010). "Un método y un servidor para predecir mutaciones de sentido erróneo dañinas" . Métodos de la naturaleza . 7 (4): 248–9. doi : 10.1038 / nmeth0410-248 . PMC 2855889 . PMID 20354512 .
- ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (agosto de 2010). "MutationTaster evalúa el potencial causante de enfermedades de alteraciones de secuencia". Métodos de la naturaleza . 7 (8): 575–6. doi : 10.1038 / nmeth0810-575 . PMID 20676075 . S2CID 26892938 .
- ^ a b c Zhang P, Bigio B, Rapaport F, Zhang S, Casanova J, Abel L, Boisson B, Itan Y, Stegle O (2018). "PopViz: un servidor web para visualizar frecuencias de alelos menores y puntuaciones de predicción de daños de variaciones genéticas humanas" . Bioinformática . 34 (24): 4307–4309. doi : 10.1093 / bioinformatics / bty536 . PMC 6289133 . PMID 30535305 .
- ^ MJ Li, J. Wang, "Tendencia actual de anotar la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs. 1-9
- ^ Ofoegbu TC, David A, Kelley LA, Mezulis S, Islam SA, Mersmann SF, Stromich L, Vakser IA, Houlston RS, Sternberg MJ (2019). "PhyreRisk: una aplicación web dinámica para unir genómica, proteómica y datos estructurales 3D para guiar la interpretación de variantes genéticas humanas" . J Mol Biol . 431 (13): 2460–2466. doi : 10.1016 / j.jmb.2019.04.043 . PMC 6597944 . PMID 31075275 .
- ^ Ittisoponpisan S, Islam SA, Khanna T, Alhuzimi E, David A, Sternberg MJ (2019). "¿Pueden las estructuras 3D de proteínas predichas proporcionar conocimientos fiables sobre si las variantes de sentido erróneo están asociadas a enfermedades?" . J Mol Biol . 431 (11): 2197–2212. doi : 10.1016 / j.jmb.2019.04.009 . PMC 6544567 . PMID 30995449 .
- ^ Cingolani P, Platts A, Wang L, Coon M, Nguyen T, Wang L, Land SJ, Lu X, Ruden DM (2012). "Un programa para anotar y predecir los efectos de polimorfismos de un solo nucleótido, SnpEff: SNPs en el genoma de la cepa w1118 de Drosophila melanogaster; iso-2; iso-3" . Vuela . 6 (2): 80–92. doi : 10.4161 / fly.19695 . PMC 3679285 . PMID 22728672 .
- ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, Flicek P, Cunningham F (junio de 2016). "El predictor de efectos de variante de Ensembl" . Biología del genoma . 17 (1): 122. doi : 10.1186 / s13059-016-0974-4 . PMC 4893825 . PMID 27268795 .
- ^ Wang K, Li M, Hakonarson H (septiembre de 2010). "ANNOVAR: anotación funcional de variantes genéticas de datos de secuenciación de alto rendimiento" . Investigación de ácidos nucleicos . 38 (16): e164. doi : 10.1093 / nar / gkq603 . PMC 2938201 . PMID 20601685 .
- ^ Jäger M, Wang K, Bauer S, Smedley D, Krawitz P, Robinson PN (mayo de 2014). "Jannovar: una biblioteca de Java para la anotación de exoma". Mutación humana . 35 (5): 548–55. doi : 10.1002 / humu.22531 . PMID 24677618 . S2CID 10822001 .
- ^ Capriotti E, Calabrese R, Casadio R (noviembre de 2006). "Predecir el surgimiento de enfermedades genéticas humanas asociadas a mutaciones de proteínas de un solo punto con máquinas de vectores de apoyo e información evolutiva" (PDF) . Bioinformática . 22 (22): 2729–34. doi : 10.1093 / bioinformatics / btl423 . PMID 16895930 .
- ^ Adzhubei I, Jordan DM, Sunyaev SR (enero de 2013). "Predicción del efecto funcional de mutaciones sin sentido humano utilizando PolyPhen-2" . Protocolos actuales en genética humana . Capítulo 7: 7.20.1–7.20.41. doi : 10.1002 / 0471142905.hg0720s76 . PMC 4480630 . PMID 23315928 .
- ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (agosto de 2010). "MutationTaster evalúa el potencial causante de enfermedades de alteraciones de secuencia". Métodos de la naturaleza . 7 (8): 575–6. doi : 10.1038 / nmeth0810-575 . PMID 20676075 . S2CID 26892938 .
- ^ Yates CM, Filippis I, Kelley LA, Sternberg MJ (julio de 2014). "SuSPect: predicción mejorada del fenotipo de variante de aminoácido único (SAV) utilizando características de red" . Revista de Biología Molecular . 426 (14): 2692–701. doi : 10.1016 / j.jmb.2014.04.026 . PMC 4087249 . PMID 24810707 .
- ^ Lee PH, Shatkay H (enero de 2008). "F-SNP: SNP funcionales predichos computacionalmente para estudios de asociación de enfermedades" . Investigación de ácidos nucleicos . 36 (Problema de la base de datos): D820–4. doi : 10.1093 / nar / gkm904 . PMC 2238878 . PMID 17986460 .
- ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (marzo de 2012). "AnnTools: un conjunto de herramientas de anotación completo y versátil para variantes genómicas" . Bioinformática . 28 (5): 724–5. doi : 10.1093 / bioinformatics / bts032 . PMC 3289923 . PMID 22257670 .
- ^ Shen TH, Carlson CS, Tarczy-Hornoch P (agosto de 2009). "SNPit: un sistema de integración de datos federado con el propósito de anotación funcional SNP" . Métodos y programas informáticos en biomedicina . 95 (2): 181–9. doi : 10.1016 / j.cmpb.2009.02.010 . PMC 2680224 . PMID 19327864 .
- ^ Gamazon ER, Zhang W, Konkashbaev A, Duan S, Kistner EO, Nicolae DL, Dolan ME, Cox NJ (enero de 2010). "ESCANEAR: SNP y anotación de número de copia" . Bioinformática . 26 (2): 259–62. doi : 10.1093 / bioinformatics / btp644 . PMC 2852202 . PMID 19933162 .
- ^ Bromberg Y, Rost B (2007). "SNAP: predecir el efecto de polimorfismos no sinónimos en la función" . Investigación de ácidos nucleicos . 35 (11): 3823–35. doi : 10.1093 / nar / gkm238 . PMC 1920242 . PMID 17526529 .
- ^ Calabrese R, Capriotti E, Fariselli P, Martelli PL, Casadio R (agosto de 2009). "Las anotaciones funcionales mejoran la puntuación predictiva de mutaciones en proteínas relacionadas con enfermedades humanas" (PDF) . Mutación humana . 30 (8): 1237–44. doi : 10.1002 / humu.21047 . PMID 19514061 . S2CID 33900765 .
- ^ Karchin R, Diekhans M, Kelly L, Thomas DJ, Pieper U, Eswar N, Haussler D, Sali A (junio de 2005). "LS-SNP: anotación a gran escala de codificación de SNP no sinónimos basada en múltiples fuentes de información" . Bioinformática . 21 (12): 2814-20. doi : 10.1093 / bioinformatics / bti442 . PMID 15827081 .
- ^ Asmann YW, Middha S, Hossain A, Baheti S, Li Y, Chai HS, Sun Z, Duffy PH, Hadad AA, Nair A, Liu X, Zhang Y, Klee EW, Kalari KR, Kocher JP (enero de 2012). "TREAT: una herramienta bioinformática para anotaciones y visualizaciones variantes en datos de secuenciación de exoma y específicos" . Bioinformática . 28 (2): 277–8. doi : 10.1093 / bioinformatics / btr612 . PMC 3259432 . PMID 22088845 .
- ^ Doran AG, Creevey CJ (febrero de 2013). "Snpdat: anotación fácil y rápida de resultados de proyectos de descubrimiento de novo snp para organismos modelo y no modelo" . BMC Bioinformática . 14 : 45. doi : 10.1186 / 1471-2105-14-45 . PMC 3574845 . PMID 23390980 .
- ^ Grant JR, Arantes AS, Liao X, Stothard P (agosto de 2011). "Anotación en profundidad de SNP que surgen de proyectos de resecuenciación utilizando NGS-SNP" . Bioinformática . 27 (16): 2300–1. doi : 10.1093 / bioinformatics / btr372 . PMC 3150039 . PMID 21697123 .
- ^ Ge D, Ruzzo EK, Shianna KV, He M, Pelak K, Heinzen EL, Need AC, Cirulli ET, Maia JM, Dickson SP, Zhu M, Singh A, Allen AS, Goldstein DB (julio de 2011). "SVA: software para anotar y visualizar genomas humanos secuenciados" . Bioinformática . 27 (14): 1998–2000. doi : 10.1093 / bioinformatics / btr317 . PMC 3129530 . PMID 21624899 .
- ^ Medina I, De Maria A, Bleda M, Salavert F, Alonso R, Gonzalez CY, Dopazo J (julio de 2012). "VARIANT: Línea de comandos, servicio web e interfaz web para una caracterización funcional rápida y precisa de las variantes encontradas por la secuenciación de próxima generación" . Investigación de ácidos nucleicos . 40 (Problema del servidor web): W54–8. doi : 10.1093 / nar / gks572 . PMC 3394276 . PMID 22693211 .
- ^ Ng PC; Henikoff S. (2003). "SIFT: predecir cambios de aminoácidos que afectan la función de las proteínas" . Investigación de ácidos nucleicos . 31 (13): 3812–3814. doi : 10.1093 / nar / gkg509 . PMC 168916 . PMID 12824425 .
- ^ Nawar Malhis; Steven JM Jones; Jörg Gsponer (2019). "Medidas mejoradas para la conservación evolutiva que aprovechan las distancias taxonómicas" . Comunicaciones de la naturaleza . 10 (1): 1556. Bibcode : 2019NatCo..10.1556M . doi : 10.1038 / s41467-019-09583-2 . PMC 6450959 . PMID 30952844 .
- ^ Nawar Malhis; Matthew Jacobson; Steven JM Jones; Jörg Gsponer (2020). "LISTA-S2: clasificación basada en taxonomía de mutaciones deletéreas sin sentido entre especies" . Investigación de ácidos nucleicos . 48 (W1): W154 – W161. doi : 10.1093 / nar / gkaa288 . PMC 7319545 . PMID 32352516 .
- ^ Yuan HY, Chiou JJ, Tseng WH, Liu CH, Liu CK, Lin YJ, Wang HH, Yao A, Chen YT, Hsu CN (julio de 2006). "FASTSNP: un servicio siempre actualizado y ampliable para el análisis y priorización de funciones SNP" . Investigación de ácidos nucleicos . 34 (Problema del servidor web): W635–41. doi : 10.1093 / nar / gkl236 . PMC 1538865 . PMID 16845089 .
- ^ Mi H, Guo N, Kejariwal A, Thomas PD (enero de 2007). "PANTHER versión 6: secuencia de proteínas y datos de evolución de funciones con representación ampliada de vías biológicas" . Investigación de ácidos nucleicos . 35 (Problema de la base de datos): D247–52. doi : 10.1093 / nar / gkl869 . PMC 1716723 . PMID 17130144 .
- ^ Capriotti E, Altman RB, Bromberg Y (2013). "El juicio colectivo predice variantes de un solo nucleótido asociadas a la enfermedad" . BMC Genomics . 14 Supl. 3: S2. doi : 10.1186 / 1471-2164-14-S3-S2 . PMC 3839641 . PMID 23819846 .
- ^ Wang K, Li M, Hakonarson H (septiembre de 2010). "ANNOVAR: anotación funcional de variantes genéticas de datos de secuenciación de alto rendimiento" . Investigación de ácidos nucleicos . 38 (16): e164. doi : 10.1093 / nar / gkq603 . PMC 2938201 . PMID 20601685 .
- ^ "charite / jannovar" . GitHub . Consultado el 25 de septiembre de 2016 .
- ^ Cingolani P, Platts A, Wang L, Coon M, Nguyen T, Wang L, Land SJ, Lu X, Ruden DM (2012). "Un programa para anotar y predecir los efectos de polimorfismos de un solo nucleótido, SnpEff: SNPs en el genoma de la cepa w1118 de Drosophila melanogaster; iso-2; iso-3" . Vuela . 6 (2): 80–92. doi : 10.4161 / fly.19695 . PMC 3679285 . PMID 22728672 .
- ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, Flicek P, Cunningham F (junio de 2016). "El predictor de efectos de variante de Ensembl" . Biología del genoma . 17 (1): 122. doi : 10.1186 / s13059-016-0974-4 . PMC 4893825 . PMID 27268795 .
- ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (marzo de 2012). "AnnTools: un conjunto de herramientas de anotación completo y versátil para variantes genómicas" . Bioinformática . 28 (5): 724–5. doi : 10.1093 / bioinformatics / bts032 . PMC 3289923 . PMID 22257670 .
- ^ "Archivo de lista de variaciones de entrada para anotación" . SeattleSeq Anotación 151 .
- ^ Medina I, De Maria A, Bleda M, Salavert F, Alonso R, Gonzalez CY, Dopazo J (julio de 2012). "VARIANT: Línea de comandos, servicio web e interfaz web para una caracterización funcional rápida y precisa de las variantes encontradas por la secuenciación de próxima generación" . Investigación de ácidos nucleicos . 40 (Problema del servidor web): W54–8. doi : 10.1093 / nar / gks572 . PMC 3394276 . PMID 22693211 .
- ^ Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, Krabichler B, Speicher MR, Zschocke J, Trajanoski Z (marzo de 2014). "Una encuesta de herramientas para el análisis de variantes de datos de secuenciación del genoma de próxima generación" . Sesiones informativas en bioinformática . 15 (2): 256–78. doi : 10.1093 / bib / bbs086 . PMC 3956068 . PMID 23341494 .
- ^ Lee, Phil H .; Lee, Christian; Li, Xihao; Wee, Brian; Dwivedi, Tushar; Daly, Mark (enero de 2018). "Principios y métodos de priorización in-silico de variantes regulatorias no codificantes" . Genética humana . 137 (1): 15-30. doi : 10.1007 / s00439-017-1861-0 . PMC 5892192 . PMID 29288389 .
- ^ Li, Xihao; Li, Zilin; Zhou, Hufeng; Gaynor, Sheila M .; Liu, Yaowu; Chen, Han; Sun, Ryan; Dey, Rounak; Arnett, Donna K .; Aslibekyan, Stella; Ballantyne, Christie M .; Bielak, Lawrence F .; Blangero, John; Boerwinkle, Eric; Bowden, Donald W .; Broome, Jai G; Conomos, Matthew P; Correa, Adolfo; Cupples, L. Adrienne; Curran, Joanne E .; Freedman, Barry I .; Guo, Xiuqing; Hindy, George; Irvin, Marguerite R .; Kardia, Sharon LR; Kathiresan, Sekar; Khan, Alyna T .; Kooperberg, Charles L .; Laurie, Cathy C .; Liu, X. Shirley; Mahaney, Michael C .; Manichaiku, Ani W .; Martin, Lisa W .; Mathias, Rasika A .; McGarvey, Stephen T .; Mitchell, Braxton D .; Montasser, May E .; Moore, Jill E .; Morrison3, Alanna C .; O'Connell, Jeffrey R .; Palmer, Nicholette D .; Pampana, Akhil; Peralta, Juan M .; Peyser, Patricia A .; Psaty, Bruce M .; Redline, Susan; Rice, Kenneth M .; Rich, Stephen S .; Smith, Jennifer A .; Tiwari, Hemant K .; Tsai, Michael Y .; Vasan, Ramachandran S .; Wang, Fei Fei; Weeks, Daniel E .; Weng, Zhiping; Wilson, James G .; Yanek, Lisa R .; El Consorcio Trans-Omics for Precision Medicine (TOPMed) del NHLBI; Grupo de trabajo sobre lípidos de TOPMed; Neale, Benjamin M .; Sunyaev, Shamil R .; Abecasis, Gonçalo R .; Rotter, Jerome I .; Willer, Cristen J .; Peloso, Gina M .; Natarajan, Pradeep; Lin, Xihong (septiembre de 2020). "La incorporación dinámica de múltiples anotaciones funcionales in silico permite el análisis de asociación de variantes raras de grandes estudios de secuenciación del genoma completo a escala" . Genética de la naturaleza . 52 (9): 969–983. doi : 10.1038 / s41588-020-0676-4 . ISSN 1061-4036 . PMC 7483769 . PMID 32839606 .