SnpEff


SnpEff es una herramienta de código abierto que anota variantes y predice sus efectos en los genes utilizando un enfoque de bosque de intervalos. Este programa toma variantes predeterminadas enumeradas en un archivo de datos que contiene el cambio de nucleótido y su posición y predice si las variantes son perjudiciales. Este programa fue creado por primera vez por Pablo Cingolani para predecir los efectos de los polimorfismos de un solo nucleótido (SNP) en Drosophila , [1] y ahora se usa ampliamente en muchas universidades como la Universidad de Harvard, UC Berkeley, la Universidad de Stanford, etc. [2] SnpEff ha sido utilizado para diversas aplicaciones [3] [4] [5] – de medicina personalizada en la Universidad de Stanford, [6]para perfilar bacterias. [7] Este software de anotación y predicción se puede comparar con ANNOVAR y Variant Effect Predictor , pero cada uno usa nomenclaturas diferentes [8] [9]

SnpEff tiene la capacidad de funcionar en sistemas Windows, Unix o Mac, aunque los pasos de instalación difieren. Para todos los sistemas, SnpEff primero se descarga como un archivo ZIP, se descomprime [10] y luego se copia y pega en el software deseado (Windows) o requiere una línea de comando adicional (Unix y Mac). Una vez que se instala el software, el usuario ingresa un archivo VCF o TXT en el kit de herramientas que contiene las columnas separadas por tabulaciones: Nombre del cromosoma , Posición, ID de la variante, Genoma de referencia , Alternativa, Puntuación de calidad, Filtro de calidad e Información.

Las columnas de nombre y posición del cromosoma describen dónde se encuentra la variante: número de cromosoma y posición de nucleótido. Si la variante tiene un nombre previamente determinado (ejemplo: rs34567), va en la columna ID. La columna de referencia proporciona el nucleótido específico en el genoma de referencia; las diferenciaciones de la referencia se indican en la sección Alternativa. La precisión de la variante será la columna de calidad y su lectura de los filtros de calidad se incluirán en la columna de filtro. Cualquier otra información genómica se coloca en la columna INFO, que se modifica para mostrar el resultado después de ejecutar SnpEff.

La salida en la sección INFO incluye: el efecto de la variante (stop loss, stop gain, etc.), impacto del efecto en el gen (Alto, Moderado, Bajo o Modificador), clase funcional de la variante (sin sentido, sin sentido, frameshift, etc. .), cambio de codón, cambio de aminoácido, longitud de aminoácido, nombre de gen, biotipo de gen (codificación de proteínas, pseudogén, ARNr, etc. [11] ), información de codificación, información de transcripción, información de exón y cualquier error o advertencia detectado. El impacto del efecto es lo que usa SnpEff para determinar qué tan perjudicial es la variante en los genes. Por ejemplo, un resultado de ALTO impacto significa que SnpEff predice que la variante causa efectos genéticos nocivos.

SnpEff se utiliza normalmente con fines académicos y de investigación en instituciones y empresas y, en algunos casos, en medicina personalizada. [ cita requerida ] Sin embargo, Pablo Cingolani ahora recomienda que ClinEff (una combinación de SnpEff y SnpSift) se use con fines médicos. [ cita requerida ]


Vía de uso para SnpEff
Ejemplo de archivo de entrada SnpEff
Ejemplo de salida SnpEff