La asignación filogenética de linajes de brotes globales nombrados (PANGOLIN) es una herramienta de software desarrollada por miembros del laboratorio Rambaut , y la aplicación web asociada es desarrollada por el Centro de vigilancia de patógenos genómicos en South Cambridgeshire . [2] Su propósito es implementar la nomenclatura dinámica de los linajes SARS-CoV-2 , conocida como nomenclatura PANGO. [3] Un usuario con una secuencia completa del genoma de una muestra de SARS-CoV-2 (el virus que causa COVID-19 ) puede usar la herramienta para enviar esa secuencia, que luego se compara con otras secuencias del genoma y se le asigna la mayor cantidad probable linaje (linaje PANGO). [4]Son posibles ejecuciones únicas o múltiples, y la herramienta puede devolver más información sobre el historial conocido del linaje asignado. [4] Además, interactúa con Microreact, para mostrar una secuencia de tiempo de la ubicación de los informes de muestras secuenciadas del mismo linaje. [4] Esta última característica se basa en genomas disponibles públicamente obtenidos del COVID-19 Genomics UK Consortium y de los presentados a GISAID . [4]
![]() Logotipo de PANGOLIN | |
Versión inicial | 30 de abril de 2020 |
---|---|
Lanzamiento estable | 2.4.2 [1] ![]() |
Repositorio | github |
Escrito en | Pitón |
Licencia | Licencia pública general GNU v3.0 |
Sitio web | pangolín ![]() |
Contexto
PANGOLIN es un componente clave que sustenta el sistema de nomenclatura PANGO. [5]
Como se describe en Andrew Rambaut et al. (2020), [3] un linaje PANGO se describe como un grupo de secuencias que están asociadas con un evento epidemiológico, por ejemplo, una introducción del virus en un área geográfica distinta con evidencia de propagación progresiva. Los linajes están diseñados para capturar el borde emergente de la pandemia y tienen una resolución de grano fino adecuada para la vigilancia epidemiológica genómica y la investigación de brotes.
Tanto la herramienta como el sistema de nomenclatura PANGOLIN se han utilizado ampliamente durante la pandemia de COVID-19 . [3] [6] [7]
Descripción
Designación de linaje
A diferencia de la herramienta PANGOLIN, los linajes de Pango se seleccionan de forma regular y manual en función de la diversidad que circula actualmente a nivel mundial. Se construye un gran árbol filogenético a partir de una alineación que contiene genomas de SARS-CoV-2 disponibles públicamente, y los subgrupos de secuencias de este árbol se examinan manualmente y se comparan con la información epidemiológica para designar nuevos linajes; estos pueden ser designados por los productores de datos, y las sugerencias de linaje se pueden enviar al equipo de Pango a través de una solicitud de problema de GitHub . [8] [9] [ se necesita más explicación ]
Entrenamiento de modelos
Estas designaciones de linaje seleccionadas manualmente y las secuencias del genoma asociadas son la entrada al entrenamiento del modelo de aprendizaje automático. Este modelo, tanto la formación como la asignación, se ha denominado 'pangoLEARN'. La versión actual de pangoLEARN usa un árbol de clasificación, basado en la implementación scikit learn [10] de un clasificador de árbol de decisión.
Asignación de linaje
Originalmente, PANGOLIN usó un algoritmo de asignación basado en la máxima verosimilitud para asignar a la consulta SARS-CoV-2 la secuencia de linaje más probable. Sin embargo, desde el lanzamiento de la Versión 2.0 en julio de 2020, ha utilizado el algoritmo de asignación basado en aprendizaje automático 'pangoLEARN' para asignar linajes a nuevos genomas de SARS-CoV-2. [11] Este enfoque es rápido y puede asignar un gran número de genomas del SARS-CoV-2 en un tiempo relativamente corto. [12]
Disponibilidad
PANGOLIN está disponible como una herramienta basada en la línea de comandos, descargable desde Conda y desde un repositorio de GitHub, [11] y como una aplicación web [13] con una interfaz gráfica de usuario de arrastrar y soltar. La aplicación web PANGOLIN ha asignado más de 512.000 secuencias únicas de SARS-CoV-2 hasta enero de 2021. [ cita requerida ]
Creadores / Desarrolladores
PANGOLIN fue creado por Áine O'Toole y el laboratorio Rambaut y lanzado el 5 de abril de 2020. Los principales desarrolladores de PANGOLIN son Áine O'Toole y Emily Scher; muchos otros han contribuido a varios aspectos de la herramienta, incluidos Ben Jackson, JT McCrone, Verity Hill y Rachel Colquhoun del Rambaut Lab. [4]
La aplicación web PANGOLIN fue desarrollada por el Centro de Vigilancia de Patógenos Genómicos [13], a saber, Anthony Underwood, Ben Taylor, Corin Yeats, Khali Abu-Dahab y David Aanensen. [4]
Ver también
Referencias
- ^ "Versión 2.4.2" . 5 de mayo de 2021 . Consultado el 21 de mayo de 2021 .
- ^ "Epidemiología en tiempo real para COVID-19" . www.pathogensurveillance.net . Consultado el 22 de enero de 2021 .
- ^ a b c Rambaut, A .; Holmes, EC; O'Toole, Á .; et al. (2020). "Una propuesta de nomenclatura dinámica para linajes de SARS-CoV-2 para ayudar a la epidemiología genómica" . Microbiología de la naturaleza . 5 (11): 1403–1407. doi : 10.1038 / s41564-020-0770-5 . PMID 32669681 . S2CID 220544096 .
- ^ a b c d e f "Lanzamiento de la aplicación web Pangolin" . virological.org . Mayo de 2020 . Consultado el 18 de febrero de 2021 .
- ^ "Anexo: una propuesta de nomenclatura dinámica para los linajes de SARS-CoV-2 para ayudar a la epidemiología genómica" . Microbiología de la naturaleza . 15 de julio de 2020. doi : 10.1038 / s41564-021-00872-5 . Consultado el 4 de marzo de 2021 .
- ^ Tubos, Lenore; Wang, Hongru; Huelsenbeck, John P; Nielsen, Rasmus (9 de diciembre de 2020). Malik, Harmit (ed.). "Evaluación de la incertidumbre en el enraizamiento de la filogenia del SARS-CoV-2" . Biología Molecular y Evolución . Prensa de la Universidad de Oxford (OUP). doi : 10.1093 / molbev / msaa316 . ISSN 0737-4038 .
- ^ Jacob, Jobin John; Vasudevan, Karthick; Pragasam, Agila Kumari; Gunasekaran, Karthik; Kang, Gagandeep; Veeraraghavan, Balaji; Mutreja, Ankur (22 de diciembre de 2020). "El seguimiento evolutivo de las variantes genéticas del SARS-CoV-2 destaca el intrincado equilibrio de mutaciones estabilizadoras y desestabilizadoras". bioRxiv 10.1101 / 2020.12.22.423920 .
La herramienta de asignación filogenética de Linajes de brotes globales nombrados (PANGOLIN) ha sido la herramienta más utilizada para la asignación de linajes a variantes emergentes.
Parámetro desconocido|url=
ignorado ( ayuda ) - ^ "PangoLEARN Store del modelo entrenado para que PANGOLIN acceda" . GitHub: cov-lineages / pangoLEARN . Consultado el 13 de febrero de 2021 .
- ^ "Linajes PANGO" . cov-lineages.org . Consultado el 4 de marzo de 2021 .
- ^ "sklearn.tree.DecisionTreeClassifier" . scikit-learn.org . Consultado el 13 de febrero de 2021 .
- ^ a b "linajes cov / pangolín" . GitHub: linajes cov / pangolin . Consultado el 13 de febrero de 2021 .
- ^ "pangoLEARN PANGOLIN 2.0: descripción de pangoLEARN" . cov-lineages.org . Consultado el 3 de marzo de 2021 .
El modelo se entrenó usando ~ 60,000 secuencias de SARS-CoV-2 de GISAID ... el entrenamiento de este modelo lleva aproximadamente 30 minutos en nuestro hardware
- ^ a b "Asignador de linaje Pangolin COVID-19" . pangolin.cog-uk.io . Consultado el 13 de febrero de 2021 .
enlaces externos
- pangolín en GitHub
- Página web oficial