De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

AlphaFold es un programa de inteligencia artificial desarrollado por DeepMind de Google que realiza predicciones de la estructura de las proteínas . [1] El programa está diseñado como un sistema de aprendizaje profundo . [2]

El software AlphaFold AI se ha destacado en dos versiones principales. Un equipo de investigadores que utilizó AlphaFold 1 (2018) ocupó el primer lugar en la clasificación general de la 13a Evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP) en diciembre de 2018. El programa fue particularmente exitoso al predecir la estructura más precisa para los objetivos calificados como el más difícil para los organizadores de la competición, donde no se disponía de estructuras de plantilla existentes a partir de proteínas con una secuencia parcialmente similar. Un equipo que usó AlphaFold 2 (2020) repitió la ubicación en la competencia CASP en noviembre de 2020. [3] El equipo logró un nivel de precisión mucho más alto que cualquier otro grupo. [2]Obtuvo un puntaje superior a 90 para alrededor de dos tercios de las proteínas en la prueba de distancia global (GDT) de CASP , una prueba que mide el grado en que un programa computacional predice la estructura es similar a la estructura determinada por el experimento de laboratorio, siendo 100 una coincidencia completa. dentro del límite de distancia utilizado para calcular GDT. [2] [4]

Los resultados de AlphaFold 2 en CASP se describieron como "asombrosos" [5] y transformadores. [6] Algunos investigadores notaron que la precisión no es lo suficientemente alta para un tercio de sus predicciones, y que no revela el mecanismo o las reglas del plegamiento de proteínas para que el problema del plegamiento de proteínas se considere resuelto. [7] [8] Sin embargo, ha habido un respeto generalizado por el logro técnico.

Al 5 de marzo de 2021, DeepMind no ha puesto ningún código para AlphaFold 2 a disposición del público para los investigadores. Cuatro meses después de anunciar los resultados de CASP14, el sitio web de la compañía dice: "Estamos justo al comienzo de explorar la mejor manera de permitir que otros grupos utilicen nuestras predicciones de estructura, además de preparar un artículo revisado por pares para su publicación". [9]

Problema de plegamiento de proteínas [ editar ]

Las cadenas de aminoácidos, conocidas como polipéptidos , se pliegan para formar una proteína.

Las proteínas consisten en cadenas de aminoácidos que se pliegan espontáneamente, en un proceso llamado plegamiento de proteínas , para formar las estructuras tridimensionales (3-D) de las proteínas. La estructura 3-D es crucial para la función biológica de la proteína, sin embargo, comprender cómo la secuencia de aminoácidos puede determinar la estructura 3-D es un gran desafío, y esto se denomina "problema de plegamiento de proteínas". [10]El "problema del plegamiento de proteínas" implica comprender la termodinámica de las fuerzas interatómicas que determinan la estructura estable plegada, el mecanismo y la vía a través de los cuales una proteína puede alcanzar su estado plegado final con extrema rapidez y cómo se puede predecir la estructura nativa de una proteína. de su secuencia de aminoácidos. [11]

Las estructuras de las proteínas se determinan actualmente de forma experimental utilizando técnicas como la cristalografía de rayos X , la microscopía crioelectrónica y la resonancia magnética nuclear , técnicas que son costosas y requieren mucho tiempo. [10] Estos esfuerzos han identificado las estructuras de unas 170.000 proteínas durante los últimos 60 años, mientras que hay más de 200 millones de proteínas conocidas en todas las formas de vida. [4] Si es posible predecir la estructura de la proteína solo a partir de la secuencia de aminoácidos, sería de gran ayuda para avanzar en la investigación científica. Sin embargo, la paradoja de Levinthalmuestra que si bien una proteína se puede plegar en milisegundos, el tiempo que lleva calcular todas las estructuras posibles al azar para determinar la verdadera estructura nativa es más largo que la edad del universo conocido, lo que hizo que la predicción de las estructuras de las proteínas fuera un gran desafío en biología para los científicos. [10]

A lo largo de los años, los investigadores han aplicado numerosos métodos computacionales para resolver el problema de la predicción de la estructura de las proteínas , pero su precisión no se ha acercado a la de las técnicas experimentales, a excepción de las proteínas pequeñas y simples, lo que limita su valor. CASP , que se lanzó en 1994 para desafiar a la comunidad científica a producir sus mejores predicciones de estructura de proteínas, descubrió que solo se pueden lograr puntuaciones de GDT de aproximadamente 40 de 100 para las proteínas más difíciles para 2016. [4] AlphaFold comenzó a competir en el CASP 2018 utilizando una técnica de aprendizaje profundo de inteligencia artificial (IA) . [10]

Algoritmo [ editar ]

Si bien los detalles completos de los algoritmos 2020 de AlphaFold no se han publicado públicamente, se esperan más cuando DeepMind publique artículos científicos que describan sus métodos y resultados. Se sabe que DeepMind ha entrenado el programa en más de 170.000 proteínas de un depósito público de secuencias y estructuras de proteínas. El programa utiliza una forma de red de atención , una técnica de aprendizaje profundo que se enfoca en hacer que el algoritmo de IA identifique partes de un problema mayor y luego lo junte para obtener la solución general. [2] La formación general se llevó a cabo sobre la potencia de procesamiento entre 100 y 200 GPU . [2]El entrenamiento del sistema en este hardware tomó "algunas semanas", después de lo cual el programa tardaría "unos días" en converger para cada estructura. [9]

AlphaFold 1, 2018 [ editar ]

AlphaFold 1 (2018) se basó en el trabajo desarrollado por varios equipos en la década de 2010, un trabajo que analizó los grandes bancos de datos de secuencias de ADN relacionadas ahora disponibles de muchos organismos diferentes (la mayoría sin estructuras 3D conocidas), para tratar de encontrar cambios en diferentes residuos. que parecía estar correlacionado, aunque los residuos no eran consecutivos en la cadena principal. Tales correlaciones sugieren que los residuos pueden estar cerca unos de otros físicamente, aunque no estén cerca en la secuencia, lo que permite estimar un mapa de contacto . Basándose en trabajos recientes anteriores a 2018, AlphaFold 1 amplió esto para estimar una distribución de probabilidad de cómoEs probable que estén cerca los residuos, convirtiendo el mapa de contacto en un mapa de distancia probable. También utilizó métodos de aprendizaje más avanzados que antes para desarrollar la inferencia. Combinando un potencial estadístico basado en esta distribución de probabilidad con la energía libre local calculada de la configuración, el equipo pudo utilizar el descenso de gradiente a una solución que se ajustaba mejor a ambos. [ aclaración necesaria ] [12] [13]

Más técnicamente, Torrisi et al resumieron en 2019 el enfoque de AlphaFold versión 1 de la siguiente manera: [14]

El elemento central de AlphaFold es un predictor de mapa de distancia implementado como redes neuronales residuales muy profundas con 220 bloques residuales que procesan una representación de dimensionalidad 64 × 64 × 128, correspondiente a las características de entrada calculadas a partir de dos fragmentos de 64 aminoácidos. Cada bloque residual tiene tres capas, incluida una capa convolucional dilatada de 3 × 3; los bloques pasan por la dilatación de los valores 1, 2, 4 y 8. En total, el modelo tiene 21 millones de parámetros. La red utiliza una combinación de entradas 1D y 2D, incluidos perfiles evolutivos de diferentes fuentes y características de coevolución. Junto con un mapa de distancias en forma de histograma de distancias muy detallado, AlphaFold predice ángulos Φ y Ψpara cada residuo que se utilizan para crear la estructura 3D prevista inicial. Los autores de AlphaFold concluyeron que la profundidad del modelo, su gran tamaño de cultivo, el gran conjunto de entrenamiento de aproximadamente 29,000 proteínas, las técnicas modernas de Deep Learning y la riqueza de información del histograma predicho de distancias ayudaron a AlphaFold a lograr una alta precisión de predicción de mapas de contacto. .

AlphaFold 2, 2020 [ editar ]

Diseño de bloque AlphaFold 2. Los dos módulos de transformación basados ​​en la atención se pueden ver en medio del diseño. (Fuente: [9] )

La versión 2020 del programa ( AlphaFold 2 , 2020) es significativamente diferente de la versión original que ganó CASP 13 en 2018, según el equipo de DeepMind. [15] [16]

El equipo de DeepMind había identificado que su enfoque anterior, que combinaba la física local con un potencial de guía derivado del reconocimiento de patrones, tenía una tendencia a tener en cuenta las interacciones entre los residuos que estaban cerca en la secuencia en comparación con las interacciones entre los residuos más separados a lo largo de la cadena. Como resultado, AlphaFold 1 tenía una tendencia a preferir modelos con una estructura ligeramente más secundaria ( hélices alfa y hojas beta ) de lo que era en realidad (una forma de sobreajuste ). [17]

El diseño de software utilizado en AlphaFold 1 contenía una serie de módulos, cada uno entrenado por separado, que se utilizaron para producir el potencial guía que luego se combinó con el potencial energético basado en la física. AlphaFold 2 reemplazó esto con un sistema de subredes acopladas en un único modelo de extremo a extremo diferenciable, basado completamente en el reconocimiento de patrones, que fue entrenado de manera integrada como una única estructura integrada. [16] [18] La física local, en forma de refinamiento de energía basado en el modelo AMBER , se aplica solo como un paso de refinamiento final una vez que la predicción de la red neuronal ha convergido, y solo ajusta ligeramente la estructura predicha. [17]

Una parte clave del sistema 2020 son dos módulos, que se cree que se basan en un diseño de transformador , que se utilizan para refinar progresivamente un vector de información para cada relación (o " borde " en la terminología de la teoría de grafos) entre un residuo de aminoácido de la proteína y otro residuo de aminoácido (estas relaciones están representadas por la matriz mostrada en verde); y entre cada posición de aminoácido y cada secuencia diferente en la alineación de la secuencia de entrada (estas relaciones están representadas por la matriz mostrada en rojo). [18] Internamente, estas transformaciones de refinamiento contienen capas que tienen el efecto de reunir datos relevantes y filtrar datos irrelevantes (el "mecanismo de atención") para estas relaciones, de una manera dependiente del contexto, aprendidas de los datos de entrenamiento. Estas transformaciones se repiten, la salida de información actualizada en un paso se convierte en la entrada del siguiente, con la información de residuo / residuo mejorada alimentando la actualización de la información de residuo / secuencia, y luego la información de residuo / secuencia mejorada alimentando la actualización de la información sobre residuos / residuos. [18] A medida que avanza la iteración, según un informe, el "algoritmo de atención ... imita la forma en que una persona podría armar un rompecabezas: primero conectando piezas en pequeños grupos, en este caso grupos de aminoácidos, y luego buscando formas de unir los grupos en un todo más grande ". [4]

La salida de estas iteraciones informa al módulo de predicción de la estructura final, [18] que también usa transformadores, [19] y luego se itera. En un ejemplo presentado por DeepMind, el módulo de predicción de estructura logró una topología correcta para la proteína objetivo en su primera iteración, calificada como con un GDT_TS de 78, pero con un gran número (90%) de violaciones estereoquímicas, es decir, ángulos de enlace no físicos o longitudes. Con las iteraciones posteriores, el número de violaciones estereoquímicas disminuyó. En la tercera iteración, el GDT_TS de la predicción se acercaba a 90, y en la octava iteración el número de violaciones estereoquímicas se acercaba a cero. [20]

El equipo de AlphaFold declaró en noviembre de 2020 que creen que AlphaFold se puede desarrollar aún más, con espacio para mejoras adicionales en la precisión. [15]

Competiciones [ editar ]

Resultados obtenidos para la predicción de proteínas por las mejores reconstrucciones en la competencia CASP 2018 (círculos pequeños) y la competencia CASP 2020 (círculos grandes), en comparación con los resultados obtenidos en años anteriores. (Fuente: [21] )
La línea de tendencia carmesí muestra cómo un puñado de modelos, incluido AlphaFold 1, lograron un cambio significativo en 2018 sobre la tasa de progreso que se había logrado anteriormente, particularmente con respecto a las secuencias de proteínas consideradas como las más importantes. difícil de predecir.
(Se había realizado una mejora cualitativa en años anteriores, pero es solo cuando los cambios traen estructuras dentro de los 8 Å de sus posiciones experimentales que comienzan a afectar la medida CASP GDS-TS).
La línea de tendencia naranja muestra que para 2020 los servidores de predicción en línea habían podido aprender y igualar este rendimiento, mientras que los mejores otros grupos (curva verde) en promedio habían podido realizar algunas mejoras. Sin embargo, la curva de tendencia negra muestra el grado en el que AlphaFold 2 había superado esto nuevamente en 2020, en todos los ámbitos.
La distribución detallada de puntos de datos indica el grado de consistencia o variación logrado por AlphaFold. Los valores atípicos representan el puñado de secuencias para las que no hizo una predicción tan exitosa.

CASP13 [ editar ]

En diciembre de 2018, AlphaFold de DeepMind ocupó el primer lugar en la clasificación general de la 13a Evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP). [22] [23]

El programa predecía con especial éxito la estructura más precisa para los objetivos calificados como los más difíciles por los organizadores de la competición, donde no había estructuras de plantilla disponibles a partir de proteínas con una secuencia parcialmente similar. AlphaFold dio la mejor predicción para 25 de 43 objetivos de proteínas en esta clase, [23] [24] [25] logrando una puntuación media de 58,9 en la puntuación de la prueba de distancia global (GDT) del CASP , por delante de 52,5 y 52,4 por los dos siguientes equipos mejor ubicados, [26] que también estaban utilizando el aprendizaje profundo para estimar las distancias de contacto. [27] [28] En general, en todos los objetivos, el programa logró una puntuación GDT de 68,5. [29]

En enero de 2020, las implementaciones y el código ilustrativo de AlphaFold 1 se lanzaron de código abierto en GitHub . [30] [10] pero, como se indica en el archivo "Léame" de ese sitio web: "Este código no se puede usar para predecir la estructura de una secuencia de proteína arbitraria. Se puede usar para predecir la estructura solo en el conjunto de datos CASP13 (enlaces a continuación). El código de generación de funciones está estrechamente vinculado a nuestra infraestructura interna, así como a las herramientas externas, por lo que no podemos abrirlo. "Por lo tanto, en esencia, el código depositado NO es adecuado para uso general, sino SOLO para las proteínas CASP13. La compañía no ha anunciado planes para poner su código a disposición del público a partir del 5 de marzo de 2021.

CASP14 [ editar ]

En noviembre de 2020, la nueva versión de DeepMind, AlphaFold 2, ganó CASP14. [9] [31] En general, AlphaFold 2 hizo la mejor predicción para 88 de los 97 objetivos. [5]

En la medida de precisión de la prueba de distancia global (GDT) preferida de la competencia , el programa logró una puntuación media de 92,4 (de 100), lo que significa que más de la mitad de sus predicciones obtuvieron una puntuación superior al 92,4% por tener sus átomos en más o menos el lugar correcto, [32] [33] un nivel de precisión informó a ser comparable a las técnicas experimentales como cristalografía de rayos X . [15] [6] [29] En 2018, AlphaFold 1 solo había alcanzado este nivel de precisión en dos de todas sus predicciones. [5] El 88% de las predicciones en la competencia de 2020 tuvieron una puntuación GDT_TS de más de 80. [34] : diapositiva 3En el grupo de objetivos clasificados como los más difíciles, AlphaFold 2 logró una puntuación media de 87.

Medido por la desviación cuadrática media (RMS-D) de la ubicación de los átomos de carbono alfa de la cadena principal de la proteína, que tiende a estar dominada por el desempeño de los valores atípicos peor ajustados, el 88% de las predicciones de AlphaFold 2 tenía una desviación RMS de menos de 4 Å para el conjunto de átomos C-alfa superpuestos. [5] El 76% de las predicciones lograron mejores que 3 Å, y el 46% tuvo una precisión RMS del átomo C-alfa mejor que 2 Å., [5] con una desviación media RMS en sus predicciones de 2,1 Å para un conjunto de CA superpuestos átomos. [5] AlphaFold 2 también logró una precisión en el modelado de cadenas laterales de superficies descritas como "realmente realmente extraordinarias". [21] : a las 0:31:50

Para verificar adicionalmente AlphaFold-2, los organizadores de la conferencia se acercaron a cuatro grupos experimentales líderes en busca de estructuras que encontraban particularmente desafiantes y que no habían podido determinar. [34] En los cuatro casos, los modelos tridimensionales producidos por AlphaFold 2 fueron lo suficientemente precisos para determinar las estructuras de estas proteínas por reemplazo molecular . [34] Estos incluían una pequeña proteína de membrana estudiada por experimentadores durante diez años. [4]

De las tres estructuras que AlphaFold 2 tuvo menos éxito en predecir, dos se obtuvieron mediante métodos de RMN de proteínas , [21] : a las 0:30:30 que definen la estructura de la proteína directamente en solución acuosa, mientras que AlphaFold se entrenó principalmente en estructuras de proteínas en cristales . El tercero existe en la naturaleza como un complejo multidominio que consta de 52 copias idénticas del mismo dominio , [21] : a las 0:30:30 una situación que AlphaFold no estaba programada para considerar. Para todos los objetivos con un solo dominio, excluyendo solo una proteína muy grande y las dos estructuras determinadas por RMN, AlphaFold 2 logró una puntuación GDT_TS de más de 80. [35]

Respuestas [ editar ]

AlphaFold 2 puntuación de más de 90 en el CASP 's prueba global distancia (GDT) se considera un logro importante en la biología computacional [4] y un gran avance hacia una décadas de edad, gran reto de la biología. [6] El ganador del Premio Nobel y biólogo estructural Venki Ramakrishnan calificó el resultado como "un avance asombroso en el problema del plegamiento de proteínas", [4] y agregó que "Ha ocurrido décadas antes de que muchas personas en el campo lo hubieran predicho. Será emocionante ver las muchas formas en que cambiará fundamentalmente la investigación biológica ". [9]

Impulsado por comunicados de prensa de CASP y DeepMind, [36] [9] el éxito de AlphaFold 2 recibió una amplia atención de los medios. [37] Además de las noticias en la prensa científica especializada, como Nature , [6] Science , [4] MIT Technology Review , [2] y New Scientist , [38] [39] la historia fue ampliamente cubierta por importantes periódicos nacionales, [40] [41] [42] [43] así como servicios generales de noticias y publicaciones semanales, como Fortune , [44] [16] The Economist , [15] Bloomberg , [29] Der Spiegel , [45] y The Spectator . [46] En Londres, The Times hizo de la historia su foto principal de portada, con dos páginas más de cobertura interna y un editorial. [47] [48] Un tema frecuente fue que se espera que la capacidad para predecir estructuras proteicas con precisión basándose en la secuencia de aminoácidos constituyentes tenga una amplia variedad de beneficios en el espacio de las ciencias de la vida, incluida la aceleración del descubrimiento avanzado de fármacos y la posibilidad de una mejor comprensión de las enfermedades. [6] [49] Escribiendo sobre el evento, MIT Technology Reviewseñaló que la IA había "resuelto un gran desafío de la biología de cincuenta años". [2] El mismo artículo continuó señalando que el algoritmo de IA podría "predecir la forma de las proteínas dentro del ancho de un átomo". [2]

Como resume Der Spiegel, las reservas sobre esta cobertura se han centrado en dos áreas principales: "Aún queda mucho por hacer" y: "Ni siquiera sabemos cómo lo hacen". [50]

Aunque el líder del proyecto John Jumper realizó una presentación de 30 minutos sobre AlphaFold 2 el segundo día de la conferencia CASP (1 de diciembre), [51] se ha descrito como "extremadamente de alto nivel, lleno de ideas e insinuaciones, pero casi completamente desprovisto de detalles ". [52] [ fuente no confiable? ] Se espera que DeepMind publique un artículo científico que dé cuenta de AlphaFold 2 en el volumen de actas [ ¿cuándo? ] de la conferencia CASP; pero no se sabe si irá más allá de lo dicho en la presentación.

En declaraciones a El País , el investigador Alfonso Valencia dijo: “Lo más importante que nos deja este avance es saber que este problema tiene solución, que es posible solucionarlo ... Solo conocemos el resultado. Google no proporciona el software y esta es la parte frustrante del logro porque no beneficiará directamente a la ciencia ". [43] Sin embargo, tanto como Google y DeepMind lanzan puede ayudar a otros equipos a desarrollar sistemas de IA similares, un beneficio "indirecto". [43] A fines de 2019, DeepMind lanzó gran parte del código de la primera versión de AlphaFold como código abierto; pero solo cuando el trabajo estaba bien avanzado en el AlphaFold 2, mucho más radical. Otra opción que podría tomar podría ser hacer que la predicción de la estructura de AlphaFold 2 esté disponible como un servicio de suscripción de caja negra en línea. Se ha estimado que la convergencia para una sola secuencia requiere del orden de $ 10,000 en tiempo de cálculo al por mayor . [53]Pero esto negaría a los investigadores el acceso a los estados internos del sistema, la oportunidad de aprender de manera más cualitativa lo que da lugar al éxito de AlphaFold 2, y el potencial de nuevos algoritmos que podrían ser más ligeros y eficientes y aun así lograr tales resultados. Los temores de una posible falta de transparencia por parte de DeepMind se han contrastado con cinco décadas de fuerte inversión pública en el banco de datos de proteínas abierto y luego también en repositorios de secuencias de ADN abiertos , sin los cuales los datos para entrenar AlphaFold 2 no hubieran existido. [54] [55] [56]

Sin embargo, todavía no está claro hasta qué punto las predicciones de estructura hechas por AlphaFold 2 se mantendrán para las proteínas unidas en complejos con otras proteínas y otras moléculas. [57] Esto no era parte de la competencia CASP en la que AlphaFold participó, y no era una eventualidad para la que estaba diseñado internamente. Donde las estructuras que AlphaFold 2 predijo fueron para proteínas que tenían interacciones fuertes con otras copias de sí mismas o con otras estructuras, estos fueron los casos en los que las predicciones de AlphaFold 2 tendieron a ser menos refinadas y menos confiables. Dado que una gran fracción de las máquinas biológicas más importantes de una célula comprenden tales complejos, o se relacionan con la forma en que las estructuras de las proteínas se modifican cuando entran en contacto con otras moléculas, esta es un área que seguirá siendo el foco de considerable atención experimental. [57]

Con tan poco conocimiento sobre los patrones internos que AlphaFold 2 aprende a hacer sus predicciones, aún no está claro hasta qué punto el programa puede verse afectado en su capacidad para identificar nuevos pliegues, si tales pliegues no están bien representados en la proteína existente. estructuras conocidas en bases de datos de estructura. [7] [57] Tampoco se conoce bien hasta qué punto las estructuras de proteínas en tales bases de datos, en su mayoría de proteínas que se han podido cristalizar en rayos X, son representativas de proteínas típicas que aún no se han cristalizado. Y tampoco está claro cuán representativas son las estructuras de proteínas congeladas en cristales de las estructuras dinámicas que se encuentran en las células in vivo . Dificultades de AlphaFold 2 con estructuras obtenidas por RMN de proteínas Los métodos pueden no ser una buena señal.

Sobre su potencial como herramienta para el descubrimiento de fármacos , Stephen Curry señala que, si bien la resolución de las estructuras de AlphaFold 2 puede ser muy buena, la precisión con la que se modelan los sitios de unión debe ser aún mayor: los estudios de acoplamiento típicamente moleculares requieren que las posiciones atómicas sean precisa dentro de un margen de 0,3 Å , pero la estructura de la proteína predicha solo tiene en el mejor de los casos una RMSD de 0,9 Å para todos los átomos. Por lo tanto, las estructuras de AlphaFold 2 pueden ser solo una ayuda limitada en tales contextos. [7] [57] Además, según el columnista de Science Derek Lowe, debido a que la predicción de la unión de moléculas pequeñas aún no es muy buena, la predicción computacional de los objetivos de los fármacos simplemente no está en posición de asumir el control como la "columna vertebral" del descubrimiento de fármacos corporativos, por lo que "la determinación de la estructura de las proteínas simplemente no es paso limitante en el descubrimiento de fármacos en general ". [58] También se ha observado que incluso con una estructura para una proteína, comprender cómo funciona, qué hace y cómo encaja en procesos biológicos más amplios puede resultar todavía muy complicado. [59]Sin embargo, si un mejor conocimiento de la estructura de las proteínas puede conducir a una mejor comprensión de los mecanismos de cada enfermedad y, en última instancia, a mejores objetivos farmacológicos, o una mejor comprensión de las diferencias entre los modelos humanos y animales, en última instancia, eso podría conducir a mejoras. [60]

Finalmente, algunos han notado que incluso una respuesta perfecta al problema de la predicción de proteínas dejaría preguntas sobre el problema del plegamiento de proteínas : comprender en detalle cómo ocurre realmente el proceso de plegado en la naturaleza (y cómo a veces también pueden plegarse mal ). [61]

Pero incluso con tales advertencias, AlphaFold 2 se describió como un gran paso técnico y un logro intelectual. [62] [63]

Aplicaciones [ editar ]

SARS-CoV-2 [ editar ]

AlphaFold se ha utilizado para predecir estructuras de proteínas de SARS-CoV-2 , el agente causante de COVID-19 . Las estructuras de estas proteínas estaban pendientes de detección experimental a principios de 2020. [64] [6] Los resultados fueron examinados por los científicos del Instituto Francis Crick en el Reino Unido antes de su publicación en la comunidad de investigación más amplia. El equipo también confirmó una predicción precisa contra la proteína de pico SARS-CoV-2 determinada experimentalmente que se compartió en el Protein Data Bank , una base de datos internacional de acceso abierto, antes de publicar las estructuras determinadas computacionalmente de las moléculas de proteína que no se han estudiado. [sesenta y cinco]El equipo reconoció que, aunque estas estructuras de proteínas podrían no ser objeto de esfuerzos de investigación terapéutica en curso, contribuirán a la comprensión de la comunidad sobre el virus SARS-CoV-2. [65] Específicamente, la predicción de AlphaFold 2 de la estructura de la proteína Orf3a fue muy similar a la estructura determinada por investigadores de la Universidad de California, Berkeley, usando microscopía crioelectrónica . Se cree que esta proteína específica ayuda al virus a salir de la célula huésped una vez que se replica. También se cree que esta proteína juega un papel en el desencadenamiento de la respuesta inflamatoria a la infección. [66]

Obras publicadas [ editar ]

Investigación de AlphaFold [ editar ]

  • Andrew W. Senior y col. (Diciembre de 2019), "Predicción de la estructura de la proteína utilizando múltiples redes neuronales profundas en la 13a Evaluación crítica de la predicción de la estructura de la proteína (CASP13)" , Proteínas: estructura, función, bioinformática 87 (12) 1141-1148 doi : 10.1002 / prot.25834
  • Andrew W. Senior y col. (15 de enero 2020), "Mejora de la proteína de predicción de estructura de base de los potenciales de aprendizaje profundo" , Naturaleza 577 706-710 doi : 10.1038 / s41586-019-1923-7
  • John Jumper y col. (Diciembre de 2020), "Predicción de la estructura de proteínas de alta precisión mediante el aprendizaje profundo", en Decimocuarta Evaluación crítica de técnicas para la predicción de la estructura de proteínas (Libro de resúmenes) , págs. 22-24
  • John Jumper y col. (Diciembre de 2020), " AlphaFold2 ". Presentación realizada en CASP 14.

Investigación derivada [ editar ]

  • Yang, Jianyi; Anishchenko, Ivan; Park, Hahnbeom; Peng, Zhenling; Ovchinnikov, Sergey; Baker, David (18 de noviembre de 2019). "Mejora de la predicción de la estructura de la proteína utilizando orientaciones entre residuos predichas" . bioRxiv : 846279. doi : 10.1101 / 846279 . S2CID  209563981 .
  • Billings, Wendy M .; Hedelius, Bryce; Millecam, Todd; Wingate, David; Corte, Dennis Della (4 de noviembre de 2019). "ProSPr: implementación democratizada de la red de predicción de distancia de proteínas Alphafold" . bioRxiv : 830273. doi : 10.1101 / 830273 . S2CID  209578310 .

Ver también [ editar ]

  • Plegable en casa
  • IBM Blue Gene
  • Foldit
  • Rosetta en casa
  • Proyecto de plegado del proteoma humano

Referencias [ editar ]

  1. ^ "AlphaFold" . Deepmind . Consultado el 30 de noviembre de 2020 .
  2. ^ a b c d e f g h "La IA de plegamiento de proteínas de DeepMind ha resuelto un gran desafío de la biología de 50 años" . Revisión de tecnología del MIT . Consultado el 30 de noviembre de 2020 .
  3. Shead, Sam (30 de noviembre de 2020). "DeepMind resuelve el 'gran desafío' de 50 años con la IA de plegamiento de proteínas" CNBC . Consultado el 30 de noviembre de 2020 .
  4. ^ a b c d e f g h Robert F. Service, 'El juego ha cambiado'. La IA triunfa en la resolución de estructuras de proteínas , Science , 30 de noviembre de 2020
  5. ^ a b c d e f Mohammed AlQuraishi, las puntuaciones de CASP14 acaban de publicarse y son asombrosas , twitter, 30 de noviembre de 2020.
  6. ↑ a b c d e f Callaway, Ewen (30 de noviembre de 2020). " ' Cambiará todo': la IA de DeepMind da un salto gigantesco en la resolución de estructuras de proteínas" . Naturaleza . 588 (7837): 203-204. doi : 10.1038 / d41586-020-03348-4 . PMID 33257889 . 
  7. ^ a b c Stephen Curry, No, DeepMind no ha resuelto el plegamiento de proteínas , Reciprocal Space (blog), 2 de diciembre de 2020
  8. ^ Balls, Phillip (9 de diciembre de 2020). "Detrás de las pantallas de AlphaFold" . Mundo de la química .
  9. ^ a b c d e f "AlphaFold: una solución a un gran desafío de 50 años en biología" . Deepmind . Consultado el 30 de noviembre de 2020 .
  10. ^ a b c d e "AlphaFold: uso de la IA para el descubrimiento científico" . Deepmind . Consultado el 30 de noviembre de 2020 .
  11. ^ Ken A. Dill, S. Banu Ozkan, M. Scott Shell y Thomas R. Weikl (2008). "El problema del plegamiento de proteínas" . Revisiones anuales de biofísica . 37 : 289–316. doi : 10.1146 / annurev.biophys.37.092707.153558 . PMC 2443096 . PMID 18573083 .  Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
  12. ^ Mohammed AlQuraishi (mayo de 2019), AlphaFold en CASP13 , Bioinformatics , 35 (22), 4862–4865 doi : 10.1093 / bioinformatics / btz422 . Véase también Mohammed AlQuraishi (9 de diciembre de 2018), AlphaFold @ CASP13: "¿Qué acaba de pasar?" (entrada en el blog).
    Mohammed AlQuraishi (15 de enero de 2020), Un momento decisivo para la predicción de la estructura de las proteínas , Nature 577 , 627–628 doi : 10.1038 / d41586-019-03951-0
  13. ^ AlphaFold: aprendizaje automático para la predicción de la estructura de proteínas , Foldit , 31 de enero de 2020
  14. ^ Torrisi, Mirko y col. (22 de enero de 2020), Métodos de aprendizaje profundo en la predicción de la estructura de proteínas . Revista de Biotecnología Computacional y Estructural vol. 18 1301-1310. doi : 10.1016 / j.csbj.2019.12.011 (CC-BY-4.0)
  15. ^ a b c d "DeepMind está respondiendo a uno de los mayores desafíos de la biología" . The Economist . 2020-11-30. ISSN 0013-0613 . Consultado el 30 de noviembre de 2020 . 
  16. ^ a b c Jeremy Kahn, Lecciones del avance de DeepMind en IA de plegamiento de proteínas , Fortune , 1 de diciembre de 2020
  17. ^ a b John Jumper et al., resumen de la conferencia (diciembre de 2020)
  18. ^ a b c d Ver diagrama de bloques. También John Jumper et al. (1 de diciembre de 2020), presentación AlphaFold2 , diapositiva 10
  19. ^ Se afirma que el módulo de estructura utiliza una "arquitectura de transformador equivariante 3-d" (John Jumper et al. (1 de diciembre de 2020), presentación de AlphaFold2 , diapositiva 12).
    Sepropusoun diseño para una red de transformadores con SE (3) - equivariancia en Fabian Fuchs et al SE (3) -Transformers: 3D Roto-Translation Equivariant Attention Networks , NeurIPS 2020; también sitio web . No se sabe cuán similar puede ser esto o no a lo que se usó en AlphaFold.
    Vea también la publicación del blog de AlQuaraishi sobre esto, o la publicación más detallada de Fabian Fuchs
  20. ^ John Jumper y col. (1 de diciembre de 2020), presentación AlphaFold2 , diapositivas 12 a 20
  21. ^ a b c d John Moult (30 de noviembre de 2020), presentación introductoria de CASP 14 , diapositiva 19. Consulte también la transmisión de video de CASP 14, día 1, parte 1 , de 00:22:46
  22. ^ Rendimiento del grupo basado en puntuaciones z combinadas , CASP 13, diciembre de 2018. (AlphaFold = Equipo 043: A7D)
  23. ^ a b Sample, Ian (2 de diciembre de 2018). "DeepMind de Google predice formas 3D de proteínas" . The Guardian . Consultado el 30 de noviembre de 2020 .
  24. ^ "AlphaFold: uso de la inteligencia artificial para el descubrimiento científico" . Deepmind . Consultado el 30 de noviembre de 2020 .
  25. ^ Singh, Arunima (2020). "Estructuras 3D de aprendizaje profundo" . Métodos de la naturaleza . 17 (3): 249. doi : 10.1038 / s41592-020-0779-y . ISSN 1548-7105 . PMID 32132733 . S2CID 212403708 .   
  26. ^ Consulte las tablas de datos de CASP 13 para 043 A7D, 322 Zhang y 089 MULTICOM
  27. ^ Wei Zheng et al , predicción de la estructura de proteínas guiada por mapas de contacto de aprendizaje profundo en CASP13 , Proteínas: estructura, función y bioinformática , 87 (12) 1149-1164 doi : 10.1002 / prot.25792 ; y diapositivas
  28. ^ Jie Hou et al (2019), Modelado de estructura terciaria de proteínas impulsado por aprendizaje profundo y predicción de distancia de contacto en CASP13 , Proteínas: estructura, función y bioinformática , 87 (12) 1165-1178 doi : 10.1002 / prot.25697
  29. ^ a b c "El avance de DeepMind ayuda a resolver cómo las enfermedades invaden las células" . Bloomberg.com . 2020-11-30 . Consultado el 30 de noviembre de 2020 .
  30. ^ "deepmind / deepmind-research" . GitHub . Consultado el 30 de noviembre de 2020 .
  31. ^ "La IA de plegamiento de proteínas de DeepMind ha resuelto un gran desafío de la biología de 50 años" . Revisión de tecnología del MIT . Consultado el 30 de noviembre de 2020 .
  32. ^ Para la medida GDT_TS utilizada, cada átomo en la predicción puntúa un cuarto de punto si está dentro de 8 Å (0.80 nm) de la posición experimental; medio punto si está dentro de 4 Å, tres cuartos de punto si está dentro de 2 Å y un punto completo si está dentro de 1 Å.
  33. ^ Para lograr una puntuación GDT_TS de 92,5, matemáticamente al menos el 70% de la estructura debe tener una precisión de 1 Å, y al menos el 85% debe tener una precisión de 2 Å.
  34. ^ a b c Andriy Kryshtafovych (30 de noviembre de 2020), Experimentalistas: ¿Son útiles los modelos? Presentación CASP 14. Consulte también la transmisión de video CASP 14, día 1, parte 1 , de 0:34:30
  35. ^ Lisa Kinch et al , CASP14 Evaluación de predicción de la estructura terciaria: Categoría de topología (FM) (presentación de CASP 14), diapositiva 11. Consulte también la transmisión de video de CASP 14, día 1, parte 3 , de 0:18:25
  36. ^ La solución de inteligencia artificial a un desafío científico de 50 años podría 'revolucionar' la investigación médica (comunicado de prensa),comité organizador de CASP , 30 de noviembre de 2020
  37. ^ Brigitte Nerlich, plegamiento de proteínas y comunicación científica: entre la exageración y la humildad ,blog de la Universidad de Nottingham , 4 de diciembre de 2020
  38. ^ Michael Le Page, biólogo de inteligencia artificial de DeepMind puede descifrar los secretos de la maquinaria de la vida , New Scientist , 30 de noviembre de 2020
  39. ^ Las predicciones de la última IA de DeepMind podrían revolucionar la medicina , New Scientist , 2 de diciembre de 2020
  40. ^ Cade Metz , laboratorio de inteligencia artificial de Londres afirma un avance que podría acelerar el descubrimiento de fármacos , New York Times , 30 de noviembre de 2020
  41. ^ Ian Sample, DeepMind AI resuelve un problema de 50 años de plegamiento de proteínas , The Guardian , 30 de noviembre de 2020
  42. ^ Lizzie Roberts, 'Once in a generation advance' mientras los investigadores de IA de Google resuelven un desafío biológico de 50 años . Daily Telegraph , 30 de noviembre de 2020
  43. ^ a b c Nuño Dominguez, La inteligencia artificial arrasa en uno de los problemas más importantes de la biología ( La inteligencia artificial saca uno de los problemas más importantes de la biología), El País , 2 de diciembre de 2020
  44. ^ Jeremy Kahn, en un gran avance científico, la IA predice la forma exacta de las proteínas , Fortune , 30 de noviembre de 2020
  45. ^ Julia Merlot, Forscher hoffen auf Durchbruch für die Medikamentenforschung (Los investigadores esperan un gran avance para la investigación de drogas), Der Spiegel , 2 de diciembre de 2020
  46. ^ Bissan Al-Lazikani, La resolución de un misterio biológico , The Spectator , 1 de diciembre de 2020
  47. ^ Tom Whipple, "Deepmind computer resuelve un nuevo rompecabezas: la vida", The Times , 1 de diciembre de 2020. imagen de portada , a través de Twitter.
  48. ^ Tom Whipple, Deepmind encuentra el 'santo grial' de la biología con una respuesta al problema de las proteínas , The Times (en línea), 30 de noviembre de 2020.
    En total, el editor científico Tom Whipple escribió seis artículos sobre el tema para The Times el día en que se conoció la noticia. ( hilo ).
  49. ^ Tim Hubbard , El secreto de la vida, parte 2: la solución del problema del plegamiento de proteínas. , medium.com , 30 de noviembre de 2020
  50. ^ Christian Stöcker, Google greift nach dem Leben selbst (Google está buscando la vida misma), Der Spiegel , 6 de diciembre de 2020
  51. ^ John Jumper y col. (1 de diciembre de 2020), AlphaFold2 . Presentación realizada en CASP 14.
  52. AlQuraishi, Mohammed (8 de diciembre de 2020). "AlphaFold2 @ CASP14:" Se siente como si el hijo de uno se hubiera ido de casa. "El Método" . Algunos pensamientos sobre un universo misterioso . Consultado el 15 de diciembre de 2020 .
  53. ^ Carlos Outeiral, CASP14: lo que realmente logró AlphaFold 2 de Google DeepMind y lo que significa para el plegamiento de proteínas, la biología y la bioinformática , Oxford Protein Informatics Group. (3 de diciembre)
  54. ^ Aled Edwards, El éxito de AlphaFold2: tomó una aldea , a través de medium.com , 5 de diciembre de 2020
  55. ^ David Briggs, si Alphafold2 de Google realmente ha resuelto el problema del plegamiento de proteínas, deben mostrar su trabajo , The Skeptic , 4 de diciembre de 2020
  56. ^ La opinión de The Guardian sobre el cerebro de DeepMind: la forma de las cosas por venir , The Guardian , 6 de diciembre de 2020
  57. ^ a b c d Tom Ireland, ¿Cómo cambiará AlphaFold la investigación en biociencias? , The Biologist , 4 de diciembre de 2020
  58. ^ Derek Lowe , In the Pipeline: What's Crucial and What Is Not , Science Translational Medicine , 25 de septiembre de 2019
  59. ^ Philip Ball , Behind the Screens of AlphaFold , Chemistry World , 9 de diciembre de 2020. Ver también tweets , 1 de diciembre
  60. ^ Derek Lowe , In the Pipeline: The Big Problems , Science Translational Medicine , 1 de diciembre de 2020
  61. ^ Por ejemplo, Greg Bowman, el plegamiento de proteínas y los problemas relacionados siguen sin resolverse a pesar del avance de AlphaFold ,blog Folding @ home , 8 de diciembre de 2020
  62. Cristina Sáez, El último avance fundamental de la biología se basa en la investigación de un científico español , La Vanguardia , 2 de diciembre de 2020. (Vista general de Alfonso Valencia )
  63. ^ Zero Gravitas y Jacky Liang, AlphaFold 2 de DeepMind: un avance impresionante con cobertura hiperbólica , Skynet hoy (blog), Stanford, 9 de diciembre de 2020
  64. ^ "AI puede ayudar a los científicos a encontrar una vacuna Covid-19" . Cableado . ISSN 1059-1028 . Consultado el 1 de diciembre de 2020 . 
  65. ^ a b "Predicciones computacionales de estructuras de proteínas asociadas con COVID-19" . Deepmind . Consultado el 1 de diciembre de 2020 .
  66. ^ "Cómo la nueva IA de plegamiento de proteínas de DeepMind ya está ayudando a combatir la pandemia de coronavirus" . Fortuna . Consultado el 1 de diciembre de 2020 .

Lectura adicional [ editar ]

  • Carlos Outeiral, CASP14: lo que realmente logró AlphaFold 2 de Google DeepMind y lo que significa para el plegamiento de proteínas, la biología y la bioinformática , Oxford Protein Informatics Group. (3 de diciembre)
  • Mohammed AlQuraishi, AlphaFold2 @ CASP14: "Se siente como si un hijo se hubiera ido de casa". (blog), 8 de diciembre de 2020

Enlaces externos [ editar ]

AlphaFold 1 [ editar ]

  • Senior, Andrew (23 de agosto de 2019). "AlphaFold: predicción mejorada de la estructura de proteínas utilizando potenciales de aprendizaje profundo" . Instituto de Diseño de Proteínas - a través de YouTube .
  • Código AlphaFold utilizado en CASP13 en GitHub
  • Implementación de la comunidad de código abierto - ProSPr en GitHub

AlphaFold 2 [ editar ]

  • Sitio web CASP 14
  • AlphaFold: la realización de un gran avance científico , DeepMind, a través de YouTube.
  • Yannic Kilcher, explicó AlphaFold 2 , 1 de diciembre de 2020, a través de YouTube. Recorrido por AlphaFold 1, con algunas ideas (de 43:50 ) sobre cómo AlphaFold 2 se diferencia de él