SAMPL ( Evaluación estadística del modelado de proteínas y ligandos ) es un conjunto de desafíos ciegos en toda la comunidad cuyo objetivo es avanzar en las técnicas computacionales como herramientas predictivas estándar en el diseño racional de fármacos . [1] [2] [3] [4] [5] Se ha seleccionado una amplia gama de sistemas biológicamente relevantes con diferentes tamaños y niveles de complejidad que incluyen proteínas , complejos huésped-huésped y pequeñas moléculas similares a fármacos para probar lo último métodos de modelado y campos de fuerza en SAMPL. Nuevos datos experimentales, como la afinidad de unión y la energía libre de hidratación, se retienen a los participantes hasta la fecha límite de envío de la predicción, de modo que se pueda revelar el verdadero poder predictivo de los métodos. El desafío SAMPL5 más reciente contiene dos categorías de predicción: la afinidad de unión de los sistemas huésped-huésped y los coeficientes de distribución de moléculas similares a fármacos entre el agua y el ciclohexano. [6] [7] Desde 2008, la serie de desafíos SAMPL ha atraído el interés generalizado de científicos involucrados en el campo del diseño de fármacos asistido por computadora (CADD) en todo el mundo, y ha dado lugar a más de 100 publicaciones, muchas de ellas muy citadas. . [8] [9] [10] Los organizadores actuales de SAMPL incluyen al Prof. John Chodera en el Memorial Sloan Kettering Cancer Center, el Prof. Michael K. Gilson en la Universidad de California, San Diego, el Prof. David Mobley en la Universidad de California, Irvine, y el Prof. Michael Shirts, de la Universidad de Colorado, Boulder. [11]
Importancia del proyecto
El desafío SAMPL busca acelerar el progreso en el desarrollo de herramientas cuantitativas y precisas de descubrimiento de fármacos proporcionando validación prospectiva y comparaciones rigurosas para metodologías computacionales y campos de fuerza. Los métodos de diseño de fármacos asistidos por computadora se han mejorado considerablemente con el tiempo, junto con el rápido crecimiento de las capacidades informáticas de alto rendimiento. Sin embargo, su aplicabilidad en la industria farmacéutica sigue siendo muy limitada debido a la precisión insuficiente. Al carecer de validaciones prospectivas a gran escala, los métodos tienden a sufrir un ajuste excesivo de los datos experimentales preexistentes. Para superar esto, los desafíos de SAMPL se han organizado como pruebas ciegas: cada vez que se diseñan y recopilan cuidadosamente nuevos conjuntos de datos de laboratorios de investigación académicos o industriales, y las mediciones se publican poco después de la fecha límite de presentación de la predicción. Luego, los investigadores pueden comparar esos datos experimentales prospectivos de alta calidad con las estimaciones enviadas. Un énfasis clave está en las lecciones aprendidas, permitiendo que los participantes en desafíos futuros se beneficien de las mejoras de modelado realizadas en base a desafíos anteriores.
SAMPL se ha centrado históricamente en las propiedades de los sistemas huésped-huésped y de las pequeñas moléculas similares a los fármacos. Estos sistemas de modelos simples requieren considerablemente menos recursos computacionales para simular, en comparación con los sistemas de proteínas, y por lo tanto permiten una convergencia mucho más rápida. Mientras tanto, a través de un diseño cuidadoso, estos sistemas de modelos se pueden usar para enfocarse en un desafío de simulación en particular o en un subconjunto. [12] Los últimos desafíos SAMPL huésped-huésped, energía libre de hidratación y log D revelaron las limitaciones en los campos de fuerza generalizados, [13] [14] facilitaron el desarrollo de modelos solventes, [15] [16] y destacaron la importancia de manejar adecuadamente los estados de protonación y los efectos de la sal. [17] [18]
Participación
El registro y la participación son gratuitos para los desafíos de SAMPL. A partir de SAMPL7, los datos de participación en el desafío se publicaron en el sitio web de SAMPL , [19] así como en la página de GitHub para el desafío específico . Las instrucciones, los archivos de entrada y los resultados se proporcionaron a través de GitHub (los desafíos anteriores proporcionaban contenido principalmente a través de D3R para SAMPL4-5, y a través de otros medios para SAMPL anteriores). Se permitió a los participantes enviar múltiples predicciones a través del sitio web de D3R, ya sea de forma anónima o con afiliación a la investigación. Desde el desafío SAMPL2, todos los participantes han sido invitados a asistir a los talleres SAMPL y enviar manuscritos para describir sus resultados. Después de un proceso de revisión por pares, los artículos resultantes, junto con los artículos generales que resumen todos los datos enviados, se publicaron en los números especiales del Journal of Computer-Aided Molecular Design . [20]
Fondos
El proyecto SAMPL fue financiado recientemente por los NIH (subvención GM124270-01A1), para el período de septiembre de 2018 a agosto de 2022, para permitir el diseño de futuros desafíos de SAMPL para impulsar avances en las áreas que más se necesitan para los esfuerzos de modelado. [9] [10] El esfuerzo está encabezado por David L. Mobley (UC Irvine) con los co-investigadores John D. Chodera (MSKCC), Bruce C. Gibb (Tulane) y Lyle Isaacs (Maryland). Actualmente, los desafíos y talleres se llevan a cabo en asociación con el recurso de datos de diseño de medicamentos financiado por los NIH , pero esto probablemente cambiará con el tiempo ya que la financiación para los dos proyectos no está acoplada.
La financiación también permitió ampliar el alcance de SAMPL; a través de SAMPL6, se ha considerado que su función se centra principalmente en las propiedades físicas, con D3R manejando desafíos de proteína-ligando. Sin embargo, el esfuerzo financiado amplió su enfoque para incluir sistemas que impulsarán mejoras en el modelado, incluidos sistemas de proteína-ligando potencialmente adecuados. Esto todavía contrasta con D3R, que se basa en conjuntos de datos donados de interés farmacéutico, mientras que los desafíos de SAMPL están diseñados específicamente para centrarse en desafíos de modelado específicos.
Historia
Desafíos anteriores de SAMPL
El primer ejercicio SAMPL, SAMPL0 (2008) [21] se centró en las predicciones de energías libres de solvatación de 17 moléculas pequeñas. Un grupo de investigación de la Universidad de Stanford y científicos de OpenEye Scientific Software llevaron a cabo los cálculos. A pesar del formato informal, SAMPL0 sentó las bases para los siguientes desafíos de SAMPL.
Los desafíos SAMPL1 (2009) [22] y SAMPL2 (2010) [1] fueron organizados por OpenEye y continuaron enfocándose en predecir energías libres de solvatación de moléculas pequeñas similares a fármacos. También se intentó predecir las afinidades de unión, las poses de unión y las proporciones de tautómeros. Ambos desafíos atrajeron una participación significativa de científicos e investigadores computacionales en la academia y la industria.
SAMPL3 y SAMPL4
Los conjuntos de datos cegados para las afinidades de unión huésped-huésped se introdujeron por primera vez en SAMPL3 (2011-2012), [3] junto con las energías libres de solvatación para moléculas pequeñas y los datos de afinidad de unión para inhibidores de tirosina de tipo 500 fragmentos. Tres moléculas hospedadoras eran todas de la familia de los cucurbituril . El desafío SAMPL3 recibió 103 presentaciones de 23 grupos de investigación en todo el mundo. [2]
A diferencia de los tres eventos anteriores de SAMPL, el ejercicio SAMPL4 (2013-2014) [4] [5] fue coordinado por investigadores académicos, con el apoyo logístico de OpenEye. Los conjuntos de datos en SAMPL4 consistieron en afinidades de unión para sistemas huésped-huésped e inhibidores de la integrasa del VIH , así como energías libres de hidratación de moléculas pequeñas. Moléculas anfitrión cucurbitáceas incluido [7] Uril (CB7) y octa-ácido . El desafío de hidratación SAMPL4 involucró 49 presentaciones de 19 grupos. La participación del desafío anfitrión-invitado también creció significativamente en comparación con SAMPL3. El taller se llevó a cabo en la Universidad de Stanford en septiembre de 2013.
SAMPL5
Las pruebas de proteína-ligando se separaron de SAMPL en SAMPL5 (2015-2016) [6] [7] y se distribuyeron como los nuevos Grandes Desafíos del Recurso de Datos de Diseño de Fármacos (D3R). [23] SAMPL5 permitió a los participantes hacer predicciones de las afinidades de unión de tres conjuntos de sistemas huésped-huésped: un derivado acíclico de CB7 y dos huéspedes de la familia de los octaácidos. También se animó a los participantes a presentar predicciones de entalpías vinculantes. Se probó una amplia gama de métodos computacionales, incluida la teoría funcional de la densidad (DFT), la dinámica molecular , el acoplamiento y la metadinámica. Las predicciones del coeficiente de distribución se introdujeron por primera vez, recibiendo un total de 76 presentaciones de 18 grupos de investigadores o científicos para un conjunto de 53 moléculas pequeñas. El taller se llevó a cabo en marzo de 2016 en la Universidad de California, San Diego, como parte del taller D3R. Los métodos de alto rendimiento en el desafío anfitrión-invitado produjeron correlaciones alentadoras pero imperfectas con los datos experimentales, acompañadas de grandes cambios sistemáticos en relación con el experimento. [24] [25]
SAMPL6
Los sistemas de prueba SAMPL6 incluyen cucurbitáceas [8] uril, octaácido, tetra-endo-metil octaácido y una serie de pequeñas moléculas en forma de fragmentos. Los desafíos de host-invitado, muestreo conformacional y predicción de pKa de SAMPL6 ya están cerrados. El taller SAMPL6 se llevó a cabo conjuntamente con el taller D3R el 22 y 23 de febrero de 2018, en Scripps Institution of Oceanography, La Jolla, CA (https://drugdesigndata.org//about/d3r-2018-workshop) , y un El número especial reciente de SAMPL del Journal of Computer Aided Molecular Design informó sobre muchos de los resultados. Un desafío SAMPL6 Parte II se centró en un pequeño conjunto de predicción del coeficiente de partición octanol-agua y fue seguido por un taller virtual el 16 de mayo de 2019 y un taller conjunto D3R / SAMPL en San Diego, del 22 al 23 de agosto de 2019, inmediatamente antes de la Reunión Nacional San Diego ACS. Se planea un número especial o una sección especial de JCAMD para informar los resultados. Las entradas de SAMPL6 y (a medida que se completan los componentes del desafío, los resultados) están disponibles a través del repositorio de GitHub de SAMPL6 .
SAMPL7
SAMPL7 nuevamente incluyó desafíos de anfitrión-invitado y un desafío de propiedad física. También se incluyó un desafío de unión de proteína-ligando en fragmentos de PHIPA. La unión huésped-huésped se centró en varias moléculas pequeñas que se unen al octaácido y exo-octaácido; unión de dos compuestos a una serie de derivados de ciclodextrina; y unión de una serie de moléculas pequeñas a un huésped en forma de clip conocido como TrimerTrip. Se llevó a cabo un taller virtual SAMPL7 y está disponible en línea . Actualmente se está llevando a cabo un desafío de propiedades físicas de SAMPL7 . Los planes para un taller en persona de EuroSAMPL en el otoño de 2020 fueron descarrilados por COVID-19 y el taller se está llevando a cabo virtualmente. Las entradas de SAMPL7 y (a medida que se completan los componentes del desafío, los resultados) están disponibles a través del repositorio SAMPL6 GitHub .
SAMPL8
La primera fase de SAMPL8 se centra en las predicciones de unión entre el anfitrión y el huésped de las drogas de abuso a CB8, como se detalla en el repositorio GitHub de SAMPL8 . Los componentes restantes de SAMPL8 aún se están planificando.
Problemas especiales de SAMPL
- SAMPL3
- Hidratación SAMPL4
- Enlace SAMPL4
- Coeficientes de distribución SAMPL5
- Host-invitado de SAMPL5
- SAMPL6 Parte 1 (anfitrión-invitado)
Futuros retos
Está previsto que SAMPL continúe centrándose en la predicción de propiedades físicas, incluidos los valores de logP y logD, la predicción de pKa, la unión huésped-huésped y otras propiedades, además de ampliarse para incluir un componente ligando de proteína. [9] Está previsto que los co-investigadores de SAMPL (Chodera, Gibb e Isaacs) recopilen directamente algunos datos, pero también se proponen asociaciones y pasantías de la industria. [9]
Ver también
- Descubrimiento de medicamento
- Compuesto de plomo
- Unión molecular
- Reconocimiento molecular
- Dinámica molecular
- Mecánica molecular
- Modelo de agua
- CASP
- CAPRI
- BindingDB
Referencias
- ↑ a b Geballe, Matthew T .; Skillman, A. Geoffrey; Nicholls, Anthony; Guthrie, J. Peter; Taylor, Peter J. (9 de mayo de 2010). "El desafío de la predicción ciega de SAMPL2: introducción y descripción general". Revista de diseño molecular asistido por computadora . 24 (4): 259-279. doi : 10.1007 / s10822-010-9350-8 . ISSN 0920-654X . PMID 20455007 . S2CID 12363968 .
- ^ a b Skillman, A. Geoffrey (24 de mayo de 2012). "SAMPL3: predicción ciega de afinidades de unión huésped-huésped, energías libres de hidratación e inhibidores de tripsina". Revista de diseño molecular asistido por computadora . 26 (5): 473–474. doi : 10.1007 / s10822-012-9580-z . ISSN 0920-654X . PMID 22622621 . S2CID 8335429 .
- ^ a b Muddana, Hari S .; Varnado, C. Daniel; Bielawski, Christopher W .; Urbach, Adam R .; Isaacs, Lyle; Geballe, Matthew T .; Gilson, Michael K. (25 de febrero de 2012). "Predicción ciega de afinidades de unión huésped-huésped: un nuevo desafío SAMPL3" . Revista de diseño molecular asistido por computadora . 26 (5): 475–487. doi : 10.1007 / s10822-012-9554-1 . ISSN 0920-654X . PMC 3383923 . PMID 22366955 .
- ^ a b Muddana, Hari S .; Fenley, Andrew T .; Mobley, David L .; Gilson, Michael K. (6 de marzo de 2014). "El desafío de predicción ciega del anfitrión-invitado de SAMPL4: una descripción general" . Revista de diseño molecular asistido por computadora . 28 (4): 305–317. doi : 10.1007 / s10822-014-9735-1 . ISSN 0920-654X . PMC 4053502 . PMID 24599514 .
- ^ a b Mobley, David L .; Wymer, Karisa L .; Lim, Nathan M .; Guthrie, J. Peter (11 de marzo de 2014). "Predicción ciega de energías libres de solvatación del desafío SAMPL4" . Revista de diseño molecular asistido por computadora . 28 (3): 135–150. doi : 10.1007 / s10822-014-9718-2 . ISSN 0920-654X . PMC 4006301 . PMID 24615156 .
- ^ a b Yin, Jian; Henriksen, Niel M .; Slochower, David R .; Camisas, Michael R .; Chiu, Michael W .; Mobley, David L .; Gilson, Michael K. (22 de septiembre de 2016). "Descripción general del desafío anfitrión-invitado de SAMPL5: ¿Lo estamos haciendo mejor?" . Revista de diseño molecular asistido por computadora . 31 (1): 1–19. doi : 10.1007 / s10822-016-9974-4 . ISSN 0920-654X . PMC 5241188 . PMID 27658802 .
- ^ a b Bannan, Caitlin C .; Burley, Kalistyn H .; Chiu, Michael; Camisas, Michael R .; Gilson, Michael K .; Mobley, David L. (27 de septiembre de 2016). "Predicción ciega de los coeficientes de distribución de ciclohexano-agua del desafío SAMPL5" . Revista de diseño molecular asistido por computadora . 30 (11): 927–944. doi : 10.1007 / s10822-016-9954-8 . ISSN 0920-654X . PMC 5209301 . PMID 27677750 .
- ^ L, Mobley, David; D, Chodera, John; K, Gilson, Michael (21 de junio de 2017). "Resultados de la encuesta de hoja de ruta 2017 de la comunidad de desafío de evaluación estadística de modelado de proteínas y ligandos (SAMPL)" . Beca .
- ^ a b c d Mobley, David L .; Chodera, John D .; Isaacs, Lyle; Gibb, Bruce C. (2016). "Avanzando en el modelado predictivo a través del desarrollo enfocado de sistemas de modelos para impulsar nuevas innovaciones de modelado" . Zenodo . doi : 10.5281 / zenodo.163963 .
- ^ a b Mobley, David L. (5 de octubre de 2016). "Avanzando en el modelado predictivo a través del desarrollo enfocado de sistemas de modelos para impulsar nuevas innovaciones de modelado" . Beca electrónica.
- ^ "D3R | SAMPL" .
- ^ Mobley, David L .; Gilson, Michael K. (8 de diciembre de 2016). "Predicción de energías libres vinculantes: fronteras y puntos de referencia". bioRxiv 10.1101 / 074625 .
- ^ Muddana, Hari S .; Gilson, Michael K. (25 de enero de 2012). "Predicción de las afinidades de unión del huésped-huésped de SAMPL3: evaluación de la precisión de los campos de fuerza generalizados" . Revista de diseño molecular asistido por computadora . 26 (5): 517–525. doi : 10.1007 / s10822-012-9544-3 . ISSN 0920-654X . PMC 3383906 . PMID 22274835 .
- ^ Mobley, David L .; Liu, Shaui; Cerutti, David S .; Swope, William C .; Rice, Julia E. (24 de diciembre de 2011). "Predicción alquímica de energías libres de hidratación para SAMPL" . Revista de diseño molecular asistido por computadora . 26 (5): 551–562. doi : 10.1007 / s10822-011-9528-8 . ISSN 0920-654X . PMC 3583515 . PMID 22198475 .
- ^ Pal, Rajat Kumar; Haider, Kamran; Kaur, Divya; Flynn, William; Xia, Junchao; Levy, Ronald M .; Taran, Tetiana; Wickstrom, Lauren; Kurtzman, Tom; Gallicchio, Emilio (30 de septiembre de 2016). "Un tratamiento combinado de hidratación y efectos dinámicos para el modelado de la termodinámica de unión huésped-huésped: el desafío ciego de SAMPL5" . Revista de diseño molecular asistido por computadora . 31 (1): 29–44. doi : 10.1007 / s10822-016-9956-6 . ISSN 0920-654X . PMC 5477994 . PMID 27696239 .
- ^ Brini, Emiliano; Paranahewage, S. Shanaka; Fennell, Christopher J .; Eneldo, Ken A. (8 de septiembre de 2016). "Adaptación del modelo de solvatación de ensamblaje semi-explícito para estimar la partición de agua-ciclohexano con las moléculas SAMPL5" . Revista de diseño molecular asistido por computadora . 30 (11): 1067–1077. doi : 10.1007 / s10822-016-9961-9 . ISSN 0920-654X . PMC 5261860 . PMID 27632227 .
- ^ Seguro, Rebecca; Antony, Jens; Grimme, Stefan (27 de marzo de 2014). "Predicción ciega de afinidades de unión para sistemas huésped-huésped supramoleculares cargados: logros y deficiencias de DFT-D3". El Journal of Physical Chemistry B . 118 (12): 3431–3440. doi : 10.1021 / jp411616b . ISSN 1520-6106 . PMID 24588346 .
- ^ Klamt, Andreas; Eckert, Frank; Reinisch, Jens; Wichmann, Karin (26 de julio de 2016). "Predicción de los coeficientes de distribución de ciclohexano-agua con COSMO-RS en el conjunto de datos SAMPL5". Revista de diseño molecular asistido por computadora . 30 (11): 959–967. doi : 10.1007 / s10822-016-9927-y . ISSN 0920-654X . PMID 27460058 . S2CID 33238269 .
- ^ "SAMPL | Desafíos" . samplchallenges.github.io . Consultado el 3 de julio de 2020 .
- ^ "Revista de diseño molecular asistido por computadora - todos los volúmenes y temas - Springer" . link.springer.com . Consultado el 12 de enero de 2017 .
- ^ Nicholls, Anthony; Mobley, David L .; Guthrie, J. Peter; Chodera, John D .; Bayly, Christopher I .; Cooper, Matthew D .; Pande, Vijay S. (1 de febrero de 2008). "Predicción de energías libres de solvatación de moléculas pequeñas: una prueba ciega informal para la química computacional" . Revista de química medicinal . 51 (4): 769–779. doi : 10.1021 / jm070549 + . ISSN 0022-2623 . PMID 18215013 . S2CID 35414610 .
- ^ Guthrie, J. Peter (9 de abril de 2009). "Un desafío ciego para las energías libres de solvatación computacional: Introducción y descripción general" . El Journal of Physical Chemistry B . 113 (14): 4501–4507. doi : 10.1021 / jp806724u . ISSN 1520-6106 . PMID 19338360 .
- ^ Gathiaka, Symon; Liu, Shuai; Chiu, Michael; Yang, Huanwang; Stuckey, Jeanne A .; Kang, You Na; Delproposto, Jim; Kubish, jengibre; Dunbar, James B. (30 de septiembre de 2016). "Gran desafío de D3R 2015: evaluación de la pose de proteína-ligando y predicciones de afinidad" . Revista de diseño molecular asistido por computadora . 30 (9): 651–668. doi : 10.1007 / s10822-016-9946-8 . ISSN 0920-654X . PMC 5562487 . PMID 27696240 .
- ^ Yin, Jian; Henriksen, Niel M .; Slochower, David R .; Gilson, Michael K. (16 de septiembre de 2016). "El desafío anfitrión-huésped de SAMPL5: cálculo de entalpías y energías libres de enlace a partir de simulaciones explícitas de solventes mediante el método adjuntar-tirar-soltar (APR)" . Revista de diseño molecular asistido por computadora . 31 (1): 133-145. doi : 10.1007 / s10822-016-9970-8 . ISSN 0920-654X . PMC 5241238 . PMID 27638809 .
- ^ Bosisio, Stefano; Mey, Antonia SJS; Michel, Julien (8 de agosto de 2016). "Predicciones cegadas de las energías libres de enlace estándar de host-invitado en el desafío SAMPL5" (PDF) . Revista de diseño molecular asistido por computadora . 31 (1): 61–70. doi : 10.1007 / s10822-016-9933-0 . ISSN 0920-654X . PMID 27503495 . S2CID 31110594 .
enlaces externos
- Sitio web