Funciones de puntuación para el acoplamiento


De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

En los campos de la química computacional y el modelado molecular , las funciones de puntuación son funciones matemáticas que se utilizan para predecir aproximadamente la afinidad de unión entre dos moléculas después de que se hayan acoplado . Por lo general, una de las moléculas es un pequeño compuesto orgánico , como un fármaco, y la segunda es el objetivo biológico del fármaco, como un receptor de proteína . [1] También se han desarrollado funciones de puntuación para predecir la fuerza de las interacciones intermoleculares entre dos proteínas [2] o entre proteína y ADN . [3]

Utilidad

Las funciones de puntuación se utilizan ampliamente en el descubrimiento de fármacos y otras aplicaciones de modelado molecular . Estos incluyen: [4]

  • Exploración virtual debases de datos de moléculas pequeñas de ligandos candidatos para identificar nuevas moléculas pequeñas que se unen a una proteína objetivo de interés y, por lo tanto, son puntos de partida útiles para el descubrimiento de fármacos [5].
  • Diseño de novo (diseño "desde cero") de nuevas moléculas pequeñas que se unen a una proteína objetivo [6]
  • Lidere la optimización de los resultados del cribado para optimizar su afinidad y selectividad [7]

Una alternativa potencialmente más confiable pero mucho más exigente desde el punto de vista computacional a las funciones de puntuación son los cálculos de perturbación de energía libre . [8]

Prerrequisitos

Las funciones de puntuación normalmente se parametrizan (o entrenan) contra un conjunto de datos que consta de afinidades de unión determinadas experimentalmente entre especies moleculares similares a las especies que se desean predecir.

Para los métodos utilizados actualmente que tienen como objetivo predecir las afinidades de los ligandos por las proteínas, primero se debe conocer o predecir lo siguiente:

  • Proteína estructura terciaria - la disposición de los átomos de la proteína en el espacio tridimensional. Las estructuras de proteínas pueden determinarse mediante técnicas experimentales tales como cristalografía de rayos X o métodos de RMN en fase de solución o predecirse mediante modelos de homología .
  • Conformación activa del ligando : forma tridimensional del ligando cuando se une a la proteína
  • Modo de enlace : orientación de los dos socios de enlace entre sí en el complejo

La información anterior produce la estructura tridimensional del complejo. Basándose en esta estructura, la función de puntuación puede estimar la fuerza de la asociación entre las dos moléculas en el complejo utilizando uno de los métodos que se describen a continuación. Finalmente, la función de puntuación en sí misma puede usarse para ayudar a predecir tanto el modo de unión como la conformación activa de la molécula pequeña en el complejo, o alternativamente se puede utilizar una función más simple y computacionalmente más rápida dentro de la ejecución de acoplamiento.

Clases

Hay cuatro clases generales de funciones de puntuación: [9] [10] [11]

  • Campo de fuerza : las afinidades se estiman sumando la fuerza de van der Waals intermolecular y las interacciones electrostáticas entre todos los átomos de las dos moléculas del complejo utilizando un campo de fuerza . Las energías intramoleculares (también denominadas energía de deformación ) de los dos socios de unión también se incluyen con frecuencia. Finalmente, dado que la unión tiene lugar normalmente en presencia de agua, las energías de desolvatación del ligando y de la proteína a veces se tienen en cuenta utilizando métodos de solvatación implícitos como GBSA o PBSA . [12]
  • Empírico : basado en el recuento de varios tipos de interacciones entre los dos socios vinculantes. [6] El recuento puede basarse en el número de átomos del ligando y del receptor en contacto entre sí o calculando el cambio en el área superficial accesible al solvente (ΔSASA) en el complejo en comparación con el ligando y la proteína no complejados. Los coeficientes de la función de puntuación suelen ajustarse mediante métodos de regresión lineal múltiple . Estos términos de interacción de la función pueden incluir, por ejemplo:
    • hidrofóbico - contactos hidrofóbicos (favorable),
    • contactos hidrofóbicos - hidrofílicos (desfavorables) (explican los enlaces de hidrógeno no cubiertos, que son una importante contribución entalpica a la unión. [13] Un enlace de hidrógeno perdido puede representar 1-2 órdenes de magnitud en la afinidad de unión. [14] ),
    • número de enlaces de hidrógeno (contribución favorable a la afinidad, especialmente si está protegido del solvente, si el solvente expuesto no hay contribución),
    • número de enlaces rotativos inmovilizados en la formación del complejo ( contribución de entropía conformacional desfavorable ).
  • Basado en conocimiento : basado en observaciones estadísticas de contactos cercanos intermoleculares en grandes bases de datos 3D (como Cambridge Structural Database o Protein Data Bank ) que se utilizan para derivar" potenciales de fuerza media " estadísticos . Este método se basa en la suposición de que las interacciones intermoleculares cercanas entre ciertos tipos de átomos o grupos funcionales que ocurren con más frecuencia de lo que uno esperaría por una distribución aleatoria probablemente sean energéticamente favorables y, por lo tanto, contribuyan favorablemente a la afinidad de unión. [15]
  • Aprendizaje automático : a diferencia de estas funciones de puntuación clásicas, las funciones de puntuación del aprendizaje automático se caracterizan por no asumir una forma funcional predeterminada para la relación entre la afinidad de unión y las características estructurales que describen el complejo proteína-ligando. [16] De esta manera, la forma funcional se infiere directamente de los datos. Se ha descubierto que las funciones de puntuación de aprendizaje automático superan sistemáticamente las funciones de puntuación clásicas en la predicción de la afinidad de unión de diversos complejos proteína-ligando. [17] [18] Este también ha sido el caso de los complejos específicos del objetivo, [19] [20] aunque la ventaja depende del objetivo y depende principalmente del volumen de datos relevantes disponibles. [11][21] Cuando se tiene el cuidado apropiado, las funciones de puntuación de aprendizaje automático tienden a superar con creces las funciones de puntuación clásicas en el problema relacionado de la detección virtual basada en estructuras. [22] [23] [24] [25] [26] [27] [28] [29] Además, si se dispone de datos específicos para el objetivo, esta brecha de rendimiento se amplía [30] Estas revisiones proporcionan una descripción más amplia de la máquina -aprendizaje de funciones de puntuación para el diseño de fármacos basado en estructuras. [11] [31] [32] [33] La elección de señuelos para un objetivo determinado es uno de los factores más importantes para entrenar y probar cualquier función de puntuación. [34]

Los primeros tres tipos, campo de fuerza, empírico y basado en el conocimiento, se denominan comúnmente funciones de puntuación clásicas y se caracterizan por asumir que sus contribuciones a la unión se combinan linealmente. Debido a esta restricción, las funciones de puntuación clásicas no pueden aprovechar grandes cantidades de datos de entrenamiento. [35]

Refinamiento

Dado que las diferentes funciones de puntuación son relativamente colineales, es posible que las funciones de puntuación de consenso no mejoren la precisión de forma significativa. [36] Esta afirmación iba un poco en contra de la opinión predominante en el campo, ya que estudios anteriores habían sugerido que la puntuación por consenso era beneficiosa. [37]

Una función de puntuación perfecta podría predecir la energía libre de unión entre el ligando y su objetivo. Pero en realidad, tanto los métodos computacionales como los recursos computacionales ponen restricciones a este objetivo. Por lo tanto, la mayoría de las veces se seleccionan métodos que minimizan el número de ligandos falsos positivos y falsos negativos. En los casos en los que se dispone de un conjunto de datos de entrenamiento experimental de estructuras y constantes de unión, se ha desarrollado un método simple para refinar la función de puntuación utilizada en el acoplamiento molecular. [38]

Referencias

  1. ^ Jain AN (octubre de 2006). "Funciones de puntuación para acoplamiento proteína-ligando". Ciencia actual de proteínas y péptidos . 7 (5): 407–20. doi : 10.2174 / 138920306778559395 . PMID  17073693 .
  2. ^ Lensink MF, Méndez R, Wodak SJ (diciembre de 2007). "Complejos de proteínas de acoplamiento y puntuación: CAPRI 3ª edición". Las proteínas . 69 (4): 704-18. doi : 10.1002 / prot.21804 . PMID 17918726 . S2CID 25383642 .  
  3. ^ Robertson TA, Varani G (febrero de 2007). "Una función de puntuación dependiente de la distancia de todos los átomos para la predicción de interacciones proteína-ADN de la estructura". Las proteínas . 66 (2): 359–74. doi : 10.1002 / prot.21162 . PMID 17078093 . S2CID 24437518 .  
  4. ^ Rajamani R, Good AC (mayo de 2007). "Poses de clasificación en el descubrimiento y optimización de prospectos basados ​​en estructuras: tendencias actuales en el desarrollo de funciones de puntuación". Opinión actual sobre descubrimiento y desarrollo de fármacos . 10 (3): 308–15. PMID 17554857 . 
  5. ^ Seifert MH, Kraus J, Kramer B (mayo de 2007). "Cribado virtual de alto rendimiento de bases de datos moleculares". Opinión actual sobre descubrimiento y desarrollo de fármacos . 10 (3): 298-307. PMID 17554856 . 
  6. ↑ a b Böhm HJ (julio de 1998). "Predicción de las constantes de unión de ligandos de proteínas: un método rápido para la priorización de aciertos obtenidos de programas de búsqueda de base de datos de diseño de novo o 3D". Revista de diseño molecular asistido por computadora . 12 (4): 309–23. Código Bibliográfico : 1998JCAMD..12..309B . doi : 10.1023 / A: 1007999920146 . PMID 9777490 . S2CID 7474036 .  
  7. ^ Joseph-McCarthy D, Baber JC, Feyfant E, Thompson DC, Humblet C (mayo de 2007). "Optimización de clientes potenciales mediante acoplamiento molecular de alto rendimiento". Opinión actual sobre descubrimiento y desarrollo de fármacos . 10 (3): 264–74. PMID 17554852 . 
  8. ^ Foloppe N, Hubbard R (2006). "¿Hacia el diseño de ligando predictivo con métodos computacionales basados ​​en energía libre?". Química Medicinal Actual . 13 (29): 3583–608. doi : 10.2174 / 092986706779026165 . PMID 17168725 . 
  9. ^ Fenu LA, Lewis RA, Good AC, Bodkin M, Essex JW (2007). "Capítulo 9: Funciones de puntuación: de las energías libres de vinculación al enriquecimiento en el cribado virtual" . En Dhoti H, Leach AR (eds.). Descubrimiento de fármacos basado en estructuras . Dordrecht: Springer. págs. 223–246. ISBN 978-1-4020-4407-6.
  10. ^ Sotriffer C, Materia H (2011). "Capítulo 7.3: Clases de funciones de puntuación" . En Sotriffer C (ed.). Proyección virtual: principios, desafíos y pautas prácticas . 48 . John Wiley & Sons, Inc. ISBN 978-3-527-63334-0.
  11. ↑ a b c Ain QU, Aleksandrova A, Roessler FD, Ballester PJ (1 de noviembre de 2015). "Funciones de puntuación de aprendizaje automático para mejorar la predicción de afinidad de unión basada en la estructura y el cribado virtual" . Revisiones interdisciplinarias de Wiley: ciencia molecular computacional . 5 (6): 405–424. doi : 10.1002 / wcms.1225 . PMC 4832270 . PMID 27110292 .  
  12. ^ Genheden S, Ryde U (mayo de 2015). "Los métodos MM / PBSA y MM / GBSA para estimar afinidades de unión a ligando" . Opinión de expertos sobre el descubrimiento de fármacos . 10 (5): 449–61. doi : 10.1517 / 17460441.2015.1032936 . PMC 4487606 . PMID 25835573 .  
  13. ^ Schneider N, Lange G, Hindle S, Klein R, Rarey M (enero de 2013). "Una descripción coherente de las energías de enlace de hidrógeno y deshidratación en complejos proteína-ligando: métodos detrás de la función de puntuación de HYDE". Revista de diseño molecular asistido por computadora . 27 (1): 15-29. Código bibliográfico : 2013JCAMD..27 ... 15S . doi : 10.1007 / s10822-012-9626-2 . PMID 23269578 . S2CID 1545277 .  
  14. ^ Lange G, Lesuisse D, Deprez P, Schoot B, Loenze P, Bénard D, Marquette JP, Broto P, Sarubbi E, Mandine E (noviembre de 2003). "Los requisitos para la unión específica de fragmentos inhibidores de baja afinidad al dominio SH2 de (pp60) Src son idénticos a los de la unión de alta afinidad de inhibidores de longitud completa". Revista de química medicinal . 46 (24): 5184–95. doi : 10.1021 / jm020970s . PMID 14613321 . 
  15. ^ Muegge I (octubre de 2006). "Revisión de la puntuación de PMF". Revista de química medicinal . 49 (20): 5895–902. doi : 10.1021 / jm050038s . PMID 17004705 . 
  16. ^ Ballester PJ, Mitchell JB (mayo de 2010). "Un enfoque de aprendizaje automático para predecir la afinidad de unión proteína-ligando con aplicaciones al acoplamiento molecular" . Bioinformática . 26 (9): 1169–75. doi : 10.1093 / bioinformatics / btq112 . PMC 3524828 . PMID 20236947 .  
  17. ^ Li H, Leung KS, Wong MH, Ballester PJ (febrero de 2015). "Mejora de AutoDock Vina usando Random Forest: la creciente precisión de la predicción de afinidad de unión mediante la explotación efectiva de conjuntos de datos más grandes". Informática molecular . 34 (2-3): 115-26. doi : 10.1002 / minf.201400132 . PMID 27490034 . S2CID 3444365 .  
  18. Ashtawy HM, Mahapatra NR (1 de abril de 2015). "Una evaluación comparativa de la precisión predictiva de las funciones de puntuación de aprendizaje automático y convencional para la predicción de afinidad de unión de proteína-ligando" . Transacciones IEEE / ACM sobre biología computacional y bioinformática . 12 (2): 335–47. doi : 10.1109 / TCBB.2014.2351824 . PMID 26357221 . 
  19. ^ Zhan W, Li D, Che J, Zhang L, Yang B, Hu Y, Liu T, Dong X (marzo de 2014). "Integración de puntuaciones de acoplamiento, perfiles de interacción y descriptores moleculares para mejorar la precisión del acoplamiento molecular: hacia el descubrimiento de nuevos inhibidores de Akt1". Revista europea de química medicinal . 75 : 11-20. doi : 10.1016 / j.ejmech.2014.01.019 . PMID 24508830 . 
  20. ^ Kinnings SL, Liu N, Tonge PJ, Jackson RM, Xie L, Bourne PE (febrero de 2011). "Un método basado en aprendizaje automático para mejorar las funciones de puntuación de acoplamiento y su aplicación a la reutilización de fármacos" . Revista de información química y modelado . 51 (2): 408-19. doi : 10.1021 / ci100369f . PMC 3076728 . PMID 21291174 .  
  21. Li H, Sze KH, Lu G, Ballester PJ (5 de febrero de 2020). "Funciones de puntuación de aprendizaje automático para la optimización de prospectos de fármacos basada en estructura" . Revisiones interdisciplinarias de Wiley: ciencia molecular computacional . 10 (5). doi : 10.1002 / wcms.1465 .
  22. ^ Li L, Wang B, Meroueh SO (septiembre de 2011). "Apoyo a la puntuación de regresión de vectores de complejos receptor-ligando para el orden de rango y el cribado virtual de bibliotecas químicas" . Revista de información química y modelado . 51 (9): 2132–8. doi : 10.1021 / ci200078f . PMC 3209528 . PMID 21728360 .  
  23. ^ Durrant JD, Friedman AJ, Rogers KE, McCammon JA (julio de 2013). "Comparación de las funciones de puntuación de la red neuronal y el estado del arte: aplicaciones para la detección de bibliotecas comunes" . Revista de información química y modelado . 53 (7): 1726–35. doi : 10.1021 / ci400042y . PMC 3735370 . PMID 23734946 .  
  24. ^ Ding B, Wang J, Li N, Wang W (enero de 2013). "Caracterización de la unión de moléculas pequeñas. I. Identificación precisa de inhibidores fuertes en el cribado virtual" . Revista de información química y modelado . 53 (1): 114–22. doi : 10.1021 / ci300508m . PMC 3584174 . PMID 23259763 .  
  25. ^ Wójcikowski M, Ballester PJ, Siedlecki P (abril de 2017). "Rendimiento de las funciones de puntuación de aprendizaje automático en el cribado virtual basado en estructura" . Informes científicos . 7 : 46710. Bibcode : 2017NatSR ... 746710W . doi : 10.1038 / srep46710 . PMC 5404222 . PMID 28440302 .  
  26. ^ Ragoza M, Hochuli J, Idrobo E, Sunseri J, Koes DR (abril de 2017). "Puntuación de proteína-ligando con redes neuronales convolucionales" . Revista de información química y modelado . 57 (4): 942–957. arXiv : 1612.02751 . doi : 10.1021 / acs.jcim.6b00740 . PMC 5479431 . PMID 28368587 .  
  27. ^ Li H, Peng J, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (marzo de 2018). "El impacto de la estructura de la proteína y la similitud de secuencia en la precisión de las funciones de puntuación de aprendizaje automático para la predicción de afinidad de unión" . Biomoléculas . 8 (1): 12. doi : 10.3390 / biom8010012 . PMC 5871981 . PMID 29538331 .  
  28. ^ Imrie F, Bradley AR, Deane CM (febrero de 2021). "Generación de moléculas señuelo de propiedades coincidentes mediante aprendizaje profundo" . Bioinformática . 37 (btab080): 2134–2141. doi : 10.1093 / bioinformatics / btab080 . PMC 8352508 . PMID 33532838 .  
  29. ^ Adeshina YO, Deeds EJ, Karanicolas J (agosto de 2020). "La clasificación de aprendizaje automático puede reducir los falsos positivos en el cribado virtual basado en estructuras" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 117 (31): 18477–18488. doi : 10.1073 / pnas.2000585117 . PMC 7414157 . PMID 32669436 .  
  30. ^ Xiong GL, Ye WL, Shen C, Lu AP, Hou TJ, Cao DS (junio de 2020). "Mejora del rendimiento de la detección virtual basada en la estructura mediante el aprendizaje de los componentes de la función de puntuación". Sesiones informativas en bioinformática . 22 (bbaa094). doi : 10.1093 / bib / bbaa094 . PMID 32496540 . 
  31. Shen C, Ding J, Wang Z, Cao D, Ding X, Hou T (27 de junio de 2019). "Del aprendizaje automático al aprendizaje profundo: avances en las funciones de puntuación para el acoplamiento proteína-ligando". Revisiones interdisciplinarias de Wiley: ciencia molecular computacional . 10 . doi : 10.1002 / wcms.1429 . S2CID 198336898 . 
  32. Yang X, Wang Y, Byrne R, Schneider G, Yang S (11 de julio de 2019). "Conceptos de inteligencia artificial para el descubrimiento de fármacos asistido por computadora" . Revisiones químicas . 119 (18): 10520–10594. doi : 10.1021 / acs.chemrev.8b00728 . PMID 31294972 . 
  33. Li H, Sze KH, Lu G, Ballester PJ (22 de abril de 2020). "Funciones de puntuación de aprendizaje automático para el cribado virtual basado en estructuras". Revisiones interdisciplinarias de Wiley: ciencia molecular computacional . 11 . doi : 10.1002 / wcms.1478 . S2CID 219089637 . 
  34. ^ Ballester PJ (diciembre de 2019). "Selección de funciones de puntuación de aprendizaje automático para el cribado virtual basado en estructuras" . Descubrimiento de drogas hoy. Tecnologías . 32–33: 81–87. doi : 10.1016 / j.ddtec.2020.09.001 . PMID 33386098 . S2CID 224968364 .  
  35. ^ Li H, Peng J, Sidorov P, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (marzo de 2019). "Las funciones clásicas de puntuación para el acoplamiento no pueden explotar grandes volúmenes de datos estructurales y de interacción". Bioinformática . Oxford, Inglaterra. 35 (20): 3989–3995. doi : 10.1093 / bioinformatics / btz183 . PMID 30873528 . 
  36. ^ Englebienne P, Moitessier N (junio de 2009). "Acoplamiento de ligandos en macromoléculas flexibles y solvatadas. 4. ¿Son precisas las funciones de puntuación populares para esta clase de proteínas?". Revista de información química y modelado . 49 (6): 1568–80. doi : 10.1021 / ci8004308 . PMID 19445499 . 
  37. ^ Oda A, Tsuchida K, Takakura T, Yamaotsu N, Hirono S (2006). "Comparación de estrategias de puntuación de consenso para evaluar modelos computacionales de complejos proteína-ligando". Revista de información química y modelado . 46 (1): 380–91. doi : 10.1021 / ci050283k . PMID 16426072 . 
  38. ^ Hellgren M, Carlsson J, Ostberg LJ, Staab CA, Persson B, Höög JO (septiembre de 2010). "Enriquecimiento de ligandos con acoplamientos moleculares y posterior caracterización de la alcohol deshidrogenasa 3 humana". Ciencias de la vida celular y molecular . 67 (17): 3005-15. doi : 10.1007 / s00018-010-0370-2 . PMID 20405162 . S2CID 2391130 .  
Obtenido de " https://en.wikipedia.org/w/index.php?title=Scoring_functions_for_docking&oldid=1046658088 "