El dominio de aplicabilidad (DA) de un modelo QSAR es el espacio físico-químico, estructural o biológico, el conocimiento o la información sobre la cual se ha desarrollado el conjunto de entrenamiento del modelo y para el cual es aplicable para hacer predicciones para nuevos compuestos.
El propósito de la AD es indicar si se cumplen los supuestos del modelo y para qué sustancias químicas se puede aplicar el modelo de manera confiable. En general, este es el caso de la interpolación más que de la extrapolación . Hasta ahora no existe un algoritmo único generalmente aceptado para determinar la DA: se puede encontrar una encuesta completa en un Informe y Recomendaciones del Taller 52 de ECVAM. [1] Existe un enfoque bastante sistemático para definir las regiones de interpolación. [2]El proceso implica la eliminación de valores atípicos y un método de distribución de densidad de probabilidad que utiliza un muestreo ponderado por kernel. Otro enfoque ampliamente utilizado para el DA estructural de los modelos de regresión QSAR se basa en el apalancamiento calculado a partir de los valores diagonales de la matriz hat de los descriptores moleculares de modelado. [3] [4] [5] Un reciente y riguroso estudio de evaluación comparativa de varios algoritmos AD identificó la desviación estándar de las predicciones del modelo como el enfoque más confiable. [6] Para investigar el DA de un conjunto de entrenamiento de sustancias químicas, se pueden analizar directamente las propiedades del espacio descriptor multivariado de los compuestos de entrenamiento o más indirectamente a través de métricas de distancia (o similitud). Al usar métricas de distancia, se debe tener cuidado de usar un espacio vectorial ortogonal y significativo. Esto se puede lograr mediante diferentes medios de selección de características y análisis de componentes principales sucesivos .
Notas
- ^ Netzeva T, Worth A, Aldenberg T, Benigni R, Cronin M, Gramatica P, Jaworska J, Kahn S, Klopman G, Marchant C, Myatt G, Nikolova-Jeliazkova N, Patlewicz G, Perkins R, Roberts D, Schultz T , Stanton D, van de Sandt J, Tong W, Veith G, Yang C: Estado actual de los métodos para definir el dominio de aplicabilidad de las relaciones estructura-actividad (cuantitativas). Altern Lab Anim 2005, 33: 1-19
- ^ Jaworska J, Nikolova-Jeliazkova N, Aldenberg T: Estimación del dominio de aplicabilidad de QSAR por proyección del espacio del descriptor del conjunto de entrenamiento: una revisión. Altern Lab Anim 2005, 33 (5): 445-459
- ^ Atkinson AC, Plots, Transformations and Regression, Clarendon Press, Oxford, 1985, p.282
- ^ Tropsha A, Gramatica P, Gombar VK, La importancia de ser serio: la validación es absolutamente esencial para la aplicación e interpretación exitosa de los modelos QSPR. QSAR Comb.Sci. 2003, 22: 69-77
- ^ Gramatica P, Principios de validación de modelos QSAR: QSAR Comb.Sci interno y externo. 2007, 26 (5): 694-701
- ^ Tetko IV, Sushko I, Pandey AK, Zhu H, Tropsha A, Papa E, Oberg T, Todeschini R, Fourches D, Varnek A. Evaluación crítica de modelos QSAR de toxicidad ambiental contra Tetrahymena pyriformis: centrándose en el dominio de aplicabilidad y sobreajuste selección de variables. Modelo J Chem Inf. Septiembre de 2008; 48 (9): 1733-46.