La especificación de objetivo arbitrario SMILES (SMARTS) es un lenguaje para especificar patrones subestructurales en moléculas . La notación de línea SMARTS es expresiva y permite una especificación subestructura y una tipificación de átomos extremadamente precisas y transparentes.
SMARTS está relacionado con la notación de línea SMILES que se utiliza para codificar estructuras moleculares y, al igual que SMILES, fue desarrollado originalmente por David Weininger y sus colegas de Daylight Chemical Information Systems . Las descripciones más completas del lenguaje SMARTS se pueden encontrar en el manual de teoría SMARTS de Daylight, [1] tutorial [2] y ejemplos. [3] OpenEye Scientific Software ha desarrollado su propia versión de SMARTS que difiere de la versión original de Daylight en cómo R
se define el descriptor (ver ciclicidad a continuación).
Sintaxis de SMARTS
Propiedades atómicas
Los átomos se pueden especificar por símbolo o número atómico. El carbono alifático está emparejado por [C]
, el carbono aromático por [c]
y cualquier carbono por [#6]
o [C,c]
. Los símbolos de la tarjeta salvaje *
, A
y a
encontró ningún átomo, cualquier alifático átomo y cualquier aromático átomo respectivamente. Los hidrógenos implícitos se consideran una característica de los átomos y los SMARTS para un grupo amino se pueden escribir como [NH2]
. La carga se especifica mediante los descriptores +
y, -
como ejemplo, los SMARTS [nH+]
( átomo de nitrógeno aromático protonado ) y [O-]C(=O)c
( ácido carboxílico aromático desprotonado ).
Cautiverio
Se pueden especificar varios tipos de enlaces: -
(simple), =
(doble), #
(triple), :
(aromático) y ~
(cualquiera).
Conectividad
Los descriptores X
y D
se utilizan para especificar el número total de conexiones (incluidos los átomos de hidrógeno implícitos) y las conexiones a átomos explícitos. Por lo tanto, [CX4]
empareja los átomos de carbono con enlaces a otros cuatro átomos, mientras que [CD4]
empareja el carbono cuaternario.
Ciclicidad
Como lo definió originalmente Daylight, el R
descriptor se utiliza para especificar la pertenencia al anillo. En el modelo Daylight para sistemas cíclicos, el conjunto más pequeño de anillos más pequeños (SSSR) [4] se utiliza como base para la pertenencia al anillo. Por ejemplo, el indol se percibe como un anillo de 5 miembros fusionado con un anillo de 6 miembros en lugar de un anillo de 9 miembros. Los dos átomos de carbono que forman la fusión del anillo coincidirían [cR2]
y los otros átomos de carbono coincidirían [cR1]
.
El modelo SSSR ha sido criticado por OpenEye [5] quien, en su implementación de SMARTS, usa R
para denotar el número de enlaces de anillo para un átomo. Los dos átomos de carbono en la fusión del anillo coinciden [cR3]
y los otros carbonos coinciden [cR2]
en la implementación OpenEye de SMARTS. Usado sin un número, R
especifica un átomo en un anillo en ambas implementaciones, por ejemplo [CR]
(átomo de carbono alifático en un anillo).
La minúscula r
especifica el tamaño del anillo más pequeño del que forma parte el átomo. Los átomos de carbono de la fusión del anillo coincidirían [cr5]
. Los enlaces se pueden especificar como cíclicos, por ejemplo, C@C
coincide con los átomos enlazados directamente en un anillo.
Operadores logicos
Cuatro operadores lógicos permiten combinar descriptores de átomos y enlaces. El operador 'y' ;
se puede utilizar para definir una amina primaria protonada como [N;H3;+][C;X4]
. El operador 'o' ,
tiene una prioridad más alta, por lo que [c,n;H]
define (carbono aromático o nitrógeno aromático) con hidrógeno implícito. El operador 'y' &
tiene una prioridad más alta que la ,
que [c,n&H]
define el carbono aromático o (nitrógeno aromático con hidrógeno implícito).
El operador "no" !
se puede utilizar para definir el carbono alifático insaturado como [C;!X4]
y los enlaces acíclicos como *-!@*
.
SMARTS recursivos
Los SMARTS recursivos permiten una especificación detallada del entorno de un átomo. Por ejemplo, los átomos de carbono orto y para de fenol más reactivos (con respecto a la sustitución aromática electrófila ) se pueden definir como .[$(c1c([OH])cccc1),$(c1ccc([OH])cc1)]
Ejemplos de SMARTS
Daylight ha reunido varios ejemplos ilustrativos de SMARTS.
Las definiciones de donantes y aceptores de enlaces de hidrógeno utilizadas para aplicar la Regla de los Cinco de Lipinski . [6] se codifican fácilmente en SMARTS. Los donantes se definen como átomos de nitrógeno u oxígeno que tienen al menos un átomo de hidrógeno unido directamente:
[N,n,O;!H0]
o[#7,#8;!H0]
(el oxígeno aromático no puede tener un hidrógeno enlazado)
Los receptores se definen como nitrógeno u oxígeno:
[N,n,O,o]
o[#7,#8]
Una definición simple de aminas alifáticas que es probable que protonen a pH fisiológico se puede escribir como los siguientes SMARTS recursivos:
[$([NH2][CX4]),$([NH]([CX4])[CX4]),$([NX3]([CX4])([CX4])[CX4])]
En aplicaciones reales, los CX4
átomos deberían definirse con mayor precisión para evitar el emparejamiento con grupos aceptores de electrones como el CF 3 que harían que la amina no fuera lo suficientemente básica para protonar a pH fisiológico .
SMARTS se puede utilizar para codificar elementos farmacóforos como centros aniónicos. En el siguiente ejemplo, la notación SMARTS recursiva se usa para combinar oxígeno ácido y nitrógeno tetrazol en una definición de átomos de oxígeno que probablemente sean aniónicos en condiciones fisiológicas normales.
[$([OH][C,S,P]=O),$([nH]1nnnc1)]
Los SMARTS anteriores solo coincidirían con el hidroxilo ácido y el tetrazol N − H. Cuando un ácido carboxílico se desprotoniza, la carga negativa se deslocaliza sobre ambos átomos de oxígeno y puede ser deseable designar ambos como aniónicos. Esto se puede lograr utilizando los siguientes SMARTS.
[$([OH])C=O),$(O=C[OH])]
Aplicaciones de SMARTS
La especificación subestructural precisa y transparente que permite SMARTS se ha aprovechado en varias aplicaciones.
Se han utilizado filtros subestructurales definidos en SMARTS [7] para identificar compuestos indeseables cuando se realiza una combinación estratégica de compuestos para un cribado de alto rendimiento. El procedimiento REOS (eliminación rápida de desechos) [8] utiliza SMARTS para filtrar restos reactivos, tóxicos y de otro modo indeseables de las bases de datos de estructuras químicas.
RECAP [9] (Procedimiento de análisis combinatorio retrosintético) utiliza SMARTS para definir los tipos de enlaces. RECAP es un editor de moléculas que genera fragmentos de estructuras rompiendo enlaces de tipos definidos y los puntos de enlace originales en estos se especifican mediante etiquetas isotópicas. La búsqueda de fragmentos en bases de datos de compuestos biológicamente activos permite identificar motivos estructurales privilegiados. Molecular Slicer [10] es similar a RECAP y se ha utilizado para identificar fragmentos que se encuentran comúnmente en los medicamentos orales comercializados.
El programa Leatherface [11] es un editor de moléculas de propósito general que permite la modificación automatizada de una serie de características subestructurales de moléculas en bases de datos, incluyendo estado de protonación, recuento de hidrógeno, carga formal, peso isotópico y orden de enlace. Las reglas de edición molecular utilizadas por Leatherface se definen en SMARTS. Leatherface se puede utilizar para estandarizar los estados tautoméricos y de ionización y para establecerlos y enumerarlos en la preparación de bases de datos [12] para el cribado virtual . Leatherface se ha utilizado en el análisis de pares moleculares emparejados , que permite cuantificar los efectos de los cambios estructurales (por ejemplo, sustitución de hidrógeno por cloro) [13] en una variedad de tipos estructurales.
ALADDIN [14] es un programa de emparejamiento de farmacóforos que utiliza SMARTS para definir puntos de reconocimiento (por ejemplo, aceptor de enlace de hidrógeno neutro ) de farmacóforos. Un problema clave en el emparejamiento de farmacóforos es que los grupos funcionales que probablemente se ionizarán a pH fisiológico se registran típicamente en sus formas neutras en bases de datos estructurales. El programa de correspondencia de formas ROCS permite definir tipos de átomos utilizando SMARTS. [15]
notas y referencias
- ^ Manual de teoría SMARTS , Sistemas de información química diurna, Santa Fe, Nuevo México
- ^ Tutorial SMARTS , Sistemas de información química diurna, Santa Fe, Nuevo México
- ^ Ejemplos de SMARTS , sistemas de información química diurna, Santa Fe, Nuevo México.
- ^ Downs, GM; Gillet, VJ; Holliday, JD; Lynch, MF (1989). "Una revisión de los algoritmos de percepción del anillo para gráficos químicos". J. Chem. Inf. Computación. Sci. 29 (3): 172-187. doi : 10.1021 / ci00063a007 .
- ^ "El conjunto más pequeño de anillos más pequeños (SSSR) considerado nocivo" . Archivado desde el original el 14 de octubre de 2007 . Consultado el 8 de febrero de 2017 .CS1 maint: bot: estado de URL original desconocido ( enlace ), OEChem - Manual de C ++, versión 1.5.1, OpenEye Scientific Software, Santa Fe, Nuevo México
- ^ Lipinski, Christopher A .; Lombardo, Franco; Dominy, Beryl W .; Feeney, Paul J. (2001). "Enfoques experimentales y computacionales para estimar la solubilidad y la permeabilidad en entornos de desarrollo y descubrimiento de fármacos". Revisiones avanzadas de entrega de medicamentos . 46 (1-3): 3-26. doi : 10.1016 / S0169-409X (00) 00129-0 . PMID 11259830 .
- ^ Hann, Mike; Hudson, Brian; Lewell, Xiao; Lifely, Rob; Miller, Luke; Ramsden, Nigel (1999). "Combinación estratégica de compuestos para el cribado de alto rendimiento". Revista de Información Química y Ciencias de la Computación . 39 (5): 897–902. doi : 10.1021 / ci990423o . PMID 10529988 .
- ^ Walters, W. Patrick; Murcko, Mark A. (2002). "Predicción de 'parecido a las drogas ' ". Revisiones avanzadas de entrega de medicamentos . 54 (3): 255-271. doi : 10.1016 / S0169-409X (02) 00003-0 . PMID 11922947 .
- ^ Lewell, Xiao Qing; Judd, Duncan B .; Watson, Stephen P .; Hann, Michael M. (1998). "Procedimiento de análisis combinatorio RECAPRetrosynthetic: una nueva y poderosa técnica para identificar fragmentos moleculares privilegiados con aplicaciones útiles en química combinatoria". Revista de Información Química y Ciencias de la Computación . 38 (3): 511-522. doi : 10.1021 / ci970429i . PMID 9611787 .
- ^ Vieth, Michal; Siegel, Miles G .; Higgs, Richard E .; Watson, Ian A .; Robertson, Daniel H .; Savin, Kenneth A .; Durst, Gregory L .; Hipskind, Philip A. (2004). "Propiedades físicas características y fragmentos estructurales de los fármacos orales comercializados". Revista de química medicinal . 47 : 224-232. doi : 10.1021 / jm030267j . PMID 14695836 .
- ^ Kenny, Peter W .; Sadowski, Jens (2005). "Modificación de estructura en bases de datos químicas". Quimioinformática en el descubrimiento de fármacos . Métodos y principios en química medicinal. págs. 271-285 . doi : 10.1002 / 3527603743.ch11 . ISBN 9783527307531.
- ^ Lyne, Paul D .; Kenny, Peter W .; Cosgrove, David A .; Deng, Chun; Zabludoff, Sonya; Wendoloski, John J .; Ashwell, Susan (2004). "Identificación de compuestos con afinidad de unión nanomolar para el punto de control quinasa-1 mediante el cribado virtual basado en el conocimiento". Revista de química medicinal . 47 (8): 1962–1968. doi : 10.1021 / jm030504i . PMID 15055996 .
- ^ Leach, Andrew G .; Jones, Huw D .; Cosgrove, David A .; Kenny, Peter W .; Ruston, Linette; MacFaul, Philip; Wood, J. Matthew; Colclough, Nicola; Ley, Brian (2006). "Pares moleculares emparejados como guía en la optimización de propiedades farmacéuticas; un estudio de solubilidad acuosa, unión a proteínas plasmáticas y exposición oral". Revista de química medicinal . 49 (23): 6672–6682. doi : 10.1021 / jm0605233 . PMID 17154498 .
- ^ Van Drie, John H .; Weininger, David; Martin, Yvonne C. (1989). "ALADDIN: Una herramienta integrada para el diseño molecular asistido por computadora y el reconocimiento de farmacóforos a partir de la búsqueda geométrica, estérica y de subestructura de estructuras moleculares tridimensionales". Revista de diseño molecular asistido por computadora . 3 (3): 225–251. doi : 10.1007 / BF01533070 . PMID 2573695 .
- ^ Software científico OpenEye | ROCS