Esta página describe la extracción de moléculas . Dado que las moléculas pueden estar representadas por gráficos moleculares, esto está fuertemente relacionado con la extracción de gráficos y la extracción de datos estructurados . El principal problema es cómo representar moléculas discriminando las instancias de datos. Una forma de hacer esto son las métricas de similitud química , que tiene una larga tradición en el campo de la quiminformática .
Los enfoques típicos para calcular las similitudes químicas utilizan huellas dactilares químicas, pero esto pierde la información subyacente sobre la topología de la molécula . La extracción de gráficos moleculares evita directamente este problema. Lo mismo ocurre con el problema QSAR inverso, que es preferible para las asignaciones vectoriales.
Codificación (Molécula i , Molécula jyo )
Métodos de kernel
- Núcleo de gráfico marginado [1]
- Núcleo de asignación óptimo [2] [3] [4]
- Núcleo de farmacóforo [5]
- C ++ (y R) aplicación combinando
Métodos de gráficos comunes máximos
- MCS -HSCS [9] (estrategia de clasificación de la subestructura común de puntuación más alta (HSCS) para un solo MCS)
- Small Molecule Subgraph Detector (SMSD) [10] : es una biblioteca de software basada en Java para calcular el subgrafo máximo común (MCS) entre moléculas pequeñas. Esto nos ayudará a encontrar similitudes / distancias entre dos moléculas. El MCS también se utiliza para detectar compuestos similares a fármacos al golpear moléculas, que comparten una subgrafía (subestructura) común. [11]
Codificación (Molécula i )
Métodos de consulta molecular
- Más cálido [12] [13]
- AGM [14] [15]
- PolyFARM [16]
- FSG [17] [18]
- MolFea [19]
- MoFa / MoSS [20] [21] [22]
- Gaston [23]
- LAZAR [24]
- ParMol [25] (contiene MoFa, FFSM, gSpan y Gaston)
- gSpan optimizado [26] [27]
- SMIREP [28]
- DMax [29]
- SAm / AIm / RHC [30]
- AFGen [31]
- gRed [32]
- G-Hash [33]
Métodos basados en arquitecturas especiales de redes neuronales.
Ver también
- Lenguaje de consulta molecular
- Teoría de grafos químicos
- QSAR
- PROMOCIONAME
- Coeficiente de partición
Referencias
- ^ a b H. Kashima, K. Tsuda, A. Inokuchi, Núcleos marginados entre gráficos etiquetados, 20ª Conferencia internacional sobre aprendizaje automático (ICML2003), 2003. PDF
- ^ H. Fröhlich, JK Wegner, A. Zell, Núcleos de asignación óptima para gráficos moleculares atribuidos , 22a Conferencia internacional sobre aprendizaje automático (ICML 2005), Omnipress, Madison, WI, EE. UU., 2005 , 225-232. PDF
- ^ Fröhlich H., Wegner JK, Zell A. (2006). "Funciones de kernel para gráficos moleculares atribuidos: un nuevo enfoque basado en similitudes para la predicción de ADME en clasificación y regresión". QSAR Comb. Sci . 25 : 317–326. doi : 10.1002 / qsar.200510135 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ H. Fröhlich, JK Wegner, A. Zell, Núcleos de asignación para compuestos químicos , Conferencia conjunta internacional sobre redes neuronales 2005 (IJCNN'05), 2005 , 913-918. CiteSeer
- ^ a b Mahe P., Ralaivola L., Stoven V., Vert J. (2006). "El núcleo de farmacóforo para el cribado virtual con máquinas de vectores de soporte". Modelo J Chem Inf . 46 : 2003-2014. arXiv : q-bio / 0603006 . doi : 10.1021 / ci060138m .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ P. Mahé, N. Ueda, T. Akutsu, J.-L. Perret y P. Vert, J.-P. (2004). "Extensiones de kernels de gráficos marginados". Actas del 21º ICML : 552–559.CS1 maint: varios nombres: lista de autores ( enlace )
- ^ L. Ralaivola, SJ Swamidass, S. Hiroto y P. Baldi (2005). "Graficar núcleos para informática química". Redes neuronales . 18 (8): 1093-1110. doi : 10.1016 / j.neunet.2005.07.009 . PMID 16157471 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ P. Mahé y J.-P. Vert (2009). "Grafique granos basados en patrones de árboles para moléculas". Aprendizaje automático . 75 (1): 3–35. arXiv : q-bio / 0609024 . doi : 10.1007 / s10994-008-5086-2 . ISSN 0885-6125 .
- ^ Wegner JK, Fröhlich H., Mielenz H., Zell A. (2006). "Minería de datos y gráficos en el espacio químico para ADME y conjuntos de datos de actividad". QSAR Comb. Sci . 25 : 205–220. doi : 10.1002 / qsar.200510009 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Rahman SA, Bashton M., Holliday GL, Schrader R., Thornton JM (2009). "Kit de herramientas del detector de subgrafos de moléculas pequeñas (SMSD)" . Revista de Cheminformatics . 1 : 12. doi : 10.1186 / 1758-2946-1-12 . PMC 2820491 . PMID 20298518 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ http://www.ebi.ac.uk/thornton-srv/software/SMSD/
- ^ King RD, Srinivasan A., Dehaspe L. (2001). "Wamr: una herramienta de minería de datos para datos químicos". J. Comput.-Aid. Mol. Des . 15 : 173-181. doi : 10.1023 / A: 1008171016861 . PMID 11272703 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ L. Dehaspe, H. Toivonen, King, Encontrar subestructuras frecuentes en compuestos químicos , 4ª Conferencia internacional sobre descubrimiento de conocimientos y minería de datos, AAAI Press., 1998, 30-36.
- ^ A. Inokuchi, T. Washio, T. Okada, H. Motoda, Aplicación del método de minería de gráficos basado en apriori al análisis de datos de mutagénesis , Journal of Computer Aided Chemistry , 2001 ;, 2, 87-92.
- ^ A. Inokuchi, T. Washio, K. Nishimura, H. Motoda, A Fast Algorithm for Mining Frequent Connected Subgraphs , IBM Research, Tokyo Research Laboratory, 2002 .
- ^ A. Clare, RD King, Minería de datos del genoma de la levadura en un lenguaje funcional perezoso , Aspectos prácticos de los lenguajes declarativos (PADL2003), 2003 .
- ^ Kuramochi M., Karypis G. (2004). "Un algoritmo eficiente para descubrir subgrafos frecuentes". Transacciones IEEE sobre conocimiento e ingeniería de datos . 16 (9): 1038–1051. doi : 10.1109 / tkde.2004.33 .
- ^ Deshpande M., Kuramochi M., Wale N., Karypis G. (2005). "Enfoques frecuentes basados en subestructura para clasificar compuestos químicos". Transacciones IEEE sobre conocimiento e ingeniería de datos . 17 (8): 1036–1050. doi : 10.1109 / tkde.2005.127 . hdl : 11299/215559 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Helma C., Cramer T., Kramer S., de Raedt L. (2004). "Técnicas de minería de datos y aprendizaje automático para la identificación de subestructuras inductoras de mutagenicidad y relaciones estructura-actividad de compuestos no congénicos". J. Chem. Inf. Computación. Sci . 44 : 1402-1411. doi : 10.1021 / ci034254q .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ T. Meinl, C. Borgelt, MR Berthold, Minería discriminativa de fragmentos cerrados y extensiones perfectas en MoFa , Actas del segundo simposio de investigadores de IA de inicio (STAIRS 2004), 2004 .
- ^ T. Meinl, C. Borgelt, MR Berthold, M. Philippsen, Fragmentos de minería con cadenas difusas en bases de datos moleculares , Segundo taller internacional sobre gráficos, árboles y secuencias de minería (MGTS2004), 2004 .
- ^ Meinl, T .; Berthold, MR (2004). "Minería de fragmentos híbridos con MoFa y FSG" (PDF) . Actas de la Conferencia IEEE 2004 sobre Sistemas, Hombre y Cibernética (SMC2004) .
- ^ S. Nijssen, JN Kok. Minería de gráficos frecuente y su aplicación a bases de datos moleculares , Actas de la Conferencia IEEE de 2004 sobre sistemas, hombre y cibernética (SMC2004), 2004 .
- ^ C. Helma, Toxicología predictiva, CRC Press, 2005 .
- ^ M. Wörlein, Extensión y paralelización de un algoritmo de minería de gráficos , Friedrich-Alexander-Universität, 2006 . PDF
- ^ K. Jahn, S. Kramer, Optimización de gSpan para conjuntos de datos moleculares , Actas del tercer taller internacional sobre gráficos, árboles y secuencias de minería (MGTS-2005), 2005 .
- ^ X. Yan, J. Han, gSpan: Minería de patrones de subestructura basada en gráficos , Actas de la Conferencia internacional IEEE de 2002 sobre minería de datos (ICDM 2002), IEEE Computer Society , 2002 , 721-724.
- ^ Karwath A., Raedt LD (2006). "SMIREP: predecir la actividad química de SMILES". Modelo J Chem Inf . 46 : 2432–2444. doi : 10.1021 / ci060159g .
- ^ Ando H., Dehaspe L., Luyten W., Craenenbroeck E., Vandecasteele H., Meervelt L. (2006). "Descubrimiento de reglas de enlace H en cristales con programación lógica inductiva". Mol Pharm . 3 : 665–674. doi : 10.1021 / mp060034z .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Mazzatorta P., Tran L., Schilter B., Grigorov M. (2007). "Integración de la relación estructura-actividad y sistemas de inteligencia artificial para mejorar la predicción en silico de la mutagenicidad de la prueba de Ames". J. Chem. Inf. Modelo . 47 : 34–38. doi : 10.1021 / ci600411v .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Wale N., Karypis G. "Comparación de espacios de descriptores para la clasificación y recuperación de compuestos químicos". ICDM . 2006 : 678–689.
- ^ A. Gago Alonso, JE Medina Pagola, JA Carrasco-Ochoa y JF Martínez-Trinidad Minería Conectada Subpárrafo Minería Reducción del número de candidatos , Proc. of ECML - PKDD , págs. 365–376, 2008 .
- ^ Xiaohong Wang, Jun Huan, Aaron Smalter, Gerald Lushington, Aplicación de las funciones del núcleo para una búsqueda precisa de similitudes en grandes bases de datos químicas , BMC Bioinformatics Vol. 11 (Suplemento 3): S8 2010 .
- ^ Baskin, II; VA Palyulin; NS Zefirov (1993). "[Una metodología para la búsqueda de correlaciones directas entre estructuras y propiedades de compuestos orgánicos mediante el uso de redes neuronales computacionales]". Doklady Akademii Nauk SSSR . 333 (2): 176-179.
- ^ II Baskin, VA Palyulin, NS Zefirov (1997). "Un dispositivo neuronal para la búsqueda de correlaciones directas entre estructuras y propiedades de compuestos orgánicos". J. Chem. Inf. Computación. Sci . 37 (4): 715–721. doi : 10.1021 / ci940128y .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ DB Kireev (1995). "ChemNet: un nuevo método basado en redes neuronales para el mapeo de gráficos / propiedades". J. Chem. Inf. Computación. Sci . 35 (2): 175–180. doi : 10.1021 / ci00024a001 .
- ^ AM Bianucci; Micheli, Alessio; Sperduti, Alessandro; Starita, Antonina (2000). "Aplicación de Redes de Correlación en Cascada para Estructuras a la Química". Inteligencia aplicada . 12 (1-2): 117-146. doi : 10.1023 / A: 1008368105614 .
- ^ A. Micheli, A. Sperduti, A. Starita, AM Bianucci (2001). "Análisis de las representaciones internas desarrolladas por redes neuronales para estructuras aplicadas a estudios cuantitativos de relación estructura-actividad de benzodiazepinas". J. Chem. Inf. Computación. Sci . 41 (1): 202–218. CiteSeerX 10.1.1.137.2895 . doi : 10.1021 / ci9903399 . PMID 11206375 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ O. Ivanciuc (2001). "Codificación de estructura molecular en topología de redes neuronales artificiales". Reseñas trimestrales de productos químicos rumanos . 8 : 197–220.
- ^ A. Goulon, T. Picot, A. Duprat, G. Dreyfus (2007). "Predicción de actividades sin descriptores informáticos: máquinas gráficas para QSAR". SAR y QSAR en Investigación Ambiental . 18 (1–2): 141–153. doi : 10.1080 / 10629360601054313 . PMID 17365965 .CS1 maint: varios nombres: lista de autores ( enlace )
Otras lecturas
- Schölkopf, B., K. Tsuda y JP Vert: Métodos de kernel en biología computacional , MIT Press, Cambridge, MA, 2004 .
- RO Duda, PE Hart, DG Stork, Clasificación de patrones , John Wiley & Sons, 2001 . ISBN 0-471-05669-3
- Gusfield, D., Algoritmos sobre cadenas, árboles y secuencias: Ciencias de la computación y biología computacional , Cambridge University Press, 1997 . ISBN 0-521-58519-8
- R. Todeschini, V. Consonni, Manual de descriptores moleculares , Wiley-VCH, 2000 . ISBN 3-527-29913-0
enlaces externos
- Small Molecule Subgraph Detector (SMSD) : es una biblioteca de software basada en Java para calcular el subgrafo máximo común (MCS) entre moléculas pequeñas.
- V Taller Internacional de Minería y Aprendizaje con Gráficos, 2007
- Resumen de 2006
- Minería de moléculas (sistemas expertos químicos básicos)
- ParMol y documentación de tesis de maestría - Java - Código abierto - Minería distribuida - Biblioteca de algoritmos de referencia
- TU München - grupo Kramer
- Minería de moléculas (sistemas expertos químicos avanzados)
- Asistente de química DMax - software comercial
- AFGen - Software para generar descriptores basados en fragmentos