Matriz de similitudes de proteínas ( SIMAP ) es una base de datos de similitudes de proteínas creada mediante computación distribuida . [1] [2] Es de libre acceso con fines científicos. SIMAP usa el algoritmo FASTA para precalcular la similitud de proteínas, mientras que otra aplicación usa modelos ocultos de Markov para buscar dominios de proteínas . SIMAP es un proyecto conjunto de la Universidad Técnica de Múnich , el Helmholtz Zentrum München y la Universidad de Viena .
Proyecto
El proyecto solía tener nuevas unidades de trabajo al comienzo de cada mes. Más recientemente (2010), la inclusión de secuencias ambientales en la base de datos ha requerido períodos de actividad más prolongados, por ejemplo, varios meses de trabajo continuo. Normalmente, estas actualizaciones se producen dos veces al año. [ cita requerida ]
En el cuarto trimestre de 2010, el proyecto se trasladó a la Universidad de Viena debido a la falla de la infraestructura eléctrica en la Universidad Técnica de Múnich. Parte de este ejercicio implicó la creación de una URL específica del proyecto que requiera que los voluntarios y usuarios existentes se desconecten / vuelvan a adjuntar al proyecto.
El 30 de mayo de 2014, los administradores del proyecto anunciaron que después de 10 años de historia, SIMAP dejaría BOINC a fines de 2014. Sin embargo, la investigación de SIMAP continuará con el uso de hardware local que consiste en -core CPU (algunos cientos), procesando una versión optimizada para SSE del algoritmo Smith-Waterman ".
Plataforma informática
SIMAP utilizó la plataforma informática distribuida Berkeley Open Infrastructure for Network Computing (BOINC) .
Notas de rendimiento de la aplicación. Los tiempos de CPU de la unidad de trabajo variaron ampliamente, oscilando entre 15 minutos y 3 horas. Las unidades de trabajo variaron en tamaño de 1,5 a 2,2 MB cada una, con un promedio de alrededor de 2 MB. SIMAP proporcionó software de cliente optimizado para procesadores SSE y procesadores x86-64 . Para procesadores más antiguos, se proporcionan aplicaciones que no son SSE, pero requieren que se sigan los pasos de instalación manual. Los sistemas operativos compatibles con SIMAP son Linux , Windows , Mac OS , Android y otras plataformas UNIX. Dado que la base de datos se había completado a veces con todas las secuencias de proteínas y metagenomas conocidos públicamente que habían sido precalculados por el proyecto, el trabajo disponible consistía en secuencias de proteínas y metagenomas recientemente publicados que debían calcularse previamente para SIMAP.
Ver también
Referencias
- ^ Arnold, R .; Rattei, T .; Tischler, P .; Truong, M.-D .; Stümpflen, V .; Mewes, HW (2005). "SIMAP - La matriz de similitud de proteínas" . Bioinformática . 21 (Suppl 2): ii42 – ii46. doi : 10.1093 / bioinformatics / bti1107 . ISSN 1367-4803 . PMID 16204123 .
- ^ Rattei, T .; Arnold, R .; Tischler, P .; Lindner, D .; Stümpflen, V .; Mewes, HW (2006). "SIMAP: la matriz de similitud de proteínas" . Investigación de ácidos nucleicos . 34 (90001): D252 – D256. doi : 10.1093 / nar / gkj106 . ISSN 0305-1048 . PMC 1347468 . PMID 16381858 .
enlaces externos
- Sitio web SIMAP