HH-suite


El HH-Suite es un software de código abierto paquete para pieles sensibles proteína búsqueda secuencia. Contiene programas que pueden buscar secuencias de proteínas similares en bases de datos de secuencias de proteínas. Las búsquedas de secuencias son una herramienta estándar en la biología moderna con la que se puede inferir la función de proteínas desconocidas a partir de las funciones de proteínas con secuencias similares. HHsearch y HHblits son dos programas principales del paquete y el punto de entrada a su función de búsqueda, siendo esta última una iteración más rápida. [2] [3] HHpred es un servidor en línea para la predicción de la estructura de proteínas que utiliza información de homología de HH-suite. [4]

La suite HH busca secuencias utilizando modelos de Markov ocultos (HMM). El nombre proviene del hecho de que realiza alineaciones HMM-HMM. Entre los métodos más populares para la comparación de secuencias de proteínas, los programas se han citado más de 5000 veces en total según Google Scholar . [5]

Las proteínas son actores centrales en todos los procesos de la vida. Comprenderlos es fundamental para comprender los procesos moleculares en las células. Esto es particularmente importante para comprender el origen de las enfermedades. Pero para una gran fracción de las aproximadamente 20 000 proteínas humanas, las estructuras y funciones siguen siendo desconocidas. Se han investigado muchas proteínas en organismos modelo, como muchas bacterias, levadura de panadería, moscas de la fruta, peces cebra o ratones, para los que los experimentos a menudo se pueden realizar con más facilidad que con células humanas. Para predecir la función, estructura u otras propiedades de una proteína para la que solo se conoce su secuencia de aminoácidos, la secuencia de la proteína se compara con las secuencias de otras proteínas en bases de datos públicas. Si se encuentra una proteína con una secuencia suficientemente similar,Es probable que las dos proteínas estén relacionadas evolutivamente ("homólogo" ). En ese caso, es probable que compartan estructuras y funciones similares. Por lo tanto, si se puede encontrar una proteína con una secuencia suficientemente similar y con funciones y / o estructura conocidas mediante la búsqueda de secuencias, se pueden predecir las funciones, la estructura y la composición del dominio de la proteína desconocida. Tales predicciones facilitan enormemente la determinación de la función o estructura mediante experimentos de validación dirigidos.

Los biólogos suelen realizar búsquedas de secuencias para inferir la función de una proteína desconocida a partir de su secuencia. Para ello, la secuencia de la proteína se compara con las secuencias de otras proteínas en bases de datos públicas y su función se deduce de las de las secuencias más similares. A menudo, no se pueden encontrar secuencias con funciones anotadas en dicha búsqueda. En este caso, se requieren métodos más sensibles para identificar proteínas o familias de proteínas relacionadas más remotamente . A partir de estas relaciones, surgen hipótesis sobre las funciones, la estructura y la composición del dominio de la proteína.puede ser inferida. HHsearch realiza búsquedas con una secuencia de proteínas a través de bases de datos. El servidor HHpred y el paquete de software HH-suite ofrecen muchas bases de datos populares que se actualizan periódicamente, como Protein Data Bank , así como las bases de datos InterPro , Pfam , COG y SCOP .


Esquema de búsqueda de secuencia iterativa de HHblits