Bioinformática


La bioinformática ( / ˌ b . ˌ ɪ n f ər ˈ m æ t ɪ k s / ( escuchar )icono de altavoz de audio ) es un campo interdisciplinario que desarrolla métodos y herramientas de software para comprender datos biológicos , en particular cuando los conjuntos de datos son grandes y complejos. . Como campo interdisciplinario de la ciencia , la bioinformática combina biología , química , física , informática ,ingeniería de la información , matemáticas y estadística para analizar e interpretar los datos biológicos . La bioinformática se ha utilizado para análisis in silico de consultas biológicas utilizando técnicas matemáticas y estadísticas. [ aclaración necesaria ]

La bioinformática incluye estudios biológicos que utilizan la programación informática como parte de su metodología, así como "tuberías" de análisis específicas que se utilizan repetidamente, en particular en el campo de la genómica . Los usos comunes de la bioinformática incluyen la identificación de genes candidatos y polimorfismos de un solo nucleótido ( SNP ). A menudo, dicha identificación se realiza con el objetivo de comprender mejor la base genética de la enfermedad, las adaptaciones únicas, las propiedades deseables (especialmente en especies agrícolas) o las diferencias entre poblaciones. De una manera menos formal, la bioinformática también trata de comprender los principios organizativos dentro de los ácidos nucleicos y las proteínas .secuencias, llamadas proteómicas . [1]

El procesamiento de imágenes y señales permite la extracción de resultados útiles a partir de grandes cantidades de datos sin procesar. En el campo de la genética, ayuda a secuenciar y anotar genomas y sus mutaciones observadas . Desempeña un papel en la extracción de textos de la literatura biológica y el desarrollo de ontologías biológicas y genéticas para organizar y consultar datos biológicos. También juega un papel en el análisis de la expresión y regulación de genes y proteínas. Las herramientas bioinformáticas ayudan a comparar, analizar e interpretar datos genéticos y genómicos y, de manera más general, a comprender los aspectos evolutivos de la biología molecular. A un nivel más integrador, ayuda a analizar y catalogar las rutas y redes biológicas que son una parte importante debiología de sistemas . En biología estructural , ayuda en la simulación y el modelado de ADN, [2] ARN, [2] [3] proteínas [4] como interacciones biomoleculares. [5] [6] [7] [8]

Históricamente, el término bioinformática no significaba lo que significa hoy. Paulien Hogeweg y Ben Hesper lo acuñaron en 1970 para referirse al estudio de los procesos de información en los sistemas bióticos. [9] [10] [11] [12] Esta definición colocó a la bioinformática como un campo paralelo a la bioquímica (el estudio de los procesos químicos en los sistemas biológicos). [9]

Ha habido un tremendo avance en velocidad y reducción de costos desde la finalización del Proyecto Genoma Humano, con algunos laboratorios capaces de secuenciar más de 100,000 billones de bases cada año, y se puede secuenciar un genoma completo por unos pocos miles de dólares. Las computadoras se volvieron esenciales en biología molecular cuando las secuencias de proteínas estuvieron disponibles después de que Frederick Sanger determinara la secuencia de la insulina a principios de la década de 1950. Comparar múltiples secuencias manualmente resultó ser poco práctico. Una pionera en el campo fue Margaret Oakley Dayhoff . [13] Compiló una de las primeras bases de datos de secuencias de proteínas, publicada inicialmente como libros [14]y fue pionero en métodos de alineación de secuencias y evolución molecular. [15] Otro de los primeros contribuyentes a la bioinformática fue Elvin A. Kabat , quien fue pionero en el análisis de secuencias biológicas en 1970 con sus volúmenes completos de secuencias de anticuerpos publicados con Tai Te Wu entre 1980 y 1991. [16] En la década de 1970, nuevas técnicas para secuenciar el ADN se aplicaron al bacteriófago MS2 y øX174, y las secuencias de nucleótidos extendidas luego se analizaron con algoritmos informativos y estadísticos. Estos estudios ilustraron que las características bien conocidas, como los segmentos de codificación y el código de triplete, se revelan en análisis estadísticos sencillos y, por lo tanto, fueron una prueba del concepto de que la bioinformática sería reveladora. [17] [18]


Bioinformática temprana: alineación computacional de secuencias determinadas experimentalmente de una clase de proteínas relacionadas; ver § Análisis de secuencias para más información.
Mapa del cromosoma X humano (del sitio web del Centro Nacional de Información Biotecnológica )
Las secuencias de material genético se usan con frecuencia en bioinformática y son más fáciles de administrar usando computadoras que manualmente.
Las estructuras tridimensionales de proteínas como esta son temas comunes en los análisis bioinformáticos.
Las interacciones entre proteínas se visualizan y analizan con frecuencia mediante redes. Esta red está formada por interacciones proteína-proteína de Treponema pallidum , el agente causal de la sífilis y otras enfermedades.