En biología evolutiva , las secuencias conservadas son secuencias idénticas o similares en ácidos nucleicos ( ADN y ARN ) o proteínas entre especies ( secuencias ortólogas ), o dentro de un genoma ( secuencias parálogas ), o entre taxones donantes y receptores ( secuencias xenólogas ). La conservación indica que una secuencia ha sido mantenida por selección natural .
Una secuencia altamente conservada es aquella que ha permanecido relativamente sin cambios en el árbol filogenético y, por lo tanto, en el tiempo geológico . Los ejemplos de secuencias altamente conservadas incluyen los componentes de ARN de los ribosomas presentes en todos los dominios de la vida, las secuencias homeobox muy extendidas entre los eucariotas y el tmRNA en las bacterias . El estudio de la conservación de secuencias se superpone con los campos de la genómica , la proteómica , la biología evolutiva , la filogenética , la bioinformática y lamatemáticas _
El descubrimiento del papel del ADN en la herencia y las observaciones de Frederick Sanger de la variación entre las insulinas animales en 1949 [2] impulsaron a los primeros biólogos moleculares a estudiar la taxonomía desde una perspectiva molecular. [3] [4] Los estudios en la década de 1960 utilizaron técnicas de hibridación de ADN y reactividad cruzada de proteínas para medir la similitud entre proteínas ortólogas conocidas , como la hemoglobina [5] y el citocromo c . [6] En 1965, Émile Zuckerkandl y Linus Paulingintrodujo el concepto del reloj molecular , [7] proponiendo que las tasas constantes de reemplazo de aminoácidos podrían usarse para estimar el tiempo transcurrido desde que dos organismos divergieron . Si bien las filogenias iniciales coincidían estrechamente con el registro fósil , las observaciones de que algunos genes parecían evolucionar a ritmos diferentes condujeron al desarrollo de teorías de la evolución molecular . [3] [4] La comparación de secuencias de ferrodoxina de Margaret Dayhoff en 1966 mostró que la selección natural actuaría para conservar y optimizar las secuencias de proteínas esenciales para la vida. [8]
Durante muchas generaciones, las secuencias de ácidos nucleicos en el genoma de un linaje evolutivo pueden cambiar gradualmente con el tiempo debido a mutaciones y deleciones aleatorias . [9] [10] Las secuencias también pueden recombinarse o eliminarse debido a reordenamientos cromosómicos . Las secuencias conservadas son secuencias que persisten en el genoma a pesar de tales fuerzas y tienen tasas de mutación más lentas que la tasa de mutación de fondo. [11]
La conservación puede ocurrir en secuencias de ácidos nucleicos codificantes y no codificantes . Se cree que las secuencias de ADN altamente conservadas tienen un valor funcional, aunque se comprende poco el papel de muchas secuencias de ADN no codificantes altamente conservadas. [12] [13] La medida en que se conserva una secuencia puede verse afectada por diferentes presiones de selección , su solidez a la mutación, el tamaño de la población y la deriva genética . Muchas secuencias funcionales también son modulares y contienen regiones que pueden estar sujetas a presiones de selección independientes , como los dominios de proteínas . [14]
En las secuencias de codificación, la secuencia de ácidos nucleicos y de aminoácidos puede conservarse en diferentes grados, ya que la degeneración del código genético significa que las mutaciones sinónimas en una secuencia de codificación no afectan a la secuencia de aminoácidos de su producto proteico. [15]