En biología molecular , las proteínas LSm son una familia de proteínas de unión al ARN que se encuentran en prácticamente todos los organismos celulares . LSm es una contracción de "como Sm", porque los primeros miembros identificados de la familia de proteínas LSm fueron las proteínas Sm . Las proteínas LSm se definen por una estructura tridimensional característica y su ensamblaje en anillos de seis o siete moléculas de proteína LSm individuales , y desempeñan una gran cantidad de funciones diversas en el procesamiento y la regulación del ARNm .
Dominio LSM | ||||||||
---|---|---|---|---|---|---|---|---|
Identificadores | ||||||||
Símbolo | LSM | |||||||
Pfam | PF01423 | |||||||
InterPro | IPR001163 | |||||||
SCOP2 | 1d3b / SCOPe / SUPFAM | |||||||
CDD | cd00600 | |||||||
|
Las proteínas Sm se descubrieron por primera vez como antígenos dirigidos por los llamados anticuerpos anti-Sm en un paciente con una forma de lupus eritematoso sistémico (LES), una enfermedad autoinmune debilitante . Fueron nombradas proteínas Sm en honor a Stephanie Smith, una paciente que sufría de LES. [1] Posteriormente se descubrieron otras proteínas con estructuras muy similares y se denominaron proteínas LSm. Se siguen identificando y notificando nuevos miembros de la familia de proteínas LSm.
Las proteínas con estructuras similares se agrupan en una jerarquía de familias, superfamilias y pliegues de proteínas. La estructura de la proteína LSm es un ejemplo de una pequeña hoja beta doblada en un barril corto. Las proteínas LSm individuales se ensamblan en un anillo de rosquilla de seis o siete miembros (más correctamente denominado toro ), que generalmente se une a una pequeña molécula de ARN para formar un complejo de ribonucleoproteína . El toro de LSm ayuda a la molécula de ARN a asumir y mantener su estructura tridimensional adecuada. Dependiendo de qué proteínas LSm y molécula de ARN estén involucradas, este complejo de ribonucleoproteína facilita una amplia variedad de procesamiento de ARN, incluida la degradación, edición, empalme y regulación.
Los términos alternativos para la familia LSm son LSm fold y Sm-like fold , y los estilos alternativos de uso de mayúsculas como lsm , LSM y Lsm son comunes e igualmente aceptables.
Historia
Descubrimiento del antígeno de Smith
La historia del descubrimiento de las primeras proteínas LSm comienza con una mujer joven, Stephanie Smith, que fue diagnosticada en 1959 con lupus eritematoso sistémico (LES) , y finalmente sucumbió a las complicaciones de la enfermedad en 1969 a la edad de 22 años. [1] Durante este período, fue tratada en el Hospital de la Universidad Rockefeller de Nueva York , bajo el cuidado del Dr. Henry Kunkel y el Dr. Eng Tan. Como aquellos con una enfermedad autoinmune , los pacientes con LES producen anticuerpos contra los antígenos en los núcleos de sus células , con mayor frecuencia contra su propio ADN . Sin embargo, el Dr. Kunkel y el Dr. Tan descubrieron en 1966 que la Sra. Smith producía anticuerpos contra un conjunto de proteínas nucleares, a las que llamaron " antígeno Smith " ( Sm Ag ). [2] Aproximadamente el 30% de los pacientes con LES producen anticuerpos contra estas proteínas, a diferencia del ADN de doble hebra. Este descubrimiento mejoró las pruebas de diagnóstico para el LES, pero se desconocía la naturaleza y función de este antígeno.
Proteínas Sm, snRNP, empalme del ARN mensajero y espliceosoma
La investigación continuó durante la década de 1970 y principios de la de 1980. Se descubrió que el antígeno Smith era un complejo de moléculas de ácido ribonucleico ( ARN ) y múltiples proteínas. Un conjunto de moléculas de ARN nuclear pequeño ( snRNA ) ricas en uridina formaba parte de este complejo, y se les dio los nombres U1 , U2 , U4 , U5 y U6 . Se encontró que cuatro de estos snRNA (U1, U2, U4 y U5) estaban estrechamente unidos a varias proteínas pequeñas, que se denominaron SmB , SmD, SmE , SmF y SmG en orden decreciente de tamaño. SmB tiene una variante empalmada alternativamente, SmB ' , y una proteína muy similar, SmN , reemplaza a SmB' / B en ciertos tejidos (principalmente neurales). Más tarde se descubrió que SmD era una mezcla de tres proteínas, que se denominaron SmD1 , SmD2 y SmD3 . Estas nueve proteínas (SmB, SmB ', SmN, SmD1, SmD2, SmD3, SmE, SmF y SmG) se conocieron como proteínas del núcleo Sm , o simplemente proteínas Sm . Los snRNA se complejan con las proteínas del núcleo Sm y con otras proteínas para formar partículas en el núcleo de la célula llamadas ribonucleoproteínas nucleares pequeñas o snRNP . A mediados de la década de 1980, quedó claro que estos snRNP ayudan a formar un complejo grande (de peso molecular 4.8 MD ), llamado espliceosoma , alrededor del pre-mRNA , escindiendo porciones del pre-mRNA llamadas intrones y empalmando las porciones codificantes ( exones ) juntas . [3] Después de algunas modificaciones más, el pre-ARNm empalmado se convierte en ARN mensajero (ARNm) que luego se exporta desde el núcleo y se traduce en una proteína por los ribosomas .
Descubrimiento de proteínas similares a las proteínas Sm
El snRNA U6 (a diferencia de U1, U2, U4 y U5) no se asocia con las proteínas Sm, aunque el snRNP U6 es un componente central en el espliceosoma . En 1999 se encontró un heterómero de proteína que se une específicamente a U6 y constaba de siete proteínas claramente homólogas a las proteínas Sm. Estas proteínas se denominaron proteínas LSm (como Sm) ( LSm1 , LSm2 , LSm3 , LSm4 , LSm5 , LSm6 y LSm7 ), identificándose posteriormente la proteína similar LSm8 . En la bacteria Escherichia coli , el Sm-como proteína HF-I codificada por el gen hfq fue descrito en 1968 como un elemento esencial h ost f actor por ARN de bacteriófago Q replicación β. El genoma de Saccharomyces cerevisiae (levadura de panadería ) se secuenció a mediados de la década de 1990, proporcionando un rico recurso para identificar homólogos de estas proteínas humanas. Posteriormente, a medida que se secuenciaron más genomas de eucariotas , quedó claro que los eucariotas, en general, comparten homólogos con el mismo conjunto de siete proteínas Sm y ocho LSm. [4] Poco después, se encontraron proteínas homólogas a estas proteínas LSm eucariotas en Archaea ( Sm1 y Sm2 ) y Bacteria ( homólogos de Hfq e YlxS ). [5] Las proteínas LSm de archaeal son más similares a las proteínas LSm eucariotas que cualquiera de las dos a las proteínas LSm bacterianas. Las proteínas LSm descritas hasta ahora eran proteínas bastante pequeñas, que variaban desde 76 aminoácidos ( peso molecular de 8,7 kD ) para SmG humano a 231 aminoácidos (peso molecular de 29 kD) para SmB humano. Pero recientemente, se han descubierto proteínas más grandes que incluyen un dominio estructural LSm además de otros dominios estructurales de proteínas (como LSm10 , LSm11 , LSm12 , LSm13 , LSm14 , LSm15 , LSm16 , ataxina-2 , así como archaeal Sm3 ).
Descubrimiento del pliegue LSm
Alrededor de 1995, las comparaciones entre los diversos homólogos de LSm identificaron dos motivos de secuencia , 32 ácidos nucleicos de longitud (14 aminoácidos), que eran muy similares en cada homólogo de LSm, y estaban separados por una región no conservada de longitud variable. Esto indicó la importancia de estos dos motivos de secuencia (denominados Sm1 y Sm2 ), y sugirió que todos los genes de la proteína LSm evolucionaron a partir de un único gen ancestral. [6] En 1999, se prepararon cristales de proteínas Sm recombinantes , lo que permitió la cristalografía de rayos X y la determinación de su estructura atómica en tres dimensiones. [7] Esto demostró que las proteínas LSm comparten un pliegue tridimensional similar de una hélice alfa corta y una hoja beta plegada de cinco hebras , posteriormente denominada pliegue LSm . Otras investigaciones encontraron que las proteínas LSm se ensamblan en un toro (anillo en forma de rosquilla) de seis o siete proteínas LSm, y que el ARN se une al interior del toro, con un nucleótido unido a cada proteína LSm.
Estructura
El fosfato de uridina se une en el arqueo Sm1 entre el bucle β2b / β3a y el bucle β4b / β5. El uracilo se apila entre los residuos de histidina y arginina , estabilizado mediante enlaces de hidrógeno a un residuo de asparagina y enlaces de hidrógeno entre el residuo de aspartato y la ribosa . Las proteínas LSm se caracterizan por una hoja beta (la estructura secundaria ), plegada en el pliegue LSm (la estructura terciaria ), la polimerización en un toro de seis o siete miembros (la estructura cuaternaria ) y la unión a oligonucleótidos de ARN . [8] A clasifica paradigma moderno proteínas sobre la base de la estructura de proteínas y es un campo actualmente activo, con tres enfoques principales, SCOP ( S ESTRUCTURALES C LASIFICACIÓN o f P roteins), CATH ( C lass, A rchitecture, T opology, H superfamilia omologous), y FSSP / DALI ( F AMILIAS de S tructurally S imilar P roteins).
Secundario
La estructura secundaria de una proteína LSm es una pequeña hoja beta antiparalela de cinco hebras , con las hebras identificadas desde el extremo N-terminal hasta el extremo C-terminal como β1, β2, β3, β4, β5. La clase SCOP de todas las proteínas beta y la clase CATH de principalmente beta se definen como estructuras de proteínas que son principalmente láminas beta, por lo que incluyen LSm. El motivo de la secuencia SM1 corresponde a las cadenas β1, β2, β3, y el motivo de la secuencia SM2 corresponde a las cadenas β4 y β5. Las primeras cuatro hebras beta son adyacentes entre sí, pero β5 es adyacente a β1, convirtiendo la estructura general en un barril corto. Esta topología estructural se describe como 51234. Una hélice alfa N-terminal corta (de dos a cuatro vueltas) también está presente en la mayoría de las proteínas LSm. Las cadenas β3 y β4 son cortas en algunas proteínas LSm y están separadas por una espiral no estructurada de longitud variable. Las hebras β2, β3 y β4 están fuertemente dobladas alrededor de 120 ° grados en sus puntos medios.Las curvas en estas hebras son a menudo glicina , y las cadenas laterales internas del barril beta son a menudo los residuos hidrófobos valina , leucina , isoleucina y metionina .
Terciario
SCOP simplemente clasifica la estructura LSm como el pliegue similar a Sm , uno de los 149 pliegues de proteína beta diferentes, sin agrupaciones intermedias. La hoja beta de LSm está muy doblada y se describe como una arquitectura Roll en CATH (una de las 20 arquitecturas de proteínas beta diferentes en CATH). Una de las hebras beta (β5 en LSm) cruza el borde abierto del rollo para formar una pequeña topología de barril tipo SH3 (una de las 33 topologías de rollo beta en CATH). CATH enumera 23 superfamilias homólogas con una topología de barril de tipo SH3, una de las cuales es la estructura LSm ( proteína de unión a ARN en el sistema CATH). SCOP continúa su clasificación estructural después de Fold a Superfamily, Family y Domain, mientras que CATH continúa a Sequence Family, pero estas divisiones se describen más apropiadamente en la sección "Evolución y filogenia".
La estructura terciaria de barril de tipo SH3 del pliegue LSm está formada por las hebras β2, β3 y β4 fuertemente dobladas (aproximadamente 120 °), con la estructura de barril cerrada por la hebra β5. Haciendo hincapié en la estructura terciaria, cada hebra beta doblada se puede describir como dos hebras beta más cortas. El pliegue LSm puede verse como un sándwich beta antiparalelo de ocho hebras, con cinco hebras en un plano y tres hebras en un plano paralelo con un ángulo de inclinación de aproximadamente 45 ° entre las dos mitades del sándwich beta. La hélice alfa N-terminal corta (de dos a cuatro vueltas) se produce en un borde del sándwich beta. Esta hélice alfa y las hebras beta se pueden marcar (desde el extremo N-terminal al C-terminal ) α, β1, β2a, β2b, β3a, β3b, β4a, β4b, β5 donde el A y B se refieren a cualquiera de las dos mitades de una hebra doblada en la descripción de cinco hebras, o de las hebras individuales en la descripción de ocho hebras. Cada hebra (en la descripción de las ocho hebras) está formada por cinco residuos de aminoácidos. Incluyendo las curvas y bucles entre las hebras y la hélice alfa, alrededor de 60 residuos de aminoácidos contribuyen al pliegue LSm, pero esto varía entre homólogos debido a la variación en los bucles entre cadenas, la hélice alfa e incluso las longitudes de β3b y hebras β4a.
Cuaternario
Las proteínas LSm generalmente se ensamblan en un anillo LSm , un toro de seis o siete miembros , de aproximadamente 7 nanómetros de diámetro con un orificio de 2 nanómetros. La condición ancestral es un homohexámero u homoheptamero de subunidades LSm idénticas. Las proteínas LSm en eucariotas forman heteroheptameros de siete subunidades LSm diferentes, como las proteínas Sm. La unión entre las proteínas LSm se comprende mejor con la descripción de ocho cadenas del pliegue LSm. La mitad de cinco hebras del sándwich beta de una subunidad se alinea con la mitad de tres hebras del sándwich beta de la subunidad adyacente, formando una hoja beta retorcida de 8 hebras Aβ4a / Aβ3b / Aβ2a / Aβ1 / Aβ5 / Bβ4b / Bβ3a / Bβ2b, donde A y B se refieren a las dos subunidades diferentes. Además de los enlaces de hidrógeno entre las cadenas beta Aβ5 y Bβ4b de las dos subunidades de la proteína LSm, existen contactos energéticamente favorables entre las cadenas laterales de aminoácidos hidrófobos en el interior del área de contacto y contactos energéticamente favorables entre las cadenas laterales de aminoácidos hidrófilos alrededor del periferia del área de contacto.
Unión de oligonucleótidos de ARN
Los anillos LSm forman complejos de ribonucleoproteína con oligonucleótidos de ARN que varían en fuerza de unión desde complejos muy estables (como los snRNP de la clase Sm) hasta complejos transitorios. Los oligonucleótidos de ARN generalmente se unen dentro del orificio (lumen) del toro de LSm, un nucleótido por subunidad de LSm, pero se han informado sitios de unión de nucleótidos adicionales en la parte superior ( lado de la hélice α ) del anillo. La naturaleza química exacta de esta unión varía, pero los motivos comunes incluyen apilar la base heterocíclica (a menudo uracilo ) entre cadenas laterales planas de dos aminoácidos, enlaces de hidrógeno a la base heterocíclica y / o ribosa , y puentes salinos al grupo fosfato .
Funciones
Los diversos tipos de anillos LSm funcionan como andamios o chaperones para los oligonucleótidos de ARN , ayudando al ARN a asumir y mantener la estructura tridimensional adecuada. En algunos casos, esto permite que el oligonucleótido ARN funcione catalíticamente como una ribozima . En otros casos, esto facilita la modificación o degradación del ARN, o el ensamblaje, almacenamiento y transporte intracelular de complejos de ribonucleoproteínas . [9]
Anillo sm
El anillo Sm se encuentra en el núcleo de todos los eucariotas (aproximadamente 2,5 x 10 6 copias por célula humana en proliferación) y tiene las funciones mejor conocidas. El anillo Sm es un heteroheptamero . La molécula de ARNrn de clase Sm (en la dirección 5 'a 3') entra en el lumen (agujero roscado) en la subunidad SmE y procede secuencialmente en el sentido de las agujas del reloj (mirando desde el lado de la hélice α) dentro del lumen (agujero roscado) las subunidades SmG, SmD3, SmB, SmD1, SmD2, que salen por la subunidad SmF. [10] (SmB puede ser reemplazado por la variante de empalme SmB 'y por SmN en tejidos neurales). El anillo Sm se une permanentemente a los snRNAs U1, U2, U4 y U5 que forman cuatro de los cinco snRNPs que constituyen el spliceosome principal . El anillo Sm también se une permanentemente a los snRNA de U11 , U12 y U4atac que forman cuatro de los cinco snRNP (incluido el snRNP de U5) que constituyen el espliceosoma menor . Ambos espliceosomas son complejos centrales de procesamiento de ARN en la maduración del ARN mensajero a partir de pre-ARNm . También se ha informado que las proteínas Sm forman parte del componente ribonucleoproteico de la telomerasa . [11]
Anillo lsm2-8
Los dos snRNP Lsm2-8 (U6 y U6atac ) tienen la función catalítica clave en los espliceosomas mayor y menor. Estos snRNP no incluyen el anillo Sm, sino que utilizan el anillo heteroheptámero Lsm2-8 . Los anillos LSm son aproximadamente 20 veces menos abundantes que los anillos Sm. El orden de estas siete proteínas LSm en este anillo no se conoce, pero en base a la homología de la secuencia de aminoácidos con las proteínas Sm, se especula que el snRNA (en la dirección 5 'a 3') puede unirse primero a LSm5, y precede secuencialmente en el sentido de las agujas del reloj hasta LSm7, LSm4, LSm8, LSm2, LSm3 y saliendo por la subunidad LSm6. Los experimentos con mutaciones de Saccharomyces cerevisiae (levadura en ciernes) sugieren que el anillo Lsm2-8 ayuda a la reasociación de los snRNP de U4 y U6 en el di-snRNP de U4 / U6 . [12] (Después de completar la deleción del exón y el empalme del intrón, estos dos snRNP deben volver a asociarse para que el espliceosoma inicie otro ciclo de empalme exón / intrón. En esta función, el anillo Lsm2-8 actúa como un chaperón de ARN en lugar de un andamio de ARN. ) El anillo Lsm2-8 también forma un snRNP con el ARN nucleolar pequeño U8 (ARNsno) que se localiza en el nucleolo . Este complejo de ribonucleoproteína es necesario para procesar el ARN ribosómico y transferir el ARN a sus formas maduras. [13] Se informa que el anillo Lsm2-8 tiene un papel en el procesamiento de pre-P RNA en RNasa P RNA . A diferencia del anillo Sm, el anillo Lsm2-8 no se une permanentemente a su ARNn y ARNsno.
Anillo Sm10 / Sm11
Existe un segundo tipo de anillo Sm donde LSm10 reemplaza a SmD1 y LSm11 reemplaza a SmD2. LSm11 es una proteína de dos dominios, siendo el dominio C-terminal un dominio LSm. Este anillo heteroheptámero se une al ARNnn U7 en el snRNP U7 . El snRNP de U7 media el procesamiento del vástago-bucle de UTR 3 ' del ARNm de histona en el núcleo. [14] Al igual que el anillo Sm, se ensambla en el citoplasma en el ARNrn U7 mediante un complejo SMN especializado.
Anillo lsm1-7
Un segundo tipo de anillo Lsm es el anillo Lsm1-7 , que tiene la misma estructura que el anillo Lsm2-8 excepto que LSm1 reemplaza a LSm8. En contraste con el anillo Lsm2-8, el anillo Lsm1-7 se localiza en el citoplasma donde ayuda a degradar el ARN mensajero en complejos de ribonucleoproteína . Este proceso controla la renovación del ARN mensajero de modo que la traducción ribosómica de ARNm a proteína responda rápidamente a los cambios en la transcripción de ADN a ARN mensajero por parte de la célula.
Géminis6 y Géminis7
El complejo SMN (descrito en "Biogénesis de snRNPs") está compuesto por la proteína SMN y Gemin2-8 . Se ha descubierto que dos de estos, Gemin 6 y Gemin7 tienen la estructura LSm y forman un heterodímero. Éstos pueden tener un chaperón función en el complejo SMN para ayudar al formación del anillo Sm en los de clase Sm ARNsn . [15] El complejo PRMT5 está compuesto de PRMT5 , pICln , WD45 (Mep50) . pICln ayuda a formar un anillo abierto Sm en el complejo SMN. El complejo SMN ayuda en el ensamblaje de snRNPs donde el anillo Sm está en la conformación abierta en el complejo SMN y este anillo Sm se carga en el snRNA por el complejo SMN. [dieciséis]
LSm12-16 y otras proteínas LSm multidominio
Las proteínas LSm12-16 se han descrito muy recientemente. Estas son proteínas de dos dominios con un dominio LSm N-terminal y un dominio de metiltransferasa C-terminal . [17] Se sabe muy poco sobre la función de estas proteínas, pero presumiblemente son miembros de anillos de dominio LSm que interactúan con el ARN. Existe alguna evidencia de que LSm12 posiblemente esté involucrado en la degradación del ARNm y LSm13-16 puede tener funciones en la regulación de la mitosis . Una proteína grande de función desconocida, ataxina-2 , asociada con la enfermedad neurodegenerativa ataxia espinocerebelosa tipo 2 , también tiene un dominio LSm N-terminal.
Anillos Archaeal Sm
Dos proteínas LSm se encuentran en un segundo dominio de la vida, las Archaea . Estos son los Sm1 y Sm2 proteínas (que no debe confundirse con el Sm1 y Sm2 motivos de secuencia ), y, a veces son identificadas como S m-como un rchaeal p roteins SmAP1 y SmAP2 por esta razón. [18] Sm1 y Sm2 generalmente forman anillos homoheptameros , aunque se han observado anillos homohexámeros. Los anillos Sm1 son similares a los anillos eucariotas Lsm en que se forman en ausencia de ARN, mientras que los anillos Sm2 son similares a los anillos eucariotas Sm en que requieren ARN rico en uridina para su formación. Se ha informado que se asocian con el ARN de la ARNasa P , lo que sugiere un papel en el procesamiento del ARN de transferencia , pero su función en las arqueas en este proceso (y posiblemente el procesamiento de otros ARN como el ARN ribosómico ) es en su mayoría desconocida. Una de las dos ramas principales de las arqueas, las crenarqueotas tienen un tercer tipo conocido de proteína LSm de arqueas, Sm3 . Esta es una proteína de dos dominios con un dominio LSm N-terminal que forma un anillo homoheptámero . No se sabe nada sobre la función de esta proteína LSm, pero presumiblemente interactúa y probablemente ayuda a procesar el ARN en estos organismos.
Anillos de LSm bacterianos
Se han informado varias proteínas LSm en el tercer dominio de la vida, las bacterias . La proteína Hfq forma anillos de homohexámeros y originalmente se descubrió que era necesaria para la infección por el bacteriófago Qβ , aunque claramente esta no es la función nativa de esta proteína en las bacterias. No está presente universalmente en todas las bacterias, pero se ha encontrado en Proteobacteria , Firmicutes , Spirochaetes , Thermotogae , Aquificae y una especie de Archaea . (Este último caso es probablemente un caso de transferencia de genes horizontal ). Hfq es pleiotrópico con una variedad de interacciones, generalmente asociadas con la regulación de la traducción . Estos incluyen bloquear la unión del ribosoma al ARNm , marcar el ARNm para su degradación al unirse a sus colas poli-A y la asociación con pequeños ARN reguladores bacterianos (como ARN DsrA) que controlan la traducción al unirse a ciertos ARNm . [19] [20] Una segunda proteína bacteriana LSm es YlxS (a veces también llamada YhbC), que se identificó por primera vez en la bacteria del suelo Bacillus subtilis . Esta es una proteína de dos dominios con un dominio LSm N-terminal . Se desconoce su función, pero se encuentran homólogos de secuencia de aminoácidos en prácticamente todos los genomas bacterianos hasta la fecha, y puede ser una proteína esencial. [21] El dominio medio del canal mecanosensible de pequeña conductancia MscS en Escherichia coli forma un anillo homoheptámero. [22] Este dominio LSm no tiene una función aparente de unión al ARN, pero el toro homoheptámero es parte del canal central de esta proteína de membrana.
Evolución y filogenia
Los homólogos de LSm se encuentran en los tres dominios de la vida e incluso se pueden encontrar en todos los organismos . Se utilizan métodos filogenéticos computacionales para inferir relaciones filogenéticas . La alineación de secuencia entre los diversos homólogos de LSm es la herramienta adecuada para esto, como la alineación de secuencia múltiple de la estructura primaria (secuencia de aminoácidos) y la alineación estructural de la estructura terciaria (estructura tridimensional). Se plantea la hipótesis de que un gen para una proteína LSm estaba presente en el último antepasado universal de toda la vida. [23] Basado en las funciones de proteínas LSm conocidas, esta proteína LSm original puede haber ayudado a las ribozimas en el procesamiento de ARN para sintetizar proteínas como parte de la hipótesis del mundo del ARN de la vida temprana. Según este punto de vista, este gen se pasó de antepasado a descendiente, con mutaciones frecuentes , duplicaciones de genes y transferencias de genes horizontales ocasionales . En principio, este proceso se puede resumir en un árbol filogenético con la raíz en el último antepasado universal (o anterior), y con las puntas que representan el universo de genes LSm existente en la actualidad.
Anillos homoméricos LSm en bacterias y arqueas
Según la estructura, las proteínas LSm conocidas se dividen en un grupo formado por las proteínas LSm bacterianas (Hfq, YlxS y MscS) y un segundo grupo de todas las demás proteínas LSm, de acuerdo con los árboles filogenéticos publicados más recientemente . [24] Las tres proteínas LSm de arqueas (Sm1, Sm2 y Sm3) también se agrupan como un grupo, distinto de las proteínas LSm eucariotas. Tanto las proteínas LSm bacterianas como las arqueales se polimerizan en anillos homoméricos, que es la condición ancestral.
Anillos LSm heteroméricos en eucariotas
Una serie de duplicaciones de genes de un solo gen LSm eucariota dio como resultado la mayoría (si no todos) de los genes LSm eucariotas conocidos. Cada una de las siete proteínas Sm tiene una mayor homología de secuencia de aminoácidos con una proteína Lsm correspondiente que con las otras proteínas Sm. Esto sugiere que un gen LSm ancestral se duplicó varias veces, lo que resultó en siete parálogos . Estos posteriormente divergieron entre sí de modo que el anillo LSm homoheptamer ancestral se convirtió en un anillo heteroheptamer. Basándose en las funciones conocidas de las proteínas de LSM en eucariotas y arqueas, la función ancestral puede haber sido el procesamiento de pre- ARN ribosomal , pre- ARN de transferencia , y pre- RNasa P . Luego, de acuerdo con esta hipótesis, los siete genes LSm eucariotas ancestrales se duplicaron nuevamente en siete pares de parálogos Sm / LSm; LSm1 / SmB, LSm2 / SmD1, LSm3 / SmD2, LSm4 / SmD3, LSm5 / SmE, LSm6 / SmF y LSm7 / SmG. Estos dos grupos de siete genes LSm (y los dos tipos correspondientes de anillos LSm) evolucionaron a un anillo Sm (que requiere ARN) y un anillo Lsm (que se forma sin ARN). El par de parálogos LSm1 / LSm8 también parece haberse originado antes del último ancestro eucariota común, para un total de al menos 15 genes de proteína LSm. El par paralog SmD1 / LSm10 y el par paralog SmD2 / LSm11 existen solo en animales , hongos y amebozoos (a veces identificados como el clado unikont ) y parecen estar ausentes en el clado bikonte ( cromalveolados , excavaciones , plantas y rizarias ). Por lo tanto, estas dos duplicaciones de genes son anteriores a esta división fundamental en el linaje eucariota. El par de parálogos SmB / SmN se ve solo en los mamíferos placentarios , que data de esta duplicación del gen LSm.
Biogénesis de snRNP
Las pequeñas ribonucleoproteínas nucleares (snRNP) se ensamblan en un proceso estrechamente orquestado y regulado que involucra tanto al núcleo celular como al citoplasma . [25]
Referencias
- ↑ a b Reeves WH, Narain S, Satoh M (2003). "Henry Kunkel, Stephanie Smith, inmunología clínica y genes divididos". Lupus . 12 (3): 213–7. doi : 10.1191 / 0961203303lu360xx . PMID 12708785 . S2CID 33112464 .
- ^ Tan EM, Kunkel HG (marzo de 1966). "Características de un antígeno nuclear soluble que precipita con sueros de pacientes con lupus eritematoso sistémico". J. Immunol . 96 (3): 464–71. PMID 5932578 .
- ^ Will CL, Lührmann R (junio de 2001). "Biogénesis, estructura y función de UsnRNP spliceosomal". Curr. Opin. Cell Biol . 13 (3): 290-301. doi : 10.1016 / S0955-0674 (00) 00211-8 . hdl : 11858 / 00-001M-0000-0012-F770-0 . PMID 11343899 .
- ^ He W, Parker R (junio de 2000). "Funciones de las proteínas Lsm en la degradación y empalme de ARNm". Curr. Opin. Cell Biol . 12 (3): 346–50. doi : 10.1016 / S0955-0674 (00) 00098-3 . PMID 10801455 .
- ^ Törö I, Thore S, Mayer C, Basquin J, Séraphin B, Suck D (mayo de 2001). "Unión de ARN en un dominio de núcleo Sm: estructura de rayos X y análisis funcional de un complejo de proteínas Archaeal Sm" . EMBO J . 20 (9): 2293-303. doi : 10.1093 / emboj / 20.9.2293 . PMC 125243 . PMID 11331594 .
- ^ Hermann H, Fabrizio P, Raker VA, Foulaki K, Hornig H, Brahms H, Lührmann R (mayo de 1995). "Las proteínas snRNP Sm comparten dos motivos de secuencia conservados evolutivamente que están implicados en interacciones proteína-proteína Sm" . EMBO J . 14 (9): 2076–88. doi : 10.1002 / j.1460-2075.1995.tb07199.x . PMC 398308 . PMID 7744013 .
- ^ Kambach C, Walke S, Young R, Avis JM, de la Fortelle E, Raker VA, Lührmann R, Li J, Nagai K (febrero de 1999). "Estructuras cristalinas de dos complejos de proteínas Sm y sus implicaciones para el ensamblaje de los snRNPs spliceosomales". Celular . 96 (3): 375–87. doi : 10.1016 / S0092-8674 (00) 80550-4 . PMID 10025403 . S2CID 17379935 .
- ^ Códigos PDB 1B34, 1D3B, 1I5L, 1KQ2, 1N9S, 1IB8 de la base de datos de estructura de información del Centro Nacional de Biotecnología.
- ^ Khusial P, Plaag R, Zieve GW (septiembre de 2005). "Las proteínas LSm forman anillos heptaméricos que se unen al ARN mediante motivos repetidos". Trends Biochem. Sci . 30 (9): 522–8. doi : 10.1016 / j.tibs.2005.07.006 . PMID 16051491 .
- ^ Urlaub H, Raker VA, Kostka S, Lührmann R (enero de 2001). "Interacciones de ARN de sitio Sm-proteína Sm dentro del anillo interno de la estructura del núcleo spliceosomal snRNP" . EMBO J . 20 (1–2): 187–96. doi : 10.1093 / emboj / 20.1.187 . PMC 140196 . PMID 11226169 .
- ^ Seto AG, Zaug AJ, Sobel SG, Wolin SL, Cech TR (septiembre de 1999). "La telomerasa de Saccharomyces cerevisiae es una partícula de ribonucleoproteína nuclear pequeña Sm". Naturaleza . 401 (6749): 177–80. Código bibliográfico : 1999Natur.401..177S . doi : 10.1038 / 43694 . PMID 10490028 . S2CID 4414530 .
- ^ Beggs JD (junio de 2005). "Procesamiento de proteínas Lsm y ARN". Biochem. Soc. Trans . 33 (Pt 3): 433–8. doi : 10.1042 / BST0330433 . PMID 15916535 .
- ^ Kufel J, Allmang C, Petfalski E, Beggs J, Tollervey D (enero de 2003). "Las proteínas Lsm son necesarias para el procesamiento normal y la estabilidad de los ARN ribosomales" . J. Biol. Chem . 278 (4): 2147–56. doi : 10.1074 / jbc.M208856200 . PMID 12438310 .
- ^ Schümperli D, Pillai RS (octubre de 2004). "La estructura especial del núcleo Sm de la U7 snRNP: significado de gran alcance de una pequeña ribonucleoproteína nuclear" (PDF) . Célula. Mol. Life Sci . 61 (19–20): 2560–70. doi : 10.1007 / s00018-004-4190-0 . PMID 15526162 . S2CID 5780814 .
- ^ Ma Y, Dostie J, Dreyfuss G, Van Duyne GD (junio de 2005). "El heterodímero Gemin6-Gemin7 de la supervivencia del complejo de neuronas motoras tiene una estructura similar a la proteína Sm". Estructura . 13 (6): 883–92. doi : 10.1016 / j.str.2005.03.014 . PMID 15939020 .
- ^ Chari A, Golas MM, Klingenhäger M, Neuenkirchen N, Sander B, Englbrecht C, Sickmann A, Stark H, Fischer U (31 de octubre de 2008). "Un acompañante de la asamblea colabora con el complejo SMN para generar SnRNP splicosomales". Celular . 135 (3): 497–509. doi : 10.1016 / j.cell.2008.09.020 . hdl : 11858 / 00-001M-0000-0010-93A3-A . PMID 18984161 . S2CID 119444 .
- ^ Albrecht M, Lengauer T (julio de 2004). "Nuevas proteínas similares a Sm con largas colas C-terminales y metiltransferasas asociadas" . FEBS Lett . 569 (1-3): 18-26. doi : 10.1016 / j.febslet.2004.03.126 . PMID 15225602 . S2CID 37187215 .
- ^ Mura C, Kozhukhovsky A, Gingery M, Phillips M, Eisenberg D (abril de 2003). "Las propiedades de oligomerización y unión de ligando de proteínas de arqueas similares a Sm (SmAP)" . Protein Sci . 12 (4): 832–47. doi : 10.1110 / ps.0224703 . PMC 2323858 . PMID 12649441 .
- ^ Schumacher MA, Pearson RF, Møller T, Valentin-Hansen P, Brennan RG (julio de 2002). "Estructuras del regulador de traducción pleiotrópico Hfq y un complejo Hfq-ARN: una proteína bacteriana similar a Sm" . EMBO J . 21 (13): 3546–56. doi : 10.1093 / emboj / cdf322 . PMC 126077 . PMID 12093755 .
- ^ Lease RA, Woodson SA (diciembre de 2004). "Ciclos de la proteína Hfq similar a Sm en el ARN regulador pequeño DsrA". J. Mol. Biol . 344 (5): 1211–23. doi : 10.1016 / j.jmb.2004.10.006 . PMID 15561140 .
- ^ Yu L, Gunasekera AH, Mack J, Olejniczak ET, Chovan LE, Ruan X, Towne DL, Lerner CG, Fesik SW (agosto de 2001). "Estructura de la solución y función de una proteína conservada SP14.3 codificada por un gen esencial de Streptococcus pneumoniae". J. Mol. Biol . 311 (3): 593–604. doi : 10.1006 / jmbi.2001.4894 . PMID 11493012 .
- ^ Bass RB, Strop P, Barclay M, Rees DC (noviembre de 2002). "Estructura cristalina de Escherichia coli MscS, un canal mecanosensible y modulado por voltaje" (PDF) . Ciencia . 298 (5598): 1582–7. Código Bibliográfico : 2002Sci ... 298.1582B . doi : 10.1126 / science.1077945 . PMID 12446901 . S2CID 15945269 .
- ^ Achsel T, Stark H, Lührmann R (marzo de 2001). "El dominio Sm es un antiguo motivo de unión a ARN con especificidad de oligo (U)" . Proc. Natl. Acad. Sci. USA . 98 (7): 3685–9. Código Bibliográfico : 2001PNAS ... 98.3685A . doi : 10.1073 / pnas.071033998 . PMC 31112 . PMID 11259661 .
- ^ Ciccarelli FD, Doerks T, von Mering C, Creevey CJ, Snel B, Bork P (marzo de 2006). "Hacia la reconstrucción automática de un árbol de la vida altamente resuelto". Ciencia . 311 (5765): 1283–7. Código bibliográfico : 2006Sci ... 311.1283C . CiteSeerX 10.1.1.381.9514 . doi : 10.1126 / science.1123061 . PMID 16513982 . S2CID 1615592 .
- ^ Kiss T (diciembre de 2004). "Biogénesis de pequeñas RNP nucleares" . J. Cell Sci . 117 (Pt 25): 5949–51. doi : 10.1242 / jcs.01487 . PMID 15564372 .
enlaces externos
- LSM de entrada de Pfam. Pfam es la base de datos del Instituto Sanger, que es una colección de dominios y familias de proteínas.