C1orf131


La proteína no caracterizada C1orf131 es una proteína que en humanos está codificada por el gen C1orf131 . El primer ortólogo de esta proteína se descubrió en humanos. [4] [5] Posteriormente, mediante el uso de algoritmos y bioinformática, se han descubierto homólogos de C1orf131 en numerosas especies y, como resultado, el nombre de la mayoría de las proteínas de esta familia de proteínas es homólogo de la proteína C1orf131 no caracterizada.

En humanos, C1orf131 se encuentra en la hebra negativa del cromosoma 1 y en la banda citogenética 1q42.2 junto con otros 193 genes. [6] En particular, el gen corriente arriba de C1orf131 es GNPAT , y el gen corriente abajo de C1orf131 es TRIM67 . Cuando este gen se transcribe en humanos, C1orf131 con mayor frecuencia forma un ARNm de 1458 pares de bases de largo que se compone de siete exones. Hay al menos otras nueve formas de empalme alternativas en humanos que producen proteínas. Varían en tamaño desde 129 pares de bases (2 exones) a 1458 pares de bases (7 exones). [7]

En la familia de proteínas C1orf131, las proteínas tienen entre 93 y 450 aminoácidos de longitud; sin embargo, la mayoría tiende a tener entre 160 y 295 aminoácidos de longitud. Tienen un peso molecular entre 10,6 y 49,0 kDa con la mayoría entre 18,6 y 32,7 kDa. Tienen un punto isoeléctrico entre 9,6 y 11,2. [8] Se ha identificado que más de 30 ortólogos de mamíferos, aves y lagartos tienen un sitio de unión de poli (A) ARN. [9] Todos los ortólogos de esta familia de proteínas tienen un dominio de función desconocida DUF4602. [9] [10] Se ha demostrado que la proteína humana está fosforilada y acetilada. [11] [12] [13] [14] [15] [16] Estas proteínas sonaminoácidos cargados ricos en lisinas ( D E H K R ) y aminoácidos cargados básicos ( H K R ). [17] La estructura secundaria de estas proteínas consiste principalmente en hélices alfa y espirales con un pequeño porcentaje de hebras beta. [18] Se ha demostrado que C1orf131 interactúa con ubiquitina [19] a través de la captura por afinidad seguida de espectrometría de masas y APP (proteína precursora de beta amiloide (A4)) [20] a través del complejo reconstituido.

DUF4602 (PF15375) tiene generalmente más de 120 aminoácidos de longitud. [21] Por lo general, solo hay un gen que contiene este dominio DUF, sin embargo, el dominio DUF se ha identificado en dos proteínas diferentes en varias especies. En Trichuris suis, DUF4602 se encuentra tanto en la proteína hipotética M5114_09117 como en la pseudouridina sintasa D del ARNt, y en Echinocuccus granulosus DUF4602 se ha encontrado en la proteína hipotética EGR 05135 y en la proteína conservada expresada. DUF4602 se ha encontrado principalmente en eucariotas; sin embargo, se ha identificado DUF4602 en el virus DRHN1 , Bacillus sp. UNC41MFS5 , Enterococcus faecalis y Enterococcus faecalis 13-SD-W-01. En los ortólogos C1orf131, los dominios DUF se encuentran típicamente en el medio del gen hacia el lado C-terminal en proteínas más grandes (250+ residuos) y en ortólogos más pequeños (160-250 residuos) el dominio DUF se encuentra cerca del N-terminal. . También en ortólogos más grandes hay regiones de baja complejidad que podrían indicar que estas proteínas son proteínas intrínsecamente desordenadas .

Esta familia de genes existe solo en eucariotas. No hay parálogos de este gen; sin embargo, hay algunos pseudogenes de C1orf131 . Hasta ahora solo se han encontrado en orangutanes, lémures ratón y perezosos. [10] Cuando se compara esta familia de genes con el citocromo C, un gen de evolución lenta, [22] y la cadena gamma de fibrinógeno , un gen de evolución rápida [23] , se muestra que evoluciona a un ritmo más rápido que el fibrinógeno.


Resumen gráfico de la proteína humana C1orf131 con DUF4602 mostrada en verde, fosforilación en puntos rojos y acetilación en punto gris.
Gráfico de divergencia de este gen en comparación con el fibrinógeno y el citocromo C.