SMIM23 o proteína de membrana integral pequeña 23 es una proteína que en humanos está codificada por el gen SMIM23 o c5orf50. La isoforma de ARNm más larga tiene 519 nucleótidos, lo que se traduce en 172 aminoácidos de una proteína. [1] En avances recientes, los investigadores han identificado este gen, junto con algunos otros, que potencialmente podrían desempeñar un papel en cómo surge la morfología facial en los seres humanos. [2] Aunque esta investigación todavía es relativamente nueva, proporciona el comienzo de un camino para futuras investigaciones sobre este gen.
SMIM23 es un gen que codifica proteínas. En la tabla se proporciona información básica sobre sus alias y la ubicación de los cromosomas. El esquema del cromosoma ayuda a visualizar la ubicación del gen.
Si bien el gen tiene dos isoformas de corte y empalme (isoformas X1 y X2), tiene tres límites exón / exón que indican cuatro exones (nucleótidos 1-105, 106-157, 158-225 y 226-519). [3]
SMIM23 tiene en particular un dominio transmembrana .
El punto isoeléctrico predicho para la proteína no modificada / sin procesar en ratones es 5.779 mientras que solo la región transmembrana en humanos tiene un punto isoeléctrico de 5.928 [4]
El gen parece ser rico en leucina y ácido glutámico, aunque no en un número generalmente alto. También es débil en todos los demás aminoácidos además de la alanina, la serina y la glutamina. [5]
Se predijo que la región subrayada en la traducción conceptual sería una repetición de Involucrin . [6]
La región transmembrana es de 1674,2 Dalton, mientras que la proteína completa es de 200008,51 Da. Esto es muy similar a lo que se encontró con UniProt donde el peso molecular predicho fue de 20.025 kDa. [7] Se investigaron los kits de anticuerpos para ver el patrón de bandas y los cambios de peso que pueden haber ocurrido después de la traducción . El anticuerpo policlonal C5orf50 de ThermoFisher Scientific tiene un patrón de bandas de transferencia Western a 40 kDa. [8] Esto predice que hay una cantidad significativa de modificación postraduccional mediante la adición de componentes grandes.
Hay muchos sitios de fosforilación a lo largo de su secuencia, incluidos dos sitios de fosforilación de proteína quinasa C , un sitio de fosforilación de proteína quinasa dependiente de cAMP y cGMP y un sitio de fosforilación de tirosina quinasa . [9] También hay un sitio de modificación GPI potencial seguro de terminal C. [10]
Hay dos tramos de hélices alfa desde el aminoácido 33 al 49 y del 89 al 136 según la evidencia de varios programas que predicen la estructura secundaria . El más informativo de todos los programas de los investigados es PELE en Biology Workbench. [5]
Se predijo que una estructura de proteína 3D se vería como una serie de hélices, [11] similar a lo que predijeron otros programas.
Se prevé que esta proteína de membrana integral humana se encuentre en el retículo endoplásmico . [12] El mismo tipo de investigación de la localización de proteínas en otros tipos de especies arrojó resultados contradictorios. Muchos programas predijeron que la proteína estaría presente en el citosol. [12] Esto sugiere la posibilidad de una denominación incorrecta, es decir, es posible que la proteína no sea una membrana integral debido a otras ubicaciones previstas. Este tipo de conclusión requerirá más información.
No existe suficiente consenso sobre en qué parte del cuerpo se expresa el SMIM23. Las bases de datos indican principalmente en los testículos , [13] pero esto puede deberse a la falta de datos.
La región promotora de SMIM23 tiene aproximadamente 1192 nucleótidos de longitud con varios factores de transcripción predichos . [14]
La regulación en la estructura secundaria es un vástago-bucle previsto en la región 5 ' UTR con algunas áreas de conservación entre especies. [15]
Una nueva investigación ha sugerido que la forma en que surge la forma de la cara en los individuos puede estar influenciada por un conjunto de genes. Este conjunto incluye SMIM23. [2] Aunque en el artículo se hace referencia al gen con un alias (C5orf50), está claro que los científicos han reunido una lista de cinco genes que probablemente determinan la forma facial. Se trata específicamente de personas de ascendencia europea. Estos hallazgos están respaldados por la replicación de fenotipos de cada gen específico y análisis estadístico. Al igual que los hallazgos en otros lugares, el artículo menciona SMIM23 que probablemente codifica una proteína transmembrana desconocida. También se han realizado estudios en los que un conjunto de genes, incluido SMIM23, puede influir en la estatura humana . [16] Además, se está realizando una gran cantidad de investigación sobre el cromosoma 5en general para comprender las funciones de ciertos genes en él, incluido SMIM23. [17] Esto podría algún día proporcionar información sobre las funciones específicas de este gen en el cromosoma mismo.
Se prevé que las siguientes proteínas interactúen con SMIM23.
Cilia And Flagella Associated Protein 43, también conocida como CFAP43 o WDR96, es la más segura de las parejas funcionales previstas y es un dominio repetido de triptófano-ácido aspártico.
SFR1 es la reparación de recombinación dependiente de SWI5 1 que es un componente del complejo SWI5-SFR1 , un complejo necesario para la reparación de roturas de doble cadena mediante recombinación homóloga.
COL17A1 es colágeno . Específicamente el tipo XVII, alfa 1. Esto puede desempeñar un papel en la estructura general de la proteína.
PRDM16 se une al ADN y actúa como regulador transcripcional . Funciona en la diferenciación entre tejido adiposo blanco y marrón . También puede ser un represor de la señalización beta del factor de crecimiento transformante . [18]
No hay parálogos conocidos .
Hay alrededor de 100 ortólogos conocidos que van desde primates hasta pequeños animales terrestres. A partir de estas investigaciones y la de la similitud de secuencia, [19] se puede discutir un espacio ortólogo. Los parientes más cercanos de los humanos con el gen SMIM23 estaban en los primates, por lo que se eligieron dos tipos de monos que divergieron hace unos 29,4 millones de años y tenían similitudes de secuencia en los 70. Los parientes un poco más distantes con el gen provienen de una amplia variedad de animales, desde caballos hasta mamíferos marinos, murciélagos y más, todos los cuales tienen similitudes entre 62-69%. Por último, se incluyeron algunos ortólogos parientes lejanos como el diablo de Tasmania y varios animales carroñeros que tienen similitudes entre el 40-61%.
Es interesante ver cómo algunas partes aún están muy conservadas (ver traducción conceptual arriba). El motivo más interesante es triptófano 124, leucina 125 y ácido aspártico 126. Por último, en BLAST se devolvió una familia de proteínas de función desconocida. Hay dos pequeñas secuencias conservadas que forman parte del motivo DUF4635 (LEQ y DLE). Entonces, aunque no se conservan completamente en las alineaciones realizadas con SMIM23, se etiquetaron en la traducción conceptual. [20]
La proteína no se encontró en bacterias, arqueas , protistas , plantas, hongos, invertebrados, reptiles y aves. Todos los ortólogos encontrados estaban bajo mamíferos. [3] Se creó un árbol filogenético sin raíces [5] de SMIM23 con algunos ortólogos cercanos, moderadamente relacionados y distantes (enumerados en la tabla). Aquí, cuanto mayor es la distancia (longitud de la línea), mayor es el tiempo hasta el último ancestro común. La identidad de secuencia se refiere a aminoácidos similares, mientras que la similitud se refiere a la coincidencia de aminoácidos.
Género y especie [3] | Nombre común [3] | Fecha de divergencia (MYA) [21] | Identidad de secuencia (%) [5] | Similitud de secuencia (%) [3] |
---|---|---|---|---|
Cercocebus atys | Mangabey hollín | 29,44 | 73,8 | 77,8 |
Macaca mulata | Mono rhesus | 29,44 | 73,3 | 78,3 |
Galeopterus variegatus | Lémur volador de sonda | 76 | 56,5 | 67 |
Tupaia chinensis | Musaraña china | 82 | 54,7 | 66 |
Castor canadensis | Castor americano | 90 | 54,1 | sesenta y cinco |
Microtus ochrogaster | Campañol de la pradera | 90 | 54,7 | 64,2 |
Mustela putorius furo | Hurón | 96 | 59,9 | 62 |
Equus caballus | Caballo | 96 | 57 | 68,2 |
Odobenus rosmarus | Morsa | 96 | 59,3 | 66,4 |
Acinonyx jubatus | leopardo | 96 | 58,7 | 63 |
Ursus maritimus | Oso polar | 96 | 58,1 | 69,3 |
Camelus ferus | Camello bactriano salvaje | 96 | 55,2 | 62,2 |
Dasypus novemcinctus | Armadillo de nueve bandas | 105 | 31,2 | 40,2 |
Echinops telfairi | Erizo menor tenrec | 105 | 50 | 61 |
Sarcophilus harrisii | Demonio de Tasmania | 159 | 34,7 | 47,7 |
Monodelphis domestica | Zarigüeya gris de cola corta | 159 | 28,5 | 44,6 |