SMIM23


De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

SMIM23 o proteína de membrana integral pequeña 23 es una proteína que en humanos está codificada por el gen SMIM23 o c5orf50. La isoforma de ARNm más larga tiene 519 nucleótidos, lo que se traduce en 172 aminoácidos de una proteína. [1] En avances recientes, los investigadores han identificado este gen, junto con algunos otros, que potencialmente podrían desempeñar un papel en cómo surge la morfología facial en los seres humanos. [2] Aunque esta investigación todavía es relativamente nueva, proporciona el comienzo de un camino para futuras investigaciones sobre este gen.

Gene

Una tabla con el número de acceso, la ubicación de los cromosomas , la ubicación de la hebra, el tamaño y los alias conocidos.

SMIM23 es un gen que codifica proteínas. En la tabla se proporciona información básica sobre sus alias y la ubicación de los cromosomas. El esquema del cromosoma ayuda a visualizar la ubicación del gen.

Cromosoma humano 5.png

ARNm

Si bien el gen tiene dos isoformas de corte y empalme (isoformas X1 y X2), tiene tres límites exón / exón que indican cuatro exones (nucleótidos 1-105, 106-157, 158-225 y 226-519). [3]

Traducción conceptual de SMIM23. Están etiquetados el codón de inicio y parada, los sitios de empalme del exón, la señal de poliadenilación , así como las hélices alfa conservadas individualmente resaltadas en amarillo, con flechas, el dominio transmembrana en púrpura, los dominios de función desconocida en azul y un dominio repetido subrayado.

Proteína

Características físicas

SMIM23 tiene en particular un dominio transmembrana .

El punto isoeléctrico predicho para la proteína no modificada / sin procesar en ratones es 5.779 mientras que solo la región transmembrana en humanos tiene un punto isoeléctrico de 5.928 [4]

El gen parece ser rico en leucina y ácido glutámico, aunque no en un número generalmente alto. También es débil en todos los demás aminoácidos además de la alanina, la serina y la glutamina. [5]

Se predijo que la región subrayada en la traducción conceptual sería una repetición de Involucrin . [6]

Modificaciones postraduccionales

La región transmembrana es de 1674,2 Dalton, mientras que la proteína completa es de 200008,51 Da. Esto es muy similar a lo que se encontró con UniProt donde el peso molecular predicho fue de 20.025 kDa. [7] Se investigaron los kits de anticuerpos para ver el patrón de bandas y los cambios de peso que pueden haber ocurrido después de la traducción . El anticuerpo policlonal C5orf50 de ThermoFisher Scientific tiene un patrón de bandas de transferencia Western a 40 kDa. [8] Esto predice que hay una cantidad significativa de modificación postraduccional mediante la adición de componentes grandes.

Hay muchos sitios de fosforilación a lo largo de su secuencia, incluidos dos sitios de fosforilación de proteína quinasa C , un sitio de fosforilación de proteína quinasa dependiente de cAMP y cGMP y un sitio de fosforilación de tirosina quinasa . [9] También hay un sitio de modificación GPI potencial seguro de terminal C. [10]

Esquema de proteína. Marcando ubicaciones de características notables que se confirmaron con cierto nivel de confianza. Aquí el rojo representa el sitio de fosforilación y el gris representa el sitio de modificación de GPI C-terminal. Se muestra el dominio transmembrana en relación con el resto de la proteína.

Estructura secundaria

Hay dos tramos de hélices alfa desde el aminoácido 33 al 49 y del 89 al 136 según la evidencia de varios programas que predicen la estructura secundaria . El más informativo de todos los programas de los investigados es PELE en Biology Workbench. [5]

Estructura prevista de SMIM23 por el programa I-Tasser.

Se predijo que una estructura de proteína 3D se vería como una serie de hélices, [11] similar a lo que predijeron otros programas.

Localización subcelular

Se prevé que esta proteína de membrana integral humana se encuentre en el retículo endoplásmico . [12] El mismo tipo de investigación de la localización de proteínas en otros tipos de especies arrojó resultados contradictorios. Muchos programas predijeron que la proteína estaría presente en el citosol. [12] Esto sugiere la posibilidad de una denominación incorrecta, es decir, es posible que la proteína no sea una membrana integral debido a otras ubicaciones previstas. Este tipo de conclusión requerirá más información.

Expresión

No existe suficiente consenso sobre en qué parte del cuerpo se expresa el SMIM23. Las bases de datos indican principalmente en los testículos , [13] pero esto puede deberse a la falta de datos.

Regulación de la expresión

La región promotora de SMIM23 tiene aproximadamente 1192 nucleótidos de longitud con varios factores de transcripción predichos . [14]

La regulación en la estructura secundaria es un vástago-bucle previsto en la región 5 ' UTR con algunas áreas de conservación entre especies. [15]

Función e importancia clínica

Una nueva investigación ha sugerido que la forma en que surge la forma de la cara en los individuos puede estar influenciada por un conjunto de genes. Este conjunto incluye SMIM23. [2] Aunque en el artículo se hace referencia al gen con un alias (C5orf50), está claro que los científicos han reunido una lista de cinco genes que probablemente determinan la forma facial. Se trata específicamente de personas de ascendencia europea. Estos hallazgos están respaldados por la replicación de fenotipos de cada gen específico y análisis estadístico. Al igual que los hallazgos en otros lugares, el artículo menciona SMIM23 que probablemente codifica una proteína transmembrana desconocida. También se han realizado estudios en los que un conjunto de genes, incluido SMIM23, puede influir en la estatura humana . [16] Además, se está realizando una gran cantidad de investigación sobre el cromosoma 5en general para comprender las funciones de ciertos genes en él, incluido SMIM23. [17] Esto podría algún día proporcionar información sobre las funciones específicas de este gen en el cromosoma mismo.

Proteínas que interactúan

Se prevé que las siguientes proteínas interactúen con SMIM23.

Cilia And Flagella Associated Protein 43, también conocida como CFAP43 o WDR96, es la más segura de las parejas funcionales previstas y es un dominio repetido de triptófano-ácido aspártico.

SFR1 es la reparación de recombinación dependiente de SWI5 1 que es un componente del complejo SWI5-SFR1 , un complejo necesario para la reparación de roturas de doble cadena mediante recombinación homóloga.

COL17A1 es colágeno . Específicamente el tipo XVII, alfa 1. Esto puede desempeñar un papel en la estructura general de la proteína.

PRDM16 se une al ADN y actúa como regulador transcripcional . Funciona en la diferenciación entre tejido adiposo blanco y marrón . También puede ser un represor de la señalización beta del factor de crecimiento transformante . [18]

Homología y evolución

No hay parálogos conocidos .

Hay alrededor de 100 ortólogos conocidos que van desde primates hasta pequeños animales terrestres. A partir de estas investigaciones y la de la similitud de secuencia, [19] se puede discutir un espacio ortólogo. Los parientes más cercanos de los humanos con el gen SMIM23 estaban en los primates, por lo que se eligieron dos tipos de monos que divergieron hace unos 29,4 millones de años y tenían similitudes de secuencia en los 70. Los parientes un poco más distantes con el gen provienen de una amplia variedad de animales, desde caballos hasta mamíferos marinos, murciélagos y más, todos los cuales tienen similitudes entre 62-69%. Por último, se incluyeron algunos ortólogos parientes lejanos como el diablo de Tasmania y varios animales carroñeros que tienen similitudes entre el 40-61%.

Es interesante ver cómo algunas partes aún están muy conservadas (ver traducción conceptual arriba). El motivo más interesante es triptófano 124, leucina 125 y ácido aspártico 126. Por último, en BLAST se devolvió una familia de proteínas de función desconocida. Hay dos pequeñas secuencias conservadas que forman parte del motivo DUF4635 (LEQ y DLE). Entonces, aunque no se conservan completamente en las alineaciones realizadas con SMIM23, se etiquetaron en la traducción conceptual. [20]

Ortólogos

Se incluye un árbol filogenético del gen SMIM23 en varios animales como se ve en la tabla. Las abreviaturas se refieren a los diferentes nombres comunes, es decir, Hu SMIM23 se refiere al gen humano.

La proteína no se encontró en bacterias, arqueas , protistas , plantas, hongos, invertebrados, reptiles y aves. Todos los ortólogos encontrados estaban bajo mamíferos. [3] Se creó un árbol filogenético sin raíces [5] de SMIM23 con algunos ortólogos cercanos, moderadamente relacionados y distantes (enumerados en la tabla). Aquí, cuanto mayor es la distancia (longitud de la línea), mayor es el tiempo hasta el último ancestro común. La identidad de secuencia se refiere a aminoácidos similares, mientras que la similitud se refiere a la coincidencia de aminoácidos.

Referencias

  1. ^ Base de datos, GeneCards Human Gene. "Gen SMIM23 - GeneCards | Proteína SIM23 | Anticuerpo SIM23" . www.genecards.org . Consultado el 18 de febrero de 2017 .
  2. ^ a b Liu, Fan; Lijn, Fedde van der; Schurmann, Claudia; Zhu, Gu; Chakravarty, M. Mallar; Hysi, Pirro G .; Wollstein, Andreas; Lao, Oscar; Bruijne, Marleen de (13 de septiembre de 2012). "Un estudio de asociación de todo el genoma identifica cinco loci que influyen en la morfología facial en los europeos" . PLOS Genetics . 8 (9): e1002932. doi : 10.1371 / journal.pgen.1002932 . ISSN 1553-7404 . PMC 3441666 . PMID 23028347 .   
  3. ^ a b c d e "SMIM23 pequeña proteína de membrana integral 23 [Homo sapiens (humano)] - Gene - NCBI" . www.ncbi.nlm.nih.gov . Consultado el 26 de febrero de 2017 .
  4. ^ Programa del Dr. Luca Toldo, desarrollado en http://www.embl-heidelberg.de . Modificado por Bjoern Kindler para imprimir también el cargo neto más bajo encontrado. Disponible en EMBL WWW Gateway to Isoelectric Point Service "Copia archivada" . Archivado desde el original el 26 de octubre de 2008 . Consultado el 10 de mayo de 2014 .Mantenimiento de CS1: copia archivada como título ( enlace )
  5. ^ a b c d Workbench, NCSA Biology. "Banco de trabajo de biología SDSC" . workbench.sdsc.edu . Consultado el 24 de abril de 2017 .
  6. ^ EMBL-EBI. "RADAR - Detección automática rápida y alineación de repeticiones en secuencias de proteínas <EMBL-EBI" . www.ebi.ac.uk . Consultado el 6 de mayo de 2017 .
  7. ^ "SMIM23 - proteína de membrana integral pequeña 23 - Homo sapiens (humano) - proteína y gen SMIM23" . www.uniprot.org . Consultado el 24 de abril de 2017 .
  8. ^ "Anticuerpo C5orf50" . www.thermofisher.com . Consultado el 24 de abril de 2017 .
  9. ^ Sigrist CJ, Cerutti L, de Castro E, Langendijk-Genevaux PS, Bulliard V, Bairoch A, Hulo N. PROSITE, una base de datos de dominios de proteínas para la caracterización funcional y la anotación. Ácidos nucleicos Res. 2010; 38 (Problema de la base de datos): D161-6.
  10. ^ Eisenhaber B., Bork P., Eisenhaber F. "Predicción de posibles sitios de modificación de GPI en secuencias de proproteína" JMB (1999) 292 (3), 741-758
  11. ^ "Servidor I-TASSER para la estructura de proteínas y la predicción de funciones" . zhanglab.ccmb.med.umich.edu . Consultado el 6 de mayo de 2017 .
  12. ^ a b "Servidor PSORT II - GenScript" . www.genscript.com . Consultado el 25 de abril de 2017 .
  13. ^ github.com/gxa/atlas/graphs/contributors, equipo de desarrollo de EMBL-EBI Expression Atlas. "Resumen de expresión para SMIM23 - homo sapiens <Atlas de expresión <EMBL-EBI" . www.ebi.ac.uk . Consultado el 24 de abril de 2017 .
  14. ^ "Genomatix - análisis de datos NGS y medicina personalizada" . www.genomatix.de . Consultado el 29 de abril de 2017 .
  15. ^ "El servidor Web Mfold | mfold.rit.albany.edu" . unafold.rna.albany.edu . Consultado el 6 de mayo de 2017 .
  16. ^ Lango Allen, Hana; Estrada, Karol; Lettre, Guillaume; Berndt, Sonja I .; Weedon, Michael N .; Rivadeneira, Fernando; Willer, Cristen J .; Jackson, Anne U .; Vedantam, Sailaja (14 de octubre de 2010). "Cientos de variantes agrupadas en loci genómicos y vías biológicas afectan la altura humana" . Naturaleza . 467 (7317): 832–838. Código Bibliográfico : 2010Natur.467..832L . doi : 10.1038 / nature09410 . ISSN 1476-4687 . PMC 2955183 . PMID 20881960 .   
  17. ^ Schmutz, Jeremy; Martín, Joel; Terry, Astrid; Couronne, Olivier; Grimwood, Jane; Lowry, Steve; Gordon, Laurie A .; Scott, Duncan; Xie, Gary (16 de septiembre de 2004). "La secuencia de ADN y análisis comparativo del cromosoma 5 humano" . Naturaleza . 431 (7006): 268–274. Código Bibliográfico : 2004Natur.431..268S . doi : 10.1038 / nature02919 . ISSN 0028-0836 . PMID 15372022 .  
  18. ^ "CADENA: redes de asociación de proteínas funcionales" . string-db.org . Consultado el 24 de abril de 2017 .
  19. ^ "El Instituto Europeo de Bioinformática - aguja EMBOSS - alineación de secuencia por pares" . Archivado desde el original el 19 de abril de 2011.
  20. ^ EMBL-EBI, InterPro. "Proteína de función desconocida DUF4635 (IPR027880) <InterPro <EMBL-EBI" . www.ebi.ac.uk . Consultado el 26 de febrero de 2017 .
  21. ^ "TimeTree :: La escala de tiempo de la vida" . www.timetree.org . Consultado el 29 de abril de 2017 .

Lectura sugerida

  • Liu F, van der Lijn F, Schurmann C, Zhu G, Chakravarty MM, Hysi PG, et al. (2012) Un estudio de asociación de todo el genoma identifica cinco loci que influyen en la morfología facial en los europeos. PLoS Genet 8 (9): e1002932. https://doi.org/10.1371/journal.pgen.1002932
  • Lowe JK, Maller JB, Pe'er I, Neale BM, Salit J, Kenny EE, et al. (2009) Estudios de asociación de todo el genoma en una población fundadora aislada de la isla de Kosrae en el Pacífico. PLoS Genet 5 (2): e1000365. https://doi.org/10.1371/journal.pgen.1000365
  • Greliche N, Germain M, Lambert JC y col. Una búsqueda en todo el genoma de interacciones SNP x SNP comunes sobre el riesgo de trombosis venosa. Genética Médica de BMC . 2013; 14: 36. doi: 10.1186 / 1471-2350-14-36.
  • Schmutz J y col. (2004). La secuencia de ADN y el análisis comparativo del cromosoma humano 5. Nature, 431 (7006), 268-74. https://dx.doi.org/10.1038/nature02919
  • Lango Allen H, Estrada K, Lettre G, et al. Cientos de variantes agrupadas en loci genómicos y vías biológicas afectan la estatura humana. Naturaleza . 2010; 467 (7317): 832-838. doi: 10.1038 / nature09410.
  • Rose JE, Behm FM, Drgon T, Johnson C, Uhl GR. Dejar de fumar personalizado: interacciones entre la dosis de nicotina, la dependencia y la puntuación del genotipo Quit-Success. Medicina molecular . 2010; 16 (7-8): 247-253. doi: 10.2119 / molmed.2009.00159.
Obtenido de " https://en.wikipedia.org/w/index.php?title=SMIM23&oldid=977474030 "