De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
La proteogenómica utiliza un enfoque integrado mediante la combinación de genómica, proteómica y transcriptómica.

La proteogenómica es un campo de investigación biológica que utiliza una combinación de proteómica , genómica y transcriptómica para ayudar en el descubrimiento e identificación de péptidos . La proteogenómica se utiliza para identificar nuevos péptidos comparando los espectros de MS / MS con una base de datos de proteínas que se ha derivado de información genómica y transcriptómica. La proteogenómica a menudo se refiere a estudios que utilizan información proteómica, a menudo derivada de la espectrometría de masas , para mejorar las anotaciones de genes . [1]La genómica se ocupa del código genético de organismos completos, mientras que la transcriptómica se ocupa del estudio de la secuenciación y transcripciones del ARN. La proteómica utiliza espectrometría de masas en tándem y cromatografía líquida para identificar y estudiar las funciones de las proteínas. La proteómica se está utilizando para descubrir todas las proteínas expresadas dentro de un organismo, conocidas como su proteoma . [2]El problema con la proteómica es que se basa en la suposición de que los modelos genéticos actuales son correctos y que se pueden encontrar las secuencias de proteínas correctas utilizando una base de datos de secuencias de proteínas de referencia; sin embargo, este no es siempre el caso, ya que algunos péptidos no pueden ubicarse en la base de datos. Además, pueden producirse nuevas secuencias de proteínas a través de mutaciones. Estos problemas se pueden solucionar con el uso de datos proteómicos, genómicos y transcriptómicos. La utilización tanto de la proteómica como de la genómica llevó a la proteogenómica, que se convirtió en su propio campo en 2004. [1] [3] [4]

Más recientemente, el perfil conjunto de proteínas de superficie y transcripciones de ARNm de células individuales mediante métodos como CITE-Seq se ha denominado proteogenómica unicelular, [5] [6] [7] aunque los objetivos de estos estudios no están relacionados a la identificación de péptidos. Desde 2019, estos métodos se conocen más comúnmente como ómicos multimodales o multicómics. [8]

Metodología [ editar ]

Imagen de una célula eucariota que ilustra cómo se fabrican las proteínas: la ARN polimerasa lee el ADN en el núcleo, luego los ribosomas en el citoplasma producen una cadena de aminoácidos que se pliega en una proteína funcional.

La idea principal detrás del enfoque proteogenómico es identificar péptidos comparando datos de MS / MS con bases de datos de proteínas que contienen secuencias de proteínas predichas. La base de datos de proteínas se genera de diversas formas mediante la utilización de datos genómicos y transcriptómicos. A continuación se muestran algunas de las formas en que se generan las bases de datos de proteínas:

Traducción de seis cuadros [ editar ]

Se pueden utilizar traducciones de seis marcos para generar una base de datos que predice secuencias de proteínas. La limitación de este método es que las bases de datos serán muy grandes debido a la cantidad de secuencias que se generan, algunas de las cuales no existen en la naturaleza. [1]

Predicción del gen ab initio [ editar ]

En este método, se genera una base de proteína mediante algoritmos de predicción de genes que permiten la identificación de regiones codificantes de proteínas . La base de datos es similar a una generada a través de la traducción de seis cuadros en lo que respecta al hecho de que las bases de datos pueden ser muy grandes. [1]

Datos de etiqueta de secuencia expresados [ editar ]

Las traducciones de seis marcos pueden utilizar una etiqueta de secuencia expresada (EST) para generar bases de datos de proteínas. Los datos EST proporcionan información de transcripción que puede ayudar en la creación de la base de datos. La base de datos puede ser muy grande y tiene la desventaja de tener presentes múltiples copias de una secuencia dada; sin embargo, este problema puede evitarse comprimiendo la secuencia de proteínas generada mediante estrategias computacionales. [1]

Otros métodos [ editar ]

Bases de datos de proteínas también se pueden crear mediante el uso de ARN datos de secuenciación, las transcripciones de ARN anotadas, y secuencias de la proteína variante. Además, existen otras bases de datos de proteínas más especializadas que pueden crearse para identificar adecuadamente el péptido de interés. [1]

Otro método en la identificación de proteínas mediante proteogenómica es la proteogenómica comparativa. La proteogenómica comparativa compara datos proteómicos de múltiples especies relacionadas al mismo tiempo y explota la homología entre sus proteínas para mejorar las anotaciones con mayor confianza estadística. [9] [10]

Aplicaciones [ editar ]

La proteogenómica se puede aplicar de diferentes formas. Una aplicación es la mejora de las anotaciones de genes en varios organismos. La anotación genética implica descubrir genes y sus funciones. [11] La proteogenómica se ha vuelto especialmente útil en el descubrimiento y mejora de las anotaciones de genes en organismos procariotas. Por ejemplo, se ha estudiado la anotación genómica de varios microorganismos mediante el enfoque proteogenómico, incluidos Escherichia coli , Mycobacterium y múltiples especies de bacterias Shewanella . [12]

Además de mejorar las anotaciones de genes, los estudios proteogenómicos también pueden proporcionar información valiosa sobre la presencia de cambios de marco programados , escisión de metionina N-terminal , péptidos señal , proteólisis y otras modificaciones postraduccionales . [3] [9] La proteogenómica tiene aplicaciones potenciales en medicina, especialmente en la investigación oncológica . El cáncer se produce a través de mutaciones genéticas como metilación , translocación y somáticas.mutaciones. La investigación ha demostrado que se necesita información tanto genómica como proteómica para comprender las variaciones moleculares que conducen al cáncer. [2] [13] La proteogenómica ha ayudado en esto mediante la identificación de secuencias de proteínas que pueden tener funciones funcionales en el cáncer. [14] Un ejemplo específico de esto ocurrió en un estudio sobre cáncer de colon que resultó en el descubrimiento de posibles objetivos para el tratamiento del cáncer. [2] La proteogenómica también ha llevado a inmunoterapias personalizadas dirigidas contra el cáncer, en las que los epítopos de anticuerpos para los antígenos del cáncer se predicen utilizando la proteogenómica para crear medicamentos que actúan sobre el tumor específico del paciente. [15]Además del tratamiento, la proteogenonómica puede proporcionar información sobre el diagnóstico del cáncer. En estudios que involucraron cáncer de colon y recto, se utilizó proteogenómica para identificar mutaciones somáticas. La identificación de mutaciones somáticas en pacientes podría usarse para diagnosticar cáncer en pacientes. Además de las aplicaciones directas en el tratamiento y el diagnóstico del cáncer, se puede usar un enfoque proteogenómico para estudiar proteínas que dan como resultado resistencia a la quimioterapia . [13]

Desafíos [ editar ]

La proteogenómica puede ofrecer métodos de identificación de péptidos sin tener la desventaja de las bases de datos de proteínas incompletas o inexactas que enfrenta la proteómica; sin embargo, existen desafíos con el enfoque proteogenómico. [1]Uno de los mayores desafíos de la proteogenómica es el gran tamaño de las bases de datos de proteínas generadas. estadísticamente, es más probable que una base de datos de proteínas grande resulte en una coincidencia incorrecta de los datos de la base de datos de proteínas con los datos de MS / MS, este problema puede dificultar la identificación de nuevos péptidos. Los falsos positivos también son un problema a través de enfoques proteogenómicos. Los falsos positivos pueden ocurrir como resultado de bases de datos de proteínas extremadamente grandes donde los datos mal emparejados conducen a una identificación incorrecta. Otro problema es la correspondencia incorrecta de los espectros de MS / MS con los datos de la secuencia de proteínas que corresponden a un péptido similar en lugar del péptido real. Hay casos de recibir datos de un péptido ubicado en múltiples sitios de genes, esto puede conducir a datos que se pueden interpretar de diferentes maneras. A pesar de estos desafíos,hay formas de reducir muchos de los errores que se producen. Por ejemplo, cuando se trata de una base de datos de proteínas muy grande, se pueden comparar las secuencias de péptidos novedosos identificados con todas las secuencias dentro de la base de datos y luego comparar las modificaciones postraduccionales. A continuación, se puede determinar si las dos secuencias representan el mismo péptido o si son dos péptidos diferentes.[1]

Referencias [ editar ]

  1. ↑ a b c d e f g h Nesvizhskii, Alexey I (1 de noviembre de 2014). "Proteogenómica: conceptos, aplicaciones y estrategias computacionales" . Métodos de la naturaleza . 11 (11): 1114–1125. doi : 10.1038 / nmeth.3144 . PMC  4392723 . PMID  25357241 .
  2. ^ a b c Sajjad, Wasim; Rafiq, Muhammad; Ali, Barkat; Hayat, Muhammad; Zada, Sahib; Sajjad, Wasim; Kumar, Tanweer (julio de 2016). "Proteogenomics: nueva tecnología emergente" . Revista HAYATI de Biociencias . 23 (3): 97–100. doi : 10.1016 / j.hjb.2016.11.002 .
  3. ^ a b Gupta N., Tanner S., Jaitly N., Adkins JN, Lipton M., Edwards R., Romine M., Osterman A., Bafna V., Smith RD, et al. Análisis de proteoma completo de modificaciones postraduccionales: aplicaciones de la espectrometría de masas para la anotación proteogenómica. Genome Res. 2007; 17: 1362–1377.
  4. ^ . Ansong C., Purvine SO, Adkins JN, Lipton MS, Smith RD (2008) Proteogenómica: necesidades y funciones que debe cumplir la proteómica en la anotación del genoma. Breve. Funct. Proteómica Genómica 7, 50–62.
  5. ^ "Proteona impulsando la adopción de la plataforma de perfiles inmunes para CAR-T, investigación de mieloma múltiple" . Noticias de Oncología de Precisión . 2021-05-07 . Consultado el 15 de mayo de 2021 .
  6. ^ "Libro electrónico de TotalSeq" . BioLegend . Consultado el 23 de noviembre de 2020 .
  7. ^ "Proteona lanza la secuenciación de ARN ESCAPE ™ para medir proteínas y ARN en células individuales con un enfoque en preguntas clínicas" . Proteona . Consultado el 23 de noviembre de 2020 .
  8. ^ "Método del año 2019: ómicas multimodales unicelulares" . Métodos de la naturaleza . 17 (1): 1–1. Enero de 2020. doi : 10.1038 / s41592-019-0703-5 . ISSN 1548-7105 . 
  9. ^ a b Gupta N., Benhamida J., Bhargava V., Goodman D., Kain E., Kerman I., Nguyen N., Ollikainen N., Rodriguez J., Wang J., et al. Proteogenómica comparativa: combinación de espectrometría de masas y genómica comparativa para analizar múltiples genomas. Genome Res. 2008; 18: 1133–1142.
  10. ^ Gallien S., Perrodou E., Carapito C., Deshayes C., Reyrat JM, Van Dorsselaer A., ​​Poch O., Schaeffer C., Lecompte O. (2009) Ortho-proteogenomics: investigación de múltiples proteomas a través de la ortología y un nuevo protocolo basado en MS. Genome Res 19, 128-135.
  11. ^ Ansong, C .; Purvine, SO; Adkins, JN; Lipton, MS; Smith, RD (7 de marzo de 2008). "Proteogenómica: necesidades y roles que debe cumplir la proteómica en la anotación del genoma" . Sesiones informativas sobre genómica funcional y proteómica . 7 (1): 50–62. doi : 10.1093 / bfgp / eln010 . PMID 18334489 . 
  12. ^ Kucharova, Veronika; Wiker, Harald G. (diciembre de 2014). "Proteogenómica en microbiología: dar la vuelta a la derecha en el cruce de la genómica y la proteómica". Proteómica . 14 (23–24): 2360–2675. doi : 10.1002 / pmic.201400168 . hdl : 1956/9547 . PMID 25263021 . 
  13. ^ a b Shukla, Hem D .; Mahmood, Javed; Vujaskovic, Zeljko (diciembre de 2015). "Enfoque proteogenómico integrado para el diagnóstico precoz y el pronóstico del cáncer". Letras de cáncer . 369 (1): 28–36. doi : 10.1016 / j.canlet.2015.08.003 . PMID 26276717 . 
  14. ^ Cámaras, Matthew C .; Jagtap, Pratik D .; Johnson, James E .; McGowan, Thomas; Kumar, Praveen; Onsongo, Getiria; Guerrero, Candace R .; Barsnes, Harald; Vaudel, Marc (1 de noviembre de 2017). "Un recurso informático de proteogenómica accesible para investigadores del cáncer" . Investigación del cáncer . 77 (21): e43 – e46. doi : 10.1158 / 0008-5472.can-17-0331 . PMC 5675041 . PMID 29092937 .  
  15. ^ Creech, Amanda L .; Ting, Ying S .; Goulding, Scott P .; Sauld, John FK; Barthelme, Dominik; Rooney, Michael S .; Addona, Terri A .; Abelin, Jennifer G. (2018). "El papel de la espectrometría de masas y la proteogenómica en el avance de la predicción del epítopo HLA" . Proteómica . 18 (12): n / a. doi : 10.1002 / pmic.201700259 . ISSN 1615-9861 . PMC 6033110 . PMID 29314742 .