La Protein Structure Initiative (PSI) fue un proyecto con sede en EE. UU. Que tenía como objetivo acelerar el descubrimiento en genómica estructural y contribuir a la comprensión de la función biológica. [1] Financiado por el Instituto Nacional de Ciencias Médicas Generales (NIGMS) de EE. UU. Entre 2000 y 2015, su objetivo era reducir el costo y el tiempo necesarios para determinar estructuras proteicas tridimensionales y desarrollar técnicas para resolver problemas desafiantes en biología estructural. incluidas las proteínas de membrana. Más de una docena de centros de investigación han sido apoyados por el PSI para trabajar en la construcción y mantenimiento de tuberías de genómica estructural de alto rendimiento, desarrollando predicción computacional de estructuras de proteínas.métodos, organizar y difundir la información generada por el PSI, y aplicar la determinación de estructuras de alto rendimiento para estudiar una amplia gama de problemas biológicos y biomédicos importantes.
El proyecto se ha organizado en tres fases separadas. La primera fase de la Iniciativa de Estructura de Proteínas (PSI-1) se extendió de 2000 a 2005 y se dedicó a demostrar la viabilidad de la determinación de estructuras de alto rendimiento, resolver estructuras de proteínas únicas y prepararse para una fase de producción posterior. [2] La segunda fase, PSI-2, se centró en implementar los métodos de determinación de estructuras de alto rendimiento desarrollados en PSI-1, así como en el modelado de homología y abordar los cuellos de botella como el modelado de proteínas de membrana . [3] La tercera fase, PSI: Biología, comenzó en 2010 y consistió en redes de investigadores que aplicaban la determinación de estructuras de alto rendimiento para estudiar una amplia gama de problemas biológicos y biomédicos.[4] El programa de PSI finalizó el 1 de julio de 2015, [5] incluso que algunos de los centros de PSI continúan con la determinación de la estructura con el apoyo de otros mecanismos de financiación.
La primera fase de la Iniciativa de Estructura de Proteínas (PSI-1) duró desde junio de 2000 hasta septiembre de 2005, y tuvo un presupuesto de $ 270 millones financiado principalmente por NIGMS con el apoyo del Instituto Nacional de Alergias y Enfermedades Infecciosas . [2] PSI-1 vio el establecimiento de nueve centros piloto que se centran en estudios de genómica estructural de una variedad de organismos, incluidos Arabidopsis thaliana , Caenorhabditis elegans y Mycobacterium tuberculosis . [2] Durante este período de cinco años, se determinaron más de 1.100 estructuras proteicas, más de 700 de las cuales se clasificaron como "únicas" debido a su <30% de similitud de secuencia con otras estructuras proteicas conocidas. [2]
El objetivo principal de PSI-1, desarrollar métodos para agilizar el proceso de determinación de la estructura, resultó en una serie de avances técnicos. Varios métodos desarrollados durante PSI-1 mejoraron la expresión de proteínas recombinantes en sistemas como Escherichia coli , Pichia pastoris y líneas celulares de insectos. También se introdujeron nuevos enfoques optimizados para la clonación celular , la expresión y la purificación de proteínas , en los que la robótica y las plataformas de software se integraron en la línea de producción de proteínas para minimizar la mano de obra requerida, aumentar la velocidad y reducir los costos. [6]
La segunda fase de la Iniciativa de Estructura de Proteínas (PSI-2) duró desde julio de 2005 hasta junio de 2010. Su objetivo era utilizar métodos introducidos en PSI-1 para determinar una gran cantidad de proteínas y continuar el desarrollo en la racionalización del proceso de genómica estructural. PSI-2 tenía un presupuesto quinquenal de $ 325 millones proporcionado por NIGMS con el apoyo del Centro Nacional de Recursos de Investigación . Al final de esta fase, la Protein Structure Initiative había resuelto más de 4.800 estructuras de proteínas; más de 4.100 de estos fueron únicos. [7]
El número de centros de investigación patrocinados aumentó a 14 durante PSI-2. Se seleccionaron cuatro centros como centros a gran escala, con el mandato de dedicar un 15% de esfuerzo a los objetivos propuestos por la comunidad de investigación en general, el 15% a objetivos de relevancia biomédica y el 70% a una amplia cobertura estructural; Estos centros eran el Centro Conjunto de Genómica Estructural (JCSG), el Centro del Medio Oeste de Genómica Estructural (MCSG), el Consorcio de Genómica Estructural del Noreste (NESG) y el Centro de Investigación SGX de Genómica Estructural de Nueva York (NYSGXRC). Los nuevos centros que participaron en PSI-2 incluyeron cuatro centros especializados: Centro de Tecnologías Aceleradas para Estructura Gen a 3D (ATCG3D), elCentro de Genómica Estructural Eucariota (CESG), el Centro de Biología Estructural de Alto Rendimiento (CHTSB), una rama del Consorcio de Genómica Estructural de Protozoos Patógenos que toma el lugar de esa institución), el Centro de Estructuras de Proteínas de Membrana (CSMP), y el Consorcio de Nueva York sobre Estructura de Proteínas de Membrana (NYCOMPS). También se agregaron dos centros de modelado de homología , el Centro Conjunto de Modelado Molecular (JCMM) y Nuevos Métodos para Modelado Comparativo de Alta Resolución (NMHRCM), así como dos centros de recursos, el Repositorio de Materiales de PSI (PSI-MR) y el Repositorio de Materiales de PSI (PSI-MR). Base de conocimientos de biología (SBKB). [8] El Consorcio de Genómica Estructural de TB fue eliminado de la lista de centros de investigación apoyados en la transición de PSI-1 a PSI-2. [2]
Lanzado originalmente en febrero de 2008, SBKB es un recurso gratuito que proporciona información sobre la secuencia de proteínas y la búsqueda de palabras clave, así como módulos que describen la selección de objetivos, protocolos experimentales, modelos de estructura, anotación funcional, métricas sobre el progreso general y actualizaciones sobre la tecnología de determinación de estructuras. . Al igual que el PDB , está dirigido por la Dra. Helen M. Berman y se encuentra alojado en la Universidad de Rutgers .
El repositorio de materiales de PSI, establecido en 2006 en el Instituto de Proteómica de Harvard, almacena y envía clones de plásmido generados por PSI . [9] Los clones se verifican en secuencia, se anotan y se almacenan en el repositorio de plásmidos DNASU , [10] actualmente ubicado en el Instituto Biodesign de la Universidad Estatal de Arizona. En septiembre de 2011, hay más de 50.000 clones de plásmidos generados por PSI y vectores vacíos disponibles para solicitarlos a través de DNASU, además de más de 147.000 clones generados a partir de fuentes que no son de PSI. Los plásmidos se distribuyen a investigadores de todo el mundo. Ahora llamado PSI: Biology Materials Repository, este recurso tiene un presupuesto de cinco años de $ 5.4 millones y está bajo la dirección del Dr. Joshua LaBaer, [11] quien se mudó a la Universidad Estatal de Arizona a mediados de 2009, llevándose el PSI: Biology-MR con él.
La tercera fase del PSI se denominó PSI: Biología y tenía la intención de reflejar el énfasis en la relevancia biológica del trabajo. [4] Durante esta fase, redes de investigadores altamente organizadas estaban aplicando el nuevo paradigma de determinación de estructuras de alto rendimiento, que se desarrolló con éxito durante las primeras fases del PSI, para estudiar una amplia gama de importantes problemas biológicos y biomédicos. La red incluía centros para la determinación de la estructura de alto rendimiento, centros para la determinación de la estructura de la proteína de membrana, consorcios para asociaciones de biología estructural de alto rendimiento, el SBKB y el PSI-MR. En septiembre de 2013, los NIH anunciaron que PSI no se renovaría después de que finalizara su tercera fase en 2015.
En enero de 2006, alrededor de dos tercios de la producción mundial de genómica estructural (SG) la realizaban los centros de ISP. [12] De estas contribuciones de PSI, más del 20% representaron nuevas familias de Pfam , en comparación con el promedio de no SG del 5%. [12] Las familias de Pfam representan grupos de proteínas estructuralmente distintos, como se predice a partir de genomas secuenciados . No se logró apuntar a homólogos de estructura conocida mediante el uso de herramientas de comparación de secuencias como BLAST y PSI-BLAST . [12] Al igual que la diferencia en la novedad determinada por el descubrimiento de nuevas familias de Pfam, el PSI también descubrió más SCOPpliegues y superfamilias que los esfuerzos no SG. En 2006, el 16% de las estructuras resueltas por el PSI representaron nuevos pliegues y superfamilias SCOP, mientras que el promedio no SG fue del 4%. [12] La resolución de estructuras tan novedosas refleja una mayor cobertura del espacio de pliegues de proteínas, uno de los principales objetivos del PSI. [1] La determinación de la estructura de una proteína nueva permite el modelado de homología para predecir con mayor precisión el pliegue de otras proteínas en la misma familia estructural.
Si bien la mayoría de las estructuras resueltas por los cuatro centros de PSI a gran escala carecen de anotación funcional, muchos de los centros de PSI restantes determinan estructuras para proteínas con función biológica conocida. El TB Structural Genomics Consortium, por ejemplo, se centró exclusivamente en proteínas caracterizadas funcionalmente. Durante su mandato en PSI-1, depositó estructuras para más de 70 proteínas únicas de Mycobacterium tuberculosis , que representaron más del 35% del total de estructuras únicas de M. tuberculosis resueltas hasta 2007. [13] Siguiendo con su tema biomédico para aumentar la cobertura de fosfotomas, el NYSGXRC ha determinado estructuras para aproximadamente el 10% de todas las fosfatasas humanas . [14]
Los consorcios PSI han proporcionado la abrumadora mayoría de objetivos para la Evaluación Crítica de Técnicas para la Predicción de la Estructura de la Proteína (CASP), un experimento bianual de toda la comunidad para determinar el estado y el progreso de la predicción de la estructura de la proteína . [15] [16] [17]
Un objetivo principal durante la fase de PSI: Biología es utilizar los métodos de alto rendimiento desarrollados durante la primera década de la iniciativa para generar estructuras de proteínas para estudios funcionales, ampliando el impacto biomédico de PSI. También se espera que avance en el conocimiento y la comprensión de las proteínas de membrana. [ cita requerida ]
La ISP ha recibido críticas notables de la comunidad de biología estructural . Entre estos cargos está que el producto principal del PSI ( archivos PDB de coordenadas atómicas de proteínas determinadas por cristalografía de rayos X o espectroscopia de RMN ) no son lo suficientemente útiles para los biólogos como para justificar el costo de $ 764 millones del proyecto. [18] [19] Los críticos señalan que el dinero que se gasta actualmente en el PSI podría haber financiado lo que consideran causas más valiosas:
Los $ 60 millones al año en dinero público que se gastan - yo diría que se desperdician - en el PSI son suficientes para financiar aproximadamente entre 100 y 200 subvenciones de investigación iniciadas por investigadores individuales. Estas propuestas impulsadas por hipótesis son el alma de la empresa científica y, como he comentado recientemente en otras columnas, están siendo absorbidas por, entre otras cosas, una tendencia creciente a financiar grandes iniciativas a su costa. Esos $ 60 millones al año aumentarían la línea de pago en un instituto típico de los NIH en aproximadamente 6 puntos porcentuales, lo suficiente como para marcar una gran diferencia en la revisión por pares y para la continuidad de una gran cantidad de ciencia importante. [19]
- Gregory Petsko , PhD
Se publicó una breve respuesta a esto: [20]
En conclusión, debe tenerse en cuenta que la investigación científica y las tecnologías de vanguardia que la impulsan y son impulsadas por ella están en constante y rápida evolución. Algunas de las críticas de Petsko son constructivas y los responsables políticos deben tenerlas en cuenta. Pero no se debe tirar al bebé con el agua del baño, sino ajustar el alcance y los objetivos de la ISP a las necesidades de la comunidad de las ciencias de la vida en su conjunto, en el espíritu de SPINE, la SGC y otras genómicas / proteómicas estructurales europeas. proyectos. [21] Si se adopta un enfoque tan constructivo, estamos seguros de que los datos estructurales proporcionados por el PSI y sus primos servirán como un recurso no menos valioso que las secuencias del genoma.
En octubre de 2008, el NIGMS organizó una reunión sobre el futuro de los esfuerzos de genómica estructural e invitó a oradores del Comité Asesor de la ISP, miembros del Consejo Asesor de la NIGMS y científicos interesados que no habían estado involucrados previamente con la ISP. También se incluyeron representantes de otras iniciativas de genómica, proteómica y genómica estructural, así como científicos de la academia, el gobierno y la industria. Sobre la base de esta reunión y las recomendaciones posteriores del Comité Asesor de la ISP, [22] [23]En enero de 2009 se publicó un documento de aclaración de conceptos que describe lo que podría implicar una tercera fase de la ISP. Lo más notable fue un gran énfasis en las asociaciones y colaboraciones para garantizar que la mayoría de la investigación de PSI se centre en proteínas de interés para la comunidad de investigación en general, así como los esfuerzos para hacer que los productos de PSI sean más accesibles para la comunidad de investigación. [24]
Las solicitudes de subvención para PSI: Biología se enviaron antes del 29 de octubre de 2009. Consulte la sección de la Fase 3 anterior.