La informática de bioimagen es un subcampo de la bioinformática y la biología computacional . [1] Se centra en el uso de técnicas computacionales para analizar bioimágenes, especialmente imágenes celulares y moleculares, a gran escala y alto rendimiento. El objetivo es obtener conocimientos útiles a partir de imágenes complicadas y heterogéneas y metadatos relacionados .
Los microscopios automatizados pueden recopilar una gran cantidad de imágenes con una intervención mínima. Esto ha llevado a una explosión de datos, que requiere absolutamente un procesamiento automático. Además, y sorprendentemente, para varias de estas tareas, existe evidencia de que los sistemas automatizados pueden funcionar mejor que los humanos. [2] [3] Además, los sistemas automatizados son imparciales, a diferencia del análisis basado en humanos, cuya evaluación puede (incluso inconscientemente) estar influenciada por el resultado deseado.
Ha habido un enfoque creciente en el desarrollo de técnicas novedosas de procesamiento de imágenes , visión por computadora , minería de datos , bases de datos y visualización para extraer, comparar, buscar y administrar el conocimiento biológico en estos problemas de uso intensivo de datos. [4] [5]
Modalidades de datos
Se utilizan varios sistemas y plataformas de recopilación de datos, que requieren diferentes métodos para ser manejados de manera óptima.
Microscopía fluorescente
La microscopía fluorescente permite la visualización directa de moléculas a nivel subcelular, tanto en células vivas como fijas . Las moléculas de interés están marcadas con proteína verde fluorescente (GFP), otra proteína fluorescente o un anticuerpo marcado con fluorescencia . Se utilizan regularmente varios tipos de microscopios: de campo amplio, confocal o de dos fotones . La mayoría de los sistemas de microscopía también admitirán la recopilación de series temporales (películas).
En general, los filtros se usan para que cada tinte se muestre por separado (por ejemplo, se usa un filtro azul para obtener imágenes de Hoechst , luego se cambia rápidamente a un filtro verde para obtener imágenes de GFP). Para el consumo, las imágenes a menudo se muestran en color falso mostrando cada canal en un color diferente, pero es posible que ni siquiera estén relacionados con las longitudes de onda originales utilizadas. En algunos casos, la imagen original incluso podría haberse adquirido en longitudes de onda no visibles (el infrarrojo es común).
Las elecciones en la etapa de adquisición de imágenes influirán en el análisis y, a menudo, requerirán un procesamiento especial. Las pilas confocales requerirán procesamiento 3D y las pseudoapilaciones de campo amplio a menudo se beneficiarán de la deconvolución digital para eliminar la luz desenfocada.
La llegada de microscopios automatizados que pueden adquirir muchas imágenes automáticamente es una de las razones por las que el análisis no se puede realizar a simple vista (de lo contrario, la anotación se convertiría rápidamente en el cuello de botella de la investigación). El uso de microscopios automatizados significa que algunas imágenes pueden estar desenfocadas (los sistemas automáticos de búsqueda de enfoque a veces pueden ser incorrectos), contener una pequeña cantidad de células o estar llenas de escombros. Por lo tanto, las imágenes generadas serán más difíciles de analizar que las imágenes adquiridas por un operador, ya que habrían elegido otras ubicaciones para fotografiar y enfocar correctamente. Por otro lado, el operador podría introducir un sesgo inconsciente en su selección eligiendo solo las células cuyo fenotipo es más parecido al esperado antes del experimento.
Histología
La histología es una aplicación de microscopía en la que los cortes de tejido se tiñen y se observan bajo el microscopio (por lo general, microscopio óptico, pero también se usa microscopía electrónica).
Cuando se utiliza un microscopio óptico, a diferencia del caso de las imágenes fluorescentes, las imágenes se adquieren normalmente utilizando sistemas de cámaras en color estándar. Esto refleja parcialmente la historia del campo, donde los humanos a menudo interpretaban las imágenes, pero también el hecho de que la muestra se puede iluminar con luz blanca y se puede recolectar toda la luz en lugar de tener que excitar los fluoróforos. Cuando se usa más de un tinte, un paso de preprocesamiento necesario es desmezclar los canales y recuperar una estimación de las intensidades específicas del tinte puro.
Se ha demostrado que la ubicación subcelular de las proteínas teñidas se puede identificar a partir de imágenes histológicas.
Si el objetivo es un diagnóstico médico, las aplicaciones de histología a menudo caerán en el ámbito de la patología digital o el análisis automatizado de imágenes de tejidos , que son campos hermanos de la informática de bioimagen. A menudo se aplican las mismas técnicas computacionales, pero los objetivos están orientados más hacia la medicina que hacia la investigación.
Problemas importantes
Análisis de ubicación subcelular
El análisis de la ubicación subcelular fue uno de los problemas iniciales en este campo. En su modo supervisado, el problema es aprender un clasificador que pueda reconocer imágenes de los principales orgánulos celulares basados en imágenes.
Los métodos utilizados se basan en el aprendizaje automático , construyendo un clasificador discriminativo basado en características numéricas calculadas a partir de la imagen. Las características son características genéricas de la visión por computadora , como las características de la textura de Haralick o características especialmente diseñadas para capturar factores biológicos (por ejemplo, la co-localización con un marcador nuclear es un ejemplo típico).
Para el problema básico de identificar orgánulos, se pueden obtener valores de precisión muy altos, incluso mejor que? resultados. [2] Estos métodos son útiles en la investigación de biología celular básica, pero también se han aplicado al descubrimiento de proteínas cuya ubicación cambia en las células cancerosas. [6]
Sin embargo, la clasificación en orgánulos es una forma limitada del problema, ya que muchas proteínas se localizarán en múltiples ubicaciones simultáneamente (patrones mixtos) y se pueden distinguir muchos patrones aunque no sean componentes diferentes unidos a la membrana. Hay varios problemas sin resolver en esta área y la investigación está en curso.
Cribado de alto contenido
Las pantallas de alto rendimiento que utilizan tecnología de imágenes automatizadas (a veces llamadas detección de alto contenido ) se han convertido en un método estándar tanto para el descubrimiento de fármacos como para la investigación biológica básica. Usando placas de pozos múltiples, robótica y microscopía automatizada, el mismo ensayo se puede aplicar a una gran biblioteca de posibles reactivos (típicamente moléculas pequeñas o ARNi ) muy rápidamente, obteniendo miles de imágenes en un corto período de tiempo. Debido al gran volumen de datos generados, el análisis automático de imágenes es una necesidad. [7]
Cuando se dispone de controles positivos y negativos, el problema se puede abordar como un problema de clasificación y se pueden aplicar las mismas técnicas de cálculo y clasificación de características que se utilizan para el análisis de ubicación subcelular.
Segmentación
La segmentación de células es un subproblema importante en muchos de los campos siguientes (y a veces es útil por sí solo si el objetivo es solo obtener un recuento de células en un ensayo de viabilidad ). El objetivo es identificar los límites de las celdas en una imagen multicelular. Esto permite procesar cada celda individualmente para medir parámetros. En los datos 3D, la segmentación debe realizarse en el espacio 3D.
Como la formación de imágenes de un marcador nuclear es común en muchas imágenes, un protocolo ampliamente utilizado es segmentar los núcleos. Esto puede ser útil por sí solo si se necesitan mediciones nucleares o puede servir para sembrar una línea divisoria de aguas que extienda la segmentación a toda la imagen.
Todos los principales métodos de segmentación se han informado en imágenes de células, desde simples métodos de establecimiento de umbrales hasta métodos de ajuste de niveles. Debido a que existen múltiples modalidades de imagen y diferentes tipos de células, cada una de las cuales implica diferentes compensaciones, no existe una única solución aceptada para este problema.
La segmentación de imágenes celulares como procedimiento importante se utiliza a menudo para estudiar la expresión génica y la relación de colocalización, etc. de células individuales. En tales casos de análisis de células individuales, a menudo es necesario determinar de forma única las identidades de las células mientras se segmentan las células. Esta tarea de reconocimiento a menudo no es trivial computacionalmente. Para organismos modelo como C. elegans que tienen linajes celulares bien definidos, es posible reconocer explícitamente las identidades celulares a través del análisis de imágenes, combinando métodos de reconocimiento de patrones y segmentación de imágenes. [9] También se ha propuesto la segmentación y el reconocimiento simultáneos de células [10] como una solución más precisa para este problema cuando se dispone de un "atlas" u otra información previa de las células. Dado que la expresión génica a resolución de una sola célula puede obtenerse utilizando estos tipos de enfoques basados en imágenes, es posible combinar estos métodos con otros métodos de cuantificación de la expresión de genes de una sola célula, como RNAseq.
Seguimiento
El seguimiento es otro problema de procesamiento de imágenes tradicional que aparece en la informática de bioimagen. El problema es relacionar los objetos que aparecen en los siguientes fotogramas de una película. Al igual que con la segmentación, el problema puede plantearse tanto en formas bidimensionales como tridimensionales. [11]
En el caso de imágenes fluorescentes, el seguimiento a menudo debe realizarse en imágenes de muy bajo contraste. Como la obtención de un alto contraste se logra al hacer brillar más luz que daña la muestra y destruye el tinte , la iluminación se mantiene al mínimo. A menudo es útil pensar en un presupuesto de fotones: la cantidad de fotones que se pueden usar para obtener imágenes antes de que el daño a la muestra sea tan grande que ya no se puede confiar en los datos. Por tanto, si se van a obtener imágenes de alto contraste, sólo se pueden utilizar unos pocos fotogramas; mientras que para películas largas, cada fotograma tendrá un contraste muy bajo.
Registro
Cuando se consideran muestras de datos de imágenes de diferentes naturalezas, como las correspondientes a diferentes métodos de etiquetado, diferentes individuos, muestras en diferentes puntos de tiempo, etc., las imágenes a menudo deben registrarse para una mejor comparación. Un ejemplo es que, a medida que se recopilan datos del curso del tiempo, las imágenes de los fotogramas posteriores a menudo deben registrarse para poder corregir cambios menores en la posición de la cámara. Otro ejemplo es que cuando se recolectan muchas imágenes de un animal modelo (por ejemplo, C. elegans o cerebro de Drosophila o el cerebro de un ratón ), a menudo existe una necesidad sustancial de registrar estas imágenes para comparar sus patrones (por ejemplo, aquellas que corresponden al mismo o diferente población de neuronas, las que comparten o difieren en la expresión génica, etc.).
Los paquetes de software de registro de imágenes médicas fueron los primeros intentos de utilizarse para las aplicaciones de registro de imágenes microscópicas. Sin embargo, debido al tamaño de archivo de imagen a menudo mucho más grande y al número mucho mayor de muestras en los experimentos, en muchos casos es necesario desarrollar un nuevo software de registro de imágenes en 3D. El BrainAligner[12] es un software que se ha utilizado para automatizar el proceso de registro 3D deformable y no lineal utilizando una estrategia confiable de coincidencia de puntos de referencia. Se ha utilizado principalmente para generar más de 50.000 imágenes cerebrales de moscas de la fruta estandarizadas en 3D en Janelia Farm del HHMI, con otras aplicaciones que incluyen libélulas y ratones.
Lugares importantes
Un consorcio de científicos de universidades e institutos de investigación ha organizado reuniones anuales sobre informática de bioimagen [13] desde 2005. La conferencia ISMB ha tenido una vía de visualización de datos y bioimagen desde 2010. La revista Bioinformatics también introdujo una vía de informática de bioimagen en 2012. The OpenAccess La revista BMC Bioinformatics tiene una sección dedicada al análisis de bioimagen, visualización y aplicaciones relacionadas. Otras revistas de biología computacional y bioinformática también publican regularmente trabajos de informática de bioimagen. Una acción de costes de la Unión Europea llamada NEUBIAS (red europea de analistas de bioimagen) ha estado organizando conferencias anuales, así como escuelas de formación de analistas de bioimagen y taggathons desde 2017.
Software
Hay varios paquetes que hacen que los métodos informáticos de bioimagen estén disponibles a través de una interfaz gráfica de usuario como ImageJ , FIJI , CellProfiler o Icy . Las plataformas de visualización y análisis como Vaa3D han aparecido en los últimos años y se han utilizado en proyectos a gran escala, especialmente para aplicaciones de neurociencia y de escritorio.
Otros investigadores desarrollan sus propios métodos, generalmente basados en un lenguaje de programación con un buen soporte de visión por computadora, como Python , C ++ o MATLAB . La biblioteca Mahotas para Python es un ejemplo popular. Aunque, existen ejemplos de métodos desarrollados por investigadores en lenguajes de programación con menos soporte de visión por computadora como R (por ejemplo, trackdem [14] ).
Ver también
- Apilamiento de enfoque La técnica de combinar varias imágenes con diferentes distancias de enfoque en una.
- Proyección de alto contenido
- patología digital
- Imagenes medicas
enlaces externos
- Vaa3D: visualización y análisis de imágenes multidimensionales de alto rendimiento
- Bioformatos El motor de E / S de archivos de imagen que admite docenas de formatos
Referencias
- ^ Peng, H; Bateman A; Valencia A; Wren JD (2012). "Informática de bioimagen: una nueva categoría en bioinformática" . Bioinformática . 28 (8): 1057. doi : 10.1093 / bioinformatics / bts111 . PMC 3324521 . PMID 22399678 .
- ^ a b Murphy, Robert; Velliste, M .; Porreca, G. (2003). "Características numéricas robustas para la descripción y clasificación de patrones de ubicación subcelular en imágenes de microscopio de fluorescencia". The Journal of VLSI Signal Processing . 35 (3): 311–321. CiteSeerX 10.1.1.186.9521 . doi : 10.1023 / b: vlsi.0000003028.71666.44 . S2CID 8134907 .
- ^ Nattkemper, Tim; Thorsten Twellmann; Helge Ritter; Walter Schubert (2003). "Humano vs máquina: evaluación de micrografías de fluorescencia". Informática en Biología y Medicina . 33 (1): 31–43. CiteSeerX 10.1.1.324.4664 . doi : 10.1016 / S0010-4825 (02) 00060-4 . PMID 12485628 .
- ^ Peng H (septiembre de 2008). "Informática de bioimagen: una nueva área de la biología de la ingeniería" . Bioinformática . 24 (17): 1827–36. doi : 10.1093 / bioinformatics / btn346 . PMC 2519164 . PMID 18603566 .
- ^ "La búsqueda de la microscopía cuantitativa" . Métodos de la naturaleza . 9 (7): 627. 2012. doi : 10.1038 / nmeth.2102 . PMID 22930824 .
- ^ Gloria, Estelle; Justin Newberg; Robert F. Murphy (2008). "Comparación automatizada de patrones de ubicación subcelular de proteínas entre imágenes de tejidos normales y cancerosos". Imágenes biomédicas: de lo nano a lo macro, 2008. ISBI 2008. 5º Simposio Internacional IEEE sobre .
- ^ Shariff, Aabid; Joshua Kangas; Luis Pedro Coelho; Shannon Quinn; Robert F. Murphy (2010). "Análisis automatizado de imágenes para análisis y cribado de alto contenido" . Revista de cribado biomolecular . 15 (7): 726–734. doi : 10.1177 / 1087057110370894 . PMID 20488979 .
- ^ Coelho, Luis Pedro; Aabid Shariff; Robert F. Murphy (2009). "Segmentación nuclear en imágenes de células de microscopio: un conjunto de datos segmentado a mano y comparación de algoritmos". Imágenes biomédicas: de lo nano a lo macro, 2009. ISBI'09. Simposio Internacional IEEE sobre. IEEE . doi : 10.1109 / ISBI.2009.5193098 . PMC 2901896 .
- ^ Long, Fuhui; Peng, H .; Liu, X .; Kim, S .; Myers, EW (septiembre de 2009). "Un atlas digital 3D de C. elegans y su aplicación a los análisis unicelulares" . Métodos de la naturaleza . 6 (9): 667–672. doi : 10.1038 / nmeth.1366 . PMC 2882208 . PMID 19684595 .
- ^ Qu, Lei; Long, F .; Liu, X .; Kim, S .; Myers, EW; Peng, H. (2011). "Reconocimiento y segmentación simultánea de células: aplicación en C. elegans" . Bioinformática . 27 (20): 2895–2902. doi : 10.1093 / bioinformatics / btr480 . PMC 3187651 . PMID 21849395 .
- ^ Dufour, Alexandre; Vasily Shinin; Shahragim Tajbakhsh; Nancy Guillén-Aghion; JC. Olivo-Marin; Christophe Zimmer (2005). "Segmentación y seguimiento de células fluorescentes en microscopía 3D dinámica con superficies activas acopladas" (PDF) . Procesamiento de imágenes, transacciones IEEE el 14, no. 9 . págs. 1396-1410. doi : 10.1109 / TIP.2005.852790 . Archivado desde el original (PDF) el 2 de marzo de 2014..
- ^ Peng, Hanchuan; Chung, P .; Long, F .; Qu, L .; Jenett, A .; Seeds, A .; Myers, EW; Simpson, JH (2011). "BrainAligner: atlas de registro 3D de cerebros de Drosophila" . Métodos de la naturaleza . 8 (6): 493–498. doi : 10.1038 / nmeth.1602 . PMC 3104101 . PMID 21532582 .
- ^ "Reunión Anual de Informática de Bioimagen" .
- ^ Bruijning, Marjolein; Visser, Marco D .; Hallmann, Caspar A .; Jongejans, Eelke; Golding, Nick (2018). "trackdem: seguimiento de partículas automatizado para obtener recuentos de población y distribuciones de tamaño de videos en r" . Métodos en ecología y evolución . 9 (4): 965–973. doi : 10.1111 / 2041-210X.12975 . ISSN 2041-210X .