Una región de interés (a menudo abreviada ROI ) son muestras dentro de un conjunto de datos identificado para un propósito particular. [1] El concepto de ROI se usa comúnmente en muchas áreas de aplicación. Por ejemplo, en la formación de imágenes médicas , los límites de un tumor pueden definirse en una imagen o en un volumen, con el fin de medir su tamaño. El borde endocárdico puede definirse en una imagen, quizás durante diferentes fases del ciclo cardíaco, por ejemplo, final de la sístole y final de la diástole, con el fin de evaluar la función cardíaca. En los sistemas de información geográfica (GIS), un ROI se puede tomar literalmente como una selección poligonal de un mapa 2D. En visión artificial yreconocimiento óptico de caracteres , el ROI define los bordes de un objeto en consideración. En muchas aplicaciones, las etiquetas simbólicas (textuales) se agregan a un ROI para describir su contenido de manera compacta. Dentro de un ROI puede haber puntos de interés individuales (PDI).
Ejemplos de regiones de interés
- Conjunto de datos 1D: un intervalo de tiempo o frecuencia en una forma de onda
- Conjunto de datos 2D: los límites de un objeto en una imagen
- Conjunto de datos 3D: los contornos o superficies que describen un objeto (a veces conocido como Volumen de interés ( VOI )) en un volumen
- Conjunto de datos 4D: el contorno de un objeto en o durante un intervalo de tiempo particular en un tiempo-volumen
Un ROI es una forma de anotación , a menudo asociada con información categórica o cuantitativa (por ejemplo, medidas como el volumen o la intensidad media), expresada como texto o en forma estructurada.
Hay tres formas fundamentalmente diferentes de codificar un ROI:
- Como parte integral del conjunto de datos de muestra, con un valor único o de enmascaramiento que puede o no estar fuera del rango normal de valores que ocurren normalmente y que etiqueta las celdas de datos individuales.
- Como información separada, puramente gráfica, como con elementos de dibujo vectoriales o de mapa de bits (rasterizados), quizás con algún texto sin formato (no estructurado) que lo acompañe en el formato de los datos en sí.
- Como información semántica estructurada separada (como tipos de valores codificados ) con un conjunto de coordenadas espaciales y / o temporales
Imagenes medicas
Los estándares de imágenes médicas como DICOM proporcionan mecanismos generales y específicos de la aplicación para admitir varios casos de uso.
Para imágenes DICOM (dos o más dimensiones):
- Los gráficos y el texto quemados pueden ocurrir dentro del rango de valor de píxel normal (por ejemplo, como el valor máximo de blanco) (obsoleto)
- Los gráficos y el texto superpuestos de mapa de bits (rasterizados) pueden estar presentes en bits altos no utilizados de los datos de píxeles o en un atributo separado (obsoleto)
- Los gráficos vectoriales se pueden codificar en atributos de imagen separados como curvas (en desuso)
- Los gráficos vectoriales no estructurados y el texto, así como los gráficos superpuestos de mapa de bits (rasterizados) se pueden codificar en un objeto separado como un estado de presentación que hace referencia al objeto de imagen al que se va a aplicar.
- Los datos estructurados se pueden codificar en un objeto separado como un informe estructurado en forma de un árbol de pares nombre-valor de conceptos codificados o de texto posiblemente asociados con información cuantitativa derivada que pueden hacer referencia a coordenadas espaciales y / o temporales que, a su vez, hacen referencia a los objetos de la imagen. a lo que se aplican
- Las ubicaciones de referencia se pueden codificar como fiduciales en forma de coordenadas espaciales con un propósito codificado asociado, ya sea como coordenadas de píxeles por referencia a imágenes específicas o como coordenadas en un espacio cartesiano 3D relativo al paciente designado.
- Los píxeles (posiblemente no contiguos) pueden clasificarse en segmentos codificados en un objeto de segmentación como valores binarios o probabilísticos en un ráster (que no es necesario que tenga el mismo muestreo espacial o extensión que las imágenes de las que se derivó la segmentación); estos suelen ser referenciados por otros objetos que contienen contenido estructurado (informes estructurados)
Para radioterapia DICOM:
- Los contornos de los objetos se pueden definir como conjuntos de estructuras, ya sea como coordenadas de píxeles por referencia a imágenes específicas o como coordenadas en un espacio cartesiano 3D relativo al paciente con nombre (estos también se utilizan para aplicaciones que no son RT)
Para formas de onda DICOM basadas en el tiempo:
- Los valores quemados pueden ocurrir con la forma de onda (en desuso)
- Las anotaciones se pueden codificar en un atributo separado que pueden seleccionar múltiples puntos de tiempo o un rango de puntos de tiempo, ya sea por número de muestra o tiempo especificado
- Los datos estructurados se pueden codificar en un objeto separado como un informe estructurado en forma de un árbol de pares nombre-valor de conceptos codificados o de texto posiblemente asociados con información cuantitativa derivada que pueden hacer referencia a coordenadas temporales que a su vez hacen referencia a los objetos de forma de onda a los que se aplican.
La arquitectura de documentos clínicos de HL7 también tiene un subconjunto de mecanismos similares (y que se pretende que sean compatibles con) DICOM para hacer referencia a las coordenadas espaciales relacionadas con la imagen como observaciones; permite definir un círculo, elipse, polilínea o punto como coordenadas enteras relativas a píxeles que hacen referencia a un objeto de imagen multimedia externo, que puede ser de un consumidor en lugar de un formato de imagen médica (por ejemplo, un GIF , PNG o JPEG ) .
Sistemas de análisis de documentos
En el reconocimiento óptico de caracteres (OCR) y el análisis de disposición de documentos , las regiones de interés (ROI) abarcan jerárquicamente páginas, bloques de texto o gráficos, hasta imágenes de tira de líneas individuales, cuadros de imágenes de palabras y caracteres. El estándar de facto en archivos y bibliotecas es el tuplet {image_file, xml_file}, generalmente en forma de archivo * .tif y el archivo * .xml que lo acompaña.
Otras aplicaciones 2D
En lo que respecta a los estándares no médicos, además de los lenguajes de marcado puramente gráficos (como PostScript o PDF ) y los formatos de archivo de dibujo de gráficos vectoriales (como SVG ) y 3D (como VRML ) que están ampliamente disponibles y que No tienen semántica de ROI específica, algunos estándares como JPEG 2000 proporcionan específicamente mecanismos para etiquetar y / o comprimir a un grado diferente de fidelidad, lo que ellos denominan regiones de interés.
Referencias
- ^ Ron Brinkmann (1999). El arte y la ciencia de la composición digital . Morgan Kaufmann. págs. 184 . ISBN 978-0-12-133960-9.