Extracción sencilla de objetos interactivos

La extracción de objetos interactivos simples ( SIOX ) es un algoritmo para extraer objetos de primer plano de imágenes y videos en color con muy poca interacción del usuario. ^[1] Se ha implementado como herramienta de "selección de primer plano" en GIMP (desde la versión 2.3.3), como parte de la herramienta de rastreo en Inkscape (desde 0.44pre3) y como función en ImageJ y Fiji (complemento) . También se informaron implementaciones experimentales para Blender y Krita . Aunque el algoritmo se diseñó originalmente para videos, prácticamente todas las implementaciones usan SIOX principalmente para la segmentación de imágenes fijas. De hecho, a menudo se dice que es el actualestándar de facto para esta tarea en el mundo de código abierto .

Inicialmente, se utiliza una herramienta de selección manual para especificar la región de interés. Debe contener todos los objetos de primer plano para extraer y la menor cantidad posible de fondo. Los píxeles fuera de la región de interés forman el fondo seguro mientras que la región interior define un superconjunto del primer plano, es decir, la región desconocida. A continuación, se utiliza un llamado pincel de primer plano para marcar regiones de primer plano representativas. El algoritmo genera una máscara de selección. La selección se puede refinar agregando más marcas de primer plano o agregando marcas de fondo usando el pincel de fondo.

Para la segmentación de video, el fondo seguro y las regiones de primer plano ciertas se aprenden de las estadísticas de movimiento. SIOX también cuenta con herramientas que permiten un refinamiento preciso de subpíxeles de los bordes y áreas de alta textura, los llamados "pinceles de refinamiento de detalles".

Como ocurre con todos los algoritmos de segmentación , siempre hay imágenes en las que el algoritmo no produce resultados perfectos. El inconveniente más crítico de SIOX es la dependencia del color. Aunque muchas fotos se pueden separar bien por color, el algoritmo no puede lidiar con el camuflaje. Si el primer plano y el fondo comparten muchos tonos idénticos de colores similares, el algoritmo podría dar un resultado con partes faltantes o un primer plano clasificado incorrectamente. SIOX funciona igual de bien en diferentes puntos de referencia en comparación con los métodos de segmentación basados en gráficos, como Grabcut . Sin embargo, SIOX es más resistente al ruido y, por lo tanto, también se puede utilizar para la segmentación de vídeos. Los métodos de segmentación basados en gráficos buscan un corte mínimo y, por lo tanto, tienden a no funcionar de manera óptima con estructuras complejas.

El algoritmo se desarrolló inicialmente en el departamento de informática de la Freie Universitaet Berlin . El desarrollador principal, Gerald Friedland , ahora es profesor en el departamento de EECS de la Universidad de California en Berkeley y también es científico principal de datos en el Laboratorio Nacional Lawrence Livermore . Continúa apoyando el desarrollo a través de la tutoría, por ejemplo, en Google Summer of Code .