Sistema de identificación automatizado digital


El sistema de identificación digital automatizada (DAISY) es un sistema de identificación de especies automatizado optimizado para la detección rápida de invertebrados (por ejemplo, insectos) por parte de no expertos (por ejemplo, parataxonomistas ).

Fue desarrollado por el Dr. Mark O'Neill a mediados de la década de 1990. El desarrollo fue apoyado por fondos de la Iniciativa Darwin en 1997 [1] y BBSRC . [2] Los derechos de propiedad intelectual fueron adquiridos por la empresa de O'Neill, Tumbling Dice Ltd, en febrero de 2000 [3] al final del proyecto Darwin financiado por la subvención . El sistema experimentó un mayor desarrollo que dio como resultado la producción de un ejemplar que es accesible en la web y que puede hacer frente en tiempo casi real a grupos (por ejemplo, polillas halcón ) que contienen varios cientos de taxones . En hardware de servidor de PC de gama media a alta (por ejemplo, un servidor Blade) es posible una identificación en menos de un segundo para un grupo de 300 taxones. La paralelización de los códigos críticos del clasificador DAISY (utilizando tecnología FPGA a medida o tecnología de programación de GPU de propósito general como CUDA ) aumentará el rendimiento en un orden de magnitud. Esto significa que DAISY se puede implementar para realizar identificaciones en tiempo real dentro de grupos que contienen miles de taxones (por ejemplo, moscas verdaderas ).

DAISY ha sido utilizado en varios proyectos de investigación por O'Neill [4] y otros, y ha aparecido en artículos de revistas y televisión de divulgación científica. El proyecto también ha sido objeto de un artículo reciente en Science . [5]

En 2011, la primera instalación DAISY capaz de escalar a cientos de taxones se instaló en el Museo de Historia Natural de Londres. Este servidor ofrecía interfaces basadas en servicios web y VNC y podía descargar operaciones de coincidencia de patrones intensivas en computación en una GPU NVIDIA programada con CUDA . Esta instalación fue capaz de proporcionar identificación a especies con un conjunto de datos de más de 300 taxones en menos de un segundo en un entorno de múltiples usuarios.

Más recientemente, bajo la égida de la financiación de Innovate UK , DAISY se ha modificado ampliamente para satisfacer las necesidades de las actividades upstream dentro del sector del petróleo y el gas, en particular la bioestratigrafía . El sistema resultante, GeoDAISY, representa un avance tecnológico significativo. Es capaz de aprendizaje profundo , encapsulación de conocimientos, minería de datos basada en patrones y búsqueda de contenido (basada en imágenes) y puede manejar de manera eficiente conjuntos de entrenamiento que constan de millones de patrones en hardware básico utilizando una combinación de almacenamiento en caché de datos inteligente y OpenMP . Más detalles de GeoDAISY y la justificación para desarrollarlo están disponibles como documentos técnicos en la página de LinkedIn Tumbling Dice.