La informática de la biodiversidad es la aplicación de técnicas informáticas a la información de la biodiversidad , como taxonomía , biogeografía o ecología . Las técnicas informáticas modernas pueden generar nuevas formas de ver y analizar la información existente, así como de predecir situaciones futuras (consulte el modelo de nicho ). La informática de la biodiversidad es un término que solo se acuñó alrededor de 1992, pero con conjuntos de datos en rápido aumento se ha vuelto útil en numerosos estudios y aplicaciones, como la construcción de bases de datos taxonómicas o sistemas de información geográfica . La informática de la biodiversidad contrasta con la " bioinformática", que a menudo se usa como sinónimo de manejo computarizado de datos en el área especializada de biología molecular .
Descripción general
La informática de la biodiversidad (diferente pero vinculada a la bioinformática) es la aplicación de métodos de tecnología de la información a los problemas de organización, acceso, visualización y análisis de datos primarios de biodiversidad. Los datos primarios de biodiversidad se componen de nombres, observaciones y registros de especímenes, y datos genéticos y morfológicos asociados a un espécimen. La informática de la biodiversidad también puede tener que lidiar con la gestión de información de taxones no identificados, como la producida por muestreo ambiental y secuenciación de muestras de campos mixtos. El término informática de la biodiversidad también se utiliza para cubrir los problemas computacionales específicos de los nombres de entidades biológicas, como el desarrollo de algoritmos para hacer frente a las representaciones variantes de identificadores como los nombres de especies y las autoridades, y los múltiples esquemas de clasificación dentro de los cuales estas entidades pueden residir de acuerdo con las preferencias de los diferentes trabajadores en el campo, así como la sintaxis y la semántica mediante las cuales el contenido de las bases de datos taxonómicas puede hacerse consultable e interoperable por máquina para fines de informática de la biodiversidad ...
Historia de la disciplina
Se puede considerar que la informática de la biodiversidad comenzó con la construcción de las primeras bases de datos taxonómicas computarizadas a principios de la década de 1970, y progresó a través del desarrollo posterior de herramientas de búsqueda distribuidas hacia fines de la década de 1990, incluido el analista de especies de la Universidad de Kansas, la Red de Información de Biodiversidad de América del Norte NABIN. , CONABIO en México, INBio en Costa Rica, y otros, [1] el establecimiento de la Facilidad Global de Información sobre Biodiversidad en 2001, y el desarrollo paralelo de una variedad de modelos de nichos y otras herramientas para operar con datos de biodiversidad digitalizados desde mediados de 1980 en adelante (por ejemplo, ver [2] ). En septiembre de 2000, la revista estadounidense Science dedicó un número especial a "Bioinformatics for Biodiversity", [3] la revista Biodiversity Informatics comenzó a publicarse en 2004, y varias conferencias internacionales durante la década de 2000 han reunido a profesionales de la informática de la biodiversidad, incluido el London e- Conferencia de la biosfera en junio de 2009. Un suplemento de la revista BMC Bioinformatics (Volumen 10 Supl. 14 [4] ) publicado en noviembre de 2009 también se ocupa de la informática de la biodiversidad.
Historia del término
Según la correspondencia reproducida por Walter Berendsohn, [5] el término "Informática de la biodiversidad" fue acuñado por John Whiting en 1992 para cubrir las actividades de una entidad conocida como el Consorcio Canadiense de Informática de la Biodiversidad, un grupo involucrado en la fusión de información básica sobre biodiversidad con la economía ambiental. e información geoespacial en forma de GPS y GIS . Posteriormente, parece haber perdido toda conexión obligada con el mundo GPS / GIS y estar asociado con la gestión computarizada de cualquier aspecto de la información sobre biodiversidad (por ejemplo, ver [6] ).
Taxonomía digital (sistemática)
Lista global de todas las especies
Un problema importante para la informática de la biodiversidad a escala global es la ausencia actual de una lista maestra completa de las especies reconocidas actualmente en el mundo , aunque este es un objetivo del proyecto Catalog of Life que tiene ca. 1,65 millones de especies de un estimado de 1,9 millones de especies descritas en su Lista de verificación anual de 2016 . Un esfuerzo similar para taxones fósiles, la Paleobiology Database [7] documenta más de 100.000 nombres de especies fósiles, de un número total desconocido.
Nombres científicos de género y especie como identificadores únicos
La aplicación del sistema linneo de nomenclatura binomial para especies y uninomios para géneros y rangos superiores ha generado muchas ventajas, pero también problemas con los homónimos (el mismo nombre se usa para múltiples taxones, ya sea inadvertidamente o legítimamente en múltiples reinos), sinónimos ( múltiples nombres para el mismo taxón), así como representaciones variantes del mismo nombre debido a diferencias ortográficas, errores de ortografía menores, variación en la forma de citar los nombres y fechas de los autores, y más. Además, los nombres pueden cambiar con el tiempo debido al cambio de opiniones taxonómicas (por ejemplo, la ubicación genérica correcta de una especie, o la elevación de una subespecie al rango de especie o viceversa), y también la circunscripción de un taxón puede cambiar según a los conceptos taxonómicos de diferentes autores. Una solución propuesta a este problema es el uso de Identificadores de Ciencias de la Vida ( LSID ) para fines de comunicación máquina-máquina, aunque hay tanto defensores como opositores de este enfoque.
Una clasificación consensuada de organismos.
Los organismos pueden clasificarse de múltiples formas (ver página principal Clasificación biológica ), lo que puede crear problemas de diseño para los sistemas de Informática de la Biodiversidad destinados a incorporar una clasificación única o múltiple para satisfacer las necesidades de los usuarios, o para orientarlos hacia una única " sistema preferido ". Si se puede lograr un sistema de clasificación de consenso único es probablemente una pregunta abierta, sin embargo, el Catálogo de la vida ha encargado una actividad en esta área [8] que ha sido reemplazada por un sistema publicado propuesto en 2015 por M. Ruggiero y colaboradores. [9]
Movilizar información primaria sobre biodiversidad
La información "primaria" sobre biodiversidad puede considerarse la información básica sobre la presencia y diversidad de especies (o de hecho, cualquier taxón reconocible), comúnmente en asociación con información sobre su distribución en el espacio, el tiempo o ambos. Dicha información puede estar en forma de especímenes retenidos e información asociada, por ejemplo, reunida en las colecciones de historia natural de museos y herbarios , o como registros de observación, por ejemplo, de estudios formales de fauna o florística realizados por biólogos profesionales y estudiantes, o como aficionados y otras observaciones planificadas o no planificadas, incluidas las que están cada vez más bajo el alcance de la ciencia ciudadana . Brindar acceso digital coherente y en línea a esta vasta colección de datos primarios dispares es una función central de la Informática de la Biodiversidad que está en el corazón de las redes de datos de biodiversidad regionales y globales, ejemplos de estas últimas incluyen OBIS y GBIF .
Como fuente secundaria de datos de biodiversidad, la literatura científica relevante puede ser analizada por humanos o (potencialmente) por algoritmos especializados de recuperación de información para extraer la información de biodiversidad primaria relevante que se reporta allí, a veces en forma agregada / resumida pero frecuentemente como observaciones primarias en forma narrativa o tabular. Los elementos de dicha actividad (como la extracción de identificadores taxonómicos clave, palabras clave / términos de índice , etc.) se han practicado durante muchos años a un nivel superior mediante determinadas bases de datos académicas y motores de búsqueda . Sin embargo, para obtener el máximo valor de la Informática de la biodiversidad, lo ideal sería recuperar los datos de ocurrencia primaria reales y luego estar disponibles en una forma o formas estandarizadas; por ejemplo, los proyectos Plazi e INOTAXA están transformando la literatura taxonómica en formatos XML que luego pueden ser leídos por las aplicaciones cliente, el primero usando TaxonX-XML y el segundo usando el formato taXMLit. La Biblioteca del Patrimonio de la Biodiversidad también está logrando un progreso significativo en su objetivo de digitalizar porciones sustanciales de la literatura taxonómica sin derechos de autor, que luego se somete a reconocimiento óptico de caracteres (OCR) para poder procesarla con herramientas informáticas de la biodiversidad.
Estándares y protocolos
Al igual que otras disciplinas relacionadas con los datos, la informática de la biodiversidad se beneficia de la adopción de estándares y protocolos apropiados para respaldar la transmisión máquina-máquina y la interoperabilidad de la información dentro de su dominio particular. Ejemplos de estándares relevantes incluyen el esquema Darwin Core XML para datos de biodiversidad basados en muestras y observaciones desarrollado a partir de 1998, más extensiones del mismo, Esquema de transferencia de conceptos taxonómicos , más estándares para datos descriptivos estructurados y acceso a datos de recopilación biológica (ABCD). ; mientras que los protocolos de recuperación y transferencia de datos incluyen DiGIR (ahora reemplazado en su mayoría) y TAPIR (Protocolo de acceso TDWG para recuperación de información). Muchos de estos estándares y protocolos se mantienen actualmente y su desarrollo está supervisado por los Estándares de Información sobre Biodiversidad (TDWG) .
Actividades actuales
En la conferencia e-Biosphere de 2009 en el Reino Unido, [10] se adoptaron los siguientes temas, lo cual es indicativo de una amplia gama de actividades actuales de Informática de la Biodiversidad y cómo podrían categorizarse:
- Aplicación: Conservación / Agricultura / Pesca / Industria / Silvicultura
- Aplicación: Especies exóticas invasoras
- Aplicación: Biología Sistemática y Evolutiva
- Aplicación: Taxonomía y sistemas de identificación
- Nuevas herramientas, servicios y estándares para la gestión y el acceso de datos
- Nuevas herramientas de modelado
- Nuevas herramientas para la integración de datos
- Nuevos enfoques para la infraestructura de la biodiversidad
- Nuevos enfoques para la identificación de especies
- Nuevos enfoques para cartografiar la biodiversidad
- Bases de datos y redes nacionales y regionales sobre diversidad biológica
Un taller posterior a la conferencia de personas clave con roles importantes en la informática de la biodiversidad en la actualidad también resultó en una Resolución del taller que enfatizó, entre otros aspectos, la necesidad de crear registros globales duraderos para los recursos que son básicos para la informática de la biodiversidad (por ejemplo, repositorios, colecciones ); completar la construcción de una sólida infraestructura taxonómica; y crear ontologías para datos de biodiversidad.
Proyectos de ejemplo
Global:
- El Servicio de Información sobre Biodiversidad Global (GBIF) y el Sistema de Información Biogeográfica Oceánica (OBIS) (para especies marinas)
- Las Especies 2000 , ITIS (Sistema Integrado de Información Taxonómica) y Catálogo de la Vida proyectos
- Nombres globales
- EOL , proyecto The Encyclopedia of Life
- El Consorcio para el Código de Barras de la Vida proyecto
- El proyecto Mapa de la vida
- El proyecto de la base de datos de reptiles
- El proyecto AmphibiaWeb
- El indexador y organizador biológico universal uBio , del Laboratorio de Biología Marina Woods Hole
- El índice de nombres de organismos (ION) de Clarivate Analytics, que proporciona acceso a los nombres científicos de taxones de numerosas revistas indexadas en el Zoological Record.
- El Registro Provisional de la Marina y no marino Genera (IRMNG)
- ZooBank , el registro de actos nomenclaturales y literatura sistemática relevante en zoología
- El Index Nominum Genericorum , compilación de nombres genéricos publicados para organismos cubiertos por el Código Internacional de Nomenclatura Botánica , mantenido en el Smithsonian Institution en los EE. UU.
- El índice internacional de nombres de plantas
- MycoBank , documentando nuevos nombres y combinaciones de hongos
- La Lista de nombres procarióticos con posición en la nomenclatura ( LPSN ) - Registro oficial de nombres válidos para bacterias y arqueas , según se rige por el Código internacional de nomenclatura de bacterias.
- El proyecto de la Biblioteca del Patrimonio de la Biodiversidad
- Wikispecies , compilación de código abierto (editable por la comunidad) de información taxonómica, proyecto complementario de Wikipedia
- TaxonConcept.org , un proyecto de datos vinculados que conecta bases de datos de especies dispares
- Instituto de Ciencias Naturales . Universidad Nacional de Colombia. Unidad de Colecciones Virtuales e Informática de la Biodiversidad
- ANTABIF . El Servicio de Información sobre Biodiversidad Antártica brinda acceso libre y abierto a los datos sobre Biodiversidad Antártica, en el espíritu del Tratado Antártico.
- Genesys (sitio web) , base de datos de recursos fitogenéticos mantenida en bancos de genes nacionales, regionales e internacionales
- VertNet , acceso a datos de presencia primaria de vertebrados de conjuntos de datos en todo el mundo.
Proyectos regionales / nacionales:
- Fauna Europaea
- Atlas de Australia Viviente
- Infraestructura paneuropea de directorios de especies (PESI)
- Symbiota
- iDigBio , Biocolecciones digitalizadas integradas (EE. UU.)
- Proyecto i4Life
- Sistema de Información sobre Biodiversidad de Colombia
- Portal de biodiversidad de India (IBP)
- Portal de biodiversidad de Bután (BBP)
- Identificación y conocimiento de malezas en el Océano Índico occidental (WIKWIO)
- LifeWatch es propuesto por ESFRI como una infraestructura de investigación (e) paneuropea para apoyar la investigación y la formulación de políticas sobre biodiversidad.
Se puede encontrar una lista de más de 600 actividades actuales relacionadas con la informática de la biodiversidad en la base de datos "Proyectos de información sobre biodiversidad del mundo" del TDWG .
Ver también
- Biodiversidad global
- Base de datos taxonómica
- Taxonomía basada en web
- Lista de bases de datos de biodiversidad
Referencias
- ^ Krishtalka L, Humphrey PS (2000). "¿Pueden los museos de historia natural capturar el futuro?" . BioScience . 50 (7): 611–617. doi : 10.1641 / 0006-3568 (2000) 050 [0611: CNHMCT] 2.0.CO; 2 .
- ^ Peterson AT, Vieglais D (2001). "Predecir las invasiones de especies mediante el modelado de nichos ecológicos: nuevos enfoques de la bioinformática atacan un problema urgente" (PDF) . BioScience . 51 (5): 363–371. doi : 10.1641 / 0006-3568 (2001) 051 [0363: PSIUEN] 2.0.CO; 2 .
- ^ "¿Bioinformática para la biodiversidad?" . Ciencia . 289 : 2229–2440. 2000.
- ^ "Informática de la biodiversidad" . BMC Bioinformática . 10 Suppl 14. 2009. Archivado desde el original el 27 de enero de 2010 . Consultado el 15 de noviembre de 2009 .
- ^ " " Informática de la biodiversidad ", el término" . Consultado el 6 de agosto de 2009 .
- ^ Bisby FA; et al. (2000). "La revolución silenciosa: informática de la biodiversidad e Internet". Ciencia . 289 (5488): 2309–2312. Código Bibliográfico : 2000Sci ... 289.2309B . doi : 10.1126 / science.289.5488.2309 . PMID 11009408 . S2CID 31852825 .
- ^ "la base de datos de paleobiología" . Consultado el 6 de agosto de 2009 .
- ^ "Hacia una jerarquía de gestión (clasificación) para el Catálogo de la vida. Borrador de documento de discusión por el Dr. Dennis P. Gordon, mayo de 2009" . Archivado desde el original el 8 de agosto de 2009 . Consultado el 6 de agosto de 2009 .
- ^ Ruggiero, MA; Gordon, DP; Orrell, TM; Bailly, N .; Bourgoin, T .; Brusca, RC; et al. (2015). "Una clasificación de nivel superior de todos los organismos vivos" . PLOS ONE . 10 (4): e0119248. Código bibliográfico : 2015PLoSO..1019248R . doi : 10.1371 / journal.pone.0119248 . PMC 4418965 . PMID 25923521 .
- ^ http://www.e-biosphere09.org/
Otras lecturas
- Grupo de Trabajo del Foro de Megasciencia de la OCDE sobre Informática Biológica (1999). Informe final del Grupo de trabajo del Foro de megaciencia de la OCDE sobre informática biológica, enero de 1999 . págs. 1-74. Archivado desde el original el 5 de marzo de 2009 . Consultado el 21 de marzo de 2018 .
- Canhos, vicepresidente; Souza, S .; Giovanni, R. y Canhos, DAL (2004). "Informática de la biodiversidad global: preparando el escenario para un" nuevo mundo "de modelado ecológico" . Informática de la biodiversidad . 1 : 1-13. doi : 10.17161 / bi.v1i0.3 .
- Soberón, J. y Peterson, AT (2004). "Informática de la biodiversidad: gestión y aplicación de datos primarios de biodiversidad" . Phil. Trans. R. Soc. Lond . B359 (1444): 689–698. doi : 10.1098 / rstb.2003.1439 . PMC 1693343 . PMID 15253354 .[ enlace muerto permanente ]
- Chapman, AD (2005). Usos de los datos primarios de ocurrencia de especies (PDF) . Copenhague: Mecanismo de información sobre diversidad biológica mundial. págs. 1-106. Archivado desde el original (PDF) el 16 de febrero de 2010 . Consultado el 12 de agosto de 2009 .
- Johnson, NF (2007). "Informática de la biodiversidad". Revisión anual de entomología . 52 : 421–438. doi : 10.1146 / annurev.ento.52.110405.091259 . PMID 16956323 .
- Sarkar, IN (2007). "Informática de la biodiversidad: organizar y vincular información en todo el espectro de la vida" . Sesiones informativas en bioinformática . 8 (5): 347–357. doi : 10.1093 / bib / bbm037 . PMID 17704120 .
- Guralnick, RP; Hill, A (2009). "Informática de la biodiversidad: enfoques automatizados para documentar los patrones y procesos de la biodiversidad global" . Bioinformática . 25 (4): 421–428. doi : 10.1093 / bioinformatics / btn659 . PMID 19129210 .
enlaces externos
- Informática de la biodiversidad (revista)
- Sitio web de la Conferencia Internacional e-Biosphere de Informática de la Biodiversidad de 2009