La publicación de datos (también publicación de datos ) es el acto de liberar datos de investigación en forma publicada para su uso por otros. Es una práctica que consiste en preparar ciertos datos o conjuntos de datos para uso público y así ponerlos a disposición de todos para que los utilicen como lo deseen. Esta práctica es una parte integral del movimiento de ciencia abierta . Existe un consenso amplio y multidisciplinario sobre los beneficios que se derivan de esta práctica. [1] [2] [3]
El objetivo principal es elevar los datos para que sean resultados de investigación de primera clase. [4] Hay una serie de iniciativas en curso, así como puntos de consenso y cuestiones aún en disputa. [5]
Hay varias formas distintas de hacer que los datos de investigación estén disponibles, que incluyen:
- Publicar datos como material complementario asociado con un artículo de investigación , generalmente con los archivos de datos alojados por el editor del artículo.
- Alojamiento de datos en un sitio web disponible públicamente, con archivos disponibles para descargar.
- alojar datos en un repositorio que se ha desarrollado para respaldar la publicación de datos, por ejemplo , figshare , Dryad , Dataverse , Zenodo . Existe una gran cantidad de repositorios de datos generales y especializados (por ejemplo, por tema de investigación). [6] Por ejemplo, el servicio de datos del Reino Unido permite a los usuarios depositar colecciones de datos y volver a compartirlas con fines de investigación.
- Publicar un artículo de datos sobre el conjunto de datos, que puede publicarse como preimpresión, en una revista o en una revista de datos dedicada a respaldar artículos de datos. Los datos pueden ser alojados por la revista o alojados por separado en un repositorio de datos.
La publicación de datos permite a los investigadores poner sus datos a disposición de otros para que los usen y permite que los conjuntos de datos se citen de manera similar a otros tipos de publicaciones de investigación (como artículos o libros), lo que permite a los productores de conjuntos de datos obtener crédito académico por su trabajo.
Las motivaciones para publicar datos pueden variar por el deseo de hacer que la investigación sea más accesible, para permitir la citabilidad de los conjuntos de datos o los mandatos de los editores o financiadores de investigaciones que requieren la publicación de datos abiertos. El Servicio de Datos del Reino Unido es una organización clave que trabaja con otras para aumentar la importancia de citar los datos correctamente y ayudar a los investigadores a hacerlo.
Soluciones para preservar la privacidad en la publicación de datos como se ha propuesto, incluidos algoritmos de protección de la privacidad, métodos de "enmascaramiento" de datos y algoritmo de cálculo del nivel de privacidad regional. [7]
Métodos para publicar datos
Archivos de datos como material complementario
Un gran número de revistas y editoriales apoyan que se adjunte material complementario a los artículos de investigación, incluidos los conjuntos de datos. Aunque históricamente dicho material podría haberse distribuido solo a pedido o en microforma a las bibliotecas, las revistas de hoy suelen albergar dicho material en línea. El material complementario está disponible para los suscriptores de la revista o, si el artículo o la revista es de acceso abierto, para todos.
Repositorios de datos
Existe una gran cantidad de repositorios de datos, tanto de temas generales como especializados. Muchos repositorios son repositorios disciplinarios , centrados en una disciplina de investigación en particular, como el Servicio de Datos del Reino Unido, que es un repositorio digital confiable de datos sociales, económicos y de humanidades. Los repositorios pueden ser gratuitos para que los investigadores carguen sus datos o pueden cobrar una tarifa única o continua por alojar los datos. Estos repositorios ofrecen una interfaz web de acceso público para buscar y explorar conjuntos de datos alojados, y pueden incluir características adicionales como un identificador de objeto digital , para la cita permanente de los datos y enlaces a artículos y códigos publicados asociados.
Documentos de datos
Los artículos de datos son “publicaciones académicas de un documento de metadatos con capacidad de búsqueda que describe un conjunto de datos en línea accesible en particular, o un grupo de conjuntos de datos, publicados de acuerdo con las prácticas académicas estándar”. [8] Su objetivo final es proporcionar “información sobre qué, dónde, por qué, cómo y quién de los datos”. [4] La intención de un documento de datos es ofrecer información descriptiva sobre los conjuntos de datos relacionados, centrándose en la recopilación de datos, las características distintivas, el acceso y la reutilización potencial, más que en el procesamiento y análisis de datos. [9] Debido a que los artículos de datos se consideran publicaciones académicas no diferentes de otros tipos de artículos, permiten a los científicos que comparten datos recibir crédito en moneda reconocible dentro del sistema académico, "haciendo que el intercambio de datos cuente". [10] Esto proporciona no solo un incentivo adicional para compartir datos, sino que también a través del proceso de revisión por pares , aumenta la calidad de los metadatos y, por lo tanto, la reutilización de los datos compartidos.
Por lo tanto, los documentos de datos representan el enfoque de comunicación académica para el intercambio de datos .
A pesar de su potencial, los documentos de datos no son la solución definitiva y completa para todos los problemas de uso compartido y reutilización de datos y, en algunos casos, se considera que inducen falsas expectativas en la comunidad investigadora. [11]
Revistas de datos
Los artículos de datos están respaldados por una amplia gama de revistas , algunas de las cuales son "puras", es decir, están dedicadas a publicar artículos de datos únicamente, mientras que otras, la mayoría, son "mixtas", es decir, publican varios tipos de artículos, incluidos datos. documentos.
Está disponible una encuesta completa sobre revistas de datos. [12] El personal de la Universidad de Edimburgo ha compilado una lista no exhaustiva de revistas de datos. [13]
Ejemplos de revistas de datos "puros" son: Earth System Science Data , Journal of Open Archaeology Data , Open Health Data , Polar Data Journal y Scientific Data .
Ejemplos de revistas "mixtas" que publican artículos de datos son: Biodiversity Data Journal , F1000Research , GigaScience , GigaByte , PLOS ONE y SpringerPlus .
Cita de datos
La citación de datos es la provisión de referencias precisas, consistentes y estandarizadas para conjuntos de datos del mismo modo que se proporcionan citas bibliográficas para otras fuentes publicadas, como artículos de investigación o monografías . Por lo general, el enfoque bien establecido del Identificador de objeto digital (DOI) se utiliza con los DOI que llevan a los usuarios a un sitio web que contiene los metadatos del conjunto de datos y el conjunto de datos en sí. [14] [15]
Ver también
- Archivo de datos
- Registro de repositorios de datos de investigación
- Repositorio disciplinario
Referencias
- ^ Costello MJ (2009). "Motivar la publicación de datos online". BioScience . 59 (5): 418–427. doi : 10.1525 / bio.2009.59.5.9 .
- ^ Smith VS (2009). "Publicación de datos: hacia una base de datos de todo" . Notas de investigación de BMC . 2 (113): 113. doi : 10.1186 / 1756-0500-2-113 . PMC 2702265 . PMID 19552813 .
- ^ Lawrence, B; Jones, C .; Matthews, B .; Pepler, S .; Callaghan, S. (2011). "Citación y revisión por pares de datos: avanzar hacia la publicación de datos formales" . Revista Internacional de Curación Digital . 6 (2): 4–37. doi : 10.2218 / ijdc.v6i2.205 .
- ^ a b Callaghan, S., Donegan, S., Pepler, S., Thorley, M., Cunningham, N., Kirsch, P., Ault, L., Bell, P., Bowie, R., Leadbetter, A., Lowry, R., Moncoiffé, G., Harrison, K., Smith-Haddon, B., Weatherby, A. y Wright, D. (2012). "Hacer de los datos un producto científico de primera clase: citación y publicación de datos por los centros de datos ambientales de NERC" . Revista Internacional de Curación Digital . 7 (1): 107-113. doi : 10.2218 / ijdc.v7i1.218 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Kratz J, Strasser C (2014). "Consensos y controversias en la publicación de datos" . F1000Research . 3 (94): 94. doi : 10.12688 / f1000research.4518 . PMC 4097345 . PMID 25075301 .
- ^ Assante, M .; Candela, L .; Castelli, D .; Tani, A. (2016). "¿Los repositorios de datos científicos están haciendo frente a la publicación de datos de investigación?" . Revista de ciencia de datos . 15 . doi : 10.5334 / dsj-2016-006 .
- ^ Zhang, Longbin; Wang, Yuxiang; Xu, Xiaoliang (agosto de 2017). "Muestreo gaussiano basado en particiones lógicas para agregación en línea" . 2017 Quinta Conferencia Internacional sobre Nube Avanzada y Big Data (CBD) . IEEE. doi : 10.1109 / cbd.2017.39 . ISBN 978-1-5386-1072-5.
- ^ Chavan, V. y Penev, L. (2011). "El documento de datos: un mecanismo para incentivar la publicación de datos en la ciencia de la biodiversidad" . BMC Bioinformática . 12 (15): S2. doi : 10.1186 / 1471-2105-12-S15-S2 . PMC 3287445 . PMID 22373175 .
- ^ Newman Paul; Corke Peter (2009). "Documentos de datos - publicación revisada por pares de conjuntos de datos de alta calidad" . Revista Internacional de Investigación en Robótica . 28 (5): 587. doi : 10.1177 / 0278364909104283 .
- ^ Gorgolewski KJ, Margulies DS, Milham MP (2013). "Hacer que el intercambio de datos cuente: una solución basada en publicaciones" . Fronteras en neurociencia . 7 : 9. doi : 10.3389 / fnins.2013.00009 . PMC 3565154 . PMID 23390412 .
- ^ Parsons, MA; Fox, Pensilvania (2013). "¿Es la publicación de datos la metáfora correcta?" . Revista de ciencia de datos . 12 : WDS31 – WDS46. doi : 10.2481 / dsj.WDS-042 .
- ^ Candela, L., Castelli, D., Manghi, P. y Tani, A. (2015). "Revistas de datos: una encuesta" . Revista de la Asociación de Ciencia y Tecnología de la Información . 66 (1): 1747-1762. doi : 10.1002 / asi.23358 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ https://www.wiki.ed.ac.uk/display/datashare/Sources+of+dataset+peer+review
- ^ Servicio Nacional de Datos de Australia: Conocimiento de citas de datos archivado el7 de marzo de 2012en la Wayback Machine (consultado el 20 de marzo de 2012)
- ↑ Ball, A., Duke, M. (2011). 'Citación y vinculación de datos'. Documentos informativos de DCC. Edimburgo: Centro de curaduría digital. Disponible en línea: http://www.dcc.ac.uk/resources/briefing-papers/