Los datos son unidades de información , a menudo numéricas, que se recopilan mediante la observación . [1] En un sentido más técnico, los datos son un conjunto de valores de variables cualitativas o cuantitativas sobre una o más personas u objetos, [1] mientras que un dato (singular de datos ) es un valor único de una sola variable. [2]
Aunque los términos "datos" e "información" a menudo se usan indistintamente, estos términos tienen significados distintos. En algunas publicaciones populares, a veces se dice que los datos se transforman en información cuando se ven en contexto o en un análisis posterior. [3] Sin embargo, en los tratamientos académicos de la asignatura, los datos son simplemente unidades de información. Los datos se utilizan en la investigación científica , la gestión empresarial (p. Ej., Datos de ventas, ingresos, beneficios, precio de las acciones ), finanzas , gobernanza (p. Ej., Tasas de delincuencia , tasas de desempleo , tasas de alfabetización ) y prácticamente en cualquier otra forma de actividad organizativa humana ( ej., censos del número de personas sin hogar por organizaciones sin fines de lucro).
Los datos se miden , recopilan , informan y analizan , y a partir de visualizaciones de datos se generan gráficos, tablas o imágenes. Los datos como concepto general se refieren al hecho de que alguna información o conocimiento existente está representado o codificado de alguna forma adecuada para un mejor uso o procesamiento . Los datos brutos ("datos sin procesar") son una colección de números o caracteres antes de que los investigadores los "limpien" y corrijan. Los datos brutos deben corregirse para eliminar valores atípicos o errores obvios de entrada de datos o instrumentos (por ejemplo, una lectura de termómetro de una ubicación al aire libre en el Ártico que registra una temperatura tropical). El procesamiento de datos ocurre comúnmente por etapas, y los "datos procesados" de una etapa pueden considerarse los "datos sin procesar" de la siguiente etapa. Los datos de campo son datos en bruto que se recopilan en un entorno " in situ " no controlado . Los datos experimentales son datos que se generan en el contexto de una investigación científica mediante la observación y el registro.
Los datos se han descrito como el nuevo petróleo de la economía digital . [4] [5]
Etimología y terminología
El primer uso en inglés de la palabra "datos" data de la década de 1640. La palabra "datos" se utilizó por primera vez para significar "información informática transmisible y almacenable" en 1946. La expresión "procesamiento de datos" se utilizó por primera vez en 1954. [6]
La palabra latina data es el plural de datum , "(cosa) dada", participio pasado neutro de atreverse "dar". [6] En inglés, la palabra data puede usarse como sustantivo plural en este sentido, y algunos escritores, generalmente aquellos que trabajan en ciencias naturales, ciencias de la vida y ciencias sociales, usan datum en singular y data en plural, especialmente en Siglo XX y en muchos casos también el XXI (por ejemplo, el estilo APA a partir de la 7ª edición todavía requiere que "datos" sea plural. [7] ). Sin embargo, en el lenguaje cotidiano y en gran parte del uso del desarrollo de software y la informática , "datos" se usa más comúnmente en singular como un sustantivo de masas (como "arena" o "lluvia"). El término big data toma el singular.
Significado
Los datos, la información , el conocimiento y la sabiduría son conceptos estrechamente relacionados, pero cada uno tiene su propio papel en relación con el otro, y cada término tiene su propio significado. Según una opinión común, los datos se recopilan y analizan; los datos solo se convierten en información apta para la toma de decisiones una vez que se han analizado de alguna manera. [8] Se puede decir que la medida en que un conjunto de datos es informativo para alguien depende de hasta qué punto es inesperado para esa persona. La cantidad de información contenida en un flujo de datos puede caracterizarse por su entropía de Shannon .
El conocimiento es la comprensión basada en una amplia experiencia en el manejo de información sobre un tema. Por ejemplo, la altura del monte Everest generalmente se considera un dato. La altura se puede medir con precisión con un altímetro e introducirse en una base de datos. Estos datos pueden incluirse en un libro junto con otros datos sobre el Monte Everest para describir la montaña de una manera útil para aquellos que deseen tomar una decisión sobre el mejor método para escalarla. Un entendimiento basado en la experiencia de escalar montañas que podría aconsejar a las personas sobre el camino para llegar a la cima del Monte Everest puede verse como "conocimiento". La escalada práctica de la cima del monte Everest basada en este conocimiento puede verse como "sabiduría". En otras palabras, la sabiduría se refiere a la aplicación práctica del conocimiento de una persona en aquellas circunstancias en las que puede resultar bueno. Así la sabiduría complementa y completa la serie "datos", "información" y "conocimiento" de conceptos cada vez más abstractos.
A menudo se supone que los datos son el concepto menos abstracto, la información el siguiente y el conocimiento el más abstracto. [9] Desde este punto de vista, los datos se convierten en información por interpretación; Por ejemplo, la altura del Monte Everest generalmente se considera "datos", un libro sobre las características geológicas del Monte Everest puede considerarse "información" y una guía para alpinistas que contiene información práctica sobre la mejor manera de llegar a la cima del Monte Everest puede considerarse "conocimiento". . "Información" tiene una diversidad de significados que van desde el uso diario hasta el uso técnico. Sin embargo, también se ha argumentado que este punto de vista invierte la forma en que los datos surgen de la información y la información del conocimiento. [10] En términos generales, el concepto de información está estrechamente relacionado con las nociones de restricción, comunicación, control, datos, forma, instrucción, conocimiento, significado, estímulo mental, patrón, percepción y representación. Beynon-Davies utiliza el concepto de signo para diferenciar entre datos e información; los datos son una serie de símbolos, mientras que la información se produce cuando los símbolos se utilizan para referirse a algo. [11] [12]
Antes del desarrollo de las máquinas y los dispositivos informáticos, la gente tenía que recopilar datos manualmente e imponerles patrones. Desde el desarrollo de dispositivos y máquinas informáticas, estos dispositivos también pueden recopilar datos. En la década de 2010, las computadoras se utilizan ampliamente en muchos campos para recopilar datos y clasificarlos o procesarlos, en disciplinas que van desde el marketing , el análisis del uso de los servicios sociales por parte de los ciudadanos hasta la investigación científica. Estos patrones en los datos se ven como información que se puede utilizar para mejorar el conocimiento. Estos patrones pueden interpretarse como " verdad " (aunque "verdad" puede ser un concepto subjetivo) y pueden ser autorizados como criterios estéticos y éticos en algunas disciplinas o culturas. Los eventos que dejan restos físicos o virtuales perceptibles se pueden rastrear a través de los datos. Las marcas ya no se consideran datos una vez que se rompe el vínculo entre la marca y la observación. [13]
Los dispositivos informáticos mecánicos se clasifican según los medios por los que representan los datos. Una computadora analógica representa un dato como voltaje, distancia, posición u otra cantidad física. Una computadora digital representa un dato como una secuencia de símbolos extraídos de un alfabeto fijo . Las computadoras digitales más comunes utilizan un alfabeto binario, es decir, un alfabeto de dos caracteres, normalmente denotados "0" y "1". A continuación, se construyen representaciones más familiares, como números o letras, a partir del alfabeto binario. Se distinguen algunas formas especiales de datos. Un programa de computadora es una colección de datos que pueden interpretarse como instrucciones. La mayoría de los lenguajes de computadora hacen una distinción entre programas y otros datos en los que operan los programas, pero en algunos lenguajes, en particular Lisp y lenguajes similares, los programas son esencialmente indistinguibles de otros datos. También es útil para distinguir metadatos , es decir, una descripción de otros datos. Un término similar pero anterior para los metadatos es "datos auxiliares". El ejemplo prototípico de metadatos es el catálogo de la biblioteca, que es una descripción del contenido de los libros.
Documentos de datos
Siempre que sea necesario registrar datos, los datos existen en forma de documentos de datos . Los tipos de documentos de datos incluyen:
- repositorio de datos
- estudio de datos
- conjunto de datos
- software
- papel de datos
- base de datos
- manual de datos
- diario de datos
Algunos de estos documentos de datos (repositorios de datos, estudios de datos, conjuntos de datos y software) están indexados en Data Citation Indexes , mientras que los artículos de datos están indexados en bases de datos bibliográficas tradicionales, por ejemplo, Science Citation Index . Ver más. [14]
Recopilación de datos
La recopilación de datos se puede lograr a través de una fuente primaria (el investigador es la primera persona en obtener los datos) o una fuente secundaria (el investigador obtiene los datos que ya han sido recopilados por otras fuentes, como los datos difundidos en una revista científica). Las metodologías de análisis de datos varían e incluyen la triangulación de datos y la filtración de datos. [15] Este último ofrece un método articulado de recopilación, clasificación y análisis de datos utilizando cinco posibles ángulos de análisis (al menos tres) con el fin de maximizar la objetividad de la investigación y permitir una comprensión de los fenómenos bajo investigación lo más completa posible: cualitativo y métodos cuantitativos, revisiones de la literatura (incluidos artículos académicos), entrevistas con expertos y simulación por computadora. A continuación, los datos se "filtran" utilizando una serie de pasos predeterminados para extraer la información más relevante.
En otros campos
Aunque los datos también se utilizan cada vez más en otros campos, se ha sugerido que su naturaleza altamente interpretativa podría estar en desacuerdo con la ética de los datos como "dados". Peter Checkland introdujo el término capta (del latín capere , “tomar”) para distinguir entre una inmensa cantidad de datos posibles y un subconjunto de ellos, a los que se orienta la atención. [16] Johanna Drucker ha argumentado que dado que las humanidades afirman que la producción de conocimiento es "situada, parcial y constitutiva", el uso de datos puede introducir supuestos que son contraproducentes, por ejemplo, que los fenómenos son discretos o independientes del observador. [17] El término capta , que enfatiza el acto de observación como constitutivo, se ofrece como una alternativa a los datos para las representaciones visuales en las humanidades.
Ver también
- Datos biologicos
- Memoria del ordenador
- Datos (Star Trek)
- Adquisición de datos
- Análisis de los datos
- Cable de datos
- Conservación de datos
- Datos oscuros
- Dominio de datos
- Elemento de datos
- Agricultura de datos
- Dato de governancia
- Integridad de los datos
- Mantenimiento de datos
- Gestión de datos
- Procesamiento de datos
- Modelado de datos
- Punto de datos
- Visualización de datos
- Procesamiento de datos informáticos
- Preservación de datos
- Publicación de datos
- Protección de Datos
- Remanencia de datos
- Ciencia de los datos
- Conjunto de datos
- Estructura de datos
- Almacén de datos
- Base de datos
- Ficha de datos
- Rescate de datos ambientales
- Trabajo de campo
- Ingeniería de Información
- Aprendizaje automático
- Información abierta
- Archivo de datos científicos
- Estadísticas
- Datos secundarios
Referencias
Este artículo se basa en material extraído del Diccionario gratuito de informática en línea antes del 1 de noviembre de 2008 e incorporado bajo los términos de "renovación de licencias" de la GFDL , versión 1.3 o posterior.
- ^ a b Glosario de términos estadísticos de la OCDE . OCDE. 2008. p. 119. ISBN 978-92-64-025561.
- ^ "Lenguaje estadístico - ¿Qué son los datos?" . Oficina de Estadísticas de Australia . 2013-07-13. Archivado desde el original el 19 de abril de 2019 . Consultado el 9 de marzo de 2020 .
- ^ "Datos vs información - diferencia y comparación | Diffen" . www.diffen.com . Consultado el 11 de diciembre de 2018 .
- ^ Yonego, Joris Toonders (23 de julio de 2014). "Los datos son el nuevo aceite de la economía digital" , a través de www.wired.com.
- ^ "Los datos son el nuevo aceite" . 16 de julio de 2018. Archivado desde el original el 16 de julio de 2018.
- ^ a b "datos | Origen y significado de los datos por Diccionario de Etimología en línea" . www.etymonline.com .
- ^ Asociación Americana de Psicología (2020). "6,11". Manual de publicación de la Asociación Americana de Psicología: la guía oficial del estilo APA . Asociacion Americana de Psicologia. ISBN 9781433832161.
- ^ "Publicación conjunta 2-0, inteligencia conjunta" (PDF) . Jefes de Estado Mayor Conjunto, Publicaciones de Doctrina Conjunta . Departamento de Defensa. 23 de octubre de 2013. págs. I-1 . Consultado el 17 de julio de 2018 .
- ^ Akash Mitra (2011). "Clasificación de datos para un modelado exitoso" .
- ^ Tuomi, Ilkka (2000). "Los datos son más que conocimientos". Revista de Sistemas de Información de Gestión . 6 (3): 103-117. doi : 10.1080 / 07421222.1999.11518258 .
- ^ P. Beynon-Davies (2002). Sistemas de información: una introducción a la informática en las organizaciones . Basingstoke, Reino Unido: Palgrave Macmillan . ISBN 0-333-96390-3.
- ^ P. Beynon-Davies (2009). Sistemas de información empresarial . Basingstoke, Reino Unido: Palgrave. ISBN 978-0-230-20368-6.
- ^ Sharon Daniel. La base de datos: una estética de la dignidad .
- ^ Schöpfel y col. 2020. "Documentos de datos". Enciclopedia ISKO de organización del conocimiento https://www.isko.org/cyclo/data_documents
- ^ Mesly, Olivier (2015). Creando modelos en la investigación psicológica. États-Unis: Springer Psychology: 126 páginas. ISBN 978-3-319-15752-8
- ^ P. Checkland y S. Holwell (1998). Información, sistemas y sistemas de información: entender el campo . Chichester, West Sussex: John Wiley & Sons. págs. 86–89. ISBN 0-471-95820-4.
- ^ Johanna Drucker (2011). "Enfoques de las humanidades a la visualización gráfica" .
enlaces externos
- Datos es un sustantivo singular (una evaluación detallada)