Datos brutos


De Wikipedia, la enciclopedia libre
  (Redirigido desde los datos primarios )
Saltar a navegación Saltar a búsqueda

Las dos columnas a la derecha de la columna más a la izquierda en esta tabla computarizada son datos sin procesar.

Los datos brutos , también conocidos como datos primarios , son datos (por ejemplo, números, lecturas de instrumentos, cifras, etc.) recopilados de una fuente. En el contexto de los exámenes, los datos brutos pueden describirse como una puntuación bruta .

Si un científico configura un termómetro computarizado que registra la temperatura de una mezcla química en un tubo de ensayo cada minuto, la lista de lecturas de temperatura para cada minuto, impresa en una hoja de cálculo o vista en una pantalla de computadora, son "datos sin procesar". Los datos sin procesar no han sido sometidos a procesamiento, "limpieza" por parte de investigadores para eliminar valores atípicos , errores obvios de lectura de instrumentos o errores de entrada de datos, o cualquier análisis (por ejemplo, determinar aspectos de tendencia central como el resultado promedio o mediano ). Además, los datos en bruto no han sido objeto de ninguna otra manipulación por parte de un programa de software o un investigador, analista o técnico humano. También se les conoce como primariosdatos. Los datos sin procesar es un término relativo (ver datos ), porque incluso una vez que un equipo de investigadores ha "limpiado" y procesado los datos sin procesar, otro equipo puede considerar estos datos procesados ​​como "datos sin procesar" para otra etapa de la investigación. Los datos brutos pueden ingresarse en un programa de computadora o usarse en procedimientos manuales como el análisis de estadísticas de una encuesta . El término "datos brutos" puede hacer referencia a los datos binarios en dispositivos de almacenamiento electrónicos, como unidades de disco duro (también denominados "datos de bajo nivel").

Generando datos

Los datos tienen dos formas de crearse o hacerse. El primero es lo que se denomina "datos capturados", [1] y se encuentra a través de una investigación o un análisis intencionados. El segundo se llama "datos de escape", [1] y lo recopilan normalmente máquinas o terminales como función secundaria. Por ejemplo, las cajas registradoras, los teléfonos inteligentes y los velocímetros cumplen una función principal, pero pueden recopilar datos como una tarea secundaria. Los datos exhaustivos suelen ser demasiado grandes o de poca utilidad para procesar y se vuelven "transitorios" o se desechan. [1]

Ejemplos de

En informática , los datos sin procesar pueden tener los siguientes atributos: posiblemente contengan errores humanos, de máquina o de instrumentos, es posible que no estén validados; puede ser en diferentes formatos de área ( coloquial ); sin codificar o sin formato; o algunas entradas pueden ser "sospechosas" (por ejemplo, valores atípicos ), que requieren confirmación o citación . Por ejemplo, una hoja de entrada de datos puede contener fechas como datos sin procesar en muchas formas: "31 de enero de 1999", "31/01/1999", "31/1/99", "31 de enero" o "hoy". Una vez capturados, estos datos sin procesar pueden procesarse y almacenarse como un formato normalizado, tal vez una fecha juliana., para que sea más fácil para las computadoras y los humanos interpretar durante el procesamiento posterior. Los datos brutos (a veces denominados coloquialmente datos de "fuentes" o datos "eggy", estos últimos una referencia a que los datos están "sin cocer", es decir, "sin procesar", como un huevo crudo ) son la entrada de datos para el procesamiento. Se hace una distinción entre datos e información , en el sentido de que la información es el producto final del procesamiento de datos . Los datos brutos que se han procesado a veces se denominan datos "cocinados" en un sentido coloquial. [ dudoso ] Aunque los datos sin procesar tienen el potencial de transformarse en "información, "la extracción, la organización, el análisis y el formateo para la presentación son necesarios antes de que los datos sin procesar se puedan transformar en información utilizable.

Por ejemplo, una terminal de punto de venta ( terminal POS, una caja registradora computarizada ) en un supermercado concurrido recopila grandes volúmenes de datos brutos todos los días sobre las compras de los clientes. Sin embargo, esta lista de artículos comestibles y sus precios y la hora y fecha de compra no proporciona mucha información hasta que se procesa. Una vez procesado y analizado por un programa de software o incluso por un investigador usando un lápiz y papel y una calculadora, estos datos brutos pueden indicar los artículos particulares que compra cada cliente, cuándo los compra ya qué precio; además, un analista o gerente podría calcular las ventas totales promedio por cliente o el gasto promedio por día de la semana por hora. Estos datos procesados ​​y analizados proporcionan información para el gerente, que el gerente podría usar para ayudarla a determinar, por ejemplo, cuántos cajeros contratar y en qué momento. Esta información podría convertirse en datos para su posterior procesamiento, por ejemplo, como parte de una campaña de marketing predictivo . Como resultado del procesamiento, los datos sin procesar a veces terminan siendo almacenados en una base de datos., que permite que los datos sin procesar sean accesibles para su posterior procesamiento y análisis de diversas formas.

Tim Berners-Lee (inventor de la World Wide Web ) sostiene que compartir datos sin procesar es importante para la sociedad. Inspirado en una publicación de Rufus Pollock de la Open Knowledge Foundation, su llamado a la acción es "Datos sin procesar ahora" , lo que significa que todos deberían exigir que los gobiernos y las empresas compartan los datos que recopilan como datos sin procesar. Señala que "los datos impulsan una gran cantidad de lo que sucede en nuestras vidas ... porque alguien toma los datos y hace algo con ellos". Para Berners-Lee, es esencialmente de este intercambio de datos brutos que surgirán los avances en la ciencia. Defensores de los datos abiertosargumentan que una vez que los ciudadanos y las organizaciones de la sociedad civil tengan acceso a los datos de las empresas y los gobiernos, los ciudadanos y las ONG podrán realizar su propio análisis de los datos, lo que puede empoderar a las personas y a la sociedad civil. Por ejemplo, un gobierno puede afirmar que sus políticas están reduciendo la tasa de desempleo , pero un grupo de defensa de la pobreza puede hacer que los econometristas de su personal hagan su propio análisis de los datos sin procesar, lo que puede llevar a este grupo a sacar conclusiones diferentes sobre los datos. colocar.

Otras lecturas

  • Dénos los datos sin procesar y dénoslos ahora : la publicación de blog de Rufus Pollock que inspiró a Tim Berners-Lee
  • Tim Berners-Lee da a la Web una nueva definición

Referencias

  1. ↑ a b c Kitchin, Rob (2014). La revolución de los datos . Estados Unidos: Sage. pag. 6.
Obtenido de " https://en.wikipedia.org/w/index.php?title=Raw_data&oldid=1048141642 "