La explosión de información es el rápido aumento en la cantidad de información o datos publicados y los efectos de esta abundancia. [1] A medida que aumenta la cantidad de datos disponibles, el problema de administrar la información se vuelve más difícil, lo que puede llevar a una sobrecarga de información . The Online Oxford English Dictionary indica el uso de la frase en un artículo del New Statesman de marzo de 1964 . [2] El New York Times utilizó por primera vez la frase en su contenido editorial en un artículo de Walter Sullivan el 7 de junio de 1964, en el que describió la frase como "muy discutida". (p11.) [3] El primer uso de la frase parece haber sido en un suplemento publicitario de IBM del New York Times publicado el 30 de abril de 1961, [4] y por Frank Fremont-Smith, Director del Programa de la Conferencia Interdisciplinaria del Instituto Americano de Ciencias Biológicas, en un artículo de abril de 1961 en el AIBS Bulletin (p18.) [5]
Muchos sectores están viendo este rápido aumento en la cantidad de información disponible, como atención médica, supermercados e incluso gobiernos con información de certificados de nacimiento y registros de vacunación. [6] Otro sector que está siendo afectado por este fenómeno es el periodismo. Tal profesión, que en el pasado era responsable de la difusión de información, puede ser suprimida por la sobreabundancia de información actual. [7]
Las técnicas para recopilar conocimientos a partir de una sobreabundancia de información electrónica (por ejemplo, la fusión de datos puede ayudar en la minería de datos ) han existido desde la década de 1970. Otra técnica común para manejar tal cantidad de información es la investigación cualitativa . [8] Estos enfoques tienen como objetivo organizar la información, sintetizando, categorizando y sistematizando para que sea más utilizable y más fácil de buscar.
Patrones de crecimiento
- La capacidad tecnológica mundial para almacenar información creció de 2,6 (óptimamente comprimidos) exabytes en 1986 a 15,8 en 1993, más de 54,5 en 2000 y a 295 (óptimamente comprimidos) exabytes en 2007. Esto equivale a menos de un CD de 730 MB. ROM por persona en 1986 (539 MB por persona), aproximadamente 4 CD-ROM por persona en 1993, 12 CD-ROM por persona en el año 2000 y casi 61 CD-ROM por persona en 2007. Sumando los 404 mil millones imaginados El CD-ROM de 2007 crearía una pila de la Tierra a la Luna y una cuarta parte de esta distancia más allá (con un grosor de 1,2 mm por CD). [9]
- La capacidad tecnológica mundial para recibir información a través de redes de transmisión unidireccionales fue de 432 exabytes de información (comprimida de forma óptima) en 1986, 715 exabytes (comprimida de forma óptima) en 1993, 1.200 exabytes (comprimidos de forma óptima) en 2000 y 1.900 en 2007. [9 ]
- La capacidad efectiva mundial para intercambiar información a través de redes de telecomunicaciones bidireccionales fue de 0,281 exabytes de información (comprimida de forma óptima) en 1986, 0,471 en 1993, 2,2 en 2000 y 65 exabytes (comprimidos de forma óptima) en 2007. [9]
Una nueva métrica que se está utilizando en un intento de caracterizar el crecimiento de la información específica de la persona es el almacenamiento en disco por persona (DSP), que se mide en megabytes / persona (donde megabytes son 10 6 bytes y se abrevia MB). Global DSP (GDSP) es el espacio total de la unidad de disco rígido (en MB) de las unidades nuevas vendidas en un año dividido por la población mundial en ese año. La métrica GDSP es una medida burda de cuánto almacenamiento en disco podría usarse para recopilar datos específicos de personas sobre la población mundial. [6] En 1983, se vendieron en todo el mundo un millón de unidades fijas con un total estimado de 90 terabytes ; Las unidades de 30 MB tenían el segmento de mercado más grande. [10] En 1996, se vendieron 105 millones de unidades, por un total de 160.623 terabytes, con unidades de 1 y 2 gigabytes líderes en la industria. [11] Para el año 2000, con la unidad de 20GB como líder en la industria, se proyecta que las unidades rígidas vendidas durante el año totalicen 2.829.288 terabytes Las ventas de unidades de disco rígido superen los $ 34 mil millones en 1997.
Según Latanya Sweeney , existen tres tendencias en la recopilación de datos en la actualidad:
Tipo 1. Ampliación del número de campos que se recopilan, conocida como tendencia de “recopilar más”.
Tipo 2. Reemplazar una recopilación de datos agregados existente por una de personas específicas, conocida como la tendencia de “recopilar específicamente”.
Tipo 3. Recopile información iniciando una nueva recopilación de datos específicos de la persona, conocida como la tendencia "recopílala si puedes". [6]
Términos relacionados
Dado que "información" en los medios electrónicos se utiliza a menudo como sinónimo de "datos", el término explosión de información está estrechamente relacionado con el concepto de inundación de datos (también denominado diluvio de datos ). A veces también se utiliza el término inundación de información . Todos estos básicamente se reducen a la cantidad cada vez mayor de datos electrónicos intercambiados por unidad de tiempo. La conciencia sobre cantidades de datos no manejables creció junto con el advenimiento de un procesamiento de datos cada vez más poderoso desde mediados de la década de 1960. [12]
Desafíos
Aunque la abundancia de información puede ser beneficiosa en varios niveles, algunos problemas pueden ser motivo de preocupación, como la privacidad , las pautas legales y éticas, el filtrado y la precisión de los datos. [13] El filtrado se refiere a encontrar información útil en medio de tantos datos, lo que se relaciona con el trabajo de los científicos de datos. Un ejemplo típico de una necesidad de filtrado de datos ( minería de datos ) es en la salud ya que en los próximos años se debe tener disponibles EHR ( Registros Electrónicos de Salud ) de los pacientes. Con tanta información disponible, los médicos deberán poder identificar patrones y seleccionar datos importantes para el diagnóstico del paciente. [13] Por otro lado, según algunos expertos, tener tantos datos públicos disponibles hace que sea difícil proporcionar datos que en realidad sean anónimos. [6] Otro punto a tener en cuenta son las pautas legales y éticas, que se refieren a quién será el titular de los datos y con qué frecuencia está obligado a darlos a conocer y por cuánto tiempo. [13] Con tantas fuentes de datos, otro problema será su precisión. Una fuente que no es de confianza puede ser cuestionada por otras, al ordenar un nuevo conjunto de datos, provocando una repetición en la información. [13] Según Edward Huth, otra preocupación es la accesibilidad y el costo de dicha información. [14] La tasa de accesibilidad podría mejorarse reduciendo los costos o aumentando la utilidad de la información. La reducción de costos según el autor, podría ser realizada por asociaciones, que deberían evaluar qué información es relevante y recopilarla de una manera más organizada.
Servidores web
En agosto de 2005, había más de 70 millones de servidores web . [15] A septiembre de 2007[actualizar]había más de 135 millones de servidores web. [dieciséis]
Blogs
Según Technorati , el número de blogs se duplica aproximadamente cada 6 meses con un total de 35,3 millones de blogs en abril de 2006.[árbitro]. [17] Este es un ejemplo de las primeras etapas del crecimiento logístico , donde el crecimiento es aproximadamente exponencial , ya que los blogs son una innovación reciente. A medida que el número de blogs se acerca al número de posibles productores (humanos), se produce la saturación, el crecimiento disminuye y el número de blogs finalmente se estabiliza.
Ver también
- Big data
- Maldición de dimensionalidad
- Procesamiento de datos
- Ecologismo de la información
- Sociedad de información
- Edad de información
- Sistema de filtrado de información
- Ley de metcalfe
- Neuroenhancement
- Segunda mitad del tablero de ajedrez
Referencias
- ^ Hilbert, M. (2015). Explosión de información global: https://www.youtube.com/watch?v=8-AqzPe_gNs&list=PLtjBSCvWCU3rNm46D3R85efM0hrzjuAIg . Tecnología digital y cambio social [Curso abierto en línea en la Universidad de California] disponible gratuitamente en: https://canvas.instructure.com/courses/949415
- ^ "Información". http://dictionary.oed.com . consultado el 4 de enero de 2008
- ^ https://www.nytimes.com/1964/06/07/us-will-remove-reactor-in-arctic.html?_r=0
- ^ http://www-03.ibm.com/ibm/history/ibm100/us/en/icons/translation/
- ^ Davis, Keith (1973). "El caso a favor y en contra de la asunción empresarial de responsabilidades sociales". Revista de la Academia de Administración . 16 (2): 312–322. doi : 10.2307 / 255331 . JSTOR 255331 .
- ^ a b c d Sweeney, Latanya. "Explosión de información". Confidencialidad, divulgación y acceso a datos: teoría y aplicaciones prácticas para agencias de estadística (2001): 43-74.
- ^ Fuller, Jack. Qué está pasando con las noticias: La explosión de la información y la crisis del periodismo. Prensa de la Universidad de Chicago, 2010.
- ^ Mayor, Claire Howell y Maggi Savin-Baden. Una introducción a la síntesis de la investigación cualitativa: Gestión de la explosión de información en la investigación en ciencias sociales. Routledge, 2010.
- ^ a b c "El Womartinhilbert.net/WorldInfoCapacity.html" acceso gratuito al estudio " y " animación de vídeo " .
- ^ Informe de disco / tendencia 1983, "Computer Week". Mountain View, CA. (46) 11/11/83.
- ^ Las ventas de unidades de disco rígidas superaron los $ 34 mil millones en 1997 ”, Disk / Trend News. Mountain View, CA: Disk / Trend, Inc., 1997.
- ^ Visor de Google Books Ngram para los términos mencionados aquí
- ^ a b c d Berner, Eta S. y Jacqueline Moss. "Desafíos informáticos para la inminente explosión de la información del paciente". Revista de la Asociación Estadounidense de Informática Médica 12.6 (2005): 614-617.
- ^ Huth, Edward J. "La explosión de la información". Boletín de la Academia de Medicina de Nueva York 65.6 (1989): 647.
- ^ Robert H Zakon (15 de diciembre de 2010). "Línea de tiempo de Internet de Hobbes 10.1" . zakon.org . Consultado el 27 de agosto de 2011 .
- ^ "Encuesta de servidores web de agosto de 2011" . netcraft.com. Agosto de 2011 . Consultado el 27 de agosto de 2011 .
- ^ "Estado de la blogosfera, abril de 2006, parte 1: sobre el crecimiento de la blogosfera" . Alertas de Sifry (sifry.com). 17 de abril de 2006. Archivado desde el original el 9 de enero de 2013 . Consultado el 27 de agosto de 2011 .
enlaces externos
- Conceptualización de los sistemas de información y la sostenibilidad cognitiva en las economías de la 'atención' del siglo XXI (incluye el plan de estudios)
- ¿Cuánta información? 2003
- Sobrevivir a la explosión de la información: cómo las personas encuentran su información electrónica [1]
- Por qué la explosión de información puede ser perjudicial para la minería de datos y cómo la fusión de datos ofrece una salida [2]
- Explosión de información, bases de datos más grandes