El Proyecto GDELT , o Base de datos global de eventos, lenguaje y tono , creado por Kalev Leetaru de Yahoo! y la Universidad de Georgetown , junto con Philip Schrodt y otros, se describe a sí misma como "una iniciativa para construir un catálogo de comportamientos y creencias a escala social humana en todos los países del mundo, conectando a cada persona, organización, ubicación, recuento, tema, fuente de noticias y eventos en todo el planeta en una única red masiva que captura lo que está sucediendo en todo el mundo, cuál es su contexto y quiénes están involucrados, y cómo se siente el mundo al respecto, todos los días ". [1] [2] [3]Las primeras exploraciones que llevaron a la creación de GDELT fueron descritas por el co-creador Philip Schrodt en un documento de conferencia en enero de 2011. [4] El conjunto de datos está disponible en Google Cloud Platform . [5]
Datos
GDELT incluye datos desde 1979 hasta el presente. Los datos están disponibles como archivos zip en formato de valores separados por tabulaciones utilizando una extensión CSV para una fácil importación a Microsoft Excel o software de hoja de cálculo similar. [6] Los datos de 1979 a 2005 están disponibles en forma de un archivo zip por año, y el tamaño del archivo aumentó gradualmente de 14,3 MB en 1979 a 125,9 MB en 2005, lo que refleja el aumento en el número de medios de comunicación y la frecuencia y exhaustividad de la grabación de eventos. [7] Los archivos de datos de enero de 2006 a marzo de 2013 están disponibles con granularidad mensual, y el tamaño del archivo comprimido aumenta de 11 MB en enero de 2006 a 103,2 MB en marzo de 2013. Los archivos de datos desde el 1 de abril de 2013 en adelante están disponibles con granularidad diaria . El archivo de datos para cada fecha está disponible a las 6 a.m., hora estándar del este, del día siguiente. En junio de 2014, el tamaño del archivo comprimido diario es de aproximadamente 5 a 12 MB. [6] [7] Los archivos de datos utilizan la codificación de Observaciones de eventos de mediación y conflicto (CAMEO) para registrar eventos. [8]
En una publicación de blog para Foreign Policy , el co-creador Kalev Leetaru intentó usar los datos de GDELT para responder a la pregunta de si la Primavera Árabe provocó protestas en todo el mundo, usando el cociente del número de eventos relacionados con protestas con el número total de eventos registrados como una medida de la intensidad de la protesta para la que luego se estudió la tendencia temporal. [9] El científico político y experto en ciencia de datos / pronóstico Jay Ulfelder criticó la publicación en su blog personal, diciendo que el método de normalización de Leetaru puede no haber explicado adecuadamente el cambio en la naturaleza y composición de la cobertura de los medios. [10]
El conjunto de datos también está disponible en Google Cloud Platform y se puede acceder a él mediante Google BigQuery . [5]
Recepción
Recepción académica
GDELT se ha citado y utilizado en varios estudios académicos, como un estudio de análisis visual y predictivo de noticias de Singapur (junto con Wikipedia y el índice Straits Times ) [11] y un estudio de conflictos políticos. [12]
El problema del desafío en la Conferencia Internacional de Computación Social, Modelado y Predicción del Comportamiento (SBP) de 2014 pidió a los participantes que exploraran GDELT y lo aplicaran al análisis de redes sociales , comportamiento y predicción. [13]
Recepción en blogs y medios
GDELT se ha tratado en el sitio web del Centro de Innovación de Datos [14] , así como en el GIS Lounge. [15] También se ha discutido y criticado en blogs sobre violencia política y predicción de crisis. [10] [16] [17] El conjunto de datos ha sido citado y criticado repetidamente en Foreign Policy , [2] [18] incluso en discusiones sobre eventos políticos en Siria , [19] la Primavera Árabe , [9] [20] y Nigeria . [21] También se ha citado en New Scientist , [22] en el sitio web FiveThirtyEight [23] y en el blog de Andrew Sullivan . [24]
El blog Predictive Heuristics y otros blogs han comparado GDELT con el Sistema Integrado de Alerta Temprana de Conflictos (ICEWS). [25] [26] Alex Hanna escribió en su blog sobre su experimento de evaluación de GDELT con datos codificados a mano comparándolos con el conjunto de datos de Dynamics of Collective Action . [27]
En mayo de 2014, el blog de Google Cloud Platform anunció que todo el conjunto de datos GDELT estaría disponible como un conjunto de datos público en Google BigQuery . [5]
Ver también
- Pulso Global de las Naciones Unidas
- Sistema integrado de alerta temprana de conflictos
Referencias
- ^ "Acerca de GDELT: la base de datos global de eventos, idioma y tono" . Consultado el 2 de junio de 2014 .
- ^ a b "Mapeado: cada protesta en el planeta desde 1979" . Política exterior . Consultado el 2 de junio de 2014 .
- ^ "Base de datos global de eventos, idioma y tono" . datahub.io . Consultado el 2 de junio de 2014 .
- ^ Schrodt, Philip (20 de enero de 2011). "Producción automatizada de datos de eventos políticos de gran volumen y casi en tiempo real" (PDF) . Archivado desde el original (PDF) el 2 de julio de 2017 . Consultado el 12 de junio de 2014 .
- ^ a b c "El conjunto de datos de eventos más grande del mundo ahora está disponible públicamente en BigQuery" . Google Cloud Platform . 29 de mayo de 2014 . Consultado el 2 de junio de 2014 .
- ^ a b "Archivos de datos brutos" . Base de datos global de eventos, idioma y tono.
- ^ a b "Todos los archivos de eventos GDELT" . Consultado el 12 de junio de 2014 .
- ^ "Documentación" . Base de datos global de eventos, idioma y tono.
- ^ a b Leetaru, Kalev (29 de mayo de 2014). "¿Realmente la Primavera Árabe provocó una ola de protestas globales? Puede parecer que el mundo se está agitando ahora, pero la década de 1980 fue mucho peor" . Política exterior . Consultado el 2 de junio de 2014 .
- ^ a b Ulfelder, Jay (6 de junio de 2014). "Otra nota sobre las limitaciones de los datos de eventos" . Consultado el 12 de junio de 2014 .
- ^ Phua, Clifton; Feng, Yuzhang; Ji, Junyao; Entonces, Timothy. "Análisis visual y predictivo en noticias de Singapur: experimentos en GDELT, Wikipedia y ^ STI". arXiv : 1404.1996 .
- ^ Yonamine, James E. "Un estudio matizado del conflicto político utilizando el conjunto de datos Global Datasets of Events Location and Tone (GDELT)" . Consultado el 2 de junio de 2014 .
- ^ "Gran desafío SBP 2014: explore GDELT, base de datos global de eventos, idioma y tono" . Consultado el 2 de junio de 2014 .
- ^ "Creación de una base de datos global en tiempo real de eventos, personas y lugares en las noticias" . Centro de Innovación de Datos . 15 de diciembre de 2013 . Consultado el 2 de junio de 2014 .
- ^ Caitlin Dempsey Morais (5 de septiembre de 2013). "Mapeo de eventos globales desde 1979" . Salón GIS . Consultado el 2 de junio de 2014 .
- ^ "Lloviendo en el desfile: algunas precauciones con respecto a la base de datos global de eventos, idioma y conjunto de datos de tono" . Violencia política de un vistazo. 20 de febrero de 2014 . Consultado el 2 de junio de 2014 .
- ^ Jongman, Berto (5 de enero de 2014). "Base de datos global de eventos, lenguaje y tono (GDELT) - ¿Big Data (antiguo) para ver crisis (nuevas)?" . Blog de inteligencia pública . Consultado el 2 de junio de 2014 .
- ^ Keating, Joshua (10 de abril de 2013). "¿Qué podemos aprender de los últimos 200 millones de cosas que sucedieron en el mundo?" . Política exterior . Archivado desde el original el 6 de junio de 2014 . Consultado el 2 de junio de 2014 .
- ^ Keating, Joshua (9 de julio de 2013). "¿Qué tan bien sigue GDELT los acontecimientos en Siria?" . Política exterior . Archivado desde el original el 6 de junio de 2014 . Consultado el 2 de junio de 2014 .
- ^ Steinert-Threlkeld, Zachary (27 de septiembre de 2013). "La Primavera Árabe y GDELT" . Consultado el 18 de junio de 2014 .
- ^ Leetaru, Kalev (13 de marzo de 2014). "Mapeo de la violencia y las protestas en Nigeria: cómo Big Data puede encontrar la gran historia" . Política exterior . Consultado el 2 de junio de 2014 .
- ^ Heaven, Douglas (13 de mayo de 2013). "La base de datos de eventos más grande del mundo podría predecir conflictos" . Nuevo científico . Consultado el 2 de junio de 2014 .
- ^ Chalabi, Mona (6 de mayo de 2014). "El secuestro de niñas en Nigeria es parte de un problema que empeora (actualizado)" . FiveThirtyEight . Consultado el 2 de junio de 2014 .
- ^ Sullivan, Andrew (30 de mayo de 2014). "No el levantamiento global de tu padre" . Consultado el 2 de junio de 2014 .
- ^ mdwardlab (17 de octubre de 2013). "GDELT e ICEWS, una pequeña comparación" . Heurística predictiva. Archivado desde el original el 17 de julio de 2014 . Consultado el 18 de junio de 2014 .
- ^ Beieler, John (28 de octubre de 2013). "Ruido en GDELT" . Consultado el 21 de junio de 2014 .
- ^ Hanna, Alex (24 de febrero de 2014). "Evaluación de GDELT con datos de protesta codificados a mano" . Mala arpillera . Consultado el 21 de junio de 2014 .
enlaces externos
- Página web oficial