De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
Datos de Evolución de la gripe de Google, Sudáfrica

Google Flu Trends ( GFT ) era un servicio web operado por Google . Proporcionó estimaciones de la actividad de la influenza para más de 25 países. Al agregar las consultas de búsqueda de Google , intentó hacer predicciones precisas sobre la actividad de la gripe. Este proyecto fue lanzado por primera vez en 2008 por Google.org para ayudar a predecir los brotes de gripe. [1]

Tendencias de la gripe de Google dejó de publicar estimaciones actuales el 9 de agosto de 2015. Las estimaciones históricas aún están disponibles para descargar y los datos actuales se ofrecen con fines de investigación declarados. [2]

Historia [ editar ]

La idea detrás de Google Flu Trends era que, al monitorear los comportamientos de seguimiento de la salud de millones de usuarios en línea, la gran cantidad de consultas de búsqueda de Google recopiladas se puede analizar para revelar si existe la presencia de una enfermedad similar a la gripe en una población. Google Flu Trends comparó estos hallazgos con un nivel de referencia histórico de actividad de la influenza para su región correspondiente y luego informa el nivel de actividad como mínimo, bajo, moderado, alto o intenso. Estas estimaciones han sido generalmente consistentes con los datos de vigilancia convencionales recopilados por las agencias de salud, tanto a nivel nacional como regional.

Roni Zeiger ayudó a desarrollar Tendencias de la gripe de Google. [3]

Métodos [ editar ]

Tendencias de la gripe de Google se describió como el uso del siguiente método para recopilar información sobre las tendencias de la gripe. [4] [5]

Primero, se calcula una serie de tiempo para aproximadamente 50 millones de consultas comunes ingresadas semanalmente en los Estados Unidos desde 2003 a 2008. La serie de tiempo de una consulta se calcula por separado para cada estado y se normaliza en una fracción dividiendo el número de cada consulta por el número de todas las consultas en ese estado. Al identificar la dirección IP asociada con cada búsqueda, se puede determinar el estado en el que se ingresó esta consulta.

Se utiliza un modelo lineal para calcular las probabilidades logarítmicas de la visita al médico de una enfermedad similar a la influenza (ETI) y las probabilidades logarítmicas de la consulta de búsqueda relacionada con la ETI:

P es el porcentaje de visitas al médico por ILI y Q es la fracción de consulta relacionada con ILI calculada en los pasos anteriores. β 0 es la intersección y β 1 es el coeficiente, mientras que ε es el término de error.

Cada una de las 50 millones de consultas se prueba como Q para ver si el resultado calculado a partir de una sola consulta podría coincidir con los datos de ILI del historial real obtenidos de los Centros para el Control y la Prevención de Enfermedades (CDC) de EE. UU. Este proceso produce una lista de las consultas principales que proporciona las predicciones más precisas de los datos ILI de los CDC cuando se utiliza el modelo lineal. Luego, se eligen las 45 consultas principales porque, cuando se agregan, estas consultas se ajustan a los datos del historial con mayor precisión. Utilizando la suma de las 45 consultas principales relacionadas con ILI, el modelo lineal se ajusta a los datos de ILI semanales entre 2003 y 2007 para poder obtener el coeficiente. Por último, el modelo entrenado se utiliza para predecir el brote de gripe en todas las regiones de los Estados Unidos.

Este algoritmo ha sido revisado posteriormente por Google, en parte en respuesta a preocupaciones sobre la precisión, y los intentos de replicar sus resultados han sugerido que los desarrolladores del algoritmo "sintieron una necesidad no articulada de ocultar los términos de búsqueda identificados". [6]

Problemas de privacidad [ editar ]

Tendencias de la gripe de Google intenta evitar violaciones de la privacidad agregando solo millones de consultas de búsqueda anónimas, sin identificar a las personas que realizaron la búsqueda. [1] [7] Su registro de búsqueda contiene la dirección IP del usuario, que podría usarse para rastrear hasta la región donde se envió originalmente la consulta de búsqueda. Google ejecuta programas en las computadoras para acceder y calcular los datos, por lo que ningún ser humano está involucrado en el proceso. Google también implementó la política para anonimizar la dirección IP en sus registros de búsqueda después de 9 meses. [8]

Sin embargo, Google Flu Trends ha planteado preocupaciones sobre la privacidad entre algunos grupos de privacidad. El Centro de información de privacidad electrónica y los derechos de privacidad del paciente enviaron una carta a Eric Schmidt en 2008, entonces director ejecutivo de Google. [9] Admitieron que el uso de datos generados por el usuario podría respaldar el esfuerzo de salud pública de manera significativa, pero expresaron su preocupación de que "las investigaciones específicas del usuario podrían ser obligadas, incluso a pesar de la objeción de Google, por orden judicial o autoridad presidencial".

Impacto [ editar ]

Una motivación inicial para GFT fue que poder identificar la actividad de la enfermedad de manera temprana y responder rápidamente podría reducir el impacto de la influenza estacional y pandémica. Un informe fue que Google Flu Trends pudo predecir los brotes regionales de gripe hasta 10 días antes de que fueran informados por los CDC (Centros para el Control y la Prevención de Enfermedades). [10]

En la pandemia de gripe de 2009, Google Flu Trends registró información sobre la gripe en los Estados Unidos. [11] En febrero de 2010, los CDC identificaron casos de influenza que aumentaron en la región del Atlántico medio de los Estados Unidos. Sin embargo, los datos de Google de las consultas de búsqueda sobre los síntomas de la gripe pudieron mostrar ese mismo aumento dos semanas antes de que se publicara el informe de los CDC.

"Cuanto antes sea la advertencia, las medidas de prevención y control más tempranas se pueden implementar, y esto podría prevenir casos de influenza", dijo la Dra. Lyn Finelli, directora de vigilancia en la división de influenza de los CDC. “Del 5 al 20 por ciento de la población del país contrae la gripe cada año, lo que lleva a aproximadamente 36,000 muertes en promedio”. [10]

Google Flu Trends es un ejemplo de inteligencia colectiva que se puede utilizar para identificar tendencias y calcular predicciones. Los datos acumulados por los motores de búsqueda son significativamente reveladores porque las consultas de búsqueda representan los deseos y necesidades no filtrados de las personas. "Esta parece una forma realmente inteligente de usar datos que los usuarios de Google crean involuntariamente para ver patrones en el mundo que de otra manera serían invisibles", dijo Thomas W. Malone, profesor de la Sloan School of Management del MIT. "Creo que solo estamos rascando la superficie de lo que es posible con la inteligencia colectiva". [10]

Precisión [ editar ]

El documento inicial de Google declaró que las predicciones de Tendencias de la gripe de Google eran un 97% precisas en comparación con los datos de los CDC. [4] Sin embargo, informes posteriores afirmaron que las predicciones de Tendencias de la gripe de Google a veces han sido muy inexactas, especialmente durante el intervalo 2011-2013, cuando sobrestimó constantemente la incidencia relativa de la gripe, [6] y durante un intervalo en la temporada de gripe 2012-2013 pronosticada el doble de visitas al médico que las registradas por los CDC. [6] [12]

Una fuente de problemas es que las personas que realizan búsquedas en Google relacionadas con la gripe pueden saber muy poco sobre cómo diagnosticar la gripe; Las búsquedas de gripe o síntomas de gripe bien pueden estar investigando síntomas de enfermedad que son similares a los de la gripe, pero que en realidad no son gripe. [13] Además, el análisis de los términos de búsqueda que, según se informa, rastreó Google, como "fiebre" y "tos", así como los efectos de los cambios en su algoritmo de búsqueda a lo largo del tiempo, han suscitado preocupaciones sobre el significado de sus predicciones. [6] En el otoño de 2013, Google comenzó a intentar compensar los aumentos en las búsquedas debido a la prominencia de la gripe en las noticias, que se encontró que anteriormente tenía resultados sesgados. [14] Sin embargo, un análisis concluyó que "al combinar GFT y datos de CDC retrasados, así como recalibrar dinámicamente GFT, podemos mejorar sustancialmente el rendimiento de GFT o del CDC solo". [6] Un estudio posterior también demuestra que los datos de búsqueda de Google se pueden utilizar para mejorar las estimaciones, reduciendo los errores observados en un modelo que utiliza únicamente datos de los CDC hasta en un 52,7 por ciento. [15]

Al reevaluar el modelo GFT original, los investigadores descubrieron que el modelo estaba agregando consultas sobre diferentes condiciones de salud, algo que podría conducir a una predicción excesiva de las tasas de ILI; En el mismo trabajo, se propuso una serie de enfoques lineales y no lineales más avanzados de mejor rendimiento para el modelado de ILI. [dieciséis]

Sistemas relacionados [ editar ]

Proyectos similares, como el proyecto de predicción de la gripe [17] del instituto de ciencia cognitiva Osnabrück, llevan adelante la idea básica, combinando datos de redes sociales , por ejemplo, Twitter con datos de CDC , y modelos estructurales que infieren la propagación espacial y temporal [18] de la enfermedad.

Referencias [ editar ]

  1. ^ a b "Tendencias de la gripe de Google | Cómo" . Archivado desde el original el 22 de octubre de 2012 . Consultado el 10 de noviembre de 2012 . CS1 maint: parámetro desalentado ( enlace )
  2. ^ Fred O'Connor (20 de agosto de 2015). "Tendencias de la gripe de Google llama enfermos, indefinidamente" . PCWorld . Archivado desde el original el 23 de agosto de 2015 . Consultado el 23 de agosto de 2015 .
  3. ^ Zeiger, Roni (6 de octubre de 2009). "Visión general de las tendencias de la gripe de Google" . youtube.com . YouTube . Archivado desde el original el 6 de junio de 2013 . Consultado el 6 de junio de 2013 . CS1 maint: parámetro desalentado ( enlace )
  4. ↑ a b Ginsberg, Jeremy. "Detección de epidemias de influenza utilizando datos de consulta del motor de búsqueda" (PDF) . Archivado (PDF) desde el original el 4 de septiembre de 2012 . Consultado el 10 de noviembre de 2012 . CS1 maint: parámetro desalentado ( enlace )
  5. ^ Ginsberg, Jeremy; Mohebbi, Matthew H .; Patel, Rajan S .; Brammer, Lynnette; Smolinski, Mark S .; Brilliant, Larry (19 de febrero de 2009). "Detección de epidemias de influenza utilizando datos de consulta del motor de búsqueda". Naturaleza . 457 (7232): 1012–1014. doi : 10.1038 / nature07634 . PMID 19020500 . 
  6. ^ a b c d e Lazer, David; Kennedy, Ryan; King, Gary; Vespignani, Alessandro (14 de marzo de 2014). "La parábola de la gripe de Google: trampas en el análisis de Big Data" (PDF) . Ciencia . 343 (6176): 1203–1205. doi : 10.1126 / science.1248506 . PMID 24626916 . Archivado (PDF) desde el original el 19 de noviembre de 2019 . Consultado el 19 de diciembre de 2019 .  
  7. ^ Helft, Miguel (13 de noviembre de 2008). "¿Existe un riesgo de privacidad en las Tendencias de la gripe de Google?" . The New York Times . Archivado desde el original el 6 de noviembre de 2012 . Consultado el 10 de noviembre de 2012 . CS1 maint: parámetro desalentado ( enlace )
  8. ^ "Política de privacidad - Políticas y principios - Google" . Archivado desde el original el 3 de noviembre de 2012 . Consultado el 10 de noviembre de 2012 . CS1 maint: parámetro desalentado ( enlace )
  9. ^ Pelar, Deborah. "Carta de EPIC del 12 de noviembre de 2008 a Google sobre las tendencias de la gripe de Google" (PDF) . Archivado (PDF) desde el original el 15 de noviembre de 2012 . Consultado el 10 de noviembre de 2012 . CS1 maint: parámetro desalentado ( enlace )
  10. ^ a b c "Google utiliza búsquedas para rastrear la propagación de la gripe" (PDF) . Archivado (PDF) desde el original el 15 de noviembre de 2012 . Consultado el 10 de noviembre de 2012 . CS1 maint: parámetro desalentado ( enlace )
  11. ^ Cook, S .; Conrad, C .; Fowlkes, AL; Mohebbi, MH (2011). Cowling, Benjamin J (ed.). "Evaluación del rendimiento de las tendencias de la influenza de Google en los Estados Unidos durante la pandemia del virus de la influenza A (H1N1) de 2009" . PLoS ONE . 6 (8): e23610. doi : 10.1371 / journal.pone.0023610 . PMC 3158788 . PMID 21886802 .  
  12. ^ Butler, Declan (13 de febrero de 2013). "Cuando Google se equivocó con la gripe" . Naturaleza . 494 : 155-156. doi : 10.1038 / 494155a . PMID 23407515 . 
  13. ^ "Tendencias de la gripe de Google: ¿un caso de Big Data que salió mal?" . SiliconANGLE .
  14. Richard Harris (13 de marzo de 2014). "El rastreador de la gripe de Google sufre de sniffles" . NPR. Archivado desde el original el 19 de marzo de 2019 . Consultado el 19 de diciembre de 2019 .
  15. ^ Preis, Tobías; Moat, Helen Susannah (29 de octubre de 2014). "Nowcasting adaptable de los brotes de influenza mediante búsquedas de Google" . Ciencia Abierta de la Royal Society . 1 : 140095. doi : 10.1098 / rsos.140095 . PMC 4448892 . PMID 26064532 .  
  16. ^ Lampos, Vasileios; Miller, Andrew C .; Crossan, Steve; Stefansen, Christian (3 de agosto de 2015). "Avances en la predicción inmediata de las tasas de enfermedades similares a la influenza mediante registros de consultas de búsqueda" . Informes científicos . 5 (12760). doi : 10.1038 / srep12760 . PMC 4522652 . PMID 26234783 .  
  17. ^ "Proyecto de predicción de la gripe de la Universidad Osnabrück e IBM WATSON" . Archivado desde el original el 27 de mayo de 2019 . Consultado el 19 de diciembre de 2019 .
  18. ^ Schumacher Johannes (2015). "Un marco estadístico para inferir el retraso y la dirección del flujo de información a partir de mediciones de sistemas complejos" . Computación neuronal . 27 : 1555–1608. doi : 10.1162 / NECO_a_00756 . Archivado desde el original el 12 de febrero de 2019 . Consultado el 20 de marzo de 2016 .

Enlaces externos [ editar ]

  • Página web oficial