De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

En la comunicación orientada a la conexión , un flujo de datos es una secuencia de señales coherentes codificadas digitalmente ( paquetes de datos o paquetes de datos ) que se utilizan para transmitir o recibir información que está en proceso de transmisión. [1] Un flujo de datos es un conjunto de información extraída de un proveedor de datos. [2] Contiene datos sin procesar que se recopilaron del comportamiento del navegador de los usuarios en los sitios web, donde se coloca un píxel dedicado. Los flujos de datos son útiles para los científicos de datos para big data e IAsuministro de algoritmos. Los principales proveedores de flujo de datos son empresas de tecnología de datos .

Definición formal [ editar ]

De manera formal, un flujo de datos es cualquier par ordenado donde:

  1. es una secuencia de tuplas y
  2. es una secuencia de intervalos de tiempo real positivos .

Contenido [ editar ]

El flujo de datos contiene diferentes conjuntos de datos, que dependen del formato de datos elegido.

  • Atributos : cada atributo [3] del flujo de datos representa un cierto tipo de datos, por ejemplo, ID de segmento / punto de datos, marca de tiempo, geodatos.
  • El atributo de marca de tiempo ayuda a identificar cuándo ocurrió un evento.
  • El ID del sujeto es un ID codificado por algoritmo, que se ha extraído de una cookie.
  • Raw Data incluye información directamente del proveedor de datos sin ser procesada por un algoritmo ni por humanos.
  • Los datos procesados son datos que han sido preparados [4] (de alguna manera modificados, validados o limpiados), para ser utilizados para acciones futuras.

Uso [ editar ]

Hay varias áreas en las que se utilizan flujos de datos:

  • Detección y puntuación de fraudes : los datos sin procesar se utilizan como datos de origen para un algoritmo antifraude ( técnicas de análisis de datos para la detección de fraudes ). Por ejemplo, la marca de tiempo o la cantidad de ocurrencias de cookies o el análisis de puntos de datos se utilizan dentro del sistema de puntuación para detectar fraudes o para asegurarse de que el receptor de un mensaje no sea un bot (el llamado Tráfico No Humano [5] ).
  • Inteligencia artificial : los datos sin procesar se tratan como un conjunto de trenes y un conjunto de pruebas durante laconstrucción de algoritmos deinteligencia artificial y aprendizaje automático .
  • Los datos brutos se utilizan para la creación de perfiles y la personalización para personalizar los perfiles de usuario [6] y dividirlos para segmentarlos, por ejemplo, por género o ubicación (según el punto de datos ).
  • Inteligencia empresarial : los datos sin procesar son una fuente de información para los sistemas de BI, que se utilizan para enriquecer los perfiles de usuario con información detallada sobre ellos, por ejemplo, ruta de compra o geodatos. Esta información se utiliza para análisis de negocios e investigación predictiva.
  • Orientación : los datos procesados ​​por científicos de datos mejoran las campañas en línea y se utilizan para llegar al público objetivo. [7]
  • Enriquecimiento de CRM : los datos sin procesar se integran con el sistema de gestión de relaciones con el cliente . La integración CRM permite llenar los vacíos en los perfiles de los usuarios con datos demográficos, intereses o intenciones de compra.

Integración [ editar ]

Las integraciones principales con flujos de datos son:

  • Los flujos de datos se integran con sistemas como la plataforma de datos del cliente (CDP), la gestión de relaciones con el cliente (CRM) o la plataforma de gestión de datos (DMP) para enriquecer los perfiles de los usuarios con datos externos. Es posible ampliar el conocimiento sobre los usuarios existentes mediante el uso de fuentes externas. [8]
  • Los flujos de datos se utilizan para enriquecer los sistemas de inteligencia empresarial y hacer que los análisis sean más precisos y las conclusiones más precisas.
  • En el caso de la integración del sistema de gestión de contenido (CMS), Data Stream se utiliza para identificar a los usuarios y personalizar su visita, incluso si es la primera. Mediante el análisis de datos, el contenido real del sitio web se adapta al usuario.
  • Los flujos de datos están integrados con la plataforma del lado de la demanda (DSP) dentro del ecosistema de publicidad programática. Las partes (por ejemplo, los anunciantes) pueden intercambiar los ID de los usuarios y concatenar con ellos los perfiles existentes.
  • Los flujos de datos se utilizan para elegir los respectivos segmentos de usuarios (por ejemplo, personas interesadas en la industria automotriz) y utilizarlos en una campaña en línea. Los segmentos se enriquecen con más características de usuario fuera del flujo de datos y luego se envían a DSP.

Fuentes de datos visibles [ editar ]

En un flujo de datos, es visible qué dispositivo ha sido utilizado por el lado del usuario; es visible en el agente de usuario :

  • móvil : cuando un usuario utiliza un navegador móvil para explorar, tiene una resolución de pantalla estrecha y una versión de la aplicación móvil, respectivamente;
  • escritorio : cuando un usuario usa un navegador de escritorio o una versión de la aplicación.

La siguiente información se comparte con el dispositivo usado:

  • URL real del sitio web visitado, donde ocurrió un evento
  • Agente de usuario
  • Geolocalización
  • Protocolo de Internet (IP)

Formatos [ editar ]

Un punto de datos es una etiqueta que recopila información sobre una determinada acción, realizada por un usuario en un sitio web. Los puntos de datos existen en dos tipos, cuyos valores se utilizan para crear las audiencias adecuadas. Esos son:

  • 'evento' con información sobre las ocurrencias del evento específico (por ejemplo, haga clic en un enlace o muestra un anuncio)
  • 'atributo' con valores numéricos o alfanuméricos.

El segmento es una declaración lógica, construida sobre puntos de datos específicos usando operadores Y, O o NO. [9]
Datos híbridos : datos sin procesar de los formatos de datos de segmento y punto de datos. [10]
URL : es un conjunto de información sobre una URL particular que se ha visitado.

GDPR [ editar ]

La información recopilada de los sitios web se basa en el comportamiento del usuario. Los proveedores de datos brindan información personal o no personal. Hay dos tipos de datos de usuario disponibles en el flujo de datos:

  • Información de identificación personal (PII): información que permite claramente o mediante la combinación con métodos de identificación de datos identificar a una persona. Ejemplos de PII son: ID de seguro, dirección de correo electrónico, número de teléfono, dirección IP , geolocalización, datos biométricos . [11]
  • La información de identificación no personal (no PII) es información que no se puede usar para identificar a una persona o rastrear una ubicación. Una cookie o un ID de dispositivo es un ejemplo de no PII.

Notas [ editar ]

  1. ^ "Flujo de datos estándar federal 1037C " . Archivado desde el original el 13 de abril de 2007 . Consultado el 4 de abril de 2007 .
  2. ^ "Flujo de datos" . techopedia.com . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .
  3. ^ "Atributo" . businessdictionary.com . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .
  4. ^ "¿Qué constituye el procesamiento de datos?" . ec.europa.eu . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .
  5. ^ "Tráfico no humano [NHT]" . theonlineadvertisingguide.com . Archivado desde el original el 13 de agosto de 2017 . Consultado el 24 de abril de 2019 .
  6. ^ "PERFILES DE COMPORTAMIENTO Y PERSONALIZACIÓN: LA EXPERIENCIA DEL CLIENTE PRIMERO" . selligent.com . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .
  7. ^ "Qué es la focalización - Significado" . selligent.com . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .
  8. ^ "Qué es Data Stream y cómo usarlo" . OnAudience.com . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .
  9. ^ "Los 6 tipos de segmentación de usuarios y lo que significan para su producto" . uxdesign.cc .
  10. ^ "Qué es la gestión de datos híbridos" . ibm.com . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .
  11. ^ "¿Qué es la información de identificación personal (PII)? Cómo protegerla bajo GDPR" . csoonline.com . Archivado desde el original el 24 de abril de 2019 . Consultado el 24 de abril de 2019 .

Referencias [ editar ]

  • Ja, Anthony. "Lotame presenta un enfoque 'desapilado' para vender herramientas de datos" . techcrunch.com .
  • "Datos brutos (datos de origen o datos atómicos)" . searchdatamanagement.techtarget.com .
  • Callejón, Garret. "¿Qué es la transmisión de datos?" . alooma.com .
  • "CÓMO UTILIZAR EL STREAMING DE DATOS PARA GRANDES DATOS" . dummies.com .
  • "Lotame lanza flujo de datos" . destinationcrm.com .
  • Perera, Srinath. "Una suave introducción al procesamiento de secuencias" . medium.com .