Algoritmo de recuento con pérdidas


El algoritmo de recuento con pérdida es un algoritmo para identificar elementos en un flujo de datos cuyo recuento de frecuencia excede un umbral dado por el usuario. El algoritmo funciona dividiendo el flujo de datos en 'depósitos' como para los elementos frecuentes, pero llena tantos depósitos como sea posible en la memoria principal una vez. La frecuencia calculada por este algoritmo no siempre es precisa, pero tiene un umbral de error que puede especificar el usuario. El espacio de tiempo de ejecución requerido por el algoritmo es inversamente proporcional al umbral de error especificado, por lo tanto, cuanto mayor es el error, menor es la huella.

Fue creado por los eminentes informáticos Rajeev Motwani y Gurmeet Singh Manku. Este algoritmo encuentra una gran aplicación en cálculos donde los datos toman la forma de un flujo de datos continuo en lugar de un conjunto de datos finito , por ejemplo, mediciones de tráfico de red, registros de servidores web, flujos de clics .