El almacenamiento en caché peer-to-peer ( caché P2P ) es una tecnología de gestión del tráfico de redes informáticas utilizada por los proveedores de servicios de Internet (ISP) para acelerar el contenido entregado a través de redes peer-to-peer (P2P) y reducir los costos de ancho de banda relacionados.
El almacenamiento en caché P2P es similar en principio al almacenamiento en caché de contenido utilizado durante mucho tiempo por los ISP para acelerar el contenido web ( HTTP ). El almacenamiento en caché P2P almacena temporalmente contenido popular que fluye hacia la red de un ISP. Si el contenido solicitado por un suscriptor está disponible en una caché, la caché satisface la solicitud de su almacenamiento temporal, eliminando la transferencia de datos a través de enlaces de tránsito costosos y reduciendo la congestión de la red . Este enfoque podría hacer que los ISP violen las leyes ya que los sistemas P2P comparten archivos que infringen los derechos de autor en porciones significativas. [1]
El contenido P2P responde bien al almacenamiento en caché porque tiene patrones de reutilización altos que reflejan una distribución similar a Zipf . [2] [3] [4] Las comunidades P2P tienen diferentes parámetros de Zipf [4] que determinan qué fracción de archivos se solicita varias veces. Por ejemplo, una comunidad P2P puede solicitar el 75% del contenido varias veces, mientras que otra puede solicitar solo el 10%.
Algunos dispositivos de almacenamiento en caché P2P también pueden acelerar el tráfico de transmisión de video HTTP desde YouTube , Facebook , RapidShare , MegaUpload , Google , AOL Video , MySpace y otros sitios web para compartir videos. [5]
Cómo funciona el almacenamiento en caché P2P
El almacenamiento en caché P2P implica la creación de un caché o espacio de almacenamiento temporal para datos P2P, utilizando hardware de comunicaciones especializado, almacenamiento en disco y software asociado. Esta caché se coloca en la red del ISP, ya sea junto con los enlaces de tránsito de Internet o en puntos clave de agregación o en cada cabecera de cable.
Una vez que se establece una caché P2P, la red redirigirá de forma transparente el tráfico P2P a la caché, que sirve el archivo directamente o pasa la solicitud a un usuario P2P remoto y simultáneamente almacena en caché esos datos para el siguiente usuario. Hasta qué punto el almacenamiento en caché es beneficioso depende de cuán similares sean los intereses de contenido de los clientes del ISP. Debido al número relativamente pequeño de contenido compartido en sistemas P2P (en comparación con la Web) y los intereses semánticos, geográficos y organizativos de los usuarios [4], la proporción de intercambio en P2P puede ser significativamente mayor que el almacenamiento en caché HTTP / Web [ cita requerida ] .
El almacenamiento en caché P2P generalmente funciona con una tecnología de mitigación del tráfico de red llamada Deep Packet Inspection (DPI). Los proveedores de servicios utilizan la tecnología DPI para comprender qué tráfico se está ejecutando en sus redes y para separarlo y tratarlo para una entrega más eficiente. Los productos DPI identifican y pasan paquetes P2P al sistema de almacenamiento en caché P2P para que pueda almacenar en caché el tráfico y acelerarlo.
Peerapp Ltd. posee la primera patente [6] para la tecnología de almacenamiento en caché P2P, que se presentó en 2000.
El problema del ancho de banda P2P
En 2008, se estimó que el tráfico de igual a igual representaba el 50% de todo el tráfico de Internet, y se esperaba que se cuadriplicara entre 2008 y 2013, alcanzando 3,3 exabytes por mes, o el equivalente a 500 millones de DVD por mes. [7] Sin embargo, esta tendencia se ha interrumpido, ya que en 2016 el tráfico P2P global comenzó a disminuir, mostrando un descenso del 6% entre 2016 y 2021. [8] Estas estadísticas pueden explicarse por la popularización de los servicios de video a pedido , que han utilizado (hasta el momento) una arquitectura centralizada para la distribución de datos.
El aumento del tráfico P2P ha creado problemas para los ISP. Las redes pueden saturarse con tráfico P2P, creando congestión para otros tipos de uso de Internet. El costo del tráfico P2P es desproporcionado a la cantidad de ingresos que los ISP obtienen de estos clientes debido a los paquetes de ancho de banda de tarifa plana que se venden comúnmente. Para evitar que el tráfico P2P degrade el servicio para todos los suscriptores, los ISP generalmente enfrentan tres opciones:
- Invierta en ancho de banda y equipos adicionales. Desafortunadamente, aumentar el ancho de banda a menudo no resuelve el problema, porque las aplicaciones P2P tienden inherentemente a consumir tanto ancho de banda como esté disponible.
- Implemente límites de bytes, políticas o modelado del tráfico P2P más estrictos , lo que limita la velocidad del tráfico P2P. La dificultad es que los paquetes P2P son cada vez más difíciles de identificar, especialmente con la introducción del cifrado (como el cifrado del protocolo BitTorrent ). La configuración del tráfico también puede generar publicidad negativa y reacciones de los clientes.
- Implementar una forma de almacenamiento en caché P2P.
El almacenamiento en caché libera la demanda de ancho de banda en los enlaces críticos de Internet y mejora la experiencia de todos los usuarios: usuarios P2P cuyo intercambio de archivos se mejora mediante el uso del caché y usuarios que no son P2P que experimentan un mejor rendimiento de las redes no congestionadas por el tráfico P2P.
Los primeros en adoptar el almacenamiento en caché P2P han sido los ISP en Asia, la Cuenca del Pacífico, América Latina, el Caribe y el Medio Oriente, cuyos suscriptores son grandes usuarios de redes P2P y donde proporcionar el ancho de banda adicional para manejar datos P2P es muy costoso debido a la Gastos de enlaces de tránsito internacional.
Se espera que el almacenamiento en caché P2P se convierta en una tecnología cada vez más esencial para los ISP y MSO (operadores de sistemas múltiples) en todo el mundo, particularmente con la creciente popularidad del contenido P2P entre los suscriptores de banda ancha y la adopción de P2P como una estrategia de distribución de contenido por parte de los principales proveedores de contenido como el BBC .
Implementaciones de caché P2P
- Software de almacenamiento en caché de medios PeerApp UltraBand [1]
- Corelli [9] es un sistema de almacenamiento en caché P2P basado en la comunidad que opera de forma descentralizada entre varios pares. Esto permite realizar un servicio de almacenamiento en caché en entornos que no poseen una infraestructura de almacenamiento en caché fija, por ejemplo, una red inalámbrica ad hoc .
- El almacenamiento en caché de la comunidad es una solución de almacenamiento en caché distribuido y consciente de los intereses de la comunidad P2P para sistemas P2P estructurados (basados en DHT). Alivia la sobrecarga debido al aislamiento de las comunidades P2P y la pérdida de popularidad del contenido debido a la agregación de contenido de múltiples comunidades. [4]
Fuentes
- ^ Jacob, Assaf M .; Zoe Argento (1 de septiembre de 2010). "Almacenar en caché o no almacenar en caché: esa es la cuestión; 'Almacenamiento en caché del sistema' P2P: el dilema del copyright". Revisión de la ley de Whittier . 31 : 421-. SSRN 1670289 .
- ^ Sripanidkulchai, K. "La popularidad de las consultas de Gnutella y sus implicaciones en la escalabilidad" . Consultado el 6 de enero de 2012 .
- ^ Klemm, A .; C. Lindemann; MK Vernon ; OP Waldhorst (2004). Caracterización del comportamiento de las consultas en sistemas de intercambio de archivos de igual a igual (PDF) . 4a Conf. ACM SIGCOMM sobre medición de Internet.
- ^ a b c d Bandara, HMN Dilum; AP Jayasumana (junio de 2011). Explotación de comunidades para mejorar el rendimiento de las búsquedas en sistemas P2P estructurados . IEEE Int. Conf. sobre Comunicaciones (ICC '11). doi : 10.1109 / icc.2011.5962882 .
- ^ "Copia archivada" . Archivado desde el original el 9 de junio de 2010 . Consultado el 23 de mayo de 2010 .CS1 maint: copia archivada como título ( enlace )
- ^ Patente de EE. UU. Número 7,203,741 B2
- ^ Cisco. "Acercándose a la era de Zettabyte" . Cisco . Consultado el 6 de enero de 2012 .
- ^ Cisco. "Índice de redes visuales de Cisco: pronóstico y metodología, 2016-2021" . Cisco . Consultado el 17 de agosto de 2018 .
- ^ Gareth Tyson, Andreas Mauthe, Sebastian Kaune, Mu Mu y Thomas Plagemann. Corelli: un servicio de replicación dinámica de igual a igual para admitir contenido dependiente de la latencia en redes comunitarias. "Copia archivada" (PDF) . Archivado desde el original (PDF) el 18 de junio de 2015 . Consultado el 26 de abril de 2012 .CS1 maint: copia archivada como título ( enlace )