El diseño de redes y servicios de red robustos y confiables se basa en la comprensión de las características del tráfico de la red. A lo largo de la historia, se han desarrollado y utilizado diferentes modelos de tráfico de red para evaluar redes y servicios existentes y propuestos.
Las demandas de las redes informáticas no son del todo predecibles. El modelado de rendimiento es necesario para decidir el nivel de calidad de servicio (QoS). Los modelos de rendimiento, a su vez, requieren modelos de tráfico precisos que tengan la capacidad de capturar las características estadísticas del tráfico real en la red. Se han desarrollado muchos modelos de tráfico basados en datos de medición de tráfico. Si los modelos de tráfico subyacentes no capturan de manera eficiente las características del tráfico real, el resultado puede ser una subestimación o una sobreestimación del rendimiento de la red. Esto perjudica el diseño de la red. Por lo tanto, los modelos de tráfico son un componente central de cualquier evaluación del rendimiento de las redes y deben ser muy precisos.
“La teoría del teletráfico es la aplicación de las matemáticas a la medición, modelado y control del tráfico en las redes de telecomunicaciones . [1] El objetivo del modelado de tráfico es encontrar procesos estocásticos para representar el comportamiento del tráfico. Trabajando en la Compañía Telefónica de Copenhague en la década de 1910, AK Erlang caracterizó el tráfico telefónico a nivel de llamadas mediante ciertas distribuciones de probabilidad para las llegadas de nuevas llamadas y sus tiempos de espera. Erlang aplicó los modelos de tráfico para estimar la capacidad del conmutador telefónico necesaria para lograr una determinada probabilidad de bloqueo de llamadas. Las fórmulas de bloqueo de Erlang tenían un gran interés práctico para los operadores públicos porque las instalaciones telefónicas (conmutación y transmisión) implicaban inversiones considerables. Durante varias décadas, el trabajo de Erlang estimuló el uso de la teoría de las colas y aplicó la probabilidad en general para diseñar la red telefónica pública conmutada . La teoría del teletráfico para redes de paquetes ha experimentado un progreso considerable en las últimas décadas. [2] [3] [4] [5] Se han realizado avances significativos en los enfoques de dependencia de largo alcance, ondículas y multifractales . Al mismo tiempo, el modelado del tráfico sigue enfrentándose al desafío de las tecnologías de red en evolución y las nuevas aplicaciones multimedia. Por ejemplo, las tecnologías inalámbricas permiten una mayor movilidad de los usuarios. La movilidad debe ser una consideración adicional para modelar el tráfico en redes inalámbricas. [6] [7] El modelado del tráfico es un proceso continuo sin un final real. Los modelos de tráfico representan nuestra mejor comprensión actual del comportamiento del tráfico, pero nuestra comprensión cambiará y crecerá con el tiempo ". [8]
Uso de modelos de tráfico de red
Las mediciones son útiles y necesarias para verificar el rendimiento real de la red . Sin embargo, las mediciones no tienen el nivel de abstracción que hace que los modelos de tráfico sean útiles. Los modelos de tráfico se pueden utilizar para la resolución de problemas hipotéticos, mientras que las mediciones de tráfico solo reflejan la realidad actual. En términos probabilísticos, una traza de tráfico es una realización de un proceso aleatorio , mientras que un modelo de tráfico es un proceso aleatorio. Por tanto, los modelos de tráfico tienen universalidad. Un seguimiento de tráfico brinda información sobre una fuente de tráfico en particular, pero un modelo de tráfico brinda información sobre todas las fuentes de tráfico de ese tipo. Los modelos de tráfico tienen tres usos principales. Un uso importante de los modelos de tráfico es dimensionar adecuadamente los recursos de la red para un nivel objetivo de QoS . Se mencionó anteriormente que Erlang desarrolló modelos de llamadas de voz para estimar la capacidad del conmutador telefónico para lograr una probabilidad de bloqueo de llamadas objetivo. De manera similar, se necesitan modelos de tráfico de paquetes para estimar el ancho de banda y los recursos de búfer para proporcionar retrasos de paquetes aceptables y probabilidad de pérdida de paquetes . El conocimiento de la tasa de tráfico media no es suficiente. Se sabe por la teoría de las colas que las longitudes de las colas aumentan con la variabilidad del tráfico. [9] Por lo tanto, se necesita una comprensión de la variabilidad o ráfagas del tráfico para determinar los tamaños de búfer suficientes en los nodos y las capacidades de enlace. [10] Un segundo uso importante de los modelos de tráfico es verificar el rendimiento de la red bajo controles de tráfico específicos. Por ejemplo, dado un algoritmo de programación de paquetes, sería posible evaluar el rendimiento de la red resultante de diferentes escenarios de tráfico. Otro ejemplo, un área de investigación popular son las nuevas mejoras en el algoritmo de prevención de congestión de TCP. Es fundamental que cualquier algoritmo sea estable y permita que varios hosts compartan el ancho de banda de manera justa, mientras mantienen un alto rendimiento. La evaluación efectiva de la estabilidad, equidad y rendimiento de los nuevos algoritmos no sería posible sin modelos fuente realistas. Un tercer uso importante de los modelos de tráfico es el control de admisión. En particular, las redes orientadas a la conexión, como ATM, dependen del control de admisión para bloquear nuevas conexiones y mantener las garantías de QOS. Una estrategia de admisión simple podría basarse en la tasa pico de una nueva conexión; se admite una nueva conexión si el ancho de banda disponible es mayor que la tasa pico. Sin embargo, esa estrategia sería demasiado conservadora porque una conexión de tasa de bits variable puede necesitar significativamente menos ancho de banda que su tasa máxima. Una estrategia de admisión más sofisticada se basa en anchos de banda efectivos. [11] El comportamiento del tráfico de origen se traduce en un ancho de banda efectivo entre la tasa máxima y la tasa promedio, que es la cantidad específica de ancho de banda necesaria para cumplir con una restricción de QoS determinada. El ancho de banda efectivo depende de la variabilidad de la fuente. [8]
Pasos de modelos de tráfico de red
El modelado de tráfico consta de tres pasos:
- (i) selección de uno o más modelos que puedan proporcionar una buena descripción del tipo de tráfico
- (ii) estimación de parámetros para los modelos seleccionados
- (iii) ensayo estadístico para elección de uno de los modelos considerados y análisis de su idoneidad para describir el tipo de tráfico objeto de análisis.
La estimación de parámetros se basa en un conjunto de estadísticas (por ejemplo, media, varianza, función de densidad o función de covarianza automática, características multifractales) que se miden o calculan a partir de los datos observados. El conjunto de estadísticas utilizadas en el proceso de inferencia depende del impacto que puedan tener en las principales métricas de rendimiento de interés. [12]
Parámetro de modelos de tráfico de red
En los últimos años se descubrieron varios tipos de comportamiento del tráfico que pueden tener un impacto significativo en el rendimiento de la red: dependencia de largo alcance, auto-similitud y, más recientemente, multifractalidad. Hay dos parámetros principales generados por los modelos de tráfico de red: distribuciones de longitud de paquetes y distribuciones de paquetes entre llegadas. Otros parámetros, como rutas, distribución de destinos, etc., son de menor importancia. Las simulaciones que utilizan trazas generadas por modelos de tráfico de red generalmente examinan un solo nodo en la red, como un enrutador o conmutador; los factores que dependen de topologías de red específicas o información de enrutamiento son específicos de esas topologías y simulaciones. [13] El problema de la distribución del tamaño de los paquetes se comprende bastante bien en la actualidad. Los modelos existentes de tamaños de paquetes han demostrado ser válidos y simples. La mayoría de los modelos de tamaño de paquete no consideran el problema del orden en los tamaños de paquete. Por ejemplo, es probable que un datagrama TCP en una dirección sea seguido por un pequeño ACK en la otra dirección aproximadamente la mitad de un tiempo de ida y vuelta (RTT) más tarde. El problema de la distribución de paquetes entre llegadas es mucho más difícil. La comprensión del tráfico de red ha evolucionado significativamente a lo largo de los años, lo que ha llevado a una serie de evoluciones en los modelos de tráfico de red.
Modelos de tráfico autosimilares
Una de las primeras objeciones a los modelos de tráfico auto-similares fue la dificultad en el análisis matemático. Los modelos auto-similares existentes no se pueden utilizar en modelos de cola convencionales. Esta limitación se anuló rápidamente y se construyeron modelos viables. Una vez que los modelos básicos auto-similares se volvieron factibles, la comunidad de modelos de tráfico se instaló en las preocupaciones de los "detalles". El algoritmo de control de congestión de TCP complicó la cuestión del modelado del tráfico, por lo que era necesario crear soluciones. La estimación de parámetros de modelos auto-similares siempre fue difícil, y una investigación reciente aborda formas de modelar el tráfico de red sin comprenderlo completamente. [14]
Cuando se introdujeron por primera vez los modelos de tráfico auto-similares, no había procesos eficientes y analíticamente manejables para generar los modelos. Ilkka Norros ideó un proceso estocástico para un modelo de almacenamiento con entrada auto-similar y salida de tasa de bits constante. Si bien este modelo inicial era continuo en lugar de discreto, el modelo era efectivo, simple y atractivo. [14]
- BALANCEARSE:
Todos los modelos de tráfico auto-similares adolecen de un inconveniente importante: estimar los parámetros de auto-similitud a partir del tráfico de red real requiere grandes cantidades de datos y requiere un cálculo extenso. El método más moderno, el análisis de múltiples resoluciones de ondículas, es más eficiente, pero sigue siendo muy costoso. Esto no es deseable en un modelo de tráfico. SWING utiliza un modelo sorprendentemente simple para el análisis y la generación de tráfico de red. El modelo examina las características de los usuarios, los intercambios de solicitud y respuesta (RRE), las conexiones, los paquetes individuales y la red en general. No se intenta analizar las características de auto-semejanza; cualquier auto-similitud en el tráfico generado proviene naturalmente de la agregación de muchas fuentes ON / OFF. [14] [15]
- Proceso de distribución de Pareto :
El proceso de distribución de Pareto produce tiempos entre llegadas independientes e idénticamente distribuidos (IID). En general, si X es una variable aleatoria con una distribución de Pareto, entonces la probabilidad de que X sea mayor que algún número x viene dada por P (X> x) = (x / x_m) -k para todo x ≥ x_m donde k es un parámetro positivo y x_m es el valor mínimo posible de Xi La distribución de probabilidad y las funciones de densidad se representan como: F (t) = 1 - (α / t) β donde α, β ≥ 0 & t ≥ α f (t) = βαβ t-β-1 Los parámetros β y α son los parámetros de forma y ubicación, respectivamente. La distribución de Pareto se aplica para modelar la llegada auto-similar en el tráfico de paquetes. También se conoce como distribución de ley de potencia doble exponencial. Otras características importantes del modelo son que la distribución de Pareto tiene varianza infinita, cuando β ≥ 2 y alcanza media infinita, cuando β ≤ 1.
- Proceso de distribución de Weibull :
El proceso distribuido de Weibull es de cola pesada y puede modelar la tasa fija en periodos ON y ON / OFF, cuando se produce tráfico auto-similar mediante la multiplexación de fuentes ON / OFF. La función de distribución en este caso viene dada por: F (t) = 1 - e- (t / β) α t> 0 y la función de densidad de la distribución de weibull está dada como: f (t) = αβ-α tα- 1 e - (t / β) α t> 0 donde los parámetros β ≥ 0 y α> 0 son los parámetros de escala y ubicación, respectivamente. La distribución de Weibull se acerca a una distribución normal. Para β ≤ 1, la función de densidad de la distribución tiene forma de L y para valores de β> 1, tiene forma de campana. Esta distribución da una tasa de fallas que aumenta con el tiempo. Para β> 1, la tasa de fallas disminuye con el tiempo. En, β = 1, la tasa de falla es constante y la vida útil se distribuye exponencialmente.
El modelo autorregresivo es uno de un grupo de fórmulas de predicción lineal que intentan predecir una salida y_n de un sistema basándose en un conjunto previo de salidas {y_k} donde k
Los modelos de regresión definen explícitamente la siguiente variable aleatoria en la secuencia por las anteriores dentro de una ventana de tiempo especificada y un promedio móvil de un ruido blanco. [5]
- Modelos TES :
Los modelos de transformación-expansión-muestra (TES) son modelos de regresión no lineal con aritmética módulo 1. Su objetivo es capturar tanto la autocorrelación como la distribución marginal de datos empíricos. Los modelos TES constan de dos procesos TES principales: TES + y TES–. TES + produce una secuencia que tiene una correlación positiva en el retraso 1, mientras que TES– produce una correlación negativa en el retraso 1. [16]
Modelos de tráfico no auto-similares
Los primeros modelos de tráfico se derivaron de modelos de telecomunicaciones y se centraron en la simplicidad de análisis. Por lo general, operaban bajo el supuesto de que la agregación del tráfico de un gran número de fuentes tendía a suavizar las ráfagas; esa explosión disminuyó a medida que aumentaba el número de fuentes de tráfico. [14]
- Modelo de distribución de Poisson :
Uno de los modelos de tráfico más antiguos y más utilizados es el modelo de Poisson. La distribución de Poisson sin memoria es el modelo predominante utilizado para analizar el tráfico en las redes de telefonía tradicionales. El proceso de Poisson se caracteriza por ser un proceso de renovación. En un proceso de Poisson, los tiempos entre llegadas se distribuyen exponencialmente con un parámetro de velocidad λ: P {An ≤ t} = 1 - exp (-λt). La distribución de Poisson es apropiada si las llegadas provienen de un gran número de fuentes independientes, denominadas fuentes de Poisson. La distribución tiene una media y varianza iguales al parámetro λ. La distribución de Poisson se puede visualizar como una forma limitante de la distribución binomial y también se usa ampliamente en modelos de colas. Hay una serie de propiedades matemáticas interesantes que exhiben los procesos de Poisson. Principalmente, la superposición de procesos de Poisson independientes da como resultado un nuevo proceso de Poisson cuya tasa es la suma de las tasas de los procesos de Poisson independientes. Además, la propiedad de incremento independiente hace que un proceso de Poisson carezca de memoria. Los procesos de Poisson son comunes en escenarios de aplicaciones de tráfico que consisten en una gran cantidad de flujos de tráfico independientes. La razón detrás del uso proviene del teorema de Palm, que establece que, en condiciones adecuadas, un número tan grande de flujos multiplexados independientes se acercan a un proceso de Poisson a medida que aumenta el número de procesos, pero las tasas individuales disminuyen para mantener constante la tasa agregada. La agregación de tráfico no siempre tiene por qué resultar en un proceso de Poisson. Los dos supuestos principales que hace el modelo de Poisson son: [14] 1. El número de fuentes es infinito 2. El patrón de llegada del tráfico es aleatorio.
En el modelo de Poisson compuesto, el modelo de Poisson base se amplía para entregar lotes de paquetes a la vez. Los tiempos de llegada entre lotes se distribuyen exponencialmente, mientras que el tamaño del lote es geométrico. Matemáticamente, este modelo tiene dos parámetros, λ, la tasa de llegada, y ρ en (0,1), el parámetro del lote. Por tanto, el número medio de paquetes en un lote es 1 / ρ, mientras que el tiempo medio de llegada entre lotes es 1 / λ. Las llegadas medias de paquetes durante el período de tiempo t son tλ / ρ. El modelo de Poisson compuesto comparte algunos de los beneficios analíticos del modelo de Poisson puro: el modelo todavía no tiene memoria, la agregación de corrientes sigue siendo (compuesta) de Poisson y la ecuación de estado estacionario sigue siendo razonablemente simple de calcular, aunque varía los parámetros de lote para flujos diferentes complicarían la derivación. [14]
- Modelos de Markov e incrustados de Markov:
Los modelos de Markov intentan modelar las actividades de una fuente de tráfico en una red, por un número finito de estados. La precisión del modelo aumenta linealmente con el número de estados usados en el modelo. Sin embargo, la complejidad del modelo también aumenta proporcionalmente con el aumento del número de estados. Un aspecto importante del modelo de Markov, la propiedad de Markov, establece que el siguiente estado (futuro) depende solo del estado actual. En otras palabras, la probabilidad del siguiente estado, denotado por alguna variable aleatoria Xn + 1, depende solo del estado actual, indicado por Xn, y no de ningún otro estado Xi, donde i
- Trenes de paquetes :
Otro intento de proporcionar un modelo de tráfico en ráfagas se encuentra en el modelo Packet Trains de Jain y Routhier. [17] Este modelo se diseñó principalmente para reconocer que la localidad de la dirección se aplica a las decisiones de enrutamiento; es decir, los paquetes que llegan cerca unos de otros en el tiempo con frecuencia van al mismo destino. Al generar un modelo de tráfico que permite un análisis más fácil de la localidad, los autores crearon la noción de trenes de paquetes, una secuencia de paquetes de la misma fuente, viajando al mismo destino (con respuestas en la dirección opuesta). Los trenes de paquetes se subdividen opcionalmente en remolques en tándem. El tráfico entre un origen y un destino generalmente consiste en una serie de mensajes de ida y vuelta. Por lo tanto, una serie de paquetes van en una dirección, seguidos de uno o más paquetes de respuesta, seguidos de una nueva serie en la dirección inicial. La cantidad de tráfico es entonces una superposición de trenes de paquetes, lo que genera un comportamiento sustancial en ráfagas. Esto refina la concepción general del modelo de Poisson compuesto, que reconoció que los paquetes llegaban en grupos, analizando por qué llegan en grupos y caracterizando mejor los atributos del grupo. Finalmente, los autores demuestran que los tiempos de llegada de los paquetes no están distribuidos por Poisson, lo que llevó a un modelo que se aparta de las variaciones sobre el tema de Poisson. El modelo de tren de paquetes se caracteriza por los siguientes parámetros y sus distribuciones de probabilidad asociadas:
- hora media de llegada entre trenes
- tiempo medio de llegada entre coches
- tamaño medio del camión (en el modelo de remolque tándem)
- tamaño medio del tren.
El modelo de tren está diseñado para analizar y categorizar el tráfico real, no para generar cargas sintéticas para simulación. Por lo tanto, se ha hecho poca afirmación sobre la viabilidad de los trenes de paquetes para generar tráfico sintético. Dados los parámetros y distribuciones precisos, la generación debería ser sencilla, pero no se aborda la derivación de estos parámetros. [14]
Modelos de tráfico hoy
NS-2 es un simulador de red popular; [18] PackMimeHTTP es un generador de tráfico web para NS-2, publicado en 2004. Tiene en cuenta dependencias de largo alcance y utiliza la distribución Weibull . Por lo tanto, se basa en colas pesadas para emular la verdadera auto-semejanza . En la mayoría de las escalas de tiempo, el esfuerzo es un éxito; sólo una simulación de larga duración permitiría establecer una distinción. Esto sigue las sugerencias de donde se sugiere que los procesos auto-similares se pueden representar como una superposición de muchas fuentes, cada una modelada individualmente con una distribución de cola gruesa. Está claro que los modelos de tráfico auto-similares están en la corriente principal. [14]
Ver también
- Modelo de generación de tráfico
- Modelo de tráfico
- Simulación de tráfico de red
Referencias
- ^ Willinger y Paxson (1998). "Donde las matemáticas se encuentran con Internet" (PDF) . AMS.
- ^ Park, Kihong; Willinger, Walter (2000). Evaluación de rendimiento y tráfico de red auto-similar . Nueva York: Wiley. doi : 10.1002 / 047120644X.fmatter_indsub . ISBN 978-0-471-31974-0.
- ^ Adas, A. (1997). "Modelos de tráfico en redes de banda ancha". Revista de comunicaciones IEEE . 35 (7): 82–89. CiteSeerX 10.1.1.23.1461 . doi : 10.1109 / 35.601746 . ISSN 0163-6804 .
- ^ Michiel, H .; Laevens, K. (1997). "Ingeniería de teletrafico en una era de banda ancha". Actas del IEEE . 85 (12): 2007-2033. doi : 10.1109 / 5.650182 . ISSN 0018-9219 .
- ^ Frost, VS; Melamed, B. (1994). "Modelado de tráfico para redes de telecomunicaciones". Revista de comunicaciones IEEE . 32 (3): 70–81. doi : 10.1109 / 35.267444 . ISSN 0163-6804 .
- ^ Chien-Hsing Wu; Huang-Pao Lin; Leu-Shing Lan (2002). "Un nuevo marco analítico para la gestión dinámica de la movilidad de las redes PCS". : Transacciones IEEE en Computación Móvil . 99 (3): 208–220. doi : 10.1109 / TMC.2002.1081756 .
- ^ Thajchayapong, S .; Peha, JM (2006). "Patrones de movilidad en redes inalámbricas microcelulares" . Transacciones IEEE sobre informática móvil . 5 (1): 52–63. doi : 10.1109 / tmc.2006.13 . ISSN 1536-1233 .
- ^ a b Thomas M. Chen (2007). "Modelado de tráfico de red" . Universidad Metodista del Sur, Dallas, Texas.
- ^ Kleinrock, Leonard (1975). Sistemas de colas (en alemán). Nueva York: Wiley. ISBN 978-0-471-49110-1.
- ^ Barakat, C .; Thiran, P .; Iannaccone, G .; Diot, C .; Owezarski, P. (2003). "Modelado del tráfico de la red troncal de Internet a nivel de flujo". Transacciones IEEE sobre procesamiento de señales . 51 (8): 2111–2124. CiteSeerX 10.1.1.2.8066 . doi : 10.1109 / tsp.2003.814521 . ISSN 1053-587X .
- ^ "Notas sobre anchos de banda efectivos" . Laboratorio de Estadística . Consultado el 26 de octubre de 2017 .
- ^ Nogueira, António; Salvador, Paulo; Valadas, Rui; Pacheco, António (2003). "Modelado del tráfico de red con comportamiento multifractal" (PDF) . Sistemas de telecomunicaciones . 24 (2/4): 339–362. doi : 10.1023 / a: 1026183318200 . ISSN 1018-4864 . Archivado desde el original (PDF) el 27 de octubre de 2017.
- ^ DK Arrowsmith, RJ Mondragon (2006). "Modelado del tráfico de datos de la red" (PDF) . Queen Mary, Universidad de Londres . Consultado el 26 de octubre de 2017 .
- ^ a b c d e f g h Chandrasekaran, Balakrishnan (27 de noviembre de 2006). "Encuesta de modelos de tráfico de red" . Universidad de Washington en St. Louis - Ciencias de la computación e ingeniería en WashU . Consultado el 26 de octubre de 2017 .
- ^ Wilson, Michael L. (2006). "Una vista histórica de los modelos de tráfico de red" . wustl.edu . Consultado el 26 de octubre de 2017 .
- ^ Jelenkovic, PR; Melamed, B. (1995). "Modelado algorítmico de procesos TES" (PDF) . Transacciones IEEE sobre control automático . 40 (7): 1305-1312. CiteSeerX 10.1.1.421.5082 . doi : 10.1109 / 9.400470 . ISSN 0018-9286 .
- ^ Jain, R .; Routhier, S. (1986). "Trenes de paquetes - Medidas y un nuevo modelo para el tráfico de redes informáticas". Revista IEEE sobre áreas seleccionadas en comunicaciones . 4 (6): 986–995. CiteSeerX 10.1.1.138.4617 . doi : 10.1109 / jsac.1986.1146410 . ISSN 0733-8716 .
- ^ "nsnam" . ns y nam Sourceforge home . 2010-04-05 . Consultado el 26 de octubre de 2017 .
- Max, G (1 de enero de 2011). "Modelado de redes informáticas" . Journal of Physics: Serie de conferencias . 268 : 012018. doi : 10.1088 / 1742-6596 / 268/1/012018 . ISSN 1742-6596 .
- Geist, Robert M; Westall, James M. (2001). "Efectos correlacionales y distributivos en modelos de tráfico de red". Evaluación de desempeño . 44 (1–4): 121–138. doi : 10.1016 / s0166-5316 (00) 00055-9 . ISSN 0166-5316 .