Este artículo tiene varios problemas. Ayude a mejorarlo o discuta estos problemas en la página de discusión . ( Obtenga información sobre cómo y cuándo eliminar estos mensajes de plantilla )
|
Sistemas de comunicaciones multimedia basados en paquetes | |
Estado | En vigor |
---|---|
Año iniciado | 1996 |
Ultima versión | 7.0 de diciembre de 2009 |
Organización | ITU-T |
Estándares relacionados | Q.931 |
Sitio web | https://www.itu.int/rec/T-REC-H.323 |
H.323 es una Recomendación del Sector de Normalización de las Telecomunicaciones de la UIT (UIT-T) que define los protocolos para proporcionar sesiones de comunicación audiovisual en cualquier red de paquetes . [1] El estándar H.323 aborda la señalización y el control de llamadas, el transporte y control multimedia y el control del ancho de banda para conferencias punto a punto y multipunto. [2]
Es ampliamente implementado [3] por fabricantes de equipos de voz y videoconferencia , se usa en varias aplicaciones de Internet en tiempo real como GnuGK y NetMeeting y es ampliamente implementado en todo el mundo por proveedores de servicios y empresas para servicios de voz y video a través de redes IP .
Es parte de la serie de protocolos ITU-T H.32x, que también se ocupa de las comunicaciones multimedia a través de ISDN , PSTN o SS7 y redes móviles 3G .
La señalización de llamadas H.323 se basa en el protocolo de la Recomendación UIT-T Q.931 y es adecuada para transmitir llamadas a través de redes utilizando una combinación de IP, PSTN, ISDN y QSIG sobre ISDN. Un modelo de llamada, similar al modelo de llamada ISDN, facilita la introducción de telefonía IP en las redes existentes de sistemas PBX basados en ISDN , incluidas las transiciones a PBX basadas en IP.
Dentro del contexto de H.323, una PBX basada en IP podría ser un portero u otro elemento de control de llamadas que brinde servicio a teléfonos o videoteléfonos . Dicho dispositivo puede proporcionar o facilitar tanto servicios básicos como servicios complementarios, como transferencia , estacionamiento , recogida y retención de llamadas .
La primera versión de H.323 fue publicada por la UIT en noviembre de 1996 [4] con un énfasis en habilitar capacidades de videoconferencia a través de una red de área local (LAN), pero fue rápidamente adoptada por la industria como un medio de transmisión de comunicaciones de voz a través de una red. variedad de redes IP, incluidas las WAN e Internet (consulte VoIP ).
A lo largo de los años, H.323 se ha revisado y vuelto a publicar con las mejoras necesarias para habilitar mejor la funcionalidad de voz y video en redes de conmutación de paquetes , y cada versión es compatible con la versión anterior. [5] Reconociendo que H.323 se estaba utilizando para la comunicación no solo en LAN, sino también en WAN y dentro de grandes redes de operadores, el título de H.323 se cambió cuando se publicó en 1998. [6] El título, que se ha mantenido desde entonces sin cambios, es "Sistemas de comunicaciones multimedia basados en paquetes". La versión actual de H.323 se aprobó en 2009. [7]
Una fortaleza de H.323 fue la disponibilidad relativamente temprana de un conjunto de estándares que no solo definen el modelo básico de llamadas, sino también los servicios complementarios necesarios para abordar las expectativas de comunicación empresarial. [ cita requerida ]
H.323 fue el primer estándar de VoIP en adoptar el protocolo de transporte en tiempo real (RTP) estándar del Grupo de trabajo de ingeniería de Internet (IETF ) para transportar audio y video a través de redes IP. [ cita requerida ]
H.323 es una especificación del sistema que describe el uso de varios protocolos ITU-T e IETF. Los protocolos que componen el núcleo de casi cualquier sistema H.323 son: [8]
Muchos sistemas H.323 también implementan otros protocolos que se definen en varias Recomendaciones UIT-T para proporcionar soporte de servicios suplementarios o entregar otras funcionalidades al usuario. Algunas de esas Recomendaciones son: [ cita requerida ]
Además de esas Recomendaciones UIT-T, H.323 implementa varias solicitudes de comentarios (RFC) de IETF para el transporte de medios y la paquetización de medios, incluido el Protocolo de transporte en tiempo real (RTP).
H.323 utiliza tanto la UIT-definido códecs y codecs definidos fuera de la UIT. Los códecs que son ampliamente implementados por equipos H.323 incluyen:
Todos los terminales H.323 que proporcionen comunicaciones de vídeo deberán poder codificar y decodificar vídeo de acuerdo con H.261 QCIF . Todos los terminales H.323 tendrán un códec de audio y podrán codificar y decodificar la voz de acuerdo con la Rec. UIT-T. G.711. Todos los terminales deberán ser capaces de transmitir y recibir de ley A y μ-ley . El soporte para otros códecs de audio y video es opcional. [7]
El sistema H.323 define varios elementos de red que trabajan juntos para ofrecer capacidades de comunicación multimedia enriquecidas. Esos elementos son terminales, unidades de control multipunto (MCU), puertas de enlace, guardianes y elementos fronterizos. En conjunto, los terminales, las unidades de control multipunto y las puertas de enlace se denominan a menudo puntos finales . H.323 usa el número de puerto TCP 1720.
Si bien no se requieren todos los elementos, se requieren al menos dos terminales para permitir la comunicación entre dos personas. En la mayoría de las implementaciones de H.323, se emplea un controlador de acceso para, entre otras cosas, facilitar la resolución de direcciones.
Los terminales en una red H.323 son los elementos más fundamentales en cualquier sistema H.323, ya que esos son los dispositivos que los usuarios normalmente encontrarían. Pueden existir en forma de un simple teléfono IP o un poderoso sistema de videoconferencia de alta definición.
Dentro de un terminal H.323 hay algo que se conoce como pila de protocolos , que implementa la funcionalidad definida por el sistema H.323. La pila de protocolos incluiría una implementación del protocolo básico definido en las Recomendaciones UIT-T H.225.0 y H.245, así como RTP u otros protocolos descritos anteriormente.
El diagrama, figura 1, muestra una pila completa y sofisticada que brinda soporte para voz, video y varias formas de comunicación de datos. En realidad, la mayoría de los sistemas H.323 no implementan una gama tan amplia de capacidades, pero la disposición lógica es útil para comprender las relaciones.
Una unidad de control multipunto (MCU) es responsable de administrar conferencias multipunto y está compuesta por dos entidades lógicas denominadas Controlador multipunto (MC) y Procesador multipunto (MP). En términos más prácticos, una MCU es un puente de conferencia similar a los puentes de conferencia que se utilizan en la PSTN en la actualidad. Sin embargo, la diferencia más significativa es que las MCU H.323 pueden ser capaces de mezclar o cambiar video, además de la mezcla de audio normal realizada por un puente de conferencia tradicional. Algunas MCU también proporcionan capacidades de colaboración de datos multipunto. Lo que esto significa para el usuario final es que, al realizar una videollamada en una MCU H.323, el usuario podría ver a todos los demás participantes en la conferencia, no solo escuchar sus voces.
Las puertas de enlace son dispositivos que permiten la comunicación entre redes H.323 y otras redes, como las redes PSTN o ISDN. Si una de las partes en una conversación está utilizando un terminal que no es un terminal H.323, entonces la llamada debe pasar a través de una puerta de enlace para permitir que ambas partes se comuniquen.
Las puertas de enlace se utilizan ampliamente en la actualidad para permitir que los teléfonos PSTN heredados se interconecten con las grandes redes internacionales H.323 que actualmente implementan los proveedores de servicios. Las puertas de enlace también se utilizan dentro de la empresa para permitir que los teléfonos IP empresariales se comuniquen a través del proveedor de servicios con los usuarios de la PSTN.
Las puertas de enlace también se utilizan para permitir que los dispositivos de videoconferencia basados en H.320 y H.324 se comuniquen con los sistemas H.323. La mayoría de las redes móviles de tercera generación (3G) implementadas en la actualidad utilizan el protocolo H.324 y pueden comunicarse con terminales basados en H.323 en redes corporativas a través de dichos dispositivos de puerta de enlace.
Un Gatekeeper es un componente opcional en la red H.323 que proporciona una serie de servicios a terminales, puertas de enlace y dispositivos MCU. Esos servicios incluyen el registro de terminales, la resolución de direcciones, el control de admisión, la autenticación de usuarios, etc. De las diversas funciones que realiza el controlador de acceso, la resolución de direcciones es la más importante, ya que permite que dos puntos finales se contacten entre sí sin que ninguno de ellos tenga que conocer la dirección IP del otro punto final.
Los controladores de acceso pueden diseñarse para operar en uno de dos modos de señalización, a saber, el modo "enrutado directo" y el modo "enrutado por el guardián de puerta". El modo de enrutamiento directo es el modo más eficiente y más implementado. En este modo, los puntos finales utilizan el protocolo RAS para conocer la dirección IP del punto final remoto y se establece una llamada directamente con el dispositivo remoto. En el modo enrutado del portero, la señalización de llamadas siempre pasa a través del portero. Si bien este último requiere que el controlador de acceso tenga más poder de procesamiento, también le da al controlador de acceso un control completo sobre la llamada y la capacidad de proporcionar servicios suplementarios en nombre de los puntos finales.
Los puntos finales H.323 utilizan el protocolo RAS para comunicarse con un controlador de acceso. Asimismo, los guardianes utilizan RAS para comunicarse con otros guardianes.
Una colección de puntos extremos que están registrados en un solo controlador de acceso en H.323 se denomina "zona". Esta colección de dispositivos no necesariamente tiene que tener una topología física asociada. Más bien, una zona puede ser completamente lógica y el administrador de la red la define arbitrariamente .
Los guardianes tienen la capacidad de comunicarse entre sí para que la resolución de llamadas pueda ocurrir entre zonas. Vecino facilita el uso de planes de marcación como el Esquema de marcación global . Los planes de marcación facilitan la marcación "entre zonas" para que dos puntos finales en zonas separadas aún puedan comunicarse entre sí.
Los elementos fronterizos y los elementos pares son entidades opcionales similares a un controlador de acceso, pero que no gestionan los puntos extremos directamente y proporcionan algunos servicios que no se describen en el protocolo RAS. El papel de un elemento fronterizo o par se entiende a través de la definición de un " dominio administrativo ".
Un dominio administrativo es la colección de todas las zonas que están bajo el control de una sola persona u organización, como un proveedor de servicios. Dentro de la red de un proveedor de servicios puede haber cientos o miles de dispositivos de puerta de enlace, teléfonos, terminales de video u otros elementos de red H.323. El proveedor de servicios puede organizar los dispositivos en "zonas" que le permitan administrar mejor todos los dispositivos bajo su control, como la disposición lógica por ciudad. En conjunto, todas las zonas dentro de la red del proveedor de servicios le aparecerían a otro proveedor de servicios como un "dominio administrativo".
El elemento de frontera es una entidad de señalización que generalmente se encuentra en el borde del dominio administrativo y se comunica con otro dominio administrativo. Esta comunicación puede incluir cosas tales como información de autorización de acceso; información de precios de llamadas; u otros datos importantes necesarios para permitir la comunicación entre los dos dominios administrativos.
Los elementos par son entidades dentro del dominio administrativo que, más o menos, ayudan a propagar la información aprendida de los elementos fronterizos por todo el dominio administrativo. Dicha arquitectura está destinada a permitir despliegues a gran escala dentro de las redes de operadores y habilitar servicios como cámaras de compensación .
El diagrama, figura 2, proporciona una ilustración de un dominio administrativo con elementos de borde, elementos de pares y guardianes.
H.323 se define como un protocolo binario , que permite el procesamiento eficiente de mensajes en elementos de red. La sintaxis del protocolo se define en ASN.1 y utiliza la forma de codificación de mensajes Packed Encoding Rules (PER) para una codificación de mensajes eficiente en el cable. A continuación se muestra una descripción general de los distintos flujos de comunicación en los sistemas H.323.
Una vez que se resuelve la dirección del punto final remoto, el punto final utilizará la señalización de llamada H.225.0 para establecer comunicación con la entidad remota. Los mensajes H.225.0 son:
En la forma más simple, una llamada H.323 puede establecerse de la siguiente manera (figura 3).
En este ejemplo, el punto final (EP) de la izquierda inició la comunicación con la puerta de enlace de la derecha y la puerta de enlace conectó la llamada con la parte llamada. En realidad, los flujos de llamadas suelen ser más complejos que el que se muestra, pero la mayoría de las llamadas que utilizan los procedimientos Fast Connect definidos en H.323 se pueden establecer con tan solo 2 o 3 mensajes. Los puntos finales deben notificar a su portero (si se utilizan porteros) que están en una llamada.
Una vez que una llamada ha concluido, un dispositivo enviará un mensaje de Liberación completa. A continuación, se requiere que los puntos finales notifiquen a su controlador de acceso (si se utilizan controladores de acceso) que la llamada ha finalizado.
Los puntos finales utilizan el protocolo RAS para comunicarse con un portero. Del mismo modo, los guardianes utilizan RAS para comunicarse con los guardianes del mismo nivel. RAS es un protocolo bastante simple compuesto por unos pocos mensajes. A saber:
Cuando se enciende un punto final, generalmente enviará un mensaje de solicitud de guardián (GRQ) para "descubrir" los guardianes que estén dispuestos a brindar el servicio. Los gatekeepers responderán con una confirmación de gatekeeper (GCF) y el punto final seleccionará un gatekeeper con el que trabajar. Alternativamente, es posible que se haya predefinido un controlador de acceso en la configuración administrativa del sistema, por lo que no es necesario que el punto final descubra uno.
Una vez que el punto final determina el controlador de acceso con el que trabajar, intentará registrarse con el controlador de acceso enviando una solicitud de registro (RRQ), a la que el controlador de acceso responde con una confirmación de registro (RCF). En este punto, la red conoce el punto final y puede realizar y realizar llamadas.
Cuando un punto final desea realizar una llamada, enviará una solicitud de admisión (ARQ) al portero. El portero resolverá entonces la dirección (ya sea localmente, consultando a otro portero o consultando algún otro servicio de red) y devolverá la dirección del punto final remoto en el mensaje de confirmación de admisión (ACF). El punto final puede entonces realizar la llamada.
Al recibir una llamada, un punto final remoto también enviará un ARQ y recibirá un ACF para obtener permiso para aceptar la llamada entrante. Esto es necesario, por ejemplo, para autenticar el dispositivo que llama o para garantizar que haya ancho de banda disponible para la llamada.
La Figura 4 muestra un intercambio de comunicación de alto nivel entre dos puntos finales (EP) y dos guardianes (GK).
Una vez que se ha iniciado una llamada (pero no necesariamente completamente conectada), los puntos extremos pueden iniciar la señalización de control de llamada H.245 para proporcionar un control más amplio sobre la conferencia. H.245 es una especificación bastante voluminosa con muchos procedimientos que permiten completamente la comunicación multipunto, aunque en la práctica la mayoría de las implementaciones solo implementan el mínimo necesario para permitir la comunicación de voz y video punto a punto .
H.245 proporciona capacidades tales como negociación de capacidad, determinación maestro / esclavo , apertura y cierre de "canales lógicos" (es decir, flujos de audio y video), control de flujo y control de conferencias. Tiene soporte para comunicaciones unidifusión y multidifusión , lo que permite que el tamaño de una conferencia crezca teóricamente sin límites.
De la funcionalidad proporcionada por H.245, la negociación de capacidad es posiblemente la más importante, ya que permite que los dispositivos se comuniquen sin tener conocimiento previo de las capacidades de la entidad remota. H.245 permite ricas capacidades multimedia, que incluyen comunicación de audio, video, texto y datos. Para la transmisión de audio, video o texto, los dispositivos H.323 utilizan códecs definidos por la UIT y códecs definidos fuera de la UIT. Los códecs que son ampliamente implementados por equipos H.323 incluyen:
H.245 también permite la capacidad de conferencias de datos en tiempo real a través de protocolos como T.120 . Las aplicaciones basadas en T.120 generalmente operan en paralelo con el sistema H.323, pero están integradas para brindar al usuario una experiencia multimedia perfecta. T.120 proporciona capacidades tales como compartir aplicaciones T.128 , pizarra electrónica T.126 , transferencia de archivos T.127 y chat de texto T.134 en el contexto de la conferencia.
Cuando un dispositivo H.323 inicia la comunicación con un dispositivo H.323 remoto y cuando se establece la comunicación H.245 entre las dos entidades, el mensaje Terminal Capability Set (TCS) es el primer mensaje transmitido al otro lado.
Después de enviar un mensaje TCS, las entidades H.323 (a través de intercambios H.245) intentarán determinar qué dispositivo es el "maestro" y cuál es el "esclavo". Este proceso, denominado Determinación Maestro / Esclavo (MSD), es importante, ya que el maestro en una llamada resuelve todas las "disputas" entre los dos dispositivos. Por ejemplo, si ambos extremos intentan abrir flujos de medios incompatibles, es el maestro quien toma la acción para rechazar el flujo incompatible.
Una vez que se intercambian las capacidades y se han completado los pasos de determinación de maestro / esclavo, los dispositivos pueden abrir "canales lógicos" o flujos de medios. Esto se hace simplemente enviando un mensaje de Canal Lógico Abierto (OLC) y recibiendo un mensaje de reconocimiento. Tras la recepción del mensaje de acuse de recibo, un punto final puede transmitir audio o vídeo al punto final remoto.
Un intercambio H.245 típico se parece a la figura 5:
Después de este intercambio de mensajes, los dos puntos finales (EP) en esta figura estarían transmitiendo audio en cada dirección. El número de intercambios de mensajes es numeroso, cada uno tiene un propósito importante, pero no obstante lleva tiempo.
Por esta razón, la versión 2 de H.323 (publicada en 1998) introdujo un concepto llamado Fast Connect, que permite que un dispositivo establezca flujos de medios bidireccionales como parte de los procedimientos de establecimiento de llamadas H.225.0. Con Fast Connect, es posible establecer una llamada con medios bidireccionales que fluyen con no más de dos mensajes, como en la figura 3.
Fast Connect cuenta con un amplio soporte en la industria. Aun así, la mayoría de los dispositivos aún implementan el intercambio H.245 completo como se muestra arriba y realizan ese intercambio de mensajes en paralelo con otras actividades, por lo que no hay una demora notable para la parte que llama o la parte llamada.
Voice over Internet Protocol (VoIP) describe la transmisión de voz a través de Internet u otras redes de conmutación de paquetes. La Recomendación UIT-T H.323 es uno de los estándares utilizados en VoIP. VoIP requiere una conexión a Internet u otra red de conmutación de paquetes, una suscripción a un proveedor de servicios de VoIP y un cliente (un adaptador de teléfono analógico (ATA), teléfono VoIP o " soft phone "). El proveedor de servicios ofrece la conexión a otros servicios VoIP o PSTN. La mayoría de los proveedores de servicios cobran una tarifa mensual y luego los costos adicionales cuando se realizan las llamadas. [ cita requerida ]El uso de VoIP entre dos ubicaciones empresariales no necesariamente requeriría un proveedor de servicios de VoIP, por ejemplo. H.323 ha sido ampliamente implementado por empresas que desean interconectar ubicaciones remotas a través de IP utilizando varias tecnologías cableadas e inalámbricas.
Una videoconferencia, o videoteleconferencia (VTC), es un conjunto de tecnologías de telecomunicaciones que permiten que dos o más ubicaciones interactúen a través de transmisiones de audio y video bidireccionales simultáneamente. Básicamente, existen dos tipos de videoconferencia; Los sistemas VTC dedicados tienen todos los componentes necesarios empaquetados en una sola pieza de equipo, mientras que los sistemas VTC de escritorio son complementos de las PC normales ., transformándolos en dispositivos VTC. Es posible realizar videoconferencias simultáneas entre tres o más puntos remotos mediante una unidad de control multipunto (MCU). Hay puentes MCU para videoconferencias basadas en IP e ISDN. Debido al precio y la proliferación de Internet, y de la banda ancha en particular, ha habido un fuerte crecimiento y uso de videoconferencias IP basadas en H.323. H.323 es accesible para cualquier persona con una conexión a Internet de alta velocidad, como DSL . La videoconferencia se utiliza en diversas situaciones, por ejemplo; educación a distancia , telemedicina , servicio de retransmisión de video y negocios. [ cita requerida ] [ necesita actualización ]