De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

H.261 es un estándar de compresión de video del UIT-T , ratificado por primera vez en noviembre de 1988. [1] [2] Es el primer miembro de la familia de estándares de codificación de video H.26x en el dominio de la Comisión de Estudio 16 del UIT-T Video Coding Experts Group ( VCEG , entonces Specialists Group on Coding for Visual Telephony), y fue desarrollado con varias empresas, incluidas Hitachi , PictureTel , NTT , BT y Toshiba . Fue el primer estándar de codificación de video que resultó útil en términos prácticos.

H.261 se diseñó originalmente para la transmisión a través de líneas RDSI en las que las velocidades de datos son múltiplos de 64 kbit / s. El algoritmo de codificación fue diseñado para poder operar a velocidades de bits de video entre 40 kbit / sy 2 Mbit / s. El estándar admite dos tamaños de fotogramas de vídeo: CIF (352 × 288 luma con 176 × 144 croma) y QCIF (176 × 144 con 88 × 72 croma) utilizando un esquema de muestreo 4: 2: 0 . También tiene un truco compatible con versiones anteriores para enviar imágenes fijas con una resolución de luma de 704 × 576 y una resolución de croma de 352 × 288 (que se agregó en una revisión posterior en 1993).

Historia [ editar ]

La transformada de coseno discreta (DCT), una forma de compresión con pérdida , fue propuesta por primera vez por Nasir Ahmed en 1972. [3] Ahmed desarrolló un algoritmo de trabajo con T. Natarajan y KR Rao en 1973, [3] y lo publicó en 1974. [4] [5] DCT se convertiría más tarde en la base de H.261. [6]

El primer estándar de codificación de vídeo digital fue H.120 , creado por el CCITT (ahora ITU-T) en 1984. [7] H.120 no se podía utilizar en la práctica porque su rendimiento era demasiado bajo. [7] H.120 se basó en la modulación diferencial de código de impulsos (DPCM), que tenía una compresión ineficiente. A fines de la década de 1980, varias empresas comenzaron a experimentar con la compresión DCT mucho más eficiente para la codificación de video, y el CCITT recibió 14 propuestas para formatos de compresión de video basados ​​en DCT, en contraste con una propuesta única basada en la compresión de cuantización vectorial (VQ). . El estándar H.261 se desarrolló posteriormente sobre la base de la compresión DCT. [6]

H.261 fue desarrollado por el Grupo de Especialistas de la Comisión de Estudio XV del CCITT en Codificación para Telefonía Visual (que luego pasó a formar parte de la SG16 del UIT-T), presidido por Sakae Okubo de NTT . [8] Varias empresas participaron en su desarrollo, incluidas Hitachi , PictureTel , NTT , BT y Toshiba , entre otras. [9] Desde H.261, la compresión DCT ha sido adoptada por todos los principales estándares de codificación de video que le siguieron. [6]

Mientras que H.261 fue precedido en 1984 por H.120 (que también se sometió a una revisión en 1988 de cierta importancia histórica) como estándar de codificación de video digital, H.261 fue el primer estándar de codificación de video digital verdaderamente práctico (en términos de soporte de producto en cantidades significativas). De hecho, todos los estándares de codificación de video internacionales posteriores ( MPEG-1 Parte 2 , H.262 / MPEG-2 Parte 2 , H.263 , MPEG-4 Parte 2 , H.264 / MPEG-4 Parte 10 y HEVC ) tienen se ha basado estrechamente en el diseño H.261. Además, los métodos utilizados por el comité de desarrollo H.261 para desarrollar en colaboración el estándar han seguido siendo el proceso operativo básico para el trabajo de estandarización posterior en el campo. [8]

Aunque H.261 se aprobó por primera vez como estándar en 1988, a la primera versión le faltaban algunos elementos importantes necesarios para convertirla en una especificación de interoperabilidad completa . Varias partes del mismo se marcaron como "En estudio". [2] Posteriormente se revisó en 1990 para agregar los aspectos necesarios restantes, [10] y luego se revisó nuevamente en 1993. [11] La revisión de 1993 agregó un anexo D titulado "Transmisión de imágenes fijas", que proporcionaba una compatibilidad con versiones anteriores forma de enviar imágenes fijas con una resolución de luma de 704 × 576 y una resolución de croma de 352 × 288 utilizando un submuestreo escalonado 2: 1 horizontal y verticalmente para separar la imagen en cuatro subimágenes que se enviaron secuencialmente.[11]

Diseño H.261 [ editar ]

La unidad de procesamiento básica del diseño se llama macrobloque , y H.261 fue el primer estándar en el que apareció el concepto de macrobloque. Cada macrobloque consta de una matriz de 16 × 16 de muestras de luma y dos matrices de 8 × 8 correspondientes de muestras de croma , utilizando un muestreo 4: 2: 0 y un espacio de color YCbCr . El algoritmo de codificación utiliza un híbrido de predicción entre imágenes con compensación de movimiento y codificación de transformación espacial con cuantificación escalar , escaneo en zig-zag y codificación de entropía .

La predicción entre imágenes reduce la redundancia temporal, con vectores de movimiento utilizados para compensar el movimiento. Si bien H.261 solo admite vectores de movimiento con valores enteros, se puede aplicar un filtro de desenfoque a la señal de predicción, lo que mitiga parcialmente la falta de precisión del vector de movimiento de muestra fraccionaria. La codificación de transformación utilizando una transformada de coseno discreta (DCT) de 8 × 8 reduce la redundancia espacial. El DCT que se utiliza ampliamente a este respecto fue introducido por N. Ahmed , T. Natarajan y KR Rao en 1974. [12]Luego se aplica la cuantificación escalar para redondear los coeficientes de transformación a la precisión apropiada determinada por un parámetro de control de tamaño de paso, y los coeficientes de transformación cuantificados se escanean en zig-zag y se codifican en entropía (utilizando un código de longitud variable de "nivel de ejecución " ) para eliminar la redundancia estadística.

El estándar H.261 en realidad solo especifica cómo decodificar el video. Los diseñadores de codificadores tuvieron la libertad de diseñar sus propios algoritmos de codificación (como sus propios algoritmos de estimación de movimiento ), siempre que su salida estuviera restringida adecuadamente para permitir que cualquier decodificador fabricado de acuerdo con el estándar lo decodificara. Los codificadores también tienen libertad para realizar cualquier preprocesamiento que deseen para su video de entrada, y los decodificadores pueden realizar cualquier posprocesamiento que deseen para su video decodificado antes de mostrarlo. Una técnica de posprocesamiento eficaz que se convirtió en un elemento clave de los mejores sistemas basados ​​en H.261 se llama filtrado de desbloqueo . Esto reduce la apariencia de artefactos en forma de bloque causados ​​por la compensación de movimiento basada en bloques.y transformación espacial de partes del diseño. De hecho, los artefactos de bloqueo son probablemente un fenómeno familiar para casi todos los que han visto videos digitales. Desde entonces, el filtrado de desbloqueo se ha convertido en una parte integral de los estándares más recientes H.264 y HEVC (aunque incluso cuando se utilizan estos estándares más nuevos, aún se permite el posprocesamiento adicional y puede mejorar la calidad visual si se realiza bien).

Los refinamientos de diseño introducidos en los esfuerzos de estandarización posteriores han dado como resultado mejoras significativas en la capacidad de compresión en relación con el diseño H.261. Esto ha hecho que H.261 se vuelva esencialmente obsoleto, aunque todavía se usa como un modo de compatibilidad con versiones anteriores en algunos sistemas de videoconferencia (como H.323 ) y para algunos tipos de video de Internet. Sin embargo, H.261 sigue siendo un hito histórico importante en el campo del desarrollo de la codificación de video.

Implementaciones de software [ editar ]

La LGPL -licensed libavcodec incluye un codificador H.261 y decodificador. Es compatible con el reproductor multimedia VLC gratuito y los reproductores multimedia MPlayer , y en proyectos de decodificadores ffdshow y FFmpeg .

Titulares de patentes [ editar ]

Las siguientes empresas contribuyeron con patentes para el desarrollo del formato H.261: [13]

  • Hitachi
  • PictureTel Corp.
  • Graphics Communication Technologies, Ltd. [14]
  • Nippon Telegraph and Telephone (NTT)
  • Grupo BT
  • Toshiba
  • KDDI
  • Alcatel
  • Laboratorios de compresión, Inc.
  • Corporación AT&T
  • Sistemas de datos GPT ( GEC )
  • Philips
  • Sony
  • Sharp Corporation
  • Industria eléctrica de Oki
  • Matsushita Communication Industrial Co., Ltd.
  • Mitsubishi Electric
  • Fujitsu
  • Orange SA
  • Comité ejecutivo nacional
  • Instituto de Investigación en Electrónica y Telecomunicaciones

Ver también [ editar ]

  • Compresión de video
  • CIF - Formato intermedio común

Referencias [ editar ]

  1. ^ "(Documento de posición de Nokia) Arquitectura web y consideraciones de códec para servicios audiovisuales" (PDF) . H.261, que (en su primera versión) fue ratificado en noviembre de 1988.
  2. ^ a b UIT-T (1988). "H.261: Códec de vídeo para servicios audiovisuales a px 384 kbit / s - Recomendación H.261 (11/88)" . Consultado el 21 de octubre de 2010 .
  3. ↑ a b Ahmed, Nasir (enero de 1991). "Cómo se me ocurrió la transformada discreta del coseno" . Procesamiento de señales digitales . 1 (1): 4–5. doi : 10.1016 / 1051-2004 (91) 90086-Z .
  4. ^ Ahmed, Nasir ; Natarajan, T .; Rao, KR (enero de 1974), "Discrete Cosine Transform", IEEE Transactions on Computers , C-23 (1): 90–93, doi : 10.1109 / TC.1974.223784
  5. ^ Rao, KR ; Yip, P. (1990), Transformada discreta del coseno: algoritmos, ventajas, aplicaciones , Boston: Academic Press, ISBN 978-0-12-580203-1
  6. ↑ a b c Ghanbari, Mohammed (2003). Códecs estándar: compresión de imágenes a codificación de video avanzada . Institución de Ingeniería y Tecnología . págs. 1-2. ISBN 9780852967102.
  7. ^ a b "La historia de la infografía de formatos de archivo de vídeo" . RealNetworks . 22 de abril de 2012 . Consultado el 5 de agosto de 2019 .
  8. ^ a b S. Okubo, "Metodología del modelo de referencia - Una herramienta para la creación colaborativa de estándares de codificación de video", Actas del IEEE , vol. 83, no. 2, febrero de 1995, págs. 139–150
  9. ^ "Recomendación UIT-T declarada patente (s)" . ITU . Consultado el 12 de julio de 2019 .
  10. ^ UIT-T (1990). "H.261: Códec de vídeo para servicios audiovisuales a px 64 kbit / s - Recomendación H.261 (12/90)" . Consultado el 10 de diciembre de 2015 .
  11. ^ a b UIT-T (1993). "H.261: Códec de vídeo para servicios audiovisuales a px 64 kbit / s - Recomendación H.261 (03/93)" . Consultado el 10 de diciembre de 2015 .
  12. ^ N. Ahmed, T. Natarajan y KR Rao, "Discrete Cosine Transform", IEEE Transactions on Computers , enero de 1974, págs. 90-93; Archivo PDF .
  13. ^ "Recomendación UIT-T declarada patente (s)" . ITU . Consultado el 12 de julio de 2019 .
  14. ^ "Declaración de declaración de patente registrada como H261-07" . ITU . Consultado el 11 de julio de 2019 .

Enlaces externos [ editar ]

  • H.261 (03/93): Códec de vídeo para servicios audiovisuales a px 64 kbit / s ( UIT )