De Wikipedia, la enciclopedia libre
  (Redirigido desde 4: 2: 0 )
Saltar a navegación Saltar a búsqueda

El submuestreo de croma es la práctica de codificar imágenes implementando menos resolución para la información de croma que para la información de luma , aprovechando la menor agudeza del sistema visual humano para las diferencias de color que para la luminancia. [1]

Se utiliza en muchos esquemas de codificación de video, tanto analógicos como digitales, y también en codificación JPEG .

Justificación [ editar ]

En tamaño completo , esta imagen muestra la diferencia entre cuatro esquemas de submuestreo. Tenga en cuenta lo similares que aparecen las imágenes en color. La fila inferior muestra la resolución de la información de color.

Las señales digitales a menudo se comprimen para reducir el tamaño del archivo y ahorrar tiempo de transmisión. Dado que el sistema visual humano es mucho más sensible a las variaciones de brillo que al color, un sistema de vídeo se puede optimizar dedicando más ancho de banda al componente de luminancia (normalmente denominado Y ') que a los componentes de diferencia de color Cb y Cr. En imágenes comprimidas, por ejemplo, el esquema 4: 2: 2 Y'CbCr requiere dos tercios del ancho de banda de "4: 4: 4" R'G'B 'sin submuestreo . Esta reducción da como resultado casi ninguna diferencia visual percibida por el espectador.

Cómo funciona el submuestreo [ editar ]

A distancias de visualización normales, no se produce ninguna pérdida perceptible al muestrear el detalle del color a una velocidad más baja, es decir, con una resolución más baja. En los sistemas de video, esto se logra mediante el uso de componentes de diferencia de color. La señal se divide en un componente de luma (Y ') y dos componentes de diferencia de color ( croma ). Se puede utilizar una variedad de métodos de filtrado para llegar a los valores de croma con resolución reducida. [2]

Luma (Y ') se diferencia de la luminancia (Y) por la presencia de corrección gamma en su cálculo, de ahí el símbolo principal agregado aquí. Una señal con corrección de gamma tiene la ventaja de emular la sensibilidad logarítmica de la visión humana, con más niveles dedicados a los niveles más oscuros que a los más claros. Como resultado, se utiliza de forma ubicua en la fuente triestímulo señal, el R'G'B' de entrada. Ejemplos de tales espacios de color incluyen sRGB , TV Rec. 601 , Rec. 709 y Rec. 2020 ; el concepto también se generaliza a las funciones de transferencia óptica en la Rec. 2020 . [2] [3] [4]

Sistemas y proporciones de muestreo [ editar ]

El esquema de submuestreo se expresa comúnmente como una relación de tres partes J : a : b (por ejemplo, 4: 2: 2) o cuatro partes, si el canal alfa está presente (por ejemplo, 4: 2: 2: 4), que describen el número de muestras de luminancia y crominancia en una región conceptual de J píxeles de ancho y 2 píxeles de alto. Las partes son (en su orden respectivo):

  • J : referencia de muestreo horizontal (ancho de la región conceptual). Por lo general, 4.
  • a : número de muestras de crominancia (Cr, Cb) en la primera fila de J píxeles.
  • b : número de cambios de muestras de crominancia (Cr, Cb) entre la primera y la segunda fila de J píxeles. Tenga en cuenta que b tiene que ser cero o igual a a (excepto en raros casos irregulares como 4: 4: 1 y 4: 2: 1, que no siguen esta convención).
  • Alfa : factor horizontal (relativo al primer dígito). Puede omitirse si el componente alfa no está presente y es igual a J cuando está presente.

Esta notación no es válida para todas las combinaciones y tiene excepciones, por ejemplo, 4: 1: 0 (donde la altura de la región no es de 2 píxeles, sino de 4 píxeles, por lo que si se utilizan 8 bits por componente, el medio sería de 9 bits por píxel) y 4: 2: 1.


Los ejemplos de mapeo dados son solo teóricos y con fines ilustrativos. También tenga en cuenta que el diagrama no indica ningún filtro de crominancia, que debe aplicarse para evitar el alias .

Para calcular el factor de ancho de banda requerido en relación con 4: 4: 4 (o 4: 4: 4: 4), es necesario sumar todos los factores y dividir el resultado por 12 (o 16, si alfa está presente).

Tipos de muestreo y submuestreo [ editar ]

4: 4: 4 [ editar ]

Cada uno de los tres componentes Y'CbCr tiene la misma frecuencia de muestreo, por lo que no hay submuestreo de croma. Este esquema se utiliza a veces en escáneres de películas de alta gama y en postproducción cinematográfica.

Tenga en cuenta que "4: 4: 4" puede estar refiriéndose al espacio de color R'G'B ' , que implícitamente tampoco tiene ningún submuestreo de croma. Los formatos como HDCAM SR pueden grabar 4: 4: 4 R'G'B 'sobre HD-SDI de doble enlace .

4: 2: 2 [ editar ]

Los dos componentes cromáticos se muestrean a la mitad de la frecuencia de muestreo horizontal de luma: la resolución cromática horizontal se reduce a la mitad. Esto reduce el ancho de banda de una señal de video sin comprimir en un tercio.

Muchos formatos e interfaces de video digital de alta gama utilizan este esquema:

  • AVC-Intra 100
  • Betacam digital
  • Betacam SX
  • DVCPRO50 y DVCPRO HD
  • Digital-S
  • CCIR 601 / Interfaz digital en serie / D1
  • ProRes (HQ, 422, LT y Proxy)
  • XDCAM HD422
  • Canon MXF HD422

4: 2: 1 [ editar ]

Este modo de muestreo no se puede expresar en notación J: a: b. "4: 2: 1" es un término obsoleto de un esquema de notación anterior, y muy pocos códecs de software o hardware lo usan. La resolución horizontal Cb es la mitad de la de Cr (y una cuarta parte de la resolución horizontal de Y ).

4: 1: 1 [ editar ]

En el submuestreo de croma 4: 1: 1, la resolución de color horizontal se divide en cuatro y el ancho de banda se reduce a la mitad en comparación con el submuestreo sin croma. Inicialmente, el submuestreo de croma 4: 1: 1 del formato DV no se consideraba calidad de transmisión y solo era aceptable para aplicaciones de consumo y de gama baja. [5] [6] Sin embargo, los formatos basados ​​en DV (algunos de los cuales utilizan submuestreo de croma 4: 1: 1) se han utilizado profesionalmente en la recopilación de noticias electrónicas y en los servidores de emisión. La DV también se ha utilizado esporádicamente en largometrajes y en cinematografía digital .

En el sistema NTSC, si la luma se muestrea a 13,5 MHz, esto significa que las señales Cr y Cb se muestrearán cada una a 3,375 MHz, lo que corresponde a un ancho de banda máximo de Nyquist de 1,6875 MHz, mientras que la transmisión analógica de alta gama tradicional El codificador NTSC "tendría un ancho de banda Nyquist de 1,5 MHz y 0,5 MHz para los canales I / Q. Sin embargo, en la mayoría de los equipos, especialmente televisores y VCR VHS / Betamax baratos, los canales cromáticos tienen solo el ancho de banda de 0,5 MHz para Cr y Cb (o equivalentemente para I / Q). Por lo tanto, el sistema DV proporciona un ancho de banda de color superior en comparación con las mejores especificaciones analógicas compuestas para NTSC, a pesar de tener solo 1/4 del ancho de banda de croma de una señal digital "completa".

Los formatos que utilizan submuestreo de croma 4: 1: 1 incluyen:

  • DVCPRO ( NTSC y PAL )
  • NTSC DV y DVCAM
  • D-7

4: 2: 0 [ editar ]

En 4: 2: 0, el muestreo horizontal se duplica en comparación con 4: 1: 1, pero como los canales Cb y Cr solo se muestrean en cada línea alternativa en este esquema, la resolución vertical se reduce a la mitad. Por tanto, la velocidad de transmisión de datos es la misma. Esto encaja razonablemente bien con el sistema de codificación de color PAL , ya que tiene solo la mitad de la resolución de crominancia vertical de NTSC . También encajaría muy bien con el SECAMsistema de codificación de color, ya que al igual que ese formato, 4: 2: 0 solo almacena y transmite un canal de color por línea (el otro canal se recupera de la línea anterior). Sin embargo, en realidad se ha producido poco equipo que emita una señal de video analógica SECAM. En general, los territorios SECAM tienen que utilizar una pantalla compatible con PAL o un transcodificador para convertir la señal PAL a SECAM para su visualización.

Se encuentran diferentes variantes de configuraciones de croma 4: 2: 0 en:

  • Todos los estándares de codificación de video ISO / IEC MPEG e ITU-T VCEG H.26x, incluidas las implementaciones de H.262 / MPEG-2 Parte 2 (aunque algunos perfiles de MPEG-4 Parte 2 y H.264 / MPEG-4 AVC permiten esquemas de muestreo como 4: 4: 4)
  • DVD-Video y Blu-ray Disc . [7] [8]
  • PAL DV y DVCAM
  • HDV
  • AVCHD y AVC-Intra 50
  • Códec intermedio de Apple
  • Implementaciones más comunes de JPEG / JFIF y MJPEG
  • VC-1

Cb y Cr se submuestrean cada uno en un factor de 2 tanto horizontal como verticalmente.

Hay tres variantes de esquemas 4: 2: 0, con diferentes ubicaciones horizontales y verticales. [9]

  • En MPEG-2, MPEG-4 y AVC Cb y Cr se calculan horizontalmente. Cb y Cr están ubicados entre píxeles en la dirección vertical (ubicados intersticialmente).
  • En JPEG / JFIF, H.261 y MPEG-1, Cb y Cr se ubican intersticialmente, a medio camino entre muestras de luminancia alternativas.
  • En 4: 2: 0 DV, Cb y Cr están co-ubicados en la dirección horizontal. En la dirección vertical, están coubicados en líneas alternas. Eso es también lo que se usa en HEVC en contenido BT.2020 y BT.2100 (en particular en Blu-rays). También se llama arriba a la izquierda.

La mayoría de los formatos de vídeo digital correspondientes a PAL utilizan un submuestreo de croma 4: 2: 0, con la excepción de DVCPRO25, que utiliza un submuestreo de croma 4: 1: 1. Los esquemas 4: 1: 1 y 4: 2: 0 reducen a la mitad el ancho de banda en comparación con el submuestreo sin crominancia.

Con material entrelazado , el submuestreo de croma 4: 2: 0 puede provocar artefactos de movimiento si se implementa de la misma manera que para el material progresivo. Las muestras de luma se derivan de intervalos de tiempo separados, mientras que las muestras de croma se derivan de ambos intervalos de tiempo. Es esta diferencia la que puede resultar en artefactos de movimiento. El estándar MPEG-2 permite un esquema de muestreo entrelazado alternativo, donde se aplica 4: 2: 0 a cada campo (no a ambos campos a la vez). Esto resuelve el problema de los artefactos de movimiento, reduce la resolución cromática vertical a la mitad y puede introducir artefactos en forma de peine en la imagen.


Original. Esta imagen muestra un solo campo. El texto en movimiento tiene algo de desenfoque de movimiento aplicado.


Muestreo progresivo 4: 2: 0 aplicado al material entrelazado en movimiento . Tenga en cuenta que el croma conduce y sigue al texto en movimiento. Esta imagen muestra un solo campo.


Muestreo entrelazado 4: 2: 0 aplicado a material entrelazado en movimiento . Esta imagen muestra un solo campo.

En el esquema entrelazado 4: 2: 0, sin embargo, la resolución vertical del croma se reduce aproximadamente a la mitad, ya que las muestras de croma describen efectivamente un área de 2 muestras de ancho por 4 muestras de alto en lugar de 2 × 2. Además, el desplazamiento espacial entre ambos campos puede resultar en la aparición de artefactos cromáticos en forma de peine.


Imagen fija original.


Muestreo progresivo 4: 2: 0 aplicado a una imagen fija. Se muestran ambos campos.


Muestreo entrelazado 4: 2: 0 aplicado a una imagen fija. Se muestran ambos campos.

Si el material entrelazado se va a desentrelazar, los artefactos de croma en forma de peine (de muestreo entrelazado 4: 2: 0) se pueden eliminar difuminando el croma verticalmente. [10]

4: 1: 0 [ editar ]

Esta relación es posible y algunos códecs la admiten, pero no se utiliza mucho. Esta relación utiliza la mitad de las resoluciones de color vertical y un cuarto de la horizontal, con solo un octavo del ancho de banda de las resoluciones de color máximas utilizadas. El video sin comprimir en este formato con cuantificación de 8 bits usa 10 bytes por cada macropixel (que es 4 × 2 píxeles). Tiene el ancho de banda de crominancia equivalente a una señal PAL I decodificada con un decodificador de línea de retardo, y sigue siendo muy superior a NTSC.

  • Algunos códecs de video pueden operar a 4: 1: 0.5 o 4: 1: 0.25 como una opción, para permitir una calidad similar a VHS.

3: 1: 1 [ editar ]

Utilizado por Sony en sus grabadoras HDCAM de alta definición (no HDCAM SR). En la dimensión horizontal, la luma se muestrea horizontalmente a tres cuartas partes de la frecuencia de muestreo Full HD: 1440 muestras por fila en lugar de 1920. La croma se muestrea a 480 muestras por fila, un tercio de la frecuencia de muestreo de luma.

En la dimensión vertical, tanto luma como croma se muestrean a la frecuencia de muestreo Full HD (1080 muestras verticalmente).

Artefactos [ editar ]

Imagen tras submuestreo de color (códec Sony Vegas DV, filtrado de cajas).
Note el sangrado en la ligereza cerca de los bordes.

El submuestreo de croma sufre dos tipos principales de artefactos, lo que provoca una degradación más notable de lo previsto cuando los colores cambian abruptamente.

Error de gamma [ editar ]

Las señales con corrección de gamma como Y'CbCr tienen un problema en el que los errores de crominancia "sangran" en la luminancia. En esas señales, un croma bajo en realidad hace que un color parezca menos brillante que uno con luma equivalente. Como resultado, cuando un color saturado se mezcla con un color no saturado o complementario, se produce una pérdida de luminancia en el borde. Esto se puede ver en el ejemplo entre magenta y verde. [2] Para llegar a un conjunto de valores submuestreados que se asemeje más al original, es necesario deshacer la corrección de gamma, realizar el cálculo y luego volver al espacio de corrección de gamma. También son posibles aproximaciones más eficientes, como con un promedio ponderado por luma o iterativamente con tablas de búsqueda en WebP y la función "Sharp YUV" de sjpeg. [11]

Colores fuera de gama [ editar ]

Otro artefacto que puede ocurrir con el submuestreo de croma es que los colores fuera de gama pueden ocurrir en la reconstrucción del croma. Suponga que la imagen consiste en líneas rojas y negras de 1 píxel alternadas y que el submuestreo omite el croma de los píxeles negros. El croma de los píxeles rojos se reconstruirá en los píxeles negros, lo que hará que los nuevos píxeles tengan valores rojos positivos y verdes y azules negativos . Como las pantallas no pueden emitir luz negativa (la luz negativa no existe), estos valores negativos se recortarán efectivamente y el valor de luminancia resultante será demasiado alto. [2] Artefactos similares surgen en el ejemplo menos artificial de gradación cerca de un límite rojo / negro bastante nítido.

Otros tipos de filtrado durante el submuestreo también pueden hacer que los colores se salgan de la gama.

Terminología [ editar ]

El término Y'UV se refiere a un esquema de codificación analógica, mientras que Y'CbCr se refiere a un esquema de codificación digital. [3] Una diferencia entre los dos es que los factores de escala de los componentes cromáticos (U, V, Cb y Cr) son diferentes. Sin embargo, el término YUV a menudo se usa erróneamente para referirse a la codificación Y'CbCr. Por lo tanto, expresiones como "4: 2: 2 YUV" siempre se refieren a 4: 2: 2 Y'CbCr, ya que simplemente no existe 4: x: x en la codificación analógica (como YUV).

En una línea similar, el término luminancia y el símbolo Y se utilizan a menudo erróneamente para referirse a luma, que se denota con el símbolo Y '. Tenga en cuenta que la luminancia (Y ') de la ingeniería de video se desvía de la luminancia (Y) de la ciencia del color (según lo definido por CIE ). Luma se forma como la suma ponderada de componentes RGB con corrección gamma (triestímulo). La luminancia se forma como una suma ponderada de componentes RGB lineales (triestímulos).

En la práctica, el símbolo CIE Y a menudo se usa incorrectamente para denotar luma. En 1993, SMPTE adoptó la Directriz de Ingeniería EG 28, aclarando los dos términos. Tenga en cuenta que el símbolo principal 'se utiliza para indicar la corrección de gamma.

De manera similar, la crominancia / crominancia de la ingeniería de video difiere de la crominancia de la ciencia del color. El croma / crominancia de la ingeniería de video se forma a partir de componentes triestímulos ponderados, no componentes lineales. En la práctica de la ingeniería de video, los términos croma , crominancia y saturación se usan a menudo de manera intercambiable para referirse a la crominancia.

Historia [ editar ]

El submuestreo de croma fue desarrollado en la década de 1950 por Alda Bedford para el desarrollo de la televisión en color por RCA , que se convirtió en el estándar NTSC ; La separación luma-croma fue desarrollada antes, en 1938 por Georges Valensi . A través de estudios, demostró que el ojo humano tiene alta resolución solo para blanco y negro, algo menos para colores de "rango medio" como amarillos y verdes, y mucho menos para colores en el extremo del espectro, rojos y azules. El uso de este conocimiento permitió a RCA desarrollar un sistema en el que descartaban la mayor parte de la señal azul después de que provenía de la cámara, manteniendo la mayor parte del verde y solo parte del rojo; esto es un submuestreo de croma en el YIQ espacio de color y es aproximadamente análogo al submuestreo 4: 2: 1, ya que tiene una resolución decreciente para luma, amarillo / verde y rojo / azul.

Ver también [ editar ]

  • Espacio de color
  • SMPTE - Sociedad de ingenieros cinematográficos y televisivos
  • Video digital
  • HDTV
  • YCbCr
  • YPbPr
  • CCIR 601 SDTV 4: 2: 2
  • YUV
  • Color
  • La visión del color
    • célula de bastón
    • Celda de cono

Referencias [ editar ]

  1. ^ S. Winkler, CJ van den Branden Lambrecht y M. Kunt (2001). "Visión y Video: Modelos y Aplicaciones" . En Christian J. van den Branden Lambrecht (ed.). Modelos de visión y aplicaciones para procesamiento de imágenes y videos . Saltador. pag. 209. ISBN 978-0-7923-7422-0.CS1 maint: varios nombres: lista de autores ( enlace )
  2. ↑ a b c d Chan, Glenn (mayo de 2008). "Hacia un mejor submuestreo de croma: ganador del premio SMPTE Student Paper Award 2007" . Diario de imágenes en movimiento SMPTE . 117 (4): 39–45. doi : 10.5594 / J15100 .
  3. ^ a b Poynton, Charles. "YUV y luminancia considerados perjudiciales: una petición de terminología precisa en vídeo" .
  4. ^ Por qué el video 4K se ve mejor en una pantalla de 1080p : The Daily Note (con gráficos que explican el submuestreo de croma.
  5. ^ Jennings, Roger; Bertel Schmitt (1997). "DV frente a Betacam SP" . DV Central . Archivado desde el original el 2 de julio de 2008 . Consultado el 29 de agosto de 2008 .
  6. ^ Wilt, Adam J. (2006). "Formatos DV, DVCAM y DVCPRO" . adamwilt.com . Consultado el 29 de agosto de 2008 .
  7. Clint DeBoer (16 de abril de 2008). "Niveles de negro mejorados HDMI, xvYCC y RGB" . Adictos al audio . Consultado el 2 de junio de 2013 .
  8. ^ "Codificación de color digital" (PDF) . Telairity. Archivado desde el original (PDF) el 7 de enero de 2014 . Consultado el 2 de junio de 2013 .
  9. ^ Poynton, Charles (2008). "Notación de submuestreo de croma" (PDF) . Poynton.com . Consultado el 1 de octubre de 2008 .
  10. ^ Munsil, Don; Stacey Spears (2003). "Benchmark de reproductor de DVD - Error de muestreo de croma" . Secretos del cine en casa y alta fidelidad . Archivado desde el original el 6 de junio de 2008 . Consultado el 29 de agosto de 2008 .
  11. ^ "Submuestreo de croma con corrección de gamma · Número 193 · mozilla / mozjpeg" . GitHub .
  • Poynton, Charles. "Vídeo digital y HDTV: algoritmos e interfaces". Estados Unidos: Morgan Kaufmann Publishers, 2003.
  • Kerr, Douglas A. "Submuestreo de crominancia en imágenes digitales" [1]

Enlaces externos [ editar ]

  • Muestreo de croma: una investigación