De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La codificación de transformación es un tipo de compresión de datos para datos "naturales" como señales de audio o imágenes fotográficas . Por lo general, la transformación no tiene pérdidas (perfectamente reversible) por sí sola, pero se utiliza para permitir una mejor cuantificación (más específica) , que luego da como resultado una copia de menor calidad de la entrada original ( compresión con pérdida ).

En la codificación de transformación, el conocimiento de la aplicación se utiliza para elegir la información que se descartará, reduciendo así su ancho de banda . La información restante se puede comprimir a través de una variedad de métodos. Cuando se decodifica la salida, es posible que el resultado no sea idéntico al de la entrada original, pero se espera que sea lo suficientemente cercano para el propósito de la aplicación.

Televisión en color [ editar ]

NTSC [ editar ]

Uno de los sistemas de codificación por transformación de mayor éxito no suele denominarse como tal; el ejemplo es la televisión en color NTSC . Después de una extensa serie de estudios en la década de 1950, Alda Bedford demostró que el ojo humano tiene alta resolución solo para blanco y negro, algo menos para colores de "rango medio" como amarillos y verdes, y mucho menos para colores al final del espectro, rojos y azules.

El uso de este conocimiento permitió a RCA desarrollar un sistema en el que descartaban la mayor parte de la señal azul después de que provenía de la cámara, manteniendo la mayor parte del verde y solo parte del rojo; esto es un submuestreo de croma en el espacio de color YIQ .

El resultado es una señal con mucho menos contenido, una que encajaría dentro de las señales existentes en blanco y negro de 6 MHz como una señal diferencial modulada en fase. El televisor promedio muestra el equivalente a 350 píxeles en una línea, pero la señal de TV contiene suficiente información para solo unos 50 píxeles de azul y quizás 150 de rojo. Esto no es evidente para el espectador en la mayoría de los casos, ya que de todos modos el ojo hace poco uso de la información "faltante".

PAL y SECAM [ editar ]

Los sistemas PAL y SECAM utilizan métodos casi idénticos o muy similares para transmitir el color. En cualquier caso, ambos sistemas están submuestreados.

Digital [ editar ]

El término se usa mucho más comúnmente en medios digitales y procesamiento de señales digitales . La técnica de codificación de transformada más utilizada en este sentido es la transformada de coseno discreta (DCT), [1] [2] propuesta por Nasir Ahmed en 1972, [3] [4] y presentada por Ahmed con T. Natarajan y KR Rao en 1974. [5] Esta DCT, en el contexto de la familia de transformadas de coseno discretas, es la DCT-II. Es la base del estándar común de compresión de imágenes JPEG , [6] que examina pequeños bloques de la imagen y los transforma al dominio de frecuencia.para una cuantificación (con pérdida) y una compresión de datos más eficientes . En la codificación de video , los estándares H.26x y MPEG modifican esta técnica de compresión de imagen DCT a través de cuadros en una imagen en movimiento usando compensación de movimiento , reduciendo aún más el tamaño en comparación con una serie de JPEG.

En la codificación de audio , la compresión de audio MPEG analiza los datos transformados de acuerdo con un modelo psicoacústico que describe la sensibilidad del oído humano a partes de la señal, similar al modelo de TV. MP3 utiliza un algoritmo de codificación híbrido, que combina la transformada de coseno discreta modificada (MDCT) y la transformada rápida de Fourier (FFT). [7] Fue sucedido por Advanced Audio Coding (AAC), que utiliza un algoritmo MDCT puro para mejorar significativamente la eficiencia de la compresión. [8]

El proceso básico de digitalización de una señal analógica es un tipo de codificación de transformación que utiliza el muestreo en uno o más dominios como su transformación.

Ver también [ editar ]

  • Teorema de Karhunen-Loève
  • Transformación (función)
  • Transformada wavelet

Referencias [ editar ]

  1. Muchahary, D .; Mondal, AJ; Parmar, RS; Borah, AD; Majumder, A. (2015). "Un enfoque de diseño simplificado para el cálculo eficiente de DCT". 2015 Quinta Conferencia Internacional sobre Sistemas de Comunicación y Tecnologías de Red : 483–487. doi : 10.1109 / CSNT.2015.134 .
  2. ^ Chen, Wai Kai (2004). El manual de ingeniería eléctrica . Elsevier . pag. 906. ISBN 9780080477480.
  3. ^ Ahmed, Nasir (enero de 1991). "Cómo se me ocurrió la transformada discreta del coseno" . Procesamiento de señales digitales . 1 (1): 4–5. doi : 10.1016 / 1051-2004 (91) 90086-Z .
  4. Stanković, Radomir S .; Astola, Jaakko T. (2012). "Reminiscencias de los primeros trabajos en DCT: Entrevista con KR Rao" (PDF) . Reimpresiones de los primeros días de las ciencias de la información . 60 . Consultado el 13 de octubre de 2019 .
  5. ^ Ahmed, Nasir ; Natarajan, T .; Rao, KR (enero de 1974), "Discrete Cosine Transform", IEEE Transactions on Computers , C-23 (1): 90–93, doi : 10.1109 / TC.1974.223784
  6. ^ "T.81 - Compresión digital y codificación de imágenes fijas de tono continuo - Requisitos y directrices" (PDF) . CCITT . Septiembre de 1992 . Consultado el 12 de julio de 2019 .
  7. ^ Guckert, John (primavera de 2012). "El uso de FFT y MDCT en la compresión de audio MP3" (PDF) . Universidad de Utah . Consultado el 14 de julio de 2019 .
  8. ^ Brandeburgo, Karlheinz (1999). "MP3 y AAC explicados" (PDF) . Archivado (PDF) desde el original el 13 de febrero de 2017.