La optimización de la distorsión de frecuencia ( RDO ) es un método para mejorar la calidad de video en la compresión de video . El nombre se refiere a la optimización de la cantidad de distorsión (pérdida de calidad de video) frente a la cantidad de datos necesarios para codificar el video, la tasa . Si bien lo utilizan principalmente los codificadores de video, la optimización de la distorsión de la velocidad se puede usar para mejorar la calidad en cualquier situación de codificación (imagen, video, audio o de otro tipo) donde se deben tomar decisiones que afectan tanto el tamaño como la calidad del archivo simultáneamente.
Fondo
El método clásico para tomar decisiones de codificación es que el codificador de video elija el resultado que produzca la imagen de salida de mayor calidad. Sin embargo, esto tiene la desventaja de que la elección que hace podría requerir más bits y ofrecer un beneficio de calidad comparativamente pequeño. Un ejemplo común de este problema es la estimación de movimiento , [1] y, en particular, con respecto al uso de la estimación de movimiento con precisión de un cuarto de píxel . Agregar la precisión adicional al movimiento de un bloque durante la estimación de movimiento puede aumentar la calidad, pero en algunos casos esa calidad adicional no vale los bits adicionales necesarios para codificar el vector de movimiento con una precisión mayor.
Cómo funciona
La optimización de la distorsión de la tasa resuelve el problema mencionado anteriormente actuando como una métrica de calidad de video, midiendo tanto la desviación del material de origen como el costo de bits para cada posible resultado de decisión. Los bits se miden matemáticamente multiplicando el costo de los bits por el Lagrangiano , un valor que representa la relación entre el costo de los bits y la calidad para un nivel de calidad particular. La desviación de la fuente generalmente se mide como el error cuadrático medio , para maximizar la métrica de calidad de video PSNR .
Los codificadores de entropía en los códecs de video modernos dificultan el cálculo del costo de bits , lo que requiere que el algoritmo de optimización de distorsión de velocidad pase cada bloque de video a probar al codificador de entropía para medir su costo de bits real. En los códecs MPEG , el proceso completo consiste en una transformada de coseno discreta , seguida de cuantificación y codificación de entropía. Debido a esto, la optimización de la distorsión de la velocidad es mucho más lenta que la mayoría de las otras métricas de coincidencia de bloques, como la suma simple de diferencias absolutas (SAD) y la suma de diferencias transformadas absolutas (SATD). Como tal, generalmente se usa solo para los pasos finales del proceso de estimación de movimiento , como decidir entre diferentes tipos de partición en H.264 / AVC .
Lista de codificadores que admiten RDO
- Codificador Ateme H.264
- Codificadores Grass Valley ViBE (SD y HD MPEG-2 / MPEG-4)
- Codificador armónico Electra 8000 (SD y HD MPEG-2 / MPEG-4)
- libavcodec
- Codificador MainConcept H.264
- Codificador Microsoft VC-1
- Televisión TANDBERG SD MPEG-2 EN8100
- Televisión TANDBERG HD MPEG-4 EN8190
- Televisión TANDBERG SD y HD MPEG-4 iPlex
- Theora 1.1-alpha1 y posterior (la rama "Thusnelda")
- codificador x264 H.264
- codificador x265 H.265
- Xvid MPEG-4 ASP codificador
- Software de referencia H.264 / AVC JM (modelo conjunto)
- Software de referencia HEVC HM (modelo de prueba HEVC)
- Kvazaar (parcial) [2]
Referencias
- ^ DT Hoang, PM Long y Jeffrey Vitter , Optimizaciones de distorsión de velocidad para estimación de movimiento en codificación de video de baja tasa de bits , Transacciones IEEE en circuitos y sistemas para tecnología de video , 8 (4), agosto de 1998, 488-500. Una versión más corta aparece en Proceedings of the Digital Video Compression Conference , IS & T / SPIE 1996 Symposium on Electronic Imaging: Science & Technology, 2668, San José, CA, enero-febrero de 1996, 18-27.
- ^ http://ultravideo.cs.tut.fi/#encoder