La relación pico de señal a ruido ( PSNR ) es un término de ingeniería para la relación entre la potencia máxima posible de una señal y el poder de corromper el ruido que afecta la fidelidad de su representación. Debido a que muchas señales tienen un rango dinámico muy amplio , PSNR generalmente se expresa como una cantidad logarítmica usando la escala de decibelios .
PSNR se usa comúnmente para cuantificar la calidad de reconstrucción de imágenes y videos sujetos a compresión con pérdida .
Definición
PSNR se define más fácilmente mediante el error cuadrático medio ( MSE ). Dada una imagen monocromática m × n libre de ruido I y su aproximación ruidosa K , MSE se define como:
El PSNR (en dB ) se define como:
Aquí, MAX I es el valor de píxel máximo posible de la imagen. Cuando los píxeles se representan usando 8 bits por muestra, esto es 255. De manera más general, cuando las muestras se representan usando PCM lineal con B bits por muestra, MAX I es 2 B −1.
Aplicación en imágenes en color
Para imágenes en color con tres valores RGB por píxel, la definición de PSNR es la misma, excepto que el MSE es la suma de todas las diferencias de valor al cuadrado (ahora para cada color, es decir, tres veces más diferencias que en una imagen monocromática) dividida por el tamaño de la imagen. y por tres. Alternativamente, para las imágenes en color, la imagen se convierte a un espacio de color diferente y el PSNR se informa en cada canal de ese espacio de color, por ejemplo, YCbCr o HSL . [1] [2]
Estimación de calidad con PSNR
PSNR se utiliza más comúnmente para medir la calidad de la reconstrucción de códecs de compresión con pérdida (por ejemplo, para la compresión de imágenes ). La señal en este caso son los datos originales y el ruido es el error introducido por la compresión. Al comparar códecs de compresión, PSNR es una aproximación a la percepción humana de la calidad de la reconstrucción.
Los valores típicos del PSNR en la compresión de imagen y video con pérdida están entre 30 y 50 dB, siempre que la profundidad de bits sea de 8 bits , donde más alta es mejor. La calidad de procesamiento de imágenes de 12 bits se considera alta cuando el valor de PSNR es de 60 dB o superior. [3] [4] Para datos de 16 bits, los valores típicos para el PSNR están entre 60 y 80 dB. [5] [6] Se considera que los valores aceptables para la pérdida de calidad de la transmisión inalámbrica oscilan entre 20 dB y 25 dB. [7] [8]
En ausencia de ruido, las dos imágenes I y K son idénticas y, por tanto, el MSE es cero. En este caso, el PSNR es infinito (o indefinido, consulte División por cero ). [9]
Comparación de rendimiento
Aunque un PSNR más alto generalmente indica que la reconstrucción es de mayor calidad, en algunos casos puede no serlo. Hay que tener mucho cuidado con el rango de validez de esta métrica; solo es válido de manera concluyente cuando se utiliza para comparar resultados del mismo códec (o tipo de códec) y el mismo contenido. [10]
En general, se ha demostrado que PSNR tiene un rendimiento deficiente en comparación con otras métricas de calidad cuando se trata de estimar la calidad de las imágenes y, en particular, de los videos percibidos por los humanos. [10] [11]
Variantes
PSNR-HVS [12] es una extensión de PSNR que incorpora propiedades del sistema visual humano como la percepción del contraste .
PSNR-HVS-M mejora PSNR-HVS al tener en cuenta adicionalmente el enmascaramiento visual . [13] En un estudio de 2007, proporcionó mejores aproximaciones de los juicios de calidad visual humana que PSNR y SSIM por un amplio margen. También se demostró que tiene una clara ventaja sobre DCTune y PSNR-HVS. [14]
Ver también
Referencias
- ^ Oriani, Emanuele. "qpsnr: un analizador rápido de PSNR / SSIM para Linux" . Consultado el 6 de abril de 2011 .
- ^ "Manual de usuario de pnmpsnr" . Consultado el 6 de abril de 2011 .
- ^ Faragallah, Osama S .; El-Hoseny, Heba; El-Shafai, Walid; El-Rahman, Wael Abd; El-Sayed, Hala S .; El-Rabaie, El-Sayed M .; El-Samie, Fathi E. Abd; Geweid, Gamal GN (2021). "Un análisis de encuesta integral para las soluciones actuales de fusión de imágenes médicas y direcciones futuras" . Acceso IEEE . 9 : 11358-11371. doi : 10.1109 / ACCESS.2020.3048315 . ISSN 2169-3536 : a través de IEEE Xplore.
Este artículo presenta un estudio de encuesta sobre las modalidades de imágenes médicas y sus características. Además, se presentan diferentes enfoques de fusión de imágenes médicas y sus métricas de calidad adecuadas.
- ^ Chervyakov, Nikolay; Lyakhov, Pavel; Nagornov, Nikolay (11 de febrero de 2020). "Análisis del ruido de cuantificación en filtros de transformada de ondas discretas para imágenes médicas 3D" . Ciencias Aplicadas . 10 (4): 1223. doi : 10.3390 / app10041223 . ISSN 2076-3417 : a través de MDPI.
La calidad de procesamiento de la imagen se considera alta si el valor de PSNR es superior a 60 dB para imágenes con 12 bits por color.
- ^ Welstead, Stephen T. (1999). Técnicas de compresión de imágenes fractal y wavelet . Publicación SPIE. págs. 155-156. ISBN 978-0-8194-3503-3.
- ^ Raouf Hamzaoui, Dietmar Saupe (mayo de 2006). Barni, Mauro (ed.). Compresión de imagen fractal . Compresión de documentos e imágenes . 968 . Prensa CRC. págs. 168-169. ISBN 9780849335563. Consultado el 5 de abril de 2011 .
- ^ Thomos, N., Boulgouris, NV y Strintzis, MG (2006, enero). Transmisión optimizada de secuencias JPEG2000 a través de canales inalámbricos. Transacciones IEEE sobre procesamiento de imágenes, 15 (1).
- ^ Xiangjun, L. y Jianfei, C. Transmisión robusta de imágenes codificadas en JPEG2000 a través de canales de pérdida de paquetes. ICME 2007 (págs. 947-950). Escuela de Ingeniería Informática, Universidad Tecnológica de Nanyang .
- ^ Salomón, David (2007). Compresión de datos: la referencia completa (4 ed.). Saltador. pag. 281. ISBN 978-1846286025. Consultado el 26 de julio de 2012 .
- ^ a b Huynh-Thu, Q .; Ghanbari, M. (2008). "Alcance de validez de PSNR en la evaluación de la calidad de imagen / video". Cartas de electrónica . 44 (13): 800. doi : 10.1049 / el: 20080522 .
- ^ Huynh-Thu, Quan; Ghanbari, Mohammed (1 de enero de 2012). "La precisión de PSNR en la predicción de la calidad de video para diferentes escenas de video y velocidades de cuadro". Sistemas de telecomunicaciones . 49 (1): 35–48. doi : 10.1007 / s11235-010-9351-x . ISSN 1018-4864 . S2CID 43713764 .
- ^ Egiazarian, Karen, Jaakko Astola, Nikolay Ponomarenko, Vladimir Lukin, Federica Battisti y Marco Carli (2006). "Nuevas métricas de calidad de referencia completa basadas en HVS". En Actas del Segundo Taller Internacional sobre Procesamiento de Video y Métricas de Calidad, vol. 4.
- ^ Ponomarenko, N .; Ieremeiev, O .; Lukin, V .; Egiazarian, K .; Carli, M. (febrero de 2011). "Métricas de calidad visual de la imagen modificada para el cambio de contraste y la contabilidad del cambio medio" . 2011 11th International Conference the Experience of Design and Application of CAD Systems in Microelectronics (CADSM) : 305–311.
- ^ Nikolay Ponomarenko; Flavia Silvestri; Karen Egiazarian; Marco Carli; Jaakko Astola; Vladimir Lukin, "Sobre el enmascaramiento de contraste entre coeficientes de las funciones base DCT" (PDF) , Actas en CD-ROM del Tercer Taller Internacional sobre Procesamiento de Video y Métricas de Calidad para Electrónica de Consumo VPQM-07, 25. – 26. Enero de 2007 (en alemán), Scottsdale AZ