En el procesamiento de señales , la codificación de subbanda ( SBC ) es cualquier forma de codificación de transformada que divide una señal en varias bandas de frecuencia diferentes , normalmente mediante el uso de una transformada rápida de Fourier , y codifica cada una de forma independiente. Esta descomposición es a menudo el primer paso en la compresión de datos para señales de audio y video.
SBC es la técnica principal utilizada en muchos algoritmos populares de compresión de audio con pérdida , incluido MP3 .
Codificación de señales de audio
La forma más sencilla de codificar digitalmente señales de audio es la modulación de código de pulso (PCM), que se utiliza en CD de audio , grabaciones DAT , etc. La digitalización transforma las señales continuas en discretas muestreando la amplitud de una señal a intervalos uniformes y redondeando al valor más cercano representable con el número de bits disponible . Este proceso es fundamentalmente inexacto e implica dos errores: error de discretización , por muestreo a intervalos, y error de cuantificación , por redondeo.
Cuantos más bits se utilicen para representar cada muestra, más fina será la granularidad en la representación digital y, por tanto, menor será el error de cuantificación. Estos errores de cuantificación pueden considerarse como un tipo de ruido, porque son efectivamente la diferencia entre la fuente original y su representación binaria. Con PCM, los efectos audibles de estos errores se pueden mitigar con difuminado y utilizando suficientes bits para garantizar que el ruido sea lo suficientemente bajo como para ser enmascarado por la propia señal o por otras fuentes de ruido. Es posible una señal de alta calidad, pero a costa de una alta tasa de bits (por ejemplo, más de 700 kbit / s para un canal de audio de CD). En efecto, muchos bits se desperdician codificando porciones enmascaradas de la señal porque PCM no hace suposiciones sobre cómo escucha el oído humano.
Las técnicas de codificación reducen la tasa de bits al explotar características conocidas del sistema auditivo. Un método clásico es PCM no lineal, como el algoritmo de ley μ . Las señales pequeñas se digitalizan con una granularidad más fina que las grandes; el efecto es agregar ruido que es proporcional a la fuerza de la señal. El formato de archivo Au de Sun para sonido es un ejemplo popular de codificación mu-law. El uso de la codificación mu-law de 8 bits reduciría la tasa de bits por canal de audio de CD a aproximadamente 350 kbit / s, la mitad de la tasa estándar. Debido a que este método simple explota mínimamente los efectos de enmascaramiento, produce resultados que a menudo son audiblemente inferiores en comparación con el original.
Principios básicos
La utilidad de SBC quizás se ilustra mejor con un ejemplo específico. Cuando se utiliza para la compresión de audio, SBC aprovecha el enmascaramiento auditivo en el sistema auditivo . Los oídos humanos son normalmente sensibles a una amplia gama de frecuencias, pero cuando hay una señal suficientemente fuerte en una frecuencia, el oído no escuchará señales más débiles en frecuencias cercanas. Decimos que la señal más fuerte enmascara a las más suaves.
La idea básica de SBC es permitir una reducción de datos descartando información sobre frecuencias que están enmascaradas. El resultado difiere de la señal original, pero si la información descartada se elige con cuidado, la diferencia no será perceptible o, lo que es más importante, objetable.
Primero, un banco de filtros digitales divide el espectro de la señal de entrada en un número (por ejemplo, 32) de subbandas. El modelo psicoacústico observa la energía en cada una de estas subbandas, así como en la señal original, y calcula los umbrales de enmascaramiento utilizando información psicoacústica. Cada una de las muestras de subbanda se cuantifica y codifica para mantener el ruido de cuantificación por debajo del umbral de enmascaramiento calculado dinámicamente. El paso final es formatear todas estas muestras cuantificadas en grupos de datos llamados cuadros, para facilitar la reproducción final por un decodificador.
La decodificación es mucho más fácil que la codificación, ya que no se trata de ningún modelo psicoacústico. Las tramas se desempaquetan, las muestras de subbanda se decodifican y un mapeo de frecuencia-tiempo reconstruye una señal de audio de salida.
Aplicaciones
A fines de la década de 1980, un organismo de estandarización, el Moving Picture Experts Group (MPEG), desarrolló estándares para la codificación de audio y video. La codificación de subbandas reside en el corazón del popular formato MP3 (más propiamente conocido como MPEG-1 Audio Layer III ), por ejemplo.
La codificación de subbanda se utiliza en el códec G.722 que utiliza modulación de código de impulsos diferencial adaptativo de subbanda (SB- ADPCM ) dentro de una velocidad binaria de 64 kbit / s. En la técnica SB-ADPCM, la banda de frecuencia se divide en dos subbandas (superior e inferior) y las señales de cada subbanda se codifican mediante ADPCM.
Referencias
Este artículo se basa en material extraído del Diccionario gratuito de informática en línea antes del 1 de noviembre de 2008 e incorporado bajo los términos de "renovación de licencias" de la GFDL , versión 1.3 o posterior.