Audio digital


Escuche este articulo
De Wikipedia, la enciclopedia libre
  (Redirigido desde la grabadora de audio digital )
Saltar a navegación Saltar a búsqueda
Los niveles de audio se muestran en una grabadora de audio digital ( Zoom H4n )

El audio digital es una representación de sonido grabado o convertido a formato digital . En audio digital, la onda de sonido de la señal de audio se codifica típicamente como muestras numéricas en una secuencia continua. Por ejemplo, en CD de audio , las muestras se toman 44,100 veces por segundo , cada una con una profundidad de muestra de 16 bits . El audio digital es también el nombre de toda la tecnología de grabación y reproducción de sonido que utiliza señales de audio codificadas en forma digital. Tras importantes avances en la tecnología de audio digital durante las décadas de 1970 y 1980, reemplazó gradualmentetecnología de audio analógico en muchas áreas de la ingeniería de audio y las telecomunicaciones en las décadas de 1990 y 2000.

En un sistema de audio digital, una señal eléctrica analógica que representa el sonido se convierte con un convertidor de analógico a digital (ADC) en una señal digital, generalmente usando modulación de código de pulso (PCM). Esta señal digital se puede grabar, editar, modificar y copiar utilizando computadoras , máquinas de reproducción de audio y otras herramientas digitales. Cuando el ingeniero de sonido desea escuchar la grabación en auriculares o altavoces (o cuando un consumidor desea escuchar un archivo de sonido digital), un convertidor de digital a analógico (DAC) realiza el proceso inverso, convirtiendo una señal digital nuevamente en una señal analógica, que luego se envía a través de un amplificador de potencia de audio y finalmente a unaltavoz .

Los sistemas de audio digital pueden incluir componentes de compresión , almacenamiento , procesamiento y transmisión . La conversión a un formato digital permite una manipulación, almacenamiento, transmisión y recuperación convenientes de una señal de audio. A diferencia del audio analógico, en el que hacer copias de una grabación da como resultado la pérdida de generación y la degradación de la calidad de la señal, el audio digital permite realizar un número infinito de copias sin ninguna degradación de la calidad de la señal.

Visión general

Una onda de sonido, en rojo, representada digitalmente, en azul (después del muestreo y la cuantificación de 4 bits ).

Las tecnologías de audio digital se utilizan en la grabación, manipulación, producción en masa y distribución de sonido, incluidas grabaciones de canciones , piezas instrumentales, podcasts , efectos de sonido y otros sonidos. La distribución de música en línea moderna depende de la grabación digital y la compresión de datos . La disponibilidad de música como archivos de datos, más que como objetos físicos, ha reducido significativamente los costos de distribución. [1] Antes del audio digital, la industria de la música distribuía y vendía música vendiendo copias físicas en forma de discos y cintas de casete . Con sistemas de distribución de audio digital y en línea como iTunes, las empresas venden archivos de sonido digitales a los consumidores, que el consumidor recibe a través de Internet.

Un sistema de audio analógico convierte formas de onda físicas de sonido en representaciones eléctricas de esas formas de onda mediante el uso de un transductor , como un micrófono . Luego, los sonidos se almacenan en un medio analógico, como una cinta magnética , o se transmiten a través de un medio analógico, como una línea telefónica o una radio . El proceso se invierte para la reproducción: la señal de audio eléctrica se amplifica y luego se convierte nuevamente en formas de onda físicas a través de un altavoz . El audio analógico conserva sus características de onda fundamentales durante todo su almacenamiento, transformación, duplicación y amplificación.

Las señales de audio analógicas son susceptibles al ruido y la distorsión, debido a las características innatas de los circuitos electrónicos y los dispositivos asociados. Las perturbaciones en un sistema digital no dan como resultado un error a menos que la perturbación sea tan grande como para que un símbolo se malinterprete como otro símbolo o altere la secuencia de símbolos. Por lo tanto, generalmente es posible tener un sistema de audio digital completamente libre de errores en el que no se introduzcan ruidos o distorsiones entre la conversión a formato digital y la conversión de nuevo a analógico.

Una señal de audio digital puede codificarse para corregir cualquier error que pueda ocurrir en el almacenamiento o transmisión de la señal. Esta técnica, conocida como codificación de canal , es esencial para que los sistemas digitales grabados o de radiodifusión mantengan la precisión de los bits. La modulación de ocho a catorce es un código de canal utilizado en el disco compacto de audio (CD).

Proceso de conversión

El ciclo de vida del sonido desde su fuente, a través de un ADC, procesamiento digital, un DAC y finalmente como sonido nuevamente.

Si una señal de audio es analógica, un sistema de audio digital comienza con un ADC que convierte una señal analógica en una señal digital. [nota 1] El ADC se ejecuta a una frecuencia de muestreo especificada y convierte a una resolución de bits conocida. El audio de CD , por ejemplo, tiene una frecuencia de muestreo de 44,1  kHz (44,100 muestras por segundo) y tiene una resolución de 16 bits para cada canal estéreo . Las señales analógicas que aún no se han limitado en banda deben pasar a través de un filtro anti-aliasing antes de la conversión, para evitar la distorsión del aliasing causada por señales de audio con frecuencias más altas que la frecuencia de Nyquist. (la mitad de la frecuencia de muestreo).

Se puede almacenar o transmitir una señal de audio digital. El audio digital se puede almacenar en un CD, un reproductor de audio digital , un disco duro , una unidad flash USB o cualquier otro dispositivo de almacenamiento de datos digitales . La señal digital se puede alterar mediante el procesamiento de la señal digital , donde se puede filtrar o aplicar efectos . La conversión de la frecuencia de muestreo, incluido el aumento y la disminución de la frecuencia de muestreo, se puede utilizar para ajustar las señales que se han codificado con una frecuencia de muestreo diferente a una frecuencia de muestreo común antes del procesamiento. Técnicas de compresión de datos de audio, como MP3 ,La codificación de audio avanzada , Ogg Vorbis o FLAC se emplean comúnmente para reducir el tamaño del archivo. El audio digital se puede transmitir a través de interfaces de audio digital como AES3 o MADI . El audio digital se puede transmitir a través de una red utilizando audio a través de Ethernet , audio a través de IP u otros estándares y sistemas de transmisión de medios .

Para la reproducción, el audio digital debe volver a convertirse a una señal analógica con un DAC. De acuerdo con el teorema de muestreo de Nyquist-Shannon , con algunas restricciones prácticas y teóricas, una versión de banda limitada de la señal analógica original se puede reconstruir con precisión a partir de la señal digital.

Historia

Codificación

La modulación de código de pulso (PCM) fue inventada por el científico británico Alec Reeves en 1937. [2] En 1950, C. Chapin Cutler de Bell Labs presentó la patente sobre modulación de código de pulso diferencial (DPCM), [3] un algoritmo de compresión de datos . El DPCM adaptativo (ADPCM) fue introducido por P. Cummiskey, Nikil S. Jayant y James L. Flanagan en Bell Labs en 1973. [4] [5]

La codificación perceptual se utilizó por primera vez para la compresión de codificación de voz , con codificación predictiva lineal (LPC). [6] Los conceptos iniciales para LPC se remontan al trabajo de Fumitada Itakura ( Universidad de Nagoya ) y Shuzo Saito ( Nippon Telegraph and Telephone ) en 1966. [7] Durante la década de 1970, Bishnu S. Atal y Manfred R. Schroeder en Bell Labs desarrolló una forma de LPC llamada codificación predictiva adaptativa (APC), un algoritmo de codificación perceptual que explotaba las propiedades de enmascaramiento del oído humano, seguido a principios de la década de 1980 con la predicción lineal excitada por código(CELP) algoritmo. [6]

La codificación de transformada de coseno discreta (DCT), un método de compresión con pérdida propuesto por primera vez por Nasir Ahmed en 1972, [8] [9] proporcionó la base para la transformada de coseno discreta modificada (MDCT), que fue desarrollada por JP Princen, AW Johnson y AB Bradley en 1987. [10] La MDCT es la base de la mayoría de los estándares de codificación de audio , como Dolby Digital (AC-3), [11] MP3 ( MPEG Layer III), [12] [6] Codificación de audio avanzada (AAC) , Windows Media Audio (WMA) y Vorbis ( Ogg). [11]

Grabación

PCM se usó en aplicaciones de telecomunicaciones mucho antes de su primer uso en transmisiones y grabaciones comerciales. La grabación digital comercial fue pionera en Japón por NHK y Nippon Columbia y su marca Denon , en la década de 1960. Las primeras grabaciones digitales comerciales se lanzaron en 1971. [13]

La BBC también comenzó a experimentar con audio digital en la década de 1960. A principios de la década de 1970, había desarrollado una grabadora de 2 canales y, en 1972, implementó un sistema de transmisión de audio digital que conectaba su centro de transmisión con sus transmisores remotos. [13]

La primera grabación PCM de 16 bits en los Estados Unidos fue realizada por Thomas Stockham en la Ópera de Santa Fe en 1976, en una grabadora Soundstream . Telarc utilizó una versión mejorada del sistema Soundstream para producir varias grabaciones clásicas por Telarc en 1978. La grabadora multipista digital 3M en desarrollo en ese momento se basaba en la tecnología BBC. El primer álbum totalmente digital grabada en esta máquina era Ry Cooder 's Bop hasta el cansancio en 1979. discográfica británica Deccacomenzó el desarrollo de sus propias grabadoras de audio digital de 2 pistas en 1978 y lanzó la primera grabación digital europea en 1979. [13]

Las populares grabadoras multipista digitales profesionales producidas por Sony / Studer ( DASH ) y Mitsubishi ( ProDigi ) a principios de la década de 1980 ayudaron a lograr la aceptación de la grabación digital por parte de las principales compañías discográficas. Las máquinas para estos formatos también tenían sus propios transportes incorporados, utilizando cinta de carrete a carrete en anchos de 1/4 ", 1/2" o 1 ", y los datos de audio se grababan en la cinta utilizando un -cabezal de cinta estacionario de pista Los adaptadores PCM permiten la grabación de audio digital estéreo en una videograbadora NTCS o PAL convencional .

La introducción en 1982 del CD popularizó el audio digital entre los consumidores. [13]

ADAT estuvo disponible a principios de la década de 1990, lo que permitió la grabación de ocho pistas a 44,1 o 48 kHz en casetes S-VHS, y DTRS realizó una función similar con cintas Hi8.

Los formatos como ProDigi y DASH se denominaron formatos SDAT ( S tationary-head D igital A udio T ape), a diferencia de formatos como los sistemas basados ​​en adaptadores PCM y DAT, que se denominaron RDAT ( R otating-head D igital a udio T ape) formatos, debido a su proceso de exploración helicoidal de la grabación.

Al igual que el casete DAT , las máquinas ProDigi y DASH también se adaptaron a la frecuencia de muestreo obligatoria de 44,1 kHz, pero también a 48 kHz en todas las máquinas y, finalmente, a una frecuencia de muestreo de 96 kHz. Superaron los problemas que hacían que las grabadoras analógicas típicas no pudieran satisfacer las demandas de ancho de banda (rango de frecuencia) de la grabación digital mediante una combinación de velocidades de cinta más altas, espacios de cabeza más estrechos utilizados en combinación con cintas de formulación metálica y la difusión de datos a través de múltiples conexiones paralelas. pistas.

Telefonía

El rápido desarrollo y la amplia adopción de la telefonía digital PCM fue posible gracias a la tecnología de circuitos de condensadores conmutados (SC) de semiconductores de óxido de metal (MOS) , desarrollada a principios de la década de 1970. [14] Esto llevó al desarrollo de chips de filtro de códec PCM a fines de la década de 1970. [14] [15] El chip de filtro de códec PCM CMOS (MOS complementario) de puerta de silicio , desarrollado por David A. Hodges y WC Black en 1980, [14] ha sido desde entonces el estándar de la industria para la telefonía digital. [14] [15] En la década de 1990, las redes de telecomunicaciones como la La red telefónica pública conmutada (PSTN) se había digitalizado en gran medida con filtros de códec CMOS PCM VLSI ( integración a gran escala ), ampliamente utilizados en sistemas de conmutación electrónica para centrales telefónicas , módems de usuario y una gama de aplicaciones de transmisión digital como la Red digital de servicios integrados (RDSI), teléfonos inalámbricos y teléfonos celulares . [15]

Tecnologias

Grabador de cinta de audio digital Sony PCM-7030

El audio digital se utiliza en la transmisión de audio. Las tecnologías estándar incluyen transmisión de audio digital (DAB), Digital Radio Mondiale (DRM), HD Radio e In-band on-channel (IBOC).

El audio digital en aplicaciones de grabación se almacena en tecnologías específicas de audio que incluyen CD, Cinta de audio digital (DAT), Casete compacto digital (DCC) y MiniDisc . El audio digital puede almacenarse en formatos de archivo de audio estándar y almacenarse en una grabadora de disco duro , Blu-ray o DVD-Audio . Los archivos se pueden reproducir en teléfonos inteligentes, computadoras o reproductores de MP3 .

Interfaces

Las interfaces específicas de audio digital incluyen:

  • A2DP a través de Bluetooth
  • Interfaz AC'97 (Audio Codec 1997) entre circuitos integrados en placas base de PC
  • ADAT Lightpipe interfaz
  • Interfaz AES3 con conectores XLR , común en equipos de audio profesionales
  • AES47 - al estilo de audio AES3 digital profesional sobre el modo de transferencia asíncrona redes
  • Audio de alta definición Intel : reemplazo moderno del AC'97
  • Interfaz I²S (sonido Inter-IC) entre circuitos integrados en electrónica de consumo
  • MADI (Interfaz digital de audio multicanal)
  • MIDI : interconexión de ancho de banda bajo para transportar datos de instrumentos; no puede transportar sonido, pero puede transportar datos de muestras digitales en tiempo no real
  • S / PDIF : ya sea por cable coaxial o TOSLINK , común en equipos de audio de consumo y derivado de AES3
  • TDIF , formato propietario de TASCAM con cable D-sub

Varias interfaces están diseñadas para transportar video y audio digitales juntos, incluidos HDMI y DisplayPort .

Para computadoras personales , USB e IEEE 1394 tienen disposiciones para brindar audio digital en tiempo real. En aplicaciones de instalación o arquitectura profesional, existen muchos protocolos e interfaces de audio a través de Ethernet . En la radiodifusión , se favorece una tecnología de red de audio sobre IP más general . En telefonía, la voz sobre IP se utiliza como interfaz de red para audio digital para comunicaciones de voz.

Ver también

  • Editor de audio digital
  • Sintetizador digital
  • Síntesis de modulación de frecuencia
  • Chip de sonido

Notas

  1. ^ Algunas señales de audio, como las creadas por síntesis digital, se originan completamente en el dominio digital, en cuyo caso no se produce la conversión de analógico a digital.

Referencias

  1. ^ Janssens, Jelle; Stijn Vandaele; Tom Vander Beken (2009). "¿La industria de la música en (la) línea? Sobrevivir a la piratería musical en una era digital". Revista europea de delincuencia, derecho penal y justicia penal . 77 (96): 77–96. doi : 10.1163 / 157181709X429105 . hdl : 1854 / LU-608677 .
  2. Genius Unrecognized , BBC, 27 de marzo de 2011 , consultado el 30 de marzo de 2011
  3. ^ Patente estadounidense 2605361 , C. Chapin Cutler, "Cuantificación diferencial de señales de comunicación", emitida el 29 de julio de 1952 
  4. ^ P. Cummiskey, Nikil S. Jayant y JL Flanagan, "Cuantización adaptativa en codificación diferencial PCM del habla", Bell Syst. Tech. J. , vol. 52, págs. 1105-1118, septiembre de 1973
  5. ^ Cummiskey, P .; Jayant, Nikil S .; Flanagan, JL (1973). "Cuantificación adaptativa en codificación diferencial PCM de voz". Revista técnica de Bell System . 52 (7): 1105-1118. doi : 10.1002 / j.1538-7305.1973.tb02007.x . ISSN 0005-8580 . 
  6. ↑ a b c Schroeder, Manfred R. (2014). "Laboratorios Bell" . Acústica, información y comunicación: volumen conmemorativo en honor a Manfred R. Schroeder . Saltador. pag. 388. ISBN 9783319056609.
  7. ^ Gray, Robert M. (2010). "Una historia del habla digital en tiempo real en redes de paquetes: parte II de codificación predictiva lineal y el protocolo de Internet" (PDF) . Fundar. Proceso de la señal de tendencias . 3 (4): 203-303. doi : 10.1561 / 2000000036 . ISSN 1932-8346 .  
  8. ^ Ahmed, Nasir (enero de 1991). "Cómo se me ocurrió la transformada discreta del coseno" . Procesamiento de señales digitales . 1 (1): 4–5. doi : 10.1016 / 1051-2004 (91) 90086-Z .
  9. ^ Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (enero de 1974). "Transformada discreta del coseno" (PDF) . Transacciones IEEE en computadoras . C-23 (1): 90–93. doi : 10.1109 / TC.1974.223784 .
  10. ^ JP Princen, AW Johnson y AB Bradley: codificación de subbanda / transformación utilizando diseños de bancos de filtros basados ​​en la cancelación de alias en el dominio del tiempo , IEEE Proc. Intl. Conferencia sobre acústica, habla y procesamiento de señales (ICASSP), 2161-2164, 1987.
  11. ↑ a b Luo, Fa-Long (2008). Estándares de radiodifusión multimedia móvil: tecnología y práctica . Springer Science & Business Media . pag. 590. ISBN 9780387782638.
  12. ^ Guckert, John (primavera de 2012). "El uso de FFT y MDCT en la compresión de audio MP3" (PDF) . Universidad de Utah . Consultado el 14 de julio de 2019 .
  13. ↑ a b c d Bien, Thomas (2008). Barry R. Ashpole (ed.). "El amanecer de la grabación digital comercial" (PDF) . Revista ARSC . Consultado el 2 de mayo de 2010 .
  14. ↑ a b c d Allstot, David J. (2016). "Filtros de condensadores conmutados" (PDF) . En Maloberti, Franco; Davies, Anthony C. (eds.). Breve historia de circuitos y sistemas: desde redes ecológicas, móviles y omnipresentes hasta Big Data Computing . Sociedad de Sistemas y Circuitos IEEE . págs. 105-110. ISBN  9788793609860.
  15. ↑ a b c Floyd, Michael D .; Hillman, Garth D. (8 de octubre de 2018) [1st pub. 2000]. "Filtros de códec de modulación de código de pulso" . The Communications Handbook (2ª ed.). Prensa CRC . págs. 26–1, 26–2, 26–3. ISBN 9781420041163.

Otras lecturas

  • Borwick, John, ed., 1994: Práctica de grabación de sonido (Oxford: Oxford University Press)
  • Bosi, Marina y Goldberg, Richard E., 2003: Introducción a la codificación y los estándares de audio digital (Springer)
  • Ifeachor, Emmanuel C. y Jervis, Barrie W., 2002: Procesamiento de señales digitales: un enfoque práctico (Harlow, Inglaterra: Pearson Education Limited)
  • Rabiner, Lawrence R. y Gold, Bernard, 1975: Teoría y aplicación del procesamiento de señales digitales (Englewood Cliffs, Nueva Jersey: Prentice-Hall, Inc.)
  • Watkinson, John, 1994: El arte del audio digital (Oxford: Focal Press)

enlaces externos

  • Monty Montgomery (24 de octubre de 2012). "Opinión de los huéspedes: por qué las descargas de música 24/192 no tienen sentido" . evolver.fm . Consultado el 7 de diciembre de 2012 .
  • J. ROBERT STUART. "Codificación de audio digital de alta calidad" (PDF) . Archivado desde el original (PDF) el 27 de junio de 2007 . Consultado el 7 de diciembre de 2012 .
  • Dan Lavry. "Teoría de muestreo para audio digital" (PDF) . Consultado el 7 de diciembre de 2012 .
Escuche este artículo ( 9 minutos )
Icono de Wikipedia hablado
Este archivo de audio se creó a partir de una revisión de este artículo con fecha del 12 de marzo de 2016 y no refleja las ediciones posteriores. ( 12/03/2016 )
Obtenido de " https://en.wikipedia.org/w/index.php?title=Digital_audio&oldid=1050552780 "