AES3 (también conocido como AES / EBU ) es un estándar para el intercambio de señales de audio digital entre dispositivos de audio profesionales . Una señal AES3 puede transportar dos canales de audio PCM a través de varios medios de transmisión, incluidas líneas balanceadas , líneas no balanceadas y fibra óptica . [1]
AES3 fue desarrollado conjuntamente por la Audio Engineering Society (AES) y la Unión Europea de Radiodifusión (EBU). La norma se publicó por primera vez en 1985 y se revisó en 1992 y 2003. AES3 se ha incorporado a la norma IEC 60958 de la Comisión Electrotécnica Internacional y está disponible en una variante de grado de consumidor conocida como S / PDIF .
Historia y desarrollo
El desarrollo de estándares para la interconexión de audio digital para equipos de audio tanto profesionales como domésticos, comenzó a finales de la década de 1970 [2] en un esfuerzo conjunto entre la Audio Engineering Society y la European Broadcasting Union, y culminó con la publicación de AES3 en 1985. El El estándar AES3 ha sido revisado en 1992 y 2003 y está publicado en versiones AES y EBU. [1] Al principio, el estándar se conocía con frecuencia como AES / EBU.
Las variantes que utilizan diferentes conexiones físicas se especifican en IEC 60958. Se trata esencialmente de versiones de consumo de AES3 para su uso en el entorno doméstico de alta fidelidad utilizando conectores que se encuentran más comúnmente en el mercado de consumo. Estas variantes se conocen comúnmente como S / PDIF.
Conexiones de hardware
El estándar AES3 es paralelo a la parte 4 del estándar internacional IEC 60958. De los tipos de interconexión física definidos por IEC 60958, dos son de uso común.
IEC 60958 tipo I
Las conexiones de tipo I utilizan cableado de par trenzado balanceado de 3 conductores y 110 ohmios con conectores XLR . Las conexiones de tipo I se utilizan con mayor frecuencia en instalaciones profesionales y se consideran el conector estándar para AES3. La interfaz de hardware generalmente se implementa mediante controladores y receptores de línea RS-422 .
Extremo del cable | Final del dispositivo | |
---|---|---|
Aporte | Enchufe macho XLR | Conector hembra XLR |
Producción | Enchufe XLR hembra | Conector XLR macho |
IEC 60958 tipo II
IEC 60958 Tipo II define una interfaz eléctrica u óptica no balanceada para aplicaciones de electrónica de consumo . El precursor de la especificación IEC 60958 Tipo II fue la Interfaz digital Sony / Philips, o S / PDIF . Ambos se basaron en el trabajo original de AES / EBU. S / PDIF y AES3 son intercambiables a nivel de protocolo, pero a nivel físico, especifican diferentes niveles e impedancias de señalización eléctrica , que pueden ser importantes en algunas aplicaciones.
Conector BNC
Las señales AES / EBU también se pueden ejecutar utilizando conectores BNC no balanceados a con un cable coaxial de 75 ohmios. La versión no balanceada tiene una distancia de transmisión muy larga en comparación con los 150 metros máximo de la versión balanceada. [3] El estándar AES-3id define una variante eléctrica BNC de 75 ohmios de AES3. Esto utiliza el mismo cableado, parcheo e infraestructura que el video analógico o digital y, por lo tanto, es común en la industria de la transmisión.
Protocolo
- El protocolo de bajo nivel para la transmisión de datos en AES3 y S / PDIF es en gran parte idéntico, y la siguiente discusión se aplica a S / PDIF, excepto cuando se indique lo contrario.
AES3 se diseñó principalmente para admitir audio codificado PCM estéreo en formato DAT a 48 kHz o formato CD a 44,1 kHz. No se intentó utilizar un operador capaz de soportar ambas tarifas; en su lugar, AES3 permite que los datos se ejecuten a cualquier velocidad y codificar el reloj y los datos juntos usando el código de marca bifase (BMC).
Cada bit ocupa un intervalo de tiempo . Cada muestra de audio (de hasta 24 bits) se combina con cuatro bits de bandera y un preámbulo de sincronización que tiene cuatro intervalos de tiempo para hacer una subtrama de 32 intervalos de tiempo. Los 32 intervalos de tiempo de cada subtrama se asignan de la siguiente manera:
Franja horaria | Nombre | Descripción |
---|---|---|
0-3 | Preámbulo | Un preámbulo de sincronización (violación del código de marca bifásico) para bloques de audio, tramas y subtramas. |
4-7 | Muestra auxiliar (opcional) | Un canal auxiliar de baja calidad que se utiliza tal como se especifica en la palabra de estado del canal, en particular para el productor de línea interior o estudio de grabación comunicación -to-estudio. |
8-27 o 4-27 | Muestra de audio | Una muestra almacenada con el bit más significativo (MSB) al final. Si se utiliza la muestra auxiliar, los bits 4 a 7 no se incluyen. Los datos con profundidades de bits de muestra más pequeñas siempre tienen MSB en el bit 27 y se extienden a cero hacia el bit menos significativo (LSB). |
28 | Validez (V) | No se establece si los datos de audio son correctos y adecuados para la conversión D / A. Durante la presencia de muestras defectuosas, el equipo receptor puede recibir instrucciones para silenciar su salida. La mayoría de los reproductores de CD lo utilizan para indicar que se está produciendo un ocultamiento en lugar de una corrección de errores. |
29 | Datos de usuario (U) | Forma un flujo de datos en serie para cada canal (con 1 bit por trama), con un formato especificado en la palabra de estado del canal. |
30 | Estado del canal (C) | Los bits de cada cuadro de un bloque de audio se clasifican para obtener una palabra de estado de canal de 192 bits. Su estructura depende de si se utiliza AES3 o S / PDIF . |
31 | Paridad (p) | Incluso bit de paridad para la detección de errores en la transmisión de datos. Excluye preámbulo; Los bits 4 a 31 tienen un número par de unos. |
Dos subtramas (A y B, normalmente utilizadas para los canales de audio izquierdo y derecho) forman una trama . Las tramas contienen períodos de 64 bits y se producen una vez por período de muestra de audio. En el nivel más alto, cada 192 cuadros consecutivos se agrupan en un bloque de audio . Si bien las muestras se repiten cada tiempo de fotograma, los metadatos solo se transmiten una vez por bloque de audio. A una frecuencia de muestreo de 48 kHz, hay 250 bloques de audio por segundo y 3,072,000 intervalos de tiempo por segundo compatibles con un reloj bifásico de 6.144 MHz. [4]
Preámbulo de sincronización
El preámbulo de sincronización es una especialmente codificado preámbulo que identifica el bastidor auxiliar y su posición dentro del bloque de audio. Los preámbulos no son bits de datos codificados en BMC normales, aunque todavía tienen un sesgo de CC cero .
Son posibles tres preámbulos:
- X (o M): 11100010 2 si el intervalo de tiempo anterior era 0 , 00011101 2 si era 1 . (Equivalente, 10010011 2 codificado en NRZI ). Marca una palabra para el canal A (izquierda), que no sea al comienzo de un bloque de audio.
- Y (o W): 11100100 2 si el intervalo de tiempo anterior era 0 , 00011011 2 si era 1 . (Equivalente, 10010110 2 codificado en NRZI ). Marca una palabra para el canal B (derecha).
- Z (o B): 11101000 2 si el intervalo de tiempo anterior era 0 , 00010111 2 si era 1 . (Equivalente, 10011100 2 codificado en NRZI ). Marca una palabra para el canal A (izquierda) al comienzo de un bloque de audio.
Los tres preámbulos se denominan X, Y, Z en el estándar AES3; y M, W, B en IEC 958 (una extensión AES).
Los preámbulos de 8 bits se transmiten en el tiempo asignado a los primeros cuatro intervalos de tiempo de cada subtrama (intervalos de tiempo 0 a 3). Cualquiera de los tres marca el comienzo de una subtrama. X o Z marca el comienzo de un fotograma y Z marca el comienzo de un bloque de audio.
| 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Ranuras de tiempo _____ _ _____ _ / \ _____ / \ _ / \ _____ / \ _ / \ Preámbulo X _____ _ ___ ___ / \ ___ / \ ___ / \ _____ / \ _ / \ Preámbulo Y _____ _ _ _____ / \ _ / \ _____ / \ _____ / \ _ / \ Preámbulo Z ___ ___ ___ ___ / \ ___ / \ ___ / \ ___ / \ ___ / \ Todos 0 bits codificados en BMC _ _ _ _ _ _ _ _ / \ _ / \ _ / \ _ / \ _ / \ _ / \ _ / \ _ / \ _ / \ Todos 1 bits codificados en BMC | 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Ranuras de tiempo
En AES3 de dos canales, los preámbulos forman un patrón de ZYXYXYXY…, pero es sencillo extender esta estructura a canales adicionales (más subtramas por trama), cada uno con un preámbulo Y, como se hace en el protocolo MADI .
Palabra de estado del canal
Hay un bit de estado de canal en cada subtrama, un total de 192 bits o 24 bytes para cada canal en cada bloque. Entre los estándares AES3 y S / PDIF, el contenido de la palabra de estado del canal de 192 bits difiere significativamente, aunque coinciden en que el primer bit de estado del canal distingue entre los dos. En el caso de AES3, el estándar describe, en detalle, la función de cada bit. [1]
- Byte 0: datos de control básicos: frecuencia de muestreo, compresión, énfasis
- bit 0: un valor de 1 indica que se trata de datos de estado del canal AES3. 0 indica que se trata de datos S / PDIF.
- bit 1: un valor de 0 indica que se trata de datos PCM de audio lineal. Un valor de 1 indica otros datos (generalmente que no son de audio).
- bits 2–4: indica el tipo de pre-énfasis de señal aplicado a los datos. Generalmente establecido en 100 2 (ninguno).
- bit 5: un valor de 0 indica que la fuente está bloqueada en alguna sincronización de hora externa (no especificada). Un valor de 1 indica una fuente desbloqueada.
- bits 6–7: frecuencia de muestreo. Estos bits son redundantes cuando se transmite audio en tiempo real (el receptor puede observar la frecuencia de muestreo directamente), pero son útiles si se graban o almacenan datos AES3. Las opciones son no especificadas, 48 kHz (el valor predeterminado), 44,1 kHz y 32 kHz. Es posible que se indiquen opciones adicionales de frecuencia de muestreo en el campo de frecuencia de muestreo ampliado (consulte a continuación).
- Byte 1: indica si el flujo de audio es estéreo, mono o alguna otra combinación.
- bits 0–3: indica la relación de los dos canales; pueden ser datos de audio no relacionados, un par estéreo, datos mono duplicados, comentarios de música y voz, un código de suma / diferencia estéreo.
- bits 4–7: se utiliza para indicar el formato de la palabra del canal de usuario
- Byte 2: longitud de la palabra de audio
- bits 0–2: uso de bits auxiliares. Esto indica cómo se utilizan los bits auxiliares (ranuras de tiempo 4–7). Generalmente configurado en 000 2 (sin usar) o 001 2 (usado para datos de audio de 24 bits).
- bits 3–5: longitud de la palabra. Especifica el tamaño de la muestra, en relación con el máximo de 20 o 24 bits. Puede especificar 0, 1, 2 o 4 bits que faltan. Los bits no utilizados se llenan con 0, pero las funciones de procesamiento de audio, como la mezcla, generalmente los completarán con datos válidos sin cambiar la longitud efectiva de la palabra.
- bits 6–7: sin usar
- Byte 3: se utiliza solo para aplicaciones multicanal [ se necesitan más explicaciones ]
- Byte 4: información adicional sobre la frecuencia de muestreo [ se necesita una explicación más detallada ]
- bits 0–1: indica el grado de la referencia de frecuencia de muestreo, según AES11
- bit 2: reservado
- bits 3–6: frecuencia de muestreo ampliada. Esto indica otras frecuencias de muestreo, no representables en el byte 0 bits 6–7. Se asignan valores para 24, 96 y 192 kHz, así como para 22,05, 88,2 y 176,4 kHz.
- bit 7: Bandera de escalado de frecuencia de muestreo. Si se establece, indica que la frecuencia de muestreo se multiplica por 1 / 1,001 para que coincida con las velocidades de cuadro de video NTSC .
- Byte 5: reservado
- Bytes 6–9: Cuatro caracteres ASCII para indicar el origen del canal. Ampliamente utilizado en grandes estudios.
- Bytes 10-13: Cuatro caracteres ASCII que indican el destino del canal, para controlar los conmutadores automáticos. Usado con menos frecuencia.
- Bytes 14-17: dirección de muestra de 32 bits, que se incrementa de bloque a bloque en 192 (porque hay 192 cuadros por bloque). A 48 kHz, esto envuelve aproximadamente todos los días. [a]
- Bytes 18-21: desplazamiento de dirección de muestra de 32 bits para indicar muestras desde la medianoche. [5]
- Byte 22: Indicación de confiabilidad de la palabra de estado del canal
- bits 0-3: reservado
- bit 4: si se establece, los bytes 0–5 (formato de señal) no son confiables.
- bit 5: si se establece, los bytes 6–13 (etiquetas de canal) no son confiables.
- bit 6: si se establece, los bytes 14-17 (dirección de muestra) no son confiables.
- bit 7: si se establece, los bytes 18-21 (marca de tiempo) no son confiables.
- Byte 23: CRC . Este byte se utiliza para detectar la corrupción de la palabra de estado del canal, como podría ser causado por la conmutación a mitad de bloque. [B]
Código de tiempo incrustado
Los datos del código de tiempo SMPTE se pueden incrustar dentro de las señales AES3. Se puede utilizar para sincronización y para registrar e identificar contenido de audio. Está incrustado como una palabra binaria de 32 bits en los bytes 18 a 21 de los datos de estado del canal. [6]
El estándar AES11 proporciona información sobre la sincronización de estructuras de audio digital. [7]
el estándar AES52 describe cómo insertar identificadores únicos en un flujo de bits AES3. [8]
SMPTE 2110-31: transmisión AES3 a través de una red IP
SMPTE 2110-31 define cómo encapsular un flujo de datos AES3 en paquetes de protocolo de transporte en tiempo real para su transmisión a través de una red IP utilizando el marco de multidifusión basado en IP SMPTE 2110. [9]
Otros formatos
El formato de audio digital AES3 también se puede transportar a través de una red en modo de transferencia asíncrona . El estándar para empaquetar tramas AES3 en celdas ATM es AES47 .
Ver también
- ADAT Lightpipe : interfaz de audio digital óptico multicanal
- AES-2id : directrices para el uso de la interfaz AES3
Notas
- ^ Exactamente 24h51m18.485333s
- ^ El polinomio generador es x 8 + x 4 + x 3 + x 2 +1, preestablecido en 1.
Referencias
- ^ a b c "Especificación de la interfaz de audio digital AES / EBU (La interfaz AES / EBU)" (PDF) . Unión Europea de Radiodifusión. 2004 . Consultado el 7 de enero de 2014 .
- ^ "Acerca de los estándares AES" . Sociedad de Ingeniería de Audio . Consultado el 7 de enero de 2014 .
En 1977, estimulado por la creciente necesidad de estándares en audio digital, se formó el Comité de Estándares de Audio Digital AES.
- ^ John Emmett (1995), Pautas de ingeniería: la interfaz de audio digital EBU / AES (PDF) , Unión Europea de radiodifusión
- ^ Robin, Michael (1 de septiembre de 2004). "El estándar de distribución de señales de audio digital AES / EBU" . Broadcastengineering.com. Archivado desde el original el 9 de julio de 2012 . Consultado el 13 de mayo de 2012 .
- ^ "Especificación de la interfaz de audio digital AES / EBU (La interfaz AES / EBU)" (PDF) . Unión Europea de Radiodifusión. 2004. p. 12 . Consultado el 7 de enero de 2014 .
Bytes 18 a 21, Bits 0 a 7: código de dirección de muestra de la hora del día. Valor (cada byte): valor binario de 32 bits que representa la primera muestra del bloque actual. Los LSB se transmiten primero. El valor predeterminado será "0" lógico. Nota: Esta es la hora del día establecida durante la codificación de la fuente de la señal y permanecerá sin cambios durante las operaciones posteriores. Un valor de todos ceros para el código de dirección de muestra binaria, a los efectos de la transcodificación a tiempo real, o a códigos de tiempo en particular, se tomará como medianoche (es decir, 00 h, 00 mm, 00 s, 00 fotogramas). La transcodificación del número binario a cualquier código de tiempo convencional requiere información de frecuencia de muestreo precisa para proporcionar la hora exacta de la muestra.
- ^ Ratcliff, John (1999). Código de tiempo: una guía del usuario . Prensa Focal. págs. 226, 228. ISBN 0-240-51539-0.
- ^ AES11-2009 (r2019): práctica recomendada de AES para la ingeniería de audio digital - Sincronización de equipos de audio digital en operaciones de estudio , Audio Engineering Society , 2009
- ^ AES52-2006 (r2017): estándar AES para ingeniería de audio digital: inserción de identificadores únicos en el flujo de transporte AES3 , Audio Engineering Society , 2006
- ^ "ST 2110-31: 2018 - Estándar SMPTE - Medios profesionales sobre redes IP administradas: Transporte transparente AES3" , St 2110-31: 2018 : 1–12, agosto de 2018, doi : 10.5594 / SMPTE.ST2110-31.2018 , ISBN 978-1-68303-151-2
Otras lecturas
- Watkinson, John (2001). El arte del audio digital Tercera edición . Prensa Focal. ISBN 0-240-51587-0.
- Watkinson, John (agosto de 1989). "La interfaz de audio digital AES / EBU" . Conferencia del Reino Unido: Interfaz AES / EBU . EBU-02.
enlaces externos
- Página de descarga para estándares AES
- Unión Europea de Radiodifusión, Especificación de la interfaz de audio digital (La interfaz AES / EBU) Tech 3250-E tercera edición (2004)
- Emmett, John (1995). "Pautas de ingeniería: la interfaz de audio digital EBU / AES" (PDF) . EBU .
- Mark Yonge (junio-julio de 2005). "Revisión del estado del canal AES3" (PDF) . Alinee (101): 20–22. Archivado desde el original (PDF) el 1 de mayo de 2015 . Consultado el 1 de septiembre de 2013 .
- "Configuración del byte de estado del canal AES3 / AES-EBU" .