MPEG-4 Part 3 o MPEG-4 Audio (formalmente ISO / IEC 14496-3) es la tercera parte del estándar internacional ISO / IEC MPEG-4 desarrollado por Moving Picture Experts Group . [1] Especifica métodos de codificación de audio . La primera versión de ISO / IEC 14496-3 se publicó en 1999. [2]
El MPEG-4 Parte 3 consta de una variedad de tecnologías de codificación de audio, desde codificación de voz con pérdida ( HVXC , CELP ), codificación de audio general ( AAC , TwinVQ , BSAC), compresión de audio sin pérdida ( MPEG-4 SLS , codificación sin pérdida de audio , MPEG -4 DST ), una interfaz de texto a voz (TTSI), audio estructurado (usando SAOL , SASL, MIDI ) y muchas técnicas de codificación y síntesis de audio adicionales. [3] [4] [5] [6] [7] [8] [9] [10][11]
MPEG-4 Audio no se dirige a una sola aplicación, como telefonía en tiempo real o compresión de audio de alta calidad. Se aplica a todas las aplicaciones que requieren el uso de compresión, síntesis, manipulación o reproducción de sonido avanzadas. MPEG-4 Audio es un nuevo tipo de estándar de audio que integra numerosos tipos diferentes de codificación de audio: sonido natural y sonido sintético, entrega de baja tasa de bits y entrega de alta calidad, voz y música, bandas sonoras complejas y simples, contenido tradicional y contenido interactivo. . [7]
Versiones
Edición | Fecha de lanzamiento | Última enmienda | Estándar | Descripción |
---|---|---|---|---|
Primera edición | 1999 | 2001 | ISO / IEC 14496-3: 1999 [2] | también conocido como "MPEG-4 Audio Version 1" |
2000 | ISO / IEC 14496-3: 1999 / Amd 1: 2000 [13] | también conocido como "MPEG-4 Audio Version 2", una enmienda a la primera edición [7] [8] | ||
Segunda edicion | 2001 | 2005 | ISO / IEC 14496-3: 2001 [14] | |
Tercera edicion | 2005 | 2008 | ISO / IEC 14496-3: 2005 [15] | |
Cuarta edición | 2009 | 2015 y en desarrollo [12] | ISO / IEC 14496-3: 2009 [1] [16] | |
Quinta edición | 2019 | ISO / IEC 14496-3: 2019 [17] | Versión actual |
Subpartes
MPEG-4 Parte 3 contiene las siguientes subpartes: [16]
- Subparte 1: Principal (lista de tipos de objetos de audio, perfiles, niveles, interfaz para ISO / IEC 14496-1, flujo de transporte de audio MPEG-4, etc.)
- Subparte 2: Codificación de voz - HVXC (Codificación de excitación de vector armónico)
- Subparte 3: Codificación de voz - CELP (Predicción lineal excitada por código)
- Subparte 4: Codificación de audio general (GA) (codificación de tiempo / frecuencia) - AAC , TwinVQ , BSAC
- Subparte 5: Audio estructurado (SA)
- Subparte 6: Interfaz de texto a voz (TTSI)
- Subparte 7: Codificación de audio paramétrica - HILN (línea armónica e individual más ruido)
- Subparte 8: Descripción técnica de la codificación paramétrica para audio de alta calidad (SSC, estéreo paramétrico )
- Subparte 9: Audio MPEG-1 / MPEG-2 en MPEG-4
- Subparte 10: Descripción técnica de la codificación sin pérdidas de audio sobremuestreado (MPEG-4 DST - Direct Stream Transfer )
- Subparte 11: Codificación sin pérdida de audio (ALS)
- Subparte 12: Codificación escalable sin pérdidas (SLS)
Tipos de objetos de audio MPEG-4
MPEG-4 Audio incluye un sistema para manejar un grupo diverso de formatos de audio de manera uniforme. A cada formato se le asigna un tipo de objeto de audio único para representarlo. [18] [19] El tipo de objeto se utiliza para distinguir entre diferentes métodos de codificación. Determina directamente el subconjunto de herramientas MPEG-4 necesario para decodificar un objeto específico. Los perfiles MPEG-4 se basan en los tipos de objetos y cada perfil admite una lista diferente de tipos de objetos. [19]
ID de tipo de objeto | Tipo de objeto de audio | Primera fecha de lanzamiento público | Descripción |
---|---|---|---|
1 | AAC principal | 1999 | contiene AAC LC |
2 | AAC LC (baja complejidad) | 1999 | Se utiliza en el "Perfil AAC". El tipo de objeto de audio MPEG-4 AAC LC se basa en el perfil de baja complejidad (LC) MPEG-2 Parte 7 combinado con Sustitución de ruido perceptual (PNS) (definido en MPEG-4 Parte 3 Subparte 4). [4] [22] |
3 | AAC SSR (frecuencia de muestreo escalable) | 1999 | El tipo de objeto de audio MPEG-4 AAC SSR se basa en el perfil de frecuencia de muestreo escalable (SSR) MPEG-2 Parte 7 combinado con la sustitución de ruido perceptual (PNS) (definida en MPEG-4 Parte 3 Subparte 4). [4] [22] |
4 | AAC LTP ( predicción a largo plazo ) | 1999 | contiene AAC LC |
5 | SBR ( replicación de banda espectral ) | 2003 [23] | utilizado con AAC LC en el "Perfil AAC de alta eficiencia" ( HE-AAC v1) |
6 | AAC escalable | 1999 | |
7 | TwinVQ | 1999 | codificación de audio a tasas de bits muy bajas |
8 | CELP ( predicción lineal excitada por código ) | 1999 | codificación de voz |
9 | HVXC (codificación de excitación de vector armónico) | 1999 | codificación de voz |
10 | (Reservado) | ||
11 | (Reservado) | ||
12 | TTSI (interfaz de texto a voz ) | 1999 | |
13 | Síntesis principal | 1999 | contiene síntesis basada en muestras de ' tabla de ondas ' [24] y síntesis algorítmica y efectos de audio |
14 | síntesis basada en muestras de ' tabla de ondas ' | 1999 | basado en SoundFont y DownLoadable Sounds , [24] contiene General MIDI |
15 | MIDI general | 1999 | |
dieciséis | Síntesis algorítmica y efectos de audio | 1999 | |
17 | ER AAC LC | 2000 | Resistente a errores |
18 | (Reservado) | ||
19 | ER AAC LTP | 2000 | Resistente a errores |
20 | ER AAC escalable | 2000 | Resistente a errores |
21 | ER TwinVQ | 2000 | Resistente a errores |
22 | ER BSAC (codificación aritmética en trozos de bits) | 2000 | También se conoce como "Fine Granule Audio" o herramienta de escalabilidad de grano fino. Se utiliza en combinación con las herramientas de codificación AAC y reemplaza la codificación silenciosa y el formato de flujo de bits del codificador MPEG-4 Versión 1 GA. Resistente a errores |
23 | ER AAC LD (retardo bajo) | 2000 | Resistente a errores, utilizado con CELP, ER CELP, HVXC, ER HVXC y TTSI en el "Perfil de retardo bajo" (comúnmente utilizado para aplicaciones de conversación en tiempo real) |
24 | ER CELP | 2000 | Resistente a errores |
25 | ER HVXC | 2000 | Resistente a errores |
26 | ER HILN ( líneas armónicas e individuales más ruido) | 2000 | Resistente a errores |
27 | ER Paramétrico | 2000 | Resistente a errores |
28 | SSC (codificación SinuSoidal) | 2004 [25] [26] | |
29 | PS ( estéreo paramétrico ) | 2004 [27] y 2006 [28] [29] | utilizado con AAC LC y SBR en el "Perfil HE-AAC v2". La herramienta de codificación PS se definió en 2004 y el tipo de objeto se definió en 2006. |
30 | Envolvente MPEG | 2007 [30] | también conocido como codificación de audio espacial MPEG (SAC), es un tipo de codificación de audio espacial [31] [32] (MPEG Surround también se definió en ISO / IEC 23003-1 en 2007 [33] ) |
31 | (Reservado) | ||
32 | MPEG-1/2 Layer-1 | 2005 [34] | |
33 | MPEG-1/2 Layer-2 | 2005 [34] | |
34 | MPEG-1/2 Layer-3 | 2005 [34] | también conocido como "MP3onMP4" |
35 | DST ( transferencia directa de flujo ) | 2005 [35] | codificación de audio sin pérdidas, utilizada en Super Audio CD |
36 | ALS ( codificación sin pérdida de audio ) | 2006 [29] | codificación de audio sin pérdidas |
37 | SLS ( codificación escalable sin pérdidas ) | 2006 [36] | codificación de audio de dos capas con capa sin pérdida y núcleo / capa de audio general con pérdida (por ejemplo, AAC) |
38 | SLS no básico | 2006 | codificación de audio sin pérdida sin núcleo / capa de audio general con pérdida (por ejemplo, AAC) |
39 | ER AAC ELD (Retardo bajo mejorado) | 2008 [37] | Resistente a errores |
40 | SMR (Representación musical simbólica) Simple | 2008 | nota: La representación de música simbólica también es el estándar MPEG-4 Parte 23 (ISO / IEC 14496-23: 2008) [38] [39] |
41 | SMR principal | 2008 | |
42 | USAC ( codificación unificada de voz y audio ) | 2012 | La codificación unificada de voz y audio se define en MPEG-D Parte 3 (ISO / IEC 23003-3: 2012) [40] |
43 | SAOC (Codificación de objetos de audio espacial) | 2010 [41] [42] | nota: La codificación de objetos de audio espacial también es el estándar MPEG-D Parte 2 (ISO / IEC 23003-2: 2010) [43] |
44 | Sonido envolvente LD MPEG | 2010 [44] | Este tipo de objeto transmite información lateral de codificación envolvente MPEG de retardo bajo (que se definió en MPEG-D Parte 2 - ISO / IEC 23003-2 [43] ) en el marco de audio MPEG-4. |
45 | SAOC-DE | 2013 | Mejora del diálogo de codificación de objetos de audio espacial |
46 | Sincronización de audio | 2015 | La herramienta de sincronización de audio brinda la capacidad de sincronizar múltiples contenidos en múltiples dispositivos. |
Perfiles de audio
El estándar de audio MPEG-4 define varios perfiles. Estos perfiles se basan en los tipos de objetos y cada perfil admite una lista diferente de tipos de objetos. Cada perfil también puede tener varios niveles, que limitan algunos parámetros de las herramientas presentes en un perfil. Estos parámetros suelen ser la frecuencia de muestreo y el número de canales de audio decodificados al mismo tiempo.
Perfil de audio | Tipos de objetos de audio | Primera fecha de lanzamiento público |
---|---|---|
Perfil AAC | AAC LC | 2003 |
Perfil AAC de alta eficiencia | AAC LC, SBR | 2003 |
Perfil HE-AAC v2 | AAC LC, SBR, PS | 2006 |
Perfil de audio principal | AAC principal, AAC LC, AAC SSR, AAC LTP, AAC escalable, TwinVQ, CELP, HVXC, TTSI, síntesis principal | 1999 |
Perfil de audio escalable | AAC LC, AAC LTP, AAC escalable, TwinVQ, CELP, HVXC, TTSI | 1999 |
Perfil de audio de voz | CELP , HVXC , TTSI | 1999 |
Perfil de audio sintético | TTSI, síntesis principal | 1999 |
Perfil de audio de alta calidad | AAC LC, AAC LTP, AAC escalable, CELP, ER AAC LC, ER AAC LTP, ER AAC escalable, ER CELP | 2000 |
Perfil de audio de bajo retardo | CELP, HVXC, TTSI, ER AAC LD, ER CELP, ER HVXC | 2000 |
Perfil de audio natural | AAC principal, AAC LC, AAC SSR, AAC LTP, AAC escalable, TwinVQ, CELP, HVXC, TTSI, ER AAC LC, ER AAC LTP, ER AAC escalable, ER TwinVQ, ER BSAC, ER AAC LD, ER CELP, ER HVXC , ER HILN, ER Paramétrico | 2000 |
Perfil de interconexión de audio móvil | ER AAC LC, ER AAC escalable, ER TwinVQ, ER BSAC, ER AAC LD | 2000 |
Perfil HD-AAC | AAC LC, SLS [45] | 2009 [46] |
Perfil simple de ALS | ALS | 2010 [42] [47] |
Almacenamiento y transporte de audio
Estándar | Descripción | |
---|---|---|
Multicine | ISO / IEC 14496-1 | Esquema de multiplexación MPEG-4 (M4Mux) [48] |
Multicine | ISO / IEC 14496-3 | Múltiplex de transporte de audio de baja sobrecarga (LATM) |
Almacenamiento | ISO / IEC 14496-3 (informativo) | Formato de intercambio de datos de audio (ADIF): solo para AAC |
Almacenamiento | ISO / IEC 14496-12 | Formato de archivo MPEG-4 ( MP4 ) / formato de archivo multimedia base ISO |
Transmisión | ISO / IEC 14496-3 (informativo) | Flujo de transporte de datos de audio (ADTS): solo para AAC |
Transmisión | ISO / IEC 14496-3 | Flujo de audio de baja sobrecarga (LOAS), basado en LATM |
No existe un estándar para el transporte de flujos elementales a través de un canal, porque la amplia gama de aplicaciones MPEG-4 tienen requisitos de entrega que son demasiado amplios para caracterizarlos fácilmente con una sola solución.
Las capacidades de una capa de transporte y la comunicación entre las funciones de transporte, multiplexación y demultiplexación se describen en el Delivery Multimedia Integration Framework (DMIF) en ISO / IEC 14496-6. [16] Existe una amplia variedad de mecanismos de entrega debajo de esta interfaz, por ejemplo, flujo de transporte MPEG , Protocolo de transporte en tiempo real (RTP), etc.
El transporte en el protocolo de transporte en tiempo real se define en RFC 3016 (formato de carga útil RTP para secuencias audio / visuales MPEG-4), RFC 3640 (formato de carga útil RTP para transporte de secuencias elementales MPEG-4), RFC 4281 (parámetro de códecs para " Bucket "Tipos de papel") y RFC 4337 (Registro de tipo MIME para MPEG-4).
LATM y LOAS se definieron para aplicaciones de audio natural, que no requieren codificación sofisticada basada en objetos u otras funciones proporcionadas por los sistemas MPEG-4.
Bifurcación en el estándar técnico AAC
La Subparte 4 de Codificación de audio avanzada en MPEG-4 Parte 3 (Audio MPEG-4) se mejoró en relación con el estándar anterior MPEG-2 Parte 7 (Codificación de audio avanzada), con el fin de proporcionar una mejor calidad de sonido para una tasa de bits de codificación determinada.
Se supone que cualquier diferencia de la Parte 3 y la Parte 7 será resuelta por el organismo de normalización ISO en un futuro próximo para evitar la posibilidad de futuras incompatibilidades de flujo de bits. En la actualidad, no se conocen incompatibilidades de reproductores o códecs debido a la novedad del estándar.
El estándar MPEG-2 Parte 7 (Codificación de audio avanzada) se publicó por primera vez en 1997 y ofrece tres perfiles predeterminados: [49] [50] Perfil de baja complejidad (LC), perfil principal y perfil de frecuencia de muestreo escalable (SSR).
MPEG-4 Parte 3 Subparte 4 (Codificación de audio general) combinó los perfiles de MPEG-2 Parte 7 con Sustitución de ruido perceptual (PNS) y los definió como Tipos de objetos de audio (AAC LC, AAC Main, AAC SSR). [4]
HE-AAC
La codificación de audio avanzada de alta eficiencia es una extensión de AAC LC que utiliza replicación de banda espectral (SBR) y estéreo paramétrico (PS). Está diseñado para aumentar la eficiencia de codificación a bajas tasas de bits mediante el uso de una representación paramétrica parcial de audio.
AAC-SSR
Sony introdujo la frecuencia de muestreo escalable AAC en los estándares MPEG-2 Part 7 y MPEG-4 Part 3. [ cita requerida ] Se publicó por primera vez en ISO / IEC 13818-7, Parte 7: Codificación de audio avanzada (AAC) en 1997. [49] [50] La señal de audio se divide primero en 4 bandas utilizando un filtro de cuadratura polifásico de 4 bandas Banco. Luego, estas 4 bandas se dividen aún más utilizando MDCT con un tamaño k de 32 o 256 muestras. Esto es similar al AAC LC normal que usa MDCT con un tamaño k de 128 o 1024 directamente en la señal de audio.
La ventaja de esta técnica es que la conmutación de bloques cortos se puede realizar por separado para cada banda PQF . De modo que las altas frecuencias se pueden codificar utilizando un bloque corto para mejorar la resolución temporal, las bajas frecuencias aún se pueden codificar con alta resolución espectral. Sin embargo, debido al aliasing entre las 4 bandas de PQF, las eficiencias de codificación alrededor de (1, 2, 3) * fs / 8 es peor que el MPEG-4 AAC LC normal. [ cita requerida ]
MPEG-4 AAC-SSR es muy similar a ATRAC y ATRAC-3 .
Por qué se introdujo AAC-SSR
La idea detrás de AAC-SSR no solo era la ventaja mencionada anteriormente, sino también la posibilidad de reducir la velocidad de datos eliminando 1, 2 o 3 de las bandas superiores de PQF. Un divisor de flujo de bits muy simple puede eliminar estas bandas y reducir así la tasa de bits y la frecuencia de muestreo.
Ejemplo:
- 4 subbandas: bitrate = 128 kbit / s, frecuencia de muestreo = 48 kHz, f_lowpass = 20 kHz
- 3 subbandas: bitrate ~ 120 kbit / s, frecuencia de muestreo = 48 kHz, f_lowpass = 18 kHz
- 2 subbandas: bitrate ~ 100 kbit / s, frecuencia de muestreo = 24 kHz, f_lowpass = 12 kHz
- 1 subbanda: bitrate ~ 65 kbit / s, frecuencia de muestreo = 12 kHz, f_lowpass = 6 kHz
Nota: aunque es posible, la calidad resultante es mucho peor que la típica para esta tasa de bits. Por lo tanto, para LC AAC normal de 64 kbit / s, se logra un ancho de banda de 14–16 kHz mediante el uso de estéreo de intensidad y RMN reducidas. Esto degrada la calidad audible menos que la transmisión de un ancho de banda de 6 kHz con una calidad perfecta.
BSAC
La codificación aritmética en trozos de bits es un estándar MPEG-4 (ISO / IEC 14496-3 subparte 4) para la codificación de audio escalable. BSAC utiliza una codificación silenciosa alternativa a AAC, y el resto del procesamiento es idéntico a AAC. Este soporte para la escalabilidad permite una calidad de sonido casi transparente a 64 kbit / sy una degradación elegante a velocidades de bits más bajas. La codificación BSAC se realiza mejor en el rango de 40 kbit / sa 64 kbit / s, aunque opera en el rango de 16 kbit / sa 64 kbit / s. El códec AAC-BSAC se utiliza en aplicaciones de difusión multimedia digital (DMB) .
Licencia
En 2002, el Comité de Licencias de Audio MPEG-4 seleccionó a Via Licensing Corporation como el Administrador de Licencias para el grupo de patentes de audio MPEG-4 . [3] [51] [52]
Ver también
- TwinVQ : uno de los tipos de objetos definidos en MPEG-4 Audio versión 1
- MPEG-4 Parte 2
- Formato contenedor MPEG-4 Parte 14 (MP4)
- Gestión de derechos digitales
- Codificación de audio avanzada (AAC)
- ISO / IEC JTC 1 / SC 29
Referencias
- ^ a b ISO (2009). "ISO / CEI 14496-3: 2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio" . ISO . Consultado el 6 de octubre de 2009 .
- ^ a b ISO (1999). "ISO / CEI 14496-3: 1999 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio" . ISO . Consultado el 6 de octubre de 2009 .
- ^ a b Business Wire (2002-12-02). "El comité de licencias de audio MPEG-4 selecciona a Via Licensing Corporation como administrador; el comité de licencias de audio MPEG-4 finaliza los términos para la licencia de perfiles de audio" . La biblioteca gratuita . Consultado el 6 de octubre de 2009 .
- ^ a b c d Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama (1999). "Codificación de audio natural MPEG-4 - Perfiles y niveles de audio" . chiariglione.org. Archivado desde el original el 17 de julio de 2010 . Consultado el 6 de octubre de 2009 .
- ^ Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama. "Codificación de audio natural MPEG-4: escalabilidad en audio natural MPEG-4" . chiariglione.org. Archivado desde el original el 28 de febrero de 2010 . Consultado el 6 de octubre de 2009 .
- ^ D. Thom, H. Purnhagen y el Subgrupo de audio MPEG (octubre de 1998). "Preguntas frecuentes sobre audio MPEG - MPEG-4" . chiariglione.org . Consultado el 6 de octubre de 2009 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ a b c d ISO / IEC JTC 1 / SC 29 / WG 11 (julio de 1999), ISO / IEC 14496-3: /Amd.1 - Borrador final del comité - MPEG-4 Audio Versión 2 (PDF) , archivado desde el original (PDF) en 2012-08-01 , consultado el 2009-10-07
- ^ a b Heiko Purnhagen (1999-06-07), An Overview of MPEG-4 Audio Version 2 (PDF) , Heiko Purnhagen , consultado el 7 de octubre de 2009[ enlace muerto permanente ]
- ^ a b Heiko Purnhagen (1 de junio de 2001). "El estándar de audio MPEG-4: descripción general y aplicaciones" . Heiko Purnhagen . Consultado el 7 de octubre de 2009 .[ enlace muerto ]
- ^ Heiko Purnhagen (7 de noviembre de 2001). "La página web de MPEG Audio - MPEG-4 Audio (ISO / IEC 14496-3)" . Consultado el 7 de octubre de 2009 .[ enlace muerto ]
- ^ Rob Koenen, ISO / IEC JTC1 / SC29 / WG11 (marzo de 2002). "Descripción general del estándar MPEG-4" . chiariglione.org . Consultado el 6 de octubre de 2009 .
- ^ a b MPEG. "Estándares MPEG - Lista completa de estándares desarrollados o en desarrollo" . chiariglione.org. Archivado desde el original el 20 de abril de 2010 . Consultado el 31 de octubre de 2009 .
- ^ ISO (2000). "ISO / IEC 14496-3: 1999 / Amd 1: 2000 - Extensiones de audio" . ISO . Consultado el 7 de octubre de 2009 .
- ^ ISO (2001). "ISO / CEI 14496-3: 2001 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio" . ISO . Consultado el 14 de octubre de 2009 .
- ^ ISO (2005). "ISO / CEI 14496-3: 2005 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio" . ISO . Consultado el 14 de octubre de 2009 .
- ^ a b c d ISO / IEC (2009-09-01), ISO / IEC 14496-3: 2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio (PDF) , IEC , recuperado 2009-10-07
- ^ ISO / IEC (2019-12-01), ISO / IEC 14496-3: 2019 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio , IEC , recuperado 2020-06-02
- ^ a b MultimediaWiki (2009). "Audio MPEG-4" . MultimediaWiki . Consultado el 9 de octubre de 2009 .
- ^ a b c Bernhard Grill; Stefan Geyersberger; Johannes Hilpert; Bodo Teichmann (julio de 2004), Implementación de componentes de audio MPEG-4 en varias plataformas (PDF) , Fraunhofer Gesellschaft, archivado desde el original (PDF) el 2007-06-10 , consultado el 2009-10-09
- ^ ISO / IEC JTC1 / SC29 / WG11 N2203 (marzo de 1998). "Audio MPEG-4 (Borrador del Comité Final 14496-3)" . Heiko Purnhagen . Consultado el 7 de octubre de 2009 .[ enlace muerto ]
- ^ a b c ISO / IEC JTC1 / SC29 / WG11 / N7016 (2005-01-11), Texto de ISO / IEC 14496-3: 2001 / FPDAM 4, Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC , archivado desde el original (DOC) en 05/12/2014 , recuperado 2009-10-09
- ^ a b Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama (1999). "Codificación de audio natural MPEG-4 - Codificación de audio general (basada en AAC)" . chiariglione.org. Archivado desde el original el 19 de febrero de 2010 . Consultado el 6 de octubre de 2009 .
- ^ ISO (2003). "Extensión de ancho de banda, ISO / IEC 14496-3: 2001 / Amd 1: 2003" . ISO . Consultado el 13 de octubre de 2009 .
- ^ a b Scheirer, Eric D .; Ray, Lee (1998). "Síntesis algorítmica y de tabla de ondas en el estándar multimedia MPEG-4". Convenio 105 de la Sociedad de Ingeniería de Audio, 1998 . CiteSeerX 10.1.1.35.2773 .
2.2 Síntesis de tablas de ondas con SASBF: El formato de banco de tablas de ondas SASBF tuvo una historia de desarrollo algo compleja. La especificación original fue aportada por E-Mu Systems y se basó en su formato "SoundFont" [15]. Después de que se completó la integración de este componente en el software de referencia MPEG-4, la Asociación de Fabricantes MIDI (MMA) se acercó a MPEG solicitando que MPEG-4 SASBF fuera compatible con su formato "Downloaded Sounds" [13]. E-Mu estuvo de acuerdo en que esta compatibilidad era deseable, por lo que todas las partes negociaron y diseñaron en colaboración un nuevo formato.
- ^ ISO (2004). "Codificación paramétrica para audio de alta calidad, ISO / IEC 14496-3: 2001 / Amd 2: 2004" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO / IEC JTC1 / SC29 / WG11 (25 de julio de 2003). "Texto de ISO / IEC 14496-3: 2001 / FPDAM2 (Audio paramétrico) - N5713" . Archivado desde el original (DOC) el 12 de mayo de 2014 . Consultado el 13 de octubre de 2009 .
- ^ 3GPP (30 de septiembre de 2004). "3GPP TS 26.401 V6.0.0 (2004-09), funciones generales de procesamiento de audio del códec de audio; Descripción general mejorada del códec de audio general aacPlus (versión 6)" (DOC) . 3GPP . Consultado el 13 de octubre de 2009 .
- ^ 3GPP (4 de enero de 2005). "ETSI TS 126 401 V6.1.0 (2004-12) - Sistema Universal de Telecomunicaciones Móviles (UMTS) general de audio codec de funciones de procesamiento de audio, audio codec general, aacPlus Enhanced General de descripción (3GPP TS 26.401 versión 6.1.0 Release 6)" . 3GPP . Consultado el 13 de octubre de 2009 .
- ^ a b ISO (2006). "Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC, ISO / IEC 14496-3: 2005 / Amd 2: 2006" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO (2007). "Extensiones BSAC y transporte de MPEG Surround, ISO / IEC 14496-3: 2005 / Amd 5: 2007" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO / IEC JTC1 / SC29 / WG11 (julio de 2005). "Tutorial sobre codificación de audio envolvente MPEG" . Archivado desde el original el 30 de abril de 2010 . Consultado el 9 de febrero de 2010 .
- ^ ISO / IEC JTC1 / SC29 / WG11 (julio de 2005). "Tutorial sobre codificación de audio envolvente MPEG" . Archivado desde el original el 24 de marzo de 2008 . Consultado el 9 de febrero de 2010 .
- ^ ISO (29 de enero de 2007). "ISO / IEC 23003-1: 2007 - Tecnología de la información - Tecnologías de audio MPEG - Parte 1: MPEG Surround" . ISO . Consultado el 24 de octubre de 2009 .
- ^ a b c ISO (2005). "Audio MPEG-1/2 en MPEG-4, ISO / IEC 14496-3: 2001 / Amd 3: 2005" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO (2005). "Codificación sin pérdidas de audio sobremuestreado, ISO / IEC 14496-3: 2001 / Amd 6: 2005" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO (2006). "Codificación escalable sin pérdidas (SLS), ISO / IEC 14496-3: 2005 / Amd 3: 2006" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO (2008). "AAC de retardo bajo mejorado, ISO / IEC 14496-3: 2005 / Amd 9: 2008" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO (2008). "ISO / CEI 14496-23: 2008, Tecnología de la información - Codificación de objetos audiovisuales - Parte 23: Representación musical simbólica" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO (2008). "Cumplimiento de la representación de música simbólica, ISO / IEC 14496-4: 2004 / Amd 29: 2008" . ISO . Consultado el 13 de octubre de 2009 .
- ^ ISO (2012). "ISO / CEI 23003-3: 2012 - Tecnología de la información - Tecnologías de audio MPEG - Parte 3: Codificación unificada de voz y audio" . ISO . Consultado el 7 de noviembre de 2019 .
- ^ ISO (2009). "ISO / IEC 14496-3: 2009 / Amd 2: 2010, perfil simple ALS y transporte de SAOC" . ISO . Consultado el 13 de octubre de 2009 .
- ^ a b ISO / IEC JTC1 / SC29 / WG11 (2009-07-03), ISO / IEC 14496-3: 200X / PDAM 2 - ALS Simple Profile and Transport of SAOC, N10826 , archivado desde el original (DOC) el 2014-07- 29 , consultado el 13 de octubre de 2009
- ^ a b ISO (2010). "ISO / IEC 23003-2: 2010 - Tecnología de la información - Tecnologías de audio MPEG - Parte 2: Codificación de objetos de audio espacial (SAOC)" . ISO . Consultado el 27 de diciembre de 2010 .
- ^ AES Convention Paper 8099: una nueva extensión estéreo paramétrica y multicanal para MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , consultado el 7 de noviembre de 2019
- ^ ISO / IEC JTC1 / SC29 / WG11 (2008-10-17), ISO / IEC 14496-3: 2005 / PDAM 10: 200X HD-AAC profile, MPEG2008 / N10188 , archivado desde el original (DOC) el 2014-05- 12 , consultado el 19 de octubre de 2009
- ^ ISO (11 de septiembre de 2009). "ISO / IEC 14496-3: 2009 / Amd 1: 2009 - Perfil HD-AAC y señalización MPEG Surround" . ISO . Consultado el 15 de octubre de 2009 .
- ^ ISO (8 de octubre de 2009). "ISO / IEC 14496-3: 2009 / Amd 2: 2010 - Perfil simple ALS y transporte de SAOC" . ISO . Consultado el 15 de octubre de 2009 .
- ^ ISO (2004-11-15), ISO / IEC 14496-1, Tercera edición 2004-11-15, Parte 1: Sistemas (PDF) , ISO, archivado del original (PDF) el 14 de junio de 2011 , recuperado en 2009- 10-14
- ^ a b ISO (2004-10-15), ISO / IEC 13818-7, Tercera edición, Parte 7 - Codificación de audio avanzada (AAC) (PDF) , p. 32, archivado desde el original (PDF) el 13 de julio de 2011 , consultado el 19 de octubre de 2009
- ^ a b ISO (1997). "ISO / CEI 13818-7: 1997, Tecnología de la información - Codificación genérica de imágenes en movimiento e información de audio asociada - Parte 7: Codificación de audio avanzada (AAC)" . Consultado el 19 de octubre de 2009 .
- ^ Business Wire (5 de enero de 2009). "Via Licensing Announces MPEG-4 SLS Patent Pool License" . Reuters. Archivado desde el original el 4 de enero de 2013 . Consultado el 9 de octubre de 2009 .
- ^ A través de Licensing Corporation (12 de mayo de 2009). "Via Licensing anuncia la disponibilidad de un programa conjunto de licencias de patentes MPEG-4 SLS" . Business Wire . Consultado el 9 de octubre de 2009 .
enlaces externos
- Apple: MPEG-4: AAC
- "AAC" (VideoLAN WIKI)
- Pruebas de escucha subjetiva EBU en códecs de audio de baja tasa de bits
- Estaciones de radio AAC: estaciones de radio en línea en formato AAC
- Tuner2 - Directorio de estaciones de radio en formato AAC + a varias velocidades de bits
- RadioFeeds Reino Unido e Irlanda : página que contiene muchas estaciones terrestres que transmiten por Internet en formato AAC +.
- [1] Una página que compara códecs que incluyen HE-AAC a 64 kbit / s mediante pruebas de escucha. (La página está desconectada)
- Sitio web oficial de MPEG
- RFC 3016 - Formato de carga útil RTP para transmisiones de audio / visuales MPEG-4
- RFC 3640 - Formato de carga útil RTP para el transporte de flujos elementales MPEG-4
- RFC 4281 - El parámetro de códecs para tipos de medios "Bucket"
- RFC 4337 - Registro de tipo MIME para MPEG-4