MPEG-4 Parte 3

Tercera parte del estándar ISO/IEC MPEG-4

MPEG-4 Parte 3 o MPEG-4 Audio (formalmente ISO / IEC 14496-3) es la tercera parte del estándar internacional ISO / IEC MPEG-4 desarrollado por Moving Picture Experts Group . [1] Especifica los métodos de codificación de audio . La primera versión de ISO/IEC 14496-3 se publicó en 1999. [2]

La Parte 3 del MPEG-4 consta de una variedad de tecnologías de codificación de audio, desde codificación de voz con pérdida ( HVXC , CELP ), codificación de audio general ( AAC , TwinVQ , BSAC), compresión de audio sin pérdida ( MPEG-4 SLS , codificación de audio sin pérdida , MPEG-4 DST ), una interfaz de texto a voz (TTSI), audio estructurado (usando SAOL , SASL, MIDI ) y muchas técnicas adicionales de síntesis y codificación de audio. [3] [4] [5 ] [6 ] [ 7] [8] [9] [10] [11]

El audio MPEG-4 no está destinado a una única aplicación, como la telefonía en tiempo real o la compresión de audio de alta calidad, sino que se aplica a todas las aplicaciones que requieren el uso de compresión, síntesis, manipulación o reproducción de sonido avanzadas. El audio MPEG-4 es un nuevo tipo de estándar de audio que integra numerosos tipos diferentes de codificación de audio: sonido natural y sonido sintético, entrega de baja tasa de bits y entrega de alta calidad, voz y música, bandas sonoras complejas y simples, contenido tradicional y contenido interactivo. [7]

Versiones

Versiones y ediciones de audio MPEG-4 [12]
EdiciónFecha de lanzamientoÚltima modificaciónEstándarDescripción
Primera edición19992001ISO/IEC 14496-3:1999 [2]También conocido como "MPEG-4 Audio Versión 1"
2000ISO/IEC 14496-3:1999/Enmienda 1:2000 [13]También conocido como "MPEG-4 Audio Version 2", una enmienda a la primera edición [7] [8]
Segunda edición20012005ISO/IEC 14496-3:2001 [14]
Tercera edición20052008ISO/IEC 14496-3:2005 [15]
Cuarta edición20092015 y en desarrollo [12]ISO/IEC 14496-3:2009 [1] [16]
Quinta edición2019ISO/IEC 14496-3:2019 [17]Versión actual

Subpartes

La Parte 3 del MPEG-4 contiene las siguientes subpartes: [16]

  • Subparte 1: Principal (lista de tipos de objetos de audio, perfiles, niveles, interfaz con ISO/IEC 14496-1, flujo de transporte de audio MPEG-4, etc.)
  • Subparte 2: Codificación de voz – HVXC (codificación de excitación vectorial armónica)
  • Subparte 3: Codificación del habla – CELP (predicción lineal por código excitado)
  • Subparte 4: Codificación de audio general (GA) (codificación de tiempo/frecuencia): AAC , TwinVQ , BSAC
  • Subparte 5: Audio estructurado (SA)
  • Subparte 6: Interfaz de texto a voz (TTSI)
  • Subparte 7: Codificación de audio paramétrica – HILN (armónicos y línea individual más ruido)
  • Subparte 8: Descripción técnica de la codificación paramétrica para audio de alta calidad (SSC, Parametric Stereo )
  • Subparte 9: Audio MPEG-1 / MPEG-2 en MPEG-4
  • Subparte 10: Descripción técnica de la codificación sin pérdida de audio sobremuestreado (MPEG-4 DST – Transferencia directa de flujo )
  • Subparte 11: Codificación sin pérdida de audio (ALS)
  • Subparte 12: Codificación escalable sin pérdida (SLS)

Tipos de objetos de audio MPEG-4

El formato de audio MPEG-4 incluye un sistema para manejar un grupo diverso de formatos de audio de manera uniforme. A cada formato se le asigna un tipo de objeto de audio único para representarlo. [18] [19] El tipo de objeto se utiliza para distinguir entre diferentes métodos de codificación. Determina directamente el subconjunto de herramientas MPEG-4 necesario para decodificar un objeto específico. Los perfiles MPEG-4 se basan en los tipos de objetos y cada perfil admite una lista diferente de tipos de objetos. [19]

Tipos de objetos de audio MPEG-4 [7] [9] [18] [20] [21]
Identificación del tipo de objetoTipo de objeto de audioFecha del primer lanzamiento públicoDescripción
1AAC principal1999contiene AAC LC
2AAC LC (baja complejidad)1999Se utiliza en el "Perfil AAC". El tipo de objeto de audio MPEG-4 AAC LC se basa en el perfil de baja complejidad (LC) MPEG-2 Parte 7 combinado con la sustitución de ruido perceptual (PNS) (definido en MPEG-4 Parte 3 Subparte 4). [4] [22]
3Frecuencia de muestreo escalable (SSR) de AAC1999El tipo de objeto de audio MPEG-4 AAC SSR se basa en el perfil de frecuencia de muestreo escalable (SSR) de MPEG-2 Parte 7 combinado con la sustitución de ruido perceptual (PNS) (definido en MPEG-4 Parte 3 Subparte 4). [4] [22]
4AAC LTP ( Predicción a largo plazo )1999contiene AAC LC
5SBR ( Replicación de banda espectral )2003 [23]Se utiliza con AAC LC en el "Perfil AAC de alta eficiencia" ( HE-AAC v1)
6CAA escalable1999
7TwinVQ1999codificación de audio a tasas de bits muy bajas
8CELP ( Predicción lineal excitada por código )1999codificación de voz
9HVXC (codificación de excitación vectorial armónica)1999codificación de voz
10(Reservado)
11(Reservado)
12TTSI ( Interfaz de texto a voz )1999
13Síntesis principal1999Contiene síntesis basada en muestras de ' tabla de ondas ' [24] y síntesis algorítmica y efectos de audio
14Síntesis basada en muestras de tabla de ondas1999Basado en SoundFont y DownLoadable Sounds , [24] contiene General MIDI
15MIDI general1999
16Síntesis algorítmica y efectos de audio1999
17ER AAC LC2000Resistente a errores
18(Reservado)
19ER AAC LTP2000Resistente a errores
20ER AAC Escalable2000Resistente a errores
21ER TwinVQ2000Resistente a errores
22ER BSAC (codificación aritmética de bits divididos)2000También se conoce como "Fine Granule Audio" o herramienta de escalabilidad de grano fino. Se utiliza en combinación con las herramientas de codificación AAC y reemplaza la codificación sin ruido y el formato de flujo de bits del codificador GA MPEG-4 versión 1. Resistente a errores
23ER AAC LD (retardo bajo)2000Resistente a errores, utilizado con CELP, ER CELP, HVXC, ER HVXC y TTSI en el "Perfil de bajo retardo" (comúnmente utilizado para aplicaciones de conversación en tiempo real)
24CELP DE ER2000Resistente a errores
25ER HVXC2000Resistente a errores
26ER HILN (Líneas armónicas e individuales más ruido)2000Resistente a errores
27ER paramétrico2000Resistente a errores
28SSC (codificación sinusoidal)2004 [25] [26]
29PS ( Estéreo paramétrico )2004 [27] y 2006 [28] [29]Se utiliza con AAC LC y SBR en el "Perfil HE-AAC v2". La herramienta de codificación PS se definió en 2004 y el tipo de objeto se definió en 2006.
30MPEG envolvente2007 [30]También conocido como codificación de audio espacial MPEG (SAC), es un tipo de codificación de audio espacial [31] [32] (MPEG Surround también se definió en ISO/IEC 23003-1 en 2007 [33] )
31(ESCAPAR)
32MPEG-1/2 Capa-12005 [34]
33MPEG-1/2 capa 22005 [34]
34MPEG-1/2 capa 32005 [34]También conocido como "MP3onMP4"
35DST ( transferencia de flujo directo )2005 [35]Codificación de audio sin pérdida, utilizada en Super Audio CD
36ALS ( codificación sin pérdida de audio )2006 [29]codificación de audio sin pérdida
37SLS ( codificación escalable sin pérdida )2006 [36]Codificación de audio de dos capas con capa sin pérdida y núcleo/capa de audio general con pérdida (por ejemplo, AAC)
38SLS no básico2006Codificación de audio sin pérdida de audio general sin núcleo/capa de audio (por ejemplo, AAC)
39ER AAC ELD (retardo bajo mejorado)2008 [37]Resistente a errores
40SMR (Representación musical simbólica) simple2008Nota: La representación musical simbólica también es el estándar MPEG-4 Parte 23 (ISO/IEC 14496-23:2008) [38] [39]
41SMR principal2008
42USAC ( codificación unificada de voz y audio )2012La codificación unificada de voz y audio se define en MPEG-D Parte 3 (ISO/IEC 23003-3:2012) [40]
43SAOC (codificación de objetos de audio espacial)2010 [41] [42]Nota: La codificación de objetos de audio espacial también es el estándar MPEG-D Parte 2 (ISO/IEC 23003-2:2010) [43]
44Sonido envolvente LD MPEG2010 [44]Este tipo de objeto transmite información secundaria de codificación MPEG Surround de bajo retardo (que se definió en MPEG-D Parte 2 – ISO/IEC 23003-2 [43] ) en el marco de audio MPEG-4.
45SAOC-DE2013Mejora del diálogo de codificación de objetos de audio espacial
46Sincronización de audio2015La herramienta de sincronización de audio proporciona la capacidad de sincronizar múltiples contenidos en múltiples dispositivos.

Perfiles de audio

Estructura jerárquica de los perfiles AAC, HE-AAC y HE-AAC v2, y compatibilidad entre ellos. El decodificador de perfiles HE-AAC es totalmente capaz de decodificar cualquier flujo de perfil AAC. De manera similar, el decodificador HE-AAC v2 puede manejar todos los flujos de perfiles HE-AAC, así como todos los flujos de perfiles AAC. Basado en la especificación técnica MPEG-4 Parte 3. [21]

El estándar de audio MPEG-4 define varios perfiles. Estos perfiles se basan en los tipos de objetos y cada perfil admite una lista diferente de tipos de objetos. Cada perfil también puede tener varios niveles, que limitan algunos parámetros de las herramientas presentes en un perfil. Estos parámetros suelen ser la frecuencia de muestreo y el número de canales de audio decodificados al mismo tiempo.

Perfiles de audio MPEG-4 [19] [21]
Perfil de audioTipos de objetos de audioFecha del primer lanzamiento público
Perfil de CAACAA LC2003
Perfil AAC de alta eficienciaAAC LC, SBR2003
Perfil HE-AAC v2AAC LC, SBR, PS2006
Perfil de audio principalAAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, Síntesis principal1999
Perfil de audio escalableAAC LC, AAC LTP, AAC escalable, TwinVQ, CELP, HVXC, TTSI1999
Perfil de audio de vozCELP , HVXC , TTSI1999
Perfil de audio sintéticoTTSI, Síntesis principal1999
Perfil de audio de alta calidadAAC LC, AAC LTP, AAC escalable, CELP, ER AAC LC, ER AAC LTP, ER AAC escalable, ER CELP2000
Perfil de audio de bajo retardoCELP, HVXC, TTSI, ER AAC LD, ER CELP, ER HVXC2000
Perfil de audio naturalAAC principal, AAC LC, AAC SSR, AAC LTP, AAC escalable, TwinVQ, CELP, HVXC, TTSI, ER AAC LC, ER AAC LTP, ER AAC escalable, ER TwinVQ, ER BSAC, ER AAC LD, ER CELP, ER HVXC , ER HILN, ER Paramétrico2000
Perfil de interconexión de audio móvilER AAC LC, ER AAC escalable, ER TwinVQ, ER BSAC, ER AAC LD2000
Perfil HD-AACAAC LC, SLS [45]2009 [46]
Perfil simple de ELAELA2010 [42] [47]

Almacenamiento y transporte de audio

Formatos de multiplexación, almacenamiento y transmisión de audio MPEG-4 [16]
EstándarDescripción
MulticineISO/IEC 14496-1Esquema de multiplexación MPEG-4 (M4Mux) [48]
MulticineISO/IEC 14496-3Multiplexor de transporte de audio de bajo consumo (LATM)
AlmacenamientoISO/IEC 14496-3 (informativo)Formato de intercambio de datos de audio (ADIF): solo para AAC
AlmacenamientoISO/IEC 14496-12Formato de archivo MPEG-4 ( MP4 ) / Formato de archivo multimedia basado en ISO
TransmisiónISO/IEC 14496-3 (informativo)Flujo de transporte de datos de audio (ADTS): solo para AAC
TransmisiónISO/IEC 14496-3Transmisión de audio de baja sobrecarga (LOAS), basada en LATM

No existe un estándar para el transporte de transmisiones elementales a través de un canal, porque la amplia gama de aplicaciones MPEG-4 tiene requisitos de entrega que son demasiado amplios para caracterizarlos fácilmente con una única solución.

Las capacidades de una capa de transporte y la comunicación entre funciones de transporte, multiplexación y demultiplexación se describen en el Marco de integración multimedia de entrega (DMIF) en ISO/IEC 14496-6. [16] Existe una amplia variedad de mecanismos de entrega debajo de esta interfaz, por ejemplo, flujo de transporte MPEG , Protocolo de transporte en tiempo real (RTP), etc.

El protocolo de transporte en tiempo real se define en RFC 3016 (Formato de carga útil RTP para transmisiones de audio/visuales MPEG-4), RFC 3640 (Formato de carga útil RTP para el transporte de transmisiones elementales MPEG-4), RFC 4281 (El parámetro de códecs para los tipos de medios "Bucket") y RFC 4337 (Registro de tipo MIME para MPEG-4).

LATM y LOAS se definieron para aplicaciones de audio natural, que no requieren codificación sofisticada basada en objetos ni otras funciones proporcionadas por los sistemas MPEG-4.

Bifurcación en la norma técnica AAC

La codificación de audio avanzada en MPEG-4 Parte 3 (Audio MPEG-4) Subparte 4 se mejoró en relación con el estándar anterior MPEG-2 Parte 7 (Codificación de audio avanzada), con el fin de proporcionar una mejor calidad de sonido para una tasa de bits de codificación determinada.

Se supone que el organismo de normalización ISO resolverá en un futuro próximo las diferencias entre las Partes 3 y 7 para evitar la posibilidad de futuras incompatibilidades de flujo de bits. En la actualidad, no se conocen incompatibilidades entre reproductores o códecs debido a la novedad de la norma.

El estándar MPEG-2 Parte 7 (codificación de audio avanzada) se publicó por primera vez en 1997 y ofrece tres perfiles predeterminados: [49] [50] Perfil de baja complejidad (LC), Perfil principal y Perfil de frecuencia de muestreo escalable (SSR).

La subparte 4 de la parte 3 del MPEG-4 (codificación de audio general) combinó los perfiles de la parte 7 del MPEG-2 con sustitución de ruido perceptual (PNS) y los definió como tipos de objetos de audio (AAC LC, AAC Main, AAC SSR). [4]

AAC-HE

La codificación avanzada de audio de alta eficiencia es una extensión de AAC LC que utiliza replicación de banda espectral (SBR) y estéreo paramétrico (PS). Está diseñada para aumentar la eficiencia de la codificación a tasas de bits bajas mediante la representación paramétrica parcial del audio.

AAC-SSR

La frecuencia de muestreo escalable AAC fue introducida por Sony en los estándares MPEG-2 Parte 7 y MPEG-4 Parte 3. [ cita requerida ] Se publicó por primera vez en ISO/IEC 13818-7, Parte 7: Codificación de audio avanzada (AAC) en 1997. [ 49 ] [ 50 ] La señal de audio se divide primero en 4 bandas utilizando un banco de filtros de cuadratura polifásica de 4 bandas . Luego, estas 4 bandas se dividen aún más utilizando MDCT con un tamaño k de 32 o 256 muestras. Esto es similar a la LC AAC normal que utiliza MDCT con un tamaño k de 128 o 1024 directamente en la señal de audio.

La ventaja de esta técnica es que la conmutación de bloques cortos se puede realizar por separado para cada banda PQF . Por lo tanto, las frecuencias altas se pueden codificar utilizando un bloque corto para mejorar la resolución temporal, mientras que las frecuencias bajas se pueden codificar con una resolución espectral alta. Sin embargo, debido al aliasing entre las 4 bandas PQF, la eficiencia de codificación alrededor de (1,2,3) * fs/8 es peor que con el LC MPEG-4 AAC normal. [ cita requerida ]

MPEG-4 AAC-SSR es muy similar a ATRAC y ATRAC-3 .

¿Por qué se introdujo el AAC-SSR?

La idea detrás del AAC-SSR no era solo la ventaja mencionada anteriormente, sino también la posibilidad de reducir la velocidad de datos eliminando 1, 2 o 3 de las bandas PQF superiores. Un divisor de flujo de bits muy simple puede eliminar estas bandas y, por lo tanto, reducir la velocidad de bits y la frecuencia de muestreo.

Ejemplo:

  • 4 subbandas: tasa de bits = 128 kbit/s, frecuencia de muestreo = 48 kHz, f_lowpass = 20 kHz
  • 3 subbandas: tasa de bits ~ 120 kbit/s, frecuencia de muestreo = 48 kHz, f_lowpass = 18 kHz
  • 2 subbandas: tasa de bits ~ 100 kbit/s, frecuencia de muestreo = 24 kHz, f_lowpass = 12 kHz
  • 1 subbanda: tasa de bits ~ 65 kbit/s, frecuencia de muestreo = 12 kHz, f_lowpass = 6 kHz

Nota: aunque es posible, la calidad resultante es mucho peor que la típica para esta tasa de bits. Por lo tanto, para un LC AAC de 64 kbit/s normal, se logra un ancho de banda de 14–16 kHz utilizando estéreo de intensidad y NMR reducidos. Esto degrada la calidad audible menos que la transmisión de un ancho de banda de 6 kHz con una calidad perfecta.

Asociación de Abogados de Basilea (BSAC)

Bit Sliced ​​Arithmetic Coding es un estándar MPEG-4 (ISO/IEC 14496-3 subparte 4) para codificación de audio escalable. BSAC utiliza una codificación alternativa sin ruido a AAC, con el resto del procesamiento siendo idéntico a AAC. Esta compatibilidad con la escalabilidad permite una calidad de sonido casi transparente a 64 kbit/s y una degradación elegante a velocidades de bits más bajas. La codificación BSAC se realiza mejor en el rango de 40 kbit/s a 64 kbit/s, aunque opera en el rango de 16 kbit/s a 64 kbit/s. El códec AAC-BSAC se utiliza en aplicaciones de transmisión multimedia digital (DMB) .

Licencias

En 2002, el Comité de Licencias de Audio MPEG-4 seleccionó a Via Licensing Corporation como Administrador de Licencias para el fondo de patentes de audio MPEG-4 . [3] [51] [52]

Véase también

Referencias

  1. ^ ab ISO (2009). "ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". ISO . Consultado el 6 de octubre de 2009 .
  2. ^ ab ISO (1999). "ISO/IEC 14496-3:1999 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". ISO . Consultado el 6 de octubre de 2009 .
  3. ^ ab Business Wire (2002-12-02). "El Comité de Licencias de Audio MPEG-4 selecciona a Via Licensing Corporation como administrador; el Comité de Licencias de Audio MPEG-4 ultima los términos para la concesión de licencias de perfiles de audio". The Free Library . Consultado el 6 de octubre de 2009 . {{cite web}}: |author=tiene nombre genérico ( ayuda )
  4. ^ abcd Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama (1999). «Codificación de audio natural MPEG-4: perfiles y niveles de audio». chiariglione.org. Archivado desde el original el 17 de julio de 2010. Consultado el 6 de octubre de 2009 .
  5. ^ Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama. "Codificación de audio natural MPEG-4: escalabilidad en audio natural MPEG-4". chiariglione.org. Archivado desde el original el 28 de febrero de 2010. Consultado el 6 de octubre de 2009 .
  6. ^ D. Thom, H. Purnhagen y el Subgrupo de Audio MPEG (octubre de 1998). "Preguntas frecuentes sobre audio MPEG: MPEG-4". chiariglione.org . Consultado el 6 de octubre de 2009 .{{cite web}}: CS1 maint: varios nombres: lista de autores ( enlace )
  7. ^ abcd ISO / IEC JTC 1/SC 29/WG 11 (julio de 1999), ISO/IEC 14496-3:/Amd.1 – Borrador final del comité – MPEG-4 Audio versión 2 (PDF) , archivado desde el original (PDF) el 2012-08-01 , consultado el 2009-10-07{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  8. ^ por Heiko Purnhagen (1999-06-07), An Overview of MPEG-4 Audio Version 2 (PDF) , Heiko Purnhagen, archivado desde el original (PDF) el 2017-07-06 , consultado el 2009-10-07
  9. ^ por Heiko Purnhagen (1 de junio de 2001). "El estándar de audio MPEG-4: descripción general y aplicaciones". Heiko Purnhagen . Consultado el 7 de octubre de 2009 . [ enlace muerto ]
  10. ^ Heiko Purnhagen (7 de noviembre de 2001). «La página web de audio MPEG: audio MPEG-4 (ISO/IEC 14496-3)» . Consultado el 7 de octubre de 2009 . [ enlace muerto ]
  11. ^ Rob Koenen, ISO/IEC JTC1/SC29/WG11 (marzo de 2002). "Descripción general del estándar MPEG-4". chiariglione.org . Consultado el 6 de octubre de 2009 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  12. ^ ab MPEG. «Estándares MPEG: lista completa de estándares desarrollados o en desarrollo». chiariglione.org. Archivado desde el original el 20 de abril de 2010. Consultado el 31 de octubre de 2009 .
  13. ^ ISO (2000). "ISO/IEC 14496-3:1999/Amd 1:2000 - Extensiones de audio". ISO . Consultado el 7 de octubre de 2009 .
  14. ^ ISO (2001). "ISO/IEC 14496-3:2001 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". ISO . Consultado el 14 de octubre de 2009 .
  15. ^ ISO (2005). "ISO/IEC 14496-3:2005 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". ISO . Consultado el 14 de octubre de 2009 .
  16. ^ abcd ISO / IEC (2009-09-01), ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio (PDF) , IEC , consultado el 2009-10-07
  17. ^ ISO / IEC (2019-12-01), ISO/IEC 14496-3:2019 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio, IEC , consultado el 2 de junio de 2020
  18. ^ ab MultimediaWiki (2009). "Audio MPEG-4". MultimediaWiki . Consultado el 9 de octubre de 2009 .
  19. ^ abc Bernhard Grill; Stefan Geyersberger; Johannes Hilpert; Bodo Teichmann (julio de 2004), Implementación de componentes de audio MPEG-4 en varias plataformas (PDF) , Fraunhofer Gesellschaft, archivado desde el original (PDF) el 2007-06-10 , consultado el 2009-10-09
  20. ^ ISO/IEC JTC1/SC29/WG11 N2203 (marzo de 1998). «MPEG-4 Audio (borrador final del comité 14496-3)». Heiko Purnhagen . Consultado el 7 de octubre de 2009 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )[ enlace muerto ]
  21. ^ abc ISO/IEC JTC1/SC29/WG11/N7016 (2005-01-11), Texto de ISO/IEC 14496-3:2001/FPDAM 4, Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC, archivado desde el original (DOC) el 2014-05-12 , recuperado 2009-10-09{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  22. ^ por Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama (1999). "Codificación de audio natural MPEG-4: codificación de audio general (basada en AAC)". chiariglione.org. Archivado desde el original el 19 de febrero de 2010. Consultado el 6 de octubre de 2009 .
  23. ^ ISO (2003). "Extensión del ancho de banda, ISO/IEC 14496-3:2001/Amd 1:2003". ISO . Consultado el 13 de octubre de 2009 .
  24. ^ ab Scheirer, Eric D.; Ray, Lee (1998). "Síntesis algorítmica y de tabla de ondas en el estándar multimedia MPEG-4". Convención 105 de la Audio Engineering Society, 1998. CiteSeerX 10.1.1.35.2773 . 2.2 Síntesis de tabla de ondas con SASBF: El formato de banco de tabla de ondas SASBF tuvo una historia de desarrollo algo compleja. La especificación original fue aportada por E-Mu Systems y se basó en su formato "SoundFont" [15]. Después de que se completó la integración de este componente en el software de referencia MPEG-4, la MIDI Manufacturers Association (MMA) se acercó a MPEG solicitando que MPEG-4 SASBF fuera compatible con su formato "Downloaded Sounds" [13]. E-Mu estuvo de acuerdo en que esta compatibilidad era deseable, por lo que se negoció y diseñó un nuevo formato en colaboración entre todas las partes. 
  25. ^ ISO (2004). "Codificación paramétrica para audio de alta calidad, ISO/IEC 14496-3:2001/Amd 2:2004". ISO . Consultado el 13 de octubre de 2009 .
  26. ^ ISO/IEC JTC1/SC29/WG11 (25 de julio de 2003). «Texto de ISO/IEC 14496-3:2001/FPDAM2 (audio paramétrico) - N5713». Archivado desde el original (DOC) el 12 de mayo de 2014. Consultado el 13 de octubre de 2009 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  27. ^ 3GPP (30 de septiembre de 2004). «3GPP TS 26.401 V6.0.0 (9 de septiembre de 2004), Funciones de procesamiento de audio del códec de audio general; Descripción general del códec de audio general aacPlus mejorado (versión 6)» (DOC) . 3GPP . Consultado el 13 de octubre de 2009 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  28. ^ 3GPP (4 de enero de 2005). «ETSI TS 126 401 V6.1.0 (12 de enero de 2004) - Funciones de procesamiento de audio del códec de audio general del sistema universal de telecomunicaciones móviles (UMTS); Descripción general del códec de audio general aacPlus mejorado (3GPP TS 26.401 versión 6.1.0 Release 6)». 3GPP . Consultado el 13 de octubre de 2009 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  29. ^ ab ISO (2006). "Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC, ISO/IEC 14496-3:2005/Amd 2:2006". ISO . Consultado el 13 de octubre de 2009 .
  30. ^ ISO (2007). "Extensiones BSAC y transporte de MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007". ISO . Consultado el 13 de octubre de 2009 .
  31. ^ ISO/IEC JTC1/SC29/WG11 (julio de 2005). "Tutorial sobre codificación de audio envolvente MPEG". Archivado desde el original el 2010-04-30 . Consultado el 2010-02-09 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  32. ^ ISO/IEC JTC1/SC29/WG11 (julio de 2005). "Tutorial sobre codificación de audio envolvente MPEG". Archivado desde el original el 24 de marzo de 2008. Consultado el 9 de febrero de 2010 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  33. ^ ISO (2007-01-29). "ISO/IEC 23003-1:2007 - Tecnología de la información -- Tecnologías de audio MPEG -- Parte 1: MPEG Surround". ISO . Consultado el 24 de octubre de 2009 .
  34. ^ abc ISO (2005). «Audio MPEG-1/2 en MPEG-4, ISO/IEC 14496-3:2001/Amd 3:2005». ISO . Consultado el 13 de octubre de 2009 .
  35. ^ ISO (2005). "Codificación sin pérdida de audio sobremuestreado, ISO/IEC 14496-3:2001/Amd 6:2005". ISO . Consultado el 13 de octubre de 2009 .
  36. ^ ISO (2006). "Codificación escalable sin pérdida (SLS), ISO/IEC 14496-3:2005/Amd 3:2006". ISO . Consultado el 13 de octubre de 2009 .
  37. ^ ISO (2008). "AAC mejorado de bajo retardo, ISO/IEC 14496-3:2005/Amd 9:2008". ISO . Consultado el 13 de octubre de 2009 .
  38. ^ ISO (2008). "ISO/IEC 14496-23:2008, Tecnología de la información - Codificación de objetos audiovisuales - Parte 23: Representación simbólica de música". ISO . Consultado el 13 de octubre de 2009 .
  39. ^ ISO (2008). "Conformidad con la representación simbólica de música, ISO/IEC 14496-4:2004/Amd 29:2008". ISO . Consultado el 13 de octubre de 2009 .
  40. ^ ISO (2012). «ISO/IEC 23003-3:2012 - Tecnología de la información - Tecnologías de audio MPEG - Parte 3: Codificación unificada de voz y audio». ISO . Consultado el 7 de noviembre de 2019 .
  41. ^ ISO (2009). "ISO/IEC 14496-3:2009/Amd 2:2010, Perfil simple ALS y transporte de SAOC". ISO . Consultado el 13 de octubre de 2009 .
  42. ^ ab ISO/IEC JTC1/SC29/WG11 (2009-07-03), ISO/IEC 14496-3:200X/PDAM 2 – Perfil simple ALS y transporte de SAOC, N10826, archivado desde el original (DOC) el 2014-07-29 , consultado el 2009-10-13{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  43. ^ ab ISO (2010). "ISO/IEC 23003-2:2010 - Tecnología de la información - Tecnologías de audio MPEG - Parte 2: Codificación de objetos de audio espacial (SAOC)". ISO . Consultado el 27 de diciembre de 2010 .
  44. ^ Documento de la Convención AES 8099: Una nueva extensión estéreo paramétrica y multicanal para MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , consultado el 7 de noviembre de 2019
  45. ^ ISO/IEC JTC1/SC29/WG11 (17 de octubre de 2008), perfil HD-AAC ISO/IEC 14496-3:2005/PDAM 10:200X, MPEG2008/N10188, archivado desde el original (DOC) el 12 de mayo de 2014 , consultado el 19 de octubre de 2009{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  46. ^ ISO (11 de septiembre de 2009). «ISO/IEC 14496-3:2009/Amd 1:2009 - Perfil HD-AAC y señalización MPEG Surround». ISO . Consultado el 15 de octubre de 2009 .
  47. ^ ISO (8 de octubre de 2009). «ISO/IEC 14496-3:2009/Amd 2:2010 - Perfil simple ALS y transporte de SAOC». ISO . Consultado el 15 de octubre de 2009 .
  48. ^ ISO (2004-11-15), ISO/IEC 14496-1, Tercera edición 2004-11-15, Parte 1: Sistemas (PDF) , ISO, archivado desde el original (PDF) el 14 de junio de 2011 , consultado el 14 de octubre de 2009
  49. ^ ab ISO (2004-10-15), ISO/IEC 13818-7, Tercera edición, Parte 7 – Codificación de audio avanzada (AAC) (PDF) , p. 32, archivado desde el original (PDF) el 2011-07-13 , consultado el 2009-10-19
  50. ^ ab ISO (1997). "ISO/IEC 13818-7:1997, Tecnología de la información - Codificación genérica de imágenes en movimiento e información de audio asociada - Parte 7: Codificación de audio avanzada (AAC)" . Consultado el 19 de octubre de 2009 .
  51. ^ Business Wire (5 de enero de 2009). "Via Licensing Announces MPEG-4 SLS Patent Pool License". Reuters. Archivado desde el original el 4 de enero de 2013. Consultado el 9 de octubre de 2009 . {{cite web}}: |author=tiene nombre genérico ( ayuda )
  52. ^ Via Licensing Corporation (12 de mayo de 2009). "Via Licensing anuncia la disponibilidad de un programa de licencias de patentes conjuntas MPEG-4 SLS". Business Wire . Consultado el 9 de octubre de 2009 .
  • Apple: MPEG-4: AAC
  • "AAC" (WIKI de VideoLAN)
  • Pruebas de escucha subjetiva de la EBU sobre códecs de audio de baja tasa de bits Archivado el 16 de febrero de 2007 en Wayback Machine
  • Estaciones de radio AAC – Estaciones de radio online en formato AAC
  • Tuner2 – Directorio de estaciones de radio en formato AAC+ a diferentes velocidades de bits
  • RadioFeeds Reino Unido e Irlanda: página que contiene numerosas estaciones terrestres que transmiten por Internet en formato AAC+.
  • Resultados de la prueba de escucha a 64 kbit/s Una página que compara los códecs, incluido HE-AAC a 64 kbit/s, mediante pruebas de escucha. (La página está fuera de línea)
  • Sitio web oficial de MPEG
  • RFC 3016 – Formato de carga útil RTP para transmisiones de audio y video MPEG-4
  • RFC 3640 – Formato de carga útil RTP para el transporte de secuencias elementales MPEG-4
  • RFC 4281 – El parámetro de códecs para los tipos de medios "Bucket"
  • RFC 4337 – Registro de tipo MIME para MPEG-4
Obtenido de "https://es.wikipedia.org/w/index.php?title=MPEG-4_Parte_3&oldid=1245143216#AAC-SSR"