El Protocolo de transporte en tiempo real (RTP) especifica un formato de datos de uso general y un protocolo de red para transmitir flujos de medios digitales en redes de Protocolo de Internet (IP). Los detalles de la codificación de medios, como la frecuencia de muestreo de la señal, el tamaño de la trama y la sincronización, se especifican en un formato de carga útil RTP . Los parámetros de formato de la carga útil RTP se comunican típicamente entre los puntos finales de transmisión con el Protocolo de descripción de sesión (SDP), pero se pueden usar otros protocolos, como el Protocolo de presencia y mensajería extensible (XMPP).
Tipos de carga útil de audio y video
RFC 3551, titulado Perfil RTP para audio y video ( RTP / AVP ), especifica los parámetros técnicos de los formatos de carga útil para transmisiones de audio y video.
El estándar también describe el proceso de registrar nuevos tipos de carga útil con IANA; Los formatos de carga útil adicionales y los tipos de carga útil se definen en las siguientes especificaciones:
- RFC 3551 , Estándar 65, Perfil RTP para conferencias de audio y video con control mínimo
- RFC 4856 , Registro de tipos de medios de formatos de carga útil en el perfil RTP para conferencias de audio y video
- RFC 3190 , formato de carga útil RTP para audio DAT de 12 bits y audio muestreado lineal de 20 y 24 bits
- RFC 6184 , formato de carga útil RTP para video H.264
- RFC 3640 , formato de carga útil RTP para el transporte de flujos elementales MPEG-4
- RFC 6416 , formato de carga útil RTP para transmisiones audiovisuales / audio MPEG-4
- RFC 2250 , formato de carga útil RTP para video MPEG1 / MPEG2
- RFC 7798 , formato de carga útil RTP para codificación de video de alta eficiencia (HEVC)
- RFC 2435 , formato de carga útil RTP para vídeo comprimido en JPEG
- RFC 4587 , formato de carga útil RTP para secuencias de video H.261
- RFC 2658 , formato de carga útil RTP para video de audio PureVoice
- RFC 4175 , formato de carga útil RTP para video sin comprimir
- RFC 7587 , formato de carga útil RTP para el códec de audio y voz Opus
Los identificadores de carga útil 96-127 se utilizan para cargas útiles definidas dinámicamente durante una sesión. Se recomienda asignar números de puerto dinámicamente, aunque los números de puerto 5004 y 5005 se han registrado para usar el perfil cuando no se requiere un puerto asignado dinámicamente.
Las aplicaciones siempre deben admitir PCMU (tipo de carga útil 0); anteriormente, también se recomendaba DVI4 (tipo de carga útil 5), pero RFC 7007 lo eliminó en 2013.
Tipo de carga útil (PT) | Nombre | Tipo | No. de canales | Frecuencia de reloj (Hz) [nota 1] | Tamaño de la trama (ms) | Tamaño de paquete predeterminado (ms) | Descripción | Referencias |
---|---|---|---|---|---|---|---|---|
0 | PCMU | audio | 1 | 8000 | alguna | 20 | UIT-T G.711 PCM μ-Law audio 64 kbit / s | RFC 3551 |
1 | reservado (anteriormente FS-1016 CELP ) | audio | 1 | 8000 | reservado, anteriormente FS-1016 CELP audio 4.8 kbit / s | RFC 3551, anteriormente RFC 1890 | ||
2 | reservado (anteriormente G721 o G726-32) | audio | 1 | 8000 | reservado, previamente ITU-T G.721 ADPCM audio 32 kbit / so ITU-T G.726 audio 32 kbit / s | RFC 3551, anteriormente RFC 1890 | ||
3 | GSM | audio | 1 | 8000 | 20 | 20 | Audio de velocidad completa GSM europeo 13 kbit / s (GSM 06.10) | RFC 3551 |
4 | G723 | audio | 1 | 8000 | 30 | 30 | Audio de ITU-T G.723.1 | RFC 3551 |
5 | DVI4 | audio | 1 | 8000 | alguna | 20 | Audio IMA ADPCM 32 kbit / s | RFC 3551 |
6 | DVI4 | audio | 1 | 16000 | alguna | 20 | Audio IMA ADPCM 64 kbit / s | RFC 3551 |
7 | LPC | audio | 1 | 8000 | alguna | 20 | Audio de codificación predictiva lineal experimental 5,6 kbit / s | RFC 3551 |
8 | PCMA | audio | 1 | 8000 | alguna | 20 | UIT-T G.711 PCM A-Law audio 64 kbit / s | RFC 3551 |
9 | G722 | audio | 1 | 8000 [nota 2] | alguna | 20 | Audio ITU-T G.722 64 kbit / s | RFC 3551 - Página 14 |
10 | L16 | audio | 2 | 44100 | alguna | 20 | PCM lineal de 16 bits de audio estéreo a 1411,2 kbit / s, [2] [3] [4] sin comprimir | RFC 3551, página 27 |
11 | L16 | audio | 1 | 44100 | alguna | 20 | Audio PCM lineal de 16 bits 705,6 kbit / s, sin comprimir | RFC 3551, página 27 |
12 | QCELP | audio | 1 | 8000 | 20 | 20 | Predicción lineal excitada por código de Qualcomm | RFC 2658, RFC 3551 |
13 | CN | audio | 1 | 8000 | Ruido de confort . Tipo de carga útil utilizado con códecs de audio que no admiten ruido de confort como parte del códec en sí, como G.711 , G.722.1 , G.722 , G.726 , G.727 , G.728 , GSM 06.10 , Siren y RTAudio . | RFC 3389 | ||
14 | MPA | audio | 1, 2 | 90000 | 8–72 | Sólo audio MPEG-1 o MPEG-2 | RFC 3551, RFC 2250 | |
15 | G728 | audio | 1 | 8000 | 2.5 | 20 | Audio ITU-T G.728 a 16 kbit / s | RFC 3551 |
dieciséis | DVI4 | audio | 1 | 11025 | alguna | 20 | Audio IMA ADPCM 44,1 kbit / s | RFC 3551 |
17 | DVI4 | audio | 1 | 22050 | alguna | 20 | Audio IMA ADPCM 88,2 kbit / s | RFC 3551 |
18 | G729 | audio | 1 | 8000 | 10 | 20 | Audio de ITU-T G.729 y G.729a a 8 kbit / s; El anexo B está implícito a menos que se utilice el annexb=no parámetro | RFC 3551, página 20 , RFC 3555, página 15 |
19 | reservado (anteriormente CN) | audio | reservado, anteriormente ruido de confort | RFC 3551 | ||||
25 | CELB | video | 90000 | Video de Sun CellB [5] | RFC 2029 | |||
26 | JPEG | video | 90000 | Video JPEG | RFC 2435 | |||
28 | Nevada | video | 90000 | Vídeo en red (nv) de Xerox PARC [6] | RFC 3551, página 32 | |||
31 | H261 | video | 90000 | Vídeo ITU-T H.261 | RFC 4587 | |||
32 | Monovolumen | video | 90000 | Vídeo MPEG-1 y MPEG-2 | RFC 2250 | |||
33 | MP2T | audio Video | 90000 | Flujo de transporte MPEG-2 | RFC 2250 | |||
34 | H263 | video | 90000 | Video H.263 , primera versión (1996) | RFC 3551, RFC 2190 | |||
72–76 | reservado | reservado porque los tipos de paquetes RTCP 200–204 serían indistinguibles de los tipos de carga útil RTP 72–76 con el bit marcador establecido | RFC 3550, RFC 3551 | |||||
77–95 | no asignado | tenga en cuenta que el tipo de paquete RTCP 207 (XR, informes extendidos) sería indistinguible de los tipos de carga útil RTP 79 con el bit marcador establecido | RFC 3551, RFC 3611 | |||||
dinámica | H263-1998 | video | 90000 | Video H.263 , segunda versión (1998) | RFC 3551, RFC 4629, RFC 2190 | |||
dinámica | H263-2000 | video | 90000 | Video H.263 , tercera versión (2000) | RFC 4629 | |||
dinámico (o perfil) | H264 AVC | video | 90000 | Vídeo H.264 (MPEG-4 Parte 10) | RFC 6184, anteriormente RFC 3984 | |||
dinámico (o perfil) | H264 SVC | video | 90000 | Vídeo H.264 | RFC 6190 | |||
dinámico (o perfil) | H265 | video | 90000 | Vídeo H.265 (HEVC) | RFC 7798 | |||
dinámico (o perfil) | theora | video | 90000 | Video de Theora | proyecto-barbato-avt-rtp-theora | |||
dinámica | iLBC | audio | 1 | 8000 | 20, 30 | 20, 30 | Códec de baja tasa de bits de Internet 13,33 o 15,2 kbit / s | RFC 3952 |
dinámica | PCMA-WB | audio | 1 | 16000 | 5 | UIT-T G.711.1 Ley A | RFC 5391 | |
dinámica | PCMU-WB | audio | 1 | 16000 | 5 | UIT-T G.711.1 ley μ | RFC 5391 | |
dinámica | G718 | audio | 32000 (marcador de posición) | 20 | UIT-T G.718 | borrador-ietf-payload-rtp-g718 | ||
dinámica | G719 | audio | (varios) | 48000 | 20 | UIT-T G.719 | RFC 5404 | |
dinámica | G7221 | audio | 16000, 32000 | 20 | UIT-T G.722.1 y G.722.1 Anexo C | RFC 5577 | ||
dinámica | G726-16 | audio | 1 | 8000 | alguna | 20 | Audio ITU-T G.726 a 16 kbit / s | RFC 3551 |
dinámica | G726-24 | audio | 1 | 8000 | alguna | 20 | Audio ITU-T G.726 24 kbit / s | RFC 3551 |
dinámica | G726-32 | audio | 1 | 8000 | alguna | 20 | Audio ITU-T G.726 a 32 kbit / s | RFC 3551 |
dinámica | G726-40 | audio | 1 | 8000 | alguna | 20 | Audio UIT-T G.726 40 kbit / s | RFC 3551 |
dinámica | G729D | audio | 1 | 8000 | 10 | 20 | UIT-T G.729 Anexo D | RFC 3551 |
dinámica | G729E | audio | 1 | 8000 | 10 | 20 | UIT-T G.729 Anexo E | RFC 3551 |
dinámica | G7291 | audio | 16000 | 20 | UIT-T G.729.1 | RFC 4749 | ||
dinámica | GSM-EFR | audio | 1 | 8000 | 20 | 20 | ITU-T GSM-EFR (GSM 06.60) | RFC 3551 |
dinámica | GSM-HR-08 | audio | 1 | 8000 | 20 | ITU-T GSM-HR (GSM 06.20) | RFC 5993 | |
dinámico (o perfil) | AMR | audio | (varios) | 8000 | 20 | Audio adaptable de múltiples velocidades | RFC 4867 | |
dinámico (o perfil) | AMR-WB | audio | (varios) | 16000 | 20 | Audio de banda ancha adaptable de múltiples velocidades (ITU-T G.722.2) | RFC 4867 | |
dinámico (o perfil) | AMR-WB + | audio | 1, 2 u omitir | 72000 | 13.3–40 | Velocidad múltiple adaptativa ampliada: audio de banda ancha | RFC 4352 | |
dinámico (o perfil) | vorbis | audio | (varios) | (varios) | Vorbis audio | RFC 5215 | ||
dinámico (o perfil) | opus | audio | 1, 2 | 48000 [nota 3] | 2,5–60 | 20 | Opus audio | RFC 7587 |
dinámico (o perfil) | speex | audio | 1 | 8000, 16000, 32000 | 20 | Audio de Speex | RFC 5574 | |
dinámica | mpa-robusto | audio | 1, 2 | 90000 | 24–72 | Audio MP3 tolerante a pérdidas | RFC 5219 (anteriormente RFC 3119) | |
dinámico (o perfil) | MP4A-LATM | audio | 90000 u otros | Audio MPEG-4 | RFC 6416 (anteriormente RFC 3016) | |||
dinámico (o perfil) | MP4V-ES | video | 90000 u otros | MPEG-4 Visual | RFC 6416 (anteriormente RFC 3016) | |||
dinámico (o perfil) | mpeg4-genérico | audio Video | 90000 u otro | Secuencias elementales MPEG-4 | RFC 3640 | |||
dinámica | VP8 | video | 90000 | Vídeo VP8 | RFC 7741 | |||
dinámica | VP9 | video | 90000 | Vídeo VP9 | borrador-ietf-payload-vp9 | |||
dinámica | L8 | audio | (varios) | (varios) | alguna | 20 | Audio PCM lineal de 8 bits con compensación de 128 | RFC 3551 Sección 4.5.10 y Tabla 5 |
dinámica | DAT12 | audio | (varios) | (varios) | alguna | 20 (por analogía con L16) | IEC 61119 audio no lineal de 12 bits | RFC 3190 Sección 3 |
dinámica | L16 | audio | (varios) | (varios) | alguna | 20 | Audio PCM lineal de 16 bits | RFC 3551 Sección 4.5.11, RFC 2586 |
dinámica | L20 | audio | (varios) | (varios) | alguna | 20 (por analogía con L16) | Audio PCM lineal de 20 bits | RFC 3190 Sección 4 |
dinámica | L24 | audio | (varios) | (varios) | alguna | 20 (por analogía con L16) | Audio PCM lineal de 24 bits | RFC 3190 Sección 4 |
dinámica | crudo | video | 90000 | Video sin comprimir | RFC 4175 | |||
dinámica | ac3 | audio | (varios) | 32000, 44100, 48000 | Audio Dolby AC-3 | RFC 4184 | ||
dinámica | eac3 | audio | (varios) | 32000, 44100, 48000 | Audio AC-3 mejorado | RFC 4598 | ||
dinámica | t140 | texto | 1000 | Texto sobre IP | RFC 4103 | |||
dinámica | EVRC EVRC0 EVRC1 | audio | 8000 | Audio EVRC | RFC 4788 | |||
dinámica | EVRCB EVRCB0 EVRCB1 | audio | 8000 | Audio EVRC-B | RFC 4788 | |||
dinámica | EVRCWB EVRCWB0 EVRCWB1 | audio | 16000 | Audio EVRC-WB | RFC 5188 | |||
dinámica | jpeg2000 | video | 90000 | Vídeo JPEG 2000 | RFC 5371 | |||
dinámica | UEMCLIP | audio | 8000, 16000 | Audio UEMCLIP | RFC 5686 | |||
dinámica | ATRAC3 | audio | 44100 | Audio ATRAC 3 | RFC 5584 | |||
dinámica | ATRAC-X | audio | 44100, 48000 | Audio ATRAC 3+ | RFC 5584 | |||
dinámica | ATRAC-AVANZADO-SIN PÉRDIDAS | audio | (varios) | Audio avanzado sin pérdidas ATRAC | RFC 5584 | |||
dinámica | DV | video | 90000 | Vídeo DV | RFC 6469 (anteriormente RFC 3189) | |||
dinámica | BT656 | video | Vídeo ITU-R BT.656 | RFC 3555 | ||||
dinámica | BMPEG | video | Vídeo MPEG-2 incluido | RFC 2343 | ||||
dinámica | SMPTE292M | video | Vídeo SMPTE 292M | RFC 3497 | ||||
dinámica | ROJO | audio | Datos de audio redundantes | RFC 2198 | ||||
dinámica | VDVI | audio | Audio DVI4 de tasa variable | RFC 3551 | ||||
dinámica | MP1S | video | Sistemas MPEG-1 Transmite video | RFC 2250 | ||||
dinámica | MP2P | video | Video de transmisiones de programa MPEG-2 | RFC 2250 | ||||
dinámica | tono | audio | 8000 (predeterminado) | tono | RFC 4733 | |||
dinámica | evento telefónico | audio | 8000 (predeterminado) | Tono DTMF | RFC 4733 | |||
dinámica | aptx | audio | 2-6 | (igual a la frecuencia de muestreo) | 4000 ÷ frecuencia de muestreo | 4 [nota 4] | audio aptX | RFC 7310 |
- ^ La "velocidad de reloj" es la velocidad a la que se incrementa la marca de tiempo en el encabezado RTP, que no tiene por qué ser la misma que la velocidad de muestreo del códec. Por ejemplo, los códecs de vídeo suelen utilizar una frecuencia de reloj de 90000 para que sus fotogramas se puedan alinear con mayor precisión con la marca de tiempo RTCP NTP, aunque las frecuencias de muestreo de vídeo suelen estar en el rango de 1 a 60 muestras por segundo.
- ^ Aunque la frecuencia de muestreo para G.722 es 16000, su frecuencia de reloj es 8000 para seguir siendo compatible con RFC 1890, que utilizó incorrectamente este valor. [1]
- ^ Debido a que Opus puede cambiar las frecuencias de muestreo de forma dinámica, su frecuencia de reloj está fijada en 48000, incluso cuando el códec funcionará a una frecuencia de muestreo menor. Losparámetros
maxplaybackrate
ysprop-maxcapturerate
en SDP se pueden usar para indicar sugerencias / preferencias sobre la frecuencia de muestreo máxima para codificar / decodificar. - ^ Para aptX, el intervalo de paquetización debe redondearse hacia abajo al intervalo de paquete más cercano que pueda contener un número entero de muestras. Por lo tanto, a tasas de muestreo de 11025, 22050 o 44100, una tasa de paquetización de "4" se redondea a 3,99.
Carga útil de mensajería de texto
- RFC 4103 , formato de carga útil RTP para conversación de texto
Carga útil MIDI
- RFC 6295 , formato de carga útil RTP para MIDI
- RFC 4696 , una guía de implementación para RTP MIDI
Ver también
- protocolo de Iniciacion de Sesion
- H323
- Comparación de formatos de codificación de audio
Referencias
- ^ RFC 3551, Perfil RTP para conferencias de audio y vídeo con control mínimo , H. Schulzrinne, S. Casner, The Internet Society (julio de 2003).
- ^ "RFC 2586 - El tipo de contenido Audio / L16 MIME" . Mayo de 1999 . Consultado el 16 de marzo de 2010 .
- ^ "RFC 3108 - Convenciones para el uso del Protocolo de descripción de sesión (SDP) para conexiones de portador ATM" . Mayo de 2001 . Consultado el 16 de marzo de 2010 .
- ^ "RFC 4856 - Registro de tipo de medio de formatos de carga útil en el perfil RTP para conferencias de audio y video - Registro de tipo de medio audio / L16" . Marzo de 2007 . Consultado el 16 de marzo de 2010 .
- ^ Guía del programador de XIL , capítulo 22 "CellB Codec". Agosto de 1997. Consultado el 19 de julio de 2014.
- ^ nv - vídeo en red en el sitio web de Henning Schulzrinne , vídeo en red en el sitio web de la Universidad de Toronto , consultado el 9 de julio de 2009.
enlaces externos
- Asignaciones de IANA de parámetros del Protocolo de transporte en tiempo real (RTP)