ampliación redes 4-1 universidad de valencia rogelio montañana tema 4 multimedia rogelio...
TRANSCRIPT
Ampliación Redes 4-1Universidad de Valencia Rogelio Montañana
Tema 4
Multimedia
Rogelio MontañanaDepartamento de Informática
Universidad de [email protected]
http://www.uv.es/~montanan/
Ampliación Redes 4-2Universidad de Valencia Rogelio Montañana
Concepto de red Multimedia
• Teóricamente:– La red que transmite información utilizando
para ello más de un medio físico. Ejemplo: documento con texto e imágenes
• Para nosotros:– La red que transmite información de audio y/o
vídeo en tiempo real (aunque solo se utilice uno de estos medios). Ejemplo: telefonía por Internet
Ampliación Redes 4-3Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital
• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Vídeo bajo demanda• Telefonía Internet
Ampliación Redes 4-4Universidad de Valencia Rogelio Montañana
Teorema de Nyquist.
• Teorema de Nyquist: La digitalización de una señal analógica ha de hacerse muestreando al menos al doble de la frecuencia máxima que se pretende capturar.– Canal telefónico: 3,1 KHz Muestreo 8 KHz– Audio HiFi: 20 KHz Muestreo 44,1 KHz
Ampliación Redes 4-5Universidad de Valencia Rogelio Montañana
Señal ‘muestreada’a 8 KHz
Señal analógicaoriginal
Canal telefónicoCanal telefónicoAncho de bandaAncho de banda = =
300 300 aa 3.400 Hz 3.400 Hz
Teorema de Nyquist
MuestrasMuestras
8.000 muestras/s(captura hasta 4 KHz)
Ampliación Redes 4-6Universidad de Valencia Rogelio Montañana
Conversión analógico-digitalPCM (Pulse Code Modulation)
Señal‘muestreada’
(valores continuos)
Señal digital (valores discretos)
Ruido (o error) de cuantización
100100111011001
DigitalizaciónEl error de
cuantización depende del número de bits por muestra.
Ampliación Redes 4-7Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital.
• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Video bajo demanda• Telefonía sobre Internet
Ampliación Redes 4-8Universidad de Valencia Rogelio Montañana
Audio digital no comprimido
Tipo Frec. de
muestreo
Bits por
muestra
Canales Caudal
Sonido telefónico
(G.711)
8 KHz 8 1 64 Kb/s
(RDSI)
CD-DA (Compact
Disc – Digital Audio)
44,1 KHz 16 2 1,411 Mb/s
(CD-ROM 1x)
DAT (Digital Audio Tape)
48 KHz 16 2 1,536 Mb/s
Ampliación Redes 4-9Universidad de Valencia Rogelio Montañana
Clasificación algoritmos de compresión• Por su fidelidad:
– Sin pérdidas (lossless): usada para datos (ej.: norma V.42bis en módems, ficheros .zip)
– Con pérdidas (lossy): usada normalmente en audio y vídeo. Inaceptable para datos
• Por su velocidad relativa de compresión/descompresión:– Simétricos: necesitan aproximadamente la misma potencia de CPU
para comprimir que para descomprimir– Asimétricos: requieren bastante más CPU para comprimir que para
descomprimir.• En multimedia se suelen utilizar algoritmos lossy• Siempre se necesita más CPU para comprimir que para
descomprimir• Generalmente los algoritmos que consiguen mayor compresión
gastan más CPU.
Ampliación Redes 4-10Universidad de Valencia Rogelio Montañana
Tipos de compresión de audio
• General (apta para todo tipo de sonidos):– Psicoacústica (MPEG)– Adaptativa Diferencial (ADPCM)
• Específica para voz:– Code Excited Linear Prediction (CELP)– CS-ACELP (Conjugate-Structure Algebraic Code
Excited Linear Prediction– GSM
• Los codecs de voz no son aptos para música u otros sonidos
Ampliación Redes 4-11Universidad de Valencia Rogelio Montañana
Algunos formatos de audio digitalFormato Frec. Muestreo
(KHz)Canales Caudal por canal
(Kb/s)Uso
PCM (G.711) 8 1 64 Telefonía
ADPCM (G.721) 8 1 32 Telefonía
SB-ADPCM (G.722) 16 1 48/56/64 Vídeoconferenc.
MP-MLQ (G.723.1) 8 1 6,3/5,3 variable Telefonía Internet
ADPCM (G.726) 8 1 16/24/32/40 Telefonía
E-ADPCM (G.727) 8 1 16/24/32/40 Telefonía
LD-CELP (G.728) 8 1 16 Telefonía/Videoc.
CS-ACELP (G.729) 8 1 8 Telefonía Internet
RPE-LTP (GSM 06.10) 8 1 13,2 Telefonía GSM
CELP (FS 1016) 8 1 4,8
LPC-10E (FS 1015) 8 1 2,4
CD-DA / DAT 44,1/48 2 705,6/768 Audio Hi-Fi
MPEG-1 Layer I 32/44,1/48 2 192-256 variable
MPEG-1 Layer II 32/44,1/48 2 96-128 variable
MPEG-1 Layer III (MP3) 32/44,1/48 2 64 variable Hi-Fi Internet
MPEG-2 AAC 32/44,1/48 5.1 32-44 variable Hi-Fi Internet
Elevadoretardo
BajoRetardo
Ampliación Redes 4-12Universidad de Valencia Rogelio Montañana
Audio digital comprimido
• Generalmente a más compresión menor calidad y mayor consumo de CPU.
• Los sistemas de caudal variable (MPEG, G.723.1) son los que mejor se adaptan a redes sin reserva de caudal constante, como el modelo DiffServ de Internet o los servicios UBR o ABR de ATM.
• Los sistemas de caudal constante (G.711, G.722, G.729) son más adecuados para servicios orientados a conexión (RSVP o circuitos CBR de ATM, por ejemplo).
• La compresión MPEG es la más eficiente y da mayor calidad, pero consume mucha CPU e introduce mucho retardo por lo que no puede emplearse en aplicaciones interactivas (vídeoconferencia o telefonía).
Ampliación Redes 4-13Universidad de Valencia Rogelio Montañana
Limitación
Comparación de codecs
FuenteSimulación
de canal
“El tren es un medio de transporte cómodo.”
1 2 3 4 5
1 2 3 4 5
MOS de 4.2 = Calidad óptimaMOS de 4.2 = Calidad óptima
Codec Codec ‘X’‘X’
MOS Calidad voz Nivel de distorsión
5 Excelente Imperceptible
4 Buena Apenas Perceptible, no desagradable
3 Regular Perceptible, levemente desagradable
2 Pobre Desagradable, pero aceptable
1 Insatisfactoria Muy desagradable. Inaceptable
MOS: Mean Opinion Score
Ampliación Redes 4-14Universidad de Valencia Rogelio Montañana
Compresión vs calidadC
aud
al (
Kb
/s)
MOS (Mean Opinion Score) Calidad Subjetiva
0
PCM (G.711)
ADPCM 32 (G.726)
ADPCM 24 (G.725)
ADPCM 16 (G.726) LDCELP 16 (G.728)
LPC 4.8CS-ACELP 8 (G.729)
MP-MLQ 6,4 (G.723.1)Normalmente requieren
hardware especial8
16
24
32
40
48
56
64
CS-ACELP (G.729a)
0 1 2 3 4 5
Ampliación Redes 4-15Universidad de Valencia Rogelio Montañana
Codec de alta compresión optimizado para la voz humana
Estos codecs no son aptos para música
Ampliación Redes 4-16Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Vídeo bajo demanda• Telefonía Internet
Ampliación Redes 4-17Universidad de Valencia Rogelio Montañana
Señal de vídeo analógica
R (rojo)
G (verde)
B (azul)
Div
isor
R
B
G
Lent
e
Filtros
Escaneadorrasterizador
amplitud
tiempo
amplitud
tiempo
amplitud
tiempo
La imagen capturada se descompone en tres señales que corresponden a los colores primarios
Ampliación Redes 4-18Universidad de Valencia Rogelio Montañana
Fundamentos de TV en color• Las señales R-G-B se transforman en una señal de luminancia
(Y) y dos de crominancia. Esta conversión se hace para:– Mantener compatibilidad con televisión B/N (se ignora la crominancia)
– Dar mas ancho de banda a la luminancia (el ojo es menos sensible a la crominancia).
• En sistema PAL las señales de crominancia se llaman U y V; la transformación que se realiza es: Y (Luminancia) = 0,30 R + 0,59 G + 0,14 B U (Crominancia) = 0,493 (B - Y) = -0,15 R - 0,29 G + 0,44 B V (Crominancia) = 0,877 (R - Y) = 0,62 R - 0,52 G - 0,10 B
• Anchura de los canales: Y: 5 MHz U y V: 1 MHz
Ampliación Redes 4-19Universidad de Valencia Rogelio Montañana
Funcionamiento de la TV en color
R
B
G CircuitoMatricial
ModuladorV
U
Y
Mezclador
Filtro
TV Blanco y Negro
MatrizInversa
TV Color
RGB
Y
Modulador
Ampliación Redes 4-20Universidad de Valencia Rogelio Montañana
Señales de vídeo analógico• A menudo las dos componentes de crominancia (U y V) se combinan (multiplexan en
frecuencia) en una única señal llamada C. • En equipos sencillos (p. ej. vídeo VHS) se combinan Y y C en una única señal que se llama
composite o vídeo compuesto.• Conforme se reduce el número de señales disminuye la calidad (especialmente en el paso de
Y/C a vídeo compuesto).
Num.
Señales
Denominación
(PAL)
Tipo de conector
Tipo de equipo
Calidad
3 YUV
(componentes)
3 RCA o 3 BNC
Equipos profesionales
Estudio
2 Y/C S-Vídeo (mini-DIN)
Vídeo Hi-8, S-VHS
Broadcast
1 Compuesto (composite)
RCA Vídeo 8 mm, VHS
Vídeo doméstico
Ampliación Redes 4-21Universidad de Valencia Rogelio Montañana
Vídeo digital ‘no comprimido’
• El formato de grabación utilizado como referencia en estudios de TV es el D1 (estándar ITU-R CCIR-601).
• En formato digital las dos componentes de crominancia se denominan Cr y Cb (en vez de U y V).
• Cada fotograma se representa como una imagen de 720x576 píxels (PAL). La luminancia se digitaliza con mayor resolución que las crominancias:– Luminancia (Y): 720(h) x 576(v) x 8 bits x 25 fps = 82,944 Mb/s
– Crominancia Cr : 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s
– Crominancia Cb: 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s
• Caudal total: 82,9 + 41,5 + 41,5 = 165,888 Mb/s
Ampliación Redes 4-22Universidad de Valencia Rogelio Montañana
Vídeo digital ‘no comprimido’
• La reducción de la resolución en las componentes de crominancia se denomina submuestreo (subsampling).
• El submuestreo se basa en la menor sensibilidad del ojo humano a la crominancia.
• El submuestreo 4:2:2 de CCIR-601 reduce la información de crominancia a la mitad (sin submuestreo el caudal total sería 248,7 Mb/s).
• La información de crominancia puede reducirse aún más (a la cuarta parte) aplicando submuestreo 4:1:1 o 4:2:0. Este submuestreo degrada un poco la calidad de color, pero la diferencia con 4:2:2 es pequeña y sólo suele ser percibida por profesionales o en situaciones extremas.
Ampliación Redes 4-23Universidad de Valencia Rogelio Montañana
BG
R Y
Cb
Cr
720 720
576 576
360
Luminancia 4Crominancia 2+2
Submuestreo 4:2:2
8 bits
576
Ampliación Redes 4-24Universidad de Valencia Rogelio Montañana
BG
R Y
Cr
720 720
576 576
180
Submuestreo 4:1:1
Cb
576
Luminancia 4Crominancia 1+1
Ampliación Redes 4-25Universidad de Valencia Rogelio Montañana
BG
R YCb
Cr
720 720
576 576
360
Submuestreo 4:2:0
288
Luminancia 4Crominancia 2+0
Ampliación Redes 4-26Universidad de Valencia Rogelio Montañana
Sistema Submuestreo Bits/pixel Compresión Mb/s
D5 4:2:2 10 1:1 220
D1 (ITU CCIR 601) 4:2:2 8 1:1 172
Digital Betacam (Sony) 4:2:2 10 2,3:1 (*) 95
AMPEX DCT 4:2:2 8 2:1 (*) 88
Digital-S, D-9, DVCPRO50
4:2:2 8 3,3:1 (*) 50
DV, DVCAM, DVCPRO, D-7
4:1:1 ó 4:2:0 8 5:1 (*) 25
D2, D3 Composite 8 1:1 94
Sistemas de grabación de vídeo digital para TV estándar (no HDTV)
(*) Compresión espacial (intraframe) con algoritmos muy parecidos a los de M-JPEG.
Ampliación Redes 4-27Universidad de Valencia Rogelio Montañana
Compresión de vídeo en tiempo real
Estación digitalizadora (PC/Mac/Workstation)
Cámara de TV o vídeo
Vídeo analógico
Almacena-Almacena-mientomiento
Red local(o WAN)
DigitDigitaliza-aliza-dordor
CODEC Hard o soft
CODEC: COmpresor/DECompresor
Vídeo digitalsin comprimir
Vídeo digital comprimido
MonitorMonitor
Señal YUV, Y/C o Composite
La compresión introduce retardo
Ampliación Redes 4-28Universidad de Valencia Rogelio Montañana
Compresión de vídeo en diferido
Estación digitalizadora (PC/Mac/Workstation)
MonitorMonitor
Cámara de TV o vídeo Almacena-Almacena-
mientomiento
Red local(o WAN)
DigitDigitaliza-aliza-dordor
CODEC Soft
CODEC: COmpresor/DECompresor
Vídeo digital comprimido
Almacena-Almacena-mientomiento
Vídeo digitalsin comprimir
Vídeo analógico
Señal YUV, Y/C o Composite
Ampliación Redes 4-29Universidad de Valencia Rogelio Montañana
Compresión de vídeo
• Para la compresión de vídeo se aplican dos técnicas:– Compresión espacial o intraframe: se aprovecha la
redundancia de información que hay en la imagen de cada fotograma, como en la imágenes JPEG
– Compresión temporal o interframe: se aprovecha la redundancia de información que hay entre fotogramas consecutivos.
• La compresión interframe siempre lleva incluida la intraframe.
Ampliación Redes 4-30Universidad de Valencia Rogelio Montañana
Sistema Compresión
Espacial (DCT)
Compresión
temporal
Complejidad
compresión
Eficiencia Retardo
M-JPEG Sí No Media Baja Muy
pequeño
H.261 Sí Limitada
(fotog. I y P)
Elevada Media Pequeño
MPEG-1/2 Sí Extensa
(fotog. I, P y B)
Muy elevada Alta Grande
H.263
MPEG-4
Sí Extensa
(fotog. I, P y B)
Enorme Alta Media
Grande
Formatos compresión de vídeo
Ampliación Redes 4-31Universidad de Valencia Rogelio Montañana
Estándar/Formato Ancho de banda típico
Ratio de compresión
CCIR 601 170 Mb/s 1:1 (Referencia)
M-JPEG 10-20 Mb/s 7-27:1
H.261 64 Kb/s – 2000 Kb/s 24:1
H.263 28,8-768 Kb/s 50:1
MPEG-1 0,4-2,0 Mb/s 100:1
MPEG-2 1,5-60 Mb/s 30-100:1
MPEG-4 28,8-500 Kb/s 100-200:1
Caudal requerido por los sistemas de compresión de vídeo más comunes
Bajoretardo
Elevadoretardo
Ampliación Redes 4-32Universidad de Valencia Rogelio Montañana
Vídeo M-JPEG (Motion JPEG)• Es el más sencillo. Trata el vídeo como una secuencia de
fotografías JPEG, sin aprovechar la redundancia entre fotogramas.
• Algoritmos DCT (Discrete Cosine Transform)
• Poco eficiente, pero bajo retardo.
• Usado en:
– Algunos sistemas de grabación digital y de edición no lineal (edición independiente de cada fotograma)
– Algunos sistemas de videoconferencia (bajo retardo).
• No incluye soporte estándar de audio. El audio ha de codificarse por algún otro sistema (p. Ej. CD-DA) y sincronizarse por mecanismos no estándar.
Ampliación Redes 4-33Universidad de Valencia Rogelio Montañana
Funcionamiento de MPEG
Compresión espacial y temporal
Fotogramasdigitalizados
Compresor MPEG(software o hardware)
Flujo MPEGcomprimido
La compresión puede o no ser en tiempo real.Generalmente para hacerla en tiempo real
se requieren compresores en hardware
Ampliación Redes 4-34Universidad de Valencia Rogelio Montañana
Vídeo MPEG (MPEG-1)
• Submuestreo 4:2:0 (25% ahorro respecto 4:2:2)• Dos formatos posibles:
– SIF (Standard Interchange Format): en PAL Y: 352 x 288 pixels, Cr y Cb: 176 x 144 pixels
– QSIF (Quarter SIF): Y: 176 x 144; Cr y Cb : 88 x 72
• Dos tipos de compresión (simultáneamente):– Espacial: como en JPEG– Temporal: se aprovecha la semejanza que cada
fotograma tiene con los que le rodean.
Ampliación Redes 4-35Universidad de Valencia Rogelio Montañana
Compresión temporal en MPEG
• El primer fotograma se digitaliza como una imagen JPEG
• De los siguientes fotogramas sólo se se digitalizan los cambios respecto al anterior. Para localizar los cambios:
– Se ‘cuadricula’ la imagen en macrobloques, cada uno formado por 16x16 pixels de Y (8x8 de Cr y 8x8 de Cb)
– Si se detecta que un macrobloque ha cambiado de sitio esto se indica mediante un vector de movimiento.
• Una imagen SIF (352x288) está formada por: 352/16 x 288/16 = 22 x 18 = 396 macrobloques
Ampliación Redes 4-36Universidad de Valencia Rogelio Montañana
Vídeo MPEG
• Tipos de fotogramas:
– I (Intra): autocontenidos, solo compresión espacial (como JPEG)
– P (Predictive): referido al P/I anterior. Compresión temporal por extrapolación mediante macrobloques. Un macrobloque pueden ser:
• Inalterado: no modificado respecto al fotograma de referencia
• Desplazado: (p. ej. un balón en movimiento) se describe por un vector de movimiento y eventualmente una corrección (diferencia respecto al original)
• Nuevo: (p. ej. Lo que aparece detrás de una puerta que se abre) se describe por compresión espacial (como un fotograma I)
– B (Bidireccional): compresión temporal con interpolación; referido al P/I anterior y al P/I posterior. Máxima compresión, máxima complejidad de cálculo. Suaviza la imagen, reduce el ruido.
Ampliación Redes 4-37Universidad de Valencia Rogelio Montañana
Fotogramas I (Intra)Los fotogramas Intra se codifican
de forma autocontenida, sin referirse a otros fotogramas
160 ms
72 KB
72 x 1024 x 8 / 0,16 = 3,7 Mb/s
25 fotogramaspor segundo
18 KBytes I
18 KBytes I
18 KBytes I
18 KBytes I
18 KBytes I
Ampliación Redes 4-38Universidad de Valencia Rogelio Montañana
Fotogramas P (Predictivos)Los fotogramas Predictivos
se codifican usando compensación de
movimiento basada en el fotograma I o P anterior
240 ms
60 KB
60 x 1024 x 8 / 0,24 = 2,0 Mb/s
18 KB I
6 KB P
6 KB P
18 KB I
6 KB P
6 KB P
18 KB I
Ampliación Redes 4-39Universidad de Valencia Rogelio Montañana
Fotogramas B (Bidireccionales)
Orden de transmisión: 1,4,2,3,7,5,6,10,8,9,…
360 ms
54 KB
Los fotogramas Bidireccionales se codifican usando
compensación de movimiento basada en el I o P mas próximo
anterior y posterior
54 x 1024 x 8 / 0,36 = 1,2Mb/s
18 KB I
1
4 KB B
2
4 KB B
3
6 KB P
4
4 KB B
5
4 KB B
6
6 KB P
7
4 KB B
8
4 KB B
9
18 KB I
10Valores
orientativos
Ampliación Redes 4-40Universidad de Valencia Rogelio Montañana
I
B
P
B
I
I
P
P
P
P
0 ms 40 ms 80 ms 120 ms
0 ms 40 ms 80 ms 120 ms
0 ms 40 ms 80 ms 120 ms
Vector de movimientofotograma P
Vector de desviación fotograma B
I _ _ P
I P P P
I B B P
Comparación fotogramas P y B
Ampliación Redes 4-41Universidad de Valencia Rogelio Montañana
Fotogramas MPEG I, P y B
Macrobloque16X16 Pixels
Vector de movimiento
Área de búsqueda
II BB BB PP BB BB II
Predicción Bidireccional
0 1 2 3 4 5 0
Grupo de fotogramas
Fotograma n
Fotograma n+1
BB BB
1 2
PP
3
Ampliación Redes 4-42Universidad de Valencia Rogelio Montañana
Vídeo MPEG-1
• Secuencia típica (360 ms): I1 B2 B3 P4 B5 B6 P7 B8 B9 I10
• Orden codif/decodificación: I1 P4 B2 B3 P7 B5 B6 I10 B8 B9
• Tamaño típico de fotogramas (SIF, 352 x 288):– I: 18 KBytes
– P: 6 KBytes
– B: 4 KBytes
– Caudal medio (IBBPBBPBBI): 1,2 Mbps
– Con QSIF el caudal se reduce a 300 Kbps
• Latencia de compresión (valores típicos):– M-JPEG: 45 ms
– MPEG fotogramas I: 200 - 400 ms
– MPEG fotogramas I y P: 200 - 500 ms
– MPEG Fotogramas I, P y B: 400 - 850 ms
Ampliación Redes 4-43Universidad de Valencia Rogelio Montañana
Caudal de una vídeoconferencia
Caudal medio: 384 Kb/sResolución: 352 x 288 (CIF)
Velocidad de refresco: 30 fps Caudalinstantáneo
600 Kb/s
300 Kb/s
Fotograma I Fotograma I
Fotogramas P y B
Tiempo0 Kb/s
0 ms 100 ms 200 ms 300 ms 400 ms
Ampliación Redes 4-44Universidad de Valencia Rogelio Montañana
Audio MPEG-1
• Muestreo mono o estéreo a 32, 44.1(CD) o 48 (DAT) KHz. Si se va a utilizar caudal es reducido es conveniente hacer el muestreo a 32 KHz.
• Compresión psicoacústica (con pérdidas) asimétrica.• De 32 a 448 Kbps por canal de audio• Tres capas en orden ascendente de complejidad/calidad:
– Capa I: buena calidad con 192-256 Kbps por canal; no se utiliza– Capa II: calidad CD con 96-128 Kbps por canal– Capa III: calidad CD con 64 Kbps por canal
• Cada capa incorpora nuevos algoritmos, y engloba los de las anteriores.
• Capa III usada en DAB (Digital Audio Broadcast) y en MP3
Ampliación Redes 4-45Universidad de Valencia Rogelio Montañana
Sistema MPEG-1
• Se ocupa de asegurar el sincronismo entre audio y vídeo mediante un sistema de marcas de tiempo (‘timestamps’) en base a un reloj de 90 KHz.
• Solo es necesario si se utilizan audio y vídeo simultáneamente (no para flujos MP3 por ejemplo)
• Ocupa poco caudal (5-50 Kbps)
Ampliación Redes 4-46Universidad de Valencia Rogelio Montañana
Codificadorde audio
Codificadorde vídeo
Multiplexordel sistema
Señal de audio analógica
Flujo MPEG-1
Señal de vídeo analógica
Sincronización de audio y vídeo MPEG
Flujo de vídeo digitalcon marcas de tiempo
Flujo de audio digitalcon marcas de tiempo
Relojde 90 KHz
Durante la decodificación se realiza el proceso inverso
Ampliación Redes 4-47Universidad de Valencia Rogelio Montañana
MPEG (Moving Pictures Expert Group)
• Grupo de trabajo de ISO que desarrolla estándares de audio-vídeo comprimido:
• MPEG-1 (1992, ISO 11172)– Orientado a vídeo en CD-ROM (vídeo progresivo)– Objetivo: Calidad VHS. Caudal típico 1,5 Mb/s – Útil para teleenseñanza, aplicaciones de empresa, negocios, etc.
• MPEG-2 (1996, ISO 13818)– Extensión compatible de MPEG-1 ‘hacia arriba’– Orientado a teledifusión (vídeo entrelazado)– Calidad broadcast, también HDTV. 4-100 Mb/s.– Útil para todo tipo de aplicaciones (negocios, entretenimiento, etc.)
• MPEG-3: Inicialmente pensado para HDTV, finalmente resuelto por reparametrización de MPEG-2.
Ampliación Redes 4-48Universidad de Valencia Rogelio Montañana
MPEG-n • MPEG-4 (1998-1999, ISO 14496):
– Extensión ‘hacia abajo’ de MPEG-1. Orientado a vídeo sobre Internet – Útil en el rango 28,8-500 Kb/s. Nuevos algoritmos de compresión– Definición de AVOs (objetos audio visuales) similar a VRML– MPEG-4 v. 2 (previsto dic. 1999)
• MPEG-5 y MPEG-6: inexistentes• MPEG-7 (aprobado sep. 2001, ISO 15938)
– Descripción de contenidos audiovisuales (indexación, búsquedas, bases de datos, etc.). Interpreta semántica de la información audiovisual
• MPEG-21: en fase borrador. Prevista aprobación de IS entre 12/2002 y 9/2004
• Referencia: http://mpeg.telecomitalialab.com
Ampliación Redes 4-49Universidad de Valencia Rogelio Montañana
Vídeo MPEG-2 (I)
• Extensión compatible de MPEG-1• Diseñado para televisión digital:
– Optimizado para transmisión, no almacenamiento
– Prevé vídeo entrelazado (TV) además de progresivo (MPEG-1 era sólo progresivo)
• Según los valores de los parámetros de muestreo utilizados se definen en MPEG-2 cuatro niveles:– Bajo: 352 x 288 (compatible MPEG-1)
– Principal: 720 x 576 (equivalente CCIR 601)
– Alto-1440: 1440 x 1152 (HDTV 4:3)
– Alto: 1920 x 1152 (HDTV 16:9)
Ampliación Redes 4-50Universidad de Valencia Rogelio Montañana
Vídeo MPEG-2 (II)• Además de los niveles se definen seis perfiles según el
submuestreo y algoritmo de compresión utilizado. Los perfiles posibles son:– Simple: para codecs de bajo costo
– Principal: el más utilizado
– SNR
– Espacial
– Alto
– 4:2:2
• No todas las combinaciones nivel-perfil están permitidas
• Cada combinación tiene un caudal máximo previsto
• TV digital y DVD utilizan nivel y perfil principal ML@MP (Main Level @ Main Profile)
Para gran calidad
Ampliación Redes 4-51Universidad de Valencia Rogelio Montañana
Perfiles Simple Principal SNR Escal.
EspacialEscal.
Alto 4:2:2 (Studio)
Submuestreo 4:2:0 4:2:0 4:2:0 4:2:0 4:2:0/2 4:2:0/2
Alto 1920 x 1152 (HDTV 16:9)
80 Mb/s 100 Mb/s
Alto-1440 1440 x 1152 (HDTV 4:3)
60 Mb/s 60 Mb/s 80 Mb/s
Principal 720 x 576
(CCIR 601)
15 Mb/s 15 Mb/s 15 Mb/s 20 Mb/s 50 Mb/s
Bajo 352 x 288 (MPEG1)
4 Mb/s
Niv
eles
Caudales de Niveles y Perfiles MPEG-2
Los mostrados son los caudales máximos previstos en el estándar para cada combinación de perfil y nivel.
Ampliación Redes 4-52Universidad de Valencia Rogelio Montañana
Audio MPEG-2
• Algoritmos:– Versión compatible con MPEG-1 capa I, II y III– Sistema de compresión mejorado Advanced Audio
Coding (AAC). Calidad comparable a MPEG-1 capa III con el 50-70% de caudal. No compatible con MPEG-1.
• Canales:– Versión estéreo compatible con MPEG-1
• Independiente (cada canal por separado)• Conjunto (aprovecha redundancia entre canales)
– Soporte multicanal (idiomas) y 5.1 (5 canales más surround)
Ampliación Redes 4-53Universidad de Valencia Rogelio Montañana
Vídeo H.26x• Estándares de vídeo la ITU-T para vídeoconferencia: baja velocidad,
poco movimiento. Menos acción que en el cine.– H.261: Desarrollado a finales de los 80 para RDSI (caudal constante).– H.263, H.263+, H.26L. Más modernos y eficientes.
• Algoritmos de compresión MPEG simplificados:– Vectores de movimiento más restringidos (menos acción)– En H.261: No fotogramas B (excesiva latencia y complejidad)
• Menos intensivo de CPU. Factible codec software en tiempo real• Submuestreo 4:1:1• Resoluciones:
– CIF (Common Interchange Format): 352 x 288– QCIF (Quarter CIF): 176 x 144 – SCIF (Super CIF): 704 x 576
• Audio independiente: G.722 (calidad), G.723.1, G.728, G.729• Sincronización audio-vídeo mediante H.320 (RDSI) y H.323 (Internet)
Ampliación Redes 4-54Universidad de Valencia Rogelio Montañana
Formato SQCIF QCIF CIF 4CIF o SCIF
16CIF 4:3
16CIF 16:9
Resolución
128x96
176x144
352x288
702x576
720x576
1408x11521440x11
52
1920x1152
H.261 Opc.
H.263 Opc. Opc.
MPEG-4
MPEG-1
MPEG-2 Bajo Princip. Alto 1440 Alto
Est
ánda
rResoluciones estándar de vídeo
comprimido
Ampliación Redes 4-55Universidad de Valencia Rogelio Montañana
Resoluciones de vídeo
16CIF 16:916CIF 4:3
SCIF
CIF
QCIF SQCIF
Ampliación Redes 4-56Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Vídeo bajo demanda• Telefonía Internet
Ampliación Redes 4-57Universidad de Valencia Rogelio Montañana
Estructura paquete RTP
Cabecera UDP
Cabecera IP
Datos (Audio o Video digital)Cabecera
RTP
820 12 Variable
Número de secuencia(16 bits)
Ordenar datagramasrecibidos,
detectar perdidos
Timestamp(32 bits)
Reproducir en elinstante adecuado,
sincronizar audio y vídeo
Payload Type(7 bits)
Identificar el tipo de información recibida
(ej.: audio G.722)
La cabecera RTP incluye: Con esto el receptor puede:
Ampliación Redes 4-58Universidad de Valencia Rogelio Montañana
Cabecera RTP (RFC 1889)
Ampliación Redes 4-59Universidad de Valencia Rogelio Montañana
Paquetes RTCP• Los paquetes RTCP no llevan información de usuario, solo
de control.
• Pueden ser de varios tipos:– SR (Sender Report): ofrece estadísticas de transmisión y
recepción de los participantes que son emisores activos.
– RR (Receiver Report): ofrece estadísticas de recepción de los participantes que no son emisores activos.
– SDES (Source Description): describe a un emisor activo. Lo utilizan los emisores para anunciarse de manera no ambigua.
– BYE: Indica el final de la participación
• Con la información de RTCP los emisores pueden ajustar el caudal según el estado de la red.
Ampliación Redes 4-60Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Vídeo bajo demanda• Telefonía Internet
Ampliación Redes 4-61Universidad de Valencia Rogelio Montañana
Aplicaciones de audio-vídeo en tiempo real
Aplicación Sentido Estándares
Retardo Espectadores
Multicast
Videoconferencia
H.32x Bajo Uno o varios Apropiado
Emisiones en directo (radio-TV
por Internet)
H.32x
MPEG
Alto Muchos Muy
Apropiado
Audio-Vídeo bajo demanda
MPEG Medio Uno No
Ampliación Redes 4-62Universidad de Valencia Rogelio Montañana
Vídeoconferencia
• Comunicación interactiva por medio de audio, video y compartición de datos
• Puede ser:– Punto a punto– Punto a multipunto– Multipunto a multipunto
Ampliación Redes 4-63Universidad de Valencia Rogelio Montañana
Requisitos/Características de la vídeoconferencia
• Compresión/descompresión en tiempo real• Retardo máximo 200-400 ms.• Movilidad reducida• Normalmente aceptable audio de calidad
telefónica• Necesidad de sincronizar audio y vídeo• Necesidad de protocolo de señalización (servicio
orientado a conexión)
Ampliación Redes 4-64Universidad de Valencia Rogelio Montañana
Estándares de Vídeoconferencia
• Los sistemas de videoconferencia han sido estandarizados por la ITU-T (International Telecommunications Union – Telecommunications sector) en los estándares de la serie H (sistemas multimedia y audiovisuales)
• En la serie H hay una gran cantidad de estándares. • Los H.32x son estándares de videoconferencia. La
‘x’ depende del tipo de red utilizado
Ampliación Redes 4-65Universidad de Valencia Rogelio Montañana
Estándares H.32x
Estándar Medio físico Tipo servicio Año aprobación
H.320 RDSI Circuito 1990
H.321 ATM Circuito
H.322 IsoEthernet TDM
H.323 Ethernet Paquete 1996
H.324 Módem analógico
Circuito
Los H.32x son estándares ‘paraguas’. Cada uno de ellos se basa en una serie de estándares previos para especificar todos los servicios necesarios en una vídeoconferencia. Ej.: Codificación de audio G.711
Ampliación Redes 4-66Universidad de Valencia Rogelio Montañana
Estándares H.320 y H.323
RDSI IP
Ampliación Redes 4-67Universidad de Valencia Rogelio Montañana
Vídeoconferencia H.320
RDSI3*BRI
Flujo de audio-vídeo128 - 384 Kb/s
3*BRI
Picturetel
Dirección E.164: 963865420 Dirección E.164: 963983542
Polycom
Sistema de grupo o sala
Ampliación Redes 4-68Universidad de Valencia Rogelio Montañana
Internet
Vídeoconferencia H.323
ADSL10BASE-T
Flujo de audio-vídeo14,4 - 512 Kb/s
MicrosoftNetmeeting,
Polycom ViaVideo
Dirección IP: 147.156.1.20Dirección IP: 172.68.135.22
Sistema desobremesa
Polycom,Tandberg
Ampliación Redes 4-69Universidad de Valencia Rogelio Montañana
Terminales de vídeoconferencia
Polycom ViewStation SP128Video: H.261, H.263+Audio: G.711, G.722, G.728Caudal: 56-128 Kb/s (H.320), 56-768 Kb/s (H.323)Formatos: CIF, QCIFPeso: 2,7 KgConexiones ent./sal.: video v audioPrecio: 5.000 euros
Polycom ViaVideoVideo: H.261, H.263, H.263+Audio: G.711, G.722, G.728, G.723.1Caudal: 32-384 Kb/s (H.323)Formatos: CIF, QCIFPeso: 250 gConexiones ent./sal.: USB, audioPrecio: 500 euros
Ampliación Redes 4-70Universidad de Valencia Rogelio Montañana
Vídeoconferencia H.323: Gatekeeper
Pedro147.156.1.20
5111
GK
Internet
Luis147.156.3.12
5112
Laura147.156.4.15
5113
Ana147.156.7.45
5114
Dirección E.164
(número teléfono)
Alias H.323 Dirección IP
5111 Pedro 147.156.1.20
5112 Luis 147.156.3.12
5113 Laura 147.156.4.15
5114 Ana 147.156.7.45
Ampliación Redes 4-71Universidad de Valencia Rogelio Montañana
Estándares H.320 y H.323
H.323 H.320
Control H.225.0
Control de llamada Q.931
H.245 Control del sistema
H.242
H.225.0
Multiplexación H.221
Medios G.711
G.722
G.723.1
G.728
Audio G.711
G.722
G.728
H.261
H.263
Vídeo H.261
H.263
T.120 Datos T.120
Ampliación Redes 4-72Universidad de Valencia Rogelio Montañana
Formatos de audio H.32x
Codec Ancho de Banda
en origen
Ratio de
compresión
Ancho de Banda
comprimido
G.711
G.722
G.723.1
G.728
G.729
MPEG
64 Kb/s
224 Kb/s
64 Kb/s
64 Kb/s
64 Kb/s
706 Kb/s
1 : 1
3,5-4,6 : 1
10 : 1
4 : 1
8 : 1
3-11 : 1
64 Kb/s
48-64 Kb/s
6,4 Kb/s
16 Kb/s
8 Kb/s
64-256 Kb/s
MPEG no es un formato de audio H.323. Solo aparece a título comparativo
Ampliación Redes 4-73Universidad de Valencia Rogelio Montañana
Terminales H.323
Red IP
Lo único obligatorio en un terminal H.323 es la parte de audio
Sistema de grupo o sala
Sistema desobremesa
Teléfono IP
Ampliación Redes 4-74Universidad de Valencia Rogelio Montañana
Arquitectura terminal H.323
Equipo e/sde vídeo
Equipo e/sde audio
Datos usuarioAplicaciones
T.120, etc.
Interfaz deusuario para
controldel sistema
Codec VideoH.261, H.263
Control H.245
H.225.0 Controlllamada
H.225.0 ControlRAS
Retardotrayecto
Recepción(Sync)
CapaH.225
UDP
TCP
RTPRTCP
IP
UDP
Control del sistema
Codec AudioG.711, G.722,G.723, G.728,
G.729
Ampliación Redes 4-75Universidad de Valencia Rogelio Montañana
Señalización H.323
GK
Petición de admisión
Confirmación de admisión RAS
Inicio
ConexiónH.225
(Q.931)
Intercambio de capacidades
Apertura de canal lógico
ACK de apertura de canal lógico
H.245
Path
Resv RSVP(opcional)
Flujo RTP
Flujo RTP
Flujo RTCPMedio
Gatekeeper
Terminal H.323
Terminal H.323
Ampliación Redes 4-76Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Vídeo bajo demanda• Telefonía Internet
Ampliación Redes 4-77Universidad de Valencia Rogelio Montañana
Elementos de vídeoconferencia
• Terminal: es el equipo que utiliza el usuario para comunicarse
• Gateway, pasarela o puerta de enlace: interconecta redes diferentes: H.320 (RDSI) e Internet (H.323)
• Gatekeeper o equipo selector: permite el control de acceso. Realiza la equivalencia de direcciones IP a direcciones E.164 o usuarios
• MCU, Multipoint Control Unit o Unidad de control multipunto: replica un flujo de audio/video para permitir multiconferencia
Ampliación Redes 4-78Universidad de Valencia Rogelio Montañana
Funciones del Gatekeeper
• Obligatorias:– Traducción de direcciones IP a E.164 o userid (alias)– Control de Admisión: en función de los recursos disponibles
(ancho de banda, etc.)– Gestión de ancho de banda: controla número de terminales
accediendo simultáneamente
• Opcionales– Señalización de control: el gatekeeper puede efectuar la
señalización de llamada– Autorización de llamada: acepta o rechaza la llamada en base a
autorización del usuario– Gestión de llamada: mantiene una lista de llamadas activas
Ampliación Redes 4-79Universidad de Valencia Rogelio Montañana
WAN IP
GK
GK
GK
GK
Zona 1Prefijo 56
Zona 2Prefijo 73
Zona 3Prefijo 48
Zona: conjunto formado por los terminales, gateways, y MCUs gestionados por un
gatekeeper
Las zonas de Gatekeeper son
areas lógicas que reflejan la
topología de la red y simplifican las
tareas administrativas
Zonas de Gatekeeper
Ampliación Redes 4-80Universidad de Valencia Rogelio Montañana
Pasarela (Gateway) H.320-H.323
Internet RDSI
Gateway o‘puerta de enlace’
147.156.2.15
147.156.2.69 963171500
963972386
BRI
PRI
Arrancar NetmeetigGW 147.156.2.69
Llamar a 963972386
ADSL
GW
Ampliación Redes 4-81Universidad de Valencia Rogelio Montañana
Funciones Gateway H.323
• Interoperabilidad entre audio/vídeo y estándares de red
• Conversión de protocolo– Procedimientos de comunicación– Formatos de transmisión
• Opcionalmente: Transcodificación (conversión de formatos audio/video)
Ampliación Redes 4-82Universidad de Valencia Rogelio Montañana
Arquitectura Gateway H.320-H.323
IP RDSI
H.323
H.320
Datos T.120
Audio
Video
IVRControl de
llamada
H.245H.225
H.242Q.931
Ampliación Redes 4-83Universidad de Valencia Rogelio Montañana
Gateway/Gatekeeper, llamada entrante
Internet GW RDSI
147.156.2.15
147.156.2.69
Gatekeeper o ‘equipo selector’
158.42.5.96
963171500
963972386
BRI
PRI
Usuario IP Ext.
Llamar a 963171500 ext. 60
Arrancar NetmeetingGK: 158.42.5.96Usuario: Alicia
Número de tel.: 60
Alicia 147.156.2.15 60
¿ext. 60?
60 = 147.156.2.15
GK
ADSL
Ampliación Redes 4-84Universidad de Valencia Rogelio Montañana
Gateway/Gatekeeper, llamada saliente
Internet RDSI
147.156.2.15
Gatekeeper158.42.5.96
963972386
BRI
PRI
Usuario IP Ext.
Arrancar NetmeetingGK: 158.42.5.96Usuario: Alicia
Número de tel.: 60
Alicia 147.156.2.15 60
Llamar al 963972386
Usar GW 147.156.2.69
GK
ADSL
Registro
147.156.2.69 963171500
GW
Ampliación Redes 4-85Universidad de Valencia Rogelio Montañana
Procedimientos de llamada vía Gateway/Gatekeeper
• Respuesta de voz interactiva (IVR, Interactive Voice Response): – Marco 96-386-3500 y dice: ‘si sabe la extensión tecleela con un
cero delante, si no espere y le atenderá la operadora’.• Extensión por defecto:
– Todas las llamadas se encaminan a una extensión determinada.• Llamada directa del exterior:
– Cada extensión recibe un número directo del exterior. Ej.: 96-386-3563 llama a la extensión 3563. Requiere obtener números extra del operador.
• Enrutamiento TCS4:– La extensión se marca detrás del número: 96-386-3500#3563
llama a la extensión 3563. No disponible en España (los números extra se ignoran).
Ampliación Redes 4-86Universidad de Valencia Rogelio Montañana
Necesidades de la vídeoconferencia
• Caudal:– El teóricamente necesario más un 10-20% como
mínimo
• Retardo:– Para telefonía de calidad: <150 ms extremo a extremo
(recomendación ITU G.114)
– Para videoconferencia: < 400 ms
• Pérdida de paquetes: – Menor del 1% (hay que evitar la congestión)
Ampliación Redes 4-87Universidad de Valencia Rogelio Montañana
Vídeoconferencia multipunto H.320
Servidor MCU(Multipoint Control Unit)
RDSI
Replica el flujo de audio/vídeopara cada participante.
Posible cuello de botella
PRI
3*BRI
3*BRI
Flujos de audio-vídeounidireccionales de 384 Kb/s
3*BRI
3*BRI
Emisor
Receptor Receptor
Receptor
MCU
Ampliación Redes 4-88Universidad de Valencia Rogelio Montañana
Vídeoconferencia multipunto H.323
MCU H.323(Multipoint Control Unit)
Internet
Replica el flujo de audio/vídeopara cada participante.
Posible cuello de botella
MCU
Ampliación Redes 4-89Universidad de Valencia Rogelio Montañana
Arquitectura de MCU H.323
Presencia continua
Activación por voz
Control de imagende vídeo
Mez
clad
or
de
aud
io
Mezclador de audio
T.120
Ampliación Redes 4-90Universidad de Valencia Rogelio Montañana
Arquitectura de MCU H.323
Controlador Multipunto
Procesador Multipunto
Procesador Multipunto
Procesador Multipunto
Procesador Multipunto
Procesador Multipunto
Aceptación
Petición de conferencia
Flujos de audio/videohacia/desde los
participantes
Control de la Conferencia•Entrada/salida•Asignación/ubicación de recursos•Sentido de la llamada
Proceso de Medios•Mezcla de audio•Selección de participantes activos•Generación de imagen de vídeo
Ampliación Redes 4-91Universidad de Valencia Rogelio Montañana
Transcodificación
MCU con transcodificacion
La transcodificación ha de hacerse entiempo real y es labor intensiva de CPU
PRI
3*BRI
BRI
3*BRI
3*BRI
Flujos H.263 de 384 Kb/s
Flujo H.261de 128 Kb/s
Terminal sin soporte H.263
RDSI
ValenciaBilbao
ToulouseAtenas
MCU
Ampliación Redes 4-92Universidad de Valencia Rogelio Montañana
Gatekeeper, Gateway y MCUs
Internet GW RDSIPasarela
Gatekeeper
BRI
3*BRI
PRI
MCU H.320 contranscodificación
PRI
MCU H.323
GK MCU
MCU
Ampliación Redes 4-93Universidad de Valencia Rogelio Montañana
Vídeoconferencia multipunto multicast
MBone
Flujo replicado por los routers.No hay cuellos de botella.
Flujo de audio-vídeomulticast de 192 Kb/s
Ampliación Redes 4-94Universidad de Valencia Rogelio Montañana
Multicast-unicast con transcodificación
Internet
Usuario consoporte multicast
Usuario sin soporte multicast
Usuario sin soporte multicast
ADSL256 Kb/s
RDSI BRI
Pasarela multicast-unicastcon transcodificación
Línea E1
Flujo unicasta/v 192 Kb/s
Flujo unicasta/v 100 Kb/s
Flujos multicasta/v 192 Kb/s
Alicia
JuanPedro
Luis
Línea E1
Ampliación Redes 4-95Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Vídeo bajo demanda• Telefonía Internet
Ampliación Redes 4-96Universidad de Valencia Rogelio Montañana
Videodifusión y vídeo bajo demanda
Internet
Usuarios locales (MPEG-1-2-4)
Usuarios remotos (MPEG-4)
MS Win. Media ServerCisco IP/TV
SGI MediaBaseEtc.
Emisiones unicast y multicast
128-512 Kb/s
Los contenidos no se generan en tiempo real (CODEC software)
Servidor de vídeo
Ampliación Redes 4-97Universidad de Valencia Rogelio Montañana
Tipo de conexión
Caudaltotal Kb/s
Caudal audio Kb/s
Calidad Audio KHz
Caudal vídeo Kb/s
Calidad vídeo
Caudal usadoKb/s
Módem RTC 33,6 10,2 5,5 mono
16 128x96 10 fps
26
Módem RTC 56 10,2 5,5 mono
38 176x14412 fps
48
RDSI básico (2B)
128 16 8 mono
80 240x180 24 fps
96
ADSL/ Cable módem
256 28 8 + 8 stereo
190 320x240 24 fps
218
ADSL/ Cable módem
512 48 16 + 16 stereo
390 640x480 24 fps
438
Perfiles típicos de audio-vídeo en servicios de VoD
Ampliación Redes 4-98Universidad de Valencia Rogelio Montañana
Distribución de vídeo en directo
Internet
CODEC H.26x
CODEC MPEG
Ampliación Redes 4-99Universidad de Valencia Rogelio Montañana
TV en red de datos, formación continua
Cursos programados regularmente yemitidos por multicast varias veces por semana
TrainingProgram 1
TrainingProgram 2
TrainingProgram 3
Videoteca cursos de formación en MPEG-2 y 4
LAN
WANWAN
ProgramaFormación 3
ProgramaFormación 1
ProgramFormación 2
ProgramaFormación 3 Programa
Formación 1
Guía deprogramasPresentaciones
en directo H.26x
Servidor de Vídeo Windows Media Server, IP/TV, etc.
MPEG-2, H.261
MPEG-4, H.263
Ampliación Redes 4-100Universidad de Valencia Rogelio Montañana
Diferencia entre vídeoconferencia y vídeo streaming
Vídeo streaming Vídeoconferencia
Codificación MPEG-1, MPEG-4
H.263
Caudal típico 750-1500 Kb/s 128-384 Kb/s
Retardo 4-5 s 200 ms
Jitter 5-6 s 20-70 msLa vídeoconferencia requiere un servicio de mayor calidad que el vídeo streaming
Ejemplo de servicio de vídeo streaming:www.catv.org/frame/cmur_streaming.html
Ampliación Redes 4-101Universidad de Valencia Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógico-digital• Audio digital. Estándares. Compresión• Vídeo digital. Estándares. Compresión• Protocolos RTP y RTCP• Vídeoconferencia. Estándares H.32x• Pasarelas e Interoperabilidad• Vídeo bajo demanda• Telefonía Internet
Ampliación Redes 4-102Universidad de Valencia Rogelio Montañana
Telefonía sobre Internet
• Pretende aprovechar la red IP para la comunicación telefónica
• Requiere una red con bajo retardo y caudal garantizado (QoS)
• Además de digitalizar la voz es necesario ofrecer todas las funciones propias de una red telefónica:– Señalización
– Funciones avanzadas: reenvío de llamadas, mensajería, etc.
Ampliación Redes 4-103Universidad de Valencia Rogelio Montañana
Red Telefónica
Red IP
Call Manager Call Manager
Red IP
Evolución de la telefonía
Telefonía Tradicional
Telefonía tradicional sobre backbone IP
Telefonía IP
Ampliación Redes 4-104Universidad de Valencia Rogelio Montañana
Ejemplo de telefonía IP
Red Telefónica
pública
Salamanca Zaragoza
Pamplona
Red Telefónica
pública
Red Telefónica
pública
1
2
3
1
2
3A 0976* por 1A 0* por 2Resto por 1
A 0923* por 1A 0* por 2
Resto por 1
Ampliación Redes 4-105Universidad de Valencia Rogelio Montañana
CONS vs CLNS
Red Telefónica
Red IP
Dir. E.164: 1001 Dir. E.164: 2001
Dir. E.164: 1001Dir. IP: 136.12.15.32
Dir. E.164: 2001Dir. IP: 158.35.23.1
En caso de fallo la red telefónica no se recupera de forma automática
En caso de fallo la red IP reenvía los paquetes por una ruta alternativa.
Ampliación Redes 4-106Universidad de Valencia Rogelio Montañana
Teletrabajador
Oficina Principal
Sucursal ‘Moderna’
Sucursal ‘Antigua’
Red IP
Red Telefónica
Ejemplo de red de telefonía IP compleja
Ampliación Redes 4-107Universidad de Valencia Rogelio Montañana
Telefonía Internet
Cabecera
Red CATV
Internet
RDSI
Cable Modem
Red TelefónicaconmutadaModem
Gateway H.323(solo voz)
Red ADSL
Modem ADSL
Línea dedicada
Para ahorrar costos el gatekeeper elige la pasarela más próxima
al destinatario.
GK
GSMRed
analógica
Ampliación Redes 4-108Universidad de Valencia Rogelio Montañana
Telefonía sobre Internet
• Un terminal H.323 solo está obligado a soportar audio, el vídeo es opcional
• Por tanto con H.323 y gateways podemos ofrecer telefonía Internet sin tener que aprobar nuevos estándares
• Sin embargo H.323 es un estándar muy complejo. Por ello el IETF ha aprobado un estándar alternativo específicamente diseñado para telefonía mucho más sencillo conocido como SIP
Ampliación Redes 4-109Universidad de Valencia Rogelio Montañana
Telefonía IP• Ventajas:
+ Reducción de distancias (y costes) en la red telefónica+ Fácil enrutamiento alternativo en caso de averías en la
red (servicio no orientado a conexión)+ Compresión de la voz (G.729, G.723.1)+ Supresión de silencios+ Posibilidad de ofrecer servicios de voz de alta calidad
(G.722, 7 KHz)• Inconvenientes
– Degradación de la calidad cuando hay congestión (si no hay QoS).
– Mayores retardos (>200ms), posibles problemas de ecos
Ampliación Redes 4-110Universidad de Valencia Rogelio Montañana
LAN con telefonía IP H.323
WAN con QoS(DiffServ o IntServ)
Teléfono software(Netmeeting, GnomeMeeting,
Softphone, etc.)
El teléfono recibe alimentación eléctrica desde el switch LAN.
Él mismo actúa como un switch de dos puertos 10/100
Call Manager(Gestor de telefonía IP)(Servidor Windows/XP)
Tramas H.323 con alta prioridad (802.1p)
Las tramas del teléfono van en una VLAN de alta prioridad (se
usa 802.1p y 802.1Q)
Ampliación Redes 4-111Universidad de Valencia Rogelio Montañana
Teléfonos IP
Cisco 7960GAudio G.711 y G.729aIncorpora conmutador de dos puertos 10/100Precio: 500 euros
Cisco SoftPhoneAudio G.711, G.723.1 y G.729aPrecio: 150 euros
Cisco 7905Audio G.711 y G.729aPrecio: 200 euros
OpenPhonehttp://www.openh323.org/code.htmlPrecio: 0 euros
Hard Soft
Ampliación Redes 4-112Universidad de Valencia Rogelio Montañana
Compresión de cabeceras RTP• Los paquetes de voz no
pueden ser muy grandes (retardo de serialización)
• G.729 genera 8 Kb/s (20 bytes cada 20 ms)
• Cabeceras:– IP: 20 bytes
– UDP: 8 bytes
– RTP: 12 bytes
• 200% de overhead. La mayoría de los campos son constantes
• La compresión de cabeceras reduce a 2-4 bytes
Ampliación Redes 4-113Universidad de Valencia Rogelio Montañana
Telefonía y Calidad de Servicio
• La telefonía es muy exigente con el retardo y el jitter
• Para asegurar la QoS necesaria hay que disponer de DiffServ o IntServ
• En enlaces de baja velocidad el retardo de serialización de paquetes grandes puede hacer inviable la telefonía, aun teniendo QoS
• Para evitarlo se puede forzar una MTU menor de 1500 bytes
Ampliación Redes 4-114Universidad de Valencia Rogelio Montañana
Retardo de serialización vs velocidad y tamaño de paquete
64
bytes
128
bytes
256
bytes
512
bytes
1024
bytes
1500
bytes
64 Kb/s 8 ms 16 ms 32 ms 64 ms 128 ms 187 ms
128 Kb/s 4 ms 8 ms 16 ms 32 ms 64 ms 93 ms
192 Kb/s 2,7 ms 5,3 ms 10,7 ms 21,3 ms 42,6 ms 62,5 ms
256 Kb/s 2 ms 4 ms 8 ms 16 ms 32 ms 46 ms
384 Kb/s 1,3 ms 2,7 ms 5,3 ms 10,7 ms 21,3 ms 31,3 ms
512 Kb/s 1 ms 2 ms 4 ms 8 ms 16 ms 23 ms
1024 Kb/s 0,5 ms 1 ms 2 ms 4 ms 8 ms 12 ms
Retardo de serialización
Velocidad Tamaño
fragmento
64 Kb/s 160 Bytes
128 Kb/s 320 Bytes
192 Kb/s 480 Bytes
256 Kb/s 640 Bytes
384 Kb/s 960 Bytes
512 Kb/s 1280 Bytes
1024 Kb/s 2560 Bytes
Tamaño defragmento
(para retardo de 20 ms)
Ampliación Redes 4-115Universidad de Valencia Rogelio Montañana
Subsistema de colas de nivel 3 Subsistema de colas de nivel 2
Encolamiento de baja latencia
PQ voz
PQ vozPolítica
Clase X
Clase Y
Default
CBWFQ Fragmento
Interleave TXRing
SalidaPaquetes
EntradaPaquetes
WFQ
Vo
Datos no urg.
Datos urgentes
Vídeo
Voz
Vi
Ur
Encolamiento en un router con QoS
NU
Vo
Vi
Ur
NU NU NU
VoViUrNU VoViUrNU NU NU
WFQ: Weighted Fair QueuingCBWFQ: Customer Based Weighted Fair Queuing
Ampliación Redes 4-116Universidad de Valencia Rogelio Montañana
SIP (Session Initiation Protocol)
• Protocolo alternativo al H.323 para telefonía sobre Internet
• Desarrollado por el grupo de trabajo MMUSIC del IETF (RFC2543, 3/99, 153 pág.)
• Direcciones E.164 o URLs (como direcciones de e-mail)
• Página principal del SIP: Universidad de Columbia: http://www.cs.columbia.edu/~hgs/sip
Ampliación Redes 4-117Universidad de Valencia Rogelio Montañana
Componentes de SIP
• UA (Agente de usuario): Teléfonos SIP, Gateways, PDAs
• UAC (User Agent Client): el que inicia una llamada• UAS (User Agent Server): el que recibe la llamada• Servidores:
– Proxy Server: el que actúa como intermediario, en representación de otro para efectuar una llamada
– Redirect Server: traduce una dirección en otra u otras– Registrar: el que acepta peticiones REGISTER– Location Server: el que facilita información al Proxy o
Redirect sobre la ubicación del destinatatrio de una llamada
Ampliación Redes 4-118Universidad de Valencia Rogelio Montañana
Referencias• Godred Fairhurst: Digital Televisión: The MPEG-2
Standard: http://www.erg.abdn.ac.uk/users/gorry/level2dp.pdf
• Godred Fairhurst: MPEG-2 Digital Video: http://www.erg.abdn.ac.uk/public_html/research/future-net/digital-video/index.html
• http://mpeg.telecomitalialab.com/• Página principal del proyecto OpenH323: http://
www.openh323.org. Interesante fuente de información sobre H.323, implementaciones y servicios relacionados (gateways, gatekeepers, sistemas de respuesta automatizada, etc.) para Linux y Windows. Todo gratuito y con los códigos fuente disponibles.
• http://www.openphone.org/