compresion de video (1)
Post on 24-Jul-2015
40 Views
Preview:
TRANSCRIPT
COMPRESION DE VIDEOConstantino Pérez Vega
Departamento de Ingeniería de Comunicaciones
Estructura de capas del sistema de TVD
Consideraciones preliminares
La señal digital de vídeo
Vídeo compuesto
Vídeo en componentes
Y + C
Y + Cr + Cb
RGB
El muestreo puede referirse a la frecuencia de subportadora o a la de línea.
Aquí trataremos lo relativo a la Recomendación 601 del CCIR
El muestreo referido a línea produce un patrón ortogonal:
En tanto que el muestreo referido a subportadora produce un patrón de muestreo como el siguiente:
Número de elementos en una imagen con relación de aspecto 4:3
3
4
625
833
625 x 833 = 520.625
Manejando sólo líneas activas, el número de elementos se reduce a 570 x 760 = 433.200
Cuantificando cada muestra con 8 bits, el flujo binario por cuadro resulta de 3,465
Mbits
A 25 cuadros/seg la tasa binaria es de 86,64 Mb/s
La tasa anterior es para una sola señal, por ejemplo vídeo monocromático compuesto o una de las componentes de una señal RGB
Una señal RGB completa requeriría 259 Mb/s
(esto equivale al formato 4:4:4 del CCIR)
En el formato 4:2:2 (Rec. 601 del CCIR), las frecuencias de muestreo son:
Luminancia: 13,5 MHz 108 Mb/s
Crominancia (2): 6,75 MHz
108 Mb/s
216 Mb/sTotal:
REDUCCION DEL CAUDAL BINARIO
Con PCM, DPCM o modulación delta y eliminando los intervalos de “blanking” horizontal y vertical, el caudal se puede reducir a unos 140-150 Mb/s (140 MHz)
Con modulación digital, por ejemplo 16QAM (4 bit/Hz), el ancho de banda requerido se reduce a unos 35 MHz.
Para fines de almacenamiento las cifras anteriores son inaceptables, lo mismo que para radiodifusión terrestre de televisión
Para transmisión, es necesario reducir el ancho de banda como máximo a 5 MHz y la tasa binaria a valores del orden de 1.5 a 2 Mb/s para fines de almacenamiento.
En el caso de transmisión...
Pensando en 16 QAM, el caudal binario debe reducirse a unos 20 Mb/s, de los que aproximadamente un 10% se destinarían a codificación de canal, de modo que la información de video debe transmitirse a 18 Mb/s como máximo.
Es necesario eliminar 122 Mb/s (de 140 Mb/s) o 198 Mb/s (de 216 Mb/s).
Entre los principales motores de la compresión:
Almacenamiento masivo de imágenes
Mayor número de programas por canal de RF
La reducción de información (compresión) se basa en eliminar información redundante o irrelevante aprovechando:
Redundancia espacial y temporal en imágenes
Redundancia temporal en audio
Características perceptuales de la visión y audición
Redundancia espacial
y
x
Redundancia temporal
t
Conversor A/D
Compresión (codificación
de fuente) Codificación
de canal
Decodificación de canal
Decodificación de fuente
Conversor D/A
Vídeo analógico
Vídeo analógico
Transmisor
Receptor
Medio de transmisión
Contexto de la compresión en el sistema de TV digital
Elementos afectados por la TVD
METODOS DE COMPRESION
Sin pérdidas
Basados en modelos
LPC
AR, ARMA
Ajuste polinomial
Fractales
Basados en objetos
Basados en forma de onda
Estadísticos:GilbertFano Huffman
Universales:Codif. AritméticaCodif. Lempel-ZivAjuste de patrones
Métodos de compresión con pérdidas
Dominio espacial y/o temporal
PCM
DPCM
Modulación delta
Cuantificación vectorial
Compresión con pérdidas...
Dominio de frecuencia
Basados en filtrado
Subbandas
Wavelets
Basados en transformadas
Fourier
Karhunen-Loeve
Hadamard
DCT
El método utilizado en JPEG, MPEG-1 y MPEG-2 es el de la transformada del coseno discreto (DCT)
F u v C u C v f x yx u y v
yx
( , ) ( ) ( ) ( , ) cos( )
cos( )
1
4
2 1
16
2 1
160
7
0
7
C w para w
para w
( )
, ,...,
1
20
1 1 2 7
f x y C u C v F u vx u y v
vu
( , ) ( ) ( ) ( , ) cos( )
cos( )
142 1
16
2 1
160
7
0
7
Transformada del Coseno Discreto (DCT)
Imagen Original
Dominio espacial
8x8 pixels
DCT
Dominio de la transformada
8x8 coeficientes
Procesado en el Estudio
Calidad de contribución
Cuantificación perceptual
Algoritmos de compresión
Señal comprimida
1 pixel = 1 muestra Y
+ Cr + Cb
Imagen original
DCT
Hadamard
Fourier
Seno discreto
Karhunen-Loeve
Propiedades de compactación de coeficientes
Cuantificación perceptual
Matriz transformada
:
Matriz de coeficientes perceptuales
=
Matriz cuantificada
perceptualmente
Coeficientes de cuantificación perceptual de luminancia
Ordenación en zig-zag de los coeficientes transformados
Codificación de recorrido
frecuencia horizontal
frecuencia vertical
Efecto del número de coeficientes de la DCT
8x8
Bloque
Macrobloque
Segmento Cuadro
Grupo de Imágenes (GOP)
Secuencia de vídeo
Jerarquía de los datos de vídeo para compresión
Estructura de un macrobloque MPEG
Luminancia (Y)
Cr Cb
Crominancia
16 x 16 muestras
8 x 8 muestras c/u
Segmentación (slicing)Macrobloque
Segmento (slice): secuencia de macrobloques contiguos en orden del barrido
Diferencias entre JPEG y MPEG
JPEG (Joint Photographic Expert Group)
Orientado a la compresión de imágenes fijas
MPEG-1 (Motion Picture Expert Group)
Compresión de imágenes en movimiento.
Originalmente enfocado a almacenamiento en CD
Barrido secuencial
Tasas binarias variables, del orden de 1 Mb/s
MPEG-2
Compresión de imágenes en movimiento
Orientado a televisión: barrido entrelazado
Tasas binarias variables, aprox. de 1 Mb/s a 20 Mb/s
DCT Cuantificador
Codificador de
entropía
Tabla de
cuantificacion
Tabla de
códigoImagen fuente
Decodificador
de
entropía
Cuantificador
inversoIDCT
Bloque8x8
Bloque8x8
Tabla de Tabla de Imagenreconstruída
código cuantificación
Codificador
Decodificador
Imagen codificada
Imagencodificada
Codificador-Decodificador básico
Los estándares MPEG NO especifican el codificador, sino la sintaxis que deben cumplir los datos a decodificar
Tipo de imágenes en MPEG
I: Intracuadro. Se codifican independientemente de las demás, sin otra referencia que la del propio cuadro
P: Predictivas. Resultado de predicciones de imágenes I o P previas en la secuencia
B: Bidireccionales. Resultado de predicciones de las imágenes más cercanas I o P, previas o posteriores en la secuencia
Arboles de decisión para la codificación
Secuencia de codificación
I P B B B P B B P B B I
Grupo de imágenes (GOP)
Secuencia de procesado de la señal de vídeo en MPEG
Estructura del codificador MPEG
Estructura del codificador de vídeo MPEG
Módulo de reconstrucción, común al codificador y decodificador
Compensación de movimiento
Imagen de referencia Predicción hacia adelante
Imagen de referencia Predicción hacia atrás
Imagen actual
tiempo
Reducción de redundancia temporal
+
+
IDCTcuantific.inverso
DCT cuantific. Buffer
estimad. movmto
compens movmto
memoria de cuadr.
+
-
Codificación intercuadro básica
Compensación de movimiento hacia adelante
Compensación bidireccional de movimiento
Perfiles
Niveles
Simple
I,P 4:2:0
Principal
I,P,B 4:2:0
SNR
I,P,B 4:2:0
Escalable Espacial
I,P,B 4:2:0
Alto
I,P,B 4:2:0/4:2:2
Alto 19201152 60 cuadros/s
80 Mb/s
100 Mb/s
Alto - 1440 14401152 60 cuadros/s
60 Mb/s
60 Mb/s
80 Mb/s
Principal 720576
30 cuadros/s
15 Mb/s
15 Mb/s
15 Mb/s
20 Mb/s
Bajo 352288
30 cuadros/s
4 Mb/s
4 Mb/s
Perfiles y niveles en MPEG-2
top related