ecimag08 introduccion a las wavelets - dc.uba.ar · introducción a las wavelets y sus aplicaciones...

49
Introducción a las wavelets y sus aplicaciones al procesamiento de imágenes ECImag 2008 Ana Ruedin Departamento de Computación, Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires

Upload: habao

Post on 25-Apr-2018

223 views

Category:

Documents


2 download

TRANSCRIPT

Introducción a las waveletsy sus aplicaciones

al procesamiento de imágenes

ECImag 2008

Ana Ruedin

Departamento de Computación,

Facultad de Ciencias Exactas y Naturales,

Universidad de Buenos Aires

1. Como surgieron las wavelets. Qué son.

2. Transformada wavelet continua.Detección de dígitos manuscritos.

3. Transformada wavelet discreta.Compresión (con pérdida)

4. Transformada wavelet de enteros a enteros.Compresión (sin pérdida)

5. Transformada wavelet invariante.Detección de bordes de una imagen. Reconstrucción a partir de los bordes.

Descriptores para la identificación de texturas y búsqueda en bases de datos de imágenes

6. Transformada wavelet continua discretizada sobre una grilla especial.Análisis y síntesis de música

Bases de cosenos

(Parte real de la transf Fourier)

{ })cos(kx

∑=k

k kxbxf )cos()(

)cos( x

)3cos( x

)7cos( x

Coeficientes b

Bases de cosenos

{ })cos(kx

∑=k

k kxbxf )cos()(

)cos( x

)3cos( x

)7cos( x

coeficientes b)(xf

(Parte real de la transf Fourier)

Coeficientes b

Bases de cosenos

{ })cos(kx

∑=k

k kxbxf )cos()(

)cos( x

)3cos( x

)7cos( x

∑k

k kxb )cos( Reconstrucción con los 5 coeficientes de mayor magnitud

coeficientes b)(xf

(Parte real de la transf Fourier)

Bases de cosenos | FourierNo hay información temporal

Excelente información frecuencialCuando la señal es 0, las bases se cancelan

Bases de cosenos | FourierNo hay información temporal

Excelente información frecuencialCuando la señal es 0, las bases se cancelan

Jean Morlet 1980 Prospección de petróleo.

eco sensoresbombas de estruendo

conocimiento sobre capas de suelo

Las ondas sonoras atraviesan las capas de materiales diferentes a distintas velocidades

Bases de cosenos | FourierNo hay información temporal

Excelente información frecuencialCuando la señal es 0, las bases se cancelan

Jean Morlet 1980 Prospección de petróleo.

eco sensoresbombas de estruendo

conocimiento sobre capas de suelo

Sistemas de ecuaciones en 4 d. Grandes volúmenes de datos

Se resuelve por Fourier.

En los intervalos entre el estallido de las bombas de estruendo, la solución no era nula.

Las ondas sonoras atraviesan las capas de materiales diferentes a distintas velocidades

¿Qué son las wavelets?

5.0=a 1=a 2=a

⎟⎠⎞

⎜⎝⎛Ψa

xCambios de escala

0)( =Ψ∫∞

∞−

dxx

4=a

0.9239

0

-1

0

-0.5

∑=i

ii yxyx,0.5

⎟⎠⎞

⎜⎝⎛ −Ψ

a

bxTraslaciones

dxa

bx

axf∫

∞−

⎟⎠⎞

⎜⎝⎛ −Ψ1

)(

0=b

2=b

4=b

)2( =a

Transformada: un producto escalar

¿Qué son las wavelets?

dxa

bx

axfbaWf ∫

∞−

⎟⎠⎞

⎜⎝⎛ −Ψ= 1

)(),(

f(x)

b

a

Transformada wavelet continua

f(x)

b

a

ja 2=kb j2=

puntosSe discretizan los argumentos a y b

)(xΦFunción de escala

⎭⎬⎫

⎩⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎛ −Ψ=j

j

j

kxspanW

2

2

Wavelet )( xΨ

0)( =Ψ∫∞

∞−

dxx

⎭⎬⎫

⎩⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎛ −Φ=j

j

j

kxspanV

2

2

1)( =Φ∫∞

∞−

dxx

Subespacios de aproximación Subespacios de detalle

Transformada wavelet discreta

...012 ⊂⊂⊂ VVV

Transformada wavelet discreta

0V1V2V

1W

2W

jjj VWV =⊕ ++ 11

Transformada rápida: promedio ponderado de la señal con 8 coeficientes.

...012 ⊂⊂⊂ VVV

⎟⎠⎞

⎜⎝⎛ −Ψ+⎟

⎠⎞

⎜⎝⎛ −Φ= ∑∑ 2

2

2

2)( )1()1( kx

dkx

cxfk

kk

k

Transformada: proyección sobre los subespacios de aproximación y detalle

Transformada wavelet discreta

0V1V2V

1W

2W

jjj VWV =⊕ ++ 11

1V∈1W∈

Señal original

Señal suavizada

Detalle omitido

)0(cTransformada wavelet discreta

Señal original

Señal suavizada

Detalle omitido

)0(c

)1(c )1(d

Transformada wavelet discreta

detalles

aproximación {

Señal original ≈ suma de detalles a diferentes escalas + una aproximación burda

Transformada wavelet discreta

Esquema de la transformada : 2 pasos

Convolución o filtrado

2 Decimación o submuestreo

de a 2; se eliminan los impares

2h

2h

2g2h

2h 2g

)0(c

)1(c

)2(c

)1(d

)2(d

)(wH )(wG

h filtro pasa bajos

g filtro pasa altos

)1(c )1(d

)2(c )2(d

w

Transformada wavelet discreta

Transformada wavelet discreta

1 pasoA1

D1

V1

H1

A AproximaciónV detalle VerticalH detalle HorizontalD detalle Diagonal

Transformada wavelet discreta

A1

D1

V1

H1

A2

D1

V1

H1

H2

V2

D21 paso 2 pasosA AproximaciónV detalle VerticalH detalle HorizontalD detalle Diagonal

Transformada wavelet discreta

Umbrales de 25, 10 y 5%

Representación rala de una imagen

Separación en detalles de ubicación y escala diferentes: textura, bordes, etc.

Concentra la energía en pocos coeficientes: compresión.

JPEG (24.43 dB) DCT 8 x 8 Usando wavelets (27.74 dB)

Comprimida 2 KB !!!

0.065277 bpp Compresión 122:1

Compresión (con pérdida)Original 256 KB

Tesis de licenciatura: Manzano y Martínez Ricci 1999

– 8 bandas– Respuestas a ciertas frecuencias del espectro

electromagnético– Objetivo: aprovechar correlación entre las bandas

...

Investigación conjunta con Daniel Acevedo

(estudiante de doctorado)

Problema: grandes volúmenes de datos

1 banda 50 MB8 bandas 400 MB

Compresión sin pérdidade imágenes satelitales

...

Wavelets de enteros a enteros

Imagen

Pixeles: 0-255

Imagen transformada

biyección

Coeficientes: -300 - 300

DH1 DD1

DV1

DH2

DV2

DD2

DV3

DH3 DD3

Investigación conjunta con Daniel Acevedo

(estudiante de doctorado)

Compresión sin pérdidade imágenes satelitales

• Wavelet: se reduce la correlación espacial.• Se clasifica la imagen.• Se predice cada coeficiente (utilizando coefs ya codificados).• Se codifican las diferencias de predicción• Codificador aritmético (basado en la entropía)

COMPRESOR

136,65125,10118,83179,80116,72Mendoza

117,92111,30105,33159,24103,98San Luis

105,6199,5498,43139,9490,37Santa Cruz

121,67113,53106,88161,05104,76Buenos Aires

PNGJPEG2000LOCO-IWINZIPNUESTROMETODO

4.23 :1Tasa de compresión

Resultados en MB Imágenes originales: 400MB

Compresión sin pérdidade imágenes satelitales

Investigación conjunta con Daniel Acevedo

(estudiante de doctorado)

Transformada wavelet invariante

Los detalles horizontales, verticales y diagonales tienen el mismo tamaño que la imagen original.

Transformada redundante.

Invariante a traslaciones.

Sin submuestreo (o decimación).

0 50 100 150 200 250

0

0.5

10 50 100 150 200 250

0

0.5

1

0

1

2

−1

0

1

0

1

2

−1

0

1

0

2

4

−1

0

1

0

2

4

−2

0

2

0

5

−2

0

2

2

4

6

−2

0

2

4

5

6

−2

0

2

7.56

−1

0

1

Aproximaciones Detalles

Detección de bordes

Máximos locales del móduloDetalles

Las singularidades más importantes se propagan hacia las escalas más gruesas

Detección de bordes

Detección de bordes

Detección de bordes

Detección de bordes

Detección de bordes

Tesis de licenciatura: Marcos Nuñez Cortés, 2005

Fig. 2: Brodatz texture collectionFig. 2: Brodatz texture collection

16 imágenes de 64x64 de cada textura

Identificación de texturas

Histograma conjunto de detalle horizontal y vertical

Nivel 1 Nivel 2 Nivel 3

TransformadaWaveletDiscreta

TransformadaWavelet

Invariante

De Ves, Ruedin, Acevedo, Benavent, Seijas, CAIP 2006

Identificación de texturas

Histograma de módulos

Identificación de texturas

Nivel 1 Nivel 2

TransformadaWavelet

Invariante Histograma circular de ángulos

Nivel 3

Recuperación en una base de diferentes texturasEn promedio

De Ves, Ruedin, Acevedo, Benavent, Seijas, CAIP 2006 89 %

Distancia basada en la diver-genciaKullbackLeibler

Algunas muestras de la base de dígitos CENPARMI, de la Universidad de Concordia

Se utiliza una red neuronal.

Tesis de licenciatura en curso. Alumno: D.J.Romero. Codirección: L.Seijas.

Reconocimiento de dígitos manuscritos .

4000 dígitos para entrenamiento. 2000 para testeo.

Reconocimiento de dígitos manuscritos .

Transformada wavelet continua para imágenes

2121

211

)/)(,(),(),,,,( dxdx

a

bxbxRxxfbbaW yx

ayxf ∫∫∞

∞−

∞−⎟⎟⎠

⎞⎜⎜⎝

⎛ −−Ψ=

εεθ θ

f(x)

b

a

1 D

Se estira la wavelet

Se hace una rotación

Son 5 parámetros.

i. Curvaturaii. Suma de cuadrados de los módulos del gradienteiii. Entropía de módulos del gradienteiv. Entropía de los ángulos del gradientev. Suma de cuadrados de la transf. Sombrero Mejicano para distintos ángulosvi. Entropía de módulos de la transf. Sombrero Mejicano para distintos ángulosvii. Densidad escala-ángulo

Reconocimiento de dígitos manuscritos .

V

(i,v) (ii,vi)

Dígito

Versión suavizada

+

Vector V

Red Neuronal

Perceptrón

multicapa

Clase

PREPROCESAMIENTO

BASADO EN LA

TRANSFORMADA

WAVELET

Reconocimiento sobre el conjunto de entrenamiento

Reconocimiento sobre el conjunto de testeo

99.28 %

92.70 %

Reconocimiento de dígitos manuscritos .

Bases estables para música en dominio tiempo-frecuencia

Investigación conjunta con Juan Vuletich, tesista de licenciatura

Bases wavelets para música.

Gabor Weyl-Heisenberg

{ })(2 katge tbji −π

establesframesab

inestablesbasesab

1

1

<=

tiempo

frecuencia

g Gaussiana

Localización tiempo- frecuencia óptima

Representaciones redundantes

Grilla uniforme

21≥ft σσ

Principio de incertidumbre Heisenberg

a

b

Bases wavelets para música.

Música

102 FaF =

102 FaF =1F

1112

013 2 FFaF ==

1 octava

1210 2=a irracional

progresión geométrica

Cociente de 2 frecuencias de notasadyacentes = constante

Bases wavelets para música.

Wavelets usadas para la trasformada

wavelet discreta

⎭⎬⎫

⎩⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎛ −Ψj

j

j

kt

2

2

2

12/

1 octava

1 octava= 12 notas

Bases estables

Excelente localización en el tiempo

Localización de las frecuencias: no muy buena

Mosaico: área constante

Se necesita mayor tiempo para identificar una frecuencia baja

Bases wavelets para música.

Grilla especial para una octava

1F

12F

tiempo

Mosaicos: área constanteMosaicos más largos para frecuencias más bajas

Bases wavelets para música.

Distintas wavelets:

usos diferentes!

Gracias!