departamento de ciencias de la computación e i.a | universidad de … · 2013. 12. 12. · ol...

172

Upload: others

Post on 28-Sep-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

UNIVERSIDAD DE GRANADA

E.T.S. DE INGENIERÍA INFORMÁTICA

Departamento de Cien ias de la Computa ión

e Inteligen ia Arti� ial

Desarrollo de un modelo omputa ional de

representa ión de imágenes y su apli a ión

a la sele ión de es alas naturales y al

ál ulo de medidas de distorsión

TESIS DOCTORAL

JAVIER MARTÍNEZ BAENA

Granada, Marzo de 1999

Page 2: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic
Page 3: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Desarrollo de un modelo omputa ional de

representa ión de imágenes y su apli a ión

a la sele ión de es alas naturales y al

ál ulo de medidas de distorsión

MEMORIA QUE PRESENTA

Javier Martínez Baena

PARA OPTAR AL GRADO DE DOCTOR EN INFORMÁTICA

Marzo de 1999

DIRECTORES

JOSE ANTONIO JOAQUÍN

GARCÍA SORIA FERNÁNDEZ VALDIVIA

DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN

E INTELIGENCIA ARTIFICIAL

E.T.S. de Ingeniería Informáti a Universidad de Granada

Page 4: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic
Page 5: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

La memoria titulada Desarrollo de un modelo omputa ional de repre-

senta ión de imágenes y su apli a ión a la sele ión de es alas naturales

y al ál ulo de medidas de distorsión, que presenta D. Javier Martínez Baena

para optar al grado de Do tor, ha sido realizada en el Departamento de Cien ias

de la Computa ión e Inteligen ia Arti� ial de le Universidad de Granada bajo la

dire ión de los do tores D. Joaquín Fernández Valdivia y D. Jose Antonio Gar ía

Soria.

Granada, Marzo de 1999.

El Do torando: Los Dire tores:

Fdo. J. Martínez Baena Fdo. J. Fdez. Valdivia Fdo. J. A. Gar ía

Page 6: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic
Page 7: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

AGRADECIMIENTOS

Quisiera expresar mi gratitud ha ia todos aquellos que han he ho posible el de-

sarrollo de esta Tesis, espe ialmente a los que la han estado supervisando desde que

empezó a gestarse hasta que vió la luz, a Joaquín y Jose Antonio.

Igualmente quiero dedi ar este trabajo a otros que también lo han he ho posible,

aunque de forma distinta: a mis padres y a mi hermano. A unos por soportarme

durante varios años y al otro por a� ionarme a estas osas de la té ni a. También

quiero agrade er a M

a

Ángeles su apoyo, que ha he ho más soportable esta tarea, que

aunque tiene sus satisfa iones también tiene sus desespera iones. Por supuesto, no

puede faltar aquí una espe ial men ión a esa entrañable (... on el tiempo) entidad,

ono ida omo El Despa ho (aunque tiene otros sinónimos), a la que tantos ratos

agradables le debo y que de vez en uando toma aires gallegos.

Finalmente, y no por ello on menos intensidad, he de agrade er la ayuda que

obtenido de todos mis ompañeros del grupo de investiga ión de Análisis de Imágenes

Digitales y sus Apli a iones y, en general, de todo el Departamento de Cien ias de

la Computa ión e Inteligen ia Arti� ial de la Universidad de Granada.

Las publi a iones [80℄, [77℄, [82℄, [78℄, [81℄, [79℄, [83℄ y [30℄ han visto la luz omo

onse uen ia de parte de la investiga ión realizada en esta Tesis Do toral.

Quiero expresar mi agrade imiento al proye to TIC97-1150 por la aporta ión de

fondos y medios materiales para la realiza ión de esta Tesis.

Page 8: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic
Page 9: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

a M

a

Ángeles,

Ángela y María

Page 10: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic
Page 11: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Índi e General

Agrade imientos vii

Índi e General xi

Lista de Tablas xiii

Lista de Figuras xvi

1 Introdu ión 1

1.1 El Sistema Visual Humano . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Objetivos de la memoria . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Des rip ión por apítulos . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Modelo de representa ión de imágenes propuesto 7

2.1 Introdu ión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Parti ión del espe tro de fre uen ias . . . . . . . . . . . . . . . . . . 11

2.2.1 Sele ión de sensores a tivos . . . . . . . . . . . . . . . . . . . 15

2.3 Modeliza ión de los ampos re eptivos . . . . . . . . . . . . . . . . . 21

2.4 Resumen del modelo de representa ión propuesto . . . . . . . . . . . 28

3 Dete ión de es alas globales 31

3.1 Dete ión de es alas signi� ativas . . . . . . . . . . . . . . . . . . . . 33

3.1.1 Fun iones de enfoque . . . . . . . . . . . . . . . . . . . . . . . 33

3.1.2 Resultados experimentales . . . . . . . . . . . . . . . . . . . . 37

3.1.2.1 Imagen sintéti a . . . . . . . . . . . . . . . . . . . . 37

3.1.2.2 Imagen biomédi a . . . . . . . . . . . . . . . . . . . 42

3.1.2.3 Imagen astronómi a . . . . . . . . . . . . . . . . . . 47

3.1.3 Robustez frente al ruido . . . . . . . . . . . . . . . . . . . . . 51

3.1.4 Comentarios �nales . . . . . . . . . . . . . . . . . . . . . . . . 56

xi

Page 12: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

xii Índice General

3.2 Compara ión on otros métodos de autoenfoque . . . . . . . . . . . . 57

3.2.1 Autoenfoque en el dominio espa ial . . . . . . . . . . . . . . . 57

3.2.2 Autoenfoque en el dominio fre uen ial . . . . . . . . . . . . . 59

3.2.3 Compara ión de resultados . . . . . . . . . . . . . . . . . . . 59

3.3 Con lusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4 Dete ión de es alas naturales lo ales 73

4.1 Método de dete ión de es alas lo ales . . . . . . . . . . . . . . . . . 74

4.1.1 Dete ión de puntos de interés . . . . . . . . . . . . . . . . . 75

4.1.2 Determina ión de las es alas lo ales sobre los puntos de interés 76

4.2 Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . 77

4.2.1 Imagen biomédi a . . . . . . . . . . . . . . . . . . . . . . . . 77

4.2.2 Es ena natural . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5 Desarrollo de una Medida de Distorsión Per eptual 85

5.1 Medidas existentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.1.1 Medidas lási as no per eptuales . . . . . . . . . . . . . . . . 87

5.1.2 Medidas per eptuales . . . . . . . . . . . . . . . . . . . . . . 89

5.2 Medida de distorsión per eptual . . . . . . . . . . . . . . . . . . . . . 90

5.3 Experimento de enmas aramiento . . . . . . . . . . . . . . . . . . . . 94

5.4 Efe to de pixelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

5.5 Distinguibilidad de objetos . . . . . . . . . . . . . . . . . . . . . . . . 102

5.5.1 Ordena ión de imágenes en base a la visibilidad de objetos

presentes en ellas . . . . . . . . . . . . . . . . . . . . . . . . . 103

5.5.2 Predi ión de la distinguibilidad visual de objetos . . . . . . . 107

5.5.3 Ordena ión de imágenes de la base de datos del TNO HFRI . 111

5.5.4 Búsqueda visual . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.6 Evalua ión de la alidad de imágenes omprimidas . . . . . . . . . . 115

5.6.1 Rela ión entre la medida de distorsión d

1

y el fa tor de alidad

de ompresión . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.6.2 Experimento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 122

5.6.3 Rela ión entre la alidad visual de imágenes omprimidas y la

onspi uidad visual . . . . . . . . . . . . . . . . . . . . . . . . 124

Con lusiones y líneas futuras 129

A Nota ión 131

Page 13: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Índice General xiii

B Fun iones gaussianas y Gabor 133

B.1 Fun iones gaussianas . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

B.2 Fun iones de Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

Bibliografía 137

Índi e de Materias 149

Page 14: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

xiv Índice General

Page 15: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Índi e de Tablas

2.1 Campos re eptivos y respuestas de las élulas de un anal orti al. . 25

3.1 Parámetros de los sensores a tivos de la imagen sintéti a. . . . . . . 38

3.2 Es alas signi� ativas dete tadas por ada uno de los riterios estudia-

dos para los sensores a tivos de la imagen sintéti a. . . . . . . . . . . 38

3.3 Parámetros de los sensores a tivos de la imagen biomédi a de la �gura

3.5. Para ada sensor S (�las) se muestra la fre uen ia radial mínima

S

rmin

, la fre uen ia radial máxima S

rmax

, el ángulo mínimo S

amin

y

el ángulo máximo S

amax

. Las fre uen ias se dan en i los por pixel

( pp) y los ángulos en grados. . . . . . . . . . . . . . . . . . . . . . . 43

3.4 Es alas de la imagen biomédi a obtenidas para ada sensor y on los

uatro riterios de enfoque. . . . . . . . . . . . . . . . . . . . . . . . 43

3.5 Parámetros de los sensores a tivos de la imagen astronómi a. . . . . 47

3.6 Es alas signi� ativas dete tadas por ada uno de los riterios estudia-

dos para los sensores a tivos de la imagen astronómi a. . . . . . . . . 49

3.7 Es alas signi� ativas de la imagen sintéti a obtenidas por los tres mé-

todos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.8 Parámetros de los sensores a tivos de la imagen natural. Las tres

últimas olumnas muestran las es alas obtenidas por ada uno de los

métodos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.1 Parámetros de los sensores a tivos dete tados para la imagen biomé-

di a junto on la es ala global de ada uno de ellos. . . . . . . . . . . 79

4.2 Parámetros de los sensores a tivos de la es ena natural junto on las

es alas dete tadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.1 Valores de RMSE y d

1

entre la imagen original y ada una de las

imágenes on ruido uniforme de la �gura 5.3. . . . . . . . . . . . . . 95

xv

Page 16: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

xvi Índice de Tablas

5.2 Valores de RMSE y d

1

entre la imagen original y ada una de las

imágenes on ruido no uniforme de la �gura 5.4. . . . . . . . . . . . . 95

5.3 Valores de las medidas de distorsión entre la imagen original (Einstein)

y las imágenes pixeladas. . . . . . . . . . . . . . . . . . . . . . . . . . 100

5.4 Valores de las medidas de distorsión entre la imagen original (es ena

de los bar os) y las imágenes pixeladas. . . . . . . . . . . . . . . . . 100

5.5 Valores de las medidas de distorsión y ordena iones para las parejas

de imágenes de la �gura 5.10. . . . . . . . . . . . . . . . . . . . . . . 107

5.6 Datos de las 17 imágenes de la base de datos del TNO HFRI. Para

ada imagen se muestra el luster al que pertene e y las tres ordena-

iones onsideradas: subjetiva, RMSE y d

1

. También se muestran

los valores del área que hay por debajo de la urva de probabilidad de

dete ión a umulada y de las otras dos medidas usadas. . . . . . . . 112

5.7 Tasas de error de d

1

y RMSE en los sub onjuntos sele ionados. . . 114

5.8 Valores de las medidas de distorsión d1 y RMSE entre la imagen ori-

ginal de la �gura 5.18 y ls misma imagen omprimida mediante el

algoritmo JPEG on fa tores de alidad (qf ) entre 1 y 99. . . . . . . 121

5.9 Valores de las medidas de distorsión entre la imagen original y las

imágenes omprimidas. . . . . . . . . . . . . . . . . . . . . . . . . . . 124

Page 17: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Índi e de Figuras

1.1 Corte transversal del ojo y organiza ión elular de la retina. . . . . . 2

1.2 Se ión transversal del erebro que muestra el amino que sigue la

informa ión visual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Esquema de desarrollo de la Tesis. . . . . . . . . . . . . . . . . . . . 5

2.1 Diferentes rosetas propuestas por varios autores. (A) Daugman. (B)

Ebrahimi y Kunt. (C) Watson. (D) Navarro. . . . . . . . . . . . . . 9

2.2 Per�l 3D de una fun ión de Gabor on simetría par. (A) en el dominio

espa ial y (B) en el dominio fre uen ial. . . . . . . . . . . . . . . . . 11

2.3 Parti ión del espe tro en bandas de orienta ión. Izquierda: Imagen

de referen ia. Dere ha: espe tro de la imagen suavizada a es ala 1 y

la parti ión en uatro bandas de orienta ión. . . . . . . . . . . . . . . 13

2.4 (A) Índi e de antialiasing obtenido sobre la banda B

0

de la imagen de

la �gura 2.3. (B) Los anales para esta banda serían ada uno de los

intervalos entre máximos y mínimos alternativos de la segunda derivada. 15

2.5 Ejemplo del ál ulo de la parti ión multisensor sobre una imagen digital. 16

2.6 Sele ión de sensores a tivos. . . . . . . . . . . . . . . . . . . . . . . 20

2.7 Modelos de ampo re eptivo propuestos por De Valois et al.. (A)

Suma de 2 gaussianas. (B) Suma de 3 gaussianas. (C) Modelo de

entro on entrado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.8 Per�les 3D de fun iones Gabor on diferentes simetrías y desfases. (A)

Simetría par. (B) Simetría impar. (C) Simetría par on desfase de

180

Æ

. (D) Simetría impar on desfase de 180

Æ

. . . . . . . . . . . . . . 24

2.9 Fila superior: per�l 2D de las respuestas orrespondientes a las 4

élulas simples que forman un anal orti al. Fila inferior: resultado

de apli ar la re ti� a ión de media onda (RMO). . . . . . . . . . . . 26

3.1 (A) Imagen sintéti a. (B) Sensores a tivos. . . . . . . . . . . . . . . 38

xvii

Page 18: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

xviii Índice de Figuras

3.2 Fun iones de autoenfoque para los sensores de la imagen sintéti a.

En la primera olumna están las fun iones orrespondientes al riterio

de la Varianza, en la segunda las de Tenengrad, en la ter era las de

Brenner y en la uarta las del Gradiente Cuadráti o. . . . . . . . . . 39

3.3 Es alas dete tadas on el riterio de Brenner. . . . . . . . . . . . . . 41

3.4 Algunas de las es alas dete tadas on el riterio de la varianza. . . . 42

3.5 (A) Imagen biomédi a. (B) Sele ión de sensores a tivos. . . . . . . . 42

3.6 Fun iones de autoenfoque de la imagen biomédi a para los riterios

de la Varianza y Tenengrad. . . . . . . . . . . . . . . . . . . . . . . . 44

3.7 Fun iones de autoenfoque de la imagen biomédi a para los riterios

de Brenner y Gradiente uadráti o. . . . . . . . . . . . . . . . . . . . 45

3.8 Imagen biomédi a �ltrada de a uerdo a distintos sensores a tivos y

algunas de las es alas signi� ativas dete tadas. (A) Sensor S

0

, � = 3.

(B) Sensor S

1

, � = 4:5. (C) Sensor S

1

, � = 13. (D) Sensor S

2

, � = 2.

(E) Sensor S

2

, � = 7:5. (F) Sensor S

3

, � = 3:5. (G) Sensor S

3

, � = 9.

(H) Sensor S

4

, � = 3:5. (I) Sensor S

5

, � = 8:5. . . . . . . . . . . . . 46

3.9 (A) Imagen astronómi a. (B) Sensores a tivos. . . . . . . . . . . . . 47

3.10 Fun iones de autoenfoque para los sensores S

0

, S

1

, S

3

, S

7

y S

8

de

la imagen astronómi a. En la primera olumna están las fun iones

orrespondientes al riterio de la Varianza, en la segunda las de Te-

nengrad, en la ter era las de Brenner y en la uarta las del Gradiente

Cuadráti o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.11 Imagen astronómi a �ltrada de a uerdo a distintos sensores a tivos y

algunas de las es alas signi� ativas dete tadas. (A) Sensor S

0

, � =

3:5. (B) Sensor S

1

, � = 5:5. (C) Sensor S

1

, � = 12:5. (D) Sensor S

3

,

� = 2. (E) Sensor S

3

, � = 6. (F) Sensor S

6

, � = 9. (G) Sensor S

7

,

� = 7:5. (H) Sensor S

7

, � = 3. (I) Sensor S

7

, � = 11. . . . . . . . . . 50

3.12 Imagen biomédi a on diferentes niveles de ruido. . . . . . . . . . . . 52

3.13 Evolu ión de las es alas de la imagen biomédi a en presen ia de ruido. 53

3.14 Imagen sintéti a on diferentes niveles de ruido. . . . . . . . . . . . . 54

3.15 Evolu ión de las es alas de la imagen sintéti a en presen ia de ruido. 55

3.16 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada

uno de los métodos sobre el sensor S

0

. (A) Área que ubre el sensor

S

0

. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . 61

3.17 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada

uno de los métodos sobre el sensor S

1

. (A) Área que ubre el sensor

S

1

. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . 62

Page 19: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Índice de Figuras xix

3.18 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada

uno de los métodos sobre el sensor S

2

. (A) Área que ubre el sensor

S

2

. (B.1) � = 5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . . 63

3.19 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada

uno de los métodos sobre el sensor S

3

. (A) Área que ubre el sensor

S

3

. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3:5. . . . . . . . . . . . . . 64

3.20 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada

uno de los métodos sobre el sensor S

4

. (A) Área que ubre el sensor

S

4

. (B.1) � = 18. (C.1) � = 1. (C.2) � = 14:5. . . . . . . . . . . . . 65

3.21 Re onstru ión de la imagen sintéti a usando la informa ión aso iada

a los sensores a tivos para la representa ión (A) en el dominio espa ial,

(B) en el dominio fre uen ial, (C) en el dominio de Gabor. . . . . . . 66

3.22 (A) Es ena natural. (B) Sensores a tivos dete tados para la es ena

natural. (C) Re onstru ión de la imágen original usando el método

basado en la representa ión en el dominio de Gabor. . . . . . . . . . 67

3.23 Es ena natural �ltrada para los sensores (A) S

2

, (B) S

3

, (C) S

4

, (D)

S

15

y (E) S

19

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.24 (A) Imagen �ltrada on el sensor S

15

usando la es ala dete tada por el

método basado en la representa ión fre uen ial. (B) Imagen �ltrada

on el sensor S

15

usando la es ala dete tada por el método basado en

la representa ión espa ial. . . . . . . . . . . . . . . . . . . . . . . . . 70

4.1 (A) Imagen biomédi a, (B) Parti ión multi anal, (C) Sensores a tivos,

(D) Re onstru ión usando el método presentado en la se ión 5. . . 78

4.2 Muestra de los ál ulos para los sensores (A) S

1

, (B) S

11

y (C) S

3

.

La primera �la muestra la región del espe tro re ogida por el sensor.

La segunda �la muestra el mapa de energía lo al. En la ter era están

superpuestos los máximos (más os uros) y mínimos (más laros) de

los mapas de energía lo al. La uarta �la muestra las regiones de

in�uen ia W (x; y) de los máximos. En la última �la se puede ver un

histograma que muestra en el eje verti al la fre uen ia de apari ión de

ada una de las es alas lo ales dete tadas (eje horizontal). . . . . . . 80

4.3 (A) Es ena natural. (B) Sele ión de sensores a tivos. . . . . . . . . 81

4.4 (A) Sensor S

1

. (B) Mapa de energía lo al. (C) Máximos del mapa

de energía lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E)

Representa ión 3D de las es alas lo ales. (F) Histograma de es alas

lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Page 20: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

xx Índice de Figuras

4.5 (A) Sensor S

2

. (B) Mapa de energía lo al. (C) Máximos del mapa

de energía lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E)

Representa ión 3D de las es alas lo ales. (F) Histograma de es alas

lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.6 (A) Sensor S

3

. (B) Mapa de energía lo al. (C) Máximos del mapa

de energía lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E)

Representa ión 3D de las es alas lo ales. (F) Histograma de es alas

lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5.1 Esquema general de la medida de distorsión. . . . . . . . . . . . . . . 92

5.2 (A) Imagen sintéti a usada en el experimento de enmas aramiento.

(B) Parti ión multisensor y sensores a tivos dete tados. . . . . . . . 94

5.3 Imágenes obtenidas añadiendo ruido normal uniforme a la imagen de

la �gura 5.2(A). Las desvia iones estandar de ada una de las imágenes

son (A) � = 10. (B) � = 20. (C) � = 30. (D) � = 45. (E) � = 55.

(F) � = 70. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

5.4 Imágenes obtenidas añadiendo ruido normal no uniforme a la imagen

de la �gura 5.2(A). El ruido se ha apli ado sólo sobre algunas zonas

de la imagen (idénti as para todas las imágenes). Las desvia iones

estandar de ada una de las imágenes son (A) � = 15. (B) � = 30.

(C) � = 50. (D) � = 65. (E) � = 95. (F) � = 120. . . . . . . . . . . 97

5.5 Grá� a omparativa de la medida d

1

(eje verti al) frente a RMSE

(eje horizontal). La línea dis ontínua muestra la omparativa para las

imágenes on ruido uniforme y la ontínua para las de ruido no-uniforme. 98

5.6 (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada

12x12. (D) Imagen pixelada 16x16. . . . . . . . . . . . . . . . . . . . 99

5.7 (A) Parti ión multisensor de la imagen original de la �gura 5.6 (Eins-

tein). (B) Sensores a tivos. . . . . . . . . . . . . . . . . . . . . . . . 100

5.8 (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada

12x12. (D) Imagen pixelada 16x16. . . . . . . . . . . . . . . . . . . . 101

5.9 (A) Parti ión multisensor de la imagen original de la �gura 5.8 (es ena

de los bar os). (B) Sensores a tivos. . . . . . . . . . . . . . . . . . . 102

5.10 6 parejas de imágenes usadas en el experimento de dete ión de ob-

jetos. Cada pareja onsta de una es ena natural va ía (dere ha) y la

misma es ena on un objeto en el entro (izquierda). (Continúa en

la figura 5.11). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

5.11 (Continua ión de la figura 5.10). . . . . . . . . . . . . . . . . . 105

Page 21: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Índice de Figuras xxi

5.12 Parti ión del espe tro de la imagen on objeto de la pareja A de la

�gura 5.10 y re onstru ión de la imagen usando la e ua ión 5.12. . . 106

5.13 Ordena iones de mejor a peor visibilidad de las imágenes de la �gura

5.10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

5.14 Muestra de las imágenes de la base de datos del TNO HFRI. (A) n

o

34, (B) n

o

20, (C) n

o

36, (D) n

o

29, (E) n

o

15, (F) n

o

32. . . . . . . . 109

5.15 Rela ión entre la medida omputa ional d1 y la medida psi ofísi a de

distinguibilidad visual. . . . . . . . . . . . . . . . . . . . . . . . . . . 110

5.16 Fun iones de distribu ión teóri as del tiempo de dete ión para las 17

imágenes de la base de datos. Con un ír ulo se indi an los lusters

dete tados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.17 Rela ión entre la medida d

1

y el tiempo medio de búsqueda. La línea

ontínua representa el ajuste por mínimos uadrados. . . . . . . . . . 116

5.18 Muestra de las imágenes usadas en el experimento (1). En la esqui-

na superior izquierda está la imagen original y el resto son imágenes

omprimidas on el algoritmo JPEG a distintos niveles de alidad

(80,40,30,25,20). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

5.19 Muestra de las imágenes usadas en el experimento (2). Imágenes

omprimidas on el algoritmo JPEG a distintos niveles de alidad

(17,14,11,8,5,2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

5.20 Comparativa entre los valores de las medidas de distorsión d1 y RMSE

frente al fa tor de alidad del algoritmo de ompresión JPEG. . . . . 120

5.21 Derivadas de las fun iones de la �gura 5.20. . . . . . . . . . . . . . . 122

5.22 (A) Imagen de una mamografía. (B) Mamografía omprimida on un

fa tor de alidad de 80. (C) Mamografía omprimida on un fa tor de

alidad de 20. (D) Mamografía omprimida on un fa tor de alidad

de 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.23 (A) Parti ión multisensor de la mamografía. (B) Sensores a tivos

dete tados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.24 Primera pareja de imágenes. (A) Imagen original on objeto. (E)

Imagen original sin objeto. (B), (C), (D) Imagen (A) omprimida a

niveles de alidad de 10, 9 y 5 respe tivamente. (F), (G), (H) Imagen

(E) omprimida on fa tores de alidad 10, 9 y 5 respe tivamente. . 125

5.25 Segunda pareja de imágenes. (A) Imagen original on objeto. (E)

Imagen original sin objeto. (B), (C), (D) Imagen (A) omprimida a

niveles de alidad de 10, 9 y 8 respe tivamente. (F), (G), (H) Imagen

(E) omprimida on fa tores de alidad 10, 9 y 8 respe tivamente. . 126

Page 22: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

xxii Índice de Figuras

5.26 Rela ión entre la métri a d1 y el fa tor de alidad (A) para la primera

pareja y (B) para la segunda pareja (B). . . . . . . . . . . . . . . . . 127

5.27 Rela ión entre la métri a d1 y la medida psi ofísi a de dintinguibilidad

para la primera pareja (línea ontínua) y para la segunda pareja (línea

dis ontínua). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

B.1 Obten ión de una gaussiana 3D on orienta ión a partir de dos gaus-

sianas 2D orientadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

B.2 Muestra de fun iones gaussianas on diferentes parámetros. . . . . . 135

Page 23: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Capítulo 1

Introdu ión

1.1 El Sistema Visual Humano

El pro eso que se desen adena desde que una señal luminosa atraviesa la órnea hasta

que se produ e algún tipo de per ep ión en el erebro es muy largo aunque o urre

de forma asi instantánea. Esta señal lumíni a sufre una serie de transforma iones

durante el pro eso que ha en posible que seamos apa es de re ono er objetos.

El sistema visual humano (SVH) es bastante omplejo y aún hoy día no es om-

prendido en su totalidad, aunque se ono en iertos aspe tos. Por ejemplo, algo que

pare e laro, sin entrar en ex esivo detalle, son las etapas que sigue el pro eso de

per ep ión visual:

✮ Forma ión de la imagen en la retina. La luz re�ejada por los objetos del mundo

exterior es proye tada en la retina.

✮ Codi� a ión de la imagen retinal y transmisión al órtex visual.

✮ Representa ión. La imagen odi� ada es pro esada por los distintos grupos de

neuronas que hay en el órtex erebral. En este nivel se realizan algunas tareas

simples omo dete ión, dis rimina ión o re ono imiento de formas simples.

✮ Interpreta ión de la imagen. Esta es sin duda la etapa más ompleja, quizá

por ser la menos ono ida. Esta fase se podría onsiderar omo la auténti a

fase de per ep ión de la imagen retinal ya que es ahora uando el erebro

aso ia propiedades per eptuales a las sensa iones presentes en la imagen ( olor,

movimiento, formas, ...).

La estru tura �siológi a del ojo se puede ver en la �gura 1.1. Una vez que la luz

atraviesa la órnea, el humor a uoso, el ristalino y el humor vítreo, esta es proye tada

1

Page 24: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2 Capítulo 1. Introducción

������������������������������������������������������������������������������������������������������������������������������������

��������������������������������������������������������������������������������������������������������������������������������

������������������������������������������������

������������������������������������������������

������������������������

����

��������������

��������������

������������

������������

��������������������

��������������������

������������������

������������������

������

������

������������

������������

Córnea

Cristalino

Humor acuoso

Nervio óptico

Energía eléctrica

Energía luminosa

Retina

Fóvea

BastonesBipolares

AmacrinasHorizontales

Conos

Ganglionares

Humor vítreo

Figura 1.1: Corte transversal del ojo y organiza ión elular de la retina.

sobre la retina, que no es más que una apa de élulas fotorre eptoras, situada en

la parte posterior del ojo, y que está ompuesta de distintos tipos de neuronas,

ada una de los uales tiene un ometido diferente. Estas élulas onvierten la

informa ión lumíni a en señales elé tri as que pueden ser interpretadas o pro esadas

por el erebro.

Aunque en la retina la luz in ide sobre las élulas ganglionares, ama rinas, bi-

polares, horizontales y onos y bastones, por ese orden, el lugar donde empieza a

ser transformada es en estos últimos, las llamadas élulas fotorre eptoras. Esto es

posible debido a que las que están por delante de ellas son transparentes y, por tan-

to, dejan pasar la luz. Los bastones son las élulas que se en argan de la visión en

ondi iones pobres de ilumina ión y son muy numerosos (sobre 100 millones). Están

presentes en toda la retina ex epto en la fóvea y en el llamado punto iego que es la

zona desde donde parte el nervio ópti o ha ia el interior del erebro y en el que no

hay ningún tipo de élula fotorre eptora. Los onos son bastante menos numerosos

(unos 5 millones) y están on entrados en la fóvea, dejando el resto de la retina

bastante despoblada. Estos son los en argados de la visión en buenas ondi iones de

ilumina ión. La fóvea es el punto entral donde se proye tan las imágenes. En este

punto es donde se tiene una mayor agudeza visual debido a la presen ia masiva de

onos.

En de�nitiva, la tarea de las élulas fotorre eptoras onsiste en onvertir los

Page 25: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

1.1. El Sistema Visual Humano 3

Nervio óptico

LGN

Córtex visual

Retina

Figura 1.2: Se ión transversal del erebro que muestra el amino que sigue la informa ión

visual.

estímulos luminosos que impa tan en la retina en señales elé tri as que serán trans-

portadas ha ia otras zonas del erebro mediante las élulas ganglionares que son las

en argadas de dirigir estos impulsos nerviosos ha ia el nervio ópti o. Estos impulsos

sufren iertas transforma iones a su paso por las élulas ama rinas, horizontales y

bipolares [42℄[107℄.

Tras salir del ojo, estos impulsos pasan por diferentes estru turas erebrales, omo

el LGN, antes de llegar a la zona del erebro donde es pro esada la informa ión visual

(�gura 1.2). La zona donde llegan estas señales, situada en la parte posterior del

erebro, se denomina órtex estriado. Más on retamente, el lugar donde se pro esan

los estímulos visuales es la denominada área V1. En esta región hay esen ialmente

tres tipos de élulas distintas: las simples, las omplejas y las hiper omplejas. Cada

una de ellas se espe ializa en dete tar un determinado tipo de estímulos. Hubel y

Wiesel fueron los primeros que investigaron las fun iones de ada una de estas élulas

[49℄[51℄.

Por ejemplo, las élulas simples forman agrupa iones que son apa es de anali-

zar estímulos uyo espe tro onsiste en un rango on reto de fre uen ias espa iales

mientras que las omplejas e hiper omplejas dete tan determinados tipos de movi-

mientos en la señal que se presenta omo estímulo. Cuando de imos que una élula

dete ta un estímulo, queremos de ir que hay un ambio en la a tividad de di ha

neurona (positivo o negativo) uando se le presenta di ho estímulo. Por supuesto,

Page 26: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

4 Capítulo 1. Introducción

la a tiva ión o no de una neurona dependerá de la posi ión espa ial del estímulo.

Se denomina ampo re eptivo visual de una neurona al área retinal en la que la luz

in�uye en la respuesta de la neurona.

1.2 Objetivos de la memoria

El objetivo de esta Tesis es el desarrollo de un modelo que permita obtener una re-

presenta ión e� iente de imágenes digitales de niveles de gris. Al hablar de e� ien ia,

no se ha e referen ia tanto a la omplejidad en espa io o tiempo que pueda requerir,

omo al aprove hamiento posterior que se pueda derivar de di ha representa ión. En

este sentido, puesto que en el ampo de la visión arti� ial, el objetivo �nal siempre

es la identi� a ión de formas y su lasi� a ión ( on mayor o menor nivel de abstra -

ión), partimos de la idea de que una representa ión óptima es aquella que ha e un

observador humano uando registra una imagen a través del SVH. Watson [120℄ pro-

pone un modelo de representa ión y evalúa su bondad en base a dos ara terísti as:

la su� ien ia y la ne esariedad. De�ende que una odi� a ión ha de ser su� iente,

en el sentido de que sea apaz de retener toda la informa ión que es apaz de per ibir

un ser humano, y ne esaria porque sólo retiene esa informa ión.

Pero tan importante omo la simula ión de di ho omportamiento inteligente son

los datos de los que se parte. Tanto el SVH omo las té ni as de visión arti� ial,

tienen omo datos de partida la proye ión de la luz en la retina. La retina, omo

se ha di ho antes, es un mosai o bidimensional de fotorre eptores que registran esa

luz y la transmiten ha ia el erebro. La pregunta que se plantea es la siguiente

¾donde empieza el denominado omportamiento inteligente durante el pro eso de

re ono imiento de formas? La razón de esta pregunta es la siguiente: si sabemos

donde omienza di ho omportamiento, podríamos separar la parte del SVH que se

limita a representar la informa ión lumíni a, de la parte que es apaz de interpretar

esa representa ión. Posiblemente, este omportamiento omenzará a estar presente

desde el momento de in idir la luz en la retina, ya que esa energía lumíni a va a

ir sufriendo una serie de transforma iones, durante su amino ha ia el erebro, de

forma que uando llegue al órtex visual ya habrá determinado iertas ara terísti as

del estímulo visual que tengan algún tipo de interpreta ión más o menos dire ta por

parte de las zonas del erebro en argadas del pro eso de per ep ión propiamente

di ho. Pero el verdadero omportamiento inteligente omenzará, sin duda alguna,

uando el estímulo esté representado en el órtex visual. Esta separa ión de fun iones

en el SVH puede mar ar la diferen ia entre un sistema de visión arti� ial inteligente

y un sistema de visión ad-ho . Normalmente, en los sistemas ad-ho tradi ionales,

Page 27: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

1.3. Descripción por capítulos 5

Seccion 2.2

Seccion 2.3

PSfrag repla ements

Parti ión

Multisensor

Se ión 2.2

Modelo

Modelo

de

de

Representa ión

Cap. 2

Dete ion

Es alas

Cap. 3

Modeliza ión

de los

Campos Re eptivos

Se ión 2.3

Dete ión de Es alas Lo ales

Cap. 4

Medida de Distorsión Per eptual

Cap. 5

Apli a iones

Figura 1.3: Esquema de desarrollo de la Tesis.

se parte de una representa ión similar a la que hay en la retina, donde tenemos

una matriz bidimensional de intensidades lumíni as, y se realiza el pro eso que se

podría llamar inteligente a partir de di ha representa ión. Di hos sistemas tienen

apli a iones muy espe í� as y limitadas, en parte porque a túan de forma distinta

a omo lo ha e el SVH, ya que éste no apli a la inteligen ia dire tamente sobre

la representa ión retinal. El SVH apli a la inteligen ia sobre la representa ión que

tiene en el órtex de la imagen retinal, donde, en lugar de intensidades lumíni as

tenemos la des rip ión del estímulo en base a un onjunto de des riptores que agrupan

determinado tipo de ara terísti as.

Por tanto, si lo que pretendemos ha er es una tarea que implique similaridad on

el omportamiento humano, pare e lógi o partir de una representa ión similar a la

que usa el SVH para re ono er formas. En esta Tesis se propone una representa ión

para imágenes de niveles de gris que ha e uso de algunas de las ara terísti as del SVH

y que tiene omo objetivo fundamental fa ilitar tareas posteriores de pro esamiento

de di ha imagen.

1.3 Des rip ión por apítulos

El desarrollo de esta memoria se puede ver en el esquema de la �gura 1.3. Esen ial-

mente hay dos partes diferen iadas en la Tesis:

✮ Parte I. En este bloque se desarrolla el modelo de representa ión de imágenes

digitales que se propone. Para ese modelo se usan distintas propiedades del

SVH. En on reto se hará uso de la sele tividad frente a fre uen ial espa ial

Page 28: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

6 Capítulo 1. Introducción

y orienta ión de las élulas simples del órtex visual. Este he ho ha e ne e-

saria la parti ión del espa io fre uen ial y la sele ión de aquellos anales que

produz an una repuesta fuerte frente a un determinado estímulo visual; esto

se detalla en la se ión 2.2. Por otra parte, además de la parti ión en anales,

se ne esitará un modelo para los ampos re eptivos (C.R.) de di has élulas;

esto se expli a en la se ión 2.3. Para llevar a abo di ha modeliza ión se ha e

uso de una herramienta de sele ión de es alas globales que se expli a en el

apítulo 3.

✮ Parte II. En esta segunda parte se proponen dos apli a iones del modelo de

representa ión. La primera de ellas ha e uso de él para determinar las es alas

lo ales naturales presentes en imágenes digitales de niveles de gris (Capítulo 4).

La segunda apli a ión usa el modelo para la implementa ión de una medida

de distorsión per eptual entre imágenes (Capítulo 5).

Tras el desarrollo del modelo y sus apli a iones, se ha e una pequeña exposi ión de

líneas futuras a seguir en la investiga ión y se añaden 2 apéndi es on informa ión

adi ional sobre la nota ión usada en la Tesis (apéndi e A) y sobre la genera ión de

fun iones gaussianas y de Gabor (apéndi e B).

Para errar la Tesis se in luye la bibliografía y el índi e de referen ias.

Page 29: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Capítulo 2

Modelo de representa ión de

imágenes propuesto

2.1 Introdu ión

Es ono ido que en las fases ini iales del pro eso de per ep ión visual, el ser huma-

no des ompone la informa ión que re ibe en anales separados de fre uen ias para

analizar por separado ada uno de ellos (Campbell y Robson [14℄, Movshon [86℄, De

Valois et al. [22℄). Este he ho se ha omprobado usando diversos tipos de té ni as:

psi ofísi as (Campbell y Robson [14℄), neuro�siológi as (Campbell et al. [12℄, Blake-

more et al. [10℄), et . Bási amente, todos los investigadores siguen una misma línea

de trabajo para demostrarlo. Sus resultados se basan en experimentos en los que,

tras presentar un estímulo de luz on unas ara terísti as on retas a un sujeto, se

mide la respuesta que produ en las élulas simples del órtex frente a di ho estímulo.

Esa respuesta se medirá de forma distinta según sea el método elegido. Se ha po-

dido omprobar que hay grupos de élulas que se espe ializan en analizar estímulos

on retos. Hay élulas que sólo se a tivan uando el estímulo se mueve o uando el

estímulo está formado por un determinado onjunto de fre uen ias espa iales. La

mayor parte de los experimentos se han llevado a abo on gatos o monos debido

a que tienen iertas similaridades on el SVH (Poggio [93℄, Marg et al. [74℄, Field

[32℄). Ini ialmente fueron Hubel y Wiesel [50℄ quienes des ubrieron en 1962 la sele -

tividad frente a orienta ión de las élulas simples de la región V1 del órtex visual.

Posteriormente fueron Campbell y Robson [14℄ los que postularon que existían ana-

les independientes que operaban de forma lineal y eran sele tivos frente a un rango

limitado de fre uen ias. Finalmente Bla kemore y Campbell [10℄ demostraron que

esos anales eran sele tivos también frente a orienta ión. Los resultados de diferentes

7

Page 30: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

8 Capítulo 2. Modelo de representación de imágenes propuesto

tipos de experimentos llegan a la misma on lusión: la del pro esamiento en anales

independientes; en todos ellos subya e la idea de que en etapas tempranas del pro-

eso de visión se realiza algún tipo de análisis de Fourier (Kabrisky [57℄, Ginsburg

[41℄, Ma�ei et al. [69℄, Pollen et al. [95℄).

Del trabajo de Campbell y Robson [14℄ se dedu ía que el ontraste de uno de los

anales espa io-fre uen iales debía superar un ierto umbral para que el observador

fuese apaz de dete tar esas fre uen ias. La existen ia de este pro eso de sele ión

espa io-fre uen ial fué estable ida por Enroth-Cugell y Robson [28℄. Posteriormente,

fué de nuevo Campbell [13℄ quien veri� ó la sele tividad de fre uen ias del sistema

visual del mono. Los experimentos de adapta ión on gratings realizados por otros

investigadores pusieron de mani�esto la existen ia de anales sele tivos en el SVH

humano similares a los que poseían los animales de los experimentos (Pantle et al.

[90℄, Blakemore et al. [10℄, Tynan et al. [115℄). Fueron Sa hs, Na hmias y Robson

[101℄ y Graham y Na hmias [44℄ quienes, mediante un estudio estadísti o, des artaron

los modelos mono anal en favor de modelos multi anal. Georgeson y Sullivan [40℄

des artaron el enfoque mono anal de Hay y Chesters [47℄ argumentando la gran

limita ión que tiene este tipo de enfoque on la presen ia de ruido.

Uno de los problemas prin ipales on el que nos en ontramos siempre que usamos

un enfoque multi anal a la hora de analizar una imagen, es sele ionar el onjunto

ade uado de anales, es de ir, hay que de idir sobre el número de anales, la fre-

uen ia espa ial entral de ada anal, su orienta ión y su an ho de banda. Hasta

ahora ha habido varias aproxima iones para en ontrar una solu ión razonable a este

problema omo por ejemplo el muestreo del espa io de fre uen ias a intervalos �jos

o el uso de un número �jo de anales prede�nidos sobre el espe tro de fre uen ias

(éste se ono e omo roseta). Dentro de esta parti ión �ja también hay varia ión en

uanto al número de anales y su posi ión en el espe tro. En la �gura 2.1 se pueden

ver distintos modelos propuestos por Watson [120℄ [119℄, Daugman [21℄, Ebrahimi

y Kunt [24℄ y Navarro [88℄. Aquí se puede ver que hay autores que muestrean más

determinados grupos de fre uen ias en detrimento de otros. Por ejemplo, Ebrahimi

y Kunt, usan más anales en las dire iones horizontal y verti al basándose en el

he ho de que el SVH es más sensible a estru turas que tienen esas orienta iones.

Este he ho es debido a la mayor presen ia de neuronas sensibles a di has orienta io-

nes (Mans�eld [71℄, Mans�eld et al. [72℄). Si observamos el espe tro fre uen ial de

es enas naturales, podremos observar una on entra ión mayor de energía en esas

dos orienta iones, este fenómeno es debido al efe to de la gravedad sobre los objetos

del mundo real.

Watson [119℄ propone en 1987 una parti ión on 4 orienta iones y 4 bandas de

Page 31: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.1. Introducción 9

PSfrag repla ements

(A) (B) (C) (D)

Figura 2.1: Diferentes rosetas propuestas por varios autores. (A) Daugman. (B) Ebrahimi

y Kunt. (C) Watson. (D) Navarro.

fre uen ias además de dos �ltros residuales, uno paso alto y otro paso bajo (transfor-

mada del órtex). Para modelizar ada anal usa un �ltro paso banda que onstruye

en el dominio fre uen ial y que se pare e a una fun ión Gabor aunque no es exa ta-

mente igual. En un trabajo posterior [120℄ evalúa la apli a ión de ese modelo a la

ompresión de imágenes obteniendo buenos resultados.

Sin embargo, el uso de este tipo de parti iones tiene varios in onvenientes:

✮ Puede haber mu hos anales. Esto puede impli ar un serio in onveniente es-

pe ialmente si lo que ha emos es un muestreo fre uen ial a intervalos �jos y la

imagen es grande.

✮ Es ine� iente. Al haber mu hos anales las ne esidades omputa ionales au-

mentan mu ho.

✮ No todos los anales tienen informa ión útil. Habrá anales que tengan sólo

ruido o estru turas no esen iales.

✮ Es posible que los anales sele ionados no hagan una parti ión ade uada.

Se puede dar el aso de la existen ia de estru turas que tengan omponentes

fre uen iales que se separen en varios de estos anales; si apli amos uno de

estos modelos puede que no onsigamos analizar di has estru turas omo una

úni a forma, sino que anali emos sus partes por separado, siendo por tanto más

ompleja la tarea posterior de determinar la presen ia de di has estru turas.

En esta Tesis se propone un modelo que solventa los in onvenientes men ionados

anteriormente, al menos en parte. Teniendo en uenta que no todas las imágenes

tienen el mismo ontenido informa ional, es obvio que tampo o tendrán los mismos

requisitos omputa ionales de ara a su pro esamiento. Sería lógi o pensar, por

tanto, en un modelo de parti ión que fuese dependiente de la imagen, es de ir, dada

Page 32: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

10 Capítulo 2. Modelo de representación de imágenes propuesto

una imagen ha er un estudio sobre los posibles anales que ontienen estru turas

más o menos independientes. Posteriormente se podría determinar uales de esos

anales tienen estru turas que son de interés para el pro esamiento posterior que se

vaya a realizar.

El modelo de parti ión propuesto en esta Tesis onsta de dos etapas:

✮ Primera. Parti ión del espe tro fre uen ial en bandas de fre uen ias que

ontengan informa ión homogénea en base a algún riterio objetivo (sensores).

Este paso se detalla en la se ión 2.2. El objetivo de esta fase es obtener una

des omposi ión adaptativa del espe tro que permita llevar a abo la seguda

etapa.

✮ Segunda. Sele ión de aquellos anales que ontengan informa ión su� iente

para realizar la tarea visual que estemos llevando a abo (sensores a tivos).

Este paso se detalla en la se ión 2.2.1.

En este sentido, pare e razonable que si nuestra inten ión es simular de alguna forma

el omportamiento del SVH, para pro esar la informa ión lumíni a de forma análoga

a omo lo ha e un ser humano, tengamos que des omponer la informa ión de entrada

en base a algún riterio objetivo que sea lo más pare ido posible al que usa el SVH.

El problema que se plantea es elegir ese riterio de parti ión de la informa ión que

re ibe el sistema visual. En este trabajo sólo se tendrán en uenta parte de las

ara terísti as de las élulas simples del órtex y del SVH para �ltrar la informa ión

que llega. En on reto se usará la sele tividad frente a orienta ión y fre uen ia

espa ial y la apa idad de enfoque de estru turas.

El riterio que nosotros vamos a tomar es ampliamente a eptado por la omu-

nidad ientí� a aunque se introdu irán varia iones que lo ha en novedoso. Vamos

a onsiderar que las élulas simples se espe ializan en el análisis de bandas de fre-

uen ias espa iales. Por tanto, dado un estímulo luminoso, lo que haremos será

des omponer su espe tro de fre uen ias en bandas, ada una de las uales será anali-

zada por un grupo distinto de élulas. Aquí apare e la no ión de sensor : de�niremos

un sensor omo ada una de las bandas de fre uen ias en las que hemos parti ionado

el espe tro.

Una vez he ha esa parti ión, es de ir, una vez que hemos determinado qué bandas

del espe tro van a ser pro esadas por ada grupo de élulas, habremos de de idir omo

van a ser pro esadas di has bandas. Para ha er esto nos basaremos en experimentos

ya desarrollados por varios autores en los que se estudia omo responden las élulas

frente a estímulos luminosos. Aquí apare e el on epto de ampo re eptivo (C.R.) de

Page 33: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.2. Partición del espectro de frecuencias 11

PSfrag repla ements

(A) (B)

Figura 2.2: Per�l 3D de una fun ión de Gabor on simetría par. (A) en el dominio espa ial

y (B) en el dominio fre uen ial.

las élulas, que no es más que la región del ampo visual dentro de la ual la luz puede

ausar algún ambio en la respuesta de la élula; por tanto, un grupo de élulas dado

responderá sólo ante aquellas fre uen ias que estén próximas al entro de su C.R.. Se

ha podido omprobar que esos ampos re eptivos tienen aproximadamente el per�l

de una fun ión de Gabor (Figura 2.2). Si observamos el espe tro de Fourier de una

fun ión de Gabor (Figura 2.2.(B)) podemos apre iar que no es más que un �ltro paso

banda sele tivo frente a orienta ión y fre uen ia radial. Por otra parte si miramos

el per�l espa ial de este tipo de fun iones (Figura 2.2.(A)) se pueden apre iar zonas

ex itatorias (la respuesta frente a un estímulo es positiva) y zonas inhibitorias (la

respuesta ante un estímulo es negativa), esto impli a que uando una élula se a tiva

inhibe a las élulas próximas a ella, este efe to es ono ido omo inhibi ión lateral .

A ontinua ión se pro ederá, en una segunda etapa, a espe i� ar uales de es-

tas bandas serán su� ientes de ara a representar la informa ión visual de manera

robusta, es de ir, resistente frente a ruido o detalles inne esarios.

2.2 Parti ión del espe tro de fre uen ias

En esta se ión se desarrollará el método que nos va a permitir parti ionar el espe tro

de fre uen ias de una imagen para su posterior pro esamiento. Puesto que partimos

de las élulas simples del órtex omo unidades bási as para el pro esamiento que

vamos a realizar, habrá que tener en uenta algunas de sus propiedades a la hora

de de idir que áreas del espe tro van a ser analizadas por ada una de ellas. Una

de estas propiedades es la sele tividad frente a orienta ión, es de ir, determinadas

Page 34: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

12 Capítulo 2. Modelo de representación de imágenes propuesto

élulas se espe ializarán en el análisis de estímulos que tengan una determinada

orienta ión espa ial. En este sentido Thomas et al. [111℄ omprobaron en 1978 que

el an ho de banda medio que son apa es de pro esar estas élulas estaba entre 10

Æ

y 20

Æ

. Estudios posteriores (1982) de De Valois et al. [23℄ on luyen que el an ho

de banda medio que son apa es de pro esar estas élulas es de alrededor de 40

Æ

.

En ese estudio se llega a esta on lusión aunque hay que tener en uenta algunos

mati es omo que la distribu ión de an hos de banda obtenida para 387 élulas era

muy variada. En sus estudios se on luyó que la mediana de esa distribu ión era

un buen estimador del an ho de banda medio de las élulas simples del órtex (la

mediana era de aproximadamente 40

Æ

).

También hay trabajos donde se habla del an ho de banda medio que han de tener

di hos anales. De Valois et al. [22℄ y Webster et al. [122℄ on luyen que el rango

medio de fre uen ias ubiertas en un anal es de aproximadamente 1.4 o tavas.

Sea f(x; y) la imagen de referen ia on un tamaño de NxN pixeles y sea F

(u; v)

la transformada de Fourier dis reta de f(x; y) suavizada a es ala �, es de ir:

F

(u; v) = FFT (f (x; y) gs (x; y; �)) (2.1)

donde es el operador de onvolu ión, FFT () es el operador Transformada de

Fourier Dire ta (ver apéndi e A) y donde gs(x; y; �) es un nú leo de onvolu ión

gaussiano simétri o de es ala � de�nido omo:

gs (x; y; �) =

1

2��

2

exp

x

2

+ y

2

2�

2

!

(2.2)

Para ver más detalles sobre los parámetros que pueden de�nir una fun ión gaus-

siana onsultar la se ión B.1.

Puesto que f(x; y) es una fun ión real, su transformada de Fourier es simétri-

a (por la propiedad de simetría onjugada) y por tanto de aquí en adelante sólo

trabajaremos on la mitad superior del espe tro de fre uen ias. También usaremos

nota ión polar en lugar de nota ión artesiana, es de ir, dadas las oordenadas ar-

tesianas (u; v) trabajaremos on las oordenadas polares (�; �) donde � =

p

u

2

+ v

2

es el radio y � = ar tan

v

u

es el ángulo.

Una forma ini ial de plantear la sele tividad frente a orienta ión es onsiderar una

serie de orienta iones �jas on el an ho de banda medio propuesto por De Valois y

otros autores, es de ir, vamos a onsiderar 4 bandas de orienta ión de 45

Æ

. Por tanto,

el primer paso del modelo onsistirá en dividir el plano fre uen ial en uatro bandas

de orienta ión B

i

(i = 0; 1; 2; 3) on un ángulo medio de �

i

= i � 45 + 22:5 grados

Page 35: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.2. Partición del espectro de frecuencias 13

PSfrag repla ements

f(x; y) F

�=1

(u; v)

B

0

B

1

B

2

B

3

(0; 0)

Figura 2.3: Parti ión del espe tro en bandas de orienta ión. Izquierda: Imagen de referen-

ia. Dere ha: espe tro de la imagen suavizada a es ala 1 y la parti ión en uatro

bandas de orienta ión.

(i = 0; 1; 2; 3) y on un an ho de banda de 45

Æ

(Figura 2.3). Cada una de estas bandas

será parti ionada en anales de fre uen ias espa iales de forma que en ada uno de

ellos aislaremos datos espe trales que umplan un ierto riterio de homogeneidad.

Este riterio ha de impli ar que los omponentes espa io-fre uen iales de un sensor

tienen similar importan ia en uanto a la aporta ión que ha en en la imagen. Una

onse uen ia inmediata de esto es la separa ión de anales que ontienen ruido de

otros anales, on un nivel de a tividad mayor, que ontienen diferentes tipos de

estru turas. Esto se hará ha iendo uso del índi e de antialiasing �

B

i

(�

sup

), de�nido

sobre ada una de las bandas B

i

, y que representa la antidad relativa de informa ión

espe tral que hay en la banda B

i

onsiderando el rango de fre uen ias [0; �

sup

):

B

i

(�

sup

) =

R R

B

sup

i

jF

�=1

(�; �)j d�d�

R R

B

i

jF

�=1

(�; �)j d�d�

(2.3)

donde el numerador es la suma de los omponentes fre uen iales para la banda

de orienta ión B

i

en el rango de fre uen ias [0; �

sup

) de la imagen de referen ia

suavizada a es ala � = 1 y el denominador es la suma de todos los omponentes

espe trales de la banda B

i

para la imagen de referen ia suavizada a es ala � = 1.

El suavizado de la imagen se ha e para eliminar las fre uen ias muy altas debidas al

ruido de uantiza ión o digitaliza ión de la imagen.

En otras palabras, el índi e de antialiasing representa la antidad de informa ión

que hay por debajo de una fre uen ia dada (esto para ada una de las bandas B

i

).

Page 36: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

14 Capítulo 2. Modelo de representación de imágenes propuesto

Una vez que tenemos los uatro índi es (uno para ada banda), haremos uso de

ellos para parti ionar ada una de las bandas en anales de fre uen ias de a uerdo a

un riterio de homogeneidad. En nuestro aso, lo que haremos será bus ar aquellos

rangos de fre uen ias en los que se produz a una varia ión signi� ativa en la velo idad

de re imiento de la fun ión de antialiasing. Esta fun ión es monótona re iente

(�gura 2.4) y en ella se va a umulando progresivamente la energía ontenida de la

banda B

i

; por tanto, un in remento en la velo idad de re imiento de la misma, nos

está indi ando que en la imagen hay estru turas uya energía está on entrada en

B

i

a partir del punto donde se in rementa la velo idad. Por otra parte uando la

velo idad de re imiento de re e hasta al anzar un valor mínimo tendremos el aso

ontrario, es de ir, tendremos el límite superior del rango de fre uen ias de mayor

ontribu ión, en B

i

, para alguna de las estru turas presentes en la imagen.

Para determinar la velo idad de re imiento de �

B

i

(�

sup

) al ularemos su segun-

da derivada y sobre ella bus aremos los extremos (máximos y mínimos) lo ales que

representarán la máxima y mínima velo idad de re imiento de di ha fun ión. Sean

i;0

, �

i;1

, ..., �

i;n

i

los extremos lo ales en ontrados (donde n

i

+1 es el número total de

extremos en ontrados). Esta se uen ia de extremos lo ales nos está dando la parti-

ión espe tral bus ada, es de ir, ahora tenemos la banda B

i

partida en n

i

anales de

fre uen ias [�

j

; �

j+1

) on j = 0; :::; n

i

�1, ada uno de los uales ontiene un rango de

fre uen ias espa iales de importan ia relativa semejante dentro de B

i

. En la �gura

2.4 se puede observar la fun ión de antialiasing �

B

i

(�

sup

) al ulada sobre la banda

B

0

de la imagen de la �gura 2.3 (izquierda) y su segunda derivada on los extremos

lo ales mar ados. Para el ál ulo de la segunda derivada se debe apli ar un método

que sea robusto frente al ruido (Mokhtarian et al. [84℄, Jain et al. [53℄). Esto es

debido a que el espe tro de fre uen ias de una imagen tiene una gran antidad de

pi os ( asi de pixel a pixel) que no son signi� ativos y que si no son eliminados de

alguna forma lo úni o que ha en es rear multitud de anales que no aislan ninguna

informa ión de utilidad. La esen ia del método es la determina ión de grupos de

fre uen ias que umplan una determinada ondi ión, aunque haya alguna fre uen ia

intermedia aislada que no la umpla estri tamente. Para el desarrollo de este trabajo

se ha elegido el operador LoG (Lapla iana de Gaussiana) sele ionando el parámetro

de es ala de la gaussiana � = 2. En el aso de la �gura 2.4 se ha usado un � mayor

para apre iar mejor los extremos de la segunda derivada.

A ada uno de los anales que obtenemos lo llamaremos de ahora en adelante

sensor y por tanto a la parti ión obtenida la llamaremos parti ión multisensor . En

la �gura 2.5 se puede ver un esquema ompleto del pro eso de ál ulo de la parti ión

multisensor. Partimos de la imagen ini ial, f(x; y), y del espe tro de fre uen ias de

Page 37: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.2. Partición del espectro de frecuencias 15

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 20 40 60 80 100 120-0.002

-0.0015

-0.001

-0.0005

0

0.0005

0 20 40 60 80 100 120

PSfrag repla ements

(A) (B)

Figura 2.4: (A) Índi e de antialiasing obtenido sobre la banda B

0

de la imagen de la �gura

2.3. (B) Los anales para esta banda serían ada uno de los intervalos entre

máximos y mínimos alternativos de la segunda derivada.

la imagen onvolu ionada on un nú leo gaussiano de es ala � = 1, F

�=1

(u; v). Pos-

teriormente, pro esaremos por separado ada una de las uatro bandas, B

0

, B

1

, B

2

y

B

3

obteniendo para ada una de ellas el índi e de antialiasing �

B

i

(�

sup

) y los orres-

pondientes extremos lo ales de su segunda derivada. Estos extremos determinarán

la parti ión del espe tro que estamos bus ando.

Dado un sensor S, llamaremos S

rmin

a la fre uen ia radial mínima que de�ne

el sensor, S

rmax

a la fre uen ia radial máxima que de�ne el sensor, S

amin

al ángulo

mínimo que de�ne el sensor y S

amax

al ángulo máximo que de�ne el sensor. De estos

parámetros podemos obtener el ángulo medio del sensor �

S

y la fre uen ia radial

media �

S

omo:

S

=

S

amin

+S

amax

2

y �

S

=

S

rmin

+S

rmax

2

En la siguiente se ión se puede ver omo la parti ión multisensor obtenida se

puede apli ar para evitar los problemas que plantean las parti iones �jas dis utidas.

2.2.1 Sele ión de sensores a tivos

Una vez que tenemos la parti ión multisensor analizaremos la importan ia de la

informa ión ontenida en ada sensor. El objetivo de esta fase es sele ionar el

sub onjunto de sensores que, dentro de la parti ión, aislan informa ión espe tral o-

rrespondiente a estru turas signi� ativas presentes en la imagen de entrada f(x; y).

Los sensores de este sub onjunto serán los llamados sensores a tivos. Esto tiene dos

ventajas importantes, por una parte redu imos el osto omputa ional del pro eso

al des artar el análisis de gran parte de la informa ión y por otra evitamos analizar

sensores que ontengan ruido y detalles po o relevantes. Esta sele ión de sensores

Page 38: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

16 Capítulo 2. Modelo de representación de imágenes propuesto

PSfrag repla ements

f(x; y)

F

�=1

(u; v)F

�=1

(u; v)F

�=1

(u; v)F

�=1

(u; v)

F

�=1

(u; v)

F

�=1

(u; v)

B

0

B

1

B

2

B

3

B

0

(�

sup

) �

B

1

(�

sup

) �

B

2

(�

sup

) �

B

3

(�

sup

)

00

B

0

(�

sup

) �

00

B

1

(�

sup

) �

00

B

2

(�

sup

) �

00

B

3

(�

sup

)

Parti ión B

0

Parti ión B

1

Parti ión B

2

Parti ión B

3

Parti ión multisensor

Figura 2.5: Ejemplo del ál ulo de la parti ión multisensor sobre una imagen digital.

Page 39: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.2. Partición del espectro de frecuencias 17

está inspirada en la do trina de Barlow [7℄ [8℄. El segundo de sus dogmas di e: �El

sistema sensorial está organizado para de�nir omo ompleta una representa ión del

estímulo sensorial on el menor número posible de neuronas a tivas�. Barlow se basa,

además de en eviden ias �siológi as, en la teoría de la informa ión de Shannon [105℄

[106℄ de la que se desprende que es posible disminuir el número de unidades a tivas

sin pérdida de informa ión. Por otra parte es ono ida la alta redundan ia de la

informa ión visual por lo que pare e lógi o ha er una sele ión de la informa ión

que vamos a pro esar. No es tarea fá il obtener un modelo de representa ión que

sea ompleto en el sentido de Barlow, por tanto, estas ideas sólo nos van a servir

de punto de partida para proponer un modelo de parti ión que intenta a er arse a

esa ompletitud. Esta parti ión estará ompuesta por aquellos sensores que onten-

gan su� iente informa ión omo para des ribir las estru tras signi� ativas presentes

en la imagen. De esta forma, des artaremos aquellos otros sensores que ontienen

informa ión redundante de ara a un pro esamiento posterior de la imagen.

El problema se entra enton es en determinar uantos y uales de los sensores

serán su� ientes para des ribir el ontenido informativo de la imagen sin perder las

estru turas signi� ativas y on la menor redundan ia posible.

Para determinar la importan ia relativa de ada sensor ara terizaremos a ada

uno de ellos on una medida que nos indique la antidad de informa ión relativa que

ontiene:

W

S

k

=

R R

S

k

jF

�=1

(�; �)j

2

d�d�

R R

jF

�=1

(�; �)j

2

d�d�

(2.4)

donde jF

�=1

(�; �)j es la poten ia del espe tro de la imagen f(x; y) suavizada a

es ala � = 1 en la posi ión (�; �), la doble integral

R R

S

k

representa la sumatoria sobre

el se tor espe tral orrespondiente al sensor S

k

y la integral

R R

es la sumatoria sobre

el espe tro ompleto.

Otras alternativas a esta pondera ión se pueden ver en (Rao [97℄, D'Astous [18℄,

Jernigan et al. [55℄) donde apare en otras formas de utilizar determinadas propieda-

des estadísti as de ada sensor omo lo aliza ión, tamaño, entropía, et .

Una vez tenemos ara terizados ada uno de los sensores apli aremos un método

de lustering ( lasi� a ión no supervisada) para agrupar los sensores en dos atego-

rías: a tivos y no-a tivos. Por a tivos vamos a denominar a aquellos on mayor nivel

de respuesta y por no-a tivos a aquellos que tienen menor nivel de respuesta aunque

no sea totalmente nulo.

El método de lustering apli ado es el ono ido omo k-medias (Jain et al. [54℄).

Este método onsiste en ir agrupando su esivamente los elementos de que disponemos

Page 40: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

18 Capítulo 2. Modelo de representación de imágenes propuesto

en lases de forma que la distan ia entre ada elemento y la lase a la que pertene e

es la menor posible. Para ini ializar el algoritmo se eligen tantos elementos omo

lusters deseemos obtener y asignamos uno a ada luster. Posteriormente, vamos

tomando el resto de elementos y los vamos in luyendo en el luster más er ano. Una

vez que están todos los elementos asignados hemos de ir uno por uno y ver si existe

algún otro luster que esté más er a que el luster al que fué asignado ini ialmente.

Este pro eso se repite hasta que no se produ en ambios.

Este algoritmo tiene varios grados de libertad en uanto a la sele ión de muestras

ini iales (semillas), la de�ni ión del entro de un luster o la de�ni ión de la distan ia

entre un elemento y un luster. Las semillas son los elementos ini iales que se asignan

a ada luster y se puede optar por varias alternativas de sele ión; por ejemplo, se

pueden tomar elementos de forma aleatoria o se pueden ordenar todos los elementos

y sele ionar varios de ellos de forma que estén equiespa iados en la ordena ión que

han tomado. En nuestro aso, el número de lases es 2 y se ha optado por la segunda

forma de elegir las semillas.

El entro de un luster se ha de�nido omo la media de los elementos que per-

tene en a di ho luster y la distan ia entre un elemento y un luster se ha de�nido

omo la distan ia eu lídea entre el elemento y el entro del luster.

Por otra parte el algoritmo también permite variar el método de itera ión. Una

posibilidad onsiste en al ular el entro de un luster uando hayamos a abado

de omprobar que todos los elementos están en el luster más próximo; después de

reasignar todos los elementos y al ular el entro del luster repetiremos el pro eso

hasta que no haya ambios. La segunda op ión onsiste en re al ular el entro de

los lusters ada vez que un elemento es ambiado de un luster a otro. En nuestro

aso se ha optado por la segunda op ión.

El algoritmo se puede esquematizar de la siguiente forma: Dados un onjunto

de N sensores = fW

S

k

; 1 � k � Ng y los pesos de ada uno de ellos W

S

k

, la

ini ializa ión del algoritmo sería la siguiente:

C

1

- fmax ()g

C

2

- fmin ()g

- � C

1

� C

2

C

entro

1

= max (C

1

)

C

entro

2

= min (C

2

)

8W

S

2

- � fW

S

g

Si (jC

entro

1

�W

S

j < jC

entro

2

�W

S

j)

C

1

- C

1

[ fW

S

g

Si-No

Page 41: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.2. Partición del espectro de frecuencias 19

C

2

- C

2

[ fW

S

g

Fin-Si

Fin-8

C

entro

1

-

P

W2C

1

W

Card[C

1

C

entro

2

-

P

W2C

2

W

Card[C

2

Ahora omenzaría el pro eso iterativo que va reasignando los elementos al luster

más er ano hasta que estén todos bien situados:

Repetir

ambio - falso

8W

S

2 (C

1

[ C

2

)

salto luster - falso

Si [(W

S

2 C

1

) ^ (jC

entro

2

�W

S

j < jC

entro

1

�W

S

j)℄

C

1

- C

1

� fW

S

g

C

2

- C

2

+ fW

S

g

salto luster - verdad

Si-No Si [(W

S

2 C

2

) ^ (jC

entro

1

�W

S

j < jC

entro

2

�W

S

j)℄

C

1

- C

1

+ fW

S

g

C

2

- C

2

� fW

S

g

salto luster - verdad

Fin-Si

Si (salto luster = verdad)

C

entro

1

-

P

W2C

1

W

Card[C

1

C

entro

2

-

P

W2C

2

W

Card[C

2

ambio - verdad

Fin-Si

Fin-8

Mientras ( ambio = verdad)

donde la fun ión Card [C

i

℄ denota el número de elementos del luster C

i

. Al

�nalizar este algoritmo tendremos los sensores a tivos en el luster C

1

y los no a tivos

en el C

2

.

La onvergen ia de este algoritmo está demostrada por Selim e Ismail [104℄.

En la �gura 2.6 se puede ver la sele ión realizada sobre el onjunto de sensores

obtenidos en la �gura 2.5. En la parte superior está la parti ión multisensor ompleta

( ompuesta por 98 sensores) seguida de una grá� a en la que se muestran los sensores

ordenados por sus pesos W

S

k

de mayor a menor. Con una línea verti al se muestra

la separa ión entre los dos lusters obtenida mediante el algoritmo k-medias. En la

parte inferior se muestran los sensores pertene ientes al luster de a tivos (izquierda)

y al de no-a tivos (dere ha).

Page 42: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

20 Capítulo 2. Modelo de representación de imágenes propuesto

PSfrag repla ements

Parti ión multisensor

W

S

k

Sensores a tivos (14) Sensores No-a tivos (84)

Figura 2.6: Sele ión de sensores a tivos.

Page 43: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.3. Modelización de los campos receptivos 21

2.3 Modeliza ión de los ampos re eptivos

Hasta ahora sólo se ha hablado de parti ionar el espe tro de fre uen ias en anales

pero no se ha di ho nada sobre la forma de pro esar la informa ión de esos anales.

Aquí es ne esario apli ar algún modelo que simule (al menos en parte) el omporta-

miento que el SVH tiene al analizar la informa ión de los anales.

En esta se ión se propondrá un modelo que nos permita modelar el omporta-

miento de las élulas simples del órtex frente a estímulos visuales. Por tanto, lo

que en de�nitiva haremos será modelizar los ampos re eptivos de di has élulas.

Esto onsiste en proponer un modelo de fun ión teóri a que ajuste, on un mínimo

error, los ampos re eptivos medidos de forma experimental por distintos autores.

De forma grá� a, el ampo re eptivo lo podemos representar omo una super� ie

bidimensional (x,y,z ), tal que, en ada posi ión (ejes x e y) situamos el nivel de

a tividad de las élulas frente al estímulo (eje z ).

En la literatura rela ionada on modelos de visión per eptual, se pueden en on-

trar multitud de fun iones teóri as que tienen similitudes on los ampos re eptivos

de las élulas simples. Una ara terísti a que tienen todas estas fun iones es la

presen ia de una región entral en la que se produ e una alta respuesta frente al

estímulo, rodeada de varias regiones de in�uen ia negativa. Estas regiones negati-

vas no indi an que la respuesta de las élulas sea negativa, sino que la respuesta de

di has élulas se ve inhibida por la a tiva ión de otras élulas (las entrales). Ini ial-

mente Hubel y Wiesel [50℄ pensaban que sólo había dos o tres regiones inhibitorias

o ex itatorias pero después se ha omprobado que hay más. Gran parte de estas

fun iones están derivadas de la familia de las gaussianas (Koenderink et al. [61℄),

omo por ejemplo diferen ias de gaussianas (Young [126℄, Stork et al. [109℄, Klein et

al. [59℄). Watson [119℄ propuso un esquema en el que usaba unos �ltros similares a

fun iones de Gabor; este esquema sirvió para obtener un modelo, al que denominó

transformada del órtex , que permitía tener una representa ión multies ala de una

imagen asumiendo una separa ión en anales fre uen iales del estímulo visual.

De Valois et al. [23℄, proponen tres alternativas para modelar di hos ampos

(�gura 2.7):

✮ Suma de 2 gaussianas de polaridad invertida on el mismo entro geométri-

o, de forma que tengamos una región ex itatoria en el entro y dos regiones

inhibitorias a los lados.

✮ Suma de 3 gaussianas de forma que la de mayor desvia ión estándar representa

la región ex itatoria entral, y las otras, de polaridad negativa, simulan el

Page 44: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

22 Capítulo 2. Modelo de representación de imágenes propuesto

PSfrag repla ements

(A) (B) (C)

Figura 2.7: Modelos de ampo re eptivo propuestos por De Valois et al.. (A) Suma de 2

gaussianas. (B) Suma de 3 gaussianas. (C) Modelo de entro on entrado.

omportamiento de las regiones inhibitorias de los �an os.

✮ El ter er modelo (al que llama de entro on entrado), asume que la respuesta

positiva frente a un estímulo se da sólo en un punto del entro del ampo

re eptivo, formando las regiones inhibitorias la mayor parte del ampo re eptivo

alrededor de di ho punto.

Hay una gran variedad de modelos basados en fun iones de tipo gaussiano (Haw-

ken et al. [46℄, Parker et al. [91℄, Malik et al. [70℄). El punto omún de todas estas

fun iones es que siempre tenemos una región ex itatoria entral (de mayor o menor

amplitud) y regiones inhibitorias laterales.

En esta Tesis se hará uso de fun iones de Gabor omplejas para modelizar los

ampos re petivos. Mar elja [73℄ fué el primero que usó la teoría desarrollada por

Gabor [36℄ para modelizar los ampos re eptivos y a él le siguieron mu hos otros omo

Daugman [19℄, Jones y Palmer [56℄ y Ati k y Redli h [5℄ por ejemplo. Además del

pare ido fun ional de este tipo de fun iones on los ampos re eptivos de las élulas

simples del órtex, hay otra razón importante para usarlas en la modeliza ión y es

que onsiguen minimizar el prin ipio de in entidumbre de Heisenberg. Esto, apli ado

al tema que nos on ierne, signi� a que se puede onseguir una máxima lo aliza ión

de las estru turas presentes en la imagen de forma simultánea en el dominio espa ial

y en el dominio fre uen ial. Esto se tradu e en la minimiza ión el produ to de la

varianza del ampo re eptivo en el dominio espa ial por la varianza de di ho ampo

en el dominio fre uen ial (Daugman [20℄).

Estas fun iones se han usado on éxito en diferentes tareas, omo por ejemplo en

la dis rimina ión de texturas (Fogel et al. [34℄, Sutter et al. [110℄).

Hay otro punto importante a tener en uenta en el omportamiento de las élulas

simples y es que, independientemente del modelo de ampo re eptivo que se propon-

ga, estas élulas tienen un omportamiento no lineal (Mar elja [73℄, Andrews et al.

[4℄, Daugman [19℄) frente a los estímulos que las a tivan. Posteriormente, la salida

Page 45: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.3. Modelización de los campos receptivos 23

de di has élulas se ombina de forma lineal para obtener lo que sería la salida de un

anal orti al.

Como se ha di ho antes, dado un determinado estímulo, on una determinada

fre uen ia espa ial y orienta ión, son varias las élulas simples que se a tivan. Este

onjunto de élulas forma lo que se denomina anal orti al. Dado un estímulo, se ha

omprobado que se a tivan dos élulas adya entes para analizarlo. Estas dos élulas

tienen la pe uliaridad de que sus ampos re eptivos tienen un desfase de 90

Æ

(Pollen

et al. [95℄) y podrían ser modelados on dos fun iones de Gabor, una on simetría

par y otra on simetría impar (�gura 2.8 (A) y (B)). Por otra parte, la respuesta

de una élula ha de ser siempre positiva, esto impli a que la informa ión que hay

sobre las regiones inhibitorias del ampo re eptivo no sería analizada, es de ir, las

respuestas negativas son trun adas a ero. Este es uno de los efe tos de no linealidad

que se produ en en estas élulas. En on reto, el trun amiento a ero de las regiones

negativas de los ampos re eptivos se ono e omo efe to de re ti� a ión de media

onda. Foster et al. [35℄ omprobaron que élulas adya entes desfasadas en 180

Æ

eran a tivadas por un estímulo de una misma fre uen ia espa ial y orienta ión. Si

observamos el per�l de una fun ión de Gabor on simetría par (o impar) y apli amos

un desfase de 180

Æ

podremos observar que estamos obteniendo la misma fun ión pero

on polaridad opuesta. En la �gura 2.8 se puede observar omo afe ta este desfase

al per�l de una fun ión de Gabor, en (A) tenemos la fun ión on 0

Æ

de desfase

(simetría par), en (B) podemos verla on un desfase de 90

Æ

(simetría impar), en (C)

podemos observar un desfase de 180

Æ

(simetría par) y en (D) se observa el desfase de

270

Æ

(simetría impar). De todo esto se obtiene que, dado un estímulo, intervienen

uatro élulas para analizarlo: un primer par on un desfase de 90

Æ

(en uadratura

de fase) y un segundo par de polaridad inversa al primero que se en arga de analizar

la informa ión que trun a el primer par debido al efe to de re ti� a ión de media

onda.

En de�nitiva, podemos on luir que uatro ampos re eptivos elementales de

diferente simetría y polaridad analizan un subdominio omún en una determinada

orienta ión y fre uen ia espa ial, o lo que es lo mismo, podemos de ir que pares de

élulas simples en uadratura de fase permiten espe i� ar la informa ión de amplitud

y fase para una fre uen ia espa ial y orienta ión, dada una región del espa io visual

(Pollen et al. [94℄).

Por tanto, dado un anal orti al on una orienta ión �, una fre uen ia entral � y

un an ho de banda �, podemos des ribir su respuesta frente a un estímulo f(x; y), en

base a los per�les de las fun iones de Gabor orrespondientes a ada una de las uatro

élulas que son a tivadas. Vamos a llamar

1

y

2

al primer par de élulas adya entes

Page 46: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

24 Capítulo 2. Modelo de representación de imágenes propuesto

PSfrag repla ements

(A) (B)

(C) (D)

Figura 2.8: Per�les 3D de fun iones Gabor on diferentes simetrías y desfases. (A) Simetría

par. (B) Simetría impar. (C) Simetría par on desfase de 180

Æ

. (D) Simetría

impar on desfase de 180

Æ

.

Page 47: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.3. Modelización de los campos receptivos 25

Célula Campo re eptivo Respuesta

1

g

o

(x; y; �; �; �) p

1

(x; y; �; �; �)

2

g

e

(x; y; �; �; �) p

2

(x; y; �; �; �)

3

�g

o

(x; y; �; �; �) p

3

(x; y; �; �; �)

4

�g

e

(x; y; �; �; �) p

4

(x; y; �; �; �)

Tabla 2.1: Campos re eptivos y respuestas de las élulas de un anal orti al.

(en uadratura de fase) y

3

y

4

al otro par de élulas ( on polaridad invertida).

Los ampos re eptivos de di has élulas y sus orrespondientes respuestas pueden

ser des ritos por tanto mediante las fun iones de la tabla 2.1 donde g

o

(x; y; �; �; �)

y g

e

(x; y; �; �; �) son fun iones de Gabor par e impar respe tivamente y donde los

p

i

(x; y; �; �; �) son las mismas fun iones tras apli arles la re ti� a ión de media onda.

La formula ión de una fun ión de Gabor ompleja es la siguiente:

gb (x; y; �; �; �) =

1

2��

2

exp

x

2

+ y

2

2�

2

!

exp (i (w

x

0

x+ w

y

0

y)) (2.5)

donde w

x

0

y w

y

0

se obtienen de las siguientes expresiones:

w

x

0

w

y

0

= tan �;

q

w

2

x

0

+ w

2

y

0

= � (2.6)

de esta forma, la parte on simetría par de la Gabor es:

g

e

(x; y; �; �; �) =

1

2��

2

exp

x

2

+ y

2

2�

2

!

os (w

x

0

x+ w

y

0

y) (2.7)

y la impar:

g

o

(x; y; �; �; �) =

1

2��

2

exp

x

2

+ y

2

2�

2

!

sin (w

x

0

x+ w

y

0

y) (2.8)

Para ver más detalles sobre los parámetros de fun iones de Gabor se puede on-

sultar el apéndi e B.2.

La re ti� a ión de media onda se puede obtener a partir de la formula ión de los

ampos re eptivos mediante las siguientes e ua iones:

Page 48: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

26 Capítulo 2. Modelo de representación de imágenes propuesto

PSfrag repla ements

g

o

() g

e

() �g

o

() �g

e

()

g

r

1

() g

r

2

() g

r

3

() g

r

4

()

Primer par Segundo par

RMO RMORMORMO

Figura 2.9: Fila superior: per�l 2D de las respuestas orrespondientes a las 4 élulas simples

que forman un anal orti al. Fila inferior: resultado de apli ar la re ti� a ión

de media onda (RMO).

p

1

(x; y; �; �; �) =

1

2

(jg

e

(x; y; �; �; �) f(x; y)j+ g

e

(x; y; �; �; �) f(x; y))

p

2

(x; y; �; �; �) =

1

2

(jg

o

(x; y; �; �; �) f(x; y)j+ g

o

(x; y; �; �; �) f(x; y))

p

3

(x; y; �; �; �) =

1

2

(j�g

e

(x; y; �; �; �) f(x; y)j � g

e

(x; y; �; �; �) f(x; y))

p

4

(x; y; �; �; �) =

1

2

(j�g

o

(x; y; �; �; �) f(x; y)j � g

o

(x; y; �; �; �) f(x; y))

(2.9)

En la �gura 2.9 se pueden apre iar los per�les de los ampos re eptivos de las

élulas modelizados mediante fun iones de Gabor y los mismos per�les tras apli arles

la re ti� a ión de media onda. También se puede apre iar el desfase de 90

Æ

entre

las élulas orrespondientes a ada par y el desfase de 180

Æ

entre los dos pares de

élulas.

Dada la señal de entrada f (x; y) a un anal dado obtendremos una salida p

i

(x; y)para

ada una de las élulas (i = 1; 2; 3; 4)

Una vez que tenemos las respuestas individuales de ada élula, hemos de usar

un modelo que las ombine y produz a una salida para el anal orti al en onjunto.

Andrews et al. [4℄, Movshon et al. [87℄ y Pollen y Ronner [94℄ demostraron que las

élulas simples realizaban, aproximadamente, una sumatoria lineal de sus respuestas.

De a uerdo a este resultado, podemos ha er uso del siguiente modelo para ombinar

las respuestas no-lineales de ada una de las élulas simples: dado un estímulo f(x; y)

y un anal orti al on parámetros �, � y �, la respuesta de di ho anal, p(x; y), la

vamos a des omponer en dos fun iones, una dada por la suma de los �ltros on

Page 49: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.3. Modelización de los campos receptivos 27

simetría par y otra dada por la suma de los �ltros de simetría impar:

p

e

(x; y) = p

1

(x; y; �; �; �) + p

3

(x; y; �; �; �) = f(x; y) g

e

(x; y; �; �; �)

p

o

(x; y) = p

2

(x; y; �; �; �) + p

4

(x; y; �; �; �) = f(x; y) g

o

(x; y; �; �; �)

(2.10)

lo que puede ser expresado de la forma:

p(x; y) = f(x; y) gb(x; y; �; �; �) = p

e

(x; y) + ip

o

(x; y) (2.11)

o lo que es lo mismo, la salida de un anal orti al la podemos obtener tras

onvolu ionar la señal de entrada on un �ltro de Gabor omplejo uyos parámetros

vienen dados por los del anal orti al que estamos onsiderando. Hasta aquí, se ha

dado una justi� a ión matemáti a del modelo partiendo de eviden ias biológi as y

que apoya la hipótesis de la modeliza ión de los ampos re eptivos mediante �ltros

de Gabor omplejos.

El modelo presentado en esta memoria parte de estas eviden ias para modelar los

ampos re eptivos mediante fun iones de Gabor. Llegados a este punto, el problema

que se plantea es la determina ión de los parámetros de tales fun iones . Si hi iésemos

uso de un enfoque multi anal �jo, es de ir, �jando a priori los anales en los que se

va a dividir el espe tro fre uen ial, sería tarea simple determinar los parámetros

de estas fun iones, ya que estos estarán rela ionados, de una forma más o menos

dire ta, on la posi ión y an ho de banda de los anales. Nuestro problema radi a

en que la parti ión no se �ja a priori y es, por tanto, dependiente de la imagen en

uestión. Esto signi� a que, puesto que los parámetros de las fun iones Gabor están

rela ionadas on los parámetros que de�nen ada anal, no podremos determinarlos

antes de haber realizado di ha parti ión y, por tanto, estos parámetros habrán de ser

también dependientes de la imagen.

En el apéndi e B se pueden ver on ierto detalle los parámetros que podemos

aso iar a una fun ión Gabor. En esta Tesis sólo se va a ha er uso de tres de ellos: la

fre uen ia radial �, la orienta ión � y la es ala espa ial �. Una fun ión de Gabor, se

onstruye modulando una fun ión gaussiana mediante una fun ión de tipo sinusoidal

(seno o oseno). En este trabajo asumiremos que la fun ión gaussiana es isotrópi a

y, por tanto, oin idirán las sigmas (�) espa iales en el eje de la x y en el eje de la y

de la misma, de forma que uando hablemos de es ala (sigma), asumiremos de forma

implí ita que ambas es alas tienen la misma magnitud (�

x

= �

y

= �). Por otra

parte, al ser la fun ión gaussiana isotrópi a, no tiene mu ho sentido ha er uso del

ángulo que forma esa gaussiana on respe to al eje horizontal y por tanto podemos

Page 50: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

28 Capítulo 2. Modelo de representación de imágenes propuesto

suponer que ese ángulo vale siempre ero.

La idea, por tanto, es ha er uso de una fun ión Gabor, gb(x; y; �; �; �), para

analizar la informa ión ontenida en un determinado anal S de parámetros �

S

y

S

. Para que la fun ión se entre en el análisis de esa informa ión, es obvio que su

entro, en el dominio fre uen ial, dado por � y � ( oordenadas polares) habrá de

estar situado en la misma posi ión que el entro del sensor �

S

y �

S

. En la �gura

2.2(B) se puede ver que una fun ión de Gabor, en esen ia, no es más que un �ltro

paso banda sensible a orienta ión. El úni o parámetro que queda por determinar es

la es ala espa ial del �ltro, es de ir, la amplitud del �ltro. Para determinarla se hará

uso de té ni as de autoenfoque que se detallan en el apítulo 3.

2.4 Resumen del modelo de representa ión propuesto

Para �nalizar el apítulo, se muestran, de forma resumida, las hipótesis de partida

y el modelo de representa ión desarrollado.

Partimos de algunas de las propiedades del SVH que se han ido en ontrando a

lo largo de los últimos años. Las más importantes son las siguientes:

✮ La sele tividad frente a orienta ión y fre uen ia espa ial de las élulas simples

del área V1 del órtex visual. Esto inspira la etapa de la parti ión multi anal

del espe tro de fre uen ias.

✮ Las eviden ias de que hay élulas que tienen una respuesta más pronun iada

que otras frente a un estímulo visual. De aquí se deriva la sele ión de sensores

a tivos.

✮ La similitud de los ampos re eptivos de di has élulas, medidos de forma

experimental, on las fun iones teóri as de Gabor. Además, a esto se une

la minimiza ión del prin ipio de in ertidumbre en espa io y fre uen ia omo

onse uen ia del uso de �ltros de Gabor omplejos.

El modelo propuesto se puede esquematizar mediante las siguientes etapas:

✮ Parti ión del espe tro de fre uen ias y sele ión de sensores a tivos:

✬ Obten ión de la parti ión multisensor:

✫ Cál ulo de los índi es de antialiasing �

B

i

(�) on i = 0; 1; 2; 3.

✫ Lo aliza ión de los extremos lo ales de las derivadas segundas de los

índi es �

B

i

(�).

Page 51: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

2.4. Resumen del modelo de representación propuesto 29

En esta etapa se dete tan zonas del espe tro donde se en uentran estru -

turas poten iales de interés. Al �nalizar este paso tenemos un onjunto

de N sensores fS

i

; 0 � i < Ng que de�nen la parti ión realizada.

✬ Sele ión de sensores a tivos:

✫ Cál ulo del peso relativo,W

S

i

, de los sensores a tivos on i = 0; :::; N�

1 para evaluar la importan ia relativa de ada sensor S

i

.

✫ Clasi� a ion de los sensores en dos grupos, a tivos y no-a tivos, me-

diante el algoritmo K-medias apli ado sobre los pesos W

S

i

.

Al �nalizar esta etapa tendremos el sub onjunto de sensores on mayor

a tividad: el grupo de sensores a tivos.

✮ Modeliza ión de los ampos re eptivos de los sensores a tivos:

✬ Cada ampo re eptivo será modelado mediante una fun ión de Gabor

ompleja de parámetros � (fre uen ia radial media), � (orienta ión media)

y � (es ala espa ial). La fre uen ia y orienta ión medias estarán de�nidas

por el propio sensor.

✬ Para determinar la es ala se hará uso de la té ni a de autoenfoque en el

dominio de Gabor presentada en el apítulo 3.

En los apítulos 4 y 5 se podrá veri� ar su validez tras su apli a ión a dos tareas

on retas: la dete ión de es alas naturales lo ales y el ál ulo de una medida de

distorsión per eptual.

Page 52: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

30 Capítulo 2. Modelo de representación de imágenes propuesto

Page 53: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Capítulo 3

Dete ión de es alas globales

Uno de los prin ipales objetivos de las etapas ini iales de la visión espa ial es a-

ra terizar los ambios de luminan ia que se produ en en la retina de forma que en

los pro esos posteriores se pueda determinar informa ión sobre las ara terísti as

de la es ena que se está visualizando. Para ada ambio de luminan ia, se debería

medir, al menos, la lo aliza ión del ambio, su extensión espa ial y la amplitud de

la dispersión de luminosidad.

El SVH es apaz de enfo ar en el rango orre to de es alas y por tanto puede

lo alizar objetos en una imagen aumentando o disminuyendo el nivel de emborrona-

miento para analizar on más o menos detalle la estru tura de los objetos (Hay et al.

[48℄). Por tanto, para desarrollar un sistema de pro esamiento automáti o de imá-

genes que simule este omportamiento será importante analizar la dependen ia de la

estru tura de una imagen respe to de la resolu ión o es ala de di ha imagen. Pare e

un he ho laro que en el pro eso de per ep ión visual se analizan las imágenes a

distintos niveles de resolu ión simultáneamente (Koenderink [60℄). El problema que

se plantea en este apítulo es la extra ión automáti a de las es alas signi� ativas de

las estru turas de niveles de gris presentes en la imagen, todo ello sin ono imiento

a priori sobre que tipo de estru turas hay o sobre su lo aliza ión. Como demuestra

Gar ía et al. [37℄, el ono imiento de la es ala aso iada a las diferentes estru turas

presentes en la imagen fa ilita el pro esamiento posterior.

Para dete tar las diferentes es alas a las que o urren estru turas de interés en la

imagen varios autores propusieron y desarrollaron el análisis multies ala (Rosenfeld

et al. [99℄, Witkin [124℄, Koenderink [60℄, Babaud et al. [6℄, Yuille et al. [127℄,

Lindeberg [67℄). Apli ando operadores de diferente tamaño a la imagen, el análisis

multies ala re oge la informa ión en un rango dado de es alas. En imágenes natura-

les, no todas las es alas intermedias dentro de un rango son realmente signi� ativas;

31

Page 54: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

32 Capítulo 3. Detección de escalas globales

tan sólo algunas se orresponden on estru turas de interés (Marr [76℄). Por ejemplo,

a un nivel alto de resolu ión, un árbol está ompuesto de hojas on una ompleja

estru tura de venas que las re orren. En el siguiente nivel, ada hoja es una úni a

región y en el siguiente nivel vemos la opa del árbol omo un úni o objeto. Hay un

rango natural de resolu iones que se orresponden on ada uno de esos niveles de

des rip ión. Esto nos lleva a que una misma estru tura se puede interpretar omo

objetos diferentes, dependiendo del nivel de resolu ión elegido para representarla. En

esta se ión nos referiremos al on epto de es ala omo a aquellos niveles naturales de

des rip ión en los uales, un sub onjunto (generalmente distinto) de partes de la es-

ena visual, son interpretados omo objetos re ono ibles por un observador. El he ho

de que se determine una es ala omo signi� ativa no impli a la existen ia explí ita

de un objeto en la imagen sino que puede impli ar la existen ia de una estru tura

que se rea omo onse uen ia de la unión de otras estru turas más pequeñas.

Las té ni as multies ala habituales tienen el gran problema de que la integra ión

de la informa ión resultante del pro esamiento a diferentes es alas no se ha e en base

a ningún ono imiento on reto sobre los niveles de resolu ión a los que se mani�estan

las estru turas en la imagen (Lu et al. [68℄). Puesto que estos métodos representan

ara terísti as en todas las es alas (dis retas) dentro de un rango, habrá una gran

redundan ia entre las imágenes de es alas onse utivas ya que la varia ión entre ellas

es pequeña. Esto ondu e a un pro esamiento ine� iente en etapas posteriores.

En este apítulo se proponen diversas alternativas para la sele ión de es alas

signi� ativas, aunque, en esen ia, todas ellas están basadas en el análisis de la nitidez

de las estru turas presentes en la imagen �ltrada a distintas es alas.

Teniendo en uenta las ara terísti as del SVH en uanto al análisis en paralelo de

diferentes anales espa io-fre uen iales (ver se ión 2.2) (Jones et al. [56℄, Daugman

[21℄, Watt [121℄) se propone un esquema en el que, tras ha er una des omposi ión

del espe tro en anales separados de fre uen ias, se bus arán las es alas signi� ativas

para ada uno de esos anales. Esas es alas, por tanto, harán apare er las estru turas

que se per iben en la imagen y que tengan presentes los omponentes fre uen iales

que hay en ada uno de los anales sele ionados. Las estru turas que somos apa es

de identi� ar no tienen porqué existir en la imagen, por ejemplo, la opa del árbol

no es algo que exista por si mismo en el ejemplo anterior, sino que es una nueva

estru tura que se rea omo onse uen ia de unir las hojas entre si.

El uso de un enfoque multi anal, nos ha permitido identi� ar objetos signi� ati-

vos y segregarlos sin un ono imiento a priori sobre ellos. En esta etapa se trata de

ha er un aprendizaje sobre uál es la es ala ideal para ada uno de esos objetos. El

he ho de separar en anales independientes ada objeto es muy importante ya que

Page 55: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 33

de esta forma podemos al ular la es ala sin que unos objetos inter�eran on otros.

3.1 Dete ión de es alas signi� ativas

Una vez que se ha realizado la parti ión del espe tro, tal omo se expli ó en la

se ión 2.2 vamos a pro eder a sele ionar las es alas signi� ativas para ada uno

de los sensores a tivos de la parti ión. En esta se ión se estudiará la sele ión de

es alas signi� ativas ha iendo uso de un esquema de autoenfoque multi anal. En este

aso las té ni as de autoenfoque están basadas en una representa ión de la imagen

dada en el dominio de Gabor.

Las ventajas que tiene este método son que, por una parte, se aprove ha la

formula ión de las fun iones de Gabor para sele ionar aquellas fre uen ias que están

in luidas en ada uno de los sensores evitando así ha er uso de �ltros paso-banda

ideales on los problemas que estos onllevan (efe to de anillado) y, por otra parte,

se ha e uso de una propiedad de las fun iones de Gabor omplejas, y es que permiten

una óptima lo aliza ión simultánea en el dominio espa ial y en el fre uen ial.

3.1.1 Fun iones de enfoque

Para omprender mejor omo se van a apli ar las fun iones de enfoque para la de-

te ión de es alas puede ser útil omentar brevemente el papel que juegan estas

fun iones en mi ros opía. Se puede ver (Groen et al. [45℄) para más detalles sobre

este tipo de fun iones.

El autoenfoque es esen ial en sistemas de mi ros opía automáti os donde se pre-

sentan un gran número de muestras que ne esitan ser digitalizadas y analizadas.

Cuando tenemos muestras multi- apa (en una misma es ena apare en objetos a dis-

tintas profundidades) no es posible tener una imagen en la que estén bien enfo adas

todas las estru turas simultáneamente. Debido a la limita ión de la profundidad

de ampo, si una de las apas está bien enfo ada, el resto estarán desenfo adas en

mayor o menor grado y por tanto se verán emborronadas.

Los algoritmos de autoenfoque bus an el máximo de una fun ión de enfoque.

Esta fun ión es una medida de la alidad del enfoque omo fun ión de la posi ión

axial (eje z ) y estará muestreada en un rango dis reto de posi iones a lo largo del eje

z. La fun ión devolverá un valor que indique la nitidez de la imagen para un punto

de enfoque dado. La distan ia al objeto que se orresponde on el máximo valor de

esta fun ión será la elegida para asegurar un mejor enfoque de la imagen.

El objetivo de esta se ión es desarrollar un método e� iente para la represen-

Page 56: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

34 Capítulo 3. Detección de escalas globales

ta ión de formas de nivel de gris que solu ione algunos de los in onvenientes que

presentan los métodos tradi ionales multies ala.

Si retomamos el ejemplo del árbol, podemos obtener una se uen ia de imágenes

emborronadas mediante un �ltro gaussiano tomando un rango de es alas su� iente-

mente amplio. Para es alas grandes, todas las hojas apare erán omo una úni a masa

emborronada formando lo que sería la opa del árbol. Conforme vamos de re iendo

en la es ala irán apare iendo on más nitidez las hojas separadas entre sí y si segui-

mos disminuyendo de es ala podremos llegar al nivel de detalle de las venosidades

en las hojas. Por tanto debería haber un rango natural de es alas determinado por

los distintos niveles signi� ativos de des rip ión. El punto importante es que para

a es alas naturales, las estru turas orrespondientes estarán bien ontrastadas y así

tendrán un ontorno bien de�nido. Por tanto, para resolver nuestro problema hare-

mos uso de una fun ión de enfoque que medirá la laridad on que son distinguidas

las estru turas de la imagen �ltrada mediante un nú leo gaussiano de es ala �. Pues-

to que estamos asumiendo un modelo de separa ión en anales espa io-fre uen iales

independientes, esta fun ión de enfoque habrá que apli arla sobre ada una de las

imagenes obtenidas tras realizar un �ltrado previo que sele ione los omponentes

fre uen iales que pertenez an a ada anal. Conse uentemente, dado un sensor, ten-

dremos que ha er un �ltrado que restrinja los omponentes fre uen iales afe tados

para posteriormente al ular la fun ión de enfoque propuesta sobre la imagen �ltrada

variando la es ala � en un rango dis reto de valores. Un nivel de emborronamiento �

que produz a un máximo lo al de la fun ión de enfoque será una es ala signi� ativa a

la que apare en estru turas signi� ativas on omponentes fre uen iales en el rango

de�nido por el sensor.

En este estudio se han onsiderado 4 posibles fun iones de enfoque debido a su

simpli idad omputa ional y sus buenas propiedades (Yeo et al. [125℄): Tenengrad,

Brenner, Gradiente uadráti o y Varianza. Con las tres primeras fun iones se estu-

dia el gradiente de la imagen partiendo de la base de que uanto mayor sea di ho

gradiente mejor de�nidos estarán los ontornos.

Puesto que una imagen es, en de�nitiva, algo físi amante observable (la luminan-

ia en fun ión de las oordenadas espa iales), es ne esario que expresemos la es ala

en unidades adimensionales, he ho este que se deriva de la ley de invarianza frente a

es ala (ver Flora k et al. [33℄ para más detalles).

Dada una imagen f(x; y) y un sensor S, vamos a de�nir la respuesta de la imagen

frente al sensor S a es ala � omo:

J

S

(x; y; �) = jf(x; y) gb (x; y; �; �

S

; �

S

)j (3.1)

Page 57: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 35

donde �

S

y �

S

son el ángulo medio y la fre uen ia radial media del sensor S

respe tivamente, y la fun ión gb() es un �ltro de Gabor omplejo de�nido en la e ua-

ión 2.5. De esta forma, al onvolu ionar la imagen on el �ltro de Gabor omplejo

entrado en �

S

y �

S

, estamos realizando un �ltrado de aquellas fre uen ias que se

en uentran en el área espe tral o upada por el sensor S. El objetivo es determinar

las es alas naturales óptimas �

1

, �

2

, ..., �

k

para di ho sensor. La opera ión jj obtiene

la envolvente o módulo de la imagen ompleja que se obtiene tras �ltrar on el �ltro

de Gabor y se de�ne omo:

jt(x; y)j =

q

t

2

real

(x; y) + t

2

imag

(x; y) (3.2)

Se parte de la idea de que las estru turas espa iales on omponentes fre uen ia-

les en el sensor S deberían apare er mejor ontrastadas uando �ltramos la imagen

f(x; y) a una es ala signi� ativa que uando lo ha emos a una es ala po o signi� a-

tiva. Para determinar la nitidez de las estru turas presentes en una imagen �ltrada a

es ala � haremos uso de los uatro riterios de enfoque men ionados anteriormente.

✮ Criterio de la Varianza

Es de esperar que las es alas signi� ativas aso iadas a las estru turas presentes en un

anal deberán produ ir un alisamiento de la respuesta on mayor varianza de niveles

de gris que los alisamientos a es alas no signi� ativas. Esto sugiere que una posible

fun ión de enfoque sea la varianza de niveles de gris de la imagen dada por:

C

1

S

(�) =

X

x

X

y

(J

S

(x; y; �) � �

S;�

)

2

(3.3)

donde �

S;�

es la media de niveles de gris de J

S

(x; y; �):

S;�

=

1

N �M

X

x

X

y

J

S

(x; y; �) (3.4)

y donde N y M son los tamaños horizontal y verti al en píxeles de la imagen.

✮ Criterio de Brenner

Con esta fun ión se pretende medir la nitidez de las fronteras de la imagen respuesta.

Una imagen más nítida tendrá unas fronteras mejor de�nidas y, por tanto, si al u-

lamos el gradiente de di ha imagen, tendremos que en los bordes de las estru turas

este tendrá un valor relativamente más elevado. El gradiente es al ulado de una

forma muy simple:

Page 58: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

36 Capítulo 3. Detección de escalas globales

C

2

S

(�) =

X

x

X

y

(J

S

(x+ 2; y; �) � J

S

(x; y; �))

2

(3.5)

✮ Criterio de Tenengrad

De nuevo, este riterio se basa en el ál ulo del gradiente, aunque se ha e uso de un

operador más so�sti ado que tiene en uenta el gradiente verti al y horizontal:

C

3

S

(�) =

X

x

X

y

S

2

h

(x; y; �) + S

2

v

(x; y; �)

(3.6)

donde S

h

y S

v

son las onvolu iones de J

S

on los operadores de Sobel horizontal

y verti al respe tivamente y que se pueden ver en la tabla siguiente:

-1 0 1 1 2 1

-2 0 2 0 0 0

-1 0 1 -1 -2 -1

M

SH

M

SV

es de ir:

S

h

(x; y; �) = J

S

(x; y; �) M

SH

(3.7)

y

S

v

(x; y; �) = J

S

(x; y; �) M

SV

(3.8)

✮ Criterio del Gradiente uadráti o

Esta fun ión parte de la misma idea que los dos métodos anteriores, pero al ula el

gradiente omo diferen ia entre píxeles adya entes horizontales y verti ales:

C

4

S

(�) =

X

x

X

y

(J

S

(x+ 1; y; �) � J

S

(x; y; �))

2

+ (J

S

(x; y + 1; �)� J

S

(x; y; �))

2

(3.9)

Una vez formulados los uatro riterios, el objetivo es en ontrar, para ada uno de

ellos las es alas (�) que los maximizan. La ompara ión entre estas uatro fun iones

se ha he ho teniendo en uenta 3 riterios de evalua ión:

1. La fun ión de enfoque debe de ser omputa ionalmente e� iente.

Page 59: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 37

2. La fun ión de enfoque deberá al anzar máximos en aquellos puntos que se

orrespondan on es alas signi� ativas de estru turas presentes en la imagen y

on ontenido espe tral en el sensor analizado.

3. La fun ión de enfoque ha de ser robusta frente al ruido.

Respe to a la e� ien ia, las uatro fun iones son relativamente sen illas desde el

punto de vista omputa ional y por tanto esta ondi ión se umple sin problema.

El umplimiento del segundo punto se analiza en la se ión 3.1.2 donde se ha e

una dis usión al respe to en base a resultados experimentales.

Para determinar si la fun ión umple o no el ter er objetivo se han realizado una

serie de experimentos que se muestran en la se ión 3.1.3.

En el estudio de éste o de ualquier otro trabajo que entre su aten ión sobre

la sele ión de es alas signi� ativas sin informa ión a priori, hay que tener presente

que estamos ante un problema bastante omplejo y posiblemente intratable desde

un punto de vista puramente matemáti o. Por tanto, las solu iones aquí aportadas

no pretenden ser exa tas ni óptimas, sino sólo una aproxima ión que nos permita

generar unas hipótesis de partida válidas.

3.1.2 Resultados experimentales

Para determinar la validez de las es alas dete tadas por ada uno de los uatro

riterios de enfoque propuestos los apli aremos sobre una imagen sintéti a (se ión

3.1.2.1), y dos imágenes naturales, una biomédi a (se ión 3.1.2.2) y una que ontiene

una galaxia espiral (se ión 3.1.2.3).

3.1.2.1 Imagen sintéti a

En este experimento se pretende ha er un estudio ontrolado sobre la bondad de

las es alas que son apa es de dete tar ada uno de los métodos propuestos. La

imagen en uestión se puede ver en la �gura 3.1. En la misma imagen se pueden

ver, además, los sensores a tivados de la parti ión multisensor. Esta imagen se ha

generado insertando una serie de ír ulos pequeños formando dos grupos de siete.

Cada ír ulo es una pequeña ampana de gauss.

Si ha emos un estudio visual de la imagen podemos distinguir varias estru turas

sin mayor problema. La primera estru tura que somos apa es de separar del resto

son los pequeños ír ulos individuales. Si vemos la parti ión multisensor observamos

que son a tivados uatro sensores, en las uatro orienta iones, de aproximadamante

el mismo rango de fre uen ias espa iales. Cada uno de ellos ontiene la informa ión

Page 60: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

38 Capítulo 3. Detección de escalas globales

PSfrag repla ements

(A) (B)

Figura 3.1: (A) Imagen sintéti a. (B) Sensores a tivos.

Sensor S

rmin

S

rmax

S

amin

S

amax

S

0

8 14 135

Æ

180

Æ

S

1

8 13 0

Æ

45

Æ

S

2

6 13 45

Æ

90

Æ

S

3

7 12 90

Æ

135

Æ

S

4

2 8 0

Æ

45

Æ

Tabla 3.1: Parámetros de los sensores a tivos de la imagen sintéti a.

fre uen ial aso iada a las estru turas del tamaño de las pequeñas bolas. Puesto que

las bolas son isotrópi as son dete tadas en todas las orienta iones. Si seguimos on

nuestro estudio visual, y analizamos la es ena a una es ala superior, podemos ver dos

agrupa iones laras que onstan de siete bolas ada una y si seguimos aumentando

de es ala podemos ver una úni a agrupa ión on una orienta ión de algo más de 90

grados.

Ahora vamos a ver los resultados que propor ionan los métodos bajo estudio. En

la tabla 3.1 se pueden ver los datos numéri os orrespondientes a los sensores a tivos.

En la �gura 3.2 se muestran las fun iones de enfoque para esta imagen y en la

tabla 3.2 se resumen las es alas signi� ativas.

Sensor Varianza Tenengrad Brenner Gradiente C.

S

0

2, 11 2 0.5, 6.5, 14, 24.5 2, 3

S

1

2, 15.5 2 0.5, 6, 20.5, 24.5 2, 3

S

2

2.5 2 0.5, 6, 24.5 2

S

3

2.5, 6 2 0.5, 6, 19.5, 24.5 2

S

4

3.5 2 0.5, 11.5, 24.5 2

Tabla 3.2: Es alas signi� ativas dete tadas por ada uno de los riterios estudiados para los

sensores a tivos de la imagen sintéti a.

Page 61: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 39

0

200

400

600

800

1000

1200

1400

1600

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

8e+07

9e+07

1e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

2000

4000

6000

8000

10000

12000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

500

1000

1500

2000

2500

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

8e+07

9e+07

1e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

5000

10000

15000

20000

25000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

2e+07

4e+07

6e+07

8e+07

1e+08

1.2e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

2000

4000

6000

8000

10000

12000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

2e+07

4e+07

6e+07

8e+07

1e+08

1.2e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

2000

4000

6000

8000

10000

12000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

200

400

600

800

1000

1200

1400

1600

1800

2000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

2e+07

4e+07

6e+07

8e+07

1e+08

1.2e+08

1.4e+08

1.6e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

5000

10000

15000

20000

25000

30000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

PSfrag repla ements

S

0

S

1

S

2

S

3

S

4

Figura 3.2: Fun iones de autoenfoque para los sensores de la imagen sintéti a. En la primera

olumna están las fun iones orrespondientes al riterio de la Varianza, en la

segunda las de Tenengrad, en la ter era las de Brenner y en la uarta las del

Gradiente Cuadráti o.

Page 62: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

40 Capítulo 3. Detección de escalas globales

Para ha er una orre ta interpreta ión de los datos mostrados hay que tener en

uenta los on eptos de es ala interna y es ala externa de una imagen (Koenderink

[60℄). Ambas es alas ha en referen ia, respe tivamente, al tamaño mínimo y máximo

que pueden tener las estru turas presentes en la imagen. La es ala interna vendrá

dada por la resolu ión de la imagen y la externa por el tamaño de la imagen. En

mu hos asos se puede ver que se obtienen es alas signi� ativas muy altas, estas no

deberían ser tenidas en uenta debido a que están por en ima de la es ala externa de

la imagen. De igual forma, en determinados asos se obtienen es alas muy pequeñas

que están por debajo de la es ala interna. En nuestro aso on reto, puesto que

estamos ha iendo un análisis sobre un espe tro de fre uen ias parti ionado, estas

es alas estarán a otadas también por las fre uen ias radiales que de�nen ada sensor,

es de ir, en sensores de fre uen ias muy bajas, la es ala interna aumentará y en

sensores de fre uen ias altas la es ala externa disminuirá.

La evalua ión de las fun iones de enfoque se ha e en un rango dis reto de es alas

(en este aso on reto hasta � = 24:5) y en el aso de que la fun ión sea re iente

al �nal de este rango impli a que se mar ará el punto � = 24:5 omo máximo lo al

aunque el máximo de la fun ión se en uentre más a la dere ha del mismo.

En la �gura 3.3 se pueden ver las respuestas que produ en los sensores a tivos

onsiderando las es alas signi� ativas dete tadas por el riterio de Brenner para la

imagen sintéti a. Las imágenes de esta �gura se obtienen �ltrando la imagen original

on fun iones de Gabor que tienen omo parámetros los de los sensores a tivos junto

on las es alas dete tadas.

Obviamente, tras ver los resultados, el riterio que más es alas dete ta es el de

Brenner; la uestión es determinar la alidad de di has es alas. Como punto de

partida podemos partir del análisis visual previo que hi imos sobre esta imagen.

Este riterio es apaz de dete tar las bolas de forma individual (primera olumna de

la �gura 3.3) y las dos estru turas de orden superior men ionadas ( on los sensores

S

0

y S

1

). Además de estos objetos, también realiza otras uniones de bolas, en grupos

de dos y de tres y en diversas orienta iones que también tienen sentido. Los otros

riterios también dete tan las estru turas bási as (bolas individuales) pero no son

apa es de unir di has estru turas para formar agrupa iones on sentido. El úni o

que dete ta algunas de estas es alas grandes es el de la Varianza.

En la �gura 3.4 tenemos algunas de las estru turas que se dete tan on los otros

tres riterios y no on el riterio de Brenner. Estas es alas dete tan las bolas de forma

individual. La es ala en este aso es algo superior a la dete tada por Brenner para

las bolas individuales pero es orre to en ambos asos ya que lo que pretendemos es

dar una aproxima ión para el ál ulo de di has es alas y, en ualquier aso, el sentido

Page 63: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 41

PSfrag repla ements

S

0

S

1

S

2

S

3

S

4

� = 0:5

� = 0:5

� = 0:5

� = 0:5

� = 0:5 � = 6:5 � = 14

� = 24:5

� = 24:5

� = 24:5

� = 24:5

� = 24:5

� = 6

� = 6

� = 6 � = 20:5

� = 19:5

� = 11:5

Figura 3.3: Es alas dete tadas on el riterio de Brenner.

Page 64: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

42 Capítulo 3. Detección de escalas globales

PSfrag repla ements

S

0

S

1

S

2

S

3

� = 2� = 2 � = 2:5� = 2:5

Figura 3.4: Algunas de las es alas dete tadas on el riterio de la varianza.

PSfrag repla ements

(A) (B)

Figura 3.5: (A) Imagen biomédi a. (B) Sele ión de sensores a tivos.

de las es alas es obtener el parámetro ne esario para la fun ión de Gabor de forma

que se per iban estru turas on sentido en la imagen.

Tras estudiar este aso, pare e laro que los riterios de Tenengrad y del Gradien-

te uadráti o no produ en muy buenos resultados ya que se limitan a dete tar las

estru turas bási as que hay en la imagen sin dete tar agrupa iones de las mismas.

Por ontra, Brenner es apaz de realizar distintas agrupa iones de estru turas indi-

viduales para formar estru turas más omplejas que ninguno de los otros riterios es

apaz de onseguir. El riterio de la Varianza dete ta las estru turas individuales y

algunas de las posibles agrupa iones que se pueden extraer de la imagen.

3.1.2.2 Imagen biomédi a

Este experimento es una répli a del anterior pero realizado sobre una imagen natural.

En la �gura 3.5 tenemos una imagen biomédi a de tamaño 128x128 píxeles junto on

la sele ión de sensores a tivos para la misma. Los datos numéri os que re�ejan

di hos sensores a tivos se pueden ver en la tabla 3.3.

En las �guras 3.6 y 3.7 se pueden ver las fun iones de autoenfoque que se obtienen

Page 65: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 43

Sensor S

rmin

S

rmax

S

amin

S

amax

S

0

2 10 135

Æ

180

Æ

S

1

1 6 0

Æ

45

Æ

S

2

6 13 90

Æ

135

Æ

S

3

2 6 90

Æ

135

Æ

S

4

2 6 45

Æ

90

Æ

S

5

6 10 0

Æ

45

Æ

Tabla 3.3: Parámetros de los sensores a tivos de la imagen biomédi a de la �gura 3.5. Para

ada sensor S (�las) se muestra la fre uen ia radial mínima S

rmin

, la fre uen ia

radial máxima S

rmax

, el ángulo mínimo S

amin

y el ángulo máximo S

amax

. Las

fre uen ias se dan en i los por pixel ( pp) y los ángulos en grados.

Sensor Varianza Tenengrad Brenner Gradiente C.

S

0

3, 23 2.5 3.5, 14.5 2.5

S

1

13, 24 4.5, 13 6.5, 24.5 4.5, 13.5

S

2

2, 6.5, 24.5 2 2, 7.5 1.5

S

3

4 3.5, 9 3, 10, 17.5 3, 9

S

4

4.5 3.5 2.5, 18 3.5

S

5

2.5, 8.5 2.5 2, 8.5, 23.5 2.5, 5

Tabla 3.4: Es alas de la imagen biomédi a obtenidas para ada sensor y on los uatro ri-

terios de enfoque.

para ada uno de los riterios y sensores a tivos. En la tabla 3.4 se pueden ver las

es alas dete tadas para ada sensor y riterio.

Al igual que o urría en el experimento de la se ión anterior, Brenner es el riterio

on mayor riqueza de es alas sele ionadas y Tenengrad y el Gradiente Cuadráti o

los más pobres. La Varianza dete ta orre tamente las estru turas pequeñas pero de-

te ta menos agrupa iones que Brenner. En la �gura 3.8 se pueden ver algunas de las

imágenes �ltradas para los sensores a tivos y ha iendo uso de las es alas dete tadas

por los uatro métodos. Puesto que las élulas de la imagen son aproximadamente

ir ulares y de un tamaño similar y relativamente grande, es lógi o que tengamos

sensores a tivos en las uatro orienta iones y de fre uen ias bajas. Es en estos senso-

res donde se dete ta la presen ia de las élulas omo estru turas independientes on

una es ala � que varía entre 3 y 4. Además de estas estru turas, también se dete tan

estru turas un po o menores que se orresponderían on los omponentes internos

de las élulas. Finalmente, algunas élulas se unen para rear una nueva estru tura

de mayor tamaño.

Page 66: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

44 Capítulo 3. Detección de escalas globales

0

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

8e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

2e+07

4e+07

6e+07

8e+07

1e+08

1.2e+08

1.4e+08

1.6e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

8e+07

9e+07

1e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

8e+07

9e+07

1e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

200

400

600

800

1000

1200

1400

1600

1800

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1000

2000

3000

4000

5000

6000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

100

200

300

400

500

600

700

800

900

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

500

1000

1500

2000

2500

3000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500

1000

1500

2000

2500

3000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200

400

600

800

1000

1200

1400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

PSfrag repla ements

S

0

S

0

S

1

S

1

S

2

S

2

S

3

S

3

S

4

S

4

S

5

S

5

Varianza

Tenengrad

Figura 3.6: Fun iones de autoenfoque de la imagen biomédi a para los riterios de la Va-

rianza y Tenengrad.

Page 67: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 45

0

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

100000

200000

300000

400000

500000

600000

700000

800000

900000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

3.5e+06

4e+06

4.5e+06

5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+06

2e+06

3e+06

4e+06

5e+06

6e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

3.5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

3.5e+06

4e+06

4.5e+06

5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

3.5e+06

4e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

PSfrag repla ements

S

0

S

0

S

1

S

1

S

2

S

2

S

3

S

3

S

4

S

4

S

5

S

5

Brenner

Gradiente uadráti o

Figura 3.7: Fun iones de autoenfoque de la imagen biomédi a para los riterios de Brenner

y Gradiente uadráti o.

Page 68: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

46 Capítulo 3. Detección de escalas globales

PSfrag repla ements

(A) (B) (C)

(D) (E) (F)

(G) (H) (I)

Figura 3.8: Imagen biomédi a �ltrada de a uerdo a distintos sensores a tivos y algunas de

las es alas signi� ativas dete tadas. (A) Sensor S

0

, � = 3. (B) Sensor S

1

,

� = 4:5. (C) Sensor S

1

, � = 13. (D) Sensor S

2

, � = 2. (E) Sensor S

2

,

� = 7:5. (F) Sensor S

3

, � = 3:5. (G) Sensor S

3

, � = 9. (H) Sensor S

4

,

� = 3:5. (I) Sensor S

5

, � = 8:5.

Page 69: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 47

PSfrag repla ements

(A) (B)

Figura 3.9: (A) Imagen astronómi a. (B) Sensores a tivos.

Sensor S

rmin

S

rmax

S

amin

S

amax

S

0

3 9 90

Æ

135

Æ

S

1

1 7 135

Æ

180

Æ

S

2

2 6 0

Æ

45

Æ

S

3

7 13 135

Æ

180

Æ

S

4

6 10 0

Æ

45

Æ

S

5

4 8 45

Æ

90

Æ

S

6

10 15 0

Æ

45

Æ

S

7

15 20 90

Æ

135

Æ

S

8

15 19 45

Æ

90

Æ

S

9

11 15 45

Æ

90

Æ

S

10

8 11 45

Æ

90

Æ

S

11

11 15 90

Æ

135

Æ

Tabla 3.5: Parámetros de los sensores a tivos de la imagen astronómi a.

3.1.2.3 Imagen astronómi a

Este experimento es una répli a del anterior sobre la imagen astronómi a de la �gura

3.9. En di ha �gura se pueden ver también los sensores a tivos dete tados.

En la tabla 3.5 se muestran los datos númeri os que des riben ada sensor a tivo.

Tras apli ar los uatro riterios de enfoque se obtienen las es alas de la tabla 3.6.

En la �gura 3.10 se pueden ver algunas de estas fun iones de enfoque. Aunque no se

muestran todas, las demás son similares en uanto al omportamiento global.

Con esta imagen, los riterios de Tenengrad y el Gradiente uadráti o tienen

problemas para dete tar es alas que no sean la es ala interna de la imagen debido,

posiblemente, a la omplejidad que tienen las estru turas pequeñas que existen en

la imagen. Este problema se ha dado en otras imágenes usadas durante el pro eso

de experimenta ión siendo más agudo on el riterio del Gradiente uadráti o. De

Page 70: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

48 Capítulo 3. Detección de escalas globales

0

500

1000

1500

2000

2500

3000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

3.5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

5500

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

7e+07

8e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

3.5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

200

400

600

800

1000

1200

1400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1e+07

2e+07

3e+07

4e+07

5e+07

6e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

3.5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

50

100

150

200

250

300

350

400

450

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

5e+06

1e+07

1.5e+07

2e+07

2.5e+07

3e+07

3.5e+07

4e+07

4.5e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1e+06

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0

50

100

150

200

250

300

350

400

450

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

5e+06

1e+07

1.5e+07

2e+07

2.5e+07

3e+07

3.5e+07

4e+07

4.5e+07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1e+06

1.5e+06

2e+06

2.5e+06

3e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

PSfrag repla ements

S

0

S

1

S

3

S

7

S

8

Figura 3.10: Fun iones de autoenfoque para los sensores S

0

, S

1

, S

3

, S

7

y S

8

de la imagen

astronómi a. En la primera olumna están las fun iones orrespondientes al

riterio de la Varianza, en la segunda las de Tenengrad, en la ter era las de

Brenner y en la uarta las del Gradiente Cuadráti o.

Page 71: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 49

Sensor Varianza Tenengrad Brenner Gradiente C.

S

0

3.5 2 1, 15 0.5

S

1

4.5 3 1, 5.5, 12.5, 19.5 0.5

S

2

4.5 3.5 1, 11 0.5, 3

S

3

2 1 1, 6, 7.5 0.5

S

4

2.5 1.5 1 0.5

S

5

3.5 2 1 0.5

S

6

1.5 1 1.5, 9, 24.5 0.5

S

7

1, 7.5 1 1, 3, 11, 18 0.5

S

8

1, 21 1 1, 7, 11.5 0.5

S

9

1.5, 17 1 1, 21 0.5

S

10

2 1.5 1, 5.5, 12 0.5

S

11

1.5 1 1, 9.5 0.5

Tabla 3.6: Es alas signi� ativas dete tadas por ada uno de los riterios estudiados para los

sensores a tivos de la imagen astronómi a.

nuevo es Brenner el riterio que más es alas dete ta.

En la �gura 3.11 se pueden ver algunas de las imágenes �ltradas on las es alas

dete tadas.

Como on lusión de los tres experimentos mostrados (que sólo son una muestra

representativa de los que se han realizado), podemos on luir lo siguiente:

✮ Las fun iones de Tenengrad y Gradiente uadráti o no pare en muy estables en

uanto a la antidad y alidad de es alas dete tadas. Generalmente dete tan

menos es alas que los otros dos métodos y en o asiones se limitan a extraer

úni amente la es ala externa.

✮ La fun ión Varianza mantiene onstan ia en uanto a la dete ión de estru tu-

ras bási as en la imagen aunque tiene algunas di� ultades para dete tar objetos

de es alas grandes que impli an la agrupa ión de objetos más pequeños en uno

sólo.

✮ La fun ión de Brenner, además de dete tar las es alas de las estru turas bási as,

tiene la ventaja de dete tar es alas que se orresponden on agrupa iones de

estru turas individuales.

En de�nitiva, las dos fun iones que mejor pare en omportarse en uanto a la alidad

de las es alas obtenidas son Brenner y la Varianza.

Page 72: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

50 Capítulo 3. Detección de escalas globales

PSfrag repla ements

(A) (B) (C)

(D) (E) (F)

(G) (H) (I)

Figura 3.11: Imagen astronómi a �ltrada de a uerdo a distintos sensores a tivos y algunas

de las es alas signi� ativas dete tadas. (A) Sensor S

0

, � = 3:5. (B) Sensor

S

1

, � = 5:5. (C) Sensor S

1

, � = 12:5. (D) Sensor S

3

, � = 2. (E) Sensor S

3

,

� = 6. (F) Sensor S

6

, � = 9. (G) Sensor S

7

, � = 7:5. (H) Sensor S

7

, � = 3.

(I) Sensor S

7

, � = 11.

Page 73: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1. Detección de escalas significativas 51

3.1.3 Robustez frente al ruido

Con los experimentos que se muestran en esta se ión se pretende omprobar la

robustez que tienen los uatro métodos bajo estudio frente a la presen ia de ruido

normal. Para ello se ha añadido ruido blan o normal de media 0 y diferentes desvia-

iones típi as (10, 20, 30, 40 y 50) a dos de las imágenes usadas en el experimento

anterior (biomédi a y sintéti a). Posteriormente se ha al ulado la parti ión multi-

sensor sobre ada una de ellas y se han apli ado los uatro métodos de enfoque sobre

los nuevos sensores a tivos dete tados.

Puesto que estamos realizando de nuevo el ál ulo de las parti iones multisensor

sobre las imágenes ruidosas, es posible que estas parti iones di�eran de las parti iones

que se obtenían sobre las imágenes originales (sin ruido), de he ho, es previsible que

o urra esto. El objeto de este experimento es analizar el omportamiento de los

métodos sobre imágenes ruidosas y, por tanto, nos vamos a entrar sólo en aquellos

sensores a tivos de las nuevas parti iones que oin idan on sensores a tivos que se

dete taron para las imágenes originales.

En la �gura 3.12 podemos ver la imagen biomédi a de la �gura 3.5 tras haberle

añadido diferentes niveles de ruido.

En la �gura 3.13 se puede ver la evolu ión de las es alas sobre los sensores de-

�nidos en la tabla 3.3. El sensor S

0

no es dete tado omo a tivo en las imágenes

ruidosas de desvia ión típi a � = 40 y � = 50; en su lugar, apare en dos nuevos

sensores que tienen, ada uno de ellos, parte de las fre uen ias re ogidas por S

0

.

Algo similar o urre on el sensor S

5

y la imagen ruidosa on � = 20.

En esta tabla tenemos una �la por ada uno de los sensores analizados y una

olumna por ada riterio de enfoque. Para ada riterio de enfoque tenemos seis

sub olumnas, una para ada imagen usada (la primera ha e referen ia a la imagen

original y las in o restantes a ada una de las imágenes ruidosas). Dada una �la

(sensor) y una sub olumna (método de enfoque e imagen usada), podemos ver las

es alas signi� ativas dete tadas.

En la imagen 3.14 se puede ver la imagen sintéti a de la �gura 3.1 distorsionada

on la presen ia de ruido normal.

En la �gura 3.15 apare e la evolu ión de las es alas ante la presen ia de ruido. De

nuevo, sólo se han onsiderado aquellos sensores que fueron dete tados omo a tivos

en la imagen sin ruido.

Ante la presen ia de ruido, es normal que haya varia iones en las es alas signi-

� ativas de la imagen, ya que, si este es su� ientemente alto, los puntos ruidosos

se unirán a las estru turas que hay en la imagen y harán que estas aumenten o

Page 74: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

52 Capítulo 3. Detección de escalas globales

PSfrag repla ements

� = 10 � = 20 � = 30

� = 40 � = 50

Figura 3.12: Imagen biomédi a on diferentes niveles de ruido.

Page 75: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1.D

etecciónde

escalassignificativas

53

Orig OrigOrig

3323 23 22.5 24

33

Orig

2.5 2.5 2.5 2 0.53.514

0.5

144

0.52.5

0.52.5

0.5

1324

14.53.5

153

2412.5 13

2414.523.5 24

1524

14.5 1 0.53.5

15.514.53.51513.5

412.5

4.5 4.513

40.55.5

24.56.5

245.5

0.59.524

110.524

9.5

2.5

13.54.5

0.5

12.54

13.5 14.5

0.50.54

0.54

0.53.515 15.5

26.5

24.5

2.57.5

2

24.5

2 2 2 2 1.5 2 1 0.5 0.5 0.5

4.57.5

0.52.52

7.5

2

8.55.52

75

7.5

1

7.55.52 1.5 1.5

0.5 0.5 0.5 0.5 0.5

4 4 4 4.5 4 410 10

1

10.5

0.5

10.5103

9.53

8.593.5 3.5

0.53

9.517.517.5

103

18.510.52.5

0.53

1117 18.5

11.5

1

1711.52.5

93

0.50.52.5

0.5

13.5

0.53

8.54

10.5 10.5

0.5

11

4.5 4.5 4.5 4.5 4 43.5 3.5 3 3

1 0.52.518

0.53

17.5 192.5

0.53

18

1

16.5 192.5

0.53.5

0.53.5 3

0.5 0.52.5

0.5

2.58.5

2.58.5

2.58.5

2.514

2.58.5

2.5 2.5 1.55.5

15.5

0.5 0.528

23

28.5

23.5

0.52.58.521

1

822

0.52.5

22.59

0.5

6

0.5

6

0.5

5.552.5

Varianza Tenengrad Brenner Gradiente C.

24.5

0.52

PSfragrepla ements

S

0

S

1

S

2

S

3

S

4

S

5

10

10

10

10

20

20

20

20

30

30

30

30

40

40

40

40

50

50

50

50

Figura3.13:Evolu ióndelases alasdelaimagenbiomédi aenpresen iaderuido.

Page 76: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

54 Capítulo 3. Detección de escalas globales

PSfrag repla ements

� = 10 � = 20 � = 30

� = 40 � = 50

Figura 3.14: Imagen sintéti a on diferentes niveles de ruido.

Page 77: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.1.D

etecciónde

escalassignificativas

55

Orig OrigOrig OrigVarianza Tenengrad Brenner Gradiente C.

2211 11 11

2 211

2 21111.5

2 23

1.5 1.53.5

13.5

14

0.5 0.5 1

7.5

0.52

1324.5

5.5

24.524.524.514 14

548 8

5.5

0.5 0.5

24.511.5

5

0.51.53.53

223 3.5

0.5 0.5

4 4

0.5

215.5

215.5 16

2 216

215

216.5

1.5 1.5 1.5 1443.53.5

0.5 0.5258

13

0.5 0.53

24.514

2324.520.5

0.5

24.5 24.5

0.5

5.5

0.5 0.5

31.5

0.51.53.5 3.5 4 4

0.5

2.5 2.5 2 2 2 2.5 2 2 1.5 1.5 1.5 1 0.5 0.51.54.5

0.5

24.5 24.58

67

0.52.56.58

18

0.5

24.56.54.5

0.5

14.59.58

20.50.5 0.5 0.5

1.52

2.5 2.56

26

26

26.5

26.5

2 2 2 1.53.5

1.54

14

0.5 0.52

5.5

0.5 0.5 0.547

12

0.5

24.52424.524.519.5

6 6.511

23

7 7.5 7.56

22

6.5

24.5

58

2 2 0.51.5

0.53.5

0.54

0.54

3.5

6

3.5 3.5 3.5 3.53.5 2 2 1.52 2 1.5 0.5

18

0.5 0.51.5

10.524.524.5

11.524.510

0.5 0.52 7.5

0.54.514

24.524.5

0.51.5

0.5 0.50.5222

PSfragrepla ements

S

0

S

1

S

2

S

3

S

4

10

10

10

10

20

20

20

20

30

30

30

30

40

40

40

40

50

50

50

50

Figura3.15:Evolu ióndelases alasdelaimagensintéti aenpresen iaderuido.

Page 78: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

56 Capítulo 3. Detección de escalas globales

disminuyan su tamaño.

A la vista de estos experimentos, el riterio de Tenengrad y el del Gradiente

uadráti o son los que antes se dejan in�uir por la presen ia de ruido y modi� an

las es alas que se dete taban en las imágenes originales o rean o eliminan alguna

de las mismas. El riterio que pare e mantener una mayor robustez en uanto a la

magnitud de las es alas y repe to al número de es alas que se dete tan es el de la

Varianza. Este riterio mantiene asi siempre la es ala de las estru turas bási as

presentes en la imagen original. El riterio de Brenner sigue siendo bastante ri o

en uanto a la antidad de estru turas que dete ta. Es más sensible al ruido que la

Varianza pero esto tiene sentido ya que al añadir niveles de ruido altos se forman

nuevas estru turas y se modi� an las que ya existían en la imagen.

3.1.4 Comentarios �nales

Las fun iones de Tenengrad y Gradiente uadráti o no se onsideran buenas para la

dete ión de es alas debido a la pobreza de las que dete tan y a la po a estabilidad

ante la presen ia de ruido. La fun ión Varianza es su� ientemente robusta para la

dete ión de es alas bási as en la imagen aun en presen ia de ruido. La fun ión de

Brenner es, sin lugar a dudas, la que dete ta mayor antidad de es alas, espe ialmente

aquellas que surgen omo resultado de agrupar estru turas pequeñas. Por tanto, si

nuestro objetivo es dete tar las es alas bási as de la imagen nos será indiferente usar

la Varianza o Brenner, mientras que si lo que pretendemos es realizar un análisis más

exhaustivo de la es ena, sería de más utilidad el uso del riterio de Brenner.

Las ara terísti as prin ipales del método de extra ión de es alas presentado

son las siguientes:

✮ El método no ne esita �jar ningún parámetro a priori. No se presupone nada

sobre la informa ión ontenida en la imagen que se va a pro esar.

✮ Computa ionalmente, es más e� iente que los métodos multies ala al redu ir

el número de es alas signi� ativas. Mientras que los métodos tradi ionales

pro esan la imagen original �ltrada en un rango dis reto de es alas, on este

método sería posible pro esar la imagen teniendo en uenta sólo aquellas es alas

que sean signi� ativas.

✮ La des omposi ión multi anal de la imagen permite ha er una sele ión indi-

vidualizada de las es alas de los objetos que aislan ada uno de los sensores

a tivos.

Page 79: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.2. Comparación con otros métodos de autoenfoque 57

✮ El método es objetivo, lo ual asegura la repli a ión de experimentos. La

tarea de determina ión de es alas útiles no es fá il para un operador humano;

posiblemente, ante una misma imagen y en diferentes instantes de tiempo,

una persona determinaría es alas diferentes omo es alas signi� ativas de la

imagen.

✮ La des omposi ión multi anal de la imagen permite un pro esamiento paralelo

de todos los anales.

3.2 Compara ión on otros métodos de autoenfoque

Podemos pensar en otras alternativas para la extra ión de es alas globales de una

imagen. La que se muestra en la se ión anterior estaba basada en una represen-

ta ión de la imagen en el dominio de Gabor. Este dominio nos permitía tener una

representa ión que está a aballo entre el dominio espa ial y el dominio fre uen ial

debido a la máxima lo aliza ión simultánea, en ambos dominios, que propor iona

el uso de fun iones de Gabor omplejas. Es posible extraer es alas signi� ativas

ha iendo uso de otras representa iones de la imagen original. En la se ión 3.2.1

se muestra una aproxima ión a este problema basándose en una representa ión en

un dominio puramente espa ial. En la se ión 3.2.2 se muestra otra basada en una

representa ión puramente fre uen ial de la imagen.

3.2.1 Autoenfoque en el dominio espa ial

La diferen ia esen ial de este método respe to al método presentado en la se ión

anterior es que no se usan fun iones de Gabor para �ltrar la informa ión ontenida

en los sensores a tivos de la imagen. En su lugar haremos uso de �ltros paso-banda

ideales. Para realizar el autoenfoque usaremos una fun ión gausiana que emborrone

a distintas es alas las imágenes �ltradas paso-banda.

Vamos a llamar B

S

(u; v) a la más ara que de�ne el �ltro paso-banda ideal res-

pe to a un sensor S:

B

S

(u; v) =

(

1 si (u; v) 2 S

0 si (u; v) =2 S

(3.10)

donde

Page 80: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

58 Capítulo 3. Detección de escalas globales

(u; v) 2 S , S

amin

< ar tan

v

u

� S

amax

y S

rmin

<

p

u

2

+ v

2

� S

rmax

(3.11)

Dada la imagen f(x; y) y su transformada de Fourier F (u; v) de�nimos h

S

(x; y)

omo el resultado de �ltrar paso-banda la imagen original on el �ltro B

S

(u; v), es

de ir:

H

S

(u; v) = F (u; v) � B

S

(u; v) (3.12)

donde * es la multipli a ión punto a punto de ambas señales. h

S

(x; y) se obtendrá

al ulando la transformada inversa de H

S

(u; v):

h

S

(x; y) = FFT

�1

(H

S

(u; v)) (3.13)

denotaremos por J

S

(x; y; �) a la imagen paso-banda obtenida a partir del sensor

S y onvolu ionada on una gaussiana de es ala � (ver e ua ión 2.2):

J

S

(x; y; �) = gs(x; y; �) h

S

(x; y) (3.14)

Dada la imagen original f(x; y) y un sensor S, se trata de obtener una familia

de imágenes J

S

(x; y; �) que se obtienen suavizando la imagen �ltrada paso banda

on una gaussiana variando la es ala � en un rango de valores. Como onse uen ia

de esto, para valores altos de � tendremos que la imagen J

S

(x; y; �) ontendrá es-

tru turas de baja resolu ión (gran longitud espa ial) y para valores de � pequeños

tendremos representadas estru turas on gran nivel de detalle. En otras palabras,

tendremos las estru turas on representa ión en el sensor S visualizadas en un rango

de resolu iones y nuestro objetivo será determinar a que resolu iones se ven mejor

di has estru turas.

De nuevo se ha experimentado on las uatro fun iones de enfoque analizadas

en la se ión 3.1.1. En este aso, los resultados obtenidos mostraban una similitud

aún mayor entre las uatro fun iones tanto en lo referente a la alidad de las es alas

obtenidas omo a la robustez frente al ruido. Este método es mu ho menos sensible a

las pequeñas diferen ias que puedan existir entre diferentes estru turas de la imagen

ya que al ha er el �ltrado paso-banda ideal se anulan por ompleto las fre uen ias

que están fuera del sensor. Además, tenemos omo in onveniente añadido el efe to

de anillado que produ en estos �ltros ideales.

Page 81: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.2. Comparación con otros métodos de autoenfoque 59

3.2.2 Autoenfoque en el dominio fre uen ial

Como segunda alternativa a la sele ión de es alas en el dominio de Gabor podemos

pensar en algún método que dete te di has es alas en el dominio fre uen ial. Este

método de sele ión propone un prin ipio heurísti o basado en un he ho físi amente

observable: la distorsión entre la informa ión espe tral de una imagen suavizada a

es alas su esivas.

Dado un sensor S y una imagen f(x; y) se de�ne un índi e de �ltrado (S; �)

que mide la antidad de distorsión que hay entre la magnitud del espe tro la imagen

de entrada suavizada a dos niveles onse utivos de es ala � y � +��:

(S; �) =

Z Z

S

(jF

(�; �)j � jF

�+��

(�; �)j)

2

d�d� (3.15)

donde F

(�; �) es el espe tro de la imagen f(x; y) suavizada a es ala � (y formu-

lado en oordenadas polares) y la doble integral sobre el sensor S está referida a la

región de fre uen ias que se en uentran dentro del sensor.

Este índi e es útil para medir la diferen ia que existe entre los espe tros de

la imagen original suavizada a es alas onse utivas. Cuando se produ e una gran

diferen ia entre di hos espe tros, para dos es alas onse utivas, podemos on luir

que ha habido un in remento signi� ativo de informa ión. Las es alas signi� ativas

serán aquellas que produz an un máximo lo al en la fun ión (S; �). Para más

detalles ver el trabajo de Gar ía-Silvente et al. [38℄.

3.2.3 Compara ión de resultados

Para omparar los tres métodos expuestos vamos a ha er uso de dos imágenes: una

sintéti a y otra natural. La imagen sintéti a, junto on sus sensores a tivos, se puede

ver en la �gura 3.1. Esta es una imagen de 128x128 píxeles on 256 niveles de gris.

En la tabla 3.1 apare en los datos numéri os que des riben los sensores a tivos de la

�gura 3.1.

Se han extraido las es alas de esta imagen usando los tres métodos. Los resultados

se muestran en la tabla 3.7. Para ha er la ompara ión se ha optado por riterio de

la Varianza omo fun ión de autoenfoque, aunque se podía haber optado por el de

Brenner.

En las �guras 3.16, 3.17, 3.18, 3.19 y 3.20 se puede ver la imagen sintéti a suavi-

zada a las distintas es alas obtenidas por los métodos basados en la representa ión

espa ial y fre uen ial. Para el método basado en la representa ión en el dominio

de Gabor se puede ver la se ión 3.1.2.1. Cada �gura está referida a las es alas

Page 82: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

60 Capítulo 3. Detección de escalas globales

Dominio

Sensor Espa ial Fre uen ial Gabor

S

0

4.5 1, 3 2, 11

S

1

4.5 1, 3 2, 15.5

S

2

5 1, 3 2.5

S

3

4.5 1, 3.5 2.5, 6

S

4

18 1, 14.5 3.5

Tabla 3.7: Es alas signi� ativas de la imagen sintéti a obtenidas por los tres métodos.

obtenidas por los métodos para un mismo sensor.

Para obtener las imágenes suavizadas ha iendo uso de las es alas obtenidas por

los métodos en el dominio espa ial y en el fre uen ial se ha suavizado la imagen

�ltrada paso-banda on una fun ión gaussiana. El �ltro paso-banda es un �ltro ideal

que omprende la región delimitada por el sensor a tivo orrespondiente.

Con este experimento se muestra la posibilidad de extraer es alas espa iales par-

tiendo de la representa ión de la imagen en tres dominios diferentes: espa ial, fre-

uen ial y Gabor.

Si analizamos on más detalle las imágenes que resultan del suavizado a diferentes

es alas on el método espa ial (�guras 3.16, 3.17, 3.18, 3.19 y 3.20) podemos observar

que las bolas que están próximas entre sí se unen para formar estru turas mayores on

orienta ión espe í� a. Por ejemplo, si �jamos nuestra vista sobre la imagen original

y desenfo amos el ojo lo su� iente, apre iaremos omo podemos per ibir que las

bolas que están próximas entre sí apare en omo una úni a estru tura. Este efe to

se ve laramente en la �gura 3.20 (B.1) donde se ven todas las bolas fundidas en una

úni a estru tura on orienta ión de aproximadamente 135

Æ

. Si vemos el experimento

realizado on el método fre uen ial, los resultados son similares aunque pare e que

las imágenes �ltradas son un po o más nítidas.

Pero no abe duda de que el método que mejor dete ta las estru turas presentes

es el que se basa en la representa ión en el dominio de Gabor. Claramente, se pueden

apre iar algunas ventajas de este método:

✮ Las estru turas están mejor lo alizadas en el espa io.

✮ Las estru turas se distinguen más nítidamente, es de ir, las imágenes �ltradas

tienen un mayor pare ido on la imagen original.

✮ Se dete tan estru turas que han pasado desaper ibidas por los otros métodos.

En la �gura 3.21 se pueden ver las re onstru iones de la imagen original partiendo

de ada una de las representa iones. Para las representa iones en el dominio espa ial

Page 83: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.2. Comparación con otros métodos de autoenfoque 61

PSfrag repla ements

D

o

m

i

n

i

o

E

s

p

a

i

a

l

D

o

m

i

n

i

o

F

r

e

u

e

n

i

a

l

Dominio Gabor

(A)

(B.1)

(C.1) (C.2)

Figura 3.16: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de los

métodos sobre el sensor S

0

. (A) Área que ubre el sensor S

0

. (B.1) � = 4:5.

(C.1) � = 1. (C.2) � = 3.

Page 84: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

62 Capítulo 3. Detección de escalas globales

PSfrag repla ements

D

o

m

i

n

i

o

E

s

p

a

i

a

l

D

o

m

i

n

i

o

F

r

e

u

e

n

i

a

l

Dominio Gabor

(A)

(B.1)

(C.1) (C.2)

Figura 3.17: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de los

métodos sobre el sensor S

1

. (A) Área que ubre el sensor S

1

. (B.1) � = 4:5.

(C.1) � = 1. (C.2) � = 3.

Page 85: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.2. Comparación con otros métodos de autoenfoque 63

PSfrag repla ements

D

o

m

i

n

i

o

E

s

p

a

i

a

l

D

o

m

i

n

i

o

F

r

e

u

e

n

i

a

l

Dominio Gabor

(A)

(B.1)

(C.1) (C.2)

Figura 3.18: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de

los métodos sobre el sensor S

2

. (A) Área que ubre el sensor S

2

. (B.1) � = 5.

(C.1) � = 1. (C.2) � = 3.

Page 86: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

64 Capítulo 3. Detección de escalas globales

PSfrag repla ements

D

o

m

i

n

i

o

E

s

p

a

i

a

l

D

o

m

i

n

i

o

F

r

e

u

e

n

i

a

l

Dominio Gabor

(A)

(B.1)

(C.1) (C.2)

Figura 3.19: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de los

métodos sobre el sensor S

3

. (A) Área que ubre el sensor S

3

. (B.1) � = 4:5.

(C.1) � = 1. (C.2) � = 3:5.

Page 87: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.2. Comparación con otros métodos de autoenfoque 65

PSfrag repla ements

D

o

m

i

n

i

o

E

s

p

a

i

a

l

D

o

m

i

n

i

o

F

r

e

u

e

n

i

a

l

Dominio Gabor

(A)

(B.1)

(C.1) (C.2)

Figura 3.20: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de

los métodos sobre el sensor S

4

. (A) Área que ubre el sensor S

4

. (B.1) � = 18.

(C.1) � = 1. (C.2) � = 14:5.

Page 88: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

66 Capítulo 3. Detección de escalas globales

PSfrag repla ements

(A) (B)

(C)

Figura 3.21: Re onstru ión de la imagen sintéti a usando la informa ión aso iada a los

sensores a tivos para la representa ión (A) en el dominio espa ial, (B) en el

dominio fre uen ial, (C) en el dominio de Gabor.

y fre uen ial, el método de re onstru ión ha onsistido en realizar la sumatoria de

todas las imágenes �ltradas paso-banda orrespondientes a ada uno de los sensores

a tivos suavizadas a su es ala signi� ativa. Es de ir, para obtener la re onstru ión

basándose en la representa ión espa ial (�gura 3.21 (A)), se han sumado las imágenes

de las sub�guras (B.1) de las �guras 3.16, 3.17, 3.18, 3.19 y 3.20. De igual forma

se ha obtenido la re onstru ión en base a la representa ión fre uen ial (�gura 3.21

(B)).

Para la re onstru ión basada en la representa ión en el dominio de Gabor se ha

usado un método más elaborado que se detalla en la se ión 5.2; en on reto se ha

usado la e ua ión 5.12.

El mismo experimento ha sido repetido para una imagen natural. En la �gura

3.22 se puede ver una es ena natural digitalizada on un tamaño de 256x256 pixeles

y 256 niveles de gris. En la misma �gura se muestran también los sensores a tivos

dete tados y la re onstru ión de la imagen basándose en la representa ión en el

dominio de Gabor.

Page 89: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.2. Comparación con otros métodos de autoenfoque 67

PSfrag repla ements

(A) (B)

(C)

Figura 3.22: (A) Es ena natural. (B) Sensores a tivos dete tados para la es ena natural.

(C) Re onstru ión de la imágen original usando el método basado en la repre-

senta ión en el dominio de Gabor.

Page 90: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

68 Capítulo 3. Detección de escalas globales

Es alas

Sensor S

rmin

S

rmax

S

amin

S

amax

Espa ial Fre uen ial Gabor

S

1

6 18 45

Æ

90

Æ

12.5 7 4

S

2

1 8 0

Æ

45

Æ

- 26.5 11

S

3

1 6 45

Æ

90

Æ

39.5 15, 44 14, 37

S

4

1 5 135

Æ

180

Æ

36.5 27 24

S

5

18 25 45

Æ

90

Æ

4 3 2, 26

S

6

42 52 135

Æ

180

Æ

1.8 1.5 1, 32

S

7

8 13 0

Æ

45

Æ

9 6.5 4.5

S

8

34 42 135

Æ

180

Æ

2 1.5 1.2, 17

S

9

15 21 90

Æ

135

Æ

5 4 2.5

S

10

12 17 135

Æ

180

Æ

6 5 2.5

S

11

8 12 135

Æ

180

Æ

9.5 7 5, 33

S

12

43 51 45

Æ

90

Æ

1.8 1.5 1

S

13

21 26 90

Æ

135

Æ

3.5 3 2

S

14

28 33 45

Æ

90

Æ

2.5 2 1.6

S

15

4 8 90

Æ

135

Æ

18.5 13.5 8.5

S

16

17 21 135

Æ

180

Æ

4.5 3.5 2.5

S

17

13 17 0

Æ

45

Æ

6 4.5 3

S

18

26 31 90

Æ

135

Æ

3 2.5 1.6

S

19

5 8 135

Æ

180

Æ

15.5 11.5 7.5

S

20

21 26 0

Æ

45

Æ

3.5 3 2

S

21

33 38 45

Æ

90

Æ

2.5 2 1.4

S

22

17 21 0

Æ

45

Æ

4.5 3.5 2.5

Tabla 3.8: Parámetros de los sensores a tivos de la imagen natural. Las tres últimas olum-

nas muestran las es alas obtenidas por ada uno de los métodos.

En la tabla 3.8 se muestran los datos de ada uno de los sensores junto a las

es alas obtenidas para ada uno de los métodos presentados.

En la �gura 3.23 se pueden ver las imágenes �ltradas orrespondientes a los

sensores 2, 3, 4, 15 y 19. Las imágenes (A), (B), (D) y (E) muestran la sele ión

de las �ores de forma aislada. Puesto que las �ores son aproximadamente redondas

y del mismo tamaño, ne esitamos uatro sensores para dete tarlas (uno por ada

orienta ión pre�jada). La imagen (C) muestra las dos �ores formando una úni a

estru tura on una orienta ión de algo más de 45

Æ

.

Las imágenes paso banda obtenidas on las otras dos representa iones son bas-

tante más omplejas de analizar para es enas naturales. Como muestra, en la �gura

3.24 (A) y (B), se pueden ver dos de estas imágenes paso banda.

Page 91: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.2. Comparación con otros métodos de autoenfoque 69

PSfrag repla ements

(A) (B)

(C) (D)

(E)

Figura 3.23: Es ena natural �ltrada para los sensores (A) S

2

, (B) S

3

, (C) S

4

, (D) S

15

y

(E) S

19

.

Page 92: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

70 Capítulo 3. Detección de escalas globales

PSfrag repla ements

(A) (B)

Figura 3.24: (A) Imagen �ltrada on el sensor S

15

usando la es ala dete tada por el método

basado en la representa ión fre uen ial. (B) Imagen �ltrada on el sensor S

15

usando la es ala dete tada por el método basado en la representa ión espa ial.

3.3 Con lusiones

En esta se ión se han visto diversas alternativas para la determina ión de las es alas

signi� ativas globales existentes en una imagen. Tras la evalua ión de los resultados,

el método más satisfa torio ha sido el que se basa en una representa ión espa io-

fre uen ial de la imagen, o lo que es lo mismo, el método basado en la representa ión

de la imagen mediante fun iones de Gabor. Los motivos fundamentales son los

siguientes:

✮ El he ho de ha er uso de estas fun iones omplejas permite tener una máxima

lo aliza ión simultánea de las estru turas en el dominio espa ial y fre uen ial.

✮ Se dete tan es alas que pasan desaper ibidas por los otros métodos.

✮ Hay eviden ias biológi as que di en que estas fun iones tienen un per�l de a ti-

vidad similar al que poseen las élulas simples del órtex visual y por tanto son

buenas andidatas para formar una base que permita representar una imagen.

✮ El resultado de �ltrar una imagen on una fun ión de Gabor se puede inter-

pretar mejor que si se ha e uso de �ltros ideales paso-banda.

Respe to al riterio para evaluar la bondad del ontraste de las estru turas presentes

en la imagen, tenemos dos alternativas válidas: la fun ión de Brenner y la Varianza.

Si úni amente ne esitamos dete tar las es alas de las estru turas bási as presentes

Page 93: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

3.3. Conclusiones 71

en la imagen haremos uso de la fun ión Varianza y si ne esitamos dete tar, además,

estru turas que surgen omo unión de otras menores, enton es haremos uso de la

fun ión de Brenner.

Page 94: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

72 Capítulo 3. Detección de escalas globales

Page 95: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Capítulo 4

Dete ión de es alas naturales

lo ales

Es lara la importan ia que tiene el on epto de es ala global en el pro esamiento

de imágenes digitales, espe ialmente si pretendemos realizar, por ejemplo, tareas que

impliquen el re ono imiento de formas de manera e� iente. El he ho de ono er ual

es la es ala de una imagen nos da una idea de la extensión espa ial media de las

estru turas que hay presentes en ella. Esto nos puede simpli� ar las fases de pro-

esamiento posteriores y puede evitar que lo ali emos formas que no nos interesan

para nuestros objetivos, es de ir, evitan el pro esamiento del ruido que tiene la señal,

entendiendo este ruido omo ualquier estru tura que no sea de nuestro interés. En

o asiones, es posible que esta es ala global no sea su� iente, ya que, omo de ía-

mos anteriormente, esta es ala sólo nos da una idea de la extensión espa ial media

de las estru turas presentes en la imagen, pero esto no quiere de ir que todas las

estru turas sean del mismo tamaño. Puede haber diferen ias de distinta magnitud

entre unas estru turas y otras. Aquí apare e el on epto de es ala lo al, que sería la

es ala aso iada a ada estru tura presente en la imagen. Normalmente, las imágenes

que se orresponden on es enas naturales, ontienen una gran variedad de formas

y tamaños, de forma que si bus ásemos las es alas globales de esas imágenes, obten-

dríamos las es alas de las estru turas uyo tamaño fuese predominante, y por tanto,

es posible que no fuesen su� ientemente representativas, debido a esa gran variedad

de estru turas.

Si volvemos al ejemplo que se usó en la se ión 3 del árbol visto a diferentes

niveles de resolu ión, podríamos de ir que, aunque podemos aso iar distintas es alas

globales a la imagen, dependiendo del nivel de informa ión que deseemos interpretar,

también podríamos dar la es ala lo al de ada uno de los objetos individuales que

73

Page 96: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

74 Capítulo 4. Detección de escalas naturales locales

apare en en di ha imagen. Cada una de las hojas, el tron o, las venas de las hojas,

et . tendrían una es ala lo al aso iada. Se podrían apre iar diferen ias entre la

es ala lo al de ada hoja y la es ala global que diferen iaba las hojas omo formas

independientes.

En este apítulo se propone un método para la dete ión de las es alas lo ales aso-

iadas a posi iones espa iales de la imagen partiendo del modelo visual desarrollado

en el apítulo 2.

4.1 Método de dete ión de es alas lo ales

Con el modelo de representa ión desarrollado en el apítulo 2, tenemos una repre-

senta ión de las estru turas más importantes presentes en una imagen, en base al

ontenido fre uen ial que tienen y a la es ala espa ial a la que son mejor des ri-

tas. En esta se ión se desarrolla un método que nos permitirá ono er las es alas

naturales lo ales aso iadas a posi iones espa iales de la imagen.

La idea de partida es, por tanto, el ono imiento de las es alas naturales a las

que son mejor des ritas las estru turas presentes en un anal fre uen ial. Dada esa

informa ión, se trata de bus ar, para esas estru turas globales, uál sería la es ala

lo al que tiene ada uno de los puntos que pertene en a esas estru turas.

Una alternativa para realizar esta tarea podría onsistir en apli ar un método de

extra ión de es alas globales a regiones de la imagen por separado. Gar ía et al.

[37℄ proponen un modelo en el que se segmenta la imagen en una serie de regiones

homogéneas y después, en ada región, se apli a un método de enfoque basado en el

gradiente para determinar la es ala. El problema que tiene este método es que, si las

regiones son pequeñas, no es posible ha er una buena estima ión de los estadísti os

relativos a es alas grandes. Con el método que aquí se propone, se resuelve ese

problema.

Puesto que partimos de una representa ión multi anal y multies ala, es posible

que una misma lo aliza ión espa ial tenga varias es alas lo ales aso iadas. Cada

uno de los sensores a tivos de la des omposi ión multi anal, aisla estru turas de

unas ara terísti as espe í� as, o visto desde otro punto de vista, ada sensor aisla

determinadas ara terísti as de las estru turas que hay en la imagen. Por tanto,

tiene sentido ha er una búsqueda de las es alas lo ales de ada uno de los puntos

que pertene en a las ara terísti as sele ionadas de una determinada estru tura. O

sea, una misma estru tura puede ser vista desde distintos niveles ognitivos y por

tanto, para ada uno de esos niveles se puede ha er un estudio lo al de la informa ión

espa ial.

Page 97: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

4.1. Método de detección de escalas locales 75

4.1.1 Dete ión de puntos de interés

Con el método propuesto, no se pretenden al ular es alas lo ales sobre todos y ada

uno de los puntos de la imagen. Puesto que ha iendo uso del modelo de representa-

ión hemos llegado a determinar las estru turas relevantes que hay en una imagen,

pare e oherente entrar nuestra aten ión sólo en las lo aliza iones espa iales que

tienen interés desde el punto de vista de las estru turas que estamos analizando.

Así, dada la respuesta que produ e una imagen frente a un sensor on reto, no pare-

e muy útil determinar la es ala aso iada a un punto que no pertene e a las formas

aisladas por ese sensor.

Para determinar uales son los puntos de interés, haremos uso del on epto de

mapa de energía aso iado a ada uno de los sensores a tivos (Morrone et al. [85℄,

Fdez-Vidal et al. [31℄).

Dado un sensor a tivo S y la imagen original f(x; y), el resultado de �ltrar f(x; y)

on el �ltro de Gabor aso iado al sensor S lo de�nimos omo la respuesta de f(x; y)

frente al sensor S:

R

g

(f; S; x; y) = f (x; y) gb (x; y; �

S

; �

S

; �

S

) (4.1)

donde �

S

es la es ala global aso iada al sensor, �

S

es la fre uen ia radial media

y �

S

es la orienta ión media. La fun ión gb() se de�ne en la e ua ión 2.5. En el aso

de que haya más de una es ala global aso iada al sensor S, se al ulará la respuesta

para ada una de las es alas obtenidas.

De�nimos el mapa de energía lo al, desde el punto de vista del sensor S, omo:

Lem (f; S; x; y) = jR

g

(f; S; x; y)j

2

(4.2)

es de ir, se de�ne el mapa de energía lo al de la imagen f(x; y) desde el punto de

vista del sensor S, omo el uadrado de la envolvente que resulta de �ltrar la imagen

original on el �ltro de Gabor omplejo aso iado al sensor en uestión.

Este mapa de energía se puede al ular apli ando por separado los dos �ltros

en uadratura que de�nen una fun ión de Gabor ompleja: la parte par y la parte

impar. Podemos de�nir

R

par

g

(f; S; x; y) = f (x; y) gb

e

(x; y; �

S

; �

S

; �

S

) (4.3)

y

R

impar

g

(f; S; x; y) = f (x; y) gb

o

(x; y; �

S

; �

S

; �

S

) (4.4)

Page 98: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

76 Capítulo 4. Detección de escalas naturales locales

donde gb

e

() y gb

o()

están de�nidas en las e ua iones 2.7 y 2.8 respe tivamente.

De esta forma podemos rede�nir el ál ulo del mapa de energía omo:

Lem (f; S; x; y) =

R

par

g

(f; S; x; y)

2

+

R

impar

g

(f; S; x; y)

2

(4.5)

Los puntos de interés en los que �ja su aten ión el SVH son aquellos que al anzan

un máximo lo al en el mapa de energía.

4.1.2 Determina ión de las es alas lo ales sobre los puntos de inte-

rés

Una vez que hemos determinado los puntos de interés, dado un mapa de energía

lo al, vamos a pro eder a la determina ión de la es ala lo al en ada uno de ellos.

El riterio de determina ión de la es ala en un punto (x

; y

), que es un máximo

lo al del mapa de energía para un sensor S, se formula de esta manera: la es ala

natural �

de la estru tura espa ial on omponentes fre uen iales en el sensor S,

en la lo aliza ión (x

; y

), debe produ ir una imagen �ltrada a es ala �

, tal que

tenga una máxima varia ión de intensidad lo al en un entorno W (x

; y

) del punto

(x

; y

) on respe to a las imágenes �ltradas que hagan uso de ualquier otra es ala.

Como riterio para determinar la varia ión de la intensidad lo al se tomará de nuevo

la fun ión Varianza, que se apli ará sobre los mapas de energía de forma lo al de la

siguiente forma:

V (f; S; �; x

; y

) =

X

(x;y)2W (x

;y

)

(jP

(f; S; x; y)j � �)

2

(4.6)

donde P

(f; S;x; y) es el resultado de �ltrar la imagen f(x; y) on el �ltro de

Gabor aso iado al sensor S pero usando la es ala � en lugar de la es ala aso iada al

sensor �

S

:

P

(f; S; x; y) = f (x; y) gb (x; y; �; �

S

; �

S

) (4.7)

y � es la media de los valores de la envolvente de la imagen �ltrada a es ala � en

el entorno del punto (x

; y

)

� =

P

(x;y)2W (x

;y

)

jP

(f; S; x; y)j

Card [W (x

; y

)℄

(4.8)

La fun ión Card [W (x

; y

)℄ devuelve el número de puntos que hay en el entorno

del punto (x

; y

).

Page 99: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

4.2. Resultados experimentales 77

En este punto se podría haber optado por ha er uso del riterio de Brenner para

la obten ión de es alas. Si vemos las on lusiones del apítulo 3, la ventaja que

supone el uso del riterio de Brenner viene dada por su apa idad para dete tar

es alas orrespondientes a estru turas que surgen omo onse uen ia de la unión

de estru turas menores. En el problema de la dete ión de es alas lo ales, estas

es alas que propor iona Brenner no suponen ninguna ventaja lara ya que, al ha er

el análisis sobre un entorno redu ido del punto que estamos onsiderando, no tiene

sentido unir varias estru turas pequeñas en una úni a estru tura grande. Lo que se

pretende es dete tar las es alas lo ales de los puntos que pertene en a esas estru turas

individuales.

Sólo queda por determinar ual es el entorno W (x

; y

) sobre el que tiene interés

al ular la varianza. Lo de�niremos omo aquellos píxeles ontenidos en un ír ulo

de radio r entrado en el punto (x

; y

) on r = Dist ((x

m

; y

m

) ; (x

; y

)). El punto

(x

m

; y

m

) es el mínimo lo al más er ano al punto (x

; y

) en el mapa de energía

lo al Lem (f; S; x; y). La fun ión Dist (a; b) devuelve la distan ia eu lídea entre dos

puntos a y b.

Puesto que un mínimo lo al en el mapa de energía lo al determina el omienzo

poten ial de otra estru tura, su uso omo límite de los entornos de in�uen ia de los

máximos lo ales (puntos de interés) evita la interferen ia de diferentes estru turas

durante el ál ulo de la es ala lo al.

4.2 Resultados experimentales

Para determinar la validez del método se ha experimentado sobre distintos tipos de

imágenes.

4.2.1 Imagen biomédi a

La primera imagen que se ha usado, es una imagen biomédi a de romosomas de

tamaño 256x256 píxeles y 256 niveles de gris. Esta se puede ver en la �gura 4.1(A).

En (B) se muestra la parti ión multi anal de di ha imagen y en (C) se ven los sensores

a tivos dete tados. En (D) apare e una re onstru ión de la imagen original he ha

en base a la representa ión de la misma mediante el modelo expli ado en el apítulo

2. Para ha er esta re onstru ión se ha usado el método desarrollado en la se ión

5.2 (e ua ión 5.12).

En la tabla 4.1 se muestran los datos numéri os orrespondientes a los sensores

a tivos de esta imagen junto on las es alas globales sele ionadas. Aunque para un

Page 100: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

78 Capítulo 4. Detección de escalas naturales locales

PSfrag repla ements

(A) (B)

(C) (D)

Figura 4.1: (A) Imagen biomédi a, (B) Parti ión multi anal, (C) Sensores a tivos, (D) Re-

onstru ión usando el método presentado en la se ión 5.

Page 101: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

4.2. Resultados experimentales 79

Sensor S

rmin

S

rmax

S

amin

S

amax

Es ala Global

S

1

2 14 135

Æ

180

Æ

6.8

S

2

23 36 0

Æ

45

Æ

1.7

S

3

4 9 0

Æ

45

Æ

8.3

S

4

3 9 45

Æ

90

Æ

8.3

S

5

14 25 45

Æ

90

Æ

2.8

S

6

14 23 135

Æ

180

Æ

2.8

S

7

10 14 0

Æ

45

Æ

4.8

S

8

14 23 0

Æ

45

Æ

2.8

S

9

3 11 90

Æ

135

Æ

6.8

S

10

11 19 90

Æ

135

Æ

3.3

S

11

23 29 135

Æ

180

Æ

2

S

12

10 14 45

Æ

90

Æ

4.3

Tabla 4.1: Parámetros de los sensores a tivos dete tados para la imagen biomédi a junto on

la es ala global de ada uno de ellos.

mismo sensor es posible que se dete ten varias es alas globales, en este experimento

sólo se ha onsiderado, por simpli idad, una es ala por sensor, esta es ala es la más

pequeña que se dete te.

Dados ada uno de los sensores, se ha pro edido al ál ulo de es alas lo ales

basado en la búsqueda de los máximos de los mapas de energía lo al. En la �gura

4.2 se pueden ver los ál ulos realizados sobre tres de los sensores de la imagen (en la

�gura apare en uno en ada olumna por este orden: S

1

, S

10

y S

2

). La primera �la

muestra el área del espe tro de fre uen ias que sele iona ada sensor. La segunda

�la muestra los mapas de energía lo al de ada uno de los sensores. En la siguiente �la

apare en superpuestos los máximos y mínimos de los mapas de energía; los máximos

apare en on olor negro mientras que los mínimos apare en on una tonalidad gris.

La siguiente �la muestra las zonas de in�uen ia W (x; y) al uladas para ada uno de

los máximos lo ales de la �la anterior. Por último, se muestran, de forma resumida,

las es alas lo ales que se han dete tado para ada uno de los máximos lo ales de la

ter era �la. Se puede ver el histograma on las fre uen ias de apari ión de ada una

de las es alas dete tadas.

Viendo el histograma se puede apre iar que las es alas lo ales dete tadas, para

un sensor dado, son de magnitud similar a la es ala global de di ho sensor, aunque

existen varia iones, en un rango no muy amplio de valores, debido a la variedad de

estru turas presentes en los mapas de energía.

Hay que tener en uenta que durante el ál ulo de las es alas lo ales no se ubre

un rango ontínuo de valores sino que nos movemos en un rango dis reto on un

Page 102: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

80 Capítulo 4. Detección de escalas naturales locales

PSfrag repla ements

(A.1)

(A.2)

(A.3)

(A.4)

(A.5)

(B.1)

(B.2)

(B.3)

(B.4)

(B.5)

(C.1)

(C.2)

(C.3)

(C.4)

(C.5)

Figura 4.2: Muestra de los ál ulos para los sensores (A) S

1

, (B) S

11

y (C) S

3

. La primera

�la muestra la región del espe tro re ogida por el sensor. La segunda �la muestra

el mapa de energía lo al. En la ter era están superpuestos los máximos (más

os uros) y mínimos (más laros) de los mapas de energía lo al. La uarta �la

muestra las regiones de in�uen ia W (x; y) de los máximos. En la última �la se

puede ver un histograma que muestra en el eje verti al la fre uen ia de apari ión

de ada una de las es alas lo ales dete tadas (eje horizontal).

Page 103: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

4.2. Resultados experimentales 81

PSfrag repla ements

(A) (B)

Figura 4.3: (A) Es ena natural. (B) Sele ión de sensores a tivos.

Sensor S

rmin

S

rmax

S

amin

S

amax

Es ala Global

S

1

11 26 135

Æ

180

Æ

1.4

S

2

3 10 90

Æ

135

Æ

4.3

S

3

2 11 0

Æ

45

Æ

3.3

Tabla 4.2: Parámetros de los sensores a tivos de la es ena natural junto on las es alas

dete tadas.

in remento entre valores onse utivos de �� = 0:5. Por tanto, el histograma es sólo

una aproxima ión de las magnitudes de las es alas lo ales presentes.

4.2.2 Es ena natural

El mismo experimento se ha llevado a abo sobre una imagen natural de tamaño

128x128 píxeles. En la �gura 4.3 se puede ver la imagen junto on la sele ión de

sensores a tivos dete tados.

En la tabla 4.2 están los datos numéri os de la parti ión junto on las es alas

globales dete tadas para ada sensor.

En las �guras 4.4, 4.5 y 4.6 se muestran los datos rela ionados on la extra ión

de es alas lo ales. En (A) se muestra el sensor sobre el que está trabajando. En

(B) se ve el mapa de energía lo al para el sensor de (A). En (C) se muestran los

máximos del mapa de energías superpuestos on di ho mapa. En (D) se pueden ver

las zonas de in�uen ia de los máximos de (C). En (E) se expone una representa ión

tridimensional de la magnitud de las es alas lo ales. En esta grá� a se han dibujado,

en los bordes y on relleno negro, unos pi os on la altura de la es ala global dete tada

para el sensor para, de esta forma, apre iar mejor la magnitud de las es alas lo ales.

Por último, en (F) se puede ver un histograma que muestra la fre uen ia de apari ión

(eje verti al) de las es alas lo ales (eje horizontal).

Page 104: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

82 Capítulo 4. Detección de escalas naturales locales

PSfrag repla ements

(A)

(B)

(C)

(D)

(E)

(F)

Magnitud de la

es ala global

Magnitud de las

es alas lo ales

Figura 4.4: (A) Sensor S

1

. (B) Mapa de energía lo al. (C) Máximos del mapa de energía

lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E) Representa ión 3D

de las es alas lo ales. (F) Histograma de es alas lo ales.

Page 105: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

4.2. Resultados experimentales 83

PSfrag repla ements

(A)

(B)

(C)

(D)

(E)

(F)

Magnitud de la

es ala global

Magnitud de las

es alas lo ales

Figura 4.5: (A) Sensor S

2

. (B) Mapa de energía lo al. (C) Máximos del mapa de energía

lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E) Representa ión 3D

de las es alas lo ales. (F) Histograma de es alas lo ales.

Page 106: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

84 Capítulo 4. Detección de escalas naturales locales

PSfrag repla ements

(A)

(B)

(C)

(D)

(E)

(F)

Magnitud de la

es ala global

Magnitud de las

es alas lo ales

Figura 4.6: (A) Sensor S

3

. (B) Mapa de energía lo al. (C) Máximos del mapa de energía

lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E) Representa ión 3D

de las es alas lo ales. (F) Histograma de es alas lo ales.

Page 107: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Capítulo 5

Desarrollo de una Medida de

Distorsión Per eptual

Una de las apli a iones inmediatas del modelo visual desarrollado es el ál ulo de

medidas de distorsión per eptuales entre imágenes, es de ir, dadas dos imágenes di-

gitales, uanti� ar de una forma objetiva la diferen ia visual existente entre ellas. El

término per eptual impli a que esta medida habrá de in orporar alguna ara terísti-

a del SVH, lo ual debería desembo ar en una buena orrela ión on observa iones

realizadas por observadores humanos on un nivel visual normal (es de ir, sin pro-

blemas de visión). Son varias las ventajas de tener un modelo omputa ional frente

al uso de observadores humanos:

✮ Es objetivo ya que usa unos riterios ono idos y los apli a sin ningún tipo de

subjetividad.

✮ Se redu e el tiempo de pro esamiento.

✮ Los observadores a túan asi siempre de forma subjetiva lo ual impli a que

unos tenderán a desta ar más unos rasgos que otros, on lo que dadas las

mismas imágenes a diferentes sujetos, estos darán distintos niveles de diferen-

ia ión entre ellas.

✮ Por otra parte, si a un mismo sujeto le presentamos una serie de imágenes dos

ve es, habrá una probabilidad alta de que nos propor ione diferentes resultados

en ambas o asiones. Esto impli a, entre otras osas, la no repetibilidad de

experimentos.

El problema que pare e dejarse ver de entre las ventajas del modelo omputa ional es

omo de idir si una medida omputa ional es buena o mala. La bondad de la misma

85

Page 108: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

86 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

viene dada por la similaridad que tenga on resultados obtenidos de observadores,

que omo hemos visto son bastante impre isos y subjetivos. La solu ión no es difí il

de ver tampo o, el resultado del modelo no se va a omparar on las observa iones

he has por un observador sino on algún estadísti o que resuma de alguna forma las

observa iones he has por un grupo, su� ientemente grande, de ellos.

Las medidas de distorsión son una apli a ión del modelo desarrollado pero no

son un �n en si mismas. A su vez, estas medidas son herramientas que ayudan a

resolver una gran variedad de problemas omo pueden ser la evalua ión de la alidad

de ompresión de imágenes, la evalua ión de la alidad de métodos de restaura ión,

la ayuda a la dete ión de estru turas en imágenes, et .

En este sentido, se evaluará la bondad de la medida de distorsión desarrollada en

esta Tesis mediante diversos experimentos:

✮ Evalua ión de la alidad de la medida en imágenes distorsionadas mediante un

efe to de enmas aramiento (se ión 5.3).

✮ Evalua ión del omportamiento de la medida apli ada sobre imágenes mues-

treadas a diferentes resolu iones (se ión 5.4).

✮ Dete ión de objetos en es enas naturales (se ión 5.5).

✮ Evalua ión de la alidad de imágenes digitales omprimidas mediante métodos

on pérdida (se ión 5.6).

5.1 Medidas existentes

Desde el punto de vista del uso o no de alguna propiedad que ara teriza al SVH,

las medidas de distorsión se dividen en per eptuales y no per eptuales.

Normalmente las per eptuales impli arán una mayor omplejidad aunque a am-

bio pare e razonable pensar que van a propor ionar una mayor pre isión y �abilidad

en los resultados. Lo deseable en una medida de distorsión es que tenga un ompor-

tamiento lineal respe to de la alidad per ibida por un observador humano y esto es

algo que sólo pare e al al anze de las medidas per eptuales.

Las propiedades genéri as que debería tener una buena medida de distorsión son

(Kominek [62℄):

✮ La medida ha de ser ero uando omparamos una imagen onsigo misma.

✮ La medida no debe ser negativa.

Page 109: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.1. Medidas existentes 87

✮ La medida ha de ser monótona re iente onforme aumenta la disimilaridad

existente entre ambas imágenes. La disimilaridad habrá de estar medida en

términos de una buena orrela ión respe to a medidas realizadas por observa-

dores humanos.

Estas onsidera iones tienen sentido uando hablamos de la magnitud de la medida

de distorsión. La segunda propiedad de las men ionadas requiere una a lara ión, y

es que uando de imos que una medida no debe ser negativa, en realidad lo que se

pretende es poner un límite inferior que nos sirva de referen ia para poder omparar

distintas medi iones entre sí. Si, en general, una medida pudiese tomar valores

negativos y positivos (sin espe i� ar nada más) sería algo más omplejo omparar

medi iones de di ha medida entre ellas. La solu ión podría pasar por omparar la

magnitud de di has medi iones sin tener en uenta el signo. En este sentido, la

medida desarrollada en esta Tesis propor iona valores sobre el dominio [0;+1) de

forma que un valor de 0 indi a la máxima similaridad posible entre dos imágenes

(esta se dará uando omparemos una imagen onsigo misma) y un valor que tienda

a +1 indi ará la máxima disimilaridad.

5.1.1 Medidas lási as no per eptuales

Este tipo de medidas se limitan a realizar algún tipo de opera ión pixel a pixel entre

las dos imágenes que estamos omparando. La medida más simple que podemos

en ontrar en la literatura es el error medio absoluto de�nido omo:

MAE =

1

N �M

X

x

X

y

f(x; y)�

b

f(x; y)

(5.1)

donde f (x; y) es la imagen de referen ia,

b

f (x; y) es la imagen on la que se quiere

omparar y N �M es la dimensión de ambas imágenes en pixeles. Otra medida muy

ono ida es el error uadráti o medio de�nido omo:

MSE =

1

N �M

X

x

X

y

f (x; y)�

b

f (x; y)

2

(5.2)

Esta es la medida más utilizada por su simpli idad omputa ional. Marmolin [75℄

realizó experimentos para observar que o urría si se introdu ía alguna ara terísti a

del SVH en modelos simples omo MSE. Su on lusión fué que se mejoraba la

orrela ión on observa iones he has por humanos. Para ha er omparables elMSE

y el MAE se re al ula el MSE extrayéndole su raíz uadrada dando lugar a una

nueva medida:

Page 110: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

88 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

RMSE =

v

u

u

t

1

N �M

X

x

X

y

f (x; y)�

b

f (x; y)

2

(5.3)

Otra medida de error bastante omún es la razón señal/ruido. Esta rela ión se

suele expresar de diversas formas, aunque siempre muestra la propor ión entre la

desvia ión de la señal frente a la desvia ión del ruido. Una primera de�ni ión sería

la siguiente:

SNR = 10 log

10

2

f

2

r

!

(5.4)

donde �

2

f

es la varianza de f (x; y) y �

2

r

es la varianza del ruido (de�nido omo

f (x; y)�

b

f (x; y)).

La rela ión señal/ruido es una medida ampliamante utilizada en la literatura

rela ionada on ompresión de imágenes. Hay mu has variantes de esta medida.

Otra muy utilizada es el pi o de la rela ión señal/ruido:

SNR

peak

= 10 log

10

0

B

max

f(x; y)

2

1

N �M

P

x

P

y

f(x; y)�

b

f(x; y)

2

1

C

A

(5.5)

Una generaliza ión de mu has de estas medidas viene dada por:

E

p

=

"

1

N �M

X

x

X

y

je (x; y)j

p

#

1

p

(5.6)

donde, por ejemplo, si ha emos p = 2 y e (x; y) = f (x; y) �

b

f (x; y) enton es

tenemos que E

2

= RMSE.

El prin ipal problema que plantean todas estas medidas lási as, es que miden la

diferen ia entre dos imágenes pixel a pixel y después resumen todas esas diferen ias

en base a alguna medida. Los humanos es obvio que no omparan así una pareja

de imágenes sino que ha en algún tipo de pro esamiento lo al y asignan mayor o

menor peso a determinadas diferen ias. Limb [66℄ ha he ho diversos experimentos

en este sentido introdu iendo en RMSE pesos y algún tipo de pro esamiento lo al

y on luye que el he ho de introdu ir ese pro esamiento lo al puede mejorar los

resultados aunque RMSE sea mejor que algunas de las medidas que propone en sus

experimentos. De ualquier forma, las modi� a iones que introdu e Limb son muy

limitadas en uanto a su similaridad on el SVH.

Shirvaikar et al. [108℄ dejan laro que las medidas basadas en estadísti os de

Page 111: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.1. Medidas existentes 89

primer orden están muy limitadas en uanto a la ara teriza ión de diferen ias per-

eptuales entre imágenes.

En general, estas medidas umplen los dos primeros riterios que debería umplir

ualquier medida de distorsión pero están lejos de umplir el ter ero. A pesar de los

in onvenientes de este tipo de medidas (Budrikis [11℄, Carl [15℄, Karunasekera et al.

[58℄), está muy extendido su uso debido a dos fa tores fundamentalmente: su bajo

oste omputa ional y la no disponibilidad de medidas que umplan orre tamente

el ter er requisito. Las medidas que propor ionan una solu ión, aunque sea par ial,

a este ter er riterio, tienen el in onveniente de que suelen ser bastante ostosas en

uanto a tiempo de ál ulo.

5.1.2 Medidas per eptuales

Los primeros pasos en el desarrollo de medidas que in orporan atributos del SVH

onsistieron en modi� ar las medidas existentes (RMSE, SNR, et ) y añadirles alguna

de esas propiedades (Budrikis [11℄, Hunt et al. [52℄, Limb [66℄, Marmolin [75℄). Por

ejemplo, para modelizar la no linealidad de los fotore ptores del SVH se propone

esta modi� a ión (Akansu et al. [3℄):

MSE

no�lineal

=

1

N �M

X

x

X

y

f (x; y)

1

3

b

f (x; y)

1

3

2

(5.7)

Otros modelos asumen un �ltrado lineal de la imagen por parte del SVH y ha en

uso de la fun ión de sensibilidad al ontraste (CSF) para ponderar los anales fre-

uen iales (Barten [9℄, Nill et al. [89℄). Una ombina ión de estas dos ara terísti as

es la propuesta por Saghri et al. [102℄ en la que ha e uso de la raíz úbi a junto on

la CSF.

A tualmente está bastante a eptado que, al menos, una propiedad fundamental

a in orporar en los modelos visuales es la separa ión en anales de fre uen ias de

la señal de entrada. En este sentido fué Sakrison [103℄ el primero en proponer un

modelo de estas ara terísti as.

Pearlman [92℄ propone un modelo visual basado en múltiples anales espa io-

fre uen iales sin onsiderar la sele tividad frente a orienta ión. En ese modelo, el

SVH se omporta omo un ban o de �ltros paralelos, de forma que ada uno de

ellos analiza un grupo de fre uen ias diferentes ubriendo todo el espe tro. La salida

de ada �ltro es analizada por el erebro para determinar si existen o no estímulos

presentes en ese rango de fre uen ias. Para ada uno de esos anales determina la

probabilidad de dete ión de un objeto. Posteriormente, para determinar la distor-

Page 112: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

90 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

sión existente entre dos imágenes, primero al ula por separado la distorsión que hay

para ada anal entre las dos imágenes en base a la probabilidad de dete ión para

ese anal y después determina la distorsión global omo la media de las distorsiones

de ada anal. La distorsión por anal, en de�nitiva, no es más que una diferen ia

uadráti a absoluta entre los oe� ientes de fourier de ambas imágenes ponderados

por una fun ión.

Karunasekera et al. [58℄ desarrollan una medida de distorsión que, en lugar de

modelar el omportamiento del SVH, explota determinadas ara terísti as de las

imágenes. Su medida se basa en la sensibilidad del SVH a determinado tipo de

estru turas (textura, fronteras, ...), de forma que, primero se dete ta la presen ia

de di has estru turas y después se pondera de a uerdo a la sensibilidad del SVH

respe to de ada tipo de estru tura. Esta sensibilidad se determinará previamente

en base a experimentos psi ovisuales.

Ahumada et al. [2℄ [1℄ propone una medida basada en la transformada del or-

tex de Watson [119℄. Esta medida apli a una normaliza ión frente a luminan ia a

las imágenes que va a omparar y después las �ltra ha iendo uso de una CSF. Pos-

teriormente las on ierte al dominio de la transofrmada del ortex y allí evalúa las

diferen ias existentes entre ambas para ada uno de los anales. Finalmente ombina

esas diferen ias y obtiene la medida que bus a.

Algo que pare e laro es que el SVH, uando pro esa una imagen, no lo ha e

punto a punto sino que lo ha e de una forma sele tiva fo alizando su aten ión sobre

determinados datos de la imagen y ponderando estos datos on un fa tor mayor que

el resto de la imagen (Wandell [118℄).

5.2 Medida de distorsión per eptual

El esquema general de la medida de distorsión propuesta en esta Tesis se puede ver

en la �gura 5.1. En la apli a ión de di ho esquema ne esitaremos dos parámetros de

entrada, que serán las dos imágenes que queremos omparar, y obtendremos un valor

de salida que no es otro que la uanti� a ión de la diferen ia per eptual existente

entre ambas imágenes. En este modelo no es indiferente el orden en el que usemos

los parámetros de entrada y por tanto, para diferen iarlos, llamaremos imagen de

referen ia al primer parámetro e imagen test al segundo. En el esquema podemos

distinguir tres etapas:

1. Obten ión de la parti ión multisensor (Se ión 2.2) y sele ión de los sensores

a tivos (Se ión 2.2.1) de la imagen de referen ia f(x; y).

Page 113: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.2. Medida de distorsión perceptual 91

2. Modeliza ión de los ampos re eptivos de ada uno de los sensores a tivos

(Se ión 2.3).

3. Compara ión de las respuestas de ada sensor a tivo para la imagen de refe-

ren ia f(x; y) y la imagen test

b

f(x; y).

El objetivo de las dos primeras etapas es la obten ión de una representa ión

de la imagen f(x; y) en la que se pongan de mani�esto las prin ipales estru turas

presentes, o equivalentemente, estamos determinando uales son los sensores on

mayor nivel de a tividad frente al estímulo representado por f(x; y). La ter era

etapa nos permitirá, en base a la des omposi ión realizada sobre f(x; y), omparar

la imagen de referen ia on una imagen test

b

f(x; y). En esen ia lo que se persigue on

este esquema es no omparar las dos imágenes en un dominio espa ial o fre uen ial

( omo lo ha en RMSE y otras medidas), sino ompararlas en un dominio per eptual.

Las dos primeras etapas transforman la imagen a ese nuevo dominio y es en él donde

apli amos la métri a de error.

La formula ión de la medida de distorsión (que llamaremos d1) es la siguiente:

d1

f;

b

f

=

X

S

k

2S

A t

N�1

X

x=0

M�1

X

y=0

m

S

k

� d1

S

k

f (x; y) ;

b

f (x; y)

(5.8)

donde S

A t

es el onjunto de sensores a tivos, m

S

k

es el fa tor que pondera la

importan ia relativa de ada sensor y donde

d1

S

k

f (x; y) ;

b

f (x; y)

=

1

f

Resp (f; S

k

;x; y)�

1

b

f

Resp

b

f; S

k

;x; y

2

(5.9)

donde �

f

es el nivel medio de gris de la imagen original f(x; y), �

b

f

es el nivel

medio de gris de la imagen test

b

f(x; y) y Resp (h; S

k

; x; y) es la respuesta del sensor

S

k

frente a una imagen h(x; y) de�nida omo

Resp (h; S

k

;x; y) = h (x; y) gb (x; y; �

S

k

; �

S

k

; �

S

k

) (5.10)

donde �

S

k

es la es ala aso iada a la fun ión de Gabor que modela el ampo

re eptivo del sensor S

k

, y �

S

k

y �

S

k

son la fre uen ia radial media y la orienta ión

media respe tivamente del sensor S

k

. El an ho de banda del sensor viene determinado

por la es ala. La fun ión gb() se de�ne en la e ua ión 2.5.

d1

S

k

f;

b

f

mide la diferen ia per eptual existente entre la respuesta que tiene

el anal modelado por el sensor S

k

frente a la imagen de referen ia f(x; y) y la

Page 114: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

92 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

f(x; y)

f(x; y)

F (u; v) Parti ión multisensor Sensores a tivos

b

f(x; y)

Medida de distorsión

P

r

i

m

e

r

a

e

t

a

p

a

S

e

g

u

n

d

a

e

t

a

p

a

T

e

r

e

r

a

e

t

a

p

a

Modeliza ión

de los

ampos re eptivos

+ +

---

Figura 5.1: Esquema general de la medida de distorsión.

Page 115: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.2. Medida de distorsión perceptual 93

respuesta de ese mismo sensor respe to a la imagen test

b

f(x; y). O lo que es lo mismo,

estamos viendo la diferen ia que existe en uanto a la a tiva ión de los sensores que

omponen ese anal uando se propor iona omo estímulo la señal f(x; y) y uando

se propor iona omo estímulo la señal

b

f(x; y).

Es un he ho ono ido que la fun ión de sensibilidad al ontraste del SVH varía

de a uerdo al nivel medio de ilumina ión del fondo. La normaliza ión introdu ida

on �

f

y �

b

f

pretende evitar las varia iones debidas al ambio de ese nivel medio de

ilumina ión en ambas imágenes.

En la e ua ión 5.8 los pesosm

S

k

son introdu idos para ha er la respuesta de ada

sensor a tivo propor ional a su importan ia respe to a su ontribu ión informa io-

nal en la imagen original f(x; y). Este fa tor se puede entender omo la importan ia

relativa que tienen unas estru turas de la imagen frente a otras, de he ho el SVH es

apaz de a entuar algunas estru turas de la imagen en detrimento de otras menos

signi� ativas visualmente. El riterio de sele ión de esos pesos va a ser la minimiza-

ión de la diferen ia existente entre la imagen original f(x; y) y una re onstru ión

de esta en base a la informa ión ontenida en los sensores a tivos

e

f(x; y), es de ir,

sele ionaremos aquellos pesos que minimizen la siguiente expresión:

X

x

X

y

f (x; y)�

e

f (x; y)

2

(5.11)

donde

e

f(x; y) se de�ne omo:

e

f (x; y) =

X

S

k

2S

A t

jm

S

k

� Resp (f; S

k

;x; y)j (5.12)

es de ir, la re onstru ión de la imagen original será una suma ponderada de las

respuestas de ada sensor a tivo.

Tal y omo está formulado, el éxito de este modelo dependerá de dos fa tores

importantes: el modelo de visión adoptado y la métri a de error que se use para

uanti� ar las diferen ias en el nuevo dominio. Algunos resultados experimentales

muestran que pare e más importante el modelo que la métri a (Faugeras [29℄).

En las siguientes se iones se va a omparar la medida propuesta on las medidas

lási as a través de diferentes experimentos. Se ha sele ionado para ello RMSE,

aunque los resultados son similares para otras medidas no per eptuales.

Page 116: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

94 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

(A) (B)

Figura 5.2: (A) Imagen sintéti a usada en el experimento de enmas aramiento. (B) Parti-

ión multisensor y sensores a tivos dete tados.

5.3 Experimento de enmas aramiento

Con este experimento se pretende ha er una primera ompara ión entre d

1

y RMSE.

Para su realiza ión se ha generado una imagen sintéti a que onsiste en una bola

obtenida a partir de una ampana de Gauss de 256 niveles de gris. Esta imagen

se puede ver en la �gura 5.2(A). En la misma �gura (5.2(B)) apare e también la

parti ión multisensor junto on los sensores a tivos dete tados. Puesto que una

gaussiana es una estru tura sin orienta ión predominante, se puede apre iar que se

dete ta un sensor signi� ativo en ada orienta ión, ubriendo de esta forma una

banda ompleta de fre uen ias.

A la imagen sintéti a se le ha apli ado un efe to de enmas aramiento mediante

dos pro edimientos distintos. El primero de ellos onsiste en añadir ruido normal

sobre la imagen de manera uniforme, es de ir, la probabilidad de que en un punto

ualquiera aparez a ruido es siempre

1

N �M

, donde N yM son los tamaños horizontal

y verti al, en píxeles, de la imagen. El segundo método onsistirá en añadir de nuevo

ruido normal, pero esta vez de manera no uniforme, es de ir, la probabilidad de que

en un punto aparez a ruido no es la misma para todos los puntos de la imagen. En

on reto, se ha usado una imagen binaria que sirve de más ara, de forma que sólo

apare erá ruido en aquellas posi iones (x; y) de la imagen, tal que la misma posi ión

en la imagen de más ara tenga omo valor uno.

En la �gura 5.3 se pueden ver las seis imágenes generadas on ruido uniforme y en

Page 117: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.3. Experimento de enmascaramiento 95

Figura 5.3 RMSE d

1

(A) 10 1.369

(B) 20 6.351

(C) 30 12.599

(D) 40 18.849

(E) 50 31.294

(F) 60 52.319

Tabla 5.1: Valores de RMSE y d

1

entre la imagen original y ada una de las imágenes on

ruido uniforme de la �gura 5.3.

Figura 5.4 RMSE d

1

(A) 10 1.463

(B) 20 7.563

(C) 30 14.047

(D) 40 37.886

(E) 50 129.160

(F) 60 328.363

Tabla 5.2: Valores de RMSE y d

1

entre la imagen original y ada una de las imágenes on

ruido no uniforme de la �gura 5.4.

la �gura 5.4 se pueden ver las seis imágenes generadas on ruido no uniforme. Para

el segundo aso se puede apre iar laramente ual es la más ara que se ha usado. En

las �guras se muestra también la desvia ión típi a que se ha usado para produ ir el

ruido gaussiano en ada imagen.

La parti ularidad que tienen estas imágenes ruidosas es que se han generado

imponiéndoles una restri ión. Esta restri ión es que han de tener un valor de

RMSE ono ido a priori respe to de la imagen original. De esta forma, para ada

uno de los tipos de ruido añadidos (uniforme y no uniforme) se han obtenido imágenes

on seis valores de RMSE que son 10, 20, 30, 40, 50 y 60. En las tablas 5.1 y 5.2 se

pueden ver estos datos junto on los valores que produ e la medida de distorsión d

1

.

Si omparamos las imágenes on ruido uniforme y las que tienen ruido no unifor-

me, podemos ver que la disimilaridad entre ellas y la imagen original se ha e mu ho

más evidente en las que tienen ruido no uniforme, ya que en las últimas, tiende a

desapare er la bola gaussiana y a apare er una nueva forma (la misma que tiene la

más ara que se usó para generar el ruido). Este he ho no lo re�eja la medida RMSE.

Tal y omo ha sido diseñado el experimento, en ambas se uen ias, el re imiento de

esta medida es idénti o. En ambio, si miramos los valores de d

1

podemos ver omo

en el aso del ruido no uniforme, re e mu ho más rápido.

En la �gura 5.5 se puede ver de forma grá� a esta diferen ia de re imiento.

Page 118: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

96 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

(A) (B)

(C) (D)

(E) (F)

Figura 5.3: Imágenes obtenidas añadiendo ruido normal uniforme a la imagen de la �gura

5.2(A). Las desvia iones estandar de ada una de las imágenes son (A) � = 10.

(B) � = 20. (C) � = 30. (D) � = 45. (E) � = 55. (F) � = 70.

Page 119: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.3. Experimento de enmascaramiento 97

PSfrag repla ements

(A) (B)

(C) (D)

(E) (F)

Figura 5.4: Imágenes obtenidas añadiendo ruido normal no uniforme a la imagen de la

�gura 5.2(A). El ruido se ha apli ado sólo sobre algunas zonas de la imagen

(idénti as para todas las imágenes). Las desvia iones estandar de ada una de

las imágenes son (A) � = 15. (B) � = 30. (C) � = 50. (D) � = 65. (E)

� = 95. (F) � = 120.

Page 120: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

98 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

0

50

100

150

200

250

300

350

10 20 30 40 50 60

PSfrag repla ements

No uniforme

Uniforme

Figura 5.5: Grá� a omparativa de la medida d

1

(eje verti al) frente a RMSE (eje horizon-

tal). La línea dis ontínua muestra la omparativa para las imágenes on ruido

uniforme y la ontínua para las de ruido no-uniforme.

Se han representado en el eje verti al la medida d

1

y en el horizontal la medida

RMSE. Es laramente visible que la medida per eptual mar a las imágenes on

ruido no uniforme omo mu ho más diferentes de la original que las que tienen ruido

uniforme.

5.4 Efe to de pixelado

En este segundo experimento se pretende ha er otra ompara ión entre la medida

d

1

y RMSE. Para ello se ha tomado una imagen y se le ha apli ado un efe to

de pixelado on diferentes tamaños de entorno. Este efe to onsiste en disminuir la

resolu ión de la imagen original en un fa tor S, de forma que, si la imagen original

tenía un tamaño de N �M píxeles, la nueva imagen tendrá

N

S

M

S

píxeles. Cada píxel

de la nueva imagen se obtiene omo la media de los niveles de gris de un entorno de

un tamaño de S � S píxeles de la imagen original.

El experimento ha sido llevado a abo sobre dos imágenes: la imagen de Einstein

y una es ena on bar os.

✮ Imagen de Einstein:

En la �gura 5.6 se puede ver la imagen original usada en este experimento de 256x256

píxeles y otras tres imágenes obtenidas mediante el pro eso de pixela ión on tamaños

de entorno de 8x8, 12x12 y 16x16 píxeles. En la �gura 5.7 se puede ver la organiza ión

multisensor de la imagen de einstein original junto on los sensores a tivos dete tados.

Page 121: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.4. Efecto de pixelado 99

PSfrag repla ements

(A) (B)

(C) (D)

Figura 5.6: (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada 12x12.

(D) Imagen pixelada 16x16.

Page 122: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

100 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

(A) (B)

Figura 5.7: (A) Parti ión multisensor de la imagen original de la �gura 5.6 (Einstein). (B)

Sensores a tivos.

Tamaño de entorno RMSE d

1

8x8 21.496 571

12x12 23.636 902

16x16 24.983 1094

Tabla 5.3: Valores de las medidas de distorsión entre la imagen original (Einstein) y las

imágenes pixeladas.

En la tabla 5.3 se pueden ver los valores de las medidas de distorsión al uladas

entre la imagen original y ada una de las imágenes píxeladas.

✮ Imagen de los bar os:

Este experimento es igual al que se ha realizado sobre la imagen de Einstein pero

usando una es ena natural de un puerto on bar os (�guras 5.8 y 5.9).

La tabla donde se muestran los valores de las medidas de distorsión al uladas

entre la imagen original de los bar os y ada una de las imágenes pixeladas es la 5.4.

En ambos experimentos, si se muestra la imagen pixelada de tamaño 8x8 a un

sujeto que no haya visto a priori las imágenes originales, este sería apaz de distinguir

orre tamente el estímulo presentado (Einstein o es ena de bar os), es de ir, su

sistema visual es apaz de eliminar las altas fre uen ias introdu idas por los bordes

de los uadros que produ e el efe to de pixelado. En ambio, si nos �jamos en las

Tamaño de entorno RMSE d

1

8x8 22.164 355.6

12x12 25.542 840.1

16x16 27.376 1162.6

Tabla 5.4: Valores de las medidas de distorsión entre la imagen original (es ena de los bar-

os) y las imágenes pixeladas.

Page 123: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.4. Efecto de pixelado 101

(A) (B)

(C) (D)

Figura 5.8: (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada 12x12.

(D) Imagen pixelada 16x16.

Page 124: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

102 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

(A) (B)

Figura 5.9: (A) Parti ión multisensor de la imagen original de la �gura 5.8 (es ena de los

bar os). (B) Sensores a tivos.

imágenes más pixeladas (16x16), es asi imposible de ir que representa la imagen (si

no se ono e a priori).

Este efe to es mu ho más pronun iado en la es ena portuaria. Si observamos la

es ena de Einstein pixelada a 16x16 y onseguimos desenfo ar la imagen forzando el

mús ulo del ojo, podríamos llegar a ver la ara de Einstein ( on bastante di� ultad),

en ambio, si ha emos este experimento on la es ena de los bar os no es posible ver

la es ena original.

Si vemos los valores de ambas medidas en las tablas de datos, podemos ver que

RMSE mantiene valores similares para los tres niveles de pixela ión mientras que los

valores de d

1

re en mu ho más rápido onforme aumentamos el nivel de pixelado.

En on reto, en la tabla 5.4, la medida d

1

para el nivel 16x16 asi tripli a al valor

que se obtiene para el nivel 8x8 mientras que RMSE re e en una propor ión de,

aproximadamente, 1.24.

En de�nitiva, la medida d

1

pare e estable er una distin ión más lara entre lo que

es re ono ible y lo que no es re ono ible de a uerdo a omo lo haría un observador

humano.

5.5 Distinguibilidad de objetos

En esta se ión se muestran varios experimentos rela ionados on la dete tabilidad

de objetos en es enas naturales. En este ámbito, se han desarrollado diversas me-

didas para determinar la disimilaridad existente entre objetos presentes en es enas

naturales y su entorno (Copeland et al. [17℄ [16℄). Algunas de esas métri as se basan

en estadísti os de primer orden y otras ha en uso de estadísti os de orden superior,

que aptan rela iones espa iales existentes entre píxeles distantes en la imagen. Aún

así, la mayoría de ellas are en de una base sólida sobre la que operar ya que toman

Page 125: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.5. Distinguibilidad de objetos 103

omo datos de partida los valores de luminan ia de las imágenes en lugar de ha er

uso de algún tipo de modelo visual que tenga en uenta ara terísti as del SVH.

Una métri a que ha servido de base para el desarrollo de otras es la métri a de

Doyle:

Doyle =

q

(�

t

� �

b

)

2

+ (�

t

� �

b

)

2

(5.13)

donde �

t

y �

t

son la media y desvia ión estándar del área que omprende el objeto

y �

b

y �

b

son la media y desvia ión del fondo de la es ena. Esta métri a fun iona

bien en entornos ontrolados pero no o urre lo mismo uando usamos es enas del

mundo real. Copeland et al. [17℄ on luyen que esta es una de las medidas basadas

en estadísti os de primer orden que mejor orrela on medidas subjetivas he has por

observadores humanos.

5.5.1 Ordena ión de imágenes en base a la visibilidad de objetos

presentes en ellas

Las imágenes usadas en este experimento (Figuras 5.10 y 5.11) son 6 parejas, ada

una de las uales onsta de una es ena natural va ía y la misma es ena on un objeto

en el entro (en este aso se trata de un vehí ulo militar). Estas imágenes son de un

tamaño de 128x128 píxeles y han sido propor ionadas por el TNO Human Fa tors

Resear h Institute de Holanda. Han sido sele ionadas de entre un onjunto de 65

imágenes de similares ara terísti as. La sele ión se ha he ho de forma que se tenga

una muestra representativa de objetos on diferentes niveles de visibilidad, desde

muy visibles hasta po o o asi nada visibles. Para ver más ara terísti as té ni as

referentes al pro eso de apta ión de di has imágenes se puede ver el trabajo de

Toet [112℄. El experimento que se plantea en esta se ión onsiste en determinar

la visibilidad relativa de ada objeto respe to de su entorno inmediato usando la

medida de distorsión d

1

.

Para el ál ulo de la medida de distorsión d

1

se ha tomado, en ada par, omo

imagen de referen ia la que ontiene el objeto y omo imagen test la que ontiene sólo

la es ena va ía. De esta forma la parti ión multisensor realizada sobre la imagen on

el objeto podrá aptar, en on reto, las estru turas presentes en di ho objeto. En la

�gura 5.12 se puede ver la organiza ión multisensor de la imagen de referen ia de la

pareja A. También se muestran los sensores a tivos dete tados y una re onstru ión

de la imagen de referen ia usando el método expuesto en la se ión 5.2 (e ua ión

5.12).

Los resultados de la medida d

1

se van a omparar on los obtenidos por RMSE

Page 126: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

104 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

(A)

(B)

(C)

Figura 5.10: 6 parejas de imágenes usadas en el experimento de dete ión de objetos. Cada

pareja onsta de una es ena natural va ía (dere ha) y la misma es ena on un

objeto en el entro (izquierda). (Continúa en la figura 5.11).

Page 127: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.5. Distinguibilidad de objetos 105

PSfrag repla ements

(D)

(E)

(F)

Figura 5.11: (Continua ión de la figura 5.10).

Page 128: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

106 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

Parti ión multisensor

Sensores a tivos

Re onstru ión

Figura 5.12: Parti ión del espe tro de la imagen on objeto de la pareja A de la �gura 5.10

y re onstru ión de la imagen usando la e ua ión 5.12.

y, además, on los obtenidos tras mostrar las imágenes a un grupo de observadores

humanos (Toet [112℄). En la tabla 5.5 se muestran di hos resultados. La primera

olumna indi a el par de imágenes sobre el que se trabaja. La olumna �Subjetivo�

muestra por una parte (sub- olumna �Orden�) la ordena ión que asignan el grupo

de sujetos del experimento a las imágenes de mayor a menor visibilidad del objeto

presente en ellas y por otra se muestra también una separa ión en lusters de di has

imágenes (ver Toet [112℄ para más detalles). La pertenen ia de dos o más imágenes

a un mismo luster indi a que no hay una ordena ión lara entre ellas por parte de

los observadores humanos, es de ir, dentro de un mismo luster es válida ualquier

ordena ión que hagamos de las imágenes. La olumna �RMSE� indi a el valor de

la medida RMSE entre la pareja de imágenes (sub- olumna �Valor�) y la posi ión

orrespondiente en la ordena ión de visibilidad (sub- olumna �Orden�). Por último

la última olumna (�d

1

�) muestra lo mismo que la anterior pero para la medida de

distorsión d

1

.

Para determinar uales son los lusters existentes, se ha he ho un estudio de las

fun iones de distribu ión a umuladas que se orresponden on las probabilidades de

dete ión de los objetos de las imágenes. Estas probabilidades de dete ión se han

obtenido en fun ión del tiempo medio ne esario por un observador humano para de-

te tar los objetos presentes en las imágenes. Para analizar la distinguibilidad relativa

entre los objetos, se ompara el área que hay bajo las urvas de probabilidad a umu-

lada. En base a estos valores se obtiene una ordena ión subjetiva. La determina ión

de la separa ión entre lusters se obtiene analizando los ru es que se produ en entre

las urvas de probabilidad a umulada. Para más detalles sobre este pro eso se puede

onsultar Toet [112℄.

Page 129: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.5. Distinguibilidad de objetos 107

Par Medidas de distorsión

Subjetivo RMSE d

1

Cluster Orden Valor Orden Valor Orden

A 1 1 6.626 4 75.796 1

B 2 4 6.680 3 31.493 4

C 1 2 7.096 1 55.732 3

D 1 3 6.748 2 61.413 2

E 3 5 5.611 5 18.954 5

F 3 6 5.350 6 15.665 6

Tabla 5.5: Valores de las medidas de distorsión y ordena iones para las parejas de imágenes

de la �gura 5.10.

En la �gura 5.13 se pueden ver las distintas ordena iones realizadas por los tres

métodos. En la primera olumna está la ordena ión subjetiva he ha por observadores

humanos. Se indi an los lusters mediante un re uadro que engloba a las imágenes

que pertene en a un mismo luster. La segunda olumna muestra la ordena ión

obtenida por RMSE. Aquí se ve que han ambiado las posi iones de los pares A y B

de forma que se rompe la ordena ión por lusters. Esto impli a una mala orrela ion

on el ranking subjetivo. Claramente el objeto del par A es más visible que el de

la pareja B. En la última olumna está la ordena ión he ha por d

1

. Aunque se han

inter ambiado las posi iones de los pares C y D, estos siguen estando dentro del

mismo luster y por tanto la ordena ión sería a eptable desde el punto de vista de

un observador humano.

5.5.2 Predi ión de la distinguibilidad visual de objetos

Rohaly et al. [98℄ han obtenido re ientemente que los modelos que uanti� an la

visibilidad de las diferen ias entre dos imágenes pueden prede ir la distinguibilidad

visual de objetos en es enas natuales. El experimento de esta se ión usa la mé-

tri a omputa ional d

1

para prede ir la distinguibilidad de objetos per ibida por

observadores humanos.

Para realizar este experimento se ha usado una base de datos de 44 imágenes on

ara terísti as similares a las del experimento de la se ión 5.5.1, es de ir, son es enas

naturales on vehí ulos militares en el entro, de forma que el nivel de visibilidad de

di hos vehí ulos es muy variado entre unas imágenes y otras debido a la distan ia

de la ámara, tamaño del vehí ulo, amu�aje utilizado, et . Esta base de datos ha

sido diseñada espe í� amente para este tipo de experimentos y ha sido reada por el

TNO HFRI de Holanda. Los detalles té ni os sobre la apta ión de estas imágens se

Page 130: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

108 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

A

A

A

B

B

B

C

C

C DD

D

E

EE

F

FF

Subjetivo RMSE d

1

Figura 5.13: Ordena iones de mejor a peor visibilidad de las imágenes de la �gura 5.10.

Page 131: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.5. Distinguibilidad de objetos 109

PSfrag repla ements

(A) (B) (C)

(D) (E) (F)

Figura 5.14: Muestra de las imágenes de la base de datos del TNO HFRI. (A) n

o

34, (B)

n

o

20, (C) n

o

36, (D) n

o

29, (E) n

o

15, (F) n

o

32.

pueden onsultar en Toet [113℄. En la �gura 5.14 se puede ver una muestra de esta

base de datos.

La determina ión de la distinguibilidad de los objetos presentes en las imágenes

se realiza mediante el siguiente método: Se va a de�nir la distinguibilidad visual de

un objeto omo la máxima separa ión angular entre el objeto y el punto de �ja ión

del ojo de forma que el objeto pueda ser distinguible omo algo que no pertene e

a su entorno (Wertheim [123℄). Esta es una medida simple y que se puede usar

en este tipo de experimentos, además requiere po os sujetos para realizarla (dos o

tres) (Toet et al. [114℄). La medida resultante ara teriza la extensión del área

de distinguibilidad entre el punto de �ja ión y el entro del objeto (Engel [25℄ [26℄

[27℄, Geisler et al. [39℄). La medida se al ula de la siguiente forma (Toet et al.

[114℄): Ini ialmente el observador inspe iona la imagen y �ja el objeto en su fóvea;

a ontinua ión, se olo a a una ierta distan ia y �ja un punto en la es ena a gran

distan ia angular del objeto. Cuando el observador �ja ese punto, el objeto debe

estar posi ionado en su ampo de visión periféri a de forma que sea indistinguible de

su entorno; el observador va �jando nuevos puntos de aten ión sobre la es ena que

Page 132: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

110 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

0.1 1 10 100 1000 10000

d1 (-)

0.01

0.1

1

10

dv (deg)

Figura 5.15: Rela ión entre la medida omputa ional d1 y la medida psi ofísi a de distin-

guibilidad visual.

estén ada vez más er a del objeto (en línea re ta) hasta que onsiga distinguirlo.

La distan ia angular entre el objeto y el punto más lejano donde es distinguible el

objeto se anota. Esta medida se ha e al menos tres ve es y la media de esas medidas

ara teriza la distinguibilidad del objeto en la dire ión de la re ta que se ha ido

trazando. La medida �nal se obtiene omo la media de todas las observa iones y de

todos los sujetos que parti ipan en el experimento.

Para poder apli ar la métri a d

1

se han ne esitado, además de las imágenes on

el objeto a dete tar, otras imágenes iguales que ellas pero sin di ho vehí ulo, es de ir,

la mismas es enas naturales pero sin el vehí ulo. De esta forma se puede apli ar el

método de representa ión desarrollado sobre la es ena on objeto y después apli ar

la medida d

1

tomando esa imagen omo imagen de referen ia y la imagen on la

es ena va ía omo imagen test.

La medida psi ofísi a de distinguibilidad se ha omparado on la medida ompu-

ta ional d

1

. En la �gura 5.15 se puede ver la rela ión existente entre ambas.

La representa ión se ha he ho en una es ala logarítmi a y se ha ajustado una

re ta mediante mínimos uadrados a la nube de puntos:

log dv = �0:85 + 0:43 log d

1

La orrela ión entre el logaritmo de los valores de d

1

y el logaritmo de la medida

Page 133: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.5. Distinguibilidad de objetos 111

de distinguibilidad visual es de 0.81, un valor su� ientemente alto omo para poder

aseverar que la métri a omputa ional produ e una buena predi ión de la visibilidad

de los objetos presentes en las imágenes tal y omo lo haría un observador humano.

5.5.3 Ordena ión de imágenes de la base de datos del TNO HFRI

Para llevar a abo este experimento, se ha usado de nuevo la base de datos del TNO

HFRI. En este aso se ha he ho un estudio ontrolado de la bondad de la medida

de distorsión d

1

sobre un sub onjunto de imágenes. En on reto se han usado 17

imágenes. El objetivo es evaluar el omportamiento global de las medidas RMSE

y d

1

en sub onjuntos extraidos de entre las 17 imágenes. La determina ión de la

bondad de ambas medidas se hará de forma similar a omo se hizo en la se ión

5.5.1, es de ir, se evaluará la distorsión existente entre ada pareja de imágenes ( on

objeto y sin objeto) y se ordenarán di has imágenes en fun ión del valor que produ e

ada una de las medidas.

Para ha er este experimento es ne esario ono er la ordena ión subjetiva de las

imágenes de la base de datos y los lusters que apare en. Tras realizar un estudio

sobre los datos realizados por una serie de observadores humanos, se han obtenido

los datos que se muestran en la tabla 5.6 (estos datos son parte de los que se usan

para el experimento de la se ión 5.5.2). En esta tabla apare en los valores de las dos

medidas de distorsión empleadas (RMSE y d

1

) y el valor del área que hay por debajo

de la urva que se obtiene tras al ular la probabilidad de dete ión a umulada. Este

último valor nos servirá para estimar la ordena ión subjetiva. Junto on esos valores

se indi a el orden relativo que o upa ada imagen en el ranking de ordena ión global

para ada medida. También se indi an, en la primera olumna los uatro lusters

que se han dete tado.

Para ada una de las imágenes de la base de datos, se ha medido el tiempo

que tarda ada uno de los individuos parti ipantes en el experimento, en dete tar los

objetos que hay presentes en ellas. Este tiempo estará en fun ión de diversos fa tores

omo por ejemplo, el tamaño del objeto, la visibilidad del mismo, su posi ión en la

imagen, el punto ini ial a partir del que se omienza la búsqueda, la estrategia de

búsqueda, et . Con estos tiempos, se puede onstruir una fun ión de distribu ión

empíri a, para ada imagen, que determine la probabilidad de dete tar el objeto

presente en ella en un tiempo dado. Esta fun ión empíri a tienen un omportamiento

que se puede modelar mediante la siguiente fun ión teóri a (Krendel et al. [63℄,

Rotman et al. [100℄, Waldman et al. [116℄):

Page 134: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

112 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

Área RMSE d

1

Cluster Imagen Valor Orden Valor Orden Valor Orden

C

1

16 96.39 2 2.55 21 8.95 20

C

1

34 96.37 3 30.48 1 2444.88 1

C

1

18 96.02 7 4.51 11 201.56 7

C

1

20 95.77 8 6.99 8 114.93 8

C

1

10 95.63 11 3.20 17 19.16 14

C

2

28 93.48 12 3.86 12 6.19 25

C

2

43 93.34 13 5.49 9 60.11 11

C

2

36 92.81 15 4.56 10 69.01 10

C

2

6 90.95 19 1.94 27 7.57 22

C

2

29 89.47 22 1.60 29 2.73 28

C

3

8 84.47 24 1.57 30 4.49 26

C

3

23 82.91 26 1.42 32 2.25 29

C

3

38 82.52 27 2.54 22 1.15 32

C

3

15 80.46 28 1.17 33 1.51 31

C

3

32 79.52 30 1.12 34 1.56 30

C

3

21 73.84 33 1.35 31 0.98 35

C

4

4 53.89 36 0.98 36 0.48 36

Tabla 5.6: Datos de las 17 imágenes de la base de datos del TNO HFRI. Para ada imagen se

muestra el luster al que pertene e y las tres ordena iones onsideradas: subjetiva,

RMSE y d

1

. También se muestran los valores del área que hay por debajo de la

urva de probabilidad de dete ión a umulada y de las otras dos medidas usadas.

Page 135: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.5. Distinguibilidad de objetos 113

0

0.2

0.4

0.6

0.8

1

0 5 10 15 20 25

16,3418,2010

28,43,366,29

8,23,38,15,32,21

4

Figura 5.16: Fun iones de distribu ión teóri as del tiempo de dete ión para las 17 imágenes

de la base de datos. Con un ír ulo se indi an los lusters dete tados.

P

d

(t) =

(

0 si t < t

0

1� exp

t�t

0

si t � t

0

(5.14)

donde t

0

es el mínimo tiempo de respuesta obtenido y � es una onstante. P

d

(t)

representa, por tanto, la fra ión de dete iones orre tas hasta un tiempo t. Estos

autores han omprobado la validez de esta distribu ión teóri a para prede ir el tiempo

de dete ión de objetos en entornos naturales.

Se ha he ho un ajuste de las fun iones de distribu ión empíri as mediante fun-

iones teóri as omo la que se presenta en la e ua ión 5.14. Para ha er este ajuste

se han dejado omo parámetros libres t

0

y � . En la �gura 5.16 se pueden ver las

grá� as de las fun iones teóri as obtenidas.

Una vez que tenemos las urvas teóri as pro edemos a determinar los lusters

que existen. Entenderemos que dos imágenes pertene en a un mismo luster si

sus urvas de probabilidad de dete ión son su� ientemente pare idas. El he ho

de que dos urvas sean similares impli a que los objetos que hay en las imágenes

son, aproximadamente, igual de omplejos en uanto al tiempo que se requiere para

Page 136: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

114 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

N

o

errores d

1

RMSE

0 208 104

1 0 0

2 545 379

3 0 0

4 229 432

5 0 0

6 18 85

7 0 0

8 0 0

9 0 0

10 0 0

Tabla 5.7: Tasas de error de d

1

y RMSE en los sub onjuntos sele ionados.

dete tarlos y por tanto, en uanto a la visibilidad de los mismos. De esta forma, si

dos imágenes pertene en al mismo luster podremos de ir que la visibilidad de los

objetos presentes en ellas es similar y, por tanto, el lugar que o upen en la ordena ión

relativa que puedan ha er personas distintas estará más en fun ión de ir unstan ias

parti ulares de los individuos que parti ipan en el experimento, omo por ejemplo el

punto de �ja ión donde omienzan a ha er la explora ión de la imagen, que en las

ondi iones de visibilidad de los propios objetos. De esta forma daremos por buena

una ordena ión que altere ordena iones dentro de un mismo luster.

Para determinar la similaridad de dos fun iones usaremos el test de Kolmogorov-

Smirnov (Law et al. [64℄, Press et al. [96℄). Tras ha er este estudio on todas las

fun iones ( on una bondad del 99%) se obtienen los lusters de la tabla 5.6 que se

pueden ver de forma grá� a en la �gura 5.16.

El planteamiento del experimento es el siguiente: dadas las 17 imágenes de la

base de datos, se han sele ionado de forma aleatoria 1.000 sub onjuntos de ellas

y se ha estudiado el omportamiento de las medidas RMSE y d

1

sobre estos sub-

onjuntos. El número de apari iones de ada imagen en todos los sub onjuntos es

aproximadamente uniforme. En la tabla 5.7 se puede omparar la tasa de fallos

que tienen las dos medidas. En esta tabla se muestra el número de sub onjuntos

en los que d

1

(segunda olumna) y RMSE (ter era olumna) ometen un número

determinado de fallos (primera olumna).

Se puede apre iar que, en global, d

1

omete menos errores que RMSE en las

lasi� a iones que realiza. Mientras que el número de errores que omete RMSE

está en torno a los 4, la tasa de error de d

1

se sitúa alrededor de 2. Además, para un

número alto de errores, RMSE omete bastantes más errores que d

1

.

Page 137: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.6. Evaluación de la calidad de imágenes comprimidas 115

Este experimento no ha e un estudio exhaustivo sobre el omportamiento de

RMSE frente a la medida d

1

, aunque es una muestra signi� ativa. La inten ión

del mismo es mostrar la mejora que puede suponer el uso de una medida per eptual

en asos en los que el omportamiento de las medidas lási as del tipo de RMSE

obtienen malos resultados.

5.5.4 Búsqueda visual

Una ara terísti a de interés en la tarea de dete ión de objetos por parte el SVH,

es el tiempo que se tarda en dete tarlos; esto es de vital importan ia, por ejemplo,

en apli a iones militares. Sin embargo, las ara terísti as que posee un buen sistema

(en este aso un sistema humano) de búsqueda visual son mu has más. Entre ellas,

el ono imiento a priori que tenga el sistema sobre los objetos que está intentando

lo alizar en la imagen.

Un objeto no es distinguible por si mismo sino por la diferen ia que existe entre

él y su entorno y por tanto uanto más distinto sea de su entorno más fá il (y más

rápido) será de dete tar. El experimento de esta se ión estudia la apa idad de la

medida d

1

para prede ir la bondad de la búsqueda visual que realiza el sistema visual

humano.

El experimento es el siguiente: Un grupo de observadores van a visualizar una

serie de imágenes que ontienen un objeto (un vehí ulo militar). Se va a medir el

tiempo medio que tardan en dete tar di ho vehí ulo y esta será la medida que nos

determine la distinguibilidad del objeto.

En la �gura 5.17 se muestra la rela ión entre la métri a d

1

y los tiempos medios

de búsqueda para ada imagen. Un ajuste por mínimos uadrados del logaritmo de

los datos obtiene la siguiente rela ión entre ambas medidas:

logST = 1:15 � 0:27 log d

1

donde ST representa el tiempo medio de búsqueda (en segundos). La orrela ión

entre ambas medidas es de 0.82. Este valor indi a una buena aproxima ión entre los

resultados que predi e d

1

y los obtenidos por observadores humanos.

5.6 Evalua ión de la alidad de imágenes omprimidas

En este experimento se pretende evaluar la alidad visual que tienen las imágenes que

son pro esadas por algoritmos de ompresión on pérdidas. En on reto, la té ni a

de ompresión on pérdidas usada en este trabajo es el estándar Joint Photographi

Page 138: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

116 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

0.1 1 10 100 1000 10000

d1 (-)

1

10

100

ST (s)

Figura 5.17: Rela ión entre la medida d

1

y el tiempo medio de búsqueda. La línea ontínua

representa el ajuste por mínimos uadrados.

Expert Group (JPEG) (Walla e [117℄, Leger et al. [65℄). La importan ia que tienen

este tipo de algoritmos en la a tualidad es muy elevada, ya que ada vez hay mayor

demanda de transmisión de informa ión (TV digital, video onferen ia, satélites, ...)

por unos anales que tienen una apa idad limitada. Puesto que aumentar la apa-

idad del anal no siempre es posible debido a fa tores e onómi os o imposibilidad

material, se impone omprimir al máximo las imágenes que se transmiten on la

mínima pérdida de alidad en su re ep ión. Hay dos tipos de algoritmos de ompre-

sión: sin pérdida y on pérdida. En las té ni as de ompresión sin pérdida la imagen

que llega al re eptor, tras ser de odi� ada, es exa tamente igual a la imagen que fué

enviada por el emisor; en ambio, en las té ni as on pérdida, la imagen re ibida no

es exa tamente igual a la enviada. La diferen ia entre unas té ni as y otras es la

razón de ompresión, mientras que en las primeras esa razón suele ser baja (5:1), en

las segundas se pueden al anzar razones muy elevadas (100:1) a ambio de alguna

pérdida en la alidad de la imagen re ibida ( uanto mayor sea el grado de ompresión

menor será la alidad de la imagen re ibida).

En el algoritmo JPEG, el grado de ompresión se ontrola mediante un pará-

metro denominado fa tor de alidad (qf ) que lo que ha e es ambiar la matriz de

uantiza ión usada en di ho algoritmo (Leger et al. [65℄). Un fa tor de alidad bajo

da lugar a un alto grado de ompresión y peor alidad de la imagen y un fa tor de

Page 139: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.6. Evaluación de la calidad de imágenes comprimidas 117

alidad alto impli a po a ompresión y mejora en la alidad de la imagen.

5.6.1 Rela ión entre la medida de distorsión d

1

y el fa tor de alidad

de ompresión

En este experimento vamos a medir la distorsión existente entre la imagen original

de la �gura 5.18, a la que llamaremos f(x; y), y esa misma imagen omprimida on

fa tores de alidad que variarán entre 1 y 99; denominaremos a ada una de esas

imágenes

d

f

qf

(x; y) donde qf es el fa tor de alidad on el que ha sido omprimida

la imagen original. Se pueden ver algunas de estas imágenes omprimidas en las

�guras 5.18 y 5.19. La imagen de partida es la imagen de los bar os que se usó en

un experimento anterior.

También se ha al ulado la medida RMSE para poder ha er una omparativa.

Se ha elegido esta medida por ser una de las más utilizadas a pesar de ser ono idos

los defe tos que tiene. Los valores de ambas medidas d

1

se pueden ver en la tabla

5.8 y grá� amente en la �gura 5.20.

Se puede ver que para valores del fa tor de alidad altos, la métri a d

1

re e

aproximadamente en la misma propor ión que lo ha e RMSE. Si bien, se puede

apre iar una primera diferen ia: los valores de d

1

son similares entre si (próximos a

0 ó 1) mientras que los valores de RMSE tienen un rango de valores más amplio.

Es de ir, el re imiento de ambas fun iones es más o menos lineal salvo que en el

aso de RMSE la pendiente es más pronun iada que en el de d

1

. Si vemos las

imágenes omprimidas on niveles de alidad mayores que 40 (aproximadamente),

no apre iaremos gran diferen ia entre ellas e in luso entre ualquiera de ellas y la

original a simple vista, lo ual es un dato a favor de la medida d

1

que nos está

indi ando on esos valores, que la diferen ia entre esas imágenes y la original es muy

leve y además que las diferen ias entre ellas tampo o son laramente distinguibles

a simple vista. Por el ontrario, RMSE asigna valores de distorsión laramente

diferen iados entre las imágenes on fa tor de alidad próximo a 100 y las que tienen

fa tores de alidad próximo a 40 (mayor que 40).

La segunda diferen ia importante la podemos ver para fa tores de alidad ba-

jos. La diferen ia visual entre la imagen original y las imágenes omprimidas se va

ha iendo más evidente al disminuir el fa tor. Además, basta on un pequeño de re-

mento de di ho fa tor para per ibir diferen ias visuales laras. Esto se debe a que el

efe to de bloques afe ta a zonas diferentes de la imagen uando variamos el fa tor de

alidad. Este he ho se ve re�ejado de nuevo en la medida d

1

que tiene un re imiento

mu ho más a elerado que RMSE.

Page 140: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

118 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

Original qf = 80

qf = 40 qf = 30

qf = 25 qf = 20

Figura 5.18: Muestra de las imágenes usadas en el experimento (1). En la esquina superior

izquierda está la imagen original y el resto son imágenes omprimidas on el

algoritmo JPEG a distintos niveles de alidad (80,40,30,25,20).

Page 141: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.6. Evaluación de la calidad de imágenes comprimidas 119

PSfrag repla ements

qf = 17 qf = 14

qf = 11 qf = 8

qf = 5 qf = 2

Figura 5.19: Muestra de las imágenes usadas en el experimento (2). Imágenes omprimidas

on el algoritmo JPEG a distintos niveles de alidad (17,14,11,8,5,2).

Page 142: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

120 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

0

50

100

150

200

10 20 30 40 50 60 70 80 900

2

4

6

8

10

12

14

16

18

20

10 20 30 40 50 60 70 80 90

PSfrag repla ements

d

1

f;

d

f

qf

RMSE

f;

d

f

qf

Fa tor de alidadFa tor de alidad

Figura 5.20: Comparativa entre los valores de las medidas de distorsión d1 y RMSE frente

al fa tor de alidad del algoritmo de ompresión JPEG.

Si ahora omparamos visualmente las imágenes on fa tor de alidad 30 y 80

(�gura 5.18) respe to de la original omprobaremos que la diferen ia es mínima. d

1

tiene un in remento de 2.5816 unidades mientras que RMSE tiene un in remen-

to de 3.4786 unidades, que normalizadas frente al máximo obtenido por ada una

de las medidas resultan en 0.01197 y 0.1828 respe tivamente. Si ahora ha emos lo

mismo on las imágenes de fa tores de alidad 8 y 17 (�gura 5.19) tendremos que el

in remento para d

1

es de 23.3166 y el in remento para RMSE es de 3.0237 (normali-

zados frente al máximo de ada medida resultan en 0.1081 y 0.1589 respe tivamente).

RMSE mantiene que el in remento en la diferen ia de esas imágenes es similar al

que había entre la pareja anterior mientras que d

1

indi a que el in remento en esa

diferen ia es mu ho mayor. Si vemos las imágenes on luiremos de nuevo la mejoría

que supone el uso de la métri a d

1

. Mientras que las imágenes on fa tores 30 y 80

son prá ti amente indistinguibles una de otra, las que tienen fa tores 8 y 17 ya no

son tan similares entre si, ya que en la de peor fa tor se apre ian laramente bloques

que no apare en en la de fa tor 17.

En la �gura 5.21 se muestran las derivadas orrespondientes a las fun iones mos-

tradas en la �gura 5.20. Con estas fun iones se apre ia mejor el salto que se produ e

en la alidad visual de dos imágenes omprimidas on fa tores de alidad onse uti-

vos. Las derivadas están obtenidas onvolu ionando la fun ión original on un nú leo

DoG (derivada de gaussiana) de es ala � = 1. La onvolu ión ir ular on este nú-

leo (de tamaño 9 unidades) produ e el efe to de de re imiento brus o al omienzo

y al �nal de ambas fun iones afe tando a los 3 ó 4 valores de los extremos (estos no

serán tenidos en uenta en las valora iones). De ualquier forma, en los dos extremos

ambas fun iones tendrían un valor muy próximo a ero (sin llegar a ser negativo).

Page 143: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.6. Evaluación de la calidad de imágenes comprimidas 121

qf d1 rmse - qf d1 rmse - qf d1 rmse

1 215.6002 19.0254 34 2.0378 6.8738 67 0.4853 4.8453

2 215.5545 19.0177 35 1.8483 6.7759 68 0.4037 4.7679

3 189.6434 18.0452 36 1.8232 6.6951 69 0.3755 4.7018

4 123.1069 15.9439 37 1.8212 6.6466 70 0.3738 4.6112

5 83.9636 14.4698 38 1.6739 6.5587 71 0.3317 4.5330

6 55.6957 13.3684 39 1.4582 6.4954 72 0.3361 4.4539

7 39.5904 12.5436 40 1.4537 6.4513 73 0.3185 4.3815

8 31.2808 11.9314 41 1.3404 6.3588 74 0.2580 4.2826

9 23.7312 11.3961 42 1.2927 6.3214 75 0.2581 4.2226

10 22.0397 10.9637 43 1.2680 6.2575 76 0.2516 4.1164

11 18.5348 10.5605 44 1.1558 6.1821 77 0.2152 4.0132

12 15.1491 10.1888 45 1.1616 6.1405 78 0.1981 3.9295

13 12.7487 9.8428 46 1.1149 6.0690 79 0.1994 3.8417

14 11.2821 9.5852 47 1.1144 6.0184 80 0.1646 3.7368

15 9.5917 9.3150 48 1.0444 5.9771 81 0.1588 3.6193

16 8.5635 9.1032 49 0.9260 5.9128 82 0.1403 3.5193

17 7.9642 8.9077 50 0.9264 5.8780 83 0.1215 3.3983

18 7.0958 8.7147 51 0.9276 5.8385 84 0.1192 3.2808

19 6.5061 8.5576 52 0.9216 5.7681 85 0.1094 3.1558

20 5.4611 8.3963 53 0.9061 5.7222 86 0.0804 3.0159

21 5.1760 8.2387 54 0.9059 5.6630 87 0.0795 2.9003

22 4.8098 8.1054 55 0.7930 5.6072 88 0.0767 2.7473

23 4.3930 7.9682 56 0.7989 5.5475 89 0.0706 2.6116

24 4.1733 7.8444 57 0.7416 5.4867 90 0.0475 2.4479

25 3.8069 7.7348 58 0.6706 5.4215 91 0.0469 2.2995

26 3.4562 7.6249 59 0.6721 5.3716 92 0.0460 2.1283

27 3.0829 7.5081 60 0.6643 5.3120 93 0.0344 1.9441

28 2.9839 7.3963 61 0.6023 5.2441 94 0.0276 1.7321

29 2.9513 7.3154 62 0.5914 5.1838 95 0.0266 1.5216

30 2.7462 7.2154 63 0.5878 5.1128 96 0.0199 1.2818

31 2.4769 7.1248 64 0.5880 5.0587 97 0.0199 1.0390

32 2.3432 7.0334 65 0.4977 4.9864 98 0.0195 0.7709

33 2.1030 6.9408 66 0.4824 4.9098 99 0.0177 0.4806

Tabla 5.8: Valores de las medidas de distorsión d1 y RMSE entre la imagen original de

la �gura 5.18 y ls misma imagen omprimida mediante el algoritmo JPEG on

fa tores de alidad (qf) entre 1 y 99.

Page 144: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

122 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

PSfrag repla ements

�d

1

f;

f

qf

�qf

�RMSE

f;

f

qf

�qf

Figura 5.21: Derivadas de las fun iones de la �gura 5.20.

Se puede observar omo, para valores de qf pequeños, la diferen ia medida por d

1

re e mu ho más que la medida por RMSE. De he ho, si observamos las imágenes

omprimidas, el efe to de bloques típi o que se produ e al omprimir on JPEG se

empieza a apre iar más laramente sobre las nubes del fondo a partir de fa tores de

alidad menores que 25 ó 30. Este he ho se puede ver re�ejado en la amplia ión de

la �gura 5.21 donde la grá� a de d

1

empieza a mostrar un aumento en la velo idad

de re imiento mientras que la grá� a de RMSE no varía esen ialmente su ompor-

tamiento en esa región. Es de ir, a partir de ese fa tor, la alidad de la imagen se va

degradando a pasos ada vez mayores.

5.6.2 Experimento 2

Este experimento es igual que el anterior pero ha e uso de otra imagen. En este aso

se trata de una mamografía digitalizada a una resolu ión de 256x256 píxeles (�gura

5.22(A)). La parti ión multisensor se muestra en la �gura 5.23.

Los niveles de ompresión JPEG que se han usado son de 80, 20 y 10 (�gura

5.22(B), (C) y (D))

En la tabla 5.9 se pueden ver los valores de las medidas entre la imagen original

y ada una de las imágenes omprimidas. En la imagen más omprimida se puede

Page 145: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.6. Evaluación de la calidad de imágenes comprimidas 123

PSfrag repla ements

(A) (B)

(C) (D)

Figura 5.22: (A) Imagen de una mamografía. (B) Mamografía omprimida on un fa tor

de alidad de 80. (C) Mamografía omprimida on un fa tor de alidad de 20.

(D) Mamografía omprimida on un fa tor de alidad de 10.

PSfrag repla ements

(A) (B)

Figura 5.23: (A) Parti ión multisensor de la mamografía. (B) Sensores a tivos dete tados.

Page 146: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

124 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

Fa tor de alidad RMSE d

1

80 1.305 0.223

20 2.604 7.345

10 3.846 21.98

Tabla 5.9: Valores de las medidas de distorsión entre la imagen original y las imágenes

omprimidas.

apre iar laramente el efe to de bloques que produ e la ompresión JPEG mientras

que en las otras, este efe to es bastante menos pronun iado. Este he ho se re�eja

perfe tamente en los valores de d

1

que tienen un re imiento mu ho mayor que los

valores de RMSE.

5.6.3 Rela ión entre la alidad visual de imágenes omprimidas y

la onspi uidad visual

Este experimento investiga la rela ión entre la métri a d

1

y la distinguibilidad de ob-

jetos per ibida por observadores humanos, usando imágenes omprimidas mediante

el método JPEG on diferentes fa tores de alidad.

Para llevarlo a abo se han usado dos parejas de imágenes similares a las del

experimento des rito en la se ión 5.5.1, es de ir, parejas de imágenes tal que una es

una es ena natural y la otra es la misma es ena on un objeto en el entro.

La primera pareja de imágenes se muestra en la �gura 5.24. (A) muestra la imagen

original on objeto y (E) la imagen original sin objeto. (B), (C) y (D) muestran la

imagen original (A) omprimida on fa tores de alidad 10, 9 y 5 respe tivamente;

(F), (G) y (H) muestran la imagen original (E) omprimida a los niveles de alidad

10, 9 y 5 respe tivamente. El mismo experimento ha sido llevado a abo sobre un

segundo par de imágenes (�gura 5.25); en este segundo aso los niveles de ompresión

han sido de 10, 9 y 8.

Los fa tores de alidad del algoritmo de ompresión se han elegido de forma que

la diferen ia per eptual medida por d

1

sea aproximadamente igual entre niveles de

ompresión onse utivos, es de ir, d

1

(A;B) � d

1

(B;C) � d

1

(C;D). Las �e has

entre imágenes indi an la diferen ia per eptual existente entre ellas.

La distinguibilidad visual de los objetos de las imágenes presentadas (A)...(D)

han sido medidas por dos observadores usando el pro edimiento des rito en la se ión

5.5.2.

Los experimentos de esta se ión se han realizado en una habita ión on po a

ilumina ión. Las imágenes son de tamaño 1024x1024 pixeles y el área de la pantalla

es de 27x27 m. Los dos sujetos parti ipantes se han situado a una distan ia de 40

Page 147: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.6. Evaluación de la calidad de imágenes comprimidas 125

(A)

(B)

(C)

(D)

(E)

(F)

(G)

(H)

68.86

62.19

46.40

60.26

36.6

837

.24

30.4

2

30.4

2

36

105

Figura 5.24: Primera pareja de imágenes. (A) Imagen original on objeto. (E) Imagen ori-

ginal sin objeto. (B), (C), (D) Imagen (A) omprimida a niveles de alidad de

10, 9 y 5 respe tivamente. (F), (G), (H) Imagen (E) omprimida on fa tores

de alidad 10, 9 y 5 respe tivamente.

Page 148: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

126 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

(A)

(B)

(C)

(D)

(E)

(F)

(G)

(H)

60.06

60.67

63.20

57.40

39.7

233

.88

35.4

5

43

35.4

5

51

Figura 5.25: Segunda pareja de imágenes. (A) Imagen original on objeto. (E) Imagen ori-

ginal sin objeto. (B), (C), (D) Imagen (A) omprimida a niveles de alidad de

10, 9 y 8 respe tivamente. (F), (G), (H) Imagen (E) omprimida on fa tores

de alidad 10, 9 y 8 respe tivamente.

Page 149: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

5.6. Evaluación de la calidad de imágenes comprimidas 127

0

20

40

60

80

100

0 0.05 0.1 0.15 0.2

0

20

40

60

80

100

0 0.05 0.1 0.15 0.2

PSfrag repla ements

d

1

d

1

1

qf

1

qf

(A) (B)

Figura 5.26: Rela ión entre la métri a d1 y el fa tor de alidad (A) para la primera pareja

y (B) para la segunda pareja (B).

entímetros de la imagen. Cada observador estima la distinguibilidad del objeto en

uatro dire iones diferentes (arriba, abajo, izquierda, dere ha).

En la �gura 5.26 se puede observar la medida d

1

en fun ión de la inversa del

fa tor de alidad. La grá� a (A) se orresponde on la �gura 5.24 y la (B) on la

�gura 5.25. La línea ontínua representa la diferen ia per eptual medida por d

1

entre

la imagen on objeto (A) y esa misma imagen omprimida a diferentes niveles de

alidad (B), (C) y (D). Estos resultados muestran que d

1

se in rementa onforme

de re e la alidad de las imágenes.

Las líneas de puntos representan la diferen ia per eptual existente entre las pa-

rejas de imágenes on y sin objeto, es de ir d

1

(A;E), d

1

(B;F ), d

1

(C;G) y d

1

(D;H).

Esta grá� a es asi onstante lo que demuestra, que la diferen ia per eptual entre

una imagen y la misma imagen on un objeto en el entro es independiente del nivel

de ompresión elegido.

La �gura 5.27 muestra la rela ión entre la medida omputa ional d

1

y la inversa de

la medida de distinguibilidad visual obtenida por el método psi ofísi o de la se ión

5.5.1. La línea ontínua es para la primera pareja y la dis ontínua para la segunda. Se

puede observar en ambos asos que la medida d

1

se in rementa onforme de rementa

la distinguibilidad visual. O di ho de otro modo, onforme disminuimos el fa tor de

alidad del algoritmo de ompresión JPEG hemos de a er ar más el punto de �ja ión

usado en la determina ión psi ofísi a de la distinguibilidad para poder asegurar la

distinguibilidad del objeto presente en la imagen.

En el aso de la segunda pareja de imágenes este he ho pare e menos evidente.

Esto es debido fundamentalmente al efe to de bloques produ ido por el algoritmo

JPEG. En la segunda pareja los bloques han oin idido de forma que han deformado

Page 150: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

128 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual

0

20

40

60

80

100

0 0.5 1 1.5 2

d1

1/dv (1/deg)

Figura 5.27: Rela ión entre la métri a d1 y la medida psi ofísi a de dintinguibilidad para la

primera pareja (línea ontínua) y para la segunda pareja (línea dis ontínua).

el objeto y por tanto se ha e muy difí il su identi� a ión. En la primera pareja,

esta deforma ión no ha afe tado tanto a las ara terísti as que ha en identi� able el

objeto omo un vehí ulo militar.

Page 151: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Con lusiones y Líneas futuras

Con lusiones

Las on lusiones fundamentales que se derivan de la investiga ión realizada en esta

Tesis son las siguientes:

✮ Se ha desarrollado un modelo de representa ión de imágenes digitales de niveles

de gris inspirado en algunas de las propiedades del SVH.

✮ Se ha demostrado que ha iendo uso de una por ión relativamente baja del es-

pe tro fre uen ial, es posible mejorar métodos lási os de parti ión multi anal

en donde se pro esa el espe tro ompleto.

✮ A través de los resultados experimentales, se ha demostrado la validez del uso

de fun iones de Gabor omplejas para la modeliza ión de los ampos re eptivos

de las élulas simples del órtex visual.

✮ Se han desarrollado distintos métodos de extra ión de es alas naturales glo-

bales on éxito. En on reto, se ha desarrollado un método basado en una

representa ión de la imagen en un dominio intermedio entre el espa ial y el

fre uen ial: el dominio de Gabor.

✮ Se ha desarrollado un método de extra ión de es alas naturales lo ales que

ha e uso del modelo de representa ión propuesto.

✮ Se ha desarrollado una medida de distorsión per eptual, a partir del modelo

de representa ión propuesto, que orrela bien on observa iones he has por

humanos. En on reto, esta medida mejora los resultados que obtiene una de

las medidas lási as más utilizadas hasta el momento (RMSE).

129

Page 152: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

130 Conclusiones y líneas futuras

Líneas futuras de investiga ión

Como onse uen ia de la investiga ión realizada quedan abiertas diversas líneas de

investiga ión; las más relevantes se itan a ontinua ión:

✮ Uso de una parti ión multi anal ompletamente dependiente de los datos.

✮ In orporar el método de dete ión de es alas lo ales a una nueva medida de

distorsión.

✮ Extensión del modelo para la representa ión de imágenes en olor.

✮ Extensión de la medida de distorsión a imágenes en olor.

✮ Extender el uso de modelos de representa ión omo el aquí desarrollado a la

resolu ión de otras problemáti as en el ámbito del pro esamiento de imágenes

digitales, tales omo:

✬ Dete ión de aristas.

✬ Puesta en orresponden ia de imágenes estéreo.

✬ Dete ión de objetos en imágenes en movimiento.

✬ Cara teriza ión de formas.

✬ Dis rimina ión de texturas.

✬ Real e de imágenes y elimina ión de ruido.

✬ Fusión de imágenes infrarrojas para mejorar la visibilidad de objetos.

✮ Desarrollo de me anismos de ompresión de imágenes basados en los modelos

de representa ión per eptuales omo el aquí desarrollado.

Page 153: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Apéndi e A

Nota ión

La nota ión usada a lo largo de la Tesis es la siguiente:

✮ Las letras x e y se usan para ha er referen ia a posi iones en el dominio espa ial

de una imagen.

✮ Las letras u y v se usan para ha er referen ia a posi iones en el dominio fre-

uen ial de una imagen.

✮ Las variables N y M se usan para ha er referen ia al tamaño de la imagen, en

píxeles, horizontal y verti al respe tivamente.

✮ El símbolo denota el operador de onvolu ión de dos imágenes.

✮ La fun ión FFT (f(x; y)) es la Transformada de Fourier Dire ta dis reta de

f(x; y) de�nida omo

F (u; v) = FFT (f(x; y)) =

1

M �N

N�1

X

x=0

M�1

X

y=0

f (x; y) exp

�2�i

ux

N

+

vy

M

��

✮ La fun ión FFT

�1

(F (u; v)) es la Transformada de Fourier Inversa dis reta de

F (u; v).

✮ Cuando hablamos de medir la distorsión entre una imagen de referen ia y una

imagen test, notaremos a la imagen test on el símbolob. Por ejemplo, si f(x; y)

es la imagen de referen ia, enton es

b

f(x; y) será la imagen test.

✮ La re onstru ión de una imagen se notará one. Por ejemplo, si f(x; y) es la

imagen original, notaremos omo

e

f(x; y) a la re onstru ión de di ha imagen

(las re onstru iones se ha en on el método detallado en el apítulo 5).

131

Page 154: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

132 Apéndice A. Notación

Page 155: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Apéndi e B

Fun iones gaussianas y Gabor

B.1 Fun iones gaussianas

Los parámetros que de�nen una fun ión gaussiana son los siguientes (ver Graham

[43℄ para más detalles):

Parámetro Signi� ado

x, y Coordenadas espa iales

x

Es ala horizontal

y

Es ala verti al

� Ángulo (en radianes)

x

0

, y

0

Desplazamiento de la gaussiana respe to al origen de oordenadas

Las es alas horizontal y verti al �jan la amplitud de la fun ión gaussiana de

forma que si denominamos W al diámetro de la gaussiana a media altura, enton es

obtenemos la es ala � de la igualdad W = 2

p

2 ln 2�.

La fun ión gaussiana tridimensional se onstruye a partir de dos fun iones gaus-

sianas bidimensionales tal omo se ve en el ejemplo de la �gura B.1. La expresión

fun ional de la fun ión es la siguiente:

gauss (x; y; �

x

; �

y

; �; x

0

; y

0

) =

1

2��

x

y

g

1

(x; y; �

x

; �; x

0

; y

0

) g

2

(x; y; �

y

; �; x

0

; y

0

)

(B.1)

133

Page 156: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

134 Apéndice B. Funciones gaussianas y Gabor

-10-5

05

10 -10

-5

0

5

10

0

1

-10-5

05

10 -10

-5

0

5

10

0

*

-10-5

05

10 -10

-5

0

5

10

0

1

PSfrag repla ements

g

1

(x; y; 1; 0:3; 0; 0) g

2

(x; y; 2:5; 0:3; 0; 0)

gauss (x; y; 2:5; 1; 0:3; 0; 0)

Figura B.1: Obten ión de una gaussiana 3D on orienta ión a partir de dos gaussianas 2D

orientadas.

g

1

(x; y; �; �; x

0

; y

0

) = exp

0

B

�2:77

((x� x

0

) os � + (y � y

0

) sin �)

2

2�

p

2 lg (2)

2

1

C

A

(B.2)

g

2

(x; y; �; �; x

0

; y

0

) = exp

0

B

�2:77

(� (x� x

0

) sin � + (y � y

0

) os �)

2

2�

p

2 lg (2)

2

1

C

A

(B.3)

En la �gura B.2 se pueden ver algunos ejemplos de gaussianas variando los valores

que pueden tomar sus parámetros.

B.2 Fun iones de Gabor

Una fun ión de Gabor se onstruye modulando una fun ión gaussiana (e ua ión B.1)

on otra fun ión de tipo sinusoidal (seno o oseno). Los parámetros que permiten

Page 157: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

B.2. Funciones de Gabor 135

(A) (B) (C) (D) (E)

PSfrag repla ements

x

0

y

0

x

x

x

y

y

y

� = 0

x

= �

y

= 10

x

0

= y

0

= 0

� = 0

x

= 6, �

y

= 12

x

0

= y

0

= 0

� = 0

x

= 12, �

y

= 6

x

0

= y

0

= 0

� = 0:6

x

= 6, �

y

= 12

x

0

= y

0

= 0

� = 0:6

x

= 6, �

y

= 12

x

0

= 16, y

0

= 10

Figura B.2: Muestra de fun iones gaussianas on diferentes parámetros.

de�nir una fun ión de Gabor son los siguientes (ver Graham [43℄ para más detalles):

Parámetro Signi� ado

x, y Coordenadas espa iales

x

Es ala horizontal

y

Es ala verti al

g

Ángulo de la gaussiana (en radianes)

m

Ángulo de la fun ión moduladora (en radianes)

� Fre uen ia radial

x

0

, y

0

Desplazamiento del entro de la fun ión respe to al origen

x

, �

y

Centro del �ltro paso banda en el dominio fre uen ial

N , M Tamaño de la imagen en píxeles horizontales y verti ales

donde �

x

= � os �

m

y �

y

= � sin �

m

es el entro del �ltro paso banda en el

dominio fre uen ial.

La e ua ión que de�ne el �ltro de Gabor omplejo es la siguiente:

gabor (x; y; �

x

; �

y

; �

g

; �

m

; �; x

0

; y

0

) = gauss (x; y; �

x

; �

y

; �

g

; x

0

; y

0

) gb

mod

(x; y; �

x

; �

y

; x

0

; y

0

)

(B.4)

donde gb

mod

(x; y; �

x

; �

y

; x

0

; y

0

) es la fun ión ompleja que modula la gaussiana

on la fre uen ia y orienta ión deseadas:

Page 158: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

136 Apéndice B. Funciones gaussianas y Gabor

gb

mod

(x; y; �

x

; �

y

; x

0

; y

0

) = os (gb

a

(x; y; �

x

; �

y

; x

0

; y

0

) + i sin (gb

a

(x; y; �

x

; �

y

; x

0

; y

0

)))

(B.5)

o en su expresión exponen ial:

gb

mod

(x; y; �

x

; �

y

; x

0

; y

0

) = exp (i gb

a

(x; y; �

x

; �

y

; x

0

; y

0

)) (B.6)

y donde:

gb

a

(x; y; �

x

; �

y

; x

0

; y

0

) =

x

� (x� x

0

)

N

2

+

y

�(y � y

0

)

M

2

(B.7)

Page 159: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Bibliografía

[1℄ A. J. Ahumada Jr and B. L. Beard. Obje t dete tion in a noisy s ene. In

B. Rogowitz and J. Alleba h, editors, Human Vision and Digital Display VII,

volume 2657. SPIE, 1996.

[2℄ A. J. Ahumada Jr, A. M. Rohaly, and A. B. Watson. Image dis rimination

models predi t obje t dete tion in natural ba kgrounds. Investigative Ophtal-

mology and Visual S ien e, 36(4), 1995.

[3℄ A. N. Akansu and R. A. Haddad. Multiresolution signal de omposition: Trans-

forms, Subbands and Wavelets. A ademi Press, San Diego, 1992.

[4℄ B. W. Andrews and D. A. Pollen. Relationship between spatial frequen y

sele tivity and re eptive �eld pro�le of simple ell. J. Physiol., 287:163�176,

1979.

[5℄ A. J. Ati k and A. N. Redli h. Mathemati al model of the simple ells in the

visual ortex. Biologi al Cyberneti s, 63:99�109, 1990.

[6℄ J. Babaud, A. P. Witkin, M. Baudin, and R. O. Duda. Uniqueness of the

gaussian kernel for s ale-spa e �ltering. IEEE Trans. on Pattern Analysis and

Ma hine Intelligen e, 8:26�32, 1986.

[7℄ H. B. Barlow. Single units and sensation: a neuron do trine for per eptual

psy hology. Per eption, 1:371�394, 1972.

[8℄ H. B. Barlow. The past, present and future of feature dete tors. In D. In Al-

bre ht, editor, Re ognition of Pattern and Form. Le tures Notes in Biomathe-

mati s, volume 44, pages 4�32. Springer, Berlin, 1979.

[9℄ P. G. J. Barten. Evaluation of subje tive image quality with the square-root

integral method. J. Opt. So . Am. A, 7(10):2024�2030, 1990.

137

Page 160: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

138 Bibliografía

[10℄ C. Blakemore and F. W. Campbell. On the existen e of neurones in the human

visual system sele tively sensitive to the orientation and size of retinal image.

Journal of Physiology, 203:237�260, 1969.

[11℄ Z. L. Budrikis. Visual �delity riterion and modeling. IEEE Pro ., 60(7):771�

779, 1972.

[12℄ F. W. Campbell, G. F. Cooper, and C. Enroth-Cugell. The spatial sele tivity

of the visual ells of the at. Journal of Physiology, 203:223�235, 1969.

[13℄ F. W. Campbell, G. F. Cooper, J. G. Robson, and M. B. Sa hs. The spatial

sele tivity of visual ells of at and the squirrel monkey. Journal of Physiology,

204:120, 1969.

[14℄ F. W. Campbell and J. G. Robson. Appli ation of fourier analysis to the

visibility of gratings. Journal of Physiology, 197:551�566, 1967.

[15℄ J. W. Carl. Quantitative �delity riterion for image pro essing appli ations.

SPIE Pro ., 858:2�8, 1987.

[16℄ A. C. Copeland and M. M. Trivedi. Signature strength metri s for amou-

�aged targets orresponding to human per eptual ues. Opti al Engineering,

37(2):582�591, 1998.

[17℄ A. C. Copeland, M. M. Trivedi, and James R. M Manamey. Evaluation of ima-

ge metri s for target dis rimination using psy hophysi al experiments. Opti al

Engineering, 35(6):1714�1722, 1996.

[18℄ F. D'Astous. Textural Feature Extra tion in the Spatial Frequen y Domain.

PhD thesis, Dept. of Systems Design Engineering, University of Waterloo, On-

tario, Canada, 1984.

[19℄ J. G. Daugman. Two-dimensional spe tral analysis of orti al re eptive �eld

pro�les. Vision Resear h, 20:847�856, 1980.

[20℄ J. G. Daugman. Un ertainty relation for resolution in spa e, spatial, frequen y,

and orientation optimized by two-dimensional visual orti al �lters. J. Opt.

So . Am. A, 2(7):1160�1169, 1985.

[21℄ J. G. Daugman. Complete dis rete 2-d gabor transforms by neural networks

for image analysis and ompression. IEEE Trans. A oust. Spee h Signal Pro .,

36:1169�1179, 1988.

Page 161: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Bibliografía 139

[22℄ R. L. De Valois, D. G. Albre ht, and L. G. Thorell. Spatial frequen y sele tivity

of ells in ma aque visual ortex. Vision Resear h, 22:545�559, 1982a.

[23℄ R. L. De Valois, E. W. Yund, and N. Hepler. The orientation and dire tion

sele tivity of ells in ma aque visual ortex. Vision Resear h, 22:531�544,

1982b.

[24℄ T. Ebrahimi and M. Kunt. Image ompression by gabor expansion. Opti al

Engineering, 30(7):873�880, 1991.

[25℄ F. L. Engel. Visual onspi uity. dire ted attention and retinal lo us. Vision

Resear h, 11:563�575, 1971.

[26℄ F. L. Engel. Visual onspi uity and sele tive ba kground interferen e in e en-

tri vision. Vision Resear h, 14:459�471, 1974.

[27℄ F. L. Engel. Visual onspi uity, visual sear h and �xation tenden ies of the

eye. Vision Resear h, 17:95�100, 1977.

[28℄ C. Enroth-Cugell and J. G. Robson. The ontrast sensitivity of retinal ganglion

ells of the at. Journal of Physiology, 187:517, 1966.

[29℄ O. D. Faugeras. Digital olor image pro essing within the frame work of a

human visual model. IEEE Trans. A oust., Spee h, Signal Pro essing, 27:380�

393, 1979.

[30℄ J. Fdez-Valdivia, J. A. Gar ía, J. Martínez-Baena, and Xose R. Fdez-Vidal. The

sele tion of natural s ales in 2d images using adaptive gabor �ltering. IEEE

Trans. on Pattern Analysis and Ma hine Intelligen e, 20(5):458�469, 1998.

[31℄ Xose R. Fdez-Vidal, J. A. Gar ía, and J. Fdez-Valdivia. Using models of

feature per eption in distortion measure guidan e. Pattern Re ognition Letters,

19(1):77�88, 1998.

[32℄ D. J. Field. S ale-invarian e and self-similar wavelet transforms: An analysis

of natural s enes and mammalian visual systems. In M. In Farge, J. Hunt,

and T. Vassili os, editors, Wavelets, Fra tals and Fourier Transforms: New

developments and new appli ations, pages 151�193. Oxford University Press,

1993.

[33℄ L. M. J. Flora k, B. M. ter Haar Romeny, J. J. Koenderink, and M. A. Vier-

gever. S ale and the di�erential stru ture of images. Image and Vision Com-

puting, 10(6):376�388, 1992.

Page 162: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

140 Bibliografía

[34℄ I. Fogel and D. Sagi. Gabor �lters as texture dis riminator. Biologi al Cyber-

neti s, 61:103�113, 1989.

[35℄ K. H. Foster, J. P. Gaska, S. Mar elja, and D. A. Pollen. Phase relationships

between adja ent simple ells in the visual ortex. ii. 180 deg. phase shifts.

Journal of Physiology, 1983.

[36℄ D. Gabor. Theory of ommuni ation. J. Inst. Ele tr. Eng., 93:429�457, 1946.

[37℄ J. A. Gar ía, J. Fdez-Valdivia, and A. Garrido. A s ale-ve tor approa h for

edge dete tion. Pattern Re ognition Letters, 16:637�646, 1995.

[38℄ M. Gar ía-Silvente, J. A. Gar ía, and Fdez-Valdivia J. The novel s ale-

spe trum spa e for representing gray-level shape. Pattern Re ognition,

30(3):367�382, 1997.

[39℄ W. S. Geisler and K. L. Chou. Separation of low-level and high-level fa tors

in omplex tasks: visual sear h. Psy hol. Rev., 102:356�378, 1995.

[40℄ M. A. Georgeson and G. D. Sullivan. Contrast onstan y: deblurring in human

vision by spatial frequen y hannels. Journal of Physiology, 252:627�656, 1975.

[41℄ A. P. Ginsburg. Psy hologi al orrelates of a model of the human system.

In Pro . 1971 Nat. Aerospa e Ele troni s Conf., pages 283�290. IEEE Trans.

Aerospa e Ele troni Systems, 1971.

[42℄ B. E. Goldstein. Sensation & Per eption. Brooks/Cole, 4th edition, 1996.

[43℄ N. Graham. Visual pattern analyzers. Oxford University Press, 1989.

[44℄ N. Graham and J.Ña hmias. Dete tion of grating patterns ontaining two spa-

tial frequen ies: A omparison of single- hannel and multiple- hannel models.

Vision Resear h, 11:251�259, 1971.

[45℄ F. C. A. Groen, I. T. Young, and G. Ligthart. A omparison of di�erent fo us

fun tions for use in autofo us algorithms. Cytometry, 6:81�91, 1985.

[46℄ M. J. Hawken and A. J. Parker. Spatial properties of neurons in the monkey

striate ortex. Pro . R. So . Lon. B, 231:251�288, 1987.

[47℄ G. A. Hay and M. S. Chesters. Signal-transfer fun tions in threshold and

suprathreshold vision. J. Opt. So . Am., 62:990�998, 1972.

Page 163: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Bibliografía 141

[48℄ G. A. Hay and M. S. Chesters. A model of visual threshold dete tion. J. Theor.

Biol., 67:221�240, 1977.

[49℄ D. H. Hubel and T. N. Wiesel. Re eptive �elds of single neurons in the at's

striate ortex. Journal of Physiology, 148:574�591, 1959.

[50℄ D. H. Hubel and T. N. Wiesel. Re eptive �elds, bino ular intera tion and fun -

tional ar hite ture in the at's visual ortex. Journal of Physiology, 160:106�

154, 1962.

[51℄ D. H. Hubel and T. N. Wiesel. Re eptive �elds and fun tional ar hite ture in

two non-striate visual areas (18 and 19) of the at. Journal of Neurophysiology,

28:229�289, 1965.

[52℄ B. R. Hunt and G. F. Sera. Power-law stimulus-response models for measures

of image quality in nonperforman e environments. IEEE Trans. on systems,

man and yberneti s, 8(11):781�791, 1978.

[53℄ A. K. Jain. Fundamentals of Digital Image Pro essing. Prenti e-Hall, Engle-

wood Cli�s, NJ, 1989.

[54℄ A. K. Jain and R. C. Dubes. Algorithms for lustering data. Prenti e-Hall,

Englewood Cli�s, NJ, 1988.

[55℄ M. E. Jernigan and F. D'Astous. Entropy-based texture analysis in the spatial

frequen y domain. IEEE Trans. on Pattern Analysis and Ma hine Intelligen e,

6:237�243, 1984.

[56℄ J. P. Jones and L. A. Palmer. An evaluation of the two-dimensional gabor

�lter model of simple re eptive �elds in at striate ortex. Journal of Neurop-

hysiology, 58:1233�1258, 1987.

[57℄ M. Kabrisky. A proposed model for visual information pro essing in the human

brain. Illinois University Press, Urbana, 1966.

[58℄ S. A. Karunasekera and N. G. Kingsbury. A distortion measure for blo king

artifa ts in images based on human visual sensitivity. IEEE Trans. on Image

Pro essing, 4:713�724, 1995.

[59℄ S. A. Klein and B. Beutter. Minimizing and maximizing the joint spa e-spatial

frequen y un ertainty of gabor-like fun tions: omment. J. Opt. So . Am. A,

9(2):337�340, 1992. JOSA Communi ations.

Page 164: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

142 Bibliografía

[60℄ J. J. Koenderink. The stru ture of images. Biologi al Cyberneti s, 50:363�370,

1984.

[61℄ J. J. Koenderink and A. J. van Doorn. Re eptive �eld families. Biologi al

Cyberneti s, 63:291�297, 1990.

[62℄ J. Kominek. Still image ompression an issue of qua-

lity. Available from University of Waterloo, Water-

loo, Ontario, Canada, Department of Computer S ien e.

http://links.uwaterloo. a/pub/Fra tals/Papers/Waterloo/kominek94b.ps.gz,

ele troni edition, 1994.

[63℄ E. S. Krendel and J. Wodinsky. Visual sear h in a unstru tured visual �eld.

J. Opt. So . Am., 50:562�568, 1960.

[64℄ A. Law and W. Kelton. Simulation models and analysis. M Graw-Hill, 2

edition, 1991.

[65℄ A. Leger, T. Oma hi, and G. K. Walla e. The jpeg still pi ture ompression

algorithm. Opti al Engineering, 30(7):947�954, 1991.

[66℄ J. O. Limb. Distortion riteria of the human viewer. IEEE Trans. on systems,

man and yberneti s, 9(12):778�793, 1979.

[67℄ T. Lindeberg. Dete ting salient blob-like image stru tures and their s ales with

a s ale-spa e primal sket h: A method for fo us-of-attention. IJCV, 11:283�

318, 1993.

[68℄ Y. Lu and R. C. Jain. Reasoning about edges in s ale spa e. IEEE Trans. on

Pattern Analysis and Ma hine Intelligen e, 14(4):450�467, 1992.

[69℄ L. Ma�ei and A. Fiorentini. The visual ortex as a spatial frequen y analyser.

Vision Resear h, 13:1255�1267, 1973.

[70℄ J. Malik and P. Perona. Preattentive texture dis rimination with early vision

me hanisms. J. Opt. So . Am. A, 7(5):923�932, 1990.

[71℄ R. J. W. Mans�eld. Neural basis of orientation per eption in primate vision.

S ien e, 186:1133�1135, 1974.

[72℄ R. J. W. Mans�eld and S. F. Ronner. Orientation anisotropy in monkey visual

ortex. Brain Res., 149:229�234, 1978.

Page 165: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Bibliografía 143

[73℄ S. Mar elja. Mathemati al des ription of the responses of the simple orti al

ells. J. Opt. So . Am., 70(11):1297�1399, 1980.

[74℄ E. Marg, J. E. Adams, and B. Rutkin. Experientia, 24:348, 1968.

[75℄ H. Marmolin. Subjetive mse measures. IEEE Trans. on Systems, man and

yberneti s, 16(3):486�489, 1986.

[76℄ D. Marr. Vision. Freeman, San Fran is o, California, 1982.

[77℄ J. Martínez-Baena, J. Fdez-Valdivia, and J. A. Gar ía. A multi hannel au-

tofo using s heme for gray-level shape s ale sele tion. Pattern Re ognition,

30(10):1769�1786, 1997.

[78℄ J. Martínez-Baena, J. Fdez-Valdivia, and J. A. Gar ía. Per eptual distor-

tion riteria based on human visual model. In IS&T/OSA Opti s & Imaging

in the Information Age, pages 348�353, Ro hester, New York (USA), 1997.

IS&T/OSA.

[79℄ J. Martínez-Baena, J. Fdez-Valdivia, J. A. Gar ía, and Xose R. Fdez-Vidal. A

new image distortion measure based on a data-driven multisensor organization.

Pattern Re ognition, 31(8):1099�1116, 1998.

[80℄ J. Martínez-Baena, J. A. Gar ía, and J. Fdez-Valdivia. On the sele tion of

signi� ant s ales for gray-level shape. In Pro eedings IPMU '96, volume III,

pages 1519�1524, Granada (Spain), 1996.

[81℄ J. Martínez-Baena, J. A. Gar ía, J. Fdez-Valdivia, and J. Chamorro. De-

veloping per eptual distortion measures using visual per eption models. In

A. Sanfeliu, J.J. Villanueva, and J. Vitrià, editors, Pattern Re ognition and

Image Analysis. VII National Simposium on PR & IA, volume 1, pages 275�

280, Bar elona (Spain), 1997. AERFAI, Centre de Visió per Computador. Uni-

versitat Autònoma de Bar elona.

[82℄ J. Martínez-Baena, J. A. Gar ía, J. Fdez-Valdivia, and R. Rodríguez-Sán hez.

S ale sele tion using three di�erent representations for images. Pattern Re og-

nition Letters, 18(14):1453�1467, 1997.

[83℄ J. Martínez-Baena, Alexander Toet, Xose R. Fdez-Vidal, A. Garrido, and

R. Rodríguez-Sán hez. A omputational visual distin tness metri . Opti al

Engineering, 37(7):1995�2005, 1998.

Page 166: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

144 Bibliografía

[84℄ F. Mokhtarian and A. Ma kworth. S ale-based des ription and re ognition of

planar urves and two-dimensional shapes. IEEE Trans. on Pattern Analysis

and Ma hine Intelligen e, 8(1):34�43, 1986.

[85℄ M. C. Morrone and D. C. Burr. Feature dete tion in human vision: A phase-

dependent energy model. Pro . R. So . Lond. B, 235:221�245, 1988.

[86℄ J. A. Movshon. Two-dimensional spatial frequen y tuning of at striate orti al

neurons. So . Neuros i., 5:799, 1979.

[87℄ J. A. Movshon and D. J. Tolhurst. On the response linearity of neurones in

at visual ortex. Pro eedings of the Physiologi al So iety, 249:56�57, 1975.

[88℄ R. Navarro and A. Tabernero. Multidim. Sys. Signal Pro ess, 2:421, 1991.

[89℄ N. B. Nill and B. H. Bouzas. Obje tive image quality measure derived from

digital image power spe tra. Opti al Engineering, 31(4):813�825, 1992.

[90℄ A. Pantle and R. Sekular. Size-dete ting me hanisms in human vision. S ien e,

162:1146�1148, 1968.

[91℄ A. Parker and M. J. Hawken. Two-dimensional spatial stru ture of re eptive

�elds in monkey striate ortex. J. Opt. So . Am. A, 5:598�605, 1988.

[92℄ W. A. Pearlman. A visual system model and a new distortion measure in the

ontext of image pro essing. J. Opt. So . Am., 68(3):374�385, 1978.

[93℄ G. F. Poggio. Handbook of medi al physiology, volume 2. Mosby, St. Louis, 12

edition, 1968.

[94℄ D. A. Pollen and S. F. Ronner. Visual orti al neurons as lo alized spatial

frequen y �lters. IEEE Trans. on Systems, Man and Cyberneti s, 13(5):907�

916, 1983.

[95℄ D. A. Pollen and J. H. Taylor. The striate ortex and the spatial analisys of

visual spa e. In The neuros ien es, third study program, pages 239�247. MIT

Press, Cambridge, Massa husetts, 1974.

[96℄ W. H. Press, S. A. Teukolsky, W. T. Vetterling, and B. P. Flannery. Numeri al

re ipes in C. The art of s ienti� omputing. Cambridge University Press, 2

edition, 1992.

Page 167: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Bibliografía 145

[97℄ C. R. Rao. Linear Statisti al Inferen e and Its Appli ations. Wiley, New York,

1973.

[98℄ A. M. Rohaly, A. J. Ahumada Jr, and A. B. Watson. Obje t dete tion in natu-

ral ba kgrounds predi ted by dis rimination performan e and models. Vision

Resear h, 37(23):3225�3235, 1997.

[99℄ A. Rosenfeld and M. Thurston. Edge and urve dete tion for visual s ene

analysis. IEEE Trans. on Computing, 20:559�562, 1971.

[100℄ S. R. Rotman, E. S. Gordon, and M. L. Kowal zyk. Modeling human sear h

and target a quisition performan e: I. �rst dete tion probability in a realisti

multitarget s enario. Opti al Engineering, 28(11):1216�1222, 1989.

[101℄ M. B. Sa hs, J. Na hmias, and J. G. Robson. Spatial-frequen y hannels in

human vision. J. Opt. So . Am., 61:1176�1186, 1971.

[102℄ J. A. Saghri, P. S. Cheatham, and A. Habibi. Image quality measure based on

a human visual system model. Opti al Engineering, 28(7):813�818, 1989.

[103℄ D. J. Sakrison. On the role of the observer and a distortion measure in image

transmission. IEEE Trans. on ommuni ations, 25(11):1251�1267, 1977.

[104℄ S. Z. Selim and M. A. Ismail. K-means-type algorithms: a generalized on-

vergen e theorem and hara terization of lo al optimality. IEEE Trans. on

Pattern Analysis and Ma hine Intelligen e, 6:81�87, 1984.

[105℄ C. E. Shannon. The mathemati al theory of ommuni ation. Bell. Syst. Te h.

J., 27:379�423, 1948.

[106℄ C. E. Shannon and W. Weaver. The mathemati al theory of ommuni ation.

University of Illinois, Urbana, 1949.

[107℄ R. Shapley and V. H. Perry. Cat and monkey retinal ganglion ells and their

fun tional roles. Trends in Neuros ien e, 9:229�235, 1986.

[108℄ M. V. Shirvaikar and M. M. Trivedi. Developing texture-based image lutter

measures for obje t dete tion. Opti al Engineering, 31(12):2628�2639, 1992.

[109℄ D. G. Stork and H. R. Wilson. Do gabor provide appropiate des riptions of

visual orti al re eptive �elds? J. Opt. So . Am. A, 7(8):1362�1373, 1990.

Page 168: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

146 Bibliografía

[110℄ A. Sutter, J. Be k, and N. Graham. Contrast and spatial variables in texture

segregation: Testing a simple spatial-frequen y hannels model. Per eption &

Psy hophysi s, 46(4):312�332, 1989.

[111℄ J. P. Thomas and J. Gille. Bandwidths of orientation hannels in human vision.

J. Opt. So . Am., 69(5):652�660, 1979.

[112℄ A. Toet. Computing visual target distin tness. Te hni al Report TM-97-A039,

TNO Human Fa tors Resear h Institute, Soesterberg, The Netherlands, 1997.

[113℄ A. Toet. Image data set for testing sear h and dete tion models. Te hni al

Report TM-97-A036, TNO Human Fa tors Resear h Institute, Soesterberg,

The Netherlands, 1997.

[114℄ A. Toet, F. L. Kooi, P. Bijl, and J. M. Valeton. Visual onspi uity determines

human target a quisition performan e. Opti al Engineering, 37(7):1969�1975,

1998.

[115℄ P. Tynan and R. Sekular. Per eived spatial frequen y varies with stimulus

variation. J. Opt. So . Am., 64:1251�1255, 1974.

[116℄ G. Waldman, J. Wootton, and G. Hobson. Visual dete tion with sear h: an

empiri al model. IEEE Trans. on Systems, Man and Cyberneti s, 21(3):596�

606, 1991.

[117℄ G. R. Walla e. The jpeg still pi ture ompression standard. Communi ations

of the ACM, 34:30�44, 1991.

[118℄ B. A. Wandell. Foundations of vision. Sinauer Asso iates In . Publishers,

Sunderland, MA, 1995.

[119℄ A. B. Watson. The ortex transform: Rapid omputation of simulated neural

images. Computer Vision, Graphi s and Image Pro essing, 39:311�327, 1987.

[120℄ A. B. Watson. E� ien y of a model human image ode. J. Opt. So . Am. A,

4(12):2401�2417, 1987.

[121℄ R. J. Watt. Issues in shape per eption. Image and Vision Computing,

11(6):389�394, 1993.

[122℄ M. A. Webster and R. L. De Valois. Relationship between spatial-frequen y

and orientation tuning of striate- ortex ells. J. Opt. So . Am. A, 2(7):1124�

1132, 1985.

Page 169: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Bibliografía 147

[123℄ A. H. Wertheim. A quantitative onspi uity index; theoreti al foundation and

experimental validation of a measurement pro edure. Te hni al Report C-20,

TNO Human Fa tors Resear h Institute, Soesterberg, The Netherlands, 1989.

[124℄ A. P. Witkin. S ale-spa e �ltering. In Pro . of the 8th Int. Joint Conf. on

Arti� ial Intelligen e, volume 2, pages 108�111, 1983.

[125℄ T. T. E. Yeo, S. H. Ong, Jayasooriah, and R. Sinniah. Autofo using for tissue

mi ros opy. Image and Vision Computing, 11(10):629�639, 1993.

[126℄ R. A. Young. The gaussian derivative model for spatial vision: I. retinal me-

hanisms. Spatial Vision, 2:273�293, 1987.

[127℄ A. L. Yuille and T. A. Poggio. S aling theorems for zero- rossings. IEEE

Trans. on Pattern Analysis and Ma hine Intelligen e, 8:15�25, 1986.

Page 170: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

148 Bibliografía

Page 171: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

Índi e de Materias

An ho de banda, 12

Antialiasing, 13, 14

Autoenfoque, 33

Baston, 2

Brenner, 34, 35, 40, 49, 56, 59

Campo re eptivo, 4, 6, 10, 21, 25, 91

Canal, 7, 13, 21, 34, 89, 91

Canal orti al, 23, 26

Cluster, 111, 113

Clustering, 17

Compresion, 115, 122, 124

Cono, 2

Conspi uidad, 124

Contraste, 8

Cortex visual, 1

CSF, 89

Distinguibilidad, 102, 107

Distorsion, 90

Doyle, 103

Enfoque, 10, 33, 36, 58

Es ala, 31�35, 40, 47, 56, 70, 91, 133,

135

Es ala externa, 40

Es ala global, 6, 31, 57

Es ala interna, 40

Es ala lo al, 6, 73, 74

Fa tor de alidad, 116, 117

Fotore eptor, 2, 89

Fourier, 8

Fovea, 2

Gabor, 9, 11, 21�23, 25, 27, 28, 40, 57,

70, 75, 134

Gausiana, 133

Gaussiana, 58

Gradiente uadrati o, 34, 36, 49, 56

In ertidumbre, 22

Inhibi ión lateral, 11

JPEG, 115, 116, 124, 127

Kolmogorov-Smirnov, 114

Mapa de energia, 75, 76

Masking, 94

Medida de distorsion, 6, 85, 90, 91

MSE, 87

Multi anal, 8, 56

Multies ala, 31

Nervio opti o, 3

Nota ion, 6

Ojo, 1

Orienta ion, 7, 8, 10, 12

Parti ion, 11, 14, 15, 19

Per eptual, 7, 85, 89, 124

Pixelado, 98

149

Page 172: Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol Desarrlo de un delo mo omputacional c esentación epr r de imágenes y su ación aplic

150 Índice de Materias

Probabilidad de dete ion, 111

Punto iego, 2

Punto de interes, 75�77

Re ti� a ion de media onda, 23, 25

Retina, 1, 2

RMSE, 87, 94, 95, 98, 102, 111, 117

Roseta, 8

Ruido, 37, 51, 58, 94, 95

Sensor, 10, 14, 15, 19, 75, 90

Sensor a tivo, 10, 15, 17, 91

SNR, 88

Sobel, 36

SVH, 1, 4, 5, 7, 10, 85, 89

Tenengrad, 34, 36, 49, 56

Transformada del ortex, 9, 21

Varianza, 34, 35, 49, 56, 59

Visibilidad, 103

Zona ex itatoria, 11, 21

Zona inhibitoria, 11, 21