reduccion de la dimensionalidad´ - inaoeemorales/cursos/nvoaprend/acetatos/pca21… · pca lda gp...

63
Introducci ´ on Selecci ´ on de atributos Filtros para selecci ´ on de atributos Wrappers para selecci ´ on de atributos etodos embedidos Generaci ´ on de atributos PCA LDA GP AE Discusi ´ on Reducci ´ on de la dimensionalidad Eduardo Morales, Hugo Jair Escalante INAOE (INAOE) 1 / 63

Upload: others

Post on 23-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Reduccion de la dimensionalidad

Eduardo Morales, Hugo Jair Escalante

INAOE

(INAOE) 1 / 63

Page 2: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Contenido

1 Introduccion

2 Seleccion de atributosFiltros para seleccion de atributosWrappers para seleccion de atributosMetodos embedidos

3 Generacion de atributosPCALDAGPAE

4 Discusion

(INAOE) 2 / 63

Page 3: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Introduccion

Reduccion de a dimensionalidad

En algunos problemas de reconocimiento de patrones, nosenfrentamos a conjuntos de datos de alta dimensionalidad.Ejemplo: clasificacion de textos:• Los documentos se representan por su BoW, esto es

vectores con tantos elementos como palabras en elvocabulario.

• Para bases de datos con 1000-10,000 documentos sepueden llegar a tener vocabularios de variasdecenas/cientos de miles de elementos.

(INAOE) 3 / 63

Page 4: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Introduccion

Reduccion de a dimensionalidad

(INAOE) 4 / 63

Page 5: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Introduccion

Reduccion de a dimensionalidad

Problemas de la alta dimensionalidad en los datos:• Costo de procesamiento y almacenamiento.• Atributos relevantes e irrelevantes.• Calculo de distancias no es sencillo.• Data sparsity.• La maldicion de la dimensionalidad.

(INAOE) 5 / 63

Page 6: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Introduccion

Reduccion de a dimensionalidad

Problemas de la alta dimensionalidad en los datos:• Costo de procesamiento y almacenamiento.• Atributos relevantes e irrelevantes.• Calculo de distancias no es sencillo.• Data sparsity.• La maldicion de la dimensionalidad.

(INAOE) 6 / 63

Page 7: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Introduccion

Reduccion de a dimensionalidadEl numero de posiciones escala de manera exponencial conla dimensionalidad del problema.Necesitamos un numero exponencial de ejemplos deentrenamiento para cubrir todas las posiciones.

Figura: La maldicion de la dimensionalidad.(INAOE) 7 / 63

Page 8: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Introduccion

Reduccion de a dimensionalidad

Dos soluciones principales:• Seleccion de atributos: Seleccionar un subconjunto

de atributos.• Generacion de atributos

(re-parametrizacion/transformacion): Mapear losatributos originales a un nuevo espacio de menordimension.

(INAOE) 8 / 63

Page 9: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos• Problema: Encontrar un subconjunto de atributos que

son mas utiles para clasificacion.• Objetivos: Eliminar atributos irrelevantes/ruidosos;

seleccionar/mantener atributos relevantes; reducir ladimensionalidad.

(INAOE) 9 / 63

Page 10: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos• Problema: Encontrar un subconjunto de atributos que

son mas utiles para clasificacion.• Objetivos: Eliminar atributos irrelevantes/ruidosos;

seleccionar/mantener atributos relevantes; reducir ladimensionalidad.

(INAOE) 10 / 63

Page 11: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos

Para un problema con d−atributos, cuantos subconjuntosexisten?

Problema computacionalmente costoso!

(INAOE) 11 / 63

Page 12: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos

Tres enfoques principales:• Filtros: Evaluan la importancia de los atributos usando

metodos que son independientes del modelo declasificacion.Wrappers: Evaluan la importancia de subconjuntos deatributos usando un modelo de clasificacion (se adoptauna estrategia de busqueda).Embedded: Toman ventaja de la naturaleza del modelode clasificacion considerado.

(INAOE) 12 / 63

Page 13: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos

(INAOE) 13 / 63

Page 14: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos - Isabelle Guyon

(INAOE) 14 / 63

Page 15: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos - Isabelle Guyon

(INAOE) 15 / 63

Page 16: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos - Isabelle Guyon

(INAOE) 16 / 63

Page 17: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos - Isabelle Guyon

(INAOE) 17 / 63

Page 18: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos - Isabelle Guyon

(INAOE) 18 / 63

Page 19: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos

Seleccion de atributos - Isabelle Guyon

(INAOE) 19 / 63

Page 20: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Filtros para seleccion de atributos

Filtros para seleccion de atributosIdea: Asignar un score a cada uno de los atributos, yseleccionar los mejores (algunos metodos sonmulti-variables).

Como hacerlo?(INAOE) 20 / 63

Page 21: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Filtros para seleccion de atributos

Filtros para seleccion de atributos

Correlacion: Forma sencilla de calcular la correlacion linealentre dos variables. ρ(Xi ,Y ) Nos indica la correlacion entreel atributo Xi y la clase Y .

ρ(Xi ,Y ) =COV (Xi ,Y )

σXi , σY

con:

COV (Xi ,Y ) = E [(Xi − E [X ])(Y − E [Y ])]

σW =√

E([W − E [W ]]2)

Relacion con informacion mutua.

(INAOE) 21 / 63

Page 22: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Filtros para seleccion de atributos

Filtros para seleccion de atributosGanancia de informacion (IG). Mide que tan bien unatributo separa los ejemplos de entrenamiento en dosclases.Se basa en el concepto de entropıa, que caracteriza laimpureza de una coleccion arbitraria de ejemplos.• La entropıa especıfica el numero mınimo de bits de

informacion necesaria para codificar un elementoarbitrario del conjunto de datos.

(INAOE) 22 / 63

Page 23: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Filtros para seleccion de atributos

Filtros para seleccion de atributosGanancia de informacion (IG). Mide que tan bien unatributo separa los ejemplos de entrenamiento en dosclases.Comunmente se mantienen aquellos atributos con IG mayora 0.

IG(Xi ,Y) = −K∑

i=1

Pr(Yi) log(Pr(Yi)) + ...

Pr(Xi)K∑

i=1

Pr(Yi |Xi) log(Pr(Yi |Xi)) + . . .

Pr(Xi)K∑

i=1

Pr(Yi |Xi) log(Pr(Yi |Xi))

La IG de un atributo mide la reduccion esperada de la entropıacausada por la particion de ejemplos usando dicho atributo.

(INAOE) 23 / 63

Page 24: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Filtros para seleccion de atributos

Filtros para seleccion de atributos

Ganancia de informacion (IG). Mide que tan bien unatributo separa los ejemplos de entrenamiento en dosclases.

(INAOE) 24 / 63

Page 25: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Filtros para seleccion de atributos

Filtros para seleccion de atributos

(INAOE) 25 / 63

Page 26: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Filtros para seleccion de atributos

Otros criterios:

(INAOE) 26 / 63

Page 27: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Wrappers para seleccion de atributos

Filtros vs. Wrappers

(INAOE) 27 / 63

Page 28: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Wrappers para seleccion de atributos

Wrappers para seleccion de atributos

Diagrama general de un metodo tipo wrapper.

(INAOE) 28 / 63

Page 29: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Wrappers para seleccion de atributos

Wrappers para seleccion de atributosVariantes:• Estrategia de busqueda: Sequential Forward Selection

(SFS). Sequential Backward Elimination (SBS). Beamsearch: keep k best path at each step. Floating search (SFFSand SBFS): Alternate betweem SFS and SBS as long as wefind better subsets than those of the same size obtained sofar. Extensive search (simulated annealing, geneticalgorithms, exhaustive search).

(INAOE) 29 / 63

Page 30: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Wrappers para seleccion de atributos

Wrappers para seleccion de atributos

Variantes:• Criterio: Generalmente son guiados por el desempeno de

clasificacion, medido por una funcion perdida.• Muestreo: Se suele usar validacion cruzada u otras

estrategias de evaluacion para evitar el sobre ajuste.• Criterio de paro: Numero maximo de iteraciones, early

stopping, convergencia.

(INAOE) 30 / 63

Page 31: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Wrappers para seleccion de atributos

Forward selection (SFS)

(INAOE) 31 / 63

Page 32: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Wrappers para seleccion de atributos

Backward elimination (SBS)

(INAOE) 32 / 63

Page 33: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Metodos embedidos

Embedded methods

(INAOE) 33 / 63

Page 34: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Metodos embedidos

Embedded methodsIdea: sacar provecho del modelo o proceso de aprendizajepara identificar variables relevantes.• Regresion lineal.

(INAOE) 34 / 63

Page 35: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Metodos embedidos

Embedded methods

Idea: sacar provecho del modelo o proceso de aprendizajepara identificar variables relevantes.• Ejemplo: SVM• Sabiendo que:

w =∑

k

αkykxk (1)

• Se usa a w como criterio para dar importancia a losatributos

(INAOE) 35 / 63

Page 36: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Metodos embedidos

Embedded methods

Idea: sacar provecho del modelo o proceso de aprendizajepara identificar variables relevantes.• SVM.

(INAOE) 36 / 63

Page 37: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Metodos embedidos

Seleccion de atributos

(INAOE) 37 / 63

Page 38: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Seleccion de atributos Metodos embedidos

Seleccion de atributos

(INAOE) 38 / 63

Page 39: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos

Generacion de atributosMapear los atributos originales a un nuevo espacio demenor dimension.

(INAOE) 39 / 63

Page 40: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos

Generacion de atributos

• Como definir el mapeo Φ(x)?• Metodos mas usados: PCA, LDA, AutoEncoders,

Factorizacion de matrices, etc.

(INAOE) 40 / 63

Page 41: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Analisis de ComponentesPrincipales

PCA: Herramienta estandar en analisis de datos

• Simple• No parametrico• Extrae informacion relevante a partir de conjuntos de

datos confusos• Provee forma de reducir un conjunto de datos complejo

a otro con dimension menor• Revela estructuras simplificadas (algunas veces

ocultas)• Permite remover ruido, informacion no relevante.

(INAOE) 41 / 63

Page 42: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Analisis de ComponentesPrincipales

Idea: Conceptualmente, PCA es un metodo que encuentraun conjunto de bases que maximizan la varianza de losdatos originales y que son ortogonales entre si. Encuentralas direcciones de mayor variacion.

(INAOE) 42 / 63

Page 43: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Analisis de ComponentesPrincipales

Receta: Sea X = {(xi}1,...,N nuestro conjunto de datos deentrenamiento1 con xi ∈ Rd .• Centrar los datos: A cada columna Xi de X restamos la

media de Xi .• Calcular la matriz de covarianza:

CX =1N

XXT

• Calcula los eigenvectores v de CX:

CXv = λv

• La matriz v es el conjunto de componentes principales.

1Ojo: PCA es un metodo no supervisado.(INAOE) 43 / 63

Page 44: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Analisis de ComponentesPrincipales

• Se pueden proyectar nuevos datos X∗ al espacio decomponentes principales mediante:

P∗ = vT X∗

• Se pueden reconstruir los datos originales:

X∗ = P∗vT

(INAOE) 44 / 63

Page 45: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Para que sirve?

Como se ven los componentes principales?

(INAOE) 45 / 63

Page 46: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Para que sirve?Como se ven los componentes principales?

(INAOE) 46 / 63

Page 47: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Para que sirve?Como se ven los componentes principales?

(INAOE) 47 / 63

Page 48: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Para que sirve?Aplicacion 1: Reduccion de la dimensionalidad de losdatos.Con PCA obtenemos un conjunto de componentes que nospermiten mapear los datos a otro espacio. Loscomponentes estan ordenados de acuerdo a su importanciapara explicar los datos, ası, es posible proyectar los datosoriginales en solo unos cuantos componentes principales.

P∗ = vT1:kX∗

(INAOE) 48 / 63

Page 49: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Para que sirve?Aplicacion 2: Remover ruido, informacion no relevante delo datos. La idea es obtener los componentes principales yposteriormente reconstruir los datos usando solo un numeropequeno de componentes k (k << d).

X∗ = P∗vT1,...,k

(INAOE) 49 / 63

Page 50: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos PCA

PCA: Para que sirve?Aplicacion 3: Como clasificador. Se sabe que loscomponentes principales minimizan el error dereconstruccion de los objetos originales. Entonces, sepuede aprender un modelo PCA por cada clase y clasificarnuevas instancias asignandolas a la clase con el menorerror de reconstruccion.

(INAOE) 50 / 63

Page 51: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos LDA

LDA: Analisis de discriminador linealPCA es una herramienta que provee transformacioneslineales que capturan la varianza de los datos, sin embargo,es un metodo no supervisado.LDA (Linear discriminant analysis) es una variantesupervisada que nos permite generar atributos tratando demaximizar la discriminatividad.

(INAOE) 51 / 63

Page 52: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos LDA

LDA: Analisis de discriminador lineal

En LDA (para reduccion de la dimensionalidad), buscamosla proyeccion de los datos que nos maximiza la separacionentre clases.

y = wT x

Queremos encontrar w que maximiza dicha separacion.Fisher planteo el siguiente criterio:

J(w) =(c− − c+)2

s2+ + s2

conc+ = wT c+; c− = wT c−

s2+ =

∑{i|yi=+1}

(yi − c+)2; s2− =

∑{i|yi=−1}

(yi − c−)2;

(INAOE) 52 / 63

Page 53: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos LDA

LDA: Analisis de discriminador linealHaciendo explıcita la dependencia con w, tenemos:

J(w) =wT SBwwT SW w

donde SB es la matriz de covarianza entre clases:

SB = (c−c+)(c−c+)T

y SW es la matriz de covarianza intra clase:

SW =∑

{i|yi=+1}

(xi−c+)(xi−c+)T +∑

{i|yi=−1}

(xi−c−)(xi−c−)T

La solucion esta dada por:

w ≈ S−1W (c− − c+)

(INAOE) 53 / 63

Page 54: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos LDA

LDA: Analisis de discriminador lineal

Proyeccion de datos con LDA:

(INAOE) 54 / 63

Page 55: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos GP

Programacion genetica como extractor deatributos

• Una alternativa a PCA y LDA que trabaja de formaintuitiva es la generacion de atributos medianteprogramacion genetica.

• La idea para generar un atributo es combinar, medianteciertas operaciones, atributos del espacio original, e.g.,:

wi = Φi(XS)

Donde XS es un subconjunto de las columas de X y Φies una funcion que combina dichas columnas.

• El problema consiste en encontrar Φ1,...,k

(INAOE) 55 / 63

Page 56: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos GP

Programacion genetica

Que es programacion genetica?

(INAOE) 56 / 63

Page 57: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos GP

Programacion geneticaProgramacion genetica para generar atributosLa idea es muy simple: codificar atributos como arboles, ydejar al programa genetico que determine los mejoresatributos.

(INAOE) 57 / 63

Page 58: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos GP

Programacion genetica

Programacion genetica para generar atributosLa idea es muy simple: codificar atributos como arboles, ydejar al programa genetico que determine los mejoresatributos.

(INAOE) 58 / 63

Page 59: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos GP

Programacion genetica

Programacion genetica para generar atributosLa idea es muy simple: codificar atributos como arboles, ydejar al programa genetico que determine los mejoresatributos.

(INAOE) 59 / 63

Page 60: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos GP

Programacion genetica

Programacion genetica para generar atributosLa idea es muy simple: codificar atributos como arboles, ydejar al programa genetico que determine los mejoresatributos.

(INAOE) 60 / 63

Page 61: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos GP

Programacion genetica

Resultados y comparacion de espacios generados.

(INAOE) 61 / 63

Page 62: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Generacion de atributos AE

Reprisal: AutoencodersLos auto encoders pueden verse/usarse como reductoresde dimensionalidad:

(INAOE) 62 / 63

Page 63: Reduccion de la dimensionalidad´ - INAOEemorales/Cursos/NvoAprend/Acetatos/pca21… · PCA LDA GP AE Discusi´on Introduccion´ Reduccion de a dimensionalidad´ En algunos problemas

Introduccion

Seleccion deatributosFiltros para seleccionde atributos

Wrappers paraseleccion deatributos

Metodos embedidos

Generacionde atributosPCA

LDA

GP

AE

Discusion

Discusion

Comentarios finales

• La dimensionalidad puede llegar a ser un problemaserio en aprendizaje computacional, cuando esta es“grande”.

• La maldicion de la dimensionalidad afecta mayormentea cierto tipo de metodos.

• Existen dos alternativas: seleccionar o generaratributos.

• Ambas estrategias son utiles y se pueden combinar,ademas que se les puede dar otros usos.

• En general es un arte, seleccionar el mejor metodopara un problema en particular.

(INAOE) 63 / 63