factor 1

17
Factor 1 F a cto r 2 Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples

Upload: athena-boyd

Post on 02-Jan-2016

20 views

Category:

Documents


1 download

DESCRIPTION

Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples. Factor 2. Factor 1. X’. -1. , N. R p. R n. , M. Individus essencials. Individus meta-variables. M. N. X. -1. R* p. , N. , M. R* n. Variables essencials. Variables meta-individus. (. ). - PowerPoint PPT Presentation

TRANSCRIPT

Factor 1

Fact

or 2

Anàlisi Discriminant Discreta Mitjançant Suavització de les Correspondències Múltiples

, M

M

, M

-1

, N

N

, N

-1X’

X

, ,( )X M N

R*n

Rn

R*p

Rp

Individus meta-variables

Individus essencials

Variables essencials Variables meta-individus

Y’X, (X’X)-1, (Y’Y)-1 ( )

*gR

*kR

kR

gR

1X'X

1Y'Y

X'Y

Y'X

Anàlisi Triplet

  Discriminant(Canònica Simple) 

  Y’X

 (X’X)-1

  (Y’Y)-1

  Correspondències(Canònica Múltiple)

 

(Y,X)

  I

 -1(Y'Y) 0

-10 (X'X)

X 1 1

X2

2

1 1 2 2max . X1 1. X

a1 a2 a3

X3

3

3 31. X

Teorema de Lancaster (1957): Suposem que X1 resulte

d’una transformació tipificada d’una variable normal tipificada Z1 i X2 de forma semblant de Z2 , aleshores

  corr(X1,X2) corr (Z1,Z2) =

Generalització del Teorema de Lancaster : Siguin Zi ,

i=1,...,p normals tipificades amb R com a matriu de correlacions i siguin Xi ,i=1,...,p transformades de les Zi

respectivament i també tipificades.

Si a és el vector propi corresponent al major valor propi de R  Var (w’X) Var(a’Z) w Rp amb w’w = 1  

0

0 n

(1, 0, ... , 0)

Esquema de la demostració del Teorema de Lancaster

Esquema de la demostració de la generalització del Teorema de lancaster

11 1p

11 1p

p1 pp

p1 pp

0 0

0 0

0 0

0 0

n n

n n

r r

r r

r r

r r

11 1p

p1 pp

r r

r r

a (a, 0, ..., 0)

Càlcul d’ a = 1r vector propi de la matriu de covariàncies dels centroïds

Classificació per LDA prèvia suavització mitjançant EM

( MDA)

Selecció del nombre d’eixos

Correspondències múltiples ponderades amb a

Convergeix?no

ec=0.48, 99%, 3 var., 9 cat. ec=0.27, 75%, 3 var., 8 cat.

ec=0.23, 80%, 2 var., 5 cat. ec=0.16, 68%, 3 var., 8 cat.

Conjunt de dades

LDA

Canònic

MDA ADDSUC millor

alternativa

1 0.492 0.464 0.461 0.467

2 0.473 0.430 0.369 0.406

3 0.449 0.421 0.312 0.337

4 0.456 0.483 0.387 0.387

500 dades d’aprenentatge i 500 de test. 50 x 50 simulacions

Sèpals

Pètals

Longitud amplàriaLogística-X.N. 0.223 ADDSUC 0.217

Màrqueting, J.Friedman, S.Francisco (California), 1987 3 classes 13 var. 75 cat. 2000 dades d’apr. 4000 dades de test

Nivell d’Ingressos Gènere Ocupació

Estat Civil Tipus de casa

Edat Propietat de la casa

Nivell Educatiu .........................

MDA Logística-X.N. ADDSUC

Màrqueting 0.392 0.385 0.363

AFIPE 0.387 0.388 0.318

AFIPE, Sisnica, León (Nicaragua), 19948 classes 6 var. 18 cat. 550 dades d’apr. 594 dades de test

Patrò d’evolució de ERA FreqüènciaTipus MunicipiProfesionalPerfil T.Comunitat

• ADDSUC sembla superar tots els altres possibles mètodes bassats en correspondències i/o suavització especialment quan hi ha permutació de l’ordre “natural” (dades simulades)

• ADDSUC sembla superar a la logística-xarxes neurals si els punts de tall es fan als punts de vall (dades Iris de Fisher)

• L’anàlisi de correspondències ponderada-iterada proposada aconsegueix la millor reconstrucció de la mixtura de partida possible (Generalització del teorema de Lancaster)

• La supossició de una mixtura categorizada com a model base sembla acceptable en moltes situacions pràctiques raó per la qual ADDSUC aconsegueix bons resultats amb exemples amb dades reals (Màrqueting,AFIPE)

•Incorporar les variables contínues al procés iteratiu ( cas mixt)

•Ampliació del model base per classe de normal a mixtura ( suavització mitjançant EM, MDA)

•Sustitució de l’EM pel Kernel adaptable multidimesional quan el model base no sigui ni normal ni mixtura de normals.

•Anàlisi canònica generalitzada posterior agrupant els eixos (polinomis de l’Hermite, FDA, covariàncies diferents)