független komponens analízis

49
1 Független Komponens Analízis Póczos Barnabás NIPG ELTE-IK

Upload: gerda

Post on 20-Jan-2016

69 views

Category:

Documents


0 download

DESCRIPTION

Független Komponens Analízis. Póczos Barnabás NIPG ELTE-IK. Tartalom. ICA alkalmazások ICA információ elmélet Nemlineáris korreláció ICA ML ICA Fast ICA Nemlineáris keresztkorreláció minimalizáció. A Független Komponens Analízis (ICA). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Független Komponens Analízis

1

Független Komponens Analízis

Póczos Barnabás

NIPG

ELTE-IK

Page 2: Független Komponens Analízis

2

Tartalom

ICA alkalmazásokICA információ elméletNemlineáris korreláció ICAML ICAFast ICANemlineáris keresztkorreláció

minimalizáció

Page 3: Független Komponens Analízis

3

A Független Komponens Analízis (ICA)

Vak Forrás Szeparáció (BSS) más néven Független Komponens Analízis (ICA) független forrásokból kevert jelek újra szétválasztására szolgál.

Amíg PCA olyan irányokat keres, melyre |x0 - x|2 minimális, addig ICA olyan irányokat választ, melyben az adatok a lehető legfüggetlenebbek.

Page 4: Független Komponens Analízis

4

ICA alkalmazási lehetőségek

Blind source separation (Bell&Sejnowski, Te won Lee, Girolami, Hyvarinen, etc.)

Image denoising (Hyvarinen) Medical signal processing – fMRI, ECG, EEG (Mackeig) Modelling of the hippocampus and visual cortex (Lorincz,

Hyvarinen) Feature extraction (feature extraction), arcfelismerés (Marni

Bartlett) Compression, redundancy reduction clustering (Girolami, Kolenda) Time series analysis (Back, Valpola) Pénzügyi alkalmazások

Page 5: Független Komponens Analízis

5

AA “ “Koktél PartiKoktél Parti” ” pproblrobléémmaa

Források Megfigyelések

x = As

Becslések

sA

y=Wx

Page 6: Független Komponens Analízis

6

Független Komponens Analízis

2221212

2121111

)(

)(

sasatx

sasatx

Két független jel A két jel keveréke

aIJ ... Jelentése a mikrofonoktól való távolság

A becslés ICA alkalmazása után

Page 7: Független Komponens Analízis

7

Független komponens analízis természetből vett képeken

Page 8: Független Komponens Analízis

8

Főkomponens Analízis bázisok természetből vett képeken

Page 9: Független Komponens Analízis

9

ICA bázisok természetből vett képeken

Page 10: Független Komponens Analízis

10

ICA mozgó képeken

Page 11: Független Komponens Analízis

11

PCA vs ICA, Mixture of Probabilistic PCA

PCA ICA

MPPCA

Page 12: Független Komponens Analízis

12

ICA-PCA bázisok öröm arckifejezésekből

Page 13: Független Komponens Analízis

13

ICA-PCA bázisok megelpetés arckifejezésekből

Page 14: Független Komponens Analízis

14

ICA-PCA bázisok undor arckifejezésekből

Page 15: Független Komponens Analízis

23.04.21.

ICA activity for classification, novelty detection

ICA activity for classification, novelty detection

Activity distributions of within-category test

movies are much narrower

Activity distributions of within-category test

movies are much narrower

Supervised dataSupervised dataT

est

da

taT

est

da

ta

Page 16: Független Komponens Analízis

16

ICA elméleti kérdések

Page 17: Független Komponens Analízis

17

Alapfogalmak

EntrópiaEgyüttes entrópiaNegentrópiaKölcsönös InformációKullback-Leibler távolság

Page 18: Független Komponens Analízis

18

Higher order moment and cumulants [Comon 94, Hyvarinen 97]

Nonlinear PCA [Karhunen 94; Oja 97] Maximalization of information transfer [Bell & Sejnowski 95;

Amari 96; Lee 97-98] Maximum likelihood [MacKay 96; Pearlmutter & Parra 96;

Cardoso 97] Negentropy maximalization [Girolami & Fyfe 97] Nemlineáris kersztkorreláció minimalizáció [Jutten-Herault,

Cardoso]

Különböző ICA megközelítések

Page 19: Független Komponens Analízis

19

ICA alapprobléma

x1, x2, … xn,

s1, s2, … sn,

x=As

x = i aisi

ICA = generatív modell: leírja, hogyan generálódik az input

ICA feladat: s=Wx ?eredeti jelek?

Page 20: Független Komponens Analízis

20

Bizonytalanságok

Nem tudjuk megmondani – a változók szórását– a változók sorrendjét

WP is jó, ha P permutáló mátrix

Page 21: Független Komponens Analízis

21

Feltételek a legegyszerűbb esetben

Ugyanannyi mikrofon van, mint hangszóró.A keverő mátrix teljes rangú.A források minden időpontban statisztikailag függetlenek.A források idősora stacionárius.Legfeljebb egy forrás lehet normális eloszlású.

Ekkor a források permutációtól, skálázástól és előjeltől eltekintve visszaállíthatóak.

Page 22: Független Komponens Analízis

22

Statisztikai függetlenség

Def y1,y2 val. változók függetlnek, ha

p(y1,y2) = p1(y1) p2(y2)

Állítás: Ekkor bármely h függvényre:

E[h1(y1)h2(y2)] = E[h1(y1)) E(h2(y2)]

Biz:

E[h1(y1)h2(y2)] = p(y1,y2) h1(y1)h2(y2) dy1dy2 =

= h1(y1) p1(y1) dy1 p2(y2) h2(y2) dy2 =

= E[h1(y1)] E[h2(y2)]

Page 23: Független Komponens Analízis

23

Korrelálatlanság, fehér adatok

Def y1,y2 val. változók korrelálatlanok (fehérek), ha

E[y1y2] = E[y1] E [y2]

Speciálisan, ha y1,y2 függetlenek, akkor korrelálatlanok.

Ha y1,y2 korrelálatlanok, abból nem következik,hogy függetlenek.

Page 24: Független Komponens Analízis

24

korrelálatlanság függetlenség

y1 y2 prob0 1 ¼0 -1 ¼1 0 ¼-1 0 ¼

y1

y2

1/4

1/4

1/4

1/4

Ezekre E[y1y2] = E[y1] E [y2]=0De E[y1

2y22] =0 1=E[y1

2] E [y22]

Page 25: Független Komponens Analízis

25

Page 26: Független Komponens Analízis

26

Gauss eloszlás nem jó

A standard többdimenziós eloszlás minden ortogonális transzformáltja ugyanúgy néz ki

p(x,y) ~ exp(-0.5*(x2+y2))

Page 27: Független Komponens Analízis

27

ICA algoritmusok

Távolodjunk a normális eloszlástól megközelítés:– Kurtózis alapján– Negentrópia alapján

Kölcsönös információ minimalizálásMaximum likelihood becslésNemlineáris keresztkorreláció

minimalizálásFastICA algoritmus

Page 28: Független Komponens Analízis

28

Maximum Likelihood ICA becslés

Page 29: Független Komponens Analízis

29

Zajmentes Maximum Likelihood ICA

x(t) = As(t), t=1,2,...,

s(t) Rn, t=1,2..., eredeti, ismeretlen forrásokx(t) Rm, t=1,2.. a megfigyelt keverékekA Rn x m, az ismeretlen keverő mátrixFeltesszük, hogy a források fi sűrűség

függvénye ismert pl Cauchy eloszlású

Page 30: Független Komponens Analízis

30

ML derivation of squared ICA

WssIW

xsWW

xwW

Wxw

sW

Asx

AWWxsAsx

W

})({

)())((1

][

)())((

))((

]))((log[|)det(|log

max|)det(|log))((log

))}((log|)det(|{log

))((log))((log

ahol (t),(t) ),()(

1

1

1

'1

1

1 1

1

11

-1

T

T

t

TT

T

tj

ii

iiij

T

t

Tii

ijijij

T

t

M

i

Tii

T

t

T

t

T

t

g

ttgT

txtsf

tsfTW

tfw

Tww

L

Ttf

tp

tptpL

tt

David J.C. MacKay (97)

Page 31: Független Komponens Analízis

31

Távolodjunk a normális eloszlástól megközelítés

Page 32: Független Komponens Analízis

32

Távolodjunk a normális eloszlástól megközelítés

Az ML módszernél kellett a sűrűség függvények ismerete, pedig az gyakran ismeretlen.

Centrális Határeloszlás Tétel : A független források keveréke közelebb kerül a normális eloszláshoz.

ICA célja: Úgy keverjük az adatokat, hogy a normális eloszlástól minél távolabb kerüljünk.– Kell egy normális eloszlástól való távolság mérték:

• Negentrópia maximalizálás• Kurtózis abszolút értékének maximalizálása

Page 33: Független Komponens Analízis

33

Cél: Normális eloszlástól minél távolabb kerülni

Kétféle módon lehet– Gauss-nál élesebben

tart nullához• ‘sub-gaussian’

– Gauss-nál lassabban tart nullához (nagy eltérések valószínűsége viszonylag nagy)

• ‘super-gaussian’

Page 34: Független Komponens Analízis

34

Normális eloszlástól való távolság mérése

Kurtózis

w

Txw

max}){(3}{)kurt( 224

yEyEy

y

Független x,y változókra:kurt(x+y)=kurt(x)+kurt(y)kurt(x) = 4 kurt(x)

Page 35: Független Komponens Analízis

35

3)]([

][)kurtosis(

22

4

i

ii sE

sEs

.

Kükönbözõ kurtosis elõjelû, azonos varianciájú eloszlásokat szemléltetõ hisztogrammok

Page 36: Független Komponens Analízis

36

NegentrópiaEntrópia:

H(y) = - f(y) log f(y) dy

Negentrópia:

J(y) = H(yGauss) – H(y) 0 azonos varianciájú eloszlásokra

A feladat tehát: (y)J maxw

Állítás: J(y) invariáns lineáris transzformációkra nézve

J(y) = J(Ay)

Page 37: Független Komponens Analízis

37

Negentrópia közelítései

J(y) ≈ (E[y3])2 /12 + (kurt(y))2/48

Kurtózis problémája az „outlier” (kiugró kivétel)

Általánosabb közelítés:

J(y) ≈ i ki (E[Gi(y)] – E[Gi(Gauss)])2

ahol ki >0 konstans

Gi(y) függvények

Gauss standard normális

Page 38: Független Komponens Analízis

38

Speciálisan 1 db k-ra

J(y) ≈ (E[G (y)] – E[G(yGauss)])2

Állítás:

G(y)= y4 választással

J(y) ≈ E[y3]2 /12 + kurt(y)2/48

mert a várható érték számításakor integrálni kell a sűrűségfüggvényt.

Page 39: Független Komponens Analízis

39

Egyéb gyakran alkalmazott nemlinearitások

G(y) = a-1 log cosh (ay) 1 a 2

G(y) = exp(-y2)

Azért, hogy a becsléseink robosztusak legyenek fontos, hogy G ne nőjön túl gyorsan.

Page 40: Független Komponens Analízis

40

A Kölcsönös Információ minimalizálásán alapuló ICA

algoritmusok

Page 41: Független Komponens Analízis

41

Kölcsönös Információ Minimalizációja

I(y1,…,ym) = i H(yi) – H(y1,…,ym) 0

Áll I(y1,…,ym) = 0 y1,…,ym függetlenek

A feladat: minW I(y1,…,ym)

Ha y=Wx, akkor

I(y1,…,ym) = i H(yi) – H(x1,…,xm) + +log |detW|

Page 42: Független Komponens Analízis

42

Kölcsönös Információ Minimalizációja

Ha yk-k közül csak a korrelálatlan és az egységnyi varianciájúak érdekelnek, akkor

1 = E[yyT] = E[ WxxTWT] = detW E[xxT] detWT

Tehát, detW konstans

Page 43: Független Komponens Analízis

43

Kölcsönös Információ Minimalizációja

A feladat: minW I(y1,…,ym)

y=Wx

I(y1,…,ym) = i H(yi) – H(x1,…,xm) + log |detW|

detW, H(x1,…,xm) konstans

A feladat: minW i H(yi)

Az outputok egyenkénti entrópia összege legyen minél kisebb.

Page 44: Független Komponens Analízis

44

Kölcsönös Információ Minimalizációja

Tehát detW konstans.

No de rögzített variancia esetén az entrópia és negentrópia csak konstansban különböznek:

H(yi)=C’-J(yi)

I(y1,…,ym) = i H(yi) – H(y1,…,ym) =

= i H(yi) – H(x1,…,xm) + log |detW|

= C - i J(yi)

Tehát a feladat: maxW i J(yi)

Page 45: Független Komponens Analízis

45

KIM

I(y1,…,ym) = C - i J(yi) 0

KIM-en alapuló ICA eljárás ekvivalens az egyes komponensek összegzett nem-Gauss jellegének maximalizációjával úgy, hogy az egyes komponensek dekorreláltak.

Page 46: Független Komponens Analízis

46

Független Komponens AnalízisKölcsönös Információ minimalizálása

WyyIΔW

xWxWΔW

WWx

WxyAsx

))(2(

)(2

:algoritmus azután sszámolgatá Kis

...)24/)()(6/)()(1)(()(

detlog)()(),...,(

, , )(

1

4433

min1

1

T

TT

iim

n

tanh

tanh

hyhyf

HyHyyI

))...P(sP(sP(s)n

Page 47: Független Komponens Analízis

47

Fast ICA algoritmus

Page 48: Független Komponens Analízis

48

Fast ICA algoritmus

Állítás:

Az ICA feladat megoldása megkapható

bizonyos G függvényekre a

min vagy maxw E[G(wTx)]

feladat megoldásaként az

E[(wTx)2] = ||w||2 kényszer mellett

0 = E[xG’(wTx)] – w = F(w)

w F(w) = E[xxTG’’(wTx)] – I

Page 49: Független Komponens Analízis

49

Fast ICA algoritmus

Közelítés:

E[xxTG’’(wTx)] ≈ E[xxT]E[G’’(wTx)] =E[G’’(wTx)]

Oldjuk meg az előbbi feladatot Newton módszerrel:

w+ = w – (E[xG’(wTx)] – w )(E[G’’(wTx)] – )-1

Ez tovább egyszerüsíthető:w+ = E[xG’(wTx)] – E[G’’(wTx)]ww+ w+ / ||w+||