Download - Inteligencja Obliczeniowa Wizualizacja
Inteligencja ObliczeniowaWizualizacja.
Wykład 16
Włodzisław DuchUniwersytet Mikołaja Kopernika
Co było
• Mapy w mózgu.
• Samoorganizacja
• Sieci Kohonena
Co będzie
• Wizualizacja
• Skalowanie wielowymiarowe
• Porównanie z modelem SOM
Wizualizacja w SOM i MDSWizualizacja w SOM i MDSWizualizacja w SOM i MDSWizualizacja w SOM i MDS
• MDS - skalowanie wielowymiaroweInformacja o skupieniach w danych zawarta jest w relacjach topograficznych maksimów gęstości rozkładow. Wizualizacja w niskowymiarowych przestrzeniach wymaga oceny stopnia zniekształcenia - miary liczbowej.
MDS, MultiDimensional Scaling (Thorton 1954, Kruskal 1964, Sammon 1964, Duch 1995) - proste miary zgodności topograficznej (MZT).
Przestrzeń danych RN, wektory X mapowane na przestrzeń docelową, zwykle Y R2.
Odległości Rij = D(Xi, Xj) pomiędzy Xi i Xj w RN;
odległości rij = d(Yi,Yj) w R2.
Znajdź mapę X Y=M(X) minimalizującą globalną MZT, czyli różnicę pomiędzy Rij i rij.
Miary zgodności topograficznejMiary zgodności topograficznej
Współczynnik stresu i alienacji (Kruskal); dowolna funkcja o nieujemnych przyczynkach, np. f. entropowe.
Miara transmisji informacji, określa ile informacji uległo straceniu przy redukcji wymiarowości.
2K
ij iji j
E R r
r 21 /
K
a ij iji j
E R r
r
2
2 2
0 1
K
ij iji j
K K
ij iji j i j
R r
AR r
r
MDS i SOMMDS i SOMMDS i SOMMDS i SOM
Mapa: nie istnieje funkcja!Umieszczenie nowego punktu a mapie wymaga nowej minimalizacji; tylko dla ustalonej liczby punktów można znaleźć odpowiednią funkcję.
Pytania:1) Jak dobre są mapy otrzymane z SOM (w sensie miary TMZ) ?2) Jak wyglądają mapy optymalne ?3) Jak udoskonalić SOM by dawał lepszą wizualizację ?
Zamiast SOM dobra klasyfikacja + MDS ?Lokalna wizualizacja danych, interakcyjne powiększanie, tak, by uniknąć zbyt dużych zniekształceń topograficznych.
Mapy semantyczneMapy semantyczneMapy semantyczneMapy semantyczne
Przestrzeń cech dla wyrazów: semantyka w relacjach topograficznych?Np. zdania o 16 zwierzętach: gołąb, kura, kaczka, gęś, sowa, jastrząb, orzeł, lis, pies, wilk, kot, tygrys, lew, koń, zebra, krowa. Koń biega; koń ma kopyta; koń jest duży... 13 binarnych cech: mały, średni, duży; ma 2 nogi, 4 nogi, włosy, kopyta, grzywę, pióra; lubi polować, biegać, latać, pływać. 76 zdań opisujących zwierzęta, razem 13+16=29 wymiarów.
Jak wygląda mapa SOM i MDS? Naturalna klasyfikacja nazw zwierząt: Ssaki oddzielone od ptaków, drapieżniki od roślinożernych, małe zwierzęta od dużych. Pytanie o podobieństwo zwierząt do siebie ma sens również w świetle odległości na takiej toposemantycznej mapie. Podobieństwo wyraża się w czasach reakcji odpowiadających osób.
Mapy semantyczne: MDS i SOMMapy semantyczne: MDS i SOMMapy semantyczne: MDS i SOMMapy semantyczne: MDS i SOM
duck horse
zebra
cow
wolf
tiger
lion
goose
hawk
owldove
heneagle
dog
fox cat
MDS danych eksperymentalychMDS danych eksperymentalychMDS danych eksperymentalychMDS danych eksperymentalych
HipersześcianyHipersześcianyHipersześcianyHipersześciany
Hipersześcian 5dHipersześcian 5dHipersześcian 5dHipersześcian 5d
Sympleksy 6-11Sympleksy 6-11Sympleksy 6-11Sympleksy 6-11
Sympleksy 15-20Sympleksy 15-20Sympleksy 15-20Sympleksy 15-20
KulaKula
216 neuronów 1D, 18x12 neuronów w 2D i 6x6x6 neuronów w 3D.
216 neuronów w 1D, 2D i 3D, rosnąca sieć GCS.
Przykłady zastosowańPrzykłady zastosowań
Sztuczne życie i AI: analiza danych z sensorów, kontrola ruchów robotów, mapy poruszania się po labiryntach, akwizycja wiedzy, podobieństwo tekstów i KDM .
Badania nad mózgiem: formowanie się map topograficznych, tonotopicznych, motorycznych, somatotopowych, w układzie wzrokowym.
Klasyfikacja: genetyka, własności białek, analiza mowy, klasyfikacja pieśni godowych owadów i ptaków, QSAR, astronomia, fizyka ....
Kompresja danych, szczególnie obrazów i dźwięków, filtrowanie informacji.
Diagnostyka: medycyna, inżynieria
Język naturalny: kategoryzacje lingwistyczne, fonetyczne rozpoznawanie mowy, rozbiór gramatyczny, wzorce przenoszenia wyrazów, nabywanie umiejętności lingwistycznych.
Przykłady cd.Przykłady cd.
Optymalizacja: konfiguracja połączeń telefonicznych, projektowanie VLSI, szeregi czasowe, zagadnienia kolejkowania.
SOM jako algorytm optymalizacji, np. reprezentacja N-miast na torusie - na razie tylko w 1 pracy.
Przetwarzanie sygnałów: filtry adaptacyjne, analiza w czasie rzeczywistym, sygnały radarowe, sonarowe, sejsmiczne, medyczne, podczerwone ...
Rozpoznawanie obrazu: segmentacja, wykrywanie obiektów, analiza tekstur.
Mapy ekonomiczne.Mapy ekonomiczne.Dane: Bank Światowy 1992, 39 wskaźników jakości życia.
SOM i mapa świata; analiza giełdy i analiza stopów.
Olej z Włoch.Olej z Włoch.
572 próbek olejków z oliwek pobrano z 9 prowincji Włoch.
Sieć SOM 20 x 20, uczona % 8 tłuszczów zawartych w olejkach.
Mapa 8D => 2D.
Dokładność klasyfikacji na testowanych próbkach rzędu 95-97%.
Co dalej?
• Podstawy teoretyczne CI.
• Inspiracje statystyczne.
• Drzewa decyzji.
• Metody oparte na podobieństwie.
• Uczenie maszynowe, indukcja reguł logicznych.
• Zastosowania.
Koniec wykładu 16
Dobranoc !