wielowymiarowa analiza korespondencji wielowymiarowa...

15
Wielowymiarowa Analiza Korespondencji Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW

Upload: phamphuc

Post on 27-Feb-2019

222 views

Category:

Documents


0 download

TRANSCRIPT

Wielowymiarowa Analiza Korespondencji

Wielowymiarowa Analiza Danychz wykorzystaniem pakietu SPSS

Joanna Ciecieląg, Marek Pęczkowski

WNE UW

ANALIZA KORESPONDENCJI

opisowa i eksploracyjna technika analizy danych jakościowych.

pozwala na graficzne przedstawienie zmiennych w niskowymiarowej

przestrzenistosunkowo łatwo interpretowalne wyniki

technika redukcji danych – przedstawienie danych w bardziej przystępnej formie, kosztem utraty pewnej ilości informacji

zaliczana do tej samej klasy co analiza czynnikowa

ANALIZA KORESPONDENCJI

Analizę korespondencji w podstawowym zastosowaniu wykonuje się dla przypadku

dwóch zmiennych jakościowych.

Klasyczne zastosowanie jest jednak rzadko stosowane, właśnie ze względu na

konieczność ograniczenia się do dwóch zmiennych.

Jednak metoda ta pozwala również na analizę bezpośrednio tablic wielodzielnych

ANALIZA KORESPONDENCJI

Przykład.

Analiza wizerunku marek produktówDysponując ocenami baterii stwierdzeń dla poszczególnych marek

można stworzyć sztuczną zmienną zawierającą średnie oceny marek

dla tych stwierdzeń – drugą zmienną będzie wtedy identyfikator

marki. Na bazie powstałej tablicy kontyngencji można otrzymaćmapę percepcji, która pozwala w jednym układzie współrzędnych

zaznaczyć marki i stwierdzenia. Wzajemne położenie marek i

stwierdzeń pozwala wnioskować, na ile poszczególne marki sązwiązane z każdym z nich oraz czym różnią się ich wizerunki.

ANALIZA KORESPONDENCJI

Jak zrobić to w praktyce?

Przykład zbioru danych: wizer_czynniki.sav banki.sav

konieczne jest utworzenie zmiennej systemowej rowcat_:

val lab rowcat_1 'NA SPECJALNE OKAZJE'2 'NATURALNE'3 'DOBRY MARKETING'4 'TRADYCYJNE'5 'NIEDROGIE'.exe.

ANALIZA KORESPONDENCJI

*Pierwsze wiersze.

CORRESPONDENCETABLE = all (5,3)‏/DIMENSIONS = 2/MEASURE = euclid/STANDARDIZE = RCMEAN/NORMALIZATION = SYMMETRICAL/PRINT = TABLE RPOINTS CPOINTS/PLOT = NDIM(1,MAX) BIPLOT(20) /OUTFILE=score('xxx.sav') ‏/supplementary =row(4,5).

exe.

Liczba wierszy - stwierdzeń

Liczba kolumn - marek

Miara odległości – euclid (dla średnich)‏– chisq (dla odsetków)‏

Zmienne pasywne

ANALIZA KORESPONDENCJI

Zmienne pasywne:

nie wpływają na geometryczną orientację przestrzeni dzięki

temu możliwe jest umieszczenie dodatkowych zmiennych np.

demograficznych, które mogą być pomocne w interpretacji

wyników.

mogą też służyć do porównywania różnych grup

przypadku wystąpienia efektu dźwigni, kategorie rzadko

występujące mogą być potraktowane jako zmienne pasywne,

podobnie jak braki danych

HOMALS

Większe możliwości analizy daje również wielowymiarowa analiza

korespondencji, nazywana też analizą homogeniczności (HOMALS),

będąca rozszerzeniem analizy korespondencji na przypadek wielu

zmiennych.

HOM ogeneity analysis via A lternating L east S quares => HOMALS

HOMALS

Dane wejściowe:

nominalne, ewentualnie porządkowe z ograniczoną liczbą poziomów

Cele

Odkrycie kluczowych, ukrytych cech respondentów Wskazanie współwystępujących grup kategorii

Identyfikacja związków przyczynowo-skutkowych

Stworzenie mapy percepcyjnej

Identyfikacja jednorodnych grup respondentów

HOMALS

Obiekty o podobnych profilach są blisko siebie Kategorie o podobnej zawartości są blisko siebie Homogeniczność danej grupy zmiennych jest mierzona przez: obliczenie sumy kwadratów odchyleń dla każdego obiektu

(OSS)‏ oraz sumy kwadratów odchyleń pomiędzy obiektami (TSS)‏

Miarą homogeniczności jest stosunek OSS i TSS homogeniczność jest doskonała gdy OSS=0

Celem jest optymalne skwantyfikowanie zmiennych (przypisanie ich kategoriom wartości liczbowych), w ten sposób, by zmaksymalizować homogeniczność

HOMALS

Przygotowanie danych dla SPSS:

kodowanie kategorii liczbami naturalnymi, zaczynając od 1

nie ma kategorii pasywnych – każda kategoria musi byćkodowana kolejną liczbą naturalną

unikać kategorii rzadko występujących (<10% próby) – w

szczególności takie kategorie mogą mieć tak wysoki wkład w

całkowitą zmienność zbioru, że wyznaczą jeden z wymiarów,

choć nie będzie on odpowiadał żadnej kategorii latentnej

HOMALS

HOMALS może być zastosowany do konstruowania syntetycznych

skal mierzących cechy latentne (ukryte):

analiza wartości punktów w układzie współrzędnych jako wartości do

konstrukcji skali (podobnie jak w PCA)‏

HOMALS

*Tworzenie skali: (pliki stw.sav stw.sps )

HOMALS

/VARIABLES=p2(7) p3(2) p4(3)‏

/ANALYSIS=p2 p3 p4

/DIMENSION=1

/PRINT FREQ EIGEN DISCRIM QUANT

/PLOT QUANT OBJECT NDIM(ALL,MAX)‏

/SAVE = (1)‏

/MAXITER = 100

/CONVERGENCE = .00001 .

TYLKO jeden wymiar

zachowuje jeden wymiar - jako skalę

HOMALS

HOMALS kwantyfikuje nie tylko kategorie zmiennych ale też każdąobserwację

Współrzędne punktu na każdym wymiarze są wyliczone tak, aby

punkt reprezentujący każdą obserwację był środkiem ciężkości dla

skwantyfikowanych kategorii do których należy

W SPSS w opcjach możemy utworzyć nowe zmienne ze

współrzędnymi