wielowymiarowa analiza korespondencji wielowymiarowa...
TRANSCRIPT
Wielowymiarowa Analiza Korespondencji
Wielowymiarowa Analiza Danychz wykorzystaniem pakietu SPSS
Joanna Ciecieląg, Marek Pęczkowski
WNE UW
ANALIZA KORESPONDENCJI
opisowa i eksploracyjna technika analizy danych jakościowych.
pozwala na graficzne przedstawienie zmiennych w niskowymiarowej
przestrzenistosunkowo łatwo interpretowalne wyniki
technika redukcji danych – przedstawienie danych w bardziej przystępnej formie, kosztem utraty pewnej ilości informacji
zaliczana do tej samej klasy co analiza czynnikowa
ANALIZA KORESPONDENCJI
Analizę korespondencji w podstawowym zastosowaniu wykonuje się dla przypadku
dwóch zmiennych jakościowych.
Klasyczne zastosowanie jest jednak rzadko stosowane, właśnie ze względu na
konieczność ograniczenia się do dwóch zmiennych.
Jednak metoda ta pozwala również na analizę bezpośrednio tablic wielodzielnych
ANALIZA KORESPONDENCJI
Przykład.
Analiza wizerunku marek produktówDysponując ocenami baterii stwierdzeń dla poszczególnych marek
można stworzyć sztuczną zmienną zawierającą średnie oceny marek
dla tych stwierdzeń – drugą zmienną będzie wtedy identyfikator
marki. Na bazie powstałej tablicy kontyngencji można otrzymaćmapę percepcji, która pozwala w jednym układzie współrzędnych
zaznaczyć marki i stwierdzenia. Wzajemne położenie marek i
stwierdzeń pozwala wnioskować, na ile poszczególne marki sązwiązane z każdym z nich oraz czym różnią się ich wizerunki.
ANALIZA KORESPONDENCJI
Jak zrobić to w praktyce?
Przykład zbioru danych: wizer_czynniki.sav banki.sav
konieczne jest utworzenie zmiennej systemowej rowcat_:
val lab rowcat_1 'NA SPECJALNE OKAZJE'2 'NATURALNE'3 'DOBRY MARKETING'4 'TRADYCYJNE'5 'NIEDROGIE'.exe.
ANALIZA KORESPONDENCJI
*Pierwsze wiersze.
CORRESPONDENCETABLE = all (5,3)/DIMENSIONS = 2/MEASURE = euclid/STANDARDIZE = RCMEAN/NORMALIZATION = SYMMETRICAL/PRINT = TABLE RPOINTS CPOINTS/PLOT = NDIM(1,MAX) BIPLOT(20) /OUTFILE=score('xxx.sav') /supplementary =row(4,5).
exe.
Liczba wierszy - stwierdzeń
Liczba kolumn - marek
Miara odległości – euclid (dla średnich)– chisq (dla odsetków)
Zmienne pasywne
ANALIZA KORESPONDENCJI
Zmienne pasywne:
nie wpływają na geometryczną orientację przestrzeni dzięki
temu możliwe jest umieszczenie dodatkowych zmiennych np.
demograficznych, które mogą być pomocne w interpretacji
wyników.
mogą też służyć do porównywania różnych grup
przypadku wystąpienia efektu dźwigni, kategorie rzadko
występujące mogą być potraktowane jako zmienne pasywne,
podobnie jak braki danych
HOMALS
Większe możliwości analizy daje również wielowymiarowa analiza
korespondencji, nazywana też analizą homogeniczności (HOMALS),
będąca rozszerzeniem analizy korespondencji na przypadek wielu
zmiennych.
HOM ogeneity analysis via A lternating L east S quares => HOMALS
HOMALS
Dane wejściowe:
nominalne, ewentualnie porządkowe z ograniczoną liczbą poziomów
Cele
Odkrycie kluczowych, ukrytych cech respondentów Wskazanie współwystępujących grup kategorii
Identyfikacja związków przyczynowo-skutkowych
Stworzenie mapy percepcyjnej
Identyfikacja jednorodnych grup respondentów
HOMALS
Obiekty o podobnych profilach są blisko siebie Kategorie o podobnej zawartości są blisko siebie Homogeniczność danej grupy zmiennych jest mierzona przez: obliczenie sumy kwadratów odchyleń dla każdego obiektu
(OSS) oraz sumy kwadratów odchyleń pomiędzy obiektami (TSS)
Miarą homogeniczności jest stosunek OSS i TSS homogeniczność jest doskonała gdy OSS=0
Celem jest optymalne skwantyfikowanie zmiennych (przypisanie ich kategoriom wartości liczbowych), w ten sposób, by zmaksymalizować homogeniczność
HOMALS
Przygotowanie danych dla SPSS:
kodowanie kategorii liczbami naturalnymi, zaczynając od 1
nie ma kategorii pasywnych – każda kategoria musi byćkodowana kolejną liczbą naturalną
unikać kategorii rzadko występujących (<10% próby) – w
szczególności takie kategorie mogą mieć tak wysoki wkład w
całkowitą zmienność zbioru, że wyznaczą jeden z wymiarów,
choć nie będzie on odpowiadał żadnej kategorii latentnej
HOMALS
HOMALS może być zastosowany do konstruowania syntetycznych
skal mierzących cechy latentne (ukryte):
analiza wartości punktów w układzie współrzędnych jako wartości do
konstrukcji skali (podobnie jak w PCA)
HOMALS
*Tworzenie skali: (pliki stw.sav stw.sps )
HOMALS
/VARIABLES=p2(7) p3(2) p4(3)
/ANALYSIS=p2 p3 p4
/DIMENSION=1
/PRINT FREQ EIGEN DISCRIM QUANT
/PLOT QUANT OBJECT NDIM(ALL,MAX)
/SAVE = (1)
/MAXITER = 100
/CONVERGENCE = .00001 .
TYLKO jeden wymiar
zachowuje jeden wymiar - jako skalę
HOMALS
HOMALS kwantyfikuje nie tylko kategorie zmiennych ale też każdąobserwację
Współrzędne punktu na każdym wymiarze są wyliczone tak, aby
punkt reprezentujący każdą obserwację był środkiem ciężkości dla
skwantyfikowanych kategorii do których należy
W SPSS w opcjach możemy utworzyć nowe zmienne ze
współrzędnymi