faktorska analiza-seminarski rad

61
Faktorska analiza SADRŽAJ Uvod.............................................................. .................................................................. ....................2 1. Faktorska analiza - pojam i karakteristike.................................................. ...........................3 1.1. Šta je faktorska analiza?........................................................... ..................................................3 1.2. Hipotetički primer faktorske analize........................................................... ...........................4 2. Faze u faktorskoj analizi.................................................. ...............................................6 2.1. Proces odlučivanja u faktorskoj analizi........................................................... .....................6 2.2. Faza 1-Ciljevi faktorske analize........................................................... ..................................7 2.3. Faza 2-Dizajniranje faktorske analize........................................................... .......................9 2.4. Faza 3-Pretpostavke u faktorskoj analizi........................................................... ...............10 2.5. Faza 4-Izvođenje faktora i procena opšteg uklapanja......................................................11 2.6. Faza 5-Interpretiranje faktora........................................................... .................................17 1

Upload: mmirsadm

Post on 03-Jan-2016

330 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Faktorska Analiza-seminarski Rad

Faktorska analiza

SADRŽAJ

Uvod....................................................................................................................................................2

1. Faktorska analiza - pojam i karakteristike.............................................................................31.1. Šta je faktorska analiza?.............................................................................................................31.2. Hipotetički primer faktorske analize......................................................................................4

2. Faze u faktorskoj analizi.................................................................................................6 2.1. Proces odlučivanja u faktorskoj analizi................................................................................6

2.2. Faza 1-Ciljevi faktorske analize.............................................................................................7 2.3. Faza 2-Dizajniranje faktorske analize..................................................................................9

2.4. Faza 3-Pretpostavke u faktorskoj analizi..........................................................................10 2.5. Faza 4-Izvođenje faktora i procena opšteg uklapanja......................................................11 2.6. Faza 5-Interpretiranje faktora............................................................................................17 2.7. Faza 6-Validacija faktorske analize....................................................................................24 2.8. Faza 7-Dodatne upotrebe rezultata faktorske analize......................................................25

3. Primer faktorske analize u statističkom softveru MINITAB.........................................29

Zaključak.........................................................................................................................................36

Literatura........................................................................................................................................37

1

Page 2: Faktorska Analiza-seminarski Rad

Faktorska analiza

Uvod

Faktorska analiza je metodološki temelj istraživanja u različitim područjima mnogih društvenih nauka, a primjenjuje se i u istraživanjima na području prirodnih nauka. Faktorska analiza kao skup statističko-matematičkih postupaka pogodnih za analizu podataka o međusobnoj povezanosti među posmatranim pojavama, koja je nastala i koja se i danas razvija u sklopu savremene psihologije, pokazala se korisnom u svim situacijama gde se u istraživanjima istovremeno pojavljuje veći broj varijabli koje stoje u medusobnim korelacijama i gde še zahteva utvrđivanje osnovnih izvora kovarijacije među podacima. Posmatranje takvih medusobno povezanih pojava posebno je značajno u različitim područjima psihologije sociologije, pedagogije, politologije, ekonomije, antropologije i medicine, ali i u hemiji farmakologiji i drugim oblastima.

Multivarijantna statistička tehnika - faktorska analiza, se sve više koristi tokom poslednje decenije, na svim poljima poslovnih istraživanja. Pošto broj varijabli koje treba razmotriti u multivarijantnim tehnikama raste, postoji srazmerna potreba za većim poznavanjem strukture i medjuodnosa varijabli. Predmet rada je upravo faktorska analiza, tehnika koja je naročito pogodna za analiziranje šema kompleksnih, multidimenzionalnih odnosa sa kojima se sreću istraživači. U radu se uopšteno definišu i objašnjavaju konceptualni pojmovi i fundamentalni aspekti faktorske analize.

Faktorska analiza se može koristiti za ispitivanje osnovnih šema ili odnosa za veliki broj varijabli, i za determinisanje da li se informacije mogu sažeti ili sumirati u manji set faktora ili komponenti. Da bi se dalje razjasnili metodološki koncepti, takodje se uključuju osnovne smernice za prezentovanje i interpretiranje rezultata ovih tehnika. Cilj rada je da teorijski objasni postupak faktorske analize i da kroz jednostavan primer odrađen u statističkom softveru MINITAB pokaže postupak dolaženja do željenih rezultata.

2

Page 3: Faktorska Analiza-seminarski Rad

Faktorska analiza

1. Faktorska analiza - pojam i karakteristike

1.1. Šta je faktorska analiza?

Metod multivarijacione analize koji se koristi za opis međusobne zavisnosti velikog broja promenljivih korišćenjem manjeg broja osnovnih, ali neopažljivih slučajnih promenljivih poznatih kao faktori, naziva se faktorska analiza. Osnovna ideja faktorske analize, onako kako je izložena krajem prošlog stoleća od strane Francis Galtona, Charles Spearmana i drugih, proizašla je uglavnom iz napora psihologa da bolje razumeju i istraže kompeksan fenomen „inteligencije“. U tim istraživanjima korišćeni su brojni testovi inteligencije sa velikim brojem pitanja. Ona su trebala da istaknu različite dimenzije opšte sposobnosti ispitanika, kao što su verbalna sposobnost, matematička sposobnost, memorija itd. Faktorska analiza je razvijena za analizu rezultata tih testova. Njen zadatak je bio da utvrdi da li je „inteligencija“ komponovana od jednog bazičnog, opšteg faktora ili od nekoliko zajedničkih faktora koji mere osobine kao što su na primer, „verbalna“, „matematička“ i druge sposobnosti.1

Faktorska analiza je generičko ime dato klasi multivarijaciona statističkih metoda - čija je primarna svrha definisanje osnovne strukture u matrici podataka. Uopšteno govoreći, ona se bavi problemom analiziranja strukture međuodnosa (korelacija) među velikim brojem varijabli (npr. skorovi testa, ajtemi testa, odgovori na upitnik), putem definisanja seta zajedničkih osnovnih dimenzija, poznatih kao faktori. Kod faktorske analize, istraživač može prvo da identifikuje odvojene dimenzije strukture, i onda determiniše obim u kom je svaka varijabla objašnjena pomoću svake dimenzije. Kada se determinišu ove dimenzije i objašnjenje svake varijable, mogu se ostvariti dve primarne upotrebe faktorske analize – sumarizacija i redukcija podataka. U sumarizaciji podataka, faktorska analiza izvodi osnovne dimenzije, koje kada se interpretiraju i shvate, opisuju podatke u mnogo manjem broju koncepata nego originalne individualne varijable. Redukcija podataka se može ostvariti izračunavanjem skorova za svaku osnovnu dimenziju i njihovom zamenom umesto originalnih varijabli.

Primarna prednost multivarijacionih tehnika je njihova sposobnost da se prilagode višestrukim varijablama u pokušaju shvatanja kompleksnih odnosa, što nije moguće sa univarijantnim i bivarijantnim metodama. Povećanje broja varijabli, takođe povećava mogućnost da nisu sve varijable nekorelirane i da nisu reprezenti distinktnih koncepata. Umesto toga, grupe varijabli mogu biti međupovezane u meri da su sve predstavnici jednog opštijeg koncepta. To može biti namerno, kao što je pokušaj da se mere mnogi aspekti ličnosti ili imidža radnje, ili može nastati samo iz dodavanja novih varijabli. U oba slučaja, istraživač mora da zna kako su varijable međupovezane, da bi bolje intepretirao rezultate. Konačno, ako je broj varijabli prevelik ili postoji potreba za boljim predstavljanjem manjeg broja koncepata a ne mnogo aspekata, faktorska analiza može pomoći u odabiru reprezentativnog podskupa varijabli ili čak u stvaranju novih varijabli, kao zamene za originalne varijable, dok se ipak zadržava njihov originalni karakter.

Faktorska analiza se razlikuje od tehnika zavisnosti tj. višestrukaeregresije, diskriminacione analize, multivarijacine analize varijanse ili kanoničke korelacije, u kojima se jedna ili više varijabli eksplicitno smatra kriterijumom ili zavisnim varijablama, a sve ostale su prediktor ili nezavisne varijable. Faktorska analiza je tehnika međuzavisnosti u kojoj se sve varijable istovremeno razmatraju, svaka je u vezi sa svim ostalima, a ipak koristi koncept varijante, linearnog kompozita varijabli. U faktorskoj analizi, varijante (faktori) se formiraju da maksimiraju svoje objašnjenje čitavog seta varijabli, a ne da predvide zavisnu varijablu (varijable). Ako bi

1 Kovačić, J., Z., Multivarijaciona analiza, Ekonomski fakultet, Beograd, 1994., str. 203.

3

Page 4: Faktorska Analiza-seminarski Rad

Faktorska analiza

trebalo da izvučemo analogiju sa tehnikama zavisnosti, bilo bi to da je svaka od opserviranih varijabli, zavisna varijabla tj., funkcija nekog osnovnog i latentnog seta faktora (dimenzija), koji su sami sastavljeni od svih ostalih varijabli. Stoga, svaku varijablu predviđaju sve ostale. Obrnuto, može se posmatrati svaki faktor (varijanta) kao zavisna varijabla tj., funkcija čitavog seta opserviranih varijabli. Ove analogije ilustruju razlike u svrsi između tehnika zavisnosti i međuzavisnosti (identifikacija strukture).

Faktorsko analitičke tehnike mogu ostvariti svoje svrhe iz eksploratorne ili iz konfirmatorne perspektive. Vodi se kontinuirana debata u vezi adekvatne uloge faktorske analize. Mnogi istraživači je smatraju samo eksploratornom, korisnom u traganju za strukturom među setom varijabli ili je smatraju metodom redukcije podataka. U ovoj perspektivi, faktorsko analitičke tehnike „uzimaju ono što vam podaci daju“ i ne postavljaju nikakva a priori ograničenja na procenu komponenti ili broj komponenti koje treba ekstrahovati. Za mnoge – ako ne i za većinu – aplikacije, ova upotreba faktorske analize je odgovarajuća. Međutim, u drugim situacijama, istraživač unapred zamišlja stvarnu strukturu podataka, na bazi teoretske podrške ili ranijeg istraživanja. Istraživač može želeti da testira hipoteze uključujući pitanja kao što su koje varijable treba grupisati u faktor ili precizan broj faktora. U ovim slučajevima, istraživač zahteva da faktorska analiza zauzme konfirmatorni pristup tj., proceni stepen u kom podaci zadovoljavaju očekivanu strukturu. Metodi o kojima diskutujemo u ovom radu, ne obezbeđuju direktno potrebnu strukturu za formalizovano testiranje hipoteze. U ovom poglavlju posmatramo faktorsko analitičke tehnike primarno sa eksploratornog ili nekonfirmatornog stanovišta.

1.2. Hipotetički primer faktorske analize

Pretpostavimo da je jedna maloprodajna firma kroz kvalitativno istraživanje, identifikovala 80 različitih karakteristika maloprodajnih radnji i njihovih usluga, za koje su potrošači pomenuli da utiču na njihov izbor radnji. Ovaj prodavac na malo želi da razume kako potrošači donose odluke, ali smatra da ne može da evaluira 80 odvojenih karakteristika ili razvije planove akcije za ove mnogobrojne varijable, jer su one previše specifične. Umesto toga, on bi želeo da zna da li potrošači razmišljaju u opštijim evaluativnim dimenzijama, umesto u specifičnim ajtemima. Da bi identifikovao ove dimenzije, prodavac na malo bi mogao da izvrši pregled koji traži evaluaciju potrošača za svaki od ovih specifičnih ajtema. Onda bi se upotrebila faktorska analiza za identifikovanje osnovnih evaluativnih dimenzija. Pretpostavlja se da su specifični ajtemi koji visoko koreliraju, „član“ šire dimenzije. Ove dimenzije postaju kompoziti specifičnih varijabli, što dalje dozvoljava da se dimenzije interpretiraju i opišu. U našem primeru, faktorska analiza bi mogla da identifikuje takve dimenzije kao što su asportiman proizvoda, kvalitet proizvoda, cene, osoblje radnje, usluga, i atmosfera u radnji, kao evaluativne dimenzije koje koriste respondenti. Svaka od ovih dimenzija sadrži specifične ajteme koji su aspekat šire evaluacijske dimenzije. Iz ovih otkrića, maloprodavac onda može da upotrebi dimenzije (faktore) da definiše široke oblasti za planiranje i akciju.

Ilustrativan primer jednostavne aplikacije faktorske analize je prikazan na slici 1., koja predstavlja korelacionu matricu za devet elemenata imidža radnje. U ovaj set su uključene mere ponude proizvoda, osoblja radnje, cenovnih nivoa, i iskustva i usluge u radnji. Pitanje koje istraživač može želeti da uputi je : Da li su svi ovi elementi odvojeni u svojim evaluativnim odlikama, ili se „grupišu“ u neke opštije oblasti evaluacije? Npr. Da li se svi elementi proizvoda grupišu zajedno? Gde se uklapa cenovni nivo, ili je on odvojen? U kakvoj su međusobnoj vezi odlike u radnji (npr. osoblje radnje, usluga i atmosfera)? Vizuelni pregled originalne korelacione matrice (slika 1., deo 1), ne otkriva lako neku specifičnu šemu. Postoje rasute visoke korelacije, ali grupisanja varijabli nisu očigledna. Primena faktorske analize rezultira u grupisanju varijabli kao što je prikazano na delu 2 slike 1. Ovde se javljaju neke interesantne šeme. Prvo, grupisane su zajedno četiri varijable, koje su sve u vezi sa iskustvom kupaca u radnji. Dalje, grupisane su

4

Page 5: Faktorska Analiza-seminarski Rad

Faktorska analiza

zajedno tri varijable koje opisuju asortiman i dostupnost proizvoda. Na kraju grupisani su kvalitet proizvoda i cenovni nivoi. Svaka grupa predstavlja set visoko međupovezanih varijabli, koji može odražavati opštiju evaluativnu dimenziju. U ovom slučaju, mogli bi obeležiti tri grupe varijabli sledećim oznakama: iskustvo u radnji, ponuda proizvoda i vrednost. To bi dalo menadžmentu radnje manji set koncepata za razmatranje, u bilo kom strateškom ili taktičkom marketing planu, a ipak bi pružalo uvid u ono što sačinjava svaku opštu oblast.

Deo 1: Originalna korelaciona matrica  V1 V2 V3 V4 V5 V6 V7 V8 V9V1 Cenovni nivo 1.000                V2 Osoblje radnje 0,427 1.000              

V3 Politika reklamacije 0,302 0,771 1.000            

V4 Dostupnost proizvoda 0,470 0,497 0,427 1.000          

V5 Kvalitet proizvoda 0,765 0,406 0,307 0,472 1.000        

V6 Dubina asortimana 0,281 0,445 0,423 0,713 0,325 1.000      

V7 Širina asortimana 0,354 0,490 0,471 0,719 0,378 0,724 1.000    

V8 Usluga u radnji 0,242 0,719 0,733 0,428 0,240 0,311 0,435 1.000  

V9 Atmosfera u radnji 0,372 0,737 0,774 0,479 0,326 0,429 0,466 0,710 1000

Deo 2: Korelaciona matrica varijabli, nakon grupisanja varijabli u faktore  V3 V8 V9 V2 V6 V7 V4 V1 V5

V3 Politika reklamacije 1.000                

V8 Usluga u radnji 0,733 1.000              

V9 Atmosfera u radnji 0,774 0,710 1.000            

V2 Osoblje radnje 0,741 0,719 0,787 1.000          

V6 Dubina asortimana 0,423 0,311 0,429 0,445 1.000        

V7 Širina asortimana 0,471 0,435 0,468 0,490 0,724 1.000      

V4 Dostupnost proizvoda 0,427 0,428 0,479 0,497 0,713 0,719 1.000    

V1 Cenovni nivo 0,302 0,242 0,372 0,427 0,281 0,354 0,470 1.000  

V5 Kvalitet proizvoda 0,307 0,240 0,326 0,406 0,325 0,378 0,472 0,765 1.000Osenčene oblasti predstavljaju varijable grupisane zajedno pomoću faktorske analize. iskustvo kupaca u radnji ponuda proizvoda vrednost

Slika 1. Ilustrativni primer upotrebe faktorske analize za identifikovanje strukture u okviru grupe varijabli

5

Page 6: Faktorska Analiza-seminarski Rad

Faktorska analiza

2. Faze u faktorskoj analizi

2.1. Proces odlučivanja u faktorskoj analizi

U nastavku će biti predstavljen model odlučivanja u faktorskoj analizi kroz šest faza. Slika 2. pokazuje prve tri faze strukturiranog pristupa izgradnji multivarijacionog modela, a slika 3. koja se nalazi u nastavu ovog rada detaljno prikazuje krajnje tri faze, plus dodatnu fazu (faza 7) posle estimacije, interpretacije i validacije faktorskih modela, što pomaže u odabiru surogat varijabli, izračunavanju faktorskih skorova ili kreiranju sumiranih skala za korišćenje u drugim multivarijacionim tehnikama.

Problem istraživanjaDa li je analiza eksploratorna ili konfirmatorna?Odabrati cilj(eve):Sumarizacija podataka & identifikovanje strukturaRedukcija podataka

Modeliranje strukturalne jednačine

Odabrati tip faktorske analizeŠta se grupiše – varijable ili slučajevi

Dizajn istraživanjaKoje su varijable uključene?

Kako se mere varijable?Koja je željena veličina uzorka?

PretpostavkeStatistička razmatranja normalnosti,

linearnosti i homoskedastičnostiHomogenost uzorka Konceptualne veze

U Fazu 4

SlučajeviFaktorska analiza Q tipa

ili klaster analiza

VarijableFaktorska analiza R tipa

Eksploratorna

Konfirmatorna

Faza 1

Faza 2

Faza 3

Slika 2. Faze 1-3 na dijagramu odlučivanja faktorske analize

6

Page 7: Faktorska Analiza-seminarski Rad

Faktorska analiza

2.2. Faza 1 - Ciljevi faktorske analize

Polazište u faktorskoj analizi, kao i kod drugih statističkih tehnika, je problem istraživanja. Opšta svrha faktorsko analitičkih tehnika je da se pronađe način da se sažmu informacije sadržane u velikom broju originalnih varijabli, u manji set novih, kompozitnih dimenzija ili varijanti (faktora), uz minimalni gubitak informacija tj. da se traže i definišu fundamentalni konstrukti ili dimenzije za koje se pretpostavlja da su u osnovi originalnih varijabli. Konkretnije, tehnike faktorske analize mogu ostvariti jedan od dva cilja:

1) identifikovanje strukture kroz sumarizaciju podataka ili2) redukcija podataka.

Identifikovanje strukture kroz sumarizaciju podataka

Faktorska analiza može identifikovati strukturu odnosa među varijablama ili respondentima, putem ispitivanja korelacija između varijabli ili korelacija među respondentima. Npr. pretpostavimo da imamo podatke o 100 respondenata, u vezi 10 karakteristika. Ako bi cilj istraživanja bilo sumiranje karakteristika, faktorska analiza bi se primenila na korelacionu matricu varijabli. Ovo je najčešći tip faktorske analize i zove se R faktorska analiza. R faktorska analiza analizira set varijabli da bi se identifikovale dimenzije koje su latentne (ne opažaju se lako). Faktorska analiza se takodje može primeniti na korelacionu matricu individualnih respondenata na bazi njihovih karakteristika. To se zove Q faktorska analiza, metod kombinovanja ili sažimanja velikog broja ljudi u distinktno različite grupe u okviru veće populacije. Pristup Q faktorske analize se ne koristi baš često, zbog računskih teškoća. Umesto toga, većina istraživača koristi neki tip klaster analize da grupiše individualne respondente.

Redukcija podataka

Faktorska analiza takođe može (1) identifikovati reprezentativne varijable iz mnogo većeg seta varijabli, za upotrebu u narednim multivarijacionim analizama ili (2) kreirati potpuno nov set varijabli, brojčano mnogo manji, da delimično ili potpuno zameni originalni set varijabli za uključenje u naredne tehnike. U oba slučaja, svrha je zadržati prirodu i karakter originalnih varijabli, ali redukovati njihov broj da bi se pojednostavila sledeća multivarijaciona analiza. Čak iako su multivarijacione tehnike razvijene da se prilagode višestrukim varijablama, istraživač uvek traga za najškrtijim setom varijabli, da bi ga uključio u analizu. Faktorska analiza obezbeđuje empirijsku osnovu za procenu strukture varijabli i potencijal za kreiranje tih kompozitnih mera, ili odabir podskupa reprezentativnih varijabli za dalju analizu.

Sumarizacija podataka čini da identifikacija osnovnih dimenzija ili faktora bude dovoljna za njih; procene faktora i doprinosi svake varijable faktorima (označena opterećenja), su sve što se zahteva za analizu. Redukcija podataka se oslanja i na faktorska opterećenja, ali ih koristi kao osnovu ili za identifikovanje varijabli za narednu analizu sa drugim tehnikama, ili za vršenje procena samih faktora (faktorski skorovi ii sumirane skale), što onda zamenjuje originalne varijable u narednim analizama.

Upotreba faktorske analize sa ostalim multivarijacionim tehnikama

Faktorska analiza pruža direktan uvid u međuodnose među varijablama ili respondentima, i empirijsku podršku za rešavanje konceptualnih pitanja u vezi sa osnovnom strukturom podataka. Ona takođe igra važnu komplementarnu ulogu sa ostalim multivarijacionim tehnikama, kroz sumarizaciju podataka i kroz redukciju podataka. Iz perspektive sumarizacije podataka, faktorska analiza pruža istraživaču jasno razumevanje toga koje varijable mogu delovati saglasno zajedno, i

7

Page 8: Faktorska Analiza-seminarski Rad

Faktorska analiza

za koliko se varijabli može zapravo očekivati da će imati uticaje u analizi. Npr. za varijable determinisane kao visoko korelirane i članice istog faktora, bi se očekivalo da imaju slične profile ili razlike među grupama u multivarijacionoj analizi varijanse ili u diskriminacionoj analizi. Primeri koji naglašavaju uticaj koreliranih varijabli, su etapne procedure višestruke regresije i diskriminaciona analiza. Ove tehnike sekvencijalno unose varijable na bazi njihove dodatne prediktivne moći nad varijablama u modelu. Kako se unese jedna varijabla iz faktora, postaje manje verovatno da bi se dodatne varijable iz istog tog faktora takođe uključile, jer su visoko korelirane i potencijalno imaju manju dodatnu prediktivnu moć nego varijable koje nisu u tom faktoru. To ne znači da su ostale varijable tog faktora manje važne ili da imaju manji uticaj, već samo da njihov efekat već reprezentuje uključena varijabla iz tog faktora. Istraživač bi bolje shvatio rezonovanje koje stoji iza unosa varijabli u ovoj tehnici, uz poznavanje strukture varijabli.

Uvid koji pruža sumarizacija podataka se može direktno inkorporirati u ostale multivarijacione tehnike, kroz bilo koju od tehnika redukcije podataka. Faktorska analiza obezbeđuje osnovu za stvaranje novog seta varijabli koje inkorporiraju karakter i prirodu originalnih varijabli, u mnogo manjem broju novih varijabli, bilo da se koriste reprezentativne varijable, faktorski skorovi ili sumirane skale. Na ovaj način, problemi u vezi velikog broja varijabli ili visokih interkorelacija među varijablama, se mogu znatno redukovati putem supstitucije novih varijabli. Istraživač može beneficirati i od empirijske estimacije odnosa, i od uvida u konceptualnu osnovu i interpretaciju rezultata.

Selekcija varijable

Redukcija podataka i sumarizacija se mogu izvršiti ili sa prethodno postojećim setovima varijabli, ili sa varijablama koje je stvorilo novo istraživanje. Kada koristi postojeći set varijabli, istraživač treba ipak da razmotri konceptualne podupirače varijabli, i koristi ocenu adekvatnosti varijabli za faktorsku analizu. Upotreba faktorske analize za redukciju podataka, postaje naročito kritična kada se zahteva uporedivost tokom vremena ili u višestrukim okruženjima. Kada se koristi novi istraživački pokušaj, faktorska analiza takodje može da determiniše strukturu i/ili stvori nove kompozitne skorove iz originalnih varijabli. Npr. jedan od prvih koraka u konstruisanju sumirane skale je proceniti njenu dimenzionalnost i adekvatnost odabranih varijabli, kroz faktorsku analizu. Stoga, iako ne zaista konfirmatorna, eksploratorna faktorska analiza se koristi za evaluaciju predložene dimenzionalnosti.

Kada se specifikuje svrha faktorske analize, onda istraživač mora definisati set varijabli koje treba ispitati. Ili u faktorskoj analizi R-tipa ili u faktorskoj analizi Q-tipa, istraživač implicitno specifikuje potencijalne dimenzije koje se mogu identifikovati kroz karakter i prirodu varijabli, izloženih faktorskoj analizi. Npr. u proceni dimenzija imidža radnje, ako ne bi bila uključena nikakva pitanja o osoblju radnje, faktorska analiza ne bi mogla da identifikuje ovu dimenziju. Istraživač takođe mora da zapamti da će faktorska analiza uvek produkovati faktore. Zato je faktorska analiza uvek potencijalni kandidat za fenomen „garbage in, garbage out“ (djubre ulazi, djubre izlazi). Ako istraživač nediskriminaciono uključuje veliki broj varijabli, i nada se da će faktorska analiza to „rešiti“, onda je verovatnoća dobijanja loših rezultata, visoka. Kvalitet i značenje izvedenih faktora, odražavaju konceptualne podupirače varijabli uključenih u analizu. Upotreba faktorske analize kao tehnike sumarizacije podataka, ne isključuje potrebu za konceptualnom osnovom za bilo koje analizirane varijable. Čak i kada se koristi jedino za redukciju podataka, faktorska analiza je najefikasnija kada konceptualno definisane dimenzije mogu biti predstavljene pomoću izvedenih faktora.

8

Page 9: Faktorska Analiza-seminarski Rad

Faktorska analiza

2.3. Faza 2 - Dizajniranje faktorske analize

Dizajn faktorske analize uključuje tri osnovne odluke: (1) kalkulaciju input podataka (korelaciona matrica) da bi se zadovoljili specifikovani

ciljevi grupisanja varijabli ili respondenata;(2) dizajn studije u smislu broja varijabli, mernih odlika varijabli, i tipova dopustljivih

varijabli i (3) potrebnu veličinu uzorka, i u apsolutnim terminima, i kao funkcija broja varijabli u

analizi.

Korelacije medju varijablama ili respondentima

Prva odluka u dizajnu faktorske analize se fokusira na pristup koji se koristi u kalkulaciji korelacione matrice za faktorsku analizu R ili Q tipa. Istraživač bi mogao izvesti matricu input podataka iz izračunavanja korelacija među varijablama. To bi bila faktorska analiza R-tipa. Istraživač bi takođe mogao odlučiti da izvede korelacionu matricu iz korelacija među individualnim respondentima. U ovoj faktorskoj analizi Q-tipa, rezultati bi bili faktorska matrica koja bi identifikovala slične individue. Npr. ako se individualni respondenti identifikuju pomoću broja, rezultirajuća faktorska šema (sklop) bi nam mogla reći da su individue 1, 5, 6 i 7, slične. Slično tome, respondenti 2, 3, 4 i 8 bi možda opteretili zajedno drugi faktor, i te pojedince bi označili kao slične. Iz rezultata Q faktorske analize, mogli bi identifikovati grupe ili klastere pojedinaca, koji demonstriraju sličnu šemu u varijablama uključenim u analizu.

Logično pitanje u ovom momentu bi bilo: Po čemu se faktorska analiza Q-tipa razlikuje od klaster analize, pošto oba pristupa porede šemu odgovora među velikim brojem varijabli i svrstavaju respondente u grupe. Odgovor je da se faktorska analiza Q-tipa bazira na interkorelacijama između respondenata, dok klaster analiza formira grupe na osnovu mera sličnosti na bazi udaljenosti između skorova respondenata o varijablama koje se analiziraju. Da bi ilustrovali ovu razliku, razmotrite sliku 3. koja sadrži skorove četiri respondenta u odnosu na tri različite varijable. Faktorska analiza Q-tipa za ova četiri respondenta bi dala dve grupe sa sličnim strukturama kovarijanse, koje se sastoje od respondenata A i C, nasuprot B i D. U suprotnom, pristup klasteringa bi bio osetljiv na stvarne udaljenosti među skorovima respondenata, i doveo bi do grupisanja najbližih parova. Stoga, kod pristupa klaster analize, respondenti A i B bi bili svrstani u jednu grupu, a C i D u drugu. Ako istraživač odluči da koristi faktorsku analizu Q-tipa, treba opaziti ove distinktne razlike u odnosu na tradicionalne tehnike klaster analize. Uz dostupnost ostalih tehnika grupisanja i rasprostranjenu upotrebu faktorske analize za redukciju i sumarizaciju podataka, preostala diskusija u ovom poglavlju se fokusira na faktorsku analizu R-tipa, grupisanje varijabli a ne respondenata. Varijable

Respondent V1 V2 V3

A 7 7 8 B 8 6 6 C 2 2 3 D 3 1 1

1

2

3

4

5

6

7

8

0 V1 V2 V3

Respondent A

Respondent B

Respondent C

Respondent D

Slika 3. Poređenja skor profila za faktorsku analizu Q-tipa i klaster analizu

9

Page 10: Faktorska Analiza-seminarski Rad

Faktorska analiza

Pitanja selekcije i merenja varijabli

U ovom momentu se mora odgovoriti na dva specifična pitanja: (1) Kako se varijable mere? i (2) Koliko varijabli treba uključiti? Za varijable za faktorsku analizu se generalno pretpostavlja da su metričke mere. U nekim slučajevima, se mogu koristiti veštačke varijable (dummy) (šifrirane 0-1) iako se one smatraju nemetričkim. Ako su sve varijable, veštačke varijable, onda su adekvatnije specijalizovane forme faktorske analize, kao što je Boolean faktorska analiza . Istraživač treba takođe da pokuša da minimizira broj uključenih varijabli, ali da ipak održi razuman broj varijabli po faktoru. Ako se studija dizajnira da proceni predloženu strukturu, istraživač treba svakako da uključi nekoliko varijabli (pet ili više), koje mogu predstavljati svaki predloženi faktor. Snaga faktorske analize leži u pronalaženju šema među grupama varijabli, i od male je koristi u identifikovanju faktora koji se sastoje od samo jedne varijable. Konačno, kada se dizajnira studija koja treba da bude faktorski analizirana, istraživač treba, ako je moguće, da identifikuje nekoliko ključnih varijabli (ponekad se zovu ključni indikatori ili marker varijable), koje blisko odražavaju osnovne faktore postavljene kao hipoteze. To će pomoći u validaciji izvedenih faktora i proceni da li rezultati imaju praktičan značaj.

Veličina uzorka

Što se tiče pitanja veličine uzorka, istraživač generalno ne bi faktorski analizirao uzorak manji od 50 opservacija, a najbolje je da veličina uzorka treba da bude 100 ili više. Kao opšte pravilo, minimum je imati bar pet puta više opservacija nego što ima varijabli koje treba analizirati, a prihvatljivija veličina bi imala racio deset prema jedan. Neki istraživači čak predlažu minimum od 20 slučajeva za svaku varijablu. Međutim, mora se zapamtiti da sa npr. 30 variajbli, postoji 435 korelacija u faktorskoj analizi. Na nivou značajnosti od 0,05, možda čak 20 od tih korelacija bi se smatrale značajnim i pojavile se u faktorskoj analizi samo slučajno. Istraživač treba uvek da pokuša da dođe do najvišeg racia slučajeva po varijabli, da bi minimizirao šanse za „overfitting“ podataka (tj. izvođenje faktora koji su specifični za uzorak, sa malom uopštljivošću). Istraživač može to uraditi putem korišćenja najškrtijeg seta varijabli, vođen konceptualnim i praktičnim razmatranjima, i onda dobijanjem adekvatne veličine uzorka za broj ispitanih varijabli. Kada se radi sa manjim veličinama uzorka i/ili nižim raciom slučajeva prema varijabli, istraživač treba uvek da oprezno interpretira sve rezultate. Pitanje veličine uzorka će takođe biti rešavano u kasnijem odeljku o interpretiranju faktorskih opterećenja.

2.4. Faza 3 - Pretpostavke u faktorskoj analizi

Kritične pretpostavke koje su u osnovi faktorske analize, su više konceptualne nego statističke. Sa statističkog stanovišta, odstupanja od normalnosti, homoskedastičnosti i linearnosti, se primenjuju samo u meri u kojoj ona smanjuju opservirane korelacije. Samo normalnost je potrebna ako se statistički test primenjuje na značajnost faktora, ali se ovi testovi retko koriste. Zapravo, poželjan je izvestan stepen multikolinearnosti, jer je cilj identifikovati međupovezane setove varijabli.

Pored statističkih osnova za korelacije matrice podataka, istraživač mora takođe da osigura da matrica podataka ima dovoljno korelacija, da bi se opravdala primena faktorske analize. Ako vizuelna inspekcija ne otkrije znatan broj korelacija većih od 30, onda je faktorska analiza verovatno neadekvatna. Korelacije među varijablama se takođe mogu analizirati putem izračunavanja parcijalnih korelacija među varijablama, tj. korelacija među varijablama kada se uzimaju u obzir efekti drugih varijabli. Ako „istinski“ faktori postoje u podacima, parcijalna korelacija treba da bude mala, jer se varijabla može objasniti pomoću faktora (varijante sa opterećenjima za svaku varijablu). Ako su parcijalne korelacije visoke, onda nema „istinskih“

10

Page 11: Faktorska Analiza-seminarski Rad

Faktorska analiza

osnovnih faktora, i faktorska analiza je neprikladna. SPSS i SAS, obezbedjuju anti-image korelacionu matricu, što je samo negativna vrednost parcijalne korelacije, a BMDP direktno pruža parcijalne korelacije. U svakom slučaju, veće parcijalne ili anti-image korelacije, indiciraju da možda matrica podataka ne odgovara faktorskoj analizi.

Još jedan način determinisanja podesnosti faktorske analize, ispituje čitavu krelacionu matricu. Bartlett test sferičnosti, statistički test prisustva korelacija među varijablama, je jedna takva mera. Ona obezbedjuje statističku verovatnoću da korelaciona matrica ima značajne korelacije bar među nekim varijablama. Međutim, istraživač treba da primeti da povećanje veličine uzorka uzrokuje da Barlett test postane osetljiviji na detektovanje korelacija među varijablama. Još jedna mera za kvantifikovanje stepena interkorelacija među varijablama i podesnosti faktorske analize, je mera adekvatnosti uzorkovanja (MSA). Ovaj indeks se kreće od 0 do 1, dostižući 1 kada je svaka varijabla savršeno predviđena bez greške od strane ostalih varijabli. Ova mera se može interpretirati sa sledećim smernicama; 0,80 ili iznad, zaslužno; 0,70 ili iznad, srednje; 0,60 ili iznad, osrednje; 0,50 ili iznad, loše; a ispod 0,50, neprihvatljivo. MSA se povećava kako (1) se povećava veličina uzorka, (2) se povećavaju prosečne korelacije, (3) se povećava broj varijabli ili (4) opada broj faktora. Iste MSA smernice se mogu proširiti i na individualne varijable. Istraživač treba prvo da ispita MSA vrednosti za svaku varijablu i da isključi one koje spadaju u kategoriju neprihvatljivo. Kada individualne varijable dostignu prihvatljiv nivo, onda se opšta MSA može evaluirati i doneti odluka o produženju faktorske analize.

Konceptualne pretpostavke koje se nalaze u osnovi faktorske analize, su u vezi sa setom selektovanih varijabli i odabranim uzorkom. Osnovna pretpostavka faktorske analize je da u setu selektovanih varijabli postoji neka osnovna struktura. Odgovornost je istraživača da osigura da su uočene šeme konceptualno validne i adekvatne za proučavanje sa faktorskom analizom, jer tehnike nemaju drugi način da determinišu podesnost, osim korelacija među varijablama. Npr. mešanje zavisnih i nezavisnih varijabli u jednoj faktorskoj analizi i onda korišćenje izvedenih faktora da podrže odnose zavisnosti, je neprikladno. Istraživač mora takođe da osigura da je uzorak homogen u pogledu osnovne faktorske strukture. Neprikladno je da se primeni faktorska analiza na uzorak muškaraca i žena, za set stavki za koje se zna da se razlikuju zbog pola. Kada se kombinuju dva poduzorka (muškarci i žene), rezultirajuće korelacije i faktorska struktura će biti loša reprezentacija jedinstvene strukture svake grupe. Stoga, kad god se očekuju različite grupe u uzorku, treba izvršiti odvojene faktorske analize, i treba uporediti rezultate da se identifikuju razlike koje nisu odražene u rezultatima kombinovanog uzorka.

2.5. Faza 4 - Izvodjenje faktora i procenjivanje opšteg uklapanja

Kada se varijable specifikuju i korelaciona matrica pripremi, istraživač je spreman da primeni faktorsku analizu da identifikuje osnovnu strukturu odnosa (videti sliku 4.). Pri tome, moraju se doneti odluke u vezi (1) metoda ekstrahovanja faktora (faktorska analiza u užem smislu nasuprot komponentnoj analizi) i (2) broja faktora odabranih da predstavljaju osnovnu strukturu u podacima. Selekcija metoda ekstrakcije zavisi od cilja istraživača. Komponentna analiza se koristi kada je cilj da se sumira većina originalnih informacija (varijansa) u minimalnom broju faktora za svrhe predviđanja. Nasuprot tome, faktorska analiza u užem smislu se koristi primarno da identifikuje osnovne faktore ili dimenzije koje odražavaju ono što varijable imaju zajedničko. Za oba metoda, istraživač mora takođe da determiniše broj faktora koji će predstavljati set originalnih varijabli. Na ovu odluku utiču i konceptualna i empirijska pitanja.

Faktorska analiza u užem smislu nasuprot komponentnoj analizi

Istraživač može da koristi dva osnovna modela da dođe do faktorskih rešenja. Oni su poznati kao faktorska analiza u užem smislu i komponentna anliza. Da bi odabrao adekvatan

11

Page 12: Faktorska Analiza-seminarski Rad

Faktorska analiza

model, istraživač mora prvo da shvati razliku izmedju tipova varijanse. Za svrhe faktorske analize, postoje tri tipa ukupne varijanse: (1) zajednička, (2) specifična (takodje poznata i kao jedinstvena) i (3) varijansa greške. Ovi tipovi varijanse i njihov odnos sa procesom odabira faktorskog modela, su ilustrovani na slici 5. Zajednička varijansa se definiše kao ona varijansa u varijabli, koja je zajednička i za sve ostale varijable u analizi.

12

Page 13: Faktorska Analiza-seminarski Rad

Faktorska analiza

Iz Faze 4

Odabir faktorskog metodaDa li se analizira ukupna, ili samo zajednička varijansa?

Specifikovanje faktorske matriceDeterminisati broj faktora koje treba

zadržati

Odabir rotacionog metodaDa li faktori treba da budu korelirani (kosi) ili

nekorelirani (ortogonalni)

Interpretiranje rotirane faktorske matriceMogu li se naći značajna opterećenja?

Mogu li faktori da se imenuju?Da li su komunaliteti dovoljni?

Respecifikacija faktorskog modelaDali su neke varijable izbačene?

Da li hoćete da promenite broj faktora?Želite li još jedan tip rotacije?

Validacija faktorske matricePodelite/višestruke uzorke

Odvojite analizu za podgrupeIdentifikujte uticajne slučajeve

Odabir surogat varijabli

Izračunavanje faktorskih skorova

Kreiranje sumiranih skala

Ukupna varijansa Ekstrahovati faktore sa

komponentnom analiyom

Zajednička varijansaEkstrahovati faktore sa faktorskom analizom u

užem smislu

Ortogonalni metodVarimaxEquimax

Quartimax

Kosi metodObliminPromax

Ortohblique

Da

Ne

Da

Ne

Faza 7Dodatne upotrebe

Faza 5

Faza 4

Slika 4. Faze 4-7 na dijagramu odlučivanja faktorske analize

13

Page 14: Faktorska Analiza-seminarski Rad

Faktorska analiza

Dijagonalna vrednost Varijansa

Jedinica

Komunalitet ekstrahovana varijansa izgubljena varijansa

Slika 5. Tipovi varijanse prenete u faktorsku matricu

Specifična varijansa je varijansa povezana samo sa specifičnom varijablom. Varijansa greške je varijansa usled nepouzdanosti u procesu prikupljanja podataka, greške merenja ili slučajne komponente u merenom fenomenu. Komponentna analiza, takođe poznata i kao analiza glavnih komponenti, razmatra ukupnu varijansu i izvodi faktore koji sadrže male razmere jedinstvene varijanse i u nekim slučajevima, varijansu greške. Međutim, prvih nekoliko faktora ne sadrže dovoljno jedinstvene ili varijanse greške da bi iskrivili opštu faktorsku strukturu. Specifično, kod komponentne analize, jedinične vrednosti se unose na dijagonalu korelacione matrice, tako da se puna varijansa uvodi u faktorsku matricu, kako je prikazano na slici 5. Obratno, kod faktorske analize u užem smislu, komunaliteti se unose na dijagonalu. Komunaliteti su procene deljene ili zajedničke varijanse, među varijablama. Faktori koji rezultiraju iz faktorske analize u užem smislu, se baziraju samo na zajedničkoj varijansi.

Oba modela, i faktorske analize u užem smislu i komponentne analize, se široko koriste. Odabir jednog modela u odnosu na drugi, se zasniva na dva kriterijuma: (1) ciljevima faktorske analize i (2) obimu prethodnog znanja o varijansi. Komponentni faktorski model je adekvatan kada je primarni interes, predviđanje ili minimalan broj faktora potreban da se objasni maksimalan deo varijanse predstavljene u originalnom setu varijabli, i kada ranije znanje sugeriše da specfična i varijansa greške, predstavljaju relativno malu razmeru ukupne varijanse. Suprotno tome, kada je primarni cilj identifikovanje latentne dimenzije ili konstrukata, predstavljene u originalnim varijablama, istraživač malo zna o obimu specifične i varijanse greške, i stoga želi da eliminiše ovu varijansu, model zajedničkog faktora je najadekvatniji. Faktorska analiza u užem smislu, sa svojim restriktivnijim pretpostavkama i upotrebom samo latentnih dimenzija (deljena varijansa), se često smatra da je više teoretski zasnovana. Međutim, iako teoretski jaka, faktorska analiza u užem smislu ima nekoliko problema. Prvo, ova analiza pati od faktorske indeterminacije, što znači da za bilo kog individualnog respondenta, nekoliko različitih faktorskih skorova se može izračunati iz rezultata faktorskog modela. Ne postoji jedno jedinstveno rešenje, kao što se pronalazi u komponentnoj analizi, ali u većini slučajeva, razlike nisu znatne. Drugo pitanje uključuje izračunavanje procenjenih komunaliteta upotrebljenih za predstavljanje deljene varijanse. Za veće probleme, izračunavanja mogu iziskivati dosta kompjuterskog vremena i resursa. Takođe, komunaliteti nisu uvek procenljivi, ili mogu biti nevažeći (npr. vrednosti veće od 1 ili manje od 0), zahtevajući izbacivanje varijable iz analize.

Komplikacije faktorske analize u užem smislu su doprinele rasprostranjenoj upotrebi komponentne analize. Iako i dalje preostaje znatna debata o tome koji faktorski model je adekvatniji, empirijsko istraživanje je pokazalo slične rezultate u mnogim slučajevima. U većini aplikacija, i komponentna analiza i faktorska analiza u užem smislu, dolaze do esencijalno identičnih rezultata, ako broj varijabli prelazi 30, ili komunaliteti prelaze 0,60 za većinu varijabli. Ako se istraživač bavi pretpostavkama komponentne analize, onda faktorsku analizu u užem smislu takođe treba primeniti, da se proceni njena reprezentacija strukture.

Ukupna varijansa

Zajednička Specifična i varijansa greške

14

Page 15: Faktorska Analiza-seminarski Rad

Faktorska analiza

Kada je doneta odluka o faktorskom modelu, istraživač je spreman da ekstrahuje inicijalne nerotirane faktore. Ispitivanjem nerotirane faktorske matrice, istraživač može da istraži mogućnosti redukcije podataka za set varijabli, i dobije preliminarnu procenu broja faktora za ekstrahovanje. Međutim, finalna determinacija broja faktora mora da sačeka, dok se rezultati rotiraju i faktori interpretiraju.

Kriterijumi za broj faktora za ekstrakciju

Kako odlučujemo o broju faktora za ekstrakciju? Kada se faktoriše veliki set varijabli, ovaj metod prvo ekstrahuje kombinacije varijabli koje objašnjavaju najveći obim varijanse, i onda produžava na kombinacije koje objašnjavaju sve manje i manje obime varijanse. U odlučivanju kada zaustaviti faktorisanje (tj. koliko faktora ekstrahovati), istraživač generalno počinje sa nekim unapred determinisanim kriterijumom, kao što je procenat varijanse ili kriterijum latentnog korena, da bi se dobio specifičan broj faktora za ekstrakciju. Nakon što je inicijalno rešenje izvedeno, istraživač izračunava nekoliko dodatnih probnih rešenja – obično jedan manje faktor od inicijalnog broja, i dva ili tri faktora više nego što je inicijalno izvedeno. Onda, na bazi informacija dobijenih iz probnih analiza, ispituju se faktorske matrice, a najbolja reprezentacija podataka se koristi kao pomoć u determinisanju broja faktora za ekstrakciju. Po analogiji, odabir broja faktora koje treba interpretirati je nalik fokusiranju mikroskopa. Previsoko ili prenisko podešavanje, će učiniti nejasnom strukturu koja je očigledna kada je podešavanje ispravno. Stoga, putem ispitivanja broja različitih faktorskih struktura izvedenih iz nekoliko probnih rešenja, istraživač može da ih poredi i suprotstavlja, da bi došao do najbolje reprezentacije podataka. Tačna kvantitativna osnova za odlučivanje o broju faktora za ekstrakciju, nije razvijena. Međutim, trenutno se koriste sledeći kriterijumi zaustavljanja, za broj faktora za ekstrakciju.

Kriterijum latentnog korena. Najčešće korišćena tehnika je kriterijum latentnog korena. Ova tehnika je jednostavna za primenu ili u komponentnoj analizi ili faktorskoj analizi u užem smislu. Obrazloženje za kriterijum latentnog korena je da bilo koji individualni faktor treba da objasni varijansu bar jedne varijable, ako ga treba zadržati za interpretaciju. Svaka varijabla doprinosi vrednost 1, ukupnoj karakterističnoj vrednosti. Stoga, samo se faktori koji imaju latentne korene ili karakteristične vrednosti veće od 1, smatraju značajnim; svi faktori sa latentnim korenima manjim od 1, se smatraju neznačajnim i oni se izostavljaju. Korišćenje karakteristične vrednosti za utvrdjivanje prekida (granične vrednosti), je najpouzdanije kada je broj varijabli izmedju 20 i 50. Ako je broj varijabli manji od 20, postoji tendencija da ovaj metod ekstrahuje konzervativan broj faktora (premalo); dok, ako je uključeno više od 50 varijabli, nije neuobičajeno da se ekstrahuje previše faktora.

A priori kriterijum. A priori kriterijum je jednostavan a ipak razuman kriterijum pod izvesnim okolnostima. Kada ga primenjuje, istraživač već zna koliko faktora da ekstrahuje, pre preduzimanja faktorske analize. Istraživač jednostavno daje instrukcije kompjuteru da zaustavi analizu kada se ekstrahuje željeni broj faktora. Ovaj pristup je koristan kada se testira teorija ili hipoteza o broju faktora koje treba ekstrahovati. On takođe može biti opravdan u pokušaju repliciranja rada drugog istraživača, i ekstrahovanja istog broja faktora koji je prethodno pronađen.

Kriterijum procenta varijanse. Kriterijum procenta varijanse je pristup baziran na ostvarenju specifikovanog kumulativnog procenta ukupne varijanse, ekstrahovane uzastopnim faktorima. Svrha je osigurati praktičnu značajnost za izvedene faktore, putem obezbeđenja da oni objašnjavaju bar specifikovani obim varijanse. Nije usvojen apsolutni prag za sve aplikacije. Medjutim, u prirodnim naukama, proceduru faktorisanja obično ne treba zaustavljati dok ekstrahovani faktori ne objasne bar 95% varijanse, ili dok poslednji faktor ne objasni samo mali deo (manje od 5%). Suprotno tome, u društvenim naukama, gde su informacije često manje precizne, nije neuobičajeno da se rešenje koje objašnjava 60% ukupne varijanse (a u nekim slučajevima čak i manje), smatra zadovoljavajućim.

15

Page 16: Faktorska Analiza-seminarski Rad

Faktorska analiza

Jedna varijanta ovog kriterijuma uključuje odabir dovoljno faktora da se ostvari unapred specifikovani komunalitet za svaku od varijabli. Ako teoretski ili praktični razlozi zahtevaju izvesni komunalitet za svaku varijablu, onda će istraživanje uključiti onoliko faktora koliko je potrebno za adekvatno reprezentovanje svake od originalnih varijabli. Ovo se razlikuje od fokusiranja na samo ukupan obim objašnjene varijanse, što zanemaruje stepen objašnjenja za individualne varijable.

Kriterijum skri (scree) testa. Kod faktorskog modela komponentne analize, kasniji ekstrahovani faktori sadrže i zajedničku i jedinstvenu varijansu. Iako svi faktori sadrže bar neku jedinstvenu varijansu, srazmera jedinstvene varijanse je znatno viša u kasnijim nego u ranijim faktorima. Scree test se koristi da identifikuje optimalni broj faktora koji se mogu ekstrahovati pre no što obim jedinstvene varijanse počne da dominira strukturom zajedničke varijanse. Scree test se izvodi putem ucrtavanja latentnih korena, u odnosu na broj faktora po njihovom redosledu ekstrakcije, a oblik rezultirajuće krive se koristi za evaluaciju tačke prekida (granične vrednosti). Slika 6. ucrtava prvih 18 faktora ekstrahovanih u studiji od strane svih autora. Počevši sa prvim faktorom, dijagram u početku ima strmi silazni nagib, a onda polako postaje približno horizontalna linija. Za tačku u kojoj kriva prvo počinje da se ispravlja, se smatra da indicira maksimalan broj faktora za ekstrakciju. U sadašnjem slučaju, prvih 10 faktora bi se kvalifikovalo. Preko 10, bila bi uključena prevelika srazmera jedinstvene varijanse; stoga, ovi faktori ne bi bili prihvatljivi. Opažamo da u upotrebi kriterijuma latentnog korena, samo osam faktora bi bilo razmotreno. Nasuprot tome, upotreba scree testa nam obezbedjuje još dva faktora. Kao opšte pravilo, scree test rezultira u tome da se za uključenje razmatra bar jedan, a ponekad i dva ili tri više faktora, nego kod kriterijuma latentnog korena.

Slika 6. Dijagram karakteristične vrednosti za kriterijum scree testa

x-osa – broj faktoray-osa – latentni koren (karakteristična vrednost)

Heterogenost respondenata. Deljena varijansa među varijablama je osnova i za komponentne faktorske modele i one sa zajedničkim faktorom. Osnovna pretpostavka je da se deljena varijansa proteže preko čitavog uzorka. Ako je uzorak heterogen u pogledu bar jednog podskupa varijabli, onda će prvi faktori predstavljati one varijable koje su homogenije preko čitavog uzorka. Varijable koje su bolji diskriminatori između podgrupa uzorka, će opteretiti kasnije faktore, mnogo puta one koji nisu odabrani pomoću kriterijuma o kojima je gore diskutovano. Kada je cilj identifikovati faktore koji vrše diskriminaciju među podgrupama uzorka, istraživač treba da ekstrahuje dodatne faktore preko onih indiciranih od strane metoda gore navedenih, i da ispita

16

Page 17: Faktorska Analiza-seminarski Rad

Faktorska analiza

sposobnost tih dodatnih faktora. Ako se oni pokažu kao manje korisni u diskriminaciji, rešenje može ponovo da se pregleda, a ovi kasniji faktori eliminišu.

Rezime kriterijuma za selekciju faktora. U praksi, većina istraživača retko koristi samo jedan kriterijum u determinisanju koliko faktora da ekstrahuje. Umesto toga, oni inicijalno koriste kirterijum kao što je latentni koren, kao smernicu za prvi pokušaj u interpretaciji. Nakon što se faktori interpretiraju, procenjuje se praktičnost faktora. Takođe se interpretiraju faktori identifikovani pomoću drugih kriterijuma. Odabir broja faktora je međupovezan sa procenom strukture, koja se otkriva u fazi interpretacije. Stoga, nekoliko faktorskih rešenja sa različitim brojem faktora se ispituje pre no što je struktura dobro definisana.

Jedno upozorenje pri selekciji finalnog seta faktora: Postoje negativne posledice, ako se odabere previše ili premalo faktora da predstavljaju podatke. Ako se koristi premalo faktora, onda nije otkrivena ispravna struktura i važne dimenzije mogu biti izostavljene. Ako se zadrži previše faktora, onda interpretacija postaje teža kada se rezultati rotiraju Iako su faktori nezavisni, možete lako imati previše kao i premalo faktora. Kao i sa ostalim aspektima multivarijantnih modela, „škrtost“ je važna. Značajan izuzetak je kada se faktorska analiza koristi striktno za redukciju podataka, a nivo varijanse seta za ekstrakciju je specifikovan. Istraživač treba uvek da teži da ima što je moguće reprezentativniji i škrtiji set faktora.

2.6. Faza 5 - Interpretiranje faktora

Interpretacija faktora i selekcija finalnog faktorskog rešenja uključuje tri koraka. Prvo, izračunava se inicijalna nerotirana faktorska matrica, da pomogne u dobijanju preliminarne indikacije broja faktora za ekstrakciju. Faktorska matrica sadrži faktorska opterećenja (videti diskusiju u sledećem pasusu) za svaku varijablu na svakom faktoru. U izračunavanju nerotirane faktorske matrice, istraživač je jednostavno zainteresovan za najbolju linearnu kombinaciju varijabli – najbolju u smislu da odredjena kombinacija originalnih varijabli objašnjava veći deo varijanse u podacima kao celini, nego bilo koja druga linearna kombinacija varijabli. Stoga, prvi faktor se može posmatrati kao jedan najbolji rezime linearnih odnosa prikazanih u podacima. Drugi faktor se definiše kao druga najbolja linearna kombinacija varijabli, zavisan od ograničenja da je ortogonalan u odnosu na prvi faktor. Da bi bio ortogonalan prema prvom faktoru, drugi faktor se mora ivzesti iz varijanse koja preostaje nakon što je prvi faktor ekstrahovan. Stoga, drugi faktor se može definisati kao linearna kombinacija varijabli koja objašnjava najveći deo rezidualne varijanse, nakon što je efekat prvog faktora uklonjen iz podataka. Sledeći faktori se definišu slično, sve dok se sva varijansa u podacima ne iscrpi.

Nerotirana faktorska rešenja ostvaruju cilj redukcije podataka, ali istraživač mora da postavi pitanje da li će nerotirano faktorsko rešenje (koje ispunjava željene matematičke zahteve) pružiti informacije koje nude najadekvatniju interpretaciju varijabli koje se ispituju. U većini slučajeva, odgovor na ovo pitanje je, ne. Faktorsko opterećenje je način interpretiranja uloge koju svaka varijabla igra u definisanju svakog faktora. Faktorska opterećenja su korelacija svake varijable i faktora. Opterećenja indiciraju stepen korespondentnosti izmedju varijable i faktora, gde veća opterećenja čine varijablu reprezentom faktora. Nerotirano faktorsko rešenje ne može da obezbedi značajnu šemu opterećenja varijable. Ako se očekuje da nerotirani faktori budu značajni, korisnik može specifikovati da se ne obavi rotacija. Generalno, rotacija će biti poželjna jer ona simplifikuje faktorsku strukturu, i obično je teško determinisati da li će nerotirani faktori biti značajni. Stoga drugi korak koristi rotacioni metod, da ostvari jednostavnija i teoretski značajnija faktorska rešenja. U većini slučajeva, rotacija faktora poboljšava interpretaciju putem redukovanja nekih dvosmislenosti koje često prate inicijalna nerotirana faktorska rešenja.

U trećem koraku, istraživač procenjuje potrebu da respecifikuje faktorski model zbog (1) brisanja varijable (varijabli) iz analize, (2) želje da se koristi drugačiji rotacioni metod za

17

Page 18: Faktorska Analiza-seminarski Rad

Faktorska analiza

interpretaciju, (3) potrebe da se ekastrahuje drugačiji broj faktora, ili (4) želje da se predje sa jednog metoda ekstrakcije, na drugi. Respecifikacija faktorskog modela se ostvaruje vraćanjem na fazu ekstrakcije, ekstrakcijom faktora i njihovom ponovnom intepretacijom.

Rotacija faktora

Važan alat u interpretaciji faktora je faktorska rotacija. Pojam rotacija znači upravo ono što i implicira. Specifično, referentne ose faktora se okreću oko koordinatnog početka, dok se ne postigne neka druga pozicija. Kao što je indicirano ranije, nerotirana faktorska rešenja ekstrahuju faktore po redosledu njihove važnosti. Prvi faktor je opšti faktor, gde skoro svaka varijabla opterećuje značajno, i on objašnjava najveći obim varijanse. Drugi i naredni faktori se onda baziraju na rezidualnom obimu varijanse. Svaki objašnjava sukcesivno manje delove varijanse. Krajnji efekat rotiranja faktorske matrice, je da se redistribuira varijansa sa ranijih faktora na kasnije faktore, da bi se ostvarila jednostavnija, teoretski značajnija, faktorska šema.

Najjednostavniji slučaj rotacije je ortogonalna rotacija, u kojoj se ose održavaju na 90 stepeni. Takodje je moguće rotirati ose, a ne zadržati ugao od 90 stepeni izmedju referentnih osa. Kada nije ograničena na to da bude ortogonalna, rotaciona procedura se zove kosa rotacija. Ortogonalna i kosa faktorska rotacija su demonstrirane na slikama 3.7 odnosno 3.8 (str. 108).

Ilustracija faktorske rotacije. Slika 7., na kojoj je ucrtano pet varijabli na dvodimenzionalnom faktorskom dijagramu, ilustruje faktorsku rotaciju. Vertikalna osa predstavlja nerotirani faktor II, a horizontalna osa predstavlja nerotirani faktor I. Ose su obeležene sa 0 na početku, i protežu se do +1,0 ili -1,0. Brojevi na osama predstavljaju faktorska opterećenja. Pet varijabli je obeleženo sa V1, V2, V3, V4 i V5. Faktorsko opterećenje za varijablu 2 (V2) na nerotiranom faktoru II, se determiniše povlačenjem isprekidane linije horizontalno od podatka do vertikalne ose za faktor II. Slično tome, vertikalna linija se povlači od varijable 2 do horizontalne ose nerotiranog faktora I, da bi se determinisalo opterećenje varijable 2 na faktor I. Slična procedura koja je usledila za preostale varijable, determiniše faktorska opterećenja za nerotirana i rotirana rešenja, kako je prikazano u tabeli 1., za svrhe poredjenja. Na nerotiranom prvom faktoru, sve varijable opterećuju prilično visoko. Na nerotiranom drugom faktoru, varijable 1 i 2 su vrlo visoko u pozitivnom smeru.

Slika 7. Ortogonalna faktorska rotacija

18

Page 19: Faktorska Analiza-seminarski Rad

Faktorska analiza

Slika 8. Kosa faktorska rotacija

Varijabla 5 je umereno visoko u negativnom smeru, a varijable 3 i 4 imaju znatno niža opterećenja u negativnom smeru.

Iz vizuelnog pregleda slike 7., očigledno je da postoje dva klastera varijabli. Varijable 1 i 2 idu zajedno, dok su varijable 3, 4 i 5 zajedno. Međutim, ovakva šablonizacija varijabli nije toliko očigledna iz nerotiranih faktorskih opterećenja. Rotiranjem originalnih osa u smeru kazaljke na satu, kako je indicirano na slici 7., dobijamo potpuno drugačiju šemu faktorskog opterećenja. Primećujemo da u rotiranju faktora, ose se održavaju pod uglom od 90 stepeni. Ova procedura označava da su faktori matematički nezavisni i da je rotacija ortogonalna. Nakon rotiranja faktorskih osa, varijable 3, 4 i 5 opterećuju vrlo visoko na faktoru I, a varijable 1 i 2 opterećuju vrlo visoko na faktoru II. Stoga, klastering ili šablonizacija ovih varijabli u dve grupe, je očiglednija nakon rotacije nego pre, čak iako relativna pozicija ili konfiguracija varijabli ostaje nepromenjena.

Tabela 1. Poredjenje rotiranih i nerotiranih faktorskih opterećenja

Nerotirana faktorska opterećenja Rotirana faktorska opterećenjaVarijable I II I II

V1

V2

V3

V4

V5

0,500,600,900,800,60

0,800,70-0,25-0,30-0,50

0,030,160,950,840,76

0,940,900,240,15-0,13

Isti opšti principi ortogonalnih rotacija se odnose i na kose rotacije. Metod kose rotacije je fleksibilniji, jer faktorske ose ne moraju biti ortogonalne. On je takođe i realističniji, jer se ne pretpostavlja da su teoretski važne osnovne dimenzije, nekorelirane jedna sa drugom. Na slici 8., porede se ova dva rotaciona metoda. Opažamo da kosa faktorska rotacija, tačnije predstavlja klastering varijabli. Ova tačnost je rezultat činjenice da je svaka rotirana faktorska osa sada bliža odgovarajućoj grupi varijabli. Takođe, koso rešenje pruža informacije o obimu u kom su faktori zapravo korelirani medjusobno.

Većina istraživača se slaže da većina direktnih nerotiranih rešenja nije dovoljna; tj. u većini slučajeva rotacija će poboljšati interpretaciju putem redukovanja dela dvosmislenosti koje često prate preliminarnu analizu. Glavna dostupna opcija je da se odabere metod ortogonalne ili kose

19

Page 20: Faktorska Analiza-seminarski Rad

Faktorska analiza

rotacije. Krajnji cilj svake rotacije je da se dobiju teoretski značajni faktori i, ako je moguće, najjednostavnija faktorska struktura. Ortogonalni rotacioni pristupi se šire koriste, jer svi kompjuterski paketi sa faktorskom analizom sadrže opcije ortogonalne rotacije, dok metodi kose rotacije nisu toliko rasprostranjeni. Ortogonalne rotacije se takođe češće koriste, jer analitičke procedure za vršenje kosih rotacija, nisu toliko razvijene i još uvek su predmet kontroverze. Nekoliko različitih pristupa je dostupno za izvršenje ortogonalne ili kose rotacije. Međutim, samo ograničen broj procedura kose rotacije, je dostupan u većini statističkih paketa; stoga, će istraživač verovatno morati da prihvati onaj koji je obezbeđen.

Metodi ortogonalne rotacije. U praksi, cilj svih metoda rotacije je da se simplifikuju kolone i redovi faktorske matrice, da bi se olakšala interpretacija. U faktorskoj matrici, kolone predstavljaju faktore, gde svaki red korespondira sa opterećenjem varijable medju faktorima. Pod simplifikovanjem redova, podrazumevamo da se što više vrednosti u svakom redu, što više približi nuli (tj. maksimiranje opterećenja varijable na jednom faktoru). Pod simplifikovanjem kolona, podrazumevamo da se što više vrednosti u svakoj koloni, što više približi nuli (tj. što je moguće više smanjiti broj „visokih“ opterećenja). Razvijena su tri glavna ortogonalna pristupa:

QUARTIMAX

Krajnji cilj QUARTIMAX rotacije je da se simplifikuju redovi faktorske matrice tj. QUARTIMAX se fokusira na rotiranje inicijalnog faktora, tako da je opterećenje varijable visoko na jednom faktoru, i što je moguće niže na svim ostalim faktorima. U ovim rotacijama, mnoge varijable mogu opteretiti visoko ili blizu visoko na isti faktor, jer se ova tehnika usmerava na simplifikovanje redova. QUARTIMAX metod se nije pokazao mnogo uspešnim u proizvodnji jednostavnijih struktura. Problem sa njim je to što on proizvodi opšti faktor kao prvi faktor, na koji većina, ako ne i sve, varijable imaju visoka opterećenja. Bez obzira na nečiji koncept „jednostavnije“ strukture, on neizbežno uključuje i bavljenje klasterima varijabli, metod koji stvara veliki opšti faktor (tj. QUARTIMAX) nije u skladu sa ciljevima rotacije.

VARIMAX

Suprotno od QUARTIMAX-a, VARIMAX kriterijum se fokusira na simplifikovanje kolona faktorske matrice. Kod VARIMAX rotacionog pristupa, maksimalna moguća simplifikacija se postiže, ako su u koloni samo jedinice i nule.

VARIMAX metod maksimira sumu varijansi zahtevanih opterećenja faktorske matrice. Prisetimo se da u QUARTIMAX pristupima, mnoge varijable mogu da opterećuju visoko ili blizu visoko, na istom faktoru, jer se ova tehnika koncentriše na simplifikovanje redova. Kod VARIMAX rotacionog pristupa, postoje neka visoka opterećenja (tj. blizu – 1 ili +1) i neka opterećenja blizu 0, u svakoj koloni matrice. Logika je da je interpretacija najlakša kada su korelacije varijabla-faktor: (1) blizu +1 ili -1, stoga indicirajući jasnu pozitivnu ili negativnu vezu između varijable i faktora; ili (2) blizu 0, indicirajući jasan nedostatak povezanosti. Ova struktura je fundamentalno jednostavna. Iako je QUARTIMAX rešenje analitički jednostavnije od VARIMAX rešenja, VARIMAX izgleda pruža jasnije razdvajanje faktora.VARIMAX metod se pokazao vrlo uspešnim kao analitički pristup dobijanju ortogonalne rotacije faktora.

20

Page 21: Faktorska Analiza-seminarski Rad

Faktorska analiza

EQUIMAX

EQUIMAX pristup je kompromis između QUARTIMAX i VARIMAX pristupa. Umesto da se koncentriše na simplifikaciju redova ili simplifikaciju kolona, on pokušava da ostvari po nešto od obe. EQUIMAX nije široko prihvaćen i ne koristi se često.

Metodi kose rotacije. Kose rotacije su slične ortogonalnim rotacijama, osim što kose rotacije dozvoljavaju korelirane faktore, umesto održavanja nezavisnosti između rotiranih faktora. Međutim, tamo gde je bilo nekoliko izbora među ortogonalnim pristupima, obično postoje samo limitirani izbori u većini statističkih paketa za kose rotacije. Npr. SPSS pruža OBLIMIN; SAS ima PROMAX i ORTHOBLIQUE; a BMDP obezeđuje DQUART, DOBLIMIN i ORTHOBLIQUE. Ciljevi simplifikacije su uporedivi sa ortogonalnim metodima, sa dodatom odlikom koreliranih faktora. Sa mogućnošću koreliranih faktora, faktorski istraživač mora biti dodatno pažljiv da izvrši validaciju koso rotiranih faktora, jer oni imaju dodatni način (neortogonalnost) da postanu specifični za uzorak, a ne uopštljivi, naročito sa malim uzorcima ili niskim raciom slučajeva prema varijabli.

Selekcija rotacionih metoda. Nisu razvijena nikakva specifična pravila koja bi pružala smernice istraživaču u odabiru odredjene ortogonalne ili kose rotacione tehnike. U većini slučajeva, istraživač jednostavno koristi rotacionu tehniku koju pruža kompjuterski program. Većina programa ima rotaciju VARIMAX, ali su široko dostupni svi glavni rotacioni metodi. Međutim, ne postoji nijedan analitički razlog za favorizovanje jednog rotacionog metoda u odnosu na drugi. Izbor ortogonalne ili kose rotacije treba izvršiti na osnovu konkretnih potreba datog problema istraživanja. Ako je cilj istraživanja redukovati broj originalnih varijabli, bez obzira na to koliko značajni rezultirajući faktori mogu biti, onda bi adekvatno rešenje bilo ortogonalno. Takođe, ako istraživač želi da redukuje veliki broj varijabli na manji set nekoreliranih varijabli za narednu u potrebu u regresiji ili drugim tehnikama predvidjanja, ortogonalno rešenje je najbolje. Međutim, ako je krajnji cilj faktorske analize, dobijanje nekoliko teoretski značajnih faktora, onda je pogodno koso rešenje. Do ovog zaključka se dolazi jer realno, vrlo malo faktora je nekorelirano, kao u ortogonalnoj rotaciji.

Kriterijumi za značajnost faktorskih opterećenja

U interpretiranju faktora, mora se doneti odluka u vezi toga koja faktorska opterećenja su vredna razmatranja. Sledeća diskusija detaljno opisuje pitanja u vezi praktične i statističke značajnosti, kao i broja varijabli, koja utiču na interpretaciju faktorskih opterećenja.

Obezbeđivanje praktične značajnosti. Prva sugestija se ne bazira na nekoj matematičkoj propoziciji, već je više u vezi sa sa praktičnom značajnošću. To je opšte načelo koje se često koristi, kao način vršenja preliminarnog ispitivanja faktorske matrice. Ukratko, za faktorska opterećenja veća od ± 0,30 se smatra da zadovoljavaju minimalni nivo, opterećenja od ± 0,40 se smatraju važnijima, a ako su opterećenja ± 0,50 ili veća, smatraju se praktično značajnima. Što je veća apsolutna veličina faktorskog opterećenja, to je važnije to opterećenje u interpretaciji faktorske matrice. Pošto je faktorsko opterećenje korelacija varijable i faktora, kvadrirano opterećenje je obim ukupne varijanse varijable, koji taj faktor objašnjava. Stoga, opterećenje od 0,30 se prevodi približno u objašnjenje od 10%, a opterećenje od 0,50 označava da faktor objašnjava 25% varijanse. Opterećenje mora da predje 0,70 da bi faktor objasnio 50% varijanse. Istraživač treba da shvati da ekstremno visoka opterećenja (0,80 i veća) nisu tipična, i da je praktična značajnost opterećenja, važan kriterijum. Ove smernice su primenljive kada je veličina uzorka 100 ili više. Naglasak u ovom pristupu je praktična, a ne statistička, značajnost.

Procenjivanje statističke značajnosti. Kao što je ranije istaknuto, faktorsko opterećenje predstavlja korelaciju izmedju originalne varijable i njenog faktora. U determinisanju nivoa

21

Page 22: Faktorska Analiza-seminarski Rad

Faktorska analiza

značajnosti za interpretaciju opterećenja, mogao bi se koristiti pristup sličan determinisanju statističke značajnosti koeficijenata korelacije. Međutim, istraživanje je demonstriralo da faktorska opterećenja imaju znatno veće standardne greške nego tipične korelacije; stoga, faktorska opterećenja treba evaluirati na znatno strožijim nivoima. Istraživač može da koristi koncept statističke moći, da specifikuje faktorska opterećenja koja se smatraju značajnima za različite veličine uzorka. Sa navedenim ciljem dobijanja nivoa moći od 80%, upotrebom nivoa značajnosti od 0,05 i predloženim povećanjem standardnih grešaka faktorskih opterećenja, Tabela 2. sadrži veličine uzorka potrebne da se vrednost opterećenja svakog faktora, smatra značajnom. Npr. u uzorku od 100 respondenata, faktorska opterećenja od 0,55 i iznad, su značajna. Međutim, u uzorku od 50, za značajnost se zahteva faktorsko opterećenje od 0,75. U poređenju sa ranijim opštim načelom, koje je označilo da sva opterećenja od 0,30 imaju praktičnu značajnost, ovaj pristup bi smatrao opterećenja od 0,30 značajnim, samo za uzorke veličina 350 ili veće. Ovo su prilično konzervativne smernice kada se porede sa smernicama prethodnog odeljka ili čak statističkim nivoima povezanim sa konvencionalnim koeficijentima korelacije. Stoga ove smernice treba upotrebiti kao polazište u interpretaciji faktorskog opterećenja, gde se niža opterećenja smatraju značajnim i dodaju interpretaciji na bazi drugih razmatranja. Sledeći odeljak detaljno opisuje proces interpretacije, i ulogu koju mogu igrati ostala razmatranja.

Tabela 2. Smernice za identifikovanje značajnih faktorskih opterećenja, na bazi veličine uzorka

Faktorsko opterećenje Veličina uzorka potrebna za značajnosta

0,300,350,400,450,500,550,600,650,700,75

35025020015012010085706050

aZnačajnost se bazira na nivou značajnosti 0,05 (α), nivou moći od 80%, i standardnim greškama za koje se pretpostavlja da su dva puta veće od onih kod konvecionalnih koeficijenata korelacije.

Uskladjenja bazirana na broju varijabli. Mana oba ranija pristupa je da se ne razmatraju broj varijabli koje se analiziraju i specifični faktor koji se ispituje. Pokazano je da kako se istraživač kreće od prvog faktora do kasnijih faktora, prihvatljiv nivo da bi se opterećenje ocenilo kao značajno, treba povećati. Činjenica da jedinstvena varijansa i varijansa greške počinju da se pojavljuju u kasnijim faktorima, znači da treba uključiti neka uskladjenja na gore, nivoa značajnosti. Broj varijabli koje se analiziraju je takodje važan u odlučivanju koja opterećenja su značajna. Kako se povećava broj analiziranih varijabli, prihvatljiv nivo da bi se opterećenje smatralo značajnim, opada. Usklađenje za broj varijabli je sve važnije, kako se pomeramo od prvog ekstrahovanog faktora ka kasnijim faktorima.

Da bi sumirali kriterijume za značajnost faktorskih opterećenja, mogu se navesti sledeće smernice: (1) što je uzorak veći, manje je opterećenje koje će se smatrati značajnim; (2) što je veći broj varijabli koje se analiziraju, manje je opterećenje koje će se smatrati značajnim; (3) što je veći broj faktora, veća je veličina opterećenja na kasnijim faktorima, koja će se smatrati značajnim za interpretaciju.

Interpretiranje faktorske matrice

22

Page 23: Faktorska Analiza-seminarski Rad

Faktorska analiza

Interpretiranje kompleksnih medjuodnosa predstavljenih u faktorskoj matrici, nije jednostavno. Međutim, prateći proceduru skiciranu u narednim pasusima, znatno se može pojednostaviti procedura faktorske interpretacije.

Ispitati faktorsku matricu opterećenja. Svaka kolona brojeva u faktorskoj matrici, predstavlja odvojeni faktor. Kolone brojeva su faktorska opterećenja za svaku varijablu na svakom faktoru. Za svrhe indentifikacije, kompjuterski printout obično identifikuje faktore sa leva na desno pomoću brojeva 1, 2, 3, 4, itd. On takođe identifikuje varijable prema broju od vrha ka dnu. Da bi dalje olakšao interpretaciju, istraživač treba da napiše ime svake varijable na levoj margini pored brojeva varijabli.

Ako se koristi kosa rotacija, obezbeđene su dve faktorske matrice opterećenja. Prva je matrica faktorskog sklopa, koja ima opterećenja koja predstavljaju jedinstven doprinos svake varijable faktoru. Druga je matrica faktorske strukture, koja ima proste korelacije između varijabli i faktora, ali ova opterećenja sadrže i jedinstvenu varijansu između varijabli i faktora, i korelaciju među faktorima. Kako se korelacija među faktorima povećava, postaje teže razlikovati koje varijable vrše jedinstveno opterećenje na svakom faktoru u matrici faktorske strukture. Većina istraživača prijavljuje rezultate matrice faktorskog sklopa.

Identifikovati najviše opterećenje za svaku varijablu. Interpretacija treba da započne sa prvom varijablom na prvom faktoru i da se kreće horizontalno sa leva na desno, tražeći najviše opterećenje za tu varijablu na bilo kom faktoru. Kada se identifikuje najviše opterećenje (najveće apsolutno faktorsko opterećenje), treba ga podvući (naglasiti) ako je značajno. Onda se pažnja fokusira na drugu varijablu, i ponovo se kreće horizontalno sa leva na desno, traži se najviše opterećenje za tu varijablu na bilo kom faktoru, i podvlači se. Ovu proceduru treba nastaviti za svaku varijablu, sve dok se ne podvuku sve varijable, za njihovo najviše opterećenje na faktoru. Prisetimo se da za uzorak manji od 100, najniže faktorsko opterećenje koje treba smatrati značajnim, bi u većini slučajeva bilo ±0,30.

Proces podvlačenja samo jednog najvišeg opterećenja kao značajnog za svaku varijablu, je ideal kome treba težiti, ali se on retko može ostvariti. Kada svaka varijabla ima samo jedno opterećenje na jednom faktoru koje se smatra značajnim, interpretacija značenja svakog faktora je znatno simplifikovana. Međutim, u praksi mnoge varijable mogu imati nekoliko opterećenja umerene veličine, od kojih su sva značajna, i onda je interpretiranje faktora mnogo teže. Teškoća nastaje jer varijabla sa nekoliko značajnih opterećenja se mora razmotriti u interpretiranju (obeležavanju) svih faktora na kojima ona ima značajno opterećenje. Većina faktorskih rešenja ne rezultira u rešenju jednostavne strukture (jedno visoko opterećenje za svaku varijablu na samo jednom faktoru). Stoga će istraživač nakon podvlačenja najvišeg opterećenja za varijablu, nastaviti da evaluira faktorsku matricu, podvlačeći sva značajna opterećenja za varijablu na svim faktorima. Na kraju, cilj je minimizirati broj značajnih opterećenja na svakom redu faktorske matrice (tj. povezati svaku varijablu samo sa jednim faktorom). Varijabla sa nekoliko visokih opterećenja je kandidat za izbacivanje (brisanje).

Proceniti komunalitete varijabli. Kada su sve varijable podvučene na svojim odgovarajućim faktorima, istraživač treba da ispita faktorsku matricu da identifikuje varijable koje nisu podvučene, i stoga ne vrše opterećenje ni na kom faktoru. Obezbeđuju se komunaliteti za svaku varijablu, predstavljajući obim varijanse koji je objašnjen pomoću faktorskog rešenja za svaku varijablu. Istraživač treba da posmatra komunalitet svake varijable, da bi procenio da li on zadovoljava prihvatljive nivoe objašnjenja. Npr. istraživač može da specifikuje da se bar polovina varijanse svake varijable, mora uzeti u obzir. Koristeći ovu smernicu, istraživač bi identifikovao da sve varijable sa komunalitetima manjim od 0,50, nemaju dovoljno objašnjenje.

Ako postoje varijable koje ne vrše opterećenje ni na jednom faktoru ili čiji se komunaliteti smatraju previše niskim, raspoložive su dve opcije: (1) interpretirati rešenje onako kako jeste i jednostavno ignorisati te varijable, ili (2) evaluirati svaku od tih varijabli za moguće brisanje. Ignorisanje varijabli može biti podesno ako je cilj samo redukcija podataka, ali istraživač ipak mora

23

Page 24: Faktorska Analiza-seminarski Rad

Faktorska analiza

da primeti da su dotične varijable loše predstavljene u faktorskom rešenju. Razmatranje brisanja, treba da zavisi od opšteg doprinosa te varijable istraživanju, kao i od njenog indeksa komunaliteta. Ako je ta varijabla od minorne važnosti za cilj studije ili ima neprihvatljivu vrednost komunaliteta, ona se može eliminisati i onda faktorski model respecifikovati, izvođenjem novog faktorskog rešenja gde su ove varijable eliminisane.

Označiti faktore. Kada je dobijeno faktorsko rešenje u kome sve varijable imaju značajno opterećenje na faktoru, istraživač pokušava da dodeli izvesno značenje šemi (sklopu) faktorskih opterećenja. Varijable sa višim opterećenjima se smatraju važnijima, i imaju veći uticaj na ime ili oznaku koja je odabrana da predstavlja faktor. Stoga će istraživač ispitati sve podvučene varijable za određeni faktor, i stavljajući veći naglasak na one varijable sa višim opterećenjima, pokušaće da dodeli ime ili oznaku faktoru koji tačno odražava varijable koje vrše opterećenje na tom faktoru. Znaci se intereptiraju kao i kod bilo kojih drugih korelacionih koeficijenata. Na svakom faktoru, slični znaci označavaju da su varijable pozitivno povezane, a suprotni znaci označavaju da su varijable negativno povezane. U ortogonalnim rešenjima, faktori su nezavisni jedan u odnosu na drugi. Stoga, znaci za faktorsko opterećenje se odnose samo na faktor na kom se pojavljuju, ne na ostale faktore u rešenju.

Ovu oznaku ne izvodi niti dodeljuje kompjuterski program za faktorsku analizu; oznaku intuitivno razvija istraživač, na osnovu njene podesnosti za predstavljanje osnovnih dimenzija određenog faktora. Ova procedura se sledi za svaki ekstrahovani faktor. Finalni rezultat će biti ime ili oznaka koja predstavlja svaki od izvedenih faktora, što je tačnije moguće.

U nekim slučajevima, nije moguće dodeliti ime svakom faktoru. Kada se naidje na ovakvu situaciju, istraživač može želeti da označi odredjeni faktor ili faktore izvedene tim rešenjem, kao „nedefinisane“. U takvim slučajevima, istraživač interpretira samo one faktore koji su značajni i izostavlja nedefinisane ili one manje značajne. Međutim, u opisivanju faktorskog rešenja, istraživač indicira da su ti faktori bili izvedeni, ali su neodredljivi i da su interpretirani samo oni faktori koji predstavljaju značajne odnose.

Kao što je diskutovano ranije, odabiri specifičnog broja faktora i rotacionog metoda, su međupovezani. Može se izvršiti nekoliko dodatnih probnih rotacija, i razmatrajući inicijalni kriterijum i poredeći faktorske interpretacije za nekoliko različitih probnih rotacija, istraživač može odabrati broj faktora za ekstrakciju. Ukratko, sposobnost dodeljivanja izvesnog značenja faktorima, ili interpretiranja prirode varijabli, postaje ekstremno važno razmatranje u determinisanju broja faktora za ekstrakciju.

2.7. Faza 6 - Validacija faktorske analize

Šesta faza uključuje procenu stepena uopštljivosti rezultata za populaciju i potencijalni uticaj individualnih slučajeva ili respondenata na opšte rezultate. Pitanje uopštljivosti je kritično za svaki od multivarijantnih metoda, ali je naročito relevantno za metode međuzavisnosti, jer oni opisuju strukturu podataka koja treba da predstavlja i populaciju. Najdirektniji metod validacije rezultata je da se pređe na konfirmatornu perspektivu, i proceni replikabilnost rezultata, ili sa (podeljenim) split uzorkom u originalnom setu podataka ili sa odvojenim uzorkom.

Još jedan aspekat uopštljivosti je stabilnost rezultata faktorskog modela. Faktorska stabilnost je pre svega zavisna od veličine uzorka i broja slučajeva po varijabli. Istraživač se uvek podstiče da dodje do najvećeg mogućeg uzorka i razvije škrte modele, da bi povećao racio slučajeva prema varijablama. Ako to dozvoljava veličina uzorka, istraživač može želeti da nasumično podeli uzorak na dva podskupa i proceni faktorske modele za svaki podskup. Poređenje dve rezultirajuće faktorske matrice će pružiti procenu robustnosti rešenja širom uzorka.

Pored uopštljivosti, još jedno pitanje koje je važno za validaciju faktorske analize, je detekcija uticajnih opservacija. Istraživač se podstiče da proceni model sa i bez opservacija koje su identifikovane kao autlejeri, da bi procenio njihov uticaj na rezultate. Ako je izostavljanje autlejera opravdano, rezultati treba da imaju veću uopštljivost. Takođe, nekoliko mera uticaja koje

24

Page 25: Faktorska Analiza-seminarski Rad

Faktorska analiza

odražavaju poziciju jedne opservacije u odnosu na sve druge (npr. racio kovarijanse), je takođe primenljivo na faktorsku analizu. Konačno, predloženi su metodi za identifikovanje uticajnih opservacija specifičnih za faktorsku analizu, ali kompleksnost limitira primenu ovih metoda.

2.8. Faza 7 - Dodatne upotrebe rezultata faktorske analize

U zavisnosti od ciljeva primene faktorske analize, istraživač može da prestane sa faktorskom interpretacijom ili daljim učestvovanjem u jednom od metoda za redukciju podataka. Ako je cilj jednostavno identifikovati logične kombinacije varijabli i bolje shvatiti međuodnose među varijablama, onda će faktorska intepretacija biti dovoljna. To obezbeđuje empirijsku osnovu za ocenu strukture varijabli i uticaja ove strukture kada se intepretiraju rezultati iz drugih multivarijacionih tehnika. Međutim, ako je cilj identifikovati podesne varijable za narednu primenu na druge statističke tehnike, onda će se koristiti neki oblik redukcije podataka. Opcije uključuju (1) ispitivanje faktorske matrice i selekciju varijable sa najvišim faktorskim opterećenjem, kao surogat predstavnika za odredjenu faktorsku dimenziju, ili (2) zamenu originalnog seta varijabli, potpuno novim, manjim setom varijabli, kreiranim ili iz sumiranih skala ili faktorskih skorova. Bilo koja od ovih opcija će obezbediti nove varijable za upotrebu, npr. kao nezavisne varijable u regresionoj ili diskriminacionoj analizi, kao zavisne varijable u multivarijantnoj analizi varijanse, ili čak kao klastering varijble u klaster analizi.

Selekcija surogat varijabli za narednu analizu

Ako je istraživačev cilj jednostavno identifikovati podesne varijable za narednu aplikaciju sa ostalim statističkim tehnikama, istraživač ima opciju ispitivanja faktorske matrice i selekcije varijable sa najvišim faktorskim opterećenjem na svakom faktoru, koja deluje kao surogat varijabla koja je predstavnik tog faktora. Ovo je jednostavan i direktan pristup samo kada jedna varijabla ima faktorsko opterećenje koje je znatno više od svih ostalih faktorskih opterećenja. Međutim, u mnogim slučajevima proces selekcije je teži, jer dve ili više varijabli imaju opterećenja koja su značajna i prilično blizu jedna drugima. Ovakvi slučajevi zahtevaju kritičko ispitivanje faktorskih opterećenja približno iste veličine, i selekciju samo jednog kao predstavnika određene dimenzije. Ova odluka treba da se zasniva na istraživačevom a priori poznavanju teorije, koje može da sugeriše da bi jedna varijabla više od drugih, bila logično predstavnik te dimenzije. Takođe, istraživač može posedovati znanje koje sugeriše da je varijabla sa opterećenjem nešto nižim, zapravo pouzdanija od varijable sa najvišim opterećenjem. U ovakvim slučajevima, istraživač može odabrati varijablu koja opterećuje nešto niže, kao najbolju varijablu za predstavljanje odredjenog faktora.

Pristup odabira jedne surogat varijable, kao predstavnika faktora – iako jednostavan i zadržava originalne varijable – ima nekoliko potencijalnih mana. Prvo, on se ne bavi pitanjem merenja greške koje se susreće kada se koriste pojedinačne mere i takođe se izlaže riziku od potencijalno obmanljivih rezultata, birajući samo jednu varijablu da predstavlja možda kompleksniji rezultat. Npr. pretpostavimo da je otkriveno da varijable koje predstavljaju cenovnu konkurentnost, kvalitet proizvoda i vrednost, visoko opterećuju na jednom faktoru. Selekcija bilo koje od ovih odvojenih varijabli, bi kreirala značajno različite interpretacije u svakoj narednoj analizi, a ipak sve tri mogu biti tako blisko povezane da zaista isključuju takvo dejstvo. Drugo,u slučajevima gde nekoliko visokih opterećenja komplikuje odabir jedne varijable, istraživač možda nema drugog izbora osim da koristi faktorsku analizu kao osnovu za kalkulaciju sumirane skale ili faktorskih skorova za upotrebu kao surogat varijable. Cilj je, baš kao u slučaju odabira jedne varijable, najbolje predstaviti osnovnu prirodu faktora ili komponente.

25

Page 26: Faktorska Analiza-seminarski Rad

Faktorska analiza

Kreiranje sumiranih skala

Sve varijable koje vrše visoko opterećenje na faktoru, se kombinuju i ukupni – ili češće prosečan skor varijabli – se koristi kao varijabla zamene. Sumirana skala pruža dve specifične koristi. Prvo, ona pruža način da se u izvesnoj meri savlada greška merenja, inherentna u svim merenim varijablama. Greška merenja je stepen u kom opservirane vrednosti ne predstavljaju „istinske“ vrednosti iz bilo kojih razloga, koji se kreću od stvarnih grešaka (npr. grešaka pri unosu podataka) do nesposobnosti pojedinaca da precizno obezbede informacije. Uticaj greške merenja je da delimično maskira sve odnose (npr. korelacije ili poredjenje grupnih sredina) i oteža procenu multivarijacionih modela. Sumirana skala redukuje grešku merenja putem korišćenja višestrukih indikatora (varijabli), da bi se redukovalo oslanjanje na jedan odgovor. Koristeći „prosečan“ ili „tipičan“ odgovor na set srodnih varijabli, greška merenja koja bi se mogla javiti u jednom pitanju, će biti redukovana.

Druga korist od sumirane skale je njena sposobnost da predstavlja više aspekata koncepta u jednoj meri. Mnogo puta koristimo više varijabli u svojim multivarijacionim modelima, u pokušaju da predstavimo mnoge „aspekte“ koncepta za koji znamo da je prilično kompleksan. Ali radeći to, mi komplikujemo interpretaciju rezultata zbog suvišnosti u ajtemima povezanim sa konceptom. Stoga želeli bi ne samoda se prilagodimo „bogatijim“ opisima koncepata putem korišćenja višestrukih varijabli, već takodje da održimo parsimoniju u broju varijabli u našim multivarijantnim modelima. Sumirana skala, kada se konstruiše kako treba, kombinuje višestruke indikatore u jednu meru koja predstavlja ono što se smatra zajedničkim u setu mera.

Konceptualna definicija. Polazište za kreiranje bilo koje sumirane skale je njena konceptualna definicija. Konceptualna definicija specifikuje teoretsku osnovu za sumiranu skalu, definišući koncept koji je predstavljen u terminima primenljivim na kontekst istraživanja. U akademskom istraživanju, teoretske definicije se baziraju na ranijem istraživanju koje definiše karakter i prirodu koncepta. U menadžerskom okruženju, mogu se definisati specifični koncepti koji se odnose na predložene ciljeve, kao što su imidž, vrednost ili satisfakcija. U svakom slučaju, kreiranje sumirane skale je uvek vodjeno konceptualnom definicijom, koja specifikuje tip i karakter ajtema koji su kandidati za uključenje u skalu.

Sadržajna validnost je procena korespondentnosti varijabli koje treba uključiti u sumiranu skalu i njene konceptualne definicije. Ova forma validnosti, takodje poznata kao očigledna ili spoljašnja validnost, subjektivno procenjuje korespondentnost izmedju individualnih ajtema i koncepta putem rejtinga od strane eksperata, pretestova sa višestukim subpopulacijama il drugih sredstava. Cilj je osigurati da selekcija ajtema skale proširi prošla samo empirijska pitanja, da takodje uključe teoretska i praktična razmatranja.

Dimenzionalnost. Osnovna pretpostavka i esencijalni zahtev za kreiranje sumirane skale je da su ajtemi unidimenzionalni, što znači da su jako povezani jedan sa drugim, i da predstavljaju jedinstven koncept. Faktorska analiza igra glavnu ulogu u vršenju empirijske procene dimenzionalnosti seta ajtema, determinisanjem broja faktora i opterećenja svake varijable na faktoru (faktorima). Test unidimenzionalnosti je da svaka sumirana skala treba da se sastoji od ajtema koji visoko opterećuju na jednom faktoru. Ako je predloženo da sumirana skala ima višestruke dimenzije, svaku dimenziju treba da odražava odvojeni faktor. Istraživač može da proceni unidimenzionalnost ili sa eksploratornom faktorskom analizom, ili konfirmatornom faktorskom analizom.

Relijabilnost (Pouzdanost). Pouzdanost je procena stepena konzistentnosti između višestrukih merenja varijable. Jedna forma pouzdanosti je test-retest, pomoću kog se meri konzistentnost izmedju odgovora za pojedinca, u dve tačke u vremenu. Cilj je osigurati da odgovori nisu previše različiti kroz vremenske periode, tako da je merenje izvršeno u bilo kojoj tački u vremenu, pouzdano. Druga i češće korišćena mera pouzdanosti je interna konzistentnost, koja se

26

Page 27: Faktorska Analiza-seminarski Rad

Faktorska analiza

primenjuje na konzistentnost medju varijablama u sumiranoj skali. Obrazloženje za internu konzistentnost je da pojedinačni ajtemi ili indikatori skale treba da mere isti konstrukt, i stoga budu visoko interkorelirani.

Pošto nijedan pojedinačni ajtem nije savršena mera koncepta, moramo se oslanjati na seriju dijagnostičkih mera da bi procenili internu konzistentnost. Prvo, postoji nekoliko mera koje se odnose na svaki odvojeni ajtem, uključujući ajtem-total korelaciju (korelacija ajtema prema skoru sumirane skale) ili inter-ajtem korelacija (korelacija među ajtemima). Opšte načelo sugeriše da korelacije ajtem-total prelaze 0,50 i da inter-ajtem korelacije prelaze 0,30. Drugi tip dijagnostičke mere je koeficijenat pouzdanosti koji procenjuje konzistentnost čitave skale, gde je Cronbach alfa (Kronbah alfa), najšire korišćena mera. Generalno ugovorena donja granica za Kronbah alfu je 0,70, iako može opasti na 0,60 u eksploratornom istraživanju. Jedno pitanje u proceni Kronbahove alfe je njen pozitivan odnos prema broju ajtema u skali. Zato što će povećanje broja ajtema, čak i sa istim stepenom interkorelacije, povećati vrednost pouzdanosti, istraživači moraju nametnuti strožije zahteve za skale sa velikim brojem ajtema. Takođe su dostupne mere pouzdanosti, izvedene iz konfirmatorne faktorske analize.

Svi glavni statistički programi sada poseduju module ili programe za procenu pouzdanosti, tako da je istraživaču obezbedjena potpuna analiza i ajtem-specifičnih i opštih mera pouzdanosti. Svaku sumiranu skalu treba analizirati za pouzdanost, da bi se osigurala njena podesnost pre no što se predje na procenju njene validnosti.

Validnost (valjanost). Kada je utvrdjeno da skala (1) se pridržava svoje konceptualne definicije, (2) je unidimenzionalna, i (3) zadovoljava potrebne nivoe pouzdanosti, istraživač mora da izvrši još jednu finalnu procenu: validnost skale. Validnost je obim u kom skala ili set mera, tačno reprezentuje koncept od interesa. Već smo diskutovali o jednoj formi validnosti – sadržajna ili spoljašnja (očigledna) validnost – u diskusiji o koneptualnim definicijama. Ostale forme validnosti se mere empirjski putem korelacije izmedju teorijski definisanih setova varijabli. Tri najšire prihvaćene forme validnosti su konvergentna, diskriminativna i nomološka validnost. Konvergentna validnost procenjuje stepen u kom su korelirane dve mere istog koncepta. Ovde istraživač može potražiti alaternativne mere koncepta, i onda ih korelirati sa sumiranom skalom. Visoke korelacije ovde indiciraju da skala meri svoj nameravani koncept. Diskriminativna validnost je stepen u kom su dva konceptualno slična koncepta, distinktna. Empirijski test je ponovo korelacija medju merama, ali ovog puta je sumirana skala korelirana sa sličnom, ali konceptualno distinktnom merom. Sada korelacija treba da bude niska, demonstrirajući da je sumirana skala dovoljno različita od drugog sličnog koncepta. Konačno, nomološka validnost se odnosi na stepen u kom sumirana skala vrši tačna predviđanja u teorijski zasnovanom modelu. Istraživač mora identifikovati teoretski podržane odnose iz ranijeg istraživanja, ili prihvaćene principe, i onda proceniti da li skala ima korespondirajuće odnose. Ukratko, konvergentna validnost potvrđuje da je skala korelirana sa drugim poznatim merama koncepta, diskriminativna validnost osigurava da je skala dovoljno različita od drugih sličnih koncepata da bi bila distinktna, a nomološka validnost determiniše da li skala demonstrira odnose za koje je pokazano da postoje na bazi teorije i /ili ranijeg istraživanja.

Rezime. Sumirane skale, jedan od skorijih dogadjaja u akademskom istraživanju, se sve više primenjuju i u primenjenom i menadžerskom istraživanju. Sposobnost sumirane skale da prikaže kompleksne koncepte u jednoj meri, dok redukuje grešku merenja, je čini dragocenim dodatkom u svakoj multivarijacionoj analizi. Faktorska analiza obezbeđuje istraživaču empirijsku procenu medjuodnosa varijabli, koja je esencijalna u formiranju konceptualnog i empirijskog temelja sumirane skale, kroz procenu sadržajne validnosti i dimenzionalnosti skale.

Izračunavanje faktorskih skorova

27

Page 28: Faktorska Analiza-seminarski Rad

Faktorska analiza

Treća opcija za kreiranje manjeg seta varijabli koji treba da zameni originalni set, je izračunavanje faktorskih skorova. Faktorski skorovi su takođe kompozitne mere svakog faktora izračunate za svaki subjekt. Konceptualno, faktorski skor predstavlja stepen u kom svaka individua ima visok skor u grupi ajtema koji imaju visoka opterećenja na faktoru. Stoga, više vrednosti na varijablama sa visokim opterećenjima na faktoru, će rezultirati u višem faktorskom skoru. Ključna karakteristika koja razlikuje faktorski skor od sumirane skale, je da se faktorski skor izračunava na osnovu faktorskih opterećenja svih varijabli na faktoru, dok se sumirana skala izračunava putem kombinovanja samo selektovanih varijabli. Stoga, iako istraživač može da okarakteriše faktor pomoću varijabli sa najvišim opterećenjima, moraju se razmotriti i opterećenja drugih varijabli, iako niža, i njihov uticaj na faktorski skor.

Većina statističkih programa može lako da izračuna faktorske skorove za svakog respondenta. Selektovanjem opcije faktorskog skora, ovi skorovi se čuvaju za upotrebu u narednim analizama. Mana faktorskih skorova je da se oni ne repliciraju lako kroz studije, jer se baziraju na faktorskoj matrici, koja se izvodi odvojeno u svakoj studiji. Replikacija iste faktorske matrice medju studijama, zahteva znatno računsko programiranje.

Selekcija između tri metoda

Da bi izvršio odabir među tri opcije redukcije podataka, istraživač mora da donese niz odluka. Prvi izbor je izmedju toga da se odabere jedna surogat varijabla za svaki faktor ili da se izračuna kompozitna mera. Pojedinačna surogat varijabla ima prednost da je jednostavna za upravljanje i interpretiranje, ali ima mane jer ne predstavlja sve „aspekte“ faktora, i što je sklona grešci merenja. Ako istraživač želi da koristi neki oblik kompozitne mere, onda se mora izvršiti izbor između faktorskih skorova i sumiranih skala. Oboje imaju prednosti i mane, a ne postoji očegledan izbor za sve situacije. Faktorski skorovi imaju prednost što predstavljaju kompozit svih varijabli koje vrše opterećenje na faktoru, iako je ovo i potencijalna mana zato što sve varijable imaju izvestan stepen uticaja u izračunavanju faktorskih skorova, i otežavaju interpretaciju. Sumirana skala je kompromis između opcija surogat varijable i faktorskog skora. To je kompozitna mera, kao i faktorski skorovi, stoga redukuje grešku merenja i predstavlja višestruke aspekte koncepta. Ipak, slična je pristupu surogat varijable, jer uključuje samo varijable koje vrše visoko opterećenje na faktoru, i isključuje one koje imaju mali uticaj. Takođe, njena lakoća replikacije izmedju uzoraka je slična pristupu surogat varijable. Na kraju, kao i surogat varijable, sumirane skale nisu neophodno ortogonalne, dok rotirani faktori mogu biti ortogonalni ili nekorelirani, ako je potrebno da se izbegnu komplikacije u njihovoj upotrebi u drugim multivarijantnim tehnikama. Pravilo odlučivanja bi stoga bilo, da ako se podaci koriste samo u originalnom uzorku ili se ortogonalnost mora održati, faktorski skorovi su pogodni. Ako se želi uopštljivost ili transferabilnost, onda su podesnije sumirane skale ili surogat varijable. Ako je sumirana skala dobro konstruisan, validan i pouzdan instrument, onda je ona verovatno najbolja alternativa. Ali ako je sumirana skala netestirana i eksploratorna, sa malo ili bez dokaza o pouzdanosti ili validnosti, treba razmotriti surogat varijable, ako dodatna analiza nije moguća da bi se poboljšala sumirana skala.

3. Primer faktorske analize u statističkom softveru MINITAB

28

Page 29: Faktorska Analiza-seminarski Rad

Faktorska analiza

Utvrđivanje osnovnih karakteristika proizvoda ’’kafa’’ primenom faktorske analize

Svaki proizvod okarakterisan je nizom karakteristika, ali se u tom velikome broju neke i preklapaju. Postavlja se pitanje jesu li te karakteristike zaista različite ili se mogu grupisati u faktore? U tu je svrhu sprovedeno empirijsko istraživanje o karakteristikama proizvoda „kafa“. Na prikupljenim podacima primijenjena je faktorska analiza da bi se od velikoga broja karakteristika dobile osnovne karakteristike, odnosno od većega broja izvornih varijabli manji broj faktora. Faktorska analiza na osnovi petnaest izvornih varijabli rezultirala je sa četiri izdvojena faktora.

Podaci su prikupljeni metodom ispitivanja na uzorku studenata prve godine Ekonomskog fakulteta. Instrument istraživanja bio je upitnik sastavljen od izjava vezanih uz karakteristike proizvoda „kafa“.

Prvo su na skupu od pedeset studenata prikupljeni podaci o karakteristikama proizvoda „kafa“. Ispitanici su bili zamoljeni da napišu nekoliko rieči vezanih uz navedeni proizvod da bi se dobila lista karakteristika toga proizvoda. Izjave vezane uz karakteristike navedenoga proizvoda određene su i na osnovu: pređašnjih istraživanja, prosuđivanja istraživača i neformalnih razgovora s ljudima. Zatim su izostavljene izjave koje se ponavljaju, pa je sastavljen upitnik. Potom je na skupu od 155 studenata sprovedeno pilot istraživanje da bi se testirao kvalitet upitnika. Nakon analize pilot istraživanja sastavljena je konačna verzija upitnika i sprovedeno je istraživanje na novom skupu ispitanika od 281 studenta prve godine Ekonomskog fakulteta. Analizom rezultata toga ispitivanja u obradu je ušlo 248 upitnika, a to zato što je odvojeno 33 upitnika koji su neadekvatno popunjeni.2

Jedna od osnovnih pretpostavki za primenu faktorske analize ta da su podaci mereni na intervalnoj skali. No u empirijskim se istraživanjima često javlja problem merenja varijabli, na primer različite izjave ispitanika, njihova mišljenja, stavovi i slično. Budući da se upitnik sastoji od izjava o karakteristikama proizvoda „kafa“ i u ovome se istraživanju pojavio taj problem mjernih skala varijabli. Ispitanici su na skali od 1 do 7 morali procijeniti svaku navedenu izjavu, pri čemu je 1 označavalo „uopšte se ne slažem s navedenom izjavom“, a 7 „izrazito se slažem s navedenom izjavom“. Iako je ta skala ordinalna, ona se može smatrati i intervalnom ako se polazi od pretpostavke da su intervali na skali jednaki. U empirijskim istraživanjima često se primenjuju ordinalne skale, ali je uobičajeno da se prikupljeni podaci analiziraju kao da su prikupljeni na intervalnoj skali. I u ovome je istraživanju primenjen navedeni postupak, odnosno podaci su analizirani na intervalnoj skali.3

Faktorska analiza karakteristika proizvoda „kafa“ sprovedena je na 15 izvornih varijabli kojih su skraćeni i potpuni nazivi ovakvi:OPUST – kafa je dobra za opuštanje,UKUS – važno je da kafa ima dobar ukus,NESPA – kada popijem kafu, ne spava mi se,DOBOS – dobro se osećam dok pijem kafu,NEZIV – ne mogu živjeti bez kafe,MIRIS – važno je da kafa ima dobar miris,ODMOR – kafa je važna za odmor,KONCEN – kafu pijem kad želim biti koncentrisan/a na učenje,BUDJEN – kafa je važna za razbuđivanje,PAUZA – kafa znači pauzu,2 Kao izvor podataka za dalju analizu u ovom radu su poslužili podaci koji su preuzeti iz rada mr.Nataše Živadinović – Kurnoga, asistenta na Ekonomskom fakultetu u Zagrebu3 Živadinović, K., N., Utvrđivanje osnovnih karakteristika proizvoda primenom faktorske analize, Ekonomski pregled 55, Zagreb, 2004

29

Page 30: Faktorska Analiza-seminarski Rad

Faktorska analiza

UZITAK – kafa mi pruža užitak,POCDAN – kafa je važna za početak dana,MIRPRIM – miris kafe je primamljiv,OSVEZ – kafa je osveženje,BITELT – kafa mi je bitan element u životu.

Korelacijska matrica koja sadrži koeficijente jednostavne linearne korelacije svakog para varijabli osnovica je za sprovođenje faktorske analize. Jedan od preduslova za sprovođenje faktorske analize jeste povezanost između izvornih varijabli, a osnova za uočavanje skupa povezanih varijabli je korelacijska matrica.

U nastavku je prezentiran postupak sprovođenja faktorske analize u programu MINITAB. Postupak otpočinje izbormom opcije Stat-Multivariate-Factor Analzsis i u nastvku su prikazani izgledi ekrana nakon odabira prethodno pomenutih funkcija.

30

Page 31: Faktorska Analiza-seminarski Rad

Faktorska analiza

Na narednoj slici je prikazan Cattellijev dijagram (scree plot) za 15 varijabli karakteristika proizvoda „kafa“ koji se takođe primjenjuje za određivanje broja faktora. Prema dijagramu takođe se izdvajaju četiri faktora jer su njihove svojstvene vrijednosti odvojene od svojstvenih vrijednosti preostalih faktora.

31

Page 32: Faktorska Analiza-seminarski Rad

Faktorska analiza

Pošto je utvrđen broj faktora, potrebno je odrediti matricu faktorske strukture izldvojenih faktora. Matrica faktorske strukture sadrži faktorska opterećenja koja predočavaju koeficijente korelacije između izldvojenih faktora i varijabli. Faktorska opterećenja ukazuju na važnost svake varijable za pojedini faktor. U nastavku je prikazana matrica faktorske strukture za 15 varijabli, pripadajući komunaliteti za svaku pojedinu varijablu i svojstvene vrijednosti izdvojenih faktora.

Analizirajući varijable sa prethodne slike uočava se da pojedine varijable koreliraju sa nekoliko faktora, a analiza faktora pokazuje da je prvi faktor definisan visokim faktorskim opterećenjima većeg broja varijabli. Budući da inicijalna matrica nema obeležja jednostavne strukture, sprovodi se rotacija faktora kojom se mijenja odnos između varijabli i faktora. Rotaciju

32

Page 33: Faktorska Analiza-seminarski Rad

Faktorska analiza

faktora moguće je provesti uz pomoć jedne od metoda ortogonalne rotacije ili jedne od metoda ugaone.

U ovome istraživanju primijenjena je ortogonalna rotacija faktora. Odabrana je metoda Varimax rotacije faktora. Ta je metoda, u odnosu na druge metode rotacije, uspešnija u postizanju principa jednostavne strukture. Varimax rotacija faktora rezultira pojednostavnjenjem stupaca u matrici faktorske strukture, odnosno pojednostavnjenjem faktora. Iz rezultata prikazanih sa prethodne slike uočava se potreba za pojednostavnjenjem faktora, jer prvi faktor ima velik broj visokih faktorskih opterećenja. Matrica faktorske strukture i matrica faktorskog sklopa nakon sprovedene rotacije osnovica su za interpretaciju faktora. Matrica faktorske strukture i matrica faktorskog sklopa jednake su ako su faktori ortogonalni, što je slučaj u ovome radu.

Naredne dve slika prikazuju matricu faktorske strukture za 15 varijabli nakon sprovedene Varimax rotacije faktora. Iz rezultata se vidi da je struktura faktorskih opterećenja izmenjena, odnosno da su faktorska opterećenja raspoređena na sva četiri faktora, što nije bio slučaj kod nerotirane matrice. Struktura faktorskih opterećenja nakon sprovedene rotacije omogućuje bolju interpretaciju faktora u odnosu na inicijalnu faktorsku matricu.

Rotated Factor Loadings and CommunalitiesVarimax Rotation

Variable Factor1 Factor2 Factor3 Factor4 Communality

33

Page 34: Faktorska Analiza-seminarski Rad

Faktorska analiza

OPUST 0,925 0,097 -0,249 -0,203 0,969UKUS 0,949 0,110 -0,070 -0,183 0,951NESPA -0,064 -0,956 -0,170 -0,215 0,993DOBOS 0,928 0,100 -0,163 -0,214 0,943NEZIV -0,206 0,201 0,904 0,273 0,975MIRIS 0,286 -0,244 -0,337 -0,846 0,970ODMOR 0,961 -0,005 -0,052 -0,137 0,945KONCEN -0,064 -0,956 -0,170 -0,215 0,993BUDJEN -0,412 -0,735 -0,451 -0,072 0,919PAUZA 0,925 0,097 -0,249 -0,203 0,969UZITAK -0,218 0,249 0,904 0,237 0,982POCDAN -0,064 -0,956 -0,170 -0,215 0,993MIRPRIM 0,348 -0,341 -0,189 -0,746 0,830OSVEZ 0,258 -0,239 -0,270 -0,875 0,962BITELT -0,231 0,257 0,903 0,211 0,978

Variance 4,9929 3,7251 3,1190 2,5361 14,3732% Var 0,333 0,248 0,208 0,169 0,958

Interpretacija faktora polazi od matrice faktorske strukture nakon provedene rotacije faktora i identifikovanja varijabli koje imaju visoka apsolutna opterećenja na isti faktor. Može se, dakle, zaključiti da su četiri izdvojena faktora te pripadajuće varijable karakteristika proizvoda „kafa“ za svaki pojedini faktor i njihova faktorska opterećenja kako slijedi:

FAKTOR 1 - nazvan „OPUŠTANJE“ i čine ga sledeće varijable:OPUST – kafa je dobra za opuštanje,UKUS – važno je da kafa ima dobar ukus,DOBOS – dobro se osećam dok pijem kafu,ODMOR – kafa je važna za odmorPAUZA – kafa znači pauzuMIRPRIM – miris kafe je primamljiv

FAKTOR 2 - nazvan „KONCENTRACIJA“ čine ga sledeće varijable:NESPA – kada popijem kafu, ne spava mi se,KONCEN – kafu pijem kad želim biti koncentrisan/a na učenjeBUDJEN – kafa je važna za razbuđivanjePOCDAN – kafa je važna za početak dana,

FAKTOR 3 - nazvan „ZAVISNOST“ čine ga sledeće varijable: NEZIV – ne mogu živeti bez kafe,UZITAK – kafa mi pruža užitak,BITELT – kafa mi je bitan element u životu

FAKTOR 4 - nazvan „OSVEŽENJE“ čine ga sledeće varijable:MIRIS – važno je da kafa ima dobar mirisOSVEZ – kafa je osveženje

Empirijskim istraživanjem karakteristika proizvoda „kafa“ i primenom faktorske analize na prikupljenim podacima nastojalo se veći broj karakteristika svesti na manji broj osnovnih karakteristika navedenoga proizvoda. Utvrđivanje osnovnih karakteristika proizvoda korisno je za razvijanje novoga i za poboljšanje postojećih proizvoda, ali i za bolje razumijevanje kupaca i za predviđanje trendova na tržištu. Saznanja o osnovnim karakteristikama korisna su i za planiranje uspešnog oglašivanja, posebno pri kreiranju oglašivačke poruke, da bi se što bolje komuniciralo s publikom. Te osnovne karakteristike mogu biti od pomoći, pri definisanju fizičkih karakteristika

34

Page 35: Faktorska Analiza-seminarski Rad

Faktorska analiza

oglašivačke poruke, ali i pri njezinom tekstualnom osmišljavanju, jer će oglašivačka poruka biti uspešnija ako se uzmu u obzir svi elementi poruke, od fizičkih do tekstualnih i misaonih dijelova. Na primer, korisne su osobama zaduženima za kreiranje poruke, kao što su tekstopisci koji ih mogu uključiti u tekst oglašivačke poruke, odnosno u oglašivanju se može staviti naglasak na te karakteristike.

Zaključak

Multivarijaciona statistička tehnika faktorske analize je prezentovana u opštim konceptualnim terminima. Uključene su osnovne smernice za interpretiranje rezultata, da bi se dalje razjasnili metodološki koncepti.

Faktorska analiza može biti vrlo korisna i moćna multivarijaciona statistička tehnika za efektivno ekstrahovanje informacija iz velikih baza podataka, i davanje smisla velikim telima međupovezanih podataka. Kada dobro funkcioniše, ona ukazuje na interesantne odnose koji možda

35

Page 36: Faktorska Analiza-seminarski Rad

Faktorska analiza

ne bi bili očigledni iz ispitivanja samo sirovih podataka ili čak korelacione matrice. Faktorska analiza ima sposobnost da identifikuje setove srodnih varijabli i čak razvije jednu kompozitnu meru da predstavlja čitav set srodnih varijabli. To nudi istraživaču moćan alat u ostvarenju boljeg razumevanja strukture podataka, i način da simplifikuje ostale analize velikog seta varijabli putem korišćenja zamenskih kompozitnih varijabli. Potencijalne primene faktorsko analitičkih tehnika na rešavanje problema i odlučivanje u poslovnom istraživanju, su brojne. Upotreba ovih tehnika će nastaviti da se proširuje, kako istraživači budu sve upoznatiji sa koristima od sumarizacije podataka i redukcije podataka.

Faktorska analiza je mnogo kompleksnija i obuhvatnija tema, nego što se može indicirati ovim kratkim izlaganjem. Tri najčešće navođena ograničenja su sledeća: prvo, postoje mnoge tehnike za vršenje faktorskih analiza, i postoji kontroverza oko toga koja tehnika je najbolja. Drugo, subjektivni aspekti faktorske analize (tj. odlučivanje koliko faktora ekstrahovati, koje tehnike treba koristiti za rotiranje faktorskih osa, koja faktorska opterećenja su značajna) podležu mnogim razlikama u mišljenjima. Treće, problem pouzdanosti je realan. Kao i svaka druga statistička procedura, faktorska analiza započinje sa setom nesavršenih podataka. Kada se podaci menjaju zbog promena u uzorku, procesu prikupljanja podataka, ili brojnih vrsta grešaka merenja, takođe se menjaju rezultati analize. Stoga su rezultati bilo koje analize, manje nego sasvim pouzdani. Ovaj problem je naročito kritičan jer rezultati analitičkog rešenja sa jednim faktorom, često deluju verodostojno. Važno je naglasiti da verodostojnost nije garancija validnosti niti čak stabilnosti.

LITERATURA

1. Hair, F., J., Anderson, E., R., Tatham, L., R., Black, C.,W., Multivariate Data Analysis, Prentice- Hall International, Inc, Fifth Edition

2. Kovačić, J., Z., Multivarijaciona analiza, Ekonomski fakultet, Beograd, 1994.

3. Živadinović, K., N., Utvrđivanje osnovnih karakteristika proizvoda primenom faktorske analize, Ekonomski pregled 55, Zagreb, 2004.

36

Page 37: Faktorska Analiza-seminarski Rad

Faktorska analiza

Ključni pojmovi

Anti-image korelaciona matrica - Matrica parcijalnih korelacija među varijablama nakon faktorske analize, koja predstavlja stepen u kom faktori „objašnjavaju“ jedan drugog u rezultatima. Dijagonala sadrži mere adekvatnosti uzorkovanja za svaku varijablu, a vandijagonalne vrednosti su parcijalne korelacije medju varijablama.Bartlett test sfericiteta (sferičnosti) - Statistički test za opšti značaj svih korelacija u okviru korelacione matrice.Klaster analiza - Multivarijaciona tehnika sa ciljem grupisanja respondenata ili slučajeva sa sličnim profilima u definisanom setu karakteristika. Slična Q faktorskoj analizi.Faktorska analiza u užem smislu (Analiza zajedničkog faktora) - Faktorski model u kome se faktori baziraju na redukovanoj korelacionoj matrici. tj. komunaliteti se ubacuju na dijagonalu korelacione matrice, a ekstrahovani faktori se baziraju samo na zajedničkoj varijansi, gde su isključene specifična i varijansa greške.Zajednička varijansa - Varijansa koja se deli sa ostalim varijablama u faktorskoj analizi.Komunalitet - Ukupan obim varijanse koji originalna varijabla deli sa svim ostalim varijablama koje su uključene u analizu.Komponentna analiza - Faktorski model u kome se faktori baziraju na ukupnoj varijansi. Kod komponentne analize, jedinice se koriste na dijagonali korelacione matrice; ova procedura računski implicira da su sve varijanse zajedničke ili deljene.Konceptualna definicija - Specifikacija teoretske osnove za koncept koji je predstavljen faktorom.Sadržajna validnost (valjanost) - Procena stepena korespondentnosti između ajtema (stavki), odabranih da konstituišu sumiranu skalu i njihove konceptualne definicije.

37

Page 38: Faktorska Analiza-seminarski Rad

Faktorska analiza

Korelaciona matrica. - Tabela koja pokazuje interkorelacije među svim varijablama.Cronbach alfa (Kronbah alfa) - Mera pouzdanosti koja se kreće od 0 do 1, gde se vrednosti 0,60 do 0,70 smatraju donjom granicom prihvatljivosti. Dummy (veštačka) varijabla - Binarna metrička varijabla koja se koristi za predstavljanje pojedinačne kategorije neke nemetričke varijable.Karakteristična vrednost - Suma kolone kvadriranih opterećenja za faktor; takođe se naziva latentni koren. Predstavlja obim varijanse objašnjen faktorom.Varijansa greške - Varijansa varijable usled grešaka u prikupljanju podataka ili merenju.Faktor - Linearna kombinacija (varijanta) originalnih varijabli. Faktori takođe predstavljaju osnovne dimenzije (konstrukte) koje sumiraju ili objašnjavaju originalni set (skup) opserviranih varijabli.Faktorska indeterminacija - Karakteristika faktorske analize u užem smislu, takva da se nekoliko različitih faktorskih skorova može izračunati za jednog respondenta, a da se svaki uklapa u procenjeni faktorski model. To znači da faktorski skorovi nisu jedinstveni za svakog pojedinca.Faktorska opterećenja - Korelacija između originalnih varijabli i faktora, i ključ za razumevanje prirode određenog faktora. Kvadrirana faktorska opterećenja indiciraju koji procenat varijanse u originalnoj varijabli, se objašnjava faktorom.Faktorska matrica - Tabela koja prikazuje faktorska opterećenja svih varijabli na svaki faktor.Matrica faktorskog sklopa - Jedna od dve faktorske matrice, koja se pronalazi u kosoj rotaciji koja je najuporedivija sa faktorskom matricom u ortogonalnoj rotaciji.Faktorska rotacija - Proces manipulacije ili usklađenja faktorskih osa, da bi se ostvarilo jednostavnije i pragmatično značajnije faktorsko rešenje.Faktorski skor - Kompozitna mera kreirana za svaku opservaciju o svakom faktoru ekstrahovanom u faktorskoj analizi. Faktorski ponderi se koriste u konjunkciji sa vrednostima originalne varijable, da bi se izračunao skor svake opservacije. Onda se faktorski skor može upotrebiti da predstavlja faktor(e) u narednim analizama. Faktorski skorovi su standardizovani da imaju sredinu 0, i standardnu devijaciju 1.Matrica faktorske strukture - Faktorska matrica, koja se pronalazi u kosoj rotaciji, koja predstavlja proste korelacije između varijabli i faktora, inkorporirajući jedinstvenu varijansu i korelacije između faktora. Većina istraživača preferira korišćenje matrice faktorskog sklopa, kada interpretira koso rešenje.Indikator - Pojedinačna varijabla koja se koristi u konjunkciji sa jednom ili više drugih varijabli, da bi se formirala kompozitna mera. Latentni koren - Videti karakterističnu vrednost.Mera adekvatnosti uzorkovanja (MSA) - Mera izračunata i za čitavu korelacionu matricu i za svaku individualnu varijablu, koja evaluira podesnost primene faktorske analize. Vrednosti iznad 0,50 ili za čitavu matricu ili individualnu varijablu, indiciraju podesnost.Greška merenja - Netačnosti u merenju „istinskih“ vrednosti varijable usled pogrešivosti instrumenta merenja, grešaka pri unosu podataka, ili grešaka respondenta.Multikolinearnost - Obim u kom varijablu mogu objasniti druge varijable u analizi.Kosa faktorska rotacija - Faktorska rotacija izračunata tako da su ekstrahovani faktori korelirani. Umesto da arbitrarno ograničava faktorsku rotaciju na ortogonalno rešenje, kosa rotacija identifikuje obim u kom je svaki od faktora koreliran.Ortogonalno - Matematička nezavisnost (nema korelacije) faktorskih osa, jedna u odnosu na drugu. (tj.pod pravim uglovima, ili 90 stepeni).Ortogonalna faktorska rotacija - Faktorska rotacija u kojoj se faktori ekstrahuju tako da se njihove ose održavaju na 90 stepeni. Svaki faktor je nezavisan od, ili ortogonalan prema, svim ostalim faktorima. Korelacija između faktora se determiniše da bude nula..Q faktorska analiza - Formira grupe respondenata ili slučajeva na bazi njihovih sličnosti u setu karakteristika

38

Page 39: Faktorska Analiza-seminarski Rad

Faktorska analiza

R faktorska analiza - Analizira odnose medju varijablama da bi identifikovala grupe varijabli koje formiraju latentne dimenzije (faktore).Pouzdanost - Obim u kom je varijabla ili set varijabli, konzistentan u onome što namerava da meri. Ako se vrše višestruka merenja, pouzdane mere će sve biti vrlo konzistentne u svojim vrednostima. Pouzdanost se razlikuje od validnosti po tome što se ne odnosi na ono što treba meriti, već na to kako se meri.Obrnuti skoring - Proces promene pravca skorova varijable, dok zadržavaju distribucione karakteristike, da bi se promenili odnosi (korelacije) između dve varijable. Upotrebljen u konstrukciji sumirane skale, da bi se izbeglo „poništavanje“ izmedju varijabli sa pozitivnim i negativnim faktorskim opterećenjem na istom faktoru.Specifična varijansa - Varijansa svake varijable, koja je jedinstvena za tu varijablu, i koja nije objašnjena ili povezana sa drugim varijablama u faktorskoj analizi.Sumirane skale - Metod kombinovanja nekoliko varijabli koje mere isti koncept, u jednu varijablu, u pokušaju da se poveća pouzdanost merenja. U većini slučajeva, odvojene varijable se sumiraju i onda se njihov ukupni ili prosečni skor, koristi u analizi.Surogat varijabla - Selekcija jedne varijable sa najvišim faktorskim opterećenjem da predstavlja faktor u fazi redukcije podataka, umesto korišćenja sumirane skale ili faktorskog skora.Trag - Predstavlja ukupan obim varijanse na kom se bazira faktorsko rešenje. Trag je jednak broju varijabli, na bazi pretpostavke da je varijansa u svakoj varijabli jednaka 1. Validnost (valjanost) - Obim u kom mera ili set mera, ispravno predstavljaju koncept studije – stepen u kom je ona oslobođena od svake sistematske ili nesistematske greške. Validnost se bavi time koliko dobro je koncept definisan merom (merama), dok se pouzdanost odnosi na konzistentnost mere (mera).VARIMAX - Jedan od najpopularnijih metoda ortogonalne faktorske rotacije.

39