backhaus kapitel faktorenanalyse

38
5 Faktorenanalyse 5.1 Problemstellung................................................................................. 260 5.2 Vorgehensweise ................................................................................ 269 5.2.1 Variablenauswahl und Errechnung der Korrelationsmatrix .............. 269 5.2.1.1 Korrelationsanalyse zur Aufdeckung der Variablen- zusammenhänge ............................................................................... 269 5.2.1.2 Eignung der Korrelationsmatrix ........................................................ 272 5.2.2 Extraktion der Faktoren ..................................................................... 277 5.2.2.1 Das Fundamentaltheorem .................................................................. 278 5.2.2.2 Graphische Interpretation von Faktoren ............................................ 279 5.2.2.3 Das Problem der Faktorextraktion .................................................... 284 5.2.3 Bestimmung der Kommunalitäten ..................................................... 289 5.2.4 Zahl der zu extrahierenden Faktoren ................................................. 295 5.2.5 Faktorinterpretation ........................................................................... 298 5.2.6 Bestimmung der Faktorwerte ............................................................ 302 5.2.7 Zusammenfassende Darstellung der Faktorenanalyse ....................... 305 5.3 Fallbeispiel ........................................................................................ 308 5.3.1 Problemstellung ................................................................................. 308 5.3.2 Ergebnisse ......................................................................................... 3 10. 5.3.3 SPSS-Kommandos ............................................................................ 324 5.4 Anwendungsempfehlungen ............................................................... 325 5.4.1 Probleme bei der Anwendung der Faktorenanalyse .......................... 325 5.4.1.1 Unvollständig beantwortete Fragebögen: Das Missing Value-Problem ............................................................. 325 5.4.1.2 Starke Streuung der Antworten: Das Problem der Durchschnittsbildung ........................................................................ 326 5.4.1.3 Entdeckungs- oder Begt'Ündungszusammenhang: Exploratorische .. versus konfirmatorische Faktorenanalyse ......................................... 330 5.4.2 Empfehlungen zur Durchfilhrung einer Faktorenanalyse ................. 330 5.5 Literaturhinweise............................................................................... 332

Upload: crnklr

Post on 20-Jun-2015

1.803 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Backhaus Kapitel Faktorenanalyse

5 Faktorenanalyse

51 Problemstellung 260

52 Vorgehensweise 269 521 Variablenauswahl und Errechnung der Korrelationsmatrix 269 5211 Korrelationsanalyse zur Aufdeckung der Variablenshy

zusammenhaumlnge 269 5212 Eignung der Korrelationsmatrix 272 522 Extraktion der Faktoren 277 5221 Das Fundamentaltheorem 278 5222 Graphische Interpretation von Faktoren 279 5223 Das Problem der Faktorextraktion 284 523 Bestimmung der Kommunalitaumlten 289 524 Zahl der zu extrahierenden Faktoren 295 525 F aktorinterpretation 298 526 Bestimmung der Faktorwerte 302 527 Zusammenfassende Darstellung der Faktorenanalyse 305

53 Fallbeispiel 308 531 Problemstellung 308 532 Ergebnisse 3 10 533 SPSS-Kommandos 324

54 Anwendungsempfehlungen 325 541 Probleme bei der Anwendung der Faktorenanalyse 325 5411 Unvollstaumlndig beantwortete Frageboumlgen

Das Missing Value-Problem 325 5412 Starke Streuung der Antworten Das Problem der

Durchschnittsbildung 326 5413 Entdeckungs- oder BegtUumlndungszusammenhang Exploratorische

versus konfirmatorische Faktorenanalyse 330 542 Empfehlungen zur Durchfilhrung einer Faktorenanalyse 330

55 Literaturhinweise 332

ov nlIUOrtII11IlllIYSt Problemstellung 261

51 Problemstellung Abbildung 51 Anwendungsbeispiele der Faktorenanalyse

Fuumlr viele wissenschaftliche und praktische Fragestellungen geht es darum den Wirkungszusammenhang zwischen zwei oder mehreren Variablen zu untersuchen Methodisches Hilfsmittel dafilr sind in der Regel die Regressions- und Korrelatishyonsanalyse Reicht eine relativ geringe Zahl von unabhaumlngigen Variablen zur Ershyklaumlrung einer abhaumlngigen Variablen aus und lassen sich die unabhaumlngigen Variabshylen relativ leicht ermitteln so wirft diese Vorgehensweise kaum schwerwiegende Probleme auf

In manchen - insbesondere naturwissenschaftlichen - Bereichen kommt man in der Tat haumlufig mit einer relativ kleinen Zahl von Variablen aus um zB bestimmte physikalische Effekte erklaumlren bzw prognostizieren zu koumlnnen

In den Sozialwissenschaften ist die Situation jedoch anders 1 d R ist zur Erklaumlshyrung menschlicher Verhaltensweisen oder allgemeiner sozialer Phaumlnomene eine Vielzahl von Einfluszligfaktoren (Variablen) zu beruumlcksichtigen Je groumlszliger jedoch die Zahl der notwendigen Erklaumlrungsvariablen wird um so weniger ist gesichert daszlig diese auch tatsaumlchlich alle unabhaumlngig voneinander zur Erklaumlrung des Sachshyverhaltes notwendig sind Bedingen sich die Erklaumlrungsvariablen gegenseitig dann fuumlhrt die Einbeziehung aller Variablen zu unbefriedigenden Erklaumlrungswerten

Eines der Hauptprobleme sozialwissenschaftlicher Erklaumlrungsansaumltze liegt daher darin aus der Vielzahl moumlglicher Variablen die voneinander unabhaumlngigen Einfluszligfaktoren herauszukristallisieren die dann weiteren Analysen zugrunde geshylegt werden koumlnnen Genau das macht sich die Faktorenanalyse zur Aufgabe Im Gegensatz beispielsweise zur Regressionsanalyse versucht die Faktorenanalyse also einen Beitrag zur Entdeckung von untereinander unabhaumlngigen Beshyschreibungs- und Erklaumlrungsvariablen zu finden

Gelingt es tatsaumlchlich die Vielzahl moumlglicher Variablen auf wenige wichtige Einfluszligfaktoren zuruumlckzufuumlhren (zu reduzieren) lassen sich fuumlr empirische Unshytersuchungen erhebliche Vorteile realisieren So kann zB eine Vielzahl moumlglicher Einfluszligfaktoren getestet werden und es muszlig erst im nachhinein entschieden wershyden welche Variablen oder Variablenbuumlndel tatsaumlchlich erklaumlrungsrelevant sind Daruumlber hinaus ermoumlglicht dieses Verfahren durch die Datenreduktion eine Ershyleichterung empirischer Forschungsarbeit

In Abbildung 51 sind einige Anwendungsbeispiele der Faktorenanalyse zusamshymengestellt Sie vermitteln einen Einblick in die Problemstellung die Zahl und Art der Merkmale die aus den Merkmalen extrahierten Faktoren sowie die jeweiligen Untersuchungseinheiten

Problemstellung Merkmale Faktoren

StadtanalyseI

Bevoumllkerungszahl Bevoumllkerungs- und Beschaumlftigtenzahl Beschaumlftigtenfaktor Dienstleistungsangebot Ausbildungs- und Schulbildung Wirtschaftsfaktor Haumluserwert

Untersuchungen der Streckenplanung Bildliche kognitiven Gruppierung von Faumlhigkeit Faumlhigkeiten

2 Symbolen Erkennung von Aumlhnlichkeitenetc Wortschatz Verbale

~ Schluszligfolgerungs- Faumlhigkeit shy eigenschaften

Satzbau etc Kostenanalyse

3 18 Kostenarten Beeinfluszligbarkei t differenziert nach Deckungsdringlichshyjeweils 5 Kosten- keit eigenschaften

Blutdruckmessung4 1 SB DM Systolischer 2 bis 12 SBDM Blutdruck I OBDM Diastolischer 2 bis 12 DBDM Blutdruck

(SBDM = Systolische Blutdruckmessung DBOM =Diastolische Blutdruckmessung)

Veranschaulichen wir uns die Problemstellung noch einmal anhand eines konkreshyten Beispiels In einer Befragung seien Hausfrauen nach ihrer Einschaumltzung von Emulsionsfetten (Butter Margarine) befragt worden Dabei seien die Marken Rashyma Sanella Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter anband der Variablen Anteil ungesaumlttigter Fettsaumluren Kaloriengehalt Vitamingeshyhalt Haltbarkeit und Preis auf einer siebenstufigen Skala von hoch bis niedrig beshyurteilt worden

I VgL Harman H H 1976 S 13 ff

2 VgL Carroll J 8 1993

3 Vgl Plinke W 1985 S 118 ff 4

Vgl Uberla K 1977 S 264 ff

262 Faktorenanalyse

Die nachfolgende Abbildung 52 zeigt einen Ausschnitt aus dem entsprechenden Fragebogen

Abbildung 52 Fragebogenausschnitt

Beurteilen Sie bitte die Margarinemarke Rama an hand folgender Eigenschaften

niedrig hoch

Anteil ung Fettsaumluren

Kaloriengehalt

Vitamingehalt

Haltbarkeit

Preis 1 2

I 3

I 4

I 5

I 6

I 7

Die Beantwortung des obigen Fragebogenausschnitts durch die 30 befragten Proshybanden liefert subjektive Eigenschaftsurteile der fuumlnf Variablenftlr die Margashyrinemarke Rama so da~ eine (30 x 5)-Matrix entsteht Diese Matrix kann der weishyteren Analyse zugrunde gelegt werden Wir haben dann 5 Eigenschaften und 30 Faumllle wobei wir ft1r unsere Analyse unterstellen daszlig die Befragtenurteile unshyabhaumlngig voneinander sind

Will man jedoch die sechs Marken gleichzeitig analysieren so werden haumlufig ftlr jede Eigenschaft pro Marke Durchschnittswerte uumlber alle 30 Befragten gebildet Wir erhalten dann eine (6 x 5)-Matrix wobei die Marken als Faumllle interpretiert werden Bei einer ~olchen Durchschnittsbildung muszlig man sich allerdings bewuszligt sein daszlig man bestimmte Informationen (naumlmlich die uumlber die Streuung der Ausshypraumlgung zwischen den Personen) verliert

Je groumlszliger die Streuung der Stichprobenwerte ist um so problematischer ist der Aussagewert bei einer solchen Vorgehensweise Da in praktischen Faumlllen haumlufig dennoch so vorgegangen wird beziehen sich auch die nachfolgenden Ausfuumlhshyrungen auf die der (6 x 5)-Matrix zugrundeliegenden Durchschnittswerte uumlber alle Personen Im abschlieszligenden Kapitel wird ein Loumlsungsvorschlag rur eine Alshyternative zur Durchschnittsbildung vorgestellt

Problemstellung 263

Wir jassen zusammen Unsere Befragung liefert uns folgende Daten

Abbildung 53 Ausgangsdaten im Beispiel

VARIABLEN (Anteil unges Fettsaumluren V bull bull V

0 bull VPerson 1

OBJEKT Pelllon 2 (8_1

bull bull bull Vusw) f------ -c-

Person 3 O

L V bull v I 0

LJ~ -~

Es sei unterstellt daszlig die ausgewaumlhlten Eigenschaften fiir die Beurteilung von Emulsionsfetten auch als relevant angesehen werden koumlnnen Fuumlr die folgenden Betrachtungen verdichten wir nun die Werte aus Abbildung 53 durch Bildung der arithmetischen Mittel rur jede ObjektlVariablen-Kombination uumlber alle 30 Befragshyten Als Durchschnittswert der 30 befragten Probanden moumlgen sich bei dieser Beshyfragung uumlber alle Hausfrauen folgende Werte ergeben haben (Abbildung 54)

Miszligt man den Informationsgehalt einer Datenstruktur an der in ihr enthaltenen Streuung (Varianz) der Befragungswerte so verliert man durch die Durchshyschnittsbildung einen Teil der urspruumlnglichen Informationen (Streuungen) und der Informationsgehalt der Mittelwertmatrix in Abbildung 54 enthaumllt jetzt nur noch die Streuung der durchschnittlichen Beurteilungen uumlber die verschiedenen EmushyISionsjette

Ein erster Blick auf die Ausgangsdatenmatrix macht bereits deutlich daszlig die Eishygenschaften (Variablen) XI bis x3 bei den Margarinemarken (Sanella Becel und Du darfst Ausnahme Rama) tendenziell houmlher bewertet wurden als bei den Buttershysorten (Hollaumlndische Butter und Weihnachtsbutter) waumlhrend die Eigenschaften x4 und Xs primaumlr bei den Buttersorten houmlher ausgepraumlgt sind Die Ausgangsdaten geshyben damit in diesem Beispiel bereits einen Hinweis darauf daszlig zwei Gruppen (xl x2 x3 und x4 xS) aumlhnlich beurteilter Variablen existieren die sich in der Beurteishylung untereinander aber unterscheiden Damit laumlszligt sich in diesem Beispiel bereits aus der Datenstruktur ein Beziehungszusammenhang vermuten Will man diese Vermutung genauer uumlberpruumlfen so ist es erforderlich auf ein statistisches Kriterishy

264 Faktorenanalyse

um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen

Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel

Eigenschaften

Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7

wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis

Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen

1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht

2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird

3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar

An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden

Problemstellung 26S

Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen

Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen

Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel

VARIABLEN FAKTOREN

x Anteil ungesaumltshy tigter Fettsaumluren I~---___-

x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT

~

x Vitamingehalt

I Hba ~___= F WIRTSCHAFTshy

LICHKEITI x bull Preis ~ _ _shy

Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren

266 Faktorenanalyse

Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant

Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden

Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind

Problemstellung 267

Abbildung 56 Faktorwerte-Matrix r-shy

Faktor 1 Faktor 2

Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914

Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)

Abbildung 57 Mapping der Faktorwerte

F 20 a k 15 t 0 r 10

05

00

-05

-10

-15

Du darfstbull f-

Becelbull Weihnachtsbutter

bull Sanellabull Holl Butterbull

Rama

bull I

-15 -10 -05 00 05 10 15

Faktor 2

268 Faktorenanalyse

Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy

zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die

wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen

bull Abbildung 58 Ablauf einer Faktorenanalyse

(1) Variablenauswahl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

(4) Zahl der Faktoren

(5) Faktorinterpretation

(6) Bestimmung der Faktorwerte

Vorgehensweise 269

52 Vorgehensweise

5 Variablenauswahl und Errechnung der Korrelationsmatrix

Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere

~ (2) Extraktion der Faktoren I

(3) Bestimmung der Kommunalitaumlten

u

(6) Bestimmung der Faktorwerte

ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull

der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird

Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern

5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge

Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen

Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen

Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen

~ IV taAtvJuAtJ(U)0

Korrelationskoeffizient

K 2(Xkl-XI)(XkZ -X2)

k = I (1)r = -===========XX2 I K K

2 (Xkl _X))2 2(XkZ -X2Y k = I k = I

mit

Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2

Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy

1 2

zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy

saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy

halt ((1+6+5+6+3+46=417) dar

Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten

(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)

336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter

1083334 1883333 1016666 ----__----~--------__~-~~------_

(xx) I6 (xx) I6

(x-i)(xx) k=1 k=1

1016664r =VOuml8333011883333 =071176

Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix

vorgenenswelse L 1

Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel

UNGEFETI KALORlEN VITAMIN HALTBARK PREIS

-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000

VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------

PREIS 004385 006652 002362 098334 100000

In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch

- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden

- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen

Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)

Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z

Standardisierte Variable

Xk -x Zkj = J j

Sj

mit

Xkj BeobachtungSlVert der Variablenj bei Objekt k

Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte

s j Standardabweichung der Variablen j

Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k

Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel

R=_I_ZmiddotZ (2)K-I

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 2: Backhaus Kapitel Faktorenanalyse

ov nlIUOrtII11IlllIYSt Problemstellung 261

51 Problemstellung Abbildung 51 Anwendungsbeispiele der Faktorenanalyse

Fuumlr viele wissenschaftliche und praktische Fragestellungen geht es darum den Wirkungszusammenhang zwischen zwei oder mehreren Variablen zu untersuchen Methodisches Hilfsmittel dafilr sind in der Regel die Regressions- und Korrelatishyonsanalyse Reicht eine relativ geringe Zahl von unabhaumlngigen Variablen zur Ershyklaumlrung einer abhaumlngigen Variablen aus und lassen sich die unabhaumlngigen Variabshylen relativ leicht ermitteln so wirft diese Vorgehensweise kaum schwerwiegende Probleme auf

In manchen - insbesondere naturwissenschaftlichen - Bereichen kommt man in der Tat haumlufig mit einer relativ kleinen Zahl von Variablen aus um zB bestimmte physikalische Effekte erklaumlren bzw prognostizieren zu koumlnnen

In den Sozialwissenschaften ist die Situation jedoch anders 1 d R ist zur Erklaumlshyrung menschlicher Verhaltensweisen oder allgemeiner sozialer Phaumlnomene eine Vielzahl von Einfluszligfaktoren (Variablen) zu beruumlcksichtigen Je groumlszliger jedoch die Zahl der notwendigen Erklaumlrungsvariablen wird um so weniger ist gesichert daszlig diese auch tatsaumlchlich alle unabhaumlngig voneinander zur Erklaumlrung des Sachshyverhaltes notwendig sind Bedingen sich die Erklaumlrungsvariablen gegenseitig dann fuumlhrt die Einbeziehung aller Variablen zu unbefriedigenden Erklaumlrungswerten

Eines der Hauptprobleme sozialwissenschaftlicher Erklaumlrungsansaumltze liegt daher darin aus der Vielzahl moumlglicher Variablen die voneinander unabhaumlngigen Einfluszligfaktoren herauszukristallisieren die dann weiteren Analysen zugrunde geshylegt werden koumlnnen Genau das macht sich die Faktorenanalyse zur Aufgabe Im Gegensatz beispielsweise zur Regressionsanalyse versucht die Faktorenanalyse also einen Beitrag zur Entdeckung von untereinander unabhaumlngigen Beshyschreibungs- und Erklaumlrungsvariablen zu finden

Gelingt es tatsaumlchlich die Vielzahl moumlglicher Variablen auf wenige wichtige Einfluszligfaktoren zuruumlckzufuumlhren (zu reduzieren) lassen sich fuumlr empirische Unshytersuchungen erhebliche Vorteile realisieren So kann zB eine Vielzahl moumlglicher Einfluszligfaktoren getestet werden und es muszlig erst im nachhinein entschieden wershyden welche Variablen oder Variablenbuumlndel tatsaumlchlich erklaumlrungsrelevant sind Daruumlber hinaus ermoumlglicht dieses Verfahren durch die Datenreduktion eine Ershyleichterung empirischer Forschungsarbeit

In Abbildung 51 sind einige Anwendungsbeispiele der Faktorenanalyse zusamshymengestellt Sie vermitteln einen Einblick in die Problemstellung die Zahl und Art der Merkmale die aus den Merkmalen extrahierten Faktoren sowie die jeweiligen Untersuchungseinheiten

Problemstellung Merkmale Faktoren

StadtanalyseI

Bevoumllkerungszahl Bevoumllkerungs- und Beschaumlftigtenzahl Beschaumlftigtenfaktor Dienstleistungsangebot Ausbildungs- und Schulbildung Wirtschaftsfaktor Haumluserwert

Untersuchungen der Streckenplanung Bildliche kognitiven Gruppierung von Faumlhigkeit Faumlhigkeiten

2 Symbolen Erkennung von Aumlhnlichkeitenetc Wortschatz Verbale

~ Schluszligfolgerungs- Faumlhigkeit shy eigenschaften

Satzbau etc Kostenanalyse

3 18 Kostenarten Beeinfluszligbarkei t differenziert nach Deckungsdringlichshyjeweils 5 Kosten- keit eigenschaften

Blutdruckmessung4 1 SB DM Systolischer 2 bis 12 SBDM Blutdruck I OBDM Diastolischer 2 bis 12 DBDM Blutdruck

(SBDM = Systolische Blutdruckmessung DBOM =Diastolische Blutdruckmessung)

Veranschaulichen wir uns die Problemstellung noch einmal anhand eines konkreshyten Beispiels In einer Befragung seien Hausfrauen nach ihrer Einschaumltzung von Emulsionsfetten (Butter Margarine) befragt worden Dabei seien die Marken Rashyma Sanella Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter anband der Variablen Anteil ungesaumlttigter Fettsaumluren Kaloriengehalt Vitamingeshyhalt Haltbarkeit und Preis auf einer siebenstufigen Skala von hoch bis niedrig beshyurteilt worden

I VgL Harman H H 1976 S 13 ff

2 VgL Carroll J 8 1993

3 Vgl Plinke W 1985 S 118 ff 4

Vgl Uberla K 1977 S 264 ff

262 Faktorenanalyse

Die nachfolgende Abbildung 52 zeigt einen Ausschnitt aus dem entsprechenden Fragebogen

Abbildung 52 Fragebogenausschnitt

Beurteilen Sie bitte die Margarinemarke Rama an hand folgender Eigenschaften

niedrig hoch

Anteil ung Fettsaumluren

Kaloriengehalt

Vitamingehalt

Haltbarkeit

Preis 1 2

I 3

I 4

I 5

I 6

I 7

Die Beantwortung des obigen Fragebogenausschnitts durch die 30 befragten Proshybanden liefert subjektive Eigenschaftsurteile der fuumlnf Variablenftlr die Margashyrinemarke Rama so da~ eine (30 x 5)-Matrix entsteht Diese Matrix kann der weishyteren Analyse zugrunde gelegt werden Wir haben dann 5 Eigenschaften und 30 Faumllle wobei wir ft1r unsere Analyse unterstellen daszlig die Befragtenurteile unshyabhaumlngig voneinander sind

Will man jedoch die sechs Marken gleichzeitig analysieren so werden haumlufig ftlr jede Eigenschaft pro Marke Durchschnittswerte uumlber alle 30 Befragten gebildet Wir erhalten dann eine (6 x 5)-Matrix wobei die Marken als Faumllle interpretiert werden Bei einer ~olchen Durchschnittsbildung muszlig man sich allerdings bewuszligt sein daszlig man bestimmte Informationen (naumlmlich die uumlber die Streuung der Ausshypraumlgung zwischen den Personen) verliert

Je groumlszliger die Streuung der Stichprobenwerte ist um so problematischer ist der Aussagewert bei einer solchen Vorgehensweise Da in praktischen Faumlllen haumlufig dennoch so vorgegangen wird beziehen sich auch die nachfolgenden Ausfuumlhshyrungen auf die der (6 x 5)-Matrix zugrundeliegenden Durchschnittswerte uumlber alle Personen Im abschlieszligenden Kapitel wird ein Loumlsungsvorschlag rur eine Alshyternative zur Durchschnittsbildung vorgestellt

Problemstellung 263

Wir jassen zusammen Unsere Befragung liefert uns folgende Daten

Abbildung 53 Ausgangsdaten im Beispiel

VARIABLEN (Anteil unges Fettsaumluren V bull bull V

0 bull VPerson 1

OBJEKT Pelllon 2 (8_1

bull bull bull Vusw) f------ -c-

Person 3 O

L V bull v I 0

LJ~ -~

Es sei unterstellt daszlig die ausgewaumlhlten Eigenschaften fiir die Beurteilung von Emulsionsfetten auch als relevant angesehen werden koumlnnen Fuumlr die folgenden Betrachtungen verdichten wir nun die Werte aus Abbildung 53 durch Bildung der arithmetischen Mittel rur jede ObjektlVariablen-Kombination uumlber alle 30 Befragshyten Als Durchschnittswert der 30 befragten Probanden moumlgen sich bei dieser Beshyfragung uumlber alle Hausfrauen folgende Werte ergeben haben (Abbildung 54)

Miszligt man den Informationsgehalt einer Datenstruktur an der in ihr enthaltenen Streuung (Varianz) der Befragungswerte so verliert man durch die Durchshyschnittsbildung einen Teil der urspruumlnglichen Informationen (Streuungen) und der Informationsgehalt der Mittelwertmatrix in Abbildung 54 enthaumllt jetzt nur noch die Streuung der durchschnittlichen Beurteilungen uumlber die verschiedenen EmushyISionsjette

Ein erster Blick auf die Ausgangsdatenmatrix macht bereits deutlich daszlig die Eishygenschaften (Variablen) XI bis x3 bei den Margarinemarken (Sanella Becel und Du darfst Ausnahme Rama) tendenziell houmlher bewertet wurden als bei den Buttershysorten (Hollaumlndische Butter und Weihnachtsbutter) waumlhrend die Eigenschaften x4 und Xs primaumlr bei den Buttersorten houmlher ausgepraumlgt sind Die Ausgangsdaten geshyben damit in diesem Beispiel bereits einen Hinweis darauf daszlig zwei Gruppen (xl x2 x3 und x4 xS) aumlhnlich beurteilter Variablen existieren die sich in der Beurteishylung untereinander aber unterscheiden Damit laumlszligt sich in diesem Beispiel bereits aus der Datenstruktur ein Beziehungszusammenhang vermuten Will man diese Vermutung genauer uumlberpruumlfen so ist es erforderlich auf ein statistisches Kriterishy

264 Faktorenanalyse

um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen

Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel

Eigenschaften

Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7

wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis

Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen

1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht

2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird

3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar

An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden

Problemstellung 26S

Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen

Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen

Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel

VARIABLEN FAKTOREN

x Anteil ungesaumltshy tigter Fettsaumluren I~---___-

x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT

~

x Vitamingehalt

I Hba ~___= F WIRTSCHAFTshy

LICHKEITI x bull Preis ~ _ _shy

Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren

266 Faktorenanalyse

Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant

Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden

Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind

Problemstellung 267

Abbildung 56 Faktorwerte-Matrix r-shy

Faktor 1 Faktor 2

Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914

Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)

Abbildung 57 Mapping der Faktorwerte

F 20 a k 15 t 0 r 10

05

00

-05

-10

-15

Du darfstbull f-

Becelbull Weihnachtsbutter

bull Sanellabull Holl Butterbull

Rama

bull I

-15 -10 -05 00 05 10 15

Faktor 2

268 Faktorenanalyse

Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy

zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die

wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen

bull Abbildung 58 Ablauf einer Faktorenanalyse

(1) Variablenauswahl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

(4) Zahl der Faktoren

(5) Faktorinterpretation

(6) Bestimmung der Faktorwerte

Vorgehensweise 269

52 Vorgehensweise

5 Variablenauswahl und Errechnung der Korrelationsmatrix

Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere

~ (2) Extraktion der Faktoren I

(3) Bestimmung der Kommunalitaumlten

u

(6) Bestimmung der Faktorwerte

ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull

der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird

Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern

5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge

Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen

Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen

Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen

~ IV taAtvJuAtJ(U)0

Korrelationskoeffizient

K 2(Xkl-XI)(XkZ -X2)

k = I (1)r = -===========XX2 I K K

2 (Xkl _X))2 2(XkZ -X2Y k = I k = I

mit

Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2

Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy

1 2

zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy

saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy

halt ((1+6+5+6+3+46=417) dar

Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten

(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)

336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter

1083334 1883333 1016666 ----__----~--------__~-~~------_

(xx) I6 (xx) I6

(x-i)(xx) k=1 k=1

1016664r =VOuml8333011883333 =071176

Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix

vorgenenswelse L 1

Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel

UNGEFETI KALORlEN VITAMIN HALTBARK PREIS

-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000

VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------

PREIS 004385 006652 002362 098334 100000

In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch

- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden

- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen

Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)

Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z

Standardisierte Variable

Xk -x Zkj = J j

Sj

mit

Xkj BeobachtungSlVert der Variablenj bei Objekt k

Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte

s j Standardabweichung der Variablen j

Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k

Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel

R=_I_ZmiddotZ (2)K-I

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 3: Backhaus Kapitel Faktorenanalyse

262 Faktorenanalyse

Die nachfolgende Abbildung 52 zeigt einen Ausschnitt aus dem entsprechenden Fragebogen

Abbildung 52 Fragebogenausschnitt

Beurteilen Sie bitte die Margarinemarke Rama an hand folgender Eigenschaften

niedrig hoch

Anteil ung Fettsaumluren

Kaloriengehalt

Vitamingehalt

Haltbarkeit

Preis 1 2

I 3

I 4

I 5

I 6

I 7

Die Beantwortung des obigen Fragebogenausschnitts durch die 30 befragten Proshybanden liefert subjektive Eigenschaftsurteile der fuumlnf Variablenftlr die Margashyrinemarke Rama so da~ eine (30 x 5)-Matrix entsteht Diese Matrix kann der weishyteren Analyse zugrunde gelegt werden Wir haben dann 5 Eigenschaften und 30 Faumllle wobei wir ft1r unsere Analyse unterstellen daszlig die Befragtenurteile unshyabhaumlngig voneinander sind

Will man jedoch die sechs Marken gleichzeitig analysieren so werden haumlufig ftlr jede Eigenschaft pro Marke Durchschnittswerte uumlber alle 30 Befragten gebildet Wir erhalten dann eine (6 x 5)-Matrix wobei die Marken als Faumllle interpretiert werden Bei einer ~olchen Durchschnittsbildung muszlig man sich allerdings bewuszligt sein daszlig man bestimmte Informationen (naumlmlich die uumlber die Streuung der Ausshypraumlgung zwischen den Personen) verliert

Je groumlszliger die Streuung der Stichprobenwerte ist um so problematischer ist der Aussagewert bei einer solchen Vorgehensweise Da in praktischen Faumlllen haumlufig dennoch so vorgegangen wird beziehen sich auch die nachfolgenden Ausfuumlhshyrungen auf die der (6 x 5)-Matrix zugrundeliegenden Durchschnittswerte uumlber alle Personen Im abschlieszligenden Kapitel wird ein Loumlsungsvorschlag rur eine Alshyternative zur Durchschnittsbildung vorgestellt

Problemstellung 263

Wir jassen zusammen Unsere Befragung liefert uns folgende Daten

Abbildung 53 Ausgangsdaten im Beispiel

VARIABLEN (Anteil unges Fettsaumluren V bull bull V

0 bull VPerson 1

OBJEKT Pelllon 2 (8_1

bull bull bull Vusw) f------ -c-

Person 3 O

L V bull v I 0

LJ~ -~

Es sei unterstellt daszlig die ausgewaumlhlten Eigenschaften fiir die Beurteilung von Emulsionsfetten auch als relevant angesehen werden koumlnnen Fuumlr die folgenden Betrachtungen verdichten wir nun die Werte aus Abbildung 53 durch Bildung der arithmetischen Mittel rur jede ObjektlVariablen-Kombination uumlber alle 30 Befragshyten Als Durchschnittswert der 30 befragten Probanden moumlgen sich bei dieser Beshyfragung uumlber alle Hausfrauen folgende Werte ergeben haben (Abbildung 54)

Miszligt man den Informationsgehalt einer Datenstruktur an der in ihr enthaltenen Streuung (Varianz) der Befragungswerte so verliert man durch die Durchshyschnittsbildung einen Teil der urspruumlnglichen Informationen (Streuungen) und der Informationsgehalt der Mittelwertmatrix in Abbildung 54 enthaumllt jetzt nur noch die Streuung der durchschnittlichen Beurteilungen uumlber die verschiedenen EmushyISionsjette

Ein erster Blick auf die Ausgangsdatenmatrix macht bereits deutlich daszlig die Eishygenschaften (Variablen) XI bis x3 bei den Margarinemarken (Sanella Becel und Du darfst Ausnahme Rama) tendenziell houmlher bewertet wurden als bei den Buttershysorten (Hollaumlndische Butter und Weihnachtsbutter) waumlhrend die Eigenschaften x4 und Xs primaumlr bei den Buttersorten houmlher ausgepraumlgt sind Die Ausgangsdaten geshyben damit in diesem Beispiel bereits einen Hinweis darauf daszlig zwei Gruppen (xl x2 x3 und x4 xS) aumlhnlich beurteilter Variablen existieren die sich in der Beurteishylung untereinander aber unterscheiden Damit laumlszligt sich in diesem Beispiel bereits aus der Datenstruktur ein Beziehungszusammenhang vermuten Will man diese Vermutung genauer uumlberpruumlfen so ist es erforderlich auf ein statistisches Kriterishy

264 Faktorenanalyse

um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen

Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel

Eigenschaften

Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7

wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis

Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen

1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht

2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird

3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar

An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden

Problemstellung 26S

Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen

Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen

Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel

VARIABLEN FAKTOREN

x Anteil ungesaumltshy tigter Fettsaumluren I~---___-

x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT

~

x Vitamingehalt

I Hba ~___= F WIRTSCHAFTshy

LICHKEITI x bull Preis ~ _ _shy

Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren

266 Faktorenanalyse

Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant

Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden

Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind

Problemstellung 267

Abbildung 56 Faktorwerte-Matrix r-shy

Faktor 1 Faktor 2

Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914

Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)

Abbildung 57 Mapping der Faktorwerte

F 20 a k 15 t 0 r 10

05

00

-05

-10

-15

Du darfstbull f-

Becelbull Weihnachtsbutter

bull Sanellabull Holl Butterbull

Rama

bull I

-15 -10 -05 00 05 10 15

Faktor 2

268 Faktorenanalyse

Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy

zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die

wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen

bull Abbildung 58 Ablauf einer Faktorenanalyse

(1) Variablenauswahl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

(4) Zahl der Faktoren

(5) Faktorinterpretation

(6) Bestimmung der Faktorwerte

Vorgehensweise 269

52 Vorgehensweise

5 Variablenauswahl und Errechnung der Korrelationsmatrix

Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere

~ (2) Extraktion der Faktoren I

(3) Bestimmung der Kommunalitaumlten

u

(6) Bestimmung der Faktorwerte

ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull

der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird

Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern

5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge

Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen

Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen

Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen

~ IV taAtvJuAtJ(U)0

Korrelationskoeffizient

K 2(Xkl-XI)(XkZ -X2)

k = I (1)r = -===========XX2 I K K

2 (Xkl _X))2 2(XkZ -X2Y k = I k = I

mit

Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2

Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy

1 2

zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy

saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy

halt ((1+6+5+6+3+46=417) dar

Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten

(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)

336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter

1083334 1883333 1016666 ----__----~--------__~-~~------_

(xx) I6 (xx) I6

(x-i)(xx) k=1 k=1

1016664r =VOuml8333011883333 =071176

Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix

vorgenenswelse L 1

Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel

UNGEFETI KALORlEN VITAMIN HALTBARK PREIS

-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000

VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------

PREIS 004385 006652 002362 098334 100000

In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch

- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden

- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen

Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)

Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z

Standardisierte Variable

Xk -x Zkj = J j

Sj

mit

Xkj BeobachtungSlVert der Variablenj bei Objekt k

Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte

s j Standardabweichung der Variablen j

Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k

Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel

R=_I_ZmiddotZ (2)K-I

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 4: Backhaus Kapitel Faktorenanalyse

264 Faktorenanalyse

um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen

Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel

Eigenschaften

Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7

wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis

Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen

1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht

2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird

3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar

An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden

Problemstellung 26S

Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen

Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen

Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel

VARIABLEN FAKTOREN

x Anteil ungesaumltshy tigter Fettsaumluren I~---___-

x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT

~

x Vitamingehalt

I Hba ~___= F WIRTSCHAFTshy

LICHKEITI x bull Preis ~ _ _shy

Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren

266 Faktorenanalyse

Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant

Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden

Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind

Problemstellung 267

Abbildung 56 Faktorwerte-Matrix r-shy

Faktor 1 Faktor 2

Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914

Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)

Abbildung 57 Mapping der Faktorwerte

F 20 a k 15 t 0 r 10

05

00

-05

-10

-15

Du darfstbull f-

Becelbull Weihnachtsbutter

bull Sanellabull Holl Butterbull

Rama

bull I

-15 -10 -05 00 05 10 15

Faktor 2

268 Faktorenanalyse

Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy

zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die

wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen

bull Abbildung 58 Ablauf einer Faktorenanalyse

(1) Variablenauswahl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

(4) Zahl der Faktoren

(5) Faktorinterpretation

(6) Bestimmung der Faktorwerte

Vorgehensweise 269

52 Vorgehensweise

5 Variablenauswahl und Errechnung der Korrelationsmatrix

Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere

~ (2) Extraktion der Faktoren I

(3) Bestimmung der Kommunalitaumlten

u

(6) Bestimmung der Faktorwerte

ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull

der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird

Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern

5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge

Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen

Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen

Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen

~ IV taAtvJuAtJ(U)0

Korrelationskoeffizient

K 2(Xkl-XI)(XkZ -X2)

k = I (1)r = -===========XX2 I K K

2 (Xkl _X))2 2(XkZ -X2Y k = I k = I

mit

Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2

Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy

1 2

zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy

saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy

halt ((1+6+5+6+3+46=417) dar

Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten

(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)

336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter

1083334 1883333 1016666 ----__----~--------__~-~~------_

(xx) I6 (xx) I6

(x-i)(xx) k=1 k=1

1016664r =VOuml8333011883333 =071176

Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix

vorgenenswelse L 1

Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel

UNGEFETI KALORlEN VITAMIN HALTBARK PREIS

-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000

VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------

PREIS 004385 006652 002362 098334 100000

In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch

- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden

- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen

Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)

Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z

Standardisierte Variable

Xk -x Zkj = J j

Sj

mit

Xkj BeobachtungSlVert der Variablenj bei Objekt k

Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte

s j Standardabweichung der Variablen j

Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k

Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel

R=_I_ZmiddotZ (2)K-I

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 5: Backhaus Kapitel Faktorenanalyse

266 Faktorenanalyse

Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant

Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden

Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind

Problemstellung 267

Abbildung 56 Faktorwerte-Matrix r-shy

Faktor 1 Faktor 2

Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914

Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)

Abbildung 57 Mapping der Faktorwerte

F 20 a k 15 t 0 r 10

05

00

-05

-10

-15

Du darfstbull f-

Becelbull Weihnachtsbutter

bull Sanellabull Holl Butterbull

Rama

bull I

-15 -10 -05 00 05 10 15

Faktor 2

268 Faktorenanalyse

Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy

zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die

wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen

bull Abbildung 58 Ablauf einer Faktorenanalyse

(1) Variablenauswahl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

(4) Zahl der Faktoren

(5) Faktorinterpretation

(6) Bestimmung der Faktorwerte

Vorgehensweise 269

52 Vorgehensweise

5 Variablenauswahl und Errechnung der Korrelationsmatrix

Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere

~ (2) Extraktion der Faktoren I

(3) Bestimmung der Kommunalitaumlten

u

(6) Bestimmung der Faktorwerte

ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull

der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird

Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern

5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge

Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen

Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen

Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen

~ IV taAtvJuAtJ(U)0

Korrelationskoeffizient

K 2(Xkl-XI)(XkZ -X2)

k = I (1)r = -===========XX2 I K K

2 (Xkl _X))2 2(XkZ -X2Y k = I k = I

mit

Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2

Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy

1 2

zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy

saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy

halt ((1+6+5+6+3+46=417) dar

Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten

(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)

336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter

1083334 1883333 1016666 ----__----~--------__~-~~------_

(xx) I6 (xx) I6

(x-i)(xx) k=1 k=1

1016664r =VOuml8333011883333 =071176

Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix

vorgenenswelse L 1

Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel

UNGEFETI KALORlEN VITAMIN HALTBARK PREIS

-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000

VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------

PREIS 004385 006652 002362 098334 100000

In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch

- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden

- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen

Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)

Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z

Standardisierte Variable

Xk -x Zkj = J j

Sj

mit

Xkj BeobachtungSlVert der Variablenj bei Objekt k

Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte

s j Standardabweichung der Variablen j

Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k

Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel

R=_I_ZmiddotZ (2)K-I

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 6: Backhaus Kapitel Faktorenanalyse

268 Faktorenanalyse

Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy

zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die

wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen

bull Abbildung 58 Ablauf einer Faktorenanalyse

(1) Variablenauswahl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

(4) Zahl der Faktoren

(5) Faktorinterpretation

(6) Bestimmung der Faktorwerte

Vorgehensweise 269

52 Vorgehensweise

5 Variablenauswahl und Errechnung der Korrelationsmatrix

Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere

~ (2) Extraktion der Faktoren I

(3) Bestimmung der Kommunalitaumlten

u

(6) Bestimmung der Faktorwerte

ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull

der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird

Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern

5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge

Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen

Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen

Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen

~ IV taAtvJuAtJ(U)0

Korrelationskoeffizient

K 2(Xkl-XI)(XkZ -X2)

k = I (1)r = -===========XX2 I K K

2 (Xkl _X))2 2(XkZ -X2Y k = I k = I

mit

Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2

Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy

1 2

zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy

saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy

halt ((1+6+5+6+3+46=417) dar

Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten

(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)

336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter

1083334 1883333 1016666 ----__----~--------__~-~~------_

(xx) I6 (xx) I6

(x-i)(xx) k=1 k=1

1016664r =VOuml8333011883333 =071176

Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix

vorgenenswelse L 1

Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel

UNGEFETI KALORlEN VITAMIN HALTBARK PREIS

-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000

VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------

PREIS 004385 006652 002362 098334 100000

In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch

- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden

- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen

Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)

Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z

Standardisierte Variable

Xk -x Zkj = J j

Sj

mit

Xkj BeobachtungSlVert der Variablenj bei Objekt k

Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte

s j Standardabweichung der Variablen j

Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k

Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel

R=_I_ZmiddotZ (2)K-I

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 7: Backhaus Kapitel Faktorenanalyse

~ IV taAtvJuAtJ(U)0

Korrelationskoeffizient

K 2(Xkl-XI)(XkZ -X2)

k = I (1)r = -===========XX2 I K K

2 (Xkl _X))2 2(XkZ -X2Y k = I k = I

mit

Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2

Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy

1 2

zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy

saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy

halt ((1+6+5+6+3+46=417) dar

Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten

(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)

336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter

1083334 1883333 1016666 ----__----~--------__~-~~------_

(xx) I6 (xx) I6

(x-i)(xx) k=1 k=1

1016664r =VOuml8333011883333 =071176

Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix

vorgenenswelse L 1

Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel

UNGEFETI KALORlEN VITAMIN HALTBARK PREIS

-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000

VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------

PREIS 004385 006652 002362 098334 100000

In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch

- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden

- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen

Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)

Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z

Standardisierte Variable

Xk -x Zkj = J j

Sj

mit

Xkj BeobachtungSlVert der Variablenj bei Objekt k

Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte

s j Standardabweichung der Variablen j

Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k

Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel

R=_I_ZmiddotZ (2)K-I

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 8: Backhaus Kapitel Faktorenanalyse

272 Faktorenanalyse Vorgehensweise 273

wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt

Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben

S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2

1 2 S S Imiddot 2 K -1 k XI X2

Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind

Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob

I die Variablen sich gegenseitig bedingen

oder

2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird

Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten

Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird

5Ul Eignung der Korrelationsmatrix

Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so

macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist

deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt

Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt

Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt

Signifikanzniveaus der Korrelationen

Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden

Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel

KOrrelatlonmatrix

UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021

Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy

f

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 9: Backhaus Kapitel Faktorenanalyse

274 Faktorenanalyse

tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet

Inverse der Korrelationsmatrix

Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen

Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1

Inverse KorrelationsmatrIx

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt

KALORIEN VITAMIN

HALTBARK

PREIS

1449910 -60678

-1319772 -558018 520353

-60678 217944 -82863

-218066 204555

-1319772 -82863

1400000 479257

-440959

-558018 -218066 479257

3817871 -3126624

520353 204555

-440959 -3726624 3738542

Bartlett-Test (test of spherlcity)

Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds

Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert

HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert

H1 Die Variablen in der Erhebungsgesamtheit sind korreliert

Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem

5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull

Vorgehensweise 275

Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345

davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind

Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte

Anti-Image-Kovarianz-Matrix

Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image

Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist

Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel

AnIlJmIU_atrIzen

UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675

Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25

Vgl Guttmann L 1953 S 277 ff

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 10: Backhaus Kapitel Faktorenanalyse

LIO r aKlOrenanalyse

oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist

Kaiser-Meyer-Olkin-Kriterium

Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy

8de Beurteilungen vor

MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)

Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1

Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an

7 Vgl Dziuban C DlShirkey E C 1974 S 359

8 Vgl Kaiser H FRice J 1974 S 111 ff

9 Vgl Cureton E EDAgostino R B 1983 S 389 f

10 Vgl Kaiser H F 1970 S 405

II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f

Vorgehensweise 277

Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel

Antllmlge-Matrlun

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350

KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701

8 Maszlig der StlchplObenelgnung

Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt

522 Extraktion der Faktoren

(4) Zahl der Faktoren

(5) Faktorinterp~etat~ (6) Bestimmung der

Faktorwerte

Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 11: Backhaus Kapitel Faktorenanalyse

278 Faktorenanalyse

5221 Das FundamentaItheorem

Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus

Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben

Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren

(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ

bzw fuumlr standardisierte x-Werte

(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq

q~l

Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und

fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen

zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen

Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt

(3c)Z=pmiddotA

Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen

Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt

R=_I_ZZ (2) K-l

Vorgehensweise 279

Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet

ergibt

R=_I_PA)PA) (4)K I

Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation

r------- R=_I_APPA=A-I_pPA (5)

K-I ~

~

Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J

auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt

R = AmiddotCmiddotA (6)

Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu

R = AmiddotA (7)

Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben

Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt

5222 Graphische Interpretation von Faktoren

Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 12: Backhaus Kapitel Faktorenanalyse

280 Faktorenanalyse

als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt

Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy

weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)

In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke

AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels

gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)

Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen

c

A 0 B

)V

Standardisierte LOnge von 1

Vorgehensweise 281

Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)

Grad CO Grad cO

45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 13: Backhaus Kapitel Faktorenanalyse

282 Faktorenanalyse

Abbildung 517 Korrelationsmatrix

R =r68660 1 06428lO1736 ~

R laumlszligt sich auch anders schreiben (vgl Abbildung 518)

Abbildung 518 Korrelationsmatrix mit Winkelausdrucken

l0deg R = 30deg 0deg

80deg 50deg 0deg

Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy

pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen

und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)

Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels

Vektor X2

Vektorx3Vektor Xl

Vorgehensweise 283

Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy

nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an

Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt

Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660

Abbildung 520 FaktorlOsung bei 2 Variablen

j

A

Vektor x

~---------__------~---- C

Resultante

e Vektor X

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 14: Backhaus Kapitel Faktorenanalyse

284 Faktorenanalyse

5223 Das Problem der Faktorextraktion

Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2

Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden

Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix

x X x x x

x 70 100 09848 90middotX 03420 30x 00000 10middotx

X -01736

Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt

Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist

Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den

Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen

In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte

12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen

Vorgehensweise 285

Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors

Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels

~

XsXl

bull

Abbildung 523 Graphische Darstellung des Schwerpunktes

X2

XIX

Faktorshyvektor2

Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden

(Erste Reshysultante)

4512

-------o

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 15: Backhaus Kapitel Faktorenanalyse

- -

286 Faktorenanalyse

Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen

Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben

Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge

die Werte selbst uumlberpruumlfen)

Abbildung 524 Einfaktorielle Ladungsmatrix

Faktor

05707Xl 07046x2 bull 09668x3

08211x4

07096

Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)

Abbildung 525 ZweifaktorieHe Ladungsmatrix

Faktor 1 Faktor 2

Xl 05707 -08211

x2 07046 -07096

x3 09668 02554

x4 08211 05707

Xs 07096 07046

Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa

Vorgehensweise 287

In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum

I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1

~~ 00

2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation

Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist

Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt

Sf = 1 = Ijj (9)J

3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt

Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)

Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung

Resutlanie 2 (Faktor 2)

A Vektor x o

120lt= fH bull C Resultante 1 (Faktor 1)

B Vektor x

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 16: Backhaus Kapitel Faktorenanalyse

288 Faktorenanalyse

Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB

Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel

Wenn obige Behauptung stimmt muumlszligte gelten

(lOa)[~J +[~~J =1

Uumlberpruumlfung 2 2 uumlc2

OC 00 +002 (lOb)--+-shy 2

OA OA OA2 2

In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)

Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)

(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)

2 2 OC +00

4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten

sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)

wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-

q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1

(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix

(2) Extraktion der

(5) Faktorinterpretatiln

(6) Bestimmung der Faktorwerte

Vorgehensweise 289

523 Bestimmung der Kommunalitaumlten

In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem

Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy

fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig

mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da

J

i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins

Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung

erklaumlrte Variant

standardisierte Gesamtvariant = 1

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 17: Backhaus Kapitel Faktorenanalyse

290 Faktorenanalyse

Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung

2 a j1 =07

2 2 8 j2 = 01 siRest= 02

Kommunalitat H =08 (erllt1arte Varianz)

Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)

R AmiddotA+U (7a)

Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet

Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion

Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer

Vorgehensweise 291

100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY

In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy

weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen

Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen

1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen

2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit

2 2I ~ ~ R j ~ mx rjk

Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse

- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy

13 Vgl Loehlin J C 1998 S 154 14

Vgl Uberla K 1972 S 155 ff

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 18: Backhaus Kapitel Faktorenanalyse

292 Faktorenanalyse

nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird

- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit

Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy

15formationsverlust deklariert wird

Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen

Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy

15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt

Vorgehensweise 293

tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder

Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren

Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen

Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren

Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist

Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf

Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden

Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel

Kommunalltlten

Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325

Extraktionsmelhode Hauptachsen-Faktorenanalyse

bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 19: Backhaus Kapitel Faktorenanalyse

294 Faktorenanalyse

Abbildung 530 Faktorladungen im 6-Produkte-Beispiel

Faktoranmatrixmiddot

Faktor

1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608

Extraktionsmethode Hauptachsen-Faktorenanalyse

a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt

Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert

Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel

Reproduzierte Korrelationen

UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT

KALORIEN

VITAMIN

HALTBARK

PREIS

96845 71193 96034 11035 04241

71193 52552b

70480

12709

07717

96034 70480 95292b

08461 01722

11035

12709 08461 99056b

8325

04241 07717 01722 98325 98070b

Residuun1 UNGEFETi

KALORIEN

VITAMIN

HALTBARK

PREIS

-00017 00101

-00141 00144

-00017

-00083 01001

- 01005

00101 -00083

-00036 00640

-00141 01061

-00636

00010

00144 -01005 00640 00010

ExtrakHonsmethode Hauptllchsenfaktorenanalyse

a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005

b Reproduzierte Kommunalltaumlten

Vorgehensweise 295

Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen

Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R

524 Zahl der Faktoren

(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix

(2) Extraktion der Faktoren

(6) Bestimmung der Faktorwerte

Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff

Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-

q N

trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N

Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden

Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 20: Backhaus Kapitel Faktorenanalyse

296 Faktorenanalyse

Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre

Abbildung 532 Bestimmung der Eigenwerte

Faktorenmatrix

Faktor

1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)

Eigenwerte 25068 19112

Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil

Kom munalltaumlten

Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807

- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren

V orgehensweise 297

Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung

Abbildung 534 Scree-Test im 6-Produkte-Beispiel

Eigen- Screeplot wert 30

25

20

15

Kaiser-Kriterium

10 1 Elbow5

00 2 3 4 5

Faktomummer

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 21: Backhaus Kapitel Faktorenanalyse

298 Faktorenanalyse

525 Faktorinterpretation

Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)

Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen

- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt

(1) Variablenauswalll und Errechnung der Korrelationsmalrix

(2) Extraktion der Faktoran

(3) Bestimmung der Kommunalltaumllen

(6) Bestimmung derFaktorwerte _______---11

middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull

geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht

Abbildung 535 Faktorladungen im 6-Produkte-Beispiel

Preis Haltbarkeit

Extraktionsmethode Hauptachsen-Faktorenanalyse

Vorgehensweise 299

Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist

Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig

Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16

Abbildung 536 Unrotierte Faktorladungen

F

F

Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung

Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 22: Backhaus Kapitel Faktorenanalyse

300 Faktorenanalyse

536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy

tert

Abbildung 537 Rotierte Faktorladungen

F (Ausgangssituation)2

11 F2 (rotiert)

F1

-- shy

(Ausgangssituation)

11

F1 (rotiert)

SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen

1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen

(rechtwinkligen) Rotation

2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren

Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die

vorgenenswelse j U 1

Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind

Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel

Faktor

1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt

Haltbarkeit

72152 bull 07020

07962 I 99208 Preis 01060 99025

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung

Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen

A bull =A T mit TC~SI7 - sina ] sma cosa

Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links

A T A 094331 - 028039 098357 003229

[C0s341570 - sin34 157 ]070669 016156 072152 007020

sin34157deg cos34157092825 - 030210 097615 000694

038926 091599 007962 099208

032320 093608 001060 099025

Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 23: Backhaus Kapitel Faktorenanalyse

Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix

Faktor 1 2

1 94868 31622

2 -31622 94868

Il

Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung

Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig

von a=1843deg

526 Bestimmung der Faktorwerte

(1) Variablenauswanl und Errechnung der Korrelationsmatrix

(2) Extraktion der Faktoren

(3) Bestimmung der Kommunalitaumlten

Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte

Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt

(3c)Z=PmiddotA

Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY

(12)Z AT1p AAT

Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt

(13)ZArl=pE

Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten

(3c) wird von rechts mit A multipliziert

ZmiddotA=PmiddotAmiddotA (15)

Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar

ZAmiddot(A At1=P(A A) (A Atl (16)

Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt

P=ZA(AAt l (17)

In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren

In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term

AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte

Abbildung 540 Koeffizientenmatrix der Faktorwerte

Faktor 1 2

Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression

Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die

xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf

SjDa p E=P ist ergibt sich

Seite 271 zu (14)

P=ZAT

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 24: Backhaus Kapitel Faktorenanalyse

304 Faktorenanalyse

Abbildung 541 Standardisierte Ausgangsdatenmatrix Z

45ampt6R4LJL4

Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542

Abbildung 542 Faktorwerte im 6-Produkte-Beispiel

Vorgehensweise 305

Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel

Du darfst

VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG

E 11 BecelS

U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T

Sanella IIII Holl Butter

-1

bull Rama

-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18

WIRTSCHAFTLICHKEIT

Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen

527 Zusammenfassende Darstellung der Faktorenanalyse

Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 25: Backhaus Kapitel Faktorenanalyse

e Vorgehensweise 307 306 Faktorenanalyse

Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen

sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-

schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy

tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig

wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy

nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy

chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy

analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte

Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht

Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der

Verwendung des Verfahrens offenzulegen

I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _

CQ)l2CQgtQ ~ i

-Q)C t l5~11

0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C

CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O

~ ~ 11 t 3

uj~fi

t Imiddot~ J1 ~SHaa

It c~

c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~

-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi

o~ ~ -gEG)

I ~l c c ~l~ampi

2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E

U~a ]i E

J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy

~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--

----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 26: Backhaus Kapitel Faktorenanalyse

Fallbeispiel 309308 Faktorenanalyse

Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert

531 Problemstellung

In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften

Variable und Objekte des BeispielsAbbildung 545

EigenschaftenMarken M k (k=I Il) xj(j=I IO)

A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado

5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H

I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama

Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist

Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)

Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern

Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 27: Backhaus Kapitel Faktorenanalyse

---

310Faktorenanalyse

532 Ergebnisse

1 Variablenauswahl und Errechnung der Korrelationsmatrix

Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung

548 wiedergegeben

Abbildung 548 Die Korrelationskoeffizienten -_ -

-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy

In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der

Fallbeispiel 311

Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet

Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie

-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -

06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170

-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260

62444 -97126 66229 -83532 -62589

-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545

-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno

Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)

Abbildung 550 Dialogfeld Deskriptive Statistik

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 28: Backhaus Kapitel Faktorenanalyse

312 Faktorenanalyse

2 Bestimmung der Kommunalitilten

Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt

wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend

bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich

von den Startwerten abweichen

Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten

Hauptkomponentenanalyse Hauptachsenanalyse

Variable Korrunuriali- Kommunali- Korrununali- Kommunali-

Ut (Startwerte)

tlt (Endwerte)

tlIl (Startwerte )

tlIl (End werte)

STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR

100000 100000 100000 100000 100000 100000 100000 100000 100000 100000

88619

76855

89167 85324 76043 84012 80223 92668 63297 88786

97414

89018

79497

85847

96501

98810

97132

99166

78019

96445

85325

55717

85754

91075

55819

82330

73903

94796

40402

87851

Fallbeispiel 313

Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy

I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren

Abbildung 552 Dialogfeld Extraktion

Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist

3 Wabl der Extraktionsmetbode

Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen

4 Zabl der Faktoren

Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen

Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet

Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch

17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 29: Backhaus Kapitel Faktorenanalyse

1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden

Erklaumlrte Gesamtvarianz

Anfaumlngliche Eigenwerte

314 Faktorenanalyse

Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy

den sich fUnfFaktoren ergeben

Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien

95) der Varianz erklaumlrt sind

2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)

3 Extrahiere n (zB 3) Faktoren

4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy

renzahl

5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein

6 Extrahiere alle Faktoren die nach der

Vom Computer automatisch verwandt wenn keine andere Spezifikation

Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden

Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden

Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist

Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt

Fallbeispiel 315

Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil

Faktor 1

2 3

4

5

6

7

8

9

10

Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden

Abbildung 555 Scree-Test und Kaiser-Kriterium

Eigen- -=gtcreeplot wert

5

4

3

2

10

o Kaisershy

~ 3 i i 7 i Q

Faktornummer

Gesamt 505188

177106

142700

81935

42961

24709

15928

06190

02943

00340

der Varianz 5051883

1771061

1427002

819349 429611

247085

159275

61902

29434

03398

Kumulierte 5051883

6822944

8249946

9069295

9498905

9745991

9905266

9967168

9996602

10000000

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 30: Backhaus Kapitel Faktorenanalyse

316 Faktorenanalyse

Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS

Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen

Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)

Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden

Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz

Erklaumlrte Geaamtvarlanz

Summen von quadrierten Faktorladungen fOr

Faktor

Extraktion

der Gesamt Varianz Kumulierte

1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530

Extraktionsmethode Hauptachsen-Faktorenanalyse

Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert

Fallbeispiel 317 Abbildung 557 Faktorladungen

Fak10renmatrlx

- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469

Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse

Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet

Abbildung 558 Kommunalitaumlten

Kommunalllllten

I Slrafchfaumlnigkeit Preis

Extraktion 85325 55717

Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075

Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 31: Backhaus Kapitel Faktorenanalyse

318 Faktorenanalyse

Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert

Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)

Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy

ren veraumlndert

Abbildung 559 Dialogfeld Rotation

Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560

hIlbeispiel JIY

Abbildung 560 Varimax-rotierte Faktormatrix

Rotierte Faktorenmatrix a

Faktor

1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren

12951 07381 94262

Preis 06852 23296 70584

Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung

a Die Rotation ist in 7 Iterationen konvergiert

Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix

5 Faktorinterpretation

Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen

Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 32: Backhaus Kapitel Faktorenanalyse

Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis

+ + + +

+ +

+

+ +

+

320 Faktorenanalyse

Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen

Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann

Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch

Spielraumlume rur Miszligbrauch

6 Bestimmung der Faktorwerte

Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy

waumlhlen (vgl Abbildung 562)

Fallbeispiel 321

Abbildung 562 Dfalogfeld Werte

Abbildung 563 Die Faktorwerte in der Datenmatrix

Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 33: Backhaus Kapitel Faktorenanalyse

Fallbeispiel 323l 322 Faktorenanalyse

werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)

Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy

macht haben (Problem der missing values) gilt

(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden

Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden

waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy

stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy

duktpositionen fUr die elf Aufstrichfette (Abbildung 564)

Abbildung 564 Graphische Darstellung der Faktorwerte

FaktoIWerteplot GesundheitlNaturbelassenheit

WeihnachlSbutter

125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E

SenellaI T Flor

-125 H bullbull Rama

oma

175-175 -105 -035 035 105

21-14 -07 0 07 14-21

NATURBELASSENHEIT

bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken

Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen

Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes

- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist

- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt

- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist

Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben

Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden

Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 34: Backhaus Kapitel Faktorenanalyse

324 Faktorenanalyse

533 SPSS-Kommandos

Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy

ten

Abbildung 565 SPSS-Kommandos zur Faktorenanalyse

Faktorenan~lyse

DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien

Tierfett vitamin Natur 1-50(3) Marke 53-60(A)

BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB

4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA

END DATA

PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur

ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)

EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken

FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke

Literaturhinweise 325

54 Anwendungsempfehlungen

541 Probleme bei der Anwendung der Faktorenanalyse

5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem

bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)

Folgende Optionen stehen dem Anwender konkret zur Auswahl

1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert

Abbildung 566 Das Dialogfeld Optionen

i I

2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen

3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 35: Backhaus Kapitel Faktorenanalyse

__

J~U JCULVl UWUl)

Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt

5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung

In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)

18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt

Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)

Abbildung 567 Der Datenquader

Personen

Variable

Objekte

In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)

Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy

nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber

Abbildung 568 Die personenbezogene Objektmatrix

I VARIABLEN (Streichfaumlhigkeil usw)

Person 1

( 1) SANELLA Person ~

I Person 18

Person 1

Person 2 (2) HOMA

~1~ bullbull

IPerson 1

Person 2 (11) RAMA

Person 1~

Abbildung 569 Die Faktorladungen im Vergleich

Durchschnittsverfuhren Objektverfahren(N = 11)

(N = 127)

FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 36: Backhaus Kapitel Faktorenanalyse

328 Faktorenanalyse

Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich

Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar

Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren

u+ ~ amp0

16

12

08 F a 04 k t 0 0 -04

-06 2

-12

-16

-20

-24

I

aSB

I

Weihnachtsbutter a a

(1) I Du darfst

(3) a Hall Butter

aDeficado

-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1

(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I

Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren

16

12 I 06 r

F 04 r a k t 0 0 r 2

1

bull

bullbull

bull -12 (4)bull

bull -16

-16 -12 -06 -004

bull SB-Elnzelbewertung - Botteram-Einzelbewertung

bull DurChSChniltabewertung der Margannearten

bull Weihnachtsbutter

bull Holl Butter

(2) bull DeJicado

(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack

0 004 08 12 16 Faktor 1

(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis

(6) Backeignung

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 37: Backhaus Kapitel Faktorenanalyse

331

330 Faktorenanalyse

5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse

Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird

542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse

Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben

Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa

Anwendungsempfehlungen

verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18

Abbildung 572

2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung

5 Faktorextraktion

6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation

18 VgL Oberla K 1972

- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)

- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen

- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05

verwenden (Konvention)

und

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385

Page 38: Backhaus Kapitel Faktorenanalyse

332 Faktorenanalyse -

55 Literaturhinweise

Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies

CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy

torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale

New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor

Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in

psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen

Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg

C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy

orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl

Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological

Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper

Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl

New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release

5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische

Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing

Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua

6 Strukturgleichungsmodelle

61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von

Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350

62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des

modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der

Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379

63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und

Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385