Analyse van confounders en mediatoren
Cursus Bachelor Project 2 B&O
College 3
Harry B.G. Ganzeboom
1
AGENDA
• Nabespreking Practicum 2.
• Terug naar College 2: regressie met dummy-variabelen.
• Confounding en mediatie.
2
Nabespreking practicum 2
• Practicum 2 was grotendeels een herneming van Practicum 0 (met andere data).
• Het was dus nuttig om de syntax van practicum 0 ter beschikking te hebben en goed te begrijpen wat daarin gebeurd is (oefen voor jezelf).
• Zo gaat het in de vervolg practica weer…
• Uitwerking van practicum 1 is nu voor de helft (tot stap 3) ter beschikking. Woensdag gaan we verder met stap 4 en 5.
3
Regressie met dummy-variabelen
• Zie presentatie van College 2.
4
CONFOUNDING EN MEDIATIE 5
Factoranalyse / meetmodel
F
Y1 Y2
6
Multipele regressie
Y
X1
X2
7
Het elementaire causale model
X2
Y X1
8
Confounding
X
Y
9
Confounding door Z
X
Y Z
10
Mediatie
Y X
11
Mediatie door mediator M
M
Y X
12
Twee interpretaties
• Confounding: – Je wilt weten wat de “zuivere” causale invloed van X op Y is. – Daarvoor is het nodig alle mogelijke confounders Z constant te
houden. – En op die manier het ‘totaal effect’ van X op Y te berekenen (die
anders is dan correlatie!!).
• Mediatie: – Je wilt weten hoe het causale effect van X op Y verklaard kan worden – Daarvoor is het nodig om mediatoren (M) constant te houden. – En vervolgens indirecte effecten te berekenen.
• We laten confounding en mediatie zien aan de hand van drie variabelen (X Y Z; X Y M), maar zowel Z als M kunnen meerdere (veel!) variabelen zijn.
• Confounding en mediatie komen natuurlijk ook tegelijkertijd in een model voor.
13
Confounding en mediatie samen
Y X
M
Z
14
CONFOUNDINg
15
Confounding
X
Y
16
Confounding door Z
X
Y Z
17
Standaard voorbeelden van confounding
• Ooievaars geboortecijfer • Schoenmaat Intelligentie • Hoeveel brandweermannen schade bij de brand. • In al deze (verzonnen) gevallen is er een voor de hand
liggende confounder die het effect helemaal ‘wegverklaart’.
• We spreken in deze gevallen van “spurious correlation”, maar liever: “spurious causation” (‘schijneffect’).
• Maar de invloed van confounders kan ook alleen maar een (klein) deel van de relatie (XY) betreffen.
18
Stappenplan analyse confounders
• Stap 1: Bedenk alle mogelijke confounders en meet de betreffende variabelen.
• Stap 2: Houdt de confounder(s) constant via regressie-analyse. Het resterende effect X Y is de totale invloed van X op Y. • NB1: Bij deze analyse werk je meestal met de
gestandaardiseerde regressie-effecten (beta).
• NB2: De totale invloed X Y kan groter zijn dan de correlatie (X,Y). In dat geval is de confounder een suppressor.
19
SPSS syntax
Regr /dep=Y /enter=X /enter=Z.
Regr /dep=X /enter=Z.
20
Wat is een (potentiële) confounder?
• Z dient causaal invloed te kunnen hebben op zowel X als Y. Assumptie.
• Het mag NIET andersom zijn (reversed causation). • Van feitelijke confounding is sprake als Z effect
heeft op zowel X als op Y. Uitkomst. • Je kunt de omvang van het confounding effect
berekenen als het product (vermenigvuldiging) van beide betrokken (gestandaardiseerde) effecten.
• Totaal effect = correlatie – confounding effects.
21
De moeilijkheid
• Als je je confounders goed gemeten hebt, is de analyse niet moeilijk. Maar wel moeilijk blijft het antwoord op de volgende vragen:
– Heb ik wel alle mogelijke confounders gemeten? Waren er nog meer?
– Hoe zeker ben ik van de (noodzakelijke) assumptie dat Z causaal van invloed op X en Y, en dat het niet andersom is?
22
Het experiment sluit alle confounders uit
• De meest eenvoudige manier om alle mogelijke confounders constant te houden is het randomized group experiment.
• De randomisatie zorgt er namelijk voor dat Z X altijd 0 is; er kan dan geen confounding optreden.
• Helaas kunnen we in de praktijk van maatschappij-wetenschappelijk onderzoek lang niet altijd experimenten houden…
23
Causale volgorde argumentatie
• De assumptie van causale volgorde wordt meestal op een van de volgende manieren beredeneerd:
• Z gaat in de tijd vooraf aan X en Y (en X gaat in de tijd vooraf aan Y). Bv. geslacht, geboortejaar, eerder beroep.
• Z is een relatief onveranderlijk (stabiel) fenomeen, bv positie in de organisatie, identificatie.
• Z is een algemene attitude, Y is een specifieke attitude.
• In de praktijk van organisatie-onderzoek zijn confounders vaak: geslacht, leeftijd, leidinggevende positie, kenmerken van de organisatie.
24
SPSS demonstratie
** BEREKENING CONFOUNDING **.
regr /dep=pinc /enter=educat
/enter=age /enter=female.
regr /dep=educat /enter=age
/enter=female.
25
MEDIATIE 26
Mediatie
M
Y X
27
Multipele mediatie
M1
Y X
M2
28
Mediatie
• We bespreken mediatie via een enkele mediator, maar het kunnen er meerdere zijn.
• Vaak is dit zelfs de hele opzet van je onderzoek: je hebt een effect X Y en wilt weten langs welke wegen dit tot stand komt.
• Voorbeeld in Practicum (morgen): – Vrouwen hebben een lager inkomen dan mannen
– In welke mate komt dit door: opleiding, al dan niet werken, hoeveelheid gewerkte uren, verantwoordelijkheid in de baan, etc.
29
Mediatie-analyse syntax
• Regr /dep=Y /enter=X /enter=M.
• Merk op dat dit precies hetzelfde is als bij confounding! De interpretatie van de twee modellen is radicaal verschillend: – Bij het constant houden van confounders gaat het je
erom de zuivere (totale) invloed van X Y te vinden. – Bij het constant houden van mediatoren gaat het je
erom te laten zien hoe deze totale invloed tot stand komt.
– Het verschil in interpretatie zit in je assumpties over causale volgorde van de variabelen – je kunt het niet zien aan je uitkomsten.
30
Is de mediatie statistisch significant – de Sobeltest?
• Regressie-analyse levert je alle voor mediatie-analyse benodigde gegevens.
• W.b. statistische toetsing leren we alleen iets over de directe effecten.
• Maar ook het indirecte effect heeft een SE en een bijbehorende toetsing.Deze kun je NIET in je SPSS output vinden, maar moet apart berekend worden.
• Een veel gebruikte berekening hiervoor is ontworpen door de Amerikaanse socioloog Michael Sobel. Baron & Kenny verwijzen hiernaar. Je kunt hiervoor terecht op speciale websites.
31
Stappenplan mediatie-analyse
• Stap 1: Meet mediatoren M in je onderzoek. Je moet beredenen dat M beïnvloed kan worden door X en van invloed kan zijn op Y (en niet andersom).
• Stap 2: Bereken eerst het totale effect X Y. Hiervoor moet de confounders constant houden.
• Stap 3: Houdt de mediatoren M constant in een stapsgewijs regressiemodel.
• Stap 4: Interpreteer bij elke stap hoe het directe effect (X Y) veranderd is.
• Stap 5: Bereken in een tweede regressiomodel de totale invloed X M. Ook hier confounders constant houden.
• Stap 6: Bereken (zelf!) de indirecte effecten X M Y. Deze zijn het product (vermenigvuldiging van de beide effecten X M en M Y.
• Meestal doen we al deze analyse met gestandaardiseerde effecten (beta). • Totaal effect = direct effect + indirecte effecten.
32
Voorbeeld in SPSS
** BEREKENING INDIRECT EFFECT VIA
HOURS **.
REGR /DEP=PINC /ENTER=EDUCAT
/ENTER=AGE FEMALE /ENTER=HOURS.
REGR /DEP=HOURS /ENTER=AGE FEMALE
EDUCAT.
33
Met dank aan Anouk
• Het navolgende is ontleend aan een college van Anouk den Hamer over mediatie en doet de achtereenvolgende stappen van mediatie-analyse minitieus uit de doeken.
• Voor zelfstudie
34
Baron & Kenny
• Meest aangehaalde statistici over mediatie
• Methode komt uit 1986, wordt nog steeds gebruikt (hoewel wel bekritiseerd door sommigen)
• Volgens deze methode zijn er vier directe effecten waar je de waardes van moet kennen:
Leeftijd
Werkervaring
Salaris
a b
c’ 35
• Vierde directe effect is het totale effec X Y:
• c = totale effect van X op Y (gecontroleerd voor evt confounders).
• c’ = directe effect van X op Y (waarbij rekening wordt gehouden met mediator M)
• Indirecte effect wordt berekend als a*b
Leeftijd Salaris c
36
Stappenplan mediatie-analyse
• Stap 1: X moet significant totaal effect op Y hebben (dus pad c). Als dit effect niet significant is, dan heeft het geen zin om te testen of er sprake is van mediatie – je hebt namelijk geen statistisch bewijs dat X een effect op Y heeft.
• Stap 2: X moet significant direct effect op M hebben (dus pad a). Anders valt er niks te mediëren.
• Stap 3: gebruik de regressie uit stap 1 en voeg M toe als predictor om het effect van M op Y te testen (dus pad b). M moet significant direct effect op Y hebben, zelfde reden als bij stap 2.
• Stap 4: kijk of het effect van X op Y verdwijnt / vermindert nadat je M hebt toegevoegd (dus pad c’). Voer daarna Sobel test uit.
Alles is dmv (Regression > Lineair) te toetsen, behalve Sobel test.
37
Vier paden
• Pad a: X naar M
• Pad b: M naar Y
• Pad c’: X naar Y (gecontroleerd voor M)
• Pad c: totale effect X op Y
• c = c’+ a*b (totaal effect XY = direct effect + indirect effect)
38
Mediatie-voorbeeld
• Bij mediatie test je of een bepaald effect volledig of gedeeltelijk wordt veroorzaakt via een derde variabele
• Mediatie is belangrijk omdat het procesuitleg geeft. Het verklaart waarom/hoe een x een samenhang heeft met een y.
Tevredenheid met baan
Verloopintentie Perceived
Organizational Support (POS)
39
Stap 1: effect X op Y
• Dus: effect POS (support) op verloopintentie
• Effect van X op Y (c): β = -.36, p < .05
40
Stap 2: effect X op M
• Dus: effect van POS op tevredenheid met baan
• Effect van X op M (a): β = .26, p < .05
41
Stap 3: effect M op Y
• Dus: effect van tevredenheid op verloopintentie
• zowel X (POS) als M (tevredenheid) als onafhankelijke variabelen in regressie
• Effect van M op Y (b): β = -.35, p < .05
42
Stap 4: verdwijnt effect van X op Y?
• Kunnen in vorige output kijken
• Effect van X (POS) op Y (verloopintentie) verdwijnt niet
• Wordt het effect wel kleiner?
• Effect was eerst c (totale effect): β = -.36, p < .05.
• Effect is nu c’ (directe effect): β = -.27, p < .05.
• Verschil is (indirect effect) -.36 - -.27 = -.09
• Is dat verschil significant? Dat kunnen we testen met de Sobel test
43
Sobel test
• De Sobel test toetst of pad c’ significant afwijkt van pad c
• Dus: is er inderdaad sprake van significante mediatie door variabele M?
• Kan niet in SPSS, wel via simpel programmaatje op internet (hoef je niet te downloaden, gewoon op website http://quantpsy.org/sobel/sobel.htm)
• Daar vul je van pad a en b de regressiecoëfficiënten (oftewel, de slopes) en de standaard errors in
44
45
46
Sobel test
• Wijkt pad c’ significant af van pad c?
POS
Tevredenheid met baan
Verloopintentie
a
b
c’
POS Verloopintentie c
47
Indirecte effecten
• Van c’ (partieel effect) en c (totaal effect) kunnen we de SE in de output lezen.
• Maar van het indirect effect a*b (beide hebben hun eigen SE) kunnen we dit niet.
• Baron & Kenny geven de formule op p. 1177.
• Het Sobel programmaatje rekent het voor ons uit.
48
Ons voorbeeld
B’s en SE’s van a en b:
• Effect van X op M: a = .157 (SEa .051), p < .05
• Effect van M op Y: b = -.578 (SEb .133), p < .05
49
• De Sobel test toetst of pad c’ significant afwijkt van pad c
• Dus: is er inderdaad sprake van mediatie door variabele M?
• Maak je geen zorgen om die andere testen, kijk alleen naar de Sobel
• Conclusie voor ons onderzoek: – Het effect van POS op verloopintentie wordt inderdaad significant gemedieerd door
tevredenheid met het werk (t = -2.51, p <.05).
X op M
M op Y,
gecontroleerd
voor X
50
Paden model
a
b
c
c’
51
• Volledige mediatie = wanneer het effect van X op Y verdwijnt zodra M erbij komt. Dus wanneer pad c’ 0 is
• Partiële mediatie = wanneer het effect van X op Y nog steeds significant is zodra M erbij komt, maar wel veel kleiner wordt
52
• Wij zagen in ons voorbeeld dat het effect van X op Y niet verdween toen we M toevoegden
• Is er sprake van volledige of partiële mediatie?
• Partiële mediatie
53
Effecten mediatie
• Indirect effect: pad a * pad b (dit wordt pad ab genoemd)
• Direct effect: pad c’
• Totale effect = direct effect + indirect effect
• c = c’ + ab
• Indirect effect (ab): .26*-.35 = -.09
• Direct effect (c’): -.27
• Totale effect (c): -.27 + (-.09) = -.36
• Van het totale effect wordt (-.09/-.36) procent verklaard door tevredenheid, dus 25.0%.
POS
Tevredenheid
Verloopintentie
a = .26 b = -.35
c’ = -.27
54
a=.26* b = -,35*
c’ = -,27*
ab = -,09*
POS Verloopintentie
Tevredenheid
55
Conclusie
Hypothese mediatie bevestigd: Het effect van Perceived Organizational Support (POS) op de verloopintentie, loopt deels via de tevredenheid van de werknemer (p < .05).
We hebben voldoende bewijs om te stellen dat het negatieve verband tussen POS en verloopintentie gedeeltelijk wordt gemedieerd door tevredenheid.
56
4 stappen mediatie
• Stap 1: X moet significant effect op Y hebben (dus pad c). Als dit effect niet significant is, dan heeft het geen zin om te testen of er sprake is van mediatie – je hebt namelijk geen statistisch bewijs dat X een effect op Y heeft.
• Stap 2: X moet significant effect op M hebben (dus pad a). Anders valt er niks te mediëren.
• Stap 3: gebruik de regressie uit stap 1 en voeg M toe als predictor om het effect van M op Y te testen (dus pad b). M moet significant effect op Y hebben, zelfde reden als bij stap 2.
• Stap 4: kijk of het effect van X op Y verdwijnt nadat je M hebt toegevoegd (dus pad c’). Voer daarna Sobel test uit.
• Alles is dmv regressies te toetsen, behalve Sobel test
57
EN DAN NOG MEER
58
Volgorde confounding en mediatie-analyse
• Analyse van confounders gaat vooraf aan analyse van mediatoren.
• Je wilt namelijk eerst het totale effect X Y weten, voordat je gaat uitvinden hoe dit werkt.
• Het is bij berekeningen voor mediatie noodzakelijk om de confounder steeds constant te houden (= mee te nemen als voorspellers in het regressiemodel).
59
Relatie met factor-analyse
• Het (meet)model van factor-analyse is eigenlijk een verzameling van confounding relaties: de latente variabelen verklaren de relaties tussen de betrokken indicatoren.
• Je kunt dit ook zeggen als: de correlatie tussen de indicatoren wordt volledig (weg)verklaard door de latente factor(en).
60
Relatie met betrouwbaarheid
• Betrouwbaarheid speelt een grote (en heel vaak onderschatte) rol bij analyse van confounding en indirecte effecten. Beide zijn een vermenigvuldiging van twee effecten: – Confounding: beta(ZX) * beta(ZY)
– Indirect: beta(XM) * beta(MY)
• In beide gevallen komt één variabele (Z of M) twee keer voor. Het verzwakkende effect van onbetrouwbaarheid treedt hierdoor ook twee keer op!!
61