pure.au.dkpure.au.dk/portal/files/36183961/rapport_rss_c_.docx · web viewfor 50 år siden var de...
TRANSCRIPT
HA, almen – 6. semester Bachelor afhandling
Forfatter:
Ruben Samuel Sørensen
Vejleder:
Morten Berg Jensen
Seminaropgave nr. MIM4
Måling af miljømæssig ansvarlig forbrugeradfærd på tværs af survey modes
En sammenligning af web og PAPI selvadministrerede spørgeskemaer
Handelshøjskolen, Aarhus Universitet
Side 1 af 101
2011
Ruben Samuel Sørensen © 2011
Forfatteren ønsker at takke følgende personer: Min vejleder, lektor Morten Berg Jensen for hans
mange konstruktive råd, positive tilgang og initiale accept af vejlederskab: Mine forældre for deres
til enhver tid store opbakning. Derudover takkes de personer, som deltog i fokusgruppe prætestene
af rapportens web og PAPI spørgeskemaer. Ikke mindst sendes også en stor tak til de mange
behjælpelige holdundervisere på Handelshøjskolen, Aarhus Universitet som afsatte tid til at deres
studerende kunne besvare rapportens PAPI spørgeskemaer, omdelt i løbet af marts måned.
Ruben Samuel Sørensen
Maj 2011
Side 2 af 101
Abstract
By doing research work in the area of environmental responsible consumer behavior, intention-
behavior / values-action gaps are empirically observed. These gaps illustrate the issue that attitudes,
intentions and values measured with traditional survey modes and methodologies normally will
overestimate the actual buying behavior of respondents. A research perspective explains this
problem by the use of a number of unconstrained survey response methods, whose constructions are
said to be prompting the measurement errors: social desirable responding (SDR) and response styles
(RS). Therefore, following management question is to be found in this rapport:
The above-mentioned management question is answered on the basis of 3 research questions. 1) An
analysis of the measurement equivalence of a given measurement model for environmental
responsible consumer behavior crosswise different modes. 2 + 3) A comparison of the magnitude of
SDR and RS crosswise the modes concerned.
Questionnaires are constructed via items from EOSCALE (Stone et. al, 2009) and Balanced
Inventory of Desirable Responding, BIDR, (Paulhus, 1988). Data is collected from a population of
bachelor students at Aarhus School of Business, University of Aarhus. This is done by random
sampling crosswise different modes. Primarily, multigroup confirmative factor analysis (MGCFA)
is used. Therefore, the position with regard to philosophy of science is analytical / positivistic.
Theoretically, the starting point of this rapport is the classic test theory and its different assumptions
and criteria of quality. Furthermore, it is based on the Paulhus SDR theory and theory concerning
operationalization/explanation of different response styles.
Side 3 af 101
To what extent are different results by measuring environmental responsible consumer behavior
across web-based and PAPI surveys obtained?
The result of this rapport is: evidence for different measurements of the construct environmental
responsible consumer behavior crosswise modes. However, it seems that SDR is in force crosswise
different modes to the same extent. When it comes to RS, statistic evidence for different degrees of
acquiescence response style is established, and this result seems to be explaining the differences
concerning the measurement of environmental responsible consumer behavior.
These results can give valuable information to researchers conducting mixed-mode data collection
in the area of environmental responsible consumer behavior. Furthermore they suggest further
research in the area of environmental responsible consumer behavior, SDR and RS.
Side 4 af 101
Indholdsfortegnelse
1. Indledning.....................................................................................................................................11
1.1. Problemstilling........................................................................................................................12
1.2. Problemformulering................................................................................................................14
1.3. Rapportens struktur.................................................................................................................16
1.4. Definition af begreber.............................................................................................................17
1.4.1 Web-based survey..............................................................................................................17
1.4.2. Miljømæssig ansvarlig forbrugeradfærd..........................................................................19
1.5. Afgræsninger...........................................................................................................................21
2. Teoretisk ramme..........................................................................................................................23
2.1. Measurement theory................................................................................................................23
2.1.1. Klassisk test teori..............................................................................................................23
2.1.2. Constructs.........................................................................................................................26
2.2. Social desirability responding.................................................................................................28
2.2.1. SDR som construct...........................................................................................................28
2.2.2. Paulhus SDR teori............................................................................................................29
2.3. Response styles........................................................................................................................31
2.3.1. Typologi for response styles.............................................................................................31
Side 5 af 101
3. Metodisk fundament....................................................................................................................34
3.1. Spørgeskemakonstruktion.......................................................................................................34
3.1.1. Prætest af spørgeskema....................................................................................................34
3.1.2. Valg af multi-item scales..................................................................................................36
3.1.3. Design af spørgeskema.....................................................................................................39
3.2. Datagenerering.......................................................................................................................41
3.2.1. Population........................................................................................................................41
3.2.2. Dataindsamling................................................................................................................42
3.3. Statistiske teknikker.................................................................................................................43
3.3.1. Eksplorativ faktoranalyse.................................................................................................43
3.3.2. Konfirmativ faktoranalyse................................................................................................44
3.4. Videnskabsteoretisk position...................................................................................................47
4. Måling af constructet miljømæssig ansvarlig forbrugeradfærd..............................................49
4.1. Datagrundlag...........................................................................................................................49
4.2. Etablering af målemodel.........................................................................................................51
4.3. Survey mode sammenligning..................................................................................................54
4.4. Diskussion og kritik af resultater.............................................................................................58
4.5. Delkonklusion.........................................................................................................................61
Side 6 af 101
5. SDR ved måling af miljømæssig ansvarlig forbrugeradfærd..................................................62
5.1. Survey mode sammenligning..................................................................................................62
5.2. Diskussion og kritik af resultater.............................................................................................69
5.3. Delkonklusion.........................................................................................................................71
6. Respons styles ved måling af miljømæssig ansvarlig forbrugeradfærd..................................72
6.1. Etablering af målemodel.........................................................................................................72
6.2. Survey mode sammenligning..................................................................................................74
6.3. Diskussion og kritik af resultater.............................................................................................79
6.4. Delkonklusion.........................................................................................................................81
7. Konklusion....................................................................................................................................82
8. Perspektivering.............................................................................................................................83
9. Litteraturliste................................................................................................................................85
10. Bilag...........................................................................................................................................100
10.1. PAPI spørgeskema (bilag 1)................................................................................................100
10.2. Web spørgeskema (bilag 2).................................................................................................106
10.3. Eksplorativ faktoranalyse (bilag 4)....................................................................................115
10.4. Multigruppe konfirmativ faktoranalyse, kapitel 4 (bilag 5)...............................................117
10.5. Multigruppe konfirmativ faktoranalyse, kapitel 5 (bilag 6)...............................................122
10.6. Multigruppe konfirmativ faktoranalyse, kapitel 6 (bilag 7)...............................................124
10.7. Web og PAPI datasæt (cd-rom)..........................................................................................126
Side 7 af 101
Figurliste
Figur 1.3. Illustration af rapportens struktur og kapitler…………………………………… 16
Figur 1.4.1. Typer af web-based surveys………………………………………………….. 17
Figur 1.4.2. Constructet miljømæssig ansvarlig forbrugeradfærd…………………………. 20
Figur 2.1.2. Målemodel for et Construct…………………………………………………... 26
Figur 2.2.2. Paulhus SDR two tier system…………………………………………………. 30
Figur 2.3.1. Response styles: DRS, MRS, ARS og ERS ved 5-punkts Likert skala ……... 33
Figur 3.4. Illustration af placeringen af rapportens videnskabsteoretiske position………... 46
Figur 4.2. Målemodel for miljømæssig ansvarlig forbrugeradfærd (uden construct korrelationer)
…………………………………………………………………………........ .. 53
Figur 5.1. Målemodel for social desirability responding - moralistic (MB) og egoistic
bias EB)…………………………………………………………………………………….. 62
Figur 5.1. Wiejters målemodel for response styles – ARS, DRS, ERS og MRS………….... 72
Side 8 af 101
Tabelliste
Tabel 4.1. Stikprøvekendetegn i alt og for enkelte modes…………………………………. 49
Tabel 4.2. Kaiser Varimax roteret faktor laoding matrix (med loadings over 0,20)………. 52
Tabel 4.3.1. χ2 test statistik samt fit index ved model for configural invariance …………. 54
Tabel 4.3.2. χ2 test statistikker samt fit index ved model for full scalar invariance……….. 55
Tabel 4.3.2. χ2 test statistikker samt fit index ved model partial scalar invariance……….. 56
Tabel 5.1.1. χ2 test statistik samt fit index ved model for configural invariance………….. 57
Tabel 5.1.2. χ2 test statistikker samt fit index ved model for full metric invariance ……… 63
Tabel 5.1.3. χ2 test statistikker samt fit index ved model for full scalar invariance………. .
63
Tabel 5.1.4. χ2 test statistikker samt fit index ved model for full invariance of factor
variances ……………………………………………………………………………….…. 65
Tabel 5.1.5. χ2 test statistikker samt fit index ved model for full invariance of factor
covariances ……………………………………………………………………………… . 65
Tabel 5.1.6. χ2 test statistikker samt fit index ved model for full invariance of latent
Means……………………………………………………………………………………... 66
Tabel 5.1.7. χ2 test statistikker samt fit index ved model for full invariance of error
variances …………………………………………………………………………………... 67
Tabel 5.1.8. χ2 test statistikker samt fit index ved model for partial invariance of error
Side 9 af 101
variances ………………………………………………………………………………….. 68
Tabel 6.2.1. χ2 test statistik samt fit index ved model for configural invariance …………. .
74
Tabel 6.2.2. χ2 test statistikker samt fit index ved model for full metric invariance ……... 75
Tabel 6.2.3. χ2 test statistikker samt fit index ved model for full scalar invariance ……… .
75
Tabel 6.2.4. Latente means, standard errors, effect sizes samt t test statistikker………….. 76
Tabel 6.2.5. χ2 test statistikker samt fit index ved model for full invariance of factor
Variances………………………………………………………………………………… . 77
Tabel 6.2.6. χ2 test statistikker samt fit index ved modeller for test af fuld invarians af
faktor kovarianser og fuld samt partiel invarians af error varianser …………………….. . 78
Side 10 af 101
1. Indledning
For 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume,
standardisering, - også benævnt least-cost production paradigmet (Kotler m.fl., 2009). Senere er der
sket et paradigmeskifte, hvor de fleste markeder er gået fra sellers til buyers market (Goodman jf.
Kotler m.fl., 2009). Således er marketing research og generel forståelse af kunders behov blevet en
central proces i mange virksomheder (Deutskens, 2006). Udvikling af innovative og værdiskabende
produkter / services er da centralt for deres succes (Lynch, 2009). Et stadigt stigende antal
virksomheder er her begyndt at implementere CSR strategier med fokus på miljø, Fair Trade og
andre faktorer, som er til fordel for samfundet som helhed og ikke kun shareholders (Lynch, 2009).
Et centralt spørgsmål ved virksomheders CSR strategier er effekten på efterspørgselssiden – dvs.
hvorledes de tilsigtede nuværende og potentielle kunder opfatter og handler herudfra. I den
forbindelse er der empirisk observeret et nyt segment af forbrugere: Ethically minded consumers (fx
Attalla, 2001 og De Pelsmacker m.fl., 2005). Der er i den forbindelse evidens for et nyt stadig
voksende segment af kunder, som har præferencer for etiske produkter og services. Denne etiske
forbrugeradfærd kan fx være i forhold til Fair Trade (De Pelsmacker m.fl., 2007), miljø og økologi
(Shaw m.fl.., 2006) og arbejdsforhold i udviklingslande (Dickson, 1999). Holbrook m.fl. (1993, s.
113) definerer etisk forbrugeradfærd som følgende ”decision-making, purchases and other
consumption experiences that are affected by the consumer’s ethical concerns”. Den givne
forbrugers købsadfærd forsøges således forklaret ud fra etiske faktorer og forhold.
Den største undergruppe af etisk forbrugeradfærd er miljømæssig ansvarlig forbrugeradfærd (fx jf.
Stone m.fl. 1995). Miljø har en meget bred implikation gående fra betydelig politisk og økonomisk
signifikans til et muligt strategisk CSR / marketing initiativ for en given virksomhed (Ozaki, 2008).
Side 11 af 101
Det er desuden en type etisk forbrugeradfærd som går mange år tilbage (Stone m.fl. 2009). På den
anden side synes nuværende miljøproblemer at betyde, at miljømæssige spørgsmål og
problemstillinger også vil være relevant / gældende i fremtiden – dvs. en sandsynlig fremtidig
relevans for denne type etiske forbrugeradfærd. Empirisk er det gældende, at mange forbrugere i
dag opfatter sig selv som green consumers (fx Neville m.fl., 2010) Tilsvarende gælder det, at
mange virksomheder har implementeret forskellige tiltag / strategier i forhold til miljø (Auger m.fl.
2007). Området, både ift. efterspørgsels- og udbudssiden, synes herved efterhånden ganske
veludviklet – om end der ikke nødvendigvis gælder modne / mættede markeder herfor.
1.1. Problemstilling
I videnskabelig og kommerciel forskning inden for etisk og miljømæssig ansvarlig forbrugeradfærd
er der i mange surveys observeret en svag sammenhæng mellem forbrugeres påståede attituder /
intentioner og deres faktiske købsadfærd (Neville m.fl., 2010, Young m.fl., 2010 og Ryan, 2011). Et
eksempel herpå findes i Hughner m.fl. (2007), hvor mellem 46-67 % af en gruppe engelske
forbrugere rapporterede positive attituder og intentioner om at vælge miljøvenlige fødevarer, mens
kun 4-10 % faktisk gjorde det. Af det britiske Futerra studie (2005) fremgår det også, at selv om 30
% angav intentioner om køb af miljøvenlige produkter, skete det i virkeligheden kun for ca. 3 %
(Futerra, 2005, s. 92). Denne empiriske inkonsistens er i litteraturen bl.a. benævnt attitude-
behavior, word-deed, intention-behavoir - og values-action gap (fx Simon, 1995, Sarasin m.fl.,
1995, Boulstrigde m.fl. 2000, Jobber m.fl., 2000, Shaw m.fl. 2007 og Auger m.fl. 2007). Den fælles
syntese er, at selvrapporterede attituder, intentioner og værdier i surveys omkring miljømæssig
ansvarlig og etisk forbrugeradfærd normalt vil overestimere respondenternes faktiske købsadfærd.
I et kommercielt marketing perspektiv medfører nævnte gaps, at størrelsen af markeder for
miljøvenlige og etiske produkter/ydelser estimeres med betydelig usikkerhed (Ozaki m.fl., 2008).
Anvendes resultater fra sådanne surveys som strategisk beslutningsgrundlag for investering i
kommunikationskampagner, produktudvikling osv. er det derfor forbundet med stor risiko. Fx vil
prædiktion af miljømæssig forbrugeradfærd via selvrapporterede attituder og intentioner i Futerra
(2005) studiet i 90 % af tilfældene være forkert (Neville m.fl., 2010). I et videnskabeligt perspektiv
udtrykker gapet en ufuldstændig forståelse / forklaring af dette empiriske fænomen inden for den
nuværende litteratur. Dette gælder særligt for etisk og miljømæssig ansvarlig forbrugeradfærd (Belk
m.fl., 2005, De Pelsmacker m.fl., 2005, Shaw m.fl. 2006 og Neville m.fl. 2010). Af den grund er
Side 12 af 101
der stadig behov for forskning inden for dette område. Med udgangspunkt i den nuværende
litteratur er formålet med denne rapport herved at bidrage til en bedre forståelse af omtalte gaps.
Den videnskabelige litteratur inden for nævnte gaps kan kategoriseres i to hovedretninger jf. Neville
m.fl. (2010): en metodisk og modelbaseret. I den modelbaserede litteratur er formålet at identificere
de faktorer, som direkte eller indirekte påvirker transformationen af attituder, intentioner og andre
teoretisk formulerede constructs til faktisk købsadfærd (fx Shaw m.fl., 2002, Black m.fl., 2008 og
Verbeke m.fl., 2008). Retningen er da kendetegnet ved modellering af købebeslutningsprocesser.
Det sker primært med udgangspunkt i teoretiske rammer inden for consumer behavoir, business
etics og psykologi (Shaw m.fl., 2007) - i særdeleshed theory of reasoned action (Fishbein og Ajzen,
1980) og theory of planned behavoir (Ajzen, 1985). Herudfra er betydningen af faktorer såsom
produktinformation, brand loyalitet og andre købskriterier blevet sandsynliggjort (fx Okasanen
m.fl., 2004, Ingram m.fl., 2005). En sådan teoretisk modellering genfindes ikke i den metodisk
baserede litteratur. Gaps forsøges derimod forklaret ud fra mangler / måleproblemer ved den
anvendte survey metodik for de empiriske undersøgelser inden for etisk og miljømæssig ansvarlig
forbrugeradfærd (fx Attala m.fl., 2001 og Auger m.fl., 2007). Retningen er da kendetegnet ved
forskning i alternative metoder og teknikker. Det gælder bl.a. kvalitative metoder (fx Attala m.fl.
2001) og statistiske teknikker såsom discrete choice modellering (fx Louviere m.fl., 2000).
I den metodisk baserede litteratur kritiseres unconstrained survey response methods (fx Auger m.fl.,
2010). Særligt brugen af direkte spørgsmål og rating scales påstås at lede til overestimation af
attituder og intentioner om køb af etiske produkter og ydelser (Neville m.fl., 2010 ). Dette forklares
ved tilskyndelsen til social desirability responding (SDR), hvor direkte spørgsmål om børnearbejde,
forurening, osv. har svarmuligheder på en rating skala, som vil opfattes mere socialt acceptable end
andre (Auger mfl., 2007). Konsekvensen heraf kan være over- / underestimerede mål for socialt
følsomme items (fx Sarasim m.fl., 2005). En anden kilde til bias kan være brugen af rating scales
(fx Likert skalaen), som inden for consumer research i visse tilfælde har medført bestemte response
styles (RS) (Wiejters m.fl., 2010). Dette udgør en markant trussel mod validitet, når der fx svares
tilfældigt eller konsekvent angives enighed/uenighed (Steenkamp m.fl., 2001). SDR og RS ved etisk
forbrugeradfærd har på nuværende tidspunkt ikke til min orientering været underlagt nærmere
forskning, hvorfor en undersøgelse af disse påståede problemstillinger vurderes relevant.
Side 13 af 101
Ved identifikationen af omtalte gaps har traditionelle survey modes normalt været anvendt. Det
gælder primært selvadministrerede papir spørgeskemaer (PAPI). Af kommercielle surveys kan bl.a.
nævnes flere større undersøgelser af Market & Opinion Research International i Storbritannien
(Mason, 2000), lignende surveys af Coperate Edge (Rogers, 1998), de mange Futerra studier
(Neville m.fl., 2010) samt flere statsligt finansierede undersøgelser (fx jf. Defra, 2006). Ved
videnskabelige surveys gælder PAPI anvendelsen både for den modelbaserede retning (fx Shaw
m.fl. 2002, Janssens m.fl. 2007, Black m.fl. 2008 og Verbeke m.fl., 2008) og den metodisk baserede
retning (fx Follows m.fl., 2000 og Auger m.fl. 2003, 2007, 2010). Et spørgsmål er her, om der
kunne gælde gunstige effekter ved brug af andre modes – dvs. mindre gaps via løsninger på de
fremsatte problemstillinger i den metodisk baserede litteraturretning. Dette spørgsmåls relevans
skyldes bl.a. muligheden for web-based surveys. For denne mode viser en række undersøgelser en
mindre grad af SDR ift. traditionelle modes såsom PAPI (fx Deutskens, 2006, Yan m.fl., 2007 og
Tourangeau m.fl., 2008) samt anderledes response styles, fx mere ekstreme svar og item variabilitet
(Stanton, 1998, Klassen m.fl., 2001, Roster m.fl. 2004, Wiejters, 2006 og Wiejters m.fl., 2010). Om
end andre undersøgelser ikke indikerer forskelle (fx Epstein m.fl., 2001 og Knapp m.fl. 2003), kan
det herved ikke afvises, at web-based surveys kan være et fordelagtigt alternativ til PAPI. Dette
begrundes også med flere generelle fordele ved web-based surveys såsom lavere omkostninger
(Carayon m.fl., 2009), hurtigere responstid (Lievens m.fl., 2009), flere muligheder for design og
effekter (Meulemeester m.fl. 2005) samt lavere tidsforbrug og fejl ved dataentry (Deutskens, 2006).
1.2. Problemformulering Med udgangspunkt i nævnte empiriske gaps, kritikpunkterne fremsat i den metodisk baserede
litteraturretning samt de potentielle fordele ved anvendelsen af web surveys ift. PAPI er formålet
med denne rapport at undersøge følgende overordnede forskningsspørgsmål:
Dette overordnede forskningsspørgsmål vil besvares ud fra følgende tre underspørgsmål:
Side 14 af 101
I hvilket omfang opnås der forskellige resultater ved måling af miljømæssig ansvarlig
forbrugeradfærd på tværs af web-based og PAPI selvadministrerede spørgeskemaer?
- 1: Gælder der ved en given estimeret målemodel for miljømæssig ansvarlig forbrugeradfærd
forskelle mellem web og PAPI?
- 2: Gælder der samme omfang af social desirability responding mellem web og PAPI?
- 3: Gælder der samme omfang af response styles mellem web og PAPI?
- Første spørgsmål omfatter et klassisk test for measurement invariance mellem de to survey modes.
Formålet med dette spørgsmål er herved at besvare i hvilket omfang der ved en given estimeret
målemodel for constructet miljømæssig ansvarlig forbrugeradfærd måtte gælde signifikante
forskelle for strukturer og modelparametre. Ud fra de to modes mange ligheder (fx deres
selvadministrerede form) samt manglen på entydige resultater ved tidligere videnskabelige studier
af deres ækvivalens er udgangspunktet i denne rapport derfor følgende hypotese:
H1: Der gælder måleækvivalens for web og PAPI ved miljømæssig ansvarlig forbrugeradfærd
Det er således formålet at falsificere ovenstående hypotese, hvilket kan synes forsøgt i mange
tidligere survey mode sammenligninger (fx Adam m.fl., 2003 Roster m.fl. 2004 og Deutskens,
2006). Sådanne forskningsresultater er imidlertid meget kontekstafhængige (Wiejters, 2006),
hvorfor de ikke umiddelbart er bredt generaliserbare. Desuden er der til min orientering ikke
gennemført en mode sammenligning ift. miljømæssig ansvarlig forbrugeradfærd. Denne rapport er
da ikke en replikation af tidligere forskning, men et bidrag inden for et til dato uudforsket område.
- Andet og tredje spørgsmål vedrører omfanget af social desirability responding (SDR) og respons
styles (RS) på tværs af modes. Der undersøges således for forskelle i respondenternes tendens til at
give socialt acceptable svar (SDR) og svar ud fra indholdsmæssigt irrelevante faktorer (RS).
Spørgsmålene kan da beskrives som henholdsvis en analyse af omfanget af content og non-content
based responding dvs. to forskellige kilder til measurement error. På baggrund af meget få tidligere
studier samt de tidl. nævnte mange ligheder mellem modes, er udgangspunktet følgende hypoteser:
H2: Der gælder samme omfang af social desirability responding for web og PAPI
Side 15 af 101
H3: Der gælder samme omfang af response styles for web og PAPI
Ovenstående to hypoteser er kun forsøgt falsificeret i meget få tidligere studier – herunder ingen i
konteksten miljømæssig / etisk forbrugeradfærd. Rapporten vurderes da at medføre et nyt bidrag i
forhold til den tidligere omtalte metodiske litteraturretning. Spørgsmålenes relevans underbygges
endvidere af det faktum, at gennemførslen af en klassisk measurement invariance test (som ved
foretaget under spørgsmål 1) ikke nødvendigvis vil diagnosticere eventuelle problemer med SDR og
RS (jf. Wiejters, 2006). Derfor er disponeringen i denne rapport implementering af to særskilte
analyser, som eksplicit / direkte undersøger for disse mulige kilder til systematisk målefejl.
1.3. Rapportens struktur
Med det formål at skabe et overblik over rapportens forskellige dispositioner vil der i dette afsnit
kort redegøres for dens struktur og indholdet af de enkelte kapitler. Grafisk kan rapportens struktur i
forhold til dets respektive kapitler og deres indbyrdes sammenhænge illustreres som følgende:
Kilde: Egen tilvirkning
I dette kapitel 1 etableres rapportens fundament i form af dets problemstilling og tilhørende
problemformulering samt centrale begreber og valgte afgrænsninger. I kapitel 2 præsenteres dens
teoretiske ramme i form af klassisk test teori samt teorier vedrørende SDR og RS. I kapitel 3
Side 16 af 101
Kapitel 1: Indledning
Kapitel 2: Teori Kapitel 3: Metode
Kapitel 4: M.A.F. Kapitel 5: SDR ved M.A.F. Kapitel 6: R.S. ved M.A.F
Kapitel 7: Konklusion
Kapitel 8: Perspektivering
Figur 1.3. Illustration af rapportens struktur og kapitler
beskrives det metodiske fundament i form af konstruktionen af web og PAPI spørgeskemaerne,
generering af data samt valg af statistiske teknikker. I dette kapitel angives desuden rapportens
videnskabsteoretiske position. Problemformuleringens tre underspørgsmål vil med udgangspunkt i
denne teori og metode besvares i kapitlerne 4-6. I kapitel 4 analyseres måleækvivalensen for web
og PAPI ift. en målemodel for miljømæssig ansvarlig forbrugeradfærd via multi group konfirmativ
faktoranalyse (MGCFA). I kapitel 5 og 6 analyseres der via MGCFA for eventuelle forskelle i
omfanget af henholdsvis SDR og RS på tværs af de to modes. I kapitel 7 angives rapportens
samlede konklusion – dvs. hvorvidt de tre initialt formulerede hypoteser kan fastholdes eller ej. I
kapitel 8 vil disse resultater danne udgangspunkt for en række relevante perspektiveringer.
1.4. Definition af begreber
I dette afsnit er formålet at definere to af rapportens mest centrale begreber / constructs: web-based
survey og miljømæssig ansvarlig forbrugeradfærd. Dette vurderes nødvendigt, idet disse har et
abstraktionsniveau, hvorudfra de ikke umiddelbart er operationaliserbare. De er herved underlagt
adskillige mulige fortolkninger, hvilket eksempelvis illustreres ved, at der i videnskabelig litteratur
ikke er enighed om deres definitioner eller definitionsrammer (fx jf. Deutskens, 2006).
1.4.1 Web-based survey
Web-based surveys (WBS) er kendetegnet ved en høj grad af diversitet, hvorfor begrebet i sig selv
er for bredt til at give nogen konkret beskrivelse af, hvordan et givet studie er foretaget (Miller
m.fl., 2008). Det skyldes fx, at der ved WBS anvendes mange forskellige typer stikprøverammer og
inviteres respondenter til deltagelse på mange forskellige måder (Couper, 2000). Ifølge Miller m.fl.
(2008) har denne diversifikation to centrale implikationer. For det første er generaliseringer
omkring WBS i forhold til andre survey modes problematisk, hvis WBS ikke nærmere defineres.
For det andet medfører begrebets mangfoldighed, at der er behov for nærmere informationer
omkring dataindsamlingsprocessen for at kunne vurdere kvaliteten af data og processen i sig selv. I
denne rapport vil det herved mere konkret defineres hvilken type WBS, som undersøges. Dette sker
med udgangspunkt i Couper (2000), som angiver følgende kategorisering af WBS.
Side 17 af 101
Figur 1.4.1. Typer af web-based surveys
Nonprobability methods Probability-based methods
1. Polls as entertainment 4. Intercept surveys2. Unrestricted self-selected survey 5. List-based samples 3. Volunteer opt-in panels 6. Web option in mixed mode
surveys 7. Pre-recruited panels of Internet users8. Pre-recruited panels of full population
Couper (2000) skelner mellem nonprobability og probability-based web surveys. Kendetegnet for
probability-based WBS er en population, hvis personer har samme udtrækningssandsynlighed –
dvs. sampling ud fra klassiske statistiske principper (Blumberg m.fl., 2008). Dette gælder ikke ved
nonprobability WBS, hvorved inferens / generalisering til en given population ikke kan ske ud fra
normale statistiske principper, men derimod det Couper (2000) kalder ”leaps of faith”.
- Nonprobability web surveys inddeles i tre undergrupper. Polls as entertainment har til formål at
skabe underholdning og fri meningsudvikling. Normalt er der ingen kontrol over hvem som deltager
og hvilke spørgsmål, som stilles. I gruppen unrestricted self-selected survey anvendes åbne
invitationer på portaler, ofte besøgte web-sider og særlige survey-sites. Normalt gælder ingen
adgangsbegrænsning eller kontrol over multiple besvarelser. Den centrale problemstilling er, at
disse surveys ofte påstås at leve op til klassiske videnskabelige kvalitetskriterier, hvilket imidlertid
er tvivlsomt (fx Witte m.fl. 1999 og May 1999). Ved gruppen volunteer opt-in panels indsamles
data fra et panel af frivillige deltagere, som initialt er fundet via forskellige web-sider og portaler.
- Probability-based web surveys angives i fem undergrupper. Gruppen intercept surveys beskriver
WBS, hvor der anvendes systematisk sampling ved at hver n’te person på en hjemmeside inviteres
til at deltage i surveyen. List-based samples er WBS foretaget ud fra en given stikprøveramme af
respondenter med høj grad af internetadgang. Web option in mixed mode surveys angiver den
situation, hvor WBS blot er en ud af flere modes, som respondenten tilbydes at svare ud fra. I pre-
recruited panels of Internet users udvælges de enkelte paneldeltagere ved probability sampling.
Herudfra kan der senere afsendes e-mail invitationer til personerne med internetadgang. Ved pre-
Side 18 af 101
Kilde: Couper (2000), s. 477-490
recruited panels of full population kan der yderligere opnås data fra en population, hvor alle ikke
har internetadgang, idet personer uden internetadgang får sat det nødvendige udstyr til rådighed.
Ved den senere dataanalyse vil der anvendes statistiske teknikker. Derfor er probability-based web
surveys foretrukket. Mere konkret er der valgt list-based samples med en e-mail liste for samtlige
bachelor studerende på Handelshøjskolen, Aarhus Universitet som stikprøveramme. Ingen andre
probability-based WBS har været mulige alternativer. Fx kan respondenter ikke genereres via en
hjemmeside, hvorfor en intercept survey ikke kunne anvendes. Idet rapportens formål er en mode
sammenligning, hvorved data fra de to modes må holdes særskilt, vil en mixed mode WBS ikke
opfylde det formål. Derimod vil rapporten give svar på, om en sådan mixed mode strategi kan
anvendes i givne kontekst Endeligt anvendes der tværsnitsdata, hvorfor panel surveys ikke er valgt.
1.4.2. Miljømæssig ansvarlig forbrugeradfærd
Forbrugeradfærd (consumer behaviour) udgør et tværfagligt forskningsfelt inden for bl.a. marketing
og kan beskrives som: ”the study of how individuals and groups buy, use and dispose goods,
services or experiences to satisfy their needs and wants” (Narus m.fl., 2004). Det givne studie kan
herudfra afgrænses til én eller flere perspektiver – fx produkttype (kortvarigt vs. langvarigt gode)
eller proces (før- vs. efterkøbsadfærd). En sådan afgrænsning ses også ved denne rapports fokus på
miljømæssig ansvarlighed. Definitionen af det construct sker ud fra relevant teori og empiri. Af den
grund kunne den også placeres i rapportens teoriafsnit. Det er imidlertid vurderet en bedre
disposition at få defineret dette centrale construct så tidligt som muligt. Udgangspunktet herfor har
været Stone m.fl. (1995) og (2009), som er et af de eneste bidrag med en eksplicit definition af
miljømæssig ansvarlighed forbrugeradfærd samt efterfølgende operationalisering via en tilhørende
multi-item scale. Dette valg er primært motiveret af definitionens stærke teoretiske fundament i
form af brugen af tidl. forskning og validerede skalaer inden for miljø, og angives som følgende:
”Environmental responsibility is a state in which a person expresses an intention to take action directed
toward remediation of environmental problems, acting not as an individual concerned with his/her own
economic interests, but through a citizen consumer concept of societal-environmental well-being.
Further, this action will be characterized by awareness of environmental problems, knowledge of
remedial alternatives best suited for alleviation of the problem, skill in pursuing his or her chosen
action, and possession of a genuine desire to act after having weighed his / her own locus of control and
determining that these actions can be meaningful in alleviation of the problem” (Stone m.fl. 1995, s. 601).
Side 19 af 101
Ovenstående definition kan beskrives som en dekomponering af constructet miljømæssig ansvarlig
forbrugeradfærd til række øvrige constructs såsom ”knowledge”. Jf. Stone m.fl. (1995) bygger
definitionen samt den tilhørende multi-item scale (ECOSCALE) også på fem teoretiske constructs:
ability to act, attitude, willingness to act, behaviour og knowledge. Definitionen kan herved
betragtes som en operationalisering til en række mere observerbare constructs, som imidlertid stadig
har et abstraktionsniveau, således ingen ”single measures” kan måle dem perfekt. Det bør i den
forbindelse nævnes, at det er relationerne mellem disse constructs – fx attitude og behaviour, som
udgør rapportens grundlæggende problemstilling. Denne problemstilling analyseres ud fra den
metodisk baserede litteratur retning, hvorfor modelleringen af disse relationer ikke er formålet med
rapporten. Udgangspunktet kan derimod angives via følgende teoretisk baserede strukturelle model:
Kilde: Egen tilvirkning ud fra Stone m.fl. (1995) og 2009
- Attitude beskriver “a person`s enduring favourable or unfavorable evaluation and emotional
feeling towards some object or idea” (Kotler 2009, s. 861). I litteraturen har der længe været bred
enighed om, at miljøbevidste forbrugere må udvise positive attituder i forhold til miljøet (fx Ward
m.fl., 1973, Dunlap m.fl., 1978 og Jackson 1985). Visse forfattere dekomponerer dette construct
yderligere – fx Bennet (1974), som skelner mellem affektive og kognitive attituder.
- Knowledge i form af faktuel viden og awareness vedrørende miljømæssige problemstillinger og
emner generelt antages nødvendigt for en miljømæssig ansvarlig forbruger (fx Ward m.fl., 1973
Arcury 1990 og Holzer m.fl. 1990). En metaanalyse af Hines m.fl. (1986) er blot én ud af mange
studier, som modellerer sammenhængen mellem viden og miljømæssig ansvarlig forbrugeradfærd,
hvorudfra det konkluderes, at viden er en afgørende komponent for miljømæssig ansvarlighed.
Side 20 af 101
Miljømæssig ansvarlig forbrugeradfærd
Knowledge BehaviourAbility to act Willingness to actAttitude
Figur 1.4.2. Constructet miljømæssig ansvarlig forbrugeradfærd
- Willingness to act angiver den grundforudsætning, at miljømæssigt ansvarlige forbrugere også
skal have viljen til aktivt at handle ud fra deres attituder og viden (Stone m.fl., 1995). Dette krav om
et desire to act ses bl.a. i Ward m.fl. (1973), hvori det benævnes verbal commitment – svarende
individets sandsynlige fremtidige handlinger, hvilket da implicit angiver selve viljen til handling.
- Ability to act beskriver den forudsætning, at en miljømæssig ansvarlig forbruger også skal have
evnen til at handle ud fra dennes attituder, viden og vilje (Stone m.fl., 1995). Dette kan også tolkes
som et krav om en vis mængde logical reasoning, idet forståelse / erkendelsen af de mulige
handlingsalternativer er en forudsætning for at faktisk adfærd kan foretages (Daniels m.fl., 1964).
- Behaviour medfører største grad af miljømæssig ansvarlighed, idet denne komponent beskriver
forbrugerens faktiske adfærd. Det er bred enighed om, at reelt miljømæssigt ansvarlige forbrugere
må udvise sådanne faktiske handlinger i forhold til miljø (fx Ward m.fl. 1973, Bennet, 1974, Hines
m.fl. 1986). Den grundlæggende problemstilling i denne rapport er diskrepansen mellem denne
faktiske adfærd og en række selvrapporterede mål – fx attituder og viljen til handling (intentionen).
Ifølge Stone m.fl. (1995) er en miljømæssig ansvarlig forbruger ud fra ovenstående kendetegnet ved
en positiv attitude overfor miljøet, viden om miljømæssige emner, viljen og evnen til at handle
aktivt i en miljømæssig ansvarlig retning samt en faktisk udførelse heraf. At definere miljømæssig
ansvarlig forbrugeradfærd ud fra en enkelt dimension er da ikke udtømmende – om end særligt den
faktiske adfærd må anses som en nødvendig forudsætning (fx Hines m.fl. 1986). Sammenhængen
mellem disse fem dimensioner er vedvarende påvist og til stadighed genstand for forskning inden
for den modelbaserede litteraturretning (Neville m.fl., 2010). I den metodisk baserede litteratur er
det omvendt formålet at undersøge og hvis muligt forbedre målingen af disse constructs.
1.5. Afgræsninger
I dette sidste indledende afsnit vil der argumenteres for rapportens centrale afgrænsninger, herunder
de fravalgte oplagte perspektiver, som herved ikke er prioriteret nærmere undersøgt. Disse
afgrænsninger vedrører hovedsageligt fokusset på web surveys ift. PAPI og analyserne af SDR samt
RS og dermed ikke andre kilder til målefejl/bias. Desuden er der foretaget en anden central
disposition givet ved afgrænsningen af etisk forbrugeradfærd til dets signifikante underområde:
miljømæssig ansvarlig forbrugeradfærd. Argumenterne herfor er indirekte angivet i rapportens
Side 21 af 101
indledning. Disse kan kort opsummeres som: 1) områdets størrelse i forhold til andre områder inden
for etisk forbrugeradfærd, hvorudfra det vurderes som mest relevante, 2) dets brede implikationer -
fx makroøkonomisk og politisk, og dermed ikke blot med en marketing / strategisk relevans og 3)
dets vedvarende og sandsynlige fremtidige store betydning for virksomheder, forbruger og
samfundet som helhed. Rapportens resultater vil da have relevans også i et fremtidigt perspektiv.
Som det første argumenteres der for afgrænsningen til web surveys ift. PAPI. Fokusset på PAPI
følger af det faktum, at det har været og er den mest anvendte mode inden for etisk og miljømæssig
ansvarlig forbrugeradfærd, hvorfor omtalte gaps primært er identificeret ved PAPI
selvadministrerede spørgeskemaer. PAPI vurderes således at være mest relevante mode at tage
udgangspunkt i – dvs. at betragte som rapportens referencegruppe. Sammenligningen med web
surveys skal ses i forhold til den signifikante vækst inden for online marketing research – herunder
øget anvendelse af web surveys (Deutskens, 2006). Der bruges således et stadigt stigende beløb på
gennemførslen af kommercielle web surveys. Inden for videnskabelig forskning gælder også en
stigende anvendelse af WBS. Herudfra vurderes denne nyeste survey mode at være den mest
relevante. Dette understøttes også af de mange sandsynliggjorte fordele ved web surveys; såsom
lavere omkostninger, hurtigere responstid osv. (fx Carayon m.fl., 2009 og Lievens m.fl., 2009).
Eksempelvis er det blevet påstået, at web surveys hurtigt ville udkonkurrere lign. survey modes
(Deutskens, 2006), hvilket imidlertid ikke er sket. Den videnskabelige litteratur inden for web
surveys er efterhånden veletableret om end det er nyest opståede survey mode. Imidlertid gælder
der stadig visse områder, som ikke er fuldt ud undersøgt. Det gælder eksempelvis i forhold til SDR
og RS (Wiejters, 2006). Af den grund vurderes afgrænsningen til web surveys også at medføre et
reelt bidrag inden for denne litteratur. Andre survey modes såsom CATI, IVR og alm. face-to-face
interview var desuden ikke reelle alternativer. Fx vil der ikke kunne opnås relevante
stikprøverammer i form af telefonnumre og dataindsamling, som ikke er selvadministreret synes
uden for rapportens tidsmæssige rammer. Litteraturen for disse modes er desuden meget etableret.
Afslutningsvist vil der argumenteres for afgræsningen til SDR og RS. Valget af disse to mulige
kilder til målefejl er primært begrundet i kritikken fremsat i den metodisk baserede litteraturretning,
hvor det bl.a. er SDR og RS som påstås at kunne lede til omtalte gaps. Det synes i den forbindelse
også en rimelig antagelse, at SDR kan forekomme ved målingen af miljømæssig ansvarlig
forbrugeradfærd, idet der vil være items som kan lede til over- el. underestimation af respondentens
Side 22 af 101
sande position. På baggrund af den anvendte Likert skala vurderes det også sandsynligt, at der kan
gælde response styles, siden dette er påvist i en række tidligere studier (jf. Wiejters, 2006 og
Wiejters m.fl., 2010). Valget af SDR og RS medfører imidlertid fravalg af en række øvrige oplagte
kilder til målefejl. Det gælder i særdeleshed non-response error. Det skyldes, at der i talrige
undersøgelser er påvist forskellige responsrater mellem web og andre survey modes (fx jf. Miller
m.fl., 2008). Inden for denne rapports rammer har det imidlertid ikke været muligt at gennemføre en
sådan undersøgelse ud over en eventuel påvisning af forskellige responsrates. Forskelle medfører
ikke nødvendigvis error, hvis dem som ikke besvarer ellers er ens på tværs af modes. Dette kan ud
fra rapportens data adgang ikke tjekkes via såkaldte validitetsdata, hvorudfra respondenter og ikke
respondenter kan sammenlignes (Tourangeau m.fl., 2008). Web litteraturen inden for respons
rates / error er også betydelig – eksempelvis indikeret ved talrige meta-analyser (fx Carayon m.fl.,
2009)
2. Teoretisk ramme
I dette kapitel angives rapportens teoretiske ramme, - dvs. de begreber, modeller og hypotiserede
sammenhænge, hvorudfra problemformuleringens tre underspørgsmål vil besvares og diskuteres.
Som det første præsenteres rapportens position i forhold til measurement theory. Dernæst beskrives
det anvendte teoretiske fundament i forhold til constructet social desirability responding.
Afslutningsvist angives teoretiske definitioner og forklaringer i forbindelse med response styles.
2.1. Measurement theory
Udgangspunktet er en given test – dvs. ”a device for obtaining a sample of an object’s attributes”
(Bernstein m.fl. 1994). I denne rapport er objekterne bachelorstuderende ved Handelshøjskolen,
Aarhus Universitet og attributterne elementer af deres miljømæssige ansvarlige forbrugeadfærd.
Den centrale udfordring er målingen af sådanne relevante attributter – dvs. ”the assigning of
numbers to the objects in a systematic way as a means of representing properties of the objects”
(Yen m.fl., 2002). Måling er da kendetegnet ved tildelingen af numeriske symboler til de relevante
objekter med det formål at kunne kvantificere disses attributter. Dette skal ske systematisk – dvs.
via standardiserede procedurer, som har enkle regler, er praktisk anvendelige og uafhængige af den
givne administrator (Bernstein m.fl. 1994). Measurement theory er det teoretiske fundament for
Side 23 af 101
denne proces og kan defineres som ”attempts to describe, categorize, and evaluate the quality of
measurements, improve the usefulness and accuracy of these, and propose methods for new and
better instruments” (Yen m.fl., 2002). Denne rapport tager herved sit udspring i en måleteoretisk
problemstilling i form af en hidtidig unøjagtig måling, hvor modevalg evt. kan forbedre denne.
2.1.1. Klassisk test teori
Tests og tilhørende målinger er ingen entydig proces, hvorfor der gælder flere litteraturretninger
inden for måleteori – fx G Theory (Cronbach m.fl. 1963) og Item Respons Theory (fx Lord, Rasch
og Lazarsfeld). I denne rapport er udgangspunktet den klassiske test teori (fx Norvick 1966 og Yen
m.fl. 1979, 2002). En sådan test teori er en symbolsk repræsentation af de faktorer, som influerer de
observerede test scores. Ved klassisk test teori er fokus, hvordan målefejl kan påvirke disse
observerede scores (Yen m.fl., 2002). Denne retning er valgt, idet problemstillingen i rapporten er
to målefejls (SDR og RS) mulige påvirkning af de observerede scores ved målingen af miljømæssig
ansvarlig forbrugeradfærd. En test teori er kendetegnet ved dets antagelser. Den første antagelse ved
klassisk test teori kan beskrives som følgende (jf. Yen m.fl., 2002):
X=T+E (1)
Ovenstående antagelse beskriver, at den observerede score (X) for et givet objekt opnået gennem et
givet empirisk studie er summen af objektets sande score (T) og en målefejl (E). Der gælder da en
antagelse om additivitet for T og E påvirkning af X. Den sande score T er imidlertid ikke
observerbar, hvorfor denne er et teoretisk construct. Desuden er målefejlen E stokastisk – dvs.
beskriver ikke systematiske målefejl (såsom SDR og RS). I forhold til denne stokastiske målefejl
gælder endvidere følgende antagelser i den klassiske test teori (jf. Yen m.fl., 2002):
ε (X )=T (2)
ρET=0(3)
ρE1 E 2=0(4)
ρE1 T2=0(5)
Side 24 af 101
Antagelse 2 siger, at den forventede værdi af en observeret score X er dets sande score T. Denne
antagelse definerer herved T som gennemsnittet for den teoretiske fordeling af observerede scores
X, som ville opnås ved gentagne uafhængige tests af samme person ved samme type test. Antagelse
3 angiver, at målefejlen E er ukorreleret med de sande scores T. Dette medfører, at objekter med
forskellige sande scores ikke systematisk har forskellige målefejl. Den fjerde antagelse implicerer,
at målefejlen E ved to tests ikke korrelerer – således et givet objekts målefejl ved første test
forklarer målefejlen ved en anden test. Femte antagelse er, at der ikke er korrelation mellem
målefejlen E i en test og den sande score T i en anden. Ovenstående fem antagelser definerer
således tilsammen den stokastiske målefejl E og er de opfyldt gælder følgende (jf. Yen m.fl., 2002):
Parallele tests : X , X¿ , T=T¿∧σ E2 =σE ¿
2 (6)
τ−ævkvivante tets : X1 , X2∧T 1=T2+c12(7)
Ovenstående to antagelser gælder i forhold til to givne tests – eksempelvis test for miljømæssig
ansvarlig forbrugeradfærd via to forskellige survey modes. Under opfyldelse af antagelse 1-5 kan to
test uden yderligere antagelser klassificeres som enten parallelle eller τ−¿ ækvivalente. Parallelle
test, beskrevet ved antagelse 6, er kendetegnet ved to observerede scores X , X¿, hvis sande scores
T ,T ¿ er ens ligesom deres respektive error varianser σ E2 , σ E¿
2 Dette implicerer, at faktorer som leder
til målefejl har ens effekt på tværs af tests samt ens gennemsnit for X, ens varianser og korrelationer
mellem test scores. τ−¿ ækvivalente tests er jf. antagelse 7 beskrevet som to tests med observerede
scores X , X¿, hvis sande scores T 1 , T 2 forskel er givet ved den addiktive konstant c12 .Herudfra kan
sådanne tests have forskellige error varianser og det er sandsynligt, at den sande score T måles mere
nøjagtigt ved en af disse. Kravene til denne type test er herved mindre restriktive end ved parallelle
test, hvorfor τ−¿ ækvivalente tests ikke nødvendigvis er parallelle.
Via nævnte antagelser kan der udledes principper til evaluering af de klassiske kvalitetskriterier:
reliabilitet og validitet. Reliabilitet er defineret og fortolket på mange måder. Perfekt reliabilitet kan
defineres som ingen målefejl E (Churchil m.fl., 1979). To andre bud jf. Yen m.fl. (2002) er: 1) høj
korrelation mellem observerede scores og sande scores og 2) høj korrelation mellem observerede
scores ved to parallel tests. Problemet er i alle tilfælde den manglende mulighed for
operationalisering, idet sande scores fx ikke kan observeres. Derfor må reliabiliteten estimeres ud
Side 25 af 101
fra andre metoder. Det gælder fx test/retest eller parallelle former for reliabilitet (Bernstein m.fl.,
1994). Problemet herved er bl.a. de såkaldte carry-over effects – hvor individers erfaringer med
første test kan medføre bias i forhold til den sande reliabilitet. Disse problemer ikke gældende ved
intern-konsistens reliabilitet, hvor kun en test pr. individ er nødvendig (Yen m.fl. 2002). Metoden er
her deling af en given sample, hvorudfra Spear-Brown formel el. Cronbachs Alpha kan anvendes.
Validitet kan generelt beskrives som en tests evne til at måle det, som det har til formål at måle
(Yen m.fl. 2002), således forskellige observerede scores X skyldes de faktiske forskelle, som
ønskes målt, dvs. X = T (Churchil m.fl., 1979). Herudfra er reliabilitet en nødvendig, men ikke en
tilstrækkelig forudsætning for validitet. Validitet findes imidlertid i mange forskellige former. To
generelle typer validitet er henholdsvis ekstern og intern validitet. Førstnævnte vedrører, hvorvidt et
givet studiets resultater kan generaliseres til en bredere population. Intern validitet kan beskrives
som graden af sandhed for et givet studies påståede kausale relationer. En type validitet er også
kriterium relateret validitet, som anvendes når test scores måtte kunne forudsige et givet
adfærdskriterium. Prædiktiv validitet er da defineret, som test scores evne til at kunne forudsige
fremtidig adfærd (Yen m.fl. 2002). Concurrent validitet har tilsvarende definition, men evalueres til
forskel fra predictive validitet ikke ved en senere måling, men simultant med den initiale måling.
2.1.2. Constructs
I denne rapport tager de fleste empiriske målinger udgangspunkt i betegnelsen: miljømæssig
ansvarlig forbrugeradfærd. Denne proces er imidlertid underlagt den kompleksitet, at der er tale om
måling af et construct. I forhold til en given test vil et construct initialt defineres som: ”some
postulated attribute of people, assumed to be latently reflected in test performance” (Cronbach
m.fl., 1955). Et construct er herved latent, hvorfor det ved en given test ikke er direkte målbart. Den
måleteoretiske udfordring er da at udforme en metode, som kan muliggøre en indirekte måling af
denne direkte uobserverbare størrelse (fx Hair m.fl., 2006). I forhold til den klassiske test teori og
dets associerede statistiske teknikker kan denne metode initialt beskrives ud fra følgende figur:
Side 26 af 101
ξ
Figur 2.1.2. Målemodel for et construct
Kilde: Egen tilvirkning ud fra Lattin m.fl. (2003)
Et givet latent construct ξ kan herved relateres til de målbare variableX j via et dependens forhold,
hvori variablene antages afhængige af constructet (Brown, 2006). Disse variable er da beskrevet
som indikatorer for constructet. Det skyldes, at alle variable enkeltvis vil måle constructet
imperfekt, men tilsammen eventuelt kan udgøre en passende empirisk operationalisering af
constructet under forudsætning af deres relevans. I afsnit 3.3. statistiske teknikker vil det nærmere
beskrives, hvordan ovenstående målemodel statistisk estimeres ud fra faktoranalytiske teknikker.
For et givet construct kan der også udledes principper til evaluering af dets validitet og reliabilitet.
Dette nye validitetsbegreb (af Cronbach m.fl., 1955) kan defineres som en given tests og tilhørende
indikatorers evne til at måle det construct, som det har til formål at måle. En type construct validitet
er konvergent validitet, som beskrives ved graden af konvergens / delt varians mellem et givet
constructs enkelte indikatorer (Hair m.fl., 2006). En anden type er diskriminant validitet, som er
graden af et constructs sande distinktion til et andet construct (Lattin m.fl., 2003). Nomologisk
validitet angiver i den forbindelse, hvorvidt korrelationerne mellem constructs (i det såkaldte
nomologiske sæt) er meningsfulde (Hair m.fl. 2006). Sidste type construct validitet, som vil omtales
er content validitet. Denne subjektive type validitet er som det første udtrykt i face validitet, som er
en vurdering af hvorvidt indholdet af indikatorerne er konsistente med definitionen af det tilhørende
construct (Brown, 2006). Som det andet er content validitet forudsat logisk validitet, som er den
givne tests evne til at repræsentere alle relevante aspekter af det constructet (Yen m.fl., 2002). Ud
fra den tidligere diskussion af reliabilitet vil dette ift. constructs være en indikator / forudsætning for
konvergent validiteten og kan fx beregnes ud fra Conbachs alpha (Latin m.fl., 2003).
Ordet construct må mere uddybende defineres. Dets tilhørende abstraktionsniveau betyder, at bud
herpå primært findes i videnskabsteoretisk baseret litteratur. Symbolic constructs, intervening
variables og hypothetical entities er eksempler på typer af constructs nævnt heri (Hull, 1943 og
Tolman 1938). I denne rapport er udgangspunktet Meehl m.fl. (1948), som skelner mellem
intervening variables og hypothetical constructs. Førstenævnte beskrives som: “a quantity obtained
by a specified manipulation of the values of empirical variables; it will involve no hypothesis as to
Side 27 af 101
X1 X2 X3
the existence of nonobserved entities or the occurrence of unobserved processes”. Intervening
variables er herudfra kendetegnet ved empirisk summation – dvs. i sig selv uden det som Meehl
m.fl. kalder “content surplus”. Hypotetiske constructs (fx miljømæssig ansvarlig forbrugeradfærd)
er omvendt beskrevet som ”these involve terms which are not wholly reducible to empirical terms;
they refer to processes or entities that not directly observed” (s. 104). Herudfra har de en kognitiv
og faktuel reference udover selve de empiriske data, som har til formål at supportere dem.
Meehl m.fl. (1948) beskriver forskellen mellem hypotetiske constructs og intervening variables ud
fra tre dimensioner. Den første vedrører ordene til beskrivelse af constructet. Ved hypotetiske
constructs indgår ord, som ikke eksplicit er defineret ved empiriske relationer – dvs. ord som ikke
direkte kan reduceres til empiriske facts. I sådanne tilfælde er deduktion nødvendigt. Intervening
variables er omvendt kendetegnet ved ord, som er empirisk eksplicitte. Den anden dimension er
constructets logiske relation til facts. Opfyldelse af ”empirical laws” er her en nødvendig og
tilstrækkelig betingelse for ”sandheden” af intervening variable. For hypotetiske constructs er
opfyldelsen af sådanne empiriske love kun en nødvendig, men ikke en tilstrækkelig forudsætning
for dets validitet. Den tredje forskel beskrives ud fra kvantificeringen af constructet. Ved
intervening variables er en simpel gruppering / summation af dets relevante enheder ud fra
accepterede empiriske love tilstrækkeligt, hvilket imidlertid ikke gælder for hypotetiske constructs.
2.2. Social desirability responding
Allerede i 1930erne blev de mulige konsekvenser af SDR for et spørgeskemas validitet diskuteret i
psykometrisk litteratur (fx Bernreuter, 1933 og Vernon, 1934). SDR kan defineres som: ”answers
that make the respondent look good, based on cultural norms about the desirability of certain
values, traits, attitudes, interests, opinions, and behaviors” (De Jong m.fl., 2010). Den generelle
forklaring på SDR er da socialt baseret, hvorfor SDR også er beskrevet som content-based
responding (Wiejters, 2006 og Tourangeau m.fl., 2008). Litteraturen inden for SDR kan opdeles i to
retninger, hvor SDR betragtes som henholdsvis et kendetegn for items og et aspekt af respondentens
personlighed (De Jong m.fl. 2010). I denne rapport afgrænses der til teorierne udviklet ved
sidstnævnte retning og i særdeleshed de mange bidrag af Delroy L. Paulhus. Dette skyldes
retningens efterhånden fremskredne teoriudvikling - herunder den teoretiske konceptualisering af
SDR i Paulhus (2002), som beskrives som den mest omfattende pr. dato af fx De Jong m.fl.(2010).
Side 28 af 101
Definitionen af SDR i Paulhus (2002) er: ”the tendency to give overly positive self-descriptions”. I
form af ordet overly betones det, at SDR kun er relevant ved klar evidens for, at svar også er
”departure from reality” (s. 50). Empirisk er sådanne svar bl.a. observeret ved social ønskværdig
adfærd såsom at stemme (Belli m.fl. 2001) samt socialt uønsket adfærd som stof- og
alkoholmisbrug (Yan m.fl. 2007). Konsekvensen er her, at disse typer adfærd medfører henholdsvis
over- og underapportering (Tourangeau m.fl., 2008), hvorudfra item scores inflateres og deflateres.
SDR truer herved validiteten af data. Imidlertid er denne trussel en funktion af det undersøgte emne
og survey mode (fx Rips m.fl. 2000). Ved miljømæssig ansvarlig forbrugeradfærd synes det
rimeligt at antage, at spørgsmål om håndtering af affald, køb af miljøvenlige af produkter, osv. kan
fremprovokere SDR for visse respondenter – spørgsmålet er da om der gælder en mode effekt.
2.2.1. SDR som construct
Generelt har der været enighed om, at SDR er et meningsfuldt construct (Paulhus, 2002). Derimod
er den løbende operationalisering af dette construct sket ud fra forskellige perspektiver. Initialt blev
SDR fortolket som unidimensional – dvs. én generel form for SDR (fx i Edwards, 1957 og Messick
m.fl. 1958). Senere opstod opfattelsen af SDR i to forskellige former (fx Wiggins, 1959, Messick
1962 og Walker m.fl. 1962). Den opfattelse blev i betydelig grad bekræftet ud fra faktoranalysen i
Wiggins (1964), som viste to forholdsvis uafhængige klynger af mål for SDR. Disse to faktorer blev
benævnt Alpha og Gamma bias. Hovedparten af de mange multi-item scales for SDR (fx Marlowe-
Crowne SD-scale) har efterfølgende vist sig med en klar loading på én af disse faktorer. Dette har
ledt til en generel konsensus omkring denne empiriske / inducerede to-faktor model, hvorudfra dens
teoretiske fortolkning har været den centrale opgave. Det første bud herpå findes i Damarin og
Messick (1965), som omdøbte faktorerne til autistic bias in self-regard og propagandistic bias.
Førstnævnte beskrives som en defensiv fordrejelse af ens personlige selvopfattelse og er associeret
med personlighedstræk som selvværd og ego-resilency. Propagandistic bias er omvendt kendetegnet
ved forsøg på at fremme et ønsket offentligt omdømme og er fx linket til habitual lying og behov
for social anerkendelse. Et andet bud på fortolkning findes i Sackeim og Gur (1978, 1979 og
Sackeim, 1983). Heri skelnes der mellem self-deception og other-deception, som angiver
henholdsvis en urealistisk positiv selvfremstilling samt fordrejelse af ens selvbeskrivelser over for
omverdenen. Self-deception sker ubevist, hvorimod other-deception er bevidst og velovervejet.
Side 29 af 101
Med udgangspunkt i ovenstående SDR teorier startede Paulhus sin teoretiske fortolkning af Alpha
og Gamma faktorerne. Initialt foreslog han betegnelserne self-deception og impression management
(Paulhus, 1984). Impression management (IM) beskriver et bevidst valg af svar med det formål at
skabe et positivt socialt image eller jf. Paulhus (1998, s. 1029): ”purposeful tailoring of responses
to impress an audience”. IM svarer herved til faktoren other-deception af Sackeim og Gur med den
forskel, at IM ikke udtrykker ”deliberate lying”, men et aspekt af respondentens personlighed
(Paulhus, 1991). Self-deception (SD) har samme fortolkning som af Sackeim og Gur – dvs.
urealistiske selvbeskrivelser, som imidlertid er respondentens sande selvopfattelse. Denne ubevidste
form for SDR viderefortolkes i Paulhus (1988) ved at dekomponere SD til henholdsvis self-
deceptive enhancement (SDE) og self-deceptive denial (SDD). SDE beskrives som angivelsen af
”enhancement”- dvs. positive egenskaber såsom intelligens. SDD udtrykker derimod ”denial”, dvs.
nægtelse af negative egenskaber såsom alkoholmisbrug, brug af prostituerede, osv. (Paulhus, 2002).
2.2.2. Paulhus SDR teori
Seneste teoretiske fortolkning af Alpha og Gamma faktorerne ved Paulhus er hans ”final two-tier
conception” (Paulhus, 2002). Deri beskrives de som to constructs af ”traits and biases”, som kan
henføres til de fundamentale værdier agency og communion (Paulhus m.fl., 1998). En stor tendens
til disse værdier medfører SDR, som kaldes egoistic bias og moralistic bias jf. nedenstående figur:
Kilde: egen tilvirkning ud fra Paulhus (2002), s. 64
Side 30 af 101
Social desirability responding
Egoistic bias Moralistic bias
Agency Management
Communion Management
Self-deceptive Enhancement
Self-deceptive Denial
Figur 2.2.2. Paulhus SDR two tier system
Associeret med moralistic og egoistic bias er henholdsvis Gamma og Alpha faktorerne. Herudfra
indeholder begge disse faktorer self-deceptive og impression management og kan desuden skelnes
ud fra ”personality content”. Ovenstående two-tier system angiver herved både et ”content level”
(agency / communion) og et “proces level” (conscious / unconscious) – dvs. i alt fire typer SDR.
- Egoistic bias er på den ene side SDE, som angiver overdrivelse af ens sociale og intellektuelle
status (Paulhus, 2002). Denne form for self-deception er beskrevet som urealistisk positiv
selvopfattelse i forhold til personlighedstræk som dominans, frygtløshed, følelsesmæssig stabilitet,
intellekt og kreativitet (Paulhus m.fl., 1998). Disse træk er agentic – dvs. beskriver prominens og
status. Høje SDD scores antyder derfor narcissisme og en ”superhero” selvopfattelse. Egoistic bias
omfatter også agency management (AM), som er kendetegnet ved bevist ”pral” i forhold til ens
kompetencer, frygtløshed og fysiske styrker. AM er herved en særlig type impression management.
- Moralistic bias indeholder SDD, som beskriver benægtelsen af socialt afvigende adfærd samt
overdreven selvrapportering af ”saint-like” attributter (Paulhus m.fl. 1998). Denne type self-
deception er da kendetegnet ved inflaterede mål for communion personlighedstræk såsom
agreeableness (samarbejdsvillighed og varme) og conscientiousness (ansvarlighed, pligtopfyldelse
og orden). Høje scores ved SDD antyder herved respondenter med en selvopfattelse som ”engle”.
På impression management niveau, indeholder moralistic bias communion management, som
beskriver bevidst bortforklaring og generel minimering af fejl / damage control (Paulhus, 2002).
2.3. Response styles
I generel metodisk litteratur har det længe været anerkendt, at indholdsmæssigt irrelevante faktorer
(såsom anvendte rating skala) kan påvirke svarene på et spørgeskemas forskellige items (fx Lentz,
1938 og Cronbach, 1946). Denne problemstilling er bl.a. benævnt response styles, response sets og
response bias (Baumgartner m.fl., 2001 og Wiejters, 2006). I denne rapport anvendes begrebet
response style (RS), som via O’Neil (1967) kan defineres som:”behavior patterns where the
individual tends to select disproportionately a particular response category regardless of item
content”. En tilsvarende definition findes i Paulhus (1991): “A systematic tendency to respond to a
range of questionnaire items on some basis other than the specific item content”. RS er herudfra
karakteriseret som non-content based responding. Det betyder, at RS ikke er afgrænset til bestemte
items – såsom socialt følsomme, men derimod hele spørgeskemaets. Endvidere er implikationen, at
Side 31 af 101
respondenters svar ikke nødvendigvis udtrykker deres faktiske holdninger. Det samme svar ved et
givet item kan da have forskellig betydning for forskellige respondenter (Rossi m.fl., 2001). Den
grundlæggende problemstilling er derfor, at RS kan invalidere de selvrapporterende survey data.
2.3.1. Typologi for response styles
Det overordnede begreb response style må nærmere operationaliseres i form af forskellige typer RS.
Derfor vil der i det følgende beskrives fire konkrete RS identificeret over en længere periode i
metodisk litteratur. I den forbindelse bør det nævnes, at der i denne litteratur er identificeret langt
flere RS, løbende angivet med forskellige navne og målt på forskellige måder (fx i Wirt m.fl. 1958
og Messick, 1968). Dette afsnits fire RS anses imidlertid for at være de mest citerede (jf.
Baumgartner m.fl., 2001), hvorfor deres teoretiske fundamenter er valgt nærmere beskrevet.
- Acquiescence response style (ARS) kan ud fra Martin (1964), Ray (1983) og Wiejters, (2006)
defineres som ”the tendency to make disproportionate use of response categories in the
favorable/agreement side of the agreement rating scale”. ARS er da kendetegnet ved enighed i
items uanset disses indhold. Synonyme betegnelser for ARS er derfor også agreement tendency,
yea-saying eller positivity (Baumgartner m.fl., 2001). En nærmere operationalisering af ARS kan
eksempelvis ske med udgangspunkt i Watson (1992), som foreslår, at ARS måles som graden af
enighed i såvel positive som negative formulerede items inden for samme skala. I denne rapport
anvendes en 5 punkts Likert skala, hvori ARS da kan være givet ved svarene delvist enig og meget
enig samt delvist sandt og meget sandt (spørgeskemaer er angivet i bilag 1-2). Flere teoretiske
forklaringer af ARS findes. Fx påstås ARS gældende, hvis items er tvetydigt og svagt formuleret
samt ved emner, hvor respondenten føler sig usikre / med manglende viden (Messick, 1967, Ray
1983 og Paulhus, 1991). Jf. McGee (1967) kan ARS forklares ved mangel på en passende mængde
kognitive ressourcer – fx i en kontekst præget af tidspres og generelle forstyrrelser. I forhold til den
givne respondent er ARS også forklaret ved dennes lave sociale status eller generelle mangel på
kognitive kapabiliteter (Presser m.fl. 1981 og Nathan m.fl. 1997). Endeligt beskrives ARS som
særligt gældende for udadvendte personligheder, som søger eksterne stimuli og tenderer til
impulsivt at accepterer andre personers påstande (Keniston m.fl., 1960 og Messick, 1991).
Side 32 af 101
- Disacquiescence response style (DRS) kan beskrives som det modsatte af ARS. DRS er derfor
kendetegnet ved tendensen til at være uenig i items uanset disses indhold (Keniston m.fl., 1960 ).
Denne uforholdsmæssige brug af uenigt indikerende svarmuligheder på en given rating skala er i
litteraturen også benævnt disagreement tendency, nay-saying eller negativity (Baumgartner m.fl.,
2001). Operationaliseres DRS inverst af ARS, da vil DRS i denne rapport kunne komme til udtryk i
svarmulighederne delvist uenig og meget uenig samt delvist usandt og meget usandt. Et teoretisk
perspektiv på DRS findes bl.a. i Keniston m.fl. (1960) og Bachman (1984), hvori DRS forklares
som en manifestation af grundlægende personlighedskarakteristika. Via en anvendelse af forskellige
personlighedstest beskrives DRS i Keniston m.fl. (1960) som et kendetegn for indadvendte
personligheder, som er kontrolsøgende, refleksive samt ønsker at undgå eksterne stimuli.
- Midpoint response style (MRS) kan defineres som ”the tendency to make disproportionate use of
the middle response category” (Baumgartner m.fl., 2001 og Wiejters m.fl., 2010). MRS kan herved
beskrives som tendensen til valg af et eventuelt midtpunkt på en rating skala uanset indholdet af det
tilhørende item. I denne rapports spørgeskemaer vil MRS da udelukkende kunne være gældende i
forhold til svarmuligheden neutral. Teoretiske forklaringer på MRS er bl.a. beskrevet i Messick
(1968) samt Presse (1981) og kan herudfra opdeles under tre hovedpunkter jf. Baumgartner m.fl.
(2001). For det første kan MRS skyldes evasiveness – dvs. den situation, hvor respondenten ikke
ønsker at afsløre sine faktiske holdninger om et givet item. MRS kan også være forårsaget af
indecision, hvilket angiver den tilstand, hvor respondenten er usikker på sin holdning for det givne
item. For det tredje kan MRS forklares med respondentens indifference – dvs. dennes manglende
interesse i det emne / emner, som de givne survey items eksplicit er designet til at måle.
- Extreme respone style (ERS) kan med udgangspunkt i Greenleaf (1992) defineres som ”the
tendency to endorse the most extreme response categories regardless of content” . ERS er derfor
karakteriseret som valget af yderpunkter på en rating skala uden det kan forklares via item indhold.
I forhold til denne rapports skala kan ERS da komme til udtryk i svarene meget uenig, meget enig,
meget usandt og meget sandt. Teoretiske forklaringer på ERS findes bl.a. i Hamilton (1968), hvori
ERS beskrives som refleksion af selvsikkerhed, ”stivhed” samt lav tolerance over for flertydighed.
Endvidere angives det, at ERS er associeret med høj grad af bekymring samt sandsynligvis også
udtryk for afvigende adfærd. Af O`Donovan (1965) fremgår det, at ERS særligt er fremtrædende
ved meningsfulde stimuli – dvs. stimuli, som opfattes vigtige eller er involverende for den givne
Side 33 af 101
respondent En anden psykologisk forklaring findes i Shulman (1973), hvor ERS henføres til
respondenter med lavt differentierede kognitive strukturer samt svagt udviklede kognitive skemaer.
Ovenstående fire typer RS: DRS, MRS, ARS og ERS kan i forhold til rapportens anvendte 5-punkts
Likert skala således grafisk summeres / illustreres ud fra følgende figur:
Kilde: egen tilvirkning
I forhold til efterfølgende mode sammenligning vedr. response styles, er det således overstående
operationalisering ved anvendte 5-punkts Likert skala, som er gældende. Dette er valgt angivet, idet
denne sammenligning tager udgangspunkt i en matematisk transformation af de indsamlede data,
hvorudfra ovenstående definitioner ikke eksplicit vil fremgå. Derimod vil de eksplicit være en del af
de metoder / formler hvorudfra de matematiske transformationer af data er foretaget.
3. Metodisk fundament
I dette kapitel angives rapportens metode – dvs. de systematiske procedurer og processer, hvorudfra
problemformuleringens tre forskningsspørgsmål besvares. Først redegøres der for konstruktionen af
rapportens instrumenter i form af web og PAPI spørgeskemaerne. Dernæst beskrives processen for
datagenerering. Som det tredje angives de statistiske teknikker, som denne data vil analyseres ud
igennem. Afslutningsvist sættes rapportens dispositioner i et videnskabsteoretisk perspektiv.
Side 34 af 101
5 3 2 1 4
MRS ARSDRS
ERS
Figur 2.3.1. Response styles: DRS, MRS, ARS og ERS ved en 5-punkts Likert skala
3.1. Spørgeskemakonstruktion
Idet rapportens formål er en survey mode sammenligning, bliver konstruktionen af de tilhørende
spørgeskemaer en central del af metoden. Denne konstruktion er sket med udgangspunkt i
rapportens teoretiske ramme, feedback fra deltagerne i en række løbende prætest samt det Olsen
(2005) kalder evidens baserede råd – dvs. anbefalinger ud fra forskning i spørgeskemadesign1.
3.1.1. Prætest af spørgeskema
Ved konstruktionen af rapportens to spørgeskemaer tilsluttes argumentet i Fowler og Mangione
(1990) om, at ikke alle problemer kan forudsiges på forhånd bag ”desken”, hvorved undersøgelser i
”feltet” er nødvendige. Herudfra blev det besluttet at afholde en række prætest af såvel PAPI som
web spørgeskemaerne – dvs. sampling af et mindre antal respondenter, hvor de nøjagtige
procedurer for undersøgelsen blev forsøgt overholdt, efterfulgt af et møde med disse personer
(Olsen, 2005). Det overordnede formål var at kvalitetssikre instrumenterne for at minimere målefejl
forårsaget af dårligt design, uklare spørgsmål, osv. og herudfra mest effektivt kunne påvise
eventuelle mode forskelle. Jf. Brace (2008) svarer det til en sikring af de klassiske kvantitative
kvalitetskriterier: reliabilitet og validitet - kort beskrevet: konsistente svar fra samme survey univers
og en måling af det som ønskes målt. Den anvendte multi-item skala ECOSCALE (se afsnit 3.1.2)
er desuden ikke tidligere anvendt i Danmark (Stone m.fl., 2009), hvorfor dens oversættelse og
ukendte egenskaber i feltet må testes inden den endelige undersøgelse blev igangsat. Prætestene er
participant pre-testing (Blumberg, 2005). Det skyldes, at samplingen er foretaget ud fra bachelor
studerende ved Handelshøjskolen, Aarhus Universitet – dvs. undersøgelsens tilsigtede population,
hvorfor deltagere fra denne gruppe er vurderet mest relevant (se afsnit 3.2.1.). Testenes metodiske
fundament bygger på kvalitative principper. Det skyldes behovet for nærmere at kunne spørge ind
til deltagernes holdninger og reaktioner, hvilket er mest oplagt via dialog og diskussion (Flick,
2009). Som dataindsamlingsmetode er primært valgt fokusgruppeinterview. Det skyldes
muligheden for en dynamisk meningsudveksling / diskussion, som bl.a. kan motivere de enkelte
deltagere og skabe et større og mere nuanceret datamateriale ved at de inspirerer / foreslår hinanden
nye perspektiver. Lukkede spørgsmål og en objektiv distance fra undersøgerens side er herved ikke
1 Jf. Lietz (2010, s. 249-250) kan der identificeres to retningen inden for denne litteratur: en kognitiv og
kommunikationsbaseret. I denne rapport vil der ikke nærmere skelnes mellem retningernes respektive bidrag, men
derimod tilstræbes en komplementær anvendelse af disses resultater og tilhørende anbefalinger.
Side 35 af 101
foretrukket, da det vil hæmme genereringen af sådanne kvalitative data. En kvantitativt baseret
prætest synes desuden ikke implementerbar ved anvendte statistiske teknikker (se afsnit 3.3.), idet
det vil kræve en betydelig stikprøvestørrelse fra en i forvejen meget begrænset population.
Ved første prætest blev et PAPI spørgeskema afprøvet på fokusgruppe af fire deltagere, hvis råd
dannede udgangspunkt for første revision af instrumentet. Herefter blev det reviderede spørgeskema
opsat i en webversion og afprøvet på en ny gruppe af fire personer. Prætest af flere omgang blev
prioriteret, idet det er usandsynligt, at alle fejl og uhensigtsmæssigheder bliver opdaget ved første
møde (Olsen, 2005). Derudover er det centralt at få feedback på de ændringer, som foretages
undervejs. Prætest af såvel PAPI som web-udgaven blev også vurderet nødvendigt, idet særligt de
tekniske aspekter ved web-udgaven måtte afprøves. Proceduren var i begge tilfælde, at deltagerne
brugte ca. 10 minutter på at besvare spørgeskemaet, hvorefter en fælles diskussion på ca. 20-25
min. fandt sted i et lokale på Handelshøjskolen, Aarhus Universitet. Den tidslængde blev vurderet
passende i forhold til opretholdelse af deltagernes motivation og deres initiale accept af deltagelse. I
tillæg til denne mere strukturerede procedure blev der også gennemført en række mere uformelle
tests – fx ved at sende web-udgaven til medstuderende, som herefter tilbagesendte kommentarer.
Deltagerne i prætestene blev samplet ud fra princippet maximal variation – dvs. så forskellige
respondenter som muligt (Flick, 2009, s. 122). Denne tilsigtede variation skulle medføre, at
deltagerne var heterogene i deres holdninger / reaktioner, hvorudfra flest mulige aspekter ved
spørgeskemaerne kunne diskuteres. Ud fra dette princip bestod fokusgrupperne af én dreng og pige
fra en økonomisk bachelor uddannelse og én dreng og pige fra en sporlig / kommunikationsmæssig
bacheloruddannelse – dvs. et køn for hver af de to overordnede udannelsesgrupper. Sampling ud fra
disse dimensioner er motiveret af forskning som viser, at spørgeskemaer samt miljømæssig
ansvarlighed opfattes forskelligt an på bl.a. køn og uddannelse (fx Stone m.fl., 2009 og Lietz 2010).
Sidste element i planlægningen af prætestene var en plan for anvendelsen af den indsamlede data.
Det blev her besluttet, at ingen systematisk kvalitativ dataanalyse eller transskribering skulle
foretages, idet rapportens metodiske fundament er kvantitativt / statistisk samt at der anvendes
allerede validerede multi-item scales. Derfor var anvendelsen case-baseret, hvor den enkelte
deltageres holdninger blev sammenholdt med generel forskning inden for spørgeskemadesign samt
det Olsen (2005) kalder almindelige ”common sense” principper. De konkrete resultater / ændringer
på baggrund af de gennemførte prætests præsenteres løbende som en del af de to næste afsnit.
Side 36 af 101
3.1.2. Valg af multi-item scales
Formuleringen af hensigtsmæssige spørgsmål udgør en central del af spøgeskemakonstruktionen.
Velformulerede spørgsmål er nødvendige, hvis den efterfølgende kommunikationsproces med
respondenten skal blive succesfuld (Brace, 2004). Kan respondenten ikke ”kode” de enkelte
spørgsmål vil der være stor risiko for høj non-response rate og en generel ringe datakvalitet (Lietz,
2010). I denne rapport skal der formuleres spørgsmål for de to constructs miljømæssig ansvarlig
forbrugeradfærd og social desirability responding (SDR). Der er i den forbindelse blevet anvendt
spørgsmålene i to allerede udviklede multi-item scales: ECOSCALE af Stone m.fl. (1995 og 2009)
samt Balanced Inventory of Desirable Responding (BIDR) af Paulhus (1988). Det skyldes, at disse
scales vedvarende har demonstreret forskellige typer af validitet samt bygger på solide teoretiske
fundamenter. I dette afsnit vil der mere konkret argumenteres for valget af disse skalaer.
3.1.2.1. ECOSCALE
Ved måling af miljømæssig ansvarlig forbrugeradfærd kan der vælges blandt et meget stort antal
multi-item scales med færdigudviklede spørgsmål om fx attituder og viden vedrørende miljøet
(Duckitt m.fl., 2010). Imidlertid er der kun tre skalaer, som er bredt anvendt og herudfra har fået
gennemtestet mål for validitet og reliabilitet (Fransson m.fl. 1999 og Dunlap m.fl. 2003). Disse er
the Ecology Scale (Ward m.fl. 1973 og 1975), Environmental Concern Scale (Weigel m.fl., 1978)
og the New Environmental Paradigm (NEP) scale (Dunlap m.fl. 1978 og 2000). To førstnævnte har
items til måling af constructs såsom viden, attituder og adfærd i forhold til miljø. Imidlertid er disse
spørgsmål i deres umiddelbare form overvejende forældede. Det skyldes, at de er udviklet i
1970erne, hvorefter der er opstået en række nye temaer / problemstillinger inden for miljø (Dunlap
m.fl. 2002 og 2003) NEP skalen kan kategoriseres som ecocentric, idet den har 12 items til måling
af attituder om mennesket som en integreret del af naturen (Duckitt m.fl., 2010). Skalaen er da ikke
designet til at måle forbrugeradfærd, hvorfor dens anvendelse ikke er passende i denne rapport.
Udfordringen var derfor at finde en mindre gennemtestet skala, som både målte relevante constructs
i forhold til miljømæssig ansvarlig forbrugeradfærd og samtidigt havde opdaterede spørgsmål.
Valget blev i den forbindelse den 31-item lange ECOSCALE af Stone m.fl. (1995 og 2009).
Side 37 af 101
ECOSCALE operationaliserer definitionen på miljømæssig ansvarlig forbrugeradfærd i afsnit 1.4.2.
Denne skala blev første gang publiceret i 1995 og udkom i 2009 i en revideret udgave, hvorfor den
vurderes at have opdaterede / relevante items. Disse items er primært udledt fra tidligere skalaer - fx
the Ecology Scale, hvorved ECOSCALE har et såvel solidt empirisk som teoretisk fundament.
2009-udgaven af ECOSCALE er også testet i flere forskellige lande med tilfredsstillende mål for
validitet og reliabilitet (Stone m.fl. 2009, s. 36). Derfor er dens anvendelse ikke afgrænset til én
bestemt kultur / land. I forhold til reliabilitet / intern konsistens målt ved Cronbachs alpha har
skalen vedvarende haft værdier over de anbefalede 0,7 (Lattin m.fl. 2003) – fx 0,72, 0,78, 0,85 og
0,93 (Stone m.fl. 1995, 2009, Clump m.fl. 2003 og Luc m.fl. 2009). I Stone m.fl. (1995 og 2009)
etableres der også evidens for skalaens face og prædikative validitet samt generel construct validitet
via konfirmativ faktoranalyse (1995, s. 608-610). ECOSCALE indgår desuden i den anerkendte bog
”Hanbook of marketing scales” af Bearden m.fl. (1999), hvilket også indikerer dens validitet.
Anvendelsen af ECOSCALE er imidlertid ikke uproblematisk. Første hovedproblematik er skalaens
begrænsede gennemtestning / anvendelse. Herudfra er der kun få tilgængelige mål for dens
reliabilitet og validitet. I forhold til sidstnævnte er alle typer validitet ikke testet – fx diskriminant
validiteten (Stone m.fl. 1995). Den manglende gennemtestning betyder også, at der endnu ikke er
etableret en fast faktorstruktur / measurement model for de 31 items (Stone m.fl. 2009). Denne
struktur er i særdeleshed ukendt ved danske respondenter, idet skalen ikke tidligere har været
anvendt på danske data. ECOSCALE er primært anvendt på studenterpopulationer (fx Clump m.fl.
2003), hvorved dens generaliserbarhed også kan synes tvivlsom. Den anden hovedproblematik er
formuleringen af spørgsmål. Visse spørgsmål er meget lange – fx det første: ”Økonomisk
velstående lande…”, hvilket jf. (Dillmann, 2000 og Fink, 2003) kan medføre, at respondenterne
ikke kan overskue dem. I den forbindelse kan række af spørgsmålene også betegnes som double-
barrelled, idet flere begreber og verber indgår i samme spørgsmål, hvilket også kan medføre
unøjagtige svar (fx Fowler, 1992 og Zouwen, 2000). Dette kan også forårsages af en række meget
generelle betegnelser såsom ”tung industri” samt visse ”vage” formuleringer som ”rutinemæssigt”
(fx Martin, 2002, White 2005 og Krumpal m.fl. 2008). For at opnå konsistens reliabilitet er 14 items
reverse coded / negatively worded, hvilket dog medfører betydelig risiko for misforståelse, idet de
tager længere tid at forstå /afkode (fx Carpenter m.fl. 1973 og Foddy, 1993). Deltagerne i
prætestene gav også udtryk for, at en række af spørgsmålene var vanskelige at læse og enkelte
direkte uforståelige. Herudfra måtte flere spørgsmål i større eller mindre omfang omformuleres. Det
Side 38 af 101
gjaldt fx formuleringen: ”I regularly do things such as cut up the plastic rings on six-packs of soft
drinks”, idet ingen af deltagerne forstod meningen / baggrunden for denne indledning.
3.1.2.2. BIDR
Måling af social desirability responding (SDR) foretages ud fra mange forskellige metoder og
forskningsdesign (Leite m.fl., 2010). En kendt teknik er fx bogus pipeline (Jones m.fl., 1971), hvor
respondenterne tilkobles en elektronisk maskine, som påstås at kunne læse deres attituder, således
der gælder incitament til at angive sande svar. The randomized response technique er en anden ofte
anvendt teknik (fx Warner, 1965 og De Jong m.fl. 2010), hvor et SDR følsomt spørgsmål
kombineres med et neutralt, hvoraf ét af dem tilfældigt udvælges uden undersøgeren ved hvilket,
således der er mindre pres / incitament til socialt acceptable svar. Den mest udbredte metode er
brugen af særlige SDR scales sammen med undersøgelsens fokale skala (Paulhus, 1991 og Leite
m.fl. 2010). Den tilgang anvendes i denne rapport via skalen Balanced Inventory of Desirable
Responding (BIDR) af Paulhus (1988), idet den operationaliserer Paulhus teorierne omtalt i afsnit
2.2. Derudover er to førstnævnte tekniker kun anvendelige ved eksperimentelle forskningsdesign.
BIDR 6. udgave (1988) indeholder 40 items, hvoraf 20 måler self-deception enhancement (SDE) og
20 impression management (IM). Senere forskning (fx Pauls m.fl. 2003 og Aavik m.fl., 2006) har
påvist, at disse SDE og IM underskaler kan anvendes til måling af henholdsvis egoistic og
moralistic bias. BIDR er da en operationalisering af rapportens teoretiske fundament. En væsentlig
styrke ved denne skala er også dens omfattende anvendelse / gennemtestning (De Jong m.fl. 2010).
Skalen har i den forbindelse vedvarende opnået acceptable værdier ved forskellige mål for
reliabilitet og validitet (fx Meston m.fl. 1996, Pauls m.fl. 2003 og Roth m.fl. 2007). Det gælder fx i
De Jong m.fl. (2010), hvor BIDR anvendes ved en stikprøve af 12.424 respondenter fra 26
forskellige lande (herunder Danmark) og 4 kontinenter. Resultaterne heraf indikerer, at skalaen
stadig er brugbar i dag samt på tværs af mange lande / kulturer. Frem for alt er der også evidens for,
at skalaen ”fitter” danske data. Der synes herudfra passende empirisk og teoretisk belæg for, at
BIDR items kan anvendes ved opstilling / estimation af en målemodel for SDR. Med hensyn til
formuleringen af spørgsmål vurderes skalen også overvejende hensigtsmæssig - fx indikeret ved at
deltagerne i rapportens løbende prætests gav udtryk for forståelse og en klar formulering af disse.
Side 39 af 101
En praktisk ulempe ved BIDR er det store antal items, som kombineret med den fokale skalas items
ofte medfører et meget langt spørgeskema. En række BIDR items er også kontroversielle – fx ”jeg
har tvivlet på mine evner som elsker” (Paulhus, 1991, s. 40). Disse forhold øger risikoen for høj
item non-response samt non-response for spørgeskemaet som helhed. I denne rapport vil en mulig
konsekvens være for små stikprøver til passende at kunne anvende valgte statistiske teknikker.
Derfor er der afgrænset til 10 items fra hver af SDE og IM underskalaerne - i begge tilfælde
henholdsvis 5 positivt og 5 negativt kodede. En kritik af BIDR og øvrige SDR scales er også, at de
er diagnostiske – dvs. kun indikerer, men ikke kontrollerer for bias pga. SDR (fx Leite m.fl., 2010).
En anden kritik er, at metodikken for deres efterfølgende anvendelse kun er svagt udviklet og
primært kendetegnet ved test af bivarate korrelationer mellem items i SDR og den fokale skala. Via
de meget personlige spørgsmål kan brugen af BIDR også ses som etisk problematisk og ved denne
rapports løbende dataindsamling har flere respondenter også reageret meget kraftigt på dens items.
3.1.3. Design af spørgeskema
Med udgangspunkt i ovenstående skalaers items kunne rapportens spørgeskemaer opstilles. Første
side i PAPI udgaven er en indledning, hvor afsender, projektets formål, skønnet tidsforbrug, en
garanti om anonymitet og præmier ved deltagelse er angivet (se bilag 1). Visse af disse oplysninger
var i web-udgaven en del af den e-mail invitation, som respondenterne initialt modtog (se bilag 2).
Formålet med oplysningerne var dog i begge tilfælde at vække modtagerens interesse og motivation
for deltagelse. En kort angivelse af projektets formål blev vurderet nødvendigt for at sikre validitet
ved at respondenterne efterfølgende kunne forstå, hvad items havde til formål at måle / var relateret
til. Anonymitet måtte i højeste grad betones ud fra de valgte meget følsomme BIDR items. Præmier
og en angivelse af skønnet tidsforbrug blev vurderet nødvendige. Af prætestene blev det fx
fremført, at brugbare præmier og skøn for tidsforbrug normalt var en forudsætning for villigheden
til deltagelse i surveys. Couper (2000) påpeger også den store risiko for høj non-response rate ved
list-based WBS og deraf risiko for non-response error. I Fallensen m.fl. (2010) er det påvist, at
præmier øger responsraten ved de undersøgte danske respondenter, hvorfor præmier blev vurderet
som en brugbar løsning ift. denne risiko. For at sikre validiteten blev respondenterne også bedt om
at angive så præcise svar som muligt samt givet instruktioner til evt. at ændre svar ved PAPI.
Side 40 af 101
De 31 ECOSCALE og 20 BIDR items blev inddelt i de 4 grupper / batterier: Om miljøet, dig og
miljøet, om dig og dit forhold til andre. Formålet var at gruppere inden for samme tema og herudfra
give en kort introduktion. Blair m.fl. (1977) og Andrews (1984) har påvist, at en sådan logisk
strukturering giver højere data kvalitet. Rækkefølgen for disse batterier følger anbefalingerne om at
placere demografiske og andre følsomme spørgsmål til sidst (fx Presser, 1986 og Oppenheim,
1992). Herudfra blev batterierne af ECOSCALE items placeret før batteriet af BIDR items.
Desuden blev BIDR items placeret før det afsluttende batteri: fakta om dig, idet evt. angivelse af
kontaktinfo før besvarelsen af BIDR items blev vurderet at kunne fremprovokere meget høj item-
nonrespons. Rækkefølgen af items inden for de 4 første batterier er valgt ud fra anbefalingen om
generelle spørgsmål før specifikke (fx Sudman m.fl. 1992 og Bater m.fl. 2006). I den forbindelse
har prætestene indikeret behovet for, at hvert af disse batterier blev fordelt over 2 sider for
webudgaven (jf. bilag 2) med det formål at skabe mere overskuelighed / øget læsbarhed.
Svarmulighederne ved ECOSCALE items tager udgangspunkt i en balanceret 5-punkts Likert skala
gående fra meget uenig til meget enig. Det antal svarkategorier anvendes også i Stone m.fl. (1995)
og (2009) og er inden for de generelle anbefalinger (Lietz 2010, s. 260-261). Midtpunktet neutral er
medtaget, så der ved senere analyse kan undersøges midtpoint respons style. For at skabe et
konsistent spørgeskema er samme type Likert skala anvendt ved BIDR - her gående fra meget
usandt til meget sandt. Valget af disse verbale svarmuligheder følger af de oprindelige skaler. Et
muligt problem er dog, at respondenter kan tolke disse betegnelser forskelligt (fx O’Muircheartaigh
m.fl. 1993). Svarmuligheden ved ikke indgår ikke i spørgeskemaerne, idet det vurderes at
respondenterne har forudsætningerne for besvarelse. I den forbindelse gives der mulighed for item-
nonrespons, hvis det ikke måtte være tilfældet. En forced answering strategi vil desuden sjældent
give anderledes resultater (fx Roster m.fl., 2010) og kan ses som uetisk at påføre ved BIDR items.
3.2. Datagenerering
Med udgangspunkt i de færdigudviklede web-based og PAPI spørgeskemaer kunne rapportens
datagenerering igangsættes for at skabe det empiriske grundlag for efterfølgende analyser. Denne
datagenerering måtte ske ud fra en given population og tilhørende stikprøveramme, hvorudfra
statistisk sampling og den praktiske dataindsamling kunne foretages.
Side 41 af 101
3.2.1. Population
Den relevante population kan i første omgang afgrænses til en B2C population, idet der undersøges
forbrugeradfærd. Ved miljømæssig ansvarlig forbrugeradfærd kan der yderligere afgrænses til
segmenter såsom green vs. grey consumers (Young m.fl., 2010). I forhold til denne rapports
problemstilling er der i litteraturen ikke eksplicit skelnet mellem sådanne grupper, men i stedet
fremsat en mere generel problematisering. Af den grund vurderes rapportens relevante population
den samlede gruppe af danske forbrugere. I den forbindelse kunne der med fordel afgrænses ud fra
kriterier såsom alder og indkomst, således alle personer i populationen kunne siges at have et
meningsfuldt forbrug. Under alle omstændigheder ville denne brede population ikke være praktisk
mulig inden for rapportens ressourcemæssige rammer. Det skyldes manglende adgang til
stikprøverammer i form af e-mail og adresse lister Omkostningerne til udseendelse af PAPI
spørgeskemaer samt adgang til brugbare stikprøverammer vurderes også betydelige. Udfordringen
var herved at bestemme en relevant population, hvorudfra der kunne foretages statistisk sampling
via tilhørende stikprøverammer inden for rapportens tidsmæssige og økonomiske rammer.
I denne rapport er populationen afgrænset til bachelorstuderende ved Handelshøjskolen, Aarhus
Universitet. Det skyldes, at der har været adgang til en e-mail liste, hvorudfra der kunne
gennemføres probability-based WBS (list-based samples). Derudover var det muligt at dele PAPI
spørgeskemaerne ud til forskellige øvelseshold, hvorved en adresseliste ikke var nødvendig ligesom
omkostninger til breve og porto. En væsentlig fordel ved denne population er omtalte liste, hvilket
muliggjorde sampling efter statistiske principper. Risikoen for coverage error synes også
begrænset, idet de fleste studerende må antages at tjekke deres e-mail løbende og i overvejende grad
være studieaktive. Denne risiko synes betydeligt større ved en bredere population, hvor det normalt
ikke kan antages, at alle grupper anvender Internettet i samme udstrækning (Couper, 2000). En
fordel er også muligheden for efficient dataindsamling ved PAPI. Det skyldes den direkte kontakt
til respondenterne, som umiddelbart herefter skal udfylde spørgeskemaet – dvs. ingen transporttider
som ved alm. post (snail mail). Et kritikpunkt kunne i den forbindelse være, at en sådan
dataindsamling ikke foregår under realistiske / normale omstændigheder, hvorved sammenligning
med web surveys er problematisk. Den største svaghed vurderes imidlertid at være den begrænsede
mulighed for at generalisere undersøgelsens resultater. Det synes meget tvivlsomt, at den valgte
Side 42 af 101
population er repræsentativ for en bredere population af danske forbrugere, idet den eksempelvis
kan beskrives som relativt højtuddannet og med et kortsigtet meget lavt rådighedsbeløb / opsparing.
3.2.2. Dataindsamling
Udgangspunktet for den konkrete dataindsamling var en stikprøveramme i form af en e-mail liste
for de ca. 2700 bachelor studerende ved Handelshøjskolen, Aarhus Universitet. Herudfra skulle et
givet antal studerende modtage PAPI spørgeskemaet ved en øvelsesundervisning og de resterede en
invitation pr. e-mail om deltagelse i webudgaven. To centrale udfordringer var at sikre mod
dobbeltbesvarelser samt udjævne demografiske forskelle såsom køn og alder mellem disse modes,
således eventuelle forskelle ikke kunne forklares ved disse forhold, men kun reelle mode-effekter.
Det bør i den forbindelse nævnes, at studerende som ikke var til stede ved den givne
øvelsesundervisning ikke modtog PAPI udgaven, hvorimod det må antages at alle e-mail
invitationer blev noteret af de studerende, som blev tildelt denne mode. Det antages her, at dette
faktum ikke har medført nogen ukontrollerbar forskel / bias mellem modes. Dette begrundes
primært med det betydelige fremmøde, som kunne noteres ved de enkelte øvelseshold.
Ved PAPI blev 20 øvelseshold simpelt tilfældigt udvalgt fra omtalte e-mail liste, hvorefter der blev
lavet aftale med den givne holdunderviser om spørgeskemaets omdeling. Dette design er motiveret
af to årsager. For det første medfører brugen af randomiseringsprincippet, at faktorer såsom alder,
køn og andre ikke inkluderede variable bliver ujævnet mellem modes – dvs. ingen bias herudfra.
Det konkrete antal øvelseshold er valgt ud fra et estimat på ca. 25 studerende pr. hold og en
svarprocent på ca. 40-50 %, hvilket ved anvendte statistiske teknikker vil give en acceptabel
stikprøvestørrelse. For at undgå dobbeltbesvarelser blev e-mails for de studerende ved disse 20 hold
ekskluderet fra listen som dannede udgangspunkt for invitationerne til web-udgaven. Web-surveyen
blev igangsat så snart det viste sig, at de 20 øvelseshold med overvejende sandsynlighed ville
medføre passende antal besvarelser, således ikke flere hold var nødvendige at sample.
3.3. Statistiske teknikker
Med udgangspunkt i dataindsamlingens besvarede PAPI og web spørgeskemaer er sidste metodiske
disposition valget af statistiske teknikker, hvorudfra disse observationer skal analyseres. I denne
Side 43 af 101
rapport foretages initialt en kort eksplorativ faktoranalyse (EFA). Den primært anvendte statistiske
teknik bliver konfirmativ faktoranalyse (CFA) i form af multi group CFA (MGCFA).
3.3.1. Eksplorativ faktoranalyse
ECOSCALE er ikke fuldt gennemtestet, hvorved klare faktorstrukturer ikke er etableret. Det gælder
særligt de reviderede items i ECOSCALE (2009). Skalen er desuden ikke anvendt på danske data
og siden den udviser uens strukturer på tværs af lande (Stone m.fl. 2009), implicerer det også en
stor usikkerhed. Herudfra gælder der ikke en entydig målemodel for miljømæssig ansvarlig
forbrugeradfærd i en dansk kontekst. For at etablere en sådan model til brug i senere MGCFA
gennemføres derfor initialt en eksplorativ faktoranalyse. Det er da de observerede mønstre i data,
som bestemmer faktorløsningen og herudfra målemodellen. Dette kan algebrafisk angives som:
X1=λ11ξ1+ λ12 ξ2+… λ1 c ξc+δ1
X2=λ21 ξ1+λ22ξ2+… λ2 c ξc+δ 2
.
X P= λp 1 ξ1+λp 2 ξ2+… λpc ξc+δ p
Ovenstående angiver den generelle common factor model. Første eksplicitte antagelse er her, at den
observerede varians i de enkelte variabel (X j) kan henføres til et mindre antal common factors (ξ i)
(dvs. uobserverbare kendetegn delt mellem flere variable). Koefficienterne λ ji angiver i hvilket
omfang de givne common factors bidrager til variansen i en given variabel. Ved standardisering af
X j og ξ i kan λ ji (factor loadings) tolkes som korrelationskoefficienter. Gøres der antagelse om
ukorrelerede common factors, vil disse factor loadings i kvadreret form da beskrive en variabels
communality (dvs. i hvilket omfang variablen er forklaret ved den underliggende faktormodel). En
anden eksplicit antagelse er, at den observerede varians i de enkelte variable (X j) kan henføres til
specifikke faktorer (δ j) (specifik for den enkelte variabel). Disse faktorer kan da tolkes som
målefejl / manglende fit med den underliggende faktormodel. Det antages her, at disse specifikke
faktorer er ukorrelerede med modellens common factors. Variansen for en given variabel (X j) er da
givet ved:
var (X ¿¿ j)= ( λi 1 ξ1+λ i2 ξ2+… λic ξc+δ p )=λ i12 +λ i 2
2 +… λic2 +var (δ p )=1¿
Side 44 af 101
Første led er diagonalen i kovariansmatrixen for en given variabel (X j). Ud fra tidl. antagelser om
uafhængighed og ved standardisering, vil kovarianselementerne bortfalde og diagonalen være givet
ved sidste udtryk. Det centrale er, at kun i denne diagonal vil de specifikke faktorer indgå. Ved
eksplorativ faktoranalyse fratrækkes estimaterne for de specifikke faktorer matrixdiagonalen,
således kun communalities er tilbage (dvs. en matrix hvor kilden til variation / kovariation er de
underliggende common factors). Dette benævnes principal factor method (Lattin m.fl. 2003). I
denne rapport estimeres communalities initialt via SMC (squared multiple correlation), hvor den
givne variabel (X j) regresseres på de øvrige variable og dens R2 anvendes som første estimat for
dets communality. Derefter gælder en iterativ proces, hvor det initiale estimat ændres ud fra
resultaterne i første faktoranalyse, hvorudfra disse nye estimater anvendes i en ny EFA, hvilket
fortsætter til communalities konvergerer. Løsningsproceduren kan matematisk beskrives som:
Χ=Ξ Λc+∆
R=Λc Λ c+Θ = R−Θ=Λc Λc
Udgangspunktet er common factor modellen, hvor Ξ=[ξ1, ξ2 …ξc ] , ∆=[δ1 , δ 2…δ p ]og Λc et p x c
matrix af factor loadings. Den model substitueres ind i en form af korrelationsmatrixen R (her som
en funktion af eigenvalues og eigenvectors). Modellen kan da angives i termer af R-Θ, hvorved der
er tale om matrix dekomponering af en symmetrisk square matrix med det formål at opnå en
approksimation heraf. Det gælder her, at der er et uendeligt antal løsninger, som er identiske i deres
evne til at approksimere matrixen R-Θ. Dette benævnes rotational indeterminancey.
3.3.2. Konfirmativ faktoranalyse
På baggrund af en EFA argumenteret målemodel er rapportens hovedformål at gennemføre en
statistisk baseret mode sammenligning. Via valgte målemodel gælder en priori etableret struktur for
data, hvor den anvendte statistiske teknik skal kunne identificere eventuelle signifikante forskelle
for dennes parametre på tværs af modes. I modsætning til EFA er udgangspunktet da en unik
defineret faktorløsning (= uden rotational indeterminancey). Formålet er herudfra ikke eksplorativt,
men derimod cross mode konfirmativt. Af den grund vælges multi group konfirmativ faktoranalyse
(MGCFA). Principperne for generel CFA kan eksemplificeres ved nedenstående to faktor model:
X1=λ11 ξ1+ λ12 ξ2+δ 1
Side 45 af 101
X2=λ21 ξ1+λ12 ξ2+δ2
X3=λ31 ξ1+λ32ξ2+δ3
X 4=λ41ξ1+λ42 ξ2+δ 4
corr ( ξ1 , ξ2)=Φ1,2
Ved CFA pålægges da begrænsninger for alle cross loadings (her: λ12 , λ22 , λ31∧ λ41) ved at fixe deres
værdier til 0 i faktor laoding matrixen Λ, hvorved disse parametre ikke skal estimeres. Estimation
foretages derimod for korrelationer mellem faktorer (her: Φ1,2), hvilket er i modsætning til EFA,
hvor faktorerne blev antaget gensidigt uafhængige (et faktor korrelationsmatrix givet ved
identitetsmatrixen Ι). Der gælder ved CFA derfor scaling inderemiancy, idet variansen af en faktor
og loadings (λ i , j) for dets tilhørende variable ikke kan estimeres samtidigt. Dette vil i denne rapport
løses ved at fixe faktorernes varians til 1 eller en loading til en arbitrær værdi (1) (jf. Latin m.fl.,
2003). I alle tilfælde sker CFA ud fra en unikt defineret faktorstruktur. Ved multi group konfirmativ
faktoranalyse (MGCFA) er formålet at teste hvorvidt elementer af den konfirmative model, såsom
item intercepts, means, laodings, etc. er forskellig mellem grupper (Little, 1997). Udgangspunktet
for disse tests er en række estimerede modelparametre og test statistikker, hvorfor der initialt må
vælges en estimator - i dette tilfælde maximum likelihood estimation (MLE) ud fra følgende model:
Χ=Ξ Λ+∆
hvor Λ er et p x c faktor loading matrix (passende begrænset ift. modelparametrene) og Ξ et n x c
matrix af standardiserede faktor scores. På baggrund af den tilladte korrelation mellem faktorer og
error terms er faktor korrelationsmatrixen Φ og kovariansmatrixen Θ ikke nødvendigvis diagonale.
Herudfra kan det sande kovariansmatrixe for X i populationen – noteret Σ, modelleres som:
Var ( X )=Var ( Ξ Λ+∆ )=ΛΦ Λ+Θ
Formålet er at nå frem til et sæt parameterestimater, således at de fittede værdier for det sande
kovariansmatrixe Σ er så tæt som muligt på de observerede værdier i stikprøvens kovariansmatrixe,
noteret S. I denne rapport anvendes MLE til valget af disse estimater. Antages det, at matrixen X
udgøres af n uafhængige trækninger fra en p-variat normal fordeling med et sandt populations mean
på Ο og et kovarians matrix Σ, vil følgende log likelihood udtryk gælde:
Side 46 af 101
ln ( L )=−n2 [ln|Σ|+tr ( S Σ−1 ) ]
hvilket er en ikke lineær funktion af modellens parametre, som løses ud fra numerisk optimerings
procedurer (Latin m.fl., 2003). Fordelen ved denne ML løsning er, at der opnås asymptotiske
standard errors for parameterestimaterne, således der kan gennemføres statistiske tests af disse
parameter værdier. For det andet medfører ML løsningsproceduren, at der kan implementeres
statistiske tests af modellens ”goodness of fit” som helhed. Herudfra kan en given model (the
restricted model) sammenlignes med en mere generel (the full model), hvor førstenævnte models
restriktioner er relakseret. En sådan test foretages med udgangspunkt i følgende χ2 statistik:
n [ ln|Σ|+ tr (S Σ−1 )−ln|S|−p ] χ2
hvor n angiver stikprøvestørrelsen og p antal observerede variable i full model. For denne fulde
model gælder et perfekt fit mellem Σ og S, hvorimod der må forventes forskelle mellem Σ og S ved
den restringerede model. Ovenstående test er da en test for hvorvidt en given model har samme fit
som en perfekt model. En problemstilling er imidlertid statistikkens direkte proportionalitet med n,
hvorved testet er følsomt ved store stikprøvestørrelser, hvor selv små forskelle kan medføre kan en
forkastelse af h0 vedrørende ækvivalens mellem den valgte modelspecifikation og en perfekt
fittende model. I denne rapport anvendes derfor også alternative goodness-of-fit indeks såsom CFI,
RMSEA, etc. Rapportens anvendelse af MGCFA kan beskrives ud fra følgende udtryk:
χ R2 − χ F
2 χr2=Δ χ2 χ df R−df F
2
hvilket angiver princippet for rapportens test af nestede modeller ift. sammenligningen af de to
survey modes, hvor der stepvist tilføjes flere restriktioner herfor. Statistisk kan det beskrives som at
overgå fra en given model til en restringeret udgave, hvor differencen mellem disses χ2 statistikker
vil være χ2 fordelte med et antal frihedsgrader (df) svarende til antal pålagte restriktioner r.
Matematisk gælder det herved, at der stepvist bliver fixet værdier for givne matrixer (fx Λ) til at
være ens på tværs af grupper (her: web og PAPI). H0 hypoteserne vil i disse tilfælde være: ingen
signifikant forværring af fit i overgangen fra den initiale til den mere restringerede nestede model.
Det er da evident, at rækkefølgen for test af nestede modeller er afgørende for disse konklusioner. I
denne rapport følges rækkefølgen foreslået i bl.a. Brown (2006), Hair m.fl. (2006) og Leuw m.fl.
(2000). Disse steps beskrives nærmere i de følgende analyseafsnit (herunder særligt i 4.3.)
Side 47 af 101
3.4. Videnskabsteoretisk position
På baggrund af det tidligere beskrevne teoretiske fundament samt dette afsnits angivne metode er
rapportens videnskabsteoretiske position da åbenlys. Denne position kan herudfra beskrives med
udgangspunkt i følgende illustration, som angiver placeringen af den videnskabsteoretiske position:
Kilde: egen tilvirkning ud fra Arbnor & Bjerke (2009, s. 15-17)
Udgangspunktet er det givne study area, som i dette tilfælde bl.a. kan beskrives ud fra valgte
population og undersøgte problemstilling / emneområde. Med det formål at kunne give en
besvarelse af underspørgsmålene i problemformuleringen må der vælges et givet operativt
paradigme – dvs. de metoder og metodikker, som er omtalt i dette afsnit. Denne boks svarer således
til, hvorledes det givne study area vil undersøges. Denne undersøgelse vil være underlagt et givet
metodesyn, hvilket i denne rapport er det Abrnor og Bjerke (2009) benævner den analytiske tilgang.
Et sådant metodesyn vil i sidste ende være underlagt et givet videnskabsteoretisk paradigme, som
bygger på en række ultimative antagelser. Det må således etableres hvilke ultimative antagelser,
som ligger bag den analytiske / positivistiske tilgang, som denne rapport skrives ud fra. Inden disse
antagelser kort angives, bør det nævnes, at denne rapports emne: survey modes, i sig selv kan
placeres i overstående figur. Det skyldes, at der her er tale om et element inden for survey
methodology, hvorfor disse kan henføres til en metodetilgang og en række ultimative antagelser.
Metodetilgangen ved surveys vil normalt være analytisk. Denne rapports bagvedliggende
metodetilgang er da analytisk ligesom konteksten for det emne, som det har til formål at undersøge.
Side 48 af 101
MethodologyPhilosophy of science
Paradigm Ope. ParadigmMethodological view
Study area Ultimate
presumptions
Figur 3.4. Illustration af placeringen af rapportens videnskabsteoretiske position
Ontologisk – dvs. opfattelsen af den virkelighed som det givne studie har til formål at undersøge,
ved den analytisk / positivistiske tilgang vil som det første omtales. I den forbindelse antages det, at
”helheden er summen af dets enkeltdele” – dvs. en summativ / additiv opfattelse af virkelighedens
forskellige elementer2. Den opfattelse ses også af rapportens anvendte teori og metode – fx i form af
den klassiske tests teoris antagelser samt de forudsætninger som gælder for CFA. Modeller og teori
har også en stor betydning i den analytiske tilgang, hvor formålet / ønsket normalt vil være at kunne
være forklarende ift. det undersøgte fænomen/ sammenhænge. Dette bør ses i forhold til den proces
for videnskabelse som danner udgangspunkt / antages ved tilgangen. Denne kan beskrives som
cyklisk i sin natur, hvor der hele tiden kan opnås forbedringer af den nuværende viden ved at de
bagvedliggende hypoteser falsificeres (jf. Popper), hvilket også kan siges at være formålet i denne
rapport jf. hypoteserne H1, H2 og H3 i tidl. afsnit. Et andet centralt begreb er ceteris paribus – dvs.
en mulighed for at foretage en alt andet lige fortolkning af det givne fænomen. Dette gælder ikke
mindst i de statistiske analyser i denne rapport, hvor der via kontrol for variable kan argumenteres
for en sådan fortolkning., hvor alle øvrige faktorer i modellen således holdes konstante.
Erkendelsesteoretisk / episimologisk gælder det, at skabelse af viden antages uafhængig af den
givne undersøger. Denne skal således forsøge at holde en distance for ikke at skabe kilde til bias,
hvilket også er fulgt ved rapportens dataindsamling. Herudfra kan udledes et andet centralt princip,
som ligger til grund for denne rapport: antagelsen om objektivitet. Denne forudsætning er i højeste
grad afspejlet i klassisk test teori og den generelle survey metodik, som web og PAPI er en del af.
Der søges således ikke skabt subjektiv viden, hvilket eksempelvis blev skabt ved rapportens
gennemførte prætest af de to spørgeskemaer. En anden central erkendelsesteoretisk antagelse er
viden som tids og kontekstuafhængig. Dette afspejles eksempelvis i den forudsætning, at der kan
repliceres tidligere opnået viden ud fra samme procedurer og processer. Netop denne antagelse er
særligt gældende i måleteori generelt via begrebet standardisering. Det hypotetiske construct
kausalitet antages også at kunne gælde ift. den analyse tilgang. I denne rapport undersøges der for
kausalitet i forhold til survey modes, hvor det implicit vil undersøges, hvorvidt der kan være
forskelle i den kausale sammenhæng mellem mode og rapporterede svar. Dette er imidlertid et
abstrakt begreb, som aldrig til fulde kan påvises, men derimod kun sandsynliggøres ud fra data.
2 Indholdet i dette afsnit er primært med udgangspunkt i Arbnor & Bjerke (2009, s. 15)
Side 49 af 101
4. Måling af constructet miljømæssig ansvarlig forbrugeradfærd
I dette kapitel vil det analyseres, hvorvidt det hypotetiske construct miljømæssig ansvarlig
forbrugeradfærd måles forskelligt på tværs af web og PAPI survey modes. Som det første vil det
anvendte data vurderes. Dernæst etableres en målemodel for dette construct via eksplorativ
faktoranalyse. Afslutningsvist foretages en multi-gruppe konfirmativ faktoranalyse med det formål
at identificere eventuelle forskelle mellem disse modes for den estimerede målemodel.
4.1. Datagrundlag
Kvaliteten af rapportens efterfølgende statistiske analyser er i betydelig grad betinget af det
anvendte datagrundlag. Som det første vil stikprøveresultaterne for den gennemførte dataindsamling
derfor vurderes. Dette sker med udgangspunkt i nedenstående beskrivende mål:
Kendetegn I alt PAPI Web
Stikprøvestørrelse 452 209 243
Responsrate 16,7 % 47,5 % 10,8 %
Item-nonrespons 0,117 % 0,135 % 0,101 %
Køn Mand 49,0 % 48,6 % 49,40 % Kvinde 51,0 % 51,4 % 50,60 %
Gennemsnitsalder 22,38 22,22 22,52
Kilde: egen tilvirkning ud fra bilag 7
Undersøgelsens samlede stikprøvestørrelse er 452 respondenter, heraf 209 og 243 for henholdsvis
PAPI og web spørgeskemaerne. Hensigtsmæssigheden af disse niveauer må vurderes i relation til de
senere anvendte statistiske teknikker. Ved eksplorativ og konfirmativ faktoranalyse kan sådanne
Side 50 af 101
Tabel 4.1. Stikprøvekendetegn i alt og for enkelte modes
niveauer være acceptable vurderet i forhold til de mange generelt etablerede ”rules-of-thumbs” (jf.
Hair m.fl. 2006, s. 113 & 753, Latin m.fl., 2003, s. 126 og Brown m.fl., 2006, s. 78). For den
seneste ECOSCALE survey i Stone m.fl. (2009) skete analyserne med udgangspunkt i en
stikprøvestørrelse på 489 fordelt på 5 underpopulationer (s. 43). Herudfra vurderes omfanget af det
indsamlede data ikke på forhånd at udgøre en åbenlyst statistisk problemstilling (i form af for få
frihedsgrader, df, efter modelparametrene er blevet estimeret), men vil imidlertid stadig konkret
vurderes ved de senere estimationer af målemodellerne.
Ud fra den samlede population (ca. 2.700) kan responsraten for web og PAPI surveys beregnes til
47,5 % og 10,8 %. Det er herved en klar statistisk signifikant forskel på andelen af personer, som
vælger at deltage ved de to modes (ift. en z-test på forskellen mellem to andele => p-værdi 0 % ).
Denne rapports forskel i responsrates bør imidlertid ikke ses som en vigtig praktisk og statistisk
signifikant mode effekt, men derimod en effekt af en delvis ”urealistisk” dataindsamlingsmetode.
Kontaktes studerende ved en holdundervisning, hvor der afsættes tid til besvarelse af spørgeskema,
må det forventes at en stor andel vil gøre det. I forhold til at modtage en e-mail om deltagelse i en
web-survey, vil presset/incitamentet til at påbegynde en besvarelse da være langt større ligesom
”støjen” fra andre aktiviteter (såsom øvrige e-mails) vil være langt mindre. Den primære
problemstilling er imidlertid, at denne dataindsamling ikke svarer til den måde, hvorpå PAPI
spørgeskemaer normalt omdeles. Det skyldes, at der ofte vil være tale om bredere populationer, hvis
personer fx ikke er samlet samme sted. Rapportens forskelle i responsrates kan derfor ikke validt
generaliseres ud til mere heterogene populationer / traditionelle PAPI surveys ved snail mail.
De opnåede stikprøvestørrelser må vurderes i forhold til ”missing data” for at kunne beskrive det
faktisk tilgængelige antal informationer (df) ved de senere modelestimationer. I denne rapport er
item-nonrespons på 0,135 % og 0,101 % for henholdsvis PAPI og web spørgeskemaerne. Ved en z-
test for forskellen mellem to andele synes det herved klart, at der ikke gælder nogen signifikante
forskelle (=> p-værdi ≫α=5 %¿. Frem for alt er dette niveau meget lavt (Brown m.fl., 2006 og
Leeuw m.fl., 2000) – svarende til 15 og 12 undladte svar ved 11.077 og 12.879 items. Via dette
næsten identisk lave niveau på tværs af modes vurderes missing data ikke at være en kilde til bias
ved de efterfølgende modelestimationer og herved en sløring af eventuelle sande modeeffekter.
Valget af en imputation teknik for missing data har da ikke en stor betydning for efterfølgende
resultater (Leeuw m.fl. 2000), men må stadig vælges for at analyserne kan gennemføres (dvs. er
Side 51 af 101
ikke ignorable missing data jf. Hair 2006 s. 39). I denne rapport vælges en ”calculation
replacement value” tilgang, hvor manglende faktiske værdier substitueres med estimerede means
og intercepts (mean substitution, Hair m.fl., 2006, s. 63). Dette valg er primært motiveret af
mulighederne inden for anvendte programmel. Endvidere begrundes det med en antagelse om
MCAR, idet hovedparten af non-response kun gælder for ét item pr. spørgeskema og uden nogle
mønstre herfor - dvs. er stokastiske. Herudfra blev listwise deletion fravalgt, idet det ville være
ugunstigt at have alle øvrige items undladt fra analysen, når eksempelvis kun 1 el. 2 mangler.
Ved miljømæssig ansvarlig forbrugeradfærd, SDR og RS er der observeret forskellige svar an på
alder og køn (fx Clump m.fl. 2003, Wiejters, 2006 og Paulhus 1998), hvorfor der i denne rapport
kontrolleres for de faktorer. I forhold til køn gælder en homogen fordeling inden for modes samt på
tværs af modes – i begge tilfælde en lille overvægt af kvinder. Ved en statistisk test for homogenitet
er det tydeligt, at hypotesen omkring ens kønsfordeling på tværs og inden for modes da fastholdes
(p-værdi ≫α=5 %¿. I forhold til alder er den i gennemsnit 22,22 og 22,52 for henholdsvis PAPI og
web. Det er herved tydeligt, at alder heller ikke er signifikant forskellig på tværs af modes (ved t-
test for forskelle mellem to forventede værdier: p-værdi ≫α=5%¿. Dette synes forklaret ved den
meget afgrænsede studenterpopulation, hvis aldersfordeling har en meget begrænset variation. I
vurderingen af alder og køn på tværs af modes bør det medtages, at stikprøverne udgør over 5 % af
den samlede population – dvs. behov for korrektion af estimatorernes varians. Denne korrektion for
endelig population vil dog ikke ændre på det faktum, at køn og alder ikke vil være en årsag til
eventuelle modeffekter. Forklaringen herpå synes anvendelsen af omtalte randomiseringsprincip.
4.2. Etablering af målemodel
Som forudsætning for senere mode sammenligninger må der initialt etableres en målemodel for
miljømæssig ansvarlig forbrugeradfærd i form af dets underliggende constructs og disses variable. I
denne rapport findes den model via eksplorativ faktoranalyse (EFA), hvis resultater sammenholdes
med ECOSCALEs teoretiske fundament samt tidligere studier i sammenlignelige vestlige lande.
Indikeret ved en afvisning af h0 hypotesen i Bartletts (1950) sphericity test (p-værdi 0%¿ samt en
MSA (Kaiser 1970, 1974) > 0,8, giver denne EFA som forventet mening ud fra korrelationerne i
data. Stikprøvestørrelserne for PAPI og web vurderes også passende ud fra rules-of-thumbs såsom
min. 5 observationer pr. variable (Fidell m.fl., 1989). Antal faktorer blev bestemt ud fra tidligere
Side 52 af 101
studier, skalaens teori samt Scree Plott (jf. Catell, 1966). Herudfra blev de to EFA gennemført ved
henholdsvis udtrækning af 4 og 5 faktorer. Andre regler såsom Kaisers rule (1959) ville medføre 9-
10 faktorer – et antal, som der ikke er empirisk eller teoretisk belæg for. På baggrund af den initiale
løsnings rotational indeterminancey blev de respektive faktoranalyser foretaget ud fra det Kaiser
Varimax roterede faktor loading matrix med det formål at opnå en mere simpel struktur at fortolke.
Metoden var i den forbindelse iterativ, idet variable én af gangen blev fjernet, når de havde
betydelige cross-loadings, lave communalities / loadings eller var den eneste variabel, som loadede
højt på en given faktor. Dette var fx motiveret af ønsket om unidimensionalitet, kun variable som
var reelle indikatorer for én faktor. Resultatet af rapportens to EFAs kan beskrives som følgende:
PAPI Web Faktor Faktor Variabel 1 2 3 4 Variabel 1 2 3 4Q_10 0,571 Q_3 0,635Q_11 0,586 Q_9 0,514Q_14 0,501 Q_14 0,639Q_15 0,760 Q_15 0,566Q_18 0,677 Q_16 -0,665Q_19 0,736 Q_18 0,729Q_24 0,536 Q_19 0,801Q_25 0,713 Q_24 0,513Q_26 0,710 Q_25 0,779Q_27 0,652 Q_26 0,742Q_29 0,531 Q_27 0,626Q_30 0,604 Q_29 0,558Q_31 0,633 Q_31 0,631
Kilde: egen tilvirkning ud fra bilag 3
Ved PAPI og web stikprøverne er der i begge tilfælde valgt i en løsning med 4 common factors. I
den forbindelse ses det, at tre af faktorerne gælder i begge løsninger i form af samme variables høje
loadings. Imidlertid genfindes faktor 2 i PAPI løsningen ikke i webs og faktor 3 i web løsningen
ikke i PAPIs. Der kan således identificeres 5 common factors, hvis variables loadings og cross-
loadings tydeligt er henholdsvis signifikante og insignifikante (Hair m.fl. 2006, s. 128). Herudfra
Side 53 af 101
Tabel 4.2. Kaiser Varimax roteret faktor laoding matrix (med loadings over 0,20)
kan construct validitet ikke afvises, men vil omvendt kræve nærmere statistiske tets. ECOSCALES
teoretiske fundament i form af definitionen på miljømæssig ansvarlig forbrugeradfærd indeholder 5
faktorer (jf. figur 1.2.4.). I de empiriske studier, hvor skalaen har været anvendt, er der fundet
mellem 5-7 faktorer (fx Stone m.fl. 1995,Clump m.fl. 2003 og Luc m.fl. 2009). Herudfra er
udgangspunktet i denne rapports efterfølgende mode sammenligninger nedenstående målemodel:
Kilde: egen tilvirkning ud fra EFAs samt ECOSCALE teori og empiri
Rapportens målemodel har 5 constructs svarende til de to EFAs omtalte 5 common factors og deres
tilhørende højt loadende variable. For overblikket skyld er korrelationerne mellem constructs (Φi , j ,)
ikke angivet til forskel fra de øvrige estimerbare parametre: faktor loadings (λ j ,i) og specifikke
faktorer (δ j ). Begrundelsen for valgte målemodel er både teoretisk og empirisk. De fem constructs
kan ud fra deres variable tolkes som repræsentationer af de tidl. nævnte 5 teoretiske dimensioner af
miljømæssig ansvarlig forbrugeradfærd jf. Stone m.fl. (1995). Fx kan item 14 og 15 (Alle bør vide,
at elfenben er… & syreregn rammer kun lande med …) tolkes som constructet om miljømæssig
viden. Ovenstående model kan da betragtes som en operationalisering af figur 1.2.4.s teoretiske
Side 54 af 101
λ30,5
λ26,3λ24,3
λ27,3 λ31,3λ29,3
λ25,3λ10,5 λ11,5λ3,1 λ9,1
λ14,2
λ15,2λ16,1
δ 29
5: Evne1:Attitude 3: Vilje 2: Viden 4: Adfærd
Q_11Q_10
Q_16
Q_3
Q_30
Q_9 Q_14
Q_27Q_15
Q_25
Q_31
Q_24
Q_29
Q_26 Q_18
Q_19
δ 30δ 15 δ 27 δ 31 δ 19δ 16
δ 9δ 3 δ 14 δ 24 δ 25 δ 26 δ 18 δ 10 δ 11
Figur 4.2. Målemodel for miljømæssig ansvarlig forbrugeradfærd (uden construct korrelationer)
λ19,4
λ18,4
Survey mode
definition af miljømæssig ansvarlig forbrugeradfærd. I den forbindelse synes de 5 constructs at være
hypotetiske, om end der ved kun 2 indikatorer kan argumenteres for intervening variables. Den
anden begrundelse for modellen er empirisk baseret. I flere studier er der udover samme antal
faktorer identificeret faktorer, hvor samme variable har høje loadings. Det gælder særligt 4: adfærd
som fx ses i Stone m.fl. (2009) og Luc m.fl. (2009). Den valgte målemodel følger da i betydelig
grad den allerede etablerede litteratur / empiri vedr. ECOSCALE i sammenlignelige vestlige lande.
4.3. Survey mode sammenligning Valide sammenligninger / sammenlægninger af grupper, i dette tilfælde survey modes, er betinget
af measurement invariance – dvs. antagelsen om ækvivalens for strukturer og parametre på tværs
grupper. En manglende opfyldelse heraf gør det usikkert, hvorvidt det overhovedet er samme
construct som måles i de forskellige grupper (Little, 1997). Sammenligninger af means eller
strukturelle relationer på tværs af grupper forudsætter således, at der er måleækvivalens for de
underliggende indikatorer (Ployhardt m.fl., 2004 og Thompson m.fl., 2006). I den forbindelse
skelner bl.a. Byrne m.fl. (1989) mellem to typer af measurement invariance: måleækvivalens (in a
narrow sense) og strukturel ækvivalens. Førstenævnte referer til invarians for faktor loadings, item
intercepts og error varianser, hvorimod strukturel ækvivalens yderligere implicerer invarians for
faktorernes varians og indbyrdes kovarianser. Rækkefølgen for tilhørende statistiske invarians test
er ikke tilfældig, idet de enkelte undergrupper af invarians er forudsat andre typers opfyldelse
(Leuw m.fl., 2000). I denne rapport undersøges her som det første for configural invariance3:
χ2(df) = 452,53 (336) p = 0,000Root Mean Square Error of Approximation (RMSEA)= 0,038Comparative Fit Index (CFI) = 0,925Tucker Lewis Index (TLI) = 0,891
Kilde: egen tilvirkning ud fra beregninger i SPSS AMOS 6.0 (se bilag 4)
3 I bl.a. Brown (2006) foreslås det, at der initialt gennemføres enkeltvise CFA for grupperne (s. 269). De tests er
fravalgt i denne rapport, idet formålet er en mode sammenligning, hvilket ikke direkte vil opnås uden simultan
estimation herfor. CFA for de enkelte grupper vil omvendt kunne validere anvendte målemodel. Det gælder imidlertid
også ved simultan estimation og er desuden ikke et stort behov, siden der anvendes en allerede udviklet skala.
Side 55 af 101
Tabel 4.3.1. χ2 test statistik samt fit index ved model for configural invariance
Ved test for configural invariance pålægges målemodellen simultant begge modes. Det er da kun
faktorstrukturen som udgør en begrænsning, idet alle parametre (fx λ i , j , Φi , j ,¿ frit estimeres i de to
stikprøver (Hair m.fl., 2006). Testet kan således fortolkes som test af ækvivalent modelstruktur i de
to grupper (Schwartz, m.fl., 2009). Denne test foretages som det første, idet yderligere (og mere
restriktive) former for måleækvivalens er betinget af ens strukturer. Af ovenstående tabel fremgår
en χ2 goodness-of-fit test statistik på 452,53 svarende til en p-værdi 0 ved modellens 336
frihedsgrader. Herudfra gælder en klar afvisning af h0 hypotesen om configural invariance. Som
nævnt er χ2 testet meget følsomt ved store stikprøvestørrelser som i denne rapport, hvor selv
mindste diskrepans kan forventes at ville indikere signifikante forskelle. Derfor suppleres analysen
med målene: RMSEA, CFI og TLI. RMSEA er et absolut fit index, hvori der forsøges korrektion af
χ2 testets følsomhed ved store stikprøvestørrelser og høj modelkompleksitet (Brown, 2006). Dets
værdi på 0,038 indikerer god fit mellem modes – fx ud fra cut-off på < 0,05 (Leuw m.fl., 2000). CFI
er et incremental fit index, hvis værdi på 0,925 også indikerer god fit mellem modes ved det
klassiske cut-off på > 0,9 (Hair m.fl., 2006). Det samme er tilfældet for TLI, der som forventet
komplementerer CFI værdien – dvs. angiver fit ved en værdi er tæt på 1 (Tucker, 1973). Via disse
fit index vurderes der høj grad af evidens for configural invariance, hvor χ2 testet da tolkes som
udtryk for store stikprøver og mange variable i modellen4. Der testes derfor for metrisk invarians:
χ2(df) = 474,78 (352) Δ χ 2(Δdf) = 22,25 (16) p = 0,135Root Mean Square Error of Approximation (RMSEA)= 0,045Comparative Fit Index (CFI) = 0,918Tucker Lewis Index (TLI) = 0,885
Kilde: som tabel 4.3.1.
4 I ovenstående samt alle efterfølgende beregninger er der anvendt sample covariance matrix S og ikke correlation
matrix R jf. anbefalingerne i Cudeck (1989). Resultaterne er imidlertid tjekket ved anvendelsen af R, hvilket ikke gav
betydelige ændringer ift. S som datagrundlag. På grund af CFA scaling indeterminancy er varianserne af faktorerne (ξ i ,)
fixet til værdien 1 og i forhold til fixing af faktor laodings (λ j ,i) gælder ingen forskelle med hensyn til model fit
(Griffen m.fl., 2001). Resultaternes validitet er desuden betinget af opfyldelse af diverse forudsætninger – fx p-variat
normalitet.
Side 56 af 101
Tabel 4.3.2. χ2 test statistikker samt fit index ved model for full metric invariance
Test for fuld metrisk invarians er et test af ækvivalensen for samtlige faktor loadings ( ΛG) på tværs
af analysens g grupper (i dette tilfælde web og PAPI) – dvs. test af følgende nulhypotese:
H0: ΛW=ΛP
Udgangspunktet er antagelsen, om ens faktor loadings ved web (W) og PAPI (P) modes, hvilket
statistisk testes ved at pålægge en lighedsbegrænsning for matrixerne ΛG, som indeholder
målemodellens faktorloadings. Ækvivalens for faktor loadings kan fortolkes som ”that the groups
calibrate their measures in the same way” – dvs. værdierne på den anvendte skala har samme
mening på tværs af grupper (Meredith 1993 og Vandenberg m.fl. 2000). Metrisk invarians er
således en forudsætning for construct komparabilitet på tværs af modes, - fx ud fra den fortolkning
at loadings er validitetskoefficienter for den kausale relation mellem construct og dets indikatorer
(Bollen, 1989). Forskellige loadings, dvs. forskellige validitetskoefficienter, kan ud fra dette
perspektiv da betvivle, hvorvidt constructet reelt er det samme i grupperne (Schwartz m.fl., 2009).
Af ovenstående tabel fremgår resultaterne af testet af den relevante nestede model, som har en χ2
test statistik på 474,78 med 352 frihedsgrader. Sammenlignet med den relevante full model – dvs.
modellen for configural invariance, er ændringen i χ2 statistikken 22,25 og antal frihedsgrader 16. P-
værdien for restriktionen af de 16 faktor loadings er således 0,135 – hvilket er betydeligt over den
klassiske grænse på 0,05 (jf. Brown, 2006). Denne fit underbygges også af de tre fit index, som kun
er marginalt ændret og stadig er inde for de normalt etablerede fit grænser. Nulhypotesen vedr. fuld
metrisk invarians vælges derfor fastholdt. Herudfra testes nu for fuld skalar invarians.
χ2(df) = 521,33 (368) Δ χ 2(Δdf) = 46,55 (16) p = 0,000Root Mean Square Error of Approximation (RMSEA)= 0,071Comparative Fit Index (CFI) = 0,881Tucker Lewis Index (TLI) = 0,861
Kilde: som tabel 4.3.1.
Ovenstående test for fuld skalar invarians er et test af ækvivalensen for samtlige item intercepts (τG)
i de regressionsligninger, som forbinder indikatorerne og de latente faktorer ( X i=τ i+λ ij ξ j+δ i¿.
Side 57 af 101
Tabel 4.3.3. χ2 test statistikker samt fit index ved model for full scalar invariance
Disse intercepts angiver da den forventede værdi af x i, når ξ j = 0. Ved en MGCFA med de to
grupper web og PAPI er der således tale om test af følgende nulhypotese:
H0: τW=τP
Initialt er antagelsen ækvivalente item intercepts ved web og PAPI, hvilket statistisk testes ved at
pålægge en lighedsbegrænsning for tau vektorerne τG på tværs af de to grupper. Disse intercepts
tolkes i Hayduk (1989) som: ”systematic biases in the responses of a group to an item”. Den givne
indikators mean kan således være enten højere eller lavere (upward vs. downward biased) end hvad
dets faktor loading samt faktors mean umiddelbart vil antyde. Skalar ækvivalens er da tilfældet, hvis
denne bias upward eller downward er ens på tværs af gruppernes items. Af ovenstående tabel
fremgår en ændring i χ2 statistikken på 46,55 og en stigning i antal frihedsgrader på 16,
sammenlignet med modellen for fuld metrisk invarians. Dette medfører en p-værdi gående mod 0
hvorudfra h0 hypotesen om fuld skalar invarians må afvises. Denne konklusion underbygges af fit
index, som alle i betydelig grad forværres. Eksempelvis falder CFI over grænsen på 0,01 (jf.
Rensvold m.fl., 2001). Fuld skalar invarians opfattes i megen litteratur ikke som påkrævet i forhold
til at gennemføre meningsfulde sammenligning af fx group means (Baumgartner m.fl., 1998).
Partiel skalar invarians betragtes da som tilstrækkeligt, hvorfor et test herfor vil implementeres:
χ2(df) = 512,28 (360) Δ χ 2(Δdf) = 37,50 (8) p = 0,002Root Mean Square Error of Approximation (RMSEA)= 0,061Comparative Fit Index (CFI) = 0,889Tucker Lewis Index (TLI) = 0,869
Kilde: som tabel 4.3.1.
Ved ovenstående test af partiel skalar invarians er der pålagt lighedsbegrænsninger for 8 item
intercepts (2 ved attitude, vilje og evne samt 1 ved viden og adfærd). Dette følger af bl.a. Brown
(2006) om to begrænsninger pr. faktor el. én ved faktorer af to indikatorer (hvorved alle øvrige
intercepts frit estimeres). I den forbindelse ses en ændring i χ2 statistikken på 37,5 samt en stigning
i frihedsgradantallet på 8 (ift. modellen om fuld metrisk invarians). P-værdien herfor er 0,002,
Side 58 af 101
Tabel 4.3.2. χ2 test statistikker samt fit index ved model partial scalar invariance
hvilket supporterer en afvisning af udgangspunktet om partiel skalar invarians. Denne afvisning af
nulhypotesen er endvidere understøttet af de angivne fit index. Det skyldes, at faldet i CFI er klart
over 0,01 samt RMSEA er over den normalt etablerede grænse på 0,05. Derfor vurderes der ikke
statistisk evidens for partiel skalar invarians. Denne konklusion er endvidere underbygget af en
række følsomhedsanalyser, hvor forskellige item intercepts i τG blev fixet uden at dette medførte en
fastholdelse af nulhypotesen om partiel skalar invarians. Kombineret med modellens svage fit vil
der herudfra ikke foretages test af yderligere nestede modeller. Eksempelvis vil det ikke være
meningsfuldt at foretage en sammenligning af faktor means på tværs af modes (fx jf. Leuw m.fl.,
2000 og nedenfor). Derimod vil overstående resultater diskuteres og kritiseres i følgende afsnit.
4.4. Diskussion og kritik af resultater
I dette afsnit (samt tilsvarende afsnit 5.2. og 6.3.) vil kapitlets angivne resultater diskuteres og
kritiseres med udgangspunkt i anvendte teori og metode (præsenteret i kapitel 2-3). Herudfra vil
resultaterne også implicit vurderes ud fra de grundlæggende antagelser / kvalitetskriterier, som
gælder for de traditioner, som lægger bag rapportens videnskabsteoretiske position (jf. afsnit 3.4.).
Det centrale resultat er afvisningen af nulhypotesen om skalar invarians. Konsekvensen heraf ses
via: E (x iG )=τ i
G+λiG κ j
G. Den forventede værdi af en indikator variabel i en gruppe er givet ud fra dets
item intercept, dets faktorloading og mean for dets faktor. Forskelle i indikator means kan således
være forklaret ved forskellige intercepts, loadings og latente means. En sammenligning af latente
means forudsætter da ækvivalente faktor loadings og item intercepts (Cole m.fl., 1985). En
implikation af afvisningen af skalar invarians er herved manglende mulighed for sammenligning af
de 5 faktorers means på tværs af modes, idet evt. forskelle også vil kunne være forklaret ved
forskellige item intercepts. I et måleteoretisk perspektiv synes der således evidens for uens måling
af miljømæssig ansvarlig forbrugeradfærd og dets underconstructs. I analyserne foreligger der ingen
direkte indikation af hvorvidt antagelserne i klassisk test teori er opfyldte. Under forudsætning af
disses opfyldelse, kan de uens item intercepts tolkes som tegn på tests, som er tau ækvivalente med
konstanten c ijsom differencen mellem de enkelte item intercepts på tværs af modes. Under alle
omstændigheder synes de forskellige intercepts at betyde en afvisning af web og PAPI som
parallele test ved måling af miljømæssig ansvarlig forbrugeradfærd. Ved tau ækvivalente tests
gælder det ofte, at en af de to tests normalt vil måle den sande score T mere præcist end den anden.
Side 59 af 101
Dette fremgår ikke nærmere af resultaterne i dette afsnit, men vil i de følgende to kapitler eventuelt
kunne ses ved eventuelle forskelle med hensyn til de to kilder til målefejl: SDR og RS.
I afsnittet er der ikke nærmere analyseret forskellige mål for construct reliabilitet og validitet. Disse
kvalitetskriterier antages således implicit på et tilfredsstillende niveau. I en optimal rapport uden
tids- og sideantalsbegrænsninger ville mål herfor imidlertid være angivet – fx Cronbachs alpha el.
målene for diskriminant og konvergent validitet foreslået af Fornell and Larcker (1981). Deres
undladelse synes imidlertid acceptabelt ud fra rapportens anvendte metode og informationen af de
foretagne analyser. Jf. tabel 4.3.1 fremgår fit index inden for de normalt etablerede grænser. Den
EFA udledte målemodel stemmer desuden overnes med relevant teori og tidl. analyser. Herudfra
gælder der således indikation på construct validitet ud fra afsnittes dataanalyse. De gennemførte
prætest kan også ses som en metodisk baseret sikring heraf med respondenternes positive feedback
som evidens. I den forbindelse kan trianguleringen via den kvalitative tilgang ses som en anden
styrke ved rapportens metode, om end en kritik kunne være den manglende anvendelse af et mixed-
study design – dvs. med en større anvendelse af kvalitative metoder. En sådan diskussion er
imidlertid dybt funderet i videnskabsteoretiske antagelser, hvorfor det ikke nærmere vil omtales.
En metodisk svaghed er visse items vage og uklare formuleringer, hvilket isoleret set kan medføre,
at der ikke måles det som reelt ønsket målt. Ved en optimal analyse var disse items udskiftet, - fx
indirekte udledt via teori el. direkte ud fra andre multi item scales. Værdien heraf synes imidlertid
begrænset. Via EFA vil problematiske items sjældent have meningsfulde / høje loadings, hvorudfra
de vil frasorteres. Den efterfølgende CFA vil desuden også kunne indikere eventuel mangel på fit
(hvilket ikke gælder i denne rapport – jf. signifikante loadings). En metodisk styrke er rapportens
sampling strategi via randomiseringsprincippet. Af tabel 4.1. fremgik tydelig udjævning i forhold til
køn og alder. Således synes der også at kunne gælde udjævning mellem modes ved andre ikke
kontrollerbare / potentiel bias skabende variable. På den anden side er den konkrete PAPI
dataindsamling med risiko for sampling bias – dvs. med mindre sandsynlighed for svar fra visse
respondenter end andre. Det skyldes, at ikke alle personer møder op til givne holdundervisninger.
Teoretisk medfører det en non-random sample af givne population ved at alle deltagerne ikke er lige
objektivt repræsenteret / balanceret. Ud fra de generelt store fremmøder vurderes denne mulige bias
dog ikke betydelig. Derimod vurderes den store forskel i responsrater at kunne være kilde til en
betydelig non-response error. Det synes sandsynligt, at de ca. 50 % som ikke besvarede PAPI har
Side 60 af 101
andre kendetegn end de ca. 90 % som ikke besvarede webs. En stor mængde af de 50 % som
besvarede PAPI synes fx at ville have givet non-response, hvis de var tildelt web. Diagnostikken af
denne evt. kilde til bias er dog ikke opnåelig jf. manglende valideringsdata herfor (jf. afsnit 1.5.).
Rapportens resultater og ovenstående fortolkninger er betinget af passende opfyldelse af de
forudsætninger, som er gældende for anvendte statistiske teknikker. Afslutningsvist vil der derfor
tages stilling til de forudsætninger som gælder ved CFA estimeret ved ML (ud fra Leeuw m.fl.
(2000). Som det første må der gælde uafhængige utrækninger fra den givne population. Dette
antages gældende ved web, men kan diskuteres ved PAPI, hvor respondenterne sad tæt og da evt.
kunne påvirke hinanden. Imidlertid blev de opfordret til at undlade interaktion, hvilket desuden kun
i svagt omfang blev observeret, hvorfor der herudfra ikke vurderes at gælde store problemer. Der
skal også gælde multivariate normalitet for den bagvedliggende population, hvorfra observationer
udtrækkes. Dette svarer til normalitet for den k-dimensionelle vektor af stokastiske vektorer X givet
ved [Q3 ,Q9 ..Q31 ] – dvs. X N (μ , Σ ), hvor Q3 ,Q 9 ..Q31er de enkelte items / variable anvendt i
målemodellen, μ en mean vektor og Σ det sande kovariansmatrixe. Test heraf må ske i data. I den
forbindelse blev det initialt noteret, at skævhed og kurtoisis for samtlige Qi var under de to normalt
etablerede grænser på henholdsvis 2 og 7 jf. bilag 7 (Finney and Distefano 2006). Således var det
ikke overraskende, at H0: X N (μ , Σ ) kunne fastholdes ud fra Mardias test (i AMOS 6.0.). Der
antages da at gælde multivariat normalitet for relevante population, hvorudfra metoder såsom
resampling el. andre estimatorer blev vurderet irrelevante at triangulere rapportens resultater med.
I forhold til resultaternes statistiske kendetegn må påvirkningen af eventuelle outliers også vurderes,
hvilket i denne rapport er undersøgt i AMOS 6.0. via Mahalanobis distance. Af denne test fremgår
kun få observationer med høje d-squared distances – som enkeltvis fortolkes som en
usandsynliggørelse af antagelsen om normalitet. Der vurderes således ikke at være problemer med
outliers og ved eksklusion af de få omtalte observationer ændres rapportens konklusioner ikke. Jf.
Lattin (2003) gælder det, at de bagvedliggende numeriske optimerings procedurer ikke altid giver
brugbare resultater ved CFA – eksempelvis i form af loadings over 1 el. negative error varianser.
Ved denne rapports resultater er der tjekket for sådanne infeasible løsninger uden at de fremkom.
Dette kan jf. Lattin (2003) tolkes som om at modellen er korrekt specificeret. I den forbindelse er en
forudsætning ved CFA, at der ikke gælder fejlagtig specifikation (Leeuw m.fl., 2000, s. 96). Denne
forudsætning vil ikke nærmere statistisk testes ligesom antagelsen om modellens eksogenitet.
Side 61 af 101
4.5. Delkonklusion
I dette afsnit blev det initialt fastslået, at rapportens datagrundlag synes hensigtsmæssigt og herved
brugbart i forhold til efterfølgende statistiske analyser. Den første analyse var en eksplorativ
faktoranalyse, hvorudfra en 5 faktor målemodel blev etableret. Modellens brugbarhed er bl.a.
understøttet af ECOSCALE teori og tidl. empiriske analyser. Med udgangspunkt i denne model
blev der foretaget mode sammenligninger via MGCFA. Af disse analyser fremgik der evidens for
configural og metrisk invarians ved givne målemodel. Derimod blev nulhypotesen om fuld og
partiel skalar invarians klart afvist. Således foreligger der ikke statistisk evidens for måleækvivalens
ved valgte målemodel for miljømæssig ansvarlig forbrugeradfærd på tværs af modes. Dette svarer
til en afvisning af den initialt formulerede hypotese H1 omkring måleækvivalens for web og PAPI
ved en sådan model. I forhold til denne konklusion synes de statistiske forudsætninger for MGCFA
opfyldte. Desuden synes anvendte målemodel brugbar via fit i data samt dens meningsfulde
fortolkning. Afvisningen af H1 synes således at ske på baggrund af et solidt statistisk, empirisk og
teoretisk fundament. Ved denne slutning må der imidlertid tages højde for eventuelle bias –
herunder i særdeleshed risikoen for non-response error via den store forskel i responsrates.
Side 62 af 101
5. SDR ved måling af miljømæssig ansvarlig forbrugeradfærd
I dette kapitel vil det analyseres, hvorvidt social desirability responding (SDR) gælder i samme
omfang på tværs af web og PAPI survey modes. Derfor vil der gennemføres en multi-gruppe
konfirmativ faktoranalyse med det formål at identificere eventuelle forskelle ved en målemodel ud
fra SDR items af Paulhus (1988). Det vil da undersøges, om der på tværs af web og PAPI modes
gælder forskelligt omfang af denne form for content-based responding / measurement error.
5.1. Survey mode sammenligning
Kapitlets fokale construct social desirability responding vælges dekomponeret til de to constructs:
moralistic og egoistic bias (jf. Paulhus, 2002). Det er herudfra formålet at identificere eventuel
invarians mellem web og PAPI via en estimeret målemodel etableret ud fra 20 items i Paulhus
BIDR (1988) – dvs. test af ækvivalens med udgangspunkt i følgende målemodel:
Kilde: egen tilvirkning ud fra Paulhus (1992 og 2002)
Side 63 af 101
Φ1,2
λ50,1λ48,1λ49,1 λ43,2λ42,2
λ44,2
λ47,1 λ37,2λ51,1 λ45,2
λ34,2λ33,2
λ32,2
λ40,1λ39,1
λ38,1 λ46,1
λ41,1 λ35,2
λ36,2
δ 38
λ3,11:MB 2: EB
Q_35Q_34
Q_48
Q_38 Q_36Q_39 Q_46
Q_50 Q_51
Q_40 Q_32 Q_33Q_41
Q_42
δ 44 δ 45
Figur 5.1. Målemodel for social desirability responding - moralistic (MB) og egoistic bias (EB)
Survey modeQ_37 Q_43 Q_44 Q_45Q_49Q_47
δ 39 δ 40 δ 41 δ 35δ 32 δ 33 δ 34δ 46 δ 36
δ 48δ 47 δ 49 δ 50 δ 51 δ 37 δ 42 δ 43
Tabel 5.1.2. χ2 test statistikker samt fit index ved model for full metric invariance
Datagrundlaget ved følgende ML estimation er omtalt i kapitel 5, hvorfor beskrivelsen samt
diskussionen heraf findes i afsnit 5.1. Fremgangsmåden ved dette kapitels MGCFA er den tidl.
omtalte stepvise teststrategi af nestede modeller, hvor der gradvist pålægges flere begrænsninger for
den relevante model. I den forbindelse må der som det første testes for (en snæver) måleækvivalens
i form af ækvivalente strukturer, loadings og item intercepts, således en valid sammenligning af de
to SDR constructs kan foretages på tværs web og PAPI modes – herunder i særdeleshed testet af
ækvivalente means. Med det formål at analysere, hvorvidt der overhovedet er tale om samme SDR
constructs ved de to modes vil der først testes for configural invariance:
χ2(df) = 462,84 (340) p = 0,000Root Mean Square Error of Approximation (RMSEA)= 0,021Comparative Fit Index (CFI) = 0,962Tucker Lewis Index (TLI) = 0,954
Kilde: egen tilvirkning ud fra beregninger i SPSS AMOS 6.0 (se bilag 5)
Ved ovenstående tabel ses en χ2 statistik på 462,84, hvilket ved 340 frihedsgrader implicerer en p-
værdi 0 - dvs. en klar afvisning af nulhypotesen omkring configural invariance. Dette resultat var
imidlertid at forvente ud fra de betydelige stikprøvestørrelser. Betragtes niveauerne for de tre fit
index, fremgår værdier, som i betydeligt omfang supporterer udgangspunktet omkring configural
invariance. RMSEA er langt under grænsen på 0,05 og CFI samt TLI langt over grænsen på 0,9 (fx
angivet i Hair m.fl., 2006 og Brown, 2006). Disse index vurderes således at supportere en
fastholdelse af nulhypotesen vedrørende ækvivalent modelstruktur på tværs de to grupper: web og
PAPI survey modes. Herudfra er det meningsfuldt at foretage et test af fuld metrisk invarians:
χ2(df) = 486,08 (358) Δ χ 2(Δdf) = 23,24 (18) p = 0,185Root Mean Square Error of Approximation (RMSEA)= 0,022Comparative Fit Index (CFI) = 0,961Tucker Lewis Index (TLI) = 0,954
Kilde: som tabel 5.1.1.
Side 64 af 101
Tabel 5.1.1. χ2 test statistik samt fit index ved model for configural invariance
Modellen for fuld metrisk invarians er skabt ved at pålægge en lighedsbegrænsninger for de tidl. frit
estimerede faktor laodings i ΛG. Herudfra opnås en χ2 statistik på 486,08 ved 358 frihedsgrader,
hvilket er stigninger på henholdsvis 23,24 og 18 ift. modellen for configural invariance. Ud fra disse
ændringer kan p-værdien beregnes til 0,185. Der er således klar evidens for fastholdelsen af H0:
ΛW=ΛP – eksempelvis ud fra grænsen på 0,05 (Leuw m.fl., 2000). Den konklusion underbygges
endvidere i de angivne fit index, som i alle tilfælde kan beskrives som stort set uændrede på trods af
de påførte restriktioner. Der vurderes således at gælde fuld metrisk invarians for web og PAPI
modes – dvs. same metric herimellem. Af den grund vil der nu testen for fuld skalar invarians:
χ2(df) = 515,59 (376) Δ χ 2(Δdf) = 29,51 (18) p = 0,042Root Mean Square Error of Approximation (RMSEA)= 0,024Comparative Fit Index (CFI) = 0,959Tucker Lewis Index (TLI) = 0,953
Kilde: som tabel 5.1.1.
Nesting af modellen for fuld metrisk invarians via yderligere lighedsbegrænsninger for de 18 ikke
fixede item intercepts i τG medfører en ændring af χ2 statistikken på 29,51. Ved 18 frihedsgraden (=
Δdf) i en χ2 fordeling svarer det til en p-værdi på 0,042. Herudfra synes der at gælde en usikker
konklusion i forhold til både en fastholdelse og afvisning af H0: τW =τP. Derfor må vurderingen
primært ske ud fra de anvendte fit index. Her ses det, at disse index kan beskrives som stort set
uændrede og fortsat inden for normalt etablerede grænser herfor. Af den grund antages der passende
statistisk evidens for fuld skalar invarians. I den forbindelse kunne det ydermere påvises, at partiel
skalar invarians tydeligt vil være gældende ud fra χ2 statistikken hvis lighedsbegrænsningerne for en
række intercepts var relakseret. Under alle omstændigheder er det således meningsfuldt at fortsætte
analysen ved at neste en relevant model. På baggrund af de stort set uændrede fit index, vil denne
model være modellen for fuld skalar invarians. Via ovenstående analyse er der således påvist strong
factorial invaraince (jf. Hair m.fl., 2006) / measurement invariance in a narrower sense (jf. Byrne m.fl., 1989). Herudfra vil der nu testes for strukturel invarians i form af ækvivalente
faktor varianser og kovarianser. Som det første testes der her for full invariance of factor variances:
Side 65 af 101
Tabel 5.1.3. χ2 test statistikker samt fit index ved model for full scalar invariance
χ2(df) = 518,54 (378) Δ χ 2(Δdf) = 2,95 (2) p = 0,228Root Mean Square Error of Approximation (RMSEA)= 0,025Comparative Fit Index (CFI) = 0,955Tucker Lewis Index (TLI) = 0,951
Kilde: som tabel 5.1.1.
Testet for fuld invarians for faktor varianser er test af ækvivalensen for samtlige af modellens
latente variables varianser (ϕ jjG¿ på tværs af grupper – dvs. et test af følgende nulhypotese:
H0: ϕ jjW=ϕ jj
p
Udgangspunktet er således en antagelse om ens varianser for de to latente faktorer: EB og MB, på
tværs af web og PAPI. Statistisk testes denne hypotese ved at pålægge en lighedsbegrænsning for
diagonalerne i matrixerne af faktor varianser og kovarianser – phi matrixerne ϕ jjG. Jf. Baumgartner
m.fl. (1998) kan denne test fortolkes som test af mulige forskelle i homogeniteten for de latente
faktorer / constructs mellem grupperne. Af ovenstående tabel fremgår en ændring af χ2 statistikken
på 2,95 ift. modellen for fuld skalar invarians, hvilket ved de 2 yderligere frihedsgrader medfører en
p-værdi på 0,228. Herudfra er der betydelig evidens for fastholdelsen af nulhypotesen. Denne
konklusion understøttes også af de tilhørende fit index, hvis ændringer er meget begrænsede.
Eksempelvis er det åbenlyst at opstillingen af konfidensintervaller for RMSEA for denne samt tidl.
model vil være overlappende. Der vurderes derfor at gælde fuld ækvivalens for de to faktorers
varianserne, hvorudfra der nu vil testes for full invariance of factor covariances:
χ2(df) = 519,61 (379) Δ χ 2(Δdf) = 1,21 (1) p = 0,271Root Mean Square Error of Approximation (RMSEA)= 0,025Comparative Fit Index (CFI) = 0,953Tucker Lewis Index (TLI) = 0,951
Side 66 af 101
Tabel 5.1.4. χ2 test statistikker samt fit index ved model for full invariance of factor variances
Tabel 5.1.5. χ2 test statistikker samt fit index ved model for full invariance of factor covariances
Kilde: som tabel 5.1.1.
Test af fuld invarians af faktor kovarianser implicerer et statistisk test af ækvivalente kovarianser (
ϕ jkG ¿ for modellens latente variable på tværs af grupperne – dvs. test af følgende hypotese:
H0: ϕ jkW=ϕ jk
p
Initialt antages der således ens kovarianser mellem de to latente variable / constructs EB og MB på
tværs af web og PAPI modes. Ved den tilhørende statistiske test pålægges en lighedsbegrænsning
for de subdiagonal elementer i matrixerne af faktor varianser og kovarianserϕ jkG . En sådan test svarer
til test af ækvivalente associationer mellem constructs på tværs af grupperne. Disse kovarianser
mellem constructs har bl.a. betydning for deres mening / validitet (Cronbach, 1955) – ikke mindst
ift. deres nomologiske validitet. Uens kovarians mellem EB og MB på tværs af de to modes kan
således betvivle, hvorvidt disse constructs har samme mening i grupperne (Maxwell m.fl., 1985).
Testet har da betydning for graden af construct sammenlignelighed mellem grupper jf. Little (1997).
Marsh m.fl. (1985) noterer i den forbindelse, at ens faktor varianser forudsætter, at ens kovarianser
kan tolkes som ens korrelationer, hvorfor test herfor først blev implementeret. Af ovenstående tabel
ses resultatet af fixing for målemodellens ene kovarians til at være en ændret χ2 stat. på 1,21,
hvilket ved 1 frihedsgrad svarer til en p-værdi på 0,271. Endvidere fremgår stort set uændrede fit
statistikker. Herudfra er der kraftig statistisk evidens for nulhypotesen omkring fuld ækvivalens for
faktor kovarianser, som jf. sidste test også er ækvivalens for faktor korrelationer.
Ud fra ovenstående test vedr. fuld ækvivalens for faktor varianser og kovarianser, er der herved
etableret betydelig statistisk evidens for strukturel ækvivalens mellem web og PAPI modes – dvs.
samme heterogenitet for de latente variable EB og MB samt ens korrelationer herimellem. Ud fra
anbefalinger i Baumgartner m.fl. (1998) samt det faktum, at der tidl. blev etableret fuld metrisk og
skalar invarians, vil der nu foretages test af en nested model for fuld invarians af latent means:
χ2(df) = 520,46 (381) Δ χ 2(Δdf) = 0,85 (2) p = 0,653Root Mean Square Error of Approximation (RMSEA)= 0,026Comparative Fit Index (CFI) = 0,953
Side 67 af 101
Tabel 5.1.6. χ2 test statistikker samt fit index ved model for full invariance of latent means
Tucker Lewis Index (TLI) = 0,951
Kilde: som tabel 5.1.1.
Testet af fuld invarians af latente means omfatter et statistisk test af ækvivalensen for modellens
latente means (κG ¿ på tværs af grupper – dvs. et test af følgende nulhypotese:
H0: κW=κP
Udgangspunktet er antagelsen om ens means for målemodellens to latente variable: EB og MB på
tværs af web og PAPI. Statistisk implementeres testet ved at pålægge en lighedsbegrænsning for
kappa vektorerneκG på tværs af grupperne. Der testes således for ækvivalente forventede værdier
for EB og MB på tværs af de to modes. Datagrundlaget herfor er deres respektive indikator variable,
hvorfor antagelsen om metrisk og skalar invarians må være opfyldte (fx Maxwell m.fl. 1985). I den
forbindelse antages der således ikke zero item intercepts og zero latent means, som det er tilfældet i
visse analyser, hvor det primært er the covariance part of the model som er i fokus (Bollen, 1989).
Af ovenstående tabel fremgår meget klar statistisk evidens for ækvivalente latent means på tværs af
web og PAPI. Ændringen i χ2statikken er på 0,85, hvilket ved 2 frihedsgrader svarer til en p-værdi
på 0,653 – dvs. en meget klar fastholdelse af nulhypotesen. Denne konklusion gælder også ud fra de
anvendte tre fit index, hvor CFI og TLI kan beskrives som uændrede, mens RMSEA stiger i et
ganske negligerbart omfang. Der vurderes derfor at gælde ækvivalente latente means for de to
constructs moralistic og egoistic bias på tværs af web og PAPI modes – svarende til ens forventede
værdier. Afslutningsvist vil der herudfra testes for full invariance of error variances:
χ2(df) = 563,57 (401) Δ χ 2(Δdf) = 43,11 (20) p = 0,002Root Mean Square Error of Approximation (RMSEA)= 0,034Comparative Fit Index (CFI) = 0,941Tucker Lewis Index (TLI) = 0,933
Kilde: som tabel 5.1.1.
Side 68 af 101
Tabel 5.1.7. χ2 test statistikker samt fit index ved model for full invariance of error variances
Test for fuld invarians af error varianser har til formål at teste ækvivalensen for error varianserne
(Θ¿¿G)¿ associeret med residualerne for modellens indikatorvariable – dvs. test af følgende
hypotese:
H0: Θ jjW =Θ jj
P
Initialt antages det herudfra, at der gælder ækvivalente error varianser for SDR målemodellens 20
indikatorvariable på tværs af web og PAPI modes. Ved den relevante statistiske test pålægges en
lighedsbegrænsning for elementerne i diagonalen for matrixerne af error varianser og kovarianser
Θ jjG på tværs af grupperne. Denne test kan således fortolkes som en test af ækvivalente measurement
errors for de 20 indikatorvariable på tværs af de to modes. I den forbindelse blev der tidligere påvist
fuld metrisk invarians samt invarians for faktor invarianser, hvorfor en eventuel ækvivalens for
error varianser vil kunne tolkes som ens reliabiliteter for de to gruppers indikatorvariable (Maxwell
m.fl., 1985 & Baumgartner m.fl. 1998). Af tabel 5.1.7. fremgår en χ2statik på 563,57 – svarende til
en ændring på 43,11 ift. modellen for fuld invarians for latent means. Ud fra stigningen på 20
frihedsgrader opnås en p-værdi på 0,002 – dvs. en klar afvisning af udgangspunktet omkring
ækvivalente error varianser. Dette resultat nås også via de tre fit index, som alle forværres i
betydelig grad – herunder et faldt i CFI på over 0,01. Det synes herved ikke rimeligt at antage fuld
invarians for indikatorvariablenes error varianser. Som tidligere vil det i stedet testes for en partiel
version af den undersøgte ækvivalens – dvs. i dette tilfælde partiel invarians for error varianser:
χ2(df) = 539,55 (391) Δ χ 2(Δdf) = 19,09 (10) p = 0,039Root Mean Square Error of Approximation (RMSEA)= 0,029Comparative Fit Index (CFI) = 0,949Tucker Lewis Index (TLI) = 0,948
Kilde: som tabel 5.1.1.
Relakseres lighedsbegrænsningen for 10 error varianser (5 ved henholdsvis EB og MB), ændres χ2
statikken med 19,09 i forhold modellen, som den er nestet ud fra. Ved 10 frihedsgrader opnås da en
Side 69 af 101
Tabel 5.1.8. χ2 test statistikker samt fit index ved model for partial invariance of error variances
p-værdi på 0,039, hvorved der svagt kan argumenteres for en afvisning af nulhypotesen vedr. partiel
invarians. Denne konklusion vælges imidlertid ikke på baggrund af ændringerne i fit index. Det ses
i den forbindelse, at alle tre index kun ændres marginalt inden for de normalt etablerede grænser. Af
den grund argumenteres der for partiel ækvivalens for error varianser, hvilket er tjekket via flere
følsomhedsanalyser, hvor andre error varianser er valgt fixet – med samme resultat til følge. Der er
således evidens for ens reliabilitet for indikatorvariable på tværs af de to modes.
5.2. Diskussion og kritik af resultater
Dette afsnits centrale resultat er de mange fastholdelser af nulhypoteserne vedrørende forskellige
typer måle- og strukturel ækvivalens på tværs af modes. Der er da megen statistisk evidens for, at
social desirability responding (i form af EB og MB) gælder i samme omfang på tværs af web og
PAPI. Ud fra klassisk test teori synes der passende belæg for at kunne betegne de to modes som
parallele tets i forhold til målingen af SDR ud fra Paulhus (1988) BIDR items. Der kan her
argumenteres for samme grad af construct validitet og reliabilitet på tværs af modes, hvilket
eksempelvis kan udledes af testet for partiel ækvivalente error varianser, som implicerer belæg for
ens reliabiliteter for indikatorvariable. Om end der kan gælde samme validitet og reliabilitet på
tværs af modes, forudsætter mode ækvivalensens fortolkning i relation til SDR, at dette construct
rent faktisk er det som er målt – dvs. opfyldelsen af construct validitet. På baggrund af fit index
(med acceptable værdier) samt det faktum, at BIDR anses som en gennemtestet valid skala, synes
denne fortolkning i termer af SDR rimelig. Årsagen til valget af denne skala var også validiteten af
fortolkninger i termer af constructet SDR for de tilhørende MGCFA analyseresultater.
Et centralt spørgsmål er vedr. linket mellem SDR og miljømæssig ansvarlig forbrugeradfærd.
Eneste direkte link mellem SDR og miljømæssig ansvarlig forbrugeradfærd er, at deres tilhørende
BIDR og ECOSCALE items er placeret i samme spørgeskemaer. Der foretages således ingen
statistiske analyser, hvor disse items estimeres sammen. Initialt var det dog formålet at foretage en
strukturel ligningsmodellering (SEM) ud fra en strukturel model givet ved de 5 constructs for
miljømæssig ansvarlig forbrugeradfærd og de 2 constructs for SDR. Herudfra kunne førstnævnte
modelleres som endogene constructs forklaret ved de to eksogene SDR constructs ved en multi
group SEM (MGSEM). Fordelen ved MGSEM er muligheden for direkte at kunne henføre forskelle
el. ligheder ved SDR til at gælde i konteksten miljømæssig ansvarlig forbrugeradfærd. Via
manglende skalar invarians identificeret i kapitel 4 er den analyse imidlertid ikke vurderet
Side 70 af 101
fordelagtig gennemført, idet resultaternes validitet ville være tvivlsom. Derfor må lighederne for
SDR mellem web og PAPI tolkes mere generelt – dvs. generelt gældende ved måling ved web og
PAPI og heraf evt. også ved miljømæssig ansvarlig forbrugeradfærd. Linket herimellem synes
imidlertid delvist gældende ud fra spørgeskema teori / forskning. Det skyldes, at ECSOCALE items
er placeret før BIDR items. Megen forskning tyder i den forbindelse på, at svar på givne items er
påvirket af spørgeskemaets øvrige items og rækkefølgen heraf jf. Lietz (2010). Herudfra synes der
at være et ikke målbart link mellem SDR og miljømæssig ansvarlig forbrugeradfærd, idet SDR er
placeret i en kontekst af ECOSCALE items. Herudfra kan der argumenteres for, at SDR
homogeniteten konkret gælder i en miljømæssig kontekst. Dette kompenserer delvist for den
manglende statistiske ”sammenkobling” af disse items og deres eventuelle sammenhænge.
Den sandsynliggjorte ækvivalens må fortolkes mere præcist i et teoretisk perspektiv. Dette gøres via
Paulhus (2002) two-tier system. Der skelnes her mellem egoistic og moralistic bias, hvilket
understøttes i rapportens data, hvor deres kovarians er insignifikant (p>>0,05) ved begge modes.
Det resultat er ikke overaskende, da de to BIDR underskalaer beskrives som ortogonale (fx Paulhus
1991). Jf. De Jong m.fl. (2010) vil disse to skalaer primært måle ubevidst SDR under anonyme
forhold (s. 201). Ækvivalensen ved web og PAPI vil da hovedsageligt være ækvivalens for ubevidst
EB og MB – dvs. self-deceptive enhancement og self-deceptive denial (jf. figur 2.2.2.). Dette). En
sådan fortolkning synes rimelig, idet der ved rapportens web og PAPI dataindsamling ikke har
været incitament til impression management ud fra undersøgelsens anonymitet – dvs. ingen
tilskyndelse til at ”look good” over for en forsamling. På den anden side har der været kilder til
begge typer self-deceptive SDR – dvs. ud fra begge content levels (agency / communion). SDE,
givet ved agentic værdier, kunne gælde ved items om miljømæssig viden (Q_14-15). SDD, givet
ved communion værdier, kunne gælde ved items om miljømæssige adfærd (Q_23-31). I den
forbindelse synes der flest items, som kunne medføre SDD. Via manglede relation / modellering til
den fokale skala (ECOSCALE) er det imidlertid ubesvaret, hvorvidt SDR reelt er et problem.
Metodisk gælder samme overvejelser som i afsnit 4.4. vedr. eventuel sampling og non-response
bias. Et yderligere kritikpunkt kunne være den PAPI dataindsamling som ikke vil kunne genfindes i
de fleste videnskabelige og kommercielle PAPI surveys. Imidlertid afhænger ovenstående
fortolkning primært af undersøgelsens anonymitet, hvilket i høj grad gælder ved denne rapports
survey. Således vurderes dette punkt ikke relevant ved målingen / konklusionen ift. SDR. Metodisk
Side 71 af 101
synes anvendte statistiske teknikker en betydelig styrke ved denne rapport. MGCFA vurderes som
en langt mere kraftfuld teknik en fx bivarate korrelationer el. ANOVA. Særligt fortolkningen af
bivarate korrelationer mellem de to BIDR faktorer og faktorerne i den fokale skala har været et
kritikpunkt af mange hidtidige metodiske dispositioner ved SDR (De Jong m.fl., 2010). Styrken ved
MGCFA er også validitet, idet etableringen af mode måleækvivalens sikrer, at gennemførte
sammenligninger overhovedet er meningsfulde. Dette antages implicit ved eksempelvis ANOVA.
Afslutningsvist må opfyldelsen af de statistiske forudsætninger for MGCFA også kort vurderes i
forhold til dette afsnits modellering. På baggrund af test i AMOS 6.0. fastholdes nulhypotesen om
multivariate normalitet (ved p-værdi >0,05) – dvs. H0: U N (μ , Σ ), hvor U er givet ved vektoren
[Q32 , Q33 .. Q51 ]. Denne fastholdelse var også forventelig ud fra de mål for skævhed og kurtoisis som
direkte kunne observeres for disse enkelte variable (jf. bilag 7). Endvidere er der ud fra
Mahalanobis distance ikke fundet væsentlige tegn på outliers og ved følsomhedsanalyser, hvor
disse undlades ændres analysens resultater ikke i et betydeligt omfang. Der vurderes herudfra ikke
at gælde væsentlige problemer med forudsætningsbrud ved anvendte statistiske teknik. For AMOS
output er der også tjekket for infeasible løsninger, hvilket ikke medførte nogen identifikation. Dette
tolkes som om, at modellen ikke er misspecificeret i et betydeligt / alvorligt omfang.
5.3. Delkonklusion
Ved målingen af de to SDR constructs: egoistic og moralistic bias ud fra Paulhus (1988) BIDR
items blev der i dette kapitel sandsynliggjort høj grad af måleækvivalens mellem web og PAPI
modes i form af fuld invarians for strutkurer, loadings og intercepts samt partiel invarians for error
varianser ved den tilhørende SDR målemodel. Derudover blev der påviste homogene latente means
samt strukturel ækvivalens i form af fuld invarians af faktorer varianser og faktor kovarianser. På
baggrund af disse meget entydige statistiske resultater må nulhypotesen etableret i første kapitel H2
vedrørende samme omfang af SDR mellem web og PAPI klart fastholdes. Denne fastholdelse
styrkes desuden af det faktum, at der er anvendt en meget valid skala – tidl. påvist samt også
indikeret i rapportens data. Desuden synes det tilfældet, at de statistiske forudsætninger for MGCFA
er opfyldt i et passende omfang. På baggrund af de anonyme forhold ved både PAPI og web, kan
lighederne primært tolkes i termer af self-deceptive enhancement og self-deceptive denial – dvs.
Side 72 af 101
ubevidste former for SDR. Et ubesvaret spørgsmål er imidlertid disse resultaters link til constructet
miljømæssig ansvarlig forbrugeradfærd, da dette er målt ud fra en særskilt skala.
6. Respons styles ved måling af miljømæssig ansvarlig forbrugeradfærd
I dette kapitel vil det analysere, hvorvidt forskellige typer response styles (RS) måtte gælde i samme
omfang på tværs af web og PAPI survey modes. Af den grund gennemføres en multi-gruppe
konfirmativ faktoranalyse med det formål at identificere eventuelle forskelle ved målemodellen for
RS foreslået af Wiejters (2006). Det vil da undersøges, om der på tværs af web og PAPI modes
gælder et forskelligt omfang af denne form for non content-based responding / measurement error.
6.1. Etablering af målemodel
Det fokale construct response style vil nærmere operationaliseres til de fire typer: acquiescence,
disacquiescence, extreme og midpoint response style (ARS, DRS, ERS og MRS). I den forbindelse
tages der udgangspunkt i målemodellen introduceret som en del af doktordisputatsen af Wiejters
(2006). Kapitels survey mode sammenligning foretages således ud fra nedenstående model:
Side 73 af 101
Φ1,4
Φ2,4Φ1,3
Φ1,2 Φ3,4Φ2,3
λc, 4λc, 3λc, 2λc, 1 λa ,4λa ,3λa ,2λa ,1
1:ARS 4: MRS
Figur 5.1. Wiejters målemodel for response styles – ARS, DRS, ERS og MRS
2:DRS 3:ERS
Kilde: egen tilvirkning ud fra Wiejters (2006, s. 139-178)
Ved ovenstående model gælder multi-indicator multi-method factor measurement, - dvs. simultan
estimation og måling af de fire typer RS. I bl.a. Podsakoff m.fl. (2003) argumenteres der for
fordelene ved denne tilgang frem for single indicators og/eller single method factors. For det første
kan der ved sidstnævnte tilgang være RS, som ikke opdages. For det andet skal der gælde
måleækvivalens på tværs af modes for, at RS typerne meningsfuldt kan sammenlignes, hvilket
netop kan testes ved MGCFA for valgte model. Her kan der også direkte kontrolleres/korrigeres for
målefejl. Generelt er mange af CFA egenskaberne argumentation for valgte model – fx modellering
af unikke varianser for indikatorerne, idet kun den delte varians er relevant for analysen. I modellen
er der også tilladt korrelation mellem indikatorer beregnet ud fra samme items (fx ARS_a og
DRS_a). Kombineret med den tilladte korrelation mellem de fire RS faktorer (Φa ,b), opnås brugbare
estimater for korrelationerne mellem de fire RS faktorer og derved ikke blot de mindre brugbare
korrelationer mellem RS indikatorerne (Wiejters, s. 147). Disse 12 RS indikatorer er opnået ud fra
formlerne foreslået og anvendt i Bachman m.fl. (1984), Hui m.fl. (1985) Baumgartner m.fl. (2001):
ARS¿ ij=1∗f (4 )+2∗f (5)
k i(1)
DRS ¿ij=2∗f (1 )+1∗f (2)
k i(2)
Side 74 af 101
λb ,4λb ,3λb ,2λb ,1
ARS_b MRS_cMRS_bDRS_a DRS_b ERS_a
δ c 3 δ a 4
Survey mode
DRS_c ERS_b ERS_c MRS_aARS_cARS_a
δ a1 δ b 1 δ c 1 δ a 2 δ b 2 δ c 2 δ a3 δ b 3 δ b 4 δ c 4
ERS ¿ij=f (1 )+f (5)
k i(3)
MRS ¿ij=f (3 )k i
(4)
hvor f ( ο )=frekvensen af svarmulighed ο
og ο=1 (meget uenig ) , 2¿delvist uenig), 3(neutral), 4(delvist enig) ∨ 5(meget enig)
For en given respondent j beregnes en RS indikator da ud fra itemsættet i indeholdende k forskellige
items. Datagrundlaget for disse matematiske transformationer har været de 31 items i ECOSCALE
(2009). Ud fra anbefalingerne i Wiejters (2006) er der via simpel tilfældig udvælgelse dannet 3 sæt
af items med henholdsvis 10,10 og 11 styk5. En normal forudsætning for analysen af RS er høj item
heterogenitet. Det skyldes, at der undersøges for non content-based responding, hvorved
homogene / relaterede items kan medføre svar, som i stedet er content-based (Greenleaf, 1992).
Effekten af RS kan da være vanskelig at isolere. I forhold til de 31 ECOSCALE items synes denne
forudsætning at kunne være problematisk. I kapitel 4s EFA fremgik mange meningsfulde
korrelationer, - særligt for målemodellens 16 indikatorvariable. Desuden er skalen udviklet inden
for et givet tema i form af miljømæssig ansvarlig forbrugeradfærd. Herudfra gælder således
forholdsvis homogene items. På den anden side blev hele 15 items iterativt frasorteret i EFA. Dette
skyldes primært deres lave korrelationer med de 5 common factors samt de øvrige potentielle
indikatorvariable. Dette faktum indikerer omvendt en vis heterogenitet / non content-based svar for
de 31 ECOSCALE items. Den randomiserede skabelse af item sæt sikrer desuden, at en lang række
svagt relaterede items sættes sammen. Herudfra vurderes det rimeligt at fortsætte analysen af de fire
typer RS på tværs af modes.
5 Sæt a: q_2, q_6, q_9, q_11, q_14, q_15, q_16, q_26, q_28, & q_30; sæt b: q_4, q_5, q_7, q_13, q_18, q_20, q_21,
q_23, q_27 & q_29; sæt c: q_1, q_3, q_8, q_10, q_12, q_17, q_19, q_22, q_24, q_25 & q_31.
Side 75 af 101
Tabel 6.2.2. χ2 test statistikker samt fit index ved model for full metric invariance
6.2. Survey mode sammenligning
I dette kapitel er det primære formål at sammenligne web og PAPI i forhold til ARS, DRS, ERS og
MRS. Det ønskes således en sammenligning ud fra de fire latente variable i Wiejters målemodel for
RS – dvs. en sammenligning af means og varianser for disse constructs. En sådan sammenligning er
imidlertid betinget af måleækvivalens i form af invariante strukturer, faktor loadings og item
intercepts (fx Baumgartner m.fl., 1998). Initialt må der derfor foretages en test af relevante nestede
modeller herfor. Jf. anbefalingerne i bl.a. Brown (2006) testes der først for configural invariance:
χ2(df) = 417,06 (334) p = 0,001Root Mean Square Error of Approximation (RMSEA)= 0,022Comparative Fit Index (CFI) = 0,984Tucker Lewis Index (TLI) = 0,981
Kilde: egen tilvirkning ud fra beregninger i SPSS AMOS 6.0 (se bilag 6)
Af ovenstående tabel fremgår som forventet en afvisning af udgangspunktet omkring ens strukturer
på tværs af modes i form af en p-værdi på 0,001 ud fra χ2test statikken på 417,06 ved 334
frihedsgrader. Denne konklusion er imidlertid ikke understøttet af de tre fit index. CFI og TLI
antager begge meget høje værdier, hvorimod RMSEA er på et lavt niveau. Herudfra vurderes der
klart at gælde passende statisk evidens for configural invariance. Derudover er disse index
indikation på meget høj grad af fit for Wiejters målemodellen (ligesom i hans oprindelige disputats,
jf. s. 156). Det vurderes således rimeligt, at der tages udgangspunkt i denne model i den videre
analyse, hvor følgende nestede model angiver restriktioner svarende til fuld metrisk invarians:
χ2(df) = 434,18 (342) Δ χ 2(Δdf) = 17,12 (8) p = 0,029Root Mean Square Error of Approximation (RMSEA)= 0,023Comparative Fit Index (CFI) = 0,984Tucker Lewis Index (TLI) = 0,980
Side 76 af 101
Tabel 6.2.1. χ2 test statistik samt fit index ved model for configural invariance
Tabel 6.2.3. χ2 test statistikker samt fit index ved model for full scalar invariance
Tabel 6.2.4. Latente means, standard errors, effect sizes samt t test statistikker
Kilde: som tabel 6.2.1.
Ved testet af nulhypotesen omkring fuld metrisk invarians på tværs af de to modes (H0: ΛW =ΛP)
fremgår en ændring af χ2statikken på 17,12, hvilket ved de 8 yderligere frihedsgrader medfører en
p-værdi på 0,029. Fuld metrisk invarians kan herudfra synes tvivlsomt. På den anden side er de tre
fit index stort set uændrede, hvorfor der vurderes passende evidens til at kunne fastholde
nulhypotesen - svarende til ækvivalente faktor loadings / metrik på tværs af modes. Ud fra denne
konklusion er det meningsfuldt at foretage en test af en nestet model for fuld skalar invarians:
χ2(df) = 453,26 (350) Δ χ 2(Δdf) = 19,08 (8) p = 0,014Root Mean Square Error of Approximation (RMSEA)= 0,025Comparative Fit Index (CFI) = 0,982Tucker Lewis Index (TLI) = 0,979
Kilde: som tabel 6.2.1.
Ved pålægning af en lighedsbegrænsning for tau vektorerne τG på tværs af de to modes opnås en
ændret χ2statistik på 19,08, hvilket implicerer en p-værdi på 0,014 ved 8 frihedsgrader. Der synes
således ikke evidens for ækvivalente item intercepts på tværs af PAPI og web ud fra denne
statistiske test. Igen er det imidlertid tilfældet, at de anvendte fit index stort set har et uændret
niveau. Dette vurderes i et omfang, som gør det rimeligt at fastholde nulhypotesen om fuld skalar
invarians (H0: τW =τP). På baggrund af den foregående tests sandsynliggørelse af fuld metrisk
invarians, vil det da være meningsfuldt at teste for ækvivalensen af latente means:
PAPI Web
Mean s.e. Mean s.e. E.S. t pARS 0,431 0,026 0,392 0,024 -1,55 -16,43 << 0,05DRS 0,505 0,039 0,503 0,037 -0,05 -0,53 > >0,05ERS 0,359 0,023 0,353 0,022 -0,18 -1,91 >0,05MRS 0,192 0,016 0,196 0,017 0,17 1,80 >0,05
Side 77 af 101
Tabel 6.2.5. χ2 test statistikker samt fit index ved model for full invariance of factor variances
Kilde: egen tilvirkning og beregning af p via: http://keisan.casio.com/has10/SpecExec.cgi
Ovenstående tabel angiver resultaterne af statistiske tests for invarians af latente means. Disse er
implementeret i form af fire særskilte tests af ækvivalensen for modellens latente means, E (ξiG ), på
tværs af web og PAPI modes. Der er således tale om enkeltvise test af følgende fire nulhypoteser:
H0: E ( ARSW ) =E ( ARSP ) , E ( DRSW ) =E ( DRSP ) , E ( ERSW ) =E ( ERS P )∧ E ( MRSW ) =E ( MRSP )
Initialt antages ens forventede værdier for de fire RS faktorer på tværs af web og PAPI. Statistisk
testes disse hypoteser ikke som tidligere simultant, men derimod enkelvist. I den forbindelse er der
taget udgangspunkt i effect size estimation via Hedges g, givet ved følgende formel og fordeling:
g=κ i
W−κip
√ ϕ iiW+ϕ ii
P
2
hvor g ∙√ ( n1 n2 )n1+n2
T n1+n 2−2(√ (n1 n2 )/(n1+n2)θ)
Hedges g er en estimator af populationens effect size θ(jf. Hedges, 1981) og kan fortolkes som
differencen mellem to givne latente means (κ iG¿ i termer af deres standardafvigelser. Ved gussian
fordelte data følger utrykket g ∙√(n1n2 ) /(n1+n2) en ikke central t-fordeling med antal frihedsgrader
lig summen af de to stikprøvestørrelser – 2 og med ikke centralitets parameteret √ (n1 n2 )/(n1+n2)θ.
Med udgangspunkt i disse sammenhænge er effekt sizes estimeret og t-statistikker samt p-værdier i
den relevante ikke centrale t-fordeling med 450 frihedsgrader beregnet.
Ved ARS er der estimeret en effect size på -1,55, hvilket ved en ikke central t-fordeling med 450
frihedsgrader giver en p-værdi tæt på 0 ud fra en t-statistik på -16,43. Via de estimerede means for
ARS ses det, at den forventede værdi af denne faktor er signifikant højere ved PAPI end for web –
dvs. signifikant mere acquiescence response style for denne mode. For DRS er der estimeret en
effect size på -0,05 – dvs. reelt 0. Den tilhørende t-statistik på -0,53 kunne dermed være undladt idet
p-værdier herfor vil være tæt på 1. I rapportens data er der således klar indikation på et ækvivalent
omfang af disacquiescence response style. Ved ERS og MRS er der estimeret g effect sizes på
henholdsvis -0,18 og 0,17 svarende til t-statistikker på -1,91 og 1,80. Med 450 frihedsgrader i en
ikke central t-fordeling og en tosidet hypoteseformulering (jf. manglende studier / teori om en
eventuel retning herfor) medfører det p-værdier et stykke over den normale kritiske værdi på 0,05.
Side 78 af 101
Tabel 6.2.6. χ2 test statistikker samt fit index ved modeller for test af fuld invarians af faktor kovarianser og fuld samt partiel invarians af error varianser
Der kan herved ikke etableres tilstrækkeligt statistisk evidens for et uens omfang af extreme og
midpoint response styles på tværs af modes. Et relateret spørgsmål er da, om der gælder samme
heterogenitet for de 4 RS faktorer, hvorfor et test for invariance of factor variances foretages:
χ2(df) = 458,38 (354) Δ χ 2(Δdf) = 5,12 (4) p = 0,275Root Mean Square Error of Approximation (RMSEA)= 0,026Comparative Fit Index (CFI) = 0,982Tucker Lewis Index (TLI) = 0,978
Kilde: som tabel 6.1.1.
Af ovenstående tabel ses en ændring af χ2statikken på 5,12 i forhold modellen for fuld skalar
invarians. Ved de yderligere 4 frihedsgrader giver det en tilhørende p-værdi på 0,275 – dvs. en klar
fastholdelsen af nulhypotesen omkring homogene varianser for de fire RS faktorer (H0: ϕ jjW=ϕ jj
p).
Denne sikre konklusion supporteres ud fra de tre fit index, som er stort set uændrede og fortsat klart
inden for de normalt etablerede fit grænser (fx Hair m.fl., 2006). I forhold til faktorerne ARS, DRS,
ERS og MRS gælder derfor meget kraftig evidens for deres ækvivalente grad af heterogenitet
mellem modes. Via de rapporterede standard errors i tabel 6.2.1. er denne konklusion imidlertid
ikke overraskende, idet disse fremstår at være meget ens. Det da udelukkende niveauet for ARS
faktoren, som er forskellig mellem de to modes i forhold sammenligningerne af de 4 RS faktorer. I
analysen i Wiejters (2006) søges der skabt evidens for metrisk og skalar invarians, således at en
sammenligning af latente means kunne foretages. Det er også det primære formål i dette kapitel,
men der vil dog kort testes nestede modeller for invarians af faktor kovarianser og error varianser,
idet den vil kunne styrke grundlaget for den efterfølgende diskussion / perspektivering af resultater.
χ2(df) Δ χ 2(Δdf) p RMSEA CFI TLI
Side 79 af 101
Fuld invarians af faktor kovarianser 491,23 (360) 5,85 (6) 0,440 0,028 0,981 0,976
Fuld invarians af error varianser
522,31 (372) 31,08 (12) 0,002 0,042 0,962 0,952
Partiel invarians af error varianser
511,01 (366) 19,78 (6) 0,003 0,038 0,968 0,954
Kilde: som tabel 6.1.1.
Ved modellen for fuld invarians af faktor kovarianser ses en ændring i χ2 statistikken på 5,85
sammenlignet med den for fuld invarians af faktor varianser. Ved de yderligere 6 frihedsgrader
svarer det til en p-værdi på 0,440 – dvs. en klar fastholdelse af nulhypotesen om ens korrelationer /
associationer mellem modellens RS faktorer (ϕ jkW=ϕ jk
p ). Denne klare konklusion underbygges også
af de 3 fit indexs uændrede niveauer. Nestes denne model for fuld invarians af kovarianser ved at
pålægge lighedsbegrænsninger for alle modellens error varianser opnås da en model for fuld
invarians af error varianser. Ved denne model ses imidlertid en p-værdi langt under grænsen på 0,05
samt fit index med ikke negligerbare forværringer – eksempelvis et fald i CFI på over 0,01. Af den
grund blev halvdelen af begrænsningerne relakseret, hvorved der blev testet for partiel invarians.
Ved denne model fremgik imidlertid stadig en meget lav p-værdi samt betydeligt forværrede fit
index, hvorfor nulhypotesen om ækvivalens for error varianser må afvises (H0: Θ jjW =Θ jj
P).
6.3. Diskussion og kritik af resultater
Dette afsnits centrale resultat er sandsynliggørelsen af samme omfang DRS, MRS og ERS men en
forskellig grad af ARS på tværs af modes. Spørgsmålet er da, om disse resultater kan tolkes ift.
response styles. Som omtalt i starten af afsnittet kan den tolkning være problematisk ud fra de
meningsfulde mønstre i data. Ud fra observationer ved omdelingen af PAPI samt oplyst tidsforbrug
ved web, synes hovedparten af respondenterne at tage sig passende tid til besvarelse, hvilket kan
give besvarelser ift. indhold. Afsnittets resultater bør dog ikke betragtes invalide at fortolke ud fra
ift. RS, men sandsynligvis præget af andre effekter - ikke mindst en reel content based responding
samt andre kilder til målefejl fx SDR. Statistisk er afsnittets konklusioner præget af betydelig
signifikans – ikke mindst ved testet for uens ARS. Havde der været mulighed for "partial out" af
øvrige effekter, synes det sandsynligt, at der stadig ville fremgå signifikant forskelle ved ARS. I
litteraturen for response styles foreslås det også af visse forfattere, at RS validt kan måles inden for
Side 80 af 101
samme skala (fx Watson, 1992). Et bedre design ville dog være det som bl.a. er anvendt i Weijters
(2006), hvor der vælges en række heterogene items, hvorved effekten af RS mere tydeligt fremgår. I
denne rapport ville det imidlertid bryde det initiale fokus på miljømæssig forbrugeradfærd.
Afsnittets resultater må også ses i et teoretisk perspektiv. ARS kan jf. McGee (1967) forklares ved
mangel på passende mængde af kognitive ressourcer – fx ved tidspres og forstyrrelser. Ved denne
rapportens web og PAPI dataindsamling kunne det være en mulig forklaring på mode forskelle. Det
skyldes, at der ved PAPI kan argumenteres for tidspres ift. den situation, at det er midt i en
holdundervisning. Derudover kunne man også forstille sig, at respondenterne kunne forstyrre
hinanden i modsætning til web, hvor de må antages at sidde alene og være i mindre grad af tidspres,
idet de selv har indvilget i deltagelse. For øvrige forklaringer på ARS synes der ikke at gælde
oplagte mode forskelle – det gælder fx manglende viden, udadvendte personligheder osv. Det
skyldes ikke mindst, at sådanne kendetegn må forventes udjævnet mellem modes via omtalte
randomisering. I forhold til de tre øvrige typer RS synes deres teoretiske forklaringer (jf. afsnit
2.3.1.) ikke at lægge op til signifikante mode forskelle, hvilket også er understøttet i dette afsnits
resultater. Imidlertid må det noteres, at der gælder megen DRS i data. Forklaringen herpå ud fra
teori kunne bl.a. være indadvendte personlighedstræk, personer som søger kontrol osv. Dette synes
ikke umiddelbart gældende for valgte population, hvorfor resultatet vurderes at være udtryk for item
content – dvs. ikke et reelt udtryk for et betydeligt omfang af DRS ved givne skalas besvarelser.
Et centralt element er linket mellem RS og rapportens fokale construct miljømæssig ansvarlig
forbrugeradfærd – herunder dets målemodel i kapitel 4. Til forskel fra kapitel 5 anvendes i dette
afsnit ECOSCALE items, hvorfor linket synes mere direkte. I forhold til målemodellen gælder det
dog, at kun 16 items indgår, mens analysen i dette afsnit anvender data for alle 31. Således kan dette
afsnits resultater ikke direkte overføres til konklusionerne i kapitel 4. I begge kap. er det centrale
fokus relationen mellem items og constructs, hvor RS evt. er en modererende effekt. Jf. Cheung and
Rensvold (2000) vil ARS påvirke item intercepts (τG) i de regressionsligninger, som forbinder
indikatorer og latente faktorer ( X i=τ i+λ ij ξ j+δ i¿ ved CFA. Resultatet i dette afsnit synes da at
forklare afvisningen af hypotesen om ækvivalente item intercepts i afsnit 4, idet den afvisning kan
være forklaret af dette afsnits påviste forskel i omfanget af ARS mellem modes. Disse analyser er
som nævnt foretaget ud fra forskellige items, men idet konklusionen i dette afsnit er meget klar
samt bl.a. foretaget ud fra de items som indgår i kapitel 4s målemodel, synes en betydelig
Side 81 af 101
sammenhæng at kunne gælde. Resultaterne kan tolkes som, at RS i form af ARS reelt har en
påvirkning på relationen mellem items og constructs, om end det kunne undersøges mere direkte –
fx via SEM. Desuden ses det, at der gælder højere grad af ARS for PAPI end web. Belæg for a web
da må være bedre / en løsning på omtalte gaps vil imidlertid kræve nærmere undersøgelser.
Metodisk vurderes rapportens simulane estimation af de fire typer RS som en klar styrke ift. mere
simple metoder – fx RS index. Dette styrker alt andet lige validiteten af afsnittes resultater.
Endvidere fremgår der meget klar model fit og kombineret med påvisningen af måleækvivalens er
de centrale sammenligninger af latent means sket ud fra et statistisk hensigtsmæssigt grundlag.
Dette må imidlertid også vurderes ud fra de statistiske forudsætninger ved MGCFA. I den
forbindelse kan der ud fra Mardias test ses evidens for multivariate normalitet via p-værdi >>0,05 –
dvs. en klar fastholdelse af H0: Y N ( μ , Σ ), hvor Y er givet ved vektoren [ ARSa , ARSb .. MRSc ] - dvs.
de beregnede RS indikatorvariable. For disse indikatorer gælder der desuden skævhed og kurtoisis
mål langt under grænserne på 2 og 7 (jf. bilag 7), hvorfor dette var at forvente. I AMOS er der
desuden tjekket for outliers via Mahalanobis distance samt følsomhedsberegninger for obs. med
høje værdier herfor. Disse resultater indikerer ingen betydningsfulde outliers. Desuden fremgår
ingen infeasible løsningselementer ved ML estimationen i AMOS, hvilke tolkes som et svagt tegn
på, at modellen er korrekt specificeret. Generelt antages der således ikke væsentlige problemer med
de gældende forudsætninger ved MGCFA, hvorfor ovenstående tolkninger synes valide.
6.4. Delkonklusion
I kapitel blev der etableret måleækvivalens for Wiejters (2006) målemodellen for ARS, DRS, ERS
og MRS. Herudfra var det meningsfuldt at foretage en sammenligning af disse faktorers means,
hvilket sandsynliggjorde en signifikant mode forskel vedrørende ARS og ingen signifikante
forskelle for de tre øvrige styles. I den forbindelse blev det yderlige påvist at heterogeniteten for
disse faktorer med rimelig kan antages ækvivalent på tværs af modes ligesom deres indbyrdes
korrelationer. Disse konklusioner er foretaget under evidens for opfyldelse af de statistiske
forudsætninger ved MGCFA. Den fra start etablerede hypotese H3 kan således til et vist omfang
afvises på baggrunden af forskellen vedr. ARS. Denne forskel synes desuden til en vis grad at
kunne forklare afvisningen af skalar invarians i kapitels 4s målemodel, om end den er estimeret ud
fra færre items end dette kapitels. En central diskussion er også hvorvidt dette kapitels resultater
overhovedet kan tolkes i termer af respons styles. Om end de ikke er frembragt ud fra et optimalt
Side 82 af 101
design (meget homogene items), medfører den klare ARS konklusion, at der under alle
omstændigheder synes evidens for respons style forskelle ved denne faktor.
7. Konklusion
I dette afsnit vil der foretages en samlet konklusion i forhold til rapportens besvarelse af
problemformuleringens tre underspørgsmål og de tilhørende hypoteser: H1,H2 og H3.
- Ved måling af miljømæssig ansvarlig forbrugeradfærd ud fra kapitel 4s målemodel blev der
etableret evidens for manglende måleækvivalens i form af forskellige item intercepts på tværs af
modes. H1 hypotesen omkring måleækvivalens mellem web og PAPI må herudfra afvises. Denne
afvisning understøttes af indikation på opfyldelse af de statistiske forudsætninger ved MGCFA samt
brugen af en hensigtsmæssig målemodel. Imidlertid må der tages forbehold for en eventuel
påvirkning af non-respons error på tværs af modes.
Side 83 af 101
- Ved målemodellen for SDR blev der påvist måle- og strukturel ækvivalens på tværs af modes,
hvorudfra der er sandsynliggjort samme omfang SDR herimellem. H2 hypotesen omkring samme
grad af SDR mellem web og PAPI må herudfra fastholdes. Dette sker ved en meget valid skala og
indikation på opfyldelse af statistiske forudsætninger ved MGCFA. Konkret synes der at gælde
samme omfang ubevidst SDR i form af SDD og SDE. Via manglende simultan estimation er linket
til miljømæssig ansvarlig forbrugeradfærd dog ikke direkte.
- Ved Wiejters målemodellen for RS blev der påvist måleækvivalens, hvorudfra det kunne
sandsynliggøres, at der var signifikant forskel mellem means ved acquiescence response style. Ud
fra en meget sikker konklusion må H3 hypotesen omkring samme grad af RS mellem web og PAPI
afvises. Dette foretages ved en målemodel med høj fit i data samt indikation på opfyldelse af
forudsætningerne ved MGCFA. Via de homogene ECOSCALE items kan det imidlertid diskuteres i
hvor stor en udstrækning, at der reelt er tale om RS.
På baggrund af ovenstående kan det samlet set konkluderes, at der er påvist evidens for forskellige
resultater ved måling af miljømæssig ansvarlighed på tværs af web og PAPI modes. Den manglende
måleækvivalens ved rapportens målemodel synes her at kunne skyldes den signifikante forskel ved
acquiescence response style mellem modes. Hvorvidt der herudfra måtte kunne gælde en gunstig
mode effect / løsning for omtalte gaps vil imidlertid kræve nærmere empiriske undersøgelser.
8. Perspektivering
På baggrund af rapportens resultater og konklusioner vil der afslutningsvist foretages en kort
perspektivering herudfra. Der vil således diskuteres perspektiver, hvor rapportens resultater kan
have en signifikant informationsværdi – såvel kommercielt som videnskabelig.
Jf. Couper (2000) er en type web survey: web option in mixed mode surveys. Herudfra er
spørgsmålet, om den type og generelle mixed mode design bør anvendes i konteksten miljømæssig
ansvarlig forbrugeradfærd – dvs. i hvilket omfang kan data fra forskellige modes lægges sammen
med data indhentet via web. Ud fra denne rapport er det påvist, at det kan være problematisk i
forhold til PAPI. Herudfra må det anbefales, at der initialt undersøges for måleækvivalens ved en
Side 84 af 101
sådan strategi. Det synes imidlertid mere hensigtsmæssigt at tage udgangspunkt i en konkret mode.
Det skyldes, at håndteringen af flere forskellige modes samtidigt kan være kompleks og
ressourcekrævende. Rapportens resultater viser her, at en sådan strategi tilmed kan medføre data,
som ved sammenlægning udgør en trussel i forhold validitet. Denne diskussion gælder både i et
kommercielt og videnskabeligt perspektiv. Ved førstenævnte er det helt centralt, at der opnås valide
data ved diverse markedsundersøgelser. For sidstnævnte perspektiv er det centralt, at de etablerede
forskningsresultater også har høj validitet. I begge tilfælde må de givne undersøgere således være
varsomme ved mixed modes studies inden for miljømæssig ansvarlig forbrugeradfærd.
Ved sammenligning af web med andre modes har særligt responsrate – risikoen for non-respons
error været undersøgt. Dette har ikke været muligt inden for denne rapports rammer, men dets
resultater er imidlertid underlagt den usikkerhed, at der ud fra de meget forskellige responsrates kan
være effekt af non-respons error. Der er herudfra et behov for en undersøgelse vedr. responsrates
inden for konteksten miljømæssig ansvarlig forbrugeradfærd. Dette vil delvist kunne afdække,
hvorvidt denne rapports konklusion om respons styles i virkeligheden kan tolkes i termer af respons
styles. Det må betones, at der i rapporten kun er undersøgt to typer af kilder to målefejl. Det synes i
den forbindelse oplagt at kunne have undersøgt andre typer, hvilket desuden ikke er gjort tidligere i
den konkrete kontekst vedr. miljø. Disse facts påpeger således, at der fortsat er behov for forskning
inden for miljømæssig ansvarlig forbrugeradfærd i et måleteoretisk / metodisk perspektiv. Som
nævnt er litteraturudviklingen i den metodiske retning ved etisk forbrugeradfærd også ganske
begrænset på nuværende tidspunkt, hvorfor fremtidige bidrag synes at være nødvendige.
Rapportens undersøgelse af SDR bekræfter model fit ift. BIDR på danske data, hvilket også
tidligere er observeret (fx De Jong m.fl., 2010). I alle tilfælde er der blevet undersøgt under
anonyme forhold. Der er således meget begrænsede empiriske resultater i forhold til impression
management i en dansk kontekst ud fra Paulhus BIDR. Inden for survey modes kunne det bl.a.
testes via CATI el. almindeligt face-to-face interview, hvor det må forventes at gælde risiko for, at
den givne respondent giver socialt acceptable svar over for den givne undersøger. I en dansk
kontekst synes denne form for SDR imidlertid at være observeret – fx ved politiske
meningsmålinger, den såkaldte DF måleproblematik. I den forbindelse er det dog ikke konkret
undersøgt med udgangspunkt i SDR teori. Idet SDR er socialt baseret, så synes kvantitative metoder
også at have deres begrænsninger. Ved et nærmere analyse af SDR synes der med fordel at kunne
Side 85 af 101
anvendes kvalitative metoder, hvor de enkelte respondenter da gav udtryk for deres meninger i en
mere åben facon. Dette synes mest oplagt ved impression management studier, idet self-deception
er givet som ubevidst, hvorfor respondenterne ikke selv er klar herover. Således foreslås det ved
nærmere undersøgelser af SDR i en dansk kontekst og andre lande, at der i visse tilfælde kunne
overvejes triangulering med kval. metoder, såsom fokusgrupper el. semistrukturerede interview.
Ved analysen af response styles blev der påvist en mulig forskel ift. ARS. Dette resultat må først og
fremmest undergå nærmere forskning for at det fuldt ud etableres hvad konsekvensen er i et item-
construct perspektiv. Under antagelse heraf synes resultatet samt den initiale påviste mangel på
måleækvivalens ved miljømæssigt ansvarlig forbrugeradfærd også at være brugbart for den
modelbaserede litteraturretning. Det kunne eksempelvis medtages ved sammenligning af data fra
forskellige survey modes (særligt web og PAPI). Derudover kunne det give anledning til at tjekke
for påvirkningen af respons style ved en given anvendt fokal skala. Det gælder således, at denne
rapports resultater ikke kun bør ses som en del af litteraturudviklingen inden for dens egen retning,
men også som en eventuel løsning / guide for modelleringen i den modelbaserede litteraturretning.
Afslutningsvist kan resultatet vedr. RS også ses i et bredende perspektiv inden for den metodiske
litteratur, hvor der hidtil har været tegn på, at web surveys gave mere ekstreme / afvigende svar.
Dette ses ikke ud fra denne rapport, - derimod gælder det, at PAPI som nævnt har højere grad af
ARS. Dette er i modsætning til hvad man måtte kunne forvente ud fra den hidtidige litteratur.
9. Litteraturliste
A ______________________________________________________________________________
Aavik.T.; Kenn.K. &. Allik.J. (2006),”Social Desirability and Consensuel Validity of Personality Traits,” European Journal of Personality, (20), s. 549-566.
Ajzen, I. (1985), “From intentions to actions: AA theory of planned behavior. In J. Kuhl & Beckman .J. (eds), Action-control: From cognition to behavior” s. 11-39. Umass.edu Icek Ajzen Selected Publications.
Ajzen, I. & Fishbein,M. (1980), “Understanding attitudes and predicting social behavior,” Englewood Cliffs, NJ. Prentice-Hall.
Side 86 af 101
Album.G.; Roster.C.; Wiley.J.; Rossiter.J. &. Smith.S. (2010), “Designing Web in marketing research: Does use of forced Answering Affect Completion Raytes?” Journal of Marketing Theory and Practice, Vol.18, no. 3, s. 285-293.
Andrews.F. (1984), “Construct validity and error components of survey measures: modeling approach,” Public Opinion Quarterly, (48), s. 409-442.
Arbnor.I. &. Bjerke.B. (2009), ”Methodology for Creating Business knowledge,” Saga Publications Inc. 2.udgave.
Arcury. T.A. (1990),“ Environmental Attitudes and Environmental Knowledge.” Human Organization, (49), s. 300-304.
Attala.A.; Carringa.M. &. Attala.A. (2001),”The Myth of the Etical Consumer- Do Ethics Matter in Purchase Behavior,” Journal of Consumer Marketing, (18), s. 560-577.
Auger.P.; Burke.P.; Devinney.T.M. &. Louviere.J.J. (2003),”What Will Consumers Pay for Social Product Features?,”Journal of Business Ethics,(42), s. 281-304.
Auger.P &. Devinney. T. (2007), “Do What Consumers Say Matte? The Misalignment of Preferences with Unconstrained Intentions”, Journal of Business Ethics, (76), s. 361-383.
B ______________________________________________________________________________
Bachman.J. &. O`Malley.P. (1984), “Yea-Saying, Nay-Saying, and Going to Extremes: Black-White Differences in Response Styles,” Public Opinion Quarterly, (48), s. 491-509.
Bartlett.M.S. (1950),”Tests of Significance of Factor Analysis” British Journal of Psychology (Statistical Section), Vol. 3, s. 77- 85.
Bates.N.; Martin.E.; DeMaio.T,J, &. De la Puerte.M. (2006), Questionnarie Effects on Measurements of Race and Spanish origin research Report Series,” Statistical Research Division, US Census Bereau.
Baumgartner.H. &. Steenkamp.J. B.E.M. (1998),”Multi-group latent variable models for varying numbers of items and factors with cross-national and longitudinal applications,” Mark. Lett. (9), s. 21-35.
Baumgartner.H. &. Steenkamp. J. (2001), “Response Styles in Marketing Research: A Cross-National Investigation”, Journal of Marketing Research, Vol. XXXV111, (2011), s. 143-156.
Bearden.W.O. &. Netemeyer.R.G. (1999), “Handbook making scales: Multi-item measures for Marketing and Consumer behavior research, 2d Ed.” Saga Publications.
Side 87 af 101
Belk.R.; Devinney.M.T. &. Eckhardt.G. (2005),”Consumer Ethics Across cultures,” consumption, Markets and culture, (8), s. 275-289.
Bennet.D.B. (1974),“ Evaluation Environmental education programs,” Environmental educations. 113-164. John Wiley &. Sons, Inc.
Bernreuter.R.G.(1933), “Validity of the personality inventory.” Personality Journal, (11), s. 383-386.
Bernstein.I & Nunnally.J.(1994),” Psychometric Theory, (3rd edn.), McGraw-Hill.
Bernstein.I & Nunnally.J.(2006),”Psychometric Theory”, McGraw-Hill, Inc. 3. Udgave.
Beuckelaer.A. & Lievens.F. (2009),”Measurement Equivalence of paper-and-Pencil and Internet Organisational Surveys: A Large Scale Examination in 16 Countries.” Applied Psychology: An Internationale Revie,(58), s. 336- 361.
Black.I. & Areni.C. (2008),”Why Consumers don’t do as they say: Hyperbolic Discounting vs. Temporal Construal Theory. Paper Presented at the International Centre for Anti-Consumption Research Symposium, Sidney, Australia.
Blair.E.; Sudman.S.; Bradburn.N. &. Stocking.C. (1977),”How to ask questions about drinking and sex: Respose effect in measuring behavior,” Journal of Marketing Research, (14), s. 316-321.
Blumberg.B; Cooper.D & Schindler.P.(2008), “Business Research Methods,” McGrave-Hill Companies 2. udgave.
Bollen.K.A. (1989),”Structural Equations With Latens Variables,” Wiley, New York.
Boulstridge.E. & Carrigan.M. (2000),”Do Conusmers Really Care about Corpurate Responsibility? High lightning the Attitude-Behavior Gab,” Journal of communication Management, (4), s. 355-368.
Brace.I.(2008),”Questionaire Design. How to Plan, Structure and Write survey Material for Effective Market Research.” London: Kogan Page.
Bray.J.; Johns.N.& Kilburn. D. (2011),”An Exploratory Study into the Factors Impeding Ethical Consumption,” Journal of Business Ethich , (98), s. 597-608.
Brown.T. (2006),”Confirmatory Factor Analysis for Applied Research,” The Guilford Press.
Bray.J.; Johns.N. &. Kilburn.D. (2010),”An Exploratory Study into the Factors Impeding Ethical Consumption,” Journal of Busines Ethich, (98), s. 597-608.
Byrne.B.M.; Shavelson.R.J. &. Muthen.B. (1989),”Testing for the equivalence of factor covariance and mean structures: the issue of partial measurement,” Psychol. Bull. (105), s. 456-466.
Side 88 af 101
C ______________________________________________________________________________
Carayon.P. &. Hoonakker.P. (2009),”Questionnaire Survey Nonresponse: A Comparison of Postal Mail and Internet Surveys,” Journal of Human-Computer Interaction, (25), s. 348-373.
Carpenter.J.B. &. Dudycha.A.L. (1973),”Effects of Item format on Item discrimination and difficulty.” Journal of Applied Psychology, (58), s. 116-121.
Carringa.M. &. Attala.A. (2001),”The Myth of the Etical Consumer- Do Ethics Matter in Purchase Behavior,” Journal of Consumer Marketing, (18), s. 560-577.
Cattell.R.B. (1966),”The Scree Test for the Number of Factors,” Multivariate Behavioral Research, Vol.1. s. 245-276.
Churchill.Jr.G.A. (1979), ”A paradigm for developing better measure of marketing,” Journal of marketing, (16), s. 64-73.
Converse.J. &. Presser.S. (1986), ”Survey Questions. Handcrafting the Standard Questionnaire,” Sage.
Couper.M.(2000),”Web Surveys. A review of issues and Approaches,” Public Opinion Quarterlig, Vol. 64, s. 464-494.
Cronbach.L.J. (1946),”Response sets and test validity,” Educational and Psychological Measurement, (6), s. 475-494.
Cronbach.L.J. &. Meehl.P.E. (1955),”Construct validity in psychological tests,” Psychol. Bull. (52), s. 281-302.
Cronbach.L.J.; Rajaratnam.N: & Gleser.G.C. (1963),”Theoryof Generalizability: A Liberalization of Reliability Theory,” British Journal of Statistical Pzychology, (16), s. 137-163.
D ______________________________________________________________________________
Daniels.L.R. &. Berkowitz.L. (1964), “Affecting the salience of social responsibility norms.” Journal of Abnormal and Social Psychology, (68), s. 275-281.
Defra. (2006)”Sustainable consumption and production: Encouraging sustainable Consumption”.
De Jong.M.; Pieters.R. & Fox. J. (2010),”Reducing Social Desirability Bias through Item Randomized Response: An Application to Measure Underreported Desires”, Journal of Marketing Research, Vol. XLV11, (2010) s. 14-27.
Side 89 af 101
De Jong.M.; Steenkamp.J &. Baumgartner. (2010),”Socially Desirable Response Tendencies In Survey Research,” Journal of Marketing Research, Vol. XLV11, (april 2010), s. 199-214.
De Pelsmacker.P.; Dreisen.I. &. Rayp.G. (2005),”Do Consumers Care About Ethich? Willingness to Pay for Fair-Trade Coffee,” The Journal of Consumers Affairs, (39), s. 363-385.
Deutskens.E. (2006), “From Paper-And-Pencil to Screen-And-Keyboard: Studies on the Effectiveness of Internet-Based Marketing Research,” Maastricht University, (doktordisputants).
Dillman:D. (2000),”Mail and Internet Surveys. The Tailored Design Method,“ New York: John Wiley & Sons, Inc.
Dunlap.R.E., & Van Liere. K. D. (1978).”The new Environmental Paradigm.” Journal of Enviromentel Education, (9), s. 10-19.
E ______________________________________________________________________________
Edwards, A.L. (1957), “The social desirability variable in personality assessment and research.”New York Dryden.
Epstein.J.; Klingenberg.W.D.; Wiley.D.& McKinley.L. (2001),”Isuring Sampler Eqivalance across Internet and Paper-and-Pencil assessments,” Computers in Human Behavior, (17), s. 339-346.
F ______________________________________________________________________________
Fadem.B. “Behavioral Science. Board Review Series”s. 262.
Fink.A. (2003),”How to Ask Survey Questions.” Thousand Oaks, CA: Sage s. 210-231.
Finny.S.J. & Distefano.C.”Nonnormal and categorical date in structural equation modeling,” Gregory.R.Hancock & Ralph.O.Mueller (eds), Structural Equation Modelling; A Second course, Information Age Publishing.
Flick.U, (2009),“An Introduction To Qualitative Research,” Saga Publications Ltd 4. udgave.
Foddy.W. (1993),”Constructing Questions for Interviews and Questionnaires. Theory and Practice in Social Research.” Cambridge Universitet Press.
Follows.S. & Jobber.D. (2000),”Environmentally Responsible Purchase Behavior: A Test of A Consumer Model,” European Journal of Marketing, (34), s. 723-746.
Fornell.C. & Larcker.D.F. (1981),”Evaluating Structural Equation Models with unoberservabel variables,” Journal of Marketing Research, (18), s. 39-50.
Side 90 af 101
Futtera.S.C.L. (2005),”The Rules of the game: The Principals of Climate change Communication,” Department for Environment, Food and Rural Affairs, London.
Fowler.F.J. (1992),”How unclear terms affect survey data,” Public opinion Quarterly, (56), s. 218-231.
Fowler.F.J. & Mangione.T.W. (1990),”Standardized Survey Interviewing: Minimizing Interviewer-Related Erro. Newbury Park. Saga Publications.
G ______________________________________________________________________________
Greenleaf.E. (1992a),”Improving Rating Scale Measyres by Detecting and Correcting Bias Components in Some Response Styles,” Journal of Marketing Research, (29), s. 176-188.
Greenleaf.E. (1992b),”Measuring Extreme Response Style,” Publis Opinion Quaterly, (56), s. 328-351.
H ______________________________________________________________________________
Hamilton.D. (1968), “Personality Attributes Associated with Extreme Response Style,” Psychological Bulletin. (69), s. 192-203.
Hair.J; Black.W; Babin.B; Anderson.R & Tatham.R. (2006),”Multivariate Data Analysis,” Pearson Prentice Hall, 6. udgave.
Hayduk.L.A. (1989),”Structural Equation Modeling- Essentials and Advances,” The John Hopkins Universitet Press. Baltimore and London.
Hines.J.M.; Hungerford.H.R. & Tomera.A.N. (1986). “Analysis of research on responsible environmental behavior: A meta- analysis.” Journal of Environmental Education, (18), s. 1-8.
Holzer.E. & Schann.J. (1990), “Studies of individual environmental concern: The role of knowledge, gender, and background variables,” Enviroment and behaviour, (22), s. 767-786.
Hu.Li-Tze & Bentler.P.M. (1999),”Cutoff criteria for fit Indexes in covariance Structure analysis: Conventional criteria versus new Alternatives,” Structural Equation modeling, (6), s. 1-55.
Hugner.R.S.; McDonagh.P.B.; Prothero.A.; Schultz.CJ II.& Stanton.J. (2007), “Who are organic food consumers? A compilation and review and why people purchase organic food,”Journal of Consumer Behaviour, (6), s. 94-110.
Side 91 af 101
Hue.C.H. & Triandis.C. (1985), “The instability of response sets,” Public Opinion Quaterly, (49), s. 253-260.
Hull.C.L. (1943),”Principles of Behavior ,” Phil. & phenomenol. res. (6), s. 590-602.
J ______________________________________________________________________________
Jackson.E.L. (1985).”Environmentel attitudes and Preferences for Energy Resource Options.” Journal of Environmentel Education, (17) s. 23-30.
Janssens.W. og De Pelsmacker.P. (2007),”A Model for Fair Buying Behaviour: The Role of Perceived Quantity and Quality of Information and Product-Specific Attitudes,” Journal of Business Etics, (75), s. 361-380.
Jobber.D. og Follows.S. (2000),”Environmentally Responsible Purchase Behavior: A Test of A Consumer Model,” European Journal of Marketing, (34), s. 723-746.
Jones.E.E & Sigall.H. (1971),”The bogus pipeline: A new paradigm for measuring affect and attitude.” Phychological Bulletin, (76), s. 349-364.
K ______________________________________________________________________________
Kaiser.H.F. (1959),”The Application of Electronic Computers to Factor Analysis,” Symposium on the Application of Computers to Psychological Problems, American Psychological Association.
Kaiser.H.F. (1958),”The Varimax Criterion for Analytic Rotatation in Factor Analysis,” Psychometrika. Vol.23. s. 187-200.
Kaiser.H.F. (1970),”A second-generation Little Jiffy” Psychometrika, (35), s. 401-415.
Kaiser.H.F. (1974),”Little Jiffy, Mark IV” Educational and Psychological Measurement, (34), s. 111-117.
Keniston. K & Couch. A. (1960), ”Yeasayers and Naysayers: Agreeing Response Set as a Personality variable,” Journal of Abnormal and Social Psychology, (60), s. 151-172.
Klassen.R.D. og Jacobs.J. (2001),”Experimental of Web, Electronic and Mail Survey Technologies in Operations Managment,” Journal of Operations Management, (19), s. 713-728.
Kline.R. (2005),“Principles And Practice Of Structural Equation Modeling,” The Guilford Press 2. udgave.
Side 92 af 101
Knapp.H. og Kirk.S.A. (2003),”Using Pencil and Paper, Internet and Touch-Tone Phones for Self-Administered Surveys: Methodology Matter?” Computers in Human Behavior, (19), s. 117-134.
Kotler.P.: Keller.K.: Brady.M.: Goodman.M. & Hansen. T. (2009),”Marketing Management,” Pearson Prentice Hall, 1. udgave.
Krumpal.I.; Rauhut.H.; Bøhr.D. & Naumann.E. (2008),”Wie wahrschenlich ist “wahrscheinlich,” Methoden - Daten – Analysen, (2), s. 3-27.
L ______________________________________________________________________________
Lattin.J.: Carroll.J. & Green.P. (2003),”Analysing Multivariate Data,” Brooks / Cole Cengage Learning 1. Udgave.
Leeuw.J . med flere (2000), “Structural Equation Modeling,” Saga Publications, Inc.
Leite.W. og Cooper.L. (2010), “Social Desirability Bias Using Mixture Models,” Multivariate Behavioral Research, s. 271-293.
Lentz.T.F. (1938),”Acquiescence as a factor in the measurement of personalit,y” Phycholocal Bulletin, (35), s. 659.
Lietz.P. (2010),”Research into questionnaire design. A summary of the literature,” The Market Research Society.
Lievens.F. og Beuckelaer.A. (2009),”Measurement Equivalence of paper-and-Pencil and Internet Organisational Surveys: A Large Scale Examination in 16 Countries.” Applied Psychology: An Internationale Review, (58), s. 336-361.
Little.T.D. (1997),”Mean and covariance structures (MACS) analyse of crosss-culturel data: practical and theoretical issues,” Multivariates Behav. Res. (32), s. 53.
Louviere.J.J.; Hensher.D.A. og Swait.J.D. (2000),”Stated Choice Methods: Analysis and Applications,” Cambridge University Press.
Lynch.R. (2009),”Strategic Management (formerly corporate strategy),” Prentice Hall, (5. edt)
M ______________________________________________________________________________
Marsh.H.W. og Hocevar.D. (1985),”Application of confirmatory factor analysis to the study of self-concept: first-and higher order factor models and their invarianse across grups.” Psychol. Bull. (97), s. 562-582.
Side 93 af 101
Martin.J. (1964), “Acquiescence-Measurement and Theory,” British Journal of Social Psychology, (3), s. 216-225.
Martin.E. (2002),”The effects of questionnaire design and reporting of deyailed Hispanic origin incensus 2000 mail questionnaires,” Public Opinien Quarterly, (66), s. 582-593.
Mason.T. (2000),”The Importance of Being Ethical,” Marketing 26 .october, (27).
Maxwell.S.E. & Cole.D.A. (1985),”Multitrait-multimethod comparisons across population: a confirmatory factor analytic approach.” Multivarieate Behav. Res. (20), s. 389-417.
May.V.A. (1999),”Survey 2000: Charting Communities and change,” National Geographic, (196), s. 130-133.
McGee.R.(1967),” Response Set in Relation to Personality: An Orientation,” Response Set in Personality Assessment, Aldine Publishing Compagny, s. 1-31.
Meehl.P. & MacCorquodal.K. (1948), “On a Distinction Between Hypothetical Construts and Intervening Variables,” Psychological Review, (55), s. 55-107.
Meredith.W. (1993),”Measurement invariance, factor analysis and factorial invariance,” Psychometrika, (58), s. 525-543.
Messick.S. (1962),”Response style and content measures from personality inventories,” Educational-and Psycological Measurement, (22), s. 41-56.
Messick.S. & Jackson.D.N, (1958),”Content and style in personality assessment,” Psychological Bulletin, (55), s. 243-252.
Messick.S & Damarin.F. (1965),”Response styles as personality variables: A theoretical integration of multivariate research,” (Res. Bull. No. 65-10) Educational Testing Service.
Messick.S. (1967),”The Psychology of Acquiescence: An Interprentation of Research Evidence,” Response Set in Personality, AldinePublishing Company, s. 115-145.
Messick.S. (1968), “Response Sets,” International Encyclopedia of the Social Sciences, Vol. 13, Macmillian, s. 492-496.
Messick.S. (1991), “Psychology and Methodology of Response Styles,” Improving Inqyiry in Social Science: A Volume in Honer of Lee J. Cronbach, Richard E. Snow and David E. Wiley, eds. Hilladale, NJ. Lawrence Erlbaum Associates, s. 161-200.
Miller.P.V. og Couper.M.P. (2008),”Web Survey Methods Introduction,” Public Opinion Quarterly. Vol. 72. No. 5. s. 831-835.
Side 94 af 101
N ______________________________________________________________________________
Neville.B.; Whitwell.G. & Carrington.M. (2010), “Why Ethical Consumers Don`t Walk Their Talk: Towards a Framework for Understanding the Gap Between the Ethical Purchase Intentions and Actual Buying Behaviour of Ethically Minded Consumers,” Journal of Business Ethics, (97), s. 139-158.
Norvick.M.R. (1966),”The axioms and principal results of classical test theory,” Journal of Mathematical Psychology, Volume 3, Issue 1, s. 1-18.
O ______________________________________________________________________________
O`Donovan.D. (1965),”Rating Extremity: Pathology or Meaningfulness,” Psychological Review (72), s. 358-372.
Olsen.H. (2005), ”Fra spørgsmål til svar,” Akedemisk Forlag, 1. udgave.
Oksanen.R. & Uusitalo.O. (2004),”Ethical Consumerism : A View from Findland,” International Journal of Consumer Studiers, (28), s. 214-221.
O`Muircheartaigh.C.; Gaskell.G. & Wright.D. (1993),”Intensifiers in behavioral frequency questions,” Public Opinion Quarterly, (57), s. 552-565.
O’Neill.H.W.(1967), “Response Style Influence in Public Opinion Surveys,” Public Opinion Quarterly, (31) s. 137-157.
Oppenheim.A.N. (1992),”Questionnarie Design, Interviewing and Attitude Measurement,” Pinter.
P ______________________________________________________________________________
Papaoikonomou.E.; Ruan.G. og Ginieis.M. (2011),”Towards a Holistic of the Attitude Behavior Cap in Ethical Consumer Behaviors: Emperical Evidence from Spain,” International Atlantic Economic Society, (17), s. 77-88.
Paulhus. D. (1984),”Two-components models of socially diserable responding,” Journal Personality and Social Psychology, (46) s. 598-609.
Paulhus. D. (1988),”Manual for the balanced Inventory of Desirable Responding,” (BIDR-6) Unpublished manual, University Of British Columbia.
Paulhus. D. (1991),”Measurement and Control of Response Bias,” Measures of Personality and Social Psychological Attitudes. Academic Press. s. 17-59.
Side 95 af 101
Paulhus, D. (1998a), ”Intrapsychic and interpersonal adaptiveness of trai self-enhancermet:A mixed blessinf,” Journal Of Personality and social psychology, (74) s. 812-820.
Paulhus, D. (1998b),”Manual for the Balanced Inventory of Desirable Responding,” (BIDR-7) Multi-Health System.
Paulhus, D. & John .O.P. (1998), ”Egoistic and moralistic bias in self-perceptions: The interplay of self-deceptive styles with basic traits and motives,” Journal of Personality, (66) s. 1024-1060.
Paulhus. D. ( 2002),”Socially Desirable Responding: The Evolution of a Construct,” The Role of Constructs in Psychological and Educational Measurement, Mahwah, NJ: Lawrence Erlbaum Associates, s. 49-69.
Pauls.C.A. & Stemmler.G. (2003),”Substance and Bias in Social Desirability Responding;” Personality and Individual differeb´nces, (35), s. 263-275.
Ployhardt.R.E. & Oswald.F.L. (2004),”Appligations of means and structure analysis: integrating correlational and experimental approaches,” Organ, Res. Methods, (7), s. 27-65.
Podsakoff.P.M.; MacKenzie.S.B.; Lee.J.Y. & Podsakoff.P. (2003),”Common method biases in behsvioral research: A critical rewiev of the literature and recommended remedies,” Journal of Applied Psychology, (88), s. 879-903.
Presser.S. & Blair.J. (1986),”Survey presteting:do different methods produce different results?” Sociological Methodology, (24), s. 73-104.
Presser.S. & Schuman.H. (1981) ,“Questions and answers in attitude surveys: Experiment on question form, wording, and context,” Acadamic Press, (New York).
R ______________________________________________________________________________
Ray.J. (1983), “Reviving the Problem of Acquiescent Response Bias,” Journal of Social Psychology, (121), s. 81-96.
Rensvold.R.B. & Cheung.G.V (2000),”Assessing extreme and acquiescense response sets in cross-cultural research using structural equation” Journal of Cross-cultural Psychologi ,(31), s. 187-212.
Rips.L.J.;Rasinski.K. & Touraangeau.R. (2000),“The psychology and survey Response,” Cambridge University Press.
Rogers.D. (1998),”Ethical Tactics Arouse Public Doubt,” Marketing, (august 6), s. 12-13.
Side 96 af 101
Roster.C.A.; Rogers.R.D.; Albaum.G.& Klein.D. (2004),”A Comparison of Response Characteristic from Web and Telephone surveys,” international Journal of Market Research, (46), s. 359-373.
Rossi.P.E.; Gilula.Z. & Allenby.G.M. (2001),”Overcoming scale usage heterogeneity: A Bayesian hierarchical approach,” Journal of the American Statistical Association, (96), s. 20-31.
Roth.M. & Herzberg.P.Y. (2007),“The resilient Type “Simply the best” or Merely and artifact of Social desirability,” Physchological Signs, (49), s. 150-167.
Ruan.G.; Ginieis.M. & Papaoikonomou.E, (2011),”Towards a Holistic of the Attitude Behavior Cap in Ethical Consumer Behaviors: Emperical Evidence from Spain”, International Atlantic Economic Society ,17, s. 77-88.
S ______________________________________________________________________________
Sackeim.H.A. & Gur.R.C. (1978), “Self-deception, other-deception and consciousness, ” G.E. Schwartz & D. Shapiro (Eds.), Consciousness and self-regulation: Advance in research Vol. 2. S.139-197. Plenum Press.
Sackeim.H.A. & Gur.R.C. (1979), “Self-deception, other deseption and selfreported psychopatholagy,” Journal of Consulting Clinical Psychology, (47) s. 213-215.
Sackeim.H.A. (1983), “Self-deception, self-estem,and depression: The adaptive value of lying to oneself In J. Masling(ed). Emperical studies of psychoanalytic theories s. 101-157, Lawrence Erlbaum Associates.
Schann.J., & Holzer. E. (1990), “Studiers of individual environmental concern: The role of knowledge, gender, and background variables.” Environment and Behavior, (22), s. 767-786.
Schillewaert.N. & Meulemeester.P. (2005),”Comparing Responce Distribution of offline and online Data Collection Methods,” International Journal of Market Research, (47), s. 164-178.
Schwarz.N. & Sudman.S. (1992), “Context Effects in Social and Psychological Research,” Springer.
Schwartz.N.; Steinmetz.H.; Schmidt.P.; Tina-Booh.A. & Wieczorek.S. (2009),”Testing Measurement using multigroupe CFA: differences between educational groups in human values measurement,” Qual Quant, (439, s. 599-616.
Schulman.A. (1973), A Comparison of Two Scales on Extremity Response Bias,” Public Opinion Quarterly. (37), s. 507-412.
Side 97 af 101
Shaw.D.; Shiu.E.; Hassan.L.; Bekin.C. & Hogg.G. (2007), “Intending to be Ethical: An Examination of Consumer Choice in Sweatshop Avoidance,” Advances in Consumers Research (34), s. 31-38.
Shaw.D. & Connolly.J. (2006),”Identifying Fair Trade in Consumption Choice,” Journal of Stratic Marketing, (14), s. 353-368.
Shaw.D. & Shui. E. (2002),”An Assessment of Ethical Obligation and Self-Identity in Ethical ConsumerDecision- Making: A Structural Equation Modelling Approach,” International Journal of Consumer Studiers, (26) s. 286-293.
Simon.F.L. (1995),”Global Corporate Philanthropy: A Strategic Framework,” International Marketing Review, (12), s. 20-37.
Stanton.J.M. (1998),”An Emprerical Assessment of Data Collection Using the Internet,” Personel Psychology, (51), s. 709-725.
Steenkamp.J. & Ter Hofstede.F. (2002),”International Market Segmentation: Issues and Outlook,” International Journal of Research in Marketing, (19), s. 185-213.
Stone.G. & Montgomery.C. & (2009), “Revisiting Consumer Environmentel Responsibility: A Five Nation Crosscultural Analysis and Comparison of Consumer Ecological And Behaviors,” International Journal of Management and Marketing Research.Vol. 2. Nr. 1 s. 35-58.
Stone.G.; Barnes.J. & Montgomery.C. (1995), ”Ecoscale: A Scale for the Measurement of Environmentally Responsible Consumers,” Psychology & Marketing, John Wiley & Sons, Inc. Vol.12(7) s. 595-612.
Sudman.S. & Bradburn.N.V. (1992),”Response Effects in Surveys.” Chicago, IL: Aldine.
T ______________________________________________________________________________
Thompson.M.S.; & Green.S.B. (2006),”Evaluating between-group differesces in latent means,” In: Hancock, G.R.,Mueller, R.O. (eds.) Structurel Equation Modeling: A Second Cource, s. 119-169. Information Age, Greenwich.
Tolman.E.C. (1938),”The determiners of Behavior at a choice Paint,” Psychol. Rev. (45), s. 1-45.
Tourangeau.R.; Kreuter.F.& Presser.F. (2008), ”Social Desirability Bias in Capi, IVR, and Web Surveys The Effects of mode and Question Sensitivity,” Puplic Opinion Quarterly, Vol. 72, No. 5 s. 847-865.
Tucker.L.R. & Lewis.C. (1973), “A reliability Coefficient for Maximum Likelihood factor analyses” Physchometrica, (38), s. 1-10.
Side 98 af 101
U _____________________ ________________________________________________________
Ulrik.P. og Sarasin.C. (1995),”Facing Public Interest: The Etical Challenge to Business Policy and Corporenate Communications,” Kluwer Academic Publication, London.
Uusitalo.O. og Oksanen. (2004),”Ethical Consumerism : A View from Findland,” International Journal of Consumer Studiers, (28), s. 214-221.
V _____________________________________________________________________________
Vandenberg.R.J. og Lavce.C.E. (2000),”A review and synthesis of the measurement invariance literature: suggestions, practices, and recommendations research,” Organ. Res. Methods, (3), s. 4-69.
Verbeke.W. og Vermeir.I. (2008),”Sustainable Food Consumption Among Young Adults in belgium; Theory of Planned Behavior and the Role of Confidence and Values,” Ecological Economic, (64), s. 542-553.
Vernon.P.E. 1934 “The attitude of the subjet in personality testing.” Journal of Applied Physychology, (18), s. 165-177.
W _____________________________________________________________________________
Walker.J.N., Edvards.A.L. & Diers.C.j. (1962),“Response sets and factor loadings on sixtyoe personaility scales,” Journal of Applied Phychology, (46), s. 220-225.
Ward.P.M. & Maloney.M.P (1973), “Ecology: Let`s hear it from the people .American Psychologist, (28), s. 583-586.
Warner.S.L.(1965),”Randomized response: A survey technique for eliminating evasive answer bias,” Journal of the American Statistical Association, (60), s. 63-69.
Watson.D. (1992), “Correcting for Acquiescent Response Bias in the Absence of a Balanced Scale,” Sociological Methods & Research, (21), s. 52-88.
Weijters.B. (2006),”Response Styles in Consumer Research,” Vlerick Leuven Gent Management School, (doktordisputants).
Side 99 af 101
White.P.C.; Jennings.N.V.; Renwick.A.R. & Baker.N.H.L. (2005),”Questionarires in ecology:a rewiev of past use and recommendations for best practice.” Journal of Applied Ecology, (42), s. 421-430.
Wirt. R. & Broen.W.E. Jr. (1958), “Varieties of Response Sets” Journal of Consulting Psychologi, (22), s. 237-240.
Wiggins J.S. (1959)”Interrelationships among MMPI measures of dissimulation under standard and social desirability instructions,” Journal of Consulting Psychology, (23) s. 419-427.
Wiggins J.S. (1964),”Convergences among stylistic response measures from objective personality tests,” Educational and Psychological Measurement, (24) s. 551-562.
Witte.J.C. og Howard.P.E.N. (1999),”Digital Consumers: Demographic Transistion on the Internet,” Northwestern University.
Y _____________________________________________________________________________
Yan.T. & Tourangeau.R. (2007),“Sensitive questions in surveys,” Phychologigal Bulletin, (133), s. 859-883.
Yen.W &.Allen.M (2002),”Introduktion to Measurement Theory”, Waveland Press, Inc.
Young.W.; Hwang.K.; McDonald.S. & Oates.C. (2009),”Sustainable Consumption: Green Consumer Behavior when Purchasing Products,” Sustainable Development, Wiley Inter Science, (18), s. 20-31.
Young.M.R.; DeSarbo.W.S. & Morwitz.V.G. (2010), “The Stochastic Modeling of Purchase Intentions and Behaviour,” Management Science, (44), s. 188-202.
Side 100 af 101
Side 101 af 101