pure.au.dkpure.au.dk/portal/files/36183961/rapport_rss_c_.docx  · web viewfor 50 år siden var de...

157
HA, almen – 6. semester Bachelor afhandling Forfatter: Ruben Samuel Sørensen Vejleder: Morten Berg Jensen Seminaropgave nr. MIM4 Måling af miljømæssig ansvarlig forbrugeradfærd på tværs af survey modes En sammenligning af web og PAPI selvadministrerede spørgeskemaer Side 1 af 157

Upload: dinhnga

Post on 30-Jan-2018

236 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

HA, almen – 6. semester Bachelor afhandling

Forfatter:

Ruben Samuel Sørensen

Vejleder:

Morten Berg Jensen

Seminaropgave nr. MIM4

Måling af miljømæssig ansvarlig forbrugeradfærd på tværs af survey modes

En sammenligning af web og PAPI selvadministrerede spørgeskemaer

Handelshøjskolen, Aarhus Universitet

Side 1 af 101

Page 2: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

2011

Ruben Samuel Sørensen © 2011

Forfatteren ønsker at takke følgende personer: Min vejleder, lektor Morten Berg Jensen for hans

mange konstruktive råd, positive tilgang og initiale accept af vejlederskab: Mine forældre for deres

til enhver tid store opbakning. Derudover takkes de personer, som deltog i fokusgruppe prætestene

af rapportens web og PAPI spørgeskemaer. Ikke mindst sendes også en stor tak til de mange

behjælpelige holdundervisere på Handelshøjskolen, Aarhus Universitet som afsatte tid til at deres

studerende kunne besvare rapportens PAPI spørgeskemaer, omdelt i løbet af marts måned.

Ruben Samuel Sørensen

Maj 2011

Side 2 af 101

Page 3: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Abstract

By doing research work in the area of environmental responsible consumer behavior, intention-

behavior / values-action gaps are empirically observed. These gaps illustrate the issue that attitudes,

intentions and values measured with traditional survey modes and methodologies normally will

overestimate the actual buying behavior of respondents. A research perspective explains this

problem by the use of a number of unconstrained survey response methods, whose constructions are

said to be prompting the measurement errors: social desirable responding (SDR) and response styles

(RS). Therefore, following management question is to be found in this rapport:

The above-mentioned management question is answered on the basis of 3 research questions. 1) An

analysis of the measurement equivalence of a given measurement model for environmental

responsible consumer behavior crosswise different modes. 2 + 3) A comparison of the magnitude of

SDR and RS crosswise the modes concerned.

Questionnaires are constructed via items from EOSCALE (Stone et. al, 2009) and Balanced

Inventory of Desirable Responding, BIDR, (Paulhus, 1988). Data is collected from a population of

bachelor students at Aarhus School of Business, University of Aarhus. This is done by random

sampling crosswise different modes. Primarily, multigroup confirmative factor analysis (MGCFA)

is used. Therefore, the position with regard to philosophy of science is analytical / positivistic.

Theoretically, the starting point of this rapport is the classic test theory and its different assumptions

and criteria of quality. Furthermore, it is based on the Paulhus SDR theory and theory concerning

operationalization/explanation of different response styles.

Side 3 af 101

To what extent are different results by measuring environmental responsible consumer behavior

across web-based and PAPI surveys obtained?

Page 4: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

The result of this rapport is: evidence for different measurements of the construct environmental

responsible consumer behavior crosswise modes. However, it seems that SDR is in force crosswise

different modes to the same extent. When it comes to RS, statistic evidence for different degrees of

acquiescence response style is established, and this result seems to be explaining the differences

concerning the measurement of environmental responsible consumer behavior.

These results can give valuable information to researchers conducting mixed-mode data collection

in the area of environmental responsible consumer behavior. Furthermore they suggest further

research in the area of environmental responsible consumer behavior, SDR and RS.

Side 4 af 101

Page 5: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Indholdsfortegnelse

1. Indledning.....................................................................................................................................11

1.1. Problemstilling........................................................................................................................12

1.2. Problemformulering................................................................................................................14

1.3. Rapportens struktur.................................................................................................................16

1.4. Definition af begreber.............................................................................................................17

1.4.1 Web-based survey..............................................................................................................17

1.4.2. Miljømæssig ansvarlig forbrugeradfærd..........................................................................19

1.5. Afgræsninger...........................................................................................................................21

2. Teoretisk ramme..........................................................................................................................23

2.1. Measurement theory................................................................................................................23

2.1.1. Klassisk test teori..............................................................................................................23

2.1.2. Constructs.........................................................................................................................26

2.2. Social desirability responding.................................................................................................28

2.2.1. SDR som construct...........................................................................................................28

2.2.2. Paulhus SDR teori............................................................................................................29

2.3. Response styles........................................................................................................................31

2.3.1. Typologi for response styles.............................................................................................31

Side 5 af 101

Page 6: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

3. Metodisk fundament....................................................................................................................34

3.1. Spørgeskemakonstruktion.......................................................................................................34

3.1.1. Prætest af spørgeskema....................................................................................................34

3.1.2. Valg af multi-item scales..................................................................................................36

3.1.3. Design af spørgeskema.....................................................................................................39

3.2. Datagenerering.......................................................................................................................41

3.2.1. Population........................................................................................................................41

3.2.2. Dataindsamling................................................................................................................42

3.3. Statistiske teknikker.................................................................................................................43

3.3.1. Eksplorativ faktoranalyse.................................................................................................43

3.3.2. Konfirmativ faktoranalyse................................................................................................44

3.4. Videnskabsteoretisk position...................................................................................................47

4. Måling af constructet miljømæssig ansvarlig forbrugeradfærd..............................................49

4.1. Datagrundlag...........................................................................................................................49

4.2. Etablering af målemodel.........................................................................................................51

4.3. Survey mode sammenligning..................................................................................................54

4.4. Diskussion og kritik af resultater.............................................................................................58

4.5. Delkonklusion.........................................................................................................................61

Side 6 af 101

Page 7: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

5. SDR ved måling af miljømæssig ansvarlig forbrugeradfærd..................................................62

5.1. Survey mode sammenligning..................................................................................................62

5.2. Diskussion og kritik af resultater.............................................................................................69

5.3. Delkonklusion.........................................................................................................................71

6. Respons styles ved måling af miljømæssig ansvarlig forbrugeradfærd..................................72

6.1. Etablering af målemodel.........................................................................................................72

6.2. Survey mode sammenligning..................................................................................................74

6.3. Diskussion og kritik af resultater.............................................................................................79

6.4. Delkonklusion.........................................................................................................................81

7. Konklusion....................................................................................................................................82

8. Perspektivering.............................................................................................................................83

9. Litteraturliste................................................................................................................................85

10. Bilag...........................................................................................................................................100

10.1. PAPI spørgeskema (bilag 1)................................................................................................100

10.2. Web spørgeskema (bilag 2).................................................................................................106

10.3. Eksplorativ faktoranalyse (bilag 4)....................................................................................115

10.4. Multigruppe konfirmativ faktoranalyse, kapitel 4 (bilag 5)...............................................117

10.5. Multigruppe konfirmativ faktoranalyse, kapitel 5 (bilag 6)...............................................122

10.6. Multigruppe konfirmativ faktoranalyse, kapitel 6 (bilag 7)...............................................124

10.7. Web og PAPI datasæt (cd-rom)..........................................................................................126

Side 7 af 101

Page 8: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Figurliste

Figur 1.3. Illustration af rapportens struktur og kapitler…………………………………… 16

Figur 1.4.1. Typer af web-based surveys………………………………………………….. 17

Figur 1.4.2. Constructet miljømæssig ansvarlig forbrugeradfærd…………………………. 20

Figur 2.1.2. Målemodel for et Construct…………………………………………………... 26

Figur 2.2.2. Paulhus SDR two tier system…………………………………………………. 30

Figur 2.3.1. Response styles: DRS, MRS, ARS og ERS ved 5-punkts Likert skala ……... 33

Figur 3.4. Illustration af placeringen af rapportens videnskabsteoretiske position………... 46

Figur 4.2. Målemodel for miljømæssig ansvarlig forbrugeradfærd (uden construct korrelationer)

…………………………………………………………………………........ .. 53

Figur 5.1. Målemodel for social desirability responding - moralistic (MB) og egoistic

bias EB)…………………………………………………………………………………….. 62

Figur 5.1. Wiejters målemodel for response styles – ARS, DRS, ERS og MRS………….... 72

Side 8 af 101

Page 9: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Tabelliste

Tabel 4.1. Stikprøvekendetegn i alt og for enkelte modes…………………………………. 49

Tabel 4.2. Kaiser Varimax roteret faktor laoding matrix (med loadings over 0,20)………. 52

Tabel 4.3.1. χ2 test statistik samt fit index ved model for configural invariance …………. 54

Tabel 4.3.2. χ2 test statistikker samt fit index ved model for full scalar invariance……….. 55

Tabel 4.3.2. χ2 test statistikker samt fit index ved model partial scalar invariance……….. 56

Tabel 5.1.1. χ2 test statistik samt fit index ved model for configural invariance………….. 57

Tabel 5.1.2. χ2 test statistikker samt fit index ved model for full metric invariance ……… 63

Tabel 5.1.3. χ2 test statistikker samt fit index ved model for full scalar invariance………. .

63

Tabel 5.1.4. χ2 test statistikker samt fit index ved model for full invariance of factor

variances ……………………………………………………………………………….…. 65

Tabel 5.1.5. χ2 test statistikker samt fit index ved model for full invariance of factor

covariances ……………………………………………………………………………… . 65

Tabel 5.1.6. χ2 test statistikker samt fit index ved model for full invariance of latent

Means……………………………………………………………………………………... 66

Tabel 5.1.7. χ2 test statistikker samt fit index ved model for full invariance of error

variances …………………………………………………………………………………... 67

Tabel 5.1.8. χ2 test statistikker samt fit index ved model for partial invariance of error

Side 9 af 101

Page 10: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

variances ………………………………………………………………………………….. 68

Tabel 6.2.1. χ2 test statistik samt fit index ved model for configural invariance …………. .

74

Tabel 6.2.2. χ2 test statistikker samt fit index ved model for full metric invariance ……... 75

Tabel 6.2.3. χ2 test statistikker samt fit index ved model for full scalar invariance ……… .

75

Tabel 6.2.4. Latente means, standard errors, effect sizes samt t test statistikker………….. 76

Tabel 6.2.5. χ2 test statistikker samt fit index ved model for full invariance of factor

Variances………………………………………………………………………………… . 77

Tabel 6.2.6. χ2 test statistikker samt fit index ved modeller for test af fuld invarians af

faktor kovarianser og fuld samt partiel invarians af error varianser …………………….. . 78

Side 10 af 101

Page 11: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

1. Indledning

For 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume,

standardisering, - også benævnt least-cost production paradigmet (Kotler m.fl., 2009). Senere er der

sket et paradigmeskifte, hvor de fleste markeder er gået fra sellers til buyers market (Goodman jf.

Kotler m.fl., 2009). Således er marketing research og generel forståelse af kunders behov blevet en

central proces i mange virksomheder (Deutskens, 2006). Udvikling af innovative og værdiskabende

produkter / services er da centralt for deres succes (Lynch, 2009). Et stadigt stigende antal

virksomheder er her begyndt at implementere CSR strategier med fokus på miljø, Fair Trade og

andre faktorer, som er til fordel for samfundet som helhed og ikke kun shareholders (Lynch, 2009).

Et centralt spørgsmål ved virksomheders CSR strategier er effekten på efterspørgselssiden – dvs.

hvorledes de tilsigtede nuværende og potentielle kunder opfatter og handler herudfra. I den

forbindelse er der empirisk observeret et nyt segment af forbrugere: Ethically minded consumers (fx

Attalla, 2001 og De Pelsmacker m.fl., 2005). Der er i den forbindelse evidens for et nyt stadig

voksende segment af kunder, som har præferencer for etiske produkter og services. Denne etiske

forbrugeradfærd kan fx være i forhold til Fair Trade (De Pelsmacker m.fl., 2007), miljø og økologi

(Shaw m.fl.., 2006) og arbejdsforhold i udviklingslande (Dickson, 1999). Holbrook m.fl. (1993, s.

113) definerer etisk forbrugeradfærd som følgende ”decision-making, purchases and other

consumption experiences that are affected by the consumer’s ethical concerns”. Den givne

forbrugers købsadfærd forsøges således forklaret ud fra etiske faktorer og forhold.

Den største undergruppe af etisk forbrugeradfærd er miljømæssig ansvarlig forbrugeradfærd (fx jf.

Stone m.fl. 1995). Miljø har en meget bred implikation gående fra betydelig politisk og økonomisk

signifikans til et muligt strategisk CSR / marketing initiativ for en given virksomhed (Ozaki, 2008).

Side 11 af 101

Page 12: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Det er desuden en type etisk forbrugeradfærd som går mange år tilbage (Stone m.fl. 2009). På den

anden side synes nuværende miljøproblemer at betyde, at miljømæssige spørgsmål og

problemstillinger også vil være relevant / gældende i fremtiden – dvs. en sandsynlig fremtidig

relevans for denne type etiske forbrugeradfærd. Empirisk er det gældende, at mange forbrugere i

dag opfatter sig selv som green consumers (fx Neville m.fl., 2010) Tilsvarende gælder det, at

mange virksomheder har implementeret forskellige tiltag / strategier i forhold til miljø (Auger m.fl.

2007). Området, både ift. efterspørgsels- og udbudssiden, synes herved efterhånden ganske

veludviklet – om end der ikke nødvendigvis gælder modne / mættede markeder herfor.

1.1. Problemstilling

I videnskabelig og kommerciel forskning inden for etisk og miljømæssig ansvarlig forbrugeradfærd

er der i mange surveys observeret en svag sammenhæng mellem forbrugeres påståede attituder /

intentioner og deres faktiske købsadfærd (Neville m.fl., 2010, Young m.fl., 2010 og Ryan, 2011). Et

eksempel herpå findes i Hughner m.fl. (2007), hvor mellem 46-67 % af en gruppe engelske

forbrugere rapporterede positive attituder og intentioner om at vælge miljøvenlige fødevarer, mens

kun 4-10 % faktisk gjorde det. Af det britiske Futerra studie (2005) fremgår det også, at selv om 30

% angav intentioner om køb af miljøvenlige produkter, skete det i virkeligheden kun for ca. 3 %

(Futerra, 2005, s. 92). Denne empiriske inkonsistens er i litteraturen bl.a. benævnt attitude-

behavior, word-deed, intention-behavoir - og values-action gap (fx Simon, 1995, Sarasin m.fl.,

1995, Boulstrigde m.fl. 2000, Jobber m.fl., 2000, Shaw m.fl. 2007 og Auger m.fl. 2007). Den fælles

syntese er, at selvrapporterede attituder, intentioner og værdier i surveys omkring miljømæssig

ansvarlig og etisk forbrugeradfærd normalt vil overestimere respondenternes faktiske købsadfærd.

I et kommercielt marketing perspektiv medfører nævnte gaps, at størrelsen af markeder for

miljøvenlige og etiske produkter/ydelser estimeres med betydelig usikkerhed (Ozaki m.fl., 2008).

Anvendes resultater fra sådanne surveys som strategisk beslutningsgrundlag for investering i

kommunikationskampagner, produktudvikling osv. er det derfor forbundet med stor risiko. Fx vil

prædiktion af miljømæssig forbrugeradfærd via selvrapporterede attituder og intentioner i Futerra

(2005) studiet i 90 % af tilfældene være forkert (Neville m.fl., 2010). I et videnskabeligt perspektiv

udtrykker gapet en ufuldstændig forståelse / forklaring af dette empiriske fænomen inden for den

nuværende litteratur. Dette gælder særligt for etisk og miljømæssig ansvarlig forbrugeradfærd (Belk

m.fl., 2005, De Pelsmacker m.fl., 2005, Shaw m.fl. 2006 og Neville m.fl. 2010). Af den grund er

Side 12 af 101

Page 13: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

der stadig behov for forskning inden for dette område. Med udgangspunkt i den nuværende

litteratur er formålet med denne rapport herved at bidrage til en bedre forståelse af omtalte gaps.

Den videnskabelige litteratur inden for nævnte gaps kan kategoriseres i to hovedretninger jf. Neville

m.fl. (2010): en metodisk og modelbaseret. I den modelbaserede litteratur er formålet at identificere

de faktorer, som direkte eller indirekte påvirker transformationen af attituder, intentioner og andre

teoretisk formulerede constructs til faktisk købsadfærd (fx Shaw m.fl., 2002, Black m.fl., 2008 og

Verbeke m.fl., 2008). Retningen er da kendetegnet ved modellering af købebeslutningsprocesser.

Det sker primært med udgangspunkt i teoretiske rammer inden for consumer behavoir, business

etics og psykologi (Shaw m.fl., 2007) - i særdeleshed theory of reasoned action (Fishbein og Ajzen,

1980) og theory of planned behavoir (Ajzen, 1985). Herudfra er betydningen af faktorer såsom

produktinformation, brand loyalitet og andre købskriterier blevet sandsynliggjort (fx Okasanen

m.fl., 2004, Ingram m.fl., 2005). En sådan teoretisk modellering genfindes ikke i den metodisk

baserede litteratur. Gaps forsøges derimod forklaret ud fra mangler / måleproblemer ved den

anvendte survey metodik for de empiriske undersøgelser inden for etisk og miljømæssig ansvarlig

forbrugeradfærd (fx Attala m.fl., 2001 og Auger m.fl., 2007). Retningen er da kendetegnet ved

forskning i alternative metoder og teknikker. Det gælder bl.a. kvalitative metoder (fx Attala m.fl.

2001) og statistiske teknikker såsom discrete choice modellering (fx Louviere m.fl., 2000).

I den metodisk baserede litteratur kritiseres unconstrained survey response methods (fx Auger m.fl.,

2010). Særligt brugen af direkte spørgsmål og rating scales påstås at lede til overestimation af

attituder og intentioner om køb af etiske produkter og ydelser (Neville m.fl., 2010 ). Dette forklares

ved tilskyndelsen til social desirability responding (SDR), hvor direkte spørgsmål om børnearbejde,

forurening, osv. har svarmuligheder på en rating skala, som vil opfattes mere socialt acceptable end

andre (Auger mfl., 2007). Konsekvensen heraf kan være over- / underestimerede mål for socialt

følsomme items (fx Sarasim m.fl., 2005). En anden kilde til bias kan være brugen af rating scales

(fx Likert skalaen), som inden for consumer research i visse tilfælde har medført bestemte response

styles (RS) (Wiejters m.fl., 2010). Dette udgør en markant trussel mod validitet, når der fx svares

tilfældigt eller konsekvent angives enighed/uenighed (Steenkamp m.fl., 2001). SDR og RS ved etisk

forbrugeradfærd har på nuværende tidspunkt ikke til min orientering været underlagt nærmere

forskning, hvorfor en undersøgelse af disse påståede problemstillinger vurderes relevant.

Side 13 af 101

Page 14: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Ved identifikationen af omtalte gaps har traditionelle survey modes normalt været anvendt. Det

gælder primært selvadministrerede papir spørgeskemaer (PAPI). Af kommercielle surveys kan bl.a.

nævnes flere større undersøgelser af Market & Opinion Research International i Storbritannien

(Mason, 2000), lignende surveys af Coperate Edge (Rogers, 1998), de mange Futerra studier

(Neville m.fl., 2010) samt flere statsligt finansierede undersøgelser (fx jf. Defra, 2006). Ved

videnskabelige surveys gælder PAPI anvendelsen både for den modelbaserede retning (fx Shaw

m.fl. 2002, Janssens m.fl. 2007, Black m.fl. 2008 og Verbeke m.fl., 2008) og den metodisk baserede

retning (fx Follows m.fl., 2000 og Auger m.fl. 2003, 2007, 2010). Et spørgsmål er her, om der

kunne gælde gunstige effekter ved brug af andre modes – dvs. mindre gaps via løsninger på de

fremsatte problemstillinger i den metodisk baserede litteraturretning. Dette spørgsmåls relevans

skyldes bl.a. muligheden for web-based surveys. For denne mode viser en række undersøgelser en

mindre grad af SDR ift. traditionelle modes såsom PAPI (fx Deutskens, 2006, Yan m.fl., 2007 og

Tourangeau m.fl., 2008) samt anderledes response styles, fx mere ekstreme svar og item variabilitet

(Stanton, 1998, Klassen m.fl., 2001, Roster m.fl. 2004, Wiejters, 2006 og Wiejters m.fl., 2010). Om

end andre undersøgelser ikke indikerer forskelle (fx Epstein m.fl., 2001 og Knapp m.fl. 2003), kan

det herved ikke afvises, at web-based surveys kan være et fordelagtigt alternativ til PAPI. Dette

begrundes også med flere generelle fordele ved web-based surveys såsom lavere omkostninger

(Carayon m.fl., 2009), hurtigere responstid (Lievens m.fl., 2009), flere muligheder for design og

effekter (Meulemeester m.fl. 2005) samt lavere tidsforbrug og fejl ved dataentry (Deutskens, 2006).

1.2. Problemformulering Med udgangspunkt i nævnte empiriske gaps, kritikpunkterne fremsat i den metodisk baserede

litteraturretning samt de potentielle fordele ved anvendelsen af web surveys ift. PAPI er formålet

med denne rapport at undersøge følgende overordnede forskningsspørgsmål:

Dette overordnede forskningsspørgsmål vil besvares ud fra følgende tre underspørgsmål:

Side 14 af 101

I hvilket omfang opnås der forskellige resultater ved måling af miljømæssig ansvarlig

forbrugeradfærd på tværs af web-based og PAPI selvadministrerede spørgeskemaer?

Page 15: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

- 1: Gælder der ved en given estimeret målemodel for miljømæssig ansvarlig forbrugeradfærd

forskelle mellem web og PAPI?

- 2: Gælder der samme omfang af social desirability responding mellem web og PAPI?

- 3: Gælder der samme omfang af response styles mellem web og PAPI?

- Første spørgsmål omfatter et klassisk test for measurement invariance mellem de to survey modes.

Formålet med dette spørgsmål er herved at besvare i hvilket omfang der ved en given estimeret

målemodel for constructet miljømæssig ansvarlig forbrugeradfærd måtte gælde signifikante

forskelle for strukturer og modelparametre. Ud fra de to modes mange ligheder (fx deres

selvadministrerede form) samt manglen på entydige resultater ved tidligere videnskabelige studier

af deres ækvivalens er udgangspunktet i denne rapport derfor følgende hypotese:

H1: Der gælder måleækvivalens for web og PAPI ved miljømæssig ansvarlig forbrugeradfærd

Det er således formålet at falsificere ovenstående hypotese, hvilket kan synes forsøgt i mange

tidligere survey mode sammenligninger (fx Adam m.fl., 2003 Roster m.fl. 2004 og Deutskens,

2006). Sådanne forskningsresultater er imidlertid meget kontekstafhængige (Wiejters, 2006),

hvorfor de ikke umiddelbart er bredt generaliserbare. Desuden er der til min orientering ikke

gennemført en mode sammenligning ift. miljømæssig ansvarlig forbrugeradfærd. Denne rapport er

da ikke en replikation af tidligere forskning, men et bidrag inden for et til dato uudforsket område.

- Andet og tredje spørgsmål vedrører omfanget af social desirability responding (SDR) og respons

styles (RS) på tværs af modes. Der undersøges således for forskelle i respondenternes tendens til at

give socialt acceptable svar (SDR) og svar ud fra indholdsmæssigt irrelevante faktorer (RS).

Spørgsmålene kan da beskrives som henholdsvis en analyse af omfanget af content og non-content

based responding dvs. to forskellige kilder til measurement error. På baggrund af meget få tidligere

studier samt de tidl. nævnte mange ligheder mellem modes, er udgangspunktet følgende hypoteser:

H2: Der gælder samme omfang af social desirability responding for web og PAPI

Side 15 af 101

Page 16: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

H3: Der gælder samme omfang af response styles for web og PAPI

Ovenstående to hypoteser er kun forsøgt falsificeret i meget få tidligere studier – herunder ingen i

konteksten miljømæssig / etisk forbrugeradfærd. Rapporten vurderes da at medføre et nyt bidrag i

forhold til den tidligere omtalte metodiske litteraturretning. Spørgsmålenes relevans underbygges

endvidere af det faktum, at gennemførslen af en klassisk measurement invariance test (som ved

foretaget under spørgsmål 1) ikke nødvendigvis vil diagnosticere eventuelle problemer med SDR og

RS (jf. Wiejters, 2006). Derfor er disponeringen i denne rapport implementering af to særskilte

analyser, som eksplicit / direkte undersøger for disse mulige kilder til systematisk målefejl.

1.3. Rapportens struktur

Med det formål at skabe et overblik over rapportens forskellige dispositioner vil der i dette afsnit

kort redegøres for dens struktur og indholdet af de enkelte kapitler. Grafisk kan rapportens struktur i

forhold til dets respektive kapitler og deres indbyrdes sammenhænge illustreres som følgende:

Kilde: Egen tilvirkning

I dette kapitel 1 etableres rapportens fundament i form af dets problemstilling og tilhørende

problemformulering samt centrale begreber og valgte afgrænsninger. I kapitel 2 præsenteres dens

teoretiske ramme i form af klassisk test teori samt teorier vedrørende SDR og RS. I kapitel 3

Side 16 af 101

Kapitel 1: Indledning

Kapitel 2: Teori Kapitel 3: Metode

Kapitel 4: M.A.F. Kapitel 5: SDR ved M.A.F. Kapitel 6: R.S. ved M.A.F

Kapitel 7: Konklusion

Kapitel 8: Perspektivering

Figur 1.3. Illustration af rapportens struktur og kapitler

Page 17: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

beskrives det metodiske fundament i form af konstruktionen af web og PAPI spørgeskemaerne,

generering af data samt valg af statistiske teknikker. I dette kapitel angives desuden rapportens

videnskabsteoretiske position. Problemformuleringens tre underspørgsmål vil med udgangspunkt i

denne teori og metode besvares i kapitlerne 4-6. I kapitel 4 analyseres måleækvivalensen for web

og PAPI ift. en målemodel for miljømæssig ansvarlig forbrugeradfærd via multi group konfirmativ

faktoranalyse (MGCFA). I kapitel 5 og 6 analyseres der via MGCFA for eventuelle forskelle i

omfanget af henholdsvis SDR og RS på tværs af de to modes. I kapitel 7 angives rapportens

samlede konklusion – dvs. hvorvidt de tre initialt formulerede hypoteser kan fastholdes eller ej. I

kapitel 8 vil disse resultater danne udgangspunkt for en række relevante perspektiveringer.

1.4. Definition af begreber

I dette afsnit er formålet at definere to af rapportens mest centrale begreber / constructs: web-based

survey og miljømæssig ansvarlig forbrugeradfærd. Dette vurderes nødvendigt, idet disse har et

abstraktionsniveau, hvorudfra de ikke umiddelbart er operationaliserbare. De er herved underlagt

adskillige mulige fortolkninger, hvilket eksempelvis illustreres ved, at der i videnskabelig litteratur

ikke er enighed om deres definitioner eller definitionsrammer (fx jf. Deutskens, 2006).

1.4.1 Web-based survey

Web-based surveys (WBS) er kendetegnet ved en høj grad af diversitet, hvorfor begrebet i sig selv

er for bredt til at give nogen konkret beskrivelse af, hvordan et givet studie er foretaget (Miller

m.fl., 2008). Det skyldes fx, at der ved WBS anvendes mange forskellige typer stikprøverammer og

inviteres respondenter til deltagelse på mange forskellige måder (Couper, 2000). Ifølge Miller m.fl.

(2008) har denne diversifikation to centrale implikationer. For det første er generaliseringer

omkring WBS i forhold til andre survey modes problematisk, hvis WBS ikke nærmere defineres.

For det andet medfører begrebets mangfoldighed, at der er behov for nærmere informationer

omkring dataindsamlingsprocessen for at kunne vurdere kvaliteten af data og processen i sig selv. I

denne rapport vil det herved mere konkret defineres hvilken type WBS, som undersøges. Dette sker

med udgangspunkt i Couper (2000), som angiver følgende kategorisering af WBS.

Side 17 af 101

Figur 1.4.1. Typer af web-based surveys

Page 18: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Nonprobability methods Probability-based methods

1. Polls as entertainment 4. Intercept surveys2. Unrestricted self-selected survey 5. List-based samples 3. Volunteer opt-in panels 6. Web option in mixed mode

surveys 7. Pre-recruited panels of Internet users8. Pre-recruited panels of full population

   

Couper (2000) skelner mellem nonprobability og probability-based web surveys. Kendetegnet for

probability-based WBS er en population, hvis personer har samme udtrækningssandsynlighed –

dvs. sampling ud fra klassiske statistiske principper (Blumberg m.fl., 2008). Dette gælder ikke ved

nonprobability WBS, hvorved inferens / generalisering til en given population ikke kan ske ud fra

normale statistiske principper, men derimod det Couper (2000) kalder ”leaps of faith”.

- Nonprobability web surveys inddeles i tre undergrupper. Polls as entertainment har til formål at

skabe underholdning og fri meningsudvikling. Normalt er der ingen kontrol over hvem som deltager

og hvilke spørgsmål, som stilles. I gruppen unrestricted self-selected survey anvendes åbne

invitationer på portaler, ofte besøgte web-sider og særlige survey-sites. Normalt gælder ingen

adgangsbegrænsning eller kontrol over multiple besvarelser. Den centrale problemstilling er, at

disse surveys ofte påstås at leve op til klassiske videnskabelige kvalitetskriterier, hvilket imidlertid

er tvivlsomt (fx Witte m.fl. 1999 og May 1999). Ved gruppen volunteer opt-in panels indsamles

data fra et panel af frivillige deltagere, som initialt er fundet via forskellige web-sider og portaler.

- Probability-based web surveys angives i fem undergrupper. Gruppen intercept surveys beskriver

WBS, hvor der anvendes systematisk sampling ved at hver n’te person på en hjemmeside inviteres

til at deltage i surveyen. List-based samples er WBS foretaget ud fra en given stikprøveramme af

respondenter med høj grad af internetadgang. Web option in mixed mode surveys angiver den

situation, hvor WBS blot er en ud af flere modes, som respondenten tilbydes at svare ud fra. I pre-

recruited panels of Internet users udvælges de enkelte paneldeltagere ved probability sampling.

Herudfra kan der senere afsendes e-mail invitationer til personerne med internetadgang. Ved pre-

Side 18 af 101

Kilde: Couper (2000), s. 477-490

Page 19: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

recruited panels of full population kan der yderligere opnås data fra en population, hvor alle ikke

har internetadgang, idet personer uden internetadgang får sat det nødvendige udstyr til rådighed.

Ved den senere dataanalyse vil der anvendes statistiske teknikker. Derfor er probability-based web

surveys foretrukket. Mere konkret er der valgt list-based samples med en e-mail liste for samtlige

bachelor studerende på Handelshøjskolen, Aarhus Universitet som stikprøveramme. Ingen andre

probability-based WBS har været mulige alternativer. Fx kan respondenter ikke genereres via en

hjemmeside, hvorfor en intercept survey ikke kunne anvendes. Idet rapportens formål er en mode

sammenligning, hvorved data fra de to modes må holdes særskilt, vil en mixed mode WBS ikke

opfylde det formål. Derimod vil rapporten give svar på, om en sådan mixed mode strategi kan

anvendes i givne kontekst Endeligt anvendes der tværsnitsdata, hvorfor panel surveys ikke er valgt.

1.4.2. Miljømæssig ansvarlig forbrugeradfærd

Forbrugeradfærd (consumer behaviour) udgør et tværfagligt forskningsfelt inden for bl.a. marketing

og kan beskrives som: ”the study of how individuals and groups buy, use and dispose goods,

services or experiences to satisfy their needs and wants” (Narus m.fl., 2004). Det givne studie kan

herudfra afgrænses til én eller flere perspektiver – fx produkttype (kortvarigt vs. langvarigt gode)

eller proces (før- vs. efterkøbsadfærd). En sådan afgrænsning ses også ved denne rapports fokus på

miljømæssig ansvarlighed. Definitionen af det construct sker ud fra relevant teori og empiri. Af den

grund kunne den også placeres i rapportens teoriafsnit. Det er imidlertid vurderet en bedre

disposition at få defineret dette centrale construct så tidligt som muligt. Udgangspunktet herfor har

været Stone m.fl. (1995) og (2009), som er et af de eneste bidrag med en eksplicit definition af

miljømæssig ansvarlighed forbrugeradfærd samt efterfølgende operationalisering via en tilhørende

multi-item scale. Dette valg er primært motiveret af definitionens stærke teoretiske fundament i

form af brugen af tidl. forskning og validerede skalaer inden for miljø, og angives som følgende:

”Environmental responsibility is a state in which a person expresses an intention to take action directed

toward remediation of environmental problems, acting not as an individual concerned with his/her own

economic interests, but through a citizen consumer concept of societal-environmental well-being.

Further, this action will be characterized by awareness of environmental problems, knowledge of

remedial alternatives best suited for alleviation of the problem, skill in pursuing his or her chosen

action, and possession of a genuine desire to act after having weighed his / her own locus of control and

determining that these actions can be meaningful in alleviation of the problem” (Stone m.fl. 1995, s. 601).

Side 19 af 101

Page 20: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Ovenstående definition kan beskrives som en dekomponering af constructet miljømæssig ansvarlig

forbrugeradfærd til række øvrige constructs såsom ”knowledge”. Jf. Stone m.fl. (1995) bygger

definitionen samt den tilhørende multi-item scale (ECOSCALE) også på fem teoretiske constructs:

ability to act, attitude, willingness to act, behaviour og knowledge. Definitionen kan herved

betragtes som en operationalisering til en række mere observerbare constructs, som imidlertid stadig

har et abstraktionsniveau, således ingen ”single measures” kan måle dem perfekt. Det bør i den

forbindelse nævnes, at det er relationerne mellem disse constructs – fx attitude og behaviour, som

udgør rapportens grundlæggende problemstilling. Denne problemstilling analyseres ud fra den

metodisk baserede litteratur retning, hvorfor modelleringen af disse relationer ikke er formålet med

rapporten. Udgangspunktet kan derimod angives via følgende teoretisk baserede strukturelle model:

Kilde: Egen tilvirkning ud fra Stone m.fl. (1995) og 2009

- Attitude beskriver “a person`s enduring favourable or unfavorable evaluation and emotional

feeling towards some object or idea” (Kotler 2009, s. 861). I litteraturen har der længe været bred

enighed om, at miljøbevidste forbrugere må udvise positive attituder i forhold til miljøet (fx Ward

m.fl., 1973, Dunlap m.fl., 1978 og Jackson 1985). Visse forfattere dekomponerer dette construct

yderligere – fx Bennet (1974), som skelner mellem affektive og kognitive attituder.

- Knowledge i form af faktuel viden og awareness vedrørende miljømæssige problemstillinger og

emner generelt antages nødvendigt for en miljømæssig ansvarlig forbruger (fx Ward m.fl., 1973

Arcury 1990 og Holzer m.fl. 1990). En metaanalyse af Hines m.fl. (1986) er blot én ud af mange

studier, som modellerer sammenhængen mellem viden og miljømæssig ansvarlig forbrugeradfærd,

hvorudfra det konkluderes, at viden er en afgørende komponent for miljømæssig ansvarlighed.

Side 20 af 101

Miljømæssig ansvarlig forbrugeradfærd

Knowledge BehaviourAbility to act Willingness to actAttitude

Figur 1.4.2. Constructet miljømæssig ansvarlig forbrugeradfærd

Page 21: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

- Willingness to act angiver den grundforudsætning, at miljømæssigt ansvarlige forbrugere også

skal have viljen til aktivt at handle ud fra deres attituder og viden (Stone m.fl., 1995). Dette krav om

et desire to act ses bl.a. i Ward m.fl. (1973), hvori det benævnes verbal commitment – svarende

individets sandsynlige fremtidige handlinger, hvilket da implicit angiver selve viljen til handling.

- Ability to act beskriver den forudsætning, at en miljømæssig ansvarlig forbruger også skal have

evnen til at handle ud fra dennes attituder, viden og vilje (Stone m.fl., 1995). Dette kan også tolkes

som et krav om en vis mængde logical reasoning, idet forståelse / erkendelsen af de mulige

handlingsalternativer er en forudsætning for at faktisk adfærd kan foretages (Daniels m.fl., 1964).

- Behaviour medfører største grad af miljømæssig ansvarlighed, idet denne komponent beskriver

forbrugerens faktiske adfærd. Det er bred enighed om, at reelt miljømæssigt ansvarlige forbrugere

må udvise sådanne faktiske handlinger i forhold til miljø (fx Ward m.fl. 1973, Bennet, 1974, Hines

m.fl. 1986). Den grundlæggende problemstilling i denne rapport er diskrepansen mellem denne

faktiske adfærd og en række selvrapporterede mål – fx attituder og viljen til handling (intentionen).

Ifølge Stone m.fl. (1995) er en miljømæssig ansvarlig forbruger ud fra ovenstående kendetegnet ved

en positiv attitude overfor miljøet, viden om miljømæssige emner, viljen og evnen til at handle

aktivt i en miljømæssig ansvarlig retning samt en faktisk udførelse heraf. At definere miljømæssig

ansvarlig forbrugeradfærd ud fra en enkelt dimension er da ikke udtømmende – om end særligt den

faktiske adfærd må anses som en nødvendig forudsætning (fx Hines m.fl. 1986). Sammenhængen

mellem disse fem dimensioner er vedvarende påvist og til stadighed genstand for forskning inden

for den modelbaserede litteraturretning (Neville m.fl., 2010). I den metodisk baserede litteratur er

det omvendt formålet at undersøge og hvis muligt forbedre målingen af disse constructs.

1.5. Afgræsninger

I dette sidste indledende afsnit vil der argumenteres for rapportens centrale afgrænsninger, herunder

de fravalgte oplagte perspektiver, som herved ikke er prioriteret nærmere undersøgt. Disse

afgrænsninger vedrører hovedsageligt fokusset på web surveys ift. PAPI og analyserne af SDR samt

RS og dermed ikke andre kilder til målefejl/bias. Desuden er der foretaget en anden central

disposition givet ved afgrænsningen af etisk forbrugeradfærd til dets signifikante underområde:

miljømæssig ansvarlig forbrugeradfærd. Argumenterne herfor er indirekte angivet i rapportens

Side 21 af 101

Page 22: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

indledning. Disse kan kort opsummeres som: 1) områdets størrelse i forhold til andre områder inden

for etisk forbrugeradfærd, hvorudfra det vurderes som mest relevante, 2) dets brede implikationer -

fx makroøkonomisk og politisk, og dermed ikke blot med en marketing / strategisk relevans og 3)

dets vedvarende og sandsynlige fremtidige store betydning for virksomheder, forbruger og

samfundet som helhed. Rapportens resultater vil da have relevans også i et fremtidigt perspektiv.

Som det første argumenteres der for afgrænsningen til web surveys ift. PAPI. Fokusset på PAPI

følger af det faktum, at det har været og er den mest anvendte mode inden for etisk og miljømæssig

ansvarlig forbrugeradfærd, hvorfor omtalte gaps primært er identificeret ved PAPI

selvadministrerede spørgeskemaer. PAPI vurderes således at være mest relevante mode at tage

udgangspunkt i – dvs. at betragte som rapportens referencegruppe. Sammenligningen med web

surveys skal ses i forhold til den signifikante vækst inden for online marketing research – herunder

øget anvendelse af web surveys (Deutskens, 2006). Der bruges således et stadigt stigende beløb på

gennemførslen af kommercielle web surveys. Inden for videnskabelig forskning gælder også en

stigende anvendelse af WBS. Herudfra vurderes denne nyeste survey mode at være den mest

relevante. Dette understøttes også af de mange sandsynliggjorte fordele ved web surveys; såsom

lavere omkostninger, hurtigere responstid osv. (fx Carayon m.fl., 2009 og Lievens m.fl., 2009).

Eksempelvis er det blevet påstået, at web surveys hurtigt ville udkonkurrere lign. survey modes

(Deutskens, 2006), hvilket imidlertid ikke er sket. Den videnskabelige litteratur inden for web

surveys er efterhånden veletableret om end det er nyest opståede survey mode. Imidlertid gælder

der stadig visse områder, som ikke er fuldt ud undersøgt. Det gælder eksempelvis i forhold til SDR

og RS (Wiejters, 2006). Af den grund vurderes afgrænsningen til web surveys også at medføre et

reelt bidrag inden for denne litteratur. Andre survey modes såsom CATI, IVR og alm. face-to-face

interview var desuden ikke reelle alternativer. Fx vil der ikke kunne opnås relevante

stikprøverammer i form af telefonnumre og dataindsamling, som ikke er selvadministreret synes

uden for rapportens tidsmæssige rammer. Litteraturen for disse modes er desuden meget etableret.

Afslutningsvist vil der argumenteres for afgræsningen til SDR og RS. Valget af disse to mulige

kilder til målefejl er primært begrundet i kritikken fremsat i den metodisk baserede litteraturretning,

hvor det bl.a. er SDR og RS som påstås at kunne lede til omtalte gaps. Det synes i den forbindelse

også en rimelig antagelse, at SDR kan forekomme ved målingen af miljømæssig ansvarlig

forbrugeradfærd, idet der vil være items som kan lede til over- el. underestimation af respondentens

Side 22 af 101

Page 23: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

sande position. På baggrund af den anvendte Likert skala vurderes det også sandsynligt, at der kan

gælde response styles, siden dette er påvist i en række tidligere studier (jf. Wiejters, 2006 og

Wiejters m.fl., 2010). Valget af SDR og RS medfører imidlertid fravalg af en række øvrige oplagte

kilder til målefejl. Det gælder i særdeleshed non-response error. Det skyldes, at der i talrige

undersøgelser er påvist forskellige responsrater mellem web og andre survey modes (fx jf. Miller

m.fl., 2008). Inden for denne rapports rammer har det imidlertid ikke været muligt at gennemføre en

sådan undersøgelse ud over en eventuel påvisning af forskellige responsrates. Forskelle medfører

ikke nødvendigvis error, hvis dem som ikke besvarer ellers er ens på tværs af modes. Dette kan ud

fra rapportens data adgang ikke tjekkes via såkaldte validitetsdata, hvorudfra respondenter og ikke

respondenter kan sammenlignes (Tourangeau m.fl., 2008). Web litteraturen inden for respons

rates / error er også betydelig – eksempelvis indikeret ved talrige meta-analyser (fx Carayon m.fl.,

2009)

2. Teoretisk ramme

I dette kapitel angives rapportens teoretiske ramme, - dvs. de begreber, modeller og hypotiserede

sammenhænge, hvorudfra problemformuleringens tre underspørgsmål vil besvares og diskuteres.

Som det første præsenteres rapportens position i forhold til measurement theory. Dernæst beskrives

det anvendte teoretiske fundament i forhold til constructet social desirability responding.

Afslutningsvist angives teoretiske definitioner og forklaringer i forbindelse med response styles.

2.1. Measurement theory

Udgangspunktet er en given test – dvs. ”a device for obtaining a sample of an object’s attributes”

(Bernstein m.fl. 1994). I denne rapport er objekterne bachelorstuderende ved Handelshøjskolen,

Aarhus Universitet og attributterne elementer af deres miljømæssige ansvarlige forbrugeadfærd.

Den centrale udfordring er målingen af sådanne relevante attributter – dvs. ”the assigning of

numbers to the objects in a systematic way as a means of representing properties of the objects”

(Yen m.fl., 2002). Måling er da kendetegnet ved tildelingen af numeriske symboler til de relevante

objekter med det formål at kunne kvantificere disses attributter. Dette skal ske systematisk – dvs.

via standardiserede procedurer, som har enkle regler, er praktisk anvendelige og uafhængige af den

givne administrator (Bernstein m.fl. 1994). Measurement theory er det teoretiske fundament for

Side 23 af 101

Page 24: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

denne proces og kan defineres som ”attempts to describe, categorize, and evaluate the quality of

measurements, improve the usefulness and accuracy of these, and propose methods for new and

better instruments” (Yen m.fl., 2002). Denne rapport tager herved sit udspring i en måleteoretisk

problemstilling i form af en hidtidig unøjagtig måling, hvor modevalg evt. kan forbedre denne.

2.1.1. Klassisk test teori

Tests og tilhørende målinger er ingen entydig proces, hvorfor der gælder flere litteraturretninger

inden for måleteori – fx G Theory (Cronbach m.fl. 1963) og Item Respons Theory (fx Lord, Rasch

og Lazarsfeld). I denne rapport er udgangspunktet den klassiske test teori (fx Norvick 1966 og Yen

m.fl. 1979, 2002). En sådan test teori er en symbolsk repræsentation af de faktorer, som influerer de

observerede test scores. Ved klassisk test teori er fokus, hvordan målefejl kan påvirke disse

observerede scores (Yen m.fl., 2002). Denne retning er valgt, idet problemstillingen i rapporten er

to målefejls (SDR og RS) mulige påvirkning af de observerede scores ved målingen af miljømæssig

ansvarlig forbrugeradfærd. En test teori er kendetegnet ved dets antagelser. Den første antagelse ved

klassisk test teori kan beskrives som følgende (jf. Yen m.fl., 2002):

X=T+E (1)

Ovenstående antagelse beskriver, at den observerede score (X) for et givet objekt opnået gennem et

givet empirisk studie er summen af objektets sande score (T) og en målefejl (E). Der gælder da en

antagelse om additivitet for T og E påvirkning af X. Den sande score T er imidlertid ikke

observerbar, hvorfor denne er et teoretisk construct. Desuden er målefejlen E stokastisk – dvs.

beskriver ikke systematiske målefejl (såsom SDR og RS). I forhold til denne stokastiske målefejl

gælder endvidere følgende antagelser i den klassiske test teori (jf. Yen m.fl., 2002):

ε (X )=T (2)

ρET=0(3)

ρE1 E 2=0(4)

ρE1 T2=0(5)

Side 24 af 101

Page 25: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Antagelse 2 siger, at den forventede værdi af en observeret score X er dets sande score T. Denne

antagelse definerer herved T som gennemsnittet for den teoretiske fordeling af observerede scores

X, som ville opnås ved gentagne uafhængige tests af samme person ved samme type test. Antagelse

3 angiver, at målefejlen E er ukorreleret med de sande scores T. Dette medfører, at objekter med

forskellige sande scores ikke systematisk har forskellige målefejl. Den fjerde antagelse implicerer,

at målefejlen E ved to tests ikke korrelerer – således et givet objekts målefejl ved første test

forklarer målefejlen ved en anden test. Femte antagelse er, at der ikke er korrelation mellem

målefejlen E i en test og den sande score T i en anden. Ovenstående fem antagelser definerer

således tilsammen den stokastiske målefejl E og er de opfyldt gælder følgende (jf. Yen m.fl., 2002):

Parallele tests : X , X¿ , T=T¿∧σ E2 =σE ¿

2 (6)

τ−ævkvivante tets : X1 , X2∧T 1=T2+c12(7)

Ovenstående to antagelser gælder i forhold til to givne tests – eksempelvis test for miljømæssig

ansvarlig forbrugeradfærd via to forskellige survey modes. Under opfyldelse af antagelse 1-5 kan to

test uden yderligere antagelser klassificeres som enten parallelle eller τ−¿ ækvivalente. Parallelle

test, beskrevet ved antagelse 6, er kendetegnet ved to observerede scores X , X¿, hvis sande scores

T ,T ¿ er ens ligesom deres respektive error varianser σ E2 , σ E¿

2 Dette implicerer, at faktorer som leder

til målefejl har ens effekt på tværs af tests samt ens gennemsnit for X, ens varianser og korrelationer

mellem test scores. τ−¿ ækvivalente tests er jf. antagelse 7 beskrevet som to tests med observerede

scores X , X¿, hvis sande scores T 1 , T 2 forskel er givet ved den addiktive konstant c12 .Herudfra kan

sådanne tests have forskellige error varianser og det er sandsynligt, at den sande score T måles mere

nøjagtigt ved en af disse. Kravene til denne type test er herved mindre restriktive end ved parallelle

test, hvorfor τ−¿ ækvivalente tests ikke nødvendigvis er parallelle.

Via nævnte antagelser kan der udledes principper til evaluering af de klassiske kvalitetskriterier:

reliabilitet og validitet. Reliabilitet er defineret og fortolket på mange måder. Perfekt reliabilitet kan

defineres som ingen målefejl E (Churchil m.fl., 1979). To andre bud jf. Yen m.fl. (2002) er: 1) høj

korrelation mellem observerede scores og sande scores og 2) høj korrelation mellem observerede

scores ved to parallel tests. Problemet er i alle tilfælde den manglende mulighed for

operationalisering, idet sande scores fx ikke kan observeres. Derfor må reliabiliteten estimeres ud

Side 25 af 101

Page 26: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

fra andre metoder. Det gælder fx test/retest eller parallelle former for reliabilitet (Bernstein m.fl.,

1994). Problemet herved er bl.a. de såkaldte carry-over effects – hvor individers erfaringer med

første test kan medføre bias i forhold til den sande reliabilitet. Disse problemer ikke gældende ved

intern-konsistens reliabilitet, hvor kun en test pr. individ er nødvendig (Yen m.fl. 2002). Metoden er

her deling af en given sample, hvorudfra Spear-Brown formel el. Cronbachs Alpha kan anvendes.

Validitet kan generelt beskrives som en tests evne til at måle det, som det har til formål at måle

(Yen m.fl. 2002), således forskellige observerede scores X skyldes de faktiske forskelle, som

ønskes målt, dvs. X = T (Churchil m.fl., 1979). Herudfra er reliabilitet en nødvendig, men ikke en

tilstrækkelig forudsætning for validitet. Validitet findes imidlertid i mange forskellige former. To

generelle typer validitet er henholdsvis ekstern og intern validitet. Førstnævnte vedrører, hvorvidt et

givet studiets resultater kan generaliseres til en bredere population. Intern validitet kan beskrives

som graden af sandhed for et givet studies påståede kausale relationer. En type validitet er også

kriterium relateret validitet, som anvendes når test scores måtte kunne forudsige et givet

adfærdskriterium. Prædiktiv validitet er da defineret, som test scores evne til at kunne forudsige

fremtidig adfærd (Yen m.fl. 2002). Concurrent validitet har tilsvarende definition, men evalueres til

forskel fra predictive validitet ikke ved en senere måling, men simultant med den initiale måling.

2.1.2. Constructs

I denne rapport tager de fleste empiriske målinger udgangspunkt i betegnelsen: miljømæssig

ansvarlig forbrugeradfærd. Denne proces er imidlertid underlagt den kompleksitet, at der er tale om

måling af et construct. I forhold til en given test vil et construct initialt defineres som: ”some

postulated attribute of people, assumed to be latently reflected in test performance” (Cronbach

m.fl., 1955). Et construct er herved latent, hvorfor det ved en given test ikke er direkte målbart. Den

måleteoretiske udfordring er da at udforme en metode, som kan muliggøre en indirekte måling af

denne direkte uobserverbare størrelse (fx Hair m.fl., 2006). I forhold til den klassiske test teori og

dets associerede statistiske teknikker kan denne metode initialt beskrives ud fra følgende figur:

Side 26 af 101

ξ

Figur 2.1.2. Målemodel for et construct

Page 27: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Kilde: Egen tilvirkning ud fra Lattin m.fl. (2003)

Et givet latent construct ξ kan herved relateres til de målbare variableX j via et dependens forhold,

hvori variablene antages afhængige af constructet (Brown, 2006). Disse variable er da beskrevet

som indikatorer for constructet. Det skyldes, at alle variable enkeltvis vil måle constructet

imperfekt, men tilsammen eventuelt kan udgøre en passende empirisk operationalisering af

constructet under forudsætning af deres relevans. I afsnit 3.3. statistiske teknikker vil det nærmere

beskrives, hvordan ovenstående målemodel statistisk estimeres ud fra faktoranalytiske teknikker.

For et givet construct kan der også udledes principper til evaluering af dets validitet og reliabilitet.

Dette nye validitetsbegreb (af Cronbach m.fl., 1955) kan defineres som en given tests og tilhørende

indikatorers evne til at måle det construct, som det har til formål at måle. En type construct validitet

er konvergent validitet, som beskrives ved graden af konvergens / delt varians mellem et givet

constructs enkelte indikatorer (Hair m.fl., 2006). En anden type er diskriminant validitet, som er

graden af et constructs sande distinktion til et andet construct (Lattin m.fl., 2003). Nomologisk

validitet angiver i den forbindelse, hvorvidt korrelationerne mellem constructs (i det såkaldte

nomologiske sæt) er meningsfulde (Hair m.fl. 2006). Sidste type construct validitet, som vil omtales

er content validitet. Denne subjektive type validitet er som det første udtrykt i face validitet, som er

en vurdering af hvorvidt indholdet af indikatorerne er konsistente med definitionen af det tilhørende

construct (Brown, 2006). Som det andet er content validitet forudsat logisk validitet, som er den

givne tests evne til at repræsentere alle relevante aspekter af det constructet (Yen m.fl., 2002). Ud

fra den tidligere diskussion af reliabilitet vil dette ift. constructs være en indikator / forudsætning for

konvergent validiteten og kan fx beregnes ud fra Conbachs alpha (Latin m.fl., 2003).

Ordet construct må mere uddybende defineres. Dets tilhørende abstraktionsniveau betyder, at bud

herpå primært findes i videnskabsteoretisk baseret litteratur. Symbolic constructs, intervening

variables og hypothetical entities er eksempler på typer af constructs nævnt heri (Hull, 1943 og

Tolman 1938). I denne rapport er udgangspunktet Meehl m.fl. (1948), som skelner mellem

intervening variables og hypothetical constructs. Førstenævnte beskrives som: “a quantity obtained

by a specified manipulation of the values of empirical variables; it will involve no hypothesis as to

Side 27 af 101

X1 X2 X3

Page 28: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

the existence of nonobserved entities or the occurrence of unobserved processes”. Intervening

variables er herudfra kendetegnet ved empirisk summation – dvs. i sig selv uden det som Meehl

m.fl. kalder “content surplus”. Hypotetiske constructs (fx miljømæssig ansvarlig forbrugeradfærd)

er omvendt beskrevet som ”these involve terms which are not wholly reducible to empirical terms;

they refer to processes or entities that not directly observed” (s. 104). Herudfra har de en kognitiv

og faktuel reference udover selve de empiriske data, som har til formål at supportere dem.

Meehl m.fl. (1948) beskriver forskellen mellem hypotetiske constructs og intervening variables ud

fra tre dimensioner. Den første vedrører ordene til beskrivelse af constructet. Ved hypotetiske

constructs indgår ord, som ikke eksplicit er defineret ved empiriske relationer – dvs. ord som ikke

direkte kan reduceres til empiriske facts. I sådanne tilfælde er deduktion nødvendigt. Intervening

variables er omvendt kendetegnet ved ord, som er empirisk eksplicitte. Den anden dimension er

constructets logiske relation til facts. Opfyldelse af ”empirical laws” er her en nødvendig og

tilstrækkelig betingelse for ”sandheden” af intervening variable. For hypotetiske constructs er

opfyldelsen af sådanne empiriske love kun en nødvendig, men ikke en tilstrækkelig forudsætning

for dets validitet. Den tredje forskel beskrives ud fra kvantificeringen af constructet. Ved

intervening variables er en simpel gruppering / summation af dets relevante enheder ud fra

accepterede empiriske love tilstrækkeligt, hvilket imidlertid ikke gælder for hypotetiske constructs.

2.2. Social desirability responding

Allerede i 1930erne blev de mulige konsekvenser af SDR for et spørgeskemas validitet diskuteret i

psykometrisk litteratur (fx Bernreuter, 1933 og Vernon, 1934). SDR kan defineres som: ”answers

that make the respondent look good, based on cultural norms about the desirability of certain

values, traits, attitudes, interests, opinions, and behaviors” (De Jong m.fl., 2010). Den generelle

forklaring på SDR er da socialt baseret, hvorfor SDR også er beskrevet som content-based

responding (Wiejters, 2006 og Tourangeau m.fl., 2008). Litteraturen inden for SDR kan opdeles i to

retninger, hvor SDR betragtes som henholdsvis et kendetegn for items og et aspekt af respondentens

personlighed (De Jong m.fl. 2010). I denne rapport afgrænses der til teorierne udviklet ved

sidstnævnte retning og i særdeleshed de mange bidrag af Delroy L. Paulhus. Dette skyldes

retningens efterhånden fremskredne teoriudvikling - herunder den teoretiske konceptualisering af

SDR i Paulhus (2002), som beskrives som den mest omfattende pr. dato af fx De Jong m.fl.(2010).

Side 28 af 101

Page 29: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Definitionen af SDR i Paulhus (2002) er: ”the tendency to give overly positive self-descriptions”. I

form af ordet overly betones det, at SDR kun er relevant ved klar evidens for, at svar også er

”departure from reality” (s. 50). Empirisk er sådanne svar bl.a. observeret ved social ønskværdig

adfærd såsom at stemme (Belli m.fl. 2001) samt socialt uønsket adfærd som stof- og

alkoholmisbrug (Yan m.fl. 2007). Konsekvensen er her, at disse typer adfærd medfører henholdsvis

over- og underapportering (Tourangeau m.fl., 2008), hvorudfra item scores inflateres og deflateres.

SDR truer herved validiteten af data. Imidlertid er denne trussel en funktion af det undersøgte emne

og survey mode (fx Rips m.fl. 2000). Ved miljømæssig ansvarlig forbrugeradfærd synes det

rimeligt at antage, at spørgsmål om håndtering af affald, køb af miljøvenlige af produkter, osv. kan

fremprovokere SDR for visse respondenter – spørgsmålet er da om der gælder en mode effekt.

2.2.1. SDR som construct

Generelt har der været enighed om, at SDR er et meningsfuldt construct (Paulhus, 2002). Derimod

er den løbende operationalisering af dette construct sket ud fra forskellige perspektiver. Initialt blev

SDR fortolket som unidimensional – dvs. én generel form for SDR (fx i Edwards, 1957 og Messick

m.fl. 1958). Senere opstod opfattelsen af SDR i to forskellige former (fx Wiggins, 1959, Messick

1962 og Walker m.fl. 1962). Den opfattelse blev i betydelig grad bekræftet ud fra faktoranalysen i

Wiggins (1964), som viste to forholdsvis uafhængige klynger af mål for SDR. Disse to faktorer blev

benævnt Alpha og Gamma bias. Hovedparten af de mange multi-item scales for SDR (fx Marlowe-

Crowne SD-scale) har efterfølgende vist sig med en klar loading på én af disse faktorer. Dette har

ledt til en generel konsensus omkring denne empiriske / inducerede to-faktor model, hvorudfra dens

teoretiske fortolkning har været den centrale opgave. Det første bud herpå findes i Damarin og

Messick (1965), som omdøbte faktorerne til autistic bias in self-regard og propagandistic bias.

Førstnævnte beskrives som en defensiv fordrejelse af ens personlige selvopfattelse og er associeret

med personlighedstræk som selvværd og ego-resilency. Propagandistic bias er omvendt kendetegnet

ved forsøg på at fremme et ønsket offentligt omdømme og er fx linket til habitual lying og behov

for social anerkendelse. Et andet bud på fortolkning findes i Sackeim og Gur (1978, 1979 og

Sackeim, 1983). Heri skelnes der mellem self-deception og other-deception, som angiver

henholdsvis en urealistisk positiv selvfremstilling samt fordrejelse af ens selvbeskrivelser over for

omverdenen. Self-deception sker ubevist, hvorimod other-deception er bevidst og velovervejet.

Side 29 af 101

Page 30: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Med udgangspunkt i ovenstående SDR teorier startede Paulhus sin teoretiske fortolkning af Alpha

og Gamma faktorerne. Initialt foreslog han betegnelserne self-deception og impression management

(Paulhus, 1984). Impression management (IM) beskriver et bevidst valg af svar med det formål at

skabe et positivt socialt image eller jf. Paulhus (1998, s. 1029): ”purposeful tailoring of responses

to impress an audience”. IM svarer herved til faktoren other-deception af Sackeim og Gur med den

forskel, at IM ikke udtrykker ”deliberate lying”, men et aspekt af respondentens personlighed

(Paulhus, 1991). Self-deception (SD) har samme fortolkning som af Sackeim og Gur – dvs.

urealistiske selvbeskrivelser, som imidlertid er respondentens sande selvopfattelse. Denne ubevidste

form for SDR viderefortolkes i Paulhus (1988) ved at dekomponere SD til henholdsvis self-

deceptive enhancement (SDE) og self-deceptive denial (SDD). SDE beskrives som angivelsen af

”enhancement”- dvs. positive egenskaber såsom intelligens. SDD udtrykker derimod ”denial”, dvs.

nægtelse af negative egenskaber såsom alkoholmisbrug, brug af prostituerede, osv. (Paulhus, 2002).

2.2.2. Paulhus SDR teori

Seneste teoretiske fortolkning af Alpha og Gamma faktorerne ved Paulhus er hans ”final two-tier

conception” (Paulhus, 2002). Deri beskrives de som to constructs af ”traits and biases”, som kan

henføres til de fundamentale værdier agency og communion (Paulhus m.fl., 1998). En stor tendens

til disse værdier medfører SDR, som kaldes egoistic bias og moralistic bias jf. nedenstående figur:

Kilde: egen tilvirkning ud fra Paulhus (2002), s. 64

Side 30 af 101

Social desirability responding

Egoistic bias Moralistic bias

Agency Management

Communion Management

Self-deceptive Enhancement

Self-deceptive Denial

Figur 2.2.2. Paulhus SDR two tier system

Page 31: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Associeret med moralistic og egoistic bias er henholdsvis Gamma og Alpha faktorerne. Herudfra

indeholder begge disse faktorer self-deceptive og impression management og kan desuden skelnes

ud fra ”personality content”. Ovenstående two-tier system angiver herved både et ”content level”

(agency / communion) og et “proces level” (conscious / unconscious) – dvs. i alt fire typer SDR.

- Egoistic bias er på den ene side SDE, som angiver overdrivelse af ens sociale og intellektuelle

status (Paulhus, 2002). Denne form for self-deception er beskrevet som urealistisk positiv

selvopfattelse i forhold til personlighedstræk som dominans, frygtløshed, følelsesmæssig stabilitet,

intellekt og kreativitet (Paulhus m.fl., 1998). Disse træk er agentic – dvs. beskriver prominens og

status. Høje SDD scores antyder derfor narcissisme og en ”superhero” selvopfattelse. Egoistic bias

omfatter også agency management (AM), som er kendetegnet ved bevist ”pral” i forhold til ens

kompetencer, frygtløshed og fysiske styrker. AM er herved en særlig type impression management.

- Moralistic bias indeholder SDD, som beskriver benægtelsen af socialt afvigende adfærd samt

overdreven selvrapportering af ”saint-like” attributter (Paulhus m.fl. 1998). Denne type self-

deception er da kendetegnet ved inflaterede mål for communion personlighedstræk såsom

agreeableness (samarbejdsvillighed og varme) og conscientiousness (ansvarlighed, pligtopfyldelse

og orden). Høje scores ved SDD antyder herved respondenter med en selvopfattelse som ”engle”.

På impression management niveau, indeholder moralistic bias communion management, som

beskriver bevidst bortforklaring og generel minimering af fejl / damage control (Paulhus, 2002).

2.3. Response styles

I generel metodisk litteratur har det længe været anerkendt, at indholdsmæssigt irrelevante faktorer

(såsom anvendte rating skala) kan påvirke svarene på et spørgeskemas forskellige items (fx Lentz,

1938 og Cronbach, 1946). Denne problemstilling er bl.a. benævnt response styles, response sets og

response bias (Baumgartner m.fl., 2001 og Wiejters, 2006). I denne rapport anvendes begrebet

response style (RS), som via O’Neil (1967) kan defineres som:”behavior patterns where the

individual tends to select disproportionately a particular response category regardless of item

content”. En tilsvarende definition findes i Paulhus (1991): “A systematic tendency to respond to a

range of questionnaire items on some basis other than the specific item content”. RS er herudfra

karakteriseret som non-content based responding. Det betyder, at RS ikke er afgrænset til bestemte

items – såsom socialt følsomme, men derimod hele spørgeskemaets. Endvidere er implikationen, at

Side 31 af 101

Page 32: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

respondenters svar ikke nødvendigvis udtrykker deres faktiske holdninger. Det samme svar ved et

givet item kan da have forskellig betydning for forskellige respondenter (Rossi m.fl., 2001). Den

grundlæggende problemstilling er derfor, at RS kan invalidere de selvrapporterende survey data.

2.3.1. Typologi for response styles

Det overordnede begreb response style må nærmere operationaliseres i form af forskellige typer RS.

Derfor vil der i det følgende beskrives fire konkrete RS identificeret over en længere periode i

metodisk litteratur. I den forbindelse bør det nævnes, at der i denne litteratur er identificeret langt

flere RS, løbende angivet med forskellige navne og målt på forskellige måder (fx i Wirt m.fl. 1958

og Messick, 1968). Dette afsnits fire RS anses imidlertid for at være de mest citerede (jf.

Baumgartner m.fl., 2001), hvorfor deres teoretiske fundamenter er valgt nærmere beskrevet.

- Acquiescence response style (ARS) kan ud fra Martin (1964), Ray (1983) og Wiejters, (2006)

defineres som ”the tendency to make disproportionate use of response categories in the

favorable/agreement side of the agreement rating scale”. ARS er da kendetegnet ved enighed i

items uanset disses indhold. Synonyme betegnelser for ARS er derfor også agreement tendency,

yea-saying eller positivity (Baumgartner m.fl., 2001). En nærmere operationalisering af ARS kan

eksempelvis ske med udgangspunkt i Watson (1992), som foreslår, at ARS måles som graden af

enighed i såvel positive som negative formulerede items inden for samme skala. I denne rapport

anvendes en 5 punkts Likert skala, hvori ARS da kan være givet ved svarene delvist enig og meget

enig samt delvist sandt og meget sandt (spørgeskemaer er angivet i bilag 1-2). Flere teoretiske

forklaringer af ARS findes. Fx påstås ARS gældende, hvis items er tvetydigt og svagt formuleret

samt ved emner, hvor respondenten føler sig usikre / med manglende viden (Messick, 1967, Ray

1983 og Paulhus, 1991). Jf. McGee (1967) kan ARS forklares ved mangel på en passende mængde

kognitive ressourcer – fx i en kontekst præget af tidspres og generelle forstyrrelser. I forhold til den

givne respondent er ARS også forklaret ved dennes lave sociale status eller generelle mangel på

kognitive kapabiliteter (Presser m.fl. 1981 og Nathan m.fl. 1997). Endeligt beskrives ARS som

særligt gældende for udadvendte personligheder, som søger eksterne stimuli og tenderer til

impulsivt at accepterer andre personers påstande (Keniston m.fl., 1960 og Messick, 1991).

Side 32 af 101

Page 33: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

- Disacquiescence response style (DRS) kan beskrives som det modsatte af ARS. DRS er derfor

kendetegnet ved tendensen til at være uenig i items uanset disses indhold (Keniston m.fl., 1960 ).

Denne uforholdsmæssige brug af uenigt indikerende svarmuligheder på en given rating skala er i

litteraturen også benævnt disagreement tendency, nay-saying eller negativity (Baumgartner m.fl.,

2001). Operationaliseres DRS inverst af ARS, da vil DRS i denne rapport kunne komme til udtryk i

svarmulighederne delvist uenig og meget uenig samt delvist usandt og meget usandt. Et teoretisk

perspektiv på DRS findes bl.a. i Keniston m.fl. (1960) og Bachman (1984), hvori DRS forklares

som en manifestation af grundlægende personlighedskarakteristika. Via en anvendelse af forskellige

personlighedstest beskrives DRS i Keniston m.fl. (1960) som et kendetegn for indadvendte

personligheder, som er kontrolsøgende, refleksive samt ønsker at undgå eksterne stimuli.

- Midpoint response style (MRS) kan defineres som ”the tendency to make disproportionate use of

the middle response category” (Baumgartner m.fl., 2001 og Wiejters m.fl., 2010). MRS kan herved

beskrives som tendensen til valg af et eventuelt midtpunkt på en rating skala uanset indholdet af det

tilhørende item. I denne rapports spørgeskemaer vil MRS da udelukkende kunne være gældende i

forhold til svarmuligheden neutral. Teoretiske forklaringer på MRS er bl.a. beskrevet i Messick

(1968) samt Presse (1981) og kan herudfra opdeles under tre hovedpunkter jf. Baumgartner m.fl.

(2001). For det første kan MRS skyldes evasiveness – dvs. den situation, hvor respondenten ikke

ønsker at afsløre sine faktiske holdninger om et givet item. MRS kan også være forårsaget af

indecision, hvilket angiver den tilstand, hvor respondenten er usikker på sin holdning for det givne

item. For det tredje kan MRS forklares med respondentens indifference – dvs. dennes manglende

interesse i det emne / emner, som de givne survey items eksplicit er designet til at måle.

- Extreme respone style (ERS) kan med udgangspunkt i Greenleaf (1992) defineres som ”the

tendency to endorse the most extreme response categories regardless of content” . ERS er derfor

karakteriseret som valget af yderpunkter på en rating skala uden det kan forklares via item indhold.

I forhold til denne rapports skala kan ERS da komme til udtryk i svarene meget uenig, meget enig,

meget usandt og meget sandt. Teoretiske forklaringer på ERS findes bl.a. i Hamilton (1968), hvori

ERS beskrives som refleksion af selvsikkerhed, ”stivhed” samt lav tolerance over for flertydighed.

Endvidere angives det, at ERS er associeret med høj grad af bekymring samt sandsynligvis også

udtryk for afvigende adfærd. Af O`Donovan (1965) fremgår det, at ERS særligt er fremtrædende

ved meningsfulde stimuli – dvs. stimuli, som opfattes vigtige eller er involverende for den givne

Side 33 af 101

Page 34: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

respondent En anden psykologisk forklaring findes i Shulman (1973), hvor ERS henføres til

respondenter med lavt differentierede kognitive strukturer samt svagt udviklede kognitive skemaer.

Ovenstående fire typer RS: DRS, MRS, ARS og ERS kan i forhold til rapportens anvendte 5-punkts

Likert skala således grafisk summeres / illustreres ud fra følgende figur:

Kilde: egen tilvirkning

I forhold til efterfølgende mode sammenligning vedr. response styles, er det således overstående

operationalisering ved anvendte 5-punkts Likert skala, som er gældende. Dette er valgt angivet, idet

denne sammenligning tager udgangspunkt i en matematisk transformation af de indsamlede data,

hvorudfra ovenstående definitioner ikke eksplicit vil fremgå. Derimod vil de eksplicit være en del af

de metoder / formler hvorudfra de matematiske transformationer af data er foretaget.

3. Metodisk fundament

I dette kapitel angives rapportens metode – dvs. de systematiske procedurer og processer, hvorudfra

problemformuleringens tre forskningsspørgsmål besvares. Først redegøres der for konstruktionen af

rapportens instrumenter i form af web og PAPI spørgeskemaerne. Dernæst beskrives processen for

datagenerering. Som det tredje angives de statistiske teknikker, som denne data vil analyseres ud

igennem. Afslutningsvist sættes rapportens dispositioner i et videnskabsteoretisk perspektiv.

Side 34 af 101

5 3 2 1 4

MRS ARSDRS

ERS

Figur 2.3.1. Response styles: DRS, MRS, ARS og ERS ved en 5-punkts Likert skala

Page 35: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

3.1. Spørgeskemakonstruktion

Idet rapportens formål er en survey mode sammenligning, bliver konstruktionen af de tilhørende

spørgeskemaer en central del af metoden. Denne konstruktion er sket med udgangspunkt i

rapportens teoretiske ramme, feedback fra deltagerne i en række løbende prætest samt det Olsen

(2005) kalder evidens baserede råd – dvs. anbefalinger ud fra forskning i spørgeskemadesign1.

3.1.1. Prætest af spørgeskema

Ved konstruktionen af rapportens to spørgeskemaer tilsluttes argumentet i Fowler og Mangione

(1990) om, at ikke alle problemer kan forudsiges på forhånd bag ”desken”, hvorved undersøgelser i

”feltet” er nødvendige. Herudfra blev det besluttet at afholde en række prætest af såvel PAPI som

web spørgeskemaerne – dvs. sampling af et mindre antal respondenter, hvor de nøjagtige

procedurer for undersøgelsen blev forsøgt overholdt, efterfulgt af et møde med disse personer

(Olsen, 2005). Det overordnede formål var at kvalitetssikre instrumenterne for at minimere målefejl

forårsaget af dårligt design, uklare spørgsmål, osv. og herudfra mest effektivt kunne påvise

eventuelle mode forskelle. Jf. Brace (2008) svarer det til en sikring af de klassiske kvantitative

kvalitetskriterier: reliabilitet og validitet - kort beskrevet: konsistente svar fra samme survey univers

og en måling af det som ønskes målt. Den anvendte multi-item skala ECOSCALE (se afsnit 3.1.2)

er desuden ikke tidligere anvendt i Danmark (Stone m.fl., 2009), hvorfor dens oversættelse og

ukendte egenskaber i feltet må testes inden den endelige undersøgelse blev igangsat. Prætestene er

participant pre-testing (Blumberg, 2005). Det skyldes, at samplingen er foretaget ud fra bachelor

studerende ved Handelshøjskolen, Aarhus Universitet – dvs. undersøgelsens tilsigtede population,

hvorfor deltagere fra denne gruppe er vurderet mest relevant (se afsnit 3.2.1.). Testenes metodiske

fundament bygger på kvalitative principper. Det skyldes behovet for nærmere at kunne spørge ind

til deltagernes holdninger og reaktioner, hvilket er mest oplagt via dialog og diskussion (Flick,

2009). Som dataindsamlingsmetode er primært valgt fokusgruppeinterview. Det skyldes

muligheden for en dynamisk meningsudveksling / diskussion, som bl.a. kan motivere de enkelte

deltagere og skabe et større og mere nuanceret datamateriale ved at de inspirerer / foreslår hinanden

nye perspektiver. Lukkede spørgsmål og en objektiv distance fra undersøgerens side er herved ikke

1 Jf. Lietz (2010, s. 249-250) kan der identificeres to retningen inden for denne litteratur: en kognitiv og

kommunikationsbaseret. I denne rapport vil der ikke nærmere skelnes mellem retningernes respektive bidrag, men

derimod tilstræbes en komplementær anvendelse af disses resultater og tilhørende anbefalinger.

Side 35 af 101

Page 36: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

foretrukket, da det vil hæmme genereringen af sådanne kvalitative data. En kvantitativt baseret

prætest synes desuden ikke implementerbar ved anvendte statistiske teknikker (se afsnit 3.3.), idet

det vil kræve en betydelig stikprøvestørrelse fra en i forvejen meget begrænset population.

Ved første prætest blev et PAPI spørgeskema afprøvet på fokusgruppe af fire deltagere, hvis råd

dannede udgangspunkt for første revision af instrumentet. Herefter blev det reviderede spørgeskema

opsat i en webversion og afprøvet på en ny gruppe af fire personer. Prætest af flere omgang blev

prioriteret, idet det er usandsynligt, at alle fejl og uhensigtsmæssigheder bliver opdaget ved første

møde (Olsen, 2005). Derudover er det centralt at få feedback på de ændringer, som foretages

undervejs. Prætest af såvel PAPI som web-udgaven blev også vurderet nødvendigt, idet særligt de

tekniske aspekter ved web-udgaven måtte afprøves. Proceduren var i begge tilfælde, at deltagerne

brugte ca. 10 minutter på at besvare spørgeskemaet, hvorefter en fælles diskussion på ca. 20-25

min. fandt sted i et lokale på Handelshøjskolen, Aarhus Universitet. Den tidslængde blev vurderet

passende i forhold til opretholdelse af deltagernes motivation og deres initiale accept af deltagelse. I

tillæg til denne mere strukturerede procedure blev der også gennemført en række mere uformelle

tests – fx ved at sende web-udgaven til medstuderende, som herefter tilbagesendte kommentarer.

Deltagerne i prætestene blev samplet ud fra princippet maximal variation – dvs. så forskellige

respondenter som muligt (Flick, 2009, s. 122). Denne tilsigtede variation skulle medføre, at

deltagerne var heterogene i deres holdninger / reaktioner, hvorudfra flest mulige aspekter ved

spørgeskemaerne kunne diskuteres. Ud fra dette princip bestod fokusgrupperne af én dreng og pige

fra en økonomisk bachelor uddannelse og én dreng og pige fra en sporlig / kommunikationsmæssig

bacheloruddannelse – dvs. et køn for hver af de to overordnede udannelsesgrupper. Sampling ud fra

disse dimensioner er motiveret af forskning som viser, at spørgeskemaer samt miljømæssig

ansvarlighed opfattes forskelligt an på bl.a. køn og uddannelse (fx Stone m.fl., 2009 og Lietz 2010).

Sidste element i planlægningen af prætestene var en plan for anvendelsen af den indsamlede data.

Det blev her besluttet, at ingen systematisk kvalitativ dataanalyse eller transskribering skulle

foretages, idet rapportens metodiske fundament er kvantitativt / statistisk samt at der anvendes

allerede validerede multi-item scales. Derfor var anvendelsen case-baseret, hvor den enkelte

deltageres holdninger blev sammenholdt med generel forskning inden for spørgeskemadesign samt

det Olsen (2005) kalder almindelige ”common sense” principper. De konkrete resultater / ændringer

på baggrund af de gennemførte prætests præsenteres løbende som en del af de to næste afsnit.

Side 36 af 101

Page 37: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

3.1.2. Valg af multi-item scales

Formuleringen af hensigtsmæssige spørgsmål udgør en central del af spøgeskemakonstruktionen.

Velformulerede spørgsmål er nødvendige, hvis den efterfølgende kommunikationsproces med

respondenten skal blive succesfuld (Brace, 2004). Kan respondenten ikke ”kode” de enkelte

spørgsmål vil der være stor risiko for høj non-response rate og en generel ringe datakvalitet (Lietz,

2010). I denne rapport skal der formuleres spørgsmål for de to constructs miljømæssig ansvarlig

forbrugeradfærd og social desirability responding (SDR). Der er i den forbindelse blevet anvendt

spørgsmålene i to allerede udviklede multi-item scales: ECOSCALE af Stone m.fl. (1995 og 2009)

samt Balanced Inventory of Desirable Responding (BIDR) af Paulhus (1988). Det skyldes, at disse

scales vedvarende har demonstreret forskellige typer af validitet samt bygger på solide teoretiske

fundamenter. I dette afsnit vil der mere konkret argumenteres for valget af disse skalaer.

3.1.2.1. ECOSCALE

Ved måling af miljømæssig ansvarlig forbrugeradfærd kan der vælges blandt et meget stort antal

multi-item scales med færdigudviklede spørgsmål om fx attituder og viden vedrørende miljøet

(Duckitt m.fl., 2010). Imidlertid er der kun tre skalaer, som er bredt anvendt og herudfra har fået

gennemtestet mål for validitet og reliabilitet (Fransson m.fl. 1999 og Dunlap m.fl. 2003). Disse er

the Ecology Scale (Ward m.fl. 1973 og 1975), Environmental Concern Scale (Weigel m.fl., 1978)

og the New Environmental Paradigm (NEP) scale (Dunlap m.fl. 1978 og 2000). To førstnævnte har

items til måling af constructs såsom viden, attituder og adfærd i forhold til miljø. Imidlertid er disse

spørgsmål i deres umiddelbare form overvejende forældede. Det skyldes, at de er udviklet i

1970erne, hvorefter der er opstået en række nye temaer / problemstillinger inden for miljø (Dunlap

m.fl. 2002 og 2003) NEP skalen kan kategoriseres som ecocentric, idet den har 12 items til måling

af attituder om mennesket som en integreret del af naturen (Duckitt m.fl., 2010). Skalaen er da ikke

designet til at måle forbrugeradfærd, hvorfor dens anvendelse ikke er passende i denne rapport.

Udfordringen var derfor at finde en mindre gennemtestet skala, som både målte relevante constructs

i forhold til miljømæssig ansvarlig forbrugeradfærd og samtidigt havde opdaterede spørgsmål.

Valget blev i den forbindelse den 31-item lange ECOSCALE af Stone m.fl. (1995 og 2009).

Side 37 af 101

Page 38: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

ECOSCALE operationaliserer definitionen på miljømæssig ansvarlig forbrugeradfærd i afsnit 1.4.2.

Denne skala blev første gang publiceret i 1995 og udkom i 2009 i en revideret udgave, hvorfor den

vurderes at have opdaterede / relevante items. Disse items er primært udledt fra tidligere skalaer - fx

the Ecology Scale, hvorved ECOSCALE har et såvel solidt empirisk som teoretisk fundament.

2009-udgaven af ECOSCALE er også testet i flere forskellige lande med tilfredsstillende mål for

validitet og reliabilitet (Stone m.fl. 2009, s. 36). Derfor er dens anvendelse ikke afgrænset til én

bestemt kultur / land. I forhold til reliabilitet / intern konsistens målt ved Cronbachs alpha har

skalen vedvarende haft værdier over de anbefalede 0,7 (Lattin m.fl. 2003) – fx 0,72, 0,78, 0,85 og

0,93 (Stone m.fl. 1995, 2009, Clump m.fl. 2003 og Luc m.fl. 2009). I Stone m.fl. (1995 og 2009)

etableres der også evidens for skalaens face og prædikative validitet samt generel construct validitet

via konfirmativ faktoranalyse (1995, s. 608-610). ECOSCALE indgår desuden i den anerkendte bog

”Hanbook of marketing scales” af Bearden m.fl. (1999), hvilket også indikerer dens validitet.

Anvendelsen af ECOSCALE er imidlertid ikke uproblematisk. Første hovedproblematik er skalaens

begrænsede gennemtestning / anvendelse. Herudfra er der kun få tilgængelige mål for dens

reliabilitet og validitet. I forhold til sidstnævnte er alle typer validitet ikke testet – fx diskriminant

validiteten (Stone m.fl. 1995). Den manglende gennemtestning betyder også, at der endnu ikke er

etableret en fast faktorstruktur / measurement model for de 31 items (Stone m.fl. 2009). Denne

struktur er i særdeleshed ukendt ved danske respondenter, idet skalen ikke tidligere har været

anvendt på danske data. ECOSCALE er primært anvendt på studenterpopulationer (fx Clump m.fl.

2003), hvorved dens generaliserbarhed også kan synes tvivlsom. Den anden hovedproblematik er

formuleringen af spørgsmål. Visse spørgsmål er meget lange – fx det første: ”Økonomisk

velstående lande…”, hvilket jf. (Dillmann, 2000 og Fink, 2003) kan medføre, at respondenterne

ikke kan overskue dem. I den forbindelse kan række af spørgsmålene også betegnes som double-

barrelled, idet flere begreber og verber indgår i samme spørgsmål, hvilket også kan medføre

unøjagtige svar (fx Fowler, 1992 og Zouwen, 2000). Dette kan også forårsages af en række meget

generelle betegnelser såsom ”tung industri” samt visse ”vage” formuleringer som ”rutinemæssigt”

(fx Martin, 2002, White 2005 og Krumpal m.fl. 2008). For at opnå konsistens reliabilitet er 14 items

reverse coded / negatively worded, hvilket dog medfører betydelig risiko for misforståelse, idet de

tager længere tid at forstå /afkode (fx Carpenter m.fl. 1973 og Foddy, 1993). Deltagerne i

prætestene gav også udtryk for, at en række af spørgsmålene var vanskelige at læse og enkelte

direkte uforståelige. Herudfra måtte flere spørgsmål i større eller mindre omfang omformuleres. Det

Side 38 af 101

Page 39: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

gjaldt fx formuleringen: ”I regularly do things such as cut up the plastic rings on six-packs of soft

drinks”, idet ingen af deltagerne forstod meningen / baggrunden for denne indledning.

3.1.2.2. BIDR

Måling af social desirability responding (SDR) foretages ud fra mange forskellige metoder og

forskningsdesign (Leite m.fl., 2010). En kendt teknik er fx bogus pipeline (Jones m.fl., 1971), hvor

respondenterne tilkobles en elektronisk maskine, som påstås at kunne læse deres attituder, således

der gælder incitament til at angive sande svar. The randomized response technique er en anden ofte

anvendt teknik (fx Warner, 1965 og De Jong m.fl. 2010), hvor et SDR følsomt spørgsmål

kombineres med et neutralt, hvoraf ét af dem tilfældigt udvælges uden undersøgeren ved hvilket,

således der er mindre pres / incitament til socialt acceptable svar. Den mest udbredte metode er

brugen af særlige SDR scales sammen med undersøgelsens fokale skala (Paulhus, 1991 og Leite

m.fl. 2010). Den tilgang anvendes i denne rapport via skalen Balanced Inventory of Desirable

Responding (BIDR) af Paulhus (1988), idet den operationaliserer Paulhus teorierne omtalt i afsnit

2.2. Derudover er to førstnævnte tekniker kun anvendelige ved eksperimentelle forskningsdesign.

BIDR 6. udgave (1988) indeholder 40 items, hvoraf 20 måler self-deception enhancement (SDE) og

20 impression management (IM). Senere forskning (fx Pauls m.fl. 2003 og Aavik m.fl., 2006) har

påvist, at disse SDE og IM underskaler kan anvendes til måling af henholdsvis egoistic og

moralistic bias. BIDR er da en operationalisering af rapportens teoretiske fundament. En væsentlig

styrke ved denne skala er også dens omfattende anvendelse / gennemtestning (De Jong m.fl. 2010).

Skalen har i den forbindelse vedvarende opnået acceptable værdier ved forskellige mål for

reliabilitet og validitet (fx Meston m.fl. 1996, Pauls m.fl. 2003 og Roth m.fl. 2007). Det gælder fx i

De Jong m.fl. (2010), hvor BIDR anvendes ved en stikprøve af 12.424 respondenter fra 26

forskellige lande (herunder Danmark) og 4 kontinenter. Resultaterne heraf indikerer, at skalaen

stadig er brugbar i dag samt på tværs af mange lande / kulturer. Frem for alt er der også evidens for,

at skalaen ”fitter” danske data. Der synes herudfra passende empirisk og teoretisk belæg for, at

BIDR items kan anvendes ved opstilling / estimation af en målemodel for SDR. Med hensyn til

formuleringen af spørgsmål vurderes skalen også overvejende hensigtsmæssig - fx indikeret ved at

deltagerne i rapportens løbende prætests gav udtryk for forståelse og en klar formulering af disse.

Side 39 af 101

Page 40: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

En praktisk ulempe ved BIDR er det store antal items, som kombineret med den fokale skalas items

ofte medfører et meget langt spørgeskema. En række BIDR items er også kontroversielle – fx ”jeg

har tvivlet på mine evner som elsker” (Paulhus, 1991, s. 40). Disse forhold øger risikoen for høj

item non-response samt non-response for spørgeskemaet som helhed. I denne rapport vil en mulig

konsekvens være for små stikprøver til passende at kunne anvende valgte statistiske teknikker.

Derfor er der afgrænset til 10 items fra hver af SDE og IM underskalaerne - i begge tilfælde

henholdsvis 5 positivt og 5 negativt kodede. En kritik af BIDR og øvrige SDR scales er også, at de

er diagnostiske – dvs. kun indikerer, men ikke kontrollerer for bias pga. SDR (fx Leite m.fl., 2010).

En anden kritik er, at metodikken for deres efterfølgende anvendelse kun er svagt udviklet og

primært kendetegnet ved test af bivarate korrelationer mellem items i SDR og den fokale skala. Via

de meget personlige spørgsmål kan brugen af BIDR også ses som etisk problematisk og ved denne

rapports løbende dataindsamling har flere respondenter også reageret meget kraftigt på dens items.

3.1.3. Design af spørgeskema

Med udgangspunkt i ovenstående skalaers items kunne rapportens spørgeskemaer opstilles. Første

side i PAPI udgaven er en indledning, hvor afsender, projektets formål, skønnet tidsforbrug, en

garanti om anonymitet og præmier ved deltagelse er angivet (se bilag 1). Visse af disse oplysninger

var i web-udgaven en del af den e-mail invitation, som respondenterne initialt modtog (se bilag 2).

Formålet med oplysningerne var dog i begge tilfælde at vække modtagerens interesse og motivation

for deltagelse. En kort angivelse af projektets formål blev vurderet nødvendigt for at sikre validitet

ved at respondenterne efterfølgende kunne forstå, hvad items havde til formål at måle / var relateret

til. Anonymitet måtte i højeste grad betones ud fra de valgte meget følsomme BIDR items. Præmier

og en angivelse af skønnet tidsforbrug blev vurderet nødvendige. Af prætestene blev det fx

fremført, at brugbare præmier og skøn for tidsforbrug normalt var en forudsætning for villigheden

til deltagelse i surveys. Couper (2000) påpeger også den store risiko for høj non-response rate ved

list-based WBS og deraf risiko for non-response error. I Fallensen m.fl. (2010) er det påvist, at

præmier øger responsraten ved de undersøgte danske respondenter, hvorfor præmier blev vurderet

som en brugbar løsning ift. denne risiko. For at sikre validiteten blev respondenterne også bedt om

at angive så præcise svar som muligt samt givet instruktioner til evt. at ændre svar ved PAPI.

Side 40 af 101

Page 41: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

De 31 ECOSCALE og 20 BIDR items blev inddelt i de 4 grupper / batterier: Om miljøet, dig og

miljøet, om dig og dit forhold til andre. Formålet var at gruppere inden for samme tema og herudfra

give en kort introduktion. Blair m.fl. (1977) og Andrews (1984) har påvist, at en sådan logisk

strukturering giver højere data kvalitet. Rækkefølgen for disse batterier følger anbefalingerne om at

placere demografiske og andre følsomme spørgsmål til sidst (fx Presser, 1986 og Oppenheim,

1992). Herudfra blev batterierne af ECOSCALE items placeret før batteriet af BIDR items.

Desuden blev BIDR items placeret før det afsluttende batteri: fakta om dig, idet evt. angivelse af

kontaktinfo før besvarelsen af BIDR items blev vurderet at kunne fremprovokere meget høj item-

nonrespons. Rækkefølgen af items inden for de 4 første batterier er valgt ud fra anbefalingen om

generelle spørgsmål før specifikke (fx Sudman m.fl. 1992 og Bater m.fl. 2006). I den forbindelse

har prætestene indikeret behovet for, at hvert af disse batterier blev fordelt over 2 sider for

webudgaven (jf. bilag 2) med det formål at skabe mere overskuelighed / øget læsbarhed.

Svarmulighederne ved ECOSCALE items tager udgangspunkt i en balanceret 5-punkts Likert skala

gående fra meget uenig til meget enig. Det antal svarkategorier anvendes også i Stone m.fl. (1995)

og (2009) og er inden for de generelle anbefalinger (Lietz 2010, s. 260-261). Midtpunktet neutral er

medtaget, så der ved senere analyse kan undersøges midtpoint respons style. For at skabe et

konsistent spørgeskema er samme type Likert skala anvendt ved BIDR - her gående fra meget

usandt til meget sandt. Valget af disse verbale svarmuligheder følger af de oprindelige skaler. Et

muligt problem er dog, at respondenter kan tolke disse betegnelser forskelligt (fx O’Muircheartaigh

m.fl. 1993). Svarmuligheden ved ikke indgår ikke i spørgeskemaerne, idet det vurderes at

respondenterne har forudsætningerne for besvarelse. I den forbindelse gives der mulighed for item-

nonrespons, hvis det ikke måtte være tilfældet. En forced answering strategi vil desuden sjældent

give anderledes resultater (fx Roster m.fl., 2010) og kan ses som uetisk at påføre ved BIDR items.

3.2. Datagenerering

Med udgangspunkt i de færdigudviklede web-based og PAPI spørgeskemaer kunne rapportens

datagenerering igangsættes for at skabe det empiriske grundlag for efterfølgende analyser. Denne

datagenerering måtte ske ud fra en given population og tilhørende stikprøveramme, hvorudfra

statistisk sampling og den praktiske dataindsamling kunne foretages.

Side 41 af 101

Page 42: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

3.2.1. Population

Den relevante population kan i første omgang afgrænses til en B2C population, idet der undersøges

forbrugeradfærd. Ved miljømæssig ansvarlig forbrugeradfærd kan der yderligere afgrænses til

segmenter såsom green vs. grey consumers (Young m.fl., 2010). I forhold til denne rapports

problemstilling er der i litteraturen ikke eksplicit skelnet mellem sådanne grupper, men i stedet

fremsat en mere generel problematisering. Af den grund vurderes rapportens relevante population

den samlede gruppe af danske forbrugere. I den forbindelse kunne der med fordel afgrænses ud fra

kriterier såsom alder og indkomst, således alle personer i populationen kunne siges at have et

meningsfuldt forbrug. Under alle omstændigheder ville denne brede population ikke være praktisk

mulig inden for rapportens ressourcemæssige rammer. Det skyldes manglende adgang til

stikprøverammer i form af e-mail og adresse lister Omkostningerne til udseendelse af PAPI

spørgeskemaer samt adgang til brugbare stikprøverammer vurderes også betydelige. Udfordringen

var herved at bestemme en relevant population, hvorudfra der kunne foretages statistisk sampling

via tilhørende stikprøverammer inden for rapportens tidsmæssige og økonomiske rammer.

I denne rapport er populationen afgrænset til bachelorstuderende ved Handelshøjskolen, Aarhus

Universitet. Det skyldes, at der har været adgang til en e-mail liste, hvorudfra der kunne

gennemføres probability-based WBS (list-based samples). Derudover var det muligt at dele PAPI

spørgeskemaerne ud til forskellige øvelseshold, hvorved en adresseliste ikke var nødvendig ligesom

omkostninger til breve og porto. En væsentlig fordel ved denne population er omtalte liste, hvilket

muliggjorde sampling efter statistiske principper. Risikoen for coverage error synes også

begrænset, idet de fleste studerende må antages at tjekke deres e-mail løbende og i overvejende grad

være studieaktive. Denne risiko synes betydeligt større ved en bredere population, hvor det normalt

ikke kan antages, at alle grupper anvender Internettet i samme udstrækning (Couper, 2000). En

fordel er også muligheden for efficient dataindsamling ved PAPI. Det skyldes den direkte kontakt

til respondenterne, som umiddelbart herefter skal udfylde spørgeskemaet – dvs. ingen transporttider

som ved alm. post (snail mail). Et kritikpunkt kunne i den forbindelse være, at en sådan

dataindsamling ikke foregår under realistiske / normale omstændigheder, hvorved sammenligning

med web surveys er problematisk. Den største svaghed vurderes imidlertid at være den begrænsede

mulighed for at generalisere undersøgelsens resultater. Det synes meget tvivlsomt, at den valgte

Side 42 af 101

Page 43: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

population er repræsentativ for en bredere population af danske forbrugere, idet den eksempelvis

kan beskrives som relativt højtuddannet og med et kortsigtet meget lavt rådighedsbeløb / opsparing.

3.2.2. Dataindsamling

Udgangspunktet for den konkrete dataindsamling var en stikprøveramme i form af en e-mail liste

for de ca. 2700 bachelor studerende ved Handelshøjskolen, Aarhus Universitet. Herudfra skulle et

givet antal studerende modtage PAPI spørgeskemaet ved en øvelsesundervisning og de resterede en

invitation pr. e-mail om deltagelse i webudgaven. To centrale udfordringer var at sikre mod

dobbeltbesvarelser samt udjævne demografiske forskelle såsom køn og alder mellem disse modes,

således eventuelle forskelle ikke kunne forklares ved disse forhold, men kun reelle mode-effekter.

Det bør i den forbindelse nævnes, at studerende som ikke var til stede ved den givne

øvelsesundervisning ikke modtog PAPI udgaven, hvorimod det må antages at alle e-mail

invitationer blev noteret af de studerende, som blev tildelt denne mode. Det antages her, at dette

faktum ikke har medført nogen ukontrollerbar forskel / bias mellem modes. Dette begrundes

primært med det betydelige fremmøde, som kunne noteres ved de enkelte øvelseshold.

Ved PAPI blev 20 øvelseshold simpelt tilfældigt udvalgt fra omtalte e-mail liste, hvorefter der blev

lavet aftale med den givne holdunderviser om spørgeskemaets omdeling. Dette design er motiveret

af to årsager. For det første medfører brugen af randomiseringsprincippet, at faktorer såsom alder,

køn og andre ikke inkluderede variable bliver ujævnet mellem modes – dvs. ingen bias herudfra.

Det konkrete antal øvelseshold er valgt ud fra et estimat på ca. 25 studerende pr. hold og en

svarprocent på ca. 40-50 %, hvilket ved anvendte statistiske teknikker vil give en acceptabel

stikprøvestørrelse. For at undgå dobbeltbesvarelser blev e-mails for de studerende ved disse 20 hold

ekskluderet fra listen som dannede udgangspunkt for invitationerne til web-udgaven. Web-surveyen

blev igangsat så snart det viste sig, at de 20 øvelseshold med overvejende sandsynlighed ville

medføre passende antal besvarelser, således ikke flere hold var nødvendige at sample.

3.3. Statistiske teknikker

Med udgangspunkt i dataindsamlingens besvarede PAPI og web spørgeskemaer er sidste metodiske

disposition valget af statistiske teknikker, hvorudfra disse observationer skal analyseres. I denne

Side 43 af 101

Page 44: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

rapport foretages initialt en kort eksplorativ faktoranalyse (EFA). Den primært anvendte statistiske

teknik bliver konfirmativ faktoranalyse (CFA) i form af multi group CFA (MGCFA).

3.3.1. Eksplorativ faktoranalyse

ECOSCALE er ikke fuldt gennemtestet, hvorved klare faktorstrukturer ikke er etableret. Det gælder

særligt de reviderede items i ECOSCALE (2009). Skalen er desuden ikke anvendt på danske data

og siden den udviser uens strukturer på tværs af lande (Stone m.fl. 2009), implicerer det også en

stor usikkerhed. Herudfra gælder der ikke en entydig målemodel for miljømæssig ansvarlig

forbrugeradfærd i en dansk kontekst. For at etablere en sådan model til brug i senere MGCFA

gennemføres derfor initialt en eksplorativ faktoranalyse. Det er da de observerede mønstre i data,

som bestemmer faktorløsningen og herudfra målemodellen. Dette kan algebrafisk angives som:

X1=λ11ξ1+ λ12 ξ2+… λ1 c ξc+δ1

X2=λ21 ξ1+λ22ξ2+… λ2 c ξc+δ 2

.

X P= λp 1 ξ1+λp 2 ξ2+… λpc ξc+δ p

Ovenstående angiver den generelle common factor model. Første eksplicitte antagelse er her, at den

observerede varians i de enkelte variabel (X j) kan henføres til et mindre antal common factors (ξ i)

(dvs. uobserverbare kendetegn delt mellem flere variable). Koefficienterne λ ji angiver i hvilket

omfang de givne common factors bidrager til variansen i en given variabel. Ved standardisering af

X j og ξ i kan λ ji (factor loadings) tolkes som korrelationskoefficienter. Gøres der antagelse om

ukorrelerede common factors, vil disse factor loadings i kvadreret form da beskrive en variabels

communality (dvs. i hvilket omfang variablen er forklaret ved den underliggende faktormodel). En

anden eksplicit antagelse er, at den observerede varians i de enkelte variable (X j) kan henføres til

specifikke faktorer (δ j) (specifik for den enkelte variabel). Disse faktorer kan da tolkes som

målefejl / manglende fit med den underliggende faktormodel. Det antages her, at disse specifikke

faktorer er ukorrelerede med modellens common factors. Variansen for en given variabel (X j) er da

givet ved:

var (X ¿¿ j)= ( λi 1 ξ1+λ i2 ξ2+… λic ξc+δ p )=λ i12 +λ i 2

2 +… λic2 +var (δ p )=1¿

Side 44 af 101

Page 45: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Første led er diagonalen i kovariansmatrixen for en given variabel (X j). Ud fra tidl. antagelser om

uafhængighed og ved standardisering, vil kovarianselementerne bortfalde og diagonalen være givet

ved sidste udtryk. Det centrale er, at kun i denne diagonal vil de specifikke faktorer indgå. Ved

eksplorativ faktoranalyse fratrækkes estimaterne for de specifikke faktorer matrixdiagonalen,

således kun communalities er tilbage (dvs. en matrix hvor kilden til variation / kovariation er de

underliggende common factors). Dette benævnes principal factor method (Lattin m.fl. 2003). I

denne rapport estimeres communalities initialt via SMC (squared multiple correlation), hvor den

givne variabel (X j) regresseres på de øvrige variable og dens R2 anvendes som første estimat for

dets communality. Derefter gælder en iterativ proces, hvor det initiale estimat ændres ud fra

resultaterne i første faktoranalyse, hvorudfra disse nye estimater anvendes i en ny EFA, hvilket

fortsætter til communalities konvergerer. Løsningsproceduren kan matematisk beskrives som:

Χ=Ξ Λc+∆

R=Λc Λ c+Θ = R−Θ=Λc Λc

Udgangspunktet er common factor modellen, hvor Ξ=[ξ1, ξ2 …ξc ] , ∆=[δ1 , δ 2…δ p ]og Λc et p x c

matrix af factor loadings. Den model substitueres ind i en form af korrelationsmatrixen R (her som

en funktion af eigenvalues og eigenvectors). Modellen kan da angives i termer af R-Θ, hvorved der

er tale om matrix dekomponering af en symmetrisk square matrix med det formål at opnå en

approksimation heraf. Det gælder her, at der er et uendeligt antal løsninger, som er identiske i deres

evne til at approksimere matrixen R-Θ. Dette benævnes rotational indeterminancey.

3.3.2. Konfirmativ faktoranalyse

På baggrund af en EFA argumenteret målemodel er rapportens hovedformål at gennemføre en

statistisk baseret mode sammenligning. Via valgte målemodel gælder en priori etableret struktur for

data, hvor den anvendte statistiske teknik skal kunne identificere eventuelle signifikante forskelle

for dennes parametre på tværs af modes. I modsætning til EFA er udgangspunktet da en unik

defineret faktorløsning (= uden rotational indeterminancey). Formålet er herudfra ikke eksplorativt,

men derimod cross mode konfirmativt. Af den grund vælges multi group konfirmativ faktoranalyse

(MGCFA). Principperne for generel CFA kan eksemplificeres ved nedenstående to faktor model:

X1=λ11 ξ1+ λ12 ξ2+δ 1

Side 45 af 101

Page 46: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

X2=λ21 ξ1+λ12 ξ2+δ2

X3=λ31 ξ1+λ32ξ2+δ3

X 4=λ41ξ1+λ42 ξ2+δ 4

corr ( ξ1 , ξ2)=Φ1,2

Ved CFA pålægges da begrænsninger for alle cross loadings (her: λ12 , λ22 , λ31∧ λ41) ved at fixe deres

værdier til 0 i faktor laoding matrixen Λ, hvorved disse parametre ikke skal estimeres. Estimation

foretages derimod for korrelationer mellem faktorer (her: Φ1,2), hvilket er i modsætning til EFA,

hvor faktorerne blev antaget gensidigt uafhængige (et faktor korrelationsmatrix givet ved

identitetsmatrixen Ι). Der gælder ved CFA derfor scaling inderemiancy, idet variansen af en faktor

og loadings (λ i , j) for dets tilhørende variable ikke kan estimeres samtidigt. Dette vil i denne rapport

løses ved at fixe faktorernes varians til 1 eller en loading til en arbitrær værdi (1) (jf. Latin m.fl.,

2003). I alle tilfælde sker CFA ud fra en unikt defineret faktorstruktur. Ved multi group konfirmativ

faktoranalyse (MGCFA) er formålet at teste hvorvidt elementer af den konfirmative model, såsom

item intercepts, means, laodings, etc. er forskellig mellem grupper (Little, 1997). Udgangspunktet

for disse tests er en række estimerede modelparametre og test statistikker, hvorfor der initialt må

vælges en estimator - i dette tilfælde maximum likelihood estimation (MLE) ud fra følgende model:

Χ=Ξ Λ+∆

hvor Λ er et p x c faktor loading matrix (passende begrænset ift. modelparametrene) og Ξ et n x c

matrix af standardiserede faktor scores. På baggrund af den tilladte korrelation mellem faktorer og

error terms er faktor korrelationsmatrixen Φ og kovariansmatrixen Θ ikke nødvendigvis diagonale.

Herudfra kan det sande kovariansmatrixe for X i populationen – noteret Σ, modelleres som:

Var ( X )=Var ( Ξ Λ+∆ )=ΛΦ Λ+Θ

Formålet er at nå frem til et sæt parameterestimater, således at de fittede værdier for det sande

kovariansmatrixe Σ er så tæt som muligt på de observerede værdier i stikprøvens kovariansmatrixe,

noteret S. I denne rapport anvendes MLE til valget af disse estimater. Antages det, at matrixen X

udgøres af n uafhængige trækninger fra en p-variat normal fordeling med et sandt populations mean

på Ο og et kovarians matrix Σ, vil følgende log likelihood udtryk gælde:

Side 46 af 101

Page 47: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

ln ( L )=−n2 [ln|Σ|+tr ( S Σ−1 ) ]

hvilket er en ikke lineær funktion af modellens parametre, som løses ud fra numerisk optimerings

procedurer (Latin m.fl., 2003). Fordelen ved denne ML løsning er, at der opnås asymptotiske

standard errors for parameterestimaterne, således der kan gennemføres statistiske tests af disse

parameter værdier. For det andet medfører ML løsningsproceduren, at der kan implementeres

statistiske tests af modellens ”goodness of fit” som helhed. Herudfra kan en given model (the

restricted model) sammenlignes med en mere generel (the full model), hvor førstenævnte models

restriktioner er relakseret. En sådan test foretages med udgangspunkt i følgende χ2 statistik:

n [ ln|Σ|+ tr (S Σ−1 )−ln|S|−p ] χ2

hvor n angiver stikprøvestørrelsen og p antal observerede variable i full model. For denne fulde

model gælder et perfekt fit mellem Σ og S, hvorimod der må forventes forskelle mellem Σ og S ved

den restringerede model. Ovenstående test er da en test for hvorvidt en given model har samme fit

som en perfekt model. En problemstilling er imidlertid statistikkens direkte proportionalitet med n,

hvorved testet er følsomt ved store stikprøvestørrelser, hvor selv små forskelle kan medføre kan en

forkastelse af h0 vedrørende ækvivalens mellem den valgte modelspecifikation og en perfekt

fittende model. I denne rapport anvendes derfor også alternative goodness-of-fit indeks såsom CFI,

RMSEA, etc. Rapportens anvendelse af MGCFA kan beskrives ud fra følgende udtryk:

χ R2 − χ F

2 χr2=Δ χ2 χ df R−df F

2

hvilket angiver princippet for rapportens test af nestede modeller ift. sammenligningen af de to

survey modes, hvor der stepvist tilføjes flere restriktioner herfor. Statistisk kan det beskrives som at

overgå fra en given model til en restringeret udgave, hvor differencen mellem disses χ2 statistikker

vil være χ2 fordelte med et antal frihedsgrader (df) svarende til antal pålagte restriktioner r.

Matematisk gælder det herved, at der stepvist bliver fixet værdier for givne matrixer (fx Λ) til at

være ens på tværs af grupper (her: web og PAPI). H0 hypoteserne vil i disse tilfælde være: ingen

signifikant forværring af fit i overgangen fra den initiale til den mere restringerede nestede model.

Det er da evident, at rækkefølgen for test af nestede modeller er afgørende for disse konklusioner. I

denne rapport følges rækkefølgen foreslået i bl.a. Brown (2006), Hair m.fl. (2006) og Leuw m.fl.

(2000). Disse steps beskrives nærmere i de følgende analyseafsnit (herunder særligt i 4.3.)

Side 47 af 101

Page 48: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

3.4. Videnskabsteoretisk position

På baggrund af det tidligere beskrevne teoretiske fundament samt dette afsnits angivne metode er

rapportens videnskabsteoretiske position da åbenlys. Denne position kan herudfra beskrives med

udgangspunkt i følgende illustration, som angiver placeringen af den videnskabsteoretiske position:

Kilde: egen tilvirkning ud fra Arbnor & Bjerke (2009, s. 15-17)

Udgangspunktet er det givne study area, som i dette tilfælde bl.a. kan beskrives ud fra valgte

population og undersøgte problemstilling / emneområde. Med det formål at kunne give en

besvarelse af underspørgsmålene i problemformuleringen må der vælges et givet operativt

paradigme – dvs. de metoder og metodikker, som er omtalt i dette afsnit. Denne boks svarer således

til, hvorledes det givne study area vil undersøges. Denne undersøgelse vil være underlagt et givet

metodesyn, hvilket i denne rapport er det Abrnor og Bjerke (2009) benævner den analytiske tilgang.

Et sådant metodesyn vil i sidste ende være underlagt et givet videnskabsteoretisk paradigme, som

bygger på en række ultimative antagelser. Det må således etableres hvilke ultimative antagelser,

som ligger bag den analytiske / positivistiske tilgang, som denne rapport skrives ud fra. Inden disse

antagelser kort angives, bør det nævnes, at denne rapports emne: survey modes, i sig selv kan

placeres i overstående figur. Det skyldes, at der her er tale om et element inden for survey

methodology, hvorfor disse kan henføres til en metodetilgang og en række ultimative antagelser.

Metodetilgangen ved surveys vil normalt være analytisk. Denne rapports bagvedliggende

metodetilgang er da analytisk ligesom konteksten for det emne, som det har til formål at undersøge.

Side 48 af 101

MethodologyPhilosophy of science

Paradigm Ope. ParadigmMethodological view

Study area Ultimate

presumptions

Figur 3.4. Illustration af placeringen af rapportens videnskabsteoretiske position

Page 49: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Ontologisk – dvs. opfattelsen af den virkelighed som det givne studie har til formål at undersøge,

ved den analytisk / positivistiske tilgang vil som det første omtales. I den forbindelse antages det, at

”helheden er summen af dets enkeltdele” – dvs. en summativ / additiv opfattelse af virkelighedens

forskellige elementer2. Den opfattelse ses også af rapportens anvendte teori og metode – fx i form af

den klassiske tests teoris antagelser samt de forudsætninger som gælder for CFA. Modeller og teori

har også en stor betydning i den analytiske tilgang, hvor formålet / ønsket normalt vil være at kunne

være forklarende ift. det undersøgte fænomen/ sammenhænge. Dette bør ses i forhold til den proces

for videnskabelse som danner udgangspunkt / antages ved tilgangen. Denne kan beskrives som

cyklisk i sin natur, hvor der hele tiden kan opnås forbedringer af den nuværende viden ved at de

bagvedliggende hypoteser falsificeres (jf. Popper), hvilket også kan siges at være formålet i denne

rapport jf. hypoteserne H1, H2 og H3 i tidl. afsnit. Et andet centralt begreb er ceteris paribus – dvs.

en mulighed for at foretage en alt andet lige fortolkning af det givne fænomen. Dette gælder ikke

mindst i de statistiske analyser i denne rapport, hvor der via kontrol for variable kan argumenteres

for en sådan fortolkning., hvor alle øvrige faktorer i modellen således holdes konstante.

Erkendelsesteoretisk / episimologisk gælder det, at skabelse af viden antages uafhængig af den

givne undersøger. Denne skal således forsøge at holde en distance for ikke at skabe kilde til bias,

hvilket også er fulgt ved rapportens dataindsamling. Herudfra kan udledes et andet centralt princip,

som ligger til grund for denne rapport: antagelsen om objektivitet. Denne forudsætning er i højeste

grad afspejlet i klassisk test teori og den generelle survey metodik, som web og PAPI er en del af.

Der søges således ikke skabt subjektiv viden, hvilket eksempelvis blev skabt ved rapportens

gennemførte prætest af de to spørgeskemaer. En anden central erkendelsesteoretisk antagelse er

viden som tids og kontekstuafhængig. Dette afspejles eksempelvis i den forudsætning, at der kan

repliceres tidligere opnået viden ud fra samme procedurer og processer. Netop denne antagelse er

særligt gældende i måleteori generelt via begrebet standardisering. Det hypotetiske construct

kausalitet antages også at kunne gælde ift. den analyse tilgang. I denne rapport undersøges der for

kausalitet i forhold til survey modes, hvor det implicit vil undersøges, hvorvidt der kan være

forskelle i den kausale sammenhæng mellem mode og rapporterede svar. Dette er imidlertid et

abstrakt begreb, som aldrig til fulde kan påvises, men derimod kun sandsynliggøres ud fra data.

2 Indholdet i dette afsnit er primært med udgangspunkt i Arbnor & Bjerke (2009, s. 15)

Side 49 af 101

Page 50: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

4. Måling af constructet miljømæssig ansvarlig forbrugeradfærd

I dette kapitel vil det analyseres, hvorvidt det hypotetiske construct miljømæssig ansvarlig

forbrugeradfærd måles forskelligt på tværs af web og PAPI survey modes. Som det første vil det

anvendte data vurderes. Dernæst etableres en målemodel for dette construct via eksplorativ

faktoranalyse. Afslutningsvist foretages en multi-gruppe konfirmativ faktoranalyse med det formål

at identificere eventuelle forskelle mellem disse modes for den estimerede målemodel.

4.1. Datagrundlag

Kvaliteten af rapportens efterfølgende statistiske analyser er i betydelig grad betinget af det

anvendte datagrundlag. Som det første vil stikprøveresultaterne for den gennemførte dataindsamling

derfor vurderes. Dette sker med udgangspunkt i nedenstående beskrivende mål:

Kendetegn I alt PAPI Web

Stikprøvestørrelse 452 209 243

Responsrate 16,7 % 47,5 % 10,8 %

Item-nonrespons 0,117 % 0,135 % 0,101 %

Køn Mand 49,0 % 48,6 % 49,40 % Kvinde 51,0 % 51,4 % 50,60 %

Gennemsnitsalder 22,38 22,22 22,52

Kilde: egen tilvirkning ud fra bilag 7

Undersøgelsens samlede stikprøvestørrelse er 452 respondenter, heraf 209 og 243 for henholdsvis

PAPI og web spørgeskemaerne. Hensigtsmæssigheden af disse niveauer må vurderes i relation til de

senere anvendte statistiske teknikker. Ved eksplorativ og konfirmativ faktoranalyse kan sådanne

Side 50 af 101

Tabel 4.1. Stikprøvekendetegn i alt og for enkelte modes

Page 51: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

niveauer være acceptable vurderet i forhold til de mange generelt etablerede ”rules-of-thumbs” (jf.

Hair m.fl. 2006, s. 113 & 753, Latin m.fl., 2003, s. 126 og Brown m.fl., 2006, s. 78). For den

seneste ECOSCALE survey i Stone m.fl. (2009) skete analyserne med udgangspunkt i en

stikprøvestørrelse på 489 fordelt på 5 underpopulationer (s. 43). Herudfra vurderes omfanget af det

indsamlede data ikke på forhånd at udgøre en åbenlyst statistisk problemstilling (i form af for få

frihedsgrader, df, efter modelparametrene er blevet estimeret), men vil imidlertid stadig konkret

vurderes ved de senere estimationer af målemodellerne.

Ud fra den samlede population (ca. 2.700) kan responsraten for web og PAPI surveys beregnes til

47,5 % og 10,8 %. Det er herved en klar statistisk signifikant forskel på andelen af personer, som

vælger at deltage ved de to modes (ift. en z-test på forskellen mellem to andele => p-værdi 0 % ).

Denne rapports forskel i responsrates bør imidlertid ikke ses som en vigtig praktisk og statistisk

signifikant mode effekt, men derimod en effekt af en delvis ”urealistisk” dataindsamlingsmetode.

Kontaktes studerende ved en holdundervisning, hvor der afsættes tid til besvarelse af spørgeskema,

må det forventes at en stor andel vil gøre det. I forhold til at modtage en e-mail om deltagelse i en

web-survey, vil presset/incitamentet til at påbegynde en besvarelse da være langt større ligesom

”støjen” fra andre aktiviteter (såsom øvrige e-mails) vil være langt mindre. Den primære

problemstilling er imidlertid, at denne dataindsamling ikke svarer til den måde, hvorpå PAPI

spørgeskemaer normalt omdeles. Det skyldes, at der ofte vil være tale om bredere populationer, hvis

personer fx ikke er samlet samme sted. Rapportens forskelle i responsrates kan derfor ikke validt

generaliseres ud til mere heterogene populationer / traditionelle PAPI surveys ved snail mail.

De opnåede stikprøvestørrelser må vurderes i forhold til ”missing data” for at kunne beskrive det

faktisk tilgængelige antal informationer (df) ved de senere modelestimationer. I denne rapport er

item-nonrespons på 0,135 % og 0,101 % for henholdsvis PAPI og web spørgeskemaerne. Ved en z-

test for forskellen mellem to andele synes det herved klart, at der ikke gælder nogen signifikante

forskelle (=> p-værdi ≫α=5 %¿. Frem for alt er dette niveau meget lavt (Brown m.fl., 2006 og

Leeuw m.fl., 2000) – svarende til 15 og 12 undladte svar ved 11.077 og 12.879 items. Via dette

næsten identisk lave niveau på tværs af modes vurderes missing data ikke at være en kilde til bias

ved de efterfølgende modelestimationer og herved en sløring af eventuelle sande modeeffekter.

Valget af en imputation teknik for missing data har da ikke en stor betydning for efterfølgende

resultater (Leeuw m.fl. 2000), men må stadig vælges for at analyserne kan gennemføres (dvs. er

Side 51 af 101

Page 52: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

ikke ignorable missing data jf. Hair 2006 s. 39). I denne rapport vælges en ”calculation

replacement value” tilgang, hvor manglende faktiske værdier substitueres med estimerede means

og intercepts (mean substitution, Hair m.fl., 2006, s. 63). Dette valg er primært motiveret af

mulighederne inden for anvendte programmel. Endvidere begrundes det med en antagelse om

MCAR, idet hovedparten af non-response kun gælder for ét item pr. spørgeskema og uden nogle

mønstre herfor - dvs. er stokastiske. Herudfra blev listwise deletion fravalgt, idet det ville være

ugunstigt at have alle øvrige items undladt fra analysen, når eksempelvis kun 1 el. 2 mangler.

Ved miljømæssig ansvarlig forbrugeradfærd, SDR og RS er der observeret forskellige svar an på

alder og køn (fx Clump m.fl. 2003, Wiejters, 2006 og Paulhus 1998), hvorfor der i denne rapport

kontrolleres for de faktorer. I forhold til køn gælder en homogen fordeling inden for modes samt på

tværs af modes – i begge tilfælde en lille overvægt af kvinder. Ved en statistisk test for homogenitet

er det tydeligt, at hypotesen omkring ens kønsfordeling på tværs og inden for modes da fastholdes

(p-værdi ≫α=5 %¿. I forhold til alder er den i gennemsnit 22,22 og 22,52 for henholdsvis PAPI og

web. Det er herved tydeligt, at alder heller ikke er signifikant forskellig på tværs af modes (ved t-

test for forskelle mellem to forventede værdier: p-værdi ≫α=5%¿. Dette synes forklaret ved den

meget afgrænsede studenterpopulation, hvis aldersfordeling har en meget begrænset variation. I

vurderingen af alder og køn på tværs af modes bør det medtages, at stikprøverne udgør over 5 % af

den samlede population – dvs. behov for korrektion af estimatorernes varians. Denne korrektion for

endelig population vil dog ikke ændre på det faktum, at køn og alder ikke vil være en årsag til

eventuelle modeffekter. Forklaringen herpå synes anvendelsen af omtalte randomiseringsprincip.

4.2. Etablering af målemodel

Som forudsætning for senere mode sammenligninger må der initialt etableres en målemodel for

miljømæssig ansvarlig forbrugeradfærd i form af dets underliggende constructs og disses variable. I

denne rapport findes den model via eksplorativ faktoranalyse (EFA), hvis resultater sammenholdes

med ECOSCALEs teoretiske fundament samt tidligere studier i sammenlignelige vestlige lande.

Indikeret ved en afvisning af h0 hypotesen i Bartletts (1950) sphericity test (p-værdi 0%¿ samt en

MSA (Kaiser 1970, 1974) > 0,8, giver denne EFA som forventet mening ud fra korrelationerne i

data. Stikprøvestørrelserne for PAPI og web vurderes også passende ud fra rules-of-thumbs såsom

min. 5 observationer pr. variable (Fidell m.fl., 1989). Antal faktorer blev bestemt ud fra tidligere

Side 52 af 101

Page 53: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

studier, skalaens teori samt Scree Plott (jf. Catell, 1966). Herudfra blev de to EFA gennemført ved

henholdsvis udtrækning af 4 og 5 faktorer. Andre regler såsom Kaisers rule (1959) ville medføre 9-

10 faktorer – et antal, som der ikke er empirisk eller teoretisk belæg for. På baggrund af den initiale

løsnings rotational indeterminancey blev de respektive faktoranalyser foretaget ud fra det Kaiser

Varimax roterede faktor loading matrix med det formål at opnå en mere simpel struktur at fortolke.

Metoden var i den forbindelse iterativ, idet variable én af gangen blev fjernet, når de havde

betydelige cross-loadings, lave communalities / loadings eller var den eneste variabel, som loadede

højt på en given faktor. Dette var fx motiveret af ønsket om unidimensionalitet, kun variable som

var reelle indikatorer for én faktor. Resultatet af rapportens to EFAs kan beskrives som følgende:

  PAPI   Web  Faktor   Faktor Variabel 1 2 3 4 Variabel 1 2 3 4Q_10 0,571 Q_3 0,635Q_11 0,586 Q_9 0,514Q_14 0,501 Q_14 0,639Q_15 0,760 Q_15 0,566Q_18 0,677 Q_16 -0,665Q_19 0,736 Q_18 0,729Q_24 0,536 Q_19 0,801Q_25 0,713 Q_24 0,513Q_26 0,710 Q_25 0,779Q_27 0,652 Q_26 0,742Q_29 0,531 Q_27 0,626Q_30 0,604 Q_29 0,558Q_31 0,633         Q_31 0,631      

Kilde: egen tilvirkning ud fra bilag 3

Ved PAPI og web stikprøverne er der i begge tilfælde valgt i en løsning med 4 common factors. I

den forbindelse ses det, at tre af faktorerne gælder i begge løsninger i form af samme variables høje

loadings. Imidlertid genfindes faktor 2 i PAPI løsningen ikke i webs og faktor 3 i web løsningen

ikke i PAPIs. Der kan således identificeres 5 common factors, hvis variables loadings og cross-

loadings tydeligt er henholdsvis signifikante og insignifikante (Hair m.fl. 2006, s. 128). Herudfra

Side 53 af 101

Tabel 4.2. Kaiser Varimax roteret faktor laoding matrix (med loadings over 0,20)

Page 54: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

kan construct validitet ikke afvises, men vil omvendt kræve nærmere statistiske tets. ECOSCALES

teoretiske fundament i form af definitionen på miljømæssig ansvarlig forbrugeradfærd indeholder 5

faktorer (jf. figur 1.2.4.). I de empiriske studier, hvor skalaen har været anvendt, er der fundet

mellem 5-7 faktorer (fx Stone m.fl. 1995,Clump m.fl. 2003 og Luc m.fl. 2009). Herudfra er

udgangspunktet i denne rapports efterfølgende mode sammenligninger nedenstående målemodel:

Kilde: egen tilvirkning ud fra EFAs samt ECOSCALE teori og empiri

Rapportens målemodel har 5 constructs svarende til de to EFAs omtalte 5 common factors og deres

tilhørende højt loadende variable. For overblikket skyld er korrelationerne mellem constructs (Φi , j ,)

ikke angivet til forskel fra de øvrige estimerbare parametre: faktor loadings (λ j ,i) og specifikke

faktorer (δ j ). Begrundelsen for valgte målemodel er både teoretisk og empirisk. De fem constructs

kan ud fra deres variable tolkes som repræsentationer af de tidl. nævnte 5 teoretiske dimensioner af

miljømæssig ansvarlig forbrugeradfærd jf. Stone m.fl. (1995). Fx kan item 14 og 15 (Alle bør vide,

at elfenben er… & syreregn rammer kun lande med …) tolkes som constructet om miljømæssig

viden. Ovenstående model kan da betragtes som en operationalisering af figur 1.2.4.s teoretiske

Side 54 af 101

λ30,5

λ26,3λ24,3

λ27,3 λ31,3λ29,3

λ25,3λ10,5 λ11,5λ3,1 λ9,1

λ14,2

λ15,2λ16,1

δ 29

5: Evne1:Attitude 3: Vilje 2: Viden 4: Adfærd

Q_11Q_10

Q_16

Q_3

Q_30

Q_9 Q_14

Q_27Q_15

Q_25

Q_31

Q_24

Q_29

Q_26 Q_18

Q_19

δ 30δ 15 δ 27 δ 31 δ 19δ 16

δ 9δ 3 δ 14 δ 24 δ 25 δ 26 δ 18 δ 10 δ 11

Figur 4.2. Målemodel for miljømæssig ansvarlig forbrugeradfærd (uden construct korrelationer)

λ19,4

λ18,4

Survey mode

Page 55: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

definition af miljømæssig ansvarlig forbrugeradfærd. I den forbindelse synes de 5 constructs at være

hypotetiske, om end der ved kun 2 indikatorer kan argumenteres for intervening variables. Den

anden begrundelse for modellen er empirisk baseret. I flere studier er der udover samme antal

faktorer identificeret faktorer, hvor samme variable har høje loadings. Det gælder særligt 4: adfærd

som fx ses i Stone m.fl. (2009) og Luc m.fl. (2009). Den valgte målemodel følger da i betydelig

grad den allerede etablerede litteratur / empiri vedr. ECOSCALE i sammenlignelige vestlige lande.

4.3. Survey mode sammenligning Valide sammenligninger / sammenlægninger af grupper, i dette tilfælde survey modes, er betinget

af measurement invariance – dvs. antagelsen om ækvivalens for strukturer og parametre på tværs

grupper. En manglende opfyldelse heraf gør det usikkert, hvorvidt det overhovedet er samme

construct som måles i de forskellige grupper (Little, 1997). Sammenligninger af means eller

strukturelle relationer på tværs af grupper forudsætter således, at der er måleækvivalens for de

underliggende indikatorer (Ployhardt m.fl., 2004 og Thompson m.fl., 2006). I den forbindelse

skelner bl.a. Byrne m.fl. (1989) mellem to typer af measurement invariance: måleækvivalens (in a

narrow sense) og strukturel ækvivalens. Førstenævnte referer til invarians for faktor loadings, item

intercepts og error varianser, hvorimod strukturel ækvivalens yderligere implicerer invarians for

faktorernes varians og indbyrdes kovarianser. Rækkefølgen for tilhørende statistiske invarians test

er ikke tilfældig, idet de enkelte undergrupper af invarians er forudsat andre typers opfyldelse

(Leuw m.fl., 2000). I denne rapport undersøges her som det første for configural invariance3:

χ2(df) = 452,53 (336)   p = 0,000Root Mean Square Error of Approximation (RMSEA)= 0,038Comparative Fit Index (CFI) = 0,925Tucker Lewis Index (TLI) =     0,891

Kilde: egen tilvirkning ud fra beregninger i SPSS AMOS 6.0 (se bilag 4)

3 I bl.a. Brown (2006) foreslås det, at der initialt gennemføres enkeltvise CFA for grupperne (s. 269). De tests er

fravalgt i denne rapport, idet formålet er en mode sammenligning, hvilket ikke direkte vil opnås uden simultan

estimation herfor. CFA for de enkelte grupper vil omvendt kunne validere anvendte målemodel. Det gælder imidlertid

også ved simultan estimation og er desuden ikke et stort behov, siden der anvendes en allerede udviklet skala.

Side 55 af 101

Tabel 4.3.1. χ2 test statistik samt fit index ved model for configural invariance

Page 56: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Ved test for configural invariance pålægges målemodellen simultant begge modes. Det er da kun

faktorstrukturen som udgør en begrænsning, idet alle parametre (fx λ i , j , Φi , j ,¿ frit estimeres i de to

stikprøver (Hair m.fl., 2006). Testet kan således fortolkes som test af ækvivalent modelstruktur i de

to grupper (Schwartz, m.fl., 2009). Denne test foretages som det første, idet yderligere (og mere

restriktive) former for måleækvivalens er betinget af ens strukturer. Af ovenstående tabel fremgår

en χ2 goodness-of-fit test statistik på 452,53 svarende til en p-værdi 0 ved modellens 336

frihedsgrader. Herudfra gælder en klar afvisning af h0 hypotesen om configural invariance. Som

nævnt er χ2 testet meget følsomt ved store stikprøvestørrelser som i denne rapport, hvor selv

mindste diskrepans kan forventes at ville indikere signifikante forskelle. Derfor suppleres analysen

med målene: RMSEA, CFI og TLI. RMSEA er et absolut fit index, hvori der forsøges korrektion af

χ2 testets følsomhed ved store stikprøvestørrelser og høj modelkompleksitet (Brown, 2006). Dets

værdi på 0,038 indikerer god fit mellem modes – fx ud fra cut-off på < 0,05 (Leuw m.fl., 2000). CFI

er et incremental fit index, hvis værdi på 0,925 også indikerer god fit mellem modes ved det

klassiske cut-off på > 0,9 (Hair m.fl., 2006). Det samme er tilfældet for TLI, der som forventet

komplementerer CFI værdien – dvs. angiver fit ved en værdi er tæt på 1 (Tucker, 1973). Via disse

fit index vurderes der høj grad af evidens for configural invariance, hvor χ2 testet da tolkes som

udtryk for store stikprøver og mange variable i modellen4. Der testes derfor for metrisk invarians:

χ2(df) = 474,78 (352)   Δ χ 2(Δdf) = 22,25 (16)   p = 0,135Root Mean Square Error of Approximation (RMSEA)= 0,045Comparative Fit Index (CFI) = 0,918Tucker Lewis Index (TLI) =     0,885

Kilde: som tabel 4.3.1.

4 I ovenstående samt alle efterfølgende beregninger er der anvendt sample covariance matrix S og ikke correlation

matrix R jf. anbefalingerne i Cudeck (1989). Resultaterne er imidlertid tjekket ved anvendelsen af R, hvilket ikke gav

betydelige ændringer ift. S som datagrundlag. På grund af CFA scaling indeterminancy er varianserne af faktorerne (ξ i ,)

fixet til værdien 1 og i forhold til fixing af faktor laodings (λ j ,i) gælder ingen forskelle med hensyn til model fit

(Griffen m.fl., 2001). Resultaternes validitet er desuden betinget af opfyldelse af diverse forudsætninger – fx p-variat

normalitet.

Side 56 af 101

Tabel 4.3.2. χ2 test statistikker samt fit index ved model for full metric invariance

Page 57: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Test for fuld metrisk invarians er et test af ækvivalensen for samtlige faktor loadings ( ΛG) på tværs

af analysens g grupper (i dette tilfælde web og PAPI) – dvs. test af følgende nulhypotese:

H0: ΛW=ΛP

Udgangspunktet er antagelsen, om ens faktor loadings ved web (W) og PAPI (P) modes, hvilket

statistisk testes ved at pålægge en lighedsbegrænsning for matrixerne ΛG, som indeholder

målemodellens faktorloadings. Ækvivalens for faktor loadings kan fortolkes som ”that the groups

calibrate their measures in the same way” – dvs. værdierne på den anvendte skala har samme

mening på tværs af grupper (Meredith 1993 og Vandenberg m.fl. 2000). Metrisk invarians er

således en forudsætning for construct komparabilitet på tværs af modes, - fx ud fra den fortolkning

at loadings er validitetskoefficienter for den kausale relation mellem construct og dets indikatorer

(Bollen, 1989). Forskellige loadings, dvs. forskellige validitetskoefficienter, kan ud fra dette

perspektiv da betvivle, hvorvidt constructet reelt er det samme i grupperne (Schwartz m.fl., 2009).

Af ovenstående tabel fremgår resultaterne af testet af den relevante nestede model, som har en χ2

test statistik på 474,78 med 352 frihedsgrader. Sammenlignet med den relevante full model – dvs.

modellen for configural invariance, er ændringen i χ2 statistikken 22,25 og antal frihedsgrader 16. P-

værdien for restriktionen af de 16 faktor loadings er således 0,135 – hvilket er betydeligt over den

klassiske grænse på 0,05 (jf. Brown, 2006). Denne fit underbygges også af de tre fit index, som kun

er marginalt ændret og stadig er inde for de normalt etablerede fit grænser. Nulhypotesen vedr. fuld

metrisk invarians vælges derfor fastholdt. Herudfra testes nu for fuld skalar invarians.

χ2(df) = 521,33 (368)   Δ χ 2(Δdf) = 46,55 (16)   p = 0,000Root Mean Square Error of Approximation (RMSEA)= 0,071Comparative Fit Index (CFI) = 0,881Tucker Lewis Index (TLI) =     0,861

Kilde: som tabel 4.3.1.

Ovenstående test for fuld skalar invarians er et test af ækvivalensen for samtlige item intercepts (τG)

i de regressionsligninger, som forbinder indikatorerne og de latente faktorer ( X i=τ i+λ ij ξ j+δ i¿.

Side 57 af 101

Tabel 4.3.3. χ2 test statistikker samt fit index ved model for full scalar invariance

Page 58: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Disse intercepts angiver da den forventede værdi af x i, når ξ j = 0. Ved en MGCFA med de to

grupper web og PAPI er der således tale om test af følgende nulhypotese:

H0: τW=τP

Initialt er antagelsen ækvivalente item intercepts ved web og PAPI, hvilket statistisk testes ved at

pålægge en lighedsbegrænsning for tau vektorerne τG på tværs af de to grupper. Disse intercepts

tolkes i Hayduk (1989) som: ”systematic biases in the responses of a group to an item”. Den givne

indikators mean kan således være enten højere eller lavere (upward vs. downward biased) end hvad

dets faktor loading samt faktors mean umiddelbart vil antyde. Skalar ækvivalens er da tilfældet, hvis

denne bias upward eller downward er ens på tværs af gruppernes items. Af ovenstående tabel

fremgår en ændring i χ2 statistikken på 46,55 og en stigning i antal frihedsgrader på 16,

sammenlignet med modellen for fuld metrisk invarians. Dette medfører en p-værdi gående mod 0

hvorudfra h0 hypotesen om fuld skalar invarians må afvises. Denne konklusion underbygges af fit

index, som alle i betydelig grad forværres. Eksempelvis falder CFI over grænsen på 0,01 (jf.

Rensvold m.fl., 2001). Fuld skalar invarians opfattes i megen litteratur ikke som påkrævet i forhold

til at gennemføre meningsfulde sammenligning af fx group means (Baumgartner m.fl., 1998).

Partiel skalar invarians betragtes da som tilstrækkeligt, hvorfor et test herfor vil implementeres:

χ2(df) = 512,28 (360)   Δ χ 2(Δdf) = 37,50 (8)   p = 0,002Root Mean Square Error of Approximation (RMSEA)= 0,061Comparative Fit Index (CFI) = 0,889Tucker Lewis Index (TLI) =     0,869

Kilde: som tabel 4.3.1.

Ved ovenstående test af partiel skalar invarians er der pålagt lighedsbegrænsninger for 8 item

intercepts (2 ved attitude, vilje og evne samt 1 ved viden og adfærd). Dette følger af bl.a. Brown

(2006) om to begrænsninger pr. faktor el. én ved faktorer af to indikatorer (hvorved alle øvrige

intercepts frit estimeres). I den forbindelse ses en ændring i χ2 statistikken på 37,5 samt en stigning

i frihedsgradantallet på 8 (ift. modellen om fuld metrisk invarians). P-værdien herfor er 0,002,

Side 58 af 101

Tabel 4.3.2. χ2 test statistikker samt fit index ved model partial scalar invariance

Page 59: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

hvilket supporterer en afvisning af udgangspunktet om partiel skalar invarians. Denne afvisning af

nulhypotesen er endvidere understøttet af de angivne fit index. Det skyldes, at faldet i CFI er klart

over 0,01 samt RMSEA er over den normalt etablerede grænse på 0,05. Derfor vurderes der ikke

statistisk evidens for partiel skalar invarians. Denne konklusion er endvidere underbygget af en

række følsomhedsanalyser, hvor forskellige item intercepts i τG blev fixet uden at dette medførte en

fastholdelse af nulhypotesen om partiel skalar invarians. Kombineret med modellens svage fit vil

der herudfra ikke foretages test af yderligere nestede modeller. Eksempelvis vil det ikke være

meningsfuldt at foretage en sammenligning af faktor means på tværs af modes (fx jf. Leuw m.fl.,

2000 og nedenfor). Derimod vil overstående resultater diskuteres og kritiseres i følgende afsnit.

4.4. Diskussion og kritik af resultater

I dette afsnit (samt tilsvarende afsnit 5.2. og 6.3.) vil kapitlets angivne resultater diskuteres og

kritiseres med udgangspunkt i anvendte teori og metode (præsenteret i kapitel 2-3). Herudfra vil

resultaterne også implicit vurderes ud fra de grundlæggende antagelser / kvalitetskriterier, som

gælder for de traditioner, som lægger bag rapportens videnskabsteoretiske position (jf. afsnit 3.4.).

Det centrale resultat er afvisningen af nulhypotesen om skalar invarians. Konsekvensen heraf ses

via: E (x iG )=τ i

G+λiG κ j

G. Den forventede værdi af en indikator variabel i en gruppe er givet ud fra dets

item intercept, dets faktorloading og mean for dets faktor. Forskelle i indikator means kan således

være forklaret ved forskellige intercepts, loadings og latente means. En sammenligning af latente

means forudsætter da ækvivalente faktor loadings og item intercepts (Cole m.fl., 1985). En

implikation af afvisningen af skalar invarians er herved manglende mulighed for sammenligning af

de 5 faktorers means på tværs af modes, idet evt. forskelle også vil kunne være forklaret ved

forskellige item intercepts. I et måleteoretisk perspektiv synes der således evidens for uens måling

af miljømæssig ansvarlig forbrugeradfærd og dets underconstructs. I analyserne foreligger der ingen

direkte indikation af hvorvidt antagelserne i klassisk test teori er opfyldte. Under forudsætning af

disses opfyldelse, kan de uens item intercepts tolkes som tegn på tests, som er tau ækvivalente med

konstanten c ijsom differencen mellem de enkelte item intercepts på tværs af modes. Under alle

omstændigheder synes de forskellige intercepts at betyde en afvisning af web og PAPI som

parallele test ved måling af miljømæssig ansvarlig forbrugeradfærd. Ved tau ækvivalente tests

gælder det ofte, at en af de to tests normalt vil måle den sande score T mere præcist end den anden.

Side 59 af 101

Page 60: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Dette fremgår ikke nærmere af resultaterne i dette afsnit, men vil i de følgende to kapitler eventuelt

kunne ses ved eventuelle forskelle med hensyn til de to kilder til målefejl: SDR og RS.

I afsnittet er der ikke nærmere analyseret forskellige mål for construct reliabilitet og validitet. Disse

kvalitetskriterier antages således implicit på et tilfredsstillende niveau. I en optimal rapport uden

tids- og sideantalsbegrænsninger ville mål herfor imidlertid være angivet – fx Cronbachs alpha el.

målene for diskriminant og konvergent validitet foreslået af Fornell and Larcker (1981). Deres

undladelse synes imidlertid acceptabelt ud fra rapportens anvendte metode og informationen af de

foretagne analyser. Jf. tabel 4.3.1 fremgår fit index inden for de normalt etablerede grænser. Den

EFA udledte målemodel stemmer desuden overnes med relevant teori og tidl. analyser. Herudfra

gælder der således indikation på construct validitet ud fra afsnittes dataanalyse. De gennemførte

prætest kan også ses som en metodisk baseret sikring heraf med respondenternes positive feedback

som evidens. I den forbindelse kan trianguleringen via den kvalitative tilgang ses som en anden

styrke ved rapportens metode, om end en kritik kunne være den manglende anvendelse af et mixed-

study design – dvs. med en større anvendelse af kvalitative metoder. En sådan diskussion er

imidlertid dybt funderet i videnskabsteoretiske antagelser, hvorfor det ikke nærmere vil omtales.

En metodisk svaghed er visse items vage og uklare formuleringer, hvilket isoleret set kan medføre,

at der ikke måles det som reelt ønsket målt. Ved en optimal analyse var disse items udskiftet, - fx

indirekte udledt via teori el. direkte ud fra andre multi item scales. Værdien heraf synes imidlertid

begrænset. Via EFA vil problematiske items sjældent have meningsfulde / høje loadings, hvorudfra

de vil frasorteres. Den efterfølgende CFA vil desuden også kunne indikere eventuel mangel på fit

(hvilket ikke gælder i denne rapport – jf. signifikante loadings). En metodisk styrke er rapportens

sampling strategi via randomiseringsprincippet. Af tabel 4.1. fremgik tydelig udjævning i forhold til

køn og alder. Således synes der også at kunne gælde udjævning mellem modes ved andre ikke

kontrollerbare / potentiel bias skabende variable. På den anden side er den konkrete PAPI

dataindsamling med risiko for sampling bias – dvs. med mindre sandsynlighed for svar fra visse

respondenter end andre. Det skyldes, at ikke alle personer møder op til givne holdundervisninger.

Teoretisk medfører det en non-random sample af givne population ved at alle deltagerne ikke er lige

objektivt repræsenteret / balanceret. Ud fra de generelt store fremmøder vurderes denne mulige bias

dog ikke betydelig. Derimod vurderes den store forskel i responsrater at kunne være kilde til en

betydelig non-response error. Det synes sandsynligt, at de ca. 50 % som ikke besvarede PAPI har

Side 60 af 101

Page 61: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

andre kendetegn end de ca. 90 % som ikke besvarede webs. En stor mængde af de 50 % som

besvarede PAPI synes fx at ville have givet non-response, hvis de var tildelt web. Diagnostikken af

denne evt. kilde til bias er dog ikke opnåelig jf. manglende valideringsdata herfor (jf. afsnit 1.5.).

Rapportens resultater og ovenstående fortolkninger er betinget af passende opfyldelse af de

forudsætninger, som er gældende for anvendte statistiske teknikker. Afslutningsvist vil der derfor

tages stilling til de forudsætninger som gælder ved CFA estimeret ved ML (ud fra Leeuw m.fl.

(2000). Som det første må der gælde uafhængige utrækninger fra den givne population. Dette

antages gældende ved web, men kan diskuteres ved PAPI, hvor respondenterne sad tæt og da evt.

kunne påvirke hinanden. Imidlertid blev de opfordret til at undlade interaktion, hvilket desuden kun

i svagt omfang blev observeret, hvorfor der herudfra ikke vurderes at gælde store problemer. Der

skal også gælde multivariate normalitet for den bagvedliggende population, hvorfra observationer

udtrækkes. Dette svarer til normalitet for den k-dimensionelle vektor af stokastiske vektorer X givet

ved [Q3 ,Q9 ..Q31 ] – dvs. X N (μ , Σ ), hvor Q3 ,Q 9 ..Q31er de enkelte items / variable anvendt i

målemodellen, μ en mean vektor og Σ det sande kovariansmatrixe. Test heraf må ske i data. I den

forbindelse blev det initialt noteret, at skævhed og kurtoisis for samtlige Qi var under de to normalt

etablerede grænser på henholdsvis 2 og 7 jf. bilag 7 (Finney and Distefano 2006). Således var det

ikke overraskende, at H0: X N (μ , Σ ) kunne fastholdes ud fra Mardias test (i AMOS 6.0.). Der

antages da at gælde multivariat normalitet for relevante population, hvorudfra metoder såsom

resampling el. andre estimatorer blev vurderet irrelevante at triangulere rapportens resultater med.

I forhold til resultaternes statistiske kendetegn må påvirkningen af eventuelle outliers også vurderes,

hvilket i denne rapport er undersøgt i AMOS 6.0. via Mahalanobis distance. Af denne test fremgår

kun få observationer med høje d-squared distances – som enkeltvis fortolkes som en

usandsynliggørelse af antagelsen om normalitet. Der vurderes således ikke at være problemer med

outliers og ved eksklusion af de få omtalte observationer ændres rapportens konklusioner ikke. Jf.

Lattin (2003) gælder det, at de bagvedliggende numeriske optimerings procedurer ikke altid giver

brugbare resultater ved CFA – eksempelvis i form af loadings over 1 el. negative error varianser.

Ved denne rapports resultater er der tjekket for sådanne infeasible løsninger uden at de fremkom.

Dette kan jf. Lattin (2003) tolkes som om at modellen er korrekt specificeret. I den forbindelse er en

forudsætning ved CFA, at der ikke gælder fejlagtig specifikation (Leeuw m.fl., 2000, s. 96). Denne

forudsætning vil ikke nærmere statistisk testes ligesom antagelsen om modellens eksogenitet.

Side 61 af 101

Page 62: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

4.5. Delkonklusion

I dette afsnit blev det initialt fastslået, at rapportens datagrundlag synes hensigtsmæssigt og herved

brugbart i forhold til efterfølgende statistiske analyser. Den første analyse var en eksplorativ

faktoranalyse, hvorudfra en 5 faktor målemodel blev etableret. Modellens brugbarhed er bl.a.

understøttet af ECOSCALE teori og tidl. empiriske analyser. Med udgangspunkt i denne model

blev der foretaget mode sammenligninger via MGCFA. Af disse analyser fremgik der evidens for

configural og metrisk invarians ved givne målemodel. Derimod blev nulhypotesen om fuld og

partiel skalar invarians klart afvist. Således foreligger der ikke statistisk evidens for måleækvivalens

ved valgte målemodel for miljømæssig ansvarlig forbrugeradfærd på tværs af modes. Dette svarer

til en afvisning af den initialt formulerede hypotese H1 omkring måleækvivalens for web og PAPI

ved en sådan model. I forhold til denne konklusion synes de statistiske forudsætninger for MGCFA

opfyldte. Desuden synes anvendte målemodel brugbar via fit i data samt dens meningsfulde

fortolkning. Afvisningen af H1 synes således at ske på baggrund af et solidt statistisk, empirisk og

teoretisk fundament. Ved denne slutning må der imidlertid tages højde for eventuelle bias –

herunder i særdeleshed risikoen for non-response error via den store forskel i responsrates.

Side 62 af 101

Page 63: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

5. SDR ved måling af miljømæssig ansvarlig forbrugeradfærd

I dette kapitel vil det analyseres, hvorvidt social desirability responding (SDR) gælder i samme

omfang på tværs af web og PAPI survey modes. Derfor vil der gennemføres en multi-gruppe

konfirmativ faktoranalyse med det formål at identificere eventuelle forskelle ved en målemodel ud

fra SDR items af Paulhus (1988). Det vil da undersøges, om der på tværs af web og PAPI modes

gælder forskelligt omfang af denne form for content-based responding / measurement error.

5.1. Survey mode sammenligning

Kapitlets fokale construct social desirability responding vælges dekomponeret til de to constructs:

moralistic og egoistic bias (jf. Paulhus, 2002). Det er herudfra formålet at identificere eventuel

invarians mellem web og PAPI via en estimeret målemodel etableret ud fra 20 items i Paulhus

BIDR (1988) – dvs. test af ækvivalens med udgangspunkt i følgende målemodel:

Kilde: egen tilvirkning ud fra Paulhus (1992 og 2002)

Side 63 af 101

Φ1,2

λ50,1λ48,1λ49,1 λ43,2λ42,2

λ44,2

λ47,1 λ37,2λ51,1 λ45,2

λ34,2λ33,2

λ32,2

λ40,1λ39,1

λ38,1 λ46,1

λ41,1 λ35,2

λ36,2

δ 38

λ3,11:MB 2: EB

Q_35Q_34

Q_48

Q_38 Q_36Q_39 Q_46

Q_50 Q_51

Q_40 Q_32 Q_33Q_41

Q_42

δ 44 δ 45

Figur 5.1. Målemodel for social desirability responding - moralistic (MB) og egoistic bias (EB)

Survey modeQ_37 Q_43 Q_44 Q_45Q_49Q_47

δ 39 δ 40 δ 41 δ 35δ 32 δ 33 δ 34δ 46 δ 36

δ 48δ 47 δ 49 δ 50 δ 51 δ 37 δ 42 δ 43

Page 64: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Tabel 5.1.2. χ2 test statistikker samt fit index ved model for full metric invariance

Datagrundlaget ved følgende ML estimation er omtalt i kapitel 5, hvorfor beskrivelsen samt

diskussionen heraf findes i afsnit 5.1. Fremgangsmåden ved dette kapitels MGCFA er den tidl.

omtalte stepvise teststrategi af nestede modeller, hvor der gradvist pålægges flere begrænsninger for

den relevante model. I den forbindelse må der som det første testes for (en snæver) måleækvivalens

i form af ækvivalente strukturer, loadings og item intercepts, således en valid sammenligning af de

to SDR constructs kan foretages på tværs web og PAPI modes – herunder i særdeleshed testet af

ækvivalente means. Med det formål at analysere, hvorvidt der overhovedet er tale om samme SDR

constructs ved de to modes vil der først testes for configural invariance:

χ2(df) = 462,84 (340)   p = 0,000Root Mean Square Error of Approximation (RMSEA)= 0,021Comparative Fit Index (CFI) = 0,962Tucker Lewis Index (TLI) =     0,954

Kilde: egen tilvirkning ud fra beregninger i SPSS AMOS 6.0 (se bilag 5)

Ved ovenstående tabel ses en χ2 statistik på 462,84, hvilket ved 340 frihedsgrader implicerer en p-

værdi 0 - dvs. en klar afvisning af nulhypotesen omkring configural invariance. Dette resultat var

imidlertid at forvente ud fra de betydelige stikprøvestørrelser. Betragtes niveauerne for de tre fit

index, fremgår værdier, som i betydeligt omfang supporterer udgangspunktet omkring configural

invariance. RMSEA er langt under grænsen på 0,05 og CFI samt TLI langt over grænsen på 0,9 (fx

angivet i Hair m.fl., 2006 og Brown, 2006). Disse index vurderes således at supportere en

fastholdelse af nulhypotesen vedrørende ækvivalent modelstruktur på tværs de to grupper: web og

PAPI survey modes. Herudfra er det meningsfuldt at foretage et test af fuld metrisk invarians:

χ2(df) = 486,08 (358)   Δ χ 2(Δdf) = 23,24 (18)   p = 0,185Root Mean Square Error of Approximation (RMSEA)= 0,022Comparative Fit Index (CFI) = 0,961Tucker Lewis Index (TLI) =     0,954

Kilde: som tabel 5.1.1.

Side 64 af 101

Tabel 5.1.1. χ2 test statistik samt fit index ved model for configural invariance

Page 65: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Modellen for fuld metrisk invarians er skabt ved at pålægge en lighedsbegrænsninger for de tidl. frit

estimerede faktor laodings i ΛG. Herudfra opnås en χ2 statistik på 486,08 ved 358 frihedsgrader,

hvilket er stigninger på henholdsvis 23,24 og 18 ift. modellen for configural invariance. Ud fra disse

ændringer kan p-værdien beregnes til 0,185. Der er således klar evidens for fastholdelsen af H0:

ΛW=ΛP – eksempelvis ud fra grænsen på 0,05 (Leuw m.fl., 2000). Den konklusion underbygges

endvidere i de angivne fit index, som i alle tilfælde kan beskrives som stort set uændrede på trods af

de påførte restriktioner. Der vurderes således at gælde fuld metrisk invarians for web og PAPI

modes – dvs. same metric herimellem. Af den grund vil der nu testen for fuld skalar invarians:

χ2(df) = 515,59 (376)   Δ χ 2(Δdf) = 29,51 (18)   p = 0,042Root Mean Square Error of Approximation (RMSEA)= 0,024Comparative Fit Index (CFI) = 0,959Tucker Lewis Index (TLI) =     0,953

Kilde: som tabel 5.1.1.

Nesting af modellen for fuld metrisk invarians via yderligere lighedsbegrænsninger for de 18 ikke

fixede item intercepts i τG medfører en ændring af χ2 statistikken på 29,51. Ved 18 frihedsgraden (=

Δdf) i en χ2 fordeling svarer det til en p-værdi på 0,042. Herudfra synes der at gælde en usikker

konklusion i forhold til både en fastholdelse og afvisning af H0: τW =τP. Derfor må vurderingen

primært ske ud fra de anvendte fit index. Her ses det, at disse index kan beskrives som stort set

uændrede og fortsat inden for normalt etablerede grænser herfor. Af den grund antages der passende

statistisk evidens for fuld skalar invarians. I den forbindelse kunne det ydermere påvises, at partiel

skalar invarians tydeligt vil være gældende ud fra χ2 statistikken hvis lighedsbegrænsningerne for en

række intercepts var relakseret. Under alle omstændigheder er det således meningsfuldt at fortsætte

analysen ved at neste en relevant model. På baggrund af de stort set uændrede fit index, vil denne

model være modellen for fuld skalar invarians. Via ovenstående analyse er der således påvist strong

factorial invaraince (jf. Hair m.fl., 2006) / measurement invariance in a narrower sense (jf. Byrne m.fl., 1989). Herudfra vil der nu testes for strukturel invarians i form af ækvivalente

faktor varianser og kovarianser. Som det første testes der her for full invariance of factor variances:

Side 65 af 101

Tabel 5.1.3. χ2 test statistikker samt fit index ved model for full scalar invariance

Page 66: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

χ2(df) = 518,54 (378)   Δ χ 2(Δdf) = 2,95 (2)   p = 0,228Root Mean Square Error of Approximation (RMSEA)= 0,025Comparative Fit Index (CFI) = 0,955Tucker Lewis Index (TLI) =     0,951

Kilde: som tabel 5.1.1.

Testet for fuld invarians for faktor varianser er test af ækvivalensen for samtlige af modellens

latente variables varianser (ϕ jjG¿ på tværs af grupper – dvs. et test af følgende nulhypotese:

H0: ϕ jjW=ϕ jj

p

Udgangspunktet er således en antagelse om ens varianser for de to latente faktorer: EB og MB, på

tværs af web og PAPI. Statistisk testes denne hypotese ved at pålægge en lighedsbegrænsning for

diagonalerne i matrixerne af faktor varianser og kovarianser – phi matrixerne ϕ jjG. Jf. Baumgartner

m.fl. (1998) kan denne test fortolkes som test af mulige forskelle i homogeniteten for de latente

faktorer / constructs mellem grupperne. Af ovenstående tabel fremgår en ændring af χ2 statistikken

på 2,95 ift. modellen for fuld skalar invarians, hvilket ved de 2 yderligere frihedsgrader medfører en

p-værdi på 0,228. Herudfra er der betydelig evidens for fastholdelsen af nulhypotesen. Denne

konklusion understøttes også af de tilhørende fit index, hvis ændringer er meget begrænsede.

Eksempelvis er det åbenlyst at opstillingen af konfidensintervaller for RMSEA for denne samt tidl.

model vil være overlappende. Der vurderes derfor at gælde fuld ækvivalens for de to faktorers

varianserne, hvorudfra der nu vil testes for full invariance of factor covariances:

χ2(df) = 519,61 (379)   Δ χ 2(Δdf) = 1,21 (1)   p = 0,271Root Mean Square Error of Approximation (RMSEA)= 0,025Comparative Fit Index (CFI) = 0,953Tucker Lewis Index (TLI) =     0,951

Side 66 af 101

Tabel 5.1.4. χ2 test statistikker samt fit index ved model for full invariance of factor variances

Tabel 5.1.5. χ2 test statistikker samt fit index ved model for full invariance of factor covariances

Page 67: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Kilde: som tabel 5.1.1.

Test af fuld invarians af faktor kovarianser implicerer et statistisk test af ækvivalente kovarianser (

ϕ jkG ¿ for modellens latente variable på tværs af grupperne – dvs. test af følgende hypotese:

H0: ϕ jkW=ϕ jk

p

Initialt antages der således ens kovarianser mellem de to latente variable / constructs EB og MB på

tværs af web og PAPI modes. Ved den tilhørende statistiske test pålægges en lighedsbegrænsning

for de subdiagonal elementer i matrixerne af faktor varianser og kovarianserϕ jkG . En sådan test svarer

til test af ækvivalente associationer mellem constructs på tværs af grupperne. Disse kovarianser

mellem constructs har bl.a. betydning for deres mening / validitet (Cronbach, 1955) – ikke mindst

ift. deres nomologiske validitet. Uens kovarians mellem EB og MB på tværs af de to modes kan

således betvivle, hvorvidt disse constructs har samme mening i grupperne (Maxwell m.fl., 1985).

Testet har da betydning for graden af construct sammenlignelighed mellem grupper jf. Little (1997).

Marsh m.fl. (1985) noterer i den forbindelse, at ens faktor varianser forudsætter, at ens kovarianser

kan tolkes som ens korrelationer, hvorfor test herfor først blev implementeret. Af ovenstående tabel

ses resultatet af fixing for målemodellens ene kovarians til at være en ændret χ2 stat. på 1,21,

hvilket ved 1 frihedsgrad svarer til en p-værdi på 0,271. Endvidere fremgår stort set uændrede fit

statistikker. Herudfra er der kraftig statistisk evidens for nulhypotesen omkring fuld ækvivalens for

faktor kovarianser, som jf. sidste test også er ækvivalens for faktor korrelationer.

Ud fra ovenstående test vedr. fuld ækvivalens for faktor varianser og kovarianser, er der herved

etableret betydelig statistisk evidens for strukturel ækvivalens mellem web og PAPI modes – dvs.

samme heterogenitet for de latente variable EB og MB samt ens korrelationer herimellem. Ud fra

anbefalinger i Baumgartner m.fl. (1998) samt det faktum, at der tidl. blev etableret fuld metrisk og

skalar invarians, vil der nu foretages test af en nested model for fuld invarians af latent means:

χ2(df) = 520,46 (381)   Δ χ 2(Δdf) = 0,85 (2)   p = 0,653Root Mean Square Error of Approximation (RMSEA)= 0,026Comparative Fit Index (CFI) = 0,953

Side 67 af 101

Tabel 5.1.6. χ2 test statistikker samt fit index ved model for full invariance of latent means

Page 68: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Tucker Lewis Index (TLI) =     0,951

Kilde: som tabel 5.1.1.

Testet af fuld invarians af latente means omfatter et statistisk test af ækvivalensen for modellens

latente means (κG ¿ på tværs af grupper – dvs. et test af følgende nulhypotese:

H0: κW=κP

Udgangspunktet er antagelsen om ens means for målemodellens to latente variable: EB og MB på

tværs af web og PAPI. Statistisk implementeres testet ved at pålægge en lighedsbegrænsning for

kappa vektorerneκG på tværs af grupperne. Der testes således for ækvivalente forventede værdier

for EB og MB på tværs af de to modes. Datagrundlaget herfor er deres respektive indikator variable,

hvorfor antagelsen om metrisk og skalar invarians må være opfyldte (fx Maxwell m.fl. 1985). I den

forbindelse antages der således ikke zero item intercepts og zero latent means, som det er tilfældet i

visse analyser, hvor det primært er the covariance part of the model som er i fokus (Bollen, 1989).

Af ovenstående tabel fremgår meget klar statistisk evidens for ækvivalente latent means på tværs af

web og PAPI. Ændringen i χ2statikken er på 0,85, hvilket ved 2 frihedsgrader svarer til en p-værdi

på 0,653 – dvs. en meget klar fastholdelse af nulhypotesen. Denne konklusion gælder også ud fra de

anvendte tre fit index, hvor CFI og TLI kan beskrives som uændrede, mens RMSEA stiger i et

ganske negligerbart omfang. Der vurderes derfor at gælde ækvivalente latente means for de to

constructs moralistic og egoistic bias på tværs af web og PAPI modes – svarende til ens forventede

værdier. Afslutningsvist vil der herudfra testes for full invariance of error variances:

χ2(df) = 563,57 (401)   Δ χ 2(Δdf) = 43,11 (20)   p = 0,002Root Mean Square Error of Approximation (RMSEA)= 0,034Comparative Fit Index (CFI) = 0,941Tucker Lewis Index (TLI) =     0,933

Kilde: som tabel 5.1.1.

Side 68 af 101

Tabel 5.1.7. χ2 test statistikker samt fit index ved model for full invariance of error variances

Page 69: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Test for fuld invarians af error varianser har til formål at teste ækvivalensen for error varianserne

(Θ¿¿G)¿ associeret med residualerne for modellens indikatorvariable – dvs. test af følgende

hypotese:

H0: Θ jjW =Θ jj

P

Initialt antages det herudfra, at der gælder ækvivalente error varianser for SDR målemodellens 20

indikatorvariable på tværs af web og PAPI modes. Ved den relevante statistiske test pålægges en

lighedsbegrænsning for elementerne i diagonalen for matrixerne af error varianser og kovarianser

Θ jjG på tværs af grupperne. Denne test kan således fortolkes som en test af ækvivalente measurement

errors for de 20 indikatorvariable på tværs af de to modes. I den forbindelse blev der tidligere påvist

fuld metrisk invarians samt invarians for faktor invarianser, hvorfor en eventuel ækvivalens for

error varianser vil kunne tolkes som ens reliabiliteter for de to gruppers indikatorvariable (Maxwell

m.fl., 1985 & Baumgartner m.fl. 1998). Af tabel 5.1.7. fremgår en χ2statik på 563,57 – svarende til

en ændring på 43,11 ift. modellen for fuld invarians for latent means. Ud fra stigningen på 20

frihedsgrader opnås en p-værdi på 0,002 – dvs. en klar afvisning af udgangspunktet omkring

ækvivalente error varianser. Dette resultat nås også via de tre fit index, som alle forværres i

betydelig grad – herunder et faldt i CFI på over 0,01. Det synes herved ikke rimeligt at antage fuld

invarians for indikatorvariablenes error varianser. Som tidligere vil det i stedet testes for en partiel

version af den undersøgte ækvivalens – dvs. i dette tilfælde partiel invarians for error varianser:

χ2(df) = 539,55 (391)   Δ χ 2(Δdf) = 19,09 (10)   p = 0,039Root Mean Square Error of Approximation (RMSEA)= 0,029Comparative Fit Index (CFI) = 0,949Tucker Lewis Index (TLI) =     0,948

Kilde: som tabel 5.1.1.

Relakseres lighedsbegrænsningen for 10 error varianser (5 ved henholdsvis EB og MB), ændres χ2

statikken med 19,09 i forhold modellen, som den er nestet ud fra. Ved 10 frihedsgrader opnås da en

Side 69 af 101

Tabel 5.1.8. χ2 test statistikker samt fit index ved model for partial invariance of error variances

Page 70: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

p-værdi på 0,039, hvorved der svagt kan argumenteres for en afvisning af nulhypotesen vedr. partiel

invarians. Denne konklusion vælges imidlertid ikke på baggrund af ændringerne i fit index. Det ses

i den forbindelse, at alle tre index kun ændres marginalt inden for de normalt etablerede grænser. Af

den grund argumenteres der for partiel ækvivalens for error varianser, hvilket er tjekket via flere

følsomhedsanalyser, hvor andre error varianser er valgt fixet – med samme resultat til følge. Der er

således evidens for ens reliabilitet for indikatorvariable på tværs af de to modes.

5.2. Diskussion og kritik af resultater

Dette afsnits centrale resultat er de mange fastholdelser af nulhypoteserne vedrørende forskellige

typer måle- og strukturel ækvivalens på tværs af modes. Der er da megen statistisk evidens for, at

social desirability responding (i form af EB og MB) gælder i samme omfang på tværs af web og

PAPI. Ud fra klassisk test teori synes der passende belæg for at kunne betegne de to modes som

parallele tets i forhold til målingen af SDR ud fra Paulhus (1988) BIDR items. Der kan her

argumenteres for samme grad af construct validitet og reliabilitet på tværs af modes, hvilket

eksempelvis kan udledes af testet for partiel ækvivalente error varianser, som implicerer belæg for

ens reliabiliteter for indikatorvariable. Om end der kan gælde samme validitet og reliabilitet på

tværs af modes, forudsætter mode ækvivalensens fortolkning i relation til SDR, at dette construct

rent faktisk er det som er målt – dvs. opfyldelsen af construct validitet. På baggrund af fit index

(med acceptable værdier) samt det faktum, at BIDR anses som en gennemtestet valid skala, synes

denne fortolkning i termer af SDR rimelig. Årsagen til valget af denne skala var også validiteten af

fortolkninger i termer af constructet SDR for de tilhørende MGCFA analyseresultater.

Et centralt spørgsmål er vedr. linket mellem SDR og miljømæssig ansvarlig forbrugeradfærd.

Eneste direkte link mellem SDR og miljømæssig ansvarlig forbrugeradfærd er, at deres tilhørende

BIDR og ECOSCALE items er placeret i samme spørgeskemaer. Der foretages således ingen

statistiske analyser, hvor disse items estimeres sammen. Initialt var det dog formålet at foretage en

strukturel ligningsmodellering (SEM) ud fra en strukturel model givet ved de 5 constructs for

miljømæssig ansvarlig forbrugeradfærd og de 2 constructs for SDR. Herudfra kunne førstnævnte

modelleres som endogene constructs forklaret ved de to eksogene SDR constructs ved en multi

group SEM (MGSEM). Fordelen ved MGSEM er muligheden for direkte at kunne henføre forskelle

el. ligheder ved SDR til at gælde i konteksten miljømæssig ansvarlig forbrugeradfærd. Via

manglende skalar invarians identificeret i kapitel 4 er den analyse imidlertid ikke vurderet

Side 70 af 101

Page 71: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

fordelagtig gennemført, idet resultaternes validitet ville være tvivlsom. Derfor må lighederne for

SDR mellem web og PAPI tolkes mere generelt – dvs. generelt gældende ved måling ved web og

PAPI og heraf evt. også ved miljømæssig ansvarlig forbrugeradfærd. Linket herimellem synes

imidlertid delvist gældende ud fra spørgeskema teori / forskning. Det skyldes, at ECSOCALE items

er placeret før BIDR items. Megen forskning tyder i den forbindelse på, at svar på givne items er

påvirket af spørgeskemaets øvrige items og rækkefølgen heraf jf. Lietz (2010). Herudfra synes der

at være et ikke målbart link mellem SDR og miljømæssig ansvarlig forbrugeradfærd, idet SDR er

placeret i en kontekst af ECOSCALE items. Herudfra kan der argumenteres for, at SDR

homogeniteten konkret gælder i en miljømæssig kontekst. Dette kompenserer delvist for den

manglende statistiske ”sammenkobling” af disse items og deres eventuelle sammenhænge.

Den sandsynliggjorte ækvivalens må fortolkes mere præcist i et teoretisk perspektiv. Dette gøres via

Paulhus (2002) two-tier system. Der skelnes her mellem egoistic og moralistic bias, hvilket

understøttes i rapportens data, hvor deres kovarians er insignifikant (p>>0,05) ved begge modes.

Det resultat er ikke overaskende, da de to BIDR underskalaer beskrives som ortogonale (fx Paulhus

1991). Jf. De Jong m.fl. (2010) vil disse to skalaer primært måle ubevidst SDR under anonyme

forhold (s. 201). Ækvivalensen ved web og PAPI vil da hovedsageligt være ækvivalens for ubevidst

EB og MB – dvs. self-deceptive enhancement og self-deceptive denial (jf. figur 2.2.2.). Dette). En

sådan fortolkning synes rimelig, idet der ved rapportens web og PAPI dataindsamling ikke har

været incitament til impression management ud fra undersøgelsens anonymitet – dvs. ingen

tilskyndelse til at ”look good” over for en forsamling. På den anden side har der været kilder til

begge typer self-deceptive SDR – dvs. ud fra begge content levels (agency / communion). SDE,

givet ved agentic værdier, kunne gælde ved items om miljømæssig viden (Q_14-15). SDD, givet

ved communion værdier, kunne gælde ved items om miljømæssige adfærd (Q_23-31). I den

forbindelse synes der flest items, som kunne medføre SDD. Via manglede relation / modellering til

den fokale skala (ECOSCALE) er det imidlertid ubesvaret, hvorvidt SDR reelt er et problem.

Metodisk gælder samme overvejelser som i afsnit 4.4. vedr. eventuel sampling og non-response

bias. Et yderligere kritikpunkt kunne være den PAPI dataindsamling som ikke vil kunne genfindes i

de fleste videnskabelige og kommercielle PAPI surveys. Imidlertid afhænger ovenstående

fortolkning primært af undersøgelsens anonymitet, hvilket i høj grad gælder ved denne rapports

survey. Således vurderes dette punkt ikke relevant ved målingen / konklusionen ift. SDR. Metodisk

Side 71 af 101

Page 72: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

synes anvendte statistiske teknikker en betydelig styrke ved denne rapport. MGCFA vurderes som

en langt mere kraftfuld teknik en fx bivarate korrelationer el. ANOVA. Særligt fortolkningen af

bivarate korrelationer mellem de to BIDR faktorer og faktorerne i den fokale skala har været et

kritikpunkt af mange hidtidige metodiske dispositioner ved SDR (De Jong m.fl., 2010). Styrken ved

MGCFA er også validitet, idet etableringen af mode måleækvivalens sikrer, at gennemførte

sammenligninger overhovedet er meningsfulde. Dette antages implicit ved eksempelvis ANOVA.

Afslutningsvist må opfyldelsen af de statistiske forudsætninger for MGCFA også kort vurderes i

forhold til dette afsnits modellering. På baggrund af test i AMOS 6.0. fastholdes nulhypotesen om

multivariate normalitet (ved p-værdi >0,05) – dvs. H0: U N (μ , Σ ), hvor U er givet ved vektoren

[Q32 , Q33 .. Q51 ]. Denne fastholdelse var også forventelig ud fra de mål for skævhed og kurtoisis som

direkte kunne observeres for disse enkelte variable (jf. bilag 7). Endvidere er der ud fra

Mahalanobis distance ikke fundet væsentlige tegn på outliers og ved følsomhedsanalyser, hvor

disse undlades ændres analysens resultater ikke i et betydeligt omfang. Der vurderes herudfra ikke

at gælde væsentlige problemer med forudsætningsbrud ved anvendte statistiske teknik. For AMOS

output er der også tjekket for infeasible løsninger, hvilket ikke medførte nogen identifikation. Dette

tolkes som om, at modellen ikke er misspecificeret i et betydeligt / alvorligt omfang.

5.3. Delkonklusion

Ved målingen af de to SDR constructs: egoistic og moralistic bias ud fra Paulhus (1988) BIDR

items blev der i dette kapitel sandsynliggjort høj grad af måleækvivalens mellem web og PAPI

modes i form af fuld invarians for strutkurer, loadings og intercepts samt partiel invarians for error

varianser ved den tilhørende SDR målemodel. Derudover blev der påviste homogene latente means

samt strukturel ækvivalens i form af fuld invarians af faktorer varianser og faktor kovarianser. På

baggrund af disse meget entydige statistiske resultater må nulhypotesen etableret i første kapitel H2

vedrørende samme omfang af SDR mellem web og PAPI klart fastholdes. Denne fastholdelse

styrkes desuden af det faktum, at der er anvendt en meget valid skala – tidl. påvist samt også

indikeret i rapportens data. Desuden synes det tilfældet, at de statistiske forudsætninger for MGCFA

er opfyldt i et passende omfang. På baggrund af de anonyme forhold ved både PAPI og web, kan

lighederne primært tolkes i termer af self-deceptive enhancement og self-deceptive denial – dvs.

Side 72 af 101

Page 73: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

ubevidste former for SDR. Et ubesvaret spørgsmål er imidlertid disse resultaters link til constructet

miljømæssig ansvarlig forbrugeradfærd, da dette er målt ud fra en særskilt skala.

6. Respons styles ved måling af miljømæssig ansvarlig forbrugeradfærd

I dette kapitel vil det analysere, hvorvidt forskellige typer response styles (RS) måtte gælde i samme

omfang på tværs af web og PAPI survey modes. Af den grund gennemføres en multi-gruppe

konfirmativ faktoranalyse med det formål at identificere eventuelle forskelle ved målemodellen for

RS foreslået af Wiejters (2006). Det vil da undersøges, om der på tværs af web og PAPI modes

gælder et forskelligt omfang af denne form for non content-based responding / measurement error.

6.1. Etablering af målemodel

Det fokale construct response style vil nærmere operationaliseres til de fire typer: acquiescence,

disacquiescence, extreme og midpoint response style (ARS, DRS, ERS og MRS). I den forbindelse

tages der udgangspunkt i målemodellen introduceret som en del af doktordisputatsen af Wiejters

(2006). Kapitels survey mode sammenligning foretages således ud fra nedenstående model:

Side 73 af 101

Φ1,4

Φ2,4Φ1,3

Φ1,2 Φ3,4Φ2,3

λc, 4λc, 3λc, 2λc, 1 λa ,4λa ,3λa ,2λa ,1

1:ARS 4: MRS

Figur 5.1. Wiejters målemodel for response styles – ARS, DRS, ERS og MRS

2:DRS 3:ERS

Page 74: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Kilde: egen tilvirkning ud fra Wiejters (2006, s. 139-178)

Ved ovenstående model gælder multi-indicator multi-method factor measurement, - dvs. simultan

estimation og måling af de fire typer RS. I bl.a. Podsakoff m.fl. (2003) argumenteres der for

fordelene ved denne tilgang frem for single indicators og/eller single method factors. For det første

kan der ved sidstnævnte tilgang være RS, som ikke opdages. For det andet skal der gælde

måleækvivalens på tværs af modes for, at RS typerne meningsfuldt kan sammenlignes, hvilket

netop kan testes ved MGCFA for valgte model. Her kan der også direkte kontrolleres/korrigeres for

målefejl. Generelt er mange af CFA egenskaberne argumentation for valgte model – fx modellering

af unikke varianser for indikatorerne, idet kun den delte varians er relevant for analysen. I modellen

er der også tilladt korrelation mellem indikatorer beregnet ud fra samme items (fx ARS_a og

DRS_a). Kombineret med den tilladte korrelation mellem de fire RS faktorer (Φa ,b), opnås brugbare

estimater for korrelationerne mellem de fire RS faktorer og derved ikke blot de mindre brugbare

korrelationer mellem RS indikatorerne (Wiejters, s. 147). Disse 12 RS indikatorer er opnået ud fra

formlerne foreslået og anvendt i Bachman m.fl. (1984), Hui m.fl. (1985) Baumgartner m.fl. (2001):

ARS¿ ij=1∗f (4 )+2∗f (5)

k i(1)

DRS ¿ij=2∗f (1 )+1∗f (2)

k i(2)

Side 74 af 101

λb ,4λb ,3λb ,2λb ,1

ARS_b MRS_cMRS_bDRS_a DRS_b ERS_a

δ c 3 δ a 4

Survey mode

DRS_c ERS_b ERS_c MRS_aARS_cARS_a

δ a1 δ b 1 δ c 1 δ a 2 δ b 2 δ c 2 δ a3 δ b 3 δ b 4 δ c 4

Page 75: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

ERS ¿ij=f (1 )+f (5)

k i(3)

MRS ¿ij=f (3 )k i

(4)

hvor f ( ο )=frekvensen af svarmulighed ο

og ο=1 (meget uenig ) , 2¿delvist uenig), 3(neutral), 4(delvist enig) ∨ 5(meget enig)

For en given respondent j beregnes en RS indikator da ud fra itemsættet i indeholdende k forskellige

items. Datagrundlaget for disse matematiske transformationer har været de 31 items i ECOSCALE

(2009). Ud fra anbefalingerne i Wiejters (2006) er der via simpel tilfældig udvælgelse dannet 3 sæt

af items med henholdsvis 10,10 og 11 styk5. En normal forudsætning for analysen af RS er høj item

heterogenitet. Det skyldes, at der undersøges for non content-based responding, hvorved

homogene / relaterede items kan medføre svar, som i stedet er content-based (Greenleaf, 1992).

Effekten af RS kan da være vanskelig at isolere. I forhold til de 31 ECOSCALE items synes denne

forudsætning at kunne være problematisk. I kapitel 4s EFA fremgik mange meningsfulde

korrelationer, - særligt for målemodellens 16 indikatorvariable. Desuden er skalen udviklet inden

for et givet tema i form af miljømæssig ansvarlig forbrugeradfærd. Herudfra gælder således

forholdsvis homogene items. På den anden side blev hele 15 items iterativt frasorteret i EFA. Dette

skyldes primært deres lave korrelationer med de 5 common factors samt de øvrige potentielle

indikatorvariable. Dette faktum indikerer omvendt en vis heterogenitet / non content-based svar for

de 31 ECOSCALE items. Den randomiserede skabelse af item sæt sikrer desuden, at en lang række

svagt relaterede items sættes sammen. Herudfra vurderes det rimeligt at fortsætte analysen af de fire

typer RS på tværs af modes.

5 Sæt a: q_2, q_6, q_9, q_11, q_14, q_15, q_16, q_26, q_28, & q_30; sæt b: q_4, q_5, q_7, q_13, q_18, q_20, q_21,

q_23, q_27 & q_29; sæt c: q_1, q_3, q_8, q_10, q_12, q_17, q_19, q_22, q_24, q_25 & q_31.

Side 75 af 101

Page 76: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Tabel 6.2.2. χ2 test statistikker samt fit index ved model for full metric invariance

6.2. Survey mode sammenligning

I dette kapitel er det primære formål at sammenligne web og PAPI i forhold til ARS, DRS, ERS og

MRS. Det ønskes således en sammenligning ud fra de fire latente variable i Wiejters målemodel for

RS – dvs. en sammenligning af means og varianser for disse constructs. En sådan sammenligning er

imidlertid betinget af måleækvivalens i form af invariante strukturer, faktor loadings og item

intercepts (fx Baumgartner m.fl., 1998). Initialt må der derfor foretages en test af relevante nestede

modeller herfor. Jf. anbefalingerne i bl.a. Brown (2006) testes der først for configural invariance:

χ2(df) = 417,06 (334)   p = 0,001Root Mean Square Error of Approximation (RMSEA)= 0,022Comparative Fit Index (CFI) = 0,984Tucker Lewis Index (TLI) =     0,981

Kilde: egen tilvirkning ud fra beregninger i SPSS AMOS 6.0 (se bilag 6)

Af ovenstående tabel fremgår som forventet en afvisning af udgangspunktet omkring ens strukturer

på tværs af modes i form af en p-værdi på 0,001 ud fra χ2test statikken på 417,06 ved 334

frihedsgrader. Denne konklusion er imidlertid ikke understøttet af de tre fit index. CFI og TLI

antager begge meget høje værdier, hvorimod RMSEA er på et lavt niveau. Herudfra vurderes der

klart at gælde passende statisk evidens for configural invariance. Derudover er disse index

indikation på meget høj grad af fit for Wiejters målemodellen (ligesom i hans oprindelige disputats,

jf. s. 156). Det vurderes således rimeligt, at der tages udgangspunkt i denne model i den videre

analyse, hvor følgende nestede model angiver restriktioner svarende til fuld metrisk invarians:

χ2(df) = 434,18 (342)   Δ χ 2(Δdf) = 17,12 (8)   p = 0,029Root Mean Square Error of Approximation (RMSEA)= 0,023Comparative Fit Index (CFI) = 0,984Tucker Lewis Index (TLI) =     0,980

Side 76 af 101

Tabel 6.2.1. χ2 test statistik samt fit index ved model for configural invariance

Page 77: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Tabel 6.2.3. χ2 test statistikker samt fit index ved model for full scalar invariance

Tabel 6.2.4. Latente means, standard errors, effect sizes samt t test statistikker

Kilde: som tabel 6.2.1.

Ved testet af nulhypotesen omkring fuld metrisk invarians på tværs af de to modes (H0: ΛW =ΛP)

fremgår en ændring af χ2statikken på 17,12, hvilket ved de 8 yderligere frihedsgrader medfører en

p-værdi på 0,029. Fuld metrisk invarians kan herudfra synes tvivlsomt. På den anden side er de tre

fit index stort set uændrede, hvorfor der vurderes passende evidens til at kunne fastholde

nulhypotesen - svarende til ækvivalente faktor loadings / metrik på tværs af modes. Ud fra denne

konklusion er det meningsfuldt at foretage en test af en nestet model for fuld skalar invarians:

χ2(df) = 453,26 (350)   Δ χ 2(Δdf) = 19,08 (8)   p = 0,014Root Mean Square Error of Approximation (RMSEA)= 0,025Comparative Fit Index (CFI) = 0,982Tucker Lewis Index (TLI) =     0,979

Kilde: som tabel 6.2.1.

Ved pålægning af en lighedsbegrænsning for tau vektorerne τG på tværs af de to modes opnås en

ændret χ2statistik på 19,08, hvilket implicerer en p-værdi på 0,014 ved 8 frihedsgrader. Der synes

således ikke evidens for ækvivalente item intercepts på tværs af PAPI og web ud fra denne

statistiske test. Igen er det imidlertid tilfældet, at de anvendte fit index stort set har et uændret

niveau. Dette vurderes i et omfang, som gør det rimeligt at fastholde nulhypotesen om fuld skalar

invarians (H0: τW =τP). På baggrund af den foregående tests sandsynliggørelse af fuld metrisk

invarians, vil det da være meningsfuldt at teste for ækvivalensen af latente means:

                 PAPI Web

  Mean s.e.   Mean s.e. E.S. t pARS 0,431 0,026 0,392 0,024 -1,55 -16,43 << 0,05DRS 0,505 0,039 0,503 0,037 -0,05 -0,53 > >0,05ERS 0,359 0,023 0,353 0,022 -0,18 -1,91 >0,05MRS 0,192 0,016   0,196 0,017 0,17 1,80 >0,05

Side 77 af 101

Page 78: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Tabel 6.2.5. χ2 test statistikker samt fit index ved model for full invariance of factor variances

 Kilde: egen tilvirkning og beregning af p via: http://keisan.casio.com/has10/SpecExec.cgi

Ovenstående tabel angiver resultaterne af statistiske tests for invarians af latente means. Disse er

implementeret i form af fire særskilte tests af ækvivalensen for modellens latente means, E (ξiG ), på

tværs af web og PAPI modes. Der er således tale om enkeltvise test af følgende fire nulhypoteser:

H0: E ( ARSW ) =E ( ARSP ) , E ( DRSW ) =E ( DRSP ) , E ( ERSW ) =E ( ERS P )∧ E ( MRSW ) =E ( MRSP )

Initialt antages ens forventede værdier for de fire RS faktorer på tværs af web og PAPI. Statistisk

testes disse hypoteser ikke som tidligere simultant, men derimod enkelvist. I den forbindelse er der

taget udgangspunkt i effect size estimation via Hedges g, givet ved følgende formel og fordeling:

g=κ i

W−κip

√ ϕ iiW+ϕ ii

P

2

hvor g ∙√ ( n1 n2 )n1+n2

T n1+n 2−2(√ (n1 n2 )/(n1+n2)θ)

Hedges g er en estimator af populationens effect size θ(jf. Hedges, 1981) og kan fortolkes som

differencen mellem to givne latente means (κ iG¿ i termer af deres standardafvigelser. Ved gussian

fordelte data følger utrykket g ∙√(n1n2 ) /(n1+n2) en ikke central t-fordeling med antal frihedsgrader

lig summen af de to stikprøvestørrelser – 2 og med ikke centralitets parameteret √ (n1 n2 )/(n1+n2)θ.

Med udgangspunkt i disse sammenhænge er effekt sizes estimeret og t-statistikker samt p-værdier i

den relevante ikke centrale t-fordeling med 450 frihedsgrader beregnet.

Ved ARS er der estimeret en effect size på -1,55, hvilket ved en ikke central t-fordeling med 450

frihedsgrader giver en p-værdi tæt på 0 ud fra en t-statistik på -16,43. Via de estimerede means for

ARS ses det, at den forventede værdi af denne faktor er signifikant højere ved PAPI end for web –

dvs. signifikant mere acquiescence response style for denne mode. For DRS er der estimeret en

effect size på -0,05 – dvs. reelt 0. Den tilhørende t-statistik på -0,53 kunne dermed være undladt idet

p-værdier herfor vil være tæt på 1. I rapportens data er der således klar indikation på et ækvivalent

omfang af disacquiescence response style. Ved ERS og MRS er der estimeret g effect sizes på

henholdsvis -0,18 og 0,17 svarende til t-statistikker på -1,91 og 1,80. Med 450 frihedsgrader i en

ikke central t-fordeling og en tosidet hypoteseformulering (jf. manglende studier / teori om en

eventuel retning herfor) medfører det p-værdier et stykke over den normale kritiske værdi på 0,05.

Side 78 af 101

Page 79: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Tabel 6.2.6. χ2 test statistikker samt fit index ved modeller for test af fuld invarians af faktor kovarianser og fuld samt partiel invarians af error varianser

Der kan herved ikke etableres tilstrækkeligt statistisk evidens for et uens omfang af extreme og

midpoint response styles på tværs af modes. Et relateret spørgsmål er da, om der gælder samme

heterogenitet for de 4 RS faktorer, hvorfor et test for invariance of factor variances foretages:

χ2(df) = 458,38 (354)   Δ χ 2(Δdf) = 5,12 (4)   p = 0,275Root Mean Square Error of Approximation (RMSEA)= 0,026Comparative Fit Index (CFI) = 0,982Tucker Lewis Index (TLI) =     0,978

Kilde: som tabel 6.1.1.

Af ovenstående tabel ses en ændring af χ2statikken på 5,12 i forhold modellen for fuld skalar

invarians. Ved de yderligere 4 frihedsgrader giver det en tilhørende p-værdi på 0,275 – dvs. en klar

fastholdelsen af nulhypotesen omkring homogene varianser for de fire RS faktorer (H0: ϕ jjW=ϕ jj

p).

Denne sikre konklusion supporteres ud fra de tre fit index, som er stort set uændrede og fortsat klart

inden for de normalt etablerede fit grænser (fx Hair m.fl., 2006). I forhold til faktorerne ARS, DRS,

ERS og MRS gælder derfor meget kraftig evidens for deres ækvivalente grad af heterogenitet

mellem modes. Via de rapporterede standard errors i tabel 6.2.1. er denne konklusion imidlertid

ikke overraskende, idet disse fremstår at være meget ens. Det da udelukkende niveauet for ARS

faktoren, som er forskellig mellem de to modes i forhold sammenligningerne af de 4 RS faktorer. I

analysen i Wiejters (2006) søges der skabt evidens for metrisk og skalar invarians, således at en

sammenligning af latente means kunne foretages. Det er også det primære formål i dette kapitel,

men der vil dog kort testes nestede modeller for invarians af faktor kovarianser og error varianser,

idet den vil kunne styrke grundlaget for den efterfølgende diskussion / perspektivering af resultater.

           

  χ2(df) Δ χ 2(Δdf) p RMSEA CFI TLI

Side 79 af 101

Page 80: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Fuld invarians af faktor kovarianser 491,23 (360) 5,85 (6) 0,440 0,028 0,981 0,976

Fuld invarians af error varianser

522,31 (372) 31,08 (12) 0,002 0,042 0,962 0,952

Partiel invarians af error varianser

511,01 (366) 19,78 (6) 0,003 0,038 0,968 0,954

Kilde: som tabel 6.1.1.

Ved modellen for fuld invarians af faktor kovarianser ses en ændring i χ2 statistikken på 5,85

sammenlignet med den for fuld invarians af faktor varianser. Ved de yderligere 6 frihedsgrader

svarer det til en p-værdi på 0,440 – dvs. en klar fastholdelse af nulhypotesen om ens korrelationer /

associationer mellem modellens RS faktorer (ϕ jkW=ϕ jk

p ). Denne klare konklusion underbygges også

af de 3 fit indexs uændrede niveauer. Nestes denne model for fuld invarians af kovarianser ved at

pålægge lighedsbegrænsninger for alle modellens error varianser opnås da en model for fuld

invarians af error varianser. Ved denne model ses imidlertid en p-værdi langt under grænsen på 0,05

samt fit index med ikke negligerbare forværringer – eksempelvis et fald i CFI på over 0,01. Af den

grund blev halvdelen af begrænsningerne relakseret, hvorved der blev testet for partiel invarians.

Ved denne model fremgik imidlertid stadig en meget lav p-værdi samt betydeligt forværrede fit

index, hvorfor nulhypotesen om ækvivalens for error varianser må afvises (H0: Θ jjW =Θ jj

P).

6.3. Diskussion og kritik af resultater

Dette afsnits centrale resultat er sandsynliggørelsen af samme omfang DRS, MRS og ERS men en

forskellig grad af ARS på tværs af modes. Spørgsmålet er da, om disse resultater kan tolkes ift.

response styles. Som omtalt i starten af afsnittet kan den tolkning være problematisk ud fra de

meningsfulde mønstre i data. Ud fra observationer ved omdelingen af PAPI samt oplyst tidsforbrug

ved web, synes hovedparten af respondenterne at tage sig passende tid til besvarelse, hvilket kan

give besvarelser ift. indhold. Afsnittets resultater bør dog ikke betragtes invalide at fortolke ud fra

ift. RS, men sandsynligvis præget af andre effekter - ikke mindst en reel content based responding

samt andre kilder til målefejl fx SDR. Statistisk er afsnittets konklusioner præget af betydelig

signifikans – ikke mindst ved testet for uens ARS. Havde der været mulighed for "partial out" af

øvrige effekter, synes det sandsynligt, at der stadig ville fremgå signifikant forskelle ved ARS. I

litteraturen for response styles foreslås det også af visse forfattere, at RS validt kan måles inden for

Side 80 af 101

Page 81: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

samme skala (fx Watson, 1992). Et bedre design ville dog være det som bl.a. er anvendt i Weijters

(2006), hvor der vælges en række heterogene items, hvorved effekten af RS mere tydeligt fremgår. I

denne rapport ville det imidlertid bryde det initiale fokus på miljømæssig forbrugeradfærd.

Afsnittets resultater må også ses i et teoretisk perspektiv. ARS kan jf. McGee (1967) forklares ved

mangel på passende mængde af kognitive ressourcer – fx ved tidspres og forstyrrelser. Ved denne

rapportens web og PAPI dataindsamling kunne det være en mulig forklaring på mode forskelle. Det

skyldes, at der ved PAPI kan argumenteres for tidspres ift. den situation, at det er midt i en

holdundervisning. Derudover kunne man også forstille sig, at respondenterne kunne forstyrre

hinanden i modsætning til web, hvor de må antages at sidde alene og være i mindre grad af tidspres,

idet de selv har indvilget i deltagelse. For øvrige forklaringer på ARS synes der ikke at gælde

oplagte mode forskelle – det gælder fx manglende viden, udadvendte personligheder osv. Det

skyldes ikke mindst, at sådanne kendetegn må forventes udjævnet mellem modes via omtalte

randomisering. I forhold til de tre øvrige typer RS synes deres teoretiske forklaringer (jf. afsnit

2.3.1.) ikke at lægge op til signifikante mode forskelle, hvilket også er understøttet i dette afsnits

resultater. Imidlertid må det noteres, at der gælder megen DRS i data. Forklaringen herpå ud fra

teori kunne bl.a. være indadvendte personlighedstræk, personer som søger kontrol osv. Dette synes

ikke umiddelbart gældende for valgte population, hvorfor resultatet vurderes at være udtryk for item

content – dvs. ikke et reelt udtryk for et betydeligt omfang af DRS ved givne skalas besvarelser.

Et centralt element er linket mellem RS og rapportens fokale construct miljømæssig ansvarlig

forbrugeradfærd – herunder dets målemodel i kapitel 4. Til forskel fra kapitel 5 anvendes i dette

afsnit ECOSCALE items, hvorfor linket synes mere direkte. I forhold til målemodellen gælder det

dog, at kun 16 items indgår, mens analysen i dette afsnit anvender data for alle 31. Således kan dette

afsnits resultater ikke direkte overføres til konklusionerne i kapitel 4. I begge kap. er det centrale

fokus relationen mellem items og constructs, hvor RS evt. er en modererende effekt. Jf. Cheung and

Rensvold (2000) vil ARS påvirke item intercepts (τG) i de regressionsligninger, som forbinder

indikatorer og latente faktorer ( X i=τ i+λ ij ξ j+δ i¿ ved CFA. Resultatet i dette afsnit synes da at

forklare afvisningen af hypotesen om ækvivalente item intercepts i afsnit 4, idet den afvisning kan

være forklaret af dette afsnits påviste forskel i omfanget af ARS mellem modes. Disse analyser er

som nævnt foretaget ud fra forskellige items, men idet konklusionen i dette afsnit er meget klar

samt bl.a. foretaget ud fra de items som indgår i kapitel 4s målemodel, synes en betydelig

Side 81 af 101

Page 82: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

sammenhæng at kunne gælde. Resultaterne kan tolkes som, at RS i form af ARS reelt har en

påvirkning på relationen mellem items og constructs, om end det kunne undersøges mere direkte –

fx via SEM. Desuden ses det, at der gælder højere grad af ARS for PAPI end web. Belæg for a web

da må være bedre / en løsning på omtalte gaps vil imidlertid kræve nærmere undersøgelser.

Metodisk vurderes rapportens simulane estimation af de fire typer RS som en klar styrke ift. mere

simple metoder – fx RS index. Dette styrker alt andet lige validiteten af afsnittes resultater.

Endvidere fremgår der meget klar model fit og kombineret med påvisningen af måleækvivalens er

de centrale sammenligninger af latent means sket ud fra et statistisk hensigtsmæssigt grundlag.

Dette må imidlertid også vurderes ud fra de statistiske forudsætninger ved MGCFA. I den

forbindelse kan der ud fra Mardias test ses evidens for multivariate normalitet via p-værdi >>0,05 –

dvs. en klar fastholdelse af H0: Y N ( μ , Σ ), hvor Y er givet ved vektoren [ ARSa , ARSb .. MRSc ] - dvs.

de beregnede RS indikatorvariable. For disse indikatorer gælder der desuden skævhed og kurtoisis

mål langt under grænserne på 2 og 7 (jf. bilag 7), hvorfor dette var at forvente. I AMOS er der

desuden tjekket for outliers via Mahalanobis distance samt følsomhedsberegninger for obs. med

høje værdier herfor. Disse resultater indikerer ingen betydningsfulde outliers. Desuden fremgår

ingen infeasible løsningselementer ved ML estimationen i AMOS, hvilke tolkes som et svagt tegn

på, at modellen er korrekt specificeret. Generelt antages der således ikke væsentlige problemer med

de gældende forudsætninger ved MGCFA, hvorfor ovenstående tolkninger synes valide.

6.4. Delkonklusion

I kapitel blev der etableret måleækvivalens for Wiejters (2006) målemodellen for ARS, DRS, ERS

og MRS. Herudfra var det meningsfuldt at foretage en sammenligning af disse faktorers means,

hvilket sandsynliggjorde en signifikant mode forskel vedrørende ARS og ingen signifikante

forskelle for de tre øvrige styles. I den forbindelse blev det yderlige påvist at heterogeniteten for

disse faktorer med rimelig kan antages ækvivalent på tværs af modes ligesom deres indbyrdes

korrelationer. Disse konklusioner er foretaget under evidens for opfyldelse af de statistiske

forudsætninger ved MGCFA. Den fra start etablerede hypotese H3 kan således til et vist omfang

afvises på baggrunden af forskellen vedr. ARS. Denne forskel synes desuden til en vis grad at

kunne forklare afvisningen af skalar invarians i kapitels 4s målemodel, om end den er estimeret ud

fra færre items end dette kapitels. En central diskussion er også hvorvidt dette kapitels resultater

overhovedet kan tolkes i termer af respons styles. Om end de ikke er frembragt ud fra et optimalt

Side 82 af 101

Page 83: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

design (meget homogene items), medfører den klare ARS konklusion, at der under alle

omstændigheder synes evidens for respons style forskelle ved denne faktor.

7. Konklusion

I dette afsnit vil der foretages en samlet konklusion i forhold til rapportens besvarelse af

problemformuleringens tre underspørgsmål og de tilhørende hypoteser: H1,H2 og H3.

- Ved måling af miljømæssig ansvarlig forbrugeradfærd ud fra kapitel 4s målemodel blev der

etableret evidens for manglende måleækvivalens i form af forskellige item intercepts på tværs af

modes. H1 hypotesen omkring måleækvivalens mellem web og PAPI må herudfra afvises. Denne

afvisning understøttes af indikation på opfyldelse af de statistiske forudsætninger ved MGCFA samt

brugen af en hensigtsmæssig målemodel. Imidlertid må der tages forbehold for en eventuel

påvirkning af non-respons error på tværs af modes.

Side 83 af 101

Page 84: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

- Ved målemodellen for SDR blev der påvist måle- og strukturel ækvivalens på tværs af modes,

hvorudfra der er sandsynliggjort samme omfang SDR herimellem. H2 hypotesen omkring samme

grad af SDR mellem web og PAPI må herudfra fastholdes. Dette sker ved en meget valid skala og

indikation på opfyldelse af statistiske forudsætninger ved MGCFA. Konkret synes der at gælde

samme omfang ubevidst SDR i form af SDD og SDE. Via manglende simultan estimation er linket

til miljømæssig ansvarlig forbrugeradfærd dog ikke direkte.

- Ved Wiejters målemodellen for RS blev der påvist måleækvivalens, hvorudfra det kunne

sandsynliggøres, at der var signifikant forskel mellem means ved acquiescence response style. Ud

fra en meget sikker konklusion må H3 hypotesen omkring samme grad af RS mellem web og PAPI

afvises. Dette foretages ved en målemodel med høj fit i data samt indikation på opfyldelse af

forudsætningerne ved MGCFA. Via de homogene ECOSCALE items kan det imidlertid diskuteres i

hvor stor en udstrækning, at der reelt er tale om RS.

På baggrund af ovenstående kan det samlet set konkluderes, at der er påvist evidens for forskellige

resultater ved måling af miljømæssig ansvarlighed på tværs af web og PAPI modes. Den manglende

måleækvivalens ved rapportens målemodel synes her at kunne skyldes den signifikante forskel ved

acquiescence response style mellem modes. Hvorvidt der herudfra måtte kunne gælde en gunstig

mode effect / løsning for omtalte gaps vil imidlertid kræve nærmere empiriske undersøgelser.

8. Perspektivering

På baggrund af rapportens resultater og konklusioner vil der afslutningsvist foretages en kort

perspektivering herudfra. Der vil således diskuteres perspektiver, hvor rapportens resultater kan

have en signifikant informationsværdi – såvel kommercielt som videnskabelig.

Jf. Couper (2000) er en type web survey: web option in mixed mode surveys. Herudfra er

spørgsmålet, om den type og generelle mixed mode design bør anvendes i konteksten miljømæssig

ansvarlig forbrugeradfærd – dvs. i hvilket omfang kan data fra forskellige modes lægges sammen

med data indhentet via web. Ud fra denne rapport er det påvist, at det kan være problematisk i

forhold til PAPI. Herudfra må det anbefales, at der initialt undersøges for måleækvivalens ved en

Side 84 af 101

Page 85: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

sådan strategi. Det synes imidlertid mere hensigtsmæssigt at tage udgangspunkt i en konkret mode.

Det skyldes, at håndteringen af flere forskellige modes samtidigt kan være kompleks og

ressourcekrævende. Rapportens resultater viser her, at en sådan strategi tilmed kan medføre data,

som ved sammenlægning udgør en trussel i forhold validitet. Denne diskussion gælder både i et

kommercielt og videnskabeligt perspektiv. Ved førstenævnte er det helt centralt, at der opnås valide

data ved diverse markedsundersøgelser. For sidstnævnte perspektiv er det centralt, at de etablerede

forskningsresultater også har høj validitet. I begge tilfælde må de givne undersøgere således være

varsomme ved mixed modes studies inden for miljømæssig ansvarlig forbrugeradfærd.

Ved sammenligning af web med andre modes har særligt responsrate – risikoen for non-respons

error været undersøgt. Dette har ikke været muligt inden for denne rapports rammer, men dets

resultater er imidlertid underlagt den usikkerhed, at der ud fra de meget forskellige responsrates kan

være effekt af non-respons error. Der er herudfra et behov for en undersøgelse vedr. responsrates

inden for konteksten miljømæssig ansvarlig forbrugeradfærd. Dette vil delvist kunne afdække,

hvorvidt denne rapports konklusion om respons styles i virkeligheden kan tolkes i termer af respons

styles. Det må betones, at der i rapporten kun er undersøgt to typer af kilder to målefejl. Det synes i

den forbindelse oplagt at kunne have undersøgt andre typer, hvilket desuden ikke er gjort tidligere i

den konkrete kontekst vedr. miljø. Disse facts påpeger således, at der fortsat er behov for forskning

inden for miljømæssig ansvarlig forbrugeradfærd i et måleteoretisk / metodisk perspektiv. Som

nævnt er litteraturudviklingen i den metodiske retning ved etisk forbrugeradfærd også ganske

begrænset på nuværende tidspunkt, hvorfor fremtidige bidrag synes at være nødvendige.

Rapportens undersøgelse af SDR bekræfter model fit ift. BIDR på danske data, hvilket også

tidligere er observeret (fx De Jong m.fl., 2010). I alle tilfælde er der blevet undersøgt under

anonyme forhold. Der er således meget begrænsede empiriske resultater i forhold til impression

management i en dansk kontekst ud fra Paulhus BIDR. Inden for survey modes kunne det bl.a.

testes via CATI el. almindeligt face-to-face interview, hvor det må forventes at gælde risiko for, at

den givne respondent giver socialt acceptable svar over for den givne undersøger. I en dansk

kontekst synes denne form for SDR imidlertid at være observeret – fx ved politiske

meningsmålinger, den såkaldte DF måleproblematik. I den forbindelse er det dog ikke konkret

undersøgt med udgangspunkt i SDR teori. Idet SDR er socialt baseret, så synes kvantitative metoder

også at have deres begrænsninger. Ved et nærmere analyse af SDR synes der med fordel at kunne

Side 85 af 101

Page 86: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

anvendes kvalitative metoder, hvor de enkelte respondenter da gav udtryk for deres meninger i en

mere åben facon. Dette synes mest oplagt ved impression management studier, idet self-deception

er givet som ubevidst, hvorfor respondenterne ikke selv er klar herover. Således foreslås det ved

nærmere undersøgelser af SDR i en dansk kontekst og andre lande, at der i visse tilfælde kunne

overvejes triangulering med kval. metoder, såsom fokusgrupper el. semistrukturerede interview.

Ved analysen af response styles blev der påvist en mulig forskel ift. ARS. Dette resultat må først og

fremmest undergå nærmere forskning for at det fuldt ud etableres hvad konsekvensen er i et item-

construct perspektiv. Under antagelse heraf synes resultatet samt den initiale påviste mangel på

måleækvivalens ved miljømæssigt ansvarlig forbrugeradfærd også at være brugbart for den

modelbaserede litteraturretning. Det kunne eksempelvis medtages ved sammenligning af data fra

forskellige survey modes (særligt web og PAPI). Derudover kunne det give anledning til at tjekke

for påvirkningen af respons style ved en given anvendt fokal skala. Det gælder således, at denne

rapports resultater ikke kun bør ses som en del af litteraturudviklingen inden for dens egen retning,

men også som en eventuel løsning / guide for modelleringen i den modelbaserede litteraturretning.

Afslutningsvist kan resultatet vedr. RS også ses i et bredende perspektiv inden for den metodiske

litteratur, hvor der hidtil har været tegn på, at web surveys gave mere ekstreme / afvigende svar.

Dette ses ikke ud fra denne rapport, - derimod gælder det, at PAPI som nævnt har højere grad af

ARS. Dette er i modsætning til hvad man måtte kunne forvente ud fra den hidtidige litteratur.

9. Litteraturliste

A ______________________________________________________________________________

Aavik.T.; Kenn.K. &. Allik.J. (2006),”Social Desirability and Consensuel Validity of Personality Traits,” European Journal of Personality, (20), s. 549-566.

Ajzen, I. (1985), “From intentions to actions: AA theory of planned behavior. In J. Kuhl & Beckman .J. (eds), Action-control: From cognition to behavior” s. 11-39. Umass.edu Icek Ajzen Selected Publications.

Ajzen, I. & Fishbein,M. (1980), “Understanding attitudes and predicting social behavior,” Englewood Cliffs, NJ. Prentice-Hall.

Side 86 af 101

Page 87: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Album.G.; Roster.C.; Wiley.J.; Rossiter.J. &. Smith.S. (2010), “Designing Web in marketing research: Does use of forced Answering Affect Completion Raytes?” Journal of Marketing Theory and Practice, Vol.18, no. 3, s. 285-293.

Andrews.F. (1984), “Construct validity and error components of survey measures: modeling approach,” Public Opinion Quarterly, (48), s. 409-442.

Arbnor.I. &. Bjerke.B. (2009), ”Methodology for Creating Business knowledge,” Saga Publications Inc. 2.udgave.

Arcury. T.A. (1990),“ Environmental Attitudes and Environmental Knowledge.” Human Organization, (49), s. 300-304.

Attala.A.; Carringa.M. &. Attala.A. (2001),”The Myth of the Etical Consumer- Do Ethics Matter in Purchase Behavior,” Journal of Consumer Marketing, (18), s. 560-577.

Auger.P.; Burke.P.; Devinney.T.M. &. Louviere.J.J. (2003),”What Will Consumers Pay for Social Product Features?,”Journal of Business Ethics,(42), s. 281-304.

Auger.P &. Devinney. T. (2007), “Do What Consumers Say Matte? The Misalignment of Preferences with Unconstrained Intentions”, Journal of Business Ethics, (76), s. 361-383.

B ______________________________________________________________________________

Bachman.J. &. O`Malley.P. (1984), “Yea-Saying, Nay-Saying, and Going to Extremes: Black-White Differences in Response Styles,” Public Opinion Quarterly, (48), s. 491-509.

Bartlett.M.S. (1950),”Tests of Significance of Factor Analysis” British Journal of Psychology (Statistical Section), Vol. 3, s. 77- 85.

Bates.N.; Martin.E.; DeMaio.T,J, &. De la Puerte.M. (2006), Questionnarie Effects on Measurements of Race and Spanish origin research Report Series,” Statistical Research Division, US Census Bereau.

Baumgartner.H. &. Steenkamp.J. B.E.M. (1998),”Multi-group latent variable models for varying numbers of items and factors with cross-national and longitudinal applications,” Mark. Lett. (9), s. 21-35.

Baumgartner.H. &. Steenkamp. J. (2001), “Response Styles in Marketing Research: A Cross-National Investigation”, Journal of Marketing Research, Vol. XXXV111, (2011), s. 143-156.

Bearden.W.O. &. Netemeyer.R.G. (1999), “Handbook making scales: Multi-item measures for Marketing and Consumer behavior research, 2d Ed.” Saga Publications.

Side 87 af 101

Page 88: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Belk.R.; Devinney.M.T. &. Eckhardt.G. (2005),”Consumer Ethics Across cultures,” consumption, Markets and culture, (8), s. 275-289.

Bennet.D.B. (1974),“ Evaluation Environmental education programs,” Environmental educations. 113-164. John Wiley &. Sons, Inc.

Bernreuter.R.G.(1933), “Validity of the personality inventory.” Personality Journal, (11), s. 383-386.

Bernstein.I & Nunnally.J.(1994),” Psychometric Theory, (3rd edn.), McGraw-Hill.

Bernstein.I & Nunnally.J.(2006),”Psychometric Theory”, McGraw-Hill, Inc. 3. Udgave.

Beuckelaer.A. & Lievens.F. (2009),”Measurement Equivalence of paper-and-Pencil and Internet Organisational Surveys: A Large Scale Examination in 16 Countries.” Applied Psychology: An Internationale Revie,(58), s. 336- 361.

Black.I. & Areni.C. (2008),”Why Consumers don’t do as they say: Hyperbolic Discounting vs. Temporal Construal Theory. Paper Presented at the International Centre for Anti-Consumption Research Symposium, Sidney, Australia.

Blair.E.; Sudman.S.; Bradburn.N. &. Stocking.C. (1977),”How to ask questions about drinking and sex: Respose effect in measuring behavior,” Journal of Marketing Research, (14), s. 316-321.

Blumberg.B; Cooper.D & Schindler.P.(2008), “Business Research Methods,” McGrave-Hill Companies 2. udgave.

Bollen.K.A. (1989),”Structural Equations With Latens Variables,” Wiley, New York.

Boulstridge.E. & Carrigan.M. (2000),”Do Conusmers Really Care about Corpurate Responsibility? High lightning the Attitude-Behavior Gab,” Journal of communication Management, (4), s. 355-368.

Brace.I.(2008),”Questionaire Design. How to Plan, Structure and Write survey Material for Effective Market Research.” London: Kogan Page.

Bray.J.; Johns.N.& Kilburn. D. (2011),”An Exploratory Study into the Factors Impeding Ethical Consumption,” Journal of Business Ethich , (98), s. 597-608.

Brown.T. (2006),”Confirmatory Factor Analysis for Applied Research,” The Guilford Press.

Bray.J.; Johns.N. &. Kilburn.D. (2010),”An Exploratory Study into the Factors Impeding Ethical Consumption,” Journal of Busines Ethich, (98), s. 597-608.

Byrne.B.M.; Shavelson.R.J. &. Muthen.B. (1989),”Testing for the equivalence of factor covariance and mean structures: the issue of partial measurement,” Psychol. Bull. (105), s. 456-466.

Side 88 af 101

Page 89: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

C ______________________________________________________________________________

Carayon.P. &. Hoonakker.P. (2009),”Questionnaire Survey Nonresponse: A Comparison of Postal Mail and Internet Surveys,” Journal of Human-Computer Interaction, (25), s. 348-373.

Carpenter.J.B. &. Dudycha.A.L. (1973),”Effects of Item format on Item discrimination and difficulty.” Journal of Applied Psychology, (58), s. 116-121.

Carringa.M. &. Attala.A. (2001),”The Myth of the Etical Consumer- Do Ethics Matter in Purchase Behavior,” Journal of Consumer Marketing, (18), s. 560-577.

Cattell.R.B. (1966),”The Scree Test for the Number of Factors,” Multivariate Behavioral Research, Vol.1. s. 245-276.

Churchill.Jr.G.A. (1979), ”A paradigm for developing better measure of marketing,” Journal of marketing, (16), s. 64-73.

Converse.J. &. Presser.S. (1986), ”Survey Questions. Handcrafting the Standard Questionnaire,” Sage.

Couper.M.(2000),”Web Surveys. A review of issues and Approaches,” Public Opinion Quarterlig, Vol. 64, s. 464-494.

Cronbach.L.J. (1946),”Response sets and test validity,” Educational and Psychological Measurement, (6), s. 475-494.

Cronbach.L.J. &. Meehl.P.E. (1955),”Construct validity in psychological tests,” Psychol. Bull. (52), s. 281-302.

Cronbach.L.J.; Rajaratnam.N: & Gleser.G.C. (1963),”Theoryof Generalizability: A Liberalization of Reliability Theory,” British Journal of Statistical Pzychology, (16), s. 137-163.

D ______________________________________________________________________________

Daniels.L.R. &. Berkowitz.L. (1964), “Affecting the salience of social responsibility norms.” Journal of Abnormal and Social Psychology, (68), s. 275-281.

Defra. (2006)”Sustainable consumption and production: Encouraging sustainable Consumption”.

De Jong.M.; Pieters.R. & Fox. J. (2010),”Reducing Social Desirability Bias through Item Randomized Response: An Application to Measure Underreported Desires”, Journal of Marketing Research, Vol. XLV11, (2010) s. 14-27.

Side 89 af 101

Page 90: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

De Jong.M.; Steenkamp.J &. Baumgartner. (2010),”Socially Desirable Response Tendencies In Survey Research,” Journal of Marketing Research, Vol. XLV11, (april 2010), s. 199-214.

De Pelsmacker.P.; Dreisen.I. &. Rayp.G. (2005),”Do Consumers Care About Ethich? Willingness to Pay for Fair-Trade Coffee,” The Journal of Consumers Affairs, (39), s. 363-385.

Deutskens.E. (2006), “From Paper-And-Pencil to Screen-And-Keyboard: Studies on the Effectiveness of Internet-Based Marketing Research,” Maastricht University, (doktordisputants).

Dillman:D. (2000),”Mail and Internet Surveys. The Tailored Design Method,“ New York: John Wiley & Sons, Inc.

Dunlap.R.E., & Van Liere. K. D. (1978).”The new Environmental Paradigm.” Journal of Enviromentel Education, (9), s. 10-19.

E ______________________________________________________________________________

Edwards, A.L. (1957), “The social desirability variable in personality assessment and research.”New York Dryden.

Epstein.J.; Klingenberg.W.D.; Wiley.D.& McKinley.L. (2001),”Isuring Sampler Eqivalance across Internet and Paper-and-Pencil assessments,” Computers in Human Behavior, (17), s. 339-346.

F ______________________________________________________________________________

Fadem.B. “Behavioral Science. Board Review Series”s. 262.

Fink.A. (2003),”How to Ask Survey Questions.” Thousand Oaks, CA: Sage s. 210-231.

Finny.S.J. & Distefano.C.”Nonnormal and categorical date in structural equation modeling,” Gregory.R.Hancock & Ralph.O.Mueller (eds), Structural Equation Modelling; A Second course, Information Age Publishing.

Flick.U, (2009),“An Introduction To Qualitative Research,” Saga Publications Ltd 4. udgave.

Foddy.W. (1993),”Constructing Questions for Interviews and Questionnaires. Theory and Practice in Social Research.” Cambridge Universitet Press.

Follows.S. & Jobber.D. (2000),”Environmentally Responsible Purchase Behavior: A Test of A Consumer Model,” European Journal of Marketing, (34), s. 723-746.

Fornell.C. & Larcker.D.F. (1981),”Evaluating Structural Equation Models with unoberservabel variables,” Journal of Marketing Research, (18), s. 39-50.

Side 90 af 101

Page 91: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Futtera.S.C.L. (2005),”The Rules of the game: The Principals of Climate change Communication,” Department for Environment, Food and Rural Affairs, London.

Fowler.F.J. (1992),”How unclear terms affect survey data,” Public opinion Quarterly, (56), s. 218-231.

Fowler.F.J. & Mangione.T.W. (1990),”Standardized Survey Interviewing: Minimizing Interviewer-Related Erro. Newbury Park. Saga Publications.

G ______________________________________________________________________________

Greenleaf.E. (1992a),”Improving Rating Scale Measyres by Detecting and Correcting Bias Components in Some Response Styles,” Journal of Marketing Research, (29), s. 176-188.

Greenleaf.E. (1992b),”Measuring Extreme Response Style,” Publis Opinion Quaterly, (56), s. 328-351.

H ______________________________________________________________________________

Hamilton.D. (1968), “Personality Attributes Associated with Extreme Response Style,” Psychological Bulletin. (69), s. 192-203.

Hair.J; Black.W; Babin.B; Anderson.R & Tatham.R. (2006),”Multivariate Data Analysis,” Pearson Prentice Hall, 6. udgave.

Hayduk.L.A. (1989),”Structural Equation Modeling- Essentials and Advances,” The John Hopkins Universitet Press. Baltimore and London.

Hines.J.M.; Hungerford.H.R. & Tomera.A.N. (1986). “Analysis of research on responsible environmental behavior: A meta- analysis.” Journal of Environmental Education, (18), s. 1-8.

Holzer.E. & Schann.J. (1990), “Studies of individual environmental concern: The role of knowledge, gender, and background variables,” Enviroment and behaviour, (22), s. 767-786.

Hu.Li-Tze & Bentler.P.M. (1999),”Cutoff criteria for fit Indexes in covariance Structure analysis: Conventional criteria versus new Alternatives,” Structural Equation modeling, (6), s. 1-55.

Hugner.R.S.; McDonagh.P.B.; Prothero.A.; Schultz.CJ II.& Stanton.J. (2007), “Who are organic food consumers? A compilation and review and why people purchase organic food,”Journal of Consumer Behaviour, (6), s. 94-110.

Side 91 af 101

Page 92: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Hue.C.H. & Triandis.C. (1985), “The instability of response sets,” Public Opinion Quaterly, (49), s. 253-260.

Hull.C.L. (1943),”Principles of Behavior ,” Phil. & phenomenol. res. (6), s. 590-602.

J ______________________________________________________________________________

Jackson.E.L. (1985).”Environmentel attitudes and Preferences for Energy Resource Options.” Journal of Environmentel Education, (17) s. 23-30.

Janssens.W. og De Pelsmacker.P. (2007),”A Model for Fair Buying Behaviour: The Role of Perceived Quantity and Quality of Information and Product-Specific Attitudes,” Journal of Business Etics, (75), s. 361-380.

Jobber.D. og Follows.S. (2000),”Environmentally Responsible Purchase Behavior: A Test of A Consumer Model,” European Journal of Marketing, (34), s. 723-746.

Jones.E.E & Sigall.H. (1971),”The bogus pipeline: A new paradigm for measuring affect and attitude.” Phychological Bulletin, (76), s. 349-364.

K ______________________________________________________________________________

Kaiser.H.F. (1959),”The Application of Electronic Computers to Factor Analysis,” Symposium on the Application of Computers to Psychological Problems, American Psychological Association.

Kaiser.H.F. (1958),”The Varimax Criterion for Analytic Rotatation in Factor Analysis,” Psychometrika. Vol.23. s. 187-200.

Kaiser.H.F. (1970),”A second-generation Little Jiffy” Psychometrika, (35), s. 401-415.

Kaiser.H.F. (1974),”Little Jiffy, Mark IV” Educational and Psychological Measurement, (34), s. 111-117.

Keniston. K & Couch. A. (1960), ”Yeasayers and Naysayers: Agreeing Response Set as a Personality variable,” Journal of Abnormal and Social Psychology, (60), s. 151-172.

Klassen.R.D. og Jacobs.J. (2001),”Experimental of Web, Electronic and Mail Survey Technologies in Operations Managment,” Journal of Operations Management, (19), s. 713-728.

Kline.R. (2005),“Principles And Practice Of Structural Equation Modeling,” The Guilford Press 2. udgave.

Side 92 af 101

Page 93: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Knapp.H. og Kirk.S.A. (2003),”Using Pencil and Paper, Internet and Touch-Tone Phones for Self-Administered Surveys: Methodology Matter?” Computers in Human Behavior, (19), s. 117-134.

Kotler.P.: Keller.K.: Brady.M.: Goodman.M. & Hansen. T. (2009),”Marketing Management,” Pearson Prentice Hall, 1. udgave.

Krumpal.I.; Rauhut.H.; Bøhr.D. & Naumann.E. (2008),”Wie wahrschenlich ist “wahrscheinlich,” Methoden - Daten – Analysen, (2), s. 3-27.

L ______________________________________________________________________________

Lattin.J.: Carroll.J. & Green.P. (2003),”Analysing Multivariate Data,” Brooks / Cole Cengage Learning 1. Udgave.

Leeuw.J . med flere (2000), “Structural Equation Modeling,” Saga Publications, Inc.

Leite.W. og Cooper.L. (2010), “Social Desirability Bias Using Mixture Models,” Multivariate Behavioral Research, s. 271-293.

Lentz.T.F. (1938),”Acquiescence as a factor in the measurement of personalit,y” Phycholocal Bulletin, (35), s. 659.

Lietz.P. (2010),”Research into questionnaire design. A summary of the literature,” The Market Research Society.

Lievens.F. og Beuckelaer.A. (2009),”Measurement Equivalence of paper-and-Pencil and Internet Organisational Surveys: A Large Scale Examination in 16 Countries.” Applied Psychology: An Internationale Review, (58), s. 336-361.

Little.T.D. (1997),”Mean and covariance structures (MACS) analyse of crosss-culturel data: practical and theoretical issues,” Multivariates Behav. Res. (32), s. 53.

Louviere.J.J.; Hensher.D.A. og Swait.J.D. (2000),”Stated Choice Methods: Analysis and Applications,” Cambridge University Press.

Lynch.R. (2009),”Strategic Management (formerly corporate strategy),” Prentice Hall, (5. edt)

M ______________________________________________________________________________

Marsh.H.W. og Hocevar.D. (1985),”Application of confirmatory factor analysis to the study of self-concept: first-and higher order factor models and their invarianse across grups.” Psychol. Bull. (97), s. 562-582.

Side 93 af 101

Page 94: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Martin.J. (1964), “Acquiescence-Measurement and Theory,” British Journal of Social Psychology, (3), s. 216-225.

Martin.E. (2002),”The effects of questionnaire design and reporting of deyailed Hispanic origin incensus 2000 mail questionnaires,” Public Opinien Quarterly, (66), s. 582-593.

Mason.T. (2000),”The Importance of Being Ethical,” Marketing 26 .october, (27).

Maxwell.S.E. & Cole.D.A. (1985),”Multitrait-multimethod comparisons across population: a confirmatory factor analytic approach.” Multivarieate Behav. Res. (20), s. 389-417.

May.V.A. (1999),”Survey 2000: Charting Communities and change,” National Geographic, (196), s. 130-133.

McGee.R.(1967),” Response Set in Relation to Personality: An Orientation,” Response Set in Personality Assessment, Aldine Publishing Compagny, s. 1-31.

Meehl.P. & MacCorquodal.K. (1948), “On a Distinction Between Hypothetical Construts and Intervening Variables,” Psychological Review, (55), s. 55-107.

Meredith.W. (1993),”Measurement invariance, factor analysis and factorial invariance,” Psychometrika, (58), s. 525-543.

Messick.S. (1962),”Response style and content measures from personality inventories,” Educational-and Psycological Measurement, (22), s. 41-56.

Messick.S. & Jackson.D.N, (1958),”Content and style in personality assessment,” Psychological Bulletin, (55), s. 243-252.

Messick.S & Damarin.F. (1965),”Response styles as personality variables: A theoretical integration of multivariate research,” (Res. Bull. No. 65-10) Educational Testing Service.

Messick.S. (1967),”The Psychology of Acquiescence: An Interprentation of Research Evidence,” Response Set in Personality, AldinePublishing Company, s. 115-145.

Messick.S. (1968), “Response Sets,” International Encyclopedia of the Social Sciences, Vol. 13, Macmillian, s. 492-496.

Messick.S. (1991), “Psychology and Methodology of Response Styles,” Improving Inqyiry in Social Science: A Volume in Honer of Lee J. Cronbach, Richard E. Snow and David E. Wiley, eds. Hilladale, NJ. Lawrence Erlbaum Associates, s. 161-200.

Miller.P.V. og Couper.M.P. (2008),”Web Survey Methods Introduction,” Public Opinion Quarterly. Vol. 72. No. 5. s. 831-835.

Side 94 af 101

Page 95: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

N ______________________________________________________________________________

Neville.B.; Whitwell.G. & Carrington.M. (2010), “Why Ethical Consumers Don`t Walk Their Talk: Towards a Framework for Understanding the Gap Between the Ethical Purchase Intentions and Actual Buying Behaviour of Ethically Minded Consumers,” Journal of Business Ethics, (97), s. 139-158.

Norvick.M.R. (1966),”The axioms and principal results of classical test theory,” Journal of Mathematical Psychology, Volume 3, Issue 1, s. 1-18.

O ______________________________________________________________________________

O`Donovan.D. (1965),”Rating Extremity: Pathology or Meaningfulness,” Psychological Review (72), s. 358-372.

Olsen.H. (2005), ”Fra spørgsmål til svar,” Akedemisk Forlag, 1. udgave.

Oksanen.R. & Uusitalo.O. (2004),”Ethical Consumerism : A View from Findland,” International Journal of Consumer Studiers, (28), s. 214-221.

O`Muircheartaigh.C.; Gaskell.G. & Wright.D. (1993),”Intensifiers in behavioral frequency questions,” Public Opinion Quarterly, (57), s. 552-565.

O’Neill.H.W.(1967), “Response Style Influence in Public Opinion Surveys,” Public Opinion Quarterly, (31) s. 137-157.

Oppenheim.A.N. (1992),”Questionnarie Design, Interviewing and Attitude Measurement,” Pinter.

P ______________________________________________________________________________

Papaoikonomou.E.; Ruan.G. og Ginieis.M. (2011),”Towards a Holistic of the Attitude Behavior Cap in Ethical Consumer Behaviors: Emperical Evidence from Spain,” International Atlantic Economic Society, (17), s. 77-88.

Paulhus. D. (1984),”Two-components models of socially diserable responding,” Journal Personality and Social Psychology, (46) s. 598-609.

Paulhus. D. (1988),”Manual for the balanced Inventory of Desirable Responding,” (BIDR-6) Unpublished manual, University Of British Columbia.

Paulhus. D. (1991),”Measurement and Control of Response Bias,” Measures of Personality and Social Psychological Attitudes. Academic Press. s. 17-59.

Side 95 af 101

Page 96: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Paulhus, D. (1998a), ”Intrapsychic and interpersonal adaptiveness of trai self-enhancermet:A mixed blessinf,” Journal Of Personality and social psychology, (74) s. 812-820.

Paulhus, D. (1998b),”Manual for the Balanced Inventory of Desirable Responding,” (BIDR-7) Multi-Health System.

Paulhus, D. & John .O.P. (1998), ”Egoistic and moralistic bias in self-perceptions: The interplay of self-deceptive styles with basic traits and motives,” Journal of Personality, (66) s. 1024-1060.

Paulhus. D. ( 2002),”Socially Desirable Responding: The Evolution of a Construct,” The Role of Constructs in Psychological and Educational Measurement, Mahwah, NJ: Lawrence Erlbaum Associates, s. 49-69.

Pauls.C.A. & Stemmler.G. (2003),”Substance and Bias in Social Desirability Responding;” Personality and Individual differeb´nces, (35), s. 263-275.

Ployhardt.R.E. & Oswald.F.L. (2004),”Appligations of means and structure analysis: integrating correlational and experimental approaches,” Organ, Res. Methods, (7), s. 27-65.

Podsakoff.P.M.; MacKenzie.S.B.; Lee.J.Y. & Podsakoff.P. (2003),”Common method biases in behsvioral research: A critical rewiev of the literature and recommended remedies,” Journal of Applied Psychology, (88), s. 879-903.

Presser.S. & Blair.J. (1986),”Survey presteting:do different methods produce different results?” Sociological Methodology, (24), s. 73-104.

Presser.S. & Schuman.H. (1981) ,“Questions and answers in attitude surveys: Experiment on question form, wording, and context,” Acadamic Press, (New York).

R ______________________________________________________________________________

Ray.J. (1983), “Reviving the Problem of Acquiescent Response Bias,” Journal of Social Psychology, (121), s. 81-96.

Rensvold.R.B. & Cheung.G.V (2000),”Assessing extreme and acquiescense response sets in cross-cultural research using structural equation” Journal of Cross-cultural Psychologi ,(31), s. 187-212.

Rips.L.J.;Rasinski.K. & Touraangeau.R. (2000),“The psychology and survey Response,” Cambridge University Press.

Rogers.D. (1998),”Ethical Tactics Arouse Public Doubt,” Marketing, (august 6), s. 12-13.

Side 96 af 101

Page 97: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Roster.C.A.; Rogers.R.D.; Albaum.G.& Klein.D. (2004),”A Comparison of Response Characteristic from Web and Telephone surveys,” international Journal of Market Research, (46), s. 359-373.

Rossi.P.E.; Gilula.Z. & Allenby.G.M. (2001),”Overcoming scale usage heterogeneity: A Bayesian hierarchical approach,” Journal of the American Statistical Association, (96), s. 20-31.

Roth.M. & Herzberg.P.Y. (2007),“The resilient Type “Simply the best” or Merely and artifact of Social desirability,” Physchological Signs, (49), s. 150-167.

Ruan.G.; Ginieis.M. & Papaoikonomou.E, (2011),”Towards a Holistic of the Attitude Behavior Cap in Ethical Consumer Behaviors: Emperical Evidence from Spain”, International Atlantic Economic Society ,17, s. 77-88.

S ______________________________________________________________________________

Sackeim.H.A. & Gur.R.C. (1978), “Self-deception, other-deception and consciousness, ” G.E. Schwartz & D. Shapiro (Eds.), Consciousness and self-regulation: Advance in research Vol. 2. S.139-197. Plenum Press.

Sackeim.H.A. & Gur.R.C. (1979), “Self-deception, other deseption and selfreported psychopatholagy,” Journal of Consulting Clinical Psychology, (47) s. 213-215.

Sackeim.H.A. (1983), “Self-deception, self-estem,and depression: The adaptive value of lying to oneself In J. Masling(ed). Emperical studies of psychoanalytic theories s. 101-157, Lawrence Erlbaum Associates.

Schann.J., & Holzer. E. (1990), “Studiers of individual environmental concern: The role of knowledge, gender, and background variables.” Environment and Behavior, (22), s. 767-786.

Schillewaert.N. & Meulemeester.P. (2005),”Comparing Responce Distribution of offline and online Data Collection Methods,” International Journal of Market Research, (47), s. 164-178.

Schwarz.N. & Sudman.S. (1992), “Context Effects in Social and Psychological Research,” Springer.

Schwartz.N.; Steinmetz.H.; Schmidt.P.; Tina-Booh.A. & Wieczorek.S. (2009),”Testing Measurement using multigroupe CFA: differences between educational groups in human values measurement,” Qual Quant, (439, s. 599-616.

Schulman.A. (1973), A Comparison of Two Scales on Extremity Response Bias,” Public Opinion Quarterly. (37), s. 507-412.

Side 97 af 101

Page 98: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Shaw.D.; Shiu.E.; Hassan.L.; Bekin.C. & Hogg.G. (2007), “Intending to be Ethical: An Examination of Consumer Choice in Sweatshop Avoidance,” Advances in Consumers Research (34), s. 31-38.

Shaw.D. & Connolly.J. (2006),”Identifying Fair Trade in Consumption Choice,” Journal of Stratic Marketing, (14), s. 353-368.

Shaw.D. & Shui. E. (2002),”An Assessment of Ethical Obligation and Self-Identity in Ethical ConsumerDecision- Making: A Structural Equation Modelling Approach,” International Journal of Consumer Studiers, (26) s. 286-293.

Simon.F.L. (1995),”Global Corporate Philanthropy: A Strategic Framework,” International Marketing Review, (12), s. 20-37.

Stanton.J.M. (1998),”An Emprerical Assessment of Data Collection Using the Internet,” Personel Psychology, (51), s. 709-725.

Steenkamp.J. & Ter Hofstede.F. (2002),”International Market Segmentation: Issues and Outlook,” International Journal of Research in Marketing, (19), s. 185-213.

Stone.G. & Montgomery.C. & (2009), “Revisiting Consumer Environmentel Responsibility: A Five Nation Crosscultural Analysis and Comparison of Consumer Ecological And Behaviors,” International Journal of Management and Marketing Research.Vol. 2. Nr. 1 s. 35-58.

Stone.G.; Barnes.J. & Montgomery.C. (1995), ”Ecoscale: A Scale for the Measurement of Environmentally Responsible Consumers,” Psychology & Marketing, John Wiley & Sons, Inc. Vol.12(7) s. 595-612.

Sudman.S. & Bradburn.N.V. (1992),”Response Effects in Surveys.” Chicago, IL: Aldine.

T ______________________________________________________________________________

Thompson.M.S.; & Green.S.B. (2006),”Evaluating between-group differesces in latent means,” In: Hancock, G.R.,Mueller, R.O. (eds.) Structurel Equation Modeling: A Second Cource, s. 119-169. Information Age, Greenwich.

Tolman.E.C. (1938),”The determiners of Behavior at a choice Paint,” Psychol. Rev. (45), s. 1-45.

Tourangeau.R.; Kreuter.F.& Presser.F. (2008), ”Social Desirability Bias in Capi, IVR, and Web Surveys The Effects of mode and Question Sensitivity,” Puplic Opinion Quarterly, Vol. 72, No. 5 s. 847-865.

Tucker.L.R. & Lewis.C. (1973), “A reliability Coefficient for Maximum Likelihood factor analyses” Physchometrica, (38), s. 1-10.

Side 98 af 101

Page 99: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

U _____________________ ________________________________________________________

Ulrik.P. og Sarasin.C. (1995),”Facing Public Interest: The Etical Challenge to Business Policy and Corporenate Communications,” Kluwer Academic Publication, London.

Uusitalo.O. og Oksanen. (2004),”Ethical Consumerism : A View from Findland,” International Journal of Consumer Studiers, (28), s. 214-221.

V _____________________________________________________________________________

Vandenberg.R.J. og Lavce.C.E. (2000),”A review and synthesis of the measurement invariance literature: suggestions, practices, and recommendations research,” Organ. Res. Methods, (3), s. 4-69.

Verbeke.W. og Vermeir.I. (2008),”Sustainable Food Consumption Among Young Adults in belgium; Theory of Planned Behavior and the Role of Confidence and Values,” Ecological Economic, (64), s. 542-553.

Vernon.P.E. 1934 “The attitude of the subjet in personality testing.” Journal of Applied Physychology, (18), s. 165-177.

W _____________________________________________________________________________

Walker.J.N., Edvards.A.L. & Diers.C.j. (1962),“Response sets and factor loadings on sixtyoe personaility scales,” Journal of Applied Phychology, (46), s. 220-225.

Ward.P.M. & Maloney.M.P (1973), “Ecology: Let`s hear it from the people .American Psychologist, (28), s. 583-586.

Warner.S.L.(1965),”Randomized response: A survey technique for eliminating evasive answer bias,” Journal of the American Statistical Association, (60), s. 63-69.

Watson.D. (1992), “Correcting for Acquiescent Response Bias in the Absence of a Balanced Scale,” Sociological Methods & Research, (21), s. 52-88.

Weijters.B. (2006),”Response Styles in Consumer Research,” Vlerick Leuven Gent Management School, (doktordisputants).

Side 99 af 101

Page 100: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

White.P.C.; Jennings.N.V.; Renwick.A.R. & Baker.N.H.L. (2005),”Questionarires in ecology:a rewiev of past use and recommendations for best practice.” Journal of Applied Ecology, (42), s. 421-430.

Wirt. R. & Broen.W.E. Jr. (1958), “Varieties of Response Sets” Journal of Consulting Psychologi, (22), s. 237-240.

Wiggins J.S. (1959)”Interrelationships among MMPI measures of dissimulation under standard and social desirability instructions,” Journal of Consulting Psychology, (23) s. 419-427.

Wiggins J.S. (1964),”Convergences among stylistic response measures from objective personality tests,” Educational and Psychological Measurement, (24) s. 551-562.

Witte.J.C. og Howard.P.E.N. (1999),”Digital Consumers: Demographic Transistion on the Internet,” Northwestern University.

Y _____________________________________________________________________________

Yan.T. & Tourangeau.R. (2007),“Sensitive questions in surveys,” Phychologigal Bulletin, (133), s. 859-883.

Yen.W &.Allen.M (2002),”Introduktion to Measurement Theory”, Waveland Press, Inc.

Young.W.; Hwang.K.; McDonald.S. & Oates.C. (2009),”Sustainable Consumption: Green Consumer Behavior when Purchasing Products,” Sustainable Development, Wiley Inter Science, (18), s. 20-31.

Young.M.R.; DeSarbo.W.S. & Morwitz.V.G. (2010), “The Stochastic Modeling of Purchase Intentions and Behaviour,” Management Science, (44), s. 188-202.

Side 100 af 101

Page 101: pure.au.dkpure.au.dk/portal/files/36183961/RAPPORT_RSS_C_.docx  · Web viewFor 50 år siden var de fleste markeder kendetegnet ved virksomheder med høj produktionsvolume, standardisering,

Side 101 af 101