732g04 surveymetodik 7 - ida.liu.se
TRANSCRIPT
Statistikämnet och utredningar
Hur tolkar man statistiken?
Går statistiken att lita på?
Var kommer statistiken ifrån?
Egeninsamlade data (primärdata)
Redan insamlade data (sekundärdata)
Kursupplägg
7 föreläsningar
3 lektioner
1 datorövning
2 seminarium
Projektarbete om insamling och analys av primärdata (3.5hp)
Tentamen (4hp)
Kurslitteratur
Huvudlitteratur
Räkna på urval! av Anders Nordgaard
Rekommenderad bredvidläsning
Från datainsamling till rapport av Karin Dahmström
Tillämpad statistik av Wahlin
Föreläsningsunderlag på kurshemsida (LISAM)
Skriftlig tentamen 26 november kl 8-12 [28 januari 2016 8-12]
Hjälpmedel: ”fusklapp” och miniräknare
Aktivt deltagande i arbete och redovisning av projektarbetet
Examination
Föreläsning 1-2
732G04
Surveymetodik
Dagens föreläsning(ar)
Introduktion till statistisk undersökningsmetodik
Repetition
Populationer, stickprov
Variabler (typer, skalor)
Diagram
Chitvå-test
Beskrivande mått
Introduktion till projektet
Insamling av primärdata
Statistisk undersökningsmetodik
(kvantitativ metod)
Grundtanke
Kontakta ett stort antal personer, och till varje person ställa frågor med
ett antal i förväg konstruerade svarsalternativ för att sedan med
statistiska metoder bearbeta och dra slutsatser från denna information.
Stickprov används för att dra slutsatser om populationen som
stickprovet dragits ur.
Egenskaper
Tillåter exakta slutsatser (?)
Kostnadseffektivt: möjlighet att med statistiska metoder dra säkra
slutsatser om populationen baserat på ett förhållandevis litet och billigt
stickprov.
Population och stickprov
Målpopulation
Den population som vi vill undersöka
Rampopulation
Den population som vi faktiskt kan undersöka
Urvalsram
(Eventuellt) register över rampopulationen
Stickprov
(Normalt slumpmässigt) urval av enheter från rampopulationen
Urvalsenhet
De enheter som blivit utvalda i stickprovet
Variabler
Variabel: resultatet av upprepade mätningar eller observationer
av ett fenomen
En variabel är detsamma som en fråga i sammanhanget av
statistiska undersökningar
Kvalitativa variabler: variabler som ej mäts numeriskt (i
sifferform)
Kvantitativa variabler: variabler som mäts numeriskt
Diskreta kvantitativa variabler
Kvantitativa variabler som endast antar heltalsvärden
Kontinuerliga kvantitativa variabler
Kvantitativa variabler som kan mätas med många
decimalers noggrannhet
Nominalskala
Hos kvalitativa variabler.
När variabelns möjliga värden bara kan betraktas som
ickenumeriska grupper utan inbördes ordning.
Exempel:
Bedömer du att generalindex kommer att stiga under
april månad?
( )Ja ( )Nej Variabelns möjliga värden
Variabeln
Ordinalskala
Hos kvalitativa eller kvantitativa variabler.
När variabelns värden kan betraktas som grupper, antingen
numeriska eller ej, som kan rangordnas.
Exempel kvalitativ variabel på ordinalskala:
Hur bedömer Du Din närmaste chefs ledaregenskaper?
( ) Mycket goda ( ) Ganska goda ( ) Varken bra eller dåliga
( ) Ganska dåliga ( ) Mycket dåliga
Exempel kvantitativ variabel på ordinalskala:
Hur många anställda har ert företag?
( ) 0-5 ( ) 6-15 ( ) 16-50 ( ) 51-
Metrisk skala
Hos kvantitativa variabler.
När variabeln direkt mäts i numeriska värden.
Exempel:
Den dagliga försäljningen i en butik.
.
.
2011-10-19 16530 kr
2011-10-20 21465 kr
2011-10-21 8972 kr
.
.
Att åskådliggöra fördelningen för variabler
En variabels fördelning är en sammanställning över vilka
värden variabeln kan anta och hur ofta respektive värde antas.
Fördelningar beskrivs oftast i diagramform men kan också
sammanställas i tabeller
Fördel diagram: läsaren kan snabbt ta till sig informationen
Nackdel diagram: detaljnivån minskar jämfört med en tabell
Olika angreppssätt används för att beskriva fördelningar för
Kvalitativa variabler
Kvantitativa diskreta variabler
Kvantitativa kontinuerliga variabler
Exempel
Företagshälsovården vid ett företag sänder ut en enkät där de
anställda bland annat får svara på frågan
Resultaten sammanställs i följande tabell
Åsikt (x) Antal (f)
Mycket goda 42
Ganska goda 61
Varken bra eller dåliga 84
Ganska dåliga 23
Mycket dåliga 10
Totalt 220
Hur bedömer Du Din närmaste chefs ledaregenskaper?
( ) Mycket goda ( ) Ganska goda ( ) Varken bra eller dåliga
( ) Ganska dåliga ( ) Mycket dåliga
Att åskådliggöra fördelningen för en
kvalitativ variabel: stapeldiagram
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
Mycket goda Ganskagoda
Varken braeller dåliga
Ganskadåliga
Mycketdåliga
Alternativ metodik för att åskådliggöra
fördelningen för en kvalitativ variabel:
cirkeldiagram
19%
28%38%
10%
5%
Mycket goda Ganska goda
Varken bra eller dåliga Ganska dåliga
Mycket dåliga
Exempel
En annan fråga på enkäten löd
Resultaten sammanställs enligt
Antal dagar (x) Antal (f) Andel (%)
0 84 38
1 41 19
2 51 23
3 22 10
4 8 4
5 6 3
6 5 2
7 3 1
Totalt 220 100%
Hur många dagar i veckan motionerar Du?
( ) Ingen ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7
Att åskådliggöra fördelningen för en
diskret kvantitativ variabel: stolpdiagram
Stolpdiagrammet är likt stapeldiagrammet, men ritas med smalare staplar
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
0 1 2 3 4 5 6 7
Antal motionsdagar per vecka
Exempel
Dygnsmedeltemperatur (grader Celsius) i centrala Linköping under
juli månad 2011.
Dag 1 2 3 4 5 6 7
Temp 20.9 20.7 19.1 16.6 18.7 19.8 19.1
Dag 8 9 10 11 12 13 14
Temp 19.2 18.6 18.4 17.3 17.8 16.0 14.7
Dag 15 16 17 18 19 20 21
Temp 16.1 16.7 18.2 15.6 18.7 19.0 18.6
Dag 22 23 24 25 26 27 28
Temp 19.7 20.1 17.0 19.1 18.4 18.4 20.8
Dag 29 30 31
Temp 20.1 19.0 19.9
Att åskådliggöra fördelningen för en
kvantitativ variabel: histogram
0%
5%
10%
15%
20%
25%
30%
35%
-15.9 16.0-16.9 17.0-17.9 18.0-18.9 19.0-19.9 20.0-
Dygnsmedeltemperatur (grader Celsius)
Tänk på att inte ”kapa” diagram!
Exempel
Vid ett experiment lät man 51 personer välja vilken av tre
informationsbroschyrer A, B eller C man fann mest informativ och
pålitlig. Följande resultat erhölls.
Finns det några skillnader i popularitet mellan broschyrtyperna på
5% signifikansnivå?
Broschyr Antal personer (f)
A 13
B 21
C 17
Totalt 51
Chitvå-test för analys av frekvenstabellKrav:
det råder oberoende mellan grupperna i tabellen. Innebörden i
detta är att samma element (person) endast får ingå i en grupp.
max 20% av de förväntade frekvenserna är mindre än 5
alla förväntade frekvenser är större än 1.
Steg 1: Välj signifikansnivå och formulera hypoteser
H0: Det finns inga skillnader i frekvens mellan grupperna
Ha: Det finns skillnader i frekvens mellan grupperna
Steg 2: Bestäm testvariabeln
𝜒2 =
𝑖=1
𝑉𝑂𝑖 − 𝐸𝑖
2
𝐸𝑖där V = antalet grupper i frekvenstabellen
Chitvåtest för analys av frekvenstabell
Steg 3: Ska vi tro på H0 eller Ha?
Om testvariabeln är större än
𝜒𝑉−1;𝛼2
där V är antalet grupper i frekvenstabellen, förkastas H0.
Chitvå-test är alltid enkelsidiga åt höger!
Steg 4: Dra slutsats
Chitvåtest för analys av frekvenstabellMinitab: Stat -> Tables -> Chi-Square Goodness-of-Fit Test
Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: C1
Test Contribution
Category Observed Proportion Expected to Chi-Sq
1 13 0.333333 17 0.941176
2 21 0.333333 17 0.941176
3 17 0.333333 17 0.000000
N DF Chi-Sq P-Value
51 2 1.88235 0.390
Category 321
20
15
10
5
0
Va
lue
Expected
Observed
Chart of Observed and Expected Values
321
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
Category
Co
ntr
ibu
ted
Va
lue
Chart of Contribution to the Chi-Square Value by Category
Exempel
Finns det ett samband mellan föräldrarnas politiska åskådning och
ens egen? Man drog ett OSU om 365 personer och frågade dels
om moderns, dels om ens egen politiska tillhörighet (vänster eller
höger). Följande resultat erhålles.
Går det att på 5% signifikansnivå att påvisa något samband mellan
respondenternas och föräldrarnas politiska åskådning?
Modern vänster Modern höger
Respondenten
vänster98 141
Respondenten höger67 59
Exempel (forts)
0%
10%
20%
30%
40%
50%
60%
70%
Modern vänster Modern höger
Respondenten vänster Respondenten höger
Chitvåtest för korstabell
Krav:
det råder oberoende mellan cellerna. Innebörden är att samma
element (person) inte får förekomma i flera celler i tabellen
max 20% av de förväntade frekvenserna är mindre än 5
alla förväntade frekvenser är större än 1
Steg 1: Välj signifikansnivå och formulera hypoteser
H0: Det finns inga skillnader i fördelning mellan grupperna
(alternativt: det finns inget samband mellan grupperna)
Ha: Det finns skillnader i fördelning mellan grupperna
(alternativt: det finns samband mellan grupperna)
Chitvåtest för korstabell
Steg 2: Beräkna testvariabeln
𝜒2 =
𝑖=1
𝑊𝑂𝑖 − 𝐸𝑖
2
𝐸𝑖
där W = antalet celler i korstabellen (exklusive marginalfrekvenser)
Steg 3: Ska vi tro på H0 eller Ha?
Om testvariabeln är större än
𝜒(𝑟−1)(𝑐−1);𝛼2
där r är antalet rader i korstabellen och c är antalet kolumner,
förkastas H0. Kom ihåg att chitvå-test alltid är enkelsidiga åt höger!
Steg 4: Dra slutsats
Chitvåtest för korstabell
Minitab: Stat -> Tables -> Chi-Square Test
Chi-Square Test: C1; C2
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
C1 C2 Total
1 98 141 239
108.04 130.96
0.933 0.770
2 67 59 126
56.96 69.04
1.770 1.460
Total 165 200 365
Chi-Sq = 4.934; DF = 1; P-Value = 0.026
Krav för att använda chitvå-test1. Oberoende
2. Max 20% av de förväntade frekvenserna < 5
3. Alla förväntade frekvenser > 1
Hur gör vi om inte dessa krav uppfylls?
Strategi 1: (Logisk) Sammanslagning
Exempel: Hur många träningspass i veckan genomför du?
0-2 3-4 5-6 7-
K 12 (9.68) 10 (12.58) 0 (2.90) 8 (4.84)
M 8 (10.32) 16 (13.42) 6 (3.10) 2 (5.16)
Förväntade frekvenser inom parentes
0-2 3-4 5-
K 12 (9.68) 10 (12.58) 8 (7.74)
M 8 (10.32) 16 (13.42) 8 (8.26)
Strategi 2: Fishers exakta test
En exakt beräkningsmetod för specialfallet 2 * 2-tabell.
p = 0.464286
Ja Nej
Kvinnor 1 4
Män 2 1
Exempel:
Tror Du att generalindex går upp i år?
Beskrivande mått för variabler
Beskrivande mått används för att sammanfatta en variabels
fördelning.
Olika metoder används beroende på variabelns skala.
Exempel:
En population består av
8 socialdemokrater (kodat som 1)
10 moderater (2)
4 folkpartister (3)
1 miljöpartist (4)
Variabler på nominalskala
Typvärde
Andelar
Konfidensintervall för andelar *
Hypotesprövning för andelar *
* = beräknas på olika sätt beroende på vilken
undersökningsdesign vi valt.
Variabler på ordinalskala
Median
Kvartiler
Kvartilavstånd
Andelar
Konfidensintervall för andelar *
Hypotesprövning för andelar *
* = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.
Variabler på metrisk skala
Medelvärde
Standardavvikelse
Median
Kvartiler
Kvartilavstånd
Andelar
Konfidensintervall för medelvärde *
Konfidensintervall för andelar *
Hypotesprövning för medelvärde *
Hypotesprövning för andelar *
* = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.
Samband mellan variabler på
nominalskala eller ordinalskala
Chitvå-test
Korrelationskoefficient
Regressionsanalys
Samband mellan variabler på metrisk
skala
Projektarbete – insamling och analys av
primärdata: Syfte
Syfte: att träna i första hand planering men också genomförande
av en statistisk undersökning av den typ som ofta används för att
inskaffa underlag för beslut.
Tyngdpunkten i genomförandet ligger på
konstruktion av frågeformulär
bearbetning och analys av insamlade data (primärdata)
rapportering (muntligt och skriftligt), särskilt resultatredovisning i
tabeller och diagram och tolkning av dessa.
Projektet genomförs i grupper om 4-5 personer.
Projektarbete – insamling och analys av
primärdata: Tillvägagångssätt
Definiera ett undersökningsproblem.
Definiera målpopulation och översätt denna i en
rampopulation.
Bestäm hur stickprovet ska dras. För detta projekt krävs att få
in svar från 50 personer per gruppmedlem.
Fundera över vilka data som behövs för att man ska kunna
besvara frågeställningarna och hur data ska bearbetas och
analyseras.
Glöm ej att fundera över hur bortfall så långt som möjligt ska
undvikas, hur bortfallet kan undersökas och hur effekter av det
slutliga bortfallet ändå ska hanteras.
Projektarbete – insamling och analys av
primärdata: Tillvägagångssätt (forts)
Konstruera frågeformulär. Frågeformuläret ska bestå av
omkring 12-15 frågor som är relevanta för problemområdet.
Genomför datainsamling
Genomför datorbearbetning av insamlade data. Använd
särskilt korstabellering (inklusive chitvå-test) och illustrativa
diagram, så att olika samband kan beskrivas och studeras. Det
kan också, beroende på undersökningsproblemet, vara
intressant att analysera samband mellan kvantitativa variabler
med hjälp av regressionsanalys.
Skriv en rapport.
Projektarbete – insamling och analys av
primärdata: RapportI rapporten ska följande finnas
formulering av undersökningsproblemet med kort
problembakgrund
undersökningsplan
enkäten
faktiskt genomförd bearbetning och analys av
undersökningsdata med hjälp av tabeller, diagram och
beskrivande mått, liksom analyser med chitvå-test och
eventuellt regressionsanalys.
något om hur bortfallet kan tänkas påverka resultaten
slutsatser, där det är viktigt att tillse att frågeställningarna i
inledningen faktiskt besvaras.
Rapporten ska vara på ca 20 sidor plus bilagor.
Projektarbete – insamling och analys av
primärdata: EnkätseminariumUnder detta seminarium kommer enkäterna och dess frågor att
diskuteras.
Grupperna presenterar (väldigt) kort sitt undersökningsproblem så att
seminariedeltagarna blir insatta i vad som ska undersökas, och därefter
redovisas de olika enkätfrågorna med tillhörande motiveringar.
Denna presentation görs med fördel med hjälp av Powerpoint och
beräknas ta ungefär 10 minuter per grupp. Därefter kommenterar
opponentgruppen enkäten och slutligen får övriga deltagare komma med
synpunkter.
De olika synpunkter som tas upp på detta seminarium tar grupperna med
sig och fortsätter utveckla sin enkät. När de anser sig klara med enkäten
skickas den till handledaren (Jörgen) för slutligt godkännande.
Datainsamlingen får ej påbörjas innan handledare godkänt enkäten!
Projektarbete – insamling och analys av
primärdata: ProjektseminariumVid projektseminariet redogör varje arbetsgrupp för sitt arbete, och en
opponentgrupp kommer med synpunkter och därefter vidtar
diskussion.
Respektive författargrupp redovisar sitt arbete under cirka 15 minuter.
Enkäten samt viktiga tabeller och/eller diagram visas med
PowerPointstöd.
Opponentgruppen ska noggrant ha läst igenom rapporten, reflekterat
över den och ska under opponeringen lyfta fram några viktiga
synpunkter.
Härefter följer diskussion av arbetet med tyngdpunkt på metodfrågor
under ca 15 minuter. Opponentgruppen ska också skriftligen (ca en
sida) förse författare och lärare med sina synpunkter på rapporten, och
denna text överlämnas i samband med opponeringen.
Det råder obligatorisk närvaro vid projektseminariet och för att bli godkänd
på projektarbetet krävs aktivt deltagande i både redovisning och
opponering.
Projektarbete – insamling och analys av
primärdata: TidplanHållpunkt Moment
V 44 måndag Projektintroduktion, gruppindelning
V 44 tisdag Gruppindelning definitiv. Inlämning av förslag till undersökningsproblem
V 44 onsdag Definition av målpopulation och val av urvalsdesign klar. Börja med frågeformulär
Datorlaboration om inmatning av enkätdata och analys av sådana
V 44 torsdag-fredag Arbete med frågeformulär, inkl. pilotundersökning
V 45 tisdag Enkätseminarium. Enkäten skickas senast måndag 15:00 till:
• Opponentgruppen (framgår av kurshemsidan)
• Lärare ([email protected]) Skriv tydligt ”732g04 Enkät Era namn”
som ärendemening i mailet till mig.
V 45 onsdag – fredag
V 46 måndag – tisdag
Datainsamling
V 46 onsdag Sammanställning av inkomna frågeformulär: kodning och analys
Rapportskrivning
V47 onsdag Rapport klar (12:00)
V47 torsdag Seminarium med redovisning. Obligatorisk närvaro.
Om enkäter och enkätkonstruktion En enkätundersökning genomförs genom att till slumpmässigt utvalda
individer sprida ett frågeformulär med i förväg konstruerade svarsalternativ
för att sedan med statistiska metoder bearbeta denna information och dra
slutsatser om populationen som stickprovet dragits ur.
Data från en enkätundersökning är exempel på primärdata, till skillnad
från information från exempelvis register vilket kallas sekundärdata.
Viktiga begrepp är, precis som vanligt inom statistiken, population och
stickprov: vi definierar en population som vi önskar dra slutsatser om och
drar sedan ett stickprov (om inte populationen är så liten och
välavgränsad att alla individer i populationen kan undersökas) med hjälp
av någon av de metoder vi lärt oss i kapitel 9 (Dahmström).
Resultaten från stickprovet används för att dra slutsatser om populationen.
Även begreppet variabel spelar en stor roll: när vi genomför en
enkätundersökning betraktas varje fråga som en variabel.
Förberedelser
Första steget i arbetet med en enkätundersökning är att formulera
undersökningens syfte och översätta detta syfte i en
problemformulering. Problemformuleringen kan med fördel uttryckas i
form av en punktlista med konkreta men övergripande frågor.
Problemformuleringen har en nyckelroll vid konstruktion av enkäter.
Nästa steg är att definiera målpopulation, den grupp av individer som
vi vill dra slutsatser om och omsätta målpopulationen i en
rampopulation, som utgörs av de individer som vi faktiskt vet
(åtminstone i teorin) att vi kan få tag i.
Vi väljer sedan en lämplig urvalsdesign (för mindre undersökningar
oftast OSU) för att ur rampopulationen kunna göra ett stickprov som är
så representativt för målpopulationen som möjligt.
Enkätkonstruktion
1. Inled enkäten med bakgrundsfrågor (ålder, kön och liknande).
2. Eftersträva enkelhet i frågorna: korta, koncisa frågor som är neutralt
formulerade.
3. Håll nere antalet frågor. För denna undersökning – omkring 12-15
frågor.
4. Se till att det finns svarsalternativ för samtliga tänkbara åsikter på
varje fråga.
5. Undvik att låta respondenten ”hoppa” för mycket i enkäten (av typen
Du som svarat ”Nej” på fråga 12, gå direkt till fråga 15). Konstruera
istället enkäten så att man successivt betar av respondenterna efter
hur de indelas av enkätfrågorna.
6. Undvik att be respondenten att rangordna svarsalternativ (frågor av
typen Sätt en etta på det tvättmedel du helst köper, en tvåa på det
som du näst helst köper och så vidare).
7. Avsluta gärna enkäten med en öppen fråga.
FöljeinformationInformera i introduktionsbrev eller i enkätens ingress alltid om
Vad undersökningen handlar om.
Vem som har skickat enkäten (och på vems uppdrag).
När enkäten senast ska besvaras.
Varför det finns identifikationsnummer, om sådant finns.
Identifikationsnummer används ofta vid postenkäter, för att man ska
veta vilka som har besvarat enkäten och vilka som behöver få en
påminnelse.
Var, när och hur man kan ta del av resultaten av undersökningen.
Vem man ska vända sig till (namn och telefonnummer) om man har
frågor eller problem att fylla i enkäten. (Ej nödvändigt om
undersökningen genomförs genom på stan-urval).
Tänk i detta sammanhang på att aldrig utlova anonymitet i studien – för
det kan aldrig garanteras. Däremot kan och bör man se till att de ifyllda
enkäterna hanteras konfidentiellt och detta bör också framgå i
introduktionsbrevet eller ingressen.
Bortfallshantering
Totalbortfall
När enkäten inte har besvarats alls. Totalbortfall inträffar på
grund av att respondenten inte har tid, vilja eller möjlighet att
besvara enkäten. Det kan också bero på problem med det
register som har använts, exempelvis genom att registret är
föråldrat så att den utvalda respondenten inte bor kvar på den
adress enkäten utsänts till och därmed aldrig får den.
Partiellt bortfall
När en eller flera av frågorna på enkäten inte har besvarats
eller inte har besvarats korrekt. Partiellt bortfall inträffar särskilt
på känsliga frågor, exempelvis sådana som berör
respondentens ekonomi.
Bortfallshantering
Redan innan enkäten sänds ut finns det flera åtgärder som kan
vidtas för att minska bortfallet.
Lägg mycket arbete på utformningen av introduktionsbrevet och
enkäten. Se till att layouten är snygg och professionell.
Se till att det finns tillräckligt med tid för respondenten att
besvara enkäten.
Skicka ut minst en påminnelse.
Lotta gärna ut priser bland dem som besvarar enkäten
(exempelvis biobiljetter eller lotter). Dock måste en
tävlingsfråga läggas till.
Hansen-Hurvitz bortfallsplanVid totalbortfall
Dra ett OSU (stickprovsstorleken bestäms av tid och ekonomi) bland
de som fått en enkät men inte svarat på den. Kontakta dessa
respondenter på ett annat sätt än det tidigare. Vanligt är att använda
telefonintervju i detta steg. För att spara tid kan man nöja sig med att
bara ställa de viktigaste frågorna till de respondenter som vi får kontakt
med i denna fas.
Den stora frågan när det handlar om bortfall är kan bortfallet betraktas
som slumpmässigt? Genom att separat studera data från den
ursprungliga undersökningen och bortfallsuppföljningen kan vi utreda
om det föreligger några markanta skillnader mellan materialen eller om
bortfallet kan betraktas just som slumpmässigt.
Vi kan ta ett steg ytterligare genom att väga ihop resultaten från den
ursprungliga undersökningen och bortfallsuppföljningen. Detta görs
genom att använda metodik för stratifiering, där vi betraktar de som
svarade i den ursprungliga undersökningen som ett stratum och de
som besvarade bortfallsuppföljningen som ett annat stratum.
SubstitutionVid totalbortfall eller partiellt bortfall
Om antalet svarande är så pass litet att ingen analys kan göras
kan man tillämpa substitution.
Man fyller då på med respondenter som vill svara tills önskad
stickprovsstorlek uppnåtts.
Det inses att man därmed inte får reda på om bortfallet kan
betraktas som slumpmässigt: individer som tillhör den grupp
som av ett eller annat skäl inte vill besvara enkäten i första
urvalet kommer heller inte att vilja göra det vid substitutionen.
Det är därför viktigt att fundera över om stickprovet efter
substitution kommer att vara representativt för målpopulationen.
Kodning
Kodning innebär att översätta svarsalternativen på varje fråga i
sifferform, och att mata in dessa siffror i en statistisk programvara i
datorn. Den som kodar har stor frihet, men även här kan några
generella råd ges.
Avvakta med att påbörja kodningsarbetet tills alla enkäter har
kommit in. Syftet med detta är att eventuella problem då kan
hanteras på ett enhetligt sätt.
Börja sedan med att tilldela varje enkät ett löpnummer. Detta
löpnummer skrivs också in i första kolumnen i programvaran.
Arbetsbladet i den statistiska programvaran läggs sedan upp på
ett sådant sätt att varje kolumn innehåller en fråga och varje rad
en respondents enkätsvar.
Kodning av frågor med endast ett tillåtet
svarsalternativ
Exempel:
Vilken är Din huvudsakliga sysselsättning?
( ) Anställd ( ) Egen företagare
( ) Studerande ( ) Pensionär/långtidssjukskriven
( ) Arbetslös ( ) Annat, nämligen ………………
Vi har alltså att göra med en kvalitativ fråga (variabel) eftersom svarsalternativen ej fås i
sifferform. Frågan kodas med löpnummer 1, 2, 3, 4, 5 eller 6. Kommentarer skrivna under
alternativet annat skrivs in i en egen kolumn eller i ett separat dokument. Kommentarerna kan
inte analyseras med statistiska metoder men bör ändå sammanställas och presenteras i
rapporten.
Innehar företaget F-skattesedel?
( ) Ja ( ) Nej
En sådan fråga kodas vanligen enligt
Ja = 1, Nej = 0
Om frågan dessutom skulle ha ett Vet ej-alternativ kodas detta exempelvis med 2.
Försök så långt det är möjligt att konstruera frågor med endast ett tillåtet svarsalternativ, för det
är denna typ av frågor som är enklast att analysera.
Kodning av frågor med flera tillåtna
svarsalternativ
Eftersom flera svarsalternativ är tillåtna inses att kodning med
löpnummer ej skulle fungera. Lösningen är istället att låta varje
svarsalternativ utgöra en egen kolumn på arbetsbladet och om ett
specifikt alternativ är markerat kodas det som 1, annars som 0.
Nackdelen med frågor med flera tillåtna svarsalternativ är att det är
svårt att göra några statistiska analyser, bortsett från diagram, av
resultaten. Frågor av denna typ bör därför så långt det är möjligt
undvikas.
Exempel:
Vilka av följande faktorer anser Du tala för internethandel? Fyll gärna i flera alternativ.
( ) Möjlighet att handla när och var som helst ( ) Lägre priser
( ) Enkelt att jämföra varor ( ) Tidsvinst
( ) Stort utbud av varor ( ) Bekvämt att få varorna hemkörda
( ) Annat, nämligen …………………………… ( ) Vet ej
Öppna frågor
Exempel:
Vad är Din månadsinkomst före skatt?
……………………………… kr
Vad är Din månadsinkomst före skatt?
( ) Upp till 10 000 kr ( ) 10 001-20 000 kr
( ) 20 001-30 000 kr ( ) 30 001-40 000 kr
( ) 40 001-50 000 kr ( ) Mer än 50 000 kr
Skriv in resultaten på arbetsbladet som de är, men för analysernas skull
är det ofta nödvändigt att klassindela variabeln i efterhand. Alternativt:
Fördel: för respondenten mindre utelämnande att besvara en så pass
känslig fråga som inkomst med ett kryss i ett intervall än att faktiskt
skriva in den exakta summan
Nackdel: på förhand kan det vara svårt att bestämma klassernas
bredd och att man därför råkar få väldigt många kryss i en enda
klass, vilket försvårar eller omöjliggör analys av korstabeller
baserade på frågan.
Kodning av partiellt bortfall
Om svar saknas på en fråga där respondenten inte förutsätts svara
(legalt partiellt bortfall) sätts en speciell bortfallskod.
Denna väljer man ofta som ett negativt tal som ligger långt borta från
de vanliga siffrorna man kodar med, ofta 99. Vid analys måste de
legala partiella bortfallen tas speciell hänsyn till, normalt genom att de
tas bort ur tabeller och diagram.
Om svar saknas på en fråga där respondenten förutsätts svara (illegalt
partiellt bortfall) lämnas cellen tom.
Exempel:
Fråga 7: Använder Du internetbank?
( ) Ja ( ) Nej
Om Du svarade Nej på fråga 7, fortsätt till fråga 9. Om Du svarade Ja,
fortsätt till fråga 8.
Fråga 8: Hur länge har Du använt internetbank?
( ) Upp till 1 år ( ) 2-3 år
( ) 4-5 år ( ) 6 år eller fler
Statistisk bearbetning
1. Rita diagram över svarsfördelningen på varje fråga. Viktigt: ta hänsyn till vilken typ av fråga (variabel) det handlar om,
eftersom olika diagramtyper används för kvalitativa, diskreta
kvantitativa och kontinuerliga kvantitativa variabler.
2. Beräkna beskrivande mått för varje fråga. Även här är det viktigt att hålla reda på vilken variabeltyp respektive
fråga är av.
3. Sök samband. Bilda korstabeller (kvalitativa variabler) eller beräkna
korrelationskoefficienten/gör regressionsanalys (kvantitativa
variabler).
4. Bilda, där så är intressant, konfidensintervall och genomför
hypotesprövning.
Arbetsgång
1. Formulera syfte och problemformulering samt genom att definiera
målpopulation och rampopulation.
2. Välj om undersökningen ska göras som en totalundersökning, där samtliga
enheter i populationen ska ingå, eller som en urvalsundersökning, i vilken ett
urval av enheter undersöks. Vi måste också välja stickprovsstorlek och denna
bestäms framförallt av tillgänglig tid och budget.
3. Utforma enkäten.
4. Vi prövar nu vår enkät på ett litet antal försökspersoner – vi gör en så kallad
pilotundersökning. Korrigera enkäten efter vad som framkommer här.
5. Genomför datainsamling genom att skicka ut enkäten. Genomför
bortfallsuppföljning.
6. Koda in svaren i statistisk programvara.
7. Analysera resultaten utifrån syfte och problemformulering.
rapport.
8. Ge självkritik, genom att kritiskt betrakta ditt arbete och fundera över vad som
fungerade bra och vad som kunnat göras annorlunda eller kanske bättre.