ikke la deg lure av statistikk
DESCRIPTION
Statistikk blir brukt og misbrukt, og snart er det valg. Statistikk setter dagsordenen, blir ammunisjon i samfunnsdebatten og diskusjon om tall blir en kamp om virkelighets¬forståelsen. Derfor er det viktig å forstå tallenes tale. Her får du enkle og praktiske råd og vink når det gjelder å bruke, tolke og formidle statistikk slik den omgir oss i form av forholdstall, prosenter, rater og gjennomsnitt: Hvordan skal tallene sammenliknes, presenteres og tolkes? Og hva er de viktigste fallgruvene?TRANSCRIPT
1
1
Tall kan temmes!Om å forstå
og formidle statistikk
Jan Erik Kristiansen – Mars 2013 [email protected]
2
Statistiker og journalist:
Gjensidig skepsis…
… eller samarbeid?
3
Det er noget fintog forstandigt ved tal.
De véd hvad de vilog de gør, hvad de skal.
Kumbel
(Piet Hein)
4
Tallfesting av sosiale forhold
(”Tabellstatistikk”) = Empirisk statistikk
Metoder for å lage/fortolke statistikk = Teoretisk statistikk
Statistikk er...
5
Statistikk er:
• Å sammenlikne tall
• Og: Å sørge for at tallene er (mest mulig) sammenliknbare
• Misbruk/feil bruk av statistikk skyldes sjelden bevisst manipulasjon av tallene, men er langt oftere et resultat av at vi sammenlikner tall som ikke er (helt) sammenliknbare
6
Noen grunnleggende begreper
Enheter: Det vi ”teller”/undersøker: Personer, husholdninger, bedrifter, kommuner, land. Men også mer abstrakte enheter som trafikkulykker, skilsmisser...
Variabler: Egenskaper/kjennemerker ved enhetene vi undersøker; som kjønn, alder, utdanning, yrkesstatus,...
Verdier: Menn/kvinner, 1,2,3,4,5,6...år, antall år i utdanning, utenfor arb.styrken, sysselsatt, arb.ledig,...
7
Begreper (forts.)
Datainnsamling (”datafangst”)?
Datakonstruksjon
Nei!
8
8
Eksempel: Andelen fattige/med lav inntekt
Definisjoner er viktig:
OECD-skala 50 prosent
OECD-skala 60 prosent
2009-2011 4,3 8,0
2009-2011/uten studenter 3,3 6,7
EU-skala 50 prosent
EU-skala 60
prosent
4,4 9,2
3,2 7,7
9
”… på full fart mot 50 millioner flyreiser i året, og den grensen passerer vi høyst sannsynlig i år. Det betyr at hver eneste en av oss flyr i gjennomsnitt 10 ganger årlig.”
Aftenposten 30/1 2013Innenlands: Ankomst 14 mill. Avgang 14 milUtenlands: Avgang 10 mill. Ankomst 10 mill.Totalt: 48 mill.
Innenlands: Ankomst 14 mill. Avgang 14 mill. Utenlands: Avgang 10 mill. Ankomst 10 mill.Totalt: 34 mill.
10
Definisjoner: (forts)
Eksempel: ”Innvandrer” (2012)• 1. generasjon: 546 521• 1. + 2. generasjon: 654 956 • ”Med innvandringsbakgrunn” 945 507
Flere eksempler: • ”Arbeidsledighet”• ”Samboer”
Statistikk er altså en sosial konstruksjon og ikke uberørt av menneskehender
11
Enhet?
12
Enhet: (forts)
Eksempel: 4 husholdninger:A: 1 person
B: 2 personer
C: 2 personer
D: 3 personer
Sum: 8 personer
Dvs.: Enslige = 25% av husholdn./13% av personene
A:
B:
C:
D:
13
Tilsvarende: Personer og ekteskap
Enhet: (forts)
"Hver fjerde gifter seg med utlending" (Aftenposten 20/11 2002)
Fire inngåtte ekteskap, hvorav ett med utlending = 25 prosent
Sju nordmenn inngår ekteskap, hvorav en med utlending = 14 prosent
Eksempel: Ekteskap og personer
Nr. 1 N NEKTE- Nr. 2 N NSKAP Nr. 3 N N
Nr. 4 N U
Personer
14
Enhet: (forts)
2 PCer 10 personer = 20 PCer per 100 innb.
2 PCer 4 husholdn. = 50 % av husholdn.
2 PCer 6 personer i husholdn. med PC = 60 %
15
15
Dobbeltrom og enkeltrom:
Ant. personer:
97
6
103
Personer:
%
94,2
5,8
100,0
Ant. og % rom
Enkeltrom 97
Dobbeltrom 3
I alt 100
Enhet: (forts)
16
Halden2011: 3,1%
Østfold: 3,3 Hele landet: 2,7
Menn: 3,4Kvinner: 2,8
Sarpsborg: 3,6Fredrikstad: 3,8
.
.2010: 3,72009: 3,42008: 2,22007: 2,32006: 3,32005: 4,2
Statistikk = å sammenlikne tall
17
2 hovedtyper sammenlikninger Utvikling over tid Sammenlikning av grupper (kjønn, alder, bosted...) Eller: Både - og
0
25
50
75
100
125
150
175
200
1983 1988 1993 1998 2003
Boliger
Fritidshus
m2
Boligareal: boliger og fritidshus
18
Er tallene sammenliknbare?
19
19
Bygdejentene på utdanningstoppen:
:Hele 76 prosent av Ulvik-jentene i alderen 19-24 år fortsetter å studere etter videregående, viser tall fra Statistisk sentralbyrå. Til sammenligning hadde 25,4 prosent av den norske befolkningen universitets-
eller høgskoleutdanning i 2006.
Nationen 24/4 08
Er tallene sammenliknbare?
Kvinner: Menn: KvinnerKvinnerKv. & M
Hordaland hele landet hele landet
Ulvik 76 29 39 37 31
20
Sysselsettingsprosent
25-61 år:
Ikke-vestlige innvandrere 57
Vestlige innvandrere 77
Øvrige befolkning 84
Differanse = 27
15-74 år:
Ikke-vestlige innvandrere 53,6
Vestlige innvandrere 71,6
Øvrige befolkning 70,1
Differanse = 16,5
(Aftenposten 1/11 2012)
Er tallene sammenliknbare?
21
Flere begreper
Absolutte tall
Antall (personer, husholdn,
bedrifter, trafikkulykker, aborter, ekteskapsinngåelser, etc.)
Kroner
Mengder: Liter, kg., tonn
Relative tall Prosent
• Forholdstall (elever pr. lærer, elever pr. PC)
• Rater: pr. 1 000 innb., skilsmissehyppighet
• Indekser
Når bruke relative tall og absolutte tall?
22
Klassekampen 10/11 07
23
”Facebook-feberAntall nordmenn i nettsamfunnet har vokst med 2600 prosent de siste fire månedene”.
Aftenposten.no 26/4 2007
3 000 80 000
24
Relative tall, men hvilke?
Døde i trafikken Pr. 100 000 innb. Pr. 100 000 biler Pr. xxx xxx kjørte km Pr. xxx xxx personkm
25
Praktiske prosenter
• Én av flere måter å gjøre det lettere å sammenlikne ulike tallstørrelser på
• To typer prosenter– Prosentandeler; viser fordeling eller forholdet mellom deler
og helhet. Summerer alltid til 100.– Prosentvise endringer. Kan både være negative og større
enn 100 prosent – kan ikke summeres.
26
Prosentpoeng
Kombinasjonen av prosentandeler og prosentvise endringer kan være vrien:
En økning fra 5 prosent til 10 prosent =
100 prosent økning - eller:
en økning på 5 prosentpoeng
27
27
Menn: 36 532 Menn tjener 17,6% mer enn kvinnerKvinner: 31 057 Kvinner tjener 15% mindre enn mennDiff.: 5 475
Dagens Næringsliv 29/11 2009
28
28
Aftenposten 13/7 2011
= 47% dyrere i Norge. 32% billigere i Sverige
29
Prosent (forts)
200 prosent nedgang? "Bruken av mobiltelefonen blir billigere og billigere. Fra januar 1996 til januar 2001
er prisen redusert med 200 prosent" (Computerworld 7. juni 2001)
100 prosent økning = dobling
200 prosent økning = tredobling
300 prosent økning = firedobling
50 prosent nedgang = halvering
Bare en økning kan være mer enn 100 prosent; ikke en nedgang.
30
Prosent (forts)
31
Forholdstall
Kvinner: kr 161 000
Menn: kr 289 000
”Inntektsgapet øker”Aftenposten 8/10 2006
Menn tjener 80 % mer enn kvinner
Kvinners inntekt i prosent av menns: 56 %
Kvinner tjener 44 % mindre enn menn
32
Klassekampen 10. juni 2006
24 970 kinobesøk per 10 000 innb.
eller
2,5 kinobesøk per innb.?
33
0
200
400
600
800
1000
1200
1400
17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83
Gjennomsnitt eller ...?
Menns alder ved ekteskapsinngåelsen. 2004
Median: 34 år
Gj.snitt: 36,3 år
Vanligst/ ”typisk”: 31 år
34
Indeks
0
50
100
150
200
250
1986 1990 1994 1998 2002
Øl
Vin
Brennevin
Alkoholomsetning. 1 000 vareliter
0
50
100
150
200
250
300
1986 1990 1994 1998 2002
Øl
Vin
Brennevin
Alkoholomsetning. Indeks 1986=100
Begrepet brukes på to, litt ulike måter:
1. Indekstall = numeriske verdier beregnet som relative størrelser. Skalering med referanse til en basisverdi:
2. Indeks = Samlemål. En måte å forenkle eller komprimere data: Eks. BMI, KPI, HDI
35
Indeks1 Volumindekser for BNP per innbygger, prisnivåjustert.
Foreløpige tall 2009. EU27=100
BNP per innbygger,
prisnivåjustert
Albania 27
Bosnia-Hercegovina 30
Den tidligere jugoslaviske republikk Makedonia 36
Serbia 37
Bulgaria 41
Montenegro 43
Romania 45
Tyrkia 46: :: :
Hellas 95
Italia 102
Spania 103
Frankrike 107
Finland 111
Belgia 115
Tyskland 116
Storbritannia 117
Danmark 117
Island 120
Sverige 120
Østerrike 124
Nederland 130
Irland 131
Sveits 144
Norge 178
Luxembourg 268
Aftenposten.no 22/6 2010
36
De fire årstider
”Økt sykefravær”
37
"Fra 1990 til 2001 økte antallet kvinnelige studenter fra 33 764 til 65 756, mens antallet mannlige studenter økte fra 28 435 til 43 567".
"Fra 1990 til 2001 økte antallet kvinnelige studenter fra 33 800 til 65 800, mens antallet mannlige studenter økte fra 28 400 til 43 600".
Om store tall
38
Dagbladet 3. august 2005
= 2 890 nye Bislett stadion à 450 millioner
Om store tall:
39
Oppslag i Dagsavisen.no og ca. 50 andre aviser 31. oktober 2006
"Til sammen reiste vi en distanse tilsvarende 150 000 ganger rundt ekvator med buss, bane og båt".
SSB 31/10 2006
40
De store talls lovAntall gutter som andel av alle fødte. Kommuner. 2004
0
20
40
60
80
100
2 10 16 22 28 36 45 54 74 100 152 236 565Ant. barn født i kommunen
% gutter
Først ved en viss størrelse oppnår en gruppe en viss struktur (kritisk masse): - Men hvor går grensen?
41
Usikkerhet
Prosent: Når er en forskjell en forskjell?
Eksempel: Andelen som mener at statistikk er interessant øker fra 46 til 49 prosent. Er dette en økning som er verdt å kommentere?
Tommelfingerregel: Prosentdifferanser under 4-5 sjelden interessante
NB: Gjelder utvalgsundersøkelser
42
Er det noen forskjell på en økning fra 5 til 10 prosent og... fra 40 til 45 prosent?
JA! ...
Usikkerhet: (forts)
43
0
10
20
30
40
50
Usikkerhet: (forts)
De små talls hevn
44
• Men: At en forskjell eller endring er statistisk signifikant, betyr ikke at den er samfunnsmessig betydningsfull.
• Og motsatt: En tidsserie med bare små forskjeller mellom de enkelte år kan like fullt være uttrykk for en trend
Andel avislesere
1991 1992 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 201184 84 85 84 82 84 81 81 77 78 77 77 75 74 74 72 68 65 64 63
45
0
100
200
300
400
500
600
1950 1960 1970 1980 1990 2000
Antall drepte i trafikken
”… samferdselsministeren må svare på hvorfor antall døde økte sterkt i fjor”.
Bodil Tenden (V)(Nettavisen 2/1 2007)
46
De små talls hevn
Onsdag 19. desember 2012, kl.10:21
(Dagbladet:) Forleggerforeningen og Bokhandlerforeningen offentliggjør i dag sin tredje rapport om det digitale boknorge i 2012.
Den viser at norske ebøker går en lys fremtid i møte: salget har økt med 450 % i år.
Men per i dag er ebokmarkedet marginalt. Eboksalg utgjør knappe 0,6 prosent av det totale boksalget i Norge.
Dvs.:
Fra 0,11% -> 0,6% = 450%
47
Fallgruver: Sammenhenger
Ikke alle sammenhenger innebærer årsak og virkning:”Spuriøse”/tilfeldige sammenhenger? f.eks. mellom tidsserier:
Rentenivå og antall drepte i trafikken
0
2
4
6
8
10
12
14
16
18
20
1980 1985 1990 1995 2000 2005
150
200
250
300
350
400
450
500
Utlånsrente
Trafikkdrepte
Rente Drepte
48
Om tolkning av tall
• ”Kraftmagasinene fylles opp” (TV2 Nettavisen 22/9 04)
• ”Fortsatt lav vannstand” (DN 22/9 04)
• ”Regnet redder magasinene” (Hegnar Online 22/9 04)
• ”Sykefraværet synker” (Aftenposten 21/9 04)
• ”Langt unna målet” (NRK 21/9 04)
49
50
År: Pst.: År: Pst.: År: Pst.: År: Pst.: År: Pst.: År: Pst.: 1870 2,83 1892 1,39 1914 0,97 1936 2,49 1958 5,51 1980 1,94 1871 3,06 1893 1,36 1915 1,06 1937 2,96 1959 5,45 1981 2,24 1872 3,21 1894 1,36 1916 1,01 1938 2,83 1960 5,35 1982 1,82 1873 3,23 1895 1,36 1917 0,99 1939 2,96 1961 5,17 1983 1,79 1874 3,22 1896 1,36 1918 1,13 1940 3,46 1962 5,10 1984 1,61 1875 3,11 1897 1,17 1919 1,12 1941 3,57 1963 5,12 1985 1,45 1876 2,67 1898 1,10 1920 1,16 1942 3,49 1964 4,80 1986 1,43 1877 2,53 1899 1,13 1921 1,24 1943 4,19 1965 4,91 1987 1,27 1878 2,20 1900 1,11 1922 1,31 1944 4,11 1966 4,58 1988 1,16 1879 2,48 1901 1,03 1923 1,32 1945 4,20 1967 4,32 1989 1,06 1880 1,97 1902 1,09 1924 1,42 1946 4,32 1968 3,97 1990 1,08 1881 2,07 1903 1,05 1925 1,36 1947 4,18 1969 3,64 1991 0,98 1882 1,80 1904 0,96 1926 1,40 1948 4,46 1970 3,19 1992 0,87 1883 2,22 1905 0,93 1927 1,71 1949 4,50 1971 2,92 1993 0,90 1884 1,95 1906 0,94 1928 1,61 1950 4,74 1972 2,67 1994 0,78 1885 2,12 1907 0,97 1929 1,55 1951 4,77 1973 2,66 1995 0,81 1886 1,82 1908 0,91 1930 1,83 1952 5,03 1974 2,45 1996 0,83 1887 1,71 1909 1,04 1931 1,93 1953 5,00 1975 2,29 1997 0,75 1888 1,84 1910 0,99 1932 1,95 1954 4,97 1976 2,24 1998 0,62 1889 1,70 1911 0,97 1933 2,17 1955 5,22 1977 2,06 1999 0,56 1890 1,85 1912 0,94 1934 2,11 1956 4,97 1978 2,19 1891 1,50 1913 1,01 1935 2,43 1957 5,39 1979 2,16
Annes vekst og fall 1870-1999
Diagrammer
51
1870 1890 1910 1930 1950 1970 19900
1
2
3
4
5
6Prosent
1870 1890 1910 1930 1950 1970 19900
1
2
3
4
5
6
52
Grafisk misvisning:
Aftenposten 18/11 2001
1994 '95 '96 '97 '98 '99 '000
500
1000
1500
2000
2500
3000
53
Grafisk misvisning:
(Barne- og familieminister Laila Dåvøy, pressekonfeanse 15/3 05)
Antall barn i barnehage 1999-2004
180 000
185 000
190 000
195 000
200 000
205 000
210 000
215 000
1999 2000 2001 2002 2003 2004
År
0
50 000
100 000
150 000
200 000
250 000
1999 2000 2001 2002 2003 2004
54
”På oppdrag av…”:
Nationen 6/6 2012Nationen 22/12 2010
Nationen 13/8 2012
Nationen 19/7 2010