statmine, visuele dataexploratie

30
StatMine – prototype StatMine visuele dataexploratie Edwin de Jonge, Jan van der Laan en Jessica Solcer CBS Datavisualisatie in beweging, 24 mei 2013

Upload: edwin-de-jonge

Post on 01-Jul-2015

89 views

Category:

Technology


0 download

DESCRIPTION

Presentatie gegeven voor Data in Beweging 2013

TRANSCRIPT

Page 1: Statmine, Visuele dataexploratie

StatMine – prototypeStatMine visuele dataexploratie

Edwin de Jonge, Jan van der Laan en Jessica Solcer

CBS

Datavisualisatie in beweging, 24 mei 2013

Page 2: Statmine, Visuele dataexploratie

StatMine 0.2 2

Wat is StatMine?

Page 3: Statmine, Visuele dataexploratie

StatMine

Doel: Verbeter gebruik van huidige CBS cijfers

Hoe: Analyse-schil op StatLine

Werkwijze:• Formuleer verbeterhypothese• Maak software prototype • Test prototype op gebruikers• Evalueer test

StatMine 3

Page 4: Statmine, Visuele dataexploratie

Missie CBS?Missie CBS?

4

Page 5: Statmine, Visuele dataexploratie

Missie CBS

“Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving”

(bron: www.cbs.nl)

StatMine 0.2 5

Page 6: Statmine, Visuele dataexploratie

Missie CBS

“Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving”

StatMine 0.2 6

Page 7: Statmine, Visuele dataexploratie

7

Zonder cijfers geen beleidZonder cijfers geen beleid

Page 8: Statmine, Visuele dataexploratie

StatMine 8

Hoe gaat het met Nederland?Hoe gaat het met Nederland?

Page 9: Statmine, Visuele dataexploratie

Waarom StatMine?

• StatLine bevat meer dan één miljard cijfers voor• Beleidsmakers• Journalisten• Burgers• Bedrijven• Economen• Sociale wetenschappers• Historici• etc

StatMine 0.2 9

Page 10: Statmine, Visuele dataexploratie

StatMine 10

Probleem 1Probleem 1Cijfers ≠ Informatie Cijfers ≠ Informatie

Page 11: Statmine, Visuele dataexploratie

Missie CBS

“Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving”

StatMine 0.2 11

Page 12: Statmine, Visuele dataexploratie

1. Cijfers ≠ Informatie

• Een aantal invloedrijke (potentiele) gebruikers van CBS cijfers wordt onvoldoende bediend:• Datajournalisten• Beleidsmedewerkers

• Veel interessante informatie in StatLine wordt niet “gespot” omdat de tabelvorm dit moeilijk maakt

StatMine 0.2 12

Page 13: Statmine, Visuele dataexploratie

StatMine 13

H1:H1:Data Data analyseanalyse= = Data Data inzichtinzicht

Page 14: Statmine, Visuele dataexploratie

H1. Data inzicht

StatMine 0.1 had tot doel om meer inzicht te geven in StatLine cijfers door

•cijfers StatLine visueel en interactief te presenteren

Met StatMine I (2012 Q1) werd deze hypothese succesvol getest op 4 “moeilijke” StatLine tabellen.

StatMine 0.2 14

Page 15: Statmine, Visuele dataexploratie

StatMine 0.2 15

Staafdiagram

- vergelijken

Lijngrafiek

- ontwikkelingen

Bubble/scatter chart

- correlatie/samenhang

Mosaic chart

- structuur

Page 16: Statmine, Visuele dataexploratie

StatMine 0.2 16

Small multiples?

Page 17: Statmine, Visuele dataexploratie

StatMine 0.2 17

Page 18: Statmine, Visuele dataexploratie

StatMine 0.1 Resultaten

Periode: 2012 Q1

Testpersonen: 25 CBS-ers

Bevindingen-Testpersonen vinden dat visueel maken van data meerwaarde biedt (small multiples)-StatLine-tabeleigenaren zien hun data op een andere wijze -StatLine-tabeleigenaren willen tool als controletool

StatMine 0.2 18

Page 19: Statmine, Visuele dataexploratie

StatMine 19

Probleem 2.Probleem 2.Verbrokkelde informatieVerbrokkelde informatie

Page 20: Statmine, Visuele dataexploratie

Missie CBS

“Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving”

StatMine 0.2 20

Page 21: Statmine, Visuele dataexploratie

2. Verbrokkelde informatie

Veel informatie in StatLine is gefragmenteerd:

•Gebruiker moet in meerdere tabellen kijken en informatie zelf combineren

• Diabetes• Energiegebruik vgl economische groei• Veiligheid vgl criminaliteit

StatMine 0.2 21

Page 22: Statmine, Visuele dataexploratie

StatMine 22

2. Tabellen koppelen2. Tabellen koppelen

Page 23: Statmine, Visuele dataexploratie

H2. Tabellen koppelen

StatMine 0.2 had tot doel om meer inzicht te geven in StatLine cijfers door:

-Gebruikers zelf tabellen te laten combineren.-Voorwaarde is dat ze tenminste één dimensie gemeenschappelijk moeten hebben.

Met prototype II (2012 Q4 – 2013 Q1) is deze hypothese getest.

StatMine 0.2 23

Page 24: Statmine, Visuele dataexploratie

StatMine 0.2 Resultaten

Periode: 2012 Q4 – 2013 Q1

Testpersonen: 20 CBS-ers, 40 externen (beleidsmakers ministeries, journalisten)

Bevindingen:-Externen enthousiast over visuele mogelijkheden StatMine-Koppelen van data vervult een externe wens

StatMine 0.2 24

Page 25: Statmine, Visuele dataexploratie

StatMine 25

Probleem 3Probleem 3Statistische cijfers zijn Statistische cijfers zijn onzekeronzeker

Page 26: Statmine, Visuele dataexploratie

Missie CBS

“Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving”

(bron: www.cbs.nl)

StatMine 26

Page 27: Statmine, Visuele dataexploratie

H3 Onzekerheidsmarges

• Alle CBS cijfers hebben een onzekerheidsmarge• European Statistics Code of Practice (12.2):

• “sampling and non sampling errors should be systematically documented”

Doel van StatMine 0.3 (2013 Q2):

kijken hoe gebruikers op een begrijpelijke manier attent kunnen maken op onze onzekerheidsmarges.

StatMine 27

Page 28: Statmine, Visuele dataexploratie

• Ongeveer 5% van de StatLine tabellen publiceert expliciete marges per tabelcel:• Standaardfout (uit steekproef!)• Of boven + ondermarge

• Alle cijfers in StatLine hebben een precisie • Aantal cijfers achter komma (1, 1,0, 1,00, 1,000)• In duizendtallen/miljoenen

StatLine & marges

StatMine 0.2 28

Page 29: Statmine, Visuele dataexploratie

Beperkt zich tot:•Hoe interpreteren gebruikers de marges? Wat betekent dat voor de interpretatie van de cijfers?•Is er behoefte aan marges?

Aanname: •Voor de testtabellen is een puntschatting met bijbehorend betrouwbaarheidsinterval aanwezig.

StatMine 0.3

StatMine 0.2 29

Page 30: Statmine, Visuele dataexploratie

• Testen invloed tonen onzekerheid op antwoorden gebruikers (analyse nog bezig)

• Inbouwen van onzekerheid in:• Lijngrafieken• Staafdiagrammen• Scatterplots

StatMine 0.3

StatMine 0.2 30