Download - Rekenkamer Metropool Amsterdam | Homepage ......2015/01/12 · Rekenkamer 3 1.1.1 Doelrealisatie 3 1.1.2 Doelgroepbereik 4 1.1.3 Doeltreffendheid 5 1.1.4 Doelmatigheid 5 1.2 Leeswijzer

12 januari 2005

Directie II

Bureau Europees en Rijksbreed Doelmatigheidsonderzoek

Algemene Rekenkamer, Lange Voorhout 8, Postbus 20015, 2500 EA Den Haag

Handleiding

Onderzoek naar doelmatigheid

en doeltreffendheid

Handleiding DDO

Documentgegevens

Vul in:

Titel: Handleiding Onderzoek naar doelmatigheid en doeltreffendheid

Datum oorspronkelijke vaststelling: 1996

Datum vaststelling laatste herziening November 2005

Afdoeningsnummer: Nr. 5000452 dd 2 maart 2006

Vervangt document(en)

Handleiding doelmatigheidsonderzoek (1996)

Handleiding onderzoek naar beleidsresultaten (1997)

Handleiding efficiëntieonderzoek (2001)

Verplicht ja

Geschikt voor externe verstrekking nee

Handar-contactpersoon: Bureauchef Erdmo

Verantwoordelijke directeur: Directeur II

Vink aan:

jaarverslagen Rijk

doeltreffendheids- en doelmatigheidsonderzoek X

onderzoek naar instellingen / publieke-private samenwerking X

ontwikkelproject(en)

Heeft betrekking op:

overig

(strategische) voorbereiding

uitvoering X

rapportage / wederhoor

publicatie

Relevant in onderzoeksslangfase(n):

nazorg

Auditing standards Intosai X Voldoet aan internationale standaards:

Europese richtlijnen ter uitvoering van de Intosai-controlenormen X

geaccordeerd door College en MT X Status:

alleen geaccordeerd door MT

Handleiding DDO

Inhoud

Voorwoord 1

1 Inleiding 3 1.1 Doelmatigheids- en doeltreffendheidsonderzoek binnen de Algemene

Rekenkamer 3 1.1.1 Doelrealisatie 3 1.1.2 Doelgroepbereik 4 1.1.3 Doeltreffendheid 5 1.1.4 Doelmatigheid 5 1.2 Leeswijzer 7

2 Algemeen kader doelmatigheids- en doeltreffendheids-onderzoek 8 2.1 Inleiding 8 2.2 Wettelijk kader 8 2.2.1 Taken Algemene Rekenkamer 8 2.2.2 Bevoegdheden Algemene Rekenkamer 9 2.2.3 Bestuurlijke verantwoordelijkheid 10 2.2.4 Van beleidsbegroting tot beleidsverantwoording 11 2.2.5 Regeling prestatiegegevens en evaluatieonderzoek rijksoverheid 11

3 Onderzoeksobject en -varianten 13 3.1 Inleiding 13 3.2 Het productieproces in de publieke sector 13 3.2.1 Prestaties 14 3.2.2 Effecten 16 3.2.3 Activiteiten 18 3.2.4 Middelen 18 3.3 Verklaringen 19 3.4 Reikwijdte en methode van het onderzoek 21 3.4.1 Welke stappen moet je in het onderzoek zetten? 21 3.4.2 Hoe kies je een onderzoeksvariant? 22 3.4.3 Wie spreek je aan? 26 3.4.4 Hoe ga je om met gedecentraliseerd beleid? 27 3.4.5 Hoe onderzoek je prestaties en effecten van derden? 27

Handleiding DDO

4 Aanpak onderzoek 30 4.1 Inleiding 30 4.2 Doel-, probleem- en vraagstelling 30 4.2.1 Doelstelling 31 4.2.2 Probleemstelling 31 4.2.3 Onderzoeksvragen 32 4.2.4 Hypothesen 32 4.2.5 Overige preciseringen van het te onderzoeken veld 33 4.3 Onderzoeksmethoden 33 4.3.1 Keuze van onderzoeksmethode 34 4.3.2 Methoden 38 4.4 Methodenmatrix 53

5 Analyse van beleidsdoelen en beleidsinformatie 55 5.1 Inleiding 55 5.2 Beleidsdoelen 55 5.2.1 Algemeen 55 5.2.2 Reconstructie en operationalisatie van beleidsdoelen 56 5.2.3 Normen beleidsdoelformulering 58 5.2.4 Beoordeling beleidsdoelformulering 59 5.2.5 Aanbevelingen 59 5.3 Beleidsinformatie 59 5.3.1 Algemeen 59 5.3.2 Welke beleidsinformatie? 60 5.3.3 Bronnen van informatie over prestaties en effecten 61 5.3.4 Kwaliteit van de beleidsinformatie (product) 63 5.3.5 Kwaliteit van de beleidsinformatie (proces) 64 5.3.6 Gebruik van beleidsinformatie 67 5.3.7 Checklists voor de beoordeling van doelformulering en beleidsinformatie 68 5.3.8 Informatievoorziening aan Tweede Kamer 69 5.3.9 Nadere aandachtspunten 69 5.3.10 Aanbevelingen 70

6 Onderzoek naar doelrealisatie (en doelgroepbereik) 72 6.1 Inleiding 72 6.2 Onderzoek naar doelrealisatie 72 6.2.1 Probleemstelling en onderzoeksvragen 72 6.2.2 Normen 73 6.2.3 Onderzoeksontwerp 73 6.2.4 Indicatoren prestaties 74 6.2.5 Indicatoren effecten 75 6.2.6 Aanbevelingen 75 6.3 Onderzoek naar doelgroepbereik 76

Handleiding DDO

6.3.1 Probleemstelling 76 6.3.2 Onderzoeksvragen 77 6.3.3 Normen 79 6.3.4 Onderzoeksontwerpen 80 6.3.5 Indicatoren doelgroep 80 6.3.6 Aanbevelingen 80

7 Onderzoek doeltreffendheid 81 7.1 Inleiding 81 7.2 Probleemstelling en onderzoeksvragen 81 7.3 Normen 84 7.4 Onderzoeksontwerp 85 7.5 Onderzoeksmethoden 86 7.6 Indicatoren doeltreffendheid 87 7.7 Aanbevelingen 87

8 Onderzoek naar doelmatigheid 89 8.1 Inleiding 89 8.2 Opzet van doelmatigheidsonderzoek 89 8.2.1 Doelstelling 89 8.2.2 Probleemstelling en onderzoeksvragen 89 8.2.3 Normen 90 8.2.4 Aanbevelingen 91 8.3 Begrippen 92 8.3.1 Effecten, prestaties en middelen 92 8.3.2 Vergelijking 92 8.3.3 Kwaliteit 93 8.3.4 Verklaringen 94 8.4 Onderwerp afbakenen 94 8.4.1 Algemene of operationele doelstellingen? 95 8.4.2 Prestaties of effecten? 96 8.5 Gegevens verzamelen 97 8.5.1 Kwaliteit informatie 97 8.5.2 Informatie over effecten of prestaties 98 8.5.3 Middelen 99 8.5.4 Kwaliteit 101 8.5.5 Verklaringen zoeken en gebruiken 102 8.6 Doelmatigheid berekenen 104 8.6.1 Doelmatigheidskengetallen 106 8.6.2 FDH, DEA en SFA 112 8.6.3 Verklaren van doelmatigheidsverschillen 125

Handleiding DDO

Bijlage 1 Literatuur 134

Bijlage 2 Dataverzameling: (longitudinale) surveys 142

Bijlage 3 VBTB-begroting 144

Bijlage 4 Normen voor het beoordelen van de doelformulering 146

Bijlage 5a Normen voor de beoordeling van de (bruikbaarheid van)

beleidsinformatie 150

Bijlage 5b Uitwerking van de subnorm ‘volledigheid’ van

beleidsinformatie (onderdeel van relevantie) 153

Bijlage 5c Voorbeelden van toepassing normen uit eerder

Rekenkameronderzoek 156

Bijlage 6 Beschrijving modus-operandi-methode 166

Bijlage 7 Checklist: is het mogelijk zelf de doelmatigheid te

berekenen? 167

Bijlage 8 Algemene voorwaarden DEA en SFA 169

Bijlage 9 Begrippen 172

Handleiding DDO

1Voorwoord

Het onderzoek naar doelmatigheid en doeltreffendheid (DDO) bij de

Algemene Rekenkamer heeft sinds het uitkomen van de eerste

Handleiding doelmatigheidsonderzoek in 1996 een sterke ontwikkeling

doorgemaakt en is nog steeds sterk in beweging. Ontwikkelingen binnen

en buiten de Algemene Rekenkamer zijn hierop van invloed geweest.

Buiten de Algemene Rekenkamer hebben vooral de Comptabiliteitswet

2001 en de regeringsnota Van Beleidsbegroting tot Beleidsverantwoording

een belangrijke impuls betekend voor het DDO.

Binnen de Algemene Rekenkamer zijn vooral de missie en de

Rekenkamerstrategie relevant geweest. De handleiding is

strategieneutraal geschreven. De handleiding bevat onder meer

onderwerpen over de analyse van beleidsdoelen, de analyse van

beleidsinformatie, onderzoek naar prestaties en effecten en onderzoek

naar verklaringen. Dergelijke onderwerpen zullen in elke

rekenkamerstrategie in meer of mindere mate relevant zijn. Onderzoekers

zullen uit deze handleiding die onderdelen kunnen selecteren die relevant

zijn voor het onderzoek dat ze gaan doen.

De handleiding schetst om te beginnen het kader waarbinnen het DDO bij

de Algemene Rekenkamer wordt uitgevoerd en omschrijft de belangrijkste

begrippen.

Ook laat de handleiding zien welke keuzen je kunt maken als je een

onderzoek naar doelmatigheid en doeltreffendheid opzet en uitvoert. De

manier waarop je dat moet doen hangt sterk af van je probleemstelling

en het terrein dat je onderzoekt. Een dwingende richtlijn voor de

onderzoeksaanpak zul je in deze handleiding dan ook niet vinden. Wel zul

je altijd goed moeten onderbouwen hoe ver je in het onderzoek gaat (dit

kan variëren van louter in kaart brengen in hoeverre de doelen van

bepaald beleid zijn gerealiseerd, tot het beoordelen van de

maatschappelijke effecten en de kosten), wat voor gegevens je op welke

manier verzamelt en hoe je die zo analyseert dat je de probleemstelling

kunt beantwoorden.

Handleiding DDO

2In de formulering van conclusies spelen de normen die de Algemene

Rekenkamer stelt aan het optreden van de overheid een grote rol. In het

DDO liggen die normen vast als het gaat om de beoordeling van de wijze

waarop beleidsdoelen zijn geformuleerd (zie § 5.2.3) en om de

beoordeling van de kwaliteit van de beleidsinformatie (zie § 5.3.4).

Voor de beoordeling van de formulering van prestaties en effecten zijn er

geen algemene normen. Hier zul je specifieke normen moeten afleiden uit

de geformuleerde doelen en de gemaakte afspraken op het beleidsterrein

in kwestie (zie ook § 6.2.2). Vrijwel hetzelfde geldt voor de beoordeling

van de doeltreffendheid van beleid (§ 7.3). Om ervoor te zorgen dat we

consequent zijn bij het afleiden van normen, worden deze uitwerkingen

gecodificeerd in de Normenbank en is elk onderzoeksteam verplicht deze

te raadplegen als het een onderzoeksvoorstel opstelt en aan te vullen als

het klaar is met het onderzoek.

De handleiding DDO vervangt zowel de Handleiding

doelmatigheidsonderzoek (1996) als de Handleiding onderzoek naar

beleidsresultaten (1997) en de Handleiding efficiëntieonderzoek (2001).

Bij het schrijven van deze handleiding is gebruikgemaakt van het

materiaal uit beide handleidingen. Het materiaal dat wordt gebruikt bij de

cursus Methoden en technieken sluit aan bij de voorliggende handleiding.

Handleiding DDO

31 Inleiding

1.1 Doelmatigheids- en doeltreffendheidsonderzoek

binnen de Algemene Rekenkamer

In het doelmatigheids- en doeltreffendheidsonderzoek (DDO) van de

Algemene Rekenkamer staan prestaties en effecten centraal. In het

onderzoek naar prestaties en effecten onderscheiden we een aantal

varianten: analyse van de mate van doelrealisatie, analyse van de

doeltreffendheid van beleid en de analyse van de doelmatigheid van

effecten en prestaties.1 Deze varianten zijn gelaagd: onderzoek naar de

doeltreffendheid van beleid veronderstelt dat er ook inzicht is in de mate

waarin de doelen zijn gerealiseerd. Daarnaast is inzicht in de

doeltreffendheid van het beleid nodig om uitspraken te kunnen doen over

de doelmatigheid van de effecten. De onderzoeksvarianten – lopend van

doelrealisatie tot doelmatigheid – worden dan ook steeds complexer en

stellen steeds meer eisen aan de gebruikte gegevens (beleidsinformatie).

1.1.1 Doelrealisatie

Bij het onderzoek naar doelrealisatie breng je de na de invoering van het

beleid feitelijk ontstane (maatschappelijke) situatie in kaart en vergelijk

je deze met de doelstellingen van het beleid (de beoogde

maatschappelijke situatie). Een causaal verband tussen de prestaties van

het Rijk en de mate waarin effecten worden behaald, wordt daarbij echter

niet gelegd. Je kunt dus geen uitspraken doen over de mate waarin het

beleid van de minister wel of niet gewerkt heeft. Dit type onderzoek is

vanuit het perspectief van de Algemene Rekenkamer (verbeteren func-

tioneren van Rijk en/of rechtspersonen met een wettelijke taak) vooral

relevant als de verwachting gerechtvaardigd is dat de doelrealisatie vrij

gering zal blijken te zijn, of als je een ‘opstapje’ wilt creëren voor verder

onderzoek naar de doeltreffendheid van het beleid.

1 De analyse van doelgroepbereik wordt wel als vierde variant onderscheiden. Deze variant wordt

besproken in hoofdstuk 6; zie ook § 1.2.2 hierna.

Handleiding DDO

4De in hoofdstuk 6 geschetste aanpak voor het vaststellen van

doelrealisatie houdt daarom zoveel mogelijk rekening met nader

onderzoek naar de doeltreffendheid van het beleid.2

Soms is het nog te vroeg of om andere redenen onmogelijk om vast te

stellen of de einddoelen van beleid zijn bereikt. Dan kan het nuttig zijn

om te onderzoeken in hoeverre tussendoelen zijn gerealiseerd.Soms is

dat ook van belang omdat het realiseren van een einddoel niet onder de

verantwoordelijkheid van een minister valt, maar het realiseren van

bepaalde tussendoelen wel.

Dit geldt in het bijzonder voor doorwerkingsonderzoek. Het gaat hierbij

om de centrale vraag of de voorwaarden hebben gewerkt die de minister

gecreëerd heeft voor een goede uitvoering van het rijksbeleid op

regionaal, provinciaal of gemeentelijk niveau. Een tussenstap in de

beleidsketen dus, tússen de voorwaardenscheppende prestaties van het

Rijk en de prestaties van decentrale overheden en instellingen.

‘Doorwerkingsonderzoek’ is in een gedecentraliseerde beleidscontext een

goede aanvulling op onderzoek naar prestaties van het Rijk. De minister

is direct aanspreekbaar als blijkt dat zijn prestaties geen enkel effect op

decentraal niveau hebben teweeggebracht. Als prestaties van het Rijk

geen effect hebben bij lagere overheden (onvoldoende doorwerking) kan

dat een verklaring zijn voor het niet of onvoldoende realiseren van de

maatschappelijke effecten.

1.1.2 Doelgroepbereik

In de praktijk kan het voorkomen dat het bereiken van de einddoelen,

bijvoorbeeld ‘de bescherming van de natuur in Nederland’, zich moeilijk

laat onderzoeken. In dergelijke gevallen kun je tussendoelen

onderzoeken. De mate van doelgroepbereik is een voorbeeld van zo’n

tussendoel.

Onderzoek naar doelgroepbereik kan worden gebruikt wanneer als

beleidsresultaat wordt verondersteld dat (groepen van) mensen bepaald

gedrag gaan vertonen. Beleid kan in dergelijke gevallen alleen resultaten

teweegbrengen wanneer de juiste personen iets merken van dat beleid.

De beoogde doelgroep moet daarom op de een of andere manier in

contact komen met het beleid.

Het bereiken van de doelgroep is niet een voldoende voorwaarde om ook

de beleidsdoelen te bereiken. Maar wanneer de doelgroep of intermediairs

niet zijn bereikt, wordt het realiseren van de beleidsdoelen erg

2 Zie ook Lulofs en Schuddeboom (1991).

Handleiding DDO

5onwaarschijnlijk. In theorie kan daarom in elk onderzoek naar

beleidsresultaten aandacht besteed worden aan het bereiken van de

doelgroep of intermediairs.

1.1.3 Doeltreffendheid

Doeltreffendheidsonderzoek binnen de Algemene Rekenkamer is

onderzoek naar de vraag in hoeverre dankzij het regeringsbeleid de

gewenste beleidsresultaten worden bereikt. Onder beleidsresultaten

worden zowel prestaties (output) als de daarmee gerealiseerde effecten

(outcome) verstaan.

Onderzoek naar de doeltreffendheid van beleid is gecompliceerd, omdat

enerzijds sprake kan zijn van een lange beleidsketen en anderzijds omdat

er externe factoren kunnen zijn die ook van invloed kunnen zijn op de te

bereiken einddoelen. Tussen directe overheidsprestaties en de uiteindelijk

gerealiseerde maatschappelijke situatie zitten vaak vele schakels.3 Hoe

verder een prestatie of effect in de keten gelegen is, des te moeilijker de

causale relatie is te leggen met ingezet beleid. De bereikte effecten zijn

vaak niet alleen tot stand gekomen door het beleid van de minister, maar

ook door allerlei andere factoren. Zo wordt de herintreding van vrouwen

op de arbeidsmarkt niet alleen beïnvloed door maatregelen op het vlak

van de arbeidsbemiddeling van herintredende vrouwen, maar ook door

sociaal-economische omstandigheden.

1.1.4 Doelmatigheid

Voor de burger telt niet alleen of beleidsresultaten zijn geleverd, maar

ook tegen welke kosten dit is gebeurd en of dat beter kan. Daarom is het

van belang om – in het verlengde van onderzoek naar effecten

respectievelijk prestaties – onderzoek te doen naar de doelmatigheid

(efficiëntie). Dat onderzoek kan zich richten op de effecten of de

prestaties die zijn geleverd voor het beleid.

In het eerste geval wordt gesproken van doelmatigheid van

(beleids)effecten (ook wel: kosteneffectiviteit), in het tweede geval van

doelmatigheid van (beleids)prestaties. Het gaat daarbij om de vraag:

• of deze effecten respectievelijk prestaties niet met de inzet van

minder middelen gerealiseerd hadden kunnen worden; dan wel

3 Een voorbeeld: subsidies bij milieubeleid. De keten van prestaties naar maatschappelijk effect

omvat schakels als: uitgekeerde subsidies, bekendheid doelgroep met subsidie, aanschaf product

door doelgroep, gebruik van product door doelgroep, veranderingen in milieu.

Handleiding DDO

6• of niet méér effecten respectievelijk prestaties verwezenlijkt hadden

kunnen worden met dezelfde inzet van middelen.

In de praktijk worden ook wel de termen ‘doelmatigheid van beleid’ en

‘doelmatigheid van bedrijfsvoering’ gehanteerd. Het eerste begrip heeft

betrekking op de beleidseffecten, het tweede op de beleidsprestaties.

Figuur 1.1 geeft weer welke relatie doelmatigheids- en

doeltreffendheidsonderzoek hebben met de verschillende aspecten uit het

productieproces in de publieke sector. De varianten ‘doelrealisatie’ en

‘doelgroepbereik’ staan hier niet in, omdat ze eigenlijk slechts een

onderdeel zijn van doeltreffendheidsonderzoek.

Figuur 1.1 Productieproces in de publieke sector (Bron: Ministerie van

Financiën, 2001).

In bovenstaande figuur zijn zowel de beoogde als de daadwerkelijk

gerealiseerde prestaties en effecten van belang.

input

personeel, materieel, geld

throughput

productieproces

output

producten, diensten

outcome

effect

middelen activiteiten prestaties effecten

economy

zuinigheid

efficiency

Doelmatigheid van prestaties

(kosteneffectiviteit)

cost-effectiveness

Doelmatigheid van effecten

Doeltreffendheid van het beleid

effectivity

effectiviteit

Handleiding DDO

71.2 Leeswijzer

Hoofdstuk 2 van deze handleiding behandelt het wettelijk kader, relevant

voor het doen van onderzoek naar doelmatigheid en doeltreffendheid. Ons

instituut heeft een in de Grondwet verankerde onafhankelijke positie in

het staatsbestel. Taken en bevoegdheden zijn uitgewerkt in de

Comptabiliteitswet. In dit hoofdstuk beschrijven we hoe de staats-

rechtelijke positie en de taken en bevoegdheden van de Algemene

Rekenkamer aan het DDO zijn eigen karakter geven.

In hoofdstuk 3 bespreken we het onderzoeksobject: welke aspecten

kunnen we onderscheiden in het productieproces van de overheid en

welke typen prestaties en effecten komen aan de orde in

Rekenkameronderzoek? In dit hoofdstuk geven we ook aan hoe je een

keuze kunt maken tussen onderzoek naar doelrealisatie, doelgroepbereik,

doeltreffendheid en doelmatigheid.

Hoofdstuk 4 behandelt manieren waarop je in het DDO gegevens

verzamelt en analyseert. Afhankelijk van de probleemstelling en de

gekozen onderzoeksvariant kun je verschillende methoden van

dataverzameling gebruiken om uitspraken te doen over de al dan niet

gerealiseerde prestaties en effecten. Afhankelijk van de gekozen

dataverzamelingsmethode kun je vervolgens een aantal data-

analysemethoden gebruiken om mogelijke verklaringen voor verschillen in

prestaties en effecten te toetsen. In dit hoofdstuk passeren de

verschillende methoden de revue.

Hoofdstuk 5 schetst hoe beleidsdoelen onderzocht kunnen worden (welke

prestaties en effecten worden beoogd?), en welke normen gehanteerd

worden bij de beoordeling van beleidsinformatie.

De hoofdstukken 6 tot en met 8 behandelen hoe je aan de hand van

beleidsinformatie van voldoende kwaliteit of zelf verzamelde gegevens

prestaties en effecten kunt onderzoeken. We presenteren voor de

verschillende varianten voor onderzoek naar prestaties en/of effecten

de probleemstellingen, normen, onderzoeksontwerpen en mogelijke

aanbevelingen.

Het is nadrukkelijk niet de bedoeling dat in elk onderzoek de handleiding

van A tot Z wordt gevolgd. Het is juist de bedoeling dat onderzoekers de

onderdelen selecteren die relevant zijn voor het onderzoek dat ze gaan

doen.

Handleiding DDO

82 Algemeen kader doelmatig-heids- en doeltreffendheids-onderzoek

2.1 Inleiding

De Algemene Rekenkamer heeft een in de Grondwet verankerde onaf-

hankelijke positie in het staatsbestel. Taken en bevoegdheden zijn

uitgewerkt in de Comptabiliteitswet 20014 (CW 2001).

Richtinggevend voor het onderzoek van de Algemene Rekenkamer is de

bestuurlijke verantwoordelijkheid van bewindspersonen en besturen van

instellingen die met de rijksoverheid verbonden zijn (§ 2.2.3).

2.2 Wettelijk kader

2.2.1 Taken Algemene Rekenkamer

In de Grondwet is vastgelegd dat de Algemene Rekenkamer belast is met

het onderzoek van de ontvangsten en uitgaven van het Rijk (artikel 76

Grondwet). De inrichting, samenstelling en bevoegdheid van de Algemene

Rekenkamer moeten volgens de Grondwet geregeld worden in een wet.

Dit is de Comptabiliteitswet 2001 (CW 2001). Daarin is ook een nadere

uitwerking gegeven aan het onderzoek dat de Algemene Rekenkamer kan

verrichten. De Grondwet bepaalt verder dat ook in bijzondere wetten

taken aan de Algemene Rekenkamer kunnen worden opgedragen.

Het DDO is in de CW 2001 omschreven als onderzoek naar “de

doeltreffendheid en doelmatigheid van het gevoerde beleid, de

doelmatigheid van het financieel en materieel beheer, de daartoe

bijgehouden administraties en de organisatie van het Rijk” (artikel 85 CW

2001)5.

4 Stb. 2002, 413. 5 Uit de weten regelgeving wordt in elk geval niet duidelijk wat precies onder 'de doelmatigheid

van het financieel en materieel beheer, de daartoe bijgehouden administraties en de organisatie

van het Rijk' wordt verstaan. Zo verwijst de Memorie van Toelichting op de Comptabiliteitswet

2001 (MvT) bij dit artikel voor een nadere toelichting naar de toelichting op de artikelen 20 en 21.

Handleiding DDO

9

Artikel 91 CW 2001 geeft de Algemene Rekenkamer bovendien bepaalde

bevoegdheden tot onderzoek bij rechtspersonen met een wettelijke taak

(RWT’s) of een financiële binding met het Rijk.

Artikel 92 CW 2001 geeft de Algemene Rekenkamer daarnaast

bevoegdheden om onderzoek uit te voeren bij organisaties die Europese

subsidies ontvangen.6

Artikel 90 CW ten slotte, 2001 biedt de Staten-Generaal de mogelijkheid

om de Algemene Rekenkamer te verzoeken bepaalde specifieke

onderzoeken in te stellen.

2.2.2 Bevoegdheden Algemene Rekenkamer

De Algemene Rekenkamer beschikt over ruime bevoegdheden voor haar

onderzoek bij onderdelen van het Rijk. Artikel 87 CW 2001 bepaalt dat de

Algemene Rekenkamer bevoegd is administraties, documenten en andere

informatiedragers op door haar aan te geven wijze te onderzoeken.

Bewindspersonen zijn bovendien gehouden desgevraagd de inlichtingen te

verstrekken die de Algemene Rekenkamer voor de uitoefening van haar

taak nodig acht. Ook voor onderzoek bij met het Rijk verbonden organen

heeft de Algemene Rekenkamer bevoegdheden. Als geld met bepaalde

doelen van het Rijk naar een instelling stroomt, dan is de AR bevoegd te

onderzoeken wat er met deze geldstroom gebeurt. Bij RWT’s beperkt de

bevoegdheid van de Algemene Rekenkamer zich tot datgene wat met die

wettelijke taak heeft te maken (en geldt dus niet voor eventuele andere

activiteiten van diezelfde instelling).

In deze artikelen worden de begrippen doelmatigheid van beleid en doelmatigheid van

bedrijfsvoering gehanteerd. De MvT definieert de doelmatigheid van bedrijfsvoering als de relatie

tussen prestaties en middelen. De MvT is hier overigens niet geheel eenduidig in en rekent ook de

relatie tussen de (kosten van de) inzet van sturings- en beheersingsinstrumenten en de risico's die

de organisatie loopt (p. 33) tot de doelmatigheid van bedrijfsvoering. De Algemene Rekenkamer

heeft hierover al eerder opgemerkt dat deze omschrijving van doelmatigheid onjuist is en niet

consequent met hoe de term op andere plaatsen in de MvT is gebruikt De MvT hanteert daarnaast

het begrip doelmatigheid van apparaatsuitgaven dat in de MvT een identieke definitie heeft als

doelmatigheid van bedrijfsvoering (terwijl dit verschillende begrippen zijn). In deze handleiding

wordt uitgegaan van de termen doelmatigheid van beleid en doelmatigheid van bedrijfsvoering (zie

hoofdstuk 1). Voor een uitgebreidere beschrijving van een aantal onduidelijkheden en

onvolkomenheden op het gebied van doelmatigheid in de weten regelgeving verwijzen we naar

het Rekenkamerrapport Doelmatigheidsinformatie in begroting en jaarverslag. 6 Meer in het bijzonder heeft de Algemene Rekenkamer bevoegdheden ‘ten aanzien van

rechtspersonen, commanditaire vennootschappen, vennootschappen onder firma en natuurlijke

personen die een beroep of bedrijf uitoefen aan wie door de Raad van de Europese Unie, het

Europees Parlement en de Raad gezamenlijk of de Commissie van de Europese Gemeenschappen

op grond van een vastgesteld programma rechtstreeks of onmiddellijk een subsidie wordt

verstrekt.”

Handleiding DDO

10De Algemene Rekenkamer geeft geen jaarlijks oordeel over de

doelmatigheid en doeltreffendheid van het gevoerde beleid.

Ondoelmatigheid of ondoeltreffendheid van het beleid kan ook geen grond

zijn voor formeel bezwaar, zoals dat in het rechtmatigheidsonderzoek wel

het geval kan zijn als het gaat om het gevoerde financieel beheer, het

materieelbeheer of de verantwoording daarover (artikel 88 en 89

CW 2001).

2.2.3 Bestuurlijke verantwoordelijkheid

Uitgangspunt voor het onderzoek van de Algemene Rekenkamer is de

verantwoordelijkheid van bewindspersonen (zie artikel 42 Grondwet) en,

bij onderzoek naar RWT’s, ook van de besturen van deze instellingen.

Enkele artikelen in de CW 2001 zijn specifiek gewijd aan de ver-

antwoordelijkheid van bewindspersonen voor de doelmatigheid en

doeltreffendheid van het beleid. Volgens artikel 20 CW 2001, eerste lid, is

elke bewindspersoon verantwoordelijk voor de doelmatigheid en

doeltreffendheid van het beleid dat aan zijn of haar begroting ten

grondslag ligt. De invulling van deze algemene ministeriële verantwoorde-

lijkheid is afhankelijk van de mate waarin de uitvoering van beleid is

gedecentraliseerd naar RWT’s7 of lagere overheden. Deze invulling is een

belangrijk sturend element in het onderzoek naar doelmatigheid en doel-

treffendheid door de Algemene Rekenkamer (meer hierover in hoofdstuk

3). Het tweede lid van artikel 20 CW 2001 schrijft voor dat de minister

zorgdraagt voor het periodiek onderzoeken van de doelmatigheid en

doeltreffendheid van het door hem of haar gevoerde beleid. De centrale

directie Financieel-Economische Zaken (FEZ) heeft hierin een

coördinerende taak (Besluit taak FEZ). Het derde lid van artikel 20 CW

2001 bepaalt dat de minister de Algemene Rekenkamer tijdig op de

hoogte stelt van de onderzoeken naar doelmatigheid en doeltreffendheid

die hij doet instellen en van de resultaten ervan.8

De verantwoordelijkheid die besturen van de RWT’s hebben voor de

besteding van het aan deze instellingen verstrekte rijksgeld of de

uitoefening van de aan hen opgedragen wettelijke taak (voor zover

gefinancierd uit een wettelijke heffing) is bepalend voor de reikwijdte van

het onderzoek bij RWT’s (ook wel ‘artikel 91-onderzoek’ genoemd).

7 Meer in het algemeen: naar zelfstandige bestuursorganen. Zie de site van het RWT-onderzoek op

intranet voor een nadere uitleg van het precieze verschil tussen RWT’s en ZBO’s. 8 Vergelijkbare verantwoordelijkheden met betrekking tot de bedrijfsvoering zijn omschreven in

artikel 21 van de CW 2001.

Handleiding DDO

112.2.4 Van beleidsbegroting tot beleidsverantwoording

De regeringsnota Van beleidsbegroting tot beleidsverantwoording (VBTB)

is eind jaren negentig opgezet om de begrotingsstukken meer

beleidsgericht te maken. Het achterliggende besturingsmodel van VBTB is

resultaatgericht: de overheid stuurt actief op geleverde prestaties en de

effecten van die prestaties.9

Van belang voor het DDO zijn met name de beleidsparagrafen in de

nieuwe begrotingen en jaarverslagen. De beleidsartikelen, die onderdeel

zijn van de beleidsparagrafen, moeten antwoord geven op de volgende

drie w- en h-vragen:

• Wat willen we bereiken? (uitgedrukt in te bereiken effecten) / Hebben

we bereikt wat we ons hadden voorgenomen?

• Wat gaan we daarvoor doen? / Hebben we daarvoor gedaan wat we

zouden doen?

• Wat mag dat kosten? / Heeft het gekost wat we dachten dat het zou

kosten?

2.2.5 Regeling prestatiegegevens en evaluatieonderzoek rijksoverheid

In februari 2001 is de Regeling Prestatiegegevens en Evaluatieonderzoek

Rijksoverheid verschenen.10 De regeling is nadrukkelijk gekoppeld aan de

regeringsnota VBTB. Deze regeling van het ministerie van Financiën geeft

een aantal nadere invullingen aan bepalingen uit de Comptabiliteitswet,

die ook van belang zijn voor het DDO van de Algemene Rekenkamer. Zij

bevat voorschriften over (p.9):

• de geïntegreerde inzet van evaluatie-instrumenten;

• de afweging die gemaakt moet worden bij de inzet van

evaluatieonderzoek ex ante;

• de mate waarin en de frequentie waarmee beleid met periodiek

evaluatieonderzoek ex post wordt afgedekt (volledigheid en

periodiciteit);

• de methodologisch-technische kwaliteit van evaluatie-instrumenten

en de wijze waarop beleidsinformatie tot stand komt;

• de wijze waarop de ambtelijke en politieke top van de uitkomsten van

periodiek evaluatieonderzoek op de hoogte worden gebracht; en

• de verantwoordelijkheden binnen een departement voor een goede

uitvoering van deze regeling.

9 Van der Knaap (2000). 10 De regeling, die mede naar aanleiding van het Rekenkamerrapport Organisatie van de

beleidsevaluatie (maart 2000) is opgesteld, vervangt de Handleiding Kengetallen uit 1994 (Hafir

A2.6) en het Referentiekader voor evaluatie-instrumenten uit 1998 (Hafir A5.5). De nieuwe

regeling is eveneens opgenomen in Hafir.

Handleiding DDO

12

In de regeling verstaat men onder evaluatie-instrumenten zowel

(informatie)systemen van reguliere prestatiegegevens als periodiek uit te

voeren evaluatieonderzoeken. Beide leveren informatie op over de

doeltreffendheid en doelmatigheid van beleid (en de doelmatigheid van

bedrijfsvoering) en zijn daarmee ook voor de Algemene Rekenkamer een

belangrijke bron voor de beoordeling van (beleids)informatie.

Handleiding DDO

133 Onderzoeksobject en -varianten

3.1 Inleiding

Het doelmatigheids- en doeltreffendheidsonderzoek (DDO) van de

Algemene Rekenkamer richt zich op de vraag: worden de doelen

(prestaties en/of effecten) gerealiseerd, worden de doelen behaald

dankzij het gevoerde beleid en is het beleid doelmatig? Aan de hand van

het ‘productieproces van de publieke sector’ geeft dit hoofdstuk aan welke

aspecten van belang zijn om mee te nemen in het onderzoek naar

prestaties en/of effecten.

3.2 Het productieproces in de publieke sector

In het DDO bekijkt de Algemene Rekenkamer het functioneren van de

publieke sector (rijksoverheid en RWT’s) vooral als een productieproces.

In dat proces onderscheiden we vier aspecten: middelen, activiteiten,

prestaties en effecten (input, throughput, output en outcome). Door je

onderzoek te richten op verschillende combinaties van deze aspecten kun

je uitspraken doen over doelrealisatie, doelgroepbereik, doeltreffendheid

en doelmatigheid van beleid en de doelmatigheid van bedrijfsvoering. Bij

doelrealisatie, doelgroepbereik en doeltreffendheid zet je de betreffende

combinaties af tegen de doelstellingen van het beleid. Dit is al beschreven

in hoofdstuk 1.

Figuur 3.1. Productieproces publieke sector (Bron: Ministerie van Financiën 2001, met

aanpassing; zie ook Bouckaert 1999).

Het is niet altijd mogelijk om duidelijk onderscheid te maken tussen

prestaties en effecten. Vaak is er sprake van een keten van prestaties en

effecten, waarbij het een kwestie van afspraak is waar de grens wordt

input

personeel, materieel, geld

throughput

productieproces

output

producten, diensten

outcome

middelen activiteiten prestaties effecten

Handleiding DDO

14getrokken. Als je dit in het onderzoek moet doen, zorg dan in ieder geval

dat je er met het betreffende departement duidelijkheid over krijgt waar

de bewindspersoon of het bestuur van een RWT nog verantwoordelijk

voor is en waar niet meer voor.

Prestatie of effect?

Het Centrum voor Werk en Inkomen (CWI) heeft onder meer als taak (doel van het beleid)

werklozen aan een baan te helpen. Hiertoe verwijzen CWI’s werkzoekenden op vacatures.

Is deze verwijzing op zichzelf een prestatie of is het pas een prestatie als de verwijzing tot

een plaatsing (werk) heeft geleid? Of is dit laatste een effect? En wanneer telt een

plaatsing mee? Als de werkzoekende de baan accepteert of pas als hij een bepaalde

minimale periode is blijven werken?

3.2.1 Prestaties

(Beleids)prestaties zijn de resultaten van werkprocessen die binnen een

organisatie worden doorlopen om een beleidsdoelstelling te realiseren.

Prestaties van het Rijk

Prestaties van het Rijk zijn de aan de doelstelling van het beleid

gerelateerde resultaten van werkprocessen van een

organisatie(onderdeel) van het Rijk die bestemd zijn voor de

‘buitenwereld’. Prestaties van het Rijk kunnen verschillende soorten

producten en diensten behelzen. Enerzijds gaat het om prestaties die

extern merkbaar zijn bij burgers, maatschappelijke instellingen en

bedrijven. Voorbeelden van zulke prestaties zijn: subsidies, heffingen en

voorlichtingscampagnes.

Anderzijds zijn er ‘faciliterende’ prestaties waarbij de ministeries een

dienst verlenen aan derden, zoals lagere overheden of RWT’s/ZBO’s.

Voorbeelden hiervan zijn: weten regelgeving, het afsluiten van

convenanten, het houden van toezicht (op bijvoorbeeld de prestaties van

lagere overheden of RWT’s), het opzetten van een geautomatiseerd

systeem of het verzamelen van relevante beleidsinformatie.

Sommige van deze prestaties zijn meer intern dan extern gericht en lijken

daarmee eerder onderwerp voor een beheeronderzoek. Toch kan dit soort

prestaties, bijvoorbeeld het opzetten van een geautomatiseerd systeem

voor registratie van mestoverschotten, wel eens het enige zijn wat je op

een bepaald beleidsterrein mag verwachten van de rijksoverheid.

Daarmee is het dus ook een relevante prestatie voor het bereiken van

een extern effect.

Handleiding DDO

15

Faciliterende prestaties komen vooral voor bij territoriaal of functioneel

gedecentraliseerd beleid. De ‘echte’ extern gerichte prestaties, de finale

prestaties aan burgers, maatschappelijke instellingen en bedrijven –

waarop het DDO zich bij voorkeur primair richt –, worden in dat geval

door derden (zoals lagere overheden en RWT’s/ZBO’s) geleverd.11

Prestaties van derden

Prestaties van derden zijn de aan de doelstelling van het Rijksbeleid

gerelateerde resultaten van werkprocessen van een

organisatie(onderdeel) buiten het Rijk die bestemd zijn voor de

‘buitenwereld’. Het gaat het om prestaties die extern merkbaar zijn bij

burgers, maatschappelijke instellingen en bedrijven. Een voorbeeld: bij

het beleid gericht op het verminderen van de hoeveelheid bedrijfsafval in

Nederland, betreffen de beleidsprestaties van het Rijk onder meer het

ontwikkelen van weten regelgeving en het faciliteren van de

vergunningverlening van lokale overheden aan bedrijven. In dit voorbeeld

is het uiteindelijke effect, te weten minder afval, afhankelijk van onder

andere de vergunningverlening door lokale overheden (de prestatie).

Andere voorbeelden van prestaties van derden zijn: het aantal nieuwe

politieagenten (te leveren prestatie voor veiligheidsbeleid) en het aantal

beschikbare plaatsen voor inburgeringcursussen (te leveren prestatie voor

inburgeringbeleid).

Vaak is de gemeente of provincie ook nog een doorgeefluik voor

uitvoerende organisaties. Dit was bijvoorbeeld het geval bij

kinderopvang.12 Het Rijk geeft geld aan gemeenten die het vervolgens

weer verdelen over kinderopvanginstellingen (niet met de overheid

verbonden non-profit- en for-profit-instellingen). De

kinderopvanginstellingen leveren de uiteindelijke prestaties en als effect

daarvan zien we bijvoorbeeld een toename van het aantal moeders dat

blijft werken na de geboorte van hun kind(eren).13

Op grond van de bevoegdheden van de Algemene Rekenkamer kunnen de

prestaties van RWT’s zelf ook zelfstandig object van

Rekenkameronderzoek zijn. Voor het onderzoeken van de prestaties van

RWT’s gelden in principe dezelfde regels als voor onderzoek naar

prestaties van het Rijk. Bijzonder aan het RWT-onderzoek is wel – in

11 Zie ook De Groot & Goudriaan (1991) voor het onderscheid tussen intermediaire en finale

producten. 12 Bij de inwerkingtreding van de nieuwe Wet basisvoorziening kinderopvang is dat niet langer het

geval. De financiering loopt dan rechtstreeks via de ouders. 13 Zie Turksema (2000).

Handleiding DDO

16vergelijking met de andere derden die prestaties leveren voor Rijksbeleid

– dat ook de bedrijfsvoering van de RWT kan worden onderzocht.14

Heterogene prestaties

De prestaties van Rijk en derden kunnen heterogeen van aard zijn: ze

verschillen dan bijvoorbeeld in complexiteit en/of kwaliteit. In het geval

van heterogene prestaties is het van belang om de prestaties te

differentiëren. Dit kan door de prestaties te verdelen over een aantal

homogene categorieën (meer hierover in § 4.3.2.1).15

Het is van belang om de kwaliteit en complexiteit van de prestaties mee

te nemen in het onderzoek. Mogelijk hebben bijvoorbeeld toegenomen

prestaties (in kwantitatieve zin) als ongewenst neveneffect dat de

kwaliteit van de geleverde prestaties achteruit is gegaan.

Onderzoekbaarheid

Het in kaart brengen van de prestaties zal in de praktijk in vergelijking

met effecten gemakkelijker zijn. Informatie over prestaties is meestal

namelijk óf aanwezig óf betrekkelijk eenvoudig te verzamelen.

Van ministeries mag immers worden verwacht dat zij inzicht hebben in de

prestaties die zij zelf hebben geleverd ter realisatie van hun beleid.

Hetzelfde mag worden verwacht van derden die betrokken zijn bij (de

uitvoering van) het beleid, zoals RWT’s en decentrale overheden. De

rijksoverheid zal er door middel van afspraken met deze derden voor

moeten zorgen dat zij de benodigde informatie krijgt en verwerkt.

3.2.2 Effecten

Effecten

(Beleids)effecten zijn de gevolgen van beleid van het Rijk of RWT die

merkbaar zijn in de maatschappij. Voorbeelden van effecten zijn: de

reductie van CO2-uitstoot (beoogd effect van klimaatbeleid), meer

mensen die zich veilig voelen op straat (beoogd effect van

veiligheidsbeleid) en betere inburgering van allochtonen (beoogd effect

van inburgeringbeleid).

Onderzoekbaarheid

Effecten zijn lastig om te onderzoeken, omdat het lastig is om deze te

kwantificeren (bijvoorbeeld: ‘goede volksgezondheid in Nederland’) en

omdat vaak moeilijk is vast te stellen in hoeverre deze effecten dóór het

rijks- respectievelijk RWT-beleid zijn gerealiseerd. Bij effecten kunnen

14 Meer informatie over RWT’s (bijvoorbeeld over definities, normen, onderzoeksvoorstellen

enzovoort) kan worden gevonden op de site van het RWT-onderzoek op intranet (map

Kennisdomeinen/Toezicht – Publiek Privaat/RWT). 15 Zie hiervoor als voorbeeld Algemene Rekenkamer (2001a).

Handleiding DDO

17immers behalve de minister (of andere bij het beleid betrokken partijen)

ook andere factoren van invloed zijn, zoals demografische ontwikkelingen

of de situatie op de arbeidsmarkt. De rijksoverheid wil bijvoorbeeld dat de

Centra voor Werk en Inkomen mensen aan het werk helpen. De

mogelijkheid om mensen aan een baan te helpen wordt niet alleen

beïnvloed door de activiteiten van de Centra voor Werk en Inkomen, maar

ook door bijvoorbeeld de arbeidsmarktsituatie (het aantal beschikbare

vacatures) en daarmee samenhangend de economische situatie (meer

aanbod van werk in een goede economische situatie). Om de effectiviteit

van het beleid te kunnen bepalen, moet de invloed van externe factoren

worden geëlimineerd. Dat is een lastige klus. Daarom kun je soms beter

volstaan met het onderzoeken van prestaties. Jammer is dat wel, daarom

wordt aanbevolen om – indien mogelijk –, behalve de prestaties zelf, ook

de effecten van de geleverde prestaties te onderzoeken.16 Immers,

geleverde prestaties leiden niet noodzakelijkerwijs tot het beoogde

(maatschappelijke) effect. Ze zijn hoogstens een noodzakelijke, maar

geen voldoende voorwaarde voor het realiseren van het beoogde

eindeffect.

Daarnaast is een oordeel over effecten van belang omdat dit de

aansprekendheid en de relevantie van het onderzoek verhoogt. Voor de

burger telt uiteindelijk vaak niet de beleidsprestatie, maar de mate

waarin het (maatschappelijk) probleem wordt opgelost of verminderd. De

minister is daarop aanspreekbaar.

Een derde reden om effecten te onderzoeken is het gevaar dat de

toegenomen aandacht voor sturing op basis van prestaties met zich mee

kan brengen dat je de inhoudelijke doelstelling uit het oog verliest (het

optreden van de performance paradox). Zo kan, indien de bekostiging

van het onderwijs plaatsvindt op basis van het aantal afgestudeerden, de

neiging ontstaan in te leveren op het niveau van de afgestudeerden. Bij

onderzoek naar de gehele keten zou dit kunnen worden opgemerkt,

bijvoorbeeld doordat de betrokken generatie studenten minder snel werk

kan vinden (overige omstandigheden gelijkblijvend).

Neveneffecten

Het kan van belang zijn om in een onderzoek naar prestaties en effecten

ook eventuele (negatieve én positieve) neveneffecten te bekijken. Vooral

bij ongewenste neveneffecten is dat relevant.

16 Een voorbeeld van zoveel mogelijk aandacht voor de gehele keten van prestaties en effecten is

te vinden in het Rekenkameronderzoek Gesubsidieerde arbeid (Algemene Rekenkamer, 1996). In

dit onderzoek zijn diverse instrumenten ter bestrijding van werkloosheid bekeken; zowel prestaties

als effecten komen hierbij aan bod, zoals creatie additionele banen, uitstroom uit additioneel werk

en instroom in regulier werk.

Handleiding DDO

18

Onderzoek naar neveneffecten wordt gecompliceerd door het feit dat dit

in principe alle kanten op kan; het wordt niet begrensd door

beleidsdoelen. Een mogelijke manier om toch een afbakening aan te

brengen is: focussen op die neveneffecten die in ander dan het onder-

zochte beleid juist worden bestreden (bijvoorbeeld ongunstige

milieueffecten van economisch beleid).

3.2.3 Activiteiten

Onder ‘activiteiten’ verstaan we al datgene wat in een ministerie of bij

een derde wordt uitgevoerd om middelen om te kunnen zetten in

prestaties voor het beleid. Met andere woorden: activiteiten hebben

betrekking op de uitvoering van het beleid – niet op de uitkomsten van

het beleid (dat zijn immers prestaties en/of effecten). Voorbeelden van

activiteiten zijn: het beoordelen van vergunningen, het volgen van

trainingen en het werven en opleiden van personeel.

Het kan van belang zijn om de activiteiten mee te nemen in onderzoek

naar prestaties en effecten. Verkeerd gekozen activiteiten kunnen een

verklaring bieden voor onder andere achterblijvende prestaties en/of

effecten (zie § 3.3).

3.2.4 Middelen

Bij middelen gaat het om de middelen die zijn ingezet om de effecten dan

wel prestaties te realiseren.17 Middelen zijn: het ingezette personeel, het

verbruikte materiaal, de ingehuurde diensten en de uitgaven aan (niet-)

financiële beleidsinstrumenten (zoals subsidies, leningen en

voorlichtingsprogramma’s). Dit geldt voor zowel het Rijk als voor de

derden.

Om de totale inzet van middelen te bepalen is het voor het meten van

doelmatigheid noodzakelijk de verschillende middelen in één grootheid uit

te drukken. De meest voor de hand liggende is geld. Het uitdrukken van

middelen in geld kan op twee manieren: in termen van kosten en in

termen van uitgaven. Uitgaven zijn betalingen die zijn gedaan op basis

van aangegane verplichtingen. Kosten betreffen de waarde van de

verbruikte middelen die nodig zijn voor het kunnen uitoefenen van de

bedrijfsvoering.

17 Zie ook Hoogerwerf (1980): al datgene wat door het Rijk of een RWT gebruikt (kan worden) om

het bereiken van een of meer doeleinden te bevorderen.

Handleiding DDO

19

3.3 Verklaringen

In het onderzoek naar prestaties en/of effecten is het van belang om

inzicht te krijgen in mogelijke oorzaken van eventueel achterblijvende

prestaties en effecten of ondoelmatigheden. Inzicht in deze oorzaken kan

nodig zijn om relevante aanbevelingen te kunnen doen aan de ministers,

RWT’s en/of Tweede Kamer. De oorzaken voor achterblijvende prestaties

en effecten of ondoelmatigheden kunnen zowel intern als extern van aard

zijn.

Interne oorzaken zijn oorzaken die liggen binnen het ministerie en/of de bij

het beleid betrokken derde. Hierbij kun je denken aan: onvoldoende duidelijke

of realistische formulering van het doel van het beleid, het inzetten van de

verkeerde beleidsinstrumenten, het ondernemen van de verkeerde activiteiten

en het creëren van onvoldoende randvoorwaarden voor doeltreffendheid.

Maar ook kenmerken van de organisatie, zoals de (kwaliteit van de) personele

bezetting vallen hieronder.

Het is ook mogelijk dat externe factoren, die buiten de invloedssfeer van het

Rijk of derden liggen en moeilijk door de organisatie te beïnvloeden zijn, de

oorzaak vormen van achterblijvende prestaties en effecten of

ondoelmatigheden. Voorbeelden van externe factoren zijn: onvoldoende steun

voor het gevoerde beleid, bestuurlijke complexiteit (denk aan het complexe

gebouw van de sociale zekerheid, functioneel en territoriaal gedecentraliseerd

beleid, marktwerking en privatisering), onvoldoende mogelijkheden tot effect-

vergroting, andere (beleids)ontwikkelingen die het mogelijke positieve effect

van het gevoerde beleid tenietdoen, en conjuncturele ontwikkelingen.

Om het brede palet aan mogelijke verklaringen te schetsen gebruiken we

een matrix. Op de verticale as wordt een onderscheid gemaakt naar de

beïnvloedingsmogelijkheden van het rijk. Eigenlijk gaat het hier om het

vraagstuk van de ministeriële verantwoordelijkheid. Op de horizontale as

wordt een onderscheid gemaakt tussen verklaringen voor achterblijvende

prestaties en voor achterblijvende effecten. Die prestaties hebben we

ruim opgevat. Voor de burger maakt het immers niet uit of een minister

zijn werk niet goed doet of een uitvoerende instantie.

Handleiding DDO

20Tabel 3.1: De verklaringenmatrix

Verklaringen voor achterblijvende

prestaties van het Rijk en daarmee

verbonden organen én lokale

overheden (in medebewind)

Verklaringen voor

achterblijvende

maatschappelijke effecten

Binnen directe

beïnvloedings-

sfeer minister

ORGANISATIE EN UITVOERING VAN

BELEID

• Mismatch tussen prestatiedoelen, tijd,

mensen en middelen (overambitieus)

• Doelen te weinig sturend

• Doelen niet SMART-C

• Overproductie van beleid

• Strijdig beleid van andere ministeries

• Gebrekkig wetgevend kader

• Gebrekkige handhaving

• Bedrijfsvoeringsproblemen:

onvoldoende financieel en

materieelbeheer, ontoereikende ICT,

onrechtmatigheden

• Onduidelijke taken en bevoegdheden

• Discongruente gebiedsindelingen

KWALITEIT VAN BELEID

• Gebrekkige beleidstheorie

(instrumentkeuze is

ontoereikend of geen

rekening gehouden met

neveneffecten)

• Onvoldoende adaptief

vermogen om in te spelen op

veranderende

omstandigheden

• Achterblijvende prestaties

van het Rijk

Buiten directe

beïnvloedingssf

eer minister

BETROKKENHEID VAN EN UITVOERING

DOOR DERDEN

• Ontbreken van draagvlak bij

stakeholders (deels binnen en deels

buiten de beïnvloedingssfeer – moet

per geval worden beoordeeld)

• Strijdig beleid van EU, provincies en

gemeenten

• Uitvoerders die wel willen, maar niet

kunnen

OVERMACHTSITUATIES

• Ingrijpende gebeurtenissen

zoals oorlog, ongelukken en

natuurrampen

• Economische, demografische

of klimatologische

ontwikkelingen

• Strijdig beleid van EU,

provincies en gemeenten

De vier categorieën in de matrix sluiten elkaar niet volledig uit. Er blijft

sprake van een grijs gebied, bijvoorbeeld rondom het begrip draagvlak (is

de minister daarvoor verantwoordelijk, of liggen de belangen van diverse

betrokkenen zover uit elkaar dat het niet realistisch is om te stellen dat

de minister direct invloed op uit kan oefenen). Impliciet blijft dat niet

geleverde prestaties ook een verklaring kunnen zijn voor het niet

bereiken van effecten.

Handleiding DDO

21

3.4 Reikwijdte en methode van het onderzoek

Op basis van een aantal overwegingen (inhoudelijk, strategisch,

beheersmatig) zal het team een keuze moeten maken voor een bepaalde

onderzoeksvariant. Deze paragraaf behandelt enkele aspecten die hierbij

een rol kunnen spelen.

3.4.1 Welke stappen moet je in het onderzoek zetten?

De doelen van het beleid zijn het startpunt voor het doen van onderzoek:

wat wil de minister bereiken (beoogde prestaties en effecten) en is het

beleidsdoel SMART-C18 geformuleerd? Vervolgens is het van belang om

inzicht te krijgen in de gerealiseerde prestaties en effecten, bij voorkeur

aan de hand van al (bij het ministerie) beschikbare gegevens.

Niet altijd zullen de bij het ministerie aanwezige gegevens

(beleidsinformatie) bruikbaar zijn voor uitspraken over prestaties en

effecten. In dat geval komt de vraag aan de orde of de Algemene

Rekenkamer zelf gegevens gaat verzamelen. Hierbij moet wel worden

overwogen dat het verzamelen en vervolgens analyseren van gegevens

over prestaties en effecten erg tijdsintensief kan zijn. De inzet van veel

onderzoekscapaciteit moet in de fase van het onderzoeksvoorstel door het

team en vervolgens door het management en/of het College worden

afgewogen tegen het belang van het onderzoek (bijvoorbeeld de toe-

gevoegde waarde ervan).

Het kan ook voldoende zijn om, op basis van hetgeen in de fase van het

onderzoeksvoorstel is geconstateerd, de minister aan te sporen om te

zorgen voor een verbetering van de beleidsinformatie en het onderzoek

daarop te richten.

Als er wel informatie kan worden verzameld en deze is bruikbaar, dat wil

zeggen van voldoende kwaliteit, dan kun je aan de hand daarvan een

uitspraak doen over bijvoorbeeld de door het Rijk of derden gerealiseerde

prestaties en/of effecten.

18 Zie hoofdstuk 5.

Handleiding DDO

223.4.2 Hoe kies je een onderzoeksvariant?

Voor onderzoek naar prestaties en effecten moet je kiezen tussen de vier

onderscheiden onderzoeksvarianten (doelrealisatie, doelgroepbereik,

doeltreffendheid, doelmatigheid).

Welke van de vier onderzoeksvariant(en) je vervolgens moet / kunt

kiezen hangt af van onder meer de volgende factoren:

• de politieke context;

• de kwaliteit van de te onderzoeken doelstelling;

• de beschikbaarheid van onderzoeksmateriaal / beleidsinformatie;

• de complexiteit van het veld c.q. de lengte van de beleidsketen;

• het karakter van het onderzoek (opduwend of niet?);

• de beschikbaarheid van onderzoekscapaciteit (kwantitatief en

kwalitatief).

Wanneer beperk je je tot doelrealisatie?

Onderzoek naar de vraag of gestelde doelen werkelijkheid zijn geworden

kan vooral belangrijk zijn als hierover onduidelijkheid of

schijnduidelijkheid heerst en als dit verbonden is met discussies over

uitgevoerd of uit te voeren beleid. Is de criminaliteit in een bepaalde

periode toegenomen of afgenomen? Was de lucht anno 2004 schoner of

vuiler dan in 2000? Zijn er in 2003 meer of minder jongeren zonder

diploma van school gegaan dan in 2002?

Behalve op zo’n breed maatschappelijk niveau kan de vraag naar

doelrealisatie ook belangrijk zijn als het ‘alleen maar’ gaat om geleverde

diensten of producten (prestaties). De politieke context kan het zinvol

maken om na te gaan hoeveel kilometer dijk er in een bepaalde periode is

geïnspecteerd, hoeveel uren onderwijs er is gegeven, hoeveel uren de

politie heeft gesurveilleerd of hoeveel WAO-uitkeringen er zijn verstrekt.

Meer dan eens blijkt het antwoord op deze ogenschijnlijk eenvoudige

vragen helemaal niet eenvoudig te vinden, terwijl beleidsmakers en/of

volksvertegenwoordigers wél van bepaalde aannamen uitgaan.

Als de benodigde gegevens niet in een nette, bewerkte vorm in de

beleidsinformatie zijn te vinden is dat op zichzelf al een bevinding. Om

verder te gaan, kun je proberen een samenhangend beeld uit

verschillende deelbestanden, archieven en bestaande onderzoeken te

construeren (zie § 4.3.2.1).

Als ook dat niet kan en de Algemene Rekenkamer wil de conclusies

desondanks niet beperken tot de gebrekkigheid van de informatie, zul je

zelf gegevens moeten verzamelen. Voor dit type vragen heb je doorgaans

Handleiding DDO

23relatief grootschalige informatie nodig, zeker als het om het niveau van

de maatschappelijke veranderingen gaat. Het survey leent zich daar goed

voor (zie § 4.3.2.2).

Als je je beperkt tot de vraag of de beoogde doelen zijn gerealiseerd, kun

je natuurlijk niets zeggen over de mate waarin het beleid hieraan heeft

bijgedragen. Die vraag zal bij de lezers van je rapport heel vaak wel

opkomen en het is niet eenvoudig te voorkomen dat ze uit zo’n onderzoek

méér willen halen dan erin zit. Het is vaak dan ook de moeite waard om

na te denken – zeker als je toch al zelf gegevens aan het verzamelen

bent – of je niet verder kunt gaan in de richting van doeltreffendheids- of

doelmatigheidsonderzoek.

Wanneer beperk je je tot doelgroepbereik?

Ook voor onderzoek naar doelgroepbereik geldt: dit is vooral belangrijk

als er gerede twijfel is of belangrijke voorlichtingscampagnes of

regelingen eigenlijk wel bekend zijn bij de doelgroep. Als dat wel zo is,

weet je nog steeds niet of ze werken. Maar als het niet zo is, mag je het

tegendeel gerust aannemen.

Mocht je, anders dan verwacht, vaststellen dat de doelgroep wél in

voldoende mate wordt bereikt dan is eigenlijk hernieuwd overleg nodig: is

ons dit voldoende resultaat, of willen we verder kijken naar de effecten in

termen van veranderingen in kennis, houding, en gedrag?

Voor het pure doelgroepbereik zul je vaak met survey-methoden moeten

werken. Als je verder wilt gaan en ook effecten wilt vaststellen, moet je

doeltreffendheidsonderzoek doen. Zoals hieronder nog aan de orde komt,

is het in dit soort gevallen nodig (maar ook lastig) om vergelijkbare

gegevens te krijgen over de situatie voor én na (of met en zonder) de

campagne.

Wanneer doe je doeltreffendheidsonderzoek?

Doeltreffendheidsonderzoek dat verder gaat dan het bewerken van

bestaande beleidsinformatie doet de Algemene Rekenkamer alleen zelf:

• als dit niet op basis van bestaande beleidsinformatie is te

beantwoorden;

• als het niet te verwachten valt dat het betreffende ministerie of

anderen hier op afzienbare termijn gedegen onderzoek naar (laten)

doen;

• als het van groot maatschappelijk en/of financieel belang is om te

weten of het betreffende beleid tot resultaten leidt; en

• als de Algemene Rekenkamer in staat is om het benodigde onderzoek

uit te voeren.

Handleiding DDO

24

Dit alles moet je uiteraard nagaan als je het onderzoeksvoorstel schrijft.

In doeltreffendheidsonderzoek moet je altijd op twee vragen antwoord

geven:

• Zijn de met het beleid beoogde effecten daadwerkelijk gerealiseerd?

(Dit is dezelfde vraag die we zojuist hebben behandeld bij

doelrealisatie);

• Is het aan het beleid te danken dat de doelen bereikt zijn, of juist

niet bereikt zijn?

Om op deze beide vragen te kunnen antwoorden, moet je aan gegevens

komen over de door het beleid te beïnvloeden situatie of gedragingen,

liefst op verschillende tijdstippen (bijvoorbeeld het volgen van scholing

door jongeren vóór en een tijdje na de introductie van stimulerend

beleid), een solide beeld construeren van andere factoren die op deze

zelfde situatie inwerken (bijvoorbeeld de toestand van de arbeidsmarkt)

en een manier vinden om de invloed van het beleid te onderscheiden van

de andere factoren.

Het maken van vergelijkingen tussen verschillende tijdstippen (voor en na

nieuw beleid) en/of verschillende groepen (die meer en minder met het

beleid in aanraking zijn gekomen) is bij de beantwoording van

bovenstaande vragen essentieel. In § 7.4 komen we hier uitgebreider op

terug.

De beste manier van vergelijken is de experimentele opzet, waarin je

zowel tussen diverse tijdstippen als tussen diverse, gelijksoortige groepen

vergelijkt (zie § 4.3.2.2).

In de praktijk is dit vaak niet haalbaar en zul je veelal moeten terugvallen

op minder fraaie oplossingen, zoals een meting op één tijdstip en

vergelijking met ander materiaal over de voorgaande situatie. Je loopt

dan het risico dat vroeger gemaakte keuzen in vraagstelling en selectie

van ondervraagden niet zo gelukkig zijn voor jouw probleemstelling.

Ook is het mogelijk om mensen te bevragen over de situatie voor de

introductie van het nieuwe beleid. Dan heb je natuurlijk met het risico te

maken, dat het geheugen niet altijd betrouwbaar is en mensen

sociaalwenselijke antwoorden geven.

Een standaardoplossing is er niet. Wel zijn er diverse manieren om de

risico’s in te perken. Die komen steeds neer op het motto: weet wat je

vergelijkt. Let dus goed op de samenstelling van de onderzochte groepen,

zoek naar methoden om belangrijke verschillen te corrigeren. Vraag

Handleiding DDO

25advies bij het informatiepunt DDO van bureau Erdmo over de manier

waarop je zo’n onderzoek aanpakt.

Om erachter te komen, in hoeverre veranderingen echt aan het beleid zijn

te danken en niet aan andere factoren kun je verschillende benaderingen

volgen, die elkaar soms aanvullen. Ten eerste kun je het onderzoek zo

opzetten dat je de kans op andere factoren beperkt tot een berekenbare

kans. Dat doe je door twee groepen te vergelijken die volgens toeval

worden samengesteld uit een grotere groep (bijvoorbeeld door voor

iedereen kop of munt te gooien). De ene groep wordt vervolgens wel aan

het beleid ‘blootgesteld’, de andere niet. Dit is een echt experimentele

opzet. Quasi-experimenten en natuurlijke experimenten kunnen we zien

als een tweede benadering. Deze wijken af van de zuivere experimenten

doordat de toewijzing van respondenten aan de experimentele en de

controlegroep niet at random gebeurt. Deze varianten hebben als

voordeel dat ze kunnen worden onderzocht aansluitend op de

beleidspraktijk. Hierdoor kan op relatief goedkope wijze informatie over

de effecten van beleid worden verzameld.19 Een derde benadering is: zo

goed mogelijk nadenken, ook door zoveel mogelijk onderzoeksrapporten

te lezen, over andere factoren die van invloed zouden kunnen zijn en

systematisch nagaan of die een rol spelen. Een voorbeeld van zo’n

systematische redeneerwijze vind je in bijlage 6. Omdat een echt

experimentele opzet bij onderzoek achteraf niet meer mogelijk is, zul je

in de praktijk heel veel moeten werken volgens de tweede aanpak (quasi-

experimenten en natuurlijke experimenten).

Wanneer doe je doelmatigheidsonderzoek?

Voor de beslissing om zelf doelmatigheidsonderzoek uit te voeren gelden

dezelfde soort voorwaarden als voor doeltreffendheidsonderzoek. De

Algemene Rekenkamer verricht alleen doelmatigheidsonderzoek:

• als een bepaalde vraag rond mogelijke doelmatigheidswinst van groot

belang is;

• als er terzake onvoldoende informatie over doelmatigheid beschikbaar

is;

• als niemand anders daar op korte termijn voor gaat zorgen; en

• als de Algemene Rekenkamer daar wel voor kan zorgen.

Doelmatigheidsonderzoek gaat nog een stap verder dan

doeltreffendheidsonderzoek. Je kijkt niet alleen welke effecten dankzij het

beleid worden bereikt of welke prestaties voor het beleid zijn

19 Meer informatie over dergelijke experimenten is bijvoorbeeld te vinden in het CPB-rapport

Lerend beleid: het versterken van beleid experimenteren en evalueren (2004).

Handleiding DDO

26gerealiseerd, maar legt ook de relatie met de middelen die daarvoor zijn

ingezet.

Ook hier staat vergelijken centraal in de onderzoeksaanpak, want

doelmatigheid is op twee manieren een relatief begrip. Ten eerste gaat

het om de onderlinge relatie tussen de middelen, de aantallen prestaties

of effecten en de kwaliteit daarvan. Om doelmatigheidsinformatie te

genereren moeten al deze bouwstenen aan elkaar worden gerelateerd.

Ten tweede kan doelmatigheid alleen worden bepaald in relatie tot een

referentiepunt, een organisatie is (on)doelmatiger ten opzichte van een

andere organisatie of het verleden.

Zoals uitvoerig in hoofdstuk 8 aan de orde komt, kun je dit soort

onderzoek soms op basis van kengetallen doen. Maar er zijn ook

ingewikkelder econometrische technieken. Een lastige voorwaarde daarbij

is, dat je minimaal ongeveer vijftig vergelijkbare waarnemingen nodig

hebt.

3.4.3 Wie spreek je aan?

Een belangrijk uitgangspunt bij het DDO is de reikwijdte van de

verantwoordelijkheid van de minister. In het geval van (territoriaal of

functioneel) gedecentraliseerd beleid is de minister niet (volledig)

verantwoordelijk voor de resultaten van het beleid. In dergelijke gevallen

wordt gesproken van indirecte verantwoordelijkheid.

Van indirecte verantwoordelijkheid wordt volgens het ministerie van

Financiën gesproken wanneer een bewindspersoon uitsluitend een

voorwaardenscheppende verantwoordelijkheid heeft voor de te behalen

resultaten, en de directe verantwoordelijkheid voor resultaten bij andere

actoren is gelegd. Wanneer – bijvoorbeeld in het beleidsartikel in de

begroting – niet expliciet is aangegeven dat de minister niet

verantwoordelijk is voor alle te behalen beleidsresultaten, wordt de

minister geacht zowel direct als indirect verantwoordelijk te zijn.

Een indirecte verantwoordelijke minister blijft niettemin te allen tijde een

‘toetsende’ medeverantwoordelijkheid houden voor de resultaten, zoals in

de algemene beleidsdoelstelling beoogd, die door het systeem worden

voortgebracht. Hoe het beleidsprobleem zich ontwikkelt en hoe de

resultaten zich ontwikkelen, is onderwerp van monitoring, evaluatie-

onderzoek en eventuele bijsturing via (bestuurlijk) overleg.

Handleiding DDO

273.4.4 Hoe ga je om met gedecentraliseerd beleid?

De Algemene Rekenkamer wil komen tot een beoordeling van de

prestaties en effecten op rijksniveau. Om te komen tot een dergelijke

beoordeling kan het nuttig en nodig zijn de totstandkoming van prestaties

en effecten op decentraal niveau te onderzoeken. Daar kunnen oorzaken

liggen voor bijvoorbeeld onvolledige of slechte uitvoering van het beleid.

De boodschap wordt aan de minister gericht. De minister zal ervoor

moeten zorgen dat decentrale overheden bepaalde prestaties leveren of

effecten bereiken. Doet de minister voldoende om dat te bewerkstelligen?

Wat de Algemene Rekenkamer dan in feite doet is de minister inzicht

bieden in een toestand in het decentrale veld. Zij biedt de minister

relevante beleidsinformatie aan over een onderdeel van de totale

beleidsketen. Op grond daarvan kan zij de minister aanbevelen in het

kader van zijn/haar indirecte verantwoordelijkheid decentrale actoren

ertoe te bewegen verbeteracties te ondernemen.

De voor achterblijvende effecten gevonden verklaringen op rijksniveau,

zoals niet-effectieve rijksprestaties, leiden tot oordelen in de richting van

de minister; dit past in de rol van de Algemene Rekenkamer om het

functioneren van het Rijk (en RWT’s) te beoordelen.

De gevonden verklaringen op decentraal niveau kunnen leiden tot

aanbevelingen aan de minister om zijn/haar beleid te richten op het

wegnemen van de belemmeringen.

3.4.5 Hoe onderzoek je prestaties en effecten van derden?

Om de prestaties van (territoriaal) gedecentraliseerd beleid en de

effecten daarvan te onderzoeken kan het van belang zijn dat de

Algemene Rekenkamer zelf informatie verzamelt bij deze decentrale

actoren. De volgende lijn wordt daarbij gevolgd:

• Als sprake is van gedecentraliseerde uitvoering van beleid moet je

eerst vaststellen waarvoor de minister precies verantwoordelijk is.

Het onderzoek dient aan te sluiten bij de verantwoordelijkheid van de

minister. Vervolgens moet je vaststellen wat de minister heeft gedaan

(dat wil zeggen welke prestaties hij/zij heeft geleverd) om ervoor te

zorgen dat het beleid op decentraal niveau goed kan worden

uitgevoerd. Daarbij ga je tevens na of de minister voldoende

beleidsinformatie heeft verzameld over deze ‘rijksprestaties’;

• Als beleid (functioneel of territoriaal) gedecentraliseerd wordt

uitgevoerd, ga je na in hoeverre de minister beschikt over

deugdelijke informatie over de voortgang van de uitvoering van het

Handleiding DDO

28beleid (dus ook over prestaties en effecten). Indien de minister niet

beschikt over dergelijke informatie, kan de Algemene Rekenkamer

besluiten zélf die informatie te gaan verzamelen om op die manier

onderbouwde conclusies te kunnen trekken over de mate waarin de

prestaties/effecten van derden worden behaald c.q. of het beleid

effectief is. Voorbeelden van onderzoek waarbij dat gedaan is, zijn:

Preventie en bestrijding jeugdcriminaliteit, Voorbereiding

rampenbestrijding en Begeleiding en herplaatsing van voortijdige

schoolverlaters;

• Een verklaring voor het niet realiseren van prestaties door

bijvoorbeeld gemeenten en van effecten in de maatschappij kan zijn

dat het beleid van het Rijk (‘de rijksprestatie’) geen effect heeft

gehad bij lagere overheden. Bij onderzoek naar verklaringen voor het

niet (voldoende) realiseren van prestaties en effecten zal vooral ook

naar deze mogelijke verklaringsgrond moeten worden gekeken. Met

het onderzoek wordt immers primair de minister aangesproken.

Voor het onderzoeken van prestaties van lagere overheden zijn we

aangewezen op vrijwillige medewerking van deze overheden, aangezien

de Algemene Rekenkamer er geen controlebevoegdheid heeft. Deze

medewerking verloopt tot nu toe nagenoeg probleemloos. Dit komt

doordat teams de anonimiteit van individuele actoren garanderen

(bijvoorbeeld bij de onderzoeken Grotestedenbeleid, Begeleiding en

herplaatsing van voortijdig schoolverlaters en Voorbereiding

rampenbestrijding).

Als we steeds vaker een beroep doen op decentrale actoren kan de

vrijwillige medewerking wel de tocht komen te staan Het is dan ook

belangrijk om aan de mogelijkheid te denken om samen te werken met

lokale rekenkamers, zorgvuldig te zijn bij het benaderen van actoren voor

medewerking en ervoor te zorgen dat afspraken over anonimiteit niet

worden geschonden.

Meer in het algemeen geldt: wanneer in onderzoek de prestaties van

decentrale actoren worden bekeken, zou dat gericht moeten zijn op het

vellen van een oordeel over de minister. Hiervoor is inzicht nodig in de

relatieve bijdrage van het Rijk aan de geleverde prestaties door

decentrale actoren.

Andere zaken waar de minister op aangesproken kan worden zijn:

• de kwaliteit van de informatie die hij/zij heeft over de realisatie van

de gestelde doelen (inclusief de informatie die van de decentrale

actoren komt of zou moeten komen);

Handleiding DDO

29• de mate waarin hij/zij de decentrale actoren, gegeven de doelen,

aanspoort om bepaalde prestaties te leveren;

• meer algemeen: de mate waarin hij/zij een systeem bouwt om te

zorgen dat de prestaties en effecten geleverd kunnen worden (het

scheppen van voorwaarden) en dat daarover informatie wordt

verzameld.

Handleiding DDO

304 Aanpak onderzoek

4.1 Inleiding

In § 4.2 bespreken we kort de formulering van doelen probleemstelling.

Een goede formulering van doelen probleemstelling is van groot belang

voor het welslagen van een onderzoek. Afhankelijk van de

probleemstelling en de gekozen onderzoeksvariant (onderzoek naar

doelrealisatie, doelgroep, doeltreffendheid of doelmatigheid) kun je

verschillende methoden gebruiken om uitspraken te doen over de al dan

niet gerealiseerde prestaties en effecten en verklaringen daarvoor. De

verschillende methoden van explorerend tot toetsend. De verschillende

methoden worden besproken in § 4.3. In § 4.4, ten slotte, komen we

terug op de verklaringenmatrix uit § 3.3. Hier geven we aan welke

onderzoeksmethoden meer of minder geschikt zijn voor welk type

verklaringen20.

4.2 Doel-, probleem- en vraagstelling

De probleemstelling is mede bepalend voor de opzet en bevindingen van

een onderzoek. Een belangrijk onderdeel dus, dat de nodige aandacht

verdient. De praktijk leert echter dat veel onderzoekers niet de moeite

nemen om een goede probleem- en doelstelling te formuleren. Het is

waarschijnlijk een van de meest verwaarloosde aspecten van het

onderzoek doen.

Het ontbreken van een goede probleem- en doelstelling vormt een van de

belangrijkste oorzaken van problemen in het onderzoeksproces. Zo

ontstaat vertraging vaak doordat onderzoekers bij het ontbreken van een

goed afgebakende probleemstelling de neiging hebben steeds meer

onderwerpen in hun onderzoek te betrekken en als het ware ‘alles’ willen

onderzoeken.

20 De tekst van dit hoofdstuk is deels ontleend aan het materiaal van de cursus Methoden en

technieken

Handleiding DDO

314.2.1 Doelstelling

De doelstelling van een onderzoek geeft aan wat de onderzoeker met een

onderzoek wil bereiken. Het gaat hier dus om de vraag waarom het

onderzoek gedaan wordt. Voor Rekenkameronderzoek geldt in het

algemeen dat met de doelstelling wordt aangegeven welk

(maatschappelijk) effect men wil bereiken met het onderzoek. Vaak gaat

het daarbij dan in eerste instantie om het bewerkstelligen van een

bepaalde actie van de verantwoordelijke bewindspersoon en/of de

betrokken instelling. We spreken in dat geval van een ‘handelings-

gerichte’ doelstelling.

Voorbeelden van gangbare doelstellingen voor Rekenkameronderzoek zijn

‘het bevorderen van de kwaliteit van het financieel beheer bij een RWT’ of

‘het leveren van een bijdrage aan de verbetering van de efficiency van

een bepaalde dienst’.

4.2.2 Probleemstelling

De probleemstelling is de vraag waarop door middel van het onderzoek

een antwoord gezocht wordt. De probleemstelling geeft op hoofdlijnen

aan wat er onderzocht gaat worden. Het te onderzoeken probleem wordt

in vraagvorm geformuleerd, bijvoorbeeld: faciliteert het beleid de lokale

beleidsuitvoerders voldoende om de gewenste resultaten te boeken, is

het beleid toereikend om gesignaleerde problemen op te lossen en welke

knelpunten doen zich daarbij voor? (Algemene Rekenkamer 2003b). De

probleemstelling is dus ‘kennisgericht’.

De probleemstelling heeft de functie de complexiteit van een

onderzoeksterrein beheersbaar te maken door een afbakening te maken

die hanteerbaar is, maar die tegelijkertijd ook weer niet te veel

simplificeert. De probleemstelling stuurt daarmee de onderzoeker tijdens

de uitvoering van het onderzoek.

De probleemstelling kan niet los worden gezien van de doelstelling van

het onderzoek. Het antwoord op de vraag of vragen waaruit de probleem-

stelling is opgebouwd moet (samen met de daaruit voortvloeiende

aanbevelingen) een bijdrage leveren aan de realisatie van de doelstelling.

De koppeling met de doelstelling is meer dan een verplicht nummer en

verdient serieuze aandacht. Als een onderzoek de pretentie heeft een

bijdrage te leveren aan de doelmatigheid van een bepaald beleid, moeten

de probleemstelling en de onderzoeksopzet daarop toegesneden zijn.

Handleiding DDO

32Uiteraard dient er ook een inhoudelijke verband te bestaan tussen

doelstelling en probleemstelling: beide moeten betrekking hebben op

hetzelfde onderwerp. De ervaring leert dat zelfs tegen deze

vanzelfsprekende voorwaarde wordt gezondigd.

4.2.3 Onderzoeksvragen

Onderzoeksvragen zijn een uitwerking van de probleemstelling en hebben

daarmee dus een logische relatie. In samenhang horen de

onderzoeksvragen een antwoord te geven op de probleemstelling.

Een goede uitwerking in onderzoeksvragen voorkomt dat het onderzoek

ruimer wordt dan de probleemstelling. Het is verleidelijk om bij de

onderzoeksvragen nog wat extra interessante vragen op te nemen, omdat

die mogelijk ‘wat belangrijks’ opleveren. Als echter de probleemstelling

omvat wat van belang is, zijn dat soort ‘stiekeme’ verruimingen niet

nodig.

Onderzoeksvragen hoeven niet allemaal van hetzelfde type te zijn als de

probleemstelling. Voor het beantwoorden van een causale

probleemstelling zijn beschrijvende vragen en vragen naar samenhang

tussen variabelen noodzakelijk.

Enkele tips voor het opstellen van onderzoeksvragen:

• Breng structuur aan in de onderzoeksvragen, bijvoorbeeld door in

elke vraag slechts één onderdeel van het probleem aan te pakken. Elk

onderdeel kan dan apart worden onderzocht en in samenhang met de

andere onderdelen bijdragen aan de oplossing van de

probleemstelling.

• Controleer of alle onderzoeksvragen samen tot totale beantwoording

van de probleemstelling kunnen leiden.

• Stel niet te veel onderzoeksvragen. Een probleemstelling is meestal

met twee tot zes vragen af te dekken. Als er meer rijzen stel jezelf

dan de vraag of de onderzoeksvragen niet verder gaan dan de

probleemstelling beoogt, dan wel of de probleemstelling niet te breed

is en een te uitgebreid onderzoek vergt.

• Formuleer onderzoeksvragen niet te gedetailleerd. Let op of twee

vragen in werkelijkheid wellicht als één vraag te beschouwen zijn.

4.2.4 Hypothesen

Onderzoeksvragen kunnen vervolgens worden vertaald in (toetsbare)

hypothesen. Uitgangspunt daarbij is dat gekozen wordt tussen een

nulhypothese (H0) en een alternatieve hypothese (H1). Beide volgen uit

Handleiding DDO

33een vermoeden over het optreden van een verschijnsel binnen de totale

populatie. Bij de keuze van H0 en H1 is het gebruikelijk dat H0 de

ontkenning van het vermoeden vormt en dat H1 overeenkomt met het

vermoeden.

Ter verduidelijking een voorbeeld dat is gebaseerd op het vermoeden dat

de gemiddelde wachttijd voor een loket op maandag verschilt van de

wachttijd op andere werkdagen. Als H0 kiest men dan de ontkenning van

dit vermoeden (‘De gemiddelde wachttijd op maandagen verschilt niet

van die op andere werkdagen’). Als H1 kiest men het vermoeden zelf (‘De

gemiddelde wachttijd op maandagen verschilt van de gemiddelde

wachttijd op andere werkdagen’).

Merk op dat de hypothesen geen uitspraken bevatten over de richting van

het verschil. Indien men vermoedt dat de gemiddelde wachttijd op

maandagen langer is dan op andere werkdagen, dan dient dat ook tot de

uitdrukking te komen in H0 en H1. H0 zou dan als volgt kunnen luiden:

‘De gemiddelde wachttijd op maandag is hoogstens even lang als op

andere werkdagen’. Voor H1 kiest men dan ‘De gemiddelde wachttijd is

op maandagen langer dan op andere werkdagen’.

4.2.5 Overige preciseringen van het te onderzoeken veld

Er zijn nog enkele preciseringen nodig om goed duidelijk te maken wat je

gaat onderzoeken. Het betreft:

1. een definitie van de gehanteerde begrippen;

2. de analyse-eenheden;

3. de variabelen;

4. de verdere afbakening van het onderzoeksterrein (geografisch en

in de tijd);

5. het type uitspraken waartoe het onderzoek zal leiden;

6. de gehanteerde hoofdnormen.

Je moet per geval afwegen welke hiervan je direct combineert met je

probleemstelling, onderzoeksvragen en hypothesen en welke je in een

afzonderlijke paragraaf onderbrengt.

4.3 Onderzoeksmethoden

In onderstaande paragrafen bespreken we de verschillende

onderzoeksmethoden al naar gelang ze meer explorerend (§ 4.3.2.1) dan

wel toetsend (§ 4.3.2.2) zijn en methoden die voor zowel exploreren als

toetsen geschikt zijn (§ 4.3.2.3). Daarvoor gaan we in op twee zaken die

van belang zijn voor de keuze voor een bepaalde onderzoeksmethode:

causaliteitsvoorwaarden en meetniveaus.

Handleiding DDO

344.3.1 Keuze van onderzoeksmethode

4.3.1.1 Causaliteitsvoorwaarden

Causaliteitsvoorwaarden zijn van belang als je onderzoek wilt doen naar

de doeltreffendheid van beleid. Er zijn drie causaliteitsvoorwaarden

waaraan moet worden voldaan wil je doeltreffendheidsonderzoek doen

(Swanborn 1987, p.294-295):

1. de aanwezigheid van een statistisch verband;

2. de tijdsvolgorde (de verklarende factor moet voorafgaan aan de te

verklaren factor);

3. afwezigheid van andere oorzaken.

Is er een statistisch verband?

De eerste voorwaarde laat zich goed onderzoeken. Statistische

samenhang kan op diverse manieren worden onderzocht. We sommen

hieronder een drietal mogelijkheden op.

• Vergelijking tussen groepen. Hierbij wordt het gemiddelde (of een

andere relevante grootheid) op de te verklaren variabele Y

(bijvoorbeeld het hebben van kennis over aids) van een groep die wel

is blootgesteld aan een instrument (bijvoorbeeld een voorlichtings-

spot over aids), vergeleken met het gemiddelde op Y van een groep

die er niet aan is blootgesteld. Als personen die de voorlichtingsspot

hebben gezien significant meer kennis hebben dan degenen die deze

niet hebben gezien, is er sprake van statistische samenhang tussen

voorlichting en kennis;

• Vergelijking binnen een groep. Hierbij wordt vergeleken hoe

eenzelfde groep voor en na de inzet van een instrument (bijvoorbeeld

voorlichting over aids) scoort op variabele Y (bijvoorbeeld kennis-

toename over aids);

• Vergelijking van scorereeksen op twee variabelen. Hierbij gaat het om

de berekening van de waarde die een correlatiemaat aanneemt

tussen variabele X (bijvoorbeeld de hoogte van een subsidie op een

goed) en Y (de aanschafgeneigdheid tot dat goed). Als de

correlatiecoëfficiënt tussen X een Y een hoge waarde aanneemt, is er

sprake van statistische samenhang tussen beide.

Gaat de verklarende factor vooraf aan wat hij verklaart?

De tweede voorwaarde is problematischer (helemaal in surveyonderzoek):

niet altijd is duidelijk of de verklarende factor X (bijvoorbeeld de omvang

van wapenaankopen in een bepaalde regio) inderdaad voorafgaat aan de

te verklaren factor Y (bijvoorbeeld de frequentie van gewapende conflic-

ten aldaar). Zonder precieze informatie over tijdstippen kan een verband

Handleiding DDO

35tussen zulke factoren in beide richtingen lopen. Dat probleem heb je niet

als je verklarende factoren neemt die nooit blootstaan aan sociale

invloeden, zoals leeftijd of geslacht. Maar meestal draait

beleidsonderzoek daar niet om, in elk geval niet uitsluitend. Dan moet je

dus met logische argumenten aannemelijk maken dat de invloed van X

naar Y loopt en niet andersom.

Zijn er geen andere oorzaken?

De derde voorwaarde, dat er geen andere oorzaken mogen zijn van de

gevonden samenhang, kan ook problemen opleveren. Zo kan een

geconstateerde samenhang tussen beleidsdoel Y (bijvoorbeeld de reductie

in het aantal verkeersongelukken waarbij alcohol in het spel is) en

instrument X (een op alcoholmatiging gerichte voorlichtingscampagne)

mogelijkerwijs ‘wegverklaard’ worden door de storende factor Z

(de introductie van alcoholvrij bier in dezelfde tijd dat de campagne liep).

Wellicht zou in zo’n geval het beleidsinstrument X aangepast moeten

worden; de voorlichtingscampagne zou bijvoorbeeld kunnen wijzen op de

mogelijkheid om alcoholvrij bier te drinken als je nog moet rijden.

Er kan ook een directere invloed in het spel zijn, bijvoorbeeld als auto- en

motorrijders alcoholhoudend bier laten staan dankzij het alcoholvrije bier.

Als deze contextfactor Z dus zowel instrument X als beleidsdoel Y

beïnvloedt, is er sprake van correlatie tussen de storingstermen van de

vergelijkingen (multi-collineariteit), waardoor niet zonder meer

uitspraken over het verband tussen X en Y kunnen worden gedaan.

Het analyseren van de score op Y binnen de diverse combinaties van X en

Z (wel/geen campagne gezien, wel/geen gebruik alcoholvrij bier) kan

meer licht op deze zaak werpen. Als uit de analyse blijkt dat binnen de

groep van gebruikers van alcoholvrij bier er toch nog een (negatieve)

relatie blijkt te bestaan tussen de mate van voorlichting en de mate van

betrokkenheid bij verkeersongevallen, dan betekent dat, dat het effect

van de campagne niet ‘wegverklaard’ kan worden door de introductie van

alcoholvrij bier (en omgekeerd).

X (voorlichtingscampagne) Y (reductie aantal verkeersongevallen)

Z (introductie alcoholvrij bier)

Handleiding DDO

36

4.3.1.2 Meetniveaus

De keuze voor een onderzoeksmethode wordt ook bepaald door het

meetniveau van de gebruikte variabelen. De te verklaren effecten,

prestaties en de bijbehorende verklarende factoren en controlefactoren21

moeten worden omgezet naar meetbare, empirische grootheden.

Sommige factoren zijn relatief eenvoudig te operationaliseren (‘inzet van

personeel’ = ‘aantal personeelsleden’), andere moeten indirect worden

gemeten.

Met name effecten zijn in de meeste gevallen niet direct te meten. In die

gevallen zal een benadering moeten worden gemaakt van de bereikte

effecten door middel van ‘indicatoren’. Een effectindicator voor

verkeersveiligheid is bijvoorbeeld de vermindering van het aantal

verkeersdoden. En het aantal ‘technostarters’ (hoog opgeleide startende

ondernemers die veel aan speur- en ontwikkelingswerk doen) kan

beschouwd worden als een indicator voor innovatief ondernemerschap.22

Dit soort effectindicatoren worden ook wel proxy-variabelen genoemd.

De gerealiseerde prestaties zijn vaak makkelijker te meten dan de

gerealiseerde effecten. Toch is het ook bij prestaties niet altijd mogelijk

om ze direct te meten. In deze gevallen zal ook de prestatie moeten

worden benaderd via een indicator of proxy-variabele.

Prestaties soms lastig te meten

Een lastig te meten prestatie is bijvoorbeeld het houden van toezicht (door diverse

inspecties). Vaak worden voor dergelijke gevallen afgeleide prestaties (proxies)

gedefinieerd zoals het aantal en de duur van de uitgevoerde inspectiebezoeken,

eventueel ook het aantal en de duur van de contacten per telefoon, email en brief en de

uitgebrachte onderzoeksrapporten op het gebied van toezicht.

Bij het meten worden getallen toegekend aan de geconstrueerde

variabelen. Er zijn daarbij vier meetniveaus: het nominale, het ordinale,

het interval- en het rationiveau. Deze meetniveaus zijn van belang voor

het gebruik van de variabelen in de beschrijvende en verklarende

analyses: het meetniveau bepaalt in sterke mate welke analyses (welke

onderzoeksmethode) je wel en niet kunt uitvoeren.

21 Controlefactoren: factoren waarvan een verband met de te verklaren factor wordt verwacht,

maar waarin men niet inhoudelijk geïnteresseerd is. Het negeren van dergelijke factoren verstoort

de analyse van de effecten waar men wel in geïnteresseerd is. 22 Algemene Rekenkamer (2002c).

Handleiding DDO

37De meetniveaus zijn:

• Nominaal niveau: als twee scores op een nominale variabele

verschillen, dan wil dat zeggen dat de ene score anders is dan de

andere score. Voorbeelden van nominale variabelen zijn sekse, type

doelgroep waarop een regeling is gericht (individuele burgers,

bedrijven, non-profitinstellingen, enzovoort). Er is dus enkel sprake

van een indeling in klassen van objecten. Ook al worden aan die

klassen cijfers/codes toegekend, met de getallen kan niet worden

gerekend;

• Ordinaal niveau: als twee scores op een ordinale variabele verschil-

len, dan wil dat zeggen dat de ene score meer is dan de andere. Een

voorbeeld van een ordinale variabele is de mening van

overheidsklanten over de mate van klantgerichtheid van de overheid.

Ook hier mag niet gerekend worden met cijfers, een hoger cijfer geeft

alleen maar aan, dat er sprake is van ‘meer’;

• Intervalniveau: als scores op een intervalvariabele verschillen, wil dat

zeggen dat het verschil (interval) tussen score a en b x maal zo groot

is als dat tussen y en z. Het verschil tussen een temperatuur van 40

graden Celsius en van 20 graden is bijvoorbeeld tweemaal zo groot

als het verschil tussen 15 en 5 graden. Maar bij 40 graden Celsius is

het niet 40 keer zo warm als bij 1 graad Celsius; en hoeveel keer zo

warm het is vergeleken met een temperatuur van –20 graden Celsius

valt al helemaal niet te zeggen (tenzij je het omrekent naar graden

Kelvin). Hier kan dus alleen met het verschil tussen de metingen

worden gerekend als met een gewoon getal;

• Rationiveau: als twee scores op een ratiovariabele verschillen, wil dat

zeggen dat de ene score x maal zoveel is als de andere. De

maandelijkse omzet van een bedrijf is bijvoorbeeld 5000 maal zo

hoog als de omzet van een kleinere concurrent. Kenmerkend verschil

met het intervalmeetniveau is dat hier sprake is van een absoluut

nulpunt, terwijl het bij het intervalmeetniveau gaat om een arbitrair

gekozen nulpunt. Hier kan dus met de meting zelf worden gerekend

als met een gewoon getal.

Een meting op ratio- of intervalniveau kan teruggebracht worden naar

een meting op ordinaal of nominaal niveau (overigens met verlies aan

‘informatie’), maar het omgekeerde is niet mogelijk.

Het streven is om ‘zo hoog mogelijk’ te meten, omdat een meting op een

hoger niveau meer ‘informatie’ bevat dan die op een lager niveau. Een

voorbeeld: wanneer je de snelheid waarmee proefpersonen een

voorlichtingsbrochure lezen vastlegt in pagina’s per minuut (rationiveau)

weet je veel meer dan wanneer je alleen maar turft in ‘snel, middelmatig

Handleiding DDO

38en langzaam’ (ordinaal niveau). Bij een hoger meetniveau zijn dan ook

meer analysetechnieken toe te passen dan bij een lager meetniveau.

4.3.2 Methoden23

4.3.2.1 Explorerende technieken

o Literatuuronderzoek en metaonderzoek

Literatuuronderzoek is van belang bij het verkrijgen van inzicht in een

onderwerp, bij het afbakenen van het onderzoeksonderwerp en bij het

formuleren en afbakenen van de onderzoeksvraag en is dus met name

bruikbaar in de opstartfase van een onderzoek (onderzoeksvoorstelfase,

verdiepte monitoring).

Hoewel literatuuronderzoek met name geschikt is voor het preciseren van

een onderzoeksvraag, is het van belang het literatuuronderzoek te

starten met een enigszins afgebakende zoekvraag, zowel inhoudelijk als

naar documenttype. Het is handig om een ‘startpublicatie’ te vinden

waarin het onderwerp, relevante auteurs en/of betrokkenen worden

behandeld. Let erop niet alles te gaan lezen wat je tegenkomt en ‘blind’

te gaan zoeken, maar maak gebruik van materie- en

literatuurdeskundigen en stel je zoekvraag (steeds) bij als dat nodig is.

Het literatuuronderzoek is een belangrijke en onmisbare schakel in het

formuleren van het onderzoeksobject en de relevante onderzoeksvragen.

Omdat geschreven bronnen per definitie een gedateerde subjectieve

weergave van gebeurtenissen, trends of objecten geven, is het van

belang literatuuronderzoek aan te vullen met andere vormen van

onderzoek.

Literatuuronderzoek wordt soms ook wel metaonderzoek genoemd. Deze

twee zijn echter niet altijd helemaal gelijk aan elkaar. Metaonderzoek kan

bestaan uit meta-evaluatie en evaluatiesynthese. Bij meta-evaluatie gaat

het om een evaluatie van al bestaande evaluaties en beantwoordt de

vragen: welke verschillen zijn er in de uitkomsten van de evaluaties en

hoe zijn deze verschillen te verklaren? Evaluatiesynthese daarentegen

probeert de uitkomsten van de verschillende evaluaties te aggregeren

(samen te vatten) en aan de hand daarvan een uitspraak te doen over

een bepaald onderwerp. Voordat je een evaluatiesynthese kunt uitvoeren,

moet je wel eerst een meta-evaluatie hebben uitgevoerd om zeker te zijn

van de kwaliteit van de gebruikte primaire onderzoeken.

23 Zie bijlage 2 voor meer informatie over survey als methode om data te verzamelen.

Handleiding DDO

39Primair doel: explorerend. Verkrijgen van inzicht in een onderwerp, bij het afbakenen van het

onderzoeksonderwerp en bij het formuleren en afbakenen van de onderzoeksvraag

Voor meer informatie: P.G Swanborn (1999). Evalueren. Meppel: Boom; Handleiding

metaonderzoek, Algemene Rekenkamer, 2003 (zie intranet, informatiepunt DDO)

o Focusgroepen

Onderzoek met focusgroepen stamt uit marktonderzoek uit de jaren

twintig. Het is een groepsinterview over een specifiek onderwerp. Het is

een open einde gesprek, dat wordt geleid door een onderzoeker. Het

aantal deelnemers varieert meestal tussen de 8 en de 12. Er kan zowel

met homogeen als met heterogeen samengestelde groepen worden

gewerkt. Beiden hebben specifieke voor- en nadelen. Het is ook mogelijk

met verschillende focusgroepen te werken. Vanzelfsprekend zijn er

methodologische haken en ogen verbonden aan het inzetten van

focusgroepen (groepsdynamica, verslaglegging, kwaliteit van facilitator).

Door de grote ervaring zijn er echter een groot aantal spelregels

ontwikkeld voor het succesvol werken met focusgroepen.

Primair doel: ideeën genereren voor mogelijke verklaringen, exploreren

Voor meer informatie: Colin Robson (2002). Real world research. Blackwell Publising.

P.G Swanborn (1999. Evalueren. Meppel: Boom.

http://www.evalsed.info/frame_downloads.asp

o Delphi-methode

De Delphi-methode is er op gericht om meningen van experts over

complexe problemen bijeen te brengen en tot consensus en helderheid

over resterende verschilpunten te komen. De deelnemers aan Delphi-

‘bijeenkomsten’ ontmoeten elkaar niet lijfelijk: zij beantwoorden

schriftelijk de vragen van de onderzoekers en lezen de (anonieme!)

samenvattingen daarvan terug, waarna een tweede – meestal laatste –

ronde vragen volgt.

Vaak wordt deze methode niet alleen gebruikt om vast te stellen welke

trends er op een bepaald gebied zijn, maar ook om tot consensus te

komen over de voorwaarden en acties die nodig zijn om te zorgen dat

bepaalde ontwikkelingen kunnen doorzetten, zoals de impact van

informatisering met toepassingen als telewerken en onderwijs op afstand.

Daarnaast wordt de Delphi-methode ook gebruikt om duidelijkheid te

krijgen over begrippen met een normatieve lading (bijvoorbeeld

milieukwaliteit en ruimtelijke kwaliteit), de achterliggende waarden en de

hiermee verbonden beleidsvisies. Altijd gaat het om een systematisch

proces van bevragen, data-analyse, terugkoppeling, discussie en

beslissen.

‘Kwalitatieve’ kenmerken van Delphi zijn onder andere dat er veel

aandacht wordt besteed aan het benoemen van de begrippen en

Handleiding DDO

40categorieën en dat men dan ook doorgaans eerst een uitvoerige fase van

probleemverkenning doorloopt. De bevragingen en de analyse daarvan

moeten echter ook voldoen aan de gebruikelijke criteria voor surveys en

hun analyse (zoals: vermijd sociaal wenselijke antwoordcategorieën; let

op goed gespreide respons; codeer zorgvuldig).

Een aantal jaren geleden heeft de Algemene Rekenkamer de Delphi-

methode uitgeprobeerd in een onderzoek uitgevoerd bij bureau VWS.24

Primair doel: kan zowel toetsend als explorerend worden gebruikt.

Voor meer informatie: M.C. Groenenberg (1998). Kwaliteit in beeld, een delphi-onderzoek naar

milieukwaliteit en ruimtelijke kwaliteit in het landelijk gebied. Nijmegen: Katholieke

Universiteit Nijmegen.

P.G. Swanborn (1999). Evalueren, het ontwerpen, begeleiden en evalueren van interventies:

een methodische basis voor evaluatieonderzoek. Meppel: Boom.

http://www.evalsed.info/frame_downloads.asp

o Casestudy

De casestudy is een onderzoeksontwerp waarmee diepgaand inzicht kan

worden verkregen in één of enkele in de tijd en/of ruimtelijk begrensde

objecten of processen. De casestudy wordt gekenmerkt door een klein

aantal onderzoekseenheden, een arbeidsintensieve benadering, een

voorkeur voor diepgang boven breedte van het onderzoek en een

beredeneerde, geïnformeerde keuze van de onderzoekseenheden. Een

belangrijke en veel gehanteerde methode binnen het casestudyonderzoek

is die van triangulatie: het gebruik maken van meerdere bronnen (half-

open interviews, literatuuranalyse, observaties, dossieronderzoek et

cetera), om zo tot betrouwbare en van elkaar onafhankelijke observaties

te komen. Daardoor wordt de kennis van het object vergroot.

In de beleidswetenschappen is de casestudy gangbaar geworden als

raamwerk voor het bestuderen van beleidsprocessen in relatie tot de

institutionele context van het beleid. In algemene kunnen twee typen

casestudy worden onderscheiden: de enkelvoudige en de vergelijkende

casestudy. In de enkelvoudige casestudy wordt een regeling, een land,

een groep als object van studie genomen. Het kan dan gaan om een

diepgaande bestudering van dat specifieke object, maar ook kan de

onderzoeker geïnteresseerd zijn in de case als een illustratie voor een

breder domein.

Een voorbeeld: onderzoek naar prestatiecontracten

Politiekorpsen werken sinds enige tijd met prestatiecontracten. Op een aantal terreinen dient

de politie specifieke, vaak gekwantificeerde doelen te behalen. Deze contracten zijn opgesteld

op basis van het Nationaal Politieconvenant en de uitwerkingen daarvan op het regionale

24 Verantwoorde cijfers in de zorg (2000).

Handleiding DDO

41niveau. De gedachte achter de contracten is dat er een behoefte bestaat aan een sterkere

verantwoording over het werk van de politie, maar ook dat het introduceren van prikkels

prestatieverhogend kan werken (aan het behalen van de in de contracten vastgestelde doelen

zijn financiële beloningen verbonden). Het achterliggende doel is het creëren, via een grotere

zichtbare aanwezigheid van politie, van een groter gevoel van maatschappelijke veiligheid.

Stel: de Algemene Rekenkamer wil onderzoek doen naar deze prestatiecontracten en is

geïnteresseerd in de vraag hoe ze uitwerken op het functioneren van regionale politiekorpsen.

In de vormgeving van een enkelvoudige casestudy kan dan gekozen worden voor een

zogenaamde critical of extreme case. In de eerste variant wordt gekozen voor een case (in dit

geval een bepaald regionaal korps) op grond waarvan we plausibele uitspraken kunnen doen

over het object in het geheel (Nederlandse politie). Voorbeeld: we kiezen het korps dat de

meeste ervaring heeft met het werken met prestatiecontracten. Als blijkt dat men hier tegen

problemen aanloopt die aan prestatiecontracten zijn gerelateerd, dan zegt dit vermoedelijk ook

iets over de korpsen die daar nog minder ervaring mee hebben. In de tweede variant wordt

een regionaal korps geselecteerd dat op een bepaalde manier zeer sterk afwijkt van de

overigen. Voorbeeld: de media berichten regelmatig over grote onvrede over deze

prestatiecontracten onder een bepaald korps. Een onderzoek langs deze lijnen opgezet

verschaft goed inzicht in de mogelijke problemen met prestatiecontracten, maar het is niet

mogelijk om iets over het functioneren van andere korpsen. Let op:

in beide gevallen hebben we dus een bepaalde mate van voorkennis nodig, die mogelijk kan

worden verkregen door middel van literatuuronderzoek of gesprekken met experts.

Primair doel: exploreren

Voor meer informatie: Flyvbjerg, B. (2000). Making social science matter: why social inquiry

fails and how it can succeed again. Cambridge: Cambridge University Press.

P. Verschuren (2003). Case study as a research strategy: some ambiguities and opportunities,

in: Journal of Research Methodology, vol. 6. no.2, 121-139.

P.G. Swanborn (1996). Case-study’s, Wat, wanneer en hoe? Meppel: Boom.

C. Robson (2002). Real World Research. Blackwell Publising.

R. K. Yin (2002). Case Study Research, Design and Methods, 3rd ed. Newbury Park: Sage

Publications.

Naast een enkelvoudige casestudy kan ook voor een vergelijkende

casestudie worden gekozen. Zie daarvoor § 4.3.2.3.

Het in kaart brengen van de manier waarop een organisatie zijn

processen heeft vastgelegd en hoe deze processen worden uitgevoerd, is

een explorerende manier van het doen van onderzoek naar verklaringen.

Want hoewel de dataverzameling tijdens een operational audit of een

bedrijfsvoeringsonderzoek uit toetsende handelingen bestaat, wordt er

geen hypothese getoetst. De opbrengst van zo’n onderzoek is de

wetenschap dat een organisatie zich wel of niet aan (voorgeschreven)

Handleiding DDO

42procedures houdt. Dat kan uiteraard iets zeggen over de reden waarom

de beoogde prestaties niet zijn geleverd, maar dat is niet met zekerheid

te zeggen: er is niet getoetst of het volgen van de beschreven procedures

leidt tot de gewenste prestaties. Er wordt geen relatie gelegd met de

resultaten.

In essentie zijn de twee hieronder te bespreken vormen van onderzoek de

voor de Algemene Rekenkamer vertrouwde onderzoeken naar

procedureel-organisatorische voorzieningen (POV).

o Operational audit

Een operational audit is een controle ter plaatse of bepaalde tevoren

geïdentificeerde processen worden uitgevoerd op de manier die in de

procesbeschrijvingen (handboeken, protocollen e.d) van de betrokken

organisatie(s) is voorgeschreven.

Deze techniek is alleen toepasbaar als de te onderzoeken organisatie

heeft vastgelegd hoe de gang van zaken rondom om een bepaald aspect

van de uitvoering van het beleid behoort te verlopen.

Belangrijkste stappen zijn de selectie van de te bekijken processen, het

maken van een controlewerkprogramma (een ‘vink-lijst’) en het

vastleggen in hoeverre procedures conform voorschrift zijn.

Primair doel: exploreren

Voor meer informatie: A.J.G. Driesen en J.W. van der Klerk (1997). Operational Auditing. Een

managementkundige benadering. Kluwer.

o Bedrijfsvoeringsonderzoek (bij derden)

Bedrijfsvoering is de sturing en beheersing van bedrijfsprocessen binnen

bijvoorbeeld een ministerie om de gestelde beleidsdoelstellingen te

kunnen realiseren. Het betreft sturing en beheersing van zowel de

primaire processen als van de processen die hiervoor faciliterend zijn. Het

onderzoek naar de bedrijfsvoering dat de Algemene Rekenkamer jaarlijks

ten behoeve van het RJV uitvoert, bestaat op grond van de

Comptabiliteitswet 2001 uit vier onderdelen:

1. het onderzoek naar het financieel beheer, het materieelbeheer van de

ministeries en de ten behoeve van dat beheer bijgehouden

administraties;

2. het onderzoek naar de totstandkoming van de informatie over het

door de ministers gevoerde beleid en de bedrijfsvoering van de

ministeries;

3. het onderzoek naar de totstandkoming van de informatie over het

gevoerde beleid en de bedrijfsvoering in de (departementale)

jaarverslagen;

Handleiding DDO

434. het onderzoek naar de kwaliteit van de informatie over de

bedrijfsvoering en het gevoerde beleid in de (departementale)

jaarverslagen.

Primair doel: explorerend

Voor meer informatie: Handleiding Rechtmatigheidonderzoek (intranet).

o Beleidstheorieanalyse

Een beleidstheorie is het geheel van normatieve, causale en finale (=

doelmiddelrelaties) elementen die aan het beleid ten grondslag liggen. De

normatieve elementen kan de Algemene Rekenkamer uiteraard niet

beoordelen. Wel kunnen we uitspraken doen over bijvoorbeeld de logica,

de consistentie, de onderbouwing, het realiteitsgehalte van het beleid.

Beoordeling van de beleidstheorie is in feite een evaluatie, zonder kennis

van de feitelijke uitkomsten van het beleid. Door het beoordelen van de

beleidstheorie maken we een inschatting van de plausibiliteit en de

robuustheid van het beleid.

Aan de hand van een aantal toetspunten is het heel goed mogelijk om de

kwaliteit van de beleidstheorie te beoordelen. Veel gebruikte toetspunten

zijn:

• Zijn de doelmiddelrelaties logisch?

• Zijn de (veronderstelde) causale mechanismes plausibel?

• Is het beleid goed onderbouwd?

• Zijn de doelen onderling consistent?

• Zijn de relevante hulpbronnen aanwezig?

• Zijn alle relevante actoren in het beleid betrokken, wat wordt van

hen verwacht, zijn deze verwachtingen realistisch?

(stakeholderanalyse)

• Zijn er niet genoemde beleidseffecten te verwachten?

(neveneffecten, averechtse effecten, is het beleid nog zinvol

tegen de tijd dat het effect sorteert)

Voor een deel hebben we deze vragen in eerder onderzoek ook gesteld,

bijvoorbeeld in het onderzoek Beleidsinformatie Betuweroute (met name

de onderbouwing van het beleid). Voor een deel betreft het voor de

Algemene Rekenkamer ook nieuwe vragen (stakeholderanalyse). In elk

geval hebben we nog niet eerder de beleidstheorie beoordeeld om

uitspraken te doen over de vraag waarom het beleid wel of niet goed

werkt.

Handleiding DDO

44Primair doel: een inschatting maken van de plausibiliteit en de robuustheid van het beleid.

Meer informatie: A. Hoogerwerf en M. Herweijer (1998). Overheidsbeleid : een inleiding in de

beleidswetenschap. Samson.

Handreiking Verantwoorden over beleid (www.rekenkamer.nl)

Werkbaarheidsanalyse beleidsvoornemens (http://www.justitie.nl/Images/11_39935.doc)

o Beschrijvende analyses (univariaat)

Beschrijvende analyses geven een eerste inzicht in de prestaties (en/of

effecten), de factoren die daarop van invloed kunnen zijn en de

samenhang tussen beide.

Frequentietabellen en histogrammen geven, per variabele, overzichten

van het aantal waarnemingen per categorie die de variabele kent.

Bijvoorbeeld: hoeveel medewerkers van de Algemene Rekenkamer

hebben de Arboflyer over RSI gelezen? Het zal duidelijk zijn dat dit alleen

zinvol is in het geval de variabele ook duidelijk onderscheiden categorieën

kent (wel gelezen, niet gelezen, weet niet meer). In het geval van

continue variabelen (interval- of rationiveau) zijn frequentietabellen en

histogrammen niet erg informatief.

Voor variabelen met een interval-of ratiomeetniveau zijn de centrale

tendentie en de spreiding informatiever. De maten voor centrale

tendentie geven aan welke getalswaarde of score als ‘gemiddelde’ of

midden van de verdeling moet worden aangemerkt. Afhankelijk van het

meetniveau is de modus (meest voorkomende waarde), mediaan

(middelste waarde) of het gemiddelde (som van de scores gedeeld door

het aantal scores) geschikt.

Spreidingsmaten geven inzicht in hoe de scores onderling verschillen

oftewel hoeveel variatie de scores in de verdeling bezitten. Wanneer

bijvoorbeeld in een schoolklas driekwart van de leerlingen de lesstof

uitstekend begrepen heeft en een acht haalt, maar het andere kwart het

niet verder brengt dan een vier, vergt dit een andere aanpak van de

docent in kwestie dan wanneer iedereen rond de zeven scoort.

Voor nominale gegevens geeft een frequentieverdeling het meeste inzicht

in hoeveel mensen op de onderscheiden categorieën hebben gescoord.

Voor ordinale en intervalvariabelen kan de spreidingsbreedte worden

weergegeven, oftewel het bereik van de scores (het verschil tussen

hoogste en laagste waarde) als ruwe indicatie voor spreiding.

Vanaf intervalmeetniveau bestaan er betere maten voor spreiding,

namelijk de variantie en de hieruit af te leiden standaarddeviatie van de

scores. De standaarddeviatie geeft de mate weer waarin de scores

gespreid zijn rondom het gemiddelde.

Handleiding DDO

45

o Heterogene prestaties

Het zal vaak het geval zijn dat door een bepaalde actor niet één, maar

verscheidene prestaties25 worden geleverd (denk maar aan de Algemene

Rekenkamer zelf, die vaak naar buiten treedt met een combinatie van

onder andere rapport, persbericht, persconferentie en briefings). In

dergelijke gevallen moeten deze prestaties tegen elkaar kunnen worden

afgewogen. We hebben dan te maken met een multi-criteriaprobleem.26

Om dit probleem op te lossen zijn twee benaderingen mogelijk:

handhaven van de deelscores, of de combinatie van deelscores

samenbrengen in een totaalscore (dat wil zeggen: corrigeren voor

heterogeniteit).

Deelscores kunnen worden gehandhaafd als het combineren van

deelscores overbodig, onmogelijk of ongewenst is.

Het combineren van deelscores is overbodig als de verschillende

deelscores dezelfde richting op wijzen. Het is onmogelijk wanneer geen

gewichtsfactoren voor de deelscores berekend kunnen worden of wanneer

het meetniveau niet hoger is dan ordinaal (zie § 4.3.1.2 voor de

verschillende meetniveaus). Het combineren van deelscores is ongewenst,

wanneer belangengroepen of -personen er verschillende weegsystemen

op na houden (Swanborn 1999).

Als dit allemaal niet het geval is (hiermee zijn dus ook meteen de

voorwaarden voor een zinvolle totaalscore gegeven), kan een combinatie

van deelscores tot een totaalscore worden gemaakt. Hiervoor bestaan

verschillende methoden. Deze worden in Swanborn (1999) uitgelegd.

Meer weten?

Voor meer informatie over meervoudige scores: zie P.G. Swanborn (1999). Evalueren.

Meppel: Boom.

o Beschrijvende analyses (bivariaat)

Om samenhangen tussen een beperkt aantal variabelen te onderzoeken

kun je gebruikmaken van kruistabellen, chikwadraattoetsen en correlatie.

Je moet wel voorzichtig zijn met het trekken van conclusies op basis van

dergelijke samenhangen, omdat je vaak geen rekening kunt houden met

allerlei interveniërende factoren waarvoor gecontroleerd moet worden.

Daarvoor moet je multivariate analyses toepassen.

25 Er is dan sprake van heterogeniteit in productie oftewel ‘productdifferentiatie’. 26 Swanborn (1999, p.176).

Handleiding DDO

46De relatie tussen twee nominale variabelen kan worden weergegeven met

een kruistabel. In feite is een kruistabel een frequentietabel waarin

waarnemingen op twee (of meer) nominale variabelen tegelijk afgebeeld

kunnen worden. Variabelen van een hoger meetniveau mogen ook, maar

om het aantal categorieën niet te groot te laten zijn moet er dan wel een

indeling in een beperkter aantal categorieën gemaakt worden. Om te

bepalen of een veronderstelde samenhang tussen twee variabelen ook

statistisch significant27 is, wordt de chikwadraattoets uitgevoerd. Zo bleek

in een onderzoek van de Algemene Rekenkamer naar de begeleiding en

herplaatsing van voortijdige schoolverlaters dat de drie onderzochte

regio’s behoorlijk verschilden in de mate waarin ze spijbelopvang

aanboden, oriëntatie op het werk, een voltijdbaan of hulpverlening. Alleen

de verschillen in de mate waarin met hulpverlening aanbod bleken echter

significant te zijn (Algemene Rekenkamer 2001c:7).

Correlatiecoëfficiënten verschaffen inzicht in de samenhang tussen twee

variabelen die ten minste op ordinaal niveau zijn gemeten. Onderzoekers

gebruiken deze techniek zo veelvuldig dat het begrip correlatie bijna

synoniem is met de begrippen samenhang en associatie.

De techniek vormt een krachtig hulpmiddel voor onderzoekers, maar kent

ook valkuilen. Essentieel is dat correlatiecoëfficiënten geen inzicht

verschaffen in de onderliggende causale relaties. Het bestaan van een

correlatie tussen twee verschijnselen vormt geen enkele garantie voor het

bestaan van een causale relatie tussen beide verschijnselen.

4.3.2.2 Toetsende technieken

Causale verbanden zijn – bij het onderzoeken van doeltreffendheid en

doelmatigheid – moeilijk aan te tonen. Afhankelijk van het te

onderzoeken object (vaak een complexe werkelijkheid), de

methodologische kwaliteit van de onderzoeksopzet en de analysetechniek

zijn causale conclusies meer of minder aanvechtbaar. Onderzoekers zullen

causale conclusies altijd met methodologische argumenten moeten

onderbouwen. In deze paragraaf wordt een aantal van de hiertoe in

Rekenkameronderzoek gebruikte (multivariate) technieken besproken.

o Elaboratie

Hierbij ga je uit van de idee dat een veronderstelde causale relatie tussen

twee variabelen wel eens het gevolg kan zijn van een derde variabele.

Denk aan het voorbeeld van de introductie van alcoholvrij bier in §

4.3.1.1.

27 ‘Statistisch significant’ betekent dat de kans klein is dat de gevonden samenhang op toeval

berust.

Handleiding DDO

47

o Regressieanalyse

Met behulp van regressieanalyse kunnen veronderstelde causale

verbanden en effecten multivariaat worden getoetst. Door het effect van

verschillende onafhankelijke variabelen op een afhankelijke variabele

gelijktijdig in ogenschouw te nemen, verschaft multipele regressieanalyse

inzicht in het relatieve belang van de afzonderlijke variabelen en brengt

het eventuele schijnverbanden aan het licht. Er zijn verschillende vormen

van regressie-analyse, bijvoorbeeld: lineaire, panel (tijdreeksen), random

effects (multilevel) en fixed effects (combinatie van cross-sectie en

tijdreeksanalyse). Voordeel van regressieanalyses is dat het met deze

technieken mogelijk is om meer dan een verklaring tegelijk te

onderzoeken.

o T-toetsen en variantieanalyse

Dit gebruik je om inzicht te krijgen in verschillen tussen groepen. Vaak

gaan ze samen met een (quasi-)experimentele opzet bedoeld om

verschillen tussen een controlegroep en experimentele groep op te sporen

met als doel het doen van causale uitspraken.

Om na te gaan of twee groepsgemiddelden in de populatie al dan niet van

elkaar verschillen, is de T-toets de geschikte techniek.

Om na te gaan of meer dan twee groepen qua gemiddelden van elkaar

verschillen, schiet de T-toets tekort. Variantieanalyse komt dan in

aanmerking.

Primair doel: toetsen

Voor meer (toegankelijke) informatie over statistiek: zie tekstblok 3 van het materiaal van de

cursus Methoden en technieken (via het kennisdomein DDO op intranet). Verder zou je

kunnen raadplegen: J. Stevens (1992). Applied multivariate statistics for the social sciences;

A. van Knippenberg & F. Siero (1980). Multivariate analyse. Beknopte inleiding en

toepassingen.

o (Natuurlijke) Experimenten

Met behulp van zuiver experimenteel onderzoek kan het bestaan van een

causaal verband goed worden getoetst. Je zorgt ervoor dat twee groepen

goed vergelijkbaar zijn. Eén van de groepen krijgt te maken met een

bepaalde prikkel (bijvoorbeeld een voorlichtingscampagne). Zowel voor

als na de prikkel meet je bij beide groepen hoe het er voor staat met het

gebied waar de prikkel zich op richt (bijvoorbeeld hun beeld van de

overheid, hun kennis van de risico’s van onveilig vrijen).

Handleiding DDO

48In de praktijk van het beleidsonderzoek is deze aanpak niet vaak volledig

toepasbaar, vanwege de strenge eisen die eraan worden gesteld (met

name de random toewijzing van onderzoekseenheden aan de

experimentele of controlegroep). Vaak wijkt men dan ook beredeneerd af

van dit ideaal en doet men concessies op het gebied van de vergelijkbaar-

heid tussen de groepen of van de voor- en nameting. Zo’n minder mooie

aanpak, die wel uitgaat van het experiment als model, heet een quasi-

experiment. Binnen het quasi-experiment bestaat nog een groot aantal

varianten waarvan de voor- en nameting met bestaande groepen,

bijvoorbeeld afdelingen binnen een ministerie, de bekendste is.

Aan het uitvoeren van beleidsexperimenten kleven allerlei ethische en

praktische bezwaren. Je kunt bijvoorbeeld niet de ene groep tuinders

bepaalde belastingvoordelen onthouden om te zien of hun energieverbruik

verandert en de andere (vergelijkbare) groep wel fiscaal stimuleren.

Maar er is meer mogelijk dan op het eerste gezicht lijkt. Er doen zich

namelijk geregeld mogelijkheden voor ‘natuurlijke’ beleidsexperimenten

voor. Het onderwijsachterstandenbeleid kan als voorbeeld worden

gebruikt: scholen met meer dan 70% allochtone leerlingen krijgen extra

geld, scholen met minder dan 70% allochtone leerlingen veel minder of

niet.

In een ‘natuurlijk experiment’ wordt gebruik gemaakt van het feit dat er

groepen bestaan die deze variabele op elkaar lijken (bijvoorbeeld scholen

met 69% allochtone leerlingen en scholen met 70% allochtone

leerlingen), maar waarbij de ene groep wel een stimulus krijgt en de

andere niet (in dit geval: extra geld). Op die manier kun je het effect van

(het uitblijven) een beleidsmaatregel bekijken bij nagenoeg gelijke

groepen. Een te toetsen verklaring kan dan bijvoorbeeld zijn dat een

extra subsidie van 6102,50 gulden per leerkracht per jaar (want daar

ging het hier om) daadwerkelijk leidt tot een hogere CITO-score van

allochtone leerlingen.


Voor meer (toegankelijke) informatie over (quasi-)experimenten kun je tekstblok 1 raadplegen

van het materiaal van de cursus Methoden en technieken (via het kennisdomein DDO). Zie

ook:

Baarda & De Goede (1995). Basisboek Methoden en Technieken; Swanborn (1987). Methoden

van sociaal-wetenschappelijk onderzoek.

E. Leuven, M. Lindahl, H. Oosterbeek en D. Webbink (2003). Zin en onzin in

evaluatieonderzoek; over de effecten van extra subsidies voor achterstandsleerlingen.

Universiteit van Amsterdam (SCHOLAR).

http://www1.fee.uva.nl/scholar/oosterbeek/achterstandsleerlingen.pdf

Handleiding DDO

49o Tijdreeksanalyse

Een tijdreeks is een chronologische reeks kwantitatieve gegevens,

bijvoorbeeld ziekteverzuimpercentages, werkloosheidscijfers,

recidivecijfers, misdaadcijfers, of cijfers over vroegtijdig schoolverlaten.

Door middel van tijdreeksanalyse kun je verklaringen zoeken voor het

patroon van een tijdreeks in termen van andere variabelen en het

relateren van waarnemingen aan bepaalde structurele gedragsregels. In

het rekenkameronderzoek Convenanten uitgaansgeweld is voor een

aantal jaar gekeken of het aantal geweldsincidenten in gemeenten daalt

door de aanwezigheid van convenanten. Hiertoe werd zowel naar

mogelijke omgevingsvariabelen gekeken als naar kenmerken van de

convenanten.

Nadeel van deze methode is dat er veel onderzoekseenheden nodig zijn

en dat het veel eisen stelt aan de kwaliteit van het verzamelde

datamateriaal.


Voor meer informatie: Chr. Chatfield (2004). The Analysis of Time Series: An Introduction.

Sixth Edition. Chapman & Hall.

4.3.2.3 Zowel explorerend als toetsend

o Vergelijkende casestudy

Een vergelijkende casestudy is niet hetzelfde als het ‘doen’ van een

aantal cases. Het verschil zit in de overwegingen die aan de selectie van

de cases ten grondslag ligt. Zo kan worden gekozen voor een

vergelijkende casestudy waarbij de cases worden geselecteerd op één of

meer onafhankelijke variabelen. Hierbij kan zowel gekozen worden voor

minimale variatie als voor maximale variatie op deze variabele(n).

Ook kunnen cases worden geselecteerd op basis van de afhankelijke

variabele(n). Dit gebeurt dan meestal door deze maximaal te laten

variëren (Swanborn 1996: 60-66).28 Een goed casestudyontwerp vraagt

dus om voorkennis van de cases.

Een veel gemaakt onderscheid in casestudy design is dat tussen het Most

Similar Systems Design (MSSD) en Most Different Systems Design

(MDSD). MDSD wordt bijvoorbeeld in de politicologie gebruikt om een in

28 Een combinatie van een enkelvoudige en een meervoudige casestudie is ook mogelijk: het

‘geneste’ casestudydesign, ook wel een embedded casestudy design genoemd. Hierbij worden

binnen een casus verschillende subcases onderscheiden. Hierdoor kan aan de ene kant gebruik

worden gemaakt van het voordeel van de enkelvoudige casestudy en een grotere diepgang als

gevolg van tijdwinst, terwijl aan de andere kant meerdere cases kunnen worden bestudeerd op een

lager abstractieniveau. De verschillende cases vormen tevens een basis om meer algemene

uitspraken te doen over het onderzochte fenomeen.

Handleiding DDO

50verschillende contexten steeds optredend fenomeen te verklaren,

bijvoorbeeld economische tijgers, staatsgrepen of revoluties. Gezocht

wordt dan naar de verklarende factoren die in al die situaties voorkomen,

terwijl de landen ook op een groot aantal aspecten zullen verschillen.

MSSD wordt onder meer gebruikt om landen te vergelijken die op een

groot aantal aspecten gelijk zijn, maar variëren op een aspect.

Een voorbeeld: gemeenten en specifieke uitkeringen

Stel dat we geïnteresseerd zijn in de vraag hoe gemeenten gebruik maken van de

beleidsvrijheid die ze rond de besteding van specifieke uitkeringen (in elk geval op papier)

hebben gekregen, en we willen weten waarom daar soms wel en soms geen gebruik van wordt

gemaakt. Door middel van een meta-evaluatie is het mogelijk om op zoek te gaan naar succes-

en faalfactoren voor decentralisatieprocessen. De uitkomsten daarvan kunnen vervolgens

worden gebruikt om heel gericht cases te selecteren en gericht het onderzoek in te gaan. De

casestudy krijgt daarmee een toetsend en verdiepend karakter.

o Benchmarking

Benchmarking is een methode die het mogelijk maakt veel meer

organisatie(onderdelen) met elkaar te vergelijken dan een vergelijkende

casestudy, maar levert wel oppervlakkiger resultaten dan de casestudy.

De Raad voor het openbaar bestuur definieert benchmarking als volgt:

"Het systematisch onderzoeken van de prestaties [en maatschappelijke

effecten] en achterliggende processen en werkwijzen van een of meer

toonaangevende referentie-organisaties op een bepaald gebied en het

spiegelen van de eigen prestaties en werkmethoden aan deze best

practices, met als doel te komen tot een plaatsbepaling en verbetering

van het eigen presteren." (Camp, 1992)

Een voorbeeld: verschillen tussen CWI’s

Het Rijk wilde af van een versplinterde verwerking van aanvragen en claimbeoordelingen voor

WW, WAO en bijstand. Per 1 januari 2002 waren alle arbeidsbureaus en gemeentelijke sociale

diensten samengesmolten tot 130 CWI’s (Centrum voor Werk en Inkomen). Deze CWI’s zijn

grosso modo op dezelfde manier ingericht. Toch haalt de ene CWI een hogere

“reïntegratiescore” dan de andere. Hoe komt dit?

Het naast elkaar leggen van alle CWI’s en vervolgens kijken op welke details hun werkwijzen

onderling verschillen (en welke gevolgen dat heeft voor de reïntegratiescores, kan een

verklaring geven voor de verschillen tussen uitvoering en prestaties).

Variabelen waar men naar zou kunnen kijken, zijn: grootte van het CWI, gebruik van

formulieren, wachttijden, plaatsingspercentages, et cetera.

Handleiding DDO

51Primair doel: zowel exploreren als toetsen

Voor meer informatie: R. Camp (1992). Benchmarking – Het zoeken naar de beste

werkmethoden die leiden tot superieure prestaties. Deventer.

Raad voor het openbaar bestuur (1992). Presteren door leren.

Ministerie van BZK & VNG (2004). De Gids. Prestatievergelijkingen en benchmarks binnen de

Openbare Sector. (http://www.vng.nl/Documenten/Extranet/Bjz/Bb/degidsdefinitief2.pdf)

Wanneer de benodigde gegevens zijn gedefinieerd en verzameld, is de

volgende stap het berekenen van de onderlinge verschillen in

doelmatigheid van de beleidsprestaties of -effecten waarover je een

uitspraak wilt doen. Er zijn verschillende methoden en technieken om dit

te doen. De belangrijkste zijn: het gebruik van eenvoudige kengetallen en

de analysetechnieken Free Disposable Hull (fdh), Data Envelopment

Analysis (dea) en Stochastic Frontier Analysis (sfa). Wanneer je met

behulp van kengetallen de doelmatigheid van de prestaties hebt bepaald,

kun je als tweede stap de mogelijke verklaringen voor de verschillen in

doelmatigheid toetsen. Hiervoor kun je een techniek als tobit- en

probitanalyse of eenvoudige regressieanalyse toepassen. Voor een

uitgebreide beschrijving van deze technieken kun je ook terecht in de

Handreiking meten van doelmatigheid en de bijbehorende internetbijlage

op de website van de Algemene Rekenkamer.

o Group Model Building

Group Model Building (GMB) is een methode waarmee groepsgewijs

modellen ontwikkeld kunnen worden over de sociale werkelijkheid.

Group model building helpt teams om hun situatie vanuit een

systeemoptiek te bekijken en daardoor deelvisies te integreren tot een

totaalvisie. De modelbouwer fungeert daarbij als 'group facilitator':

iemand die de groep helpt om zo’n systeemdynamica-model te

ontwikkelen. Zo wordt het kennispotentieel dat in de groep aanwezig is,

maar vaak door ineffectieve communicatie onderbenut wordt, beter

aangewend. Het uiteindelijke doel is het vinden van een oplossing die niet

alleen kwalitatief hoogwaardig is, maar die ook draagvlak heeft.

Van Group Model Building bestaan twee varianten: een meer

kwalitatieve en een meer kwantitatieve variant. In de kwalitatieve

variant (ook wel “mapping” genoemd) wordt met behulp van ‘causal loop

diagramming’ het probleem in kaart gebracht. Een causal loop

diagram is behulpzaam bij het structureren van oorzaak-

gevolgredeneringen over complexe problemen. Het diagram wordt

vervolgens gebruikt om het probleem te analyseren en interventiepunten

in het systeem te ontdekken, waarmee strategieën kunnen worden

ontwikkeld om het probleem op te lossen.

Handleiding DDO

52Bij de kwantitatieve variant wordt het causal loop diagram omgezet in

een ‘stocks and flow’ diagram dat vervolgens wordt gekwantificeerd,

waarna simulaties met het model kunnen worden uitgevoerd en potentiële

oplossingsrichtingen op hun effectiviteit en robuustheid kunnen worden

getoetst.

Een mogelijke toepassing van GMB zou kunnen zijn dat de Algemene

Rekenkamer op zoek gaat naar verklaringen voor de aanhoudende

problemen op een complex beleidsveld als de gezondheidszorg. GMB

voorziet in het bij elkaar brengen van alle betrokken partijen die in

verschillende rondes hun visie op de werkzaamheid van het beleid kunnen

geven. Welke (f)actoren spelen allemaal een rol? Met welke houdt het

beleid rekening? En gebeurt dat op een goede manier?

GMB vereist wel een hoge mate van betrokkenheid van betrokken actoren

en vereist bovendien de nodige specialistische kennis, waar de Algemene

Rekenkamer niet zelf over beschikt. Deze zou moeten worden ingehuurd.

Primair doel: zowel exploreren als toetsen

Voor meer informatie: J. Vennix (1996). Group Model Building. Wiley.

J. Vennix (1999). Group Model-building: tackling messy problems. System Dynamics Review,

15 (4), 379-401.

http://www.par-groep.nl/index.php?m=1&s=5

o Netwerk- en stakeholderanalyse

Ministers voeren hun beleid op een bepaald terrein meestal uit met lagere

overheden, ondernemingen, maatschappelijke organisaties en/of groepen

burgers. In een netwerkanalyse kijk je naar de rol van de overheid als

‘mede-speler’; een actor die stuurt temidden van andere actoren die ook

proberen te sturen.

Door middel van een netwerken stakeholderanalyse kun je

sturingsrelaties, interactiepatronen, (wederzijdse) afhankelijkheden en

probleemdefinities in kaart brengen. Kernvragen bij dit type analyse zijn:

1. Wie is bij het beleid betrokken?

2. In welke verhouding staan de verschillende actoren tot elkaar?

3. Over welke mogelijkheden beschikt elke afzonderlijke actor om de

uitvoering van beleid te bevorderen dan wel tegen te werken?

4. Kijken de actoren op dezelfde manier tegen het beleidsprobleem

en de mogelijke oplossingen aan?

De uitkomsten hiervan zijn te gebruiken om antwoord te geven op de

vraag waarom de implementatie van beleid uitblijft, bijvoorbeeld omdat

de sturingsrelaties onhelder zijn of omdat actoren die nodig zijn voor de

uitvoering een andere agenda hebben.

Handleiding DDO

53Een voorbeeld: Rolverdeling tussen OCW en PMPO

Organisaties voor procesmanagement worden gedefinieerd als semi-zelfstandige, op afstand

van het ministerie geplaatste organisaties met een tijdelijk karakter, die de implementatie en

uitvoering van grootschalige, complexe vernieuwingsprocessen begeleiden. Een voorbeeld

hiervan is het Procesmanagement Primair Onderwijs (PMPO).

Uit onderzoek (Algemene Rekenkamer, 1999c) kwam naar voren dat de positionering van het

PMPO onduidelijk was. Ging het om een autonome organisatie, een verlengstuk van het

departement of een adviseur van de staatssecretaris? Binnen het departement wordt erkend

dat, achteraf gezien, onvoldoende is nagedacht over wat het PMPO moest zijn en moest doen.

In een onderzoek naar verklaringen kan expliciet worden gekeken naar de relatie tussen het

PMPO en het departement.

Primair doel: kan zowel toetsend als explorerend worden gebruikt

Voor meer informatie:

Handleiding Normen voor netwerksturing (intranet Algemene Rekenkamer)

J.A, de Bruijn, E.F. ten Heuvelhof (1995). Netwerkmanagement: strategieën, instrumenten en

normen. Utrecht, Lemma.

G. Teisman (1992). Complexe besluitvorming, een pluricentrisch perspectief op besluitvorming

over ruimtelijke investeringen. VUGA.

http://www.storrmcs.nl/denieuwedorpen/downloads/DND_stakeholders_analyse.pdf

http://www.ketens-netwerken.nl/

4.4 Methodenmatrix

In § 3.3 zijn we – aan de hand van de verklaringenmatrix – ingegaan op

mogelijke oorzaken van eventueel achterblijvende prestaties en effecten

of ondoelmatigheden. In onderstaande methodenmatrix geven we – voor

een aantal van de in de vorige paragraaf genoemde methoden – aan

welke (meer of minder) geschikt is voor onderzoek naar verklaringen

binnen een van de vier kwadranten. In het middelste vak staan de breed

toepasbare methoden genoemd.

Handleiding DDO

54 Prestaties Effecten

Intern • Operational audit

• Bedrijfsvoeringsonderzoek

• Beleidstheorieanalyse

• (Natuurlijke) experimenten

Extern

• Bedrijfsvoeringsonderzoek bij derden

• Netwerk- en stakeholderanalyse

• Tijdreeksanalyse

• Event analysis

Literatuuronderzoek, (vergelijkende) casestudies,

benchmarks, focusgroepen, delphi-methode,

regressieanalyse, Group model building

Handleiding DDO

555 Analyse van beleidsdoelen en beleidsinformatie

5.1 Inleiding

Dit hoofdstuk behandelt de analyse van beleidsdoelen en

beleidsinformatie. In § 5.2 bespreken we de analyse van beleidsdoelen.

Hieronder vallen ook de normen en de reconstructie van beleidsdoelen. In

§ 5.3 gaan we in op de analyse van beleidsinformatie. Hier komen onder

meer aan de orde: de verschillende soorten beleidsinformatie, de bronnen

van beleidsinformatie, de normen voor beleidsinformatie, de wijze van

beoordeling van beleidsinformatie en aanbevelingen.

5.2 Beleidsdoelen

5.2.1 Algemeen

De doelen van het beleid van een minister of een RWT zijn uitgangspunt

van elk DDO. De algemene doelen van het beleid van de minister kunnen

tegenwoordig worden gevonden in de zogenoemde VBTB-begrotingen.

Met de regeringsnota Van Beleidsbegroting tot Beleidsverantwoording

(VBTB) zijn de begrotingen omgebouwd van begrotingen met veel

financiële informatie tot begrotingen die concrete beleidsdoelstellingen

bevatten. In een VBTB-begroting moeten de ministers aangeven: (1) wat

ze willen bereiken, (2) wat ze daarvoor gaan doen en (3) wat dat mag

kosten. Daarmee zijn de begrotingen een vertrekpunt geworden voor het

DDO van de Algemene Rekenkamer (zie bijlage 3 voor een nadere

uitzetting over VBTB-begrotingen).

In de praktijk van het onderzoek zullen doelstellingen uit de begroting,

zoals geformuleerd in de beleidsartikelen, vaak nog te abstract zijn om te

kunnen gebruiken voor een analyse van beleidsdoelen. Beleidsnota’s en

Tweede-Kamerstukken verschaffen dan meer informatie over concrete,

operationele doelstellingen.

Handleiding DDO

56De doelen van RWT’s kunnen worden gevonden in weten regelgeving (ze

hebben immers een wettelijke taak) of anders wellicht in begrotingen van

departementen, oprichtingsstatuten of jaarverslagen van de RWT’s zelf.

5.2.2 Reconstructie en operationalisatie van beleidsdoelen

Wanneer een minister, de VBTB-eisen ten spijt, geen duidelijke

beleidsdoelen heeft geformuleerd, zal de Algemene Rekenkamer proberen

de doelen te reconstrueren of te operationaliseren. Daarbij is het van

belang de reconstructies en operationalisaties tussentijds door de

minister te laten accorderen.

Reconstructie beleidsdoelen

Het ligt voor de hand om voor het achterhalen van beleidsdoelen niet

alleen officiële beleidsstukken te raadplegen, maar ook overleg te voeren

met de gecontroleerde. Vaak blijkt dan dat de officiële beleidsdoelen niet

altijd een juist of bruikbaar beeld geven van wat de gecontroleerde

werkelijk wil bereiken. De beleidsdoelen kunnen vaag zijn geformuleerd,

onrealistisch hoog of laag zijn gesteld en aan veranderingen onderhevig

zijn. Toch verdient het de voorkeur om de officiële beleidsdoelen als uit-

gangspunt te nemen.

Ook wanneer gecontroleerden iets anders nastreven, vormen de officiële

beleidsdoelen in belangrijke mate de legitimatie van het beleid in het

democratisch proces. Uit het oogpunt van democratische controle zijn de

officiële beleidsdoelen de maatstaf. Overigens kunnen ook bevindingen en

conclusies worden geformuleerd over de gebleken discrepantie tussen

officiële en in de praktijk gehanteerde beleidsdoelen.

Een methode om doelen te reconstrueren is het gebruik van de

‘doelboom’. In een doelboom worden relaties aangebracht tussen

instrumenten, subdoelen en einddoelen van het beleid. De (re)constructie

van een doelboom is geen simpele exercitie. De brokstukken voor een

dergelijke boom moeten veelal uit diverse beleidsstukken bijeen worden

gebracht. Daarom is overleg met de gecontroleerde over de ge(re)-

construeerde doelboom aan te bevelen.

Een goed voorbeeld van het gebruik van een doelboom vind je hieronder.

Handleiding DDO

57

Doelen en instrumenten uit de beleidsnota Werk door ondernemen: stimulering van

het midden- en kleinbedrijf (1995) (zoals gereconstrueerd in het Rekenkameronderzoek

Stimulering midden- en kleinbedrijf, 2001)

Operationalisatie beleidsdoelen

Het zelf operationaliseren van beleidsdoelen is relatief gemakkelijk als

deze in direct observeerbare termen zijn geformuleerd, zoals in de

formulering: ‘een lagere gemiddelde snelheid op de autowegen, namelijk

x kilometer per uur’. Vaak zijn beleidsdoelen echter zo geformuleerd dat

ze géén betrekking hebben op direct observeerbare zaken. Een voorbeeld

van een dergelijk beleidsdoel: ‘de preventie van afvalstoffen’.

Het gaat erom zodanige indicatoren te ontwikkelen dat zij een zo juist en

volledig mogelijke afbeelding vormen van de door beleidsmakers

geformuleerde beleidsdoelen en toch meetbaar zijn. Daarbij dient

aandacht besteed te worden aan de volgende aspecten:

• Omvatten de gekozen indicatoren het beleidsdoel in zijn volle

breedte?

Hebben de gekozen indicatoren bijvoorbeeld alleen betrekking op de

Scheppen van meer Werk

Vergroten ruimte voor Ondernemerschap

Vergroten ruimte voor Starters Vergroten ruimte voor Doorgroeiers

eind

doel

entu

ssen

doel

enin

stru

men

ten

Verzilveren van de Werkgelegenheidspotenties

Van het M KB

Fiscale maatregelen1. Verlaging tariefstapje Vennootschapsbelasting2. Verhoging investeringsaftrek 3. Verhoging ondergrens BTW-vrijstelling4. Fiscale tante Agaath regeling5. Verhoging ondernemingsvrijstell ing in de Vermogenbelasting

Vermindering regeldruk11. Liberalisering Winkelsluitingswet12. Vermindering administratieve lasten / bestaande regelgeving13. Vermindering administratieve lasten / voorgenomen regelgeving 14. Dereguleringsactie Grote Steden 15. Dereguleringsactie Grote Steden (kansenzônes)

Arbeid26. Verlaging overhevelingstoeslag27. Verruiming mogelijkheden detachering langdurig werklozen28. Afdrachtvermindering langdurig werklozen29. Subsidieregeling experimenten activering uitkeringsgelden 30. Experimenten concurrerende dienstverlening 31. Premieregeling bij marginale arbeid 32. Dispensatie Wet minimumloon en minimumvakantiebijslag33. Inkorten procedure preventieve ontslagtoets34. N ieuwe arbeidstijdenwet 35. Aanpassing proeftijdregeling36. Invoering mogelijkheid verlenging ti jdeli jke contracten37. Europese regeling ESF (scholing voor behoud van werk)38. Europese regelgeving Adapt 39. Afdrachtvermindering onderwijs

Fiscale maatregelen6. Verruiming afschrijving van investeringen door starters7. Verhoging startersaftrek8. Vereenvoudiging bedrijfsopvolging

Vermindering regeldruk16. M odernisering Vestigingswet 17. Evaluatie Besluit bijstandsverlening zelfstandigen

Kwaliteit ondernemerschap18. Regionale coördinatie startersopvang19. Proefprojecten opvang kansarme starters20. Expertisecentrum allochtone ondernemers21. Doorstarters

Financiering40. Facil iteit voor participatiemaatschappijen ten behoeve van technostarters41. Bevordering financieringsaanbod seeders42. Bemiddelingsbureau informal investors

Fiscale maatregelen9. Fiscale exportreserve 10. Verhoging WBSO

Kwaliteit ondernemerschap22. Projectmatige benadering M KB vanuit ondernemingshuizen23. M KB-loket op internet24. Programma starters op buitenlandse markten (PSB)25. Voortzetting Stimuleringsregeling Branchecentra voor Technologie (BCT)

Financiering43. Ondersteuning technologie-rating ten behoeve van financiers44. Verruiming Besluit borgstell ing M KB-kredieten45. Verhoging maximale bedragen Besluit borgstell ing M KB-kredieten

Handleiding DDO

58preventie van absolute hoeveelheden afvalstoffen (kwantitatieve

preventie) of ook op het verminderen van de schadelijkheid van

afvalstoffen voor het milieu (kwalitatieve preventie)?

• Is er een voldoende sterke relatie tussen het te operationaliseren

beleidsdoel en de voor het onderzoek gekozen indicatoren?

Zo geeft ‘(reductie van) de omvang van het bij bedrijven vrijgekomen

afval’ maar een beperkte indicatie van de mate waarin sprake is van

‘preventie van afvalstoffen’. De omvang van de afvalproductie wordt

namelijk niet alleen bepaald door preventiemaatregelen, maar ook

door autonome ontwikkelingen (bijvoorbeeld economische groei).

• Zijn er interveniërende factoren die verandering aanbrengen in de

vertaling die de indicator geeft van het beleidsdoel?

Daarvan is bijvoorbeeld sprake bij de operationalisering van het

beleidsdoel ‘preventie van gevaarlijke afvalstoffen’ in de indicator ‘de

verandering van de door bedrijven gemelde hoeveelheid gevaarlijk

afval’. Bij deze operationalisering wordt de invloed van veranderingen

in het meldgedrag van bedrijven over het hoofd gezien. Immers: een

verslechterd meldgedrag van bedrijven leidt wel tot minder gemeld

gevaarlijk afval, maar niet tot afvalpreventie.

5.2.3 Normen beleidsdoelformulering

Beleidsdoelen moeten SMART29 zijn geformuleerd. Dit houdt in:30

SMART Omschrijving

Specifiek Doelen moeten concreet zijn geformuleerd: welke prestaties en effecten worden beoogd c.q. welke doelgroepen (zo die er zijn) moeten worden bereikt?

Meetbaar Het bereiken van doelen moet kunnen worden gemeten; eenduidige definiëring van begrippen is vereist. Vaak is ook een nulmeting nodig.

Afgestemd Beleidsdoelen moeten in ieder geval zijn afgestemd met de relevante actoren (Tweede Kamer, uitvoerders).

Realistisch Doelen moeten zodanig zijn gekozen dat ze realiseerbaar zijn onder alle plausibele omstandigheden (exogene variabelen en beleidsmaatregelen).

Tijdgebonden Er moet een datum zijn vastgelegd waarop het einddoel moet zijn bereikt; bij langlopende projecten kunnen ook tussendoelen en bijbehorende data van belang zijn.

Bovendien moeten de doelen consistent zijn:

Consistentie van doelen

Consistentie tussen doelen: het ene doel mag het andere niet uitsluiten. Consistent Consistentie tussen doelen en basisgegevens: als basisgegevens wijzigen,

moeten de doelen hieraan zo nodig worden aangepast.

Bij de Algemene Rekenkamer spreken we daarom over SMART-C.

29 Bouckaert e.a. (1998). 30 Deels ontleend aan Algemene Rekenkamer (2002a).

Handleiding DDO

59Bovenstaande normen zijn nader toegelicht in bijlage 4. Zie ook de

Normenbank (te benaderen vanuit het menu Start, Algemene

Rekenkamer Applicaties) en de toelichting in bijlage 4 voor voorbeelden

van de toepassing van de normen.31

5.2.4 Beoordeling beleidsdoelformulering

Om de beoordeling van doelformulering handen en voeten te geven, kan

gebruikgemaakt worden van checklists. Zie § 5.3.7 voor meer informatie.

5.2.5 Aanbevelingen

Uit onderzoek naar beleidsdoelen vloeit doorgaans een cluster van

aanbevelingen voort. Bijvoorbeeld:

• het beter toetsbaar formuleren van de beleidsdoelen;

• het opheffen van de onderlinge inconsistentie (strijdigheid) van de

beleidsdoelen of aangeven tot op welke hoogte ze strijdig mogen zijn

(beleidsdoel A mag beleidsdoel B niet zodanig belemmeren, dat

beleidsdoel B beneden/boven een grenswaarde X uitkomt);

• het beter onderbouwen (op haalbaarheid onderzoeken) van de

beleidsdoelen;

• het beter expliciteren en onderbouwen van wijzigingen in de

beleidsdoelen of de te hanteren evaluatiecriteria.

5.3 Beleidsinformatie

5.3.1 Algemeen

Beleidsinformatie speelt een belangrijke rol in het (be)sturen van de

rijksoverheid. Met het verschijnen van de regeringsnota VBTB (1999) en

de eerste VBTB-begrotingen (2002) is het belang van beleidsinformatie

alleen nog maar toegenomen. De beschikbaarheid van beleidsinformatie

(en de beoordeling daarvan door de Algemene Rekenkamer) is geen doel

op zichzelf, maar een vereiste om de doelmatigheid en doeltreffendheid

van het beleid te kunnen bewaken en bevorderen.

31 De Rijksbegrotings- en verantwoordingsvoorschriften 2001 stellen dat de algemene

beleidsdoelstellingen (of ten minste één operationele doelstelling) zoveel als mogelijk uitgedrukt

behoren te worden in meetbare en beïnvloedbare streefwaarden. Deze moeten tevens een

aanduiding van de doelgroep(en) bevatten en geplaatst zijn tegen een tijdshorizon.

Handleiding DDO

605.3.2 Welke beleidsinformatie?

Gebruiksfuncties van beleidsinformatie

Beleidsinformatie kan voor verschillende functies en in verschillende

beleidsstadia gebruikt worden:

• tijdens de beleidsvoorbereidingsfase: als basis voor het opstellen van

beleid en/of het opstellen van de begroting;

• tijdens de uitvoeringsfase: voor de (bij)sturing van het beleid

(waaronder ook toezicht houden);

• in de evaluatiefase: voor de verantwoording over het gevoerde

beleid.32

Het verschil in gebruiksfunctie gaat samen met een verschil in doelgroep

en een gebruik in verschillende cycli. Beleidsinformatie zal, in het kader

van de sturingsfunctie, met name relevant zijn voor de beleidsdirectie en

de verantwoordelijke minister; daarnaast zal een deel ook nodig zijn voor

de Tweede Kamer.

De behoefte aan beleidsinformatie voor de begrotings- en

verantwoordingsfunctie vloeit voort uit het budgetrecht van de Tweede

Kamer. Het betreft informatie van de ministers aan de Tweede Kamer ter

accordering van voorgenomen beleid (begroting) en ter verantwoording

over uitgevoerd beleid (jaarverslag). Deze informatie verloopt langs de

lijn van de jaarlijkse begrotingscyclus.

De rol die informatie speelt in de beleidsvoorbereidende fase is eveneens

belangrijk in het DDO. Hierbij gaat het onder meer om een

probleemanalyse die – als het goed is – een nulmeting en een

beleidstheorie bevat, evenals ex-ante-evaluaties voor verschillende

scenario’s en beleidsvarianten. Ook de beschikbare informatie over de

onderbouwing van de doelen is relevant.

Beleidsinformatie over prestaties en effecten

De doelen die de regering in bijvoorbeeld begrotingen en beleidsnota’s

heeft geformuleerd voor haar beleid zijn in hoge mate bepalend voor de

vraag welke beleidsinformatie nodig is over prestaties en effecten

(bijvoorbeeld naar wat voor soort resultaten wordt gekeken en wat voor

criteria moeten worden aangelegd om resultaten als voldoende te

beschouwen).

32 Sturing en verantwoording hebben overigens niet alleen op het beleid betrekking , maar zijn ook

gericht op bedrijfsvoering en financiële middelen. Zie het rapport Jaarverslag in de politieke arena,

naar een nieuwe stijl van verantwoorden (mei 1998).

Handleiding DDO

61Welke beleidsinformatie – qua vorm – er moet zijn over prestaties en

effecten, wordt omschreven in de Regeling Prestatiegegevens en

Evaluatieonderzoek Rijksoverheid. De regeling onderscheidt drie typen

van prestatiegegevens:

1. beleidsdoelstellingen, zo veel mogelijk geoperationaliseerd in termen

van nagestreefde en gerealiseerde effecten, gekoppeld aan

doelgroepen van beleid en een tijdshorizon;

2. informatie over kostprijs en kwaliteit van de door de overheid te

leveren / geleverde prestaties (producten en diensten);

3. programma-uitgaven, zo veel als zinvol onderbouwd met volume- en

prijsgegevens (bijvoorbeeld het verwachte aantal begunstigden van

een subsidieregeling en het bedrag per subsidie).

Prestatiegegevens worden dus ruim opgevat: het gaat niet alleen over

prestaties, maar ook over effecten en kosten. Ook moet tegenwoordig in

de begrotingen informatie worden opgenomen over bijvoorbeeld de

kostprijs en de kwaliteit van de door de overheid te leveren c.q.

geleverde prestaties.

Zie ook hoofdstuk 3 voor een uiteenzetting van de verschillende

begrippen.

5.3.3 Bronnen van informatie over prestaties en effecten

Beleidsinformatie over prestaties en effecten kan op verschillende

plaatsen worden aangetroffen. Veel beleidsinformatie is te vinden in de

begrotingen en jaarverslagen. Deze dienen – naast de informatie over de

beoogde/bereikte effecten van het beleid – ook informatie te bevatten

over de daartoe te ontplooien/ontplooide initiatieven (inclusief de te

leveren/geleverde prestaties) en daarmee gemoeide kosten. Deze

informatie is nodig om uitspraken te kunnen doen over doelrealisatie,

doelmatigheid van beleid en bedrijfsvoering en de doeltreffendheid van

beleid.

In de eerder genoemde Regeling Prestatiegegevens en

Evaluatieonderzoek Rijksoverheid (RPE) worden systemen van reguliere

prestatiegegevens en periodiek evaluatieonderzoek (ex ante en ex post)

genoemd als bronnen waaruit deze beleidsinformatie kan voortkomen.

Daarnaast valt ook te denken aan niet-reguliere informatiebronnen, zoals

derden.

Handleiding DDO

62Reguliere prestatiegegevens

Systemen van reguliere prestatiegegevens zijn volgens de RPE (p.19):

“informatiesystemen waarmee op gezette tijden informatie wordt

verkregen over onder meer:

1. de mate waarin doelstellingen c.q. beoogde effecten worden bereikt;

2. de – voortgang van de – uitvoering van beleid; en

3. de aantallen, kosten en kwaliteit van geleverde prestaties.”

Hoewel het woord ‘systeem’ doet vermoeden dat het altijd zou moeten

gaan om iets dat ingewikkeld, elektronisch en duur is, hoeft dat helemaal

niet zo te zijn. Een organisatie die jaarlijks een set fraaie kengetallen

opstelt die inzicht geven in de aantallen en kwaliteit van de geleverde

prestaties, heeft ook een meetsysteem.

Evaluatieonderzoek

Evaluatieonderzoeken (ex ante33 en ex post34) die door of voor de

ministeries zijn uitgevoerd, leveren uiteraard ook beleidsinformatie op.

Evaluatieonderzoek is, vanwege het diepgravende karakter, bij uitstek

geschikt om onderzoek te doen naar de doelmatigheid en doeltreffendheid

van het beleid. Daarmee zijn – door of voor de ministeries uitgevoerde –

evaluatieonderzoeken voor de Algemene Rekenkamer een belangrijke

bron van beleidsinformatie over doelmatigheid en doeltreffendheid.

In de RPE is opgenomen dat de in de begroting en jaarverslagen

opgenomen algemene en/of nader geoperationaliseerde doelstellingen

van beleid in de regel ten minste eens in de vijf jaar worden geëvalueerd

aan de hand van evaluatieonderzoek ex post.

Overige bronnen

Behalve in de reguliere bronnen kan beleidsinformatie ook worden

gevonden in inspectierapporten, (niet-departementale) niet-reguliere

voortgangsrapportages, beleidsnota’s, Kamerstukken enzovoort. Ook

bestaande databestanden kunnen worden aangemerkt als bron van

onbewerkte beleidsinformatie en dus worden gebruikt in het DDO.

Een vraag die zich hierbij aandient is of informatie over beleid door of in

opdracht van het ministerie moet zijn verzameld om als beleidsinformatie

33 Ex ante-evaluatieonderzoek wordt uitgevoerd om op systematische wijze de kosten en de

verwachte effecten en neveneffecten van twee of meer beleidsalternatieven te vergelijken. 34 Onder ex post-evaluatieonderzoek wordt verstaan: ‘systematisch onderzoek naar de effecten van

bestaand beleid, de wijze waarop beleid wordt uitgevoerd en/of de kosten en kwaliteit van

geleverde producten en diensten’ (Ministerie van Financiën (2001), p.21). Evaluatieonderzoek ex

post valt uiteen in (Ministerie van Financiën (2001), p.21): doelrealisatiesonderzoek,

doeltreffendheidsonderzoek, onderzoek naar de doelmatigheid van beleid en onderzoek naar de

doelmatigheid van de bedrijfsvoering.

Handleiding DDO

63te worden aangemerkt. Ook derden (bijvoorbeeld universiteiten en

brancheorganisaties) verzamelen immers informatie over (resultaten van)

beleid. Daarnaast is het denkbaar dat er (in ruwe vorm) informatie

aanwezig is op het ministerie maar dat deze niet ‘bruikbaar’ wordt

gemaakt.

De Algemene Rekenkamer beschouwt de genoemde informatie als

beleidsinformatie, ook als deze informatie onbekend is bij of niet

aanwezig is op het ministerie. Het wordt de minister negatief

aangerekend als hij relevante informatie niet kent of (ongemotiveerd)

niet gebruikt.

5.3.4 Kwaliteit van de beleidsinformatie (product)

In DDO kan de kwaliteit van de beleidsinformatie beoordeeld worden.

Over de normen waar de informatie aan moet voldoen, is heel wat

vastgelegd.

Voor de beoordeling van de kwaliteit (en bruikbaarheid) van

beleidsinformatie maakt het onderzoeksteam gebruik van binnen de

Algemene Rekenkamer nader uitgewerkte normen voor beleidsinformatie

en van de toepassingen ervan die kunnen worden gevonden in de

Normenbank (te benaderen vanuit het menu Start, Algemene

Rekenkamer Applicaties). Deze normen gelden voor beleidsinformatie die

uit systemen van reguliere prestatiegegevens afkomstig is, alsook voor

beleidsinformatie die uit evaluatieonderzoek komt. Uiteraard worden de

normen ook toegepast op informatie afkomstig van de overige bronnen

zoals beschreven in § 5.3.3.

De Algemene Rekenkamer hanteert in al haar onderzoek dezelfde hoofd-

normen voor de beoordeling van informatie.

Er zijn twee groepen hoofdnormen35 (zie ook bijlage 5a):

• Inhoudelijke hoofdnormen: relevantie, betrouwbaarheid en

conformiteit aan wettelijke regels en gezaghebbende richtlijnen voor

de inhoud van informatie.

• Hoofdnormen voor vorm en presentatie: begrijpelijkheid,

vergelijkbaarheid en conformiteit aan wettelijke regels en

gezaghebbende richtlijnen voor de vorm van informatie.

Als de beleidsinformatie voldoet aan de zes hoofdnormen, dan verdient ze

volgens de Algemene Rekenkamer het predikaat ‘bruikbaar’.

35 Algemene Rekenkamer (2004):Handleiding Normen en begrippen (onderdeel van Handar)

Handleiding DDO

64In het DDO zal bij de hoofdnorm relevantie in ieder geval ook aandacht

geschonken moeten worden aan de volgende subnormen:

• volledigheid;

• actualiteit;

• tijdigheid.

Bij vergelijkbaarheid zal in ieder geval aandacht geschonken moeten

worden aan:

• consistentie (in de tijd; tussen onderdelen van de beleidsketen; en

tussen bronnen).

Deze (hoofd)normen vormen een ‘basispakket’. Toepassing van

deelnormen zal van situatie tot situatie kunnen verschillen.

De subnorm ‘volledigheid’ is nader uitgewerkt in bijlage 5b. Daar is in

algemene termen aangegeven welke informatie voor de sturing van beleid

nodig is in de verschillende fasen waarin beleid zich kan bevinden.

Daarbij is met het begrip ‘optioneel’ aangeven wat binnen de subnorm

‘volledigheid’ niet tot het basispakket wordt gerekend. Voorbeelden van

toepassingen van de normen zijn te vinden in bijlage 5c.

5.3.5 Kwaliteit van de beleidsinformatie (proces)

Totstandkoming informatie

Voor het onderzoek naar de vraag of de beleidsinformatie – afkomstig uit

systemen van reguliere prestatiegegevens of evaluatieonderzoek – aan de

gestelde zes hoofdnormen voldoet, zal (veelal) moeten worden

aangesloten bij de drie fasen van totstandkoming van informatie.

Informatie komt tot stand in drie fasen:36

1. De fase van informatieverzameling, inclusief initiële vastlegging. Deze

leidt tot het product ‘basisinformatie’;

2. De fase van informatieverwerking. Deze leidt tot het product

‘veredelde informatie’;

3. De fase van informatieverstrekking. Deze leidt tot het product

‘verstrekte informatie’ oftewel ‘rapportage’.

Deze fasen kunnen niet los van elkaar worden beschouwd. Immers, wil

het Rijk of een instelling informatie kunnen verstrekken die aan de eisen

voldoet (fase 3), dan moeten ook het proces van informatieverzameling

(fase 1) en informatieverwerking (fase 2) aan de eisen voldoen.

36 Uit: handleiding Normen en begrippen (2004).

Handleiding DDO

65Om bijvoorbeeld relevante informatie te kunnen verstrekken, dienen de

ministeries en instellingen voor de informatieverzameling (met name die

over beleidsresultaten) een rationeel-analytische benadering te hanteren.

Dat betekent dat ze doelstellingen hebben bepaald en

geoperationaliseerd, en dat ze prestatiegegevens (inclusief

effectgegevens) hebben benoemd.

Daarnaast moeten ministeries bij de informatieverzameling rekening

houden met de gebruikers van de informatie. Dit betekent dat ze (1) een

goed beeld moeten hebben van de gebruikers, (2) de informatiebehoeften

van de gebruikers moeten kennen (grootheden en eenheden) en (3) de

processen van informatieverzameling op de door de gebruikers verlangde

informatie moeten inrichten.

Wanneer een ministerie of instelling basisinformatie verwerkt (ag-

gregeert, synthetiseert enzovoort), moet haar integriteit behouden

blijven. Dit betekent dat ook verwerkingsprocessen moeten voldoen aan

eisen van betrouwbaarheid, validiteit, ordelijkheid en controleerbaarheid.

Als we de verstrekte informatie op betrouwbaarheid en validiteit

beoordelen, dan steunen we op de waarborgen die ministeries en

instellingen hebben getroffen. Deze waarborgen zijn bijvoorbeeld: de

juiste deskundigheid, functiescheiding, heldere procedures en goede

vastlegging (audit trail).

Indien ministeries en instellingen de informatie niet zelf verwerken,

dienen zij zich ervan te vergewissen dat dat elders goed gebeurt.

Eisen in regelgeving

De RPE (bepaling 5.1) stelt dat de ten behoeve van begroting en

verantwoording gebruikte informatiesystemen (van reguliere

prestatiegegevens) of evaluatie-instrumenten moeten voldoen aan de

eisen van validiteit, betrouwbaarheid / nauwkeurigheid en bruikbaarheid.

In de RPE (p.34-37) worden deze eisen verder geëxpliciteerd. Bepaling

5.2 stelt dat de in begroting en verantwoording opgenomen

beleidsinformatie op een ordelijke en controleerbare wijze tot stand dient

te komen. Helder moet zijn hoe de betreffende informatie tot stand is

gekomen: “[er wordt] op een transparante wijze aangegeven welke

keuzes aan de totstandkoming van de informatie ten grondslag hebben

gelegen. Systemen voor reguliere prestatiegegevens en de

administratieve organisatie daarvan moeten zo beschreven zijn, dat hun

kwaliteit vastgesteld kan worden. De kwaliteit en onafhankelijkheid van

evaluatieonderzoek dienen aan de hand van een onderzoeksdossier

vastgesteld te kunnen worden.”37

37 Ministerie van Financiën (2001).

Handleiding DDO

66

Beoordelen van prestatiemeetsystemen

Bij het evalueren van een meetsysteem moet in de eerste plaats worden

vastgesteld welk doel het meetsysteem in de organisatie heeft. Heeft dit

een neutrale thermometerfunctie die alleen objectief en afstandelijk

registreert en geen invloed heeft op de organisatie? Of vervult het

meetsysteem een centrale functie in de planning- en controlcyclus van

een organisatie? Idealiter is uiteraard de gegevensverzameling en

-analyse een onderdeel van de planning- en controlcyclus want daarmee

is gewaarborgd dat de informatie wordt gebruikt voor (bij)sturing van

beleid of voor verantwoording. Informatie verzamelen en er vervolgens

niets mee doen is immers niet wenselijk.

In de tweede plaats is van belang om de vraag te stellen of het

meetsysteem, gegeven de strategische en operationele doelen van het

beleid en gegeven de functie van het meetsysteem, wel de juiste

prestatie-indicatoren bevat. Vaak zijn de strategische en operationele

doelen immers niet uiteengelegd in de juiste indicatoren. Dan kan de

informatie uit het meetsysteem niet gebruikt worden voor sturing, noch

voor verantwoording. Als bijvoorbeeld van het afvalbeleid de doelstelling

is: ‘het voorkómen van het ontstaan van afval’, dan zegt het

prestatiegegeven ‘afname hoeveelheid afval’ nog weinig over het

voorkómen van afval, dus is het geen goede indicator van het effect. Als

de doelstelling luidt: ‘het verminderen van de hoeveelheid afval’, dan zegt

dit prestatiegegeven juist alles over het bereiken van het doel en is er

dus sprake van een goede indicator van het effect.

In de derde plaats is van belang om vast te stellen of de prestatie-

indicatoren meettechnisch goed zijn. Het gaat daarbij onder meer om

validiteit en betrouwbaarheid.

Ten aanzien van meetsystemen op het gebied van doelrealisatie,

doeltreffendheid of doelmatigheid hanteert de Algemene Rekenkamer de

volgende normen:

• het meetsysteem bevat informatie over middelen, activiteiten,

prestaties en effecten;

• de informatie uit het meetsysteem voldoet aan de eerder in deze

paragraaf genoemde productcriteria;

• de informatie in het meetsysteem maakt een extern oordeel over

doeltreffendheid en/of doelmatigheid mogelijk;

• de indicatoren zijn verbonden met specifieke strategische of

operationele doelstellingen van het beleid of de organisatie;

Handleiding DDO

67• de indicatoren bevorderen niet het kortetermijndenken ten koste van

de lange termijn;

• de baten van de gegevensverzameling staan in redelijke verhouding

tot de kosten daarvan;

• de informatie uit het meetsysteem is nuttig bij de besluitvorming van

het management;

• de informatie uit het meetsysteem wordt gebruikt in bijvoorbeeld het

begrotingsproces, periodieke beslissingen of evaluatieonderzoeken;

• vroegere informatie wordt steeds bewaard, zodat het mogelijk is

ontwikkelingen in de tijd te analyseren.

Britse criteria voor meetsystemen

In een handleiding van onder meer het Britse ministerie van Financiën en de Britse

rekenkamer (HM Treasury, 2001) getiteld Choosing the right FABRIC. A framework for

performance information, is een hoofdstuk opgenomen met criteria die aangeven wanneer

een meetsysteem goed is. Het gaat om de volgende criteria:

• Focused on the organisation’s aim and objectives;

• Appropriate to, and useful for, the stakeholders who are likely to use it;

• Balanced, giving a picture of what the organisation is doing, covering all significant

areas of work;

• Robust in order to withstand organisational changes or individuals leaving;

• Integrated into the organisation, being part of the business planning and management

process, and;

• Cost Effective, balancing the benefits of the information against the costs.

De handleiding is in bezit van de bibliotheek van de Algemene Rekenkamer.

5.3.6 Gebruik van beleidsinformatie

Een logisch vervolg op onderzoek naar de kwaliteit (bruikbaarheid) van

beleidsinformatie is het onderzoek naar de vraag in hoeverre er ook

daadwerkelijk gebruik van wordt gemaakt voor de ontwikkeling en (bij)-

sturing van beleid. Met name in onderzoek naar de onderbouwing van

beleid (ex-ante-evaluatieonderzoek zoals Beleidsinformatie Betuweroute)

is onderzoek naar het gebruik van informatie onmisbaar.

Ook wanneer in een bepaald onderzoek het accent niet ligt op de

onderbouwing, dient afgewogen te worden in hoeverre dit aspect

meegenomen moet worden. Er moet voor gewaakt worden dat ministeries

alleen maar informatie verzamelen en te weinig in de gaten houden of

deze ook gebruikt wordt. Bovendien kan het niet-gebruik van

Handleiding DDO

68beleidsinformatie (of het gebruik van kwalitatief slechte informatie) een

verklaring bieden voor het niet realiseren van prestaties en/of effecten.

Enkele aspecten die worden vermeld in de RPE (bepaling 6.1) zijn van

belang voor de beoordeling van het gebruik van beleidsinformatie /

prestatiegegevens:

• De ambtelijke en politieke top moeten volgens een door

departementen zelf te bepalen standaardprocedure op de hoogte

gebracht worden van de uitkomsten van periodiek

evaluatieonderzoek;

• Prestatiegegevens moeten worden benut in: (a) de rijksbegroting, (b)

de departementale begrotingscyclus, (c) de departementale

beleidsprocessen en (d) de bedrijfsvoering.

Daarnaast zijn de volgende normen van belang (zie ook Algemene

Rekenkamer, 1991c):

• De juiste personen (denk aan: parlement, minister, ambtenaren)

moeten tijdig de uitkomsten van het onderzoek ontvangen;

• Het bevoegd gezag dient (tijdig) een besluit te nemen over de vraag

of men al dan niet iets gaat doen met de uitkomsten van het

onderzoek (denk aan: wijziging of ondersteuning van het beleid of

van de organisatiestructuur waarbinnen het beleid tot stand komt);

• De veranderingen (in doelen, organisatie of instrumenten) moeten

worden gecommuniceerd aan de betrokkenen.

Om redenen van controleerbaarheid is het van belang dat het gebruik van

beleidsinformatie aanwijsbaar, dus schriftelijk moet zijn vastgelegd.

5.3.7 Checklists voor de beoordeling van doelformulering en

beleidsinformatie

Om de beoordeling van doelformulering en/of beleidsinformatie (over

onder meer prestaties en effecten) handen en voeten te geven, kan

gebruikgemaakt worden van checklists. Checklists kunnen worden

gebruikt om, bijvoorbeeld per te beoordelen onderzoeksrapport,

systematisch de te onderzoeken normen langs te lopen. Het hoeft hierbij

niet altijd alleen te gaan om de beoordeling van normen voor

doelformulering of beleidsinformatie, maar het kan ook gaan om een

inventarisatie van algemene en/of methodisch-technische aspecten van

het te beoordelen rapport.

Handleiding DDO

69Voorbeelden van in het Rekenkameronderzoek gehanteerde checklists

kunnen worden gevonden op intranet onder

‘kennisdomein’/’kennisdomein Prestaties en effecten - DDO’.

5.3.8 Informatievoorziening aan Tweede Kamer

Voor onderzoek naar de informatieplicht van ministers jegens de Staten-

Generaal heeft de Algemene Rekenkamer een Handreiking

informatieplicht ministers vastgesteld die toegepast dient te worden (te

vinden in Handar, map primaire processen \ onderzoeksproces). Deze

handreiking gaat niet alleen in op de normen die gelden voor de

informatievoorziening, maar ook op de terminologie die de Algemene

Rekenkamer op dit precaire terrein in haar rapporten hanteert. De

handreiking bevat tevens een checklist.

Let erop dat voor projecten die vallen onder de Procedureregeling Grote

Projecten aanvullende informatie-eisen gelden.

5.3.9 Nadere aandachtspunten

Bij de beoordeling van beleidsinformatie vragen de volgende punten om

nadere aandacht.

In de eerste plaats is de vraag aan de orde op welk niveau welke

informatie aanwezig moet zijn. Hiervoor hebben we gesteld dat dit soort

beleidsinformatie in principe bij de minister aanwezig moet zijn. Feitelijk

richtinggevend hiervoor is echter de verantwoordelijkheid van de minister

voor het betreffende beleidsterrein (zie ook hoofdstuk 3).

Wanneer er bijvoorbeeld een toezichthouder in het spel is, kan de

informatie die de minister heeft van een andere aard zijn dan wanneer de

minister volledige verantwoordelijkheid draagt voor het beleid. Per

beleidsterrein zal dit bepaald moeten worden.

Beoordeling beleidsinformatie op decentraal niveau

Wanneer de Algemene Rekenkamer de kwaliteitsborging van de informatievoorziening wil

beoordelen op decentraal niveau, begeeft zij zich op een terrein waar haar mandaat geen

betekenis heeft. Zij is dan dus aangewezen op vrijwillige medewerking. In het onderzoek

Begeleiding en herplaatsing voortijdige schoolverlaters was dit aan de orde. De Algemene

Rekenkamer heeft hier een toets op de kwaliteit van de beleidsinformatie op decentraal niveau

verricht. Ook in het onderzoek Grotestedenbeleid heeft zij gekeken naar de kwaliteit van

instrumenten van monitoring en auditing van het grotestedenbeleid. In beide onderzoeken heeft

de Algemene Rekenkamer echter expliciet de keuze gemaakt haar pijlen te richten op de minister.

Deze moest zorgdragen voor een goede informatievoorziening, als onderdeel van zijn/haar

systeemverantwoordelijkheid voor het beleid.

In de onderzoeken Preventie en bestrijding jeugdcriminaliteit en Voorbereiding rampenbestrijding

Handleiding DDO

70heeft de Algemene Rekenkamer ook de mate van geïnformeerdheid van sommige decentrale

actoren beoordeeld. Hiermee wilde zij respectievelijk de coördinerende rol van gemeenten en

toezichthoudende rol van provincies aan een toets onderwerpen. De minister is niet direct

aanspreekbaar op de invulling van die rol door decentrale actoren, maar kan deze actoren wél

aanspreken op tekortkomingen.

Ten tweede speelt de vraag, hoe de Algemene Rekenkamer zou moeten

omgaan met de beoordeling van beleidsinformatie die geproduceerd

wordt door informatie-instituten als het Rijksinstituut voor

Volksgezondheid en Milieu (RIVM), het Centraal Bureau voor de Statistiek

(CBS), het Centraal Planbureau (CPB) of het Sociaal en Cultureel

Planbureau (SCP).38 In principe zullen deze instituten op dezelfde wijze

moeten worden behandeld als andere informatieleveranciers en zal ons

onderzoek niet mogen stoppen bij hun voordeur. In de praktijk zal blijken

hoe ver we met de beoordeling van deze informatie kunnen en willen

gaan en hoe gedetailleerd we daarbij willen zijn. Hetzelfde geldt voor

instanties als toezichthouders, inspecties en overige controleurs.

5.3.10 Aanbevelingen

Het is van belang om bij de aanbevelingen die we formuleren concrete

manieren aan te geven waarop de beleidsinformatie structureel zou

kunnen worden verbeterd.

In het onderzoek Preventie en bestrijding jeugdcriminaliteit39 gaat de

Algemene Rekenkamer bijvoorbeeld gedetailleerd in op allerlei

inhoudelijke punten die in de informatiestromen opgenomen moeten

worden (zoals: een voorziening waarmee duidelijk wordt of jongeren

daadwerkelijk hulp hebben gekregen en met welk resultaat; duidelijkheid

over doorlooptijden).

Behalve de inhoud is ook de opbouw van de informatiemeetsystemen

vaak van belang. Zo wordt in het onderzoek Begeleiding en herplaatsing

van voortijdige schoolverlaters40 veel aandacht besteed aan de noodzaak

van koppelingen tussen schooladministraties, administraties van

begeleidende en controlerende instellingen zoals de jeugdzorg en leer-

38 Zie voor de voors en tegens van een dergelijk onderzoek de notitie van Ed Broeze aan het DSO,

d.d. 12 februari 1999. Vragen zijn bijvoorbeeld: Kunnen we de informatie (met name de

modelberekeningen) van deze specialistische instituten op hun waarde schatten? Hebben we

voldoende inzicht in de veldprocessen die deze modellen weergeven? Hebben we voldoende

expertise om de methodisch-technische kant ervan te beoordelen? Hebben we daarbij externe

expertise nodig? Zo ja, zouden er onafhankelijke experts beschikbaar zijn wanneer de kennis

geconcentreerd is in monopolieachtige instituten? 39 Algemene Rekenkamer (2002e). 40 Algemene Rekenkamer (2001b).

Handleiding DDO

71plichtambtenaren en de informatie die naar het ministerie van OCenW

gaat in het kader van het beleid voor voortijdige schoolverlaters. Het is

immers veel efficiënter voor alle partijen om de data ter verantwoording

van het nationale beleid geautomatiseerd op te bouwen uit gegevens die

diverse partijen voor hun uitvoerende werk zelf nodig hebben, dan om ze

elke keer afzonderlijk te moeten samenstellen. Wel moet dan de kwaliteit

van de gegevens op de ‘lagere’ niveaus gewaarborgd zijn en dat heeft

grenzen. Uiteraard dient ook de privacywetgeving nauwlettend

gerespecteerd te worden.

Aanbevelingen van het type ‘verbeter de kwaliteit van de

beleidsinformatie’ zijn te vaag. De volgende aanbevelingen zijn wél

concreet:

• Laat onderzoek doen naar de oorzaken van het feit dat voor 44% van

de jongeren die als verdachte in het Cliëntvolgsysteem

Jeugdcriminaliteit (CVS-JC) geregistreerd staan, niet kan worden

vastgesteld dat zij vervolgd zijn;

• Blik systematischer terug op het grotestedenbeleid, zodat inzicht kan

worden verkregen in de mate waarin de doelstellingen worden bereikt

en de mate waarin het beleid effectief is en wat mogelijke

verklaringen daarvoor zijn;

• Ontwerp een informatiesysteem waarin relevante informatie is

opgenomen over middelen, activiteiten, prestaties en effecten. Het

informatiemeetsysteem moet aansluiten op de planning- en

controlcyclus en de beleidscyclus.

Handleiding DDO

726 Onderzoek naar doelrealisatie (en doelgroepbereik)

6.1 Inleiding

In hoofdstuk 3 hebben we laten zien dat er globaal drie varianten zijn van

onderzoek naar prestaties en effecten: onderzoek naar doelrealisatie /

doelgroepbereik, naar doeltreffendheid en naar doelmatigheid. De drie

varianten onderscheiden zich doordat ze elk verschillende

probleemstellingen, onderzoeksontwerpen en onderzoeksmethoden

kennen. Dit hoofdstuk behandelt de eerste variant: het onderzoek naar

doelrealisatie en doelgroepbereik.

6.2 Onderzoek naar doelrealisatie

6.2.1 Probleemstelling en onderzoeksvragen

Onderzoek naar doelrealisatie is gericht op het bepalen van de mate

waarin een algemene en/of nadere geoperationaliseerde

beleidsdoelstelling wordt gehaald. Hierbij kan – conform VBTB – worden

gekeken naar doelgroepen (zie daarvoor § 6.3), streefwaarden en

eindtermijnen. Een typische probleemstelling in onderzoek naar

doelrealisatie is vrij eenvoudig en luidt:

• (in hoeverre) Worden de doelen van het beleid behaald?

De vraag naar wat de doelen van het beleid zijn, moet hiervoor al

beantwoord zijn (zie hoofdstuk 5). Bij de beleidsdoelen kan het zowel

gaan om prestaties als om effecten (veranderingen in de maatschappij).

De probleemstelling kan vervolgens verder worden uitgewerkt in

onderliggende onderzoeksvragen, bijvoorbeeld verbijzonderde vragen per

beleidsterrein, ministerie / RWT, bestuurslaag, beleidsinstrument en/of

tijdvak. Daarbij kun je ook kijken naar de rol van de minister bij het

realiseren van de doelen. Voorbeelden van dergelijke vragen zijn:

• Hoeveel subsidiebeschikkingen zijn het afgelopen jaar afgegeven en

komt dit overeen met de op dit punt geformuleerde doelen? (fictief

voorbeeld)

Handleiding DDO

73• Welke prestaties heeft het College Toelating Bestrijdingsmiddelen in

de praktijk geleverd?41

• Hoe is de kwaliteit van de registratie en conservering van de museale

collecties van het Rijk?42

6.2.2 Normen

Er zijn geen standaardnormen voor het behalen van prestaties en

effecten, zoals we die kennen voor doelformulering en beleidsinformatie

(zie hoofdstuk 5). Bij het onderzoek naar prestaties gaat het veeleer om

de beoogde prestaties en effecten, die kunnen worden afgezet tegen de

gerealiseerde prestaties en effecten.

De beoogde prestaties en effecten (‘normen’) kunnen op verschillende

plaatsen gevonden worden. Ze kunnen bijvoorbeeld worden ontleend aan

gemaakte afspraken omtrent de omvang van de prestaties en effecten,

zoals in het geval van afspraken tussen de rijksoverheid enerzijds en

agentschappen en/of zelfstandige bestuursorganen anderzijds (zie ook

hoofdstuk 5 over doelformulering).

6.2.3 Onderzoeksontwerp

Het onderzoeksontwerp bij doelrealisatie is niet gericht op de vraag of het

eventueel halen van de beleidsdoelstelling is toe te schrijven aan de inzet

van beleidsinstrumenten. Een ingewikkeld onderzoeksontwerp is dus niet

nodig.

We kunnen volstaan met een nameting van de verschillende prestaties

en/of effecten, dan wel met een combinatie van een voor- en nameting.

Het eerste (alleen nameting) is van toepassing als het beleidsdoel in

formele termen luidt: het bereiken van een bepaalde waarde op een

bepaalde grootheid (bijvoorbeeld: een geluidshinder van maximaal X

decibel). Voor- én nameting zijn nodig als het beleidsdoel in formele

termen luidt: het bereiken van een toe- dan wel afname van de waarde

van een bepaalde grootheid (bijvoorbeeld: reductie van geluid met X

decibel).

Als er geen afspraken zijn gemaakt, kunnen uitspraken worden gedaan

over prestaties en/of effecten aan de hand van vergelijkingen.

• Gelijktijdige vergelijking: deze manier van vergelijken is vooral

geschikt wanneer er sprake is van meer uitvoeringsorganisaties met

dezelfde dan wel vergelijkbare productieprocessen en producten

41 Algemene Rekenkamer 2002f, p.29. 42 Algemene Rekenkamer 2000b, p.8-9.

Handleiding DDO

74(bijvoorbeeld één type inspectie in diverse regio’s); het vergelijken

van gegevens van de eigen organisatie met die van andere wordt ook

wel aangeduid als ‘benchmarking’. De ‘best practice’ of de

‘gemiddelde praktijk’ fungeert hierbij als norm.

• Volgtijdelijke vergelijking: de prestaties van het heden van de

organisatie worden vergeleken met die uit het verleden. Norm is

veelal dat het in het heden ‘beter moet’ dan in het verleden. Bij de

vergelijking in de tijd moet wel bedacht worden, dat ontwikkelingen

in de prestaties niet alleen toe te schrijven zijn aan het functioneren

van de organisatie zelf, maar ook aan andere ontwikkelingen

(bijvoorbeeld toe- of afname van het ‘werkaanbod’, zoals aantal

aangevraagde vergunningen).

De relevante methoden en technieken zijn uitgewerkt in hoofdstuk 4.

6.2.4 Indicatoren prestaties

Verschillende productindicatoren of kengetallen kunnen worden gebruikt

om uitspraken te doen over de door een ministerie, RWT of lagere

overheid gerealiseerde prestaties. Het Sociaal en Cultureel Planbureau

(2001, p. 10) onderscheidt hiertoe onder meer de volgende product-

indicatoren:

• prestatie-indicatoren: deze hebben te maken met de geleverde

eindproducten (bijvoorbeeld het afgegeven van vergunningen,

afgesloten convenanten);

• procesindicatoren: deze hebben te maken met de verrichte

werkzaamheden of met tussenproducten.

Bij de interpretatie van de productindicatoren of kengetallen moet de

onderzoeker wel kritisch kijken naar de kwaliteit van deze indicatoren en

de wijze waarop deze tot stand zijn gekomen. In ieder geval kan worden

geëist dat ze voldoen aan drie voorwaarden:43

• ze moeten in kwantificeerbare grootheden zijn geformuleerd;

• ze moeten reproduceerbaar zijn;

• ze moeten voor een langere periode leverbaar zijn en dus in de tijd

vergelijkbaar zijn.

Overigens kan het bij de prestatie-indicatoren van belang zijn om de

prestaties te onderscheiden in extern merkbare prestaties en faciliterende

prestaties (zie ook hoofdstuk 3).

43 Algemene Rekenkamer (2002c).

Handleiding DDO

756.2.5 Indicatoren effecten44

De prestaties van bedrijven, burgers en instellingen kunnen een indicatie

geven van het effect in de samenleving (bijvoorbeeld het aantal

‘technostarters’45 als indicator voor innovatief ondernemerschap).

Daarnaast kunnen ook directe effectindicatoren46 voor het finale effect in

de samenleving worden onderscheiden (bijvoorbeeld het aantal verkeers-

doden als indicator voor verkeersveiligheid). Deze indicatoren beogen de

uiteindelijke effecten te meten op de burgers waarvoor het product

bedoeld is of op de samenleving als geheel. Eventueel kunnen

gebruiksindicatoren (mate van bereiken van de doelgroep) dienen als

proxy (indirecte indicator) voor de meting van effecten (zie de volgende

paragraaf).47 Bijvoorbeeld het aantal tuinders dat gebruikmaakt van

energiebesparende maatregelen.

Dit neemt niet weg dat ook gegevens over activiteiten en prestaties van

de rijksoverheid kunnen dienen als effectindicator, namelijk in gevallen

waarbij deze activiteiten of prestaties direct bijdragen aan het realiseren

van het beoogde effect (bijvoorbeeld het aantal gesaneerde

Defensieterreinen als indicator voor bodemsanering van

Defensieterreinen). Lang niet alle activiteiten en prestaties van de

rijksoverheid zeggen echter direct iets over het beoogde finale effect.

De vraag of prestatiegegevens iets over het finale effect zeggen, hangt

overigens samen met de formulering van het doel. Als bij het eerdere

voorbeeld van het afvalbeleid de doelstelling is: ‘het voorkómen van het

ontstaan van afval’, dan zegt het prestatiegegeven ‘afname hoeveelheid

afval’ nog weinig over het voorkómen van afval, dus is het geen goede

indicator van het effect. Als de doelstelling luidt: ‘het verminderen van de

hoeveelheid afval’, dan zegt dit prestatiegegeven juist alles over het

bereiken van het doel en is dus sprake van een goede indicator van het

effect.

6.2.6 Aanbevelingen

Mogelijke aanbevelingen zijn:

• Stel de beleidsinstrumenten bij, teneinde de beleidsdoelen in het

vervolg wél te bereiken;

44 Voor onderzoek naar intermediaire effecten (prestaties van gemeenten) kan goed gebruik

worden gemaakt van Maten voor gemeenten (SCP, 2000). 45 ‘Technostarters’ zijn aspirant-ondernemers die een technische innovatie op de markt willen

brengen. 46 De Groot & Goudriaan (1991). 47 Hierbij moet dan wel worden uitgegaan van een voldoende aanbod. Zo niet, dan wordt iets

anders gemeten dan het gebruik-zoals-bedoeld. Het is dan meer gebruik-zoals-bepaald.

Handleiding DDO

76• Stel de tijdsperiode bij waarin de beleidsdoelen gerealiseerd moeten

zijn;

• Stel de beleidsdoelen zelf bij. Dit laatste is een zinvolle aanbeveling

wanneer bijvoorbeeld blijkt dat de beleidsdoelen onrealistisch hoog

zijn gesteld. Handhaving van deze beleidsdoelen is dan niet zinnig.

Ook kan het zo zijn dat de beleidsdoelen technisch wel realiseerbaar

zijn, maar tegen zeer hoge kosten. Ook dan is het handhaven van de

oorspronkelijke beleidsdoelen niet zinnig en zou beter gemikt kunnen

worden op het bereiken van minder ambitieuze doelen tegen

aanvaardbare kosten.

Aanbevelingen kunnen ook betrekking hebben op het wegnemen van de

oorzaken van het niet bereiken van de beleidsdoelen (zie § 3.3 voor

verschillende oorzaken).

6.3 Onderzoek naar doelgroepbereik

6.3.1 Probleemstelling

In het onderzoek naar het bereiken van de doelgroep kunnen twee

varianten worden onderscheiden: onderzoek naar doelgroepbereik (in

enge zin) en doorwerkingsonderzoek.48

In het eerste geval gaat het om de vraag, of en hoe de uiteindelijke

doelgroepen van het beleid (burgers, instellingen, bedrijven) worden

bereikt. Daarnaast kan dezelfde vraag gesteld worden voor

beleidsuitvoerders anders dan het Rijk (zoals provincies, gemeenten,

RWT’s / ZBO’s): zij vormen belangrijke tussenschakels in de beleidskolom

/ het beleidsnetwerk tussen enerzijds het Rijk en anderzijds de uiteinde-

lijke doelgroep.

De karakteristieke probleemstelling bij onderzoek naar het bereiken van

de doelgroep is:

• Is de doelgroep van het beleid in de voorgenomen periode in de

beoogde vorm en mate bereikt?

De karakteristieke probleemstelling luidt in het doorwerkingsonderzoek:

48 Dit begrip wordt onder andere door de Rijksplanologische Dienst gehanteerd in Evaluatie van

indicatieve plannen; Handleiding en begrippen, januari 1990. Hierin wordt gesteld (op p. 10): “Om

te kunnen spreken van doorwerking van een perspectief in de besluit- of planvorming van

nageschakelde beleidsmakers moet aan een aantal minimumeisen zijn voldaan. De beleidsmaker

dient kennis te hebben van de inhoud van het perspectief, het perspectief in overweging te hebben

genomen en er mee in te stemmen. Als aan deze voorwaarden is voldaan, heeft het perspectief

doorgewerkt.”

Handleiding DDO

77• In hoeverre werken de doelen van het Rijk door bij de actoren in de

beleidskolom / het beleidsnetwerk?

6.3.2 Onderzoeksvragen

Bereiken doelgroep

De probleemstelling bij onderzoek naar het bereiken van de doelgroep is

in de volgende vier onderzoeksvragen uiteen te leggen:

1. Hoe is de doelgroep gedefinieerd?

2. Is de juiste doelgroep gekozen?

3. Welke vorm en mate van bereik wordt beoogd?

4. Is de doelgroep daadwerkelijk in die vorm en mate bereikt?

Ad 1. Hoewel elk beleidsdoel door toedoen van mensen gerealiseerd moet

worden, is de doelgroep van beleid lang niet altijd in termen van

individuele mensen geformuleerd. Beleid richt zich vaak op organisaties:

bedrijven dienen maatregelen te treffen om minder energie te gebruiken,

instellingen moeten zich inspannen om ziekteverzuim terug te dringen,

sportverenigingen moeten jongeren proberen te interesseren. De eerste

onderzoeksvraag gaat dan ook in op de kwestie, hoe de doelgroep van

het beleid is gedefinieerd.

Ad 2. Bij de vraag of de juiste doelgroep gekozen is, dient het begrip

‘juist’ niet zozeer in politieke termen opgevat te worden, maar in termen

van beleidsonderbouwing. Zo zou je bij een regeling die bedoeld is voor

de minima kunnen nagaan of de afbakening van de doelgroepen in de

regeling daarmee in overeenstemming is.

Ad 3. Voordat je de vraag naar het feitelijk bereik kunt beantwoorden,

moet ook duidelijk zijn welke vorm van bereik wordt beoogd. Er zijn vele

varianten denkbaar: ‘in contact komen met’, ‘kennis nemen van’,

‘begrijpen’, ‘accepteren’,49 ‘deelnemen aan’, enzovoort. Voor de mate van

bereik geldt meestal dat een bepaald percentage van de doelgroep op een

vastgelegd moment bereikt dient te zijn.

Ad 4. Pas nu ben je toe aan het beantwoorden van de hamvraag over het

daadwerkelijk bereik. Er kunnen hier twee typen onderzoeksvragen aan

bod komen.

Het eerste type heeft betrekking op de stand van zaken op een bepaald

moment. Kenmerkende onderzoeksvragen van dit type luiden

bijvoorbeeld als volgt:

49 Zie Algemene Rekenkamer (1991b).

Handleiding DDO

78• hoeveel procent van de mensen is op de hoogte van het bestaan van

individuele huursubsidie?

• hoeveel procent van de mensen weet op welke manier en waar

individuele huursubsidie aangevraagd kan worden?

• hoeveel procent van de mensen die recht hebben op individuele

huursubsidie, zijn zich bewust van dat recht?

• welk percentage van de mensen die daarop recht hebben, vraagt

huursubsidie aan?

Het tweede type vragen heeft betrekking op veranderingen in het bereik

van de doelgroep nadat een specifieke prestatie is geleverd. In de meeste

gevallen gaat het dan om de inzet van voorlichtingsmateriaal waarmee

men probeert mensen te informeren over hun mogelijkheden (‘Het kan

zijn dat ook u recht op huursubsidie hebt’) of over wenselijk geacht

gedrag (‘Een goed milieu begint bij jezelf’).50 Onderzoek naar het bereik

van de doelgroep is in zulke gevallen onderzoek naar de verandering in

het bereik van de doelgroep nadat het voorlichtingsmateriaal is ingezet.

Concrete onderzoeksvragen luiden dan bijvoorbeeld:

• Is het percentage kinderen tussen nul en vier jaar dat regelmatig een

consultatiebureau bezoekt, toegenomen na de daarop gerichte

voorlichtingscampagne?

• Hoeveel boeren hebben subsidie aangevraagd voor braakliggende

grond sinds de bekendmaking van de wijziging in de

subsidievoorwaarden?

Doorwerking

De probleemstelling bij onderzoek naar de doorwerking van beleid kan

uiteengelegd worden in de volgende onderzoeksvragen:51

• Welke actoren zijn – naast het Rijk – betrokken bij beleid X, ofwel:

hoe ziet de beleidskolom/het beleidsnetwerk er bij beleid X uit?

• Welke bijdrage verwacht het Rijk van de betrokken actoren aan beleid

X?

• Zijn de betrokken actoren bekend met de doelen van het Rijk rond

beleid X?

• Hebben de betrokken actoren deze doelen in overweging genomen?

50 N.B.: in het algemeen kunnen de volgende vier vragen worden onderscheiden bij onderzoek naar

het effect van voorlichting: wat is het bereik (bekendheid), welke verandering in kennis is

opgetreden, welke verandering in houding is opgetreden en welke verandering in gedrag is

opgetreden. 51 Gelijksoortige onderzoeksvragen zijn gehanteerd in het voorbeeldonderzoek naar afvalpreventie

(Algemene Rekenkamer, 1997). Het begrip doorwerking heeft in dat onderzoek overigens een

ruimere strekking dan hierboven geschetst : het heeft daar niet alleen betrekking op

beleidsuitvoerders , maar ook op de uiteindelijke doelgroepen van het beleid. Zo is onder andere

gekeken naar de doorwerking van het beleid bij bedrijven door bedrijfsmilieuplannen te

bestuderen.

Handleiding DDO

79• Stemmen de betrokken actoren in met deze doelen, oftewel: is er

sprake van vergelijkbare probleemdefinities, visies, waarden en

oplossingsrichtingen?

• Worden de doelen van het Rijk rond beleid X ook door de betrokken

actoren nageleefd, oftewel: is hun feitelijk gedrag in

overeenstemming met deze doelen?

6.3.3 Normen

Om een oordeel te kunnen uitspreken over de mate waarin de doelgroep

of intermediairs zijn bereikt of over de verandering in bereik die is

opgetreden, is het nodig te beschikken over gespecificeerde normen over:

1. de gewenste omvang van (verandering in) het bereik van

het beleid;

2. de gewenste vorm van het bereik van het beleid;

3. het gewenst tijdstip waarop het bovenstaande

gerealiseerd moet zijn.

Ad 1. In de eerste plaats dient dus in termen van een concreet streefgetal

(bijvoorbeeld een percentage of een absolute aantal van de doelgroep of

van intermediairs) of in termen van een wenselijk geachte richting (meer,

beter) aangegeven te zijn naar welk bereik wordt gestreefd of naar welke

verandering daarin. Daarbij is niet alleen de specificatie van de

hoeveelheid van belang, maar ook de precieze afbakening van de doel-

groep of intermediairs. Zo maakt het nogal wat uit of je je op alle

inwoners van Nederland richt of uitsluitend op de leeftijdscategorie tussen

18 en 24 jaar.

Ad 2. Verder moet vanzelfsprekend zijn vastgelegd welke vorm van bereik

wordt beoogd. In de meeste gevallen zal de beoogde vorm van bereik

overigens in termen van kennis en bekendheid zijn beschreven.

Ad 3. Ten slotte moet duidelijk zijn op welk tijdstip de doelgroep of

intermediairs bereikt dienen te zijn. Ook kan een reeks tijdstippen zijn

aangegeven waarmee duidelijk gemaakt wordt hoe het bereik dient te zijn

op tussentijds gelegen tijdstippen. Wanneer je op de aangegeven

momenten meet of het beoogde bereik is gerealiseerd, voorkom je het

verwijt dat je te vroeg bent komen meten.

In principe moet specifiek voor het onderzochte beleid duidelijk zijn welke

doelgroep in welke vorm en mate en op welk tijdstip bereikt moet zijn. In

sommige gevallen echter kan een oordeel worden gebaseerd op

algemenere normen. Dat geldt bijvoorbeeld voor voorlichtingscampagnes:

Handleiding DDO

80de Rijksvoorlichtingsdienst heeft in algemene zin uitgesproken dat het als

positief wordt beschouwd wanneer het bereik van de relevante doelgroep

door een televisiespot 80% bedraagt.52

6.3.4 Onderzoeksontwerpen

Als het beoogde bereik en/of de beoogde doorwerking is geformuleerd in

termen van een criterium (bijvoorbeeld 80% of x personen) dat op een

bepaald tijdstip moet zijn gehaald, kan volstaan worden met een

eenmalige meting. Gaat het om het vaststellen van een verandering, dan

zul je over een voormeting en een nameting moeten beschikken.

6.3.5 Indicatoren doelgroep

Als indicator voor het bereiken van de doelgroep kan een

gebruiksindicator worden gebruikt: deze zegt iets over de afnemers van

de diensten53 en de mate waarin deze worden gebruikt.

6.3.6 Aanbevelingen

Wanneer het bereik niet voldoet aan het geformuleerde criterium, zal de

karakteristieke aanbeveling luiden dat men moet streven naar een beter

bereik. Die aanbeveling kan in concrete gevallen verschillende vormen

aannemen:

• In zijn meest eenvoudige vorm is de aanbeveling gericht op de

ingezette instrumenten, en luidt dan bijvoorbeeld dat men andere

media of intermediairs moet gebruiken om de doelgroep op de hoogte

te brengen (tenminste als het onderzoek daar aanwijzingen voor

biedt).

• Daarnaast kan de aanbeveling op zijn plaats zijn om de uiteindelijke

doelgroep of intermediairs beter af te bakenen. Wellicht zijn er

aanwijzingen dat deze beperkter of juist ruimer opgevat moeten

worden.

• De aanbeveling kan zich ook richten op de omvang en/of de vorm van

bereik. Bij tekortschietend bereik verdient het soms aanbeveling een

geringer bereik dan wel een minder vergaande vorm van bereik na te

streven; dit geldt eens te meer indien dit geringere bereik tegen

aanzienlijk lagere kosten kan worden gerealiseerd.

52 Algemene Rekenkamer (1991). 53 SCP (2001, p.10).

Handleiding DDO

817 Onderzoek doeltreffendheid

7.1 Inleiding



doelgroepbereik, naar doeltreffendheid en naar doelmatigheid. Dit

hoofdstuk behandelt de tweede variant: het onderzoek naar de doeltref-

fendheid van beleid. Dit is een gecompliceerde onderzoeksvariant. Dat zit

hem in het feit dat er een relatie moet worden gelegd tussen de

beleidsprestaties van de minister en de gerealiseerde effecten in de

samenleving. Doordat er sprake kan zijn van een lange beleidsketen en er

externe factoren kunnen zijn die ook van invloed kunnen zijn op de te

bereiken einddoelen, is het vaak moeilijk om het causale verband tussen

prestaties en effecten aan te tonen.

7.2 Probleemstelling en onderzoeksvragen

Bij onderzoek naar de doeltreffendheid van beleid gaat het om twee –

met elkaar verbonden – vragen (zie figuur 7.1):

1. In hoeverre is de doelrealisatie op het conto te schrijven van de inge-

zette instrumenten en middelen?

2. Welke verklaringen zijn te geven voor de geconstateerde

(in)effectiviteit?

Figuur 7.1 Analysemodel doeltreffendheid.

De eerste vraag is van belang om te onderzoeken of het inderdaad het

beleid van de minister / RWT is geweest dat ertoe heeft geleid dat de

externe factoren tussendoelen neveneffecten

einddoel

ingezette beleidsinstrumenten

Handleiding DDO

82effecten zijn behaald of dat er externe factoren zijn die dit (mede)

kunnen verklaren. Als uitsluitend externe factoren de effecten kunnen

verklaren, is de minister uitgegaan van een onjuiste beleidstheorie:

de ingezette instrumenten zijn niet de juiste of niet nodig geweest om de

gestelde doelen te kunnen bereiken.

De tweede vraag – die in feite het complement is van de eerste vraag – is

van belang om in het onderzoek mee te om aanbevelingen te kunnen

doen: waaraan moet de minister aandacht besteden, wil hij/zij het beleid

effectiever maken?

In doeltreffendheidsonderzoek kan naar verschillende relaties worden

gekeken:

instrument a beleidsdoel x benadering 1

instrument a

instrument b beleidsdoel x benadering 2

instrument c

beleidsdoel x

instrument a beleidsdoel y benadering 3

neveneffect z

instrument a beleidsdoel x

instrument b beleidsdoel y benadering 4

instrument c neveneffect z

De eerste benadering is onder andere zinvol indien de overheid een

bepaald doel via één instrument (in plaats van een complex

instrumenten) wil realiseren en het risico van het optreden van negatieve

neveneffecten laag wordt ingeschat. Een voorbeeld zou kunnen zijn de

bevordering van de remigratie van allochtonen door middel van een

remigratieregeling. De eerste benadering is ook zinvol als je, hoewel er

een complex van instrumenten op een bepaald beleidsdoel is gericht, het

onderzoek vanwege effectiviteitrisico’s wilt focussen op één instrument uit

het complex. De andere instrumenten fungeren dan als context.

De tweede benadering kan opportuun zijn als het gaat om een complex

van beleidsinstrumenten in relatie tot een bepaald beleidsdoel. Soms zijn

de instrumenten zo sterk met elkaar verweven, dat het lastig is ze uiteen

te rafelen in hun gevolgen voor de mate van doelrealisatie. Je evalueert

dan in feite een mix van ingezette instrumenten.

Handleiding DDO

83Soms is het echter nog wél mogelijk om de effectiviteit van de diverse

onderdelen van het beleid uiteen te rafelen, zoals bij een

beleidsexperiment in het kader van energiebesparing het geval was.

Effectiviteit instrumenten energiebesparingsbeleid: een experiment

In een experiment van het energiebedrijf EDON in 1993 en 1994, dat B&A-groep in

opdracht van het ministerie van Economische Zaken begeleidde, werd de effectiviteit beoor-

deeld van twee instrumenten die bij het energiebesparingsbeleid zouden kunnen worden

ingezet: voorlichting versus een financiële prikkel (van f 150 respectievelijk f 75). De

effecten op energiebesparing konden tegen elkaar worden afgezet omdat men beschikte

over zes groepen: (1) alleen voorlichting (2) alleen f 150 (3) alleen f 75 (4) voorlichting + f

150 (5) voorlichting + f 75 (6) controlegroep (zie ook bijdrage van Hufen in de achtste

bundel Klankbordgroep, 1997).

Bij dit soort onderzoek stelt de onderzoeker de groepen bij voorkeur samen door loting

voorafgaand aan de inzet van beleidsinstrumenten, opdat ze op andere kenmerken (behalve

die van de beïnvloeding door beleidsinstrumenten) zo gelijk mogelijk zijn. Als dit niet

mogelijk is kun je ook, nadat de groepen zich al spontaan hebben gevormd, vergelijkingen

tussen de groepen trekken. Nadeel kan dan zijn dat ze op andere kenmerken ook niet gelijk

zijn, waardoor minder eenduidig verschillen tussen groepen aan het verschil in blootstelling

aan beleidsinstrumenten kan worden toegeschreven.

Uit het experiment bleek overigens dat de combinatie van hoge premie en voorlichting het

meeste effect sorteerde.

De derde benadering kun je kiezen als je van de inzet van een

beleidsinstrument verwacht dat deze diverse effectiviteitrisico’s met zich

meebrengt. Een voorbeeld vormt het Rekenkameronderzoek naar de

integratie van kruiswerk en gezinsverzorging.54 In dit onderzoek is

nagegaan wat de effecten van de integratie waren op het punt van (1)

minder overheadkosten en (2) inhoudelijke kwaliteit (wegwerken

wachtlijsten).

De vierde benadering is het meest omvattend en kan toegepast worden

bij verwevenheid van instrumenten en te verwachten effectiviteitrisico’s

op vele fronten. Een voorbeeld hiervan is te vinden in het

Rekenkameronderzoek Gesubsidieerde arbeid.55 In dit onderzoek zijn

diverse instrumenten ter bestrijding van werkloosheid afgezet tegen

diverse beleidsdoelen (zoals creatie van banen, uitstroom) en

neveneffecten (zoals verdringing).

54 Algemene Rekenkamer. Decemberverslag 1993. 55 Tweede Kamer, vergaderjaar 1996-1997, 25 070, nrs. 1-2.

Handleiding DDO

847.3 Normen

De hoofdnorm bij onderzoek naar effecten is uiteraard doeltreffendheid.

Daarvoor bestaat evenwel geen standaard, net zo min als voor

doelrealisatie. De norm dient voor ieder onderzoek gespecificeerd te

worden al naar gelang de doelen van het onderzochte beleid. Als

bijvoorbeeld de integratie van kruiswerk en gezinsverzorging een reductie

in de overheadkosten ten doel heeft, dan is de norm dat er als gevolg van

de ingezette integratie-instrumenten ook daadwerkelijk een reductie in de

overheadkosten optreedt (liefst nog met een gespecificeerd percentage).

Het ligt in de rede bij de bepaling van de mate van effectiviteit het

einddoel van het onderzochte beleid als uitgangspunt te nemen: om de

realisatie van dát doel gaat het tenslotte. Concentratie op einddoelen kan

ons echter voor een dilemma plaatsen. Immers, vaak geldt:

• Hoe hoger je komt in de doelboom, hoe abstracter/vager het doel is

geformuleerd, en hoe lastiger meetbaar de mate van doelrealisatie is;

• Hoe hoger je komt in de doelboom, hoe lastiger de causale toe-

rekeningsvraag is te beantwoorden, omdat aangenomen mag worden

dat met het ‘klimmen’ in de doelboom het aantal relevante storende

factoren toeneemt.

Deze barrières kunnen reden zijn de aandacht toch op tussendoelen

(prestaties van gemeenten / RWT’s en prestaties van bedrijven, burgers

en instellingen) te richten. Deze aanpak wint aan kracht als

redenerenderwijs plausibel gemaakt kan worden wat de relatie is tussen

eind- en tussendoel.

Als je in het onderzoek ook neveneffecten betrekt, zou naast effectiviteit

als norm kunnen gelden dat er geen sprake mag zijn van (substantiële)

negatieve neveneffecten.

Daarnaast kun je als norm hanteren dat de volgende inhoudelijke effecten

niet of in geringe mate zouden mogen voorkomen:

• Cadeaueffect: dit effect treedt onder andere op bij subsidies: men

had het door de subsidie gestimuleerde gedrag ook zonder of met

minder subsidie tentoongespreid. Dit bleek bijvoorbeeld het geval te

zijn bij de eenmalige premiëring van koopwoningen;56

• Verdringingseffect: dit is een effect dat vaak optreedt bij instru-

menten op het gebied van de arbeidsvoorziening: sommigen komen

56 Voorbeeld ontleend aan Kraan-Jetten (1991). In feite kun je bij dit effect stellen dat er wel

sprake is van doelrealisatie, maar niet van effectiviteit. Tegelijkertijd kun je dit zien als een

voorbeeld van onderzoek naar de doelmatigheid van het beleid: had het effect niet met minder

geld tot stand kunnen komen?

Handleiding DDO

85weliswaar beter aan het werk, maar dit gaat ten koste van andere

werknemers/werkzoekenden;57

• ‘Benefit-snatching’: dit is het verschijnsel dat aanbieders van een te

subsidiëren product (of anderen in de productkolom) meegenieten

van het geboden subsidievoordeel door de prijs te verhogen. Zo is bij

de vervanging van PCB’s een verviervoudiging geconstateerd van de

prijzen voor PCB-afvalverwerking in de periode 1984-1986, waarvan

niet duidelijk is of die alleen aan kostenstijging van afvalverwijdering

is toe te schrijven.58

7.4 Onderzoeksontwerp

Om een uitspraak te kunnen doen over de mate waarin de realisatie van

een beleidsdoel te danken is aan het beleid, is een vergelijking nodig.

Deze bestaat idealiter uit een meting voor en na de invoering van het

beleid, en een meting bij een controlegroep die niet onderworpen is aan

het beleid.

In de praktijk blijkt een dergelijke vergelijking meestal moeilijk

uitvoerbaar, onder meer doordat vergelijkingsmateriaal vaak ontbreekt.

Onderzoeksontwerpen kunnen gerangschikt worden naar de mate waarin

zij voldoen aan de causaliteitsvoorwaarden uit § 4.2.5. In de literatuur

zijn deze onderzoeksontwerpen uitgebreid gedocumenteerd.59 Hier zij met

name benadrukt dat het treffen van vergelijkingen voor de bepaling /

benadering van effectiviteit essentieel is. Zo kun je vergelijkingen maken:

• in de tijd: hoe werd gescoord voor en na de inzet van het

instrument?;60

• tussen groepen: hoe scoorde de groep die wel aan het instrument

werd blootgesteld in vergelijking met de groep die er niet aan werd

blootgesteld?;61

57 Zie voor dit effect ook het Rekenkameronderzoek Gesubsidieerde arbeid (Algemene Rekenkamer,

1996a). Afhankelijk van het doel van het instrument (creatie werkgelegenheid in het algemeen

versus werkgelegenheidscreatie voor een specifieke doelgroep) kan dit als ineffectiviteit dan wel als

negatief neveneffect worden opgevat. 58 In feite dus op te vatten als een speciaal soort neveneffect. Voorbeeld ontleend aan Vermeulen

(1992). 59 Naast de literatuur die reeds vermeld is in de noten bij deze handleiding gaat het onder andere

om: P.H. Rossi en H.E. Freeman, Evaluation, a systematic approach, 1993; Th. D. Cook and D.T.

Campbell, Quasi- Experimentation, Design and Analysis Issues for Field Setting, 1979; Veldkamp

Marktonderzoek b.v., Naar een zilveren standaard; een aanzet tot richtlijnen voor effectonderzoek

naar campagnes van de Rijksoverheid, 1993. 60 In Heeft beleid effect, Afdeling Beleidsanalyse van het Ministerie van Financiën, 1999, aangeduid

als de voor-na benadering. 61 In Heeft beleid effect, Afdeling Beleidsanalyse van het Ministerie van Financiën, 1999, aangeduid

als de met-zonder benadering.

Handleiding DDO

86• tussen diverse (uitvoerings)varianten van het beleid: wat werkt in

welke omstandigheden? Om dit te kunnen traceren is een

nauwgezette beschrijving van de diverse (uitvoerings)varianten van

het beleid in samenhang met eventuele verschillen in context

waarbinnen het beleid wordt uitgevoerd, essentieel;62

• met een hypothetische situatie: wat zou de score geweest zijn zónder

het betreffende beleidsinstrument? Dit kun je bijvoorbeeld

onderzoeken door middel van de subjectieve beoordelingsmethode,

waarbij vragen gesteld worden als: ‘Als u deze subsidie niet had

gehad, was u dan ook tot het via de subsidie beoogde gedrag

gekomen?’. Deze methode is op zichzelf weinig geschikt omdat ze

ongeldige sociaalwenselijke antwoorden kan genereren, maar met

‘doorvragen’ en in combinatie met andere methoden kan ze toch een

indicatie van effectiviteit geven;63

• door middel van combinaties van bovenstaande mogelijkheden.

7.5 Onderzoeksmethoden

Evaluatieonderzoek ex post is de aangewezen methode om

te onderzoeken, of op zijn minst aannemelijk te maken, in welke mate de

inzet van de beleidsinstrumenten (bijvoorbeeld subsidies, convenanten,

vergunningen) heeft bijgedragen aan het al dan niet realiseren van de

beleidsdoelstelling(en).

Daarnaast kan het benoemen van plausibele storende factoren en het

nagaan of die in het concrete geval gespeeld hebben van belang zijn. Hoe

beter je in staat bent aan te geven dat dergelijke storende factoren geen

rol hebben gespeeld, hoe beter je de mate van effectiviteit van een

beleidsinstrument kunt aantonen.64 Dit is de essentie van de modus-

operandimethode (letterlijk: wijze van werking). Een uiteenzetting van de

methode staat beschreven in bijlage 6.

De vanuit methodisch-technisch standpunt meest gewenste ontwerpen

zijn in de praktijk vaak het lastigst te realiseren. Zo is een voormeting

vaak niet meer te realiseren omdat de evaluator (te) laat wordt

62 Zie hiervoor ook het artikel van R. Pawson and N. Tilley, Whither (European) Evaluation

Methodology, Knowledge and Policy, Fall 1995, vol. 8, no. 3, p.20-33. 63 Zie P. Swanborn, Evalueren onder de loep; op weg naar een standaardvoorziening voor evaluatie

in de Arbeidsvoorziening, O&A werkdocument 95-03, 1995, p.72. 64 Vergelijk hiervoor onder andere het voorbeeldonderzoek uit directie I naar de brandstofsanering

bij defensieterreinen. Aannemelijk is in dit geval, dat er geen andere actoren en factoren een rol

spelen bij de terugdringing van de verontreiniging behalve de saneringsacties van het Ministerie

van Defensie zelf. In dit geval is door een strategische keuze van het onderzoeksonderwerp dus

sprake van doelrealisatie=effectiviteit.

Handleiding DDO

87ingeschakeld. Of er kan geen controle- of vergelijkingsgroep worden

gevormd omdat men het ethisch onverantwoord vindt het beleid

(voorlopig) te onthouden aan bepaalde doelgroepen.

Niettemin biedt de praktijk soms ook de mogelijkheid tot creatieve

oplossingen: zo kun je gebruikmaken van wachtlijstgroepen als

vergelijkingsgroep. Ook kun je meer methoden – elk met hun eigen

sterkten en zwakten – tegelijkertijd gebruiken, om na te gaan of zij alle

qua effecten in dezelfde richting wijzen.65

De relevante methoden en technieken zijn uitgewerkt in hoofdstuk 4.

7.6 Indicatoren doeltreffendheid

Er bestaan geen kant-en-klare indicatoren voor doeltreffendheid, zoals

bijvoorbeeld bij doelrealisatie. Uit een doeltreffendheidsindicator zou

namelijk moeten blijken in welke mate het beleid heeft bijgedragen aan

de effecten in de samenleving. Dat valt vrijwel alleen op basis van ex-

post-evaluatieonderzoek te onderzoeken. In de praktijk worden daarom

vaak – ten onrechte – indicatoren voor doelrealisatie gepresenteerd als

doeltreffendheidskengetallen.66

7.7 Aanbevelingen

Om bij geconstateerde ondoeltreffendheid van beleid aanbevelingen te

kunnen doen, moet je zicht hebben op verklaringen voor deze

ondoeltreffendheid. Potentiële verklaringen zullen al in het begin van het

onderzoek gespecificeerd moeten worden om tijdens de rit van het

onderzoek te kunnen vaststellen in hoeverre ze daadwerkelijk een rol

spelen.

In de literatuur worden diverse verklaringsgronden onderscheiden, zoals

onjuiste veronderstellingen/beleidstheorie, afwijkende uitvoering, conflic-

65 Zie het pleidooi hiervoor van E. Chelimsky: “This means that we think less today about the

relative merits of one method versus another and more about whether and how using them in

concert could result in more conclusive findings” (in: Where we stand in the practice of evaluation,

Knowledge and Policy, Fall 1995, vol. 8, no. 3, p. 8-19).

Een aardig voorbeeld van gebruikmaking van een scala aan methoden wordt gegeven in een

onderzoek van het College van Toezicht Sociale Verzekeringen (CTSV) naar de effecten en

neveneffecten van invoering van financiële prikkels in de Ziektewet (J. Vijgen in achtste bundel

Klankbordgroep, 1997). Er werd een telefonische enquête gehouden onder bedrijven om te

achterhalen in welke mate waarin zij op de hoogte waren van wijzigingen in de Ziektewet en welke

maatregelen zij hadden ingevoerd om ziekteverzuim te bestrijden (nu de nieuwe Ziektewet het

eigen risico voor de werkgever verhoogt). Daarnaast maakte men gebruik van een aantal andere

methoden: analyse van bestaande verzuimcijfers, berekening van de samenhang tussen aantal

ingevoerde maatregelen en de mate van daling in het ziekteverzuim, vergelijking van

verzuimcijfers in de tijd tussen bedrijven die veel en weinig verzuimmaatregelen hadden

geïntroduceerd om autonome ontwikkelingen in verzuimcijfers te traceren, enzovoort. 66 Zie ook Algemene Rekenkamer (1997b).

Handleiding DDO

88terende beleidsdoelen, te hoog gegrepen beleidsdoelen, ontoereikende

beleidsorganisatie en elkaar bestrijdende overheden (zie ook § 3.3).67

Aanbevelingen kunnen, al naar gelang de toepasselijkheid van

bovenstaande verklaringen, luiden:

• Pleeg (beter) ex-ante-evaluatieonderzoek alvorens over te gaan tot

keuze en inzet van instrumenten. Betrek daarin niet alleen de te

verwachten effecten, maar ook de kosten van alternatieve

instrumenten;

• Heroverweeg de inzet van dit instrument in relatie tot het

beleidsdoel;

• Heroverweeg de mate van inzet van het instrument (bijvoorbeeld

hogere/lagere subsidie);

• Heroverweeg de instrumentenmix;

• Stel de uitvoering(sorganisatie) bij, zodat deze conform plan

geschiedt (handelt);

• Handhaaf de uitvoering, maar stel de te ambitieuze beleidsdoelen bij;

• Probeer negatieve effecten te vermijden door bijstelling instrument.

67 Zie hiervoor onder andere: H. Bressers en P.J. Klok, Handleiding instrumententheorie, 1988; A.

Kraan-Jetten, Effectiviteit van overheidsbeleid, 1991; W.J.V. Vermeulen, De vervuiler betaald:

onderzoek naar de werking van subsidies op vier deelterreinen van het milieubeleid, 1992.

Handleiding DDO

898 Onderzoek naar doelmatigheid

8.1 Inleiding



doelgroepbereik, naar doeltreffendheid en naar doelmatigheid. Dit

hoofdstuk behandelt de derde en laatste variant: het onderzoek naar

doelmatigheid.

We bespreken achtereenvolgens de opzet van doelmatigheidsonderzoek

(§ 8.2) en de begrippen die bij doelmatigheid een rol spelen (§ 8.3). Ten

slotte gaan we in op de vier stappen die we idealiter onderscheiden in

doelmatigheidsonderzoek:

1. Onderwerp afbakenen (§ 8.4).

2. Gegevens verzamelen (§ 8.5).

3. Doelmatigheid berekenen (§ 8.6).

4. Het zoeken naar verklaringen voor verschillen in doelmatigheid (§

8.6).

8.2 Opzet van doelmatigheidsonderzoek

8.2.1 Doelstelling

De doelstelling van doelmatigheidsonderzoek door de Algemene

Rekenkamer zou kunnen luiden:

een bijdrage leveren aan het verbeteren van de doelmatigheid door

informatie te verschaffen over de mate van doelmatigheid en verklaringen

te geven voor (on)doelmatigheid.

Door te laten zien hoe doelmatigheidsonderzoek uitgevoerd kan worden

kan men als neveneffect een bijdrage leveren aan de verbetering van de

wijze waarop organisatie X haar eigen doelmatigheid bewaakt

(doelmatigheidsinformatie genereert).

8.2.2 Probleemstelling en onderzoeksvragen

Uit de doelstelling volgt de volgende probleemstelling:

Handleiding DDO

90welke doelmatigheidsverschillen zijn er tussen (onderdelen van)

organisaties en/of in de tijd en welke factoren verklaren deze

doelmatigheidsverschillen?

De probleemstelling kan worden vertaald in de volgende

onderzoeksvragen:

• Meten van doelmatigheid:

o Welke effecten of prestaties (daarbij rekening houdend met

eventuele kwaliteitsverschillen) en middelen worden

onderscheiden en welke omvang hebben deze?

o In welke mate zijn er verschillen in doelmatigheid tussen de

organisaties en/of in de tijd?

• Verklaren van doelmatigheidsverschillen:

o Welke potentiële verklaringen zijn er voor verschillen in

doelmatigheid?

o Welke factoren verklaren de eventuele verschillen in

doelmatigheid?

8.2.3 Normen

Zoals reeds aangegeven in hoofdstuk 1 kan doelmatigheid zowel

betrekking hebben op beleidseffecten (outcome) als op beleidsprestaties

(output), ongeacht welke (onderdelen van) organisaties deze prestaties of

effecten geleverd hebben.

Wanneer we ons afvragen of de effecten respectievelijk prestaties van

beleid doelmatig zijn gerealiseerd door de betrokken organisatie(s), gaat

het erom:

• of deze effecten respectievelijk prestaties door die organisatie(s) niet met

de inzet van minder middelen gerealiseerd hadden kunnen worden; dan

wel

• of niet méér effecten respectievelijk prestaties door de organisatie(s)

verwezenlijkt hadden kunnen worden met dezelfde inzet van middelen.

Zoals gezegd wordt dit kortweg aangeduid als doelmatigheid van effecten

respectievelijk doelmatigheid van prestaties.

Normen doelmatigheid(sinformatie)

Om inzicht in de doelmatigheid van beleidseffecten of prestaties te

kunnen geven, is derhalve informatie over de drie in deze definitie

genoemde ingrediënten noodzakelijk:

Handleiding DDO

91• Inzicht in de middelen. Alle middelen die gebruikt zijn om de

prestaties/effecten te leveren moeten worden meegenomen in de

berekening;

• Inzicht in de kwantiteit van de gerealiseerde prestaties/effecten.

De beleidseffecten en -prestaties moeten meetbaar zijn en logisch volgen

uit de beleidsdoelstellingen;

• Inzicht in de kwaliteit van de gerealiseerde prestaties/effecten. Er moet

rekening zijn gehouden met eventuele verschillen in kwaliteit tussen de

prestaties of effecten van de verschillende organisaties of op de

verschillende momenten.68

Daarnaast is doelmatigheid op twee manieren een relatief begrip. Ten eerste

zijn bovenstaande drie ingrediënten in onderlinge samenhang noodzakelijk om

inzicht te geven in de doelmatigheid. Ten tweede is een vergelijking van deze

onderlinge samenhang nodig om inzicht te geven (in de ontwikkelingen) in

(on)doelmatigheid. Er bestaan geen standaardnormen voor doelmatigheid.

Ten slotte moeten voor het meten van de doelmatigheid en het bepalen van

de factoren die de verschillen in doelmatigheid verklaren geschikte methoden

en technieken op een juiste wijze worden gehanteerd.

Deze normen worden in het vervolg van dit hoofdstuk nader toegelicht.

8.2.4 Aanbevelingen

Op basis van onderzoek naar doelmatigheid kan worden aangegeven:

• in welke mate de doelmatigheid kan verbeteren ten opzichte van de

gekozen vergelijkingsmaatstaf (voorbeeld: de organisatie kan

gegeven zijn middelen de prestaties met 10% verhogen).

Doelmatigheidsinformatie kan daarmee antwoord bieden op de vraag

hoe met hetzelfde geld meer gedaan kan worden voor de

maatschappij, wat het uiteindelijke doel is van elk beleid. Of ze kan

antwoord geven op de vraag of hetzelfde bereikt kan worden met

minder middelen/geld. In dat geval kan het bespaarde geld worden

gebruikt voor bijvoorbeeld ander of nieuw beleid;

• met behulp van welke acties de organisatie de doelmatigheid zou kunnen

verbeteren. Het onderzoek kan zo helpen bij het verbeteren van de

bedrijfsvoering van de onderzochte organisatie(s).

Goede doelmatigheidsinformatie is voorts een belangrijk hulpmiddel in de

verantwoording over het beleid en de daarvoor geleverde prestaties aan

bijvoorbeeld de Tweede Kamer.

68 Er moet sprake zijn van groepen van homogene prestaties of effecten. Homogeen wil zeggen dat

binnen zo’n groep de ‘workload’ en/of kwaliteit van de prestaties of effecten gelijk is.

Handleiding DDO

92

Aanbevelingen om de doelmatigheid te verbeteren komen voort uit

factoren die aantoonbaar van invloed zijn op de doelmatigheid. Dit zijn bij

voorkeur de factoren waarop de betrokken organisaties zelf invloed

kunnen uitoefenen (interne verklaringen). Deze bieden de organisaties

sturingsmogelijkheden. Zie ook § 3.3.

8.3 Begrippen

8.3.1 Effecten, prestaties en middelen

Zoals gezegd spelen bij doelmatigheid drie ingrediënten een rol: de

kwantiteit en kwaliteit van de effecten of prestaties en de middelen die

zijn ingezet om deze effecten dan wel prestaties te realiseren. Zie voor de

definities van effecten, prestaties en middelen § 3.2 en voor de definitie

van doelmatigheid § 1.1.4 en § 8.2.3.

8.3.2 Vergelijking

Doelmatigheid is een relatief begrip. De beleidseffecten of -prestaties zijn

meer of minder doelmatig gerealiseerd vergeleken met die van een

andere vergelijkbare organisatie of ten opzichte van de situatie in het

recente verleden. Je kunt dus alleen maar zeggen dat je ten opzichte van

die andere periode of organisatie (on)doelmatiger bent geweest.

Dit betekent dat nooit een absolute uitspraak over de doelmatigheid kan

worden gedaan. Als bijvoorbeeld in een departementaal jaarverslag een

kengetal is opgenomen over de verhouding tussen ingezette middelen

enerzijds en effecten of prestaties anderzijds, zonder dat dit kengetal

wordt afgezet tegen een bepaalde ‘meetlat’, zegt dat kengetal niets over

de doelmatigheid. Pas na vergelijking krijg je inzicht in de mate van

doelmatigheid.

De vergelijking met eerdere jaren wordt vaak gebruikt. Vergelijking per

maand, kwartaal of half jaar is echter ook mogelijk, al vergt dat vaak wel

meer inspanning (en dus hogere kosten) voor de dataverzameling.

Als gekozen wordt voor vergelijking met andere organisaties, is het van

belang dat het gaat om organisaties die écht vergelijkbaar zijn, dat wil

zeggen hetzelfde beleid uitvoeren (bijvoorbeeld: politieregio’s, een

landelijk netwerk van ziekenhuizen of scholen), of organisaties die

vergelijkbare prestaties leveren (bijvoorbeeld: een publieke en een

particuliere school).

Handleiding DDO

93

Samenvattend: vergelijkingen kunnen op twee manieren worden

gemaakt:

• ten opzichte van het verleden;

• met een (of meer) andere, vergelijkbare organisatie(s).

Een combinatie van beide is ook mogelijk.

8.3.3 Kwaliteit

Het is van belang om je te realiseren dat bij de bepaling van

doelmatigheid altijd rekening moet worden gehouden met eventuele

(kwaliteits)verschillen tussen de prestaties of effecten van de

verschillende organisaties en/of op de verschillende momenten (zie ook §

3.2.1).

Zo kunnen prestaties op het eerste gezicht homogeen lijken, maar bij

nadere beschouwing heterogeen zijn. Bijvoorbeeld: niet alle

belastingaangiften zijn gelijk en niet elke vergunningaanvraag voor een

bepaalde subsidie is hetzelfde. De verwerking van complexe aangiften en

aanvragen vergt meer inzet van middelen dan de standaardgevallen. Dat

betekent dat de geleverde prestaties van elkaar verschillen.

Maar ook bij vergelijking van prestaties in het ene jaar met dezelfde

prestaties in het andere jaar of van de ene organisatie met de andere,

blijkt in de praktijk vaak dat er kwaliteitsverschillen zijn. Je kunt alleen

maar spreken van een verbetering van de doelmatigheid wanneer

goedkopere prestaties met minstens dezelfde kwaliteit zijn geleverd.

Als de kosten van een bepaalde prestatie ten opzichte van bijvoorbeeld

vorig jaar lager zijn geworden als gevolg van een lagere kwaliteit van de

prestatie in kwestie, mag dat dus niet leiden tot de conclusie dat de

doelmatigheid is verbeterd. Bij het bepalen van de doelmatigheid dien je

rekening te houden met eventuele kwaliteitsverschillen tussen de

prestaties, om het risico te vermijden dat je verkeerde conclusies trekt

(zie verder § 8.5.4).

Het meten van de kwaliteit van effecten/prestaties van rijksbeleid of een

RWT is vaak niet eenvoudig omdat de prestaties meestal in de vorm van

diensten worden geleverd. Klanttevredenheid is een veel voorkomende

operationalisatie van de kwaliteit van de prestaties. Een kwalitatief goede

enquête is hier een bruikbaar middel om de gegevens boven water te

krijgen. Als een dergelijke enquête niet mogelijk is, kun je een

inschatting maken van de mate van klanttevredenheid door bijvoorbeeld

het aantal ingediende klachten te meten.

Handleiding DDO

948.3.4 Verklaringen

Door beleidseffecten respectievelijk beleidsprestaties te relateren aan de

daarvoor ingezette middelen, en dit geheel te vergelijken met dezelfde

verhouding van vergelijkbare organisaties en/of met andere momenten, krijg

je inzicht in de relatieve doelmatigheid van de effecten of prestaties in

kwestie. Met ‘doelmatigheidsscores’ kun je dan aangeven op welk moment de

organisatie relatief het doelmatigst is geweest en/of welke organisaties

relatief goed hebben gepresteerd.

Voor organisaties die nu relatief slecht presteren, is het van belang om te

weten wat ze kunnen doen om doelmatiger te worden. Daarom moet naar

factoren worden gezocht die de verschillen in doelmatigheid verklaren, zodat

duidelijk wordt hoe een organisatie haar doelmatigheid kan verbeteren (zie

ook § 3.3). Voorbeelden van mogelijke verklarende factoren voor verschillen

in doelmatigheid zijn de personeelssamenstelling (uitgesplitst naar leeftijd en

naar voltijd- en deeltijdcontracten), verspillingen en de kwaliteit van

werkprocessen.

Stel dat twee organisaties die hetzelfde beleid uitvoeren op doelmatigheid

worden vergeleken en de doelmatigheidsscore van de eerste veel beter is dan

van de tweede. Stel dat verder blijkt dat de tweede organisatie twee keer zo

veel leidinggevenden heeft als de eerste en dat bij die tweede organisatie

twee diensten volledig langs elkaar heen werken. Dan zou dit een verklaring

voor de doelmatigheidverschillen kunnen zijn.69

8.4 Onderwerp afbakenen

Als je doelmatigheidsinformatie over een bepaald beleidsterrein wilt

genereren zul je eerst antwoord moeten geven op de vraag: waarvan wil

ik precies de doelmatigheid bepalen? Van alle effecten of prestaties die

worden geleverd voor een beleidsartikel of RWT of van een deel daarvan?

Kan ik me daarbij richten op de effecten of de prestaties?

Deze vragen komen hierna aan bod, evenals een voorstel voor een

stapsgewijze aanpak voor het in kaart brengen van de doelmatigheid.

69 Het moge duidelijk zijn dat dit een sterk vereenvoudigd voorbeeld is. In werkelijkheid zullen er

tal van interne en externe factoren van invloed zijn op de doelmatigheid.

Handleiding DDO

958.4.1 Algemene of operationele doelstellingen?

De doelstellingen van het beleid waarvan je de doelmatigheid wilt

vaststellen, vormen vanzelfsprekend het startpunt voor de analyse. Deze

doelstellingen benoemen immers de effecten dan wel prestaties die het

ministerie dan wel de RWT met het beleid wil realiseren.

De eerste keuze die bij ministeries gemaakt moet worden is of je de

doelmatigheid wilt bepalen op het niveau van de algemene doelstelling

(alle effecten of prestaties) of van één of meer operationele doelstellingen

(een deel van de (effecten/)prestaties). Als je kiest voor het niveau van

operationele doelstellingen, moet vervolgens worden besloten welke

daarvan. Wanneer er verschillende operationele doelstellingen zijn en je

wilt op basis van de operationele doelstellingen inzicht geven in de

doelmatigheid van het beleid zoals gedefinieerd in de algemene

doelstelling, dan moet je vanzelfsprekend alle operationele doelstellingen

betrekken bij het berekenen van de doelmatigheid.

Als de doelen van beleid (de te realiseren effecten of prestaties) niet

duidelijk zijn geformuleerd, kan de doelmatigheid van de effecten of

prestaties niet worden berekend. Immers, we moeten de effecten of

prestaties kunnen afzetten tegen de ingezette middelen, en dat is

onmogelijk als deze effecten of prestaties niet duidelijk zijn. Het is in dat

geval noodzakelijk eerst de formulering van de beleidsdoelstelling aan te

passen.

Voor het bepalen van de doelmatigheid van effecten of prestaties, moeten

de doelstellingen in elk geval concreet zijn, dat wil zeggen: specifiek en

meetbaar. Tips voor het formuleren van goede beleidsdoelstellingen zijn

te vinden in § 5.2, maar bijvoorbeeld ook in de Handreiking

doelformulering en prestatiegegevens van het Ministerie van Financiën,

en in de Handreiking verantwoorden over beleid van de Algemene

Rekenkamer.70

In de praktijk (in 2004) blijkt dat de algemene doelstellingen vaak niet

concreet zijn.71 Het is dan dus niet helder welke effecten exact met de

algemene doelstelling worden beoogd. Dat betekent dat we ook de

doelmatigheid van deze effecten niet kunnen nagaan.

Wat je in zo’n geval ook kan doen is: teruggrijpen op de in de

operationele doelstellingen geformuleerde effecten of prestaties die het

70 Ministerie van Financiën, Handreiking doelformulering en prestatiegegevens, december 2000;

Algemene Rekenkamer, Handreiking verantwoorden over beleid, 2000. 71 Dit is overigens weer niet verwonderlijk omdat de Regeling Prestatiegegevens en

Evaluatieonderzoek Rijksoverheid aangeeft dat wanneer een algemene doelstelling niet valt te

kwantificeren of geen goede aanknopingspunten voor sturing biedt, een beleidsartikel één of meer

operationele doelstellingen zal bevatten.

Handleiding DDO

96ministerie wil inzetten om de algemene doelstelling te realiseren (zie ook

de volgende paragraaf).

Voorbeeld van een algemene en een operationele doelstelling

Het ministerie van Justitie heeft voor beleidsartikel 4.2 ‘Rechtsbijstand’ de algemene

beleidsdoelstelling: ‘waarborgen van de toegang tot het recht voor rechtzoekenden die niet

over voldoende financiële middelen beschikken en die deskundige juridische bijstand nodig

hebben’. De eerste operationele doelstelling die daarbij hoort, luidt: ‘een adequaat stelsel

van gesubsidieerde rechtsbijstand voor minder draagkrachtige rechtzoekenden’.

8.4.2 Prestaties of effecten?

Je kunt je onderzoek richten op de doelmatigheid van de effecten of op de

doelmatigheid van de prestaties. Het zal niet voor alle doelstellingen

mogelijk zijn de doelmatigheid van effecten in kaart te brengen. Soms zal

het te kostbaar zijn; soms ook zal het niet mogelijk zijn om de effecten te

kwantificeren of aan te tonen in welke mate bepaald beleid effect heeft.

Het in kaart brengen van de relatie tussen de ingezette middelen en de

gerealiseerde prestaties zal in de praktijk gemakkelijker zijn. Zie verder §

3.2.

De tweede vraag die daarom beantwoord moet worden, is of je informatie

wilt en kunt krijgen over de relatie tussen middelen en effecten dan wel

over de relatie tussen middelen en prestaties. Het beste kun je

stapsgewijs te werk gaan.

• Bekijk waar de meeste mogelijkheden zijn om doelmatigheidsinformatie

te maken. Welke zijn politiek en maatschappelijk gezien op dit moment

vanuit doelmatigheidsperspectief het meest opportuun en voor welke

daarvan is het eenvoudigst doelmatigheidsinformatie te genereren?;

• Begin zo nodig met een goede formulering van de algemene en/of

operationele doelen van het beleid;

• Het ligt voor de hand op de korte termijn vooral te investeren in de

relatief gemakkelijk te bepalen doelmatigheid van de prestaties;

• Genereer eerst informatie over de kwantiteit en kwaliteit van de

beleidsprestaties en daarna informatie over de doelmatigheid van

deze beleidsprestaties;

• Ondertussen kun je dan nadenken over en toewerken naar het

verzamelen van informatie over effecten en de doelmatigheid van de

effecten, voor zover dat mogelijk en betaalbaar is.

Handleiding DDO

978.5 Gegevens verzamelen

Nadat je hebt afgebakend waarover je doelmatigheidsinformatie wilt of

kunt opstellen, moet je de daarvoor benodigde gegevens gaan

verzamelen over:

- de effecten of prestaties en de middelen die gebruikt zijn om de effecten

of prestaties te leveren (§ 8.5.2);

- de kwaliteit van effecten of prestaties (§ 8.5.3);

- potentiële verklaringen voor verschillen in doelmatigheid (§ 8.5.4).

Je moet er uiteraard voor zorgen dat deze informatie van voldoende kwaliteit

is, dat wil zeggen: relevant, betrouwbaar en vergelijkbaar (zie ook § 5.372).

Deze begrippen lichten we hieronder eerst kort toe.

8.5.1 Kwaliteit informatie

De informatie is voor doelmatigheidsinformatie pas bruikbaar als deze

relevant, betrouwbaar en vergelijkbaar is.

Relevantie

Het is niet wenselijk dat overbodige gegevens verzameld worden. Wat je

allemaal moet verzamelen hangt af van de inhoud van het beleidsterrein

en de vraag die beantwoord moet worden. ‘Relevant’ is informatie die het

beleid, respectievelijk de activiteiten van het betrokken ministerie of de

betrokken organisatie(s) adequaat weerspiegelt.

Betrouwbaarheid

De verzamelde informatie mag geen materiële onjuistheden of

onvolledigheden bevatten.

Vergelijkbaarheid

De verzamelde informatie dient in tijdsperspectief en/of tussen

organisaties vergelijkbaar te zijn.

Onafhankelijk van de wijze waarop wordt vergeleken, moeten de

effecten/prestaties waarvoor je de doelmatigheid berekent en de wijze

waarop deze totstandkomen voor alle organisaties vergelijkbaar zijn. Ook

de doelmatigheidsindicatoren waarin de verhouding tussen middelen en

effecten/prestaties worden weergegeven, moeten voor alle te vergelijken

organisaties en/of in de tijd uniform zijn gedefinieerd. De gegevens die

72 Drie normen die we in § 5.3 noemen zijn hier niet van toepassing omdat de informatie alleen

voor het onderzoek bruikbaar moet zijn: begrijpelijkheid (voor een lezerspubliek); conformiteit aan

de regels voor de inhoud; conformiteit aan de regels voor vorm.

Handleiding DDO

98nodig zijn om de doelmatigheidsindicatoren te berekenen, moeten

eveneens uniform zijn gedefinieerd.

Voorbeelden vergelijkbaarheid gegevens

Wanneer je de doelmatigheid van de CWI’s wilt vergelijken, moeten de indicatoren die je

daarvoor wilt gebruiken voor elk centrum op dezelfde manier zijn gedefinieerd. Zo moet elk

centrum de kosten en het aantal personen dat aan het werk is geholpen op dezelfde manier

definiëren, berekenen en registreren.

Indien de wens bestaat de doelmatigheid te vergelijken met die van een externe

organisatie, moet van tevoren goed worden nagedacht over de vraag of deze externe

organisatie in alle opzichten echt vergelijkbaar is. Een relevante vergelijking is alleen

mogelijk als de prestaties en de bedrijfsprocessen onderling vergelijkbaar zijn, hetgeen in

de meeste gevallen niet zo zal zijn.

Het is belangrijk om in de beginfase veel tijd en energie te besteden aan

de kwaliteit van de informatie. Realiseer je dat dit meestal een

tijdrovende kwestie is. Het is verstandig om gebruik te maken van de

kennis die aanwezig is in de praktijk (denk bijvoorbeeld aan een

begeleidingscommissie).

Verzamelen kost tijd

Het Sociaal en Cultureel Planbureau verrichtte in 1998 een onderzoek naar de

doelmatigheid van algemene en academische ziekenhuizen. Men deed er ruim een jaar over

om een bestaande (!) dataset met productiegegevens van ziekenhuizen op orde te krijgen.

In het onderzoek van de Algemene Rekenkamer naar de doelmatigheid van arbeidsbureaus

(2001) heeft die fase eveneens ongeveer een jaar gekost.

De verzamelde gegevens moeten altijd worden beoordeeld op hun

kwaliteit (zie ook § 5.3). Afhankelijk van de zekerheid die je hebt over de

kwaliteit kan deze analyse van zeer globaal tot zeer diepgaand zijn. In §

8.6 beschrijven we hoe kengetallenanalyse kan helpen bij het bepalen

van de toereikendheid van de kwaliteit van de te gebruiken gegevens.

8.5.2 Informatie over effecten of prestaties

Effecten zijn de gevolgen van beleid die merkbaar zijn in de

maatschappij. Effecten zijn in de meeste gevallen niet direct te meten. In

die gevallen zal een benadering moeten worden gemaakt van de bereikte

effecten door middel van ‘indicatoren’, ook wel proxy-variabelen

genoemd. Als prestaties worden gebruikt als effectindicator (wat niet

verstandig is), zal de berekening van de doelmatigheid van de effecten op

hetzelfde neerkomen als de doelmatigheid van de prestaties.

Handleiding DDO

99

Hoewel de gerealiseerde prestaties vaak makkelijker te meten zijn, zijn

ook deze niet altijd direct te meten. Zie voor definities, voorbeelden en

onderzoekbaarheid van effecten en prestaties § 3.2 en § 4.3.2.

8.5.3 Middelen

Het is belangrijk om af te bakenen welke middelen zijn ingezet voor de

geleverde effecten of prestaties (zie ook § 3.2.4). Twee dingen moeten

we daarbij goed in de gaten houden.

In de eerste plaats moeten in principe alle middelen die zijn ingezet voor

het realiseren van de prestaties of effecten, in de berekening worden

meegenomen. Middelen bestaan uit vaste en variabele ingezette

middelen. Personeel en materieel worden tot de variabele middelen

gerekend. Vaste ingezette middelen zijn de middelen waarop organisaties

op korte termijn zelf geen of moeilijk invloed kunnen uitoefenen zoals

gebouwen. Omdat deze vaste middelen moeilijk kunnen worden

aangepast, worden ze bij de berekening van de doelmatigheidsscores ook

wel buiten beschouwing gelaten en wordt dus alleen uitgegaan van de

variabele middelen/kosten.

Alle (relevante) middelen

Het ministerie van Onderwijs, Cultuur en Wetenschappen (OCenW) heeft bij diverse

onderwijsbeleidsartikelen het kengetal ‘kosten per leerling’ opgenomen. Een kengetal kan

een goed instrument zijn om inzicht in de ontwikkeling van de doelmatigheid te geven.

Dit specifieke kengetal is in zijn huidige vorm echter ontoereikend om inzicht in de

doelmatigheid te geven, onder meer omdat niet alle middelen zijn meegenomen. De

middelen die in het kengetal zijn verwerkt, betreffen de overdrachtsuitgaven van het

ministerie aan de onderwijsinstelling. De kosten van de onderwijsinstellingen zelf die niet

door overdrachtsuitgaven zijn gedekt, zijn dus niet meegenomen. Wanneer de uitgaven van

het ministerie dalen, lijkt het op basis van dit kengetal alsof het proces van opleiden van

leerlingen doelmatiger wordt. Dit is echter niet het geval wanneer de kosten van de

onderwijsinstellingen niet navenant zijn afgenomen. Daarom moeten álle middelen in de

berekening worden meegenomen.

In de tweede plaats: er mogen weliswaar geen ingezette middelen in de

berekening ontbreken, maar tegelijkertijd mogen er ook niet méér

middelen worden meegeteld dan de middelen die zijn ingezet voor het

realiseren van de prestatie of het effect in kwestie.

Handleiding DDO

100 Alle middelen en alleen die zijn ingezet voor de prestatie

In de begroting 2003 van het ministerie van Volkshuisvesting, Ruimtelijke Ordening en

Milieubeheer (VROM) staat onder meer beleidsartikel 12 ‘Beheer milieurisico’s van stoffen,

afval en straling’.

Centraal in dit beleidsartikel staat de beheersing van risico’s voor mens en milieu bij het

omgaan met stoffen, afvalstoffen, radioactieve stoffen en straling en met genetisch

gemodificeerde organismen, rekening houdend met sociale en economische factoren.

In de begroting staat als doelmatigheidskengetal voor de in-, uit- en doorvoer van

afvalstoffen: de kostprijs per afgehandelde EVOA-kennisgeving. In deze kostprijs zijn niet

alle kosten opgenomen die gemoeid zijn met de prestatie ‘afhandelen EVOA-

kennisgevingen’. Zo zijn onder meer de interne kosten van het ministerie (voornamelijk

personele kosten) niet meegenomen.

Anderzijds heeft een deel van de kosten die in de kostprijs zijn verwerkt geen betrekking

op de prestatie. Niet alle relevante middelen en meer dan alleen de middelen die voor de

betrokken prestaties worden gemaakt zijn meegeteld.

Voor een bruikbaar doelmatigheidskengetal zouden beide gebreken in de afbakening van de

kosten verholpen moeten worden.

Zoals gezegd (zie § 3.2.4) worden in de praktijk voor het uitdrukken van

middelen in geld zowel kosten als uitgaven gebruikt. Voor het bepalen

van de doelmatigheid zou idealiter moeten worden uitgegaan van de

kosten. Wanneer je vergelijkt in de tijd moet je daarbij werken met

kosten in constante prijzen (defleren). Anders wordt het beeld vertekend

door inflatie. Zoals gezegd kan ook wel gewerkt worden met de variabele

kosten.

Ook de kosten zijn niet altijd direct te meten. In deze gevallen zullen

deze ook moeten worden benaderd via een indicator of proxy-variabele.

De informatie over uitgaven in de huidige begrotingssystematiek is

bijvoorbeeld vooralsnog vaak de enige informatie die beschikbaar is. De

uitgaven zouden, als ‘second best’-oplossing, als proxy voor de kosten

kunnen worden gebruikt. Er moet dan wel worden nagegaan of er ‘grote

uitgaven’ (investeringen) zijn, die van jaar op jaar sterk verschillen en

het beeld kunnen vertekenen. Als dat zo is moeten deze uitgaven worden

Verschil tussen kosten en uitgaven

Computers worden bij aanschaf in een bepaald jaar volledig betaald (uitgaven), maar slechts

een deel van die computers wordt in dat jaar ‘verbruikt’ (kosten). De computers kunnen

immers enkele jaren mee. Als de uitgaven verschillen van de kosten – wat vaak het geval is –

leidt het relateren van de uitgaven aan de prestaties of effecten dus tot verkeerde conclusies

over de doelmatigheid. Uitgaven zullen immers van jaar op jaar sterk kunnen fluctueren. Ze

zullen hoog zijn in het jaar dat computers worden aangeschaft. In het daaropvolgende jaar

zou het bepalen van de doelmatigheid op basis van de uitgaven ten onrechte leiden tot de

conclusie dat de doelmatigheid verbeterd is.

Handleiding DDO

101 verdeeld over de jaren waarin ze verbruikt worden of ze moeten niet

worden meegeteld (uitgaven minus investeringen).73

8.5.4 Kwaliteit

Onderling verschillende effecten/prestaties mogen niet op één hoop

gegooid worden (zie ook § 3.2). Het over één kam scheren van alle

belastingaangiften die de Belastingdienst behandelt, zou bijvoorbeeld

geen recht doen aan het gegeven dat standaardgevallen de

Belastingdienst een lagere werklast bezorgen dan de moeilijke gevallen.

Wanneer de verhouding tussen het aantal ‘makkelijke’ en ‘moeilijke’

prestaties tussen de te vergelijken organisaties of van jaar op jaar

verschilt, dan moeten de effecten/prestaties worden gedifferentieerd naar

moeilijkheidsgraad.

Makkelijke en moeilijke prestaties

De CWI’s hebben onder meer als taak (doel van het beleid) werklozen aan een baan te

helpen. Stel dat het accepteren van een baan door een werkzoekende de prestatie is. Het

plaatsen van een persoon met geringe kansen op de arbeidsmarkt (een grote afstand tot

de arbeidsmarkt) kost meer moeite, tijd en inspanning dan het plaatsen van een

werkzoekende met goede kansen op de arbeidsmarkt. Om homogene groepen van

prestaties te kunnen vormen, zal onderscheid moeten worden gemaakt tussen plaatsingen

van werkzoekenden met een grote afstand tot de arbeidsmarkt en werkzoekenden met een

minder grote afstand tot de arbeidsmarkt.

Bij het vergelijken van effecten of prestaties in het ene jaar met dezelfde

effecten of prestaties in het andere jaar is het eveneens van belang

rekening te houden met mogelijke kwaliteitsverschillen.

Kwaliteitsverschillen

Stel dat een bepaalde dienst maar één prestatie levert: belastingaangiften behandelen.

Indien bij vergelijking van twee dependances van die dienst, die beide hetzelfde soort

belastingaangiften verwerken, blijkt dat bij de ene dependance de aangiften snel, maar

slordig (met fouten) worden behandeld, terwijl de andere dependance trager maar

grondiger (zonder fouten) werkt, dan mag je niet uitsluitend naar de kosten per prestatie

kijken. Daaruit zou je immers ten onrechte kunnen concluderen dat de eerste dependance

doelmatiger is.

73 Zie Aarts et. al. (2002) voor onder andere het verschil tussen het kasstelsel (huidige

begrotingssystematiek) en het baten-lastenstelsel (waarin wel informatie over prestaties en

kostprijzen wordt gegenereerd).

Handleiding DDO

102 Zowel bij de dataverzameling, de analyse, als het trekken van conclusies

over de ontwikkelingen in doelmatigheid moet rekening worden gehouden

met eventuele verschillen tussen effecten en prestaties.

8.5.5 Verklaringen zoeken en gebruiken

Wanneer je bij een ministerie of organisatie de doelmatigheid van (een

onderdeel van) het beleid in kaart hebt gebracht, is het belangrijk dat je

ook nagaat welke factoren de eventuele verschillen in doelmatigheid

verklaren. Pas met concrete verklaringen in de hand kan immers gewerkt

worden aan het verbeteren van de doelmatigheid. Zie ook § 3.3.

Interne en externe verklaringen

Verklaringen kunnen binnen het ministerie en/of de bij het beleid

betrokken organisatie liggen: interne verklaringen.

Ze kunnen ook buiten deze organisaties liggen: externe verklaringen. In

de volgende tabel zijn voorbeelden van verklaringen opgenomen.

Handleiding DDO

103 Te verklaren situatie Mogelijke interne verklaring Mogelijke externe verklaring

Doelmatigheid is

afgenomen ten opzichte

van vorig jaar

• personeelsverloop (hoog)

• recent gereorganiseerd

• (hoog) ziekteverzuim

• wijzigingen in het ‘productieproces’

• (toename) aantal klachten

• inconsistente (beleids)doelstellingen

• (meer) tussentijdse verzoeken van

de Tweede Kamer die van invloed

zijn op de ‘productie’

• nieuwe wetten waardoor de

‘productie’ anders moest

• (slechtere) arbeidsmarktsituatie

• (slechtere) weersomstandigheden

die productie beïnvloeden

• (slechtere) (inter)nationale

economische situatie

• (meer) files

• (slechtere) bodemgesteldheid die

productie beïnvloed

• verandering in kenmerken van

klanten

• inconsistente (beleids)doelstellingen

Doelmatigheid organisatie

A is hoger dan doelmatig-

heid organisatie B

• verschillen in werkwijze

• verschillen in aandeel overhead

• verschillen in leeftijdsopbouw

medewerkers

• verschillen in opleidingsniveau

medewerkers

• verschillen in gemiddeld salaris

• verschillen in ervaring medewerkers

• verschillen in aandeel deeltijdbanen

• verschillen in aantal klachten

• verschillen in m2 vloeroppervlak per

persoon

• verschil in aantal locaties per

organisatie

• verschillen in aandeel uitbesteed

werk

• verschillen in de regionale arbeids-

marktsituatie

• verschillen in regionale economische

situatie

• verschillen in bodemgesteldheid

• verschillen in kenmerken van klanten

• verschillen in regionale

leeftijdsopbouw bevolking

• verschillen in regionaal

opleidingsniveau bevolking

De interne verklaringen geven in het algemeen mogelijkheden om de

doelmatigheid te verbeteren, omdat het ministerie respectievelijk de

organisatie in kwestie hieraan zelf iets kan verbeteren. De externe

verklaringen daarentegen zijn vaak niet door het ministerie of de

organisatie te beïnvloeden. Deze factoren geven wel verklaringen voor

(on)doelmatigheid, maar reiken geen mogelijkheden tot verbetering aan.

Handleiding DDO

104 Externe verklaring erg moeilijk beïnvloedbare factor

In een onderzoek van Goudriaan et al. naar de doelmatigheid van hogescholen (1998) bleken de

verschillen in doelmatigheid voor een belangrijk deel te kunnen worden verklaard door de

ontwikkeling van studentenaantallen, een vrijwel onbeïnvloedbare factor voor de individuele

hogeschool. Hoewel je met verklaringen probeert de noodzakelijke grondstof voor aanbevelingen

voor verbeteringen te bieden, bleek dat in dit voorbeeld dus voor deze factor niet mogelijk te zijn.

Het is verstandig voordat je informatie gaat verzamelen over mogelijke

verklarende factoren, om bij het inventariseren ervan zo veel mogelijk

gebruik te maken van de kennis die aanwezig is bij de personen binnen het

ministerie en/of organisaties(onderdelen) ‘die er over gaan’. Daarnaast kan

raadplegen van literatuur of een dag meelopen in de organisatie(s) nuttige

informatie opleveren.

Bevindingen gebruiken

Indien mogelijkheden tot verbetering gevonden zijn, ligt het voor de hand

dat deze gebruikt worden om daadwerkelijk verbeteringen aan te

brengen. Als het de doelmatigheid betreft van derden die betrokken zijn

bij (de uitvoering van) het beleid zoals gemeenten, dan kunnen ministers

deze derden bijvoorbeeld via overleg stimuleren en/of via nadere

regelgeving aansturen om verbeteringen aan te brengen.

8.6 Doelmatigheid berekenen

Wanneer de benodigde gegevens zijn gedefinieerd en verzameld, is de

volgende stap het berekenen van de doelmatigheid van de

beleidsprestaties of -effecten die je onder de loep hebt. Er zijn

verschillende methoden en technieken om dit te doen. De belangrijkste

zijn: het gebruik van eenvoudige kengetallen en de analysetechnieken

Free Disposable Hull (FDH), Data Envelopment Analysis (DEA) en

Stochastic Frontier Analysis (SFA).74

0We gaan eerst in op kengetallen, die het breedst toepasbaarheid zijn (§

8.6.1). Daarna beschrijven we kort de werking van de meer ingewikkelde

technieken FDH, DEA en SFA (§ 8.6.2). Deze zijn in principe erg geschikt

om de doelmatigheid van een groter aantal vergelijkbare organisaties of

tijdstippen te berekenen. Ten slotte beschrijven we globaal op welke

manieren gezocht kan worden naar verklaringen voor verschillen in

doelmatigheid die mogelijke aanknopingspunten geven voor het

verbeteren van de doelmatigheid.

74 Zie bijvoorbeeld Coelli, 1998, Blank, 2000 en New South Wales Treasury, 2001.

Handleiding DDO

105 Vooraf

Bij de berekening van de doelmatigheid kijk je:

• of de beleidsprestaties respectievelijk -effecten niet met de inzet van

minder middelen gerealiseerd hadden kunnen worden; dan wel

• of niet méér beleidsprestaties respectievelijk -effecten verwezenlijkt

hadden kunnen worden met dezelfde inzet van middelen.

Dit eerste punt wordt ook wel ‘inputoriëntatie’ genoemd, het tweede

‘outputoriëntatie’.

Met welke methode je de doelmatigheid van een organisatie ook wilt

berekenen, je zult eerst moeten bepalen welke oriëntatie het meest

geschikt is, een input- of outputoriëntatie. De keuze wordt in het

algemeen bepaald door de middelen (input) of de beleidsprestaties75

(output) waarover een manager van de organisatie(s) de meeste controle

heeft. Dit zijn immers de factoren die hij kan beïnvloeden en dus waarop

hij kan (bij)sturen.

Als de middelen voor de organisatie een gegeven zijn (vastliggen), dan kies je

voor een outputoriëntatie. Je kijkt of het mogelijk is om gegeven de middelen

meer prestaties (output) te leveren.

Outputoriëntatie

Een voorbeeld waarbij gekozen moet worden voor een outputoriëntatie is het onderwijs,

waar de budgetten (input) een gegeven zijn voor de scholen.

Als daarentegen de prestaties een gegeven zijn voor de organisatie, dan

kies je voor een inputoriëntatie. En kijk je of het mogelijk is om de

prestaties te realiseren met minder middelen (input).76

Inputoriëntatie

Een voorbeeld waarbij gekozen moet worden voor een inputoriëntatie zijn de

elektriciteitsbedrijven, waar de vraag naar elektriciteit (output) een gegeven is waarop niet

of nauwelijks invloed kan worden uitgeoefend.

Analyses met kengetallen (en/of eenvoudige regressieanalyses) vormen altijd

een logische start bij het bepalen van de doelmatigheid en verklaringen voor

verschillen daarin, ook wanneer het rekenen met kengetallen niet de optimale

methode is om de doelmatigheid te bepalen. Dit soort analyses geeft namelijk

een eerste inzicht in onder andere de structuur van de organisaties en een

75 Met het oog op de leesbaarheid wordt vanaf hier steeds gesproken over (beleids)prestaties in

plaats van over (beleids)prestaties/-effecten. (Beleids)effecten zijn ‘outcome’. 76 Zie voor een nadere toelichting onder andere Coelli (1998), Blank (2000) en Algemene

Rekenkamer (2001).

Handleiding DDO

106 aantal aspecten over de relatie tussen de middelen en de prestaties. Zie ook §

8.6.2.1 en 8.6.3.2.

In bijlage 7 staat een checklist op basis waarvan is na te gaan of voor

een bepaald onderwerp de doelmatigheid is te bepalen.

8.6.1 Doelmatigheidskengetallen

8.6.1.1 Wat zijn doelmatigheidskengetallen?

Doelmatigheidskengetallen zijn een momentopname van de verhouding

tussen middelen en effecten of prestaties. Het cijfer dat de kosten per

verleende subsidie weergeeft, is bijvoorbeeld een kengetal.

Door kengetallen van verschillende vergelijkbare organisaties onderling

en/of met kengetallen uit een eerdere periode te vergelijken, wordt de

relatieve mate van doelmatigheid zichtbaar.

Vergelijken van kengetallen

1998 1999 2000 2001 2002

Kosten per verleende subsidie

(in euro’s prijspeil 1-1-2002)

200 180 210 225 240

Kwaliteit: klanttevredenheid

(schaal 1-10)

8 6 6 6 8

Uit de tijdreeks is af te leiden dat de kosten per verleende subsidie vanaf 1999

toenemen. De kwaliteit, in dit geval gemeten met behulp van de klanttevredenheid, blijft

in deze periode gelijk – met uitzondering van het jaar 2002 –, waarin de kwaliteit iets

toeneemt. Uit deze twee ontwikkelingen is af te leiden dat in de periode 1999-2001 de

doelmatigheid afneemt. Voor 2002 is dat niet direct af te leiden omdat weliswaar de

kosten per verleende subsidie zijn toegenomen, maar de kwaliteit ook is toegenomen.

De voordelen van kengetallen zijn:

• ze zijn makkelijk te berekenen;

• ze kunnen op een eenvoudige wijze inzicht geven (in ontwikkelingen) in

de doelmatigheid;

• ze zijn zonder veel inspanning en kosten frequent (maandelijks, jaarlijks)

te maken zodat ze de mogelijkheid bieden vaak inzicht te hebben en snel

in te grijpen;

• bij meer effecten of prestaties geven ze inzicht in de afzonderlijke

effecten/prestaties.

Handleiding DDO

107 8.6.1.2 Wanneer kengetallen gebruiken?

Eén effect of prestatie

Kengetallen zijn goed bruikbaar voor de berekening van de doelmatigheid

bij beleid waar per beleidsartikel of doelstelling sprake is van slechts één

prestatie of effect en waaraan alle daarvoor gebruikte middelen kunnen

worden gekoppeld. Je spreekt dan van enkelvoudige kengetallen (zie

voorgaand voorbeeld).

Verscheidene effecten of prestaties

Meestal echter zijn aan beleidsdoelstellingen verscheidene effecten /

prestaties gekoppeld. Als voor de afzonderlijke effecten/prestaties bekend

is welke middelen zijn ingezet, dan kan in zo’n geval voor elk effect /

prestatie eveneens een enkelvoudig kengetal worden opgesteld.

Problemen en mogelijke oplossingen

Als de middelen niet kunnen worden toegerekend aan de verschillende

effecten/prestaties kunnen tijdschrijfgegevens uitkomst bieden – zij het

dat dit wel een arbeidsintensieve onderneming is. Tijdschrijfgegevens

geven inzicht in het aantal uren dat besteed is aan de verschillende

effecten/prestaties door de bij het beleid betrokken personen. Door deze

uren te koppelen aan het salaris van deze personen, verkrijg je een

benadering van de kosten per effect/prestatie. In dit geval blijven de

niet-personele kosten overigens wel buiten beschouwing. Een kunstgreep

om ook deze niet-personele kosten mee te nemen is deze toe te rekenen

aan de verschillende effecten/prestaties via verdeelsleutels.

Als er geen tijdschrijfgegevens beschikbaar zijn, moeten andere

kunstgrepen worden toegepast om kengetallen te maken, zoals:

• het direct toerekenen van middelen aan de verschillende

effecten/prestaties via verdeelsleutels;

• het wegen van de effecten/prestaties tot een samengesteld

effect/prestatie. Door dit samengestelde getal vervolgens te relateren aan

de middelen ontstaat een kengetal dat gebruikt kan worden om de

doelmatigheid te bepalen. Je spreekt dan van een samengesteld kengetal.

Vergeet de kwaliteit niet

Idealiter zou in het kengetal ook de kwaliteit van de geleverde prestaties of

de gerealiseerde effecten moeten zijn opgenomen. In de praktijk zal dat vaak

niet kunnen. Een goed alternatief is dan het opstellen van een indicator voor

de kosten per prestatie/effect én een indicator voor de kwaliteit.

Handleiding DDO

108 8.6.1.3 Hoe conclusies trekken uit kengetallen?

Verdeelsleutels of weging

Als je gebruikmaakt van verdeelsleutels of weging, weet je niet met

zekerheid wat de juiste verdeelsleutel of weging is; een verdeelsleutel of

wegingsfactor is immers vaak arbitrair gekozen. Je loopt met deze

kunstgrepen het risico dat je ongewild doelmatigheidsverschillen

wegpoetst of opblaast. Bijvoorbeeld doordat je middelen aan een

effect/prestatie toerekent die hierop geen betrekking hebben, waardoor

dit effect/prestatie te duur wordt ‘geprijsd’ en dus ten onrechte als

minder doelmatig uit de bus komt.

Ook als je op basis van wegingsfactoren een samengesteld kengetal hebt

gemaakt (de verscheidene effecten/prestaties gewogen hebt tot één

effect/prestatie) is voorzichtigheid geboden. Je weet dan niet door welk deel

van het beleidsproces de score op het kengetal te verklaren is. Mogelijkheden

tot het vinden van verbetering van de doelmatigheid zijn dan (wel erg)

moeilijk, omdat immers niet bekend is hoe elk deelproces bijdraagt aan de

(on)doelmatigheid van het gehele beleidsproces.

Wisselwerking tussen deelprocessen

Wanneer er verscheidene effecten/prestaties zijn en je voor elke afzonderlijke

effect/prestatie een doelmatigheidskengetal hebt, dan nog zijn er valkuilen.

Weliswaar kan deze verzameling kengetallen inzicht geven in de verschillende

delen van het ‘productieproces’, maar inzicht in de samenhang van die

deelprocessen heb je daarmee niet. Je ziet bijvoorbeeld bij vergelijking in de

tijd wel wat de ontwikkeling is van de kosten van elke afzonderlijke prestatie,

maar je weet niet zeker of het beleidsonderdeel of -proces waarmee de

prestatie in kwestie wordt geleverd op zichzelf staat. Als de deelprocessen

waarmee elk effect respectievelijk elke prestatie wordt gerealiseerd niet

volledig los van elkaar staan, is voorzichtigheid geboden omdat het risico

bestaat dat verbeteringen voor de ene prestatie dan wel het ene effect ten

koste gaat van de doelmatigheid van een andere prestatie of een ander effect.

Elkaar beïnvloedende deelprocessen

Universiteiten leveren als prestaties: onderzoek(srapporten) en onderwijs. Niet altijd is

bekend hoeveel geld wordt besteed aan het voortbrengen van de afzonderlijke prestaties.

Bovendien draagt onderzoek bij aan de inhoud en kwaliteit van het onderwijs. Hoe

construeer je dan kengetallen over middelen per prestatie? Je kunt de kunstgreep van

verdeelsleutels/weging toepassen en bijvoorbeeld de kosten pondspondsgewijs toerekenen

aan respectievelijk onderwijs en onderzoek. Stel dat deze verdeelsleutels een juiste

benadering geven van de werkelijkheid en de volgende ontwikkelingen hebben

plaatsgevonden:

Handleiding DDO

109

1998 1999 2000 2001 2002

Kosten per onderwijseenheid 1000 1200 1400 1500 1600

Kosten per onderzoekseenheid

(in euro’s prijspeil 1-1-2002)

4950 5250 5400 5500 5600

Kwaliteit onderwijs 5 6 7 8 9

Kwaliteit onderzoek

(visitatiescore schaal 1-10)

4 6 7 8 9

Uit de tijdreeks is af te leiden dat zowel de kosten per onderwijs- als per

onderzoekseenheid in de periode 1998-2002 toenemen. De kwaliteit, in dit geval gemeten

met de score die jaarlijks door een visitatiecommissie wordt gegeven, neemt in deze

periode eveneens toe. Met deze verzameling van kengetallen krijg je dus inzicht in de

verschillende delen van het ‘productieproces’.

De verschillende delen zijn echter niet onafhankelijk van elkaar, want zoals gezegd draagt

onderzoek bij aan de inhoud en kwaliteit van onderwijs. Stel nu dat zowel de stijging van

de kosten per onderzoekseenheid als de kwaliteit van het onderwijs geheel wordt

veroorzaakt door de toename in de kwaliteit van het onderzoek. De doelmatigheid van

onderzoek blijft dan gelijk, maar de stijging van de kosten per onderwijseenheid duidt op

een verslechtering van de doelmatigheid. De mogelijkheden tot verbetering liggen in dit

geval dus bij het onderwijs.

Stel dat je niet wist dat onderzoek van invloed was op onderwijs, dan had je misschien wel

geconcludeerd dat de doelmatigheid van zowel onderzoek als onderwijs gelijk is gebleven in

de periode 1998-2002. Je moet dus veel van de onderliggende processen weten voordat je

een juiste conclusie en goede suggesties voor verbetering kunt geven.

Strijdige kengetallen

Bij de interpretatie van een verzameling van kengetallen is veel ruimte voor

verschillende conclusies. Daarnaast kunnen verschillende kengetallen

tegenstrijdige signalen afgeven. Ga dan zorgvuldig te werk bij het trekken van

conclusies. Alleen als de ontwikkeling van de ‘doelmatigheid’ van alle ken-

getallen dezelfde kant op wijst, zijn eenduidige conclusies te trekken.

Bijvoorbeeld bij een kengetal voor de kosten per effect/prestatie én een

indicator voor de kwaliteit is alleen indien beide indicatoren dezelfde richting

op wijzen (beide een positieve dan wel negatieve ontwikkeling laten zien)

direct een eenduidige uitspraak over de ontwikkeling van de doelmatigheid

mogelijk.

Een pragmatische oplossing bij tegengestelde ontwikkelingen, hoewel second

best, is weging van de verschillende ontwikkelingen. Hierbij bepaal je hoe

zwaar de ene ontwikkeling weegt ten opzichte van de anderen (bijvoorbeeld

een toename in de kosten per prestatie met 2% weegt even zwaar als een

afname in kwaliteit met 1%) (zie eerder voor de risico’s van wegen).

Handleiding DDO

110 Het wegen van tegengestelde ontwikkelingen

In het hiervoor gegeven voorbeeld over de universiteiten zijn voor onderzoek de

ontwikkelingen gewogen. De kosten per onderzoekseenheid nemen toe in de periode 1998-

2002 met respectievelijk ongeveer 6, 3, 3 en 3%. De kwaliteit neemt in diezelfde periode

ook toe met respectievelijk 2, 1, 1 en 1. Een toename van de kwaliteit van 1 wordt gelijk

gesteld aan een toename met ongeveer 3% in de kosten. Hiermee blijft de doelmatigheid

van onderzoek in deze periode gelijk.

Hoe het niet moet

Een goed voorbeeld van de gevaren van het niet goed gebruiken van

kengetallen is het doelmatigheidsonderzoek dat Bakkenist Management

Consultants deed naar de thuiszorg. Het betrof een onderzoek onder

zeven instellingen, dat werd uitgevoerd met behulp van kengetallen.77

In onderstaande tabel78 zijn enkele uitkomsten opgenomen.

1 2 3 4 5 6 7

Zorguren wijkverpleging per fte uitvoering wijkverpleging 966 1075 960 nb 726 865 954

Zorguren gezinsverzorging per fte uitvoering gezinsverzorging 1421 1401 1434 nb 1490 1449 1477

Zorguren per f 10.000 budget 261 212 202 225 225 213 237

Aandeel uitvoerend personeel (%) 93 88 92 91 89 91 91

Waarvan productief (%) 80 75 71 81 76 77 78

Leiding per 100 fte verzorgend personeel 0,92 1,06 0,67 0,85 0,39 0,91 0,56

Financieel ec.-personeel per 100 fte verzorgend personeel 1,47 2,66 2,67 2,37 2,50 2,92 2,91

Automatiseringspersoneel per 100 fte verzorgend personeel 0,76 0,97 0,84 0,52 0,76 0,65 0,71

Facilitair personeel per 100 fte verzorgend personeel 1,34 3,61 3,52 2,67 2,07 3,19 1,99

Ziekteverzuim (%) 11 7 11 12 11 9 11

Aandeel variabel personeel (%) 15 2 3 19 15 4 8

Parttime factor (%) 46 57 48 44 58 42 61

Van ieder verhoudingsgetal uit de tabel hebben de onderzoekers een

best-practice afgeleid, het cursief en grijs gedrukte getal in elke rij.

De verzameling ‘best-practice’-kengetallen noemen de onderzoekers

een virtuele instelling die voor alle instellingen als lichtend

voorbeeld zou kunnen dienen. Ze gaan er daarbij voor het gemak

even van uit dat de processen die ten grondslag liggen aan de

verschillende kengetallen allemaal los van elkaar staan. Of dat zo is,

is niet onderzocht. Het is bijvoorbeeld maar de vraag of instelling 4

77 Zie voor een kritische bespreking van het onderzoek: Benchmarken of de kunst van het

vergelijken (Blank, 1998). 78 De eerste drie regels van de tabel geven globale informatie over de doelmatigheid (prestaties

zijn het aantal zorguren, de middelen zijn (second best) uitgedrukt in het aantal fte). De rest van

de tabel geeft geen betekenisvolle informatie over doelmatigheid, maar zou verklaringen kunnen

geven voor doelmatigheidsverschillen.

Handleiding DDO

111 door alle instellingen gevolgd moet worden in het aandeel variabel

personeel (nog los van de vraag of de veronderstelling juist is dat

een hoger percentage beter is voor de doelmatigheid). Instelling 4

heeft wel – toevallig of niet? – het hoogste percentage ziekte-

verzuim. De vraag waardoor de verschillen zijn te verklaren wordt in

het onderzoek niet gesteld, laat staan beantwoord.

De instellingen die op basis van de uitkomsten van dit onderzoek

blindelings hun processen gaan aanpassen, zouden wel eens van

een koude kermis thuis kunnen komen.

Hoe het ook niet moet

Een ander voorbeeld van minder gelukkig gebruik van kengetallen vormt de

analyse die Taphoorn et al. in 1998 hebben gemaakt van de doelmatigheid bij

de Dienst Justitiële Inrichtingen (DJI) in de jaren 1994-1996. De auteurs ont-

wikkelden vijf (financiële) indicatoren om de doelmatigheidsontwikkeling in

het gevangeniswezen te kunnen meten:

- de kostprijs per dag;

- het begrotingsresultaat: winst of verlies;

- de bezettingsgraad: gemiddelde bezetting/gemiddelde bruikbare

capaciteit;

- personeelsratio: aantal personeelsleden in verhouding tot aantal

gedetineerden;

- overheadratio: indirecte uitgaven in verhouding tot totale uitgaven.

Indicatoren 1994 1995 1996

Kostprijs per dag (1994=100) 100 93 91

Begrotingsresultaat (x f 1 miljoen) - 14,3 - 8,5 1

Bezettingsgraad 100,5 100,5 88

Personeelsratio (%) 96 92 98,6

Overheadratio (%) niet bekend 8,2 9,4

Tevens is naar de ontwikkeling van de kwaliteit gekeken. Deze is gemeten als

het aantal klachten per honderd bezette cellen. Het blijkt dat het aantal

klachten voor alle typen inrichtingen binnen het gevangeniswezen is

gestabiliseerd dan wel is afgenomen in de onderzochte periode.

De onderzoekers concluderen dat de vijf indicatoren per saldo wijzen in de

richting van een zekere doelmatigheidsverbetering in de jaren 1995 en 1996.

Over de omvang kunnen ze geen conclusies trekken. Wel geven ze

verklaringen: de agentschapstatus (verruiming van de

reserveringsmogelijkheden, het vrij kunnen schuiven tussen materieel en

personeel, meer mogelijkheden op huisvestingsgebied) en de

capaciteitsuitbreidingen (kostenbesparingen bij ontwerp en bouw,

Handleiding DDO

112 schaalvergroting) zouden de oorzaak zijn voor de verbetering van de

doelmatigheid.

Ook dit voorbeeld brengt een aantal risico’s van het gebruik van kengetallen

in beeld.79 De verschillende kengetallen laten tegenstrijdige ontwikkelingen

zien. Toch trekt men als eindconclusie dat de doelmatigheid is verbeterd.

De onderliggende ontwikkelingen geven evenwel af en toe een ander beeld.

Ook is het belang van de verschillende kengetallen onbekend. Is het goed of

slecht dat de bezettingsgraad en de personeelsratio afnemen en de

overheadratio toeneemt? Of alle kengetallen relevant zijn is ook de vraag.

Verder is niet zonder meer duidelijk waardoor het begrotingsresultaat

positiever is geworden. Dit zou bijvoorbeeld te maken kunnen hebben met

toegenomen inkomsten van het Rijk.

Eigenlijk is alleen de kostprijs per gevangene per dag een indicator op basis

waarvan de ontwikkeling in de doelmatigheid zou kunnen worden bepaald,

mits aan de voorwaarden in § 8.5 is voldaan. De andere gegevens zouden

potentiële verklaringen kunnen zijn voor verschillen in doelmatigheid.

De conclusies over de verklaringen worden dus wel erg gemakkelijk

getrokken. Het is maar de vraag of zonder meer geroepen kan worden dat

agentschapvorming en capaciteitsuitbreiding de belangrijkste oorzaken zijn

voor de ontwikkelingen. Het zijn eerder hypothesen, die vervolgens moeten

worden getoetst.

8.6.2 FDH, DEA en SFA

Globale werking van de technieken

Bij Free Disposable Hull (FDH), Data Envelopment Analysis (DEA) en

Stochastic Frontier Analysis (SFA) wordt de doelmatigheid bepaald door

een vergelijking met de beste verhouding tussen de middelen en de

beleidsprestaties die in de praktijk voorkomt. Alle drie de technieken

berekenen voor elke organisatie de verhouding tussen de ingezette

middelen en de geleverde prestaties, bepalen welke organisaties

onderling vergelijkbaar zijn en welke binnen elke groep van vergelijkbare

organisaties dan ‘de beste uit de klas’ is. Dat wil zeggen: de organisatie80

die gegeven de hoeveelheid beleidsprestaties de minste middelen

gebruikt of gegeven de gebruikte middelen de meeste beleidsprestaties

levert. De doelmatigheid wordt ten slotte bepaald door van alle

organisaties die niet de beste uit hun groep zijn de verhouding af te

79 Een methode als DEA zou in dit en voorgaand voorbeeld van verscheidene prestaties en

middelen een beter instrument zijn om de doelmatigheid te bepalen. Zie verder § 8.6.2 en Blank

(2003). 80 Met het oog op de leesbaarheid wordt hier steeds gesproken over organisaties, maar het kan ook

zijn dat een organisatie in de tijd wordt vergeleken of verscheidene organisaties over verscheidene

perioden.

Handleiding DDO

113 zetten tegen de beste. De besten dienen dus als referentie, zij vormen bij

elkaar de ‘beste praktijk’. Ze geven de beste combinaties weer tussen de

beleidsprestaties en de middelen die in de praktijk haalbaar zijn. Het zijn

de doelmatige organisaties. De maat voor (on)doelmatigheid wordt

vervolgens bepaald door de afstand van elke organisatie tot de

(vergelijkbare) referentiewaarde (hoe scoort een bepaalde organisatie in

vergelijking met de meest doelmatige vergelijkbare organisatie?). De

mate van doelmatigheid wordt daarmee weergegeven in een

doelmatigheidsscore. De doelmatigheidsscore van doelmatige organisaties

is 100% (of 1), die van ondoelmatige organisaties is lager dan 100% (of

1). Hoe lager de score, hoe ondoelmatiger een organisatie is en hoe meer

deze dus (in principe) haar doelmatigheid kan verbeteren.

8.6.2.1 Free Disposable Hull

Bij Free Disposable Hull (FDH) wordt voor elke bestaande organisatie de

doelmatigheidsscore bepaald door een vergelijking met de beste praktijk.

Er wordt alleen maar vergeleken met bestaande organisaties. Voor elke

organisatie wordt gezocht of er bestaande organisaties zijn die met

minder middelen dezelfde beleidsprestaties realiseren.81

FDH verschilt op dit punt van DEA en SFA, bij welke de vergelijking ook

kan plaatsvinden met virtuele organisaties (zie § 8.6.2.2 en 8.6.2.3).

De toepassing van FDH is relatief eenvoudig. Er zijn diverse

gebruiksvriendelijke standaardsoftwarepakketten voor beschikbaar. 82

Hieronder bespreken we een voorbeeld van de toepassing van FDH. De

techniek is toegepast in een onderzoek dat de Algemene Rekenkamer

tussen 1998 en 2000 heeft gedaan naar de doelmatigheid van

arbeidsbureaus (nu ‘centra voor werk en inkomen’ oftewel CWI’s).83

Arbeidsbureaus

De Algemene Rekenkamer heeft voor elk van de 62 in het onderzoek

betrokken arbeidsbureaus bepaald hoeveel de middelen kunnen worden

verlaagd terwijl toch ten minste dezelfde hoeveelheid prestaties kan

worden geleverd. De variabele kosten vormen de middelen. De vaste

kosten, zoals huur-, afschrijvings- en rentekosten van de gebouwen zijn

niet meegenomen.84

81 Dit is een inputoriëntatie, maar uiteraard is ook een outputoriëntatie mogelijk.

82 De Algemene Rekenkamer heeft op het ogenblik (begin 2005) geen software voor FDH. Als een

onderzoek start waarvoor dit nodig is, kan voor de tijd van dat onderzoek een licentie gekocht

worden. 83 Algemene Rekenkamer (2001). Zie ook Israël, Matheeuwsen, Roelofs en Roijackers (2001). 84 Dit zijn op korte termijn moeilijk te beïnvloeden kosten en het meenemen ervan zou tot

verkeerde conclusies kunnen leiden. Als er twee arbeidsbureaus zijn die als enig verschil hebben

dat de ene twee keer zo hoge huisvestingskosten heeft, dan zou het meenemen van deze kosten in

Handleiding DDO

114 De onderscheiden prestaties zijn het aantal plaatsingen van werkzoekenden

op vacatures (aantal werkzoekenden dat aan een baan is geholpen)

uitgesplitst naar de afstand van de werkzoekende tot de arbeidsmarkt (fase 1,

fase 2 en fase 3). Fase-1-werkzoekenden zijn personen met de meeste

kansen op de arbeidsmarkt (kleinste afstand tot de arbeidsmarkt), enzovoort.

Door deze uitsplitsing wordt rekening gehouden met de verschillen in kwaliteit

van de prestaties (zie § 8.5).

De doelmatigheidsscore van de doelmatige arbeidsbureaus is 100%, die van

de ondoelmatige is lager dan 100%. Een doelmatigheidsscore van 90%

betekent dat dit arbeidsbureau zijn kosten met 10% kan verlagen en toch ten

minste dezelfde hoeveelheid werkzoekenden, uitgesplitst naar afstand van de

arbeidsmarkt, aan een baan kan helpen.

In bovenstaande figuur worden de resultaten voor 1998 weergegeven.

Van de 62 arbeidsbureaus zijn er 32 met een score van 100%. Dit

betekent dat voor deze arbeidsbureaus geen vergelijkbare betere

arbeidsbureaus gevonden zijn. Tien van deze doelmatige arbeidsbureaus

treden op als referentiewaarde voor ondoelmatige arbeidsbureaus. Deze

tien zijn arbeidsbureaus die vergeleken met vergelijkbare arbeidsbureaus

de minste kosten hebben en ten minste even veel (vergelijkbare)

prestaties leveren. Ze zijn in de figuur weergegeven met een score van

100%. De doelmatigheidsscore wordt bepaald door de ondoelmatige

arbeidsbureaus te vergelijken met hun referentiewaarde. Zo ontstaan tien

groepen van vergelijkbare arbeidsbureaus (de tien ‘kolommen’ in de

figuur). De scores van de ondoelmatige arbeidsbureaus lopen uiteen van

70 tot en met 99%.

een doelmatigheidsberekening leiden tot de conclusie dat het ene arbeidsbureau ondoelmatiger is

dan het andere. Voor een dergelijke conclusie is geen onderzoek naar doelmatigheid nodig en vaak

zal een arbeidsbureau maar een geringe keuze hebben in de locatie vanwege het voorgeschreven

voorzieningsgebied. (Zie voor benodigde gegevens § 8.5 ).

70

75

80

85

90

95

100

1 2 3 4 5 6 7 8 9 10

Groepen arbeidsbureaus met zelfde referentiewaarde

Doe

lmat

ighe

idss

core

(%

)

Handleiding DDO

115 Uit de figuur blijkt dat er erg grote verschillen zijn tussen de

doelmatigheidsscores van de vergelijkbare arbeidsbureaus.

Ter illustratie zijn in de volgende tabel voor 1998 voor een groep

arbeidsbureaus (groep 5 uit de figuur) de verschillen in kosten in beeld

gebracht.

Plaatsingen zijn gegeven in aantallen, de kosten in miljoenen euro’s.

Arbeidsbureau Plaatsingen

fase 1+

Plaatsingen

fase 2

Plaatsingen

fase 3

Kosten Doelmatigheidsscore

Referentie 1.125 407 306 2,4 100%

Arbeidsbureau 1 924 267 302 2,6 91%

Arbeidsbureau 2 778 404 306 4,0 85%

Arbeidsbureau 3 700 344 265 5,9 70%

Bron: Algemene Rekenkamer

Uit de tabel kun je onder meer aflezen dat de referentiewaarde in alle

categorieën de meeste plaatsingen heeft, terwijl de kosten het laagste zijn.

Arbeidsbureau 1 kan bijvoorbeeld zijn prestaties verhogen en bovendien zijn

kosten verlagen tot het niveau van het referentie-arbeidsbureau.

8.6.2.2 Data Envelopment Analysis

Bij DEA wordt een doelmatigheidsgrenslijn gevormd die de beste

combinaties weergeeft tussen beleidsprestaties en middelen die in de

praktijk haalbaar zijn. In onderstaande figuur wordt dit met een simpel

voorbeeld geïllustreerd.

De punten zijn de verschillende organisaties met in dit geval het ene

middel dat ze inzetten en de ene beleidsprestatie die ze daarmee

voortbrengen. De lijn geeft de grenslijn die bepaald is met DEA. De figuur

wordt toegelicht uitgaande van een outputoriëntatie (met een bepaalde

hoeveelheid middelen zoveel mogelijk beleidsprestaties leveren).85

De organisaties A tot en met D leveren relatief de meeste beleidsprestaties in

vergelijking met de daarvoor benodigde middelen. Deze bestaande best

presterende organisaties liggen op de grenslijn. Op de lijnstukken tussen deze

organisaties liggen virtuele organisaties die even goed presteren als de

bestaande.

85 Met variabele schaalopbrengsten. Dit betekent dat de beleidsprestaties minder/meer dan

proportioneel kunnen toenemen met een verandering in alle middelen (zie voor een verdere

toelichting § 8.6.2.4).

Handleiding DDO

116

Middel

Figuur 8.1 DEA : een simpel grafisch voorbeeld.

Bij DEA kan de vergelijking dus plaatsvinden met zowel bestaande als

virtuele organisaties. Zie de volgende paragraafvoor een verdere

toelichting.

DEA is een relatief eenvoudige mathematische methode waarvoor

verschillende standaardsoftwarepakketten beschikbaar zijn die op een

relatief eenvoudige wijze de doelmatigheid bepalen.86 Voorbeelden van

pakketten zijn: DEAP en DEA-solver.87 DEA is een veelgebruikte methode.

Er zijn inmiddels duizenden artikelen en rapporten gepubliceerd waarin

deze methode is toegepast.88

Hieronder bespreken we een voorbeeld van de toepassing van DEA. De

techniek is toegepast in een onderzoek dat het Rijksinstituut voor

Volksgezondheid en Milieu (RIVM) in 2001 publiceerde over de

doelmatigheid en kwaliteit van de ambulancezorg.89

Ambulancezorg

Het RIVM heeft met DEA de doelmatigheid van de ambulancezorg

onderzocht. De kosten zijn ingevuld door de totale exploitatiekosten. Er

worden vier prestaties onderscheiden:

• aantal ritten waarbij de ambulance zich met de grootste spoed naar

de patiënt moet begeven (A1-ritten);

86 Zie ook bijvoorbeeld Blank (2003) en Eggink en Blank (2001). 87 Zie Coelli (1996) voor een toelichting op DEAP en Cooper (2000) voor een toelichting op DEA-

solver. Zie voor meer pakketten onder andere Blank (2003). De Algemene Rekenkamer heeft op

het ogenblik (begin 2005) geen software voor DEA. Als een onderzoek start waarvoor dit nodig is,

kan voor de tijd van dat onderzoek een licentie gekocht worden. 88 Blank (2003). 89 Van der Veen, Zwakhals, Hazelnet-Crans en Van Manen (2001). Een vergelijkbaar voorbeeld is te

vinden in: Finansministeriet (2001). Budgetredegørelse 2000/2001 (Budget Review 2000/2001).

Albertslund, Schultz Information. Het betreft hier een onderzoek van de Deense regering naar de

doelmatigheid van districtsrechtbanken, waarbij gebruikgemaakt is van DEA.

Beleidsprestatie

A

B

C

D DEA

Handleiding DDO

117 • aantal ritten waarbij de ambulance onmiddellijk moet uitrukken met

de intentie zo spoedig mogelijk ter plaatse te zijn (A2-ritten);

• aantal tevoren geplande ritten (B-ritten);

• beschikbaarheid: naar ritten gewogen gemiddelde van de

beschikbaarheidindexen per standplaats.

In de DEA-analyse zijn 73 ambulancediensten meegenomen van de 80 die

er in Nederland zijn (91%). De gemiddelde doelmatigheid van deze 73

ambulancediensten bedraagt 87%.90 Onderstaande tabel geeft de scores

van de diensten naar grootteklasse van de ambulancediensten. Twintig

van de ambulancediensten hebben een doelmatigheid van 100%. Deze

diensten vormen de referentiediensten waartegen de prestaties van de

overige organisaties zijn afgezet. De laagste doelmatigheidsscore

bedraagt 57%. Verder blijkt uit de tabel dat de doelmatigheid gemiddeld

toeneemt naarmate de ambulancedienst groter is.

Grootteklasse Aantal

diensten

Gemiddelde

doelmatigheidsscore

Aantal diensten met

score 100

1: < 2.000

2: 2.000 – 5.000

3: 5.000 – 10.000

4: 10.000 – 20.000

5: > 20.000

Totaal

11

16

19

17

10

73

81

87

83

90

95

87

4

4

2

5

5

20

De volgende figuur geeft de scores van de diensten naar klasse van

doelmatigheidsscore. Uit de figuur blijkt dat het aantal diensten in de klassen

80-84 tot en met 95-99 ongeveer gelijk verdeeld is. Opvallend is het aantal

diensten dat minder dan 60% scoort: vier diensten, oftewel 5% van het totaal

aantal. Dit zijn voor dit soort doelmatigheidsonderzoek erg (ongebruikelijk)

lage scores.

90 Hierbij is uiteraard nog geen rekening gehouden met verklarende factoren die van invloed zijn op

de doelmatigheid zoals omgevingsfactoren of institutionele factoren.

Handleiding DDO

118

8.6.2.3 Stochastic Frontier Analysis

Bij SFA wordt net als bij DEA een doelmatigheidsgrenslijn gevormd, zodat

de vergelijking kan plaatsvinden met zowel bestaande als virtuele

organisaties.

DEA en SFA verschillen van elkaar in de wijze waarop de

doelmatigheidsgrenslijn wordt bepaald. Bij SFA wordt deze grenslijn

namelijk bepaald door een wiskundige functie. Je moet hiervoor van

tevoren aannames maken over de relatie tussen de middelen en de

beleidsprestaties (het wiskundige model). Vaak is niet precies duidelijk

hoe deze relatie in elkaar zit. Het is daarom verstandig om eerst wat te

spelen met simpele regressies, die een gevoel geven over hoe deze

relatie in elkaar zou kunnen zitten.

In de literatuur worden verschillende (modelmatige) relaties genoemd

tussen beleidsprestaties en middelen. Wij noemen hier in dit verband de

productiefunctie (outputoriëntatie) en de kostenfunctie (inputoriëntatie).91

De toepassing van SFA is niet eenvoudig en vereist een zekere kennis van

econometrische methoden die worden gebruikt om de wiskundige functie

te bepalen (schatten).92 Ook voor SFA zijn standaardsoftwarepakketten

voorhanden. Een voorbeeld is Frontier Version 4.1.93

91 Andere relaties zijn onder meer output-afstandsfuncties en input-afstandsfuncties. Bij een

productiefunctie worden de hoeveelheid prestaties verklaard uit onder andere de hoeveelheid

ingezette middelen. Bij een kostenfunctie worden juist de kosten verklaard uit onder andere de

hoeveelheid geleverde prestaties. Zie bijvoorbeeld Coelli et al. (1998) en Blank (2000). 92 Zie ook bijvoorbeeld Eggink en Blank (2001). 93 Coelli (1996) en New South Wales Treasury (2001).

43

1

5 5

10

89

8

20

0

5

10

15

20

25

1 2 3 4 5 6 7 8 9 10

Klasse van doelmatigheidsscore

Aan

tal a

mbu

lanc

edie

nste

n

43

1

5 5

10

89

8

20

0

5

10

15

20

25

50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95-99


Aan

tal a

mbu

lanc

edie

nste

n

43

1

5 5

10

89

8

20

0

5

10

15

20

25

55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95-99 100


Aan

tal a

mbu

lanc

edie

nste

n

Handleiding DDO

119 In figuur 8.2 worden DEA en SFA met een simpel voorbeeld geïllustreerd.

De figuur is figuur 8.1 met de grenslijn voor DEA, aangevuld met de

grenslijn die is bepaald met SFA.

D

C DEA

B

A

Figuur 8.2 DEA en SFA; een simpel grafisch voorbeeld

De organisaties A tot en met D leveren relatief de meeste

beleidsprestaties in vergelijking met de daarvoor benodigde middelen. De

DEA-grenslijn loopt dan ook door deze punten. Bij DEA wordt voor elke

organisatie een lineair programmeringsprobleem opgelost. Alle

organisaties komen na de rekenpartij op of onder de grenslijn. Als ze er

op liggen realiseren zij ten opzichte van de andere organisaties in de

populatie de meeste beleidsprestaties, als zij er onder liggen realiseren zij

bij een gegeven hoeveelheid middelen minder prestaties.

Elke afwijking van de grenslijn wordt verondersteld het gevolg te zijn van

ondoelmatigheid. Er wordt, met andere woorden, geen rekening

gehouden met de invloed van statistische ‘ruis’, zoals

onvolkomenheden/meetfouten/onzuiverheden in de gebruikte gegevens.

Bij een grenslijn die bepaald is door middel van SFA wordt hiermee wel

rekening gehouden. Er kunnen dan dus ook waarnemingen boven de

grenslijn liggen. Met SFA kan onderscheid worden gemaakt tussen

ondoelmatigheid enerzijds en ruis anderzijds.

Hieronder bespreken we een voorbeeld van de toepassing van SFA. De

techniek is toegepast in een onderzoek naar de intramurale zorg voor

verstandelijk gehandicapten dat het Sociaal en Cultureel Planbureau

(SCP) in 2001 publiceerde.

Prestatie

SFA

Handleiding DDO

120 Intramurale zorg verstandelijk gehandicapten

Met SFA (kostenfunctie) heeft het SCP de doelmatigheid van de

intramurale zorg voor verstandelijk gehandicapten onderzocht. DEA is

eveneens toegepast. In dit voorbeeld beperken we ons tot de algemene

instellingen. Waarnemingen van meer dan honderd algemene instellingen

over de periode 1984-1998 vormen de basis van de analyses (vergelijking

in de tijd en tussen organisaties). De kosten zijn ingevuld door de

variabele kosten. De onderscheiden prestaties zijn het aantal

verpleegdagen uitgesplitst naar drie niveaus van functioneren (licht,

matig/ernstig en zeer ernstig gehandicapt).

De gemiddelde doelmatigheid voor de algemene instellingen bedraagt in

1998 86 à 89%. Algemene instellingen kunnen (in theorie) hun prestaties

dus met gemiddeld ruim 10% minder kosten voortbrengen.

Onderstaande figuren geven per doelmatigheidsscore (die ligt tussen 0 en

1) het percentage instellingen met de desbetreffende

doelmatigheidsscore. De eerste figuur zijn de scores die zijn bepaald met

SFA. De tweede figuur geeft de scores die bepaald zijn met DEA. Beide

methoden leiden tot vergelijkbare conclusies. Dit betekent dus dat

robuuste conclusies kunnen worden getrokken.

SFA

0

5

10

15

20

25

30

0,6

0,65 0,

70,

75 0,8

0,85 0,

9

Doelmatigheidsscore

Fre

quen

tie (

in %

)

SFA

0

5

10

15

20

25

30

0,6

0,65 0,7

0,75 0,8

0,85 0,9

Doelmatigheidsscore

Fre

quen

tie (

in %

)

Handleiding DDO

121

De algemene conclusie van het SCP luidt dat de verschillen tussen de

doelmatige instellingen voor verstandelijk gehandicapten en de rest (de

niet doelmatige) klein zijn. De mogelijkheden om via beleidsingrepen of

verbetering van het bedrijfsproces middelen vrij te maken voor het

oplossen van knelpunten zijn daardoor vooralsnog beperkt. Wel kunnen

de instellingen de doelmatigheid (licht) verbeteren door onder andere de

mix van ingezette middelen aan te passen.

Voor een gedetailleerde beschrijving van onder meer de technieken FDH,

DEA en SFA wordt verwezen naar onder andere Fried et al. (1993), Coelli

(1998), Blank (2000), Cooper et al. (2000), Scheel (2000) en New South

Wales Treasury (2001).

8.6.2.4 Welke techniek kiezen?

Om zowel kengetallen als FDH, DEA en SFA te kunnen toepassen moet

aan een aantal voorwaarden worden voldaan. Sommige voorwaarden

gelden voor alle soorten technieken, andere alleen voor een

deelverzameling ervan. Elke techniek heeft ook zijn sterke en zwakke

kanten.94 Welke techniek in een specifieke situatie het meest geschikt is

om de doelmatigheid van een organisatie te meten, hangt onder meer af

van het aantal organisaties en/of perioden dat wordt onderzocht en van

het aantal verschillende beleidsprestaties.

De verschillende keuzemomenten die hierbij globaal aan de orde zijn,

bespreken we aan de hand van onderstaand schema.

94 Zie voor een toelichting onder andere Lovell (1998), Coelli (1998), Blank (2000) en Eggink en

Blank (2001).

DEA

0

5

10

15

20

25

0,65 0,7

0,75 0,8

0,85 0,9

0,95

100

Doelmatigheidsscore

Fre

quen

tie (

in %

)

Handleiding DDO

122

* = aanvullende gegevens nodig.

1. Constante of variabele schaalopbrengsten

Een eerste element dat van invloed is op de keuze voor de geschikte

methode(n) om de doelmatigheid te berekenen is de vraag of er sprake is

van constante of variabele schaalopbrengsten.

Bij constante schaalopbrengsten leidt een verandering in de middelen tot

een proportionele verandering in de beleidsprestaties. Bijvoorbeeld als

10% meer beleidsprestaties worden geleverd (de schaal wordt vergroot)

dan nemen de kosten ook met 10% toe. Dit betekent dat onafhankelijk

van de grootte van de organisatie de gemiddelde kosten per prestatie

gelijk zijn.

Bij variabele schaalopbrengsten nemen daarentegen de beleidsprestaties

minder/meer dan proportioneel toe met een verandering in alle middelen.

Bijvoorbeeld als 10% meer beleidsprestaties worden geleverd dan nemen

de kosten met minder of meer dan 10% toe. Bij variabele schaal-

opbrengsten is een normaal beeld dat de gemiddelde kosten per prestatie

voor kleine en grote organisaties in het algemeen het hoogst zijn. De

middelgrote organisaties hebben de laagste gemiddelde kosten.95

Met uitzondering van kengetallen kan bij de verschillende technieken

rekening worden gehouden met de situatie of er sprake is van constante

dan wel variabele schaalopbrengsten.

95 Zie bijlage 7 voor een toelichting en een voorbeeld.

constante schaal-

opbrengsten

variabele schaal-

opbrengsten

Geen onvolkomen-

heden in gegevens

Onvolkomenheden in

gegevens

Geen onvolkomen-

heden in gegevens

< 20 à 50

waarnemingen

≥ 20 à 50

waarnemingen

< 20 à 50

waarnemingen

≥ 20 à 50

waarnemingen

< 20 à 50

waarnemingen

≥ 20 à 50

waarnemingen

Kengetallen

FDH, DEA

SFA

Kengetallen Geen

techniek

SFA Kengetallen* Kengetallen*

FDH, DEA

SFA

Handleiding DDO

123 Daarentegen veronderstellen doelmatigheidskengetallen (zoals de kosten

per prestatie) impliciet constante schaalopbrengsten; de grootte van de

organisaties heeft dan dus geen invloed op de kosten per prestatie.

Toch kunnen bij variabele schaalopbrengsten onder voorwaarden wel

kengetallen worden gebruikt. In vergelijking met de situatie ‘constante

schaalopbrengsten’ geldt dan de extra voorwaarde dat in de analyse ook

een set van kengetallen voor verschillende groottes van de organisaties

(bijvoorbeeld kleine, middelgrote en grote organisaties) worden mee-

genomen. Zie voor een voorbeeld § 8.6.3.2.

2. Onvolkomenheden in de gegevens of niet

Een tweede element dat van invloed is op de keuze is de vraag of de

gegevens die je gebruikt om de doelmatigheid te berekenen

onvolkomenheden bevatten of niet. Een mogelijkheid om dit vast te kunnen

stellen is de analyse vooraf: analyses met kengetallen (en/of eenvoudige

regressieanalyses) die een eerste inzicht in de gegevens geven (vooraf). Op

SFA na zijn alle technieken namelijk gevoelig voor onvolkomenheden in de

gegevens. SFA daarentegen is, zoals reeds eerder vermeld, in staat

onderscheid te maken tussen verschillen in doelmatigheid en

onvolkomenheden (ruis) in de gegevens.

Thuiszorg

Voor de thuiszorg hebben Price Waterhouse Coopers en Berenschot in 1999 een DEA-

analyse uitgevoerd om de doelmatigheid te bepalen, hoewel gemeld wordt dat de gegevens

niet allemaal even betrouwbaar zijn. SFA, die meer voor de hand ligt bij twijfels over de

kwaliteit van de gegevens, wordt niet gebruikt.

3. Meer dan twintig à vijftig waarnemingen of niet

Een derde element dat van invloed is op de keuze is de vraag of je over

de benodigde gegevens beschikt (kunt beschikken) over de

beleidsprestaties en de daarvoor ingezette middelen voor twintig à vijftig

organisaties/tijdstippen of meer.96 Voor het toepassen van kengetallen

heb je in het algemeen minder waarnemingen nodig dan voor FDH, DEA

of SFA. En voor FDH en DEA heb je in het algemeen weer minder waar-

nemingen nodig dan voor SFA. Kengetallen kun je grofweg al toepassen

bij minder dan twintig à vijftig waarnemingen, FDH en DEA al rond de

twintig à vijftig, maar voor SFA heb je al snel minimaal vijftig

waarnemingen nodig.

FDH kan al met een beperkter aantal organisaties worden toegepast,

maar dan moet het wel zo zijn dat verschillende groepen van deze

96 Het aantal van 20 à 50 is slechts een indicatie. Afhankelijk van het aantal waarnemingen ten

opzichte van het aantal te onderscheiden variabelen als soorten prestaties en middelen zal moeten

worden bepaald of het aantal waarnemingen voldoende is om de technieken toe te kunnen passen.

Voldoende in de zin van om statistisch betrouwbare uitspraken te kunnen doen.

Handleiding DDO

124 organisaties vergelijkbaar zijn qua grootte. Bij deze methode vergelijk je

zoals gezegd alleen maar met bestaande organisaties. Wanneer er voor

veel van deze organisaties geen vergelijkbare organisaties zijn qua hoe-

veelheid beleidsprestaties en/of middelen dan bestempelt deze methode

deze organisaties als doelmatig. Dat wordt ook wel ‘efficiënt by default’ of

‘doelmatig bij verstek’ genoemd.

Een voordeel van DEA en SFA boven FDH is dat bij deze twee methoden

organisaties minder snel doelmatig bij verstek worden bestempeld (je

hebt ook de virtuele organisaties waarmee vergeleken kan worden). Bij

FDH zijn dan ook relatief veel organisaties doelmatig. FDH levert hiermee

relatief weinig inzicht in doelmatigheidsverschillen op (minder

onderscheidend vermogen).

Voorkeur

In alle situaties waarin kengetallen worden toegepast is voorzichtigheid

geboden. Verschillende kengetallen kunnen bijvoorbeeld leiden tot

tegenstrijdige signalen, waardoor het lastig wordt om uitspraken te doen

over de totale doelmatigheid. Kengetallen leveren relatief weinig inzicht in

doelmatigheidsverschillen op. Zie verder voor een toelichting op het

gebruik van kengetallen § 8.6.1.

In de twee situaties waarin grofweg alle technieken geschikt zijn, zijn

vaak (afhankelijk van de sterke en zwakke punten van deze technieken)

één of meer van deze technieken geschikter dan andere(n). Een aantal

sterke en zwakke punten van de verschillende technieken zijn hiervoor

reeds aan de orde gekomen. Een aantal belangrijke andere punten zijn:

• Bij verscheidene prestaties en/of middelen zijn kengetallen vaak minder

geschikt. Bij FDH, DEA en SFA kunnen, anders dan bij kengetallen,

tegelijkertijd verscheidene beleidsprestaties aan de middelen worden

gerelateerd en in hun samenhang worden onderzocht.

Bij verscheidene beleidsprestaties is bij SFA een productiefunctie een

minder geschikte methode. In een productiefunctie is het lastig(er) om

meer dan één prestatie te onderscheiden;

• Zoals gezegd moet je bij SFA voor de wiskundige functie van tevoren

aannames maken over de relatie tussen de middelen en beleidsprestaties,

terwijl vaak niet precies duidelijk is hoe deze relatie in elkaar zit. Als je

weinig of geen vertrouwen hebt in de gekozen vorm van de functie, dan

genieten – indien geschikt – kengetallen, FDH en DEA de voorkeur boven

SFA.97

97 Bij SFA heeft daarnaast de gekozen functionele vorm invloed op de hoogte van de

doelmatigheidsscore.

Handleiding DDO

125 De volgende tabel geeft een samenvattend globaal overzicht van een

aantal belangrijke sterke en zwakke kanten van de technieken:

kengetallen (KG), FDH, DEA en SFA.

KG SFA DEA SFA

Kan met techniek rekening houden met constante en variabele schaalopbrengsten - + + +

Kan verscheidene prestaties en middelen in hun samenhang onderzoeken - ++ ++ +

Minder gevoelig voor onvolkomenheden in de gegevens - - - +

Kan reeds toegepast worden bij relatief weinig waarnemingen ++ + + -

Eenvoudige techniek ++ + + -

Mate van inzicht in doelmatigheidsverschillen -- - -+ +

Methodisch verantwoorde techniek - + + ++

8.6.2.5 Meer dan één techniek gebruiken

De verschillende methoden waarmee de doelmatigheid kan worden

berekend hebben elk hun sterke en zwakke kanten. Door het gebruik van

verschillende methoden naast elkaar (kengetallen,98 FDH, DEA en SFA)

kan de robuustheid van de uitkomsten worden bepaald. Kies er minstens

twee.

Indien alle methoden dezelfde uitkomsten hebben, is de mate van

betrouwbaarheid waarmee uitspraken kunnen worden gedaan groter dan

wanneer de uitkomsten elkaar tegenspreken.

Een hoge mate van robuustheid is noodzakelijk om aanbevelingen te

kunnen doen.99 Het is dan ook verstandig om zo mogelijk altijd een aantal

verschillende methoden toe te passen om de doelmatigheid te berekenen

en de resultaten te vergelijken.

8.6.3 Verklaren van doelmatigheidsverschillen

Als je de factoren kunt aanwijzen die verschillen in doelmatigheid

verklaren, kun je je/een organisatie concreet adviseren over de

mogelijkheden om haar doelmatigheid te verbeteren. Je wilt dus op zoek

naar verklaringen. Daarbij wordt in de praktijk gebruikgemaakt van zowel

statistische als niet-statistische technieken.

8.6.3.1 Statistische technieken

Wanneer je met behulp van kengetallen de doelmatigheid van de effecten

of prestaties hebt bepaald, kun je als tweede stap de mogelijke

verklaringen daarvoor toetsen. Hiervoor kun je een techniek als tobit- en

98 Overigens kunnen om inzicht te krijgen ook eenvoudige regressieanalyse worden gebruikt. 99 Zie bijvoorbeeld Israël, Matheeuwsen, Roelofs en Roijackers (2001) en Eggink en Blank (2001).

Handleiding DDO

126 probitanalyse of eenvoudige regressieanalyse toepassen.100 Er moeten

dan wel voldoende waarnemingen zijn. Ook SFA, DEA en FDH kunnen

hiervoor worden gebruikt. FDH is echter in beperkte mate geschikt. Als de

doelmatigheid wordt berekend met SFA, DEA of FDH kunnen de

verklaringen voor de verschillen in doelmatigheid ook worden gevonden

met behulp van deze technieken zelf.

We bespreken in deze paragraaf een tweetal praktijkvoorbeelden. Het

gaat om onderzoeken waarin de doelmatigheid van de prestaties van een

organisatie is bepaald, en waarbij met statistische technieken (SFA en

DEA respectievelijk probitanalyse) is gezocht naar verklaringen voor de

gevonden doelmatigheidsverschillen. Het eerste voorbeeld betreft

ziekenhuizen, het tweede verpleeghuizen.

Ziekenhuizen

In het onderzoek Tussen bed en budget beoogt het Sociaal en

Cultureel Planbureau inzicht te geven in de doelmatigheid van

ziekenhuizen in Nederland in de periode 1985-1995 (Blank, 1998).

Voor ieder ziekenhuis is met SFA (kostenfunctie) de doelmatigheidsscore

berekend die ligt tussen 0 en 1. De resultaten zijn te vinden in de volgende

figuur.

Met behulp van de kostenfunctie zijn de verklaringen getoetst die de

verschillen in doelmatigheid kunnen verklaren. Uit deze analyse blijkt

onder andere dat de doelmatigheid:

• met 0,3% afneemt als de samenstellingsprijs van verplegend personeel

met 1% groeit (samenstellingsprijs: verhouding tussen de prijs die een

ziekenhuis betaalt en de gemiddelde prijs; de samenstellingsprijs is hoog

100 Zie voor een meer compleet overzicht en de theorie achter deze technieken bijvoorbeeld

Stevens (1992) of Tacq ( 1991).

D oelm at igheidsscor es van ziek enhuizen, 1985-1995

0

2

4

6

8

10

12

14

16

0,76

0,77

0,78

0,79 0,8

0,82

0,83

0,84

0,85

0,86

0,88

0,89 0,9

0,91

0,92

0,94

0,95

0,96

0,97

0,98

doelmati gheid

aand

eel z

ieke

nhui

zen

(%)

Handleiding DDO

127 als het ziekenhuis relatief goed opgeleid en ervaren personeel in dienst

heeft);

• met respectievelijk 0,17 en 0,13% afneemt als de samenstellingsprijs van

overig en paramedisch personeel met 1% groeit;

• met 0,1% afneemt als het aandeel paramedisch personeel met 1%

groeit;

• met 0,04% afneemt als het ziekteverzuim met 1% groeit.

Andere verklarende factoren die in de analyse zijn meegenomen,

bijvoorbeeld de bezettingsgraad van bedden en het aandeel specialisten

in loondienst >10%, blijken niet aantoonbaar van invloed op de

doelmatigheid.

Ook DEA is toegepast voor het berekenen van de doelmatigheidsscores en

het bepalen van de aantoonbaar van invloed zijnde factoren en leidt in

grote lijnen tot dezelfde conclusies.

Verpleeghuizen

Het Sociaal en Cultureel Planbureau publiceerde in 1996 het onderzoek

Zuinig op zorg. Daarin staat de doelmatigheid van verpleeghuizen in

Nederland in de jaren 1984, 1987-1993 centraal.101

De doelmatigheidsscore is met SFA (kostenfunctie) berekend voor ieder

verpleeghuis in de verschillende jaren en ligt tussen de 0 en 100%.

De kosten worden ingevuld door de variabele kosten personeel en

materieel. De volgende prestaties worden onderscheiden:

• aantal verpleegdagen;

• aantal dagbehandelingdagen;

• zorgintensiteit (hulpbehoevendheid aanwezige patiënten en kwaliteit

dienstverlening);

• extramurale activiteiten.

De meest doelmatige verpleeghuizen hebben in dit onderzoek een score

van 100%. De gemiddelde doelmatigheidsscore van alle verpleeghuizen

over de onderzochte jaren is 93%. Dit betekent dat de verpleeghuizen

hun kosten dus met gemiddeld 7% kunnen verlagen.

Uit het onderzoek blijkt onder andere dat naarmate de verpleeghuizen

groter zijn, de doelmatigheid groter is. Met behulp van probitanalyse is

getoetst welke variabelen van invloed zijn op de vraag of een

verpleeghuis ondoelmatig of doelmatig is. Deze verklarende variabelen

zijn in drie groepen ingedeeld: productiekenmerken, markt en

institutionele vormgevingskenmerken en bedrijfs- en proceskenmerken.

Onderstaand overzicht geeft de resultaten van de probitanalyse. Een

101 Zie Blank et al. (1996) en Instituut voor Onderzoek van Overheidsuitgaven (1998).

Handleiding DDO

128 positief respectievelijk negatief teken betekent dat de betreffende

variabele bijdraagt aan een grotere respectievelijk kleinere

doelmatigheid. Een nul geeft aan dat er geen verantwoorde uitspraak

over het effect kan worden gedaan.

Schatting

Productie

- aandeel leerling-verpleegkundigen +

- kwaliteit gediplomeerde verpleegkundigen -

- kwaliteit overig personeel -

- kapitaal per bed 0

- eigen apotheek +

- hulpindex 0

Markt en institutionele vormgeving

- maat voor de concurrentie +

- algemeen niet-confessioneel 0

- protestants-christelijk -

- stichting 0

- somatisch 0

- psychogeriatrisch 0

Bedrijf en proces

- bezettingsgraad +

- ziekteverzuim -

- uitbesteed werk +

- inbesteed werk +

- afdelingsgrootte -

De onderzoekers concluderen dat er slechts in beperkte mate

aantoonbaar doelmatigheidswinst (kostenreductie) is te realiseren. De

gevonden ondoelmatigheden zijn voor een deel te herleiden tot

externe/exogene, en niet of moeilijk beheersbare of beïnvloedbare

grootheden, zoals marktomstandigheden. Bovendien concluderen de

onderzoekers dat enige schaalvergroting bij kleine organisaties zou

kunnen leiden tot een bescheiden doelmatigheidswinst, maar bij grote

verpleeghuizen juist tot doelmatigheidsverlies.

Verder blijkt onder andere dat een hogere kwaliteit van het personeel

leidt tot grotere ondoelmatigheden. Maar uit het oogpunt van kwaliteit

van de dienstverlening en uit sociale overwegingen lijken de opties om de

kwaliteit te verlagen geen realistische beleidsinstrumenten. Verder

zouden bijvoorbeeld het in- en uitbesteden van werk, een hogere

bezettingsgraad en het verkleinen van afdelingen leiden tot grotere

doelmatigheid.

Handleiding DDO

129 Ook DEA is toegepast voor het berekenen van de doelmatigheidsscores en

leidt in grote lijnen tot dezelfde conclusies.

Slotsom

Uit bovenstaande voorbeelden blijkt het nut van statistische technieken:

je kunt er concreet mee aangeven welke factoren van invloed zijn op de

doelmatigheid. Je hebt dus direct onderbouwde verklaringen bij de hand,

waarvan je gebruik kunt maken om te werken aan de verbetering van de

doelmatigheid.

De voorbeelden laten tegelijk zien dat lang niet alle ondoelmatigheid te

verklaren is en dat lang niet alle verklaringen beïnvloedbaar zijn door de

betrokken organisaties. Ook dat is een belangrijke constatering: als blijkt

dat het grootste deel van de ondoelmatigheid niet door eigen

functioneren maar door externe omstandigheden wordt veroorzaakt, biedt

dit een legitimatie om niets te veranderen.

8.6.3.2 Niet-statistische technieken

Als de informatie die tot je beschikking staat het niet mogelijk maakt een

statistische techniek toe te passen voor het vinden van verklaringen van

eventuele doelmatigheidsverschillen, kun je vaak wel gebruikmaken van

grafieken. Ook kun je deskundigen raadplegen. Ten slotte is er de

mogelijkheid om (het functioneren van) organisaties te vergelijken. We

lopen deze drie opties hieronder langs.

Grafieken

Een hulpmiddel bij het vinden van verklaringen is om elke factor die

mogelijk een verklaring is voor eventuele doelmatigheidsverschillen in

een figuur/spreidingsdiagram uit te zetten tegen het

doelmatigheidskengetal, bijvoorbeeld de kosten per effect/prestatie. Om

op basis van deze figuren conclusies te kunnen trekken, moeten er wel

voldoende waarnemingen zijn, zodat je uitspraak niet ‘op toeval’ berust.

Als je kengetallen maakt voor de vergelijking van een groter aantal

organisaties, zorg er dan voor dat je ook voor zover mogelijk en relevant

de grootte van de organisaties als mogelijke verklarende factor

meeneemt. Deze factor kan ook van invloed zijn op de doelmatigheid en

dus moet je er rekening mee houden. Zo kunnen bijvoorbeeld kleine,

middelgrote en grote organisaties een andere ‘kostenstructuur’ hebben

(grote organisaties hebben bijvoorbeeld vaak te maken met meer

bureaucratie waardoor de gemiddelde kosten hoger liggen) (zie ook

bijlage 8).

Handleiding DDO

130 Een illustratie van nuttige toepassing van grafieken ontlenen we aan

eerder genoemde onderzoek van de Algemene Rekenkamer naar

arbeidsbureaus (nu: de CWI’s).

Werkzoekenden die door wat voor omstandigheden dan ook niet

gemakkelijk werk vinden, maken in het algemeen pas kans op werk na

scholing en/of training. Verwacht wordt dat de kosten per werkzoekende

die een baan gevonden heeft hoger liggen naarmate het arbeidsbureau

wordt geconfronteerd met een zwaarder/moeilijker bestand

werkzoekenden (ceteris paribus). De arbeidsbureaus moeten dan immers

meer inspanning leveren en dus meer kosten maken om de afstand tot de

arbeidsmarkt voor de werkzoekenden te verkleinen.

Onderstaande figuren geven voor 1998 de kosten per plaatsing per

zwaarteklasse van het bestand geplaatsten (werkzoekenden die aan het

werk zijn geholpen). De zwaarteklassen van de arbeidsbureaus zijn

bepaald op basis van de samenstelling van hun werkzoekendenbestand.

Om rekening te houden met eventuele schaaleffecten – grote,

middelgrote en kleine arbeidsbureaus hebben mogelijk verschillende

kostenstructuren – zijn de kosten uitgezet tegen de grootte van het

arbeidsbureau, gemeten naar het aantal werkzoekenden (zie bijlage 8

voor een toelichting).

A: zwaarteklasse 1 (minst zware werkzoekendenbestanden)

0

1000

2000

3000

4000

5000

6000

0 10000 20000 30000 40000 Aantal werkzoekenden

Kos

ten

per

plaa

tsin

g in

eur

o’s

Handleiding DDO

131 B: zwaarteklasse 2 (werkzoekendenbestanden van gemiddelde zwaarte)

0

1000

2000

3000

4000

5000

6000


Kos

ten

per

plaa

tsin

g in

eur

o’s

C: zwaarteklasse 3 (meest zware werkzoekendenbestanden)

0

1000

2000

3000

4000

5000

6000


Kos

ten

per

plaa

tsin

g in

eur

o’s

Uit de figuren is geen eenduidige relatie tussen de kosten per geplaatste

werkzoekende en de zwaarte van het bestand af te lezen. De kosten per

geplaatste werkzoekende liggen onafhankelijk van de omvang en de

zwaarte van het bestand grofweg tussen de € 1.000 en € 3.000.

Vanzelfsprekend moet ook rekening worden gehouden met de invloed van

de arbeidsmarkt. Arbeidsbureaus in een regio waar de arbeidsmarkt veel

beter is dan elders, kunnen relatief gemakkelijk werk vinden voor de bij

dat bureau ingeschreven werkzoekenden. Ook wanneer expliciet rekening

wordt gehouden met arbeidsmarktomstandigheden, blijkt er een vrij forse

spreiding in de kosten per plaatsing te zijn.

Er blijkt dus voor de verschillende verklarende factoren geen duidelijk

verband te zijn met de kosten per plaatsing. Deze bevindingen geven dan

ook geen aanknopingspunten om de doelmatigheid te verbeteren.

Meningen van deskundigen

Een andere mogelijkheid om mogelijke verklaringen voor

doelmatigheidsverschillen te vinden is aan deskundigen de bevindingen

(over de doelmatigheidsscores; kosten per effect/prestaties) voor te

leggen en te vragen welke verklaringen hiervoor naar hun mening zouden

Handleiding DDO

132 kunnen gelden. Hoewel deze meningen vanzelfsprekend ‘educated

guesses’ zijn, zouden ze kunnen helpen om eventuele mogelijkheden voor

verbetering te vinden. Via ‘trial en error’ zouden deze mogelijkheden

vervolgens in de praktijk kunnen worden uitgeprobeerd om te zien of ze

ook daadwerkelijk tot verbetering leiden.

Deze aanpak bergt overigens wel risico’s in zich. Omdat niet zeker is of

de meningen echte verklaringen voor de gesignaleerde ondoelmatigheid

zijn, verschillende verklaringen vaak van invloed zijn op elkaar en dit

lastig te overzien is, is het denkbaar dat de hieruit voortvloeiende acties

geen of zelfs een averechts effect hebben op die doelmatigheid.

Risico’s van raadplegen deskundigen (fictief voorbeeld)

Stel, je raadpleegt deskundigen in verband met een onderzoek dat je verricht naar de

doelmatigheid van ziekenhuizen. Volgens de deskundigen nemen de kosten per patiënt toe

met het aandeel paramedisch personeel. Maar stel nu dat het aandeel paramedisch

personeel van invloed is op de samenstellingsprijs: een lager aandeel zorgt voor een hogere

samenstellingsprijs. De deskundige is hiervan niet op de hoogte. Een hogere

samenstellingsprijs brengt hogere kosten per patiënt met zich mee. Als nu dus wordt

ingezet om het aandeel paramedisch personeel te verminderen om de doelmatigheid te

verbeteren, bestaat de kans dat deze doelmatigheidsverbetering niet zal slagen omdat het

lagere aandeel paramedisch personeel in een hogere samenstellingsprijs resulteert die op

zijn beurt een negatieve invloed op de doelmatigheid heeft.

Organisaties vergelijken

Als je bij het bepalen van de doelmatigheid vergelijkbare organisaties met

elkaar hebt vergeleken en er blijken grote verschillen te bestaan in de

doelmatigheid, is het verstandig om rond te gaan kijken bij de beste en

de slechte organisatie(s). Dit kan wellicht bruikbare tips opleveren over

het aanpassen van (onderdelen van) bedrijfsprocessen bij de slechts

functionerende organisatie(s) naar het voorbeeld van de beste.

Zo zagen we in het voorbeeld van de arbeidsbureaus in § 8.6.2.1 (figuur

en tabel) dat de ondoelmatige arbeidsbureaus hun doelmatigheid kunnen

verbeteren tot het niveau van hun referentie-arbeidsbureau (best

presterende vergelijkbare arbeidsbureau). De ondoelmatige

arbeidsbureaus kunnen gaan rondkijken en wellicht bruikbare tips opdoen

bij hun referentie-arbeidsbureau dat in de figuur in hun kolom ‘boven ze

ligt’. Deze aanpak kan uiteraard het beste worden toegepast bij

vergelijking met bestaande organisaties.

Voor deze aanpak gelden wel dezelfde risico’s als voor het gebruiken van

meningen van deskundigen.

Handleiding DDO

133

Hoe het niet moet

Een voorbeeld van een onderzoek waarbij DEA is toegepast, maar waar

wel erg makkelijk conclusies aan de uitkomsten van de analyse zijn

verbonden is het al eerder aangehaalde doelmatigheidsonderzoek dat

Price Waterhouse Coopers en Berenschot in 1999 deden naar de

thuiszorg.

AWBZ

Het kabinet heeft in de jaren negentig besloten om tot benchmarking in alle

sectoren van de AWBZ te komen. Voor de thuiszorg hebben Price Waterhouse

Coopers en Berenschot in 1999 een DEA-analyse uitgevoerd. Het kabinet

concludeerde op basis van dit onderzoek dat de resultaten aangeven dat het

instrument geschikt is voor het inzichtelijk maken en het vergelijken van

organisatieprestaties en dat overeenkomstige kenmerken van doelmatige

organisaties aan het licht kunnen worden gebracht.

De Groot (2000) laat zien dat deze conclusies nauwelijks door het onderzoek

worden gedekt. De onderzoekers slagen er niet in om voldoende aan-

knopingspunten voor de doelmatigheidsverschillen te vinden, afgezien van de

redelijk triviale samenhang tussen hoog ziekteverzuim en lage

doelmatigheid. In de bedrijfsvoering zijn er voorts geen duidelijke

kenmerken te vinden die de ‘best-practice’-organisaties als categorie

onderscheiden van andere organisaties. Dat betekent dus dat er geen

aanbevelingen uit het onderzoek zijn af te leiden voor verbetering van de

prestaties van de organisaties in de richting van de best presterende onder

hen, wat toch het uiteindelijke doel van dit soort vergelijkend onderzoek is.

Zoals alle technieken moet je DEA (en SFA) zorgvuldig toepassen. Voor bruikbare

resultaten is het bovendien erg belangrijk om mogelijke verklaringen te formuleren en te

toetsen in hoeverre die inderdaad verschillen in efficiency verklaren (zie § 8.6.3 ). Je

moet dus van goed onderbouwde en precies geformuleerde mogelijke verklaringen voor

verschillen uitgaan, of deze in een tweede fase (onder)zoeken.

Handleiding DDO

134 Bijlage 1 Literatuur

Aarts, L.J.M., I. Been en R. Goudriaan (2002).

Productiviteitstaakstellingen in de nationale begrotingen: een

internationale vergelijking van de doorwerking in de begroting van de

arbeidsproductiviteitsontwikkeling. Den Haag: APE bv.

Algemene Rekenkamer (1990). Subsidies. Tweede Kamer, vergaderjaar

1989-1990, 21 080, nrs. 1-2.

Algemene Rekenkamer (1991a). Toetsbaarheid kinderopvangbeleid.

Tweede Kamer, vergaderjaar 1991-1992, 22 233, nrs. 1-2.

Algemene Rekenkamer (1991b). Voorlichtingscampagnes van het Rijk.

Tweede Kamer, vergaderjaar 1990-1991, 22 152, nrs. 1-2, blz. 5.

Algemene Rekenkamer (1991c). Verslag van de Algemene Rekenkamer

over 1990. Tweede Kamer, vergaderjaar 1990-1991, 22 032, nrs. 1-2.

Algemene Rekenkamer (1995a). Fondsbeheer in de sociale zekerheid.


Algemene Rekenkamer (1995b). Ontslaguitkeringen bij universiteiten,

academische ziekenhuizen en onderzoeksinstellingen. Tweede Kamer,

vergaderjaar 1994-1995, 24 224, nrs. 1-2.

Algemene Rekenkamer (1996a). Gesubsidieerde arbeid. Tweede Kamer,


Algemene Rekenkamer (1996b). Vergunningen. Tweede Kamer,


Algemene Rekenkamer (1996c). Verhaalsrecht in de ziekenfondswet.


Algemene Rekenkamer (1997a). Afvalpreventie. Tweede Kamer,


Handleiding DDO

135 Algemene Rekenkamer (1997b). Fonds voorheffing pensioenverzekering.


Algemene Rekenkamer (1997c). Informatievoorziening en kengetallen.


Algemene Rekenkamer (1997d). Ontwikkeling en herverdeling

politiesterkte 1994-1995. Tweede Kamer, vergaderjaar 1996-1997, 25

385, nrs. 1-2.

Algemene Rekenkamer (1998a). Fiscale faciliteit voor het leerlingwezen.

Tweede Kamer, vergaderjaar 1997-1998, 26 060.

Algemene Rekenkamer (1998b). Geluidshinder Defensie. Tweede Kamer,


Algemene Rekenkamer (1998c). Groeicijfers Schiphol. Tweede Kamer,


Algemene Rekenkamer (1998d). Kwaliteit uitvoering Europese

akkerbouwregeling. Tweede Kamer, vergaderjaar 1998-1999, 26 240,

nrs. 1-2.

Algemene Rekenkamer (1999a). Collegeprogramma 1999-2004:

positionering en prioriteiten. Den Haag: Algemene Rekenkamer.

Algemene Rekenkamer (1999b). Integratiebeleid etnische minderheden.


Algemene Rekenkamer (1999c). Procesmanagement bij het Ministerie van

Onderwijs, Cultuur en Wetenschappen (brief aan de minister). Den

Haag: Algemene Rekenkamer.

Algemene Rekenkamer (2000a). Organisatie van de beleidsevaluatie.


Algemene Rekenkamer (2000b). Museale collecties van het Rijk. Tweede

Kamer, vergaderjaar 2000-2001, 27 470, nrs. 1-2.

Algemene Rekenkamer (2001a). Efficiëntie van arbeidsbureaus. Den

Haag: Algemene Rekenkamer.

Handleiding DDO

136 Algemene Rekenkamer (2001b). Begeleiding en herplaatsing van

voortijdige schoolverlaters. Den Haag: Algemene Rekenkamer.

Algemene Rekenkamer (2001c). Specifieke gegevens regio Zuid/Oost

Brabant,uitsluitend aan de regio gecommuniceerde annex bij het

bovengenoemde onderzoek Begeleiding en herplaatsing van

voortijdige schoolverlaters. Den Haag: Algemene Rekenkamer.

Algemene Rekenkamer (2002a). Bestrijding uitstoot broeikasgassen.


Algemene Rekenkamer (2002b). Reactie van de Algemene Rekenkamer op

het Referentiekader mededeling over de Bedrijfsvoering. Den Haag:

Algemene Rekenkamer.

Algemene Rekenkamer (2002c). VBTB in begrotingen 2002. Den Haag:

Algemene Rekenkamer.

Algemene Rekenkamer (2002 d). Van beleidsbegroting tot

beleidsverantwoording. Lijst van vragen en antwoorden. Tweede

Kamer, vergaderjaar 2000-2001, 26 573, nr.75.

Algemene Rekenkamer (2002 e). Preventie en bestrijding

jeugdcriminaliteit. Tweede Kamer, vergaderjaar 2001-2002, 29 282,

nr.2.

Algemene Rekenkamer (2002 f). Toelating bestrijdingsmiddelen voor de

landbouw. Tweede Kamer, vergaderjaar 2002-2003, 28 615, nrs. 1-2.

Algemene Rekenkamer (2003a). Handreiking meten van doelmatigheid.

Den Haag: Algemene Rekenkamer.

Algemene Rekenkamer (2003b). Wonen, zorg en welzijn van ouderen.

Tweede Kamer, vergaderjaar 2002-2003, 28951, nrs. 1-2.

Algemene Rekenkamer (2004). Handleiding Normen en begrippen. Den

Haag: algemene Rekenkamer (Onderdeel van Handar, intern

document).

Baarda, D.B. & M.P.M. de Goede (1996). Basisboek methoden en

technieken. Houten: Stenfert Kroese.

Handleiding DDO

137 Baarda, D.B., M.P.M. de Goede & M. Kalmijn (2000). Basisboek

enquêteren en gestructureerd interviewen . Houten: Stenfert Kroese.

Blank J.L.T. (1998). Benchmarken of de kunst van het vergelijken. In:

Economisch Statistische Berichten, 29-5-1998, 2.

Blank, J.L.T. (ed.) (2000). Public provision and performance; contri-

butions from efficiency and productivity measurement. Amsterdam:

Elsevier.

Blank, J.L.T (2000). Doelmatigheid van de publieke sector: enige

beschouwingen. In: Openbare Uitgaven, 32, nr. 6, pp. 260-271.

Blank, J.L.T. (2003). Data Envelopment Analysis: een goede praktijk.

http://www.benchmarkenindepubliekesector.nl: Kenniskamer

Benchmarken Publieke Sector, Ministerie van Binnenlandse Zaken en

Koninkrijksrelaties.

Blank, J.L.T., E. Eggink m.m.v. A.I. de Graaff (1996). Zuinig op zorg; een

empirisch onderzoek naar de productiestructuur van verpleeghuizen.

Rijswijk: Sociaal en Cultureel Planbureau.

Blank, J.L.T., E. Eggink, A.H.Q.M. Merkies (1998). Tussen bed en budget.

Een empirisch onderzoek naar de doelmatigheid van algemene en

academische ziekenhuizen in Nederland. Den Haag: SCP.

Bouckaert, G., W. Van Reeth, T. Auwers & K. Verhoest (1998). Handboek

doelmatigheidsanalyse prestaties begroten. Brussel: Ministerie van de

Vlaamse Gemeenschap.

Bouckaert, G. & T. Auwers (1999). Prestaties meten in de overheid.

Brugge: die Keure.

Bressers, J.T.A. (1982). Beleidseffektiviteit en waterkwaliteitsbeleid; een

bestuurskundig onderzoek, dissertatie T.H. Twente.

Brinks, R. & T. Witteveen (red.) (1999). Toegang tot de rijksbegroting.

Den Haag: Sdu.

Centraal Planbureau (2004). Lerend beleid: het versterken van beleid

door experimenteren en evalueren. CPB-document 48. Den Haag:

CPB.

Handleiding DDO

138 Coelli T.J. (1996-1). A guide to Frontier Version 4.1: A Computer Program

for Frontier Production Function Estimation. CEPA Working Paper 96/7.

Armidale: Department of Econometrics, University of New England.

Coelli T.J. (1996-2). A guide to DEAP Version 2.1: A Data Envelopment

Analysis (Computer) Program. CEPA Working Paper 96/8. Armidale:

Department of Econometrics, University of New England.

Coelli T.J., D.S. Prasada Rao and G.E. Battese (1998). An introduction to

efficiency and productivity analysis. Boston/Dordrecht/London: Kluwer

Academic Publishers, 1998.

Cooper W.W., L.M. Seiford en K. Tone (2000). Data Envelopment

Analysis: a comprehensive text with models, applications, references

and DEA-solver software. Dordrecht: Kluwer Academic Publishers.

Eggink, E. en J.L.T. Blank (2001). Verstandig verzorgd. Een empirisch

onderzoek naar de efficiëntie van de intramurale zorg voor

verstandelijk gehandicapten. Den Haag: Sociaal en Cultureel

Planbureau.

Finansministeriet (2001). Budgetredegørelse 2000/2001 (Budget Review

2000/2001). Albertslund: Schultz Information.

Fried, H.O., C.A. Knox Lovell en S.S. Smidt (1993). The measurement of

productive efficiency: Techniques and applications. New York/Oxford:

Oxford University Press.

GAO (1990). Case study evaluations. http://www.gao.gov.

GAO (1991). Designing evaluations. http://www.gao.gov.

Goudriaan et al. (1989). Doelmatig dienstverlenen. Een onderzoek naar

de produktiestructuur van vier voorzieningen in de kwartaire sector.

Rijswijk: Sociaal- en Cultureel Planbureau.

Goudriaan, R., B. Jongbloed en D.C. van Ingen (1998).

Kostendeterminanten en doelmatigheid van het Nederlandse hoger

onderwijs. Zoetermeer: Ministerie van OCenW.

Groot, H. de (2000). Tussen markt en politieke arena; over

managementcontrol in non-profitorganisaties. Amsterdam: Vrije

Universiteit.

Handleiding DDO

139

Groot, H. de & R. Goudriaan (1991). De produktiviteit van de overheid.

Over prestaties, personeel en uitgaven in de publieke sector.

Schoonhoven: Academic Service.

Hoogerwerf, A. (1980). Overheidsbeleid. Alphen aan den Rijn: Samson.

HM Treasury e.a. (2001). Choosing the right FABRIC. A Framework for

Performance Information . London (UK): HM Treasury, Cabinet Office,

National Audit Office, Audit Commission, Office for National Statistics.

Instituut voor Onderzoek van Overheidsuitgaven. Openbare Uitgaven,

Thema: Doelmatigheid in de publieke sector, nr.1, 1998.

Israël, F.J., A.G.M. Matheeuwsen, M.V.A.M. Roelofs en F.V. Roijackers

(2001). Werken arbeidsbureaus efficiënt? In: Openbare uitgaven, 33,

nr. 3, pp.126-132.

Jones, R, & M. Pendlebury (2000). Public sector accounting. Harlow (UK):

Pearson Education.

Knaap, P. van der (2000). Evaluatieonderzoek en prestatiegegevens bij

het rijk: nieuwe kaders en perspectieven. Beleidsanalyse, 3 en 4, pp.

35-49.

Kraan-Jetten, A. (1991). Effectiviteit van overheidsbeleid.

Systematisering van inzichten, getoetst aan het beleid ter bevordering

van het eigen-woningbezit. Beusichem: Centraal Service Bureau.

Leeuw, F.L. (1992). Produktie en effectiviteit van overheidsbeleid.

Institutionele analyse en effectmeting. Den Haag: Vuga.

Lovell, C.A.K. (1998). Doelmatigheidsonderzoek in de publieke sector. In:

Openbare uitgaven, 30, nr. 1, pp.6-13.

Lulofs en Schuddeboom (1991). Het vaststellen van de mate van

doelrealisatie. In: J.Th. A. Bressers en A. Hoogerwerf (red.),

Beleidsevaluatie. Alphen aan de Rijn: Samsom H.D. Tjeenk Willink.

Ministerie van Financiën (1999). Van beleidsbegroting tot

beleidsverantwoording. Den Haag: Ministerie van Financiën.

Handleiding DDO

140 Ministerie van Financiën (2001). Regeling prestatiegegevens en

evaluatieonderzoek rijksoverheid. Den Haag: Ministerie van Financiën.

New South Wales Treasury (2001). Guide to economic performance

measurement for general government sector agencies. New South

Wales: New South Wales Treasury.

PriceWaterhouseCoopers/ Berenschot (1999). Benchmarkonderzoek

Thuiszorg biedt aanknopingspunten voor instellingen en overheid.

PriceWaterhouseCoopers/Berenschot, Utrecht.

Rao, D.S. Prasada (1999). Workshop on Productivity and efficiency

analysis, 15-18 november 1999. Groningen. University of

Groningen/research institute SOM (Systems, Organization and

Management).

Scheel, H. (2000). Effizienzmasse der Data Envelopment Analysis.

Wiesbaden: Gabler.

SCP (2001). Maten voor gemeenten. Een verkennende studie naar

prestatie-indicatoren in het kader van het ‘Plan van aanpak

transparantie in de financiële verhouding’. Werkdocument 74. Den

Haag: SCP.

Stevens, J. (1992). Applied multivariate statistics for the social sciences.

Mahwah (N.J.): Lawrence Erlbaum Associates.

Swanborn, P.G. (1987). Methoden van sociaal-wetenschappelijk

onderzoek. Meppel: Boom.

Swanborn, P.G. (1996). Case-study’s, wat, wanneer en hoe?, Meppel:

Boom.

Swanborn, P.G. (1999). Evalueren. Meppel: Boom.

Swedish National Audit Office (1999). Handbook in performance auditing.

Theory and practice. RRV 1999: 17. Stockholm: RRV.

Tacq, J. (1991). Van probleem naar analyse. De Lier: Academisch

Boekencentrum.

Handleiding DDO

141 Taphoorn, R.T.G, K. Paalman, en H.J. van der Meulen (1998). Twee jaar

agentschap: doelmatigheid bij de Dienst Justitiële Inrichtingen. In:

Openbare Uitgaven, nr. 1, pp. 32-40.

Turksema, R.W. (2000). The supply of day care. Utrecht: ICS.

Tweede Kamer (2001). Vaststelling van de wet inzake het beheer van de

financiën van het Rijk (Comptabiliteitswet 2001) . Memorie van

Toelichting. Vergaderjaar 2000-2001, 27 849, nr 3, p. 44-45.

Vermeulen, W.J.V. (1992). De vervuiler betaald: onderzoek naar de

werking van subsidies op vier deelterreinen van het milieubeleid.

Utrecht: Van Arkel.

Weimer, D.L. & A.R. Vining (1992). Policy analysis. Concepts and

practice. Englewood Cliffs (NJ): Prentice Hall.

Handleiding DDO

142 Bijlage 2 Dataverzameling: (longitudinale) surveys

Het survey is een systematische ondervraging van personen of

organisaties op een groot aantal punten. Die ondervraging kan

schriftelijk, telefonisch of in direct mondeling contact plaatsvinden.

Meting vindt plaats op één tijdstip, maar kan wel verscheidene perioden

betreffen. Surveys zijn geschikt om zowel beschrijvende als verklarende

(causale) uitspraken te doen.

Bij longitudinale surveys worden gegevens op verschillende momenten

verzameld. Hierbij zijn twee varianten mogelijk: dezelfde gegevens bij

dezelfde groep verzamelen (panel-onderzoek) en dezelfde gegevens bij

steeds verschillende personen verzamelen (trendonderzoek).

Surveyonderzoek kan ook worden gebruikt om uitspraken te doen over de

doeltreffendheid van het beleid. Hiervoor moet zijn voldaan aan drie

causaliteitsvoorwaarden; deze worden besproken in § 4.3.1.1.

Populatie en steekproef (eenheden)

Omdat het in een survey meestal ondoenlijk (en niet nodig) is om een

gehele populatie te onderzoeken, kan een steekproef worden getrokken

uit de populatie. Door op aselecte wijze de steekproef te trekken, kun je

een uitspraak doen over gemiddelden, samenhangen en effecten op het

niveau van de populatie.

Het DDO van de Algemene Rekenkamer richt zich op verschillende

populaties. In de eerste plaats gaat het om het Rijk en RWT’s. Vervolgens

kan – zeker in het geval van doorwerkingsonderzoek – ook worden

gedacht aan provincies en gemeenten (zie bijvoorbeeld het onderzoek

Voorbereiding rampenbestrijding). Het is zelfs mogelijk om burgers in het

onderzoek te betrekken (zie bijvoorbeeld het onderzoek Preventie en

bestrijding jeugdcriminaliteit). De populaties kunnen echter ook

instrumenten betreffen, zoals vergunningen, stimuleringsregelingen of

subsidies.

Handleiding DDO

143 Om verantwoord een steekproef te kunnen trekken, moet er wel zicht zijn

op de omvang van de populatie. In het geval van gemeenten of provincies

is dat eenvoudig, maar lastiger is het in het geval van subsidies. Er is

immers geen overzicht van alle subsidies in Nederland.

Meer weten?

Raadpleeg voor meer informatie over steekproeven en hoe om te gaan met non-respons het

materiaal van de cursus Methoden en technieken (via het kennisdomein DDO op intranet)

en/of consulteer een van de statistische adviseurs.

Vragenlijsten (schriftelijk interview)

Vragenlijsten zijn het geschiktste middel om de benodigde gegevens voor

een surveyonderzoek te verzamelen. Vragenlijsten hebben als voordeel

dat je er veel mensen mee kunt bereiken en er relatief veel vragen in

kunt stellen. Het is echter niet eenvoudig om goede vragenlijsten samen

te stellen. Het verdient aanbeveling hier veel aandacht aan te besteden.

Meer weten?

Voor meer (toegankelijke) informatie over (longitudinaal) surveyonderzoek, meetniveaus,

betrouwbaarheid, validiteit en/of vragenlijsten kun je bijvoorbeeld raadplegen: Baarda & De

Goede (1995), Basisboek Methoden en Technieken; Baarda, De Goede & Kalmijn (2000),

Basisboek enquêteren en gestructureerd interviewen; Swanborn (1987), Methoden van

sociaal-wetenschappelijk onderzoek.

Handleiding DDO

144 Bijlage 3 VBTB-begroting

De departementale begroting-nieuwe-stijl dient als volgt te zijn

opgebouwd.102

Departementale begroting-nieuwe-stijl

• Voorstel van wet

– begrotingsstaat

• Leeswijzer

• Beleidsparagraaf

- beleidsagenda

- beleidsartikelen

• Bedrijfsvoeringsparagraaf

• Baten-lastendiensten

• Verdiepingsbijlage

In de beleidsagenda worden de zogenoemde beleidsprioriteiten van het

ministerie beschreven. Hierbij wordt in ieder geval ingegaan op datgene

wat er het komende jaar ondernomen gaat worden om de

beleidsvoornemens te realiseren. De beleidsagenda bevat tevens een

samenvattend overzicht van de financiële gevolgen van het voorgestelde

beleid. Ook worden de belangrijkste beleidsintensiveringen en -

extensiveringen op totaalniveau zichtbaar.

In de beleidsartikelen, die het grootste deel van de beleidsparagraaf

vormen, staat de ambitie centraal om waar mogelijk een direct verband

te leggen tussen (1) de doelstellingen van beleid, (2) de daartoe in te

zetten instrumenten en te leveren prestaties en (3) de daarvoor

beschikbare middelen. Het streven verder is te komen tot een indeling in

beleidsartikelen waarin de beleidsterreinen duidelijk herkenbaar en

voldoende homogeen zijn. Overigens dienen in de beleidsartikelen altijd

prestatiegegevens opgenomen te zijn over de na te streven effecten –

ook wanneer de verantwoordelijke minister niet (direct) verantwoordelijk

102 Algemene Rekenkamer (2002c).

Handleiding DDO

145 is voor alle te behalen resultaten, omdat deze verantwoordelijkheid

(gedeeltelijk) extern is verzelfstandigd of gedecentraliseerd.

Om de vergelijkbaarheid van beleidsartikelen te vergroten wordt in de

nieuwe stijl een vaste structuur gehanteerd. Deze vaste structuur ziet er

als volgt uit.

Beleidsartikel-nieuwe-stijl

• Algemene beleidsdoelstelling

• Nader geoperationaliseerde beleidsdoelstellingen

• Budgettaire gevolgen van beleid

• Budgetflexibiliteit

• Veronderstellingen in effectbereiking, doelmatigheid en raming

Handleiding DDO

146 Bijlage 4 Normen voor het beoordelen van de doelformulering

Hoofdnormen Specificatie van deelnormen Toelichting

Specifiek (volledig): a. prestaties en effecten (eventueel processen) b. doelgroep

a. Prestaties en effecten • doelen moeten bij voorkeur

geformuleerd worden in termen van prestaties (welke beleidsprestatie gaat de gecontroleerde leveren) en in termen van te bereiken maatschappelijke effecten (welke maatschappelijke situatie of verandering wordt beoogd);

• wanneer dat niet mogelijk is, kunnen procesdoelen geformuleerd worden.

b. Indien het beleid niet op de hele bevolking gericht is, moet: • de doelgroep van het beleid zijn

omschreven en zo duidelijk mogelijk afgebakend;

• de keuze van de doelgroep zijn gemotiveerd.

Een prestatiedoelstelling heeft betrekking op een beleidsprestatie die door de gecontroleerde kan worden gerealiseerd, zonder dat deze daarbij afhankelijk is van anderen of van maatschappelijke ontwikkelingen die buiten de invloed van het beleid liggen. Bij een maatschappelijk effectdoelstelling is het beleid meestal een van de factoren die van invloed zijn op het bereiken ervan. Wanneer het niet mogelijk is een prestatie of maatschappelijk effectdoelstelling te formuleren kan worden teruggevallen op een procesdoelstelling. Denk bijvoorbeeld aan productkwaliteit die vaak moeilijk meetbaar te maken is. Doel kan dan zijn de voortgang van maatregelen ter verbetering van de kwaliteit (proces).

Meetbaar (toetsbaar) • de doelen moeten in toetsbare termen zijn geformuleerd (de beoogde situatie bij doelrealisatie moet eenduidig zijn omschreven, begrippen moeten goed gedefinieerd zijn, dat wil zeggen niet voor tweeërlei uitleg vatbaar, en begrippen moeten meetbaar zijn);

• bij doelen ten opzichte van een referentiepunt moet de situatie van het referentiepunt bekend zijn (nulmeting).

Om te weten waarop de minister aan-spreekbaar is, moet worden gelet op definities van begrippen en de praktische meetbaarheid van genoemde grootheden. Een nulmeting is niet altijd noodzakelijk. Voorbeeld: de doelstelling “dat het aantal geluidsgehinderden niet groter mag zijn dan in 1985”, vereist een nulmeting van de situatie in 1985. De doelstelling “het aantal geluidgehinderden mag in 2010 niet groter zijn dan 12.000” niet.

Afgestemd(expliciet) • beleidsdoelen moeten in ieder geval zijn afgestemd met de relevante actoren (Tweede Kamer, uitvoerders).

• tussentijdse bijstellingen / wijzigingen van de doelstelling moeten worden afgestemd met de Tweede Kamer en uitvoerders.

Beleidsdoelen moeten zijn afgestemd met de Tweede Kamer en met de uitvoerders van het beleid. Met deze norm wordt aandacht besteed aan de aansluiting tussen beleid en uitvoering; beleidsmakers moeten van tevoren afstemmen welk beleid uitgevoerd kan worden.

Realistisch • de doelen moeten zodanig zijn gekozen dat ze bereikt kunnen worden bij plausibele scenario’s voor de exogene variabelen.

Het realiteitsgehalte van de doelen valt uiteen in twee elementen: • de ambities moeten op een haalbaar

niveau zijn geformuleerd; • er moet bij de doelformulering

rekening zijn gehouden met eventuele beperkte mogelijkheden om de doelen te behalen (exogene factoren, gedeelde beleids- c.q. resultaatverantwoordelijkheden).

Tijdgebonden (tijdig) • er is aangeven op welk tijdstip / binnen welke periode het doel moet zijn bereikt;

• bij doelen ver weg moet een tijdpad met gespecificeerde mijlpalen zijn aangegeven (bijvoorbeeld tussen-doelen, tempo van doelrealisatie).

Zonder vooraf gestelde temporele restricties (einddatum en/of mijlpalen) is het moeilijk om te bepalen of de doelen binnen de gestelde voorwaarden bereikt zijn.

Consistent Het gaat om twee vormen van consistentie:

1. Consistentie tussen doelen:

Ad 1: Vaak zijn aan het beleid verscheidene doelen verbonden. Doelen kunnen

Handleiding DDO

147 Hoofdnormen Specificatie van deelnormen Toelichting

• de doelen van het beleid moeten met elkaar te verenigen zijn;

• de doelen voor onderdelen van het beleid moeten aansluiten bij de algemene doelen voor het gehele beleidsterrein (hiërarchische ordening);

• tussendoelen moeten aansluiten bij het einddoel;

• bij decentraal uitgevoerd beleid moeten de doelen van de rijksoverheid en de uitvoerende instanties (bijvoorbeeld gemeenten, uitvoerende instellingen) consistent zijn;

• de formulering van de doelstelling moet in de tijd consistent zijn. Wijzigingen in de doelstelling moeten expliciet vermeld en gemotiveerd zijn.

2. Consistentie tussen doelen en

basisgegevens: • de doelstelling moet consistent zijn

met de basisgegevens waarop deze is gebaseerd. Als deze gegevens wijzigen moet de doelstelling worden aangepast.

geordend worden in een doelenboom: • in hiërarchie: doelen per maatregel

--> doelen voor onderdelen van het beleid--> algemene doelen voor het gehele beleidsterrein.

• in de tijd: tussendoelen --> einddoel. Van belang is dat deze doelen consistent met elkaar zijn. Het bereiken van het ene doel moet niet op gespannen voet staan met of belemmerend zijn voor het bereiken van het andere doel. Ad 2: De doelstelling om de hoeveelheid afval tussen 1986 en 2000 maximaal te laten groeien van 40 naar 50 miljoen ton is gebaseerd op de basisinformatie dat de hoeveelheid afval in 1986 40 miljoen ton bedroeg. Als later blijkt dat er in 1986 geen 40 maar 50 miljoen ton afval was, is de doelstelling niet meer consistent met de informatie waarop deze gebaseerd is.

We beschrijven hieronder vier voorbeelden van eerder

Rekenkameronderzoek waarbij de doelformulering beoordeeld werd.

Voorbeeld 1

De SMART-normen zijn in het onderzoek Bestrijding uitstoot

broeikasgassen (Algemene Rekenkamer, 2002a) gebruikt. Onderzocht is

of de beleidsdoelen van de ministeries van VROM, EZ, V&W, LNV en

Financiën ten aanzien van het broeikasgasbeleid SMART zijn

geformuleerd.

Voorbeeld 2

In het onderzoek Integratiebeleid etnische minderheden (Algemene

Rekenkamer, 1999b) werd doelformulering beoordeeld op:

� Volledigheid: onderzocht werd op welke wijze de doelstellingen van

de beleidsmaatregelen waren geformuleerd: als output of outcome of

beiden. Als norm werd gesteld dat de doelstelling in beide termen

moest zijn verwoord.

� Toetsbaarheid: de doelstelling van een maatregel werd toetsbaar

genoemd wanneer 1: een meetbare omschrijving was gegeven van de

situatie bij doelrealisatie. De genoemde indicatoren moeten eenduidig

zijn en de beoogde situatie is kwantitatief geformuleerd. En 2: een

tijdshorizon was bepaald, zodat duidelijk is binnen welke termijn of

op welk tijdstip de doelstelling gerealiseerd moet worden.

� Consistentie: onderzocht werd of de doelen van maatregelen

aansloten bij de algemene hoofddoelstellingen van het

minderhedenbeleid.

Handleiding DDO

148

Voorbeeld 3 In het onderzoek Afvalpreventie (Algemene Rekenkamer,

1997) werd de doelformulering beoordeeld op:

� Expliciteit: de Algemene Rekenkamer verschilde van inzicht met de

minister over de vraag wat wel of niet als doelstelling kon worden

aangemerkt. De minister achtte zich niet aanspreekbaar op doelen

vermeld in informatiedocumenten van het RIVM. De Algemene

Rekenkamer ging hiermee akkoord omdat dit geen Kamerstukken

waren. De Algemene Rekenkamer trof in Kamerstukken doelstellingen

aan die volgens de minister niet gezien moesten worden als doelen

maar als te treffen maatregelen en verwachte resultaten daarvan. De

Algemene Rekenkamer bleef van mening dat het hier ging om doelen

waarop de minister aanspreekbaar was.

� Toetsbaarheid: het ging hier om preventiedoelstellingen. Extra

lastigheid hierbij is dat gemeten moet worden hoeveel afval er niet

ontstaan is. Als norm gehanteerd dat de preventiedoelstelling

duidelijkheid moest bieden op de volgende punten: het realisatiejaar,

het referentiejaar en de uitgangssituatie, de prognose voor autonome

groei van het afvalaanbod, het tempo van de beoogde doelrealisatie,

de afvalstoffen waarop de doelstelling betrekking heeft, en de wijze

waarop het bereiken van de doelstelling zal worden gemeten.

� Consistentie: de consistentie van de doelen is op vier manieren

geoperationaliseerd:

1. Consistentie in de tijd. De doelstelling was een aantal malen

gewijzigd, maar deze wijzigingen waren niet altijd in

Kamerstukken geëxpliciteerd en gemotiveerd.

2. Consistentie met de basisgegevens. De gegevens waarop de

doelstelling was gebaseerd, waren achterhaald.

3. Consistentie tussen algemene doelstelling en deeldoelstellingen.

Daarbij gaat het om de aansluiting van de doelstellingen voor

verschillende prioritaire afvalstoffen bij de algemene doelstelling

voor de totale hoeveelheid afval.

4. Consistentie tussen doelen van het Rijk enerzijds en lagere

overheden en bedrijven anderzijds werd onderzocht door na te

gaan in hoeverre de doelen van het rijksbeleid hun weerslag

kregen in bedrijfsmilieuplannen en milieuvergunningen van lagere

overheden. Dit wordt in het rapport ‘doorwerking’ genoemd.

Voorbeeld 4

Een voorbeeld van de manier waarop de Algemene Rekenkamer kan

omgaan met niet-toetsbare doelen is het onderzoek toetsbaarheid

kinderopvangbeleid (Algemene Rekenkamer, 1991a). Omdat de doelen en

toetsingscriteria van de stimuleringsmaatregel kinderopvang niet duidelijk

Handleiding DDO

149 genoeg geformuleerd waren, heeft zij de minister een aantal vragen

voorgelegd. Op grond van de antwoorden daarop en de achterliggende

stukken construeerde de Algemene Rekenkamer de einddoelstelling en de

nevendoelstellingen van het beleid.

De minister nam vervolgens niet alle doelen over maar schiep wel meer

helderheid. Of de doelstellingen worden bereikt werd in dit onderzoek niet

nagegaan.

Handleiding DDO

150 Bijlage 5a Normen voor de beoordeling van de (bruikbaarheid van) beleidsinformatie

Hoofdnormen

Subnormen Specificatie van subnormen Toelichting

Relevantie Startvraag/eerste selectie: Als er informatie wordt aangetroffen die om te kunnen (bij)sturen niet nodig (irrelevant) is, ga dan na of deze informatie met dit doel verza-meld is. • Zo nee: dan geen oordeel. De

betreffende informatie kan voor een ander doel wel relevant zijn. Deze informatie blijft verder buiten beschouwing.

• Zo ja: dan luidt het oordeel: ‘irrelevant’. De kwaliteit van deze informatie hoeft verder niet beoordeeld te worden.

Voor een doelmatige informatieverzameling en een efficiënt gebruik van onderzoeksgelden is het niet wenselijk dat overbodige gegevens verzameld worden. Welke aspecten relevant zijn hangt af van de inhoud van het onderzochte beleidsterrein en de vraag die beantwoord moet worden. Vaak zal de vraag samenhangen met de fase waarin het beleid zich bevindt.

volledig • Alle informatie die, gelet op de doelen, beschikbaar zou moeten zijn om te sturen of te verantwoorden is daadwerkelijk beschikbaar.

• Er mag geen relevante informatie achtergehouden worden.

Informatie dient om inzicht te krijgen in een bepaalde vraag. Er moet informatie beschikbaar zijn over alle relevante aspecten. Toekomstscenario’s en modelberekeningen zijn vrijwel altijd gebaseerd op een aantal aannames en vereenvoudigingen van de werkelijkheid. Van belang is dat die expliciet gemaakt worden. Wanneer relevante aspecten/factoren buiten beschouwing worden gelaten, moet dit expliciet zijn vermeld en gemotiveerd.

actueel • De aanwezige informatie moet actueel genoeg zijn (niet verouderd)

• hoe actueel informatie moet zijn kan (nog) niet gekwantificeerd worden.

• info over prestaties en effecten: evaluatie moet minimaal eens in de 5 jaar plaatsvinden, tenzij een andere termijn is afgesproken bij de start van beleid.

tijdig • De benodigde informatie dient op tijd beschikbaar zijn (niet te laat)

Het gaat om de volgorde van het beschikbaar komen van informatie enerzijds en besluiten en handelingen anderzijds. Hierbij is een logische volgorde van stappen in de beleidsketen richtinggevend. Bijvoorbeeld: • probleemanalyse en ex-ante evaluatie

moeten vooraf gaan aan het inzetten van instrumenten.

• doelen moeten bij de start van het beleid geformuleerd zijn, bij voorkeur inclusief operationele evaluatiecriteria.

Bij de beoordeling moet rekening gehouden worden met het cyclisch karakter van beleid. Dit betekent dat doelen na de start van het beleid kunnen worden bijgesteld of uitgewerkt. Dit is niet verkeerd, mits gemotiveerd en geëxpliciteerd. • Ex post evaluatie dient vooraf te gaan aan

besluitvorming over voortzetting/ bijstelling van het beleid.

Betrouwbaarheid/ juistheid

Betrouwbaar Het meetinstrument wordt nauwkeurig toegepast, herhaalde metingen leveren steeds dezelfde uitkomst. • Beleidsinformatie dient voldoende

Handleiding DDO

151 Hoofdnormen


betrouwbaar te zijn. • De lezer moet inzicht hebben in

de mate van betrouwbaarheid van de geboden informatie.

Wanneer over de betrouwbaarheid van de gegevens geen zekerheid bestaat: • moet de mate van on-

betrouwbaarheid expliciet vermeld zijn (zo mogelijk gekwantificeerd, bijvoorbeeld in de vorm van een betrouwbaarheidsinterval);

• moet de omvang van de onzekerheidsmarge acceptabel zijn.

• bij grote onzekerheden is het van belang dat gegevens uit verschillende bronnen vergeleken worden.

Valide Het meetinstrument is inhoudelijk adequaat • Begrippen moeten valide gemeten

worden, dat wil zeggen begrippen moeten zodanig geoperationali-seerd en gemeten zijn dat je meet wat je meten wilt.

Enkele voorbeeldjes om het verschil tussen betrouwbaar en valide te illustreren: Als je de temperatuur meet met een thermometer, maar je leest de stand slordig af, zijn de metingen valide maar onbetrouwbaar. De afwijkingen door onbetrouwbare metingen zijn toevalsfouten (bij herhaalde meting zijn de uitkomsten niet stabiel, de ene keer zijn ze te hoog, dan weer te laag). Niet-valide metingen zijn het gevolg van het gebruik van een niet adequaat meetinstrument. Meet je de temperatuur met een barometer, of een thermometer met een valse schaal, dan zijn de metingen misschien wel betrouwbaar maar niet valide. Een gebrek aan validiteit van de metingen leidt tot systematische fouten (systematisch te hoog of te laag). Niet-valide metingen kunnen zich ook voordoen als begrippen gemeten moeten worden die niet direct meetbaar zijn. De vraag is dan of de gekozen (wel meetbare) indicatoren het te meten begrip zo goed mogelijk benaderen. Zo kan de omvang van de werkloosheid afgemeten worden aan het aantal ingeschrevenen bij het arbeidsbureau, maar de meting is alleen valide als alle werklozen daar ook ingeschreven staan. Een andere oorzaak van systematische vertekening is dat mensen in een enquête of interview de neiging hebben sociaal wenselijke antwoorden te geven. In de praktijk is het soms lastig betrouwbaarheid en validiteit van elkaar te scheiden. Het is vooral van belang aan te geven waarom de informatie onjuist is, waar de tekortkomingen in zitten. Juistheid van informatie wordt meestal onderzocht door na te gaan of voldaan is aan een aantal voorwaarden: • de informatie dient op onafhankelijke wijze

tot stand te komen. Evaluatieonderzoek wordt bij voorkeur uitgevoerd door onderzoekers die geen deel uitmaken van de afdeling/instelling die verantwoordelijk zijn voor de voorbereiding/ uitvoering van het beleid;

• de wijze van dataverzameling voldoet aan de methodisch-technische eisen. Bij het beoordelen van de kwaliteit van informatiebronnen kan aangesloten worden op de RPE.

• de controle op de juistheid van de gegevens is gewaarborgd. (bijvoorbeeld peer-review, controle op gegevensinvoer)

• bij de beoordeling van informatie die gebaseerd is op andere bronnen, kan ook de kwaliteit van die andere bron beoordeeld worden (bijvoorbeeld bij modellen: de kwaliteit van de gebruikte invoergegevens).

Conformiteit wettelijke regels en gezaghebbende richtlijnen voor de

De kwaliteits-eisen voor evaluatie-onderzoek uit de

Voorbeelden van deze kwaliteitseisen uit de regeling zijn: • het gebruiksdoel van het

evaluatieonderzoek is

Handleiding DDO

152 Hoofdnormen


inhoud Regeling prestatie-gegevens en evaluatie-onderzoek

omschreven; • de opdrachtformulering en de

onderzoeksvragen vloeien logisch voort uit gebruiksdoel;

• de uitkomsten van het evaluatieonderzoek zijn praktisch toepasbaar; de conclusies en/of aanbevelingen sluiten aan op het gebruiksdoel.

Kwaliteitseisen voor systemen van reguliere prestatiegegevens uit de Regeling prestatiegegevens en evaluatie-onderzoek

Voorbeelden van deze kwaliteitseisen uit de regeling zijn: • valide afbakening van het

systeemobject; • goed ontwerp van het systeem; • heldere definities en gehanteerde

begrippen; • meerjarige vergelijkbaarheid.

Begrijpelijkheid Toegankelijk/ helder

Van belang is dat de informatie toegankelijk is voor de gebruikers van de informatie (beleidsmakers, Tweede Kamer en dergelijke).

Eenduidig Het gaat erom dat de informatie niet voor meer uitleg vatbaar is

Vergelijkbaarheid Consistent Het gaat om drie vormen van consistentie: 1. consistentie in de tijd: • de gegevens moeten in de tijd

vergelijkbaar zijn; • wijzigingen in eerder verstrekte

gegevens moeten worden geëxpliciteerd.

2. consistentie tussen onderdelen in de beleidsketen: • gegevens moeten aansluiten bij

de wijze waarop het beleid is gedefinieerd;

• de wijze van prestatiemeting moet aansluiten op de ingezette instrumenten en de prestatie-doelstelling; de wijze van effectmeting moet aansluiten bij het maatschappelijke probleem en de maatschappelijk effectdoelstelling.

3. consistentie tussen verschillende informatiebronnen: • verschillende gegevens over

eenzelfde onderwerp moeten onderling consistent zijn;

• gegevens uit verschillende bronnen over eenzelfde object moeten met elkaar vergeleken worden en liefst naast elkaar worden gepresenteerd;

• als sommige (onderdelen van) gegevens strijdig met elkaar zijn moet dit expliciet vermeld worden en zo mogelijk verklaard.

Ad. 1: Bij consistentie in de tijd gaat het om de vraag of gegevens over verschillende jaren/ tijdvakken met elkaar vergeleken kunnen worden (bijv. is het gemeten object en de gebruikte meetmethode consistent in de tijd?) Ad. 2: Bij consistentie tussen alle onderdelen van de beleidsketen gaat het om de aansluitende informatie over maatschappelijk probleem, doelen, middelen, prestaties en effecten. Zo moet informatie over prestaties en effecten aansluiten bij de wijze waarop het beleid(sdoel) geformuleerd is. Kernbegrippen moeten consequent op dezelfde wijze ingevuld zijn (bijv. omschrijving doelgroep, jaartallen, gehanteerde definities en operationaliseringen)? Zo niet, dan moet dat beargumenteerd zijn. N.B.: Inconsistentie in informatie over opeenvolgende onderdelen van de beleidsketen kan ook veroorzaakt worden doordat het beleid niet logisch is opgebouwd. Als er geen logische relatie is tussen de verschillende elementen in het beleid en tussen de verschillende stappen in het beleidsproces, sluit de bijbehorende informatie waarschijnlijk ook niet goed op elkaar aan. Ad. 3: Bij inconsistentie tussen bronnen kan sprake zijn van een verschil in meetmethode, steekproef, respons, etc. Ook kan er een verschil in belangen aan ten grondslag liggen. Het risico van inconsistente gegevens zonder verklaring daarvoor, is dat er geen draagvlak is voor de gegevens, en/ of dat betrokken partijen die uitkomsten kiezen die het best bij hun belangen passen.

Conformiteit aan wettelijke regels en gezaghebbende richtlijnen voor de vorm

De kwaliteits-eisen voor evaluatie-onderzoek uit de Regeling prestatiegegevens en evaluatie-onderzoek

Voorbeelden van deze kwaliteitseisen uit de regeling zijn: • Het evaluatierapport bevat een

samenvatting

Handleiding DDO

153 Bijlage 5b Uitwerking van de subnorm ‘volledigheid’ van beleidsinformatie (onderdeel van relevantie)

Welke informatie wordt vereist is afhankelijk gesteld van de fase van

beleid die beoordeeld wordt. Daarbij is (in drie kolommen) onderscheid

gemaakt tussen:

1. de voorbereiding van nieuw beleid. Hierbij kan informatie uit een

vorige beleidscyclus een rol spelen maar daarnaast gaat het ook om

andere informatie (voorafgaand aan t-0);

2. de besluitvorming, waarbij de grondslag gelegd wordt voor het beleid

(t-0);

3. de implementatie en uitvoering van het beleid, waarbij het gaat om

evaluatie met het oog op het voortzetten, bijsturen of beëindigen van het

beleid (t-1).

De aanwezigheid van informatie over een beperkt aantal onderwerpen is

bij elk beleidsterrein van belang en dient dus in elk

Rekenkameronderzoek beoordeeld worden. De aanwezigheid van

informatie onder het kopje ‘optioneel’ valt niet onder het basispakket. Per

beleidsterrein en per onderzoek zal nagegaan moeten worden of deze

informatie van belang is vanuit de optiek van de beleidsmaker. Zo ja, dan

kan deze informatie eveneens in het Rekenkameronderzoek (oordeel)

worden betrokken. Wel moet het onderzoeksteam van elke doelstelling

die wordt genoemd (zoals in kolom 3 hieronder), nagaan welke informatie

er zou moeten zijn, gelet op deze doelstelling.

Fase: Informatie over:

Voorbereiding van nieuw beleid (voorafgaand aan t-0)

Besluit (t-0) Implementatie en uitvoering van beleid (t-1)

Maatschap-pelijk probleem

• aard en omvang van het maatschappelijk probleem (in kwalitatieve/ kwanti-tatieve termen);

• de belangrijkste oorzaken van het maatschappelijk probleem en de mate waarin deze oorzaken te manipuleren zijn door het beleid.

Optioneel: • de redenen waarom de

Optioneel: motivatie voor het beleid

• aard en omvang van het maatschappelijk probleem bij de start van het beleid (t-0) en nu (t-1). Overigens, wanneer de doelstelling in termen van maatschappelijk effect is geformuleerd, zal dit tevens de effectmeting zijn.

Optioneel: • het verloop in de tussentijd.

Handleiding DDO

154 Fase: Informatie over:



overheid dit probleem wil aanpakken;

• de betrokken actoren bij het probleem en hun belangen daarbij.

Doelstellingen • doel dat wordt nagestreefd

Optioneel: • overwegingen bij keuze

doelstelling

- doel dat wordt na-gestreefd Optioneel: - motivatie

• doel dat wordt nagestreefd • bij een doelstelling in de toekomst

(t-2): daaruit afleiden wat bereikt zou moeten zijn op het moment van informatieverzameling (t-1), bijv. door interpolatie.

input: beleidsin-strumenten

• in te zetten beleidsinstrumenten

- in te zetten beleidsinstrumenten

� daadwerkelijk ingezette beleidsinstrumenten.

motivatie instrument-keuze

• alternatieve beleidsinstrumenten

• motivatie voor de instrumentkeuze (waarom is het gekozen instrument het beste, alle relevante argumenten genoemd)

• logische relatie tussen instrumenten en doelen (plausibele redenering dat instrumenten bijdragen aan doel, mede gezien de beïnvloedbare factoren uit de probleemanalyse)

Optioneel: • haalbaarheid doelstelling,

verwachte effecten en mogelijke neveneffecten.

optioneel: - motivatie

n.v.t.

input: de kosten en de dekking

• de kosten van uitvoering van het voorgestelde beleid (begroting)

• voorgestelde dekking van de kosten

- kosten van uitvoering • kosten van de uitvoering van het beleid (realisatie, eventueel vergeleken met de begroting)

betrokken partijen en verdeling taken en verantwoor-delijkheden

• wie is verantwoordelijk voor wat

Optioneel: • is met alle betrokken

actoren afgestemd of overlegd

• Indien er meerdere overheidsinstanties bij het beleidsterrein betrokken zijn: interfereert het voorgestelde rijksbeleid met dat van andere betrokken overheidsinstanties

- wie is verantwoordelijk voor wat

• wie deed wat, gerelateerd aan ieders de verantwoordelijkheden

prestaties en effecten (eventueel: proces)

Optioneel: • afspraken over evaluatie

van prestaties en effecten (wie, wanneer)

Optioneel: - afspraken over evaluatie

• Er moet beoordeeld kunnen worden of de prestaties en effecten (eventueel proces) voldoende zijn, door ze te vergelijken met de doelstellingen. De informatie moet betrekking hebben op alle geformuleerde doelstellingen. Welke informatie minimaal nodig is hangt af van de wijze waarop de doelstelling geformuleerd is: bij een prestatiedoelstelling moeten beleidsprestaties gemeten worden op een manier die daarop aansluit, bij een maatschappelijk effect-doelstelling moeten de effecten op overeenkomstige wijze gemeten worden, bij een procesdoelstelling is informatie over het proces nodig. Idealiter is er zowel een prestatie- als een maatschappelijk effect-doelstelling geformuleerd. Dan is informatie nodig over:

Handleiding DDO

155 Fase: Informatie over:



a. beleidsprestaties van de gecontroleerde;

b. maatschappelijke effecten; c. prestaties en effecten moet in

verband gebracht worden met de doelen (er moet een uitspraak gedaan worden over de mate van doelrealisatie).

Optioneel: • er moet ook informatie zijn over

opgetreden neveneffecten (effecten die niet het doel waren, dit kunnen gewenste en ongewenste effecten zijn).

• plausibel maken in hoeverre het bereiken van de opgetreden maatschappelijke effecten zijn toe te schrijven aan de beleidsprestaties (de link leggen tussen a en b). Een nog zwaardere eis is dit empirisch aan te tonen (effectiviteit meten).

• plausibel maken in hoeverre de opgetreden neveneffecten zijn toe te schrijven aan de beleidsprestaties.

de mate van efficiëntie

Optioneel: • na te streven efficiëntie-

norm

Optioneel: • de aard en omvang van de

geleverde prestaties/ producten, zo nodig rekening houdend met de kwaliteit ervan

• de gemaakte kosten (tijd, geld) • de kosten per prestatie/ product • de kosten moeten vergeleken

worden met een norm. Deze norm is meestal een relatieve, dat wil zeggen vergelijking in de tijd of vergelijking met andere instanties (efficiëntie). • afwijking van de norm dient te

worden verklaard.

Implementa-tie- en uitvoerings-problemen/ succes- en faalfactoren

Optioneel: • welke problemen worden

verwacht? • hoe is men daar op voor-

bereid? • welke activiteiten worden

ondernomen om de start van het nieuwe beleid goed te laten verlopen?

Alleen indien doelen niet bereikt zijn of niet bereikt lijken te worden: • Informatie over de oorzaken

waardoor een doelstelling niet gehaald is/ wordt. Deze oorzaken kunnen betrekking hebben op: a. het verloop van de uitvoering,

zoals de mate waarin en de wijze waarop instrumenten zijn ingezet

b. de verdeling van taken en verantwoordelijkheden

c. de mate waarin alle betrokke-nen de afgesproken bijdrage hebben geleverd (bijvoorbeeld medewerking, draagvlak)

d. onvoorziene maatschappelijke ontwikkelingen

e. het realiteitsgehalte van de doelstelling

eventueel tussentijds opgetreden veranderingen

• veranderingen in gegevens tijdens het proces van beleidsvoorbereiding: deze dienen altijd geëxpliciteerd te worden

• veranderingen in gegevens sinds de start van het beleid: deze dienen altijd geëxpliciteerd te worden

Handleiding DDO

156 Bijlage 5c Voorbeelden van toepassing normen uit eerder Rekenkameronderzoek

Van de voorbeelden die in deze bijlage worden beschreven hebben alleen

de onderzoeken Groeicijfers Schiphol en Fiscale faciliteit voor het

leerlingwezen betrekking op de fase van beleidsvoorbereiding. Alle andere

onderzoeken hebben betrekking op de fase van beleidsuitvoering.

HOOFDNORM 1: RELEVANTIE

Voorbeeld 1:

In het onderzoek Informatievoorziening en kengetallen (Algemene

Rekenkamer, 1997c) werd de kwaliteit van de aanwezige kengetallen

onderzocht. Als een kengetal in de toelichting wordt opgenomen, moet de

betekenis van het getal voor de gebruiker duidelijk zijn. Er moet een

relatie gelegd kunnen worden tussen beleid(sdoelstellingen) en

kengetallen en de relatie tussen kengetal en het toegelichte bedrag moet

duidelijk zijn. Dit was vaak niet zo, en de Algemene Rekenkamer

concludeerde dat de relatie met beleid en budget nog onvoldoende wordt

toegelicht (p.16-17). Deze situatie zou gesproken kunnen worden van

niet-relevante informatie.

Overigens wordt in de Regeling prestatiegegevens en evaluatieonderzoek

rijksoverheid expliciet gesteld, dat systemen van reguliere

prestatiegegevens, evenals periodiek evaluatieonderzoek, dienen aan te

sluiten op het gebruiksdoel (Ministerie van Financiën 2001 p 37)..

Voorbeeld 2:

In het onderzoeksvoorstel van het onderzoek Verantwoorde cijfers

(Jaaroverzicht zorg 3, januari 1999) is het normenkader opgenomen. In

het onderzoek zal worden nagegaan of de zorginhoudelijke en de

financiële informatie relevant is. Gezien de doelgroep, de Tweede Kamer,

moeten de gegevens een hoog aggregatieniveau hebben en moeten de

gegevens onderdeel uitmaken van een cijferreeks die meerdere jaren

beslaat. Informatie is relevant als deze betrekking heeft op:

Handleiding DDO

157 - de kern van de stand van zaken van het zorgaanbod;

- de belangrijkste ontwikkelingen;

- de kernpunten van het beleid.

Subnorm volledigheid

In veel Rekenkameronderzoeken wordt ingegaan op de volledigheid van

beschikbare beleidsinformatie. Hieronder wordt een aantal voorbeelden

(lang niet uitputtend) beschreven, gerangschikt naar het onderzochte

element van de beleidsinformatie.

Algemeen

Voorbeeld 1:


(Jaaroverzicht zorg 3, januari 1999) is het normenkader opgenomen. Aan

de volledigheid van de zorginhoudelijke informatie zullen de volgende

eisen gesteld worden. Informatie over beleid dient in ieder geval een

beschrijving van de externe beleidsdoelen te betreffen, wat hiervan de

resultaten waren (gemeten in prestaties en effecten) en wat de relatie

tussen de doelen en de resultaten was. Tevens wordt een relatie gelegd

met de middelen. Zorginhoudelijke informatie is zo mogelijk in de vorm

gegoten van kengetallen.

Overigens is het Jaaroverzicht zorg niet de enige informatiebron,

daarnaast zijn er De staat van de gezondheidszorg en de Volksgezondheid

Toekomstverkenningen. Overlap daarmee dient te worden vermeden.

Maatschappelijk probleem

Geen geschikt voorbeeld bekend.

Beleidsinstrumenten

Voorbeeld 1:

In het onderzoek Geluidshinder Defensie (Algemene Rekenkamer, 1998b)

werd (de realisatie van) de voorgenomen maatregelen onderzocht.

Voorbeeld 2:

In het onderzoek Afvalpreventie (Algemene Rekenkamer, 1997a) werd de

ontwikkeling, inzet en doorwerking van de beleidsinstrumenten

onderzocht.

Motivatie instrumentkeuze

Voorbeeld 1:

Handleiding DDO

158 In het onderzoek Fiscale faciliteit voor het leerlingwezen (Algemene

Rekenkamer, 1998a) is de normatiek voor de beleidsvoorbereiding

overzichtelijk beschreven in bijlage 1. Een groot deel van deze normen

hebben betekenis voor de beleidsinformatie ten tijde van de

voorbereiding van nieuw beleid. Als meest cruciale eis van de

beleidsvoorbereiding wordt genoemd: een adequate plausibiliteittoets van

het veronderstelde verband tussen het in te zetten instrument en het te

bereiken doel. Hieraan was in het geval van de fiscale faciliteit voor het

leerlingwezen niet voldaan.

Voorbeeld 2:

In het onderzoek Voorlichtingscampagnes van het Rijk (Algemene

Rekenkamer, 1991b) werd aan de motivatie van het instrument

voorlichting de volgende eis gesteld: voorlichting gericht op beïnvloeding

van houding en/of gedrag is alleen acceptabel, indien: (a) sprake is van

parlementair aanvaard beleid, (b) het een niet (te) controversieel

onderwerp betreft, en (c) de voorlichting inhoudelijk voldoende en juiste

informatie bevat, zodanig dat belanghebbenden in staat zijn zich

zelfstandig een oordeel te vormen.

Voorbeeld 3:

In het onderzoek Subsidies (Algemene Rekenkamer, 1990) werd

nagegaan of bij subsidieregelingen met een financieel belang groter dan 1

miljoen voorafgaand aan de subsidieregeling een ex-ante-evaluatie was

verricht. Indien er geen ex-ante-evaluatie wordt verricht, moest de

motivatie daarvoor schriftelijk zijn vastgelegd. In de ex-ante-evaluatie

van een subsidiemaatregel moest onder meer worden ingegaan op de

(veronderstelde) relatie tussen het subsidie-instrument en de

beleidsdoelstelling, dat wil zeggen: er moet een plausibele redenering zijn

waarom het instrument bijdraagt aan de beleidsdoelstelling. Een

strengere eis is dat de verschillende mogelijke (combinaties van/andere

soorten) instrumenten tegen elkaar worden afgewogen aan de hand van

een aantal criteria, waaronder in elk geval de verwachte mate van

doelrealisatie.

De kosten van het beleid

Voorbeeld 1:

In het onderzoek Vergunningen (Algemene Rekenkamer, 1996b) werd

onderzocht of inzicht bestond in de kosten van vergunningenstelsels. De

volgende uitgaven en ontvangsten werden meegerekend:

uitvoeringskosten van de vergunningverlening, ontvangen leges, en

andere ontvangsten als gevolg van vergunningsverlening (uit de

exploitatie van onroerende zaken die eigendom zijn van de staat). De

Handleiding DDO

159 uitvoeringskosten van de handhaving werden niet in het onderzoek

betrokken.

Voorbeeld 2:

Het juniverslag 1994 van de Algemene Rekenkamer bevat twee

onderzoeken waarbij is getracht de uitvoeringskosten in kaart te brengen.

In het onderzoek Milieusubsidies (p. 42-56) onderzocht de Algemene

Rekenkamer de uitvoeringskosten van vijf subsidieregelingen voor

bedrijven. Wegens het ontbreken van tijden kostenregistratie waren de

uitvoeringskosten niet vast te stellen. In het onderzoek Natuurbeleidsplan

(p.77-87) stelde de Algemene Rekenkamer vast dat de administratie bij

het ministerie niet zo is ingericht dat een goed inzicht ontstaat in de

uitgaven ten behoeve van de realisatie van het Natuurbeleidsplan.

Betrokken partijen en verdeling taken en verantwoordelijkheden

Voorbeeld 1:

In het onderzoek Fondsbeheer in de sociale zekerheid (Algemene

Rekenkamer, 1995a) werd de verdeling van taken en bevoegdheden bij

het beheer van drie fondsen in de sociale zekerheid onderzocht. De

regeling werd sluitend geacht wanneer daarin was vastgelegd dat:

- de rechtmatigheid van de bedragen gecontroleerd moet worden door

een ander dan het collecterend of distribuerend orgaan zelf, namelijk

een externe accountant, een fondsbeheerder, een toezichthouder of

een controleur die valt onder de controlestructuur van de rijksdienst;

- de controleur de noodzakelijke bevoegdheden heeft om de controles

uit te voeren, zoals bijvoorbeeld de bevoegdheid tot inzage in boeken

en bescheiden;

- er geen overlap in controletaken is tussen de fondsbeheerder en de

controleur;

- de fondsbeheerder zich van de reikwijdte en uitkomsten van de

controle kan vergewissen.

Voorbeeld 2:

In het onderzoek Fonds voorheffing pensioenverzekering (Algemene

Rekenkamer, 1997b) ging de Algemene Rekenkamer onder meer na of de

verdeling van taken en bevoegdheden over een aantal organen, volgens

de wet en het besluit Fonds voorheffing pensioenverzekering, sluitend en

samenhangend is (p. 12-14).

Implementatie- en uitvoeringsproblemen/ succes- en faalfactoren

Voorbeeld 1:

Aanleiding voor het onderzoek Ontslaguitkeringen bij universiteiten,

academische ziekenhuizen en onderzoeksinstellingen (Algemene

Handleiding DDO

160 Rekenkamer, 1995b) was dat de ontslaguitkeringen in geld en aantal

personen waren gegroeid, terwijl de beleidsdoelstelling gericht was op

terugdringing. De Algemene Rekenkamer onderzocht wat de oorzaken

daarvan waren.

Efficiëntie

Voorbeeld 1:

In het onderzoek Kwaliteit uitvoering Europese akkerbouwregeling

(Algemene Rekenkamer, 1998d) verstond de Algemene Rekenkamer

onder een efficiënte uitvoering dat de regeling wordt uitgevoerd tegen

minimale kosten, gegeven een bepaalde kwaliteit van dienstverlening. De

uitvoerende organisatie had zelf een onderzoek gedaan naar efficiëntie

van vijf regiokantoren, waaruit grote verschillen in tijdsbesteding per

aanvraag bleken. De Algemene Rekenkamer beoordeelde of de gebruikte

gegevens volledig, juist, tijdig en regelmatig waren. Tevens ging de

Algemene Rekenkamer na welke verklaringen voor deze verschillen

werden gegeven en of aan alle mogelijke verklaringen aandacht was

besteed (p. 17-19).

Voorbeeld 2:

In het onderzoek Verhaalsrecht in de ziekenfondswet (Algemene

Rekenkamer, 1996c) werd onderzocht in hoeverre ziekenfondsen de

letselschade van ziekenfondsverzekerden verhaalde op de

(schadeverzekering van) de veroorzaker. De opbrengsten per verzekerde

bleken tussen de ziekenfondsen en de jaren sterk te verschillen. De

Algemene Rekenkamer trachtte de verschillen te verklaren en ging na in

hoeverre de ziekenfondsen de oorzaken konden beïnvloeden. Op basis

daarvan formuleerde de Algemene Rekenkamer minimumeisen voor een

optimale verhaalsuitvoering.

Tussentijdse veranderingen

Voorbeeld 1:

In het onderzoek Groeicijfers Schiphol (Algemene Rekenkamer, 1998c)

deed de Algemene Rekenkamer de volgende aanbeveling: “Wijzigingen

van invoergegevens die van wezenlijk belang zijn voor de uitkomst van

berekeningen dienen geëxpliciteerd te worden voor de besluitvorming.”

(p. 61)

Voorbeeld 2:

In het onderzoek Afvalpreventie (Algemene Rekenkamer, 1997a)

constateerde de Algemene Rekenkamer dat in het afvalpreventiebeleid

een accentverschuiving was opgetreden, die pas na afronding van het

Handleiding DDO

161 Rekenkameronderzoek in een notitie aan de Tweede Kamer werd

verwoord.

Voorbeeld 3:

In het onderzoek Efficiëntie van arbeidsbureaus (Algemene Rekenkamer

2001) heeft de Algemene Rekenkamer gegevens over de kosten en

prestaties van arbeidsbureaus verzameld en alles voorbereid om hieruit

de relatieve efficiëntie te berekenen en verklaringen te zoeken. Diverse

econometrische technieken zijn ingezet. De resultaten hiervan waren

dermate onmogelijk, dat geconcludeerd moest worden dat de

onderliggende data te slecht waren om uitspraken over de efficiëntie van

de diverse arbeidsbureaus te doen.

Prestaties en effecten (doelrealisatie)

Voorbeeld 1:


werd de informatie over doelrealisatie onderzocht. De Algemene

Rekenkamer ging op grond van milieueffectrapporten na of de realisering

van de milieudoelstellingen van de planologische kernbeslissing (PKB) in

2015 haalbaar zijn. Zij concludeerde dat doelrealisatie zonder trendbreuk

onwaarschijnlijk is. Voor het beoordelen van de mate van doelrealisatie

hoeft dus niet gewacht te worden op het jaar waarin de doelstelling

gerealiseerd moet zijn. Eerder kan al gekeken worden of doelen haalbaar

zijn resp. of doelrealisatie op schema ligt.

Voorbeeld 2:

Uit het onderzoek Subsidies (Algemene Rekenkamer, 1990) bleek dat het

ministerie vaker inzicht heeft in de doelrealisatie van subsidies wanneer

een ex-ante-evaluatie is verricht, wanneer vooraf evaluatiecriteria zijn

opgesteld en wanneer een ex-post-evaluatie is gedaan. Geen van deze

drie ‘voorwaarden’ garandeert echter dat er inzicht in doelrealisatie is.

Voorbeeld 3:

In het onderzoek Voorlichtingscampagnes van het Rijk (Algemene

Rekenkamer, 1991b) werden drie vormen van informatie over resultaten/

doelrealisatie onderscheiden:

- Bereik: de mate waarin de doelgroep van de voorlichting in contact is

gekomen met (één of meer) voorlichtingsmiddelen, kennis heeft

genomen van deze boodschap, deze heeft begrepen en vervolgens

heeft geaccepteerd.

- Effecten: de als gevolg van de voorlichting bij de doelgroep

optredende veranderingen in kennis, houding en/of gedrag.

Handleiding DDO

162 - Effectiviteit: de bijdrage die de voorlichting levert aan de realisatie

van de beleidsdoelstellingen.

- Hierin zijn ook eerder gerealiseerde percentages voor bereik, effecten

en effectiviteit voor een groot aantal campagnes te vinden.

- Aan uitvoering van een ex-post-evaluatieonderzoek gaf de Algemene

Rekenkamer de voorkeur boven het registreren van cijfers

betreffende de oplage, distributie en afname van

voorlichtingsmiddelen, zoals kijkcijfers en aantal deelnemers aan

activiteiten. Bij campagnes met een beperkt financieel belang

(bijvoorbeeld minder dan f 500.000 of f 1 miljoen) kan een

kosten/baten-afweging leiden tot het niet uitvoeren van zo’n

onderzoek.

Subnorm actualiteit

Voorbeeld 1:


werd geconstateerd dat bij de berekening van de externe veiligheid

gebruikgemaakt leek te worden van verouderde gegevens over het

startgewicht van vliegtuigen (p. 42-43).

Subnorm tijdigheid

Voorbeeld 1:


werd van sommige informatie gesteld dat deze te laat beschikbaar kwam

om een rol te kunnen spelen in de discussie en besluitvorming.

HOOFNORM 2: BETROUWBAARHEID/JUISTHEID

Voorbeeld 1:


werd de betrouwbaarheid van de beleidsinformatie onderzocht.

Geconcludeerd dat de onzekerheden in de informatie die ten grondslag

lag aan de PKB groot waren omdat veel veronderstellingen op elkaar

gestapeld werden. De PKB was daardoor een risicovol besluit.

Voorts werd de juistheid van modellen onderzocht aan de hand van de

volgende vragen:

- Zijn de veronderstellingen die ten grondslag liggen aan

prognosemodellen juist?

- Zijn alle relevante factoren in het model opgenomen?

Handleiding DDO

163 - Worden de prognoses bijgesteld als recente ontwikkelingen daartoe

aanleiding geven?

- Zijn de juiste invoergegevens gebruikt?

Voorbeeld 2:

In het Rechtmatigheidsonderzoek 1997 wordt de kwaliteit van de

verantwoordingsinformatie in de Miljoenennota beoordeeld. Hierbij wordt

als norm gesteld dat onzekerheden vermeld en zo mogelijk

gekwantificeerd moeten worden (p. 43).

Voorbeeld 3:

In het onderzoek Ontwikkeling en herverdeling politiesterkte 1994-1995

(Algemene Rekenkamer, 1997d), onderzocht de Algemene Rekenkamer

(onder meer) de informatievoorziening over de politiesterkte en de

verantwoordingsinformatie over de besteding van de financiële middelen

daarvoor. Het onderzoek was een vervolg op drie eerdere onderzoeken

naar dit onderwerp. De Algemene Rekenkamer stelde als norm dat de

juistheid en volledigheid van de gegevens gewaarborgd moet zijn.

Daarvoor dienen niet alleen voldoende waarborgen te zijn voor de

vaststelling en controle van gegevens aanwezig te zijn, maar moeten ook

de gehanteerde definities en uitgangspunten eenduidig en

operationaliseerbaar zijn.

Zo was het begrip ‘blauw op straat’ niet goed gedefinieerd en bleek het

‘executieve personeel’ niet hetzelfde te zijn als ‘blauw op straat’ (een

voorbeeld van onvoldoende validiteit). Verder bleek dat het begrip

‘feitelijke sterkte’ niet eenduidig gedefinieerd te zijn. Daardoor telde

bijvoorbeeld de ene regio vrijwilligers, aspiranten en/of

parkeercontroleurs wel mee en de andere niet (voorbeeld van

onvoldoende betrouwbaarheid). Ook bleek dat controle op de gegevens

door een onafhankelijke derde niet plaatsvond (waarborg voor betrouw-

baarheid). Ook constateerde de Algemene Rekenkamer dat informatie aan

de Tweede Kamer over de verhouding tussen personele en materiële

uitgaven onjuist was geweest.

Overigens blijkt uit de reactie van de minister van BZK dat hij vindt dat

aan de betrouwbaarheid van verantwoordingsinformatie hogere eisen

gesteld mogen worden dan aan beleidsinformatie.

Voorbeeld 4:


(Jaaroverzicht zorg 3, januari 1999) is het normenkader ontwikkeld. In

het onderzoek zal worden nagegaan of de financiële informatie juist is

aan de hand van de volgende normen:

Handleiding DDO

164 - De verantwoordingscijfers moeten zijn voorzien van een adequate

accountantsverklaring. Bij publieke middelen gaat het om een

rechtmatigheidsverklaring, bij private middelen om een

getrouwheidsverklaring.

- Bij de beoordeling van de realisatiecijfers hanteert de Algemene

Rekenkamer een tolerantie van 1% van het totaal van de

verantwoorde geldstroom in de betreffende deelsector.

HOOFDNORM 3: VERGELIJKBAARHEID

Subnorm consistentie

Voorbeeld 1:

In het deelonderzoek NT2 van het onderzoek Integratiebeleid etnische

minderheden (Algemene Rekenkamer, 1999b) bleken verschillende

vormen van inconsistentie in de gegevens:

- Het begrip ‘wachtlijst’ werd door de minister anders gedefinieerd dan

door de onderzoekers (consistentie tussen onderdelen in de

beleidsketen).

- De omvang van het cursusaanbod werd soms in cursistenplaatsen en

soms in lesuren uitgedrukt (consistentie tussen informatiebronnen).

Deze gegevens konden niet bij elkaar worden opgeteld door het

ontbreken van een omrekensleutel.

- Door uitkomsten van verschillende evaluatieonderzoeken en monitors

met elkaar te vergelijken werd duidelijk dat sommige bronnen

consequent afweken van de rest. Dit is opgevat als teken aan de

wand. Een verklaring werd later gevonden in niet-representatieve

steekproef respectievelijk respons (consistentie tussen informatie-

bronnen).

Voorbeeld 2:


constateerde de Algemene Rekenkamer dat de PKB intern inconsistent

was, doordat bij de vervoerprognoses werd uitgegaan van een daling van

de luchtvaarttarieven en bij de substitutieberekeningen van een stijging

(consistentie binnen een informatiebron, p. 30 en 37). De Algemene

Rekenkamer deed naar aanleiding daarvan de volgende aanbeveling:

“Juist als sprake is van grote onzekerheden dient consistent te worden

omgegaan met het verwerken van factoren die van invloed zijn op de

uitkomsten van prognoses.” (p. 60).

Handleiding DDO

165 Voorts: “De transparantie in de besluitvorming is ermee gediend dat

prognoses worden vergeleken met prognoses van anderen, in het

bijzonder wanneer sprake is van grote onzekerheden en lange termijn

voorspellingen.” (consistentie tussen informatiebronnen, p. 61).

Handleiding DDO

166 Bijlage 6 Beschrijving modus-operandi-methode

De modus-operandi-methode is afkomstig van Michael Scriven. De

methode (letterlijke vertaling van ‘modus operandi’: wijze van werking)

wordt door hem ook wel aangeduid als het ‘detective paradigma’. In feite

is het een fraaie benaming voor een eliminatiemethode. Zoals bij het

zoeken van een dader diverse mogelijkheden worden uitgeschakeld, zo

geschiedt dat ook bij deze methode: voor de successievelijke rivali-

serende factoren wordt getracht te beargumenteren, dat deze geen rol

hebben gespeeld.

De methode bevat vier stappen, waarbij vooral de laatste twee stappen

kenmerkend zijn: het beargumenteren of een factor al dan geen rol heeft

gespeeld door na te gaan of in het concrete geval de factor werkzaam is

geweest volgens de voor deze factor karakteristieke

paden/tussenschakels.

De vier stappen zijn als volgt:

- welke verklaringen Xi zijn mogelijk voor verschijnsel Y?

- welke factoren, die de verklaringen Xi zouden kunnen opleveren, zijn

inderdaad aanwezig geweest?

- welke karakteristieke kenmerken vertonen de causale paden die van

Xi (voor zover aanwezig) naar Y leiden?

- van welke Xi zijn zulke kenmerken inderdaad in de werkelijkheid

aanwezig geweest en in welke mate?

De procedure wordt voor iedere rivaliserende factor herhaald tot een

beeld verkregen is, in hoeverre Y door de inzet van het onderzochte

beleidsinstrumentarium dan wel (mede) door rivaliserende factoren is

bepaald.

De modus-operandi-methode is onder andere toegepast in een studie van

Bressers naar de effectiviteit van het waterkwaliteitsbeleid103.

103J.Th. A. Bressers, Beleidseffektiviteit en waterkwaliteitsbeleid; een bestuurskundig onderzoek,

dissertatie T.H. Twente, 1982.

Handleiding DDO

167 Bijlage 7 Checklist: is het mogelijk zelf de doelmatigheid te berekenen?

Het is verstandig eerst de hoofdstuk 8 van deze handleiding door te

nemen voordat de onderstaande checklist ingevuld wordt.

Is de doelstelling van voldoende kwaliteit?

0. Is de doelstelling van voldoende kwaliteit om te bepalen welke

effecten/prestaties men wil bereiken met het beleid of is de

doelstelling alsnog eenvoudig vast te stellen?

Zijn de effecten/prestaties te meten?

1. Zijn de effecten van beleid te meten (desnoods via indicator of proxy-

variabele)?

2. Zijn de prestaties van beleid te meten (desnoods via indicator of

proxy-variabele)?

Beslismoment 1:

Denk bij dit eerste beslismoment aan de stapsgewijze aanpak in

hoofdstuk 8: begin daar waar de meeste mogelijkheden liggen. Als op

vraag 0 ‘nee’ is geantwoord, moet een andere doelstelling worden

gekozen of de formulering van de doelstelling worden verbeterd.

Als de doelstelling van voldoende kwaliteit is en op vraag 1 of 2 is ‘ja’

geantwoord, kan verder worden gegaan.

Als van vraag 1 en 2 alleen vraag 1 met ‘ja’ is beantwoord, geldt in

onderstaande vragen steeds bij ‘effecten/prestaties’: effecten. Als

daarvan alleen vraag 2 met ‘ja’ is beantwoord geldt steeds: prestaties.

Zijn er gegevens104 van voldoende kwaliteit105?

3. Zijn gegevens van voldoende kwaliteit over effecten/prestaties

beschikbaar of eenvoudig te verzamelen en zijn deze gegevens voor

minstens twee tijdstippen of organisaties beschikbaar?

104 Of een benadering daarvan via indicatoren of proxy-variabelen. 105 Kwaliteit: relevant, betrouwbaar en vergelijkbaar. Denk bij relevant aan onder andere alle voor

beleid van belang zijnde effecten, prestaties en alle voor het leveren daarvan van belang zijnde

middelen enzovoort. Zie verder hoofdstuk 8.

Handleiding DDO

168 4. Zijn gegevens van voldoende kwaliteit over middelen beschikbaar of

eenvoudig te verzamelen en zijn deze gegevens voor minstens twee

tijdstippen of organisaties beschikbaar?

5. Zijn gegevens van voldoende kwaliteit over ‘kwaliteit’ van de

effecten/prestaties beschikbaar of eenvoudig te verzamelen en zijn deze

gegevens voor minstens twee tijdstippen of organisaties beschikbaar?

6. Zijn gegevens van voldoende kwaliteit over verklaringen beschikbaar of

eenvoudig te verzamelen en zijn deze gegevens voor minstens twee

tijdstippen of organisaties beschikbaar?

Beslismoment 2:

Er moet in elk geval op elk van de vragen 3 t/m 5 ‘ja’ zijn geantwoord om een

doelmatigheidsscore te kunnen berekenen. Als ook vraag 6 met ‘ja’ is

beantwoord, kan gekeken worden naar de factoren die mogelijk de verschillen

in de doelmatigheid verklaren.

Voor de verschillende situaties waarin voorzichtigheid is geboden bij het

trekken van conclusies en het doen van aanbevelingen wordt verwezen

naar met name § 8.6.1.

Handleiding DDO

169 Bijlage 8 Algemene voorwaarden DEA en SFA

De uitkomsten van SFA en DEA-analyses moeten aan een aantal

voorwaarden voldoen om te mogen worden gebruikt. Dit zijn algemeen-

geldige voorwaarden. Met de met SFA geschatte relatie kunnen deze

voorwaarden worden getoetst. Met DEA kun je minder gemakkelijk en

minder eenduidig toetsen of daar aan voldaan is.

Mocht je dus bij je SFA-analyse ontdekken dat aan de voorwaarden niet is

voldaan, dan weet je in beginsel ook dat aan deze voorwaarden voor DEA

niet is voldaan. Dit betekent twee dingen:

1. als DEA nog niet is gebruikt voor analyses: dat je DEA beter achterwege

kan laten;

2. als zowel met DEA als met SFA al analyses zijn uitgevoerd: dat je de

uitkomsten van beide analyses niet mag gebruiken. Deze voorwaarden

worden immers impliciet in deze techniek verondersteld. Als er niet aan

de voorwaarden is voldaan zouden organisaties mogelijk ten onrechte als

(on)doelmatig worden bestempeld.

Om welke voorwaarden gaat het?

• De marginale kosten zijn overwegend positief (‘no free lunch’).

Marginale kosten zijn de extra kosten die verbonden zijn aan het

leveren van één extra eenheid prestatie. Wanneer een instelling één

eenheid prestatie meer wil leveren zijn daarvoor extra middelen nodig

en moeten daarvoor dus extra middelen worden ingezet. Als uit de

analyse blijkt dat voor veel instellingen het tegenovergestelde geldt,

dus dat veel instellingen niet-positieve marginale kosten hebben, dan

weet je dat er iets goed fout zit (al is het niet altijd even simpel om

de oorzaken daarvoor te vinden) en dat je de uitkomsten niet mag

gebruiken.

• Wanneer uit de geschatte relatie blijkt dat er in de onderzochte sector

sprake is van variabele schaalopbrengsten (dus dat de prestaties

minder/meer dan proportioneel toenemen met een verandering in alle

middelen) dan zal doorgaans sprake zijn van:

o toenemende meeropbrengsten bij de kleinste instellingen: een

proportionele toename van alle middelen leidt tot een meer dan

proportionele toename in de prestaties;

Handleiding DDO

170 o constante meeropbrengsten bij de middelgrote instellingen: een

proportionele toename van alle middelen leidt tot een proportionele

toename in de prestaties;

o afnemende meeropbrengsten bij de grootste instellingen: een

proportionele toename van alle middelen leidt tot een minder dan

proportionele toename in de prestaties.

Het mag niet zo zijn dat er sprake is van een omgekeerd beeld (dus

eerst afnemende dan constante en dan toenemende

meeropbrengsten).

• Samenhangend met het voorgaande punt: wanneer uit de geschatte

relatie blijkt dat er in de onderzochte sector sprake is van variabele

schaalopbrengsten, dan zullen in theorie de gemiddelde kosten voor

kleine en grote instellingen in het algemeen relatief hoog en voor

middelgrote instellingen relatief laag zijn (U-vormige gemiddelde

kostencurve). Kleine instellingen hebben vaak te weinig personeel om

zich te specialiseren en hebben relatief veel overheadkosten. Grote

instellingen hebben de neiging te verbureaucratiseren, doordat het

voor het management onmogelijk is om alle aspecten van het

productieproces te beheersen, met onder meer relatief veel

overheadkosten als gevolg.

Er mag geen sprake zijn van het omgekeerde beeld.

Er zijn drie verklaringen mogelijk voor de constatering dat niet voldaan is

aan deze algemene voorwaarden (van SFA en DEA):

• de kwaliteit van de gegevens is slecht;

• in de relatie tussen de middelen en beleidsresultaten zijn niet alle

relevante factoren meegenomen (onvolledig of foute specificatie);

• er is sprake van chaos en/of volstrekt irrationeel gedrag in de

desbetreffende sector.

We illustreren hieronder hoe enkele elementen ook kunnen worden

getoetst in een analyse vooraf. We doen dit aan de hand van het al

eerder genoemde Rekenkameronderzoek naar arbeidsbureaus.

Arbeidsbureaus

In het onderzoek van de Algemene Rekenkamer naar de doelmatigheid

van arbeidsbureaus (Algemene Rekenkamer, 2001a)is ook met SFA de

relatie geschat tussen de kosten en de prestaties (het aantal

werkzoekenden dat op een vacature is geplaatst) van de arbeidsbureaus.

Uit de geschatte relatie blijkt dat voor vele arbeidsbureaus geldt dat hoe

meer prestaties men levert, hoe lager de kosten zijn (‘negatieve

marginale kosten’). Eveneens blijkt dat de gemiddelde kosten juist voor

Handleiding DDO

171 de middelgrote arbeidsbureaus het hoogst zijn, wat in strijd is met de

economische theorie die ook ten grondslag ligt aan SFA en DEA.

Dit laatste is ook af te lezen uit de doelmatigheidskengetallen voor

arbeidsbureaus zoals gegeven in de figuren in § 8.6.3.2. In de figuren zijn de

kosten per geplaatste werkzoekende afgezet tegen de zwaarte van de

werkzoekendenbestanden van de arbeidsbureaus. Hoewel je zou verwachten

dat moeilijk plaatsbare werkzoekenden relatief meer kosten met zich

meebrengen, is uit de figuren geen eenduidige relatie tussen de kosten per

geplaatste werkzoekende en de zwaarte van het werkzoekendenbestand af te

lezen. De kosten per geplaatste werkzoekende liggen onafhankelijk van de

omvang en zwaarte van de bestanden grofweg tussen de € 1.000 en € 3.000.

Ook wanneer expliciet rekening gehouden wordt met arbeidsmarkt-

omstandigheden blijkt er een vrij forse spreiding in de kosten per plaatsing te

zijn.

Er wordt dus niet voldaan aan de veronderstellingen die ten grondslag

liggen aan SFA en DEA.

Handleiding DDO

172 Bijlage 9 Begrippen

Activiteiten: al datgene wat in een ministerie of bij een derde wordt

uitgevoerd om middelen om te kunnen zetten in prestaties voor het beleid

Beleidsinformatie: informatie over de doelstellingen van beleid, de

beoogde en/of gerealiseerde effecten, de daartoe te leveren of geleverde

prestaties en de daarmee gemoeide kosten.

Betrouwbaarheid: de verzamelde informatie mag geen materiële

onjuistheden of onvolledigheden bevatten.

Doelgroepbereik: onderzoek naar de vraag of en hoe de uiteindelijke

doelgroepen van het beleid (burgers, instellingen, bedrijven) worden

bereikt.

Doelrealisatie (onderzoek naar): onderzoek naar de vraag of de met het

beleid beoogde prestaties en/of effecten daadwerkelijk zijn gerealiseerd.

Doelmatigheid van (beleids)effecten (doelmatigheid van beleid;

kosteneffectiviteit) gaat om de vraag

o of de effecten niet met de inzet van minder middelen gerealiseerd

hadden kunnen worden; dan wel

o of niet méér effecten verwezenlijkt hadden kunnen worden met

dezelfde inzet van middelen.

Doelmatigheid van (beleids)prestaties (doelmatigheid van bedrijfsvoering)

gaat om de vraag

o of de prestaties niet met de inzet van minder middelen gerealiseerd

hadden kunnen worden; dan wel

o of niet méér prestaties verwezenlijkt hadden kunnen worden met

dezelfde inzet van middelen.

Doeltreffendheid: onderzoek naar de vraag in hoeverre met het

regeringsbeleid de gewenste beleidsresultaten worden bereikt.

Doorwerkingsonderzoek: onderzoek naar de vraag of de voorwaarden

hebben gewerkt die de minister gecreëerd heeft voor een goede

Handleiding DDO

173 uitvoering van het rijksbeleid op regionaal, provinciaal of gemeentelijk

niveau.

(Beleids)effecten (outcome): de gevolgen van het beleid die merkbaar

zijn in de maatschappij.

Effectiviteit: zie doeltreffendheid.

Efficiëntie: zie doelmatigheid.

Externe verklaringen: (mogelijke) verklaringen voor verschillen in

doelmatigheid die buiten het ministerie en/of de bij het beleid betrokken

organisatie liggen.

Interne verklaringen: (mogelijke) verklaringen voor verschillen in

doelmatigheid die binnen het ministerie en/of de bij het beleid betrokken

organisatie liggen.

Kwaliteit: verschillen in de kenmerken van dezelfde prestaties dan wel

effecten.

Kosten: de waarde van de verbruikte middelen die nodig zijn voor het

kunnen uitoefenen van de bedrijfsvoering.

Middelen: het ingezette personeel, het verbruikte materiaal, de

ingehuurde diensten en de uitgaven aan (niet-) financiële

beleidsinstrumenten (zoals subsidies, leningen en voorlichtings-

programma’s).

Neveneffecten: maatschappelijk gevolgen van beleid, anders dan de

primair beoogde. Het kan hierbij gaan om bedoelde en onbedoelde

neveneffecten.

Prestatiegegevens: er zijn drie typen van prestatiegegevens:

o beleidsdoelstellingen, zo veel mogelijk geoperationaliseerd in termen

van nagestreefde en gerealiseerde effecten, gekoppeld aan

doelgroepen van beleid en een tijdshorizon;

o informatie over kostprijs en kwaliteit van de door de overheid te

leveren / geleverde prestaties (producten en diensten);

o programma-uitgaven, zo veel als zinvol onderbouwd met volume- en

prijsgegevens (bijvoorbeeld het verwachte aantal begunstigden van

een subsidieregeling en het bedrag per subsidie).

Handleiding DDO

174 (Beleids)prestaties (output): de resultaten van werkprocessen die binnen

een organisatie worden doorlopen om een beleidsdoelstelling te

realiseren.

Relevantie: ‘relevant’ is die informatie die het beleid, respectievelijk de

activiteiten van het betrokken ministerie of de betrokken organisatie(s)

adequaat weerspiegelt.

SMART-C: norm voor de formulering van beleidsdoelen. Specifiek,

Meetbaar, Afgestemd, Realistisch, Tijdgebonden en Consistent.

Uitgaven: betalingen die zijn gedaan op basis van aangegane

verplichtingen.

Vergelijkbaarheid: de verzamelde informatie dient in tijdsperspectief en

tussen organisaties vergelijkbaar te zijn.

Download - Rekenkamer Metropool Amsterdam | Homepage ......2015/01/12 · Rekenkamer 3 1.1.1 Doelrealisatie 3 1.1.2 Doelgroepbereik 4 1.1.3 Doeltreffendheid 5 1.1.4 Doelmatigheid 5 1.2 Leeswijzer

Top Related