HOOFDSTUK 8 DATA ANALYSE
8.1 Betrouwbaarheid steekproefgrootte
Een belangrijke indicator voor de betrouwbaarheid van een onderzoek ligt in het aantal
respondenten. Op basis van de gewenste betrouwbaarheid en foutmarge is in paragraaf 3.3.1
vastgesteld dat er minimaal 59 respondenten van de 418 gemeenten dienen deel te nemen. In deze
paragraaf zal aangetoond worden dat er 222 respondenten zijn die bruikbare resultaten hebben
ingevuld.
Om een overzicht te geven van de betrouwbaarheid zal allereerst ingegaan worden op respondenten
die gestopt zijn met invullen, vervolgens dat er vijf respondenten betiteld worden als ‘uitschieter’
waardoor ze uit de resultaten verwijderd worden. Uiteindelijk zal geconcludeerd worden wat de
betrouwbaarheid van de steekproef is.
8.1.1 GESTOPTE RESPONDENTEN
Na de sluiting van de internetenquête zijn in totaal 285 respondenten gestart met het invullen van de
enquête. Van deze 285 zijn er 58 respondenten gestopt om onbekende redenen. In tabel 4 is
aangegeven op welke pagina en voor welk onderwerp de respondenten zijn gestopt met invullen.
Pagina Onderwerp in enquête nadat respondent is gestopt Aantal
Pagina 1 Voor inventarisatie van mate van samenwerking. Mogelijke oorzaak
hiervan, is dat men concludeerde dat ze niet tot de doelgroep van de
enquête behoren, omdat hun gemeente niet samen werkt. Enkele
respondenten hebben dit per email kenbaar gemaakt.
12 (4,2%)
Pagina 2 Voor aanvang van inventarisatie succesfactoren. Mogelijke oorzaak
hiervan, is dat men concludeerde dat ze niet tot de doelgroep van de
enquête behoren. Enkele respondenten hebben dit per email kenbaar
gemaakt.
Hoofdstuk 8. Data analyse 83/180
Pagina 3 Voor stellingen gericht op de voorzitter en doelstelling. Eventuele reden
hiervoor is onduidelijk.
17 (6,0%)
Pagina 4 Voor stellingen die gericht zijn op inwoneraantallen en enkele
huishoudelijke vragen. Eventuele reden hiervoor is onduidelijk.
4 (1,4%)
Totaal 58 (20,4%)
Tabel 4. Aantal gestopte respondenten per onderdeel vragenlijst
8.1.2 UITSCHIETERS
Naast het stoppen met invullen, zijn er ook enkele respondenten die onbetrouwbare resultaten
invullen. Zo is er in dit onderzoek een respondent die op alle vragen ‘helemaal mee eens’ heeft
ingevuld. Dit is niet aannemelijk omdat het enerzijds raar is dat een respondent het overal helemaal
mee eens is. Zeker omdat enkele vragen zo waren geformuleerd dat het oneens zijn met de stelling
juist het goede antwoord is. Anderzijds is het raar dat een respondent continu dezelfde score geeft
en er geen variatie is.
Omdat dergelijke respondenten extreme antwoorden geven, wijken ze relatief veel af van de overige
respondenten. In de analyses betekent dit dat hun antwoorden een zeer grote invloed uitoefenen.
Aangezien het voor bovenstaand voorbeeld duidelijk is dat het een onbetrouwbare reactie is, zou er
een grote invloed worden gegeven aan onbetrouwbaar resultaat. Dergelijke uitschieters worden
daarom verwijderd uit de resultaten.
Het selecteren van uitschieters gebeurt door de gesommeerde score van een individuele respondent
te vergelijken met de totaalscores van alle respondenten. Zo ontstaat een verdeling van alle
respondenten zoals weergegeven in figuur 12. Hierin is per score aangegeven hoeveel respondenten
deze totaalscore hebben gehaald. In dit figuur valt op dat de meeste scores rond de 90 punten liggen
waarbij het uitvlakt naar beide zijden.
Figuur 12. Frequentieverdeling totaalscores ten behoeve van het bepalen van uitschieters
Om uitschieters te bepalen wordt er een scheiding getrokken tussen de ‘normale resultaten’ en de
‘extreme resultaten’. Dit gebeurt op basis van het percentage respondenten dat een bepaalde score
haalt. Wanneer een respondent hier ver boven of onder scoort, dan wordt hij getypeerd als
0 2 4 6 8 10 12 14 16 18 20 57 62 67 72 77 82 87 92 97 102 107 112 117 122 127 132 137
‘extreem’ en wordt hij verwijderd uit de onderzoeksresultaten. Het bepalen of een score extreem
hoog of laag is, is gebeurt op basis van de volgende gegevens:
• Het eerste kwartiel (Q1); de score die correspondeert met de laagste 25% van de
respondenten. Vijfenzeventig procent van de respondenten scoort dus hoger dan deze score.
Voor dit onderzoek is Q1 85;
• Het derde kwartiel (Q
3); de score die correspondeert met de hoogste 25% van de
respondenten. Vijfenzeventig procent van de respondenten scoort dus lager dan deze score.
Voor dit onderzoek is Q
395;
• De interkwartielafstand (IKA); een maat voor de spreiding van de verdeling, dus de mate
waarin de waarden onderling verschillen. De IKA is het verschil tussen Q1 en Q3 en in dit
onderzoek dus 10.
Het bepalen van de onder- en bovengrens gebeurt op basis van onderstaande formule.
1,5 · 85 1,5 · 10 70
1,5 · 95 1,5 · 10 110
In totaal zijn er vijf respondenten die boven de bovengrens, of onder de ondergrens scoren. De
extreme scores van de respondenten zijn weergegeven in tabel 5. Op basis van figuur 12 was te
verwachten dat deze scores relatief hoog of laag waren. Van deze resultaten wordt verondersteld dat
ze zo veel afwijken van de overige respondenten, dat ze niet betrouwbaar kunnen worden geacht.
Om die reden worden de vijf onderstaande resultaten niet meegenomen in de analyse.
Type uitschieter Scores van respondenten
Onder de ondergrens 59; 65; 67
Boven de bovengrens 112; 137
Tabel 5. Scores van uitschieters aan boven en onderzijde
8.1.3 BETROUWBAARHEID
Het resterende sample met betrouwbare en volledige resultaten bestaat uit 222 respondenten. In
paragraaf 3.3.1 is uitgewerkt dat een ‘normale’ betrouwbaarheid en foutmarge voor
wetenschappelijk onderzoek respectievelijk 95% en 5% zijn. Om vast te stellen wat de
betrouwbaarheid en foutmarge in dit onderzoek zijn, wordt onderstaande formule gebruikt die
eveneens in paragraaf 3.3.1 is gebruikt:
222 ! "
#$
· %0,51 0,5& · 418
"
#$· %0,51 0,5& 418 1(
)$Hoofdstuk 8. Data analyse 85/180
is allereerst Z
αop 1,65 ingesteld, omdat dit correspondeert met een betrouwbaarheid van 95%. Dit is
een veelgebruikte benodigde betrouwbaarheid in wetenschappelijk onderzoek. Hieruit volgt dat de
foutmarge slecht 3,8% is. In vergelijking met overig wetenschappelijk onderzoek een hoge score. Een
overzicht van de populatie, sample, betrouwbaarheid en foutmarge is gegeven in tabel 6.
Criterium Waarde
Totale populatie 418 gemeenten
Sample 222 gemeenten (53,1%)
Verwachte spreiding 50%
Betrouwbaarheidsniveau 95%
Foutmarge 3,8%
Tabel 6. Betrouwbaarheid en foutmarge van het onderzoek op basis van het resterende sample