• No results found

Validatie van de metingen van ouderbetrokkenheid

ouderbetrokkenheid In dit hoofdstuk ligt de focus op resultaten van onderzoek waarin aan de hand van een

3.4 Een nieuw theoretisch model voor de relatie tussen (determinanten van) ouderbetrokkenheid en de schoolse vaardigheden van kinderen

4.3.1 Validatie van de metingen van ouderbetrokkenheid

In hoofdstuk 3 is een theoretisch basismodel voor de relaties tussen (determinanten van) ouderbetrokkenheid en schoolse vaardigheden van kinderen beschreven. Dit model is tot stand gekomen op basis van in de wetenschappelijke literatuur aangetoonde empirische relaties. Getracht is daarbij overlap tussen de verschillende constructen te voorkomen. Met behulp van toetsende factoranalyses zijn de metingen van de ouder- betrokkenheidsconstructen gevalideerd. Hiervoor is het programma MPlus gebruikt (versie 7, Muthén & Muthén, 2015), met als schattingsmethode WLSMV (weighted least squares with robust standard errors and means and variances), omdat de items categorisch zijn: er zijn immers maar vijf antwoordcategorieën (Likert schalen). De "linkerkant" van het model, dus de constructen die bij ouders gemeten zijn, is getoetst. Het model bevatte alle constructen gemeten met meer dan één item.

Voor het passend maken van het model wordt gekeken naar verschillende uitkomst- maten of fit-indices. De χ² “goodness-of-fit” maat toetst de “exacte fit” en geeft aan of het model perfect past bij de data. Omdat de χ² een erg grote power heeft bij grote 19 Dit heeft te maken met de manier waarop de oude generatie toetsen bij Cito wordt vervangen door een nieuwe generatie: ieder schooljaar komt er weer een nieuwe “klas” beschikbaar. Ten tijde van de dataverzameling voor dit onderzoek had Cito alleen nog de leergroepen 3 en 4 vervangen, de groepen 5 en hoger kwamen pas later beschikbaar voor scholen om te gebruiken.

steekproeven en omdat exacte fit een erg streng criterium is voor de sociale weten- schappen, is ook gekeken naar de Comparative Fit Index (CFI), de Tucker-Lewis Index (TLI) en de Root Mean Square Error of Approximation (RMSEA) (MacCallum, Browne & Sugawara, 1996). Deze laatste indices zijn gekozen omdat zij minder gevoelig zijn voor steekproefgrootte en compenseren voor de complexiteit van het model (Hu & Bentler, 1999).

Er kan gesproken worden van een goed passend model (“good fit”) en daarmee de minste kans op het onterecht verwerpen van een model bij een combinatie van de volgende waarden van de verschillende indices: CFI en TLI ≥ .95 en RMSEA ≤.06. Een acceptabel passend model (“fair fit”) kan gevonden worden bij een CFI en TLI ≥ .90 en RMSEA ≤.08. Een middelmatig passend model (“mediocre fit”) kent een RMSEA tussen .08 en .10 en een slecht passend model heeft een RMSEA ≥.10 (Hu & Bentler, 1999). Op basis van de modificatie indices per item en de significantie van de factorladingen van items, zijn slechte items verwijderd.

Met de gestandaardiseerde correlaties tussen de latente variabelen is na de uitvoering van een confirmatieve factoranalyse bekeken of variabelen samengevoegd moesten worden, waarbij ook steeds een theoretische afweging is gemaakt.

4.3.2 Meetinvariantie

In onderzoek wordt er soms impliciet vanuit gegaan dat constructen bij verschillende groepen dezelfde betekenis hebben, ofwel dat er hetzelfde gemeten wordt op dezelfde schaal (Koomen, Verschueren, Van Schooten, Jak & Pianta, 2012). Als de gebruikte meet- instrumenten echter niet meetinvariant zijn over verschillende groepen, zijn conclusies over verschillen tussen groepen spurieus. Omdat niet op voorhand duidelijk is of de items van het model voor ouderbetrokkenheid voor verschillende groepen ouders dezelfde constructen meten op dezelfde schaal, zal getoetst worden of de meting van het model meetinvariant is ten opzichte van verschillende groepen ouders. Het gaat daarbij om de volgende groepen:

• ouders uit het basis- en voortgezet onderwijs • ouders uit groep 4 en groep 7

• ouders met een laag, middelbaar of hoog opleidingsniveau • ouders van jongens en meisjes

• ouders die thuis alleen Nederlands spreken met hun kinderen en ouders die Nederlands en/of een andere taal spreken met hun kinderen.

Meetinvariantie kent verschillende gradaties. In dit onderzoek is het onderscheid tussen metric invariance en scalar invariance gehanteerd (Vandenberg & Lance, 2000, Cheung & Rensvold, 2002; Meredith & Teresi, 2006;). Bij metric invariance wordt aangenomen dat de gemeten constructen in de onderscheiden groepen respondenten hetzelfde meten. Deze gradatie van meetinvariantie wordt getoetst door de fit van twee geneste modellen te vergelijken: 1) een model met over groepen heen gelijke factorladingen, maar verschillende intercepten en residuen en 2) een model waarbij alle drie genoemde groepen parameters vrij mogen variëren tussen groepen (configural invariance). Als het eerste model niet significant slechter past dan het tweede model, is sprake van metric invariance. Bij metric invariance is echter nog onzeker of de constructen op dezelfde schaal zijn gemeten. Als er niet op dezelfde schaal is gemeten in beide groepen, kunnen scores tussen de groepen niet vergeleken worden.

Bij scalar invariance wordt aangenomen dat dezelfde constructen zijn gemeten in de onderscheiden groepen én dat deze op dezelfde schaal zijn gemeten. Deze gradatie van meetinvariantie wordt getoetst door wederom de fit van twee geneste modellen te vergelijken: 1) een model met alleen gelijke factorladingen over alle groepen (het metric model) en 2) een model met gelijke factorladingen en gelijke intercepten. Voor het interpreteren van resultaten over groepen heen, is metric invariance een vereiste. Voor het vergelijken van verschillen tussen groepen, moet ook scalar invariance worden aangetoond.

De verschillen tussen de geneste modellen die hierboven worden genoemd, zijn nagegaan door de verslechtering van de modelfits te toetsen met behulp van de χ2. Ook hier geldt weer dat deze index erg veel power heeft bij grote steekproeven en erg streng is (exacte fit wordt getoetst), zodat triviale verschillen toch een significante fitverslechtering kunnen aangeven. Daarom is ook gekeken naar de Root Deterioration per Restriction (RDR; Browne & Du Toit, 1992; Dudgeon, 2004), de Expected Cross-Va- lidation Index (ECVI) (Browne & Du Toit, 1992; Oort, 2009), en het CFI verschil (Cheung

& Rensvold, 2002). Het computer programma NIESEM is gebruikt voor het berekenen van de RDR waarden (Dudgeon, 2003). Als het χ2 verschil niet significant is, worden de modellen als gelijk beschouwd. Omdat de RDR verwant is aan de RMSEA (Browne & Du Toit, 1992), hanteren we dezelfde grenswaarden om de verschillen in fit te evalueren. Als RDR niet groter wordt dan .08, beschouwen we de modellen als ongeveer gelijkwaardig. Ten slotte, gebaseerd op de Monte Carlo simulatiestudie van Cheung en Rensvold (2002), mag het verschil in CFI niet groter zijn dan .01 om van gelijkwaardige modellen te spreken. Van een serieus verschil is sprake als delta CFI groter is dan .02 (Cheung & Rensvold, 1999). Uiteraard is in alle gevallen waarbij de modellen gelijkwaardig zijn, gekozen voor het spaarzaamste model, dat wil zeggen het model met de minste geschatte parameters.

4.3.3 Beschrijvende analyses: groepsgemiddelden en relaties tussen deter-