Assumpties multiple regressie analyse - De nieuwe betrokkenheid? : een onderzoek naar de invloe

5. Resultaten

5.1 Assumpties multiple regressie analyse

Voordat de gestelde hypotheses van dit onderzoek behandeld kunnen worden, is het nodig om de genoemde assumpties te controleren. Om een multiple regressie analyse te gebruiken als een valide test zijn er een aantal assumpties waaraan voldaan moet worden. Deze zijn al kort naar voren gekomen in het vorige hoofdstuk. De assumpties worden getest aan de hand van de 9 items van HNW als onafhankelijke variabelen en de algemene betrokkenheid als afhankelijke variabele. Ten eerste wordt er getest op de onafhankelijkheid van de observaties. Het is aannemelijk dat de observaties niet van elkaar afhankelijk zijn, maar om hier een concrete uitspraak over te kunnen doen is er een Durbin-Watson test uitgevoerd. Met deze test kan er worden bepaald of de observaties van het onderzoek geen correlatie met elkaar vertonen. De waarde van de Durbin-Watson test kan liggen tussen de 0 en de 4, waar de waarde 2 aantoont dat er geen correlatie is tussen de observaties. Uit de test blijkt een waarde van 1,763 te komen. Deze waarde ligt dicht bij 2, er kan gesteld worden dan de observaties onafhankelijk van elkaar zijn. In de onderstaande tabel is de uitkomst van de test te zien.

Tabel 4 - De onafhankelijk van de observaties (Durbin-Watson test) Model samenvatting

Durbin-Watson 1,763

Ten tweede wordt er gekeken of er een lineaire relatie tussen de afhankelijke, de betrokkenheid en onafhankelijke variabelen, de 9 items van HNW, kan worden vastgesteld.

33 Om dit te kunnen controleren zijn in SPSS twee nieuwe variabelen aangemaakt, de studentized residuals en de unstandardized predicted value. Deze twee variabelen worden tegen elkaar afgezet in een spreidingsdiagram om te zien of er een lineaire relatie is tussen de onafhankelijk en afhankelijke variabelen. Wanneer de residuen, die als punten worden weergeven in spreidingdiagram 1, enigszins een horizontale band vormen, waar geen kromming in te zien is, kan er worden aangenomen dat er een lineaire relatie bestaat. In de onderstaande spreidingsdiagram is te zien dat de assumptie van een lineaire relatie kan worden aangenomen. Tevens is er voor elk item van HNW een spreidingsdiagram gemaakt en ook voor elk individueel item kan er worden aangenomen dat er een lineaire relatie bestaat tussen de afhankelijke variabele en de onafhankelijke variabelen. De aparte spreidingsdiagrammen voor elk item zijn terug te vinden in de bijlagen van dit onderzoek.

Spreidingsdiagram 1 - De lineaire relatie tussen de betrokkenheid en items van HNW

De assumptie voor homoscedasticiteit houdt in dat de residuen gelijk zijn voor alle waardes van de voorspelde afhankelijke variabele. Om deze assumptie te kunnen controleren wordt de hierboven genoemde spreidingsdiagram gebruikt. Er is te zien dat de residuen, die als bolletjes worden weergeven in spreidingsdiagram 1, redelijk gelijk verdeeld zijn over de voorspelde afhankelijke variabele. Er is een lichte tendens naar links toe, maar dit is

34 onvoldoende om de assumptie te schenden. Er kan dus worden gesteld dat de assumptie voor homoscedasticiteit kan worden aangenomen.

Multicollineariteit ontstaat wanneer er twee of meer onafhankelijke variabelen sterk met elkaar correleren. Dit kan leiden tot problemen met het begrijpen welke variabele bijdraagt aan de verklaarde variantie. Aangezien de items van HNW niet als één onafhankelijk variabele gezien mogen worden, is er gekozen voor een multiple regressie analyse. Deze analyse gaat ervan uit dat de verschillende onafhankelijke variabelen geen correlatie vertonen. Echter is het in dit geval mogelijk dat bepaalde items toch enigszins een correlatie met elkaar vertonen. De correlatie kan aanwezig zijn omdat de items, vanuit de theorie gezien, één concept meten. De correlatie tussen de onafhankelijke variabelen, hier de 9 verschillende items van HNW, mag niet hoger zijn dan 0.7. Uit de test blijkt dat geen van de items een correlatie van 0.7 of hoger vertoont, er kan dus worden gesteld dat de assumptie van multicollineariteit kan worden aangenomen. Om zeker te zijn dat er geen probleem is met de collineariteit van dit onderzoek kan er gekeken worden naar de tolerantie van de coëfficiënten. De tolerantie mag niet lager zijn dan 0.1 om zeker te zijn dat de assumptie kan worden aangenomen. De onderstaande tabel laat zien dat de tolerantie van elk item voldoende is. De volledige correlatie tabel is terug te vinden in de bijlagen van dit onderzoek.

Tabel 5 - De tolerantie van de coëfficiënten Coëfficiënten Model Statistieken Tolerantie VIF 1 (Constant) HNW 1 ,537 1,863 HNW 2 ,738 1,354 HNW 3 ,745 1,342 HNW 4 ,885 1,130 HNW 5 ,608 1,645 HNW 6 ,817 1,224 HNW 7 ,819 1,221 HNW 8 ,886 1,129 HNW 9 ,544 1,839

De dataset kan enkele observaties bevatten die ongebruikelijk zijn voor een goed passend regressie model. Een outlier is een observatie dat het patroon van de verwachte waarde niet

35 volgt. Door middel van een Casewise Diagnostics analyse kan er worden gekeken of de dataset outliers bevat. Een observatie wordt als een outlier gezien wanneer de standaard deviatie groter is dan 3. Wanneer alle observaties een kleinere standaard deviatie hebben dan 3, wordt de tabel niet in de output van SPSS gegenereerd. Aangezien de tabel niet terug komt in de output kan er worden aangenomen dat de data geen outliers bevat.

Om de statistische significantie van de regressie analyse te bepalen moet de data normaal verdeeld zijn. Dit kan op twee manieren worden gecontroleerd, namelijk met een histogram en een P-P plot. In de onderstaande afbeeldingen is te zien of de data normaal verdeeld is.

Histogram 1 - De normaal verdeling van de data P-P plot 1 - De normaal verdeling van de data

De zwarte lijn in de histogram geeft de normaal verdeling aan, de staven laten de gestandaardiseerde residuen zien. Te zien is dat de data redelijk normaal verdeeld is. Om de normaal verdeling volledig aan te nemen moet er ook gekeken worden naar de P-P plot. Als de data normaal verdeeld is, zullen de punten langs de diagonale lijn lopen. In werkelijkheid lopen de punten bijna nooit perfect met de diagonale lijn. In de P-P plot is te zien dat de punten inderdaad niet perfect op de diagonale lijn liggen. Ze liggen zodanig dichtbij dat er kan worden aangenomen dat de data normaal verdeeld is.

36 Uit alle analyses blijkt dat er geen assumpties zijn geschonden. Er kan dus met zekerheid worden gesteld dat de data geschikt is om een multiple regressie analyse uit te voeren. In de volgende paragraaf zal er antwoord worden gegeven op de gestelde hypotheses.

In document De nieuwe betrokkenheid? : een onderzoek naar de invloed van Het Nieuwe Werken op de betrokkenheid van werknemers (pagina 33-37)