• No results found

De invloed van gezondheid op het inkomen in Nederland : verschil tussen mannen en vrouwen

N/A
N/A
Protected

Academic year: 2021

Share "De invloed van gezondheid op het inkomen in Nederland : verschil tussen mannen en vrouwen"

Copied!
40
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

De invloed van gezondheid op het inkomen in Nederland

Verschil tussen mannen en vrouwen

Bachelorscriptie Econometrie Karlijn Schipper

10002106

Begeleid door Dr. J.C.M. van Ophem 20 december 2013

Universiteit van Amsterdam

   

In deze scriptie wordt gebruik gemaakt van data van het LISS panel. De gegevens uit dit panel zijn verzameld door CentERdata (Universiteit van Tilburg) als onderdeel van het MESS project. Veel dank gaat uit naar CentERdata voor het beschikbaar stellen van deze data. Zie voor meer informatie over het LISS panel en CentERdata: www.lissdata.nl. Verder gaat ook mijn dank uit naar Dr. J.C.M. van Ophem voor het begeleiden van mijn scriptie.

(2)

Abstract

Er is in Nederland nog betrekkelijk weinig onderzoek gedaan naar de invloed van gezondheid op het inkomen. Tot op heden is het ook onbekend of hier verschillen bestaan tussen mannen en vrouwen. Daarom wordt in dit onderzoek onderzocht wat het effect is van gezondheid op het uurloon in Nederland en of hier verschillen bestaan tussen mannen en vrouwen. Aan de hand van een Mincer-type vergelijking is een model opgesteld met verschillende

gezondheidsvariabelen (waaronder BMI en zelfevaluaties) als regressoren. Data zijn verkregen uit het LISS panel uit 2012. Allereerst is het model met OLS geschat en zijn er verschillende toetsen uitgevoerd. Uit de Chow-toets is gebleken dat er significante verschillen bestaan tussen mannen en vrouwen met betrekking tot het inkomen en zodoende is het model apart voor mannen en vrouwen geschat. Uit deze resultaten is gebleken dat het BMI voor vrouwen een groter negatief en meer significant effect heeft op het inkomen dan voor mannen. Tegen de verwachting in is gebleken dat voor vrouwen een goede en uitstekende gezondheid negatief gecorreleerd zijn met het inkomen. Hoewel de gezondheidsvariabelen voor mannen gezamenlijk significant zijn, is echter gebleken dat alle gezondheidsvariabelen individueel niet significant zijn. Wegens (zeer geringe) endogeniteit van de

gezondheidsvariabelen is tevens geschat met 2SLS. Uit deze resultaten is gebleken dat voor vrouwen gezondheid een groter effect heeft op het inkomen. Daarnaast is voor vrouwen het BMI positief (+0,033) gecorreleerd met het inkomen. Aangezien ook hier zeer weinig (instrumentele) variabelen gezamenlijk dan wel individueel significant zijn, is het lastig om op grond van de gevonden resultaten een degelijke en gegronde conclusie te trekken. Verder onderzoek wordt daarom aangeraden.

(3)

INHOUDSOPGAVE

1 Inleiding

………. 1

2 Literatuur

………

2

3

Onderzoeksmethode ………... 5

4

Data en variabelen ………... 10

4.1 Bewerking van de data ………. 10

4.2 Afhankelijke variabele ………. 12

4.3 Onafhankelijke variabelen ……… 13

   

5 Resultaten

………. 14

5.1 OLS ……….. 14

5.2 2SLS met instrumentele variabelen .………. 18

   

6 Conclusie

………..

20

Bibliografie ………. 22

Bijlage ………... 23

      

(4)

1. Inleiding

Superfoods, het Paleo dieet en Insanity Workouts zijn de laatste tijd veel in het nieuws. Dit is niet voor niets. Ruim tien procent van de Nederlandse bevolking lijdt namelijk aan obesitas (Harchaoui, S. et al, 2011). Mensen met extreem overgewicht hebben een verhoogde kans op onder andere hart- en vaatziekten en in 2011 overleden er in Nederland maar liefst 39.000 mensen aan de gevolgen van één van deze ziekten (Vaartjes, I. et al, 2011). Naast alle vervelende lichamelijke en psychologische gevolgen van obesitas voor zwaarlijvige mensen zelf, is het bovendien denkbaar dat een slechte gezondheid een negatief effect heeft op de arbeidsproductiviteit en op de hoogte van het inkomen. Aangezien het inkomen uitermate belangrijk is voor de welvaart en het welzijn van de werknemer, is het zeer interessant om de invloed van gezondheid op het inkomen nader te onderzoeken.

De hoogte van het inkomen en de totstandkoming hiervan zijn in de afgelopen decennia uitgebreid onderzocht. Zo heeft Mincer (1958) al ruim een halve eeuw geleden de human capital theorie ontwikkeld waarin scholing en werkervaring positief gecorreleerd zijn met het inkomen. In recente onderzoeken naar de hoogte van het loon zijn bovendien

significante verschillen gevonden tussen mannen en vrouwen. Zo zouden mannelijke werknemers met een fulltime baan in Nederland maar liefs vijftien procent meer verdienen dan vrouwelijke werknemers die eveneens in het bezit zijn van een fulltime baan (Brakel, M. van den en L. Moonen 2013). Verschillen in functie en het aantal arbeidsuren zouden hier een belangrijke rol kunnen spelen. Echter is het onduidelijk of gezondheid ook een bepalende factor is. In dit onderzoek wordt daarom onderzocht wat de invloed is van gezondheid op het inkomen in Nederland en of dit gezondheidseffect verschilt tussen mannen en vrouwen.

Om dit te onderzoeken, wordt allereerst een regressievergelijking opgesteld. Als afhankelijke variabele wordt de natuurlijke logaritme van het bruto uurloon gebruikt. Om dit uurloon zo goed mogelijk te verklaren, worden verschillende verklarende variabelen,

waaronder gezondheidsvariabelen en werkervaring, opgenomen. Het opgestelde model wordt in eerste instantie geschat met OLS (Ordinary Least Squares). Door middel van verschillende toetsen wordt onderzocht of er interactietermen dienen te worden toegevoegd en of de

regressie apart voor mannen en vrouwen moet worden uitgevoerd.

Het is echter mogelijk dat de gezondheidsvariabelen endogeen zijn. Om deze reden wordt onderzocht of de storingstermen van de regressie gecorreleerd zijn met de

(5)

niet consistent en wordt vervolgens de 2SLS-methode (Two Stage Least Squares) gebruikt om de regressie opnieuw te schatten. In dit nieuwe model worden onder andere medicijngebruik en het aantal huisartsbezoeken als instrumentele variabelen opgenomen. De instrumentele variabelen worden getoetst op relevantie en validiteit en ook wordt met de Hausman-toets onderzocht of de gebruikte onafhankelijke variabelen bij 2SLS exogeen zijn.

Om de bovenstaande regressies te schatten en toetsen uit te voeren, worden microdata gebruikt. Deze data zijn afkomstig uit het LISS (Longitudinal Internet Studies for the Social sciences) data panel. De gegevens van dit panel zijn verzameld door CentERdata, een onderzoeksorganisatie die gefinancierd wordt door het NWO (Netherlands Organization for Scientific Research). Het LISS panel bestaat uit ongeveer 5.000 huishoudens waarbij circa 8.000 individuen. De gegevens over de huishoudens en individuen zijn verkregen aan de hand van verschillende maandelijkse enquêtes. In deze enquêtes is gevraagd naar onder andere inkomen, afkomst en beroep. Voor dit onderzoek worden de gegevens uit meerdere enquêtes van april en november 2012 gebruikt. Aangezien niet alle observaties even relevant zijn voor dit onderzoek, worden de data deels bewerkt.

De opbouw van de rapportage van het onderzoek is als volgt. Allereerst worden in hoofdstuk 2 theorieën en resultaten verkregen uit eerdere onderzoeken besproken. In hoofdstuk 3 wordt de onderzoeksmethode met bijbehoren modellen uitgelicht. Vervolgens worden in hoofdstuk 4 de data en variabelen besproken. In hoofdstuk 5 worden de gevonden resultaten behandeld. Tot slot volgt in hoofdstuk 6 de conclusie aan de hand van het verrichte onderzoek.

2. Literatuur

Er zijn verschillende factoren die een invloed hebben op het inkomen. Mincer (1958) heeft hier ruim een halve eeuw geleden als één van de eersten onderzoek naar gedaan. Zo heeft hij een model ontwikkeld van het human capital. In zijn onderzoek legt Mincer uit dat door middel van verschillende variabelen waaronder scholing, on-the-job training1 en

werkervaring, men kennis kan vergaren over aan werk gerelateerde zaken en verschillende vaardigheden kan opdoen. Deze opgedane kennis en vaardigheden kunnen beschouwd worden

      

1 On-the-job training is een één-op-één training die plaats vindt op het werk en gegeven wordt door een ervaren werknemer. Deze manier van trainen is betrekkelijk goedkoop, erg realistisch (aangezien de trainee direct de werkomgeving en de taken leert kennen) en heeft een positief effect op de productiviteit van de werknemer.

(6)

als een investering en bepalen de mate van het human capital. Volgens de human capital theorie zou wanneer een werknemer over een grotere voorraad aan gewenste vaardigheden en kennis (en dus human capital) beschikt, productiever en efficiënter kunnen werken. Dit zou voor een bedrijf een hogere omzet betekenen. Hierdoor is een werkgever volgens Mincer bereid een hoger inkomen te betalen.

Becker (1962) maakt als één van de eersten gebruik van het idee om een verband te leggen tussen de gezondheid van werknemers en hun human capital. Zo beschouwt hij gezondheid als een belangrijk onderdeel van het human capital (het zogenaamde health capital) en concludeert dat door een investering in de algehele gezondheid, zoals het nuttigen van goede voeding en het gebruik maken van medische zorg, de arbeidsproductiviteit kan worden verhoogd. Op deze manier is een werkgever bereid meer inkomen te betalen en heeft gezondheid dus invloed op de hoogte van het inkomen.

Grossman (1972) ontwerpt een model van de vraag naar het bovenstaande health capital. In zijn onderzoek beschrijft hij dat gezondheid gezien kan worden als een

consumptiegoed of als een investeringsgoed. Wanneer men direct gebruik wil maken van een goede gezondheid, spreekt men volgens Grossman van een consumptiegoed (de gezondheid wordt als het ware geconsumeerd). Gezondheid kan als investeringsgoed worden beschouwd wanneer men op het werk als gevolg van een investering in de gezondheid de tijd efficiënter en productiever kan besteden. Aangezien in sommige beroepen de productiviteit niet duidelijk meetbaar is, kan gezondheid bovendien gebruikt worden als een indirecte maatstaf voor de individuele productiviteit. Zo zouden gezondere arbeiders productiever zijn. Grossman komt in zijn onderzoek tot de conclusie dat een goede gezondheid negatief gecorreleerd is met de leeftijd. Echter kan door middel van een investering de gezondheid verbeterd worden. Ook komt in het onderzoek van Grossman naar voren dat gezondheid invloed heeft op het aantal werkuren. Zo zouden mensen met een slechte gezondheid betrekkelijk minder uren werken.

Berkowitz et al. (1983) maken vervolgens gebruik van het idee van Becker en hebben een regressievergelijking opgesteld met verschillende gezondheidsindicatoren. Zij vinden een significant positief effect van de gezondheid van werknemers op diens productiviteit. Baldwin en Johnsons (1994) gebruiken een vergelijkbare regressievergelijking met maar liefst acht verschillende gezondheidsvariabelen waaronder het hebben van mentale ziektes. Echter voegen zij ook het hebben van een handicap toe aan hun model. Zij vinden dat gehandicapte mannen relatief minder verdienen dan niet-gehandicapten mannen. Ook vinden zij dat er

(7)

betrekkelijk minder mannen met een handicap op de arbeidsmarkt zijn dan gehandicapte vrouwen.

Currie en Madrian (1999) onderzoeken of een gezondheidsverzekering ook invloed heeft op het inkomen. Zodoende nemen zij het hebben van een gezondheidsverzekering mee als verklarende dummyvariabele. Na het schatten van hun model vinden Currie en Madrian dat het hebben van een gezondheidsverzekering een klein doch significant effect heeft op deelname op de arbeidsmarkt, maar geen significant effect heeft op het inkomen. Een gezondheidsverzekering is in de Verenigde Staten optioneel en om deze reden wordt er in Amerikaanse onderzoeken geregeld aandacht besteed aan de gevolgen van het hebben van een gezondheidsverzekering op de gezondheid. In Nederland is een basisgezondheidsverzekering voor werknemers echter verplicht en aangezien in dit onderzoek met Nederlandse data gewerkt wordt, is dit hier minder relevant.

Gezondheid kan dus een significant effect hebben op de arbeidsproductiviteit. In verschillende onderzoeken is eveneens gebleken dat er verschillen in uitkomsten bestaan tussen mannen en vrouwen. Zo vindt Luft (1975) dat mannen die in een slechte gezondheid verkeren ongeveer dertien procent minder inkomen genereren dan gezonde mannen. Voor vrouwen is een slechte gezondheid echter minder invloedrijk. Zo zouden vrouwelijke werk-nemers met een slechte gezondheid ongeveer negen procent minder verdienen dan gezonde vrouwelijke werknemers. Contoyannis en Ryan (2001) concluderen dat, hoewel het vinden van verschillen tussen mannen en vrouwen niet hun voornaamste focus was, bij mannen met een psychische aandoening het salaris significant negatief beïnvloed wordt, wat weer bij vrouwen echter niet zo is. Voor vrouwen zou weer het hebben van een goede zelfevaluatie met betrekking tot de gezondheid een significant positieve impact hebben op het inkomen.

Een ander recent onderzoek waar ook verschillen zijn gevonden tussen mannen en vrouwen is het onderzoek van Gambin (2005). Zij gebruikt gegevens uit heel Europa en in haar onderzoek meet Gambin gezondheid aan de hand van verschillende zelfevaluaties. Zo konden geënquêteerden hun eigen gezondheid beoordelen met ‘erg goed’, ‘goed’ en ‘redelijk’. Gambin vindt dat voor het grootste deel van de onderzochte Europese landen de zelfevaluatie van de gezondheid een groter effect heeft op het inkomen voor mannen dan voor vrouwen. Daarnaast vindt Gambin dat het hebben van een chronische ziekte weer voor

vrouwen meer significant is dan voor mannen. Ook merkt zij op dat er verschillen bestaan tussen Europese landen met betrekking tot de invloed van gezondheid op inkomen.

(8)

Cultuurverschillen zouden hierbij een belangrijke rol kunnen spelen. Aangezien in dit onderzoek echter enkel Nederlandse data wordt gebruikt, is dit hier niet relevant.

Tot slot zijn er ook vele onderzoeken gedaan naar de simultaniteit tussen inkomen en gezondheid. Dit laatste houdt in dat gezondheid en inkomen elkaar kunnen beïnvloeden. Zo zouden rijkere mensen meer geld te besteden hebben aan betere voeding of

fitnessabonnementen om te investeren in hun gezondheid en deze te verbeteren. Daarentegen zouden mensen met een betere gezondheid productiever en efficiënter kunnen werken, waardoor zij uiteindelijk een hoger inkomen kunnen verwerven. Uit het onderzoek van Lee (1982) blijkt dat het inkomen een sterk significant positief effect heeft op de vraag naar gezondheid, maar dat een goede gezondheid ook zeker het inkomen voordelig kan

beïnvloeden. Hij vindt ook dat het hebben van een ziekte via scholing een vertraagd effect heeft op het latere inkomen. Haveman et al. (1994) stellen ook een simultaan model op dat zij vervolgens schatten met GMM (Generalized Method of Moments). Zij vinden dat een slechte gezondheid in voorgaande jaren een negatief effect heeft op het loon. Na het ontdoen van de endogeniteit in de eerder gebruikte regressie, vinden zij bovendien een groter negatief significant effect van een slechte gezondheid. Al hoewel in de bovenstaande onderzoeken wordt aangetoond dat er simultaniteit bestaat tussen inkomen en gezondheid, wordt in dit onderzoek echter enkel het eenzijdige effect van gezondheid op het inkomen geschat, en dus niet tevens het effect van inkomen op de gezondheid.

3. Onderzoeksmethode

In dit hoofdstuk worden de onderzoeksmethode en de bijbehorende modellen besproken. Zoals in het vorige hoofdstuk is uitgelegd, kan het inkomen verklaard worden aan de hand van verschillende variabelen. Als basis van het te schatten model wordt de Mincer-type vergelijking gebruikt. In de vorige paragraaf is uitgelegd dat Mincer onder andere het aantal jaren scholing en werkervaring als regressoren gebruikt. De bijbehorende

regressievergelijking ziet er als volgt uit:

(1) met w als het jaarlijkse inkomen in dollars, s als het aantal jaren scholing, exp als het aantal jaren werkervaring en ε als de storingsterm (met E(ε|s,x) = 0). De coëfficiënten van de

(9)

variabelen geven de zogeheten returns aan en kunnen aan de hand van de OLS-methode geschat worden.

In het vorige hoofdstuk is besproken dat gezondheid eveneens een invloed kan hebben op het inkomen. Daarnaast is het mogelijk dat andere individuele eigenschappen van de desbetreffende persoon (zoals geslacht en afkomst) en het soort beroep een invloed kunnen uitoefenen op het inkomen. Daarom wordt de Mincer-vergelijking aangepast en uitgebreid. In model 1 wordt zo het bruto uurloon als afhankelijke variabele gebruikt. Het uurloon meet namelijk in vergelijking met het jaarlijkse inkomen op een meer directe manier de individuele productiviteit. Verder geeft het bruto inkomen de directe kosten en uitbetalingen van de werkgever aan haar werknemers aan, zonder eventuele belastingen. Tot slot wordt de

natuurlijke logaritme van het inkomen genomen om een procentuele stijging in het uurloon te

meten. Dit alles leidt tot de volgende vergelijking:

(2) waar h het bruto uurloon aangeeft, en PK, GK en WK voor persoonlijke variabelen (waaronder opleiding), gezondheidsvariabelen (waaronder de zelfevaluaties van de

gezondheid) en variabelen met betrekking tot het werk (waaronder het type beroep) respectievelijk staan, en υ de storingsterm aangeeft. In het volgende hoofdstuk worden de variabelen besproken.

Dit multivariate model wordt allereerst geschat met OLS. Dit is de meest eenvoudige schattingsmethode. Om de geschatte resultaten te beoordelen, kan gekeken worden naar de R² die de goodness-of-fit aangeeft. De aangepaste (adjusted) R² geeft tevens de goodness-of-fit, maar hier is ook rekening gehouden met het aantal opgenomen variabelen. Ook kan gekeken worden naar de waarde van de F-Statistiek en de bijbehorende p-waarde die het resultaat geeft van de F-toets met als nulhypothese dat de coëfficiënten van alle variabelen gelijk zijn aan nul. Daarnaast kan ook gekeken worden naar de significantie van de individuele regressoren. De p-waarde van de desbetreffende variabele dient hoogstens 0.05 te bedragen aangezien in dit onderzoek een significantieniveau van 5% geldt. Daarnaast kan met behulp van een F-toets gekeken worden naar de gezamenlijke significantie van de gezondheidsvariabelen. Uiteraard is het ook van belang de grootte en de tekens van de geschatte variabelen te beoordelen met betrekking tot het verklaren van het inkomen.

In dit onderzoek wordt ook onderzocht of er een verschil bestaat tussen mannen en vrouwen met betrekking tot de invloed van gezondheid op het inkomen. Zo is het mogelijk

(10)

dat er een interactie-effect bestaat tussen geslacht en de gezondheidsvariabelen. Dit betekent dat het marginale effect van geslacht dan wel een gezondheidsvariabele afhankelijk is van gezondheidsvariabele dan wel geslacht. Daarom worden interactietermen (bijvoorbeeld man*BMI) opgenomen in model 2 en aan de hand van een F-toets wordt de gezamenlijke significantie bepaald van deze interactietermen. Wanneer deze termen gezamenlijk significant blijken te zijn, worden deze variabelen opgenomen in de uiteindelijke regressie.

Ook is het mogelijk dat het model apart voor mannen en vrouwen geschat moet worden. Aan de hand van een Chow-toets kan bepaald worden of er een significant verschil bestaat tussen de geschatte coëfficiënten bij mannen en vrouwen. De nulhypothese van deze toets is dat er geen significant verschil bestaat. De alternatieve hypothese houdt in dat de regressies voor mannen en vrouwen apart geschat moeten worden en deze hypothese wordt aangenomen wanneer de waarde van de F-toets groter is dan de kritieke waarde van

F(k,nm+nv-2k). De volgende berekening wordt gedaan om de waarde van de F-toets te

berekenen:

(3)

waar Stot, Sm en Sv de SSR (Sum of Squared Residuals) van de regressie aangeven

wanneer respectievelijk de gehele sample, enkel de mannen en enkel de vrouwen gebruikt wordt, k het aantal restricties aangeeft, nm en nv het aantal mannen en het aantal vrouwen

respectievelijk aangeven. Model 3 is gelijk aan model 1 alleen wordt hier enkel de data van mannen gebruikt, en model 4 van enkel vrouwen.

Er zijn verschillende voorwaardes waaraan voldaan moet worden om de OLS-methode (Ordinary Least Squares) te mogen gebruiken. Zo dienen de storingstermen willekeurig en normaal verdeeld te zijn. Ook dienen de varianties van de storingstermen constant te zijn. Wanneer dit laatste geldt, wordt gesproken van homoscedasticiteit: E[εi²|X]=σ².

Heteroscedasticiteit (E[εi²|X]=σi² voor i=1…n) duidt op ongelijke varianties van de

storingstermen. De verwachting van de storingstermen dient daarnaast gelijk te zijn aan nul. De regressoren mogen namelijk niet gecorreleerd zijn met de storingstermen. E[ε|X]=0 impliceert op deze manier dat E[X’ε] = 0. Wanneer de verklarende variabelen zodoende ongecorreleerd zijn met de storingstermen, kan gesproken worden van strikte exogeniteit. De verklarende variabelen mogen daarnaast niet onderling afhankelijk te zijn, oftewel er mag geen multicollineariteit zijn. Wanneer aan al deze bovenstaande assumpties wordt voldaan, zijn de OLS-schatters consistent en zuiver met een minimale variantie en zijn de schatters

(11)

gelijk aan de correcte waarde (b=β). Om te onderzoeken of het geschatte model aan de voorwaarden voldoet, worden een aantal toetsen uitgevoerd.

Allereerst wordt met de Breusch-Pagan-toets getoetst op homoscedasticiteit. Deze toets heeft als nulhypothese dat de varianties van de geschatte storingstermen constant en onafhankelijk van de afhankelijke variabelen zijn. Dit impliceert homoscedasticiteit. Wanneer de nulhypothese bij een significantieniveau van vijf procent verworpen wordt, wordt

vervolgens de alternatieve hypothese aangenomen. Deze houdt in dat de varianties van de storingstermen juist heteroscedastisch zijn. Wanneer heteroscedasticiteit is aangetoond, wordt verder geschat met robuuste storingstermen aangezien er anders een bias in de

standaardfouten van de geschatte coëfficiënten kan zitten.

Vervolgens wordt getoetst op exogeniteit in het geschatte model. Zowel vanuit de theorie als eerdere onderzoeken kan verwacht worden dat enkele gezondheidsvariabelen endogeen zijn.2 Endogeniteit kan veroorzaakt worden door meetfouten, weggelaten variabelen of door interactie tussen en causaliteit in de afhankelijke variabele (het uurloon) en de

onafhankelijke variabelen (in dit geval de gezondheidsvariabelen).

Om te bepalen of de gezondheidsvariabelen exogeen zijn, wordt gekeken naar de correlatie tussen de storingstermen en de gezondheidsvariabelen. Hoe hoger de waarde van de correlatiecoëfficiënt, hoe sterker de correlatie tussen de twee. Wanneer de

correlatie-coëfficiënt een waarde van 0,000 aanneemt, is er geen correlatie en is de desbetreffende gezondheidsvariabele dus exogeen. Ook wordt een regressie uitgevoerd van de storingstermen op alle opgenomen gezondheidsvariabelen. Wanneer een gezondheidsvariabele hier

significant is bij een significantieniveau van vijf procent, kan gesteld worden dat deze variabele endogeen is. Wanneer er één of enkele variabelen endogeen blijken te zijn, is OLS inconsistent en wordt het model geschat met 2SLS. Om te corrigeren voor deze endogeniteit worden dan verschillende instrumentele variabelen opgenomen3. In dit onderzoek worden onder andere het aantal huisartsbezoeken en medicijngebruik als instrumenten gebruikt. Het

      

2 Het is mogelijk dat andere variabelen uit het model ook endogeen zijn. Aangezien in dit onderzoek de invloed van gezondheid op het inkomen wordt onderzocht, wordt hier enkel de endogeniteit van de

gezondheidsvariabelen onderzocht.

3 Door middel van theorie kan bedacht worden welke instrumentele variabelen opgenomen kunnen worden. Het is het van belang dat de instrumenten gecorreleerd zijn met de mogelijk endogene variabelen (o.a. de

zelfevaluatie van de gezondheid), maar geen invloed uitoefenen op het inkomen en andere onafhankelijke variabelen.

(12)

model wordt vervolgens òf apart voor mannen en vrouwen geschat òf voor alle observaties geschat (dit ligt aan de uitkomst bij de Chow-toets).

Om 2SLS te mogen gebruiken, zijn ook hier enkele assumpties. Zo dienen alle instrumenten relevant en dus gecorreleerd te zijn met de endogene variabelen. Als er

instrumenten worden gekozen die echter zwak gecorreleerd zijn met de endogene variabelen, resulteert dit in een minder goede schatting van de uiteindelijke coëfficiënten van de

variabelen uit de hoofdregressie. Daarnaast dienen de instrumentele variabelen relevant en valide te zijn. Er dienen verder evenveel instrumenten als of meer instrumenten dan endogene variabelen te worden opgenomen. Er is dan sprake van overidentificatie. Echter is het ook belangrijk dat er niet teveel instrumenten worden opgenomen. Zo resulteert het gebruik van teveel instrumenten in een grotere bias, met name wanneer enkele instrumenten zwak gecorreleerd zijn met de endogene variabelen. Tot slot dienen de regressoren uit de hoofdregressie exogeen te zijn.

Vervolgens wordt onderzocht of er voldaan wordt aan deze voorwaarden. Allereerst worden de instrumenten getoetst op relevantie. Om te kijken of de instrumenten relevant zijn en of de instrumenten dus gecorreleerd zijn met de endogene variabelen, wordt voor elke mogelijke endogene variabele individueel een regressie uitgevoerd. Een instrument is relevant wanneer deze bij een significantieniveau van vijf procent significant blijkt te zijn. Om te kijken of de instrumenten valide zijn en dus of de instrumenten met de storingstermen zijn gecorreleerd, wordt de Sargan-toets gebruikt. Tot slot wordt de Hausman-toets uitgevoerd. Bij deze toets wordt getoetst op exogeniteit van alle regressoren in de hoofdregressie.

Na het schatten van alle modellen, wordt gekeken naar de invloed van gezondheid op het inkomen en het verschil hierbij tussen mannen en vrouwen. Verwacht wordt dat over het algemeen een goede gezondheid een positief effect heeft op het uurloon. Iemand met een goede gezondheid zou volgens de theorie namelijk productiever werken en daarom een hoger inkomen verdienen. Verder wordt gekeken naar het verschil van de coëfficiënten van de gezondheidsvariabelen tussen mannen en vrouwen. Ook wordt verwacht dat een betere gezondheid een groter effect heeft op het inkomen voor mannen dan voor vrouwen. Dit is ook in eerdere onderzoeken naar voren gekomen. Daarnaast wordt verwacht dat een hoger BMI voor mannen een minder groot effect heeft op het inkomen dan voor vrouwen, aangezien er meer mannen met overwicht en een hoge functie zijn. Tot slot wordt verwacht dat het hebben

(13)

van een chronische ziekte nadeliger is voor vrouwen, omdat er op de arbeidsmarkt al een vorm van negatieve discriminatie bestaat tegenover vrouwen.

4. Data en variabelen

Om bovenstaande regressies te schatten en toetsen uit te voeren, worden data gebruikt. De gegevens die in dit onderzoek gebruikt worden, komen uit het LISS (Longitudinal Internet Studies for the Social Sciences) data panel. LISS is een onderdeel van het MESS

(Measurement and Experimentation in the Social Sciences) project, een project dat door CentERdata (Tilburg University) is opgezet om aan de hand van beschikbare data

onderzoekers de gelegenheid te geven tot het opzetten van een eigen onderzoek. Vanaf 2006 wordt er in verschillende maandelijkse enquêtes informatie verzameld van ongeveer 5.000 willekeurig gekozen huishoudens waarvan circa 8.000 individuen. In deze enquêtes worden onder andere vragen gesteld over persoonlijke kenmerken, demografische karakteristieken, werk en interesses. In dit onderzoek worden de gegevens uit de volgende enquêtes uit 2012 gebruikt:

 Background variables (LISS Core Study, november 2012)  Health (LISS Core study, wave 6, november 2012)

 Work and schooling (LISS Core study, wave 5, april 2012) 4.1 Bewerking van de data

Nadat alle gegevens uit de verschillende enquêtes gedownload zijn, worden de enquêtes gecombineerd. Er worden enkel observaties gebruikt van personen die alle bovenstaande enquêtes hebben ingevuld. Vervolgens is een selectie gemaakt van deze gepaarde data. Zo zijn de observaties waar belangrijke en voor dit onderzoek relevante informatie miste (over bijvoorbeeld het bruto uurloon, de gezondheid, werk of opleiding) verwijderd. Ook zijn onrealistische waarnemingen uit de sample verwijderd. Verder zijn enkel de individuen geselecteerd die betaald werk verrichten. Mensen die in een familiebedrijf werken, zelfstandigen, werkzoekenden, studenten, vrijwilligers, gepensioneerden en

arbeidsongeschikten zijn tevens uit het sample verwijderd. Verder worden variabelen waar minder dan 10 waarnemingen zijn, niet opgenomen in het model en deze observaties worden verwijderd. Tot slot zijn geënquêteerden die volgens hun contract minder dan 16 uur per week

(14)

werken, eveneens verwijderd. Na al deze bewerkingen zijn er in totaal 1771 waarneming overgebleven waarvan 895 mannen en 876 vrouwen.4

Niet alle variabelen die in het model worden opgenomen, waren reeds aanwezig na het downloaden. Zodoende zijn er verschillende variabelen gemaakt. In de enquête waren er verscheidene meerkeuzevragen. Aangezien er verondersteld wordt dat er geen lineaire relatie bestaat tussen de antwoorden van dit type vragen, zijn van de antwoorden van verschillende categorische (en ordinale) variabelen dummyvariabelen gemaakt. Dit geldt voor afkomst, burgerlijke staat, opleiding, beroep met benodigde vaardigheden, sector, evaluatie van de gezondheid, evaluatie van de gezondheid met betrekking tot het voorgaande jaar, medicijn-gebruik, bezoeken aan een medisch specialist en belemmeringen. Er zijn daarnaast nog twee dummyvariabelen gemaakt met betrekking tot het aantal uren dat iemand werkt (1 = fulltime: ≥ 36 uur, 0 = parttime: < 36 uur) (fulltime) en met betrekking tot het dienstverband bij de huidige werkgever (1 = vast dienstverband, 0 = tijdelijk dienstverband) (vast_tijdelijk). Bij sommige vragen konden geënquêteerden met een getal antwoord geven. Aangezien er bij de meeste van deze variabelen ook hier geen lineaire relatie bestaat, zijn er dummyvariabelen voor groepen gemaakt om aantallen preciezer te specificeren. Dit is gedaan voor het aantal huisartsbezoeken en aantal werknemers in het bedrijf.

Er is bovendien een aparte variabele voor het BMI gemaakt. Aangezien het BMI onder- en overgewicht aangeeft, is dit een belangrijke variabele als het om gezondheid gaat. Het BMI is berekend aan de hand van de volgende formule:

(5)

Verder is het van belang dat het aantal jaren mogelijke werkervaring (ervaring) wordt opgenomen in de regressie (zie uitleg Mincer-vergelijking). Deze variabele is berekend aan de

hand van de volgende formule:

(6)

Te zien is dat allereerst leeftijd als basis is genomen. Hier is vervolgens het aantal jaar scholing tot en met de hoogst genoten opleiding van afgetrokken. Over het algemeen duurt de basisschool 8 jaar, vmbo 4 jaar, havo/vwo 6 jaar, mbo 3 jaar, hbo 4 jaar en WO 5 jaar. Het aantal jaar scholing is berekend aan de hand van de benodigde jaren voor de hoogst afgeronde

      

4 Het is mogelijk dat na deze bewerkingen er een zogenaamde sample selection bias aanwezig is in het model. Hierdoor zit er een bias in de resultaten. Er wordt verder echter geen Heckman selection model geschat.

(15)

opleidingen. Tot slot is er 4 jaar van afgetrokken aangezien iedereen in Nederland op zijn vierde levensjaar naar school gaat. Aangezien ook het effect van ervaring in de loop der jaren verandert, is een variabele voor ervaring in het kwadraat (ervaring2) gemaakt. Zo zouden oudere werknemers meer ervaring en kennis in hun leven hebben opgedaan dan hun jongere collega’s en daardoor een voorsprong hebben. Echter wordt het effect van ervaring op inkomen naarmate iemand ouder wordt, steeds kleiner. Deze variabele zou mogelijk een negatief effect hebben op het inkomen. Vanwege multicollineariteit wordt leeftijd niet (rechtstreeks) opgenomen in de regressie.

Tot slot is een variabele gemaakt voor het aantal jaar dat iemand in dienst is bij zijn of haar huidige werkgever (tenure). Deze is berekend aan de hand van de volgende formule.

(7)

4.2 Afhankelijke variabele

In bijlage I is beschrijvende statistiek te vinden in de vorm van een overzicht met een omschrijving van alle gebruikte variabelen, waar schuin gedrukte variabelen dummy’s

aanduiden. Als afhankelijke variabele wordt in dit onderzoek de natuurlijke logaritme van het bruto uurloon in euro gebruikt. Aangezien het uurloon niet direct beschikbaar is, is de

volgende formule gebruikt om het uurloon te berekenen:

(8)

Helaas mist er voor sommige waarnemingen informatie over het netto dan wel bruto maandinkomen. Om deze reden heeft CentERdata de salarissen deels aangepast. Zo is wanneer het netto maandsalaris €0 bedraagt en het bruto maandsalaris onbekend is, het bruto salaris gelijkgesteld aan €0. Wanneer het netto salaris meer dan €0 bedraagt en het bruto maandsalaris onbekend is, dan is het netto maandsalaris berekend uit het bruto salaris5.

Hieronder is in de tabel het gemiddelde bruto uurloon in euro in natuurlijke logaritme voor zowel mannen als vrouwen als voor de gehele steekproef voor 2012 te vinden. Uit de tabel valt op te maken dat mannen ongeveer 3% meer verdienen dan vrouwen.

Tabel 4.2.1: overzicht van het gemiddelde bruto uurloon in euro in natuurlijke logaritme uit 2012

      

5 Voor meer en gedetailleerde informatie over deze formule, zie: Vos, K. de (2011), “Imputation of income in household questionnaire LISS panel”, CentERdata, Tilburg, version 5

(16)

4.3 Onafhankelijke variabelen

In bijlage II is een tabel te vinden met aantallen en percentages met betrekking tot de

gebruikte onafhankelijke variabelen en in bijlage III staat een tabel met van links naar rechts de gemiddelde waarden, standaarddeviaties en intervallen voor de gebruikte variabelen.6

Naast geslacht, afkomst, het hebben van een partner, aan werk gerelateerde variabelen en de variabelen uit de Mincer-type vergelijking worden er tevens enkele

gezondheidsvariabelen opgenomen in de regressie. Aangezien de gezondheidsvariabelen voor dit onderzoek zeer belangrijk zijn, worden deze meer behandeld. Het is van belang om

gezondheid zo exact mogelijk te definiëren en zo meetbaar mogelijk te maken. De volgende gezondheidsvariabelen worden opgenomen in het model: zelfevaluatie van de gezondheid, BMI, ziekte of handicap (ziekte_handicap). In de afgenomen enquête hebben mensen zelf kunnen aangeven hoe gezond zij zichzelf beoordelen: slecht, matig, goed, erg goed of uitstekend. Dit leidt tot de volgende dummyvariabelen: ze_slecht, ze_matig, ze_goed,

ze_zeergoed en ze_uitstekend. Aangezien er zeer weinig waarnemingen zijn voor ‘slecht’, zijn

deze observaties verwijderd.

Er wordt verondersteld dat de coëfficiënten van ze_zeergoed en ze_goed positief gecorreleerd zijn met het inkomen aangezien bij deze dummy’s een betere gezondheid aangegeven is door de geënquêteerden dan bij de referentiecategorie. Daarbij neemt mogelijk de coëfficiënt van ze_zeergoed de grootste waarde aan. De meeste mannen en vrouwen hebben hun gezondheid met ‘goed’ beoordeeld (63%). Verder zal het BMI waarschijnlijk negatief gecorreleerd zijn met het inkomen, evenals het hebben van een chronische ziekte of handicap. Chronisch zieken, gehandicapten en mensen met een zeer hoog BMI hebben waarschijnlijk een lagere productiviteit en dus een lager uurloon dan mensen die niet

chronisch ziek of gehandicapt zijn of een lagere BMI hebben. Bij mannen en vrouwen is het percentage chronisch zieken of gehandicapten gelijk (22%).

      

6 Er is voor verschillende variabelen gekeken naar de significantie met betrekking tot het inkomen. Uiteindelijk is gebleken dat het aantal kinderen, aantal dagen ziek afgelopen maand, de type organisatie (private of publieke sector), stedelijk gebied, positie in het huishouden en minder dan 500 werknemers in het bedrijf waar iemand werkzaam is geen significant effect hebben op het inkomen en deze variabelen zijn daarom niet opgenomen in het model.

ln_bruto_uurloon Man Vrouw Verschil Ratio

M/V Gehele steekproef gemiddelde (std. fout) min. – max. 2,648 (0,313) 0,916-4.317 2,571 (0.283) 0,669-3,624 0.077 1.030 2,611 (0,301) 0,669-4,317

(17)

Voor 2SLS is het van belang om een onderscheid te maken tussen exogene, endogene en instrumentele variabelen. Verwacht wordt dat de gezondheidsvariabelen endogeen zijn. De rest van de verklarende variabelen worden exogeen verondersteld. Verondersteld wordt dat de volgende instrumenten een significant effect hebben op de gezondheidsvariabelen: het aantal huisartsbezoeken, ziekenhuisbezoek, roken7, bezoek aan een medisch specialist, het

ondervinden van belemmeringen om het werk goed uit te voeren en/of sociale contacten te onderhouden, het hebben van een ziekte (waaronder astma: chronische ziekten zitten hier niet bij), medicijngebruik en een vergelijking van de gezondheid met afgelopen jaar gebruikt. Geënquêteerden hebben kunnen aangeven hoe zij hun gezondheid vergelijken met die van vorig jaar: 1. aanzienlijk slechter; 2. iets slechter; 3. hetzelfde; 4. iets beter; of 5. aanzienlijk beter. Dit levert respectievelijk de volgende dummyvariabelen op: aanzienlijk_slechter,

iets_slechter, hetzelfde, iets_beter en aanzienlijk_beter. Gezien het geringe aantal observaties

is aanzienlijk_slechter (<5) verwijderd. Maar liefst 71% van de geënquêteerden beschouwd hun gezondheid als niet verbeterd ten opzichte van vorig jaar. Het aantal instrumenten (11) is groter dan het aantal mogelijke endogene variabelen (6).

5. Resultaten

In dit hoofdstuk worden de uitkomsten van de geschatte modellen en toetsen besproken. Allereerst volgen de resultaten van de met OLS geschatte modellen 1 tot en met 4 met de bijbehorende toetsen en vervolgens worden de resultaten van de met 2SLS geschatte modellen 5 en 6 met ook hier de bijbehorende toetsen besproken. De focus in dit hoofdstuk ligt met name op de gezondheidsvariabelen, maar ook de andere variabelen worden behandeld. In bijlage IV zijn de uitkomsten van de Breusch-Pagan-toets te vinden. Wanneer

heteroscedasticiteit is gesignaleerd, wordt geschat met robuuste standaardfouten. 5.1 OLS

De resultaten van het schatten van model 1 zijn te vinden in bijlage V met in de kolommen van links naar rechts de coëfficiënten, standaardfout en p-waarde. Model 1 is niet geschat met robuuste standaardfouten, aangezien er geen heteroscedasticiteit is. Wat opvalt aan de

resultaten uit bijlage V is dat model 1 een vrij hoge R² heeft (0,513). Dit betekent dat de

      

7 Roken kan opgevat worden als gezondheidsrisicogedrag en daarom is het van belang om deze variabele als instrument op te nemen. Redelijk veel mensen hebben echter geen informatie gegeven over hun

(18)

regressoren het inkomen vrij goed verklaren. Over het algemeen nemen verder de coëfficiënten van de geschatte regressoren de verwachte tekens en waarden aan. Uit de resultaten blijkt dat vrouwen ongeveer 14,3% minder verdienen dan mannen. Verder verdienen mensen met een Nederlandse afkomst ongeveer 6,7% meer dan mensen die niet oorspronkelijk uit Nederland komen. Het volgen van een hogere en langere opleiding loont, aangezien de coëfficiënten van hbo en wo hoger zijn dan die van vmbo en mbo. Ervaring heeft een positief effect op het inkomen en is concaaf, aangezien de coëfficiënt van ervaring2 negatief is. Opmerkelijk is echter dat alle branches een negatief coëfficiënt hebben. Dit kan komen doordat er geen referentiecategorie is. Daarnaast hebben mensen met een

leidinggevende functie een hoger uurloon dan mensen die geen leidinggevende functie

hebben. Ook uit de resultaten bij beroep (o.a. hoger_supervisory) blijkt dat het volgen van een opleiding een significant en positief effect heeft op het inkomen. Als referentiecategorie wordt namelijk ongeschoold gebruikt. Verder is de coëfficiënt van fulltime negatief. Een verklaring hiervoor zou kunnen zijn dat mensen met een volledige baan relatief veel belasting moeten betalen over hun inkomen waardoor er betrekkelijk minder geld overblijft.

Daarnaast is te zien dat betrekkelijk veel onafhankelijke variabelen significant zijn. Enkel partner, vmbo, fulltime en gemid_geschoold_fysiek hebben een betrekkelijk hoge p-waarde. Helaas blijkt uit de resultaten dat de gezondheidsvariabelen verre van significant zijn, zelfs niet bij een significantieniveau van 10%. Hierdoor is het lastig om een goede conclusie te trekken. Echter zijn de gezondheidsvariabelen wel gezamenlijk significant. Dit blijkt uit bijlage VI. In deze bijlage is de uikomst van de F-toets op gezamenlijke significantie te zien (p-waarde = 0,026).

Wanneer enkel de coëfficiënten van de gezondheidsvariabelen in beschouwing worden genomen, valt op dat de coëfficiënt van ziekte_handicap positief is, wat zou betekenen dat chronisch zieken of gehandicapten meer verdienen dan niet chronisch zieken of

niet-gehandicapten. Ook is opmerkelijk dat de coëfficiënten van ze_goed en ze_uitstekend negatief zijn. Dit zou betekenen dat een goede en uitstekende gezondheid, vergeleken met een slechte gezondheid, een negatief effect hebben op het inkomen. Dit is tegen de verwachting in. Een verklaring hiervoor kan zijn dat het grootste deel van de mensen hun gezondheid met ‘goed’ heeft beoordeeld en dat het grootste deel van deze mensen hun gezondheid niet nauwkeurig genoeg hebben beoordeeld. Echter zijn, zoals als eerder gezegd is, ook hier de p-waarden zeer hoog en daardoor zijn de resultaten betrekkelijk.

(19)

Om te bepalen of er een significant verschil bestaat tussen mannen en vrouwen met betrekking tot het effect van gezondheid op het inkomen, is onderzocht of er interactie-effecten van geslacht en de gezondheidsvariabelen moeten worden opgenomen (bv.

man*BMI). Dit is gedaan aan de hand van een F-toets. De resultaten van de F-toets en het

geschatte model zijn te vinden in bijlage VI. Uit de resultaten is af te leiden dat alle interactie-effecten zowel individueel als gezamenlijk niet significant zijn.

Vervolgens is daarom een Chow-toets gedaan om te bepalen of er een significant verschil bestaat tussen mannen en vrouwen met betrekking tot het inkomen. De uitkomst van deze toets is weergegeven in bijlage IX te vinden. De waarde van de F-toets is 2,327 en aangezien dit getal groter is dan de bijbehorende kritieke waarde F(37,1760)=1,394, wordt de nulhypothese verworpen. Dit betekent dat er significante verschillen bestaan tussen mannen en vrouwen. Om deze reden zijn modellen 3 en 4 geschat waar enkel de waarnemingen voor mannen en vrouwen respectievelijk zijn gebruikt. Deze modellen komen overeen met model 1. Echter is in modellen 3 en 4 het geslacht uiteraard niet als verklarende variabele

opgenomen. In beide modellen zijn robuuste standaardfouten gebruikt wegens

heteroscedasticiteit. De resultaten zijn in bijlage VIII te vinden. Hier is te zien dat de R² van beide modellen behoorlijk hoog is. Echter wordt voor vrouwen het bruto uurloon minder goed verklaard dan voor mannen (0,4282 en 0,578 resp.).

Verder is uit de resultaten af te leiden dat de meeste coëfficiënten van de regressoren overeenkomt met die van het geschatte model 1. Echter hebben partner en vmbo nu voor vrouwen in model 6 een negatief coëfficiënt (-0,040 en -0,023). Verder zijn de coëfficiënten bij opleiding in model 5 hoger dan in model 6. Opleiding heeft dus een groter effect op het inkomen voor mannen dan voor vrouwen. Daarentegen zijn de coëfficiënten van de variabelen met betrekking tot het beroep en sector voor vrouwen weer over het algemeen hoger.

Verder is te zien dat er betrekkelijk meer niet-significante variabelen zijn in model 4 dan in model 3. Zo zijn opleiding en branche over het algemeen niet significant. Dit betekent dat de opgenomen onafhankelijke variabelen minder goed het inkomen verklaren voor vrouwen. Het zou kunnen zijn dat er meer afwijkende observaties bij vrouwen zijn.

Wat verder opvalt, is dat ook hier alle gezondheidsvariabelen voor zowel mannen als vrouwen niet significant zijn. Zo heeft ze_uitstekend zelfs een p-waarde van 0,807 en 0,912 in model 3 en 5 respectievelijk. Echter is ze_zeergoed in model 3 bij een significantieniveau van 10% wel significant. Aan de hand van verschillende F-toetsen is de gezamenlijke significantie

(20)

van de gezondheidsvariabelen getoetst. De resultaten van deze toetsen zijn tevens in tabel VI te vinden. Uit de resultaten valt op te maken dat voor mannen de gezondheidsvariabelen wel gezamenlijk significant zijn (p-waarde=0,026). Voor vrouwen zijn de gezondheidsvariabelen echter niet gezamenlijk significant (p-waarde=0,339).

Als enkel naar de coëfficiënten van de gezondheidsvariabelen gekeken wordt, is te zien dat in model 4 (net als in model 1) ze_goed en ze_uitstekend een negatief coëfficiënt hebben, wat zou betekenen dat vrouwen met een goede of uitstekende gezondheid minder verdienen dan vrouwen met een slechtere gezondheid. Voor mannen geldt dit niet. Daarnaast blijkt uit de resultaten van model 4 dat ziekte_handicap een positief effect heeft op het inkomen. Dit is opmerkelijk. Bovendien heeft het BMI voor vrouwen een sterker negatief effect op het inkomen dan voor mannen. Dit zou kunnen betekenen dat het BMI voor vrouwen een groter negatief effect heeft op het inkomen dan voor mannen. Er kan verder geconcludeerd worden dat de resultaten in model 4 erg verschillen met die van model 3 en dat de uitkomsten van het geschatte model 3 meer overeen komen met de verwachting.

Aangezien er mogelijk een simultaan verband bestaat tussen het inkomen en de gezondheidsvariabelen, zijn de gezondheidsvariabelen getoetst op exogeniteit. De resultaten hiervan staan in bijlage X. Uit de resultaten valt op te maken dat bij zowel mannen als

vrouwen de gezondheidsvariabelen zwak gecorreleerd zijn met de storingstermen uit model 3 en 4 respectievelijk. Alle correlatiecoëfficiënten zijn namelijk ongelijk aan nul (variërend van 0,001 tot 0,036). Dit betekent dat de gezondheidsvariabelen (licht) endogeen zijn. BMI is zowel met res_m als met res_v8 het sterkst gecorreleerd (-0,027 en 0,036 resp.) in vergelijking met de andere variabelen. Daarom kan geconcludeerd worden dat BMI mogelijk de meest endogene gezondheidsvariabele is. De correlaties tussen ze_matig en ziekte_handicap en de storingstermen zijn het zwakst. Er zijn verder een aantal verschillen tussen mannen en vrouwen. Zo zijn de tekens van de correlatiecoëfficiënten niet overal gelijk. Deze verschillen bij de correlatie tussen de storingstermen en ze_matig (0,001 en -0,006 in model 3 en 4 resp.),

ze_uitstekend (0,015 en -0,011), BMI (-0,027 en 0,036) en ziekte_handicap (0,006 en -0,006).

Er is bovendien een regressie van de storingstermen res_m en res_v op alle gezondheidsvariabelen gedaan om de gezamenlijke relatie van de storingstermen met alle gezondheidsvariabelen te meten. De resultaten van deze regressie zijn te vinden in bijlage X onder de correlatietabellen. Uit de resultaten van de geschatte regressies is op te maken dat

      

(21)

geen enkele gezondheidsvariabele hier significant is. De p-waarden van BMI zijn echter voor zowel model 3 als 4 het laagst, wat overeenkomt met de vorige bevindingen. Geconcludeerd kan worden dat de opgenomen gezondheidsvariabelen exogeen zijn, maar dat BMI mogelijk endogeen is. OLS zou een juiste schattingsmethode kunnen zijn. Aangezien er toch een zwakke correlatie (de correlatiecoëfficiënten zijn ongelijk aan nul) ontdekt is tussen de gezondheidsvariabelen en de storingstermen, is geschat met 2SLS. De uitkomsten van deze schattingsmethode zijn in de volgende paragraaf te vinden.

5.2 2SLS

In deze paragraaf worden de resultaten besproken van het opgestelde model dat nu aan de hand van verschillende instrumentele variabelen met 2SLS geschat is. Omdat uit de Chow-toets is gebleken dat er significante verschillen bestaan tussen mannen en vrouwen met betrekking tot het inkomen, is ook hier enkel met mannen (model 5) en enkel met vrouwen (model 6) geschat. De resultaten van de geschatte modellen 5 en 6 zijn in bijlage XI te vinden. Gelijk valt op dat de R² in model 6 zeer laag is (0,091). Wanneer met 2SLS geschat wordt, is het inkomen voor vrouwen dus minder goed te verklaren. Model 5 wordt echter veel beter verklaard aan de hand van de opgenomen verklarende variabelen en instrumenten. Hier is de R² namelijk 0,572.

Verder valt op dat veel (algemene) variabelen niet significant zijn. Zo blijkt uit de resultaten dat voor mannen de branche waarin iemand werkzaam is en het beroep verre van significant zijn. Voor vrouwen zijn de variabelen voor opleiding niet significant. Ervaring2 is in beide modellen ook nauwelijks significant. Deze uitkomsten zijn zeer opmerkelijk en in strijd met de verwachting, aangezien verwacht wordt dat het inkomen en het beroep, branche en opleiding nauw met elkaar samenhangen. De coëfficiënten van de variabelen nemen echter wel ongeveer de verwachte tekens en waarden aan.

Uit de resultaten is verder op te maken dat voor zowel mannen als vrouwen ook de gezondheidsvariabelen niet significant zijn. De gezondheidsvariabelen zijn zowel voor model 5 als 6 ook niet gezamenlijk significant (zie bijlage VI). Uit de resultaten kan verder

geconcludeerd worden dat ook hier BMI meer significant en positief is voor vrouwen dan voor mannen (0,126 tegen 0,716 resp.). Als naar de coëfficiënten gekeken wordt, zijn er behoorlijk wat verschillen tussen mannen en vrouwen. Zo heeft het BMI voor mannen een negatief effect op het inkomen (-0,010) en aangezien de coëfficiënt van BMI voor vrouwen echter positief is, zouden dikkere vrouwen meer verdienen dan dunnere vrouwen. Dit is tegen

(22)

de verwachting in. Het hebben van een ziekte is voor vrouwen nadelig met betrekking tot het inkomen (-0,040), terwijl de coëfficiënt van ziekte_handicap voor mannen echter weer positief is (0,067). Verder zijn de coëfficiënten van ze_goed en ze_uitstekend positiever voor mannen dan voor vrouwen. Dit betekent dat een goede of uitstekende gezondheid een groter positief effect heeft op het inkomen voor mannen. Een zeer goede gezondheid speelt voor vrouwen weer een belangrijkere rol, want het verkeren in een zeer goede gezondheid kan het inkomen met 28,1% doen stijgen. Daarnaast is te zien dat de gezondheid een groter effect heeft op het inkomen voor vrouwen dan voor mannen, aangezien alle coëfficiënten van de zelfevaluaties positiever dan wel negatiever zijn. Echter is het wegens wederom de hoge p-waarden van vele gezondheidsvariabelen in beide modellen erg lastig om een gegronde conclusie te trekken uit de resultaten. Het kan zijn dat belangrijke gezondheids- of instrumentele variabelen niet zijn opgenomen in de modellen, waardoor er een omitted variable bias ontstaat.

Er zijn verschillende toetsen gedaan om te bepalen of voldaan is aan de assumpties voor 2SLS. Zo zijn de instrumentele variabelen allereerst getoetst op relevantie. De

uitkomsten hiervan zijn in bijlage XII te vinden. Uit de resultaten is op te maken dat in model 5 ziekte en belemmeringen redelijk, doch zwak gecorreleerd zijn met de meeste variabelen. De rest van de instrumenten is nauwelijks gecorreleerd met de gezondheids-variabelen. Uit de resultaten van model 6 is tevens op te maken dat ziekte en belemmeringen het meest gecorreleerd zijn met de gezondheidsvariabelen. Huisarts13 en ziekenhuis blijken ook hier geen relevante instrumenten te zijn. Er kan uit deze bevindingen geconcludeerd worden dat ziekte en belemmering mogelijk wel relevant zijn en de rest van de instrumenten niet. Het gebruik van zwakke instrumenten kan zorgen voor een grotere bias in de resultaten.

Vervolgens is aan de hand van de Sargan–toets getoetst op validiteit van de instrumenten. In bijlage XIII zijn de resultaten van deze toetsen te vinden. Gelijk valt te concluderen dat voor zowel model 5 als 6 de p-waarden groter zijn dan 0,05 (0137 en 0,941 resp.) en dat de nulhypothese dus nergens verworpen dient te worden. Dit betekent dat de instrumenten valide en dus niet gecorreleerd met de storingstermen zijn. In model 5 is de p-waarde van de Sargan-toets betrekkelijk lager dan die in model 6. Dit zou betekenen dat voor mannen de instrumenten meer gecorreleerd zijn met de storingstermen.

Tot slot is de Hausman–toets uitgevoerd om te toetsen op exogeniteit van de

(23)

de toets valt op te maken dat de nulhypothesen niet verworpen hoeven te worden. De p-waarde van de toets is voor model 5 namelijk 0,898 en voor model 6 0,331. Dit betekent dat alle verklarende variabelen uit de hoofdregressie bij 2SLS zodoende exogeen zijn.

6. Conclusie

In dit onderzoek is onderzocht wat de invloed is van gezondheid op de natuurlijke logaritme van het bruto uurloon in Nederland en wat het verschil hierin is tussen mannen en vrouwen. Op grond van de Mincer-type vergelijking is een model opgesteld met onder andere

verschillende gezondheidsvariabelen, beroep en opleiding als verklarende variabelen. Om dit model te schatten, zijn data gebruikt die verkregen zijn uit meerdere enquêtes uit 2012 van het LISS data panel. Nadat dit model met alle waarnemingen geschat is, is een Chow-toets

gedaan. Hieruit is gebleken dat er significante verschillen bestaan tussen mannen en vrouwen met betrekking tot het inkomen. Aangezien bovendien interactie-effecten van geslacht en gezondheid op het inkomen geen (gezamenlijk) significant effect hebben, is het genoemde model zodoende apart geschat voor mannen en vrouwen.Uit de resultaten is gebleken dat in tegenstelling tot mannen een goede of uitstekende zelfevaluatie van de gezondheid voor vrouwen een negatief effect hebben op het inkomen (-0,018 en -0,006 resp.) en dat het hebben van een chronische ziekte of handicap weer een positief effect heeft (0,014). De coëfficiënten uit het met enkel mannen geschatte model nemen wel de verwachte tekens aan. Het BMI heeft verder voor vrouwen een groter negatief effect op het inkomen. Alle gezondheidsvariabelen zijn echter voor zowel mannen als vrouwen niet significant. Voor mannen bleken daarentegen de gezondheidsvariabelen wel weer gezamenlijk significant.

Aangezien er mogelijk een simultaan verband bestaat tussen het inkomen en de gezondheidsvariabelen, zijn de gezondheidsvariabelen getoetst op exogeniteit. Uit de resultaten is geconcludeerd dat alle gezondheidsvariabelen (in zeer geringe mate) endogeen zijn. Daarom is aan de hand van instrumentele variabelen (waaronder huisartsbezoek en medicijngebruik) geschat met 2SLS. Ook hier is apart geschat voor mannen en vrouwen. Uit de resultaten is naar voren gekomen dat tegen de verwachting in het BMI voor vrouwen een positief effect heeft op het inkomen en dat voor mannen het hebben van een ziekte of handicap het inkomen met 6,7% stijgt. Verder is gebleken dat voor vrouwen de gezondheid een groter effect heeft op het inkomen aangezien voor vrouwen alle coëfficiënten van de gezondheidsvariabelen in absolute waarde groter zijn dan die voor mannen. Aangezien de

(24)

gezondheidsvariabelen ook hier verre van (gezamenlijk) significant zijn, is het lastig om een gegronde conclusie te trekken aan de hand van de resultaten. Uit verschillende toetsen is tot slot gebleken dat voor zowel model 5 als 6 het merendeel van de gebruikte instrumenten niet relevant maar wel valide bleek te zijn en dat de regressoren uit de hoofdregressie allen exogeen zijn.

Er zitten een aantal beperkingen in het onderzoek. Zo is een zelfevaluatie van de eigen gezondheid erg subjectief. Mogelijk zijn er fouten gemaakt bij de zelfevaluatie. Mensen met een lagere opleiding zouden bijvoorbeeld minder goed in staat kunnen zijn om hun eigen gezondheid te beoordelen aangezien het hen aan (relevante) kennis ontbreekt. Zodoende is scholing mogelijk ook endogeen. Het is erg lastig om gezondheid objectief en exact te meten. Om een goede conclusie te trekken aan de hand van de geschatte regressies zou de

gezondheid van de participanten eigenlijk in een gezondheidscentrum gemeten moeten worden. Dit is echter erg duur, maar wellicht zijn de waarnemingen dan meer objectief en precies metingen. Het kan ook zijn dat belangrijke gezondheids- en instrumentele variabelen niet opgenomen zijn in het model, waardoor gezondheid eveneens niet goed meetbaar is gemaakt en waardoor de instrumenten bij 2SLS niet relevant zijn. Hierdoor ontstaat er een omitted variable bias ontstaat.

Daarnaast komen 569 van de 1771 mensen uit hetzelfde huishouden. In verschillende huishouden hebben dus meerdere mensen de enquêtes ingevuld. Hierdoor zijn de

waarnemingen hoogst waarschijnlijk onderling gecorreleerd. Zo hebben mensen uit hetzelfde huishoudens waarschijnlijk ongeveer dezelfde opleidingen gevolgd, mogelijk dezelfde afkomst en leef- en eetpatroon en hierdoor misschien dezelfde gezondheid. Daarom wordt aangeraden om in vervolgonderzoek willekeurig één persoon uit een huishouden te nemen.

Een laatste en zeer belangrijke beperking in het onderzoek is dat enkel data uit 2012 is gebruikt. Om te corrigeren voor de omitted variable bias en eventuele veranderingen over tijd, wordt aangeraden om met panel data te schatten. Dit betekent dat data uit meerdere jaren (bv. 2008 t/m 2012, oftewel 5 waves) gebruikt worden. Zodoende kunnen modellen met fixed dan wel random effects worden geschat (zie o.a. Gambin, 2005). Gezien de betrekkelijkheid van de resultaten van en de beperkingen in het verrichte onderzoek kan geconcludeerd worden dat er genoeg stof is tot nadenken en voor verder onderzoek.

(25)

Bibliografie

Baldwin, M. and W. Johnson (1994), “Lanor Market Discrimination Against Men with Disablities,”

Journal of Human Resources 29, 1-19

Becker, G. S. (1962), “Investment in Human Capital; A theoretical analysis,” Journal of Political

Economy 70, Part 2: Investment in Human Beings, 9-49

Berkowitz, M., P. Fenn en J. Labrinos (1983), “The Optimal Stock of Health with Endogenous Wages,” Empirical Economics 26, 599-622

Brakel, M. van den en L. Moonen (2013), Groot inkomensverschil tussen werkende vaders en moeders, webmagazine, CBS

Contoyannis, P. and N. Rice (2001), “The Impact of Health on Wages: Evidence from the British Houseshold Panel Survey,” Empirical Economics 26, 599-622

Currie, J. and Madrian B. (1999), “Chapter 50: Health, health insurances and the labor market,”

Handbook of labor economics, 3C, 3309-3416

Ettner, S. (1996), “New Evidence on the Relationship between Income and Health,” Journal of Health

Economics, 15: 67-85

Gambin, M. (2005), “The Impact of Health on Wages in Europe – Does Gender Matter?,” HEDG

working paper 05/03

Grossman, M. (1972), “On the Concept of Health Capital and the Demand for Health,” Journal of

Political Economy 80, 223-255

Haveman, R., B. Wolfe, B. Kreider, en M. Stone (1994), “Market Work, Wages and Men’s Health,”

Journal of Health Economics 13, 163-182

Lee, L. F. (1982), “Health and Wages: A Simultaneous Equation Model with Multiple Discrete Indicators,” International Economic Review 23, 199-221

Luft, H. S. (1975), “The Impact of Poor Health on Earnings,” Review of Economics and Statistics 57, 43-57

Mincer, J. (1958), “Investment in Human Capital and Personal Income Distribution,” Journal of

Political Economy 66: 281-302

Harchaoui, S. et al (2011), Nieuwe ronde, nieuwe kansen: sociale stijging en daling in perspectief, Raad voor Maatschappelijke Ontwikkeling, 128-129

Sundberg, G. (1998), “Health, Work-Hours and Wages in Sweden”, Developments in Health Economics and Public Publicy 6, 95-112

Vaartjes, I. et al (2011), “Hart- en vaatziekten in Nederland – cijfers over leefstijl- en risicofactoren, ziekte en sterfte,” Nederlandse Hartstichting

Wagstaff, A. en Van Doorslaer, E. (2000), Income inequality and health: what does the literature tells us?”, Annual Review of Public health 21, 543-567

(26)

Bijlage

Bijlage I. Naamgeving van alle variabelen met omschrijving9

VARIABELE OMSCHRIJVING AFHANKELIJKE VARIABELE

ln_netto_uurloon netto uurloon in euro in natuurlijke logaritme VERKLARENDE VARIABELEN

GK - Gezondheidsvariabelen Zelfevaluatie (met ze_matig als CG)

ze_matig 1 = zelfevaluatie van een matige gezondheid, 0 = anders ze_goed 1 = zelfevaluatie goede gezondheid, 0 = anders

ze_zeergoed 1 = zelfevaluatie zeer goede gezondheid, 0 = anders ze_uitstekend 1 = zelfevaluatie uitstekende gezondheid, 0 = anders BMI Body Mass Index: gewicht in kg / lengte²

ziekte_handicap 1 = wel ziekte en/of handicap, 0 = geen PK – variabelen mbt persoonlijke kenmerken

geslacht 1 = Vrouw, 0 = man

nederlands 1 = Nederlandse afkomst, 0 = anders (zo kunnen geënquêteerden ouders of grootouders hebben die uit het buitenland (Westen of niet-Westen) komen

partner 1 = samenwonend met partner, 0 = anders Opleiding (met basisschool als CG)

basisschool 1 = basisschool als hoogste opleiding, 0 = anders vmbo 1 = vmbo als hoogste opleiding, 0 = anders havo_vwo 1 = havo of vwo als hoogste opleiding, 0 = anders mbo 1 = mbo als hoogste opleiding, 0 = anders hbo 1 = hbo als hoogste opleiding, 0 = anders wo 1 = wo als hoogste opleiding, 0 = anders ervaring aantal jaren mogelijke werkervaring

ervaring2 ervaring kwadraat in jaren: (ervaring^2)/100 WK – werkgerelateerde variabelen

tenure aantal jaren in dienst bij huidige werkgever Sector

industrie 1 = werkzaam in de branche industrie, 0 = elders werkzaam bouw 1 = werkzaam in de branche bouw, 0 = elders werkzaam klein_handel 1 = werkzaam in de branche kleinhandel, 0 = elders werkzaam horeca 1 = werkzaam in de branche horeca, 0 = elders werkzaam transport 1 = werkzaam in de branche transport, 0 = elders werkzaam financieel 1 = werkzaam in de branche financiële instellingen,

0 = elders werkzaam

business_services 1 = werkzaam in de branche zakelijke dienstverlening,

0 = elders werkzaam

overheidsservices 1 = werkzaam in de branche overheidsservices,

0 = elders werkzaam

onderwijs 1 = werkzaam in de branche onderwijs, 0 = elders werkzaam zorg 1 = werkzaam in de branche zorg, 0 = elders werkzaam recreatie 1 = werkzaam in de branche recreatie, cultuur, milieudienst- en

overige dienstverlening, 0 = elders werkzaam       

9 Schuin gedrukte variabelen duiden dummy variabelen aan. De uitkomst van deze variabelen kunnen dus twee waardes aannemen: 1 dan wel 0. CG betekent controlegroep.

(27)

overig_werk 1 = werkzaam in een nog niet genoemde branche, 0 = elders werkzaam

Beroep (met ongeschoold als CG): beroepen ingedeeld op benodigde vaardigheden en taken en opleiding hoger_academisch 1 = hoger academische vaardigheden (vh), 0 = anders

hoger_supervisory 1 = hoger supervisory/leidinggevende vh, 0 = anders gemiddeld_academisch 1 = gemiddeld academische vh, 0 = anders

gemiddeld_supervisory 1 = gemiddeld supervisory/leidinggevende vh, 0 = anders ander_geestelijk 1 = andere geestelijke vh, 0 = anders

geschoold_fysiek 1 = geschoold fysiek, 0 = anders

gemid_geschoold_fysiek 1 = gemiddeld geschoold fysiek, 0 = anders ongeschoold 1 = ongeschoold, 0 = anders

fulltime 1 = fulltime baan, 0 = anders

cursus 1 = een on-the-job training of cursus afgerond, 0 = anders aantal_werknemers500p 1 = 500 of meer mensen in het bedrijf, 0 = anders Instrumentele variabelen

Aantal huisartsbezoeken (met huisarts0 als CG)

huisarts0 1 = geen huisartsbezoeken per maand, 0 = anders huisarts13 1 = 1 t/m 3 huisartsbezoeken per maand, 0 = anders huisarts4p 1 = 4 en meer huisartsbezoeken per maand, 0 = anders

ziekenhuis 1 = meer dan één keer naar het ziekenhuis geweest afgelopen jaar, 0 = anders

roker 1 = roker, 0 = anders

ziekte 1 = het hebben van een ziekte (chronische ziekten zitten hier bij), 0 = anders

specialist 1 = een specialist bezocht afgelopen jaar (psychiater,

fysiotherapeut, tandarts, neuroloog, oogarts, internist, hartspecialist, chirurg orthopeet), 0 = anders

medicijn 1 = medicijnen gebruikt afgelopen jaar (tegen een te hoog cholesterol / hoge bloeddruk / hartproblemen / astma / diabetes / depressie / maagzuurproblemen / e.d.), 0 = anders

Zelfevaluatie vergelijking (met iets_slechter als CG)

iets_slechter 1 = zelfevaluatie gezondheid iets slechter vergeleken met vorig jaar, 0 = anders

hetzelfde 1 = zelfevaluatie gezondheid hetzelfde vergeleken met vorig jaar, 0 = anders

iets_beter 1 = zelfevaluatie gezondheid iets beter vergeleken met vorig jaar, 0 = anders

aanzienlijk_beter 1 = zelfevaluatie gezondheid iets beter vergeleken met vorig jaar, 0 = anders

belemmeringen 1 = belemmeringen mbt werk, algemeen en sociaal, 0 = geen of nauwelijks belemmeringen

Interactietermen voor model 2 Man_ze_slecht = man*ze_slecht Man_ze_goed = man*ze_slecht Man_ze_zeergoed = man*ze_slecht Man_BMI = man*ze_slecht Man_ziekte_handicap = man*ziekte_handicap Vrouw_ze_slecht = vrouw*ze_slecht Vrouw_ze_goed = vrouw*ze_goed Vrouw_ze_zeergoed = vrouw*ze_zeergoed Vrouw_BMI = vrouw*BMI Vrouw_ziekte_handicap = vrouw*ziekte_handicap

Naamgeving storingstermen behorend bij de toetsen op exogeniteit res_m: storingstermen van het geschatte model 3 (bij mannen) res_v: storingstermen van het geschatte model 4 (bij vrouwen)

(28)

Bijlage II. Overzicht met aantallen en percentages voor de gebruikte variabelen bij mannen, vrouwen en de gehele sample respectievelijk10

MAN VROUW TOTAAL

Gezondheidsvariabele Aantal Percentage Aantal Percentage Aantal Percentage

Nederlands 784 0,876 803 0,917 1587 0,896 Partner 704 0,787 654 0,747 1358 0,767 Basisschool 11 0,012 9 0,010 20 0,011 Vmbo 161 0,180 156 0,178 317 0,179 havo_vwo 74 0,083 85 0,097 159 0,090 Mbo 277 0,309 250 0,285 527 0,298 Hbo 251 0,280 278 0,317 529 0,299 Wo 121 0,135 98 0,112 219 0,124 Industrie 151 0,169 37 0,042 188 0,106 Bouw 73 0,082 13 0,015 86 0,049 klein_handel 56 0,063 64 0,073 120 0,068 Horeca 18 0,020 20 0,023 38 0,021 Transport 65 0,073 20 0,023 85 0,048 Financieel 53 0,059 44 0,050 97 0,055 business_services 70 0,078 45 0,051 115 0,065 Overheidsservices 136 0,152 77 0,088 213 0,120 Onderwijs 70 0,078 115 0,131 185 0,104 Zorg 66 0,074 308 0,352 374 0,211 Recreatie 9 0,010 28 0,032 37 0,021 overig_werk 122 0,136 95 0,108 217 0,123 hoger_academisch 96 0,107 46 0,053 142 0,080 hoger_supervisory 98 0,109 40 0,046 138 0,078 gemiddeld_academisch 165 0,184 319 0,364 484 0,273 gemiddeld_supervisory 155 0,173 92 0,105 247 0,139 ander_geestelijk 155 0,173 296 0,338 451 0,255 geschoold_fysiek 126 0,141 11 0,013 137 0,077 gemid_geschoold_fysiek 79 0,088 24 0,027 103 0,058 ongeschoold_fysiek 15 0,017 38 0,043 53 0,030 fulltime 779 0,870 219 0,250 998 0,564 cursus 324 0,362 354 0,404 678 0,383 aantal_werknemers500p 115 0,128 92 0,105 207 0,117 ze_matig 77 0,086 73 0,083 150 0,085 ze_goed 548 0,612 574 0,655 1122 0,634 ze_zeergoed 221 0,247 187 0,213 408 0,230 ze_uitstekend 49 0,055 42 0,048 91 0,051 ziekte_handicap 198 0,221 194 0,221 392 0,221 huisarts0 437 0,488 254 0,290 691 0,390 huisarts13 389 0,435 480 0,548 869 0,491 huisarts4p 69 0,077 142 0,162 211 0,119 ziekenhuis 61 0,068 85 0,097 146 0,082 roker 171 0,191 156 0,178 327 0,185 ziekte 143 0,160 143 0,163 286 0,161 specialist 285 0,318 389 0,444 674 0,381 medicijn 240 0,268 268 0,306 508 0,287 iets_slechter 120 0,134 141 0,161 261 0,147 hetzelfde 661 0,739 607 0,693 1268 0,716 iets_beter 114 0,127 128 0,146 242 0,137 aanzienlijk_beter 17 0,019 30 0,034 47 0,027       

10 ‘Procenten’ bij mannen is berekend door het desbetreffende aantal te delen door het totaal aantal mannen (895), bij vrouwen is ‘Procenten’ op dezelfde wijze berekend (876). ‘Procenten’ bij totaal is berekend door het desbetreffende aantal te delen door het totaal aantal observaties (1771).

(29)

Bijlage III. Overzicht met gemiddelden, standaarddeviaties en minimale en maximale waarnemingen voor elke onafhankelijke variabele

Variable # Obs Gemiddelde Min Max

nederlands 1771 .8961039 0 1 geslacht 1771 .4946358 0 1 partner 1771 .7667984 0 1 basisschool 1771 .0112931 0 1 vmbo 1771 .1789949 0 1 havo_vwo 1771 .0897798 0 1 mbo 1771 .297572 0 1 hbo 1771 .2987013 0 1 wo 1771 .1236589 0 1 ervaring 1771 26.107 1 52.000 ervaring2 1771 8.054 .01 27.04 tenure 1770 13.193 .0400391 49.040 industrie 1771 .1061547 0 1 bouw 1771 .0485601 00 1 klein_handel 1771 .0677583 0 1 horeca 1771 .0214568 0 1 transport 1771 .0479955 0 1 financieel 1771 .0547713 0 1 business_services 1771 .0649351 0 1 overheidsservices 1771 .120271 0 1 onderwijs 1771 .1044608 0 1 zorg 1771 .2111801 0 1 recreatie 1771 .0208922 0 1 overig_werk 1771 .1225296 0 1 hoger_acadademisch 1771 .0801807 0 1 hoger_ supervisoy 1771 .0779221 0 1 gemiddeld_acadademisch 1771 .2732919 0 1 gemiddeld_ 1771 .1394692 0 1 ander_geestelijk 1771 .2546584 0 1 geschoold_fysiek 1771 .0773574 0 1 gemid_geschoold_fysiek 1771 .0581592 0 1 Ongeschool_fysiek 1771 .0299266 0 1 fulltime 1771 .5635234 0 1 cursus 1770 .3830508 0 1 aantal_werknemers500p 1771 .1168831 0 1 ze_matig 1771 .0846979 0 1 ze_goed 1771 .6335404 0 1 ze_zeergoed 1771 .2303783 0 1 ze_uitstekend 1771 .0513834 0 1 BMI 1771 25.640 16.824 55.936 ziekte_hanicap 1771 .2213439 0 1 huisarts0 1771 .390175 0 1 huisarts13 1771 .4906832 0 1 huisarts4p 1771 .1191417 0 1 ziekenhuis 1771 .0824393 0 1 roker 977 .3346981 0 1 ziekte 1771 .1614907 0 1 specialist 1771 .3805759 0 1 medicijn 1771 .2868436 0 1 iets_slechter 1771 .1473744 0 1 hetzelfde 1771 .7159797 0 1 iets_beter 1771 .136646 0 1 aanzienlijk_beter 1771 .0265387 0 1

(30)

Bijlage IV. Uitkomsten van de Breusch-Pagan-toetsen op homoscedasticiteit voor modellen 1, 2, 3 en 4

Model 1 (OLS, alle observaties)

Model 2 (OLS inclusief interactietermen, alle observaties)

Model 3 (OLS, enkel mannen)

Model 4 (OLS, enkel vrouwen) Prob > chi2 = 0.9119 chi2(1) = 0.01

Variables: fitted values of ln_bruto_uurloon Ho: Constant variance

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Prob > chi2 = 0.9810 chi2(1) = 0.00

Variables: fitted values of ln_bruto_uurloon Ho: Constant variance

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Prob > chi2 = 0.0000 chi2(1) = 17.04

Variables: fitted values of ln_bruto_uurloon Ho: Constant variance

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Prob > chi2 = 0.0001 chi2(1) = 15.70

Variables: fitted values of ln_bruto_uurloon Ho: Constant variance

Referenties

GERELATEERDE DOCUMENTEN

Kunt u een voorbeeld geven waaruit blijkt dat u bij het vaststellen van de impact en waarschijnlijkheid van optreden van risico’s, de nadruk op lange of korte termijn legt.. Bij

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of

Voor deze behandeling kan worden gekozen als het zaad te slecht is (minder dan 1 miljoen beweeglijke zaadcellen per zaadlozing) of als reageerbuisbevruchting één of twee keer

Mean stremwise velocity profile and its fluctuating component for the cases A1-2 and A2-2 for different turbulent length and time scales used to generate turbulent inflow

Opvallend is dat de vijf bibliotheken (zwart) die aangeven dat het aanzienlijk vergemakkelijken van de 

Mannen of vrouwen bleken inderdaad geen significant hogere daling van het aantal glazen alcohol te hebben dan het andere geslacht wanneer er trek naar alcohol bij kick-situaties werd

Dus, hoewel de oor- zaken van stress meer aanwezig zijn in jobs en sec- toren waar vrouwen oververtegenwoordigd zijn en hoewel vrouwen naast hun job ook nog vaak in- staan voor de

[r]