Adverse selectie of moral hazard? : het analyseren van asymmetrische informatie op de markt voor ziektekostenverzekeringen in de VS

(1)

1

Adverse selectie of moral hazard?

Het analyseren van asymmetrische informatie op de

markt voor ziektekostenverzekeringen in de VS

Gidion van Kempen, 10610898 Econometrie, Universiteit van Amsterdam

Studiejaar 2015-2016 Begeleider: Hans van Ophem

Bachelorscriptie, juni 2016

Abstract

Deze scriptie richt zich op de vraag hoe en in hoeverre adverse selectie en moral hazard geïdentificeerd kunnen worden op de ziektekostenverzekeringsmarkt in De Verenigde Staten van Amerikain 2000, 2004 en 2008, en hoe deze twee te

onderscheiden zijn. Er zijn hiervoor gegevens van het MEPS te gebruikt, waarbij personen zijn onderverdeeld in vier groepen: de publiek, via het werk, privaat, en niet verzekerden. Voor de laatste drie groepen is een correctie voor selectiviteit van de uitgaven gebruikt en vervolgens zijn regressies gedaan om de gemaakte uitgaven aan zorg te verklaren. Er is geprobeerd om adverse selectie en moral hazard te onderscheiden met een Blinder-Oaxaca-decompositie. Daaruit blijkt dat in 2008 het verschil in uitgaven tussen de publiek en de privaat verzekerden grotendeels te verklaren in door adverse selectie, het verschil in uitgaven van de publiek en via het werk verzekerden eveneens, en het verschil tussen privaat en niet verzekerden grotendeels door moral hazard. Voor de andere jaren zijn niet altijd goede resultaten voortgekomen.

(2)

2

Inhoudsopgave

1 Inleiding ... 3

2 Theoretisch kader ... 5

3 Onderzoeksopzet ... 8

4 Gegevens en keuze van variabelen... 12

5 Onderzoeksresultaten ... 16

6 Analyse ... 23

7 Conclusie ... 27

Bibliografie ... 28

Appendix ... 30

Verklaring eigen werk

Hierbij verklaar ik, Gidion van Kempen, dat ik deze scriptie zelf geschreven heb en dat ik de volledige verantwoordelijkheid op me neem voor de inhoud ervan.

Ik bevestig dat de tekst en het werk dat in deze scriptie gepresenteerd wordt origineel is en dat ik geen gebruik heb gemaakt van andere bronnen dan die welke in de tekst en in de referenties worden genoemd.

De Faculteit Economie en Bedrijfskunde is alleen verantwoordelijk voor de begeleiding tot het inleveren van de scriptie, niet voor de inhoud.

(3)

3 1 Inleiding

Wie artikelen met onderzoek naar asymmetrische informatie leest merkt vaak al snel dat het uit elkaar trekken van adverse selectie en moral hazard een moeilijk

probleem is, omdat de gevolgen ervan hetzelfde zijn. Asymmetrische informatie is een veelbesproken verschijnsel, en het kan voorkomen in twee vormen: adverse selectie, het fenomeen dat slechts mensen die vaker kosten maken zich gaan verzekeren, en moral hazard, het fenomeen dat verzekerden minder voorzichtig handelen omdat ze toch al verzekerd zijn (Mishkin, Matthews &, Giuliodori, 2013, p.36). Op de zorgverzekeringsmarkt houdt adverse selectie in dat mensen die verwachten dat ze vaker gebruik zullen maken van zorgvoorzieningen zich beter gaan verzekeren en moral hazard dat verzekerden meer gebruik van

zorgvoorzieningen gaan maken omdat ze het niet meer zelf hoeven te betalen (Mishkin et al., 2013, p.37).

Recent heeft Shen (2013) geschat, door middel van het onderzoeken van gegevens uit 2005, dat iemands uitgaven 48 procent omhooggaan indien diegene verzekerd is. Dit zou kunnen duiden op adverse selectie doordat mensen juist een verzekering nemen omdat ze verwachten meer kosten te maken, of juist op moral hazard aangezien de uitgaven omhoog gaan nadat er een verzekering is afgesloten, of een combinatie van die twee. Cardon en Hendel (2001) hebben de Amerikaanse zorgverzekeringsmarkt onderzocht en kwamen daarbij tot de conclusie dat er geen asymmetrische informatie te vinden was.

Het is voor zowel verzekeraars als consumenten nuttig om inzicht te hebben in het verschil tussen beide vormen en de mate waarin dit voorkomt op een bepaalde markt. Verzekeraars kunnen er dan bijvoorbeeld met een ander beleid er voor zorgen dat de juiste mensen zich verzekeren waardoor de prijs ook omlaag kan gaan. Om een goede werking van de verzekeringsmarkt te krijgen, is het nodig om meer

onderzoek te doen. Het is de vraag hoe asymmetrische informatie het beste gemeten kan worden, en, hoewel het in eerder onderzoek lastig is gebleken, hoe adverse selectie en moral hazard dan kunnen worden onderscheiden. Een obstakel dat komt kijken hierbij is dat de verzekeraar niet alle mogelijke informatie heeft. Hij kan

bijvoorbeeld bij een persoon alleen zijn inkomen schatten door naar de woonwijk te kijken. Doordat een persoon zelf natuurlijk wel alle nodige informatie met betrekking tot zijn gezondheid heeft, is er meer informatie aanwezig bij een consument dan bij de verzekeraar. Deze informatieasymmetrie kan adverse selectie en moral hazard tot

(4)

4

gevolg hebben. Voor deze scriptie zijn veel meer gegevens beschikbaar die de zorgverzekeraar niet tot zijn beschikking heeft, waardoor er nu wel onderzocht kan worden welke factoren van belang zijn bij het nemen van een verzekering. Het grootste probleem blijft echter gezondheid; deze variabele is bijvoorbeeld niet in een schaal van 1 tot 100 te krijgen, bovendien schat iedereen zijn gezondheid op zijn eigen manier in, en juist deze subjectieve gezondheid is van belang bij het wel of niet nemen van een verzekering.

In het verleden zijn er al verschillende modellen gebruikt hiervoor, voor deze scriptie zal een onderzoeksmethode als uitgangspunt worden genomen die de uitgaven van groepen personen probeert te verklaren met verschillende

verzekeringskeuzes (wel of niet verzekerd, verplicht of vrijwillig verzekerd, etc.) met verschillende demografische, socio-economische, en gezondheidsafhankelijke factoren, en vervolgens hierop toetsen uit te voeren, om vervolgens te proberen adverse selectie en moral hazard uit elkaar te beschouwen.

Deze scriptie richt zich op de vraag hoe en in hoeverre adverse selectie en moral hazard geïdentificeerd kunnen worden op de ziektekostenverzekeringsmarkt in Amerikain 2000, 2004 en 2008, en hoe deze twee te onderscheiden zijn. Eerst wordt in hoofdstuk 2 besproken wat de problemen zijn bij het onderscheiden van adverse selectie en moral hazard, namelijk dat het er in regressieresultaten uitziet als hetzelfde verschijnsel. Daarna wordt in hoofdstuk 3 uitgelegd hoe het onderzoek uitgevoerd wordt. Hiervoor worden personen onderverdeeld in vier groepen: de publiek verzekerden, de via het werk verzekerden, de privaat verzekerden, en de niet verzekerden. Na een correctie op de selectiviteit die aanwezig is bij de via het werk verzekerden, privaat verzekerden en onverzekerden, worden er regressies

uitgevoerd voor de verschillende groepen. Als er adverse selectie aanwezig is, is dat te zien aan een verschil in de resultaten van de regressie. Vervolgens wordt in hoofdstuk 4 besproken welke gegevens worden gebruikt. Daarna worden de

resultaten van onderzoek weergegeven in hoofdstuk 5, waarna een analyse daarvan volgt in hoofdstuk 6, daarbij wordt gebruik gemaakt van een

Blinder-Oaxaca-decompositie, waarbij adverse selectie in beginsel kan worden gemeten door het verschil in waarde van de variabelen en moral hazard door het verschil van de

coëfficiënten. Hierbij moet worden opgemerkt dat dit enkel goed mogelijk is indien het model correct gespecificeerd is, in het bijzonder is het lastig om de variabele

(5)

5

van de regressies, waaruit geconcludeerd kan worden of er inderdaad adverse selectie te vinden is op de verzekeringsmarkt, en daarna kan er ook een conclusie worden getrokken over moral hazard.

2 Theoretisch kader

In dit hoofdstuk wordt besproken welke onderzoeken er al zijn gedaan naar adverse selectie en moral hazard, en welke problemen bij het onderscheiden van die twee komen kijken. Inzicht hebben in asymmetrisch informatie en kennis hierover nuttig is voor een goede werking van de verzekeringsmarkt, dat wil zeggen, er kunnen

maatregelen getroffen worden zodat niet alleen zieke personen verzekeringen

nemen, en verzekerden niet onnodig gebruik maken van zorgvoorzieningen. Daarom is er al veel onderzoek gedaan naar asymmetrische informatie op

verzekeringsmarkten, maar niet met eenduidige resultaten. Wat betreft de aanwezigheid van asymmetrische informatie zijn bijvoorbeeld de volgende

onderzoeken gedaan: Phelps (1976) onderzoekt of ziekte te voorspellen is aan de hand van verzekeringskeuze, maar hij vind geen asymmetrische informatie. Wolfe en Goddeeris (1991) vinden daarentegen wel adverse selectie in een bepaalde

ziekteverzekeringsmarkt, de grootte is echter verwaarloosbaar. Cameron, Trivedi, Milne en Piggott (1988) hebben adverse selectie in een Australische

zorgverzekeringsmarkt gevonden, terwijl Dowd, Feldman, Cassou en Finch (1991) met dezelfde onderzoeksmethode geen bewijs voor adverse selectie in Minnesota vonden. Hoewel deze onderzoeken gaan over verschillende landen en deelstaten, geeft dit wel weer dat er verschillende conclusies mogelijk zijn.

Bij onder andere de hiervoor genoemde artikelen zijn verschillende modellen gebruikt om asymmetrische informatie te meten, maar het blijkt vooral erg moeilijk om adverse selectie en moral hazard te onderscheiden (Cohen & Siegelman, 2010, p.71). Bij het proces om adverse selectie en moral hazard te scheiden zijn er

verschillende zaken waar rekening mee gehouden moet worden. Ten eerste is het van belang om te weten of een verzekering verplicht is of vrijwillig. In de Verenigde Staten zijn er wat betreft zorgverzekeringen verschillende mogelijkheden: (a) men is verplicht door de overheid verzekerd, bijvoorbeeld via regelingen voor de ouderen (genaamd Medicare), of voor de allerarmsten (genaamd Medicaid) om alsnog sociale zekerheid te hebben, (b) men is automatisch via de werkgever verzekerd, (c) men kan zelf een private verzekering afsluiten, of (d) men is niet verzekerd (Centers for

(6)

6

Medicare & Medicaid Services, 2016). Van het verwachte verschil in adverse selectie tussen deze groepen kan men gebruikmaken in het onderzoek naar asymmetrische informatie. Bij de via het werk verzekerde personen zou er milde adverse selectie kunnen zijn, aangezien personen ook juist een baan kunnen kiezen die een

verzekering aanbiedt. Bij de groepen mensen die vrijwillig verzekerd of niet verzekerd zijn, is het aannemelijk dat er adverse selectie aanwezig is. Dit komt doordat mensen hun eigen gezondheid het beste kennen en dus ook de beste afweging kunnen maken tussen wel of niet verzekeren, wat adverse selectie is (Shen, 2013). Moral hazard zal bij alle groepen verzekerden aanwezig zijn, en dus niet bij de

onverzekerden, aangezien dit zich enkel kan voordoen als hogere uitgaven doordat men verzekerd is.

Daarnaast is het van belang rekening te houden met het probleem dat bij het onderzoek dat verzekeringskeuze een endogene variabele kan zijn, omdat mensen die meer zorg nodig hebben misschien een hogere vraag naar verzekeringen hebben (Shen, 2013). De reden dat dit probleem zich voordoet in dit geval is omdat de

variabele gezondheid niet op een exacte manier beschreven kan worden om

gemeten te worden. Er is dan sprake van selectiviteit, want personen kiezen meestal zelf de verzekering die ze willen. Dit kan bijvoorbeeld doordat een persoon met een ziekte ervoor kiest om zich te verzekeren en vaker naar de dokter gaat. Indien dit het geval is, dan verstoort dit het onderzoek naar asymmetrische informatie omdat er dan correlaties tussen variabelen kunnen zijn die ook iets anders dan asymmetrische informatie kunnen betekenen. Deze selectiviteit komt in twee vormen voor: (i) ten eerste wordt door een persoon gekozen om zich wel of niet te verzekeren, (ii) en ten tweede wordt door dezelfde persoon gekozen om al dan niet kosten te maken door van zorgvoorzieningen gebruik te maken.

De endogeniteit kan worden verholpen door het gebruik van instrumentele variabelen, zoals ook door Vera-Hernandez wordt gedaan (1999). Vera-Hernandez (1999, p.579) beschrijft wat het effect is van dubbel verzekerd zijn: zowel door een verplichte als door een private verzekering. Uit dat onderzoek blijkt dat er een verband bestaat tussen de dekking van de verzekering en het gebruik van

zorgvoorzieningen, wat zou kunnen duiden op moral hazard. Indien er sprake is van bovenstaande selectiviteit zal dit probleem zich manifesteren door incorrecte

schattingsresultaten bij een regressie. Dit probleem zou opgelost kunnen worden door gebruik te maken van een correctie door middel van het tweestapsmodel van

(7)

7

Heckman (Shen, 2013, p.142). Hoe deze correctie in dit geval in zijn werk gaat, en voor welke van bovenstaande twee vormen van selectiviteit wordt gecorrigeerd, wordt in hoofdstuk 3 uitgewerkt.

Ten slotte is de grootste moeilijkheid om, indien gevonden is dat er

asymmetrische informatie voorkomt, een werkende manier te vinden om adverse selectie en moral hazard te onderscheiden. Dit komt doordat beiden als het ware in dezelfde richting werken, en zich met hetzelfde gevolg manifesteren; beiden zorgen immers voor een verandering in gedrag met betrekking tot de verzekering aangezien personen betere informatie hebben over hun gezondheid dan de verzekeraar,

waardoor een verzekering voor de verzekeraar meer kost dan als er geen asymmetrische informatie zou zijn.

Een methode om asymmetrische informatie te detecteren wordt gebruikt door bijvoorbeeld Chiappori en Salanie (2000) en Cardon en Hendel (2001), zij berekenen of de inkomenselasticiteit hoog is en kunnen aan de hand daarvan bepalen of er moral hazard is. Volgens de theorie over adverse selectie zouden indien personen nog extra informatie hebben over bijvoorbeeld hun kans om ziek te worden of een aanrijding te veroorzaken, een andere keuze maken voor een verzekering dan te voorspellen met de waarneembare factoren. Het kan dan zijn dat zij een verzekering nemen met een hogere dekkingsgraad. Echter, uit het onderzoek van zowel

Chiappori en Salanie (2000) als dat van Cardon en Hendel (2001) blijkt dat de keuze volledig te verklaren is met de door de verzekeraar waarneembare factoren, en er dus geen adverse selectie te vinden is. Over moral hazard wordt geen conclusie getrokken, dit kan ermee te maken hebben dat het onderscheid tussen adverse selectie en moral hazard moeilijk te meten is.

Volgens Abbring et al. (2003, p.513) kan moral hazard aangetoond worden via een omgekeerde redenering. Indien er sprake is van moral hazard gaan mensen zich roekelozer of ongezonder gedragen als ze verzekerd zijn. Echter, ook in dit geval zou zich een correlatie moeten voordoen tussen het hebben van een betere verzekering en duurdere claims; hetzelfde als bij adverse selectie. Op deze manier toetsen is handig om aan te tonen dat er asymmetrische informatie aanwezig is, maar niet om adverse selectie en moral hazard te onderscheiden. Dat komt, zo leggen Abbring et al. (2003, p.513) uit, doordat de correlatie niets zegt over de richting van de

causaliteit. Daarnaast, stellen zij, komt er met cross-sectiegegevens het probleem kijken dat ook informatie over het verzekeringscontract uit het vorige jaar van belang

(8)

8

is. De drie zaken waar rekening mee gehouden moet worden bij het onderzoek naar asymmetrische informatie op de verzekeringsmarkt zijn dus dat er verplicht en vrijwillig verzekerden zijn, het bestaan van selectiviteit, en de moeilijkheid van het onderscheid maken van adverse selectie en moral hazard. Het model dat voor deze scriptie wordt gebruikt wordt om de uitgaven van personen uit verschillende groepen te verklaren, wordt in het volgende hoofdstuk besproken.

3 Onderzoeksopzet

In dit hoofdstuk wordt uiteengezet welk model er in deze scriptie wordt gebruikt, welke regressies daarmee worden gedaan, en hoe adverse selectie en moral hazard aan de hand daarvan worden gemeten . Er wordt in principe gewerkt met de

vergelijking

𝑦𝑖 = 𝑋𝑖𝛽 + 𝜀𝑖 met 𝜀𝑖~𝐼𝐼𝐷, 𝐸[𝜀𝑖|𝑋𝑖] = 0 (1)

waarbij 𝑋_𝑖 een vector is met gekozen verklarende variabelen die worden besproken in hoofdstuk 4, en 𝑦_𝑖 de ziektekosten die gemaakt worden. Er wordt van

homoscedasticiteit uitgegaan, dus dat alle storingstermen 𝜀𝑖 van een bepaalde groep dezelfde variantie hebben. De gegevens worden in de vier groepen opgedeeld zoals besproken in hoofdstuk 2, dat zijn: (a) de publiek verzekerden, (b) de via het werk verzekerden, (c) de privaat verzekerden, en (d) de onverzekerden. Bij sommige groepen moet een correctie op selectiviteit worden toegepast, daarover straks meer.

Er kan sprake zijn van selectiviteit bij groep (a), de privaat verzekerden, doordat die mensen zelf de keuze hebben om zich te verzekeren,omdat er

endogeniteit kan bestaan bij de keuze van het nemen van een verzekering. Immers, de persoon die de keuze maakt om wel of niet een verzekering te nemen heeft zelf de beste informatie over zijn leefstijl, gezondheid en financiën, waardoor het zou kunnen dat de keuze om te verzekeren is gecorreleerd met de gezondheid van een persoon, maar dat de uitgaven aan zorgvoorzieningen ook weer worden verklaard door gezondheid (Vera-Hernandez, 1999). Hierom is het noodzakelijk in het onderzoek van deze scriptie een correctie op de gegevens uit te voeren. Meestal wordt voor een correctie op selectiviteit het model van Heckman gebruikt, maar in de huidige analyse moet een algemener model gebruikt worden. Hiertoe wordt een model gebruikt die gebaseerd is model van Roy.

Het Heckmantweestapsmodel is door Heckman (1979) voorgesteld om een selectievertekening te corrigeren, en later door hemzelf en verschillende andere

(9)

9

auteurs uitgewerkt. Het model is te gebruiken voor het maken van een correctie indien er een vertekening is in de data door het gebruiken van een afhankelijke variabele met selectiviteit. Onder andere Heij, De Boer, Franses, Kloek en Van Dijk (2004) en Allegre, Mateo en Pou (2013) leggen uit hoe het tweestapsmodel van Heckman gebruikt kan worden. Als gegevens gecensureerd zijn, houdt dat in dat een variabele niet een waarde boven of onder een bepaalde grens kan hebben. Indien een respondent die wel heeft, wordt aan die waarneming de grenswaarde gegeven. Dit kan worden weergegeven met het volgende model. Beschouw een model met de volgende twee vergelijkingen:

𝑦_𝑖 = 𝑋_𝑖′_{𝛽 + 𝜎𝜀}

𝑖 (2) 𝑤_𝑖∗ _{= 𝑍}

𝑖′𝛾 + 𝜂𝑖 (3)

waarbij het volgende binaire antwoordmodel wordt gebruikt: 𝑤𝑖 = {1 als 𝑤𝑖

∗ _{> 0} 0 als 𝑤_𝑖∗ _{≤ 0} (4)

Waarbij 𝑦𝑖 alleen wordt waargenomen als 𝑤𝑖 = 1. Hierbij is 𝑋𝑖 een vector met exogene variabelen, zoals besproken wordt in hoofdstuk 4. De storingstermen 𝜀_𝑖 en 𝜂_𝑖 hebben een bivariate normale verdeling:

(𝜀𝑖 𝜂_𝑖) ~𝑁 (( 0 0) , ( 1 𝜌 𝜌 1))

Hierin wordt gebruikt dat 𝜌 de correlatie is tussen 𝜀𝑖 en 𝜂𝑖, en 𝜎 de standaardafwijking van 𝜀_𝑖. De matrix 𝑍_𝑖 bestaat uit variabelen die een binaire keuze kunnen verklaren, zie ook hiervoor hoofdstuk 4. 𝑦_𝑖 staat voor de gemaakte ziektekosten en 𝑤_𝑖 is dus een indicator of er gebruik is gemaakt van zorgvoorzieningen. Als eerste stap moet 𝛾 worden geschat door middel van een ML-schatting in het probitmodel 𝑃[ 𝑤𝑖 = 1 ] = Φ(𝑍_𝑖’ 𝛾), vervolgens kan de correctieterm 𝜆_𝑖, de inverse Millsratio, worden

uitgerekend met:

𝐸[ 𝜀𝑖 | 𝑤𝑖 = 1 ] = 𝜆𝑖 =

𝜙(𝑍_𝑖’ 𝛾̂) Φ(𝑍𝑖’ 𝛾̂) (5)

Schat als tweede stap 𝛽, 𝜎 en 𝜌 vervolgens met OLS in het model 𝑦̃𝑖 = 𝑋𝑖’ 𝛽 + 𝜎𝜌 𝜆̂𝑖 + 𝜔𝑖 , waarbij 𝐸[𝜔𝑖|𝑤𝑖 = 1] = 0 (6)

Deze stappen worden het tweestapsmodel van Heckman genoemd (Heij et al., 2004, pp.500-504).

Voor deze scriptie wordt niet het model van Heckman gebruikt, waar uitgaven alleen waargenomen als 𝑤_𝑖 = 1. In plaats daarvan wordt het model van Roy

(10)

10

gebruikt, waar de uitgaven aan zorgkosten altijd waargenomen worden. In het model van Roy kunnen echter twee mogelijkheden met elkaar vergeleken worden, waarvan afhankelijk van bepaalde omstandigheden er een van de twee wordt waargenomen. Het Roy-model werkt op de volgende manier (Deb, Munkin, & Trivedi, 2006): stel dat een persoon de keuze heeft tussen twee mogelijke uitgaven

𝑦_1,𝑖 = 𝑋_𝑖𝛽₁+ 𝜀_1,𝑖 en 𝑦_2,𝑖 = 𝑋_𝑖𝛽₂+ 𝜀_2,𝑖 (7). Daarnaast wordt gedefinieerd

𝑤_𝑖∗ _{= 𝑍} 𝑖𝛾 + 𝜂𝑖 (8) Met 𝑤𝑖 = {1 als 𝑤𝑖 ∗ _{> 0} 0 als 𝑤_𝑖∗ ≤ 0 (9)

Keuze nummer 1 wordt alleen waargenomen als er wel van de zorgvoorzieningen gebruik wordt gemaakt, dus uitgaven groter dan nul zijn en dus 𝑤𝑖 = 1. Keuze nummer 2 wordt alleen waargenomen als er geen gebruik van wordt gemaakt, dus uitgaven nul zijn en 𝑤_𝑖 = 0. De storingstermen zijn verdeeld volgens een multivariate normale verdeling (Vijverberg, 1993, p.73):

( 𝜂_𝑖 𝜀_1,𝑖 𝜀_2,𝑖) ~𝑁 ( (00 0 ) , ( 1 𝜎1𝜌1𝜂 𝜎2𝜌2𝜂 𝜎1𝜌1𝜂 𝜎12 𝜎1𝜎2𝜌12 𝜎2𝜌2𝜂 𝜎1𝜎2𝜌12 𝜎22 ) )

Het belangrijkste verschil van dit model met het Heckmanmodel is dat nu twee alternatieven waargenomen kunnen worden in de eerste stap, bepaald door

bijvoorbeeld wel of niet geld uitgeven aan zorg. In het Heckmanmodel wordt 𝑦𝑖 in het geval dat 𝑤𝑖 = 0 niet waargenomen, en in het model van Roy wordt een andere vergelijking gebruikt. Hierna worden de volgende vergelijkingen gebruikt (Vijverberg, 1993, pp.75-76): 𝑦̃_1,𝑖 = 𝑋_𝑖’ 𝛽₁ + 𝜎₁𝜌_1𝜂 𝜙(𝑍𝑖′𝛾̂) Φ(𝑍_𝑖′_𝛾̂)+ 𝜔1,𝑖 𝑦̃_2,𝑖 = 𝑋_𝑖’ 𝛽₂ − 𝜎₂𝜌_2𝜂 𝜙(𝑍𝑖′𝛾̂) 1−Φ(𝑍_𝑖′𝛾̂)+ 𝜔2,𝑖 (10)

met 𝜎_𝑘 de standaardafwijking van 𝜀_𝑘,𝑖 in het geval van normaliteit van de storingstermen, en 𝜌_𝑘 de correlatie is tussen 𝜀_𝑘,𝑖 en 𝜂_𝑘,𝑖.

Ondanks de verschillen blijft de vergelijking van het Heckmanmodel te gebruiken om het model van Roy te schatten, aangezien met de methode van Heckman er één 𝛽_𝑘 per keer uitgerekend wordt, dus eigenlijk 𝛽₁ voor het model van Roy. De gebruikte vergelijking luidt dan

(11)

11

𝑦̃1,𝑖 = 𝑋𝑖’ 𝛽1 + 𝜎1𝜌1𝜂 𝜆̂𝑖 + 𝜔1,𝑖 (*)

met 𝜆𝑖 zo gedefinieerd als in (5), en wordt gebruikt om vier verschillende regressies te doen, waarbij 𝛽₁ wordt geschat wanneer de uitgaven groter dan nul zijn en daarbij wordt 𝛽₂ geschat voor de als de uitgaven nul zijn. Door de Heckmanmethode te gebruiken wordt er dan alleen 𝛽1 uitgerekend. Voor de vier groepen die eerder in dit hoofdstuk besproken zijn worden de volgende vier verschillende regressies gedaan: (a) Een regressie voor de mensen die verplicht een publieke verzekering hebben. Hier kan geen adverse selectie zijn, want de personen hebben er niet zelf voor gekozen. Er kan hier uiteraard wel moral hazard aanwezig zijn. Hier wordt geen correctie op selectiviteit uitgevoerd, dus 𝜌 = 0 in (*), en standaard alleen de

waarnemingen gebruikt waarvoor geld dat de uitgaven aan zorg groter dan nul zijn. Voor deze groep wordt 𝛽_𝑎 geschat.

(b) Een regressie voor de mensen die via hun werk verzekerd zijn, het is niet zeker of hier adverse selectie aanwezig is, maar waarschijnlijk is er matig tot veel adverse selectie aanwezig. Want hoewel deze verzekering verplicht is bij een specifieke baan, zouden mensen misschien juist die baan kiezen omdat er een verzekering bijzit. Om die reden wordt zowel met als zonder de Heckmancorrectie geschat, en getoetst wat tot betere resultaten lijdt. Indien het Roymodel gebruikt zou worden zou hier 𝛽_𝑏 worden geschat als de uitgaven groter dan nul zijn.

(c) Een regressie met Heckmancorrectie voor de mensen die vrijwillig privaat verzekerd zijn. Het is te verwachten dat hier veel adverse selectie is, aangezien de personen er zelf voor kiezen om te verzekeren en niet gedwongen worden. Met een Roymodel zou hier 𝛽_𝑐 geschat worden als de uitgaven aan zorg groter dan nul zijn. (d) Tot slot kan er ook nog een regressie gedaan worden voor de groep met niet verzekerden, hier kan immers net zo goed adverse selectie aanwezig zijn, aangezien er voor veel mensen zelf gekozen wordt om geen verzekering te nemen, bijvoorbeeld als ze weten dat ze toch geen gebruik zullen maken van zorgvoorzieningen. Het grote verschil met de groep privaat verzekerden is natuurlijk dat hier geen moral hazard aanwezig kan zijn, aangezien de persoon geen reden heeft om onnodig gebruik te maken van zorgvoorzieningen. Het kan echter ook zijn dat de persoon geen geld heeft voor een verzekering (en ook niet in aanmerking komt voor Medicare), en daarom afziet van het nemen van een verzekering. In het geval

(12)

12

Voor deze scriptie wordt er vanuit gegaan dat deze groepen samenvallen. Bij het Roymodel zou hier 𝛽_𝑑 worden geschat, indien de uitgaven aan zorg groter dan nul zijn.

Zoals gezegd is het technisch gezien eenvoudiger om via het Heckmanmodel alleen 𝛽₁ uit te rekenen, en op die manier worden daarmee 𝛽_𝑎, 𝛽_𝑏, 𝛽_𝑐 en 𝛽_𝑑 één voor één geschat. Hiermee kan enkel voor de selectiviteit van groep (ii) uit hoofdstuk 2, de selectiviteit van het wel of niet uitgaven aan zorg maken, worden gecorrigeerd. Een correctie voor groep (i), de keuze om wel of niet te verzekeren, wordt

achterwege gelaten, omdat van dit verschil gebruik wordt gemaakt in het vergelijken van de groepen en het maken van een tweede correctie erg ingewikkeld is.

Als de coëfficiënten uitgerekend zijn worden groep (a) en (c) vergeleken en indien er verschillen tussen de uitkomsten zitten kan er geconcludeerd worden dat er adverse selectie is. Daarna worden de twee varianten van regressie (b) vergeleken met (a) waaruit kan worden opgemaakt of er inderdaad matige adverse selectie aanwezig is. Tot slot kunnen ook nog voor het onderzoek naar moral hazard de groepen (c) en (d) met elkaar vergeleken worden, er zou immers alleen moral hazard aanwezig moeten zijn in (d) en geen adverse selectie, terwijl in (c) dit allebei

aanwezig kan zijn. Voor een betere kwantitatieve analyse wordt een Blinder-Oaxaca-decompositie gebruikt. Hoe dit werkt wordt uitgelegd in hoofdstuk 6. Om goede resultaten te krijgen is het van belang dat het model goed gespecificeerd is. Indien dit niet het geval is, kan het lijken alsof de zorguitgaven niet verklaard kunnen worden met de te meten variabelen en de personen zelf betere informatie hebben over hun gezondheid. Het kan echter ook zijn dat model beter gespecificeerd had kunnen worden met andere meetbare variabelen. Het volgende hoofdstuk gaat in op de keuze van de variabelen.

4 Gegevens en keuze van variabelen

In dit hoofdstuk wordt uiteengezet waar de gegevens vandaan komen die worden gebruikt en welke variabelen voor dit model gebruikt kunnen worden. Voor deze scriptie worden de gegevens van de Medical Expenditure Panel Survey (MEPS) gebruikt. Dit is een jaarlijkse enquête die gehouden wordt onder Amerikaanse families, individuen, dokters en werkgevers, waarbij informatie over allerlei gezondheid gerelateerde onderwerpen worden verzameld, zoals uitgaven aan verzekeringen, frequentie van naar de dokter gaan, hoe het wordt betaald, maar ook

(13)

13

wat voor soort verzekering het is en hoe duur. Elk jaar worden andere mensen gevraagd waardoor de personen niet in de tijd te volgen zijn. Het onderzoek wordt sinds 1996 ieder jaar uitgevoerd, waardoor het gaat om herhaalde

cross-sectiegegevens. In deze scriptie worden gegevens uit de jaren 2000, 2004 en 2008 onderzocht. Die keuze is zo gemaakt omdat er dan een spreiding is over de tijd en kan worden vastgesteld of er verschillen zijn in resultaten, waarna eventueel naar een verklaring kan worden gezocht.

Voor dit onderzoek is de keuze van de variabelen grotendeels

overeenkomend met die van Shen (2013, p.147). Volgens Shen is in de Verenigde Staten het hebben van een verzekering en een baan aan elkaar gerelateerd, aangezien er een prikkel kan zijn om juist een baan te kiezen die een verzekering aanbied. Daarnaast worden alleen de personen tussen 18 en 65 gebruikt, niet jonger omdat veel jongeren nog niet werken of bij hun ouders ingeschreven staan, en niet ouder omdat de meesten dan met pensioen zijn. Er wordt, in tegenstelling tot het onderzoek van Shen, niet op de mensen met overgewicht gefocust. Deze factor wordt niet meegenomen in het onderzoek omdat wordt verwacht dat dit al wordt verklaard door andere variabelen. De endogene variabelen die met het onderzoek verklaard moeten worden zijn de uitgaven aan de zorg en het al dan niet gebruik van zorg. De verklarende variabelen die gebruikt worden voor zijn onderzoek zijn door Shen onderverdeeld in drie groepen: demografische gegevens, socio-economische status, en aan gezondheid gerelateerde kenmerken.

Voor de vector met exogene variabelen 𝑋_𝑖 wordt als demografische variabelen hier gebruikt: leeftijd (AGE&X, met ‘&’ voor het jaartal), leeftijd kwadraat (AGE&X^2), geslacht (dummy voor vrouw zijn gemaakt uit SEX), ras/etniciteit (dummy voor blank of niet-blank gemaakt uit RACEX), huwelijksstatus (dummy voor getrouwd of niet uit MARRY&X) en gezinsgrootte gebruikt. Als socio-economische variabelen worden hier jaren opleiding (EDUCYR/EDUCYEAR) , en netto-inkomen (TTLP&X) gebruikt. In navolging van Shen (2013) worden als variabelen om de gezondheid van een persoon uit te drukken het aantal aandoeningen, aanwezigheid van een geestelijke stoornis (dummy voor wel of niet hebben van een slechte geestelijke gezondheid, categorie 5 uit MNHLTH31), en het zijn van een roker (dummy van ADSMOK42) gebruikt. Daarnaast is ook een dummy voor de subjectieve gezondheid toegevoegd, voor als de persoon inschat dat zijn gezondheid uitstekend, erg goed of goed is (1, 2, of 3 uit RTHLTH31). Voor de variabele die het aantal aandoeningen telt worden de

(14)

14

volgende stoornissen en aandoeningen meegeteld: keelpijn (CHBRON31), astma (ASTHDX), artritis (ARTHDX), emfyseem (EMPHDX), diabetes (DIABDX),

hartaandoeningen (CHDDX, ANGIDX, MIDX en OHRTDX), hoge bloeddruk (HIBPDX), gewrichtspijn (JTPAIN31), en beroertes (STRKDX). Deze variabele is toegevoegd omdat het zou kunnen zijn dat het van belang is voor een persoon om pas bij een hoger aantal aandoeningen een verzekering af te sluiten. De variabele leeftijd in het kwadraat is toegevoegd zodat het effect van leeftijd met de tijd kan afnemen of verzwaren. Als afhankelijke variabele 𝑦_𝑖 is de logaritme van de totale uitgaven aan zorgvoorzieningen gebruikt (TOTEXP&).

Voor de selectievergelijking, vergelijking 3, wordt als afhankelijke variabele, 𝑤_𝑖, een aangemaakte variabele gebruikt die weergeeft of er wel of niet gebruik wordt gemaakt van zorgvoorzieningen. Dit kan ook worden gezien als variabele die

aangeeft wanneer de uitgaven groter zijn dan 0. Als verklarende variabelen in de matrix 𝑍𝑖 worden dezelfde variabelen gebruikt als in 𝑋𝑖, en daarnaast worden ook nog drie dummy’s toegevoegd die de regio in de VS aangeven (noordoost, midden-west, of zuid; respectievelijk categorie 1, 2 en 3 in REGION31) waar de persoon woont. De vierde regio west is de referentiegroep dus wordt niet als dummy gebruikt bij de schattingen.Ook wordt voor beroepsgroep een dummy gebruikt om de

witteboordenberoepen (professional, management, zakelijk, of financieel) te

representeren (categorie 9 en 8 bij INDCAT31). Deze variabele is toegevoegd omdat baankeuze zou kunnen afhangen van het meekomen van een verzekering bij de baan, en bepaalde beroepsgroepen vaker verzekeringen aanbieden. Tot slot is ook een dummy toegevoegd die aangeeft of iemand zijn gordel altijd of meestal draagt, wat aan zou kunnen geven dat iemand voorzichtig met zichzelf is (1 en 2 in

SEATBE53).

Het aantal gebruikte waarnemingen is voor ieder jaar in tabel 1 samengevat. De reden dat het aantal waarnemen van deze groepen niet optellen tot het totaal is dat er ook personen zijn die niet in de specifieke groepen in te delen zijn, of niet alle informatie volledig hebben opgegeven. In tabel 1 zijn de gemiddelden van de

gebruikte variabelen voor de hierboven genoemde groepen weergeven, indien de variabele een dummy is, wordt er dus het gedeelte weergegeven waarbij de beschrijving van de variabele het geval is. Er is ook een kolom voor alle gegevens samen toegevoegd.

(15)

15

a(publiek) b(werk) c(privaat) d(niet) geheel

2000 1243 (8,6%) 8875 (61,7%) 375 (2,6%) 2717 (18,9%) 14379 Variabele Gemiddelde Uitgaven 4172,9770 2100,9340 1782,7280 722,6301 1963,4770 Leeftijd 40,0644 41,5810 44,9412 36,6268 40,0244 Leeftijd^2 1811,5560 1870,9320 2187,0810 1495,5330 1760,0710 #aandoeningen 1,1802 0,6784 0,6078 0,5050 0,6744

Slechte geest. gezdh. 0,0531 0,0030 0,0112 0,0092 0,0089

Vrouw 0,6573 0,5245 0,5518 0,4814 0,5274 Blank 0,0129 0,0070 0,0028 0,0133 0,0088 Inkomen 8942,9310 34311,5500 31481,2100 15068,8200 27345,1300 Roker 0,3194 0,1876 0,1653 0,2613 0,2127 Jaren opleiding 10,4240 13,3575 13,5854 10,9135 12,5822 Getrouwd 0,3548 0,6907 0,6611 0,4649 0,6005 Gezinsgrootte 3,4143 3,0987 2,7787 3,5510 3,2089 Subjectieve gezndh. 0,6187 0,9198 0,8824 0,8219 0,8615 Noordoost 0,1979 0,1682 0,1289 0,0997 0,1522 Midwest 0,1706 0,2410 0,2381 0,1170 0,2032 Zuid 0,3121 0,3695 0,3697 0,4398 0,3754 Witteboordberoep 0,0692 0,2975 0,2297 0,1012 0,2268 Gordeldrager 0,7635 0,8692 0,8403 0,7943 0,8416 2004 2709 (13,8%) 10348 (52,8%) 448 (2,4%) 4456 (22,7%) 19592 Variabele Gemiddelde Uitgaven 4764,1700 3290,7000 3138,8700 779,4123 2831,4240 Leeftijd 39,7014 42,0926 43,6094 36,5965 39,9858 Leeftijd^2 1763,5970 1920,2100 2086,2390 1489,8380 1762,3970 #aandoeningen 1,4803 0,9198 0,9442 0,5848 0,9091

Vrouw 0,6770 0,5280 0,5246 0,4693 0,5350 Blank 0,6770 0,8005 0,8393 0,7895 0,7780 Inkomen 9182,8100 37914,5400 33904,0200 14623,0000 27319,7800 Roker 0,2920 0,1690 0,1161 0,2392 0,2039 Jaren opleiding 10,6390 13,3882 13,6205 10,8894 12,3992 Getrouwd 0,3463 0,6794 0,5848 0,4533 0,5637 Gezinsgrootte 3,3555 3,0962 2,7545 3,5741 3,2362 Subjectieve gezndh. 0,3053 0,6462 0,6607 0,4794 0,8289 Noordoost 0,1960 0,1714 0,1071 0,0750 0,1459 Midwest 0,1477 0,2279 0,2344 0,1254 0,1888 Zuid 0,3319 0,3737 0,3371 0,4749 0,3920 Witteboordberoep 0,0377 0,1336 0,1228 0,0734 0,1027 Gordeldrager 0,8479 0,9101 0,9085 0,8660 0,8902 2008 ₂₅₈₇ (13,5%) 9971 (52,0%) 303 (1,6%) 4524 (23,6%) 19185 Variabele Gemiddelde Uitgaven 5661,4740 3527,4620 2528,5060 963,6116 3124,2900 Leeftijd 38,9807 42,7354 42,9970 37,4123 40,4185

(16)

16

Leeftijd^2 1722,8250 1981,6300 2020,0820 1557,1010 1805,3450

#aandoeningen 1,6993 1,0690 0,9394 0,7683 1,0661

Vrouw 0,6765 0,5244 0,5182 0,4746 0,5326 Blank 0,6096 0,7180 0,8091 0,7456 0,7113 Inkomen 11057,1100 41832,7700 35979,1000 17041,5400 30440,4700 Roker 0,2760 0,1534 0,1030 0,2233 0,1860 Jaren opleiding 11,2184 13,6488 13,8152 11,1594 12,6957 Getrouwd 0,3189 0,6627 0,6000 0,4425 0,5443 Gezinsgrootte 3,5006 3,0933 2,7212 3,6483 3,2818 Subjectieve gezndh. 0,6606 0,9070 0,9242 0,8046 0,8378 Noordoost 0,2315 0,1639 0,0848 0,0995 0,1515 Midwest 0,1855 0,2183 0,2333 0,1353 0,1892 Zuid 0,2988 0,3535 0,3515 0,4416 0,3683 Witteboordberoep 0,0425 0,1492 0,1727 0,0913 0,1182 Gordeldrager 0,8833 0,9354 0,9273 0,8992 0,9177

a(publiek) b(werk) c(privaat) d(niet) geheel Tabel 1: aantal waarnemingen en gemiddeldes

Wat meteen opvalt is dat er bij de niet verzekerden veruit de laagste uitgaven zijn. Ook heeft deze groep de minste aandoeningen, wat een reden zou kunnen zijn om niet te verzekeren. Toch is de subjectieve kwaliteit van de gezondheid lager dan bij andere groepen, bij de privaat verzekerden is dat het hoogst. De groep privaat verzekerden is veruit de kleinste en de groep via het werk verzekerde veruit de grootste. Wat ook opvalt is dat de privaat verzekerden een hoger inkomen hebben dan de onverzekerden, wat er toch op zou kunnen wijzen dat rijkere mensen het kunnen veroorloven om zich te verzekeren. De via het werk verzekerden hebben het hoogste inkomen, en zoals verwacht hebben sociaal verzekerden veruit het laagste inkomen.

Na dit vastgesteld te hebben, kunnen de resultaten van onderzoek worden gepresenteerd, dit wordt gedaan in het volgende hoofdstuk.

5 Onderzoeksresultaten

Nu worden eerst de regressies van groepen (a), (b), (c) en (d) uit hoofdstuk 3, jaar voor jaar besproken, en daarna worden ze vergeleken. Er word begonnen met het bespreken van het jaar 2004, waarna vergeleken wordt of er vier jaar daar voor en vier jaar daarna, in 2000 en 2008, andere resultaten uit het onderzoek komen.

(a): Allereerst de regressie voor de publiek verzekerden, dat houdt in de mensen die er niet voor gekozen hebben om zich te verzekeren. Deze personen zijn bijvoorbeeld

(17)

17

via Medicare en Medicaid verzekerd. De via het werk verzekerden vallen in deze databank onder privaat verzekerden, maar worden hier als aparte groep genomen, zie groep b. Aangezien hier waarschijnlijk geen adverse selectie voorkomt, hoeft ook geen Heckmancorrectie te worden toegepast. Er wordt gewerkt met vergelijking (1) uit hoofdstuk 3. Het aantal gebruikte waarnemingen is soms iets verminderend doordat alleen die waarnemingen worden gebruikt waarvoor geld dat de totale uitgaven groter dan nul zijn.

Log(Totale uitgaven)

2000 2004 2008

Variabele Coëff Std.err p-wrde Coëff Std.err p-wrde Coëff Std.err p-wrde Constante 5,423667 0,524167 0,0000 6,822908 0,347408 0,0000 6,791654 0,375103 0,0000

Leeftijd 0,067363 0,023961 0,0050 0,000465 0,016106 0,9770 0,000473 0,016811 0,9775

Leeftijd^2 -0,000585 0,000283 0,0386 7,83E-05 0,000194 0,6871 9,25E-05 0,000202 0,6473

# aandoeningen 0,245424 0,039412 0,0000 0,299072 0,022422 0,0000 0,255032 0,022220 0,0000 Slechte geest. gezondh. 0,438639 0,206544 0,0339 0,390215 0,136427 0,0043 0,294049 0,159252 0,0650 Vrouw 0,370268 0,106664 0,0005 0,115634 0,073199 0,1143 0,238441 0,077826 0,0022 Blank 0,434567 0,426177 0,3081 0,107426 0,070815 0,1294 0,175262 0,072144 0,0152

Inkomen 1,10E-06 4,93E-06 0,8231 -9,10E-06 3,42E-06 0,0078 -2,28E-06 2,82E-06 0,4179

Roker 0,063110 0,106164 0,5523 0,053216 0,071803 0,4587 0,068466 0,078392 0,3826

Jaren opleiding 0,002468 0,014790 0,8675 0,034706 0,010755 0,0013 0,044947 0,012820 0,0005

Getrouwd 0,009575 0,107227 0,9289 -0,060769 0,076463 0,4268 0,110296 0,080094 0,1686

Gezinsgrootte -0,082934 0,029135 0,0045 -0,066184 0,020457 0,0012 -0,144938 0,020755 0,0000

Sub. gezondheid -0,496385 0,113026 0,0000 -0,521676 0,073928 0,0000 -0,544201 0,085627 0,0000

Tabel 2: publiek verzekerden

In 2000 zijn alle variabelen behalve inkomen, roker zijn, jaren opleiding en getrouwd zijn significant. In 2004 zijn bij deze regressie de meeste variabelen niet significant. Alleen de constante, aantal aandoeningen, geestelijke gezondheid, inkomen, jaren opleiding, gezinsgrootte en subjectieve gezondheid hebben een p-waarde kleiner dan 0,05. In 2008 zijn daarnaast het hebben van een slechte geestelijke gezondheid en inkomen ook niet significant, vrouw zijn weer wel. Er zijn dus aanzienlijke

verschillen tussen jaren wat betreft significantie van variabelen. Aangezien zoveel andere variabelen niet significant zijn, moet worden nagedacht of de factoren wel in dit model horen. De reden voor het niet significant zijn kan zijn dat er model niet goed gespecificeerd is. Hoewel het niet in elk jaar significant is, lijkt leeftijd essentieel voor het model aangezien het welbekend is dat de gezondheid van mensen achteruit gaat naarmate ze ouder worden. Toch is het effect van leeftijd kwadraat overal

(18)

18

model gelaten moet worden, aangezien het een graadmeter lijkt voor hoe serieus iemand zijn eigen gezondheid neemt, al zou dit effect ook door subjectieve

gezondheid bepaald kunnen worden.

(b) De tweede groep bestaat uit degenen die via het werk verzekerd zijn. Aangezien deze personen niet zelf kunnen kiezen of ze de verzekering nemen, lijkt het

vanzelfsprekend dat er hier geen adverse selectie aanwezig is. Echter, het zou ook kunnen dat mensen juist een baan kiezen die een verzekering aanbiedt zodat ze er zelf geen hoeven te kopen. In dit onderzoek zijn voor groep (b) de gegevens van personen die via een zogenaamde groep verzekerd zijn bij elkaar genomen, dat houdt in, mensen die via het werk, via een vakbond of andere soort groep verzekerd zijn. Eerst wordt de gewone OLS-regressie gedaan met vergelijking (1) uit hoofdstuk 3, deze is weergegeven in tabel 3, en daarna met een selectiviteitscorrectie op de uitgaven, gebruik makend van vergelijking (*) uit hoofdstuk 3, deze is weergegeven in tabel 4.

2000 2004 2008

Variabele Coëff Std.err p-wrde Coëff Std.err p-wrde Coëff Std.err p-wrde Constante 6,347931 0,208925 0,0000 6,545024 0,194172 0,0000 6,085867 0,207228 0,0000 Leeftijd -0,011049 0,009534 0,2465 -0,013879 0,008667 0,1093 -0,015790 0,009136 0,0840 Leeftijd^2 0,000287 0,000112 0,0101 0,000317 0,000102 0,0018 0,000345 0,000106 0,0011 # aandoeningen 0,381518 0,017647 0,0000 0,328609 0,013042 0,0000 0,317511 0,012667 0,0000 Slechte geest. gezondh. 0,312074 0,265359 0,2396 0,654456 0,178555 0,0002 0,402533 0,215017 0,0612 Vrouw 0,498573 0,032389 0,0000 0,473221 0,029362 0,0000 0,490573 0,031029 0,0000 Blank 0,335728 0,184977 0,0696 0,226732 0,036797 0,0000 0,272774 0,034340 0,0000

Inkomen 6,26E-07 6,22E-07 0,3143 1,42E-06 4,91E-07 0,0040 8,06E-07 4,66E-07 0,0836

Roker -0,019861 0,041442 0,6318 -0,050127 0,038794 0,1963 -0,040248 0,042898 0,3482 Jaren opleiding 0,033312 0,006719 0,0000 0,035495 0,005922 0,0000 0,057599 0,006417 0,0000 Getrouwd 0,213325 0,039493 0,0000 0,210696 0,035863 0,0000 0,177304 0,037389 0,0000 Gezinsgrootte -0,065495 0,012697 0,0000 -0,075511 0,011234 0,0000 -0,066523 0,011821 0,0000 Sub. gezondheid -0,770827 0,057872 0,0000 -0,749476 0,051224 0,0000 -0,552717 0,053247 0,0000 SSR: 14130,25 SSR: 16389,38 SSR: 16748,80

Tabel 3: Gewone OLS, werkverzekerden

2000 2004 2008

Variabele Coëff Std.Err p-wrde Coëff Std.Err p-wrde Coëff Std.Err p-wrde Antwoordvergelijking

(19)

19 Leeftijd 0,001615 0,010312 0,8756 0,000687 0,009337 0,9414 -0,017008 0,010517 0,1059 Leeftijd^2 0,000134 0,000122 0,2700 0,000143 0,000110 0,1944 0,000338 0,000124 0,0066 # aandoeningen 0,278322 0,034454 0,0000 0,227416 0,025688 0,0000 0,242453 0,023179 0,0000 Slechte geest. gezondh. 0,189319 0,303431 0,5327 0,592026 0,204677 0,0038 0,345048 0,249909 0,1674 Vrouw 0,371590 0,046999 0,0000 0,339747 0,040742 0,0000 0,328994 0,049669 0,0000 Blank 0,282272 0,203928 0,1663 0,170781 0,042274 0,0001 0,228146 0,041016 0,0000

Inkomen -7,40E-07 8,69E-07 0,3946 -5,40E-07 7,67E-07 0,4814 -4,00E-07 6,64E-07 0,5469

Roker 0,015516 0,048949 0,7513 -0,024337 0,046867 0,6036 -0,018994 0,049413 0,7007 Jaren opleiding 0,022896 0,007516 0,0023 0,025956 0,006501 0,0001 0,038029 0,008290 0,0000 Getrouwd 0,138390 0,048669 0,0045 0,143179 0,043723 0,0011 0,091660 0,046567 0,0491 Gezinsgrootte -0,046498 0,014359 0,0012 -0,050310 0,012865 0,0001 -0,042169 0,013962 0,0025 Sub. gezondheid -0,784666 0,058529 0,0000 -0,761374 0,052074 0,0000 -0,551304 0,053696 0,0000 Selectievergelijking Constante 0,980557 0,041182 0,0000 0,985044 0,038467 0,0000 -0,416646 0,132905 0,0017 Leeftijd -0,058710 0,002793 0,0000 -0,061857 0,002405 0,0000 -0,035489 0,006262 0,0000

Leeftijd^2 0,000700 3,34E-05 0,0000 0,000734 2,97E-05 0,0000 0,000476 7,74E-05 0,0000

# aandoeningen 0,506574 0,018475 0,0000 0,457816 0,013385 0,0000 0,400094 0,013094 0,0000 Slechte geest. gezondheid 0,665359 0,145861 0,0000 0,253826 0,089882 0,0048 0,396718 0,137736 0,0040 Vrouw 0,388518 0,020137 0,0000 0,411138 0,017047 0,0000 0,578752 0,022819 0,0000 Blank 0,156514 0,097869 0,1098 0,127894 0,019597 0,0000 0,137030 0,024610 0,0000

Inkomen 5,18E-06 5,79E-07 0,0000 6,71E-06 4,73E-07 0,0000 5,32E-06 4,62E-07 0,0000

Roker -0,132844 0,029544 0,0000 -0,110326 0,026358 0,0000 -0,081584 0,029040 0,0050 Jaren opleiding 0,021568 0,002884 0,0000 0,020177 0,002369 0,0000 0,061284 0,003971 0,0000 Getrouwd 0,256883 0,025897 0,0000 0,203252 0,022306 0,0000 0,285310 0,025421 0,0000 Gezinsgrootte -0,056311 0,006079 0,0000 -0,059217 0,004999 0,0000 -0,067036 0,006763 0,0000 Noordoost 0,329040 0,032251 0,0000 0,434424 0,028561 0,0000 0,235987 0,035740 0,0000 Midden-west 0,357181 0,029571 0,0000 0,347926 0,026032 0,0000 0,315708 0,034031 0,0000 Zuid 0,088188 0,023558 0,0002 0,116995 0,020075 0,0000 0,049754 0,026857 0,0640 Witteboord 0,199479 0,033691 0,0000 0,104605 0,037725 0,0056 0,047805 0,035881 0,1828 Gordeldrager 0,022197 0,028089 0,4294 -0,088253 0,026180 0,0008 0,134326 0,038918 0,0006 SSR: 14714,93 SSR: 17382,37 SSR: 17492,06

Tabel 4: Met Heckmancorrectie, werkverzekerden

Bij de gewone OLS blijkt dat in de drie jaren de meeste variabelen significant zijn. Leeftijd en het zijn van een roker zijn niet significant in alle jaren, de p-waarde is groter dan 0,05. Er moet worden opgemerkt dat de resultaten van de regressie niet lijken op de het resultaat van (a). Hier kan een toets voor gedaan worden, hier voor 2004. De Chowtoets voor een structurele breuk met H0: 𝛽_𝑎 = 𝛽_𝑏 geeft 𝐹 =

(9005 + 2314 − 2) ∗ (22043.10 − 5498.124 − 16389.38) / (5498.124 + 16389.38) = 80.451 met 𝐹 ~ 𝐹(2,9005 + 2314 − 2) is 3,84 bij een significantieniveau van 0,95. Dus de hypothese dat de coëfficiënten van model groepen a en b hetzelfde zijn kan

(20)

20

worden verworpen. Dit betekent dat er ook statistisch gezien een verschil is tussen twee groepen.

Als we naar de regressie met de Heckmancorrectie kijken, zien we een ander beeld. Nu zijn de variabelen leeftijd, roker zijn, en inkomen in alle drie de jaren niet significant. Bij de selectievergelijking zijn er bijna geen niet-significante variabelen te zien. De geschatte coëfficiënten zijn bij de schatting die rekening houdt met

selectiviteit wel duidelijk anders, inkomen is bijvoorbeeld niet meer significant. Om te toetsen welk model beter is, kan er naar gekeken worden of de

Millsratio significant is. Met een Wald-F-toets blijkt dat in 2000 de p-waarde 0,4316 is. In 2004 0,0327 en in 2008 0,2111. Hierbij is de nulhypothese gebruikt dat de

coëfficiënt nul is. Hiermee is duidelijk geworden dat 2004 de enige is waar de

correctie significant is. Aangezien het niet aannemelijk lijkt dat het per jaar verschilt of er op selectiviteit gecorrigeerd moet worden, is er met deze drie resultaten niets te zeggen over de vraag of er een selectiviteitscorrectie moet worden gebruikt.

(c): Als derde de regressie voor de personen die privaat verzekerd zijn. Aangezien dit vrijwillig is, kan er sprake zijn van selectiviteit in de gegevens, want mensen die verwachten dat ze meer zorgkosten gaan maken zullen zich juist gaan verzekeren, in tegenstelling tot de mensen die geen zorgkosten verwachten te maken. Er wordt gebruik gemaakt van vergelijking (4) uit hoofdstuk 3, de uitkomsten zijn weergegeven in tabel 5.

2000 2004 2008

Variabele Coëff Std.Err p-wrde Coëff Std.Err p-wrde Coëff Std.Err p-wrde Antwoordvergelijking Constante 6,203707 0,994076 0,0000 5,758666 0,947842 0,0000 7,976459 1,450940 0,0000 Leeftijd -0,033391 0,048779 0,4941 0,039865 0,040946 0,3308 -0,051021 0,049846 0,3069 Leeftijd^2 0,000526 0,000559 0,3473 -0,000290 0,000474 0,5409 0,000809 0,000581 0,1647 # aandoeningen 0,408466 0,139999 0,0038 0,340719 0,104633 0,0012 0,073142 0,113724 0,5206 Slechte geest. gezondh. 0,308179 0,708283 0,6638 1,358230 0,638937 0,0341 0,902785 1,008551 0,3714 Vrouw 0,464000 0,203936 0,0235 0,345168 0,188518 0,0678 0,477949 0,260896 0,0680 Blank 0,105072 1,316870 0,9365 0,128056 0,215416 0,5525 0,494156 0,250030 0,0490

Inkomen 2,63E-06 3,04E-06 0,3875 -3,35E-06 2,69E-06 0,2130 2,73E-07 3,12E-06 0,9304

Roker -0,189332 0,210720 0,3696 -0,128253 0,241943 0,5963 0,067573 0,304782 0,8247 Jaren opleiding 0,054669 0,034173 0,1106 0,010848 0,030746 0,7244 -0,025021 0,046001 0,5869 Getrouwd 0,224177 0,219991 0,3089 0,035924 0,179957 0,8419 0,117523 0,226585 0,6044 Gezinsgrootte -0,071942 0,073727 0,3299 -0,006470 0,066669 0,9227 -0,030589 0,076907 0,6911

(21)

21 Sub. gezondheid -0,606806 0,242532 0,0128 -0,570157 0,240690 0,0183 -0,767309 0,314214 0,0152 Selectievergelijking Constante 0,980557 0,041182 0,0000 0,985044 0,038467 0,0000 -0,416646 0,132905 0,0019 Leeftijd -0,058710 0,002793 0,0000 -0,061857 0,002405 0,0000 -0,035489 0,006262 0,0000

Leeftijd^2 0,000700 3,34E-05 0,0000 0,000734 2,97E-05 0,0000 0,000476 7,74E-05 0,0000

Inkomen 5,18E-06 5,79E-07 0,0000 6,71E-06 4,73E-07 0,0000 5,32E-06 4,62E-07 0,0000

Roker -0,132844 0,029544 0,0000 -0,110326 0,026358 0,0000 -0,081584 0,029040 0,0053 Jaren opleiding 0,021568 0,002884 0,0000 0,020177 0,002369 0,0000 0,061284 0,003971 0,0000 Getrouwd 0,256883 0,025897 0,0000 0,203252 0,022306 0,0000 0,285310 0,025421 0,0000 Gezinsgrootte -0,056311 0,006079 0,0000 -0,059217 0,004999 0,0000 -0,067036 0,006763 0,0000 Noordoost 0,329040 0,032251 0,0000 0,434424 0,028561 0,0000 0,235987 0,035740 0,0000 Midden-west 0,357181 0,029571 0,0000 0,347926 0,026032 0,0000 0,315708 0,034031 0,0000 Zuid 0,088188 0,023558 0,0002 0,116995 0,020075 0,0000 0,049754 0,026857 0,0649 Witteboord 0,199479 0,033691 0,0000 0,104605 0,037725 0,0058 0,047805 0,035881 0,1838 Gordeldrager 0,022197 0,028089 0,4300 -0,088253 0,026180 0,0008 0,134326 0,038918 0,0006 SSR: 521,6313 SSR: 722,8803 SSR: 503,3939

Tabel 5: privaat verzekerden (Inclusief Heckmancorrectie)

Bij deze regressie zijn er erg veel variabelen niet significant, vooral in het jaar 2004. Dit lijkt er erg op te duiden dat het geen goed model is, maar waarschijnlijker is dat dit komt doorat er te weinig waarnemingen voor deze groep zijn. Het is wel zo dat leeftijd, inkomen en opleiding lijken juist factoren die erg van belang zijn bij het kiezen van een verzekering, en toch zijn ze niet significant. Het lijkt toch belangrijk dat deze variabelen gebruikt worden om het model te schatten. In dit geval is het ook te zien dat geestelijke gezondheid en aantal aandoeningen erg belangrijk zijn voor de hoogte van de uitgaven. Wat betreft de selectievariabelen is er te zien dat vrijwel alle factoren significant zijn.

(d) Tot slot ook nog een regressie voor de niet verzekerden. Het is te verwachten dat hier wel adverse selectie aanwezig is, aangezien mensen er meestal zelf voor kiezen om zich niet te verzekeren. Het zou ook kunnen dat die personen geen geld hebben en net buiten een sociale regeling vallen. Aangezien er sprake kan zijn van

selectiviteit doordat er door de persoon zelf wordt gekozen om geen verzekering af te sluiten, wordt ook hier een Heckmancorrectie toegepast.

(22)

22 Log(Totale uitgaven)

2000 2004 2008

Variabele Coëff Std.Err p-wrde Coëff Std.Err p-wrde Coëff Std.Err p-wrde Antwoordvergelijking Constante 5,393157 0,443523 0,0000 5,473482 0,386085 0,0000 6,049617 0,479690 0,0000 Leeftijd -0,020174 0,022555 0,3712 -0,021075 0,018808 0,2626 -0,053652 0,017872 0,9414 Leeftijd^2 0,000479 0,000277 0,0835 0,000460 0,000230 0,0457 0,000880 0,000217 0,1944 # aandoeningen 0,340253 0,077625 0,0000 0,233459 0,053664 0,0000 0,261646 0,046513 0,0000 Slechte geest. gezondh. 0,051871 0,331691 0,8757 0,935294 0,251009 0,0002 0,521254 0,312170 0,0038 Vrouw 0,266596 0,109348 0,0148 0,138970 0,088761 0,1175 0,230707 0,104094 0,0000 Blank 0,651572 0,299973 0,0299 0,264002 0,080514 0,0010 0,252228 0,078471 0,0001

Inkomen 1,07E-06 2,57E-06 0,6772 1,17E-06 1,99E-06 0,5570 1,73E-06 1,58E-06 0,4814

Roker 0,108015 0,092113 0,2410 0,051855 0,076753 0,4993 -0,110370 0,080470 0,6036 Jaren opleiding 0,032640 0,013083 0,0127 0,036845 0,010882 0,0007 0,032478 0,013373 0,0001 Getrouwd 0,096413 0,093956 0,3049 0,054240 0,075100 0,4702 0,016474 0,081950 0,0011 Gezinsgrootte -0,037298 0,026988 0,1671 0,024299 0,022127 0,2722 0,009882 0,022847 0,0001 Sub. gezondheid -0,296404 0,100939 0,0033 -0,258417 0,078648 0,0010 -0,285003 0,084861 0,0000 Selectievergelijking Constante 0,980557 0,041182 0,0000 0,985044 0,038467 0,0000 -0,416646 0,132905 0,0017 Leeftijd -0,058710 0,002793 0,0000 -0,061857 0,002405 0,0000 -0,035489 0,006262 0,0000

Leeftijd^2 0,000700 3,34E-05 0,0000 0,000734 2,97E-05 0,0000 0,000476 7,74E-05 0,0000

Inkomen 5,18E-06 5,79E-07 0,0000 6,71E-06 4,73E-07 0,0000 5,32E-06 4,62E-07 0,0000

Roker -0,132844 0,029544 0,0000 -0,110326 0,026358 0,0000 -0,081584 0,029040 0,0050 Jaren opleiding 0,021568 0,002884 0,0000 0,020177 0,002369 0,0000 0,061284 0,003971 0,0000 Getrouwd 0,256883 0,025897 0,0000 0,203252 0,022306 0,0000 0,285310 0,025421 0,0000 Gezinsgrootte -0,056311 0,006079 0,0000 -0,059217 0,004999 0,0000 -0,067036 0,006763 0,0000 Noordoost 0,329040 0,032251 0,0000 0,434424 0,028561 0,0000 0,235987 0,035740 0,0000 Midden-west 0,357181 0,029571 0,0000 0,347926 0,026032 0,0000 0,315708 0,034031 0,0000 Zuid 0,088188 0,023558 0,0002 0,116995 0,020075 0,0000 0,049754 0,026857 0,0640 Witteboord 0,199479 0,033691 0,0000 0,104605 0,037725 0,0056 0,047805 0,035881 0,1828 Gordeldrager 0,022197 0,028089 0,4295 -0,088253 0,026180 0,0008 0,134326 0,038918 0,0006 SSR: 3347,725 SSR: 4991,991 SSR: 5554,542 Tabel 6: Onverzekerden

Het valt direct op dat de resultaten uit tabel 6 enigszins op die van tabel 5 lijken. Ook hier is het effect van leeftijd en blank zijn verwaarloosbaar klein. De reden daar voor ligt voor de hand, beide groepen bestaan uit personen die zelf gekozen hebben om al dan niet een verzekering af te sluiten.

(23)

23

Er kan getest worden of er inderdaad statisch geen verschil is tussen de publiek verzekerden en de onverzekerden. Bijvoorbeeld in 2004 wordt hiervoor de grootheid 𝐹 = (5927.380 − 4991.991 − 722.8803)/(4991.991 + 722.8803)/(448 + 4456 − 2) =

182.2819 genomen die 𝐹(1, 448 + 4456 − 2) verdeeld is met als kritieke F-waarde 3,84 (bij een significantieniveau van 95%). De hypothese dat de coëfficiënten van beide groepen hetzelfde zijn wordt dus ruimschoots verworpen. Er is toch statistisch bewijs dat er verschil is tussen de privaat verzekerden en de onverzekerden.

Waarschijnlijk komt dit doordat er geen moral hazard aanwezig is in de groep onverzekerden.

6 Analyse

In dit hoofdstuk worden eerst de keuze van de variabelen kort besproken en

vervolgens wordt een analyse gedaan over de aanwezigheid van adverse selectie en moral hazard. Uit de regressieresultaten blijkt dat de variabele roker nergens

significant is. Ook de variabele die slechte geestelijke gezondheid aangeeft is vaak niet significant. De reden hiervoor zou kunnen zijn dat de variabele voor subjectieve gezondheid of het aantal aandoeningen al een goed alternatief is om de gezondheid van personen uit te drukken en de andere twee variabelen niet meer nodig zijn. Zoals eerder genoemd is het voornaamste probleem om een goede manier te vinden om gezondheid in het model te verwerken aangezien gezondheid de belangrijkste beslissingsfactor is bij het kiezen van een verzekering. Daarnaast blijkt dat leeftijd kwadraat vaak een verwaarloosbaar kleine invloed heeft op de uitgaven. Opvallend is dat de invloed van inkomen in veel gevallen ook verwaarloosbaar klein is. Het zou juist te verwachten zijn dat het inkomen van iemand een belangrijke factor is bij de uitgaven aan zorgkosten of de keuze van het verzekeren, zeker bij de groepen privaat verzekerden en onverzekerden.

De resultaten van de regressies kunnen geanalyseerd worden, waarmee er een oordeel kan worden gegeven over de vraag of er adverse selectie aanwezig dan wel moral hazard is. Om uit de resultaten te destilleren of er inderdaad

asymmetrische informatie te vinden is op deze markt, kunnen de groepen eerst vergeleken worden. Omdat adverse selectie en moral hazard dezelfde gevolgen hebben, kunnen we niet direct het verschil zien in de resultaten. Eerst kan de groep publiek verzekerden (a) met de groep privaat verzekerden (c) vergeleken worden, waaruit zou moeten blijken dat er wel adverse selectie aanwezig is bij de groep

(24)

24

privaat verzekerden en niet bij de publiek verzekerden. Bij beide groepen kan moral hazard aanwezig zijn. Hierna wordt de groep publiek verzekerden (a) vergeleken met de groep via het werk verzekerden (b). Hier wordt verwacht dat alleen bij groep b er adverse selectie te vinden is. Wel kan er bij beide groepen moral hazard zijn. Tot slot kan ook nog de groep privaat verzekerden (c) en de groep onverzekerden (d) met elkaar vergeleken worden. In dit geval wordt juist een verschil moral hazard verwacht, namelijk dat dit alleen aanwezig is bij de privaat verzekerden, omdat er geen reden meer is voor de onverzekerden om onnodige uitgaven aan

zorgvoorzieningen te doen. Wel zal er in beide groepen adverse selectie aanwezig zijn omdat de personen er zelf voor kiezen om zich te verzekeren of niet.

Om een duidelijke conclusie te kunnen trekken over de grootte van enerzijds adverse selectie en anderzijds moral hazard kan een Blinder-Oaxaca-decompositie gebruikt worden (Blinder, 1973; Oaxaca, 1973). Dit is te doen door de gebruikte vergelijkingen van twee groepen, bijvoorbeeld a en b, te schrijven als

𝑦𝑎 = 𝑋𝑎′𝛽𝑎+ 𝜀𝑎 en 𝑦𝑏 = 𝑋𝑏′𝛽𝑏+ 𝜀𝑏

Dan kan het verschil in verwachte waarde van de uitgaven van groep a en groep b worden geschreven als:

𝑦̅_𝑎− 𝑦̅_𝑏 = 𝑋̅_𝑎′_𝛽̂

𝑎− 𝑋̅𝑏′𝛽̂𝑏 = (𝑋̅_𝑎′ _{− 𝑋̅}

𝑏′)𝛽̂𝑏+ 𝑋̅𝑎′(𝛽̂𝑎− 𝛽̂𝑏) = ∆𝑋 ̅ 𝛽̂𝑏+ 𝑋̅𝑎′Δ𝛽̂ (8)

Voor variabelen is de verwachte waarde het gemiddelde, voor de residuen is de verwachte waarde nul. In de formule staat 𝑋̅_𝑎 voor een vector met gemiddelde waarden van de variabelen van groep a, 𝑋̅_𝑏 voor die van groep b, en 𝑦̅_𝑎 voor de gemiddelde uitgaven van groep a, 𝑦̅𝑏 voor die van groep b (Tárrega, Bayarri, Carbonell, & Izquierdo, 2010, p.662). Als het gedeelte van de vergelijking dat onderaan staat gegeven wordt gebruikt, wordt gezegd dat groep b als basis wordt genomen, en groep a ten opzichte daarvan wordt bekeken (Fournier, 2005, p.670). Aangezien de verschillen tussen de modellen door adverse selectie te verklaren zijn, zal dit het gedeelte van Δ𝑋 verklaren. Het verschil in de coëfficiënten, Δ𝛽̂, het overige gedeelte, zal dan aan moral hazard te wijten zijn. Het verschil in uitgaven dat wordt veroorzaakt door adverse selectie is dus te meten met ∆𝑋 ̅ 𝛽̂𝑏, en door moral hazard met 𝑋̅_𝑎′_{Δ𝛽̂. Er moet wel opgemerkt worden dat deze methode alleen goed te}

gebruiken is mits het regressiemodel goed gespecificeerd is, anders kan een decompositie geen goede conclusie geven. In het bijzonder hangt dit af van hoe

(25)

25

goed gezondheid te beschrijven is met de gekozen variabelen. Als er de log van afhankelijke variabele wordt genomen, kan de som van elk van de twee termen worden geïnterpreteerd als een percentage (Blinder, 1973). De resultaten van de decompositie zijn samengevat in tabel 7, de volledige resultaten zijn te vinden in de appendix. Uit de laatste twee kolommen uit die tabellen is op te maken welk gedeelte van het verschil in uitgaven wordt verklaard door het verklaarde verschil (op een na laatste kolom), dat wil zeggen adverse selectie, of door het onverklaarde verschil (laatste kolom), dat wil zeggen moral hazard. Een positief getal houdt in dat dit meer op de basisgroep werkt, en een negatief getal houdt in dat er meer aanwezig is bij de andere groep (Blinder, 1973, p.444).

publ./priv. pulb./werk priv./niet

2000 AS -0,0883 0,3185 0,3348 MH 0,3906 -0,1305 0,4846 2004 AS 0,4309 -0,3683 0,2869 MH -0,1005 0,3023 0,6484 2008 AS 0,2512 0,1746 0,2696 MH 0,0126 -0,1996 0,7219

Tabel 7: decompositie van adverse selectie en moral hazard tussen verschillende groepen

Als eerste wordt er gekeken naar de verschillen in groep publiek verzekerden (a) en de privaat verzekerden (c), weergegeven in tabel 8. In het jaar 2000

was -0,8% van het verschil in uitgaven toe te schrijven aan adverse selectie en 39,1% aan moral hazard. Dit is compleet tegen de verwachting in, hier blijkt dat er nagenoeg geen verschil aan adverse selectie te wijten is en alles aan moral hazard. Verwacht werd dat het verschil in uitgaven juist te wijten zou zijn aan adverse

selectie. In 2004 was er een heel ander verschil te zien. Daar bleek dat 43% van het verschil in uitgaven wordt verklaard door adverse selectie. Dit resultaat is hetgeen verwacht was, aangezien er bij de publiek verzekerden geen adverse selectie zal zijn doordat die personen niet zelf kiezen voor een verzekering, daarentegen zal er bij de privaat verzekerden wel adverse selectie aanwezig zijn. Maar volgens dit resultaat is -10% van het verschil te verklaren is door moral hazard. Dat er bij de privaat

verzekerden minder moral hazard is, kan komen doordat er juist bij mensen die niks hoeven te betalen een prikkel is om meer zorguitgaven te maken, en misschien hebben personen die zelf voor een verzekering betalen die prikkel minder doordat ze toch zelf geld betalen aan de verzekering. Er zou eigenlijk verwacht worden dat het deel verklaard door moral hazard 0 zou zijn, omdat dan het gehele verschil in

(26)

26

uitgaven door adverse selectie bepaald zou worden. Een andere verklaring voor het resultaat dat de waarde niet 0 is, zou kunnen zijn dat het model niet goed

gespecificeerd is. Voor 2008 blijkt uit deze resultaten dat 25,1% wordt verklaard door adverse selectie en 1,3% door moral hazard. In dit geval is gedeelte moral hazard wel dicht bij nul, waardoor het resultaat het dichtst in de buurt komt van de

verwachting. Of dit resultaat nu ook als enige klopt, is niet te zeggen aangezien twee jaren andere resultaten geven. In de jaren 2004 en 2008 blijkt wel dat het grootste gedeelte van het verschil in uitgaven tussen de publiek en de privaat verzekerden door adverse selectie verklaard kan worden, zoals verwacht, waarbij dit in 2004 een groter verschil oplevert.

Vervolgens wordt de groep sociaal verzekerden (b) en de groep via het werk verzekerden (b) vergeleken. De resultaten van de decompositie zijn weergegeven in tabel 9. Er is voor de groep via het werk verzekerden gebruik gemaakt van de

resultaten met selectiviteitscorrectie. Voor 2000 blijkt dat 31,9% van het verschil in uitgaven wordt verklaard door adverse selectie en -13,1% door moral hazard. Het verschil wordt dus inderdaad voor een groot gedeelte verklaard door adverse

selectie, aanwezig bij de via het werk verzekerden. Net als bij de hiervoor besproken decompositie zou het verschil in moral hazard hier 0 moeten zijn, aangezien het in beide groepen kan voorkomen. De reden dat dit niet in het resultaat te zien is, is wederom hetzelfde. Voor 2004 wordt in dit geval -36,8% van het verschil in uitgeven verklaard door adverse selectie, maar daarentegen 30,2% door moral hazard. Met andere woorden, bij de groep via het werk verzekerden zou minder adverse selectie aanwezig zijn dan bij de groep sociaal verzekerden. Dit resultaat is echter compleet tegen de verwachting in, aangezien verwacht zou worden dat er juist meer is bij de via het werk verzekerden. Een mogelijke verklaring voor dit resultaat is dat het model niet goed gespecificeerd is. Voor 2008 wordt 17,5% verklaard door adverse selectie en -20,0% door moral hazard. Het probleem in dit jaar is dat de moral hazard groter lijkt dan de adverse selectie, terwijl het eigenlijk 0 zou moeten zijn. Waarschijnlijk is dit resultaat dus ook niet correct. Voor de jaren 2000 en 2008 zijn de resultaten dus bijna zoals verwacht, er is een groot gedeelte verschil in uitgaven te verklaren door adverse selectie bij de via het werk verzekerden. Er blijkt in die jaren echter ook meer moral hazard aanwezig te zijn bij de publiek verzekerden, wat niet werd verwacht. Voor het jaar 2004 blijken de resultaten omgekeerd. Het is onduidelijk waarom dit het geval is, aangezien de decomposities van de andere groepen wel een resultaat in

(27)

27

dezelfde richtingen van de andere jaren opleveren. Waarschijnlijk is het model niet goed gespecificeerd dat er dit resultaat uit is gekomen.

Tot slot wordt onderzocht wat de verschillen zijn tussen de groep privaat

verzekerden (c) en de groep onverzekerden (d). Dat resultaat is in tabel 10 te zien. In dit geval blijkt dat voor 2000 33,5% wordt verklaard door adverse selectie, en 48,5% door moral hazard. Voor 2004 is het grootste gedeelte van het verschil in uitgaven door moral hazard te verklaren, namelijk 64,8%. Er blijkt echter ook uit de

berekeningen dat 28,7% toe te schrijven is aan adverse selectie. Voor 2008 is 27,0% toe te schrijven aan adverse selectie en 72,2% aan moral hazard. Volgens de

verwachting zou het gedeelte adverse selectie 0 moeten zijn, aangezien er geen moral hazard bij de onverzekerden kan zijn en het verschil in uitgaven dus volledig verklaard zou moeten worden door moral hazard. Dat er in alle drie de jaren toch nog meer dan 20% verklaard wordt door adverse selectie zou bijvoorbeeld kunnen komen doordat het model niet goed gespecificeerd is. Alle jaren geven ongeveer hetzelfde resultaat: Het grootste gedeelte van het verschil in uitgaven tussen de publiek verzekerden en onverzekerden wordt bepaald door moral hazard, maar de adverse selectie is niet 0 terwijl dat wel verwacht werd.

7 Conclusie

Uit het onderzoek dat voor deze scriptie is uitgevoerd is gebleken dat als personen worden onderverdeeld in vier groepen, publiek verzekerden, via het werk

verzekerden, privaat verzekerden, en onverzekerden, er asymmetrische informatie kan worden gemeten. Vervolgens kunnen adverse selectie en moral hazard via een Blinder-Oaxaca-decompositie van elkaar onderscheiden worden. Uit deze

decompositie blijkt dat het verschil in uitgaven aan zorg bij de publiek verzekerden en de privaat verzekerden in de jaren 2004 en 2008 grotendeels verklaard kan worden doordat er adverse selectie aanwezig is bij de privaat verzekerden en niet bij de publiek verzekerden. Het blijkt echter wel dat het verschil verklaard door moral

hazard niet nul is zoals verwacht, wat zou kunnen duiden op andere invloeden of een slecht model. De resultaten voor 2000 voor deze groepen zijn waarschijnlijk niet correct. Ook blijkt dat voor de verschillen in uitgaven voor de publiek verzekerden en de via het werk verzekerden voor de jaren 2000 en 2008 ook te verklaren zijn met meer adverse selectie bij de groep via het werk verzekerden. Wederom is de moral hazard niet nul, waarschijnlijk om dezelfde hiervoor genoemde oorzaken. Het jaar

(28)

28

2004 levert in dit geval echter onverwachte resultaten op, het is onduidelijk waarom deze zo anders en onverwacht zijn. Tot slot blijkt uit het vergelijken van de groepen privaat verzekerden en de onverzekerden dat er in de jaren 2000, 2004 en 2008 het verschil in uitgaven duidelijk verklaard kan worden door voornamelijk moral hazard. Dit is inderdaad wat verwacht zou worden aangezien er geen moral hazard kan zijn bij de onverzekerden want er geen aanleiding om vaker dan nodig is naar de dokter te gaan. Het is gebleken dat 2008 het enige jaar is waar de resultaten ongeveer zo waren zoals verwacht. Dat er in sommige gevallen slechte resultaten uit de

regressies en decompositie kwamen, komt waarschijnlijk doordat het model niet goed gespecificeerd is, een voorwaarde om een succesvolle Blinder-Oaxaca-decompositie te maken. De slechte specificatie van het model is het gevolg van het niet goed kunnen modelleren van de variabele voor gezondheid.

Er kan dus geconcludeerd worden dat er aanwijzingen zijn dat er adverse selectie is bij de via het werk verzekerden, privaat verzekerden en onverzekerden, en dat er aanwijzingen zijn voor moral hazard is bij de publiek verzekerden, via het werk verzekerden en privaat verzekerden. Echter, of dit over de jaren verschilt is niet zeker, omdat er uit dit onderzoek onduidelijke resultaten kwamen.

Bibliografie

Alegre, J., Mateo, S., en Pou, L. (2013). Tourism participation and expenditure by Spanish households: The effects of the economic crisis and unemployment. Tourism

Management, vol. 39, pp. 37-49.

Blinder, A. S. (1973). Wage discrimination – Reduced form and structural estimates.

Journal of Human Resources, vol. 8, pp. 436–455.

Cameron, A.C., Trivedi, P.K., Milne, F., en Piggott, J. (1988). A Microeconometric Model of the Demand for Health Care and Health Insurance in Australia. Review of

Economic Studies, vol. 55, pp. 85-106.

Cardon, J.H. en Hendel, I. (2001). Asymmetric information in health insurance: evidence from the National Medical Expenditure Survey. RAND Journal of

Economics, vol. 32, pp. 408-427.

Centers for Medicare & Medicaid Services. (2016). Medicare & You 2016. Diane Publishing.

Chiappori, J.H. en Salanie, B. (2000). Testing for asymmetric information in insurance markets. Journal of Political Economy, vol. 108, pp. 56-78.