• No results found

Een pseudo-panel analyse van de zorguitgaven in de VS

N/A
N/A
Protected

Academic year: 2021

Share "Een pseudo-panel analyse van de zorguitgaven in de VS"

Copied!
25
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Universiteit van Amsterdam

Bachelorscriptie Econometrie

Een pseudo-panel analyse van de

zorguitgaven in de VS

Door:

Ruben Spruit

10447482

Begeleider:

dhr. dr. J.C.M. van

Ophem

December 23, 2014

(2)
(3)

Inhoudsopgave

1 Inleiding 4 2 Literatuur 5 3 Model 8 3.1 Pseudo-panel analyse . . . 8 3.2 Hausman specificatietoets . . . 10 3.3 Tijdspecifiek model en OLS regressies . . . 11

4 Data 11

5 Resultaten 15

5.1 Fixed effects en Random effects . . . 15 5.2 Jaarspecifieke kenmerken . . . 16 5.3 OLS regressies per observatiejaar . . . 17

6 Conclusie 18

Referenties 20

(4)
(5)

1

Inleiding

Een groot probleem in de Verenigde Staten (VS) in de afgelopen decennia is de disproportionele groei van de uitgaven voor gezondheidszorg als deel van het bruto nationaal product (bnp) (Centers for Medicare & Medicaid Services (CMS), 2014). Hoewel de volksgezondheid profijt heeft van deze groei veroorzaakt het problemen bij de financiering van deze uitgaven (Orszag, 2007).

Op nationaal niveau vond Newhouse (1977) een groei van het BNP als mo-gelijke oorzaak voor de toenemende gezondheidszorguitgaven. Andere momo-gelijke oorzaken zoals de toegenomen levensverwachting zijn insignificant gebleken.1 Op

individueel niveau onderzocht Shen (2013) de determinanten van drie verschil-lende beslissingen in de gezondheidszorg waaronder een analyse van de individuele gezondheidszorguitgaven. Uit deze analyse blijkt dat variabelen als verzekerd zijn en het aantal aandoeningen van een individu een aanzienlijk effect hebben op de zorguitgaven.

De vraag die centraal staat in dit onderzoek luidt: hoe hebben de determi-nanten van gezondheidszorguitgaven op cohort niveau zich ontwikkeld in de tijd. Om deze vraag te beantwoorden zal gebruik gemaakt worden van een pseudo-panel analyse. Voor deze analyse moeten ‘cohorten’ opgesteld worden. Het fixed effects (FE) model wordt gebruikt voor de analyse omdat cohorteffecten mogelijk gecor-releerd zijn met een of meerdere verklarende variabelen.

De data gebruikt in dit onderzoek zijn afkomstig uit de Medical Expenditure Panel Survey (MEPS). Dit is een lopende nationale enquˆete die representatief is voor de bevolking in de Verenigde Staten. Uit deze cross-sectionele dataset worden cohorten opgesteld van mannen en vrouwen geboren tussen 1930 en 1984. Deze cohorten worden gevolgd in vier jaren beginnend in 2000 met het opvolgende jaar vier jaar verder.

Omdat de uitgaven van een persoon tot stand komen door meerdere gerela-teerde beslissingen moet hier rekening mee gehouden worden bij de analyse van de uitgaven. Een mogelijk empirisch obstakel is dat de verklarende variabele verzek-ering, endogeen zou kunnen zijn. Dit zou kunnen omdat iemand die verwacht

1Leu (1986) vond geen significant effect van het aandeel ouderen (leeftijd 65) op de uitgaven,

(6)

veel ziektekosten te maken eerder geneigd is om zichzelf te verzekeren. Daarnaast hoeven verzekerde niet direct voor zorgkosten betalen waardoor ze mogelijk eerder zorgkosten maken. Het gevolg van deze twee fenomenen is dat er simulatiteit op-treed wat mogelijk leidt tot endogeniteit.

Deze scriptie is als volgt opgebouwd; Sectie 2 bespreek gerelateerde liter-atuur. In sectie 3 wordt het model ge¨ıntroduceerd. Sectie 4 beschrijft de dataset en sectie 5 geeft de resultaten. Tot slot geeft sectie 6 een conclusie, discussie en verdere onderzoeksmogelijkheden.

2

Literatuur

Decennia lang zijn groeiende gezondheidszorguitgaven typerend geweest voor de gezondheidszorgsystemen in alle ontwikkelde landen. In de Verenigde Staten, het land dat een groter deel van het BNP aan gezondheidszorg besteedt dan enig an-der land, zijn de per capita gezondheidszorguitgaven gestegen van $809 in 1960 tot $8915 in 2012 (inflatie gecorrigeerd) (CMS, 2014). Ondanks dat de uitgaven-groei door de tijd varieerde, heeft het altijd de uitgaven-groei van geaggregeerd inkomen overschreden. Hoewel de volksgezondheid baat heeft bij deze groei van uitgaven is het financieren van deze groei een substantieel probleem. (Orszag en Ellis, 2007).

Figure 1: Groei zorgkosten VS

(7)

een belangrijke rol spelen bij het tot stand komen van deze groei. Newhouse (1977, 1987), Cullis and West (1979), Leu (1986), Parkin et al. (1987), Milne en Molana (1991), Getzen en Poullier (1991), Gerdtham en Johnsson (1991), Gerdtham et al. (1992), en Hitiris en Posnett (1992) vonden allemaal een sterke positieve correlatie tussen de geaggregeerde zorguitgaven en het BNP in verschillende landen. In veel van deze onderzoeken is gebruik gemaakt van data afkomstig van de OECD health database.

Een belangrijke kwestie in deze onderzoeken op macro-economisch niveau is de vraag of de gezondheidszorg een ‘luxe goed’ is. Oftewel of er een grotere dan proportionele toename van inkomen wordt besteed aan gezondheidszorg. Kleiman (1974), Newhouse (1977), Maxwell (1981), Gertzen (1990), Getzen en Poullier (1992) en Gerdtham et al. (1992) vonden allemaal een inkomenselasticiteit van de gezondheidszorguitgaven groter dan 1. Dit resultaat zou erop wijzen dat gezond-heidszorg op nationaal niveau een luxe goed is. Tegenovergestelde resultaten wor-den gevonwor-den bij de analyse van individuele gezondheidszorguitgaven. In het toonaangevende onderzoek van Manning et al. (1987) wordt op 3 verschillende manieren individuele inkomenselasticiteiten van gezondheidszorguitgaven tussen de -0.2 en -0.1 geschat. Deze resultaten zijn consistent met resultaten uit stud-ies die geen gebruik maken van experimentele data. Getzen (2000) concludeert dat omdat kosten voor gezondheidszorg een resultaat zijn van beslissingen op ver-schillende niveaus (bijvoorbeeld nationaal of individueel) er een multi-level analyse nodig is.

Bij de analyse van het effect verzekerd zijn op uitgaven moet rekening gehouden worden met twee fenomenen, adverse-selection en moral-hazard, die kunnen optre-den. Shen (2013) stelt aan de orde dat mensen die verwachten dat ze meer medische hulp nodig hebben eerder geneigd zijn om zich te verzekeren. Dit adverse-selection probleem heeft als gevolg dat verzekeringsmaatschappijen minder vrijgevig wor-den. Dit zou betekenen dat kosten van verzekeringen omhoog gaan en daardoor zijn gezonde mensen minder geneigd om zich te verzekeren. Het resultaat is dat in de groep verzekerden de algemene gezondheid lager is en het aannemelijk is dat de uitgaven hoger zijn voor de groep mensen met een slechtere gezondheid (Cutler en Reber, 1992). Tegengestelde resultaten worden gevonden in de onderzoeken over adverse selection bij verzekeringen. Cameron en Trivedi (1991) vonden geen

(8)

sig-nificant effect van gezondheidsstatus op het dan wel niet verzekerd zijn. Cutler en Zeckerhause (1997) constateerden echter wel dat er sprake is van adverse selection bij ziektekostenverzekering die via een werkgever zijn geregeld.

Ook moet er rekening worden gehouden met het zogenaamde moral hazard effect. Moral hazard is een situatie waarin een partij bereid is meer risico te lopen omdat de kosten niet voor eigen risico zijn. In de gezondheidszorgtheorie kan dit twee dingen betekenen. Het zou kunnen betekenen dat omdat iemand verzekerd is, diegene meer risico durft te nemen door bijvoorbeeld het aannemen van een ongezondere leefstijl (ex ante moral hazard). Ook kan het betekenen dat voor iemand die verzekerd is de drempel lager is om medische hulp te zoeken (ex post moral hazard). Cutler en Zeckerhauser (2000) concluderen dat ex ante moral hazard geen significante rol speelt bij de gezondheidszorguitgaven. Shen (2013) nam een verhoogde kans waar voor mensen die verzekerd zijn op het gebruik maken van medische hulp van ongeveer 15 procent.

Doordat iemand die verwacht veel ziektekosten te maken eerder geneigd is om zichzelf te verzekeren en door dat verzekerd zijn de drempel om zorg te zoeken verkleint kan leiden tot endogeniteit bij de analyse van het effect van verzekerd zijn op uitgaven. In de econometrische literatuur is het gebruik maken van instru-mentele variabelen een oplossing voor endogeniteit (Heij et al., 2004). Het vinden van een goed instrument voor verzekerd zijn of niet is moeilijk aangezien weinig variabelen gecorreleerd zijn met verzekerd zijn maar niet met de uitgaven.

Shen (2013) maakt onder andere gebruik van een semi-parametrisch model waar geen aannames worden gedaan over de verdeling van de storingstermen en schat het marginale effect van verzekerd zijn op de hoogte van gezondheidszorguitgaven op 47.9 procent.

Voor het vervolg van dit onderzoek is het van belang om de technieken die worden toegepast toe te lichten. Omdat slechts herhaalde cross-secties beschik-baar zijn zullen pseudo panel schattingstechnieken, ge¨ıntroduceerd door Deaton (1985), gebruikt worden. In sectie 3 zal dieper op deze technieken worden inge-gaan. Deaton (1985) kwam met het idee om een cohort benadering te beschouwen om een model te construeren met herhaalde cross-secties. Hij stelde dat ondanks het niet mogelijk is om een individu te volgen in de tijd, het mogelijk is om co-horten te volgen door de tijd. Het idee is om de gegevens binnen een cohort te

(9)

aggregeren en vervolgens schattingstechnieken op dit gevormde pseudo-panel toe te passen.

Cohorten zijn gedefinieerd als groepen met vast staande karakteristieken op ba-sis van tijd invariante variabelen. Veelgebruikt karakteristieken om een cohort te defini¨eren zijn geboortejaar en geslacht. Meerdere karakteristieken kunnen gecom-bineerd worden zodat een mogelijke groep zou kunnen zijn ‘mannen geboren tussen 1950 en 1955. Belangrijk is dat elke observatie slechts in een groep behoort en die groep gebaseerd is op basis van tijd invariante variabelen.

Pseudo-panels kunnen worden bewerkt door de data met betrekking tot de gedefinieerde groepen te aggregeren. Dit betekent dat groepsgemiddelden van de variabelen moeten worden bepaald voor elke tijdsperioden. Voor de analyse is het van belang om verschillende dimensies van de data te beschouwen. Ten eerste het totaal aantal observaties N , het aantal tijdsperiodes T . De observaties worden gegroepeerd in totaal S cohorten met Nst observaties in cohort s in tijdsperiode t.

3

Model

3.1

Pseudo-panel analyse

Deaton (1985) laat zien dat op basis van onafhankelijke cross-secties in achtereen-volgende jaren er door het construeren van cohorten, een panel analyse kan worden gedaan. Bij een reguliere paneldata set wordt het volgende het random of lineaire fixed effects model beschouwd:

yit= xitβ + αi+ it

Waarin xit verklarende variabelen zijn met i de index voor individuen en t de

tijdsindex. Aangenomen wordt dat E[it|xit] = 0 voor alle t, i. Bij random-effects

wordt verondersteld dat er geen covariantie is tussen de tijdsonafhankelijke indi-viduele effecten αi. Mogelijk zijn de individuele effecten αi gecorreleerd met

verk-larende variabelen. Dit zou betekenen dat de aanname dat αi uit een willekeurige

trekking komt, zal leiden tot inconsistente schatters. Dit wordt voorkomen door de fixed effects αi, de vaststaande individuele karakteristieken, te beschouwen als

(10)

constante onbekende parameters. Is dit het geval dan moet het fixed effects model gebruikt worden. Normaliter kunnen deze individuele fixed effect ge¨elimineerd worden door het nemen van eerste verschillen. Deze strategie werkt niet meer als er geen herhaalde observaties van eenzelfde individu beschikbaar zijn. Aggregatie van alle observaties op cohort level zal leiden tot het volgende model:

yct = xctβ + αct+ ct

Met ycten xctde gemiddelde van alle geobserveerde y en x in cohort c op tijdstip

t. Het probleem met de schatting van dit model is dat αct afhangt van t, niet

waargenomen is en waarschijnlijk gecorreleerd is met de verklarende variabelen. Deaton stelt daarom een alternatief model voor:

yct = xctβ + α∗c+ ct

Waar αc∗ het cohort fixed effect die constant is door de tijd omdat de

popu-latie van de cohorten door de tijd hetzelfde type individuen bevatten. Omdat deze cohort populatie gemiddelden niet te bepalen zijn worden deze populatie gemid-delden bepaald door de steekproefgemidgemid-delden van de variabelen. Omdat deze steekproefgemiddelden error-ridden metingen zijn van de cohort populatie stelt Deaton (1985) een error-invariables schatter voor die constant blijkt onder zwakke aannames. Zo neemt Deaton (1985) aan dat de meetfouten in yct en xct normaal

verdeeld zijn met verwachte waarde 0 en onafhankelijk van de echte waardes van y∗ct en x∗ct. Met yct xct ! ∼ N yct∗ x∗ct ! , σ00 σ 0 σ Σ !!

Als het aantal observaties binnen een cohort groot genoeg is. Is het aannemelijk om deze error-in-variables te negeren en de gevormde panel te beschouwen als een reguliere paneldataset. Dit zou betekenen dat de fixed effects schatter voor β gegeven wordt door

(11)

ˆ β = C X c=1 T X t=1 (xct− xc)0(xct− xc) !−1 C X c=1 T X t=1 (xct− xc)0(yct− yc) ! Met xc= T1 PT t=1xct, en yc= 1 T PT

t=1yct. Onder de aanname dat

E[θct− θc|xct− xc] = 0 en

PC c=1

PT

t=1(xct− xc)0(xct− xc) inverteerbaar, volgt dat

ˆ

β zuiver is.

Verbeek en Nijman (1992) onderzochten of cohort data inderdaad behandeld kan worden als paneldata en komen tot de conclusie dat het effect van het negeren van het feit dat alleen een pseudo-panel beschikbaar is klein zal zijn als de cohort omvang groot genoeg is.

Voor het analyseren van de totale uitgaven wordt het logaritme van de uitgaven en ook het logaritme van inkomen genomen. Dit zorgt ervoor dat de parameter voor inkomen dan een schatter is voor de inkomenselasticiteit voor gezondheidszorg uitgaven. Doordat er observaties zijn met als waarde voor de zorguitgaven 0 zullen complicaties optreden in het model waar het logarithme van de uitgaven gebruikt wordt. Daarom worden de data getransformeerd door bij alle waarnemingen een eenheid op te tellen. Dezelfde transformatie is gedaan bij het transformeren van het inkomen. Pas na het nemen van het logaritme zullen de cohortgemiddelden berekend worden. Deze manier van aggregeren wordt ook gesuggereerd in Deaton (1985). Deze transformatie is formeel gezien niet correct maar de bias die ontstaat, als mogelijke selectiveitseffecten genegeerd worden, zal dermate klein zijn dat dit slechts zeer beperkte gevolgen zal hebben voor de schattingen.

3.2

Hausman specificatietoets

Voor het analyseren van de totale uitgaven door de tijd zal voor de volledigheid zowel een fixed effects model geschat worden als een random effects model. Door gebruik te maken van een Hausman specificatietoets kan een uitspraak worden gedaan over de aannamens van beide modellen wat een indicatie kan geven over de vraag welk model gebruikt moet worden. De Hausman statistic H wordt gegeven door:

(12)

H = ( ˆβRE− ˆβF E)0(Var( ˆβRE) − Var( ˆβF E))−1( ˆβRE− ˆβF E)

Waarbij onder de nulhypothese H0 : Cov(xct, αc) = 0 en de alternatieve

hy-pothese Ha : Cov(xct, αc) 6= 0. Onder de nulhypothese is het random effects

model geprefereerd omdat dit leidt tot effici¨entere schattingen terwijl onder de alternatieve hypothese alleen het fixed effects model leidt tot consistente schattin-gen. Onder de nulhypothese is de Hausman statistic chi-kwadraat verdeeld met het aantal vrijheidsgraden gelijk aan de rang van de matrix Var( ˆβRE) − Var( ˆβF E).

3.3

Tijdspecifiek model en OLS regressies

Onder de aanname dat de effecten door de jaren heen gelijk blijven maar er per observatiejaar jaar-specifieke kenmerken een rol spelen in de totale uitgaven, kun-nen er indicatorvariabelen voor elk jaar in het model opgenomen worden. Zo kan het model uitgebreid worden tot een model die per jaar een verschillend snijpunt heeft per jaar. Dit leidt tot het volgende model:

yct = xctβ + α∗c+ D1,t + D2,t+ D3,t+ ct

Waarbij D1,t, D2,t en D3,t indicator variabelen zijn voor de jaren 2004, 2008 en

2012 zodat de constante term het jaar 2000 representeert.

Om te onderzoeken of de schattingen door de jaren heen daarwerkelijk gelijk zijn wordt per jaar een apparte OLS regressie gedaan. Voor deze regressies worden, in tegenstelling tot de panel-analyse, de data niet geaggregeerd.

4

Data

De data gebruikt in dit onderzoek zijn afkomstig van het MEPS. De MEPS is een lopende nationale en representatieve enquˆete voor de bevolking van de VS begonnen in 1996 door het Department of Health and Human Services. Dit onder-zoek maakt gebruik van de Household Component van de data en bevat enquˆetes van huishoudens uit de VS. Voor deze gedetailleerde gegevens is informatie ver-gaard over gezondheidszorguitgaven en ziektekostenverzekeringen maar ook over

(13)

demografische en socio-economische karakteristieken. De enquˆete wordt jaarlijks afgenomen en elk jaar worden verschillende huishoudens ondervraagd wat resul-teert in een pseudo-panel dataset.

Dit onderzoek gebruikt data uit een reeks van vier jaren (T = 4). Deze vier verschillende jaartallen, beginnend in 2000, volgen elkaar op met het opvolgende jaartal vier jaar verder. Om er voor te zorgen een gebalanceerde analyse gedaan kan worden (evenveel waarnemingen voor alle observaties) wordt gekeken naar mensen geboren tussen 1930 en 1984. De totale steekproefpopulatie bevat 56893 individuen.

Dit onderzoek beschouwt cohorten van mensen geboren tussen 1930 en 1984. De cohorten zijn gebaseerd op geboortejaar (niet te verwarren met leeftijd) en geslacht zodat een mogelijk cohort zou kunnen zijn ‘mannen geboren in 1950’. Dit betekent dat er 53 leeftijdsgroepen zijn en 2 geslachtsgroepen zodat er uiteindelijk 53 x 2 = 106 cohorten zijn (S = 106). Deze cohorten hebben een gemiddelde cohortomvang van Nst = 132 met de kleinste cohortomvang 21 individuen en de

grootste cohortomvang 239 individuen.

Voor de afhankelijke variabelen wordt het logaritme genomen van de totale gezondheidzorguitgaven. De totale uitgaven is een optelsom van alle zorguit-gaven die een persoon maakt in een jaar. Uitgaven voor medicijnen die geen voorschrift nodig hebben zijn hierin niet meegenomen. De volgende verklarende variabelen worden gebruikt in de analyse: demografische verklarende variabe-len zijn leeftijd, etniciteit (blank). Etniciteit wordt gebaseerd op de indicator-variabelen die aangeeft of iemand blank is of niet. Jaren scholing en de logaritme van het inkomen (log(inkomen)) en de indicator variabelen voor het hebben van een verzekering zijn socio-economische variabelen. Om een indicatie te geven voor de gezondheid status van een individu wordt de variabele voor het aantal medis-che aandoeningen, de indicator variabele of iemand rookt opgenomen en de vari-abele voor het aantal dokters bezoeken zijn afgelegd afgelopen jaar. Gelijksoort-ige regressoren worden gebruikt door Shen (2013) en Banthin, & Moeller (2004). De variabelen aantal medische aandoeningen is een opsomming van de volgende gezondheidsproblemen: astma, artritis, emfyseem, diabetes, hart- en vaarziekten, hoge bloeddruk, artrose en beroerte. Deze variabele is opgenomen om de ver-schillen in fysieke gezondheid status van mensen weer te geven en wordt vaak

(14)

gebruikt in gezondheid gerelateerde studies (Klabunde et al., 2000). Opgemerkt moet worden dat niet alle gegeven die Shen (2013) gebruikt opgenomen zijn om-dat in sommige jaren die gegevens niet beschikbaar zijn. Gegevens over mentale gezondheidsklachten worden niet opgenomen omdat deze niet aanwezig zijn in de Household Component.

In tabel 1 is een overzicht gegeven van de beschrijvende statistieken van de dataset die gebruikt wordt. Menige continue variabelen zijn gecategoriseerd in groepen om de een idee te geven over de verdeling van die variabelen. Deze vari-abelen blijven continu voor het schatten van het model. Door de verschillende observatiejaren heen is de verdeling van de gezondheidszorguitgaven erg scheef is. Gemiddeld is ongeveer 50% van de uitgaven zijn kleiner dan $1000 terwijl slechts 8,5% van de uitgaven groter zijn dan $10000.

(15)

Table 1: Beschijvende statistieken van de steekproefpopulatie 2000 2004 2008 2012 n % n % n % n % Observations 13363 100.0 17661 100.0 16510 100.0 9359 100.0 Expenditures No expenditures 2482 18.6 3278 18.6 2896 17.5 1743 18.6 Less than $1000 5834 43.7 6027 34.1 5208 31.5 2868 30.6 1000−2000 1924 14.4 2256 12.8 2173 13.2 1221 13.0 2000−5000 1808 13.5 3069 17.4 2931 17.8 1514 16.2 5000−10000 755 5.6 1647 9.3 1632 9.9 910 9.7 Over $10000 560 4.2 1384 7.8 1670 10.1 1103 11.8 Insurance Insured 11118 83.2 14174 80.3 13363 80.9 7562 80.8 Uninsured 2245 16.8 3487 19.7 3147 19.1 1797 19.2 Income Lest than $20000 6360 47.6 8482 48.0 6825 41.3 3934 42.0 20000−30000 2288 17.1 2902 16.4 2779 16.8 1401 15.0 30000−50000 2778 20.8 3436 19.5 3486 21.1 1875 20.0 Over $50000 1937 14.5 2841 16.1 3420 20.7 2149 23.0 Age Under 40 6160 46.1 7386 41.8 5693 34.5 2474 26.4 40-50 3161 23.7 4089 23.2 3867 23.4 2118 22.6 50 and over 4042 30.2 6186 35.0 6950 42.1 4767 50.9 Years education 0-7 762 5.7 1250 7.1 1065 6.5 563 6.0 7-14 7732 57.9 9894 56.0 8614 52.2 4824 51.5 More than 14 4869 36.4 6517 36.9 6831 41.4 3972 42.4 Gender Male 6215 46.5 7974 45.2 7504 45.5 4301 46.0 Female 7148 53.5 9687 54.8 9006 54.5 5058 54.0 Race White 111 0.8 13911 78.8 11952 72.4 6694 71.5 Non-white 13252 99.2 3750 21.2 4558 27.6 2665 28.5 Marital status Married 8069 60.4 10488 59.4 10115 61.3 5463 58.4 Other 5294 39.6 7173 40.6 6395 38.7 3896 41.6 Comorbidities 0 9224 69.0 11473 65.0 9000 54.5 4741 50.7 1 2952 22.1 4064 23.0 4422 26.8 2605 27.8 2 or more 1187 8.9 2124 12.0 3088 18.7 2013 21.5 Current smoker Yes 3179 23.8 3988 22.6 3334 20.2 1691 18.1 No 10184 76.2 13673 77.4 13176 79.8 7668 81.9

(16)

5

Resultaten

5.1

Fixed effects en Random effects

Table 2: Resultaten Fixed-Effects/Random-Effects model van log(uitgaven)

Fixed effects Random effects

Schatting SE p-waarde Schatting SE p-waarde

Constante 3.82 0.56 0.00 3.32 0.59 0.00 Log(inkomen) -0.07 0.05 0.15 -0.49 0.04 0.00 Verzekering 1.33 0.31 0.00 2.92 0.35 0.00 Jaren scholing 0.02 0.04 0.55 0.14 0.04 0.00 Leeftijd 0.00 0.01 0.49 0.03 0.00 0.00 Getrouwd 0.32 0.20 0.11 0.80 0.19 0.00 Blank 0.43 0.06 0.00 0.20 0.06 0.00 Aantal aandoeningen 0.61 0.10 0.00 0.26 0.10 0.01 Doktersbezoeken 0.08 0.01 0.00 0.14 0.01 0.00 Roker -0.48 0.35 0.17 -0.50 0.36 0.17 R2 0.86 0.85

Voor de analysevan de zorguitgaven worden twee modellen beschouwd, het fixed effects model en het random effects model. In tabel 2 is een overzicht gegeven van de resultaten van de schattingen voor de regressies. In beide tabellen zijn de significante variabelen (p < 0.05) hetzelfde. De resultaten van de Hausman specificatietoets zijn gegeven in tabel 3. De H-statistic heeft een waarde van 185.25. Dit resultaat is eenduidig en verwerpt het gebruik van een random effects model.

Table 3: Resultaten Hausman specificatietoets H-statistic 185.25

p > χ2 0.000

De schatter voor het effect van het hebben van een verzekering op de uitgaven is in het fixed effects model significant (p < 0.05). Dit effect wordt geschat op

(17)

ongeveer 133% meer uitgaven voor verzekerden. Opmerkelijk is dat deze resul-taten sterk overeenkomen met de schatters uit het parametrische model van Shen (2013), die ook een toenamen in de uitgaven van 125% voor verzekerde waarneemt. Deze resultaten zijn ook in overeenstemming met andere onderzoeken die ook toe-names in de zorguitgaven van deze omvang schatten (Hadley & Holahan, 2003; Miller, Banthin, & Moeller, 2004). Zowel deze onderzoeken en het parametrische model van Shen (2013) veronderstellen dat het hebben van een verzekering als een endogene beslissing kan worden beschouwd. Shen (2013) stelt dat deze aanna-men als gevolg heeft dat het marginale effect een opwaartse bias heeft, het semi-parametrische model in dit onderzoek berust niet op aanname over de verdeling van de storingsterm en schat het effect op 48%.

Blank zijn heeft een significante positieve relatie tot gezondheidszorguitgaven. Dit effecten wordt geschat op een toename van 43% in de zorguitgaven voor blanke mensen. In het fixed effects model zijn de gezondheid gerelateerde variabelen aan-tal aandoeningen en aanaan-tal dokters bezoeken significant. Deze effecten hebben een positief marginaal effect en worden geschat op ongeveer 61% en 8% respectievelijk. De variabelen of iemand rookt heeft geen significant effect wat in overeenstemming is met Leu & Schaub (1983) en Shen (2013).

De schatters voor het inkomen is in het fixed effects model niet significant. In het dit model wordt het effect van een percentuele toename in inkomen geschat op een afname van 7% in de gezondheidszorguitgaven. Dit zou betekenen dat gezond-heidszorg een Giffen goed is. Omdat in de Verenigde Staten gezondgezond-heidszorg als relatief duur gezien wordt, is dit tegen de intuitie in maar consistent met de bevin-dingen van Manning et al. (1987) die op individueel niveau min of meer gelijke resultaten concluderen.

5.2

Jaarspecifieke kenmerken

Onder de aannamen dat de effecten door de jaren heen gelijk blijven maar er per observatiejaar er jaar-specifieke kenmerken een rol spelen in de totale uitgaven kunnen er indicatorvariabelen in het model opgenomen worden. De resultaten van dit model worden gegeven in Tabel 4.

(18)

Table 4: Resultaten Fixed-Effects met Tijdsdummies Schatting SE p-waarde Constante 0.01 69.81 1.00 Log(inkomen) -0.08 0.05 0.08 Verzekering 1.35 0.31 0.00 Jaren scholing 0.02 0.04 0.60 Leeftijd 0.10 1.58 0.95 Getrouwd 0.19 0.21 0.36 Blank 0.86 0.37 0.02 Aantal aandoeningen 0.49 0.11 0.00 Doktersbezoeken 0.08 0.01 0.00 Roker -0.47 0.35 0.17 D1 -0.71 6.32 0.91 D2 -0.95 12.65 0.94 D3 -1.38 18.99 0.94 R2 0.82 Cov(αc, xct) -0.83

met een p-waarde van gemiddeld 0.93. Opmerkelijk zijn de negatieve co¨effici¨enten voor de schattingen van de indicator-variabelen voor de verschillende jaren. Zoals te zien is in figuur 2 is wel degelijk sprake van een groei in de gemiddelde uitgaven. Het zou kunnen betekenen dat de stijging van uitgaven tot stand komt door een verandering van verklarende variabelen zoals bijvoorbeeld een stijging van het aantal verzekerden, in plaats van jaar-specifieke kenmerken die invloed hebben op de stijging. Dit model geeft soortgelijke resultaten in de zin dat dezelfde variabelen significant zijn en de marginale effecten in dezelfde orde van grootte liggen. Het co¨efficient voor de variabelen of iemand blank is, ten opzichte van het fixed effects model, opmerkelijk toegenomen van 43% tot 86%.

5.3

OLS regressies per observatiejaar

Om te onderzoeken of de schattingen door de jaren heen daarwerkelijk gelijk zijn, wordt per jaar een apparte OLS regressie gedaan. Voor deze regressies worden, in tegenstelling tot de panel-analyse, de data niet geaggregeerd. De resultaten van deze OLS regressies per jaar worden gegeven in Tabel 5 (zie bijlagen). Opvallend

(19)

is dat de schattingen per jaar in ongeveer dezelfde orde van grootte liggen en er niet veel variatie in zit. Zo wordt de inkomens elasticiteit van de gezondheidszorg geschat op gemiddeld −0.03. Het OLS model schat gemiddeld het effect van het hebben van een verzekering op de zorgkosten op een toename 208%.

Een toename van een jaar in leeftijd leidt tot een 3% toename in uitgaven en dit is consistent in alle oberservatiejaren. Ook het aantal aandoeningen en het aantal doktersbezoeken zijn door de jaren heen redelijk consistent en deze effecten worden door het OLS model geschat op gemiddeld 75% toenamen in uitgaven per aandoeningen en 9% toename per doktersbezoek.

Het fixed effects model neemt aan dat de marginale effecten door de tijd heen constant zullen zijn, oftewijl dat β niet van t afhangt. Uit de resultaten van de OLS regressies lijkt het dat de marginale effecten door de jaren heen min of meer gelijk zijn. De marginale effecten worden ongeveer in de zelfde orde van grootte geschat door de jaren heen. Dit doet vermoeden dat het fixed effects, waarin wordt verondersteld dat marginale effecten β constant zijn door de jaren, een goede keuze is voor het model. Een mogelijke oorzaak van de groei in geaggregeerde gezondheidszorguitgaven wordt mogelijkerwijs veroorzaakt door bijvoorbeeld een stijging in het deel verzekerde, een stijging in het gemiddeld aantal aandoeningen of de vergrijzing van de bevolking. Dit laatste, toename in leeftijd, wordt echter door het fixed model als insignificant effect bevonden.

6

Conclusie

Dit onderzoek bestudeerd de determinanten van gezondheidszorgen uitgaven. Daar-voor wordt data gebruikt afkomstig uit het MEPS. Data uit de jaren 2000, 2004, 2008 en 2012 worden gecombineerd zodat een pseudo-panel verkregen wordt.

Een van de vragen waar getracht wordt een antwoord op te geven in dit on-derzoek is hoe het hebben van een verzekering invloed heeft op gezondheidszorg-uitgaven. Opmerkelijk zijn de overeenkomstige resultaten van de invloed van een verzekering op de uitgaven met andere onderzoeken. Het fixed-effects model schat dit effect op een 133% toenamen in de uitgaven voor verzekerden. Hiervoor is echter wel verondersteld dat verzekerd zijn als exogeen kan worden beschouwd. Shen (2013) vermoetd dat deze veronderstelling waarschijnlijk zorgt voor een

(20)

op-waartse vertekening.

Andere significante variabelen zijn etniciteit, huwelijkse staat en het aantal fysieke aandoeningen. Zowel blanke als getrouwde mensen blijken aanzienlijk hogere ziektekosten te genereren. Het hebben van een aandoening verhoogt gemid-deld gezien de uitgaven voor gezondheidszorg aanzienlijk. Voor beleidsmakers zou dit betekenen dat preventieve behandeling van aandoeningen mogelijk ziektekosten kunnen reduceren.

Naast het standaard fixed effects model worden twee andere modellen geschat. Zo wordt een model geschat die onderscheidt maakt tussen de verschillende ob-servatiejaren door te corrigeren voor tijdsspecifieke kenmerken. Uit de resultaten blijkt dat deze tijdsspecifieke kenmerken niet significant zijn. Het andere model bekijkt de onderlinge jaren apart. Door de jaren blijken de effecten van verschil-lende determinanten van de gezondheidszorguitgaven redelijk constant te blijven. Er zijn in dit onderzoek beperkingen wat leidt tot mogelijke vervolg onder-zoeken. In dit onderzoek is aangenomen dat verzekerd zijn als exogene variabelen kan worden beschouwd. Op het gebied van gezondheidszorg worden meerdere si-multane en gerelateerde beslissingen genomen. In dit onderzoek is dit complexe proces gesimplificeerd door bepaalde aannames. Een uitgebreidere studie zou dit complexe proces ook door de tijd kunnen analyseren. Ten tweede is door het op-stellen van cohorten geen duidelijk onderscheid tussen mannen en vrouwen. Ten derde is er geen onderscheid gemaakt tussen verschillende vormen van gezondheids-zorg. Zo zou het interessant zijn hoe preventieve zorg in voorgaande tijdsperioden effect heeft op de zorguitgaven.

(21)

Referenties

CMS, 2014. http://www.cms.gov/Research-Statistics-Data-and-Systems/Statistics-Trends-and-Reports/NationalHealthExpendData/NHE-Fact-Sheet.html

MEPS, 2009. http://meps.ahrq.gov/data files/publications/st247/stat247.pdf

Chernew, M., Cutler, D. M., & Keenan, P. S. (2005). Increasing health insurance costs and the decline in insurance coverage. Health services research, 40(4), 1021-1039.

Cullis, J. G., & West, P. A. (1979). The economics of health: an introduction. 76, 12-20. Oxford: Martin Robertson.

Cutler, D. M., & Zeckhauser, R. J. (1998)Adverse selection in health insurance. National Bureau of Economic Research 1(1).

Cutler, D. M., & Zeckhauser, R. J. (2000). The anatomy of health insurance. Hand-book of health economics, 1, 563-643.

Deaton, A. (1985). Panel data from time series of cross-sections. Journal of econo-metrics, 30(1), 109-126.

Gerdtham, U. G., J¨onsson, B., MacFarlan, M., & Oxley, H. (1998). The determinants of health expenditure in the OECD countries: a pooled data analysis. Health, the medical profession, and regulation, 113-134. Springer US.

Gerdtham, U. G., Søgaard, J., Andersson, F., & J¨onsson, B. (1992). An econometric analysis of health care expenditure: a cross-section study of the OECD countries. Journal of health economics, 11(1), 63-84.

Getzen, T. E. (1990). Macro forecasting of national health expenditures. Advances in health economics and health services research, 11, 27.

Getzen, T. E. (2000). Health care is an individual necessity and a national luxury: applying multilevel decision models to the analysis of health care expenditures. Journal of Health Economics, 19(2), 259-270.

(22)

Getzen, T. E., & Poullier, J. P. (1991). An income-weighted international average for comparative analysis of health expenditures. The International journal of health planning and management, 6(1), 3-22.

Hadley, J.,& Holahan, J. (2003). Is health care spending higher under Medicaid or private insurance?. INQUIRY: The Journal of Health Care Organization, Provi-sion, and Financing, 40(4), 323-342.

Hitiris, T.,& Posnett, J. (1992). The determinants and effects of health expenditure in developed countries. Journal of health economics, 11(2), 173-181.

Klabunde, Carrie N., Arnold L. Potosky, Julie M. Legler, & Joan L. Warren, (2000) Development of a Comorbidity Index Using Physician Claims. Journal of Clinical Epidemiology, 53, 1258–1267.

Kleiman, E. (1974). The determinants of national outlay on health. The economics of health and medical care, 369-376, Macmillan, London.

Leu, R. E., & Schaub, T. (1983). Does smoking increase medical care expenditure?. Social science & medicine, 17(23), 1907-1914.

Leu, R. E. (1986). The public-private mix and international health care costs. Public and private health services, 41-63.

Maxwell, R. J. (1981). Health and wealth: an international study of health-care spending. Sandoz Institute for Health and Socio-Economic Studies.

Moeller, J. F., Miller, G. E., & Banthin, J. S. (2004). Looking inside the nation’s medicine cabinet: trends in outpatient drug spending by Medicare beneficiaries, 1997 and 2001. Health affairs, 23(5), 217-225.

Milne, R., & Molana, H. (1991). On the effect of income and relative price on demand for health care: EC evidence. Applied Economics, 23(7), 1221-1226.

Newhouse, J. P. (1977). Medical-care expenditure: a cross-national survey. Journal of human resources, 115-125.

(23)

Orszag, P. R., & Ellis, P. (2007). The challenge of rising health care costs-a view from the Congressional Budget Office. New England Journal of Medicine, 357(18), 1793.

Parkin, D., McGuire, A., & Yule, B. (1987). Aggregate health care expenditures and national income: is health care a luxury good?. Journal of health economics, 6(2), 109-127.

Roberts, J. (1999). Sensitivity of elasticity estimates for OECD health care spending: analysis of a dynamic heterogeneous data field. Health Economics, 8(5), 459-472. Shen, C. (2013). Determinants of Health Care Decisions: Insurance, Utilization, and

Expenditures. The Review of Economics and Statistics, 95(1), 142-153.

Truffer, C. J., Keehan, S., Smith, S., Cylus, J., Sisko, A., Poisal, J. A., ...& Clemens, M. K. (2010). Health spending projections through 2019: the recession’s impact continues. Health Affairs, 10-1377

(24)

Bijlage

Table 5: Resultaten OLS regressies per jaar Tabel 5.1 Jaar 1 (2000) Schatting SE p-waarde Constante 1.02 0.12 0.00 Log(inkomen) -0.04 0.01 0.00 Verzekering 1.73 0.06 0.00 Leeftijd 0.03 0.00 0.00 Jaren scholing 0.10 0.01 0.00 Blank 0.43 0.23 0.07 Getrouwd 0.11 0.05 0.01 Dokters bezoeken 0.10 0.00 0.00 Aantal aandoeningen 0.80 0.03 0.00 Roker -0.14 0.05 0.01 R2 0.32 Tabel 5.2 Jaar 2 (2004) Schatting SE p-waarde Constante 0.34 0.11 0.00 Log(inkomen) -0.02 0.01 0.01 Verzekering 2.21 0.05 0.00 Leeftijd 0.03 0.00 0.00 Jaren scholing 0.11 0.01 0.00 Blank 0.27 0.05 0.00 Getrouwd 0.05 0.04 0.24 Dokters bezoeken 0.09 0.00 0.00 Aantal aandoeningen 0.77 0.02 0.00 Roker 0.00 0.05 0.94 R2 0.39

(25)

Tabel 5.3 Jaar 3 (2008) Schatting SE p-waarde Constante 0.46 0.12 0.00 Log(inkomen) -0.03 0.01 0.00 Verzekering 2.07 0.05 0.00 Leeftijd 0.03 0.00 0.00 Jaren scholing 0.11 0.01 0.00 Blank 0.34 0.04 0.00 Getrouwd 0.11 0.04 0.01 Dokters bezoeken 0.09 0.00 0.00 Aantal aandoeningen 0.69 0.02 0.00 Roker -0.17 0.05 0.00 R2 0.38 Tabel 5.4 Jaar 4 (2012) Schatting SE p-waarde Constante 0.20 0.17 0.24 Log(inkomen) -0.02 0.01 0.02 Verzekering 2.34 0.07 0.00 Leeftijd 0.03 0.00 0.00 Jaren scholing 0.10 0.01 0.00 Blank 0.46 0.06 0.00 Getrouwd 0.01 0.06 0.92 Dokters bezoeken 0.10 0.00 0.00 Aantal aandoeningen 0.73 0.03 0.00 Roker -0.11 0.07 0.13 R2 0.40

Referenties

GERELATEERDE DOCUMENTEN

Concluderend kan worden gesteld dat de afstemming van analyse resultaten tussen laboratoria is te verbeteren en dat het werken met een vaste fac- tor voor bilirubine is te

(Here we equip R n×n with an arbitrary norm.) (ii) Calculate the derivative of the map (1).. Remark: In this problem you may not use smoothness of a map that is given by an

You are not allowed to use books, calculators, or lecture notes, but you may use 1 sheet of handwritten personal notes (A4, both sides).. Unless otherwise stated, you may use

Het college WISB212 werd in 2006-2007 gegeven door Dr.J.A.C.Kolk.. Analyse in Meer Variabelen

Indien u een bepaald onderdeel niet of slechts ten dele kunt maken, mag u de resultaten daaruit gebruiken bij het maken van de volgende onderdelen.. Raak dus niet ontmoedigd indien

Indien u een bepaald onderdeel niet of slechts ten dele kunt maken, mag u de resultaten daaruit gebruiken bij het maken van de volgende onderdelen.. • Bij dit tentamen mogen

Indien u een bepaald onderdeel niet of slechts ten dele kunt maken, mag u de resultaten daaruit gebruiken bij het maken van de volgende onderdelen.. • Bij dit tentamen mogen

• Zet NIET meer vraagstukken tegelijk op één blad, want de vraagstukken worden afzonderlijk nagekeken door verschillende correctoren.. • De verschillende onderdelen van de