• No results found

Kosten-utiliteitsanalyse

Afbakening van het basispakket

4.4 Kosten-utiliteitsanalyse

De meest aanbevolen vorm van economische evaluatie is de kosten- utiliteitsanalyse, waarin de gezondheidswinst wordt uitgedrukt in ‘quality adjusted life years’ (QALYs), dus voor kwaliteit gecorrigeerde levensjaren. Deze analyse wordt ook als preferent aangeduid in de farmaco-economische richtlijnen van het CVZ. De effecten van behan- delingen worden uitgedrukt in gewonnen QALYs, die zowel levensver- lening kunnen meten als een verbetering in de kwaliteit van leven. Een groot voordeel van deze QALY-winsten is dat ze gezondheidswinsten van verschillende interventies (bijvoorbeeld borstkankerscreening en cholesterolverlagers) vergelijkbaar maken, waardoor een integrale afwe- ging kan plaatsvinden over alle verschillende gezondheidsinterventies. Een vraag is uiteraard hoe de omvang van een gezondheidswinst precies te bepalen valt in termen van QALYs. Daartoe bestaan verschillende methoden. Deze methoden worden normaal gesproken gebruikt om een gezondheidstoestand te waarderen op een schaal van 0 (dood) tot 1 (per- fect gezond).4Wanneer een bepaalde gezondheidstoestand bijvoorbeeld

0,6 scoort op deze schaal (zie hieronder hoe dat valt vast te stellen) en iemand kan door middel van een eenmalige interventie weer perfect gezond worden, dan wint die persoon 0,4 QALYs per jaar dat hij profijt heeft van de interventie. De QALY winst wordt dan dus berekend door de QALY waarde van de oude gezondheidstoestand af te trekken van de QALY waarde van de nieuwe gezondheidstoestand. Voor de totale winst moet dit verschil worden vermenigvuldigd met het aantal jaar dat een persoon profijt heeft van de interventie.

Om gezondheidstoestanden te waarderen moet allereerst worden bepaald wie deze gezondheidstoestanden zou moeten waarderen. Een logisch antwoord zou wellicht zijn de patiënten die zich in die toestand bevinden, maar dat blijkt in de praktijk geen goede bron. Een reden hiervoor is dat patiënten zich aanpassen aan en instellen op de nieuwe gezondheidstoestand (fysiek en zeker ook mentaal) en daardoor vaak een hogere waardering toekennen aan slechtere gezondheidstoestanden dan mensen die niet in die situatie verkeren. Hierdoor wordt de te behalen winst uiteraard kleiner. Vaak wordt derhalve gekozen voor waarderingen door een representatief panel uit de algemene bevolking (het generale publiek). Dit past bij de gedachte dat men een afweging maakt m.b.t. verzekering voor dat ziekte intreedt (Busschbach, 2000). Om de waarderingen van gezondheidstoestanden vast te stellen bestaan drie belangrijke methoden. Allereerst is er de Standard Gamble methode. Deze methode is sterk gerelateerd aan de economische theorie van ver- wacht nut (expected utility) en werd dan ook lang gezien als de gouden standaard voor gezondheidsstaat waarderingen. In deze methode wordt

normaal gesproken respondenten gevraagd een afweging te maken tussen het leven in een imperfecte gezondheidstoestand x en een alternatief. Het alternatief bestaat uit de kans om weer helemaal gezond te worden en een kans (p) meteen te sterven. Dus bijvoorbeeld: u heeft een dwarslaesie en bent hierdoor volledig verlamd vanaf uw middel. U kunt een operatie ondergaan die u volledig zal genezen of u zult tijdens deze operatie overlij- den. Vervolgens wordt aan mensen gevraagd hoe groot de kans op onmid- dellijk overlijden mag zijn om toch nog te kiezen voor het alternatief (de operatie). Het idee is dat deze kans (p) groter mag zijn, naarmate de te waarderen toestand erger is. De waarde van de gezondheidstoestand op de schaal van 0 tot 1 is dan 1-p. Dus als de kans op direct overlijden 20% mag bedragen, wordt de gezondheidstoestand gewaardeerd als (1 - 0,2 =) 0,8. Aangezien de SG vaak tot hoge waarderingen leidt en in toenemende mate werd getwijfeld aan de SG als zijnde de gouden standaard, werden er ook alternatieve methoden ontwikkeld. Het meest belangrijke instrument op dit moment is de time trade-off methode (TTO) (Dolan et al., 1996). Hierin wordt mensen gevraagd om levensjaren in te ruilen om gezondheid te winnen. Mensen wordt gevraagd zich voor te stellen nog 10 jaar te leven in een imperfecte gezondheidstoestand x. Vervolgens wordt gevraagd hoeveel jaren in perfecte gezondheid (H) men gelijkwaardig vindt aan 10 jaar in toestand x. Een voorbeeld is het volgende: stel u voor dat u nog 10 jaar te leven hebt terwijl u vanwege een dwarslaesie volledig verlamd bent vanaf uw middel. Hoeveel jaar in perfecte gezondheid vindt u gelijkwaar- dig aan 10 jaar in gezondheidstoestand x? Ook hierbij is het idee dat men- sen bereid zijn om meer levensjaren op te geven (dus een lagere hoeveel- heid jaar in perfecte gezondheid te accepteren) naarmate de te waarderen gezondheidstoestand erger is. Uit de antwoorden op TTO vragen kan ook een waardering voor de gezondheidstoestand worden afgeleid. Stel mensen vinden 5 jaar in perfecte gezondheid gelijk aan 10 jaar in toestand x, dan is de waardering van gezondheidstoestand x: 5/10 is 0,5.

Tenslotte is er de Visual Analogue Scale (VAS). Dit is eenvoudigweg een schaal van 0 tot 100 (waarbij 0 vaak staat voor dood of de slechtst denkbare gezondheidstoestand) waarop mensen gezondheidstoestanden kunnen inschalen. Een voorbeeld volgt hieronder (o.b.v. Sendi and Brouwer, in press):

Dood of Perfecte of

slechtst denkbare best denkbare

gezondheids- gezondheids-

toestand 0 10 20 30 40 50 60 70 80 90 100 toestand

Op deze schaal kunnen mensen eenvoudigweg een bepaalde gezond- heidstoestand waarderen, door een streepje te plaatsen bij de waarde die zij die toestand geven. Naarmate de toestand slechter is, zal men verder naar links op de schaal bewegen (dichter naar dood of slechtst denkbare

toestand). Wanneer mensen een waardering aangeven van bijvoorbeeld 60 voor een bepaalde toestand, dan is daarmee meteen de waardering duidelijk (hetgeen correspondeert met 0,6 op een schaal van 0 tot 1 uiteraard). Een voordeel van deze methode is dat het betrekkelijk een- voudig is voor respondenten. Een van de nadelen is dat respondenten geen afweging hoeven te maken (niet iets hoeven uit te ruilen zoals bij SG en TTO wel het geval).

Op dit moment wordt de TTO methode het meest gebruikt en in Nederlands onderzoek wordt ook veelal gebruik gemaakt van uniforme gezondheidsstaat waarderingen (de zogenaamde MVH_A1 scores) die op basis van de TTO techniek in Engeland zijn vastgesteld (Dolan, 1997). Ook vindt er onderzoek plaats naar mogelijke verklaringen voor verschillen in uitkomsten tussen methoden (zie bijvoorbeeld Bleichrodt, 2002 en Dolan et al., 1996).

In feite vormt de kosten-utiliteitsanalyse (KUA) een tussenvorm tussen de kosten-baten analyse en de kosten-effectiviteitsanalyse. De uitkom- sten in KUAs zijn wel vergelijkbaar en gebaseerd op preferenties net als in KBA, en ze staan relatief dicht bij de klinische praktijk, zoals de uitkomsten in KEAs. Alhoewel sommige economen een brug proberen te slaan tussen KBA en KUA (zie bijvoorbeeld Hansen et al., 2004, Bala et al., 2002, Bleichrodt & Quiggin, 1999) achten anderen KUA en KBA fundamenteel verschillend (zie bijvoorbeeld Brouwer & Koopmanschap, 2000 en Dolan & Edlin, 2003). Een groot voordeel van KUAs is dat er geen expliciete waarde hoeft te worden gegeven voor leven en gezond- heid. Dat betekent echter niet dat er geen impliciete waarde aan wordt gehecht. Immers, als een bepaalde medicijn voor 10.000 euro een QALY kan winnen, moet er een afweging plaatsvinden of vergoeding zou moe- ten plaatsvinden, binnen het raamwerk van alle overige criteria. In de volgende paragraaf gaan wij dan ook nader in op de vraag wanneer een interventie als doelmatig kan worden aangemerkt.

Tot slot van deze paragraaf dient nog te worden opgemerkt dat ook in termen van hoe doelmatigheid dient te worden vastgesteld en de vele methodologische en normatieve keuzen die daarbij dienen te worden gemaakt, er nog veel te verbeteren en te onderzoeken valt. Een belang- rijk voorbeeld, ook in het kader van vraagsturing, is bijvoorbeeld dat het proces van zorg in economische evaluaties veelal buiten beschouwing blijft en alleen uitkomsten worden meegenomen in de analyse. Een ver- dere bespreking van dergelijke beperkingen en overwegingen valt buiten het kader van deze achtergrondstudie, maar het is goed hiervan nota te nemen. Doelmatigheidsinformatie is slechts één relevant besliscriterium en de kwaliteit daarvan zou nog kunnen worden verbeterd. Anderzijds zou verdedigd kunnen worden dat van de te beschouwen besliscriteria die met betrekking tot doelmatigheid het beste geoperationaliseerd is.

5 Wanneer is iets doelmatig?

Wanneer er informatie beschikbaar komt over de doelmatigheid van een bepaald programma, is het uiteraard de bedoeling dat deze informatie kan bijdragen aan uiteindelijke besluitvorming. Alhoewel doelmatigheid slechts een van de criteria is in de besluitvorming, kan men zich afvragen wanneer een bepaalde interventie aan de doelmatigheidseis heeft vol- daan. In deze paragraaf zullen we eerst de situatie bezien waarin wordt verondersteld dat alleen doelmatigheidsinformatie van belang is. Dat betekent ook dat we er allereerst vanuit gaan dat het doel van besluitvor- mers is gezondheid te maximeren en dat de uitkomsten in de verschillen- de evaluatietypen (gezondheidseffecten, QALYs of monetaire baten) de te behalen gezondheidswinst uitdrukken. Vervolgens wordt nader ingegaan op de waarde van leven en de waarde van QALYs. Daarna wordt aange- geven hoe doelmatigheid moet worden bezien in combinatie met andere criteria, hetgeen voor de afbakening van het pakket uitermate belangrijk is. Daarbij wordt ook gekeken naar ervaringen in andere landen.

5.1 Wanneer is iets doelmatig?

De vraag wanneer iets doelmatig is kan op verschillende wijzen worden beantwoord. In een kostenminimalisatie analyse wordt uitgegaan van een gelijke effectiviteit bij de te onderzoeken interventies en is de meest goedkope variant daarmee het meest doelmatig. Die behaalt immers dat gelijke effect (het doel) met een zo matig mogelijk gebruik van middelen. Impliciet is daarmee de kosteneffectiviteitsratio van de goedkoopste variant het meest gunstig. Wat men echter in een kosten- minimalisatie studie niet doet is de afweging maken of de behaalde effecten wel opwegen tegen de gemaakte kosten. Dat is in de andere evaluatietypen wel het geval.

In een kosten-baten analyse komt dit het best tot uiting. Aan de ene kant zijn er de monetaire verliezen (kosten) die moeten worden gemaakt om monetaire baten (winsten) te genereren. In theorie is het zo dat de welvaart wordt vergroot wanneer de opbrengsten de kosten overstijgen. Elk programma met een positieve balans zou dan ook voor implementa- tie in aanmerking kunnen komen. De afweging tussen kosten en effecten is in een kosten-baten analyse dan ook relatief eenvoudig, aangezien er een directe verhouding tussen twee (ogenschijnlijk) gelijke eenheden uit de analyse naar voren komt. Toch zijn een paar kanttekeningen op zijn plaats. Allereerst kunnen er meer zorgprogramma’s zijn met een positieve balans tussen kosten en effecten dan gefinancierd kunnen worden uit het budget. In dat geval moet men die programma’s prioriteit geven die het meest opleveren per geïnvesteerde euro. Die bereiken dan immers een

zo groot mogelijk effect met de beschikbare middelen. Tenzij men het hele basispakket doorlicht (hetgeen ondoenlijk is) zal men voor nieuwe interventies dus moeten vaststellen welke kosten-baten ratio als accep- tabel wordt geacht. Daarbij moet men zich ook realiseren dat de kosten vaak een hard karakter hebben (werkelijke financieel voelbare kosten), terwijl de opbrengsten een zachter karakter hebben (een monetaire inschatting van de gezondheidswinsten). Ook kan (en zal) er een verschil zijn tussen de betalers en de ontvangers. Dat is relevant omdat bekend is dat de waarde van een euro (in welvaartstermen) kan verschillen tussen bijvoorbeeld inkomensgroepen. In dat geval is een simpele vergelijking van opbrengsten en kosten ook welvaartstheoretisch twijfelachtig (zie bijvoorbeeld Hammond, 1991). In dat kader is het ook relevant aan te geven dat in economische evaluaties normaal gesproken wordt uitgegaan van een maatschappelijk perspectief. Dat houdt in dat de individuele waarderingen van bijvoorbeeld gezondheidswinsten wellicht niet altijd maatgevend hoeven te zijn in besluitvorming. Immers, individuele waarderingen worden gevormd vanuit een individueel perspectief terwijl vanuit een maatschappelijk oogpunt ook andere overwegingen een rol spelen. Zo geven bijvoorbeeld Bleichrodt en Quiggin (1999) aan dat de bereidheid om te betalen voor gezondheidswinsten naar oneindig neigt wanneer de kwaliteit van leven naar 0 (dood) neigt. Dat is vanuit een individueel perspectief wellicht goed invoelbaar - men heeft er alles voor over om niet te sterven - maar vanuit een maatschappelijk perspectief is het onwaarschijnlijk dat men oneindig veel geld zou willen aanwenden voor de afwending van sterfte (alhoewel misschien wel relatief veel, zie onder), aangezien daarmee andere zorginterventies niet zouden kunnen worden gefinancierd. Tenslotte is in ieder geval nodig voor een kosten- baten analyse dat er aan levensjaren en gezondheidswinst een (betrouw- bare) monetaire waardering kan worden verbonden. Of dat kan, en welke waarde daarbij wordt voorgestaan, wordt later in deze paragraaf besproken.

In een kosten-utiliteits analyse worden de opbrengsten uitgedrukt in QALYs. De uitkomst van de studie zijn dan de kosten per QALY. Het mag duidelijk zijn dat naarmate de kosten per QALY lager zijn het pro- gramma doelmatiger is, ceteris paribus. Wanneer het basispakket volledig zou worden doorgelicht kan dus een rangorde worden gemaakt (con- form tabel 1) van programma’s op basis van hun doelmatigheid. Echter, meestal zal bij pakketbeslissingen geen integrale afweging plaatsvinden, waarbij het hele pakket wordt doorgelicht en ook niet bij het toelaten van een meer doelmatig programma een minder doelmatig programma uit het pakket worden gehaald. In dat geval moet er dus worden bepaald wanneer een programma doelmatig genoeg is om tot het pakket te wor- den toegelaten. Dat houdt in dat er een maximale kosten-per-QALY grens dient te worden vastgesteld, waarboven een programma niet mag komen om nog doelmatig bevonden te worden. In feite, zo zou men

kunnen stellen, wordt hiermee een verkapte vorm van een kosten-baten analyse geïntroduceerd. Er wordt een maximale bereidheid om te betalen voor een QALY gedefinieerd waarmee de kosten per QALY vervolgens kunnen worden vergeleken. Overigens is het ook hier goed om aan te geven dat er een verschil kan zijn tussen de waarde van een QALY zoals bijvoorbeeld het generale publiek die aangeeft en de bereidheid om te betalen voor QALYs in een maatschappelijke context. Bij het laatste zal ook impliciet rekening worden gehouden met andere programma’s en het budget, net zoals ook bij in het kader van kosten-baten analyses werd opgemerkt dat niet alle programma’ s met een positieve balans kunnen worden geïmplementeerd. Wel is weer de vraag hoe deze grenswaarde moet worden bepaald en welke grenswaarden er in de praktijk worden gehanteerd. Daarop wordt in de volgende sectie nader ingegaan. Tenslotte is er de kosteneffectiviteitsanalyse. In deze analyse worden de kosten vergeleken met uitkomsten in natuurlijke eenheden die niet vergelijkbaar zijn tussen verschillende interventies. Zelfs een op het eer- ste oog vergelijkbare maat als gewonnen levensjaren is onvergelijkbaar, omdat de ene interventie ervoor zorgt dat deze levensjaren in perfecte gezondheid kunnen worden doorgebracht, terwijl de gewonnen levens- jaren in een andere situatie in een veel minder gunstige toestand worden doorgebracht. Uiteraard is de gezondheidswinst in het eerste geval groter (uitgaande van dezelfde uitgangssituatie) en daarmee ook de waarde het programma. In feite moet in het kader van kosten-effectiviteitsanalyse dan ook per programma worden bezien welke grenswaarde voor de gepresenteerde kosten-effectiviteitsratio juist zou zijn. Dat is ook een reden waarom de voorkeur wordt gegeven aan kosten-utiliteitsanalyses. We zullen hieronder dan ook niet nader ingaan op afkapwaarden bij kos- ten-effectiviteitsanalyses, omdat dat naar onze mening weinig zinvol is.

5.2 De waarde van leven, de waarde van QALYs

Zoals hierboven aangegeven is het nodig voor de uiteindelijke afweging of iets doelmatig genoeg is om te worden vergoed dat de waarde van gezondheid en leven en de grenswaarde voor QALYs worden bepaald. In deze sectie zullen we kort stilstaan bij de vraag welke waarden er uit de literatuur naar voren komen en met name bij de vraag hoe men in verschillende landen omgaat met afkapwaarden voor QALYs. Daarbij is het belangrijk op voorhand een onderscheid te maken tussen verschillende soorten van waarden.

Allereerst zullen we ingaan op literatuur die tracht de waarde van een statistical life in kaart te brengen. In dat type onderzoek wordt getracht aan de hand van trade-offs tussen geld en overlijdensrisico’s de waarde van statistische levens vast te stellen. De term statistisch leven wordt

hierbij gehanteerd om aan te geven dat het hier risicoreducties betreft waardoor weliswaar gegeven een bepaalde kansverdeling levens zullen worden gered in een grote groep, maar waarvan op voorhand niet duidelijk wie er worden gered. Dit geeft meteen aan dat de context van dergelijke waardebepalingen fundamenteel anders is dan bijvoorbeeld in de curatieve zorg, maar wel overeenkomsten vertoont met preventieve zorg. Deze methode wordt ook in andere sectoren wel gebruikt, zoals in de transportsector (zie bijvoorbeeld www.swov.nl).

In de literatuur wordt er redelijk veel aandacht besteed aan de bepaling van de waarde van een statistisch leven. Op eenzelfde wijze kan de waar- de van (vermeden) letsel worden bepaald. Een belangrijke bron voor een overzicht van empirische gegevens op dit terrein is een recente kritische review van de literatuur door onder andere een pionier op dit gebied, Kip Viscusi (Viscusi en Aldy, 2003). Daarin worden meer dan 60 studies die overlijdensrisico’s bestuderen (en dus de waarde van een statistisch leven bepalen) besproken en zo’n 40 studies die ingaan op de waarde van letselschade. Op basis van arbeidsmarktdata uit de Verenigde Staten komt men op een range voor de waarde van een statistisch leven van zo’n $4 tot $9 miljoen, met een mediane waarde van $7 miljoen. De waarde van statistisch letsel varieert ook sterk, afhankelijk van de gebruikte risicomaat en of er ook een overlijdensrisico werd meegenomen, maar werd veelal tussen de $20.000 en $70.000 geschat. Viscusi en Aldy geven verder aan dat de waarde van een statistisch leven wordt beïnvloed door het inkomensniveau en dat de inkomenselasticiteit wordt geschat op 0,5 tot 0,6. Lidmaatschap van een vakbond heeft ook invloed op de geschatte waarde van een statistisch leven, aangezien door vakbonden effectiever hogere lonen voor risico-beroepen kunnen worden bedongen. Het is ook te verwachten dat leeftijd een invloed heeft op de waarde van leven, al was het alleen maar omdat een jonger iemand meer levensjaren te winnen heeft. Rosen (1988) berekend dat voor een persoon met een gemiddelde leeftijd de waarde voor een statistisch levensjaar in de range valt van $31.000 tot $130.000 euro. Op basis van levensverwachting vindt Rosen verder dat de waarde van een statistisch leven voor iemand van 48 jaar ongeveer 10% lager ligt dan die van iemand van 36 jaar. Ook in de Nederlandse context is wel dergelijk onderzoek verricht. Uit beloningsverschillen tussen gevaarlijke en minder gevaarlijke beroepen is een aantal jaren geleden voor Nederland becijferd dat een mensenleven gewaardeerd wordt op ca. 5 miljoen gulden. Op basis hiervan kwam men tot een waarde van een QALY van rond de 73.000 Euro (Bomhoff, 2000).

Vicusi en Aldy (2003) geven aan dat er een verschil bestaat tussen afge- leide waarden voor verschillende vormen van overlijdensrisico’s. Zo vindt men een hogere waarde voor het vermijden van sterfte als gevolg van kanker dan voor het vermijden van sterfte als gevolg van ongelukken.

Dat betekent dat het niet meteen duidelijk is hoe deze zaken dienen te worden vertaald naar de zorgpraktijk. Daarbij moet ook worden bedacht dat de waarde van iets dat men heeft maar kan kwijtraken anders kan zijn dan de waarde van iets dat men kan terugkrijgen. Verliezen worden veelal zwaarder meegerekend dan winsten (Kahneman & Tversky, 1979). Wat betreft het gebruik van deze monetaire waarderingen zijn Viscusi en Aldy (2003) redelijk optimistisch. Zij geven het voorbeeld uit de VS van wetgeving waarin risicovoorlichting werd geregeld. Door een te beperkte