• No results found

Waarmee vergelijken wij de te beoordelen interventie?

3 Werkwijze en uitgangspunten

3.1 Zoeken en selecteren van evidence en verdere informatie

3.1.2 Waarmee vergelijken wij de te beoordelen interventie?

3.1.2.1 Vergelijking met de standaard- of gebruikelijke behandeling

De te toetsen interventie beoordelen wij in principe in vergelijking met de op het moment van toetsing bestaande, meest toegepaste en beste interventie. Deze werkwijze sluit aan bij de internationale praktijk.68

De ‘meest toegepaste’ interventie is:

• de standaardbehandeling. Dit is de interventie die in de behandelpraktijk wordt gezien als behandeling van eerste keuze, de ‘gouden standaard’;

• de gebruikelijke behandeling (‘usual care’), indien geen standaardbehandeling kan worden vastgesteld.

68 Zie de EUnetHTA documenten:

- EUnetHTA. JA WP5: Relative effectiveness assessment (REA) of pharmaceuticals, July 2011.

- EUnetHTA. Guidelines: Endpoints used for relative effectiveness assessment of pharmaceuticals. Clinical endpoints. Composite endpoints. Surrogate endpoints. Comparators and comparisons: direct and indirect comparisons. Health-related quality of life and utility measures. February 2013. Beschik- baar via www.eunethta.eu/eunethta-guidelines.

In het EUnetHTA document over het kiezen van de comparator is een overzicht opgenomen van hoe een groot aantal Europese landen, Australië, Canada, Nieuw Zeeland en de VWS hiermee omgaan. De meeste landen houden als comparator aan ‘de op dit moment in de praktijk toegepaste behandeling’.

Actuele (inter)nationale richtlijnen en standaarden kunnen als bron dienen om vast te stellen welke interventie als comparator gekozen moet worden. Soms ontbreken die echter of het kan zijn dat zij geen uitsluitsel geven. Het is bijvoorbeeld lang niet altijd zo dat er maar één standaardbehandeling is voor een aandoening. Soms zijn meerdere interventies mogelijk, die onderling goed vergelijkbaar zijn qua uitkomsten.69 Wat de ‘usual care’ betreft, deze kan van land tot land of zelfs - binnen één land - van regio

tot regio verschillen. Verder kan ‘usual care’ er ook uit bestaan dat geen behandeling wordt geboden, maar dat geadviseerd wordt om (voorlopig) af te wachten of rust te houden. De ‘usual care’ kan ook bestaan uit verlichting van klachten, zoals bijvoorbeeld aan de orde is bij palliatieve zorg. Ook is het mogelijk dat tot dan toe geen alternatief beschikbaar is. In deze gevallen moet de te beoordelen (nieuwe) interventie vergeleken worden met ‘niets doen’ of ‘best ondersteunende zorg’.

De ‘beste’ comparator is bij voorkeur de interventie waarvan de effectiviteit (in voldoende mate) vaststaat. Soms kan het echter schorten aan bewijs voor de effectiviteit van de ‘meest toegepaste’ interventie. Bewijs van goede kwaliteit voor effectiviteit ontbreekt immers geregeld.

Het kiezen van een goede comparator is soms dus lastig, maar er zal toch altijd een keuze gemaakt moeten worden. Het ligt in de rede in dat geval een gemotiveerde, pragmatische benadering te volgen.70

Het is van belang om de beargumenteerde keuze af te stemmen met de relevante wetenschappelijke verenigingen van beroepsgroepen en patiëntenorganisaties.

Basis voor de beoordeling is de vergelijking met de standaard- of gebruikelijke behandeling. Het gaat er immers, zoals eerder gezegd, om wat de (nieuwe) interventie ‘netto’ toevoegt aan datgene wat in de praktijk al aan medische zorg voor de betreffende aandoening wordt geboden. Vooral bij studies over medicijnen vindt echter geregeld een andere vergelijking plaats, namelijk de vergelijking met het toedienen van een placebo (placebo-gecontroleerd onderzoek). Een dergelijk onderzoek kan bij de beoordeling een toegevoegde waarde hebben.

3.1.2.2 Vergelijking met placebo

Bij placebo-gecontroleerd medicijnonderzoek wordt de pil met de werkzame stof vergeleken met een pil zonder werkzame stof. Met dit onderzoek kan de werkzaamheid van de actieve stof sec worden vastgesteld en worden onderscheiden van een eventueel effect van het gebruiken van een pil op zich. Bijvoorbeeld: een placebo kan ook een positief effect hebben op een depressie en qua effect op één lijn te stellen zijn met een antidepressivum. De aandacht, het idee er zelf iets aan te kunnen doen door pillen te slikken, zou op zich – zonder dat er een werkzame stof nodig is - ook al kunnen helpen. Soms wordt in de chirurgie een ‘sham’ operatie gedaan (bijvoorbeeld een knie-arthroscopie): de patiënt krijgt wel een verdoving en een incisie, maar er vindt geen daadwerkelijke, actieve ingreep plaats.

69 Een voorbeeld hiervan is de lumbale HNP (hernia). Deze aandoening kan veel pijn in het been geven en kan soms zelfs invaliderend zijn. In het me- rendeel van de gevallen gaan deze klachten vanzelf weer over na enkele maanden, zonder specifieke behandeling. Met een operatie gaan de klachten ook over. Afhankelijk van de voorkeur van de patiënt kan gekozen worden voor directe operatie of enkele maanden afwachten. Iemand die een drukke baan of een druk gezin heeft, kan ervoor kiezen om toch meteen een operatie te ondergaan, daarbij de risico’s van een operatie op de koop toe nemend. De richtlijn HNP beveelt aan om afwachtend te zijn met operatie, tenzij er sprake is van ernstige/onhoudbare pijn of sensorische uitval. Dit is echter geen wet van meden en perzen. En wat is onhoudbaar: iemand met kleine kinderen thuis zal eerder over onhoudbaar spreken dan iemand zonder veel verplichtingen.

70 In de literatuur wordt het probleem dat bewijs van goede kwaliteit voor effectiviteit soms ontbreekt ook onderkend. Er wordt geadviseerd in die gevallen op pragmatische wijze te handelen. Zie EUnetHTA document: EUnetHTA. Guidelines: Endpoints used for relative effectiveness assessment of pharmaceuticals. Clinical endpoints. Composite endpoints. Surrogate endpoints. Comparators and comparisons: direct and indirect comparisons. Health-related quality of life and utility measures. February 2013. Beschikbaar via www.eunethta.eu/eunethta-guidelines.

De plaats van placebo-gecontroleerd onderzoek is bepaald in de Verklaring van Helsinki en gaat uit van: ‘geen placebo-gecontroleerd onderzoek, tenzij’.71 In de volgende situaties kan het gebruik van placebo-

gecontroleerd onderzoek worden overwogen:72

• als er geen effectieve interventie bestaat;

• als in de studie een add-on interventie wordt onderzocht (nieuwe interventie toegevoegd aan standaardzorg versus placebo toegevoegd aan standaardzorg);

• als er geen, of minimale, nadelige gevolgen zijn van het onthouden/uitstellen van de gebruikelijke behandeling (denk bijvoorbeeld aan een interventie tegen verkoudheid);

• als er zwaarwegende redenen zijn om een placebo-controle te gebruiken, én er geen grote kans op schade bestaat bij deelnemers aan de studie (bij hoge kans op placebo-effect, bijvoorbeeld pijnstillers, acupunctuur, of bij een chronische aandoening met een sterk fluctuerend verloop).

Het kan in sommige gevallen toegestaan en ook zinvol zijn om (aanvullend) placebo-gecontroleerd onderzoek te doen, bijvoorbeeld als de effectiviteit van de bestaande behandeling (waarmee eigenlijk vergeleken moet worden) onvoldoende vaststaat. Het zou dan kunnen zijn dat het effect van de interventie in werkelijkheid een placebo-effect is. Een voorbeeld hiervan is de ‘sham’ arthroscopie bij knie-arthrose of degeneratief meniscusletsel (zie het kader).

Arthroscopie versus sham: geen verschil in effect

Moseley et al73 onderzochten het effect van aan arthroscopie met débridement of lavage ten opzichte

van een sham-procedure bij patiënten met slijtage van de knie. De sham procedure bestond uit het maken van uitsluitend de huid-incisies. De arthroscoop werd niet in het kniegewricht geïntroduceerd. De resultaten in de groepen (na de echte scopie en na de sham-procedure) waren niet verschillend van elkaar over een totale follow-up periode van twee jaar. De uitkomstmaten waren zowel subjectief (door de patiënt gerapporteerde pijn- en functiescores) als objectief (tijdsduur van een bepaalde loopafstand en van traplopen). Deze studie liet zien dat een algemeen geaccepteerde en op grote schaal uitgevoerde behandeling geen voordelen biedt boven een placebo-procedure.

Recent nog werd een dergelijke placebo-gecontroleerde studie ook uitgevoerd om te kijken naar de effectiviteit van een arthroscopische partiële meniscectomie. Ook in deze studie werd geen verschil gezien in effectiviteit na de werkelijke ingreep en na de sham-procedure.74

Ook uit een ander, recent voorbeeld blijkt de toegevoegde waarde van een placebo-gecontroleerde studie (zie het kader).

Rofecoxib met placebo: rofecoxib geeft verhoogde kans op infarct

Het gaat hier om rofecoxib (Vioxx), een pijnstiller, o.a. toegepast bij gewrichtsklachten. Vergeleken met naproxen leidde rofecoxib tot meer kans op hartinfarcten. Het was echter niet duidelijk of dit verschil gevolg was van een beschermend effect van naproxen, of van een werkelijk verhoogde kans door rofecoxib. Pas uit een latere, placebogecontroleerde studie bleek dat het werkelijk ging om een verhoogde kans op infarct door de rofecoxib. Eerst na afronding van deze studie werd rofecoxib uit de handel genomen.75

Het komt erop neer dat als uitgangspunt geldt dat wij altijd de effectiviteit van een (nieuwe) interventie vergelijken met de bestaande, meest toegepaste en beste interventie (relative/ comparative

effectiveness). De keus van de comparator dient goed beargumenteerd te zijn. In sommige gevallen kan placebo-gecontroleerd onderzoek extra (nuttige) informatie opleveren. Dit zal van geval tot geval 71 World Medical Association. Declaration of Helsinki - Ethical Principles for Medical Research Involving Human Subjects. 2013. Beschikbaar via www.

wma.net.

72 Millum J, Grady C. The ethics of placebo-controlled trials: methodological justifications. Contemp Clin Trials 2013; 36:510-4.

73 Moseley JB, O’Malley K, Petersen NJ, et al. A controlled trial of arthroscopic surgery for osteoarthritis of the knee. N Engl J Med 2002;347:81-8. 74 Sihvonen R, Paavola M, Malmivaara A, et al. Arthroscopic partial meniscectomy versus sham surgery for a degenerative meniscal tear. N Engl J Med

2013;369:2515-24.

beoordeeld moeten worden. Als er placebo-gecontroleerd onderzoek beschikbaar is, betrekken wij dit bij onze beoordeling.

3.1.2.3 Directe en indirecte vergelijkingen

Idealiter zou je de te beoordelen interventie en de comparator voor één aandoening direct met elkaar willen vergelijken in een gerandomiseerde gecontroleerde studie (RCT). Op deze manier kan het meest betrouwbare bewijs worden geleverd voor de waarde van een bepaalde interventie ten opzichte van de controle-interventie.76 Deze ideale situatie doet zich lang niet altijd voor. De vraag is of er ook gebruik

gemaakt kan worden van zogenoemde indirecte vergelijkingen. Dat is de situatie waarin resultaten van studie-armen uit verschillende onderzoeken met elkaar worden vergeleken. Bijvoorbeeld: interventie A is in RCT X vergeleken met interventie B. Interventie C is in RCT Y vergeleken met interventie B. Door middel van een indirecte vergelijking kan men ook interventie A met interventie C vergelijken.

Directe vergelijking in RCT X: A versus B Directe vergelijking in RCT Y: C versus B Indirecte vergelijking: A versus C.

Met behulp van indirecte vergelijkingen kan het tekort aan directe vergelijkingen worden

gecompenseerd, of kan het bewijs afkomstig uit directe vergelijkingen worden aangevuld/versterkt. Echter, dit kan niet zomaar: als studies niet goed vergelijkbaar zijn is het risico van vertekening en daarmee het risico dat de conclusies minder geloofwaardig zijn, zeker aanwezig. De vergelijkbaarheid betreft verschillende aspecten, zoals klinische aspecten (waaronder patiëntkenmerken, interventie, studiecontext, follow-up, uitkomstmaten) en methodologische aspecten (waaronder studie-opzet, data- analyse).

Ter toelichting hiervan geven wij enkele voorbeelden (zie het kader). Indirecte vergelijking niet zonder meer mogelijk

Als in RCT X middel A wordt onderzocht in patiënten met hypertensie, bestaande uit 20- tot 50-jarigen zonder co-morbiditeit, en in RCT Y middel B in patiënten met dezelfde mate van hypertensie,

maar bestaande uit 60-plussers met overgewicht, dan zijn de groepen niet vergelijkbaar en is een indirecte vergelijking (A versus B) niet betrouwbaar. Als de uitkomstmaat in RCT X is gemeten d.m.v. een éénmalige meting van de bloeddruk en in RCT Y d.m.v. een 24-uurs bloeddrukmeting, is deze evenmin vergelijkbaar en is een indirecte vergelijking dus niet betrouwbaar. Ook de dosering van een interventie kan verschillen, of de toepassing, zoals de mate van ervaring van een chirurg. Als de studieresultaten op verschillende manieren zijn geanalyseerd kan evenmin zonder meer indirect vergeleken worden.

Voor het uitvoeren van indirecte vergelijkingen is een aantal methodieken gangbaar. In grote lijnen gaat het om het volgende:

• De meest simpele manier om een indirecte vergelijking uit te voeren is door het vergelijken van de resultaten uit twee verschillende studies, uit twee verschillende meta-analyses of van studie-armen uit verschillende onderzoeken met elkaar. Als niet duidelijk is waarin de groepen, de behandeling en de analyse van elkaar verschillen, zal een dergelijke ruwe indirecte vergelijking tot veel bias leiden en niet goed bruikbaar zijn.

• Een verbetering is een indirecte vergelijking van studie-armen waarbij de controle-arm hetzelfde is. Voorbeeld: A versus C en B versus C gebruiken we om indirect A met B te vergelijken. Dit kan als gecheckt is of de studies vergelijkbaar zijn qua klinische en qua methodologische aspecten (zie boven). • Een geavanceerde methodiek is om directe en indirecte vergelijkingen met elkaar te combineren in

één analyse (mixed treatment comparisons, MTC; netwerk meta-analyse). Uitgangspunt is dat alle 76 De controle-interventie hoeft in een directe vergelijking overigens geen actieve interventie te zijn, het kan ook gaan om een placebo-behandeling of

om geen behandeling. Bij de beoordeling van geneesmiddelen wordt overigens de term ‘head-to-head comparison’ gebruikt voor vergelijking met de actieve interventie.

beschikbare behandelingen voor één indicatie in één grote analyse worden gestopt (een netwerk meta-analyse) en dat dan al deze behandelingen met elkaar worden vergeleken: direct en/of indirect. Daaruit volgt dan een rangorde van de verschillende behandelingen qua effectiviteit. De kwaliteit van dergelijke analyses, en daarmee de betrouwbaarheid, neemt toe naarmate de vergelijkbaarheid van de studies toeneemt.

EUnetHTA77 heeft onlangs een guideline gepubliceerd over directe en indirecte vergelijkingen waarin de

verschillende technieken kritisch worden besproken aan de hand van een aantal reviews. In de guideline staat een aantal aanbevelingen betreffende de bruikbaarheid van indirecte vergelijkingen.78 Dat geeft

een indruk van waar op gelet moet worden bij het beoordelen van indirecte vergelijkingen. Daarnaast is onlangs een mogelijke aanpak voorgesteld over hoe bij de toepassing van GRADE de kwaliteit van het bewijs uit netwerk meta-analyses gewaardeerd zou kunnen worden.79

Wat betekent een en ander voor onze toetsing van interventies aan ‘de stand van de wetenschap en praktijk’? Wij kunnen voor onze beoordelingen gebruik maken van gepubliceerde indirecte vergelijkingen, mits de auteurs de kans op bias en de betrouwbaarheid van de resultaten goed hebben ingeschat. De genoemde aanbevelingen in de EUnetHTA-guideline en wellicht ook de GRADE-aanpak kunnen behulpzaam zijn om ons over dit laatste een oordeel te vormen.