• No results found

SO-5 Kritisch lezen observationeel onderzoek

Diagnostisch en prognostisch onderzoek hebben vaak een observationele studieopzet. Over het algemeen is dat geen probleem. Anders wordt dat bij therapeutisch onderzoek. Hier wordt de

gerandomiseerde (en dubbel geblindeerde) trial als de beste studieopzet gezien. Door het randomiseren worden de patiënten willekeurig over de twee behandelingsgroepen verdeeld, en verschillen de twee behandelingsgroepen alleen door toevalsfluctuatie.

Dit is ook de reden dat je een klinische vraag vanuit een therapeutische CAT het liefst beantwoordt met de resultaten van gerandomiseerde studies. Maar niet altijd zijn er voldoende trials over een onderwerp uitgevoerd. Dan zul je evidence moeten halen uit observationeel onderzoek.

Bias en confounding

In het blok AWV-jaar 2 zijn de begrippen bias en confounding uitgebreid behandeld. Probeer in eigen woorden nog eens te formuleren wat onderstaande begrippen precies inhouden, en bedenk voor elk van de begrippen een voorbeeld

a. Confounding b. Selectiebias c. Informatiebias Voorbeelden

Hieronder staan een paar voorbeelden waarbij je moet bedenken of bias of confounding een rol kan spelen:

1. In een onderzoek naar lange termijneffecten (cognitief en neurologisch) van vroeggeboorte worden 150 veel te vroeg geboren kinderen op 4 jaar met MRI onderzocht. Elk kind wordt gevraagd om als controle een 4-jarig vriendje/vriendinnetje mee te nemen dat na 37 weken zwangerschap geboren is.

Dat kind wordt ook in MRI onderzocht.

a. Wat is de onderzoeksopzet? Follow-up/cohort of case-controle?

b. Wat is het voordeel van de gekozen “controlegroep”?

c. Denk je dat hier sprake kan zijn van informatiebias of selectiebias?

2. In een groot onderzoek zijn gegevens verzameld van alle in Nederland te vroeg geboren kinderen in een jaar. De selectiecriteria waren: kind levend ter wereld gekomen, een zwangerschapsduur van minder dan 32 weken en/of een geboortegewicht van minder dan 1500 gram.

Een van de vele vraagstellingen was de relatie tussen hypertensie moeder en aanwezigheid van (lichte of zware) handicaps bij het kind. Hiertoe werden standaarddefinities gebruikt en beide aspecten als

“ja/nee” gecodeerd. De kruistabel van hypertensie (ja/nee) versus gehandicapt (ja/nee) gaf een duidelijk lager percentage gehandicapte kinderen aan bij hypertensieve dan bij de niet-hypertensieve moeders. Het verschil was significant.

a. Is hiervoor een verklaring te geven?

b. Is hier sprake van bias of van confounding?

c. Betekent dit dat een aanstaande moeder het risico op een handicap van haar te baren kind kan verlagen door flink wat zoute drop tijdens de zwangerschap te eten?

d. Als je van mening bent dat deze associatie niet de klinische “werkelijkheid” weergeeft, hoe kan zo’n associatie dan voorkomen worden? In de opzet van de studie of in de analyse zelf?

e. Hoe kunnen we het “echte” effect van hypertensie op de kans op een handicap te weten komen?

3. Hieronder een figuur waar de relatie tussen chocoladeconsumptie en de kans op het winnen van een Nobelprijs uitgezet.

a. Is hiervoor een verklaring te geven?

b. Is hier sprake van bias of van confounding?

Omgaan met confounding in de analyse.

Wanneer je vermoedt dat er sprake is van bias of confounding in de studie die je aan het beoordelen bent, moet je kijken of (1) het aannemelijk is dat de resultaten van de studie vertekend zijn, en (2) of men geprobeerd heeft om correcties aan te brengen. Corrigeren voor selectiebias is vaak lastig of onmogelijk zijn. Correctie voor confounding kan op verschillende manieren:

1. stratificatie: de analyses worden apart gedaan in subgroepen met dezelfde confounderwaarden.

2. Matchen: er worden koppels gemaakt van mensen met dezelfde confounderwaarden, waarvan een iemand de uitkomst wel heeft en de andere niet, of een iemand de therapie wel heeft en de andere niet. Binnen die koppels worden vergelijkingen uitgevoerd.

3. Regressiemodellen. In een multivariaat regressiemodel kun je het effecten van meerdere factoren op een uitkomst modeleren.

In het artikel Nguyen CD, Andersson C, Jensen TB, et al. Statin treatment and risk of recurrent venous thromboembolism: a nationwide cohort study. BMJ Open 2013 wordt gekeken of het geven van statines aan patiënten met trombose een effect heeft op de kans op een recidief trombose. De studie is een prospectieve cohort studie. De patientenpopulatie bestaat uit alle personen (44 330 patiënten) met een ziekenhuisdiagnose van veneuze trombose in Denemarken in de periode 1997–2009. Het artikel is te vinden op http://bmjopen.bmj.com/content/3/11/e003135.full.pdf+html.

4. a. Bekijk de eerste tabel uit het artikel. Wat valt op?

b. Bekijk tabel 4 uit het artikel. De titel van de table is “HRs of venous thromboembolism associated with statin use.” Waar staat de afkorting HR voor?

c. Welke van de van de drie kolommen van resultaten zou je rapporteren in je CAT verslag?

d. Wat is de conclusie over het effect van statines op recidief trombose?

e. Welke kanttekeningen moeten er bij deze conclusie gemaakt worden?

SO-6 Prognostische indices

Niet elk individu heeft hetzelfde risico om een bepaalde ziekte te krijgen en niet elke patiënt heeft dezelfde prognose. Vaak wordt het risico op een bepaalde uitkomst vastgelegd in een risico score of een prognostische score. Voorbeelden van dit soort scores zijn de Apache scores die gebruikt worden om de prognose van patiënten op de intensive care unit in te schatten en de SCORE (Systematic Coronary Risk Evaluation), een risicoscore die het 10-jaars risico op hart en vaatziekten in de

huisartspraktijk schat. Dit soort scores worden vaak gemaakt met behulp van statistische modellen. In deze SO bekijken we twee van dit soort statistische modellen, het lineaire regressiemodel en het logistische regressiemodel.

Leerdoelen

Na afloop van het maken van deze SO

(1) Kun je voorspellingen maken op grond van een lineair en een logistisch regressie model (2) Weet je hoe de parameters in de modellen geïnterpreteerd worden, en kun je met behulp van de schattingen met bijbehorende 95% betrouwbaarheidsintervallen conclusies trekken

(3) Weet je het verschil tussen de univariate analyses en multivariate analyses

(4) ken je de verschillende redenen waarom regressiemodellen toegepast worden (voor predictie en om te corrigeren voor confounding)

We bekijken in deze opdracht gegevens van alle kinderen die in 2010 veel te vroeg geboren zijn (<32 weken zwangerschap). De gegevens komen uit de Perinatale Registratie Nederland.

I. Lineaire regressie

Hieronder zie je een plaatje waar de zwangerschapsduur is uitgezet tegen het geboortegewicht. Schat met het blote oog wat de vergelijking van de regressielijn is, die in het plaatje al getekend is.

Een regressieanalyse in SPSS geeft de volgende uitvoer:

b. Schrijf de bijbehorende regressievergelijking op. Kijk of deze redelijk overeenkomt met wat je in onderdeel a zelf geschat hebt.

c. Hoe interpreteer je de coëfficiënt 148.24 die bij amenorroe staat? En wat is de interpretatie van het 95% betrouwbaarheidsinterval (141.807, 154.676) dat bij deze coëfficiënt hoort?

Men voert een tweede regressieanalyse uit waarbij men naast de zwangerschapsduur ook het geslacht van het kind meeneemt. Geslacht is gecodeerd als 1 voor een jongen en 0 voor een meisje.

d. Wat is nu de regressievergelijking?

e. Hoe interpreteer je de coëfficiënt148.446 die bij amenorroe staat? Waarom is deze niet precies gelijk aan de 148.24 uit onderdeel c?

f. Hoe interpreteer je de coëfficiënt voor geslacht 109.702?

g. Voorspel het geboortegewicht van een jongen, en van een meisje dat na 30 weken zwangerschap geboren wordt.

h. Van de schatting van het gemiddelde geboortegewicht voor een jongen geboren na 30 weken zwangerschap is de standaardfout gelijk aan 9.1 gram. De standaarddeviatie is gelijk aan 277 gram.

Wat is het verschil tussen een standaardfout en een standaarddeviatie? Welk van de twee gebruik je om een interval met normaalwaarden te maken, een interval waar de geboortegewichten van 95 % van de jongens die na 30 weken geboren worden tussen vallen. Bereken dit interval.

II. Logistische regressie

We gaan nu kijken of het mogelijk is om te voorspellen hoe groot de kans is dat een pasgeboren premature baby binnen een week overlijdt. Omdat deze uitkomst binair is (1=overleden, 0=in leven), gebruiken we het logistische regressiemodel.

a. Van de 1703 kinderen die levend geboren zijn, zijn er 100 binnen een week overleden. Hieronder zie je de gegevens, uitgesplitst naar geslacht:

Overleden binnen 7 dagen Totaal

Geslacht Ja nee

Jongen 59 846 905

Meisje 41 757 798

totaal 1603 100 1703

Bereken het risico op overlijden voor jongens en meisje. Bereken ook het risicoverschil, het relatieve risico en de oddsratio voor jongens ten opzichte van meisjes.

b. Wanneer je een logistische regressie uitvoert met overlijden als uitkomst en geslacht als voorspeller krijg je de volgende output.

Bekijk de coëfficiënt voor geslacht. Controleer of deze gelijk is aan ln(OR), de natuurlijke logaritme van de oddsratio. Bekijk ook het 95% betrouwbaarheidsinterval voor de oddsratio. Wat is je conclusie over de relatie tussen geslacht en mortaliteit?

c. Men voert ook een logistische regressie uit met zwangerschapsduur als voorspeller. Dat geeft als uitvoer:

Wat is de interpretatie van de exp(B) =0.631? En wat impliceert een negatieve regressiecoëfficiënt voor zwangerschapsduur ?

Bereken de kans op overlijden binnen 7 dagen voor een kind geboren na 25 weken

zwangerschapsduur. Doe hetzelfde na 28 en 32 weken en maak een plaatje met kans op sterfte op de y-as en zwangerschapsduur op de x-y-as.

d. Men besluit nu om een prognostisch model te maken met zwangerschapsduur en geslacht.

Wat is nu de interpretatie van de coëfficiënten? Hoe ziet het corresponderende model eruit? Bereken de geschatte kans op overlijden apart voor een jongen en meisje na 28 weken zwangerschap.

e. Uiteindelijk worden er ook een paar karakteristieken die direct bekend zijn na de geboorte

toegevoegd: de apgar score, de zwangerschapsduur, het geboortegewicht en of een kind een meerling is.

Dat geeft:

Wat kan een verklaring zijn voor het feit dat de coëfficiënt voor geslacht nu negatief is, en de corresponderende OR kleiner dan 1?

In het artikel A.C.J. Ravelli et al. European Journal of Obstetrics & Gynecology and Reproductive Biology 176 (2014) 126–131, wordt een prognostisch model voor sterfte binnen 28 dagen bij veel te vroeg geborenen ontwikkeld. Hierbij zie je de tabel van het logistische model uit dit artikel:

Vergelijk de coëfficiënten uit dit model met het prognostisch model uit opdracht IId en IIe. Zie je verschillen? Geef een verklaring.

Meer over lineaire en logistische regressie kun je vinden in:

Tripepi et al How to Deal with Continuous and Dichotomic Outcomes in Epidemiological Research:

Linear and Logistic Regression Analysis. Nephron Clin Pract 2011;118:c399–c406.

SO 7 Samenvatten van evidence. Meta analyse

Op Blackboard vind je artikelen van vier randomized clinical trials over het effect van statines op cardiovasculaire eindpunten. In deze opdracht bekijken we een van de eindpunten, namelijk sterfte aan kanker.

1. Om het bewijs uit de verschillende studies goed samen te vatten moet je per studie de

patientenpopulatie en de interventie en de controlebehandeling noteren (als uitkomst nemen we steeds sterfte aan kanker). Doe dit voor elk van deze vier studies. Wat valt op?

2. Haal uit elk van de vier artikelen het aantal patiënten in elke groep dat (a) dood ging aan kanker en (b) het aantal patiënten dat niet doodging aan kanker. Vul deze getallen in onderstaande tabel in.

Studie

Statine Placebo

Dood aan kanker

Niet-dood aan kanker

Dood aan kanker

Niet-dood aan kanker CARDS

PROSPER

HPS (=MRC/BHF) ASCOT

3. Er zijn verschillende effectmaten om een binaire uitkomst tussen twee groepen te vergelijken.

Bereken voor de eerste studie (CARDS):

a. het risicoverschil met 95% betrouwbaarheidsinterval. Gebruik hierbij dat de standaarderror van een risicoverschil gelijk is aan

, met n1 het totaal aantal mensen in groep 1 (statines) en n2 het totaal aantal mensen in groep 2 (niet statines). Wat concludeer je uit dit 95% betrouwbaarheidsinterval?

b. het aantal mensen dat behandeld moet worden om één sterfte geval te voorkomen (numbers needed to treat).

c. de oddsratio met 95% betrouwbaarheidsinterval. Omdat de oddsratio altijd groter dan 0 moet zijn is het lastig om direct een 95% betrouwbaarheidsinterval te maken. Daarom wordt eerst een betrouwbaarheidsinterval voor ln(OR) gemaakt, met ln de natuurlijke logarithme. Voor ln(OR) geldt dat de standaardfout : se( ln(OR)) gelijk is aan met a,b,c en d de vier cellen uit de 2 bij 2 tabel. Voor ln(OR) is het 95% CI gelijk aan

ln(OR) – 1.96*se(OR), ln(OR) +1.96*se(OR). Dat geeft voor ln(OR) een onder en bovengrens.

Voor de OR krijg je dan als betrouwbaarheidsinterval (exp(ondergrens), exp(bovengrens)), met exp(x) gelijk aan ex (e tot de macht x).

Bereken het interval. Wat is je conclusie?

4. Voor elk van de vier studies kun je op dezelfde manier een oddsratio berekenen met 95%

betrouwbaarheidsinterval. Hieronder is dat voor de andere drie studies gedaan (met excel, de excel sheet staat op Blackboard):

OR ln(OR) SE (ln(OR))

95% CI ln(OR)

95%CI OR CARDS

PROSPER 1,28 0,2505 0,1428 -0,03; 0,53 0,97;1.70

HPS (=MRC/BHF) 1,01 0,01456 0,0518 -0,09; 0,11 0,92;1,12

ASCOT 0,92 -0,0788 0,1555 -0,38;0,23 0,68;1,25

Wat zou je concluderen over de relatie tussen statinegebruik en sterfte aan kanker op grond van deze vier studies?

5. We gaan nu ook een formele meta-analyse uitvoeren. Hiervoor wordt het gemiddelde van de ln(OR)’s berekend. De gewichten hangen af van de standaardfouten van de schattingen en zijn gelijk aan W=1/SE2 . Bereken voor elke studie de W en het gewogen gemiddelde ln(OR). Transformeer deze waarde terug door eln(OR) uit te rekenen.

OR Ln(OR) SE

(ln(OR))

W W x

ln(OR) CARDS

PROSPER 1,28 0,2505 0,1428

HPS (=MRC/BHF) 1,01 0,0145 0,0518

ASCOT 0,92 -0,0788 0,155

6. Maak een forest plot en een funnel plot voor deze meta-analyse met 4 studies. Gebruik voor de y-as van de funnel plot het aantal patiënten in de trial.

7. Bekijk het artikel Statins and cancer risk JAMA 2006, dat ook op Blackboard staat. Komen de getallen uit figuur 3 overeen met de getallen uit de zojuist gemaakte spreadsheet? Wat concludeer je uit Figuur 3? Bekijk ook de forest en de funnelplot uit het artikel. Zijn er aanwijzingen voor

publicatiebias?

Beoordelingsformulier literatuuronderzoek