• No results found

De numerieke kwaliteit van statistische informatie

4.5 De helling van een regressierechte .1Probleemstelling

4.5.7 Aanbevelingen voor trendbepaling

Zoals hierboven reeds aangegeven, herformuleren we bovenstaande conclusies in termen van aanbeve-lingen voor trendbepaling, aangezien trendbepaling een veel voorkomende vraag is in heel wat natuur-en milieumeetnettnatuur-en. Wat we hier voorstellnatuur-en, is slechts enatuur-en eerste aanzet. Zo is het weinig realistisch te veronderstellen dat de waarnemingen in een tijdsreeks onderling niet gecorreleerd zijn. Het resultaat van het voorgaande jaar heeft immers vaak een invloed op het volgende jaar. Dergelijke autocorrelatie kan een fundamentele trend maskeren of juist versterken. Deze factor hebben we niet opgenomen in ons model en dat zal de vereiste steekproef verder opdrijven. Maar zelfs los van deze en andere overwegingen, verduidelijkt bovenstaande analyse al heel wat. De X-waarden stellen nu de punten in de tijd voor en ΔX is het tijdsbereik.

Een eerste belangrijke boodschap is dat het heel moeilijk is om in een korte tijdspanne een trend te detecteren.Uit (4.23) volgt dat een verdubbeling van het tijdsbereikΔX met hetzelfde aantal punten (dus met minder punten per tijdseenheid) hetzelfde effect heeft als een verviervoudiging van N maar binnen een gelijk tijdsbereik. Als we op een heel korte tijd een trend willen bepalen, dan moeten we de steekproefgrootte in belangrijke mate doen toenemen, wat wel eens in de praktijk niet haalbaar zou kunnen zijn. Daarenboven lopen we het risico dat we geen zicht krijgen op wat er aan de hand is omdat processen op een kortere tijdsschaal de langere termijn trend kunnen maskeren of versterken.

Een tweede punt is dat een planmatige aanpak heel veel voordelen heeft. Van meet af aan een duidelijke tijdshorizon uittekenen en hierbinnen op een uniforme wijze de metingen verdelen, is een mogelijk compromis om zowel de lineaire trend effici¨ent te bepalen alsook de mogelijkheid te hebben om eventuele afwijkingen van die trend te detecteren. Zonder een duidelijke tijdshorizon lopen we het gevaar de inspanningen niet goed te doseren, door bijvoorbeeld in het begin relatief meer te meten dan op het eind. Als we na verloop van tijd vaststellen dat we nog langer moeten meten terwijl de middelen daartoe ontbreken, zullen veel van de eerste inspanningen verloren gaan. Maar ook de omgekeerde redenering is mogelijk. Uit deze resultaten volgt evenzeer dat het een goede tactiek kan zijn om in het begin meer te meten, om zo snel mogelijk een beeld te hebben van de trend en dan in een later stadium met grotere intervallen te werken. Maar deze strategie moeten we wel op voorhand goed overdenken en begroten.

(1) Een voldoende analyse van het gegevensgebruik i.f.v. de beslissingsmomenten van het beleid en de informatiebehoeften van de andere doelgroepen.

(2) De productdifferentiatie is voldoende gemotiveerd en er is een visie ontwikkeld op de vorm-vereisten en de verspreiding van de eindproducten.

PROCESCRITERIA

(1) Een voldoende analyse van het gegevensgebruik i.f.v. de beslissingsmomenten van het beleid en de informatiebehoeften van de andere doelgroepen.

(2) De productdifferentiatie is voldoende gemotiveerd en er is een visie ontwikkeld op de vormvereisten en de verspreiding van de eindproducten.

FASE V:

Laatste voorbereidingen,

implementatie en

kwaliteitszorg

(1) Een voldoende analyse van het gegevensgebruik i.f.v. de beslissingsmomenten van het beleid en de informatiebehoeften van de andere doelgroepen.

(2) De productdifferentiatie is voldoende gemotiveerd en er is een visie ontwikkeld op de vorm-vereisten en de verspreiding van de eindproducten.

PROCESCRITERIA

(1) Een voldoende analyse van het gegevensgebruik i.f.v. de beslissingsmomenten van het beleid en de informatiebehoeften van de andere doelgroepen.

(2) De productdifferentiatie is voldoende gemotiveerd en er is een visie ontwikkeld op de vormvereisten en de verspreiding van de eindproducten.

Hoofdstuk 5:

Steekproefgrootteberekeningen

voor het toetsen van

5.1 Inleiding

In dit hoofdstuk behandelen we de bepaling van de vereiste steekproefgrootte voor het toetsen van statistische hypothesen. Een essenti¨ele stap bij het steekproefontwerp is het instellen van een aantal waarden: het kleinste relevante effect (verschil tussen de nulhypothese en de alternatieve hypothese) dat we willen detecteren, het significantieniveau en het onderscheidend vermogen. Dat werd reeds uitvoerig besproken in hoofdstuk 2, waar we benadrukten dat deze keuzes moeten gebaseerd zijn op de doelstellingen van het meetnet. We nemen hier aan dat deze instelwaardenzijn vastgelegd.

Naast de bepaling van de gewenste steekproefgrootte, benadrukken we het belang van andere facetten van het ontwerp. Een steekproefgrootteberekening is een middel om inzicht te krijgen in (het relatief belang van) de factoren die het onderscheidend vermogen bepalen. Deze informatie moeten we gebruiken om het steekproefontwerp verder te optimaliseren en eventueel bij te sturen. Want heel dikwijls blijkt dat we onvoldoende middelen hebben om aan de gewenste steekproefgrootte te voldoen. In dat geval is het nodig een stap terug te zetten om na te denken over eventuele alternatieven en/of de doelstellingen realistischer te maken.

We bespreken het onderscheidend vermogen voor enkele veel voorkomende statistische toetsen: t-toets voor ´e´en gemiddelde (verschilt het gemiddelde van een vooropgezette waarde), t-toets voor het verschil tussen twee onafhankelijke gemiddelden of voor gepaarde metingen (vergelijking van het gemiddelde van twee populaties), t-toets voor de helling van een regressierechte (controle voor een lineaire trend) en F -toets bij ANOVA (vergelijken van meerdere gemiddelden op basis van een variantieanalyse). Net zoals in het vorige hoofdstuk wisselen we de algemene bespreking af met concrete voorbeelden die we hier beknopt inleiden.

Rekenvoorbeeld 5.1: monitoring lozingspunt (vervolg op rekenvoorbeeld 4.1)

We willen de impact opvolgen van een (nieuw) lozingspunt in een rivier. Uit de literatuur is bekend dat een goede en vlot meetbare indicator voor eutrofi¨ering de gemiddelde dichtheid is van een soort borstelworm. In goede ecologische omstandigheden is de gemiddeld dichtheid 100 eenheden per monster en de standaardafwijking is 30. Ondanks deze grote biologische variabiliteit, is bekend uit de literatuur dat een toename van 10% op het gemiddelde al wijst op een verslechterende toestand. Bedoeling is dat we na enkele maanden, wanneer zich een nieuw ecologisch evenwicht heeft ingesteld, de meetcampagne starten met elke dag ´e´en meting. We willen een toename van 10% detecteren bij een significantieniveau van 1% met een onderscheidend vermogen van 95%. Hoeveel metingen zijn nodig?

Rekenvoorbeeld 5.2: tarieven naargelang fytoregio (vervolg op rekenvoorbeeld 4.2)

Het tarief in het Brabantse district is log( V ) = −0.0482 + 2.2244 log(C) + ε, met σε= 0.1. De tabel is geldig voor een omtrek tussen 0.35 en 4m. Vraag die zich stelt is of het tarief van het Zoni¨enwoud verschillend is. Het kleinste verschil van de helling relevant voor de praktijk is 0.05. We willen een onderscheidend vermogen van 99% realiseren bij significantieniveau van 1%.

Rekenvoorbeeld 5.3: overlevingskans kwabaaleieren

Voor de herintroductie van kwabaal wordt een kweekprogramma opgezet. Voor het uitkomen van de eitjes en de ontwikkeling van de larven is de temperatuur heel kritiek. Een paar graden hoger kan het verschil maken. Daarom zetten we bij twee temperaturen A (laag) en B (enkele graden hoger) een experiment op om de overlevingskans S (survival) te vergelijken. We vermoeden dat SA = 0.65 en SB = 0.55. Dit verschil willen we ontdekken met een onderscheidend vermogen van 80% bij een significantieniveau van 5%.

Rekenvoorbeeld 5.4: opname cadmium bij meerdere wilgensoorten

Op voormalige baggerterreinen is er een risico dat zware metalen in de voedselketen verspreid raken via bladeren van pionierboomsoorten zoals wilgen. Wilgen nemen veel cadmium op, zodat het zware metaal via bladval in de humuslaag terecht kan komen. Maar de cadmiumopname verschilt misschien tussen wilgensoorten. Als dat waar is, dan kunnen we via de keuze van de boomsoorten het probleem beter beheersen. We willen deze hypothese in het veld onderzoeken. Hoe groot moet de steekproef zijn?

5.2 De basisformule voor steekproefgrootteberekeningen

5.2.1 De startformule

We toetsen met een toetsingsgrootheid τ een (nul)hypothese H0 bij een significantieniveau α en we willen een welbepaalde relevant geachte alternatieve hypothese Ha detecteren met een onderscheidend vermogen π. Het verschil ΔH tussen H0 en Ha wordt vaak uitgedrukt in termen van een parameter ϑ (bv. het gemiddelde) van de onderliggende distributie:

ΔH = Δϑ0 = ϑa− ϑ0 (5.1)

Als we – zoals bij het schatten van parameters op basis van de centrale limietstelling – er van uitgaan dat de toetsingsgrootheid τ in goede benadering normaal verdeeld is met variantie στ2, dan kunnen we aantonen ( 8.2) dat onderstaande vergelijking een goede startformule is voor veel steekproefgrootte-berekeningen:

(z1−α

2 + zπ)2σ2

τ ≤ Δ2

H (5.2)

In vergelijking met de startformule (4.4) voor het schatten van parameters komt er in het linkerlid een term bij (zπ) die functie is van het onderscheidend vermogen. In het rechterlid staat het kleinste relevante verschil tussen de hypothesen (ΔH) in plaats van de maximaal toegelaten foutmarge (ΔF). Maar in wezen zijn beide formules gelijkaardig. Veel van de aanbevelingen voor de precisie zullen dan ook gelden voor het onderscheidend vermogen en vice versa.

Formule (5.2) is geschikt voor tweezijdige hypothesetoetsen, waarbij zowel negatieve als positieve afwijkingen ten opzichte van H0 in aanmerking komen. Als we eenzijdig toetsen, dan moeten we het significantieniveau in het percentiel van de standaardnormale distributie verdubbelen:

(z1−α+ zπ)2σ2

T ≤ Δ2

H (5.3)

Belangrijk is te beseffen dat we goede (wetenschappelijke of praktische) argumenten moeten hebben om te kiezen voor eenzijdige toetsen. Als er geen a priori indicatie is van de richting van het effect, dan gaat de voorkeur uit naar tweezijdig toetsen omdat we hiermee meer informatie krijgen. In de hiernavolgende tekst geven we alleen formules voor tweezijdige toetsen.