5. STATISTIEK
5.2 E VALUATIE VAN BESTAAND ONDERZOEK
5.2.5 Onderzoek Klunhaar
In het onderzoek van Klunhaar zijn drie frequentieanalyses uitgevoerd met gebruik van de klassieke
statistiek en twee Bayesiaanse modellen. De Bayesiaanse statistiek is een alternatieve methode om
kansverdelingen te schatten. Om klassieke statistiek te gebruiken moeten empirische waarnemingen
voorhanden zijn. Met Bayesiaanse statistiek is het mogelijk om met alleen subjectieve waarnemingen
en schatting te doen. Vandaar dat de gebruikte tijdserie is uitgebreid met een reeks waarnemingen
waarvan alleen bekend is of het overstromingsschade of een ramp betrof. De evaluatie van de
onzekerheden van het onderzoek van Klunhaar betrekt alleen de Bayesiaanse statistiek omdat deze
uiteindelijk de voorkeur heeft verdient om de maatgevende afvoer mee uit te rekenen. De klassieke
statistiek is vrijwel overeenkomstig met het Boertien II onderzoek.
Bij het schatten van de parameters en de keuze van een a priori kansverdeling ten behoeve van de
subjectieve waarnemingen wordt van hogere wiskunde gebruik gemaakt. De klassieke statistiek
bestaat voornamelijk uit praktische uitvoerbare recepten, die vaak zelfs zonder een computer niet al te
moeilijk uit te voeren zijn. Een Bayesiaanse analyse vereist daarentegen vaak het uitintegreren van
variabelen uit verdelingen, maar dit is meestal alleen praktisch mogelijk met behulp van een computer
(Luginbuhl, 2004). Het beoordelen van deze specifieke berekeningsstappen (het construeren van een
a posteriori vergelijking met a priori parameters) gaat te ver voor dit onderzoek. De beoordeling gaat
in op het feit dat subjectieve waarnemingen verdisconteerd zijn in een aangepaste
kansverdelingfunctie. Daarbij dient een analyse van de resultaten van het onderzoek ter
onderbouwing.
Boertien I Boertien II HR2006 2.790 3.175 3.175 2.466 3.120 3.039 2.449 2.573 2.746 2.165 2.388 2.731 2.125 2.279 2.488 2.000 2.207 2.300 1.957 2.171 2.280 Tabel 5.9 Vergelijk hoogste jaarmaxima BT II en HR 2006Onzekerheden
Statistische kwaliteit
1. Kansverdelingstype onzekerheid:
Klunhaar heeft over het schatten van het type kansverdeling het volgende gezegd:
“Geconcludeerd moet worden dat de klassieke technieken ter bepaling van het type
kansverdeling – op basis van empirische waarnemingen – doorgaans weinig kracht
bezitten: zij geven een indruk, tot op zekere hoogte, maar de uiteindelijke keuze is toch
vaak subjectief. Met de Bayesiaanse statistiek worden twee elementen – statistische
informatie én subjectiviteit – allebei formeel betrokken in de schattingsprocedure”
Het schatten van het type kansverdeling is in feite verweven met het schatten van de
parameters voor de kansverdeling (Klunhaar, 2003). Verschillende hypothesen worden
opgesteld waarbij elke hypothese gebaseerd is op een ander verdelingstype. Uiteindelijk
wordt de Bayesiaanse analyse voortgezet door die verdelingsvorm te kiezen met de
hoogste a posteriori kans. Al wordt in het rapport wel gesuggereerd dat zonder uit te gaan
van een enkele verdeling, en alle verdelingen met een gewogen gemiddelde zouden
worden meegenomen, de Bayesiaanse analyse het meeste recht zou worden aangedaan.
Dat zou echter zeer veel rekenwerk kosten. Er is daarom gebruik gemaakt van één
objectieve toets. Omdat er geen visuele beoordeling en gevoeligheidsanalyse (pas ná de
keuze) is uitgevoerd, wordt het criterium “goede aanpassing naar een betrouwbaar
statistisch model welke de meeste hulptests heeft doorstaan, maar niet allemaal”
aangenomen. De score is 3.
2. Fit van de kansverdeling:
Voor het Bayesiaanse model is het toetsen van de fit niet zomaar uit te voeren omdat geen
directe afleiding van een empirische dataset wordt gebruikt. Het model is opgebouwd uit a
priori en a posteriori verdelingen. Van het a priori gedeelte zijn geen werkelijke afvoeren
bekend.
Er is getoetst op de gevoeligheid voor extra waarnemingen. De Bayesiaanse model I en II
zijn beide getoetst. Voor model I (zonder a priori informatie) is het resultaat in Tabel 5.10
gegeven.
T (jaar) 1911-1993 + 2.870 m3/s + 2.100 m3/s < 2.000 m3/s
1250 4132 4378 4026 4126
Opvallend is dat pas bij toevoeging van het extreme hoogwater van 2.870 m
3/s, er een
stijging van de maatgevende afvoer optreedt. De vraag is wat het model doet bij nog een
aantal hoge hoogwaters zoals opgetreden tussen 1993 en 2003. Op basis van de resultaten
die nu gegeven zijn, kan daarop geen duidelijk antwoord worden gegeven. De
maatgevende afvoer zou met de vijfjaarlijkse vaststelling vermoedelijk relatief sterk
fluctueren wanneer met het Bayesiaanse model I wordt gerekend. Over de gevoeligheid
van model I wordt in het rapport geconcludeerd dat de schatting van de maatgevende
afvoer voor een extra waarneming het grootst is als de extra waarneming qua orde van
grootte in een gebied valt waar er op voorhand relatief weinig gegevens beschikbaar zijn
(Klunhaar, 2003).
Voor model II is het gewicht van de a priori infomatie gewijzigd door het verhogen dan wel
verlagen van een specifieke parameter. Uit de analyse werd afgeleid dat een grotere
bijdrage van a priori informatie tot een kleinere maatgevende afvoer leidt. Dit heeft te
Resultaten Klunhaar 1000 1500 2000 2500 3000 3500 4000 1 10 100 1000 10000 Herhalingstijd [jaren] A fvo er [ m 3/ s] klassiek [exponentieel]
Bayesiaans II [met a priori gegevens] Bayesiaans I
maken met het feit dat er in de vorige eeuw relatief veel hoogwaters boven 2.500 m
3/s zijn
voorgekomen, ten opzichte van de vijf eeuwen daarvoor. Hoe meer gewicht de periode met
minder hoogwaters krijgt, hoe lager de maatgevende afvoer.
T (jaar) 1400-1993 Κ= 5 1400-1993 Κ= 10 1400-1993 Κ= 15 1250 4022 3919 3858
Volgens het Bayesiaans model I is er gevoeligheid voor extreme afvoeren maar de
gevoeligheid voor afvoeren boven de 2.100 m
3/s en onder de 2.000 m
3/s is enigszins
merkwaardig. Voor model II is de gevoeligheid sterk afhankelijk van de subjectieve omgang
met het schatten van de parameters voor de a priori informatie. De gevoeligheid is niet
zomaar objectief te bepalen.
De frequentieplots van de resultaten gegeven in Figuur 5.4 geven meer uitsluitsel. De fit
van de Bayesiaanse statistiek is binnen het bereik van de geplotte jaarmaxima vrijwel gelijk
met de klassieke statistiek. Op basis hiervan kan eenzelfde beoordeling worden gegeven
als het Boertien II onderzoek (want zelfde reeks jaarmaxima).
De beoordeling volgens NUSAP zit tussen twee omschrijvingen in: ‘’goede aanpassing naar
een betrouwbaar statistisch model welke de meeste hulptests heeft doorstaan, maar niet
allemaal’’, score is 3 en ‘’hulptests niet beduidend gepasseerd, model geen duidelijke
betrekking op gegevens, of model gekozen op basis van gelijkaardige gegevens’’, score is
2. De uiteindelijke score is 2,5.
Tabel 5.11 Resultaten gevoeligheidsanalyse Bayesiaans model II (Klunhaar, 2003)
3. Betrouwbaarheidsinterval: Tabel 5.12 geeft de betrouwbaarheidsintervallen weer. Ten
opzichte van de het Boertien II onderzoek zijn alle intervallen van de kansverdelingen
behorende bij een herhalingstijd van 1.250 jaar breder. Met het toevoegen van a priori
informatie voor model II is het interval smaller geworden maar nog altijd breder dan het
Boertien II onderzoek.
Methode kwaliteit
1. Parameterschatting:
Het schatten van de parameters gebeurt tegelijk met het schatten van de verdelingsfunctie
waaruit het Bayesiaanse model is opgebouwd. De aandacht gaat voornamelijk naar model II. De
Bayesiaanse methode komt namelijk vanwege de a priori invulling bij model II het beste tot zijn
recht. Een aantal factoren spelen bij de parameterschatting een rol:
- De gebruikte techniek voor de parameterschatting van het a priori gedeelte in model II is de
‘device of imaginary results’. Hiermee krijgt de a priori verdeling een wegingsfactor ten
opzichte van de a posteriori verdeling. De grootte van deze factor is afhankelijk van de a
posteriori waarnemingen waardoor de a priori verdeling niet als volledig onafhankelijk kan
worden beschouwd. Of zoals in het rapport wordt gesteld: het bepalen van de weging is een
interessant concept, maar niet helemaal zuiver (Klunhaar, 2003).
- Evenals bij de kansverdelingstype-onzekerheid zou het rekenen met een gewogen
gemiddelde van meerdere ‘mogelijke’ kansverdeling-functies de analyse sterker maken.
- De schattingsprocedure laat zich met de klassieke statistiek het meest vergelijken met de
methode der grootste aannemelijkheid, aangezien ook daar een soort ‘trial and error’
procedure wordt aangehouden.
Het schatten van de parameters is inherent voor de Bayesiaanse statistiek. De kwaliteit van de
schatting uit zich daardoor direct in de kwaliteit van de fit van de gebruikte kansverdelingsfuncties.
Uit een alternatieve methode voor het schatten kan niet worden gekozen zoals bij de klassieke
statistiek wel het geval is. Omdat het aannemen van een gewicht voor de a priori verdeling op
subjectieve gronden geschiedt, komt de Pedigree beoordeling uit op: “betrouwbare methode, die
bekend is binnen de discipline’’, score is 3 en ‘’aanvaardbare methode, maar beperkte consensus
op betrouwbaarheid’’, score is 2. De uiteindelijke score is 2,5
Tot slot heeft Klunhaar het volgende geconcludeerd: “Een Bayesiaanse aanpak leidt niet
noodzakelijk tot een betere schatting voor de maatgevende afvoer dan een klassieke aanpak. In
de Bayesiaanse aanpak wordt de statistische onzekerheid en de daarmee gepaard gaande
subjectieve houding ronduit ‘erkend”
2. Bepaling maatgevende afvoer:
Voor het onderzoek van Klunhaar is niet echt een aanbeveling gedaan om te kiezen voor een
nieuwe maatgevende afvoer. Het ging meer om de toepassing van de Bayesiaanse statistiek zelf.
Er wordt hierom geen extra beoordeling gegeven over de keuze voor de maatgevende afvoer.
Betrouwbaarheidsinterval Verdelingsfunctie Q1250 - 95% + 95% Spreiding BI Exponentieel 3879 40,4%* Bayesiaans I 4132 3054 5256 52,8% Bayesiaans II 4022 3107 4907 44,7% Tabel 5.12 95% Betrouwbaarheidsintervallen
(Klunhaar , 2003) *) de spreiding van de Exponentiele verdeling was in het rapport niet gegeven en is overgenomen uit het Boertien II onderzoek