Onderzoek Klunhaar - E VALUATIE VAN BESTAAND ONDERZOEK

5. STATISTIEK

5.2 E VALUATIE VAN BESTAAND ONDERZOEK

5.2.5 Onderzoek Klunhaar

In het onderzoek van Klunhaar zijn drie frequentieanalyses uitgevoerd met gebruik van de klassieke

statistiek en twee Bayesiaanse modellen. De Bayesiaanse statistiek is een alternatieve methode om

kansverdelingen te schatten. Om klassieke statistiek te gebruiken moeten empirische waarnemingen

voorhanden zijn. Met Bayesiaanse statistiek is het mogelijk om met alleen subjectieve waarnemingen

en schatting te doen. Vandaar dat de gebruikte tijdserie is uitgebreid met een reeks waarnemingen

waarvan alleen bekend is of het overstromingsschade of een ramp betrof. De evaluatie van de

onzekerheden van het onderzoek van Klunhaar betrekt alleen de Bayesiaanse statistiek omdat deze

uiteindelijk de voorkeur heeft verdient om de maatgevende afvoer mee uit te rekenen. De klassieke

statistiek is vrijwel overeenkomstig met het Boertien II onderzoek.

Bij het schatten van de parameters en de keuze van een a priori kansverdeling ten behoeve van de

subjectieve waarnemingen wordt van hogere wiskunde gebruik gemaakt. De klassieke statistiek

bestaat voornamelijk uit praktische uitvoerbare recepten, die vaak zelfs zonder een computer niet al te

moeilijk uit te voeren zijn. Een Bayesiaanse analyse vereist daarentegen vaak het uitintegreren van

variabelen uit verdelingen, maar dit is meestal alleen praktisch mogelijk met behulp van een computer

(Luginbuhl, 2004). Het beoordelen van deze specifieke berekeningsstappen (het construeren van een

a posteriori vergelijking met a priori parameters) gaat te ver voor dit onderzoek. De beoordeling gaat

in op het feit dat subjectieve waarnemingen verdisconteerd zijn in een aangepaste

kansverdelingfunctie. Daarbij dient een analyse van de resultaten van het onderzoek ter

onderbouwing.

Boertien I Boertien II HR2006 2.790 3.175 3.175 2.466 3.120 3.039 2.449 2.573 2.746 2.165 2.388 2.731 2.125 2.279 2.488 2.000 2.207 2.300 1.957 2.171 2.280 Tabel 5.9 Vergelijk hoogste jaarmaxima BT II en HR 2006

Onzekerheden

Statistische kwaliteit

1. Kansverdelingstype onzekerheid:

Klunhaar heeft over het schatten van het type kansverdeling het volgende gezegd:

“Geconcludeerd moet worden dat de klassieke technieken ter bepaling van het type

kansverdeling – op basis van empirische waarnemingen – doorgaans weinig kracht

bezitten: zij geven een indruk, tot op zekere hoogte, maar de uiteindelijke keuze is toch

vaak subjectief. Met de Bayesiaanse statistiek worden twee elementen – statistische

informatie én subjectiviteit – allebei formeel betrokken in de schattingsprocedure”

Het schatten van het type kansverdeling is in feite verweven met het schatten van de

parameters voor de kansverdeling (Klunhaar, 2003). Verschillende hypothesen worden

opgesteld waarbij elke hypothese gebaseerd is op een ander verdelingstype. Uiteindelijk

wordt de Bayesiaanse analyse voortgezet door die verdelingsvorm te kiezen met de

hoogste a posteriori kans. Al wordt in het rapport wel gesuggereerd dat zonder uit te gaan

van een enkele verdeling, en alle verdelingen met een gewogen gemiddelde zouden

worden meegenomen, de Bayesiaanse analyse het meeste recht zou worden aangedaan.

Dat zou echter zeer veel rekenwerk kosten. Er is daarom gebruik gemaakt van één

objectieve toets. Omdat er geen visuele beoordeling en gevoeligheidsanalyse (pas ná de

keuze) is uitgevoerd, wordt het criterium “goede aanpassing naar een betrouwbaar

statistisch model welke de meeste hulptests heeft doorstaan, maar niet allemaal”

aangenomen. De score is 3.

2. Fit van de kansverdeling:

Voor het Bayesiaanse model is het toetsen van de fit niet zomaar uit te voeren omdat geen

directe afleiding van een empirische dataset wordt gebruikt. Het model is opgebouwd uit a

priori en a posteriori verdelingen. Van het a priori gedeelte zijn geen werkelijke afvoeren

bekend.

Er is getoetst op de gevoeligheid voor extra waarnemingen. De Bayesiaanse model I en II

zijn beide getoetst. Voor model I (zonder a priori informatie) is het resultaat in Tabel 5.10

gegeven.

T (jaar) 1911-1993 + 2.870 m3/s + 2.100 m3/s < 2.000 m3/s

1250 4132 4378 4026 4126

Opvallend is dat pas bij toevoeging van het extreme hoogwater van 2.870 m

/s, er een

stijging van de maatgevende afvoer optreedt. De vraag is wat het model doet bij nog een

aantal hoge hoogwaters zoals opgetreden tussen 1993 en 2003. Op basis van de resultaten

die nu gegeven zijn, kan daarop geen duidelijk antwoord worden gegeven. De

maatgevende afvoer zou met de vijfjaarlijkse vaststelling vermoedelijk relatief sterk

fluctueren wanneer met het Bayesiaanse model I wordt gerekend. Over de gevoeligheid

van model I wordt in het rapport geconcludeerd dat de schatting van de maatgevende

afvoer voor een extra waarneming het grootst is als de extra waarneming qua orde van

grootte in een gebied valt waar er op voorhand relatief weinig gegevens beschikbaar zijn

(Klunhaar, 2003).

Voor model II is het gewicht van de a priori infomatie gewijzigd door het verhogen dan wel

verlagen van een specifieke parameter. Uit de analyse werd afgeleid dat een grotere

bijdrage van a priori informatie tot een kleinere maatgevende afvoer leidt. Dit heeft te

Resultaten Klunhaar 1000 1500 2000 2500 3000 3500 4000 1 10 100 1000 10000 Herhalingstijd [jaren] A fvo er [ m 3/ s] klassiek [exponentieel]

Bayesiaans II [met a priori gegevens] Bayesiaans I

maken met het feit dat er in de vorige eeuw relatief veel hoogwaters boven 2.500 m

/s zijn

voorgekomen, ten opzichte van de vijf eeuwen daarvoor. Hoe meer gewicht de periode met

minder hoogwaters krijgt, hoe lager de maatgevende afvoer.

T (jaar) 1400-1993 Κ= 5 1400-1993 Κ= 10 1400-1993 Κ= 15 1250 4022 3919 3858

Volgens het Bayesiaans model I is er gevoeligheid voor extreme afvoeren maar de

gevoeligheid voor afvoeren boven de 2.100 m

/s en onder de 2.000 m

/s is enigszins

merkwaardig. Voor model II is de gevoeligheid sterk afhankelijk van de subjectieve omgang

met het schatten van de parameters voor de a priori informatie. De gevoeligheid is niet

zomaar objectief te bepalen.

De frequentieplots van de resultaten gegeven in Figuur 5.4 geven meer uitsluitsel. De fit

van de Bayesiaanse statistiek is binnen het bereik van de geplotte jaarmaxima vrijwel gelijk

met de klassieke statistiek. Op basis hiervan kan eenzelfde beoordeling worden gegeven

als het Boertien II onderzoek (want zelfde reeks jaarmaxima).

De beoordeling volgens NUSAP zit tussen twee omschrijvingen in: ‘’goede aanpassing naar

een betrouwbaar statistisch model welke de meeste hulptests heeft doorstaan, maar niet

allemaal’’, score is 3 en ‘’hulptests niet beduidend gepasseerd, model geen duidelijke

betrekking op gegevens, of model gekozen op basis van gelijkaardige gegevens’’, score is

2. De uiteindelijke score is 2,5.

Tabel 5.11 Resultaten gevoeligheidsanalyse Bayesiaans model II (Klunhaar, 2003)

3. Betrouwbaarheidsinterval: Tabel 5.12 geeft de betrouwbaarheidsintervallen weer. Ten

opzichte van de het Boertien II onderzoek zijn alle intervallen van de kansverdelingen

behorende bij een herhalingstijd van 1.250 jaar breder. Met het toevoegen van a priori

informatie voor model II is het interval smaller geworden maar nog altijd breder dan het

Boertien II onderzoek.

Methode kwaliteit

1. Parameterschatting:

Het schatten van de parameters gebeurt tegelijk met het schatten van de verdelingsfunctie

waaruit het Bayesiaanse model is opgebouwd. De aandacht gaat voornamelijk naar model II. De

Bayesiaanse methode komt namelijk vanwege de a priori invulling bij model II het beste tot zijn

recht. Een aantal factoren spelen bij de parameterschatting een rol:

- De gebruikte techniek voor de parameterschatting van het a priori gedeelte in model II is de

‘device of imaginary results’. Hiermee krijgt de a priori verdeling een wegingsfactor ten

opzichte van de a posteriori verdeling. De grootte van deze factor is afhankelijk van de a

posteriori waarnemingen waardoor de a priori verdeling niet als volledig onafhankelijk kan

worden beschouwd. Of zoals in het rapport wordt gesteld: het bepalen van de weging is een

interessant concept, maar niet helemaal zuiver (Klunhaar, 2003).

- Evenals bij de kansverdelingstype-onzekerheid zou het rekenen met een gewogen

gemiddelde van meerdere ‘mogelijke’ kansverdeling-functies de analyse sterker maken.

- De schattingsprocedure laat zich met de klassieke statistiek het meest vergelijken met de

methode der grootste aannemelijkheid, aangezien ook daar een soort ‘trial and error’

procedure wordt aangehouden.

Het schatten van de parameters is inherent voor de Bayesiaanse statistiek. De kwaliteit van de

schatting uit zich daardoor direct in de kwaliteit van de fit van de gebruikte kansverdelingsfuncties.

Uit een alternatieve methode voor het schatten kan niet worden gekozen zoals bij de klassieke

statistiek wel het geval is. Omdat het aannemen van een gewicht voor de a priori verdeling op

subjectieve gronden geschiedt, komt de Pedigree beoordeling uit op: “betrouwbare methode, die

bekend is binnen de discipline’’, score is 3 en ‘’aanvaardbare methode, maar beperkte consensus

op betrouwbaarheid’’, score is 2. De uiteindelijke score is 2,5

Tot slot heeft Klunhaar het volgende geconcludeerd: “Een Bayesiaanse aanpak leidt niet

noodzakelijk tot een betere schatting voor de maatgevende afvoer dan een klassieke aanpak. In

de Bayesiaanse aanpak wordt de statistische onzekerheid en de daarmee gepaard gaande

subjectieve houding ronduit ‘erkend”

2. Bepaling maatgevende afvoer:

Voor het onderzoek van Klunhaar is niet echt een aanbeveling gedaan om te kiezen voor een

nieuwe maatgevende afvoer. Het ging meer om de toepassing van de Bayesiaanse statistiek zelf.

Er wordt hierom geen extra beoordeling gegeven over de keuze voor de maatgevende afvoer.

Betrouwbaarheidsinterval Verdelingsfunctie Q1250 - 95% + 95% Spreiding BI Exponentieel 3879 40,4%* Bayesiaans I 4132 3054 5256 52,8% Bayesiaans II 4022 3107 4907 44,7% Tabel 5.12 95% Betrouwbaarheidsintervallen

(Klunhaar , 2003) *) de spreiding van de Exponentiele verdeling was in het rapport niet gegeven en is overgenomen uit het Boertien II onderzoek

In document Beoordeling van de kwaliteit van hoogwaterparameters berekend voor de Nederlandse Maas (pagina 108-112)