• No results found

Voorspellen van de avondpiek in het dagelijks drinkwaterverbruik door middel van weersvariabelen

N/A
N/A
Protected

Academic year: 2021

Share "Voorspellen van de avondpiek in het dagelijks drinkwaterverbruik door middel van weersvariabelen"

Copied!
65
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Bachelor Informatica

Voorspellen van de avondpiek

in het dagelijks

drinkwaterver-bruik door middel van

weers-variabelen

David Andrew P¨

uroja

28 juni 2019

Inf

orma

tica

Universiteit

v

an

Ams

terd

am

(2)
(3)

Abstract

Samenvatting

Waterbedrijven hebben voor het aanleggen van waterinfrastructuur in zowel de aanvoer als de productie en opslagcapaciteit het verwachte drinkwaterverbruik nodig. In de zomer is het drinkwaterverbruik hoger dan in de rest van het jaar, waarbij er een hogere avondpiek is, wat het interessant maakt om te kijken welke invloed verschillende weersfactoren hebben op het drinkwaterverbruik. In dit onderzoek is onderzocht of weersinvloeden een verkla-rende rol spelen bij de duur en de grootte van de avondpiek in het drinkwaterverbruik. De analyse is uitgevoerd op een dataset van Evides welke voor 2 jaren aan gemeten drinkver-bruik beschikbaar gesteld hebben. 8 weersvariabelen zijn getest: gemiddelde temperatuur, maximale temperatuur, bewolkingsgraad, verdamping, straling, windsnelheid, voorkomen van neerslag en luchtvochtigheid. Niet alle variabelen zijn gebruikt in het model doordat er veel colineariteit-problemen ontstaan bij het combineren van de weersvariabelen. 12 multi-lineaire regressiemodellen zijn gemaakt met de variabelen welke in combinatie niet colinear zijn: gemiddelde temperatuur, voorkomen van regen en het drinkwaterverbruik van de vo-rige dag. Naar voren is gekomen dat het model welke de gemiddelde temperatuur op de dag zelf, de dag ervoor en het voorkomen van regen van de afgelopen 5 dagen het kleinst gemiddelde absolute fout heeft in het voorspellen van het drinkwaterverbruik over het hele jaar en in de zomer. Voor het voorspellen van de avondpiek in het drinkwaterverbruik zijn er echter geen sterke verklarende weersvariabelen gevonden.

(4)
(5)

Inhoudsopgave

1 Definities 3 2 Introductie 5 3 Theoretische Achtergrond 7 4 Data 9 4.1 Metingen water . . . 9 4.2 KNMI weersdata . . . 10 4.2.1 Referentiegewasverdamping . . . 11 4.2.2 Gemiddelde bewolking . . . 11 4.3 Data-analyse . . . 12 5 Methode 15 5.1 Data verwerken . . . 16

5.1.1 Converteren naar volume . . . 16

5.1.2 Verwijderen negatieve waarden . . . 16

5.1.3 Verwijderen outliers . . . 16

5.1.4 Datapunten smoothen . . . 16

5.2 Controle variabelen voor basismodel . . . 18

5.2.1 Stationair/niet-stationair . . . 18

5.2.2 Cointegratie . . . 18

5.2.3 Pearson Correlation Coefficient . . . 18

5.2.4 Colineariteit variabelen . . . 19

5.2.5 Lineaire Regressie Model per weervariabele . . . 19

5.2.6 Multi-Linear Regressie Model . . . 20

5.3 Data-analyse verbruikspieken . . . 22

6 Resultaten 23 6.1 Controle eigenschappen variabelen . . . 23

6.1.1 Stationair/niet-stationair . . . 23

6.1.2 Cointegratie-test . . . 25

6.1.3 Colineariteit . . . 25

6.2 Drinkwaterverbruik & Weervariabelen . . . 28

6.2.1 Correlatie drinkwaterverbruik per variabele . . . 28

6.2.2 Enkelvoudige Lineaire Regressie . . . 28

6.2.3 Multi-linear Regressie Modellen . . . 30

7 Discussie 33 7.1 Data . . . 33

7.2 ADF-test . . . 33

(6)

7.6 Multi-Lineaire Regressiemodellen . . . 34

8 Conclusie 37

8.1 Vervolgonderzoek . . . 37

9 Referenties 39

A Grafieken KNMI Weerdata 41

B Scatterplots Weer-variabelen tegenover waterverbruik 47

C Tabellen Resultaten Colineariteit 53

D Tabellen Correlatie Coefficient 55

E Tabellen Enkelvoudige Lineaire Regressie 57

(7)
(8)

HOOFDSTUK 1

Definities

In dit hoofdstuk worden er een aantal definities uitgelegd welke in het rapport gebruikt worden. 1. EV24: Referentiegewasverdamping (in Makkink 0.1mm)

2. NG: Etmaalgemiddelde bewolking (in achtsten) 3. Q: Globale Straling J/cm2

4. RH: Wel/Niet voorkomen neerslag (1 voorkomen neerslag, 0 niet voorkomen neerslag) 5. TG: Etmaalgemiddelde temperatuur (in graden Celsius)

6. TX: Maximale temperatuur (in graden Celsius) 7. UG: Maximale relatieve vochtigheid (in procenten) 8. IJsdagen: Temperatuur onder de 0 graden Celsius

9. Koude dagen: Temperatuur tussen de 0 en de 10 graden Celsius 10. Frisse dagen Temperatuur tussen de 10 en de 20 graden Celsius 11. Warme dagen: Temperatuur tussen de 20 en de 25 graden Celsius 12. Zomerse dagen: Temperatuur tussen de 25 en de 30 graden Celsius 13. Tropische dagen: Temperatuur boven de 30 graden Celsius

14. MAE: Mean Absolute Error 15. Max-AE: Max Absolute Error

16. Dagpiekfactor: totaalwaterverbruikopdedagmethethoogsteverbruiktotaalgemiddeldwaterverbruikopeendag

17. Uurpiekfactor: maximaaluurverbruikgemiddelduurverbruik

18. KNMI: Koninklijke Nederlandse Meteorologisch Instituut

(9)
(10)

HOOFDSTUK 2

Introductie

De zomer van 2018 was in Nederland een van de droogste zomers in de geschiedenis. Ondanks de droogte was er geen sprake van een tekort aan drinkwater. De drinkwaterbedrijven PWN en Vitens hadden opgeroepen om zuinig aan te doen met het drinkwater, vanwege de gevolgen op het drinkwaternet bij de grote vraag naar water door huishoudens. De oproep hield onder andere in om in de ochtend tussen 07:00 en 09:00 en in de avond om 18:00-22:00 minder lang te douchen en de tuin niet te sproeien. (Vos en Bolwijn, 2018)

Waterbedrijven gebruiken voor het plannen van de waterinfrastructuur in zowel de aanvoer, als de productie- en opslagcapaciteit de dagpiekfactor en de max-uurfactor. De dagpiekfactor is de dagfactor op een extreme gebruiksdag, die statistisch een keer in de tien jaar voor kan komen en wordt gebruikt bij het bepalen van de productie van drinkwater. De max-uurfactor wordt gebruikt bij het ontwerpen van de distributie van het drinkwater. Uit onderzoek van (Vonk, Cir-kel en Leunk, 2017, Gevolgen klimaatverandering en vakantiespreiding voor de drinkwatervraag) blijkt dat de dagpiekfactor door klimaatverandering in 2050 met 21,3% stijgt in het warmste klimaatscenario opgesteld door het KNMI.

Vanwege de effecten van het weer is het interessant om te kijken naar het seizoensinvloed op het drinkwaterverbruik en welke factoren daar een rol in spelen. In een case-study (Xenochristou, Blokker e.a., 2018) is het drinkwaterverbruik bij Nederlandse huishoudens op 9 verschillende locaties gemeten. Daaruit is gebleken dat temperatuur en straling het meeste invloed hebben op het drinkwaterverbruik. Ook is daaruit gebleken dat luxe huizen met een tuin buiten de stad het meest gevoelig zijn voor veranderingen in temperatuur en warmte, en dat appartementen en flats geen significante invloed ondervinden.

Uit onderzoek van KWR voor het waterbedrijf Evides (Vertommen, Blokker, Albert en Agudelo-Vera, 2018) blijkt dat het seizoensinvloed op het drinkwaterverbruik bij huishoudens het meest significant zijn in landelijke gebieden, waarbij het drinkwaterverbruik 2,5 hoger is op een warme weekenddag dan de referentiedag. Voor waterbedrijven is het noodzakelijk een zo goed mogelijke voorspelling te kunnen maken van deze factor voor het kosten-effectief de waterinfrastructuur te onderhouden en uit te breiden. (Adamowski, 2008)

In dit onderzoek wordt onderzocht welke weerparameters van invloed zijn op de hoogte van de avondpiek. Op ijsdagen, koude dagen en frisse dagen is de avondpiek lager dan de ochtend-piek, daar waar op warme dagen, zomerse dagen en tropische dagen er een hogere avondpiek geobserveerd wordt. De onderzoeksvraag bij dit onderzoek is:

Welke weersfactoren kunnen gebruikt worden in het voorspellen van de avondpiek in het drinkwaterverbruik?

(11)
(12)

HOOFDSTUK 3

Theoretische Achtergrond

Meerdere onderzoeken zijn uitgevoerd naar het voorspellen van korte termijn drinkwater ver-bruik. Daarbij worden verschillende modellen gebruikt om het waterverbruik te voorspellen. Deze modellen zijn onder andere Multiple Linear Regression, Artificial Neural Networks (Ada-mowski, 2008), Pricipal Component Analysis (Haque, Egodawatta, Rahman en Goonetilleke, 2015) en Support Vector Machines (Vonk e.a., 2017). Minder onderzoek is gedaan naar het voor-spellen van de dagpiekfactor en uurpiekfactor. Deze factoren zorgen voor pieken die belangrijk zijn in het ontwerpen en bepalen van de productievraag en de distributie.

In Bakker, Van Duist, Van Schagen, Vreeburg en Rietveld, 2014 is voor het voorspellen van drink-waterbehoefte gebruik gemaakt van klimaat-factoren. Daarbij is een Multiple Linear Regression model gebruikt. Uit dit onderzoek is naar voren gekomen dat het gebruik van weersfactoren de fouten in de voorspelling kunnen verlagen met maximaal 11% en gemiddeld 7%. In dit onderzoek is echter niet aangegeven welke weersfactoren gebruikt zijn.

In (Adamowski, 2008) is er onderzoek gedaan naar dagpiek waterverbruik in de regio van Ottawa, Canada. Daarbij is er een analyse utgevoerd op een dataset met verbruikgegevens en weergege-vens van 10 jaar. Daarbij is uitgekomen dat de volgende weersfactoren het meest nauwkeurige resultaat geven:

• Piek waterverbruik van de vorige dag

• Maximale temperatuur van de huidige dag en vorige dag • Wel of niet voorkomen van regen van de afgelopen 5 dagen

Als suggestie voor een vervolgonderzoek was aangegeven dat er gekeken kon worden naar meer weervariabelen, zoals evapotranspiratie, windsnelheid, relatieve luchtvochtigheid, bewolkingsper-centage en hoeveelheid zonlicht.

Een onderzoek met een kleinere dataset is uitgevoerd in Nederland, waarbij de data van 9 lo-caties in Rotterdam gebruikt zijn, elk met verschillende type woningen. Daarbij is de data van gedurende een jaar (2016-2017) van het waterbedrijf Evides gebruikt in combinatie met 6 weervariabelen:

• Maximale temperatuur • Globale straling • Neerslagduur • Neerslaghoeveelheid

(13)

Het waterverbruik was ingedeeld op seizoen, daarna op de type dag (werkdag/weekenddag) en daarna het tijdstip op de dag. Daaruit was voortgekomen dat een stijging in temperatuur en straling het meeste invloed hebben op waterconsumptie, gevolgd door relatieve luchtvochtigheid. (Xenochristou, Blokker e.a., 2018)

Bij een onderzoek door KWR uitgevoerd in 2017 is er gebruik gemaakt van vakantiespreidings-data, waarbij onder andere gekeken is naar de invloed van het weer op de vakantiespreiding en het drinkwatergebruik. In het onderzoek is er gebruik gemaakt van het doorlopend potentieel neer-slagtekort, gemiddelde dagtemperatuur, neerslag, verdamping en straling met drie voorgaande dagen, type weekdag, nationale feestdagen en maand van het jaar. In dit onderzoek gebruik gemaakt van een Support Vector Regression, welke een uitbreiding is op de Support Vector Ma-chine. Hierbij wordt er geprobeerd een functie te fitten op een dataset met een vooraf bepaalde maximale afwijking in relatie tot de trainingsdata. Uit dit onderzoek is naar voren gekomen dat door temperatuurstijgingen als gevolg van klimaatverandering in het warmste scenario de watervraag met 3.1% laat stijgen en de dagpiekfactor tot 21.3%. (Vonk e.a., 2017)

(14)

HOOFDSTUK 4

Data

Voor dit onderzoek wordt gebruik gemaakt van twee verschillende datasets: het waterverbruik van een aantal meetgebieden van het waterbedrijf Evides en de gemeten weersvariabelen beschik-baar gesteld door het KNMI. In dit hoofdstuk worden de verschillende databronnen toegelicht.

4.1

Metingen water

De gegevens die beschikbaar gesteld zijn door Evides zijn van 9 verschillende locaties in Rotter-dam en omstreken. Deze locaties zijn weergegeven in Figuur 4.1. In Tabel 4.1 zijn de kenmerken van deze locatie weergegeven. De metingen zijn per minuut gemeten op deze locaties in de periode 1 juli 2016 tot 16 april 2019.

Figuur 4.1: Overzichtskaart van de meetlocaties in de buurt van Rotterdam, Nederland. In het rood staat aangegeven van welk weerstation de data gebruikt wordt (Weerstation Rotterdam 344 van het KNMI)

(15)

Meetlocatie Kenmerk Aantal Woningen

Landelijk 1 Luxe woningen met tuin, veel senioren 115

Landelijk 3 Rijwoningen met tuin, gemengde gezinssamenstelling 142

Landelijk 4 Luxe woningen met tuin, veel tweeverdieners 109

Voorstedelijk 1 Luxe woningen met tuin, voornamelijk tweeverdieners en gezinnen met kinderen

138 Voorstedelijk 2 Appartementen, voornamelijk tweeverdieners en gezinnen

met kinderen

-Voorstedelijk 3 Seniorenflat 125

Stedelijk 1 Luxe rijwoningen 112

Stedelijk 2 Goedkope apartementen, veel arbeiders 117

Stedelijk 3 Goedkope rijwoningen met tuin, voornamelijk gezinnen met kinderen

119

Tabel 4.1: Kenmerken meetlocaties met aantal woningen. (Bron: Ina Vertommen en Blokker, 2016)

Voor het onderzoek is gekozen om gebruik te maken van de data van Randstedelijk 1, gezien de korte tijdsduur van het onderzoek.

4.2

KNMI weersdata

Voor de weergegevens wordt er gebruik gemaakt van gegevens van het KNMI. Deze gegevens zijn gemeten bij het weerstation nabij Rotterdam (aangegeven met een rode stip in Figuur 4.1). Het KNMI stelt zowel dagmetingen als uurmetingen beschikbaar. In dit onderzoek wordt er gebruik gemaakt van de dagmetingen. De gebruikte parameters zijn weergegeven in Tabel 4.2.

Parameter Eenheid Tijdschaal

Gemiddelde Temperatuur C Dag

Referentiegewasverdamping (Makkink 0.1mm) Dag

Neerslag (wel/geen) Boolean Dag

Globale Straling J/cm2 Dag/Uur

Gemiddelde Windsnelheid 0.1 m/s Dag/Uur

Gemiddelde Bewolking (graad 1/8) Dag/Uur

Luchtvochtigheid in procenten Dag/Uur

Maximale Temperatuur C Uur

Tabel 4.2: Gebruikte weerparameters in het onderzoek. De data is afkomstig van het KNMI-weerstation Rotterdam 344

De referentiegewasverdamping en de gemiddelde bewolking worden verder toegelicht in paragraaf 4.2.1 respectievelijk 4.2.2. De wel-geen neerslag parameter wordt geaggregeerd voor 2, 3, 4 en 5 dagen om te kijken of het aantal dagen wel/geen neerslag invloed heeft. Als er een dag is met neerslag, dan wordt er een 1 geregistreerd, anders 0.

(16)

4.2.1

Referentiegewasverdamping

De hoeveelheid vocht dat verdampt van vegetatie die voorzien is van voldoende water. De referentie-gewasverdamping hangt nauw samen met de beschikbare hoeveelheid zon en is daarmee in de zomermaanden belangrijk hoger dan gedurende de winter. (KNMI, 2019) De referentie-gewasverdamping wordt berekend door Formule 4.1.

λ · Eref = C1· s

s + γ · Kin+ C2 (4.1)

waarbij λ de verdampingswaarde van water is (in J/kg), C1 en C2 constanten zijn, s de afge-leide van temperatuur naar verzadigingsdampspanning, γ de psychrometerconstante en Kin de kortgolvig inkomende straling (in W/m2). De referentiegewasverdamping wordt gebruikt als re-ferentie voor het besproeien van gewassen: mocht de verdamping dalen doordat er onvoldoende vocht in de ondergrond is, dan worden de gewassen besproeid.

4.2.2

Gemiddelde bewolking

De gemiddelde bewolking wordt per uur bepaald en gerepresenteerd in achtsten (octa’s). Bij de daggegevens wordt de gemiddelde bewolkingsgraad gebruikt. (KNMI, 2019)

Octa Klasse Octa Klasse

0 Onbewolkt 5 Half tot zwaar bewolkt

1 Vrijwel onbewolkt 6 Zwaar bewolkt

2 Licht bewolkt 7 Vrijwel geheel bewolkt

3 Half bewolkt 8 Geheel bewolkt

4 Half bewolkt 9 Bovenlucht onzichtbaar

(17)

4.3

Data-analyse

Om te kijken hoe het drinkwaterverbruik eruit ziet over dagen met verschillende temperaturen zijn er 6 dagen uitgekozen met verschillende gemiddelde en maximale temperaturen. Deze dagen zijn doordeweekse dagen en zijn weergegeven in Tabel 4.4.

Dag Gemiddelde temperatuur Maximale temperatuur Type dag

18 januari 2017 -3,4 -1,2 IJsdagen

5 april 2017 9,5 12,6 Koude dagen

11 mei 2017 15,7 23,4 Frisse dagen

21 mei 2017 14,8 20,3 Warme dagen

19 juli 2017 23,0 29,4 Zomer dagen

27 mei 2017 22,2 31,3 Tropische dagen

Tabel 4.4: Verschillende doordeweekse dagen met verschillende temperaturen. Het dagpatroon in drinkwaterverbruik over deze dagen is weergegeven in Figuur 4.2.

23:0000:0001:0002:0003:0004:0005:0006:0007:0008:0009:0010:0011:0012:0013:0014:0015:0016:0017:0018:0019:0020:0021:0022:0023:0000:0001:00 Tijd in uren 0.02 0.04 0.06 0.08 0.10 0.12 Waterverbuik (in m 3

Waterverbruik op dagen met verschillende temperaturen

IJsdagen Koude dagen Frisse dagen Warme dagen Zomerdagen Tropische dagen

Figuur 4.2: Waterverbruik over de dag binnen het Randstedelijk 1 meetgebied. Elk grafiek is een andere dag met een temperatuur in de gedefinieerde temperatuur grenzen van het KNMI. De grafieken zijn gesmooth.

Uit Figuur 4.2 is te zien dat op tropische dagen en warme dagen er in de namiddag meer water verbruikt wordt dan in de ochtend het geval is. Dit in tegenstelling tot koudere dagen. De grafiek van de zomerdagen valt lager uit dan verwacht, wat kan komen doordat deze in een zomervakantie valt (onder andere onderzocht in Vonk e.a., 2017).

(18)

2016-08 2016-10 2016-12 2017-02 2017-04 2017-06 2017-08 Tijd in dagen 10 20 30 40 50 60 70 80 W at er ve rb ru ik pe r d ag in m 3 0 50 100 150 200

Gemiddelde Temperatuur in 0.1 graden Celsius

Gemiddelde Temperatuur

Figuur 4.3: Drinkwaterverbruik en gemiddelde temperatuur over het jaar heen.

Als er gekeken wordt naar het drinkwaterverbruik gedurende het jaar uitgezet tegen de ge-middelde temperatuur (Figuur 4.3, dan is te zien dat in de maanden waarbij de gege-middelde temperatuur onder de 15 graden Celsius is het waterverbruik op een dag rond de 50 m3 blijft. Wanneer de temperatuur boven de 15 graden Celsius is, stijgt het drinkwaterverbruik.

Wordt er gekeken op niveau per dag (zie Figuur 4.4), dan is per dag een piek in de ochtend te zien en een piek in de namiddag/avond met in de nacht een lager verbruik. Het verbruik in de nacht is in dit figuur in de weekenddagen (8 juli t/m 10 juli) hoger dan de dagen doordeweeks.

03/07/2016 04/07/2016 05/07/2016 06/07/2016 07/07/2016 08/07/2016 09/07/2016 10/07/2016 11/07/2016 12/07/2016 13/07/2016 14/07/2016 15/07/2016 16/07/2016 17/07/2016 Tijd (gemeten per minuut)

0.02 0.04 0.06 0.08 0.10 W at er ve rb uik (i n m 3)

Waterverbruik in cluster Randstedelijk 1

Raw Data

(19)
(20)

HOOFDSTUK 5

Methode

In dit hoofdstuk wordt de methode toegelicht voor het maken van het model. Een overzicht van de stappen in de methode is weergegeven in Figuur 5.1. In de blauwe blokken wordt de data bruikbaar gemaakt voor analyse, in de oranje blokken worden verschillende testen uitgevoerd om te controleren welke variabelen bruikbaar zijn en of er extra stappen nodig zijn om het model op te bouwen, in het grijze blok worden de gegevens van de avondpiek bepaald en in de groene blokken worden de variabelen van zowel het verbruik als het weer tegenover elkaar geplaatst.

(21)

5.1

Data verwerken

Om de data te kunnen gebruiken zullen er eerst een aantal stappen doorlopen worden om deze geschikt te maken voor analyse. In deze paragraaf worden de stappen doorgelopen die gebruikt worden voor het verwerken van de data van het drinkwaterverbruik.

5.1.1

Converteren naar volume

De aangeleverde data is momenteel beschreven als een volumestroom die per minuut gemeten is. Een volumestroom wordt beschreven door:

Q =V

t (5.1)

waarbij Q de volumestroom is in m3/h, V het volume in m3 en t de tijd in uren. Aangezien de data per minuut gemeten is en de eenheid in m3/h moet deze door 60 gedeeld worden om de volume te verkrijgen dat per minuut gebruikt is.

5.1.2

Verwijderen negatieve waarden

Door fouten in de meetapparatuur kan het voorkomen dat er in de meting een negatieve hoeveel-heid water wordt opgenomen door een meetgebied, wat niet mogelijk is aangezien er water dan in tegengestelde richting wordt toegevoegd aan het systeem. Deze waarden worden vervangen door0N otanumber0.

5.1.3

Verwijderen outliers

Een outlier is een waarde die ten opzichte van de andere waarden in de dataset sterk afwijkt. Voor het verwijderen van outliers in de dataset wordt er gebruik gemaakt van de z-score. De definitie van de Z-score is weergegeven in Formule 5.2

Z = X − µ

σ (5.2)

waarbij X de stochastische variabele is, µ het gemiddelde, σ de standaard-deviatie en Z de score. Met de score kan er gekeken worden naar de relatie tussen de standaard-deviatie en gemiddelde van een dataset. Als een datapunt te ver afwijkt van µ en σ, dan is het een outlier. (Sharma en Sharma, 2018) In dit onderzoek is gekozen om de datapunten waarvoor geldt dat |Z| > 3 te beschouwen als een outlier. Deze punten worden vervangen voor de waarde N otanumber.

5.1.4

Datapunten smoothen

De meetdata is per minuut gemeten. Doordat de waarde per minuut verandert is de data onregelmatig, waardoor een groot aantal kleine pieken gemeten kunnen zijn die van korte duur zijn. Om deze pieken te filteren wordt er gebruik gemaakt van Gaussian Smoothing. De definitie van de Gaussische functie is weergegeven in Formule 5.3

G(x) =√ 1 2πσ2 · e

−x2

2σ2 (5.3)

waarbij x het datapunt is en σ de standaard-deviatie. De standaard-deviatie wordt in de filter-functie gebruikt als maat voor hoe groot het filter moet zijn. De grootte van het filter bepaald hoeveel datapunten in beschouwing genomen wordt, in dit geval het aantal meetpunten. In het geval van de data die per minuut gemeten is is een σ = 1 gelijk aan 1 minuut data en σ = 60 aan 60 minuten data. In Figuur 5.2 is een weergave gegeven van de meetpunten op een dag met zowel de gesmoothe als ruwe data.

(22)

23:00 00:00 01:00 02:00 03:00 04:00 05:00 06:00 07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00 01:00 Tijd in uren 0.02 0.04 0.06 0.08 0.10 0.12 W at er ve rb uik (i n m 3 Waterverbruik op 2016-07-20 Smoothed 15 Smoothed 30 Smoothed 45 Smoothed 60 23:00 00:00 01:00 02:00 03:00 04:00 05:00 06:00 07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00 01:00 Tijd in uren 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 W at er ve rb uik (i n m 3) Waterverbruik op 2016-07-20 Raw Data

Figuur 5.2: Weergave van gemeten data op een tropische zomerdag, zowel gesmooth als de ruwe data. Hierbij is de horizontale lijn het gemiddelde waterverbruik van het gehele gemeten gebied. In dit onderzoek is gekozen om σ = 60 te gebruiken, wat gelijk is aan 60 minuten. Hiermee worden kleine pieken weggefilterd zodat alleen de grote, maatgevende pieken in beschouwing genomen worden. De smoothing wordt alleen gebruikt bij het detecteren van de pieken; voor de modellen wordt er gebruik gemaakt van ongesmoothe data.

(23)

5.2

Controle variabelen voor basismodel

Voordat het model opgezet wordt moeten de tijdreeksen eerst gecontroleerd worden op bepaalde statistische eigenschappen: stationariteit, correlatie en colineariteit. Daarmee wordt gecontro-leerd of de datasets geschikt zijn voor het gebruiken in een lineaire regressiemodel zonder dat er valse (spurious) regressie plaatsvindt: dit is wanneer twee variabelen niet aan elkaar gerelateerd zijn. Initieel wordt er een basismodel gemaakt die het totaal volume drinkwaterverbruik per dag als afhankelijke variabele gebruikt. Daarna worden er modellen gemaakt waarbij het totaal waterverbruik in de avondpiek en de duur van de avondpiek als afhankelijke variabele gebruikt wordt om te kijken welke weersfactoren voorspellers kunnen zijn van deze pieken.

5.2.1

Stationair/niet-stationair

Om te kijken het waterverbruik stationair is of niet, dat wilt zeggen onafhankelijk van de tijd of niet, wordt er gebruik gemaakt van de Augmented Dickey-Fuller test (ADF). De ADF test is een statistische methode om te onderzoeken wat de kans p is dat een tijdreeks een ¨unit root”heeft: als een tijdreeks een unit-root heeft, dan is deze niet-stationair en dus afhankelijk van de tijd. De nul-hypothese van deze test gaat uit dat er een unit-root aanwezig is, met de alternatieve hypothese dat er geen unit-root aanwezig is. Om de nul-hypothese te verwerpen wordt er gekeken of de p-waarde onder de 5%-drempelwaarde ligt. De test onderzoekt per tijdstap wanneer de waarde hoger dan het gemiddelde is, dat deze in de volgende tijdstap naar beneden gaat en wanneer de waarde lager is dan het gemiddelde, deze in de volgende tijdstap omhoog gaat. Dit is beschreven in Formule 5.4. (Corrius, 2018)

∆y(t) = α + βt + λyt−1+ δ1∆yt−1+ ... + δm−1∆yt−m+1+ t (5.4)

waarbij α constant is, β de coefficient van de tijdreeks trend en m de tijds-lag voor de auto-regressie. Als β = 0, dan betekent het dat de tijdreeks willekeurig verloopt. Door ˆλ te testen tegen de kritische waarden van de Dickey-Fuller test kan de null-hypothese, λ = 0 getest worden. Mocht λ > 0, dan kan de nul-hypothese verworpen worden en is de tijdreeks stationair. De test is weergegeven in Formule 5.5.

DFt= λ

SE(λ) (5.5)

De Dickey-Fuller test geeft een waarde ADF terug samen met een p-waarde en drie kritische drempelwaarden waarmee gecontroleerd kan worden wat de statistische significantie van de ADF -waarde is.

5.2.2

Cointegratie

Mocht een of beide tijdreeksen niet stationair zijn, dan wordt er gebruik gemaakt van de Aug-mented Engle-Granger-Test om te onderzoeken of een combinatie van beide tijdreeksen samen wel stationair zijn. Wanneer twee tijdreeksen samen stationair zijn, dan zijn de co-integreerd. Dit houdt in dat ze dezelfde trend volgen op de lange termijn.

5.2.3

Pearson Correlation Coefficient

Voor elke weervariabele wordt de Pearson-r-correlatie berekend met het drinkwaterverbruik. De Pearson r beschrijft de lineaire relatie tussen twee datasets, in dit geval twee tijdreeksen. De Pearson-r wordt berekend met Formule 5.6

r = Σ(x − mx)(y − my) pΣ(x − mx)2(y − my)2

(5.6)

hierbij is r het Pearson-getal, x en y tijdreeksen zijn en mx en my de gemiddelden zijn van de betreffende tijdreeksen. (SciPy, 2019) De coefficient kan een waarde hebben tussen de −1 en

(24)

Voor de Pearson-correlation coefficient dienen de tijdreeksen genormaliseerd te zijn (SciPy, 2019) Dit wordt gedaan door middel van Formule 5.7

y = (x − µ)

σ (5.7)

waarbij x een waarde in de tijdreeks is, µ het gemiddelde van de tijdreeks en σ de standaard-deviatie van de tijdreeks. Om de coefficienten te kunnen interpreteren wordt er gebruik gemaakt van de criteria weergegeven in Tabel 5.1.

Absolute Correlatie Coefficient Interpretatie 0.00-0.10 Verwaarloosbare correlatie 0.10-0.39 Zwakke correlatie 0.40-0.69 Gemiddelde correlatie 0.70-0.89 Sterke correlatie

0.90-1.00 Zeer sterke correlatie

Tabel 5.1: Grenzen voor interpretatie van de correlatie-coefficient. (Bland en Altman, 2011)

5.2.4

Colineariteit variabelen

Colineariteit komt voor wanneer een of meer verklarende variabelen in een regressiemodel voor-speld kan worden door andere verklarende variabelen. Colineariteit is gedefineerd als er een lineaire verband te vinden is zoals beschreven in Formule 5.8:

c1X1+ c2X2= c0 (5.8)

waarbij c0, c1en c2 constanten zijn die op de hele dataset van toepassing zijn. (Weisberg, 2014) Om verklarende weervariabelen te detecteren die colineair zijn wordt er gebruik gemaakt van de variance inflation factor (VIF). Dit is een waarde die aanduidt of colineariteit tussen variabelen bestaat. In Formule 5.9 is de variance inflation factor weergegeven:

V ar( ˆβj) = σ2 1 − R2 j · 1 SXjXj (5.9) waarbij: 1−R1 2 j

de j − de variance inflation factor is en SXjXj de j-de term in de gemiddelde functie (Σ(xijx¯j)2). (Weisberg, 2014) Wanneer de waarde van V ar( ˆβj) = 1, dan is er geen colineariteit tussen de variabelen, tussen de 5 en 10 is een indicatie dat er een hoge mate van colineariteit tussen de variabelen aanwezig is. (Ogee en Ellis, 2013)

5.2.5

Lineaire Regressie Model per weervariabele

Mocht er een correlatie aanwezig zijn, dan is het mogelijk om een lineaire regressie model te maken waarin het drinkwaterverbruik wordt gebruikt als response-variabele en een weervariabele als verklarende variabele. Het lineaire regressie-model wordt beschreven met Formule 5.10.

Y = b0+ b1· X (5.10)

waarbij Y het voorspelde drinkwaterverbruik is op een dag (of uur), b0 het startgetal is welke bepaald is wanneer X gelijk aan 0 is, b1de gemiddelde verandering van Y voor elke X-stap en X de verklarende variabele is. In dit geval is X de weersvariabele waarmee Y voorspeld kan worden. Daarbij wordt er ook gevarieerd in verschillende aggregratie-groten van de weersvariabelen (de hoeveelheid dagen die meegenomen worden in de voorspelling) en wordt ook de afwijking tussen

(25)

om te kijken naar de afhankelijkheid tussen de verklarende en voorspellende variabele. De inter-pretatie van R2 is afgeleid van een eerder onderzoek naar piek-drinkwaterverbruik (Adamowski, 2008). Daarbij worden de interpretaties gebruitk zoals weergegeven in Tabel 5.2.

R2 Interpretatie

0.00-0.10 Zwakke afhankelijkheid

0.10-0.39 Voldoende correlatie

0.40-0.69 Sterke correlatie

0.70-1.00 Zeer Sterke correlatie

Tabel 5.2: Grenzen voor interpretatie van R2zoals ge¨ınterpreteerd uit (Adamowski, 2008)

5.2.6

Multi-Linear Regressie Model

Na het toepassen van lineaire regressiemodellen kan er gekeken worden naar een regressiemodel waarin meerdere bi-variabelen meegenomen worden: multi-lineaire regressie. De definitie van multi-lineaire-regressie (MLR) is weergegeven in Formule 5.11:

Y = b0+ b1· xi1+ b2· xi2+ ... + bp· xip (5.11) waarbij bide verschillende weersvariabelen zijn welke gebruikt worden in het voorspellen van het drinkwaterverbruik.

In dit onderzoek is gekozen voor het gebruiken van Multi-Lineaire Regressiemodellen (MLR), gezien deze in voorgaande onderzoeken ook gebruikt is. In voorgaande onderzoeken zijn MLR toegepast voor het voorspellen van het drinkwaterverbruik. In (Adamowski, 2008) zijn MLR-modellen toegepast op weersvariabelen en het totaal drinkwaterverbruik de dag ervoor en in (Bakker e.a., 2014) op het totaal drinkwaterverbruik van de dag ervoor en andere weersvariabelen. Bij regressiemodellen bestaat de mogelijkheid om interacties tussen variabelen mee te nemen: deze interacties tussen twee verklarende variabelen wordt weergegeven in Formule 5.12.

Y = b0+ b1· xi1+ b2· xi2+ b3· xi1xi2 (5.12) waarbij de interactie zichtbaar is in de term b3xi1xi2. Deze term heeft b3 als co¨efficient. In dit onderzoek wordt onderzoek naar interactie tussen de verschillende weersvariabelen buiten beschouwing gelaten.

Het model wordt door middel van R2en de Mean Absolute Error (MAE) geverifieerd. R2is het determinatieco¨efficient, wat een maat is om de variantie uit te drukken waarin het drinkwater-verbruik te voorspellen is. MAE is een maat om het verschil tussen de variabelen te bepalen waarbij er gekeken wordt naar de gemiddelde absolute fout. MAE wordt beschreven in Formule 5.13.

M AE = PN

i=1|Oi− Di|

n (5.13)

waarin n de totaal aantal samples zijn, Oihet gemeten drinkwaterverbruik is en Dihet voorspelde drinkwaterverbruik. Er worden verschillende modellen getest, waarbij er gevarieerd wordt met welke lag een variabele in beschouwing genomen wordt. Een overzicht van de te testen modellen is weergegeven in Tabel 5.3.

(26)

Model Parameters Model-T1-RH Vt−1, Bt, Tt, Tmax, Tt−1, Rt, U Gt, Qt, EV 24 Model-T1-RH1 Vt−1, Bt, Tt, Tmax, Tt−1, Rt−1, U Gt, Qt, EV 24 Model-T1-RH2 Vt−1, Bt, Tt, Tmax, Tt−1, Rt−2, U Gt, Qt, EV 24 Model-T1-RH3 Vt−1, Bt, Tt, Tmax, Tt−1, Rt−3, U Gt, Qt, EV 24 Model-T1-RH4 Vt−1, Bt, Tt, Tmax, Tt−1, Rt−4, U Gt, Qt, EV 24 Model-T1-RH5 Vt−1, Bt, Tt, Tmax, Tt−1, Rt−5, U Gt, Qt, EV 24 Model-T1-T2-RH Vt−1, Bt, Tt, Tmax, Tt−1, Tt−2, Rt, U Gt, Qt, EV 24 Model-T1-T2-RH1 Vt−1, Bt, Tt, Tmax, Tt−1, Tt−2, Rt−1, U Gt, Qt, EV 24 Model-T1-T2-RH2 Vt−1, Bt, Tt, Tmax, Tt−1, Tt−2, Rt−2, U Gt, Qt, EV 24 Model-T1-T2-RH3 Vt−1, Bt, Tt, Tmax, Tt−1, Tt−2, Rt−3, U Gt, Qt, EV 24 Model-T1-T2-RH4 Vt−1, Bt, Tt, Tmax, Tt−1, Tt−2, Rt−4, U Gt, Qt, EV 24 Model-T1-T2-RH5 Vt−1, Bt, Tt, Tmax, Tt−1, Tt−2, Rt−5, U Gt, Qt, EV 24

Tabel 5.3: Modellen welke getest worden. Vt−1 is het drinkwaterverbruik van de vorige dag, Bt de bewolking op een dag, Tt de gemiddelde temperatuur op een dag, Tt−1 de gemiddelde temperatuur de dag ervoor, Tt−2 de gemiddelde temperatuur van twee dagen ervoor, Tmax de maximale temperatuur op een dag, Rt−n het wel of niet voorkomen van regen op een dag met n het aantal dagen ervoor, U Gt de luchtvochtigheid op een dag, Qt de straling op een dag en EV 24 de verdamping op een dag.

(27)

5.3

Data-analyse verbruikspieken

De grootte van de avondpiek is afhankelijk van het type dag, ijsdag, koude dag, frisse dag, zomerdag, tropische dag. Geobserveerd is dat de pieken op zomerdagen en tropische dagen hoger zijn dan op andere type dagen in het jaar. Voor het bepalen van de grootte van de piek en de volume worden de volgende stappen genomen:

1. Door middel van de gesmoothe dataset wordt bepaald op welke data en tijdsintervallen er pieken hebben plaatsgevonden. Dit wordt gedaan door te kijken naar pieken die over het gemiddelde waterverbruik + 10% gaan. Daarbij worden de snijpunten van de gesmoothe dataset met de lijn y = µ · 1.1 gebruikt om het begin en het einde van de piek te bepalen. De µ is genomen over de hele tijdreeks.

2. Met de data wordt in de ongesmoothe dataset de grootte van de avondpiek bepaald door middel van de tijdsinterval gevonden met de gesmoothe data. Dit is weergegeven in Figuur 5.3.

3. De breedte van de piek (tijdsduur) en verbruik van de avondpiek worden bepaald voor pieken die na 15:00 plaatsvinden. Dit is doorgaans het tijdstip welke gehanteerd wordt voor het bepalen van avondpieken.

23:00 00:00 01:00 02:00 03:00 04:00 05:00 06:00 07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00 01:00 Tijd in uren 0.02 0.04 0.06 0.08 0.10 0.12 Waterverbuik (in m 3 Waterverbruik op 2016-07-20 Smoothed 60 23:00 00:00 01:00 02:00 03:00 04:00 05:00 06:00 07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00 01:00 Tijd in uren 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 Waterverbuik (in m 3) Waterverbruik op 2016-07-20 Raw Data <--Piek--> <--Piek-->

Figuur 5.3: Pieken op 20 juli 2016. De verticale zwarte lijnen geven de grenzen van de pieken aan tot waar ze in beschouwing genomen worden.

Omdat het verhoogde waterverbruik in de zomer plaatsvinden (zichtbaar in Figuur 4.3), worden de modellen gemaakt voor zowel het hele jaar als voor alleen de zomermaanden (mei, juni, juli, augustus).

(28)

HOOFDSTUK 6

Resultaten

In dit hoofdstuk zijn de resultaten van het onderzoek weergegeven. Dit hoofdstuk is opgebouwd aan de hand van de methode, beschreven in Hoofdstuk 5. Voor een visuele weergave van de ondernomen stappen bij het uitvoeren van het wordt verwezen naar Figuur 5.1.

6.1

Controle eigenschappen variabelen

De tijdreeksen worden eerst op bepaalde eigenschappen gecontroleerd, zoals beschreven in sectie 5.2. Door het controleren van de tijdreeksen wordt bepaald welke variabelen bruikbaar zijn in een regressiemodel. In de resultaten kunnen de weervariabelen weergegeven zijn met de afkortingen gehanteerd door het KNMI. Deze afkortingen zijn in de Definitielijst 1 opgenomen.

6.1.1

Stationair/niet-stationair

De Augmented Dickey-Fuller test is uitgevoerd op de data van het waterverbruik en weervaria-belen op dagschaal om te onderzoeken of de tijdreeks stationair is. De tijdreeksen van zowel een heel jaar als voor alleen de zomermaanden zijn in beschouwing genomen. Mocht een tijdreeks niet-stationair zijn, dan wordt er gekeken door middel van cointegratie of een combinatie van de tijdreeksen wel stationair is. In Tabel 6.1 zijn de resultaten weergegeven voor de weervariabelen en in Tabel 6.3 voor het waterverbruik.

Variabel (Volledig jaar) ADF P-value Critical 5%

Gemiddelde Bewolking (NG) −17.157 6.87E-30 -2.867

Wel/Geen Regen RHt −10.676 4.04E-19 -2.867

Wel/Geen Regen RHt−1 −12.439 3.77E-23 -2.867

Wel/Geen Regen RHt−2 −9.856 4.35E-17 -2.867

Wel/Geen Regen RHt−3 −10.366 2.33E-18 -2.867

Wel/Geen Regen RHt−4 −10.430 1.62E-18 -2.867

Wel/Geen Regen RHt−5 −10.649 4.72E-19 -2.867

Maximale Temperatuur (T Xt) −9.803 5.92E-17 -2.867

Gemiddelde Temperatuur (T Gt) −9.436 5.03E-16 -2.867

Gemiddelde Temperatuur (T Gt−1) −9.388 6.68E-16 -2.867

Gemiddelde Temperatuur (T Gt−2) −9.420 5.52E-16 -2.867

Luchtvochtigheid (U G) −10.804 1.98E-19 -2.867

Verdamping (EV 24) −9.334 9.15E-16 -2.867

(29)

Variabel (Zomermaanden) ADF P-value Critical 5%

Gemiddelde Bewolking (NG) −11.906 5.42E-22 -2.867

Wel/Geen Regen RHt −11.766 1.12E-21 -2.867

Wel/Geen Regen RHt−1 −9.855 4.39E-17 -2.867

Wel/Geen Regen RHt−2 −9.729 9.09E-17 -2.867

Wel/Geen Regen RHt−3 −9.945 2.61E-17 -2.867

Wel/Geen Regen RHt−4 −7.685 1.47E-11 -2.867

Wel/Geen Regen RHt−5 −7.338 1.08E-10 -2.867

Maximale Temperatuur (T Xt) −10.585 6.74E-19 -2.867

Gemiddelde Temperatuur (T Gt) −7.868 5.09E-12 -2.867

Gemiddelde Temperatuur (T Gt−1) −7.773 8.84E-12 -2.867

Gemiddelde Temperatuur (T Gt−2) −7.766 9.18E-12 -2.867

Luchtvochtigheid (U G) −8.154 9.53E-13 -2.867

Verdamping (EV 24) −7.771 8.93E-12 -2.867

Straling (Q) −10.410 1.83E-18 -2.867

Tabel 6.2: Resultaten van de ADF-test op de weervariabelen gebruikt in het model voor de maanden mei-september.

In Tabel 6.1 en Tabel 6.2 is te zien dat alle weersvariabelen een ADF-waarde hebben onder de kritische 5% waarde welke uit de voorgerekende Dickey-Fuller tabellen komen. Ook de p-waarden zijn kleiner dan de gestelde grens van 5%, waarmee de tijdreeksen van de weervariabelen stationair zijn, voor zowel een heel jaar als voor alleen de zomermaanden. De ADF-score voor alle variabelen ook lager dan de kritische waarde van 5%, waarmee in 5% statistische zekerheid gesteld kan worden dat de tijdreeks stationair is.

Variabel (Volledig jaar) ADF P-value Critical 5%

Waterverbruik (Vt) −6.086 1.06E-07 -2.867

Waterverbruik (Vt−1) −5.970 1.95E-07 -2.867

Waterverbruik Duur avondpiek −11.837 7.73E-22 -2.868

Waterverbruik Volume avondpiek −11.829 8.08E-22 -2.868

Tabel 6.3: Resultaten van de ADF-test op het waterverbruik over het hele jaar. Het waterver-bruik Vtis het totaal waterverbruik op een dag.

Variabel (Zomermaanden) ADF P-value Critical 5%

Waterverbruik (Vt) −4.258 5.25E-4 -2.867

Waterverbruik (Vt−1) −4.179 7.14E-4 -2.867

Waterverbruik Duur avondpiek −7.451 5.68E-11 -2.881

Waterverbruik Volume avondpiek −7.478 4.85E-11 -2.881

Tabel 6.4: Resultaten van de ADF-test op het waterverbruik in de zomermaanden. Te zien is in Tabel 6.3 en 6.4 dat het waterverbruik een p-waarde heeft onder de gestelde grens van 5%, waarmee de tijdreeks voor een heel jaar als voor alleen de zomermaanden stationair zijn.

(30)

6.1.2

Cointegratie-test

Doordat alle tijdreeksen stationair zijn is een co-integratie test niet vereist.

6.1.3

Colineariteit

Voor het selecteren van de variabelen in het model wordt eerst gekeken naar de colineariteit van de variabelen. Colineaire variabelen zijn variabelen waarbij een variabel door andere variabelen verklaart kan worden. Als deze variabelen gebruikt worden in een model kan het de betrouw-baarheid reduceren doordat coefficienten overlappen. (Minitab, 2013) Elke keer wordt er een variabel verwijdert totdat de VIF-test, beschreven in Hoofdstuk 5.2.4, waarden geeft onder de 5. In Figuur 6.1 zijn de resultaten zichtbaar van de VIF-test op de weersvariabelen zonder verwij-deren van variabelen. De schaal op de y-as is logaritmisch.

1 10 100 1000 10000 EV24 NG Q RH TG TG1 TG2 TX UG V ar (β ) Colineariteit Test 1

Var (β) Jaar Var(β) Zomer Grenswaarde

Figuur 6.1: Resultaten 1eVIF-test zonder verwijderen van variabelen. Numerieke waarden zijn weergegeven in Tabel C.1.

Uit Figuur 6.1 komt naar voren dat 5 variabelen collinear zijn met een andere weersvariabele over het hele jaar: EV 24, Q, T G, T X en U G, waarbij EV 24 een sterke relatie heeft met Q, gezien evapotranspiratie berekend wordt door middel van straling Q. Daarom wordt EV 24 buiten beschouwing gelaten. In de zomer zijn dezelfde variabelen colineair. T X is verwijdert gezien dat alleen wat zegt over het moment op de dag dat de temperatuur maximaal was. De resultaten van de VIF-test na het verwijderen van deze variabelen zijn weergegeven in Figuur 6.2. De schaal op de y-as is logaritmisch.

(31)

1 10 100 NG Q RH TG TG1 TG2 UG V ar (β ) Colineariteit Test 2

Var (β) Jaar Var(β) Zomer Grenswaarde

Figuur 6.2: Resultaten VIF-test na verwijderen van verdamping EV 24 en maximale temperatuur T X. Numerieke waarden zijn weergegeven in Tabel C.2.

Uit Figuur C.2 is te zien dat 3 variabelen colineair zijn: Q, T G en U G. Daarbij is eerst de variabel straling Q verwijdert, waarna bleek dat er nog steeds colineariteit aanwezig was bij de variabelen T G en U G. Na het verwijderen van de variabelen Q en U G is de VIF-test weer uitgevoerd. Deze resultaten zijn weergegeven in Figuur 6.3.

0 1 2 3 4 5 6 NG RH TG TG1 TG2 V ar (β ) Colineariteit Test 3

Var (β) Jaar Var(β) Zomer Grenswaarde

Figuur 6.3: Resultaten VIF-test na verwijderen van Q en U G. Numerieke waarden zijn weerge-geven in Tabel C.3.

In Figuur 6.3 is te zien dat de waarden voor V ar( ˆβj) onder de 5 is, waarmee het model geen colineariteit meer bevat. Nu wordt voor elk model zoals beschreven in Tabel 5.3 onderzocht of variabelen colineair zijn. Daarbij wordt per model gekeken naar de colineairiteit tussen de

(32)

V ar( ˆβj) V-1 Bt T T-1 T-2 R R-1 R-2 R-3 R-4 R-5 Model 1 1.54 2.69 2.72 1.49 - 2.78 - - - - -Model 2 1.54 2.68 2.75 1.61 - - 1.68 - - - -Model 3 1.55 2.71 2.75 1.54 - - - 1.36 - - -Model 4 1.55 2.64 2.74 1.51 - - - - 1.16 - -Model 5 1.55 2.62 2.72 1.50 - - - 1.09 -Model 6 1.56 2.62 2.71 1.49 - - - 1.07 Model 7 1.58 2.69 2.77 1.61 1.36 2.78 - - - - -Model 8 1.57 2.68 2.78 1.73 1.36 - 1.68 - - - -Model 9 1.57 2.71 2.83 1.63 1.42 - - 1.42 - - -Model 10 1.58 2.65 2.80 1.62 1.39 - - - 1.20 - -Model 11 1.58 2.62 2.78 1.61 1.38 - - - - 1.11 -Model 12 1.59 2.62 2.77 1.61 1.37 - - - 1.08

Tabel 6.5: VIF-test resultaten voor MLR-variabelen zonder straling Q

Uit Tabel 6.5 komt naar voren dat hoe meer dagen er in beschouwing genomen wordt voor het wel of niet voorkomen van regen R, de colineariteit bij deze variabel afneemt. De verschillen in de colineariteit bij de andere variabelen zijn met waarden tussen de 0.1-0.25 minder groot dan bij het verschil bij het wel of niet van regen.

(33)

6.2

Drinkwaterverbruik & Weervariabelen

In deze paragraaf zijn de resultaten weergegeven van het drinkwaterverbruik in combinatie met de verklarende variabelen. Daarbij is gekeken naar correlatie en naar de sterkte van de afhanke-lijkheid uit de regressiemodellen.

6.2.1

Correlatie drinkwaterverbruik per variabele

Van elke weersvariabele en van het totaal waterverbruik van de dag ervoor is door middel van de Pearson Correlation Coefficient onderzocht wat de correlatie is. Door middel van de correlatie co¨efficient kan de sterkte van de correlatie bepaald worden. De resultaten zijn weergegeven in Figuur 6.4. -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 TG TG-1 TG-2 NG RH RH1 RH2 RH3 RH4 RH5 Vt-1 Pear so n C or rela tion C oe ffi cien t (-)

Correlatie Coefficient voor waterverbruik,

avondpiekduur en avondpiek volume

Corr. Coeff. Jaar Corr. Coeff. Zomer Corr. Coef. Volume Avondpiek Jaar

Corr. Coef. Volume Avondpiek Zomer Corr. Coef. Duur Avondpiek Jaar Corr. Coef. Duur Avondpiek Zomer

Figuur 6.4: Correlatie Co¨efficienten voor het waterverbruik, avondpiek-duur en avondpiek volume voor de weersvariabelen gemiddelde temperatuur T G, gemiddelde temperatuur van de dag ervoor T G − 1, gemiddelde temperatuur twee dagen ervoor T G − 2, gemiddelde bewolking N G, wel/niet voorkomen van regen op de dag zelf en tot 5 dagen terug RH − RH5 en het totaal waterverbruik van de dag ervoor Vt−1.

In Figuur 6.4 is te zien dat de correlaties dat het drinkwaterverbruik de dag ervoor een sterke correlatie heeft met het drinkwaterverbruik over zowel het hele jaar of alleen de zomer. De piek-duur en piekgrootte hebben een zwakke correlatie met het gemiddelde temperatuur op een dag en de dag ervoor en het drinkwaterverbruik de dag ervoor. Voor de andere variabelen hebben ze een verwaarloosbare correlatie, gezien de correlatie onder de 0.10 is.

6.2.2

Enkelvoudige Lineaire Regressie

(34)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 TG TG-1 TG-2 NG RH RH1 RH2 RH3 RH4 RH5 Vt-1 R² (-)

R² Enkelvoudige Regressie

voor waterverbruik, avondpiekduur en avondpiek volume

R² Jaar R² Zomer R² Volume Avondpiek Jaar

R² Volume Avondpiek Zomer R² Duur Avondpiek Jaar R² Duur Avondpiek Zomer

Figuur 6.5: R2van enkelvoudige regressie voor het waterverbruik, avondpiek-duur en avondpiek volume voor de weersvariabelen gemiddelde temperatuur T G, gemiddelde temperatuur van de dag ervoor T G − 1, gemiddelde temperatuur twee dagen ervoor T G − 2, gemiddelde bewolking N G, wel/niet voorkomen van regen op de dag zelf en tot 5 dagen terug RH − RH5 en het totaal waterverbruik van de dag ervoor Vt−1.

Te zien is dat de gemiddelde temperatuur op een dag voor zowel T Gt, T Gt−1 als T Gt−2 vol-doende afhankelijkheid hebben. Sterke afhankelijkheid is terug te vinden met het verbruik van de vorige dag Vt−1. Zwakke afhankelijkheid is te zien bij het wel/niet voorkomen RH. In de zomer vertoont RHt, RHt−1en RHt−2 voldoende afhankelijkheid. De gemiddelde temperatuur van twee dagen ervoor heeft een zwakke afhankelijkheid. Vanwege de zeer zwakke afhankelijkheid van de gemiddelde bewolking N G is deze uit de MLR-modellen gehaald.

Voor de avondpiek waterverbruik valt op te maken dat er alleen zwakke afhankelijkheden te vinden zijn, waarbij de gemiddelde temperatuur op de dag zelf en de dag ervoor en het verbruik van de dag ervoor de meeste afhankelijkheid vertonen ten opzichte van de andere variabelen. Zwakke afhankelijkheden zijn te zien voor de duur van de avondpiek, waarbij de gemiddelde temperatuur op de dag zelf en de dag ervoor en het verbruik van de dag ervoor de meeste afhankelijkheid vertonen ten opzichte van de andere variabelen.

(35)

6.2.3

Multi-linear Regressie Modellen

Voor de MLR- modellen wordt er zowel voor het gehele jaar als alleen voor de zomermaanden een model getraind.

De modellen in Tabel 5.3 zijn aangepast met de verwijderde variabelen. De beschrijving van de nieuwe modellen is weergegeven in Tabel 6.6.

Model Parameters Model-T1-RH Vt−1, Tt, Tt−1, Rt Model-T1-RH1 Vt−1, Tt, Tt−1, Rt−1 Model-T1-RH2 Vt−1, Tt, Tt−1, Rt−2 Model-T1-RH3 Vt−1, Tt, Tt−1, Rt−3 Model-T1-RH4 Vt−1, Tt, Tt−1, Rt−4 Model-T1-RH5 Vt−1, Tt, Tt−1, Rt−5 Model-T1-T2-RH Vt−1, Tt, Tt−1, Tt−2, Rt Model-T1-T2-RH1 Vt−1, Tt, Tt−1, Tt−2, Rt−1 Model-T1-T2-RH2 Vt−1, Tt, Tt−1, Tt−2, Rt−2 Model-T1-T2-RH3 Vt−1, Tt, Tt−1, Tt−2, Rt−3 Model-T1-T2-RH4 Vt−1, Tt, Tt−1, Tt−2, Rt−4 Model-T1-T2-RH5 Vt−1, Tt, Tt−1, Tt−2, Rt−5

Tabel 6.6: Modellen welke getest worden. Vtis het drinkwaterverbruik per dag, Ttde gemiddelde temperatuur op een dag, Rthet wel of niet voorkomen van regen op een dag.

De R2 van de modellen zijn weergegeven in Figuur 6.6 en in Figuur 6.7 zijn de gemiddelde ab-solute fout en maximale abab-solute fout weergegeven.

In Figuur 6.6 is te zien dat het verschil in R2 tussen de modellen verschilt met maximaal 0.003, waarbij Model-T1-T2-RH5 met 0.684 de hoogste R2-waarde heeft. In Figuur 6.7 is te zien dat de maximale absolute fout in het model met ongeveer 26% verlaagt kan worden als alleen de zomer in beschouwing genomen wordt in plaats van een heel jaar. Het verschil in de gemiddelde fout over een heel jaar is ongeveer 16%. De gemiddelde absolute fout is het laagst met Model-T1-RH5, zowel in de zomer als over een heel jaar. De maximale absolute fout is het kleinst bij Model-T1-RH, zowel in de zomer als over een heel jaar.

(36)

0.6795 0.68 0.6805 0.681 0.6815 0.682 0.6825 0.683 0.6835 0.684 0.6845 R ² ( -)

R² voor MLR Modellen over het jaar en in de zomer

R² Jaar R² Zomer

Figuur 6.6: R2 van de 12 geteste modellen. Numerieke waarden zijn weergegeven in Tabel F.1 en Tabel F.2. 0 5 10 15 20 25 30 35 40 45 Error (-)

Gemiddelde en maximale absolute fout

voor verschillende MLR-modellen

(37)
(38)

HOOFDSTUK 7

Discussie

7.1

Data

De gebruikte dataset bevatte metingen van juli 2016 tot april 2019. Tijdens het onderzoek is naar voren gekomen dat de data vanaf januari 2018 niet betrouwbaar is, doordat tussen januari 2018 tot april 2019 slechts ´e´en waarde constant gemeten is over de tijd in de dataset. Hierdoor was het noodzakelijk om de dataset te verkleinen tot januari 2018, waarmee deze aanzienlijk verkleind is. De dataset is gesplitst zodat de metingen tussen juli 2016 en juli 2017 gebruikt konden worden voor het trainen van het model. Voor het testen van het model is gekozen voor de metingen van de maanden augustus en september van 2017. De trainingsdataset voor de zomers bevat de data van effectief 1,5 zomer (juli 2016, augustus 2016, mei 2017, juni 2017, juli 2017). De maanden augustus en september 2017 zijn daarbij ook gebruikt als test dataset.

Door tijdsgebrek in het onderzoek was het niet mogelijk om alle locaties te testen. In een vervolgonderzoek kan gekeken worden naar deze locaties om te onderzoeken wat de verschillen zijn tussen de locaties gezien de locaties van kenmerken met elkaar verschillen (verschillende type woningen, locatie, bevolking).

7.2

ADF-test

Uit de ADF-test voor de weervariabelen is naar voren gekomen dat alle weersvariabelen stationair zijn, gezien de p-waarde lager is dan de kritische waarde van 5%. Hierdoor kan de nul-hypothese verworpen worden, welke stelde dat de tijdreeks een unit-root heeft en daarmee niet-stationair zijn. Dit houdt ook in dat voor alle weerparameters over de geteste tijdspan van 1 jaar geen stijgende of dalende trend aanwezig is. Voor een korte tijdspan is dit te verwachten gezien het weer geen trend toont in de korte termijn: zou er over een meerjarige termijn gekeken worden kan er wel een trend opgemerkt worden in het warmer worden van de zomers (KNMI, 2018). Voor het waterverbruik en de pieken in het waterverbruik is uit de ADF-test ook naar voren gekomen dat deze stationair zijn, zowel voor de meting over de hele tijdspan als voor de meting van alleen de zomermaanden mei-augustus.

Een co-integratie test is niet vereist, gezien deze controleert of een combinatie van twee tijdreeksen stationair zijn, als 1 daarvan niet stationair is. Doordat alle tijdreeksen stationair zijn is deze test buiten beschouwing gelaten.

(39)

7.3

Colineariteit

Uit de VIF-test voor het bepalen van colineariteit zijn 4 van de 9 variabelen colineair gebleken: de relatieve verdamping, straling, maximale temperatuur en luchtvochtigheid. De variabelen hebben een hogere mate van colineariteit als er alleen gekeken wordt naar de zomermaanden. Door de colineariteit zijn minder variabelen bruikbaar gebleken voor het maken van een model. Uit de VIF-test voor de verschillende modellen komt naar voren dat hoe meer dagen voor het wel/niet voorkomen van regen in beschouwing genomen worden, hoe lager de colineariteit is van deze variabel.

7.4

Correlatie

Uit de correlatie-test is naar voren gekomen dat de gemiddelde temperatuur op de dag en van 1 en 2 dagen ervoor voldoende correleren met het waterverbruik. Ook het wel/niet voorkomen van regen heeft voldoende correlatie met het drinkwaterverbruik. In de zomermaanden heeft het wel/niet voorkomen van regen een hogere correlatie dan wanneer het hele jaar in beschouwing genomen wordt. Zwakke correlaties zijn zichtbaar wanneer de duur en de volume drinkwater van de 2e piek op een dag in beschouwing genomen wordt. Daar heeft alleen het drinkwaterverbruik van de dag ervoor en de gemiddelde temperatuur van de dag ervoor een zwakke correlatie. De rest heeft een zeer zwakke correlatie.

7.5

Enkelvoudige Lineaire Regressie Modellen

Bij de enkelvoudige lineaire regressiemodellen op de training dataset over het hele jaar laat de ge-middelde temperatuur op de dag zelf als van 1 en 2 dagen ervoor voldoende afhankelijkheid zien. Het drinkwaterverbruik van de dag ervoor laat een sterke afhankelijkheid zien met een waarde van 0.657 over het hele jaar en 0.649 in alleen de zomermaanden. De gemiddelde bewolking heeft gedurende het jaar als in de zomermaanden een zwakke afhankelijkheid. Een van de redenen voor de zwakke afhankelijkheid kan zijn dat de gemiddelde temperatuur en voorkomen van regen belangrijkere factoren zijn voor mensen om bijvoorbeeld de tuin te wateren dan wanneer er meer bewolking is.

Het wel/niet voorkomen van regen heeft een zwakke afhankelijkheid over het jaar en voldoende afhankelijkheid wanneer alleen de zomermaanden in beschouwing genomen worden. Dit kan ver-klaart worden doordat er in de zomer het wel/niet voorkomen van regen over meerdere dagen een reden kan zijn voor het wel/niet besproeien van de tuin, wat tot een verhoogt drinkwater-verbruik leidt. In dit onderzoek komt een lag van 2 dagen als beste naar voren gekeken naar de enkelvoudige regressie.

De enkelvoudige modellen voor piekduur en piekvolume laten zeer zwakke afhankelijkheden zien met de gekozen weervariabelen. Ook is er alleen zwak tot voldoende correlatie tussen de gemid-delde temperatuur op de dag zelf en een dag ervoor en het waterverbruik van een dag ervoor. Dit kan een indicatie zijn dat de gekozen methode voor het isoleren van de pieken verkeerd is of de gekozen verklarende variabelen niet geschikt zijn voor het voorspellen van de tweede piek. Door de lage afhankelijkheden is er geen multi-lineaire regressiemodel uitgevoerd.

7.6

Multi-Lineaire Regressiemodellen

Van de geteste multi-lineaire regressiemodellen presteert Model-T1-RH5 het beste over zowel een heel jaar als alleen in de zomer. Dit model is beschreven als Vt−1, Tt, Tt−1, Rt−5. In dit model is het wel/niet voorkomen van regen over de voorgaande vijf dagen meegenomen, als ook de temperatuur op de dag zelf, die van een dag ervoor en het waterverbruik van een dag ervoor.

(40)

2008). De afhankelijkheid tussen de verklarende variabelen en het drinkwaterverbruik is tussen de modellen met een verschil van 0.001 en 0.002 verwaarloosbaar.

(41)
(42)

HOOFDSTUK 8

Conclusie

Het doel van het onderzoek was te zoeken naar weersvariabelen welke gebruikt kunnen worden in een model om eigenschappen van de avondpiek te voorspellen. Daarbij is onderzoek gedaan naar de duur van de avondpiek en het volume drinkwater wat gebruikt wordt bij de avondpiek. Uit dit onderzoek komt naar voren dat de gekozen weervariabelen onderhevig zijn aan colineariteit, waardoor ze niet allemaal gebruikt kunnen worden in ´e´en model. Van de gebruikte weersvariabe-len correleren alleen 3 zwak met het voorkomen van de avondpiek: de gemiddelde temperatuur op de dag zelf, de dag ervoor en het waterverbruik een dag ervoor. Wanneer alleen de zomer in beschouwing genomen wordt is er een hogere mate van colineariteit tussen de variabelen dan wanneer een heel jaar in beschouwing genomen wordt. Het model waarbij de gemiddelde tempe-ratuur van de dag zelf, de dag ervoor, het voorkomen van regen in de afgelopen vijf dagen en het waterverbruik van de dag ervoor scoort het beste in het voorspellen van het drinkwaterverbruik over het hele jaar en in de zomermaanden.

8.1

Vervolgonderzoek

Gezien de geteste variabelen allemaal in relatie staan tot het weer is het in een vervolgonderzoek interessant om te kijken naar socio-economische variabelen, welke mogelijk minder onderhevig zijn aan colineare factoren. Een andere suggestie is om andere combinatie van weersvariabelen te testen, zodat andere weervariabelen, zoals straling Q, getest kunnen worden. Ook kan er gekeken worden naar onderscheidt tussen werkdagen en weekenddagen in zowel het drinkwaterverbruik als de duur en volume van de avondpiek. Ook factoren als de grootte van tuinen, aantal badka-mers in een huishouden of bevolkingsgrootte in het meetgebied kunnen in een vervolgonderzoek meegenomen worden om te kijken of deze geschikt zijn voor het verklaren van de avondpiek op een dag.

(43)
(44)

HOOFDSTUK 9

Referenties

Adamowski, J. F. (2008). Peak Daily Water Demand Forecast Modeling Using Artificial Neural Networks. Journal of Water Resources Planning and Management, 134 (2), 119–128. Bakker, M., Van Duist, H., Van Schagen, K., Vreeburg, J. & Rietveld, L. (2014). Improving

the performance of water demand forecasting models by using weather input. Procedia Engineering, 70, 93–102.

Bland, J. M. & Altman, D. G. (2011). Correlation in restricted ranges of data. BMJ, 342. doi:10.1136/bmj.d556. eprint: https://www.bmj.com/content

Corrius, J. (2018). Simple stationarity tests on time series. bluekiri. Verkregen van https : / / medium.com/bluekiri/simple-stationarity-tests-on-time-series-ad227e2e6d48

Haque, M. M., Egodawatta, P., Rahman, A. & Goonetilleke, A. (2015). Assessing the signifi-cance of climate and community factors on urban water demand. International Journal of Sustainable Built Environment, 4 (2), 222–230.

KNMI. (2018). Trends in weerextremen in Nederland. KNMI. Verkregen van https://www.knmi. nl/over-het-knmi/nieuws/trends-in-weerextremen-in-nederland

KNMI. (2019). Daggegevens van het weer. KNMI. Verkregen van https://www.knmi.nl/kennis-en-datacentrum/achtergrond/daggegevens-van-het-weer

KNMI. (2019). Verdamping in Nederland. KNMI. Verkregen van https://www.knmi.nl/kennis-en-datacentrum/achtergrond/verdamping-in-nederland

Minitab. (2013). What Are the Effects of Multicollinearity and When Can I Ignore Them? Minitab. Verkregen van https://blog.minitab.com/blog/adventures-in-statistics-2/what-are-the-effects-of-multicollinearity-and-when-can-i-ignore-them

Ogee, A. & Ellis, M. (2013). Enough Is Enough! Handling Multicollinearity in Regression Ana-lysis. Verkregen van https://blog.minitab.com/blog/understanding- statistics/handling-multicollinearity-in-regression-analysis

SciPy. (2019). scipy.stats.pearsonr. The SciPy community. Verkregen van https://docs.scipy. org/doc/scipy/reference/generated/scipy.stats.pearsonr.html

(45)

Vertommen, I., Blokker, d. i. E., Albert, i. M. & Agudelo-Vera, d. i. C. (2018). Weers- en sei-zoensinvloeden op waterverbruik. Weers- en seisei-zoensinvloeden op waterverbruik, 2–2. Vertommen, I. [Ina] & Blokker, M. (2016). BTO 2016.004 Weers- en seizoensinvloeden op

water-verbruik in DMAs. KWR Water.

Vonk, E., Cirkel, D. & Leunk, I. (2017). De gevolgen van klimaatverandering en vakantiespreiding voor de drinkwatervraag.

Vos, M. & Bolwijn, M. (2018). Wees zuinig met water, zeggen waterbedrijven, maar van een tekort is geen sprake. De Volkskrant. Verkregen van https://www.volkskrant.nl/nieuws- achtergrond/wees-zuinig-met-water-zeggen-waterbedrijven-maar-van-een-tekort-is-geen-sprake∼b2070ab1/

Weisberg, S. (2014). Applied Linear Regression. Wiley.

Xenochristou, M., Blokker, M. e.a. (2018). Investigating the Influence of Weather on Water Consumption: A Dutch Case Study.

(46)

BIJLAGE A

Grafieken KNMI Weerdata

(47)

Dec Jan Feb Mar Apr May Jun

Jul

Aug Sep Oct Nov Dec Jan

Time

0

50

100

150

200

250

300

350

RH

RH 2016

Dec Jan Feb Mar Apr May Jun

Jul

Aug Sep Oct Nov Dec Jan

Time

0

100

200

300

400

RH

RH 2017

Dec Jan Feb Mar Apr May Jun

Jul

Aug Sep Oct Nov Dec Jan

Time

0

100

200

300

400

RH

RH 2018

2018

(48)

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time

0

50

100

150

200

250

TG

TG 2016

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time

0

50

100

150

200

250

TG

TG 2017

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time

50

0

50

100

150

200

250

300

TG

TG 2018

2018

(49)

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan Time 50 60 70 80 90 100 UG

UG 2016

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time 50 60 70 80 90 100 UG

UG 2017

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time 40 50 60 70 80 90 100 UG

UG 2018

2018

(50)

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time

0

500

1000

1500

2000

2500

3000

Q

Q 2016

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time

0

500

1000

1500

2000

2500

3000

Q

Q 2017

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time

0

500

1000

1500

2000

2500

3000

Q

Q 2018

2018

(51)

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan Time 0 10 20 30 40 50 EV24

EV24 2016

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time 0 10 20 30 40 50 EV24

EV24 2017

Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan

Time 0 10 20 30 40 50 EV24

EV24 2018

2018

(52)

BIJLAGE B

Scatterplots Weer-variabelen tegenover

waterverbruik

0

50

100

150

200

250

Gemiddelde temperatuur per dag (in 0.1 graden Celsius)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en TG gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: 0.5014498169184654

(53)

0

50

100

150

200

250

Gemiddelde temperatuur per dag (in 0.1 graden Celsius)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en TG1 gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: 0.39493836085283746

Figuur B.2: Scatterplot Gemiddelde temperatuur op t − 1 tegenover volume drinkwaterverbruik

0

50

100

150

200

250

Gemiddelde temperatuur per dag (in 0.1 graden Celsius)

40

50

60

70

80

90

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en TG2 gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: 0.34872176648827263

(54)

0

20

40

60

80

Etmaalgemiddelde relatieve luchtvochtigheid (in procenten)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en UG gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: 0.23904590516324903

Figuur B.4: Scatterplot Relatieve Luchtvochtigheid op t = 0 tegenover volume drinkwaterver-bruik

0

500

1000

1500

2000

2500

3000

Relatieve straling (in J/cm2)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en Q gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: 0.5214121849176104

(55)

0

1

2

3

4

5

6

7

8

Etmaalgemiddelde bewolking (in achtsten, 9=bovenlucht onzichtbaar

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en NG gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: 0.10118394603668786

Figuur B.6: Scatterplot Gemiddelde Bewolking op t = 0 tegenover volume drinkwaterverbruik

0.0

0.2

0.4

0.6

0.8

1.0

Etmaalsom Neerslag (in mm) (-1 als <0.05mm)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en RH gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: -0.29625423380767507

(56)

0.0

0.2

0.4

0.6

0.8

1.0

Neerslag Wel (1) / Niet (0)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en RH2 gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: -0.2960848803135355

Figuur B.8: Scatterplot voorkomen regen op t − 1 tegenover volume drinkwaterverbruik

0.0

0.2

0.4

0.6

0.8

1.0

Neerslag Wel (1) / Niet (0)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en RH3 gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: -0.25383455017302564

(57)

0.0

0.2

0.4

0.6

0.8

1.0

Neerslag Wel (1) / Niet (0)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en RH4 gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: -0.19061103552007888

Figuur B.10: Scatterplot voorkomen regen op t − 3 tegenover volume drinkwaterverbruik

0.0

0.2

0.4

0.6

0.8

1.0

Neerslag Wel (1) / Niet (0)

40

50

60

70

80

90

100

W

at

er

ve

rb

ru

ik

pe

r d

ag

in

m

3

Scatterplot Waterverbruik en RH5 gedurende 01/07/2016-31/07/2017

Pearson Correlation coefficient: -0.179890100706043

(58)

BIJLAGE C

Tabellen Resultaten Colineariteit

Weersvariabel V ar( ˆβj)year V ar( ˆβj)summer

EV24 207.767 2272.255 NG 3.367 3.546 Q 176.302 2019.007 RH 1.134 4.236 TG 117.742 755.334 TG1 1.511 1.414 TG2 1.353 1.234 TX 139.126 375.133 UG 10.381 93.792

Tabel C.1: Resultaten van de VIF-test voor alle in beschouwing genomen weerparameters over het hele jaar.

Weersvariabel V ar( ˆβj)year V ar( ˆβj)summer

NG 2.785 2.901 Q 7.175 17.581 RH 2.732 2.343 TG 7.282 16.160 TG1 1.493 1.393 TG2 1.326 1.183 UG 5.924 22.383

Tabel C.2: Resultaten van de VIF-test na het verwijderen van colineare variabelen.

Weersvariabel V ar( ˆβj)year V ar( ˆβj)summer

NG 1.568 2.063

RH 1.798 2.146

TG 2.258 3.750

TG1 1.481 1.383

TG2 1.325 1.181

(59)
(60)

BIJLAGE D

Tabellen Correlatie Coefficient

Weersvariabel Corr. Coef. Year Cor. Coef. Summer

Gemiddelde Temperatuur (T Gt) 0.42 0.40 Gemiddelde Temperatuur (T Gt−1) 0.35 0.32 Gemiddelde Temperatuur (T Gt−2) 0.30 0.27 Gemiddelde Bewolking (NG) 0.09 0.14 Wel/Geen Regen RHt −0.27 −0.35 Wel/Geen Regen RHt−1 −0.30 −0.38 Wel/Geen Regen RHt−2 −0.27 −0.35 Wel/Geen Regen RHt−3 −0.21 −0.28 Wel/Geen Regen RHt−4 −0.19 −0.25 Wel/Geen Regen RHt−5 −0.19 −0.24 Waterverbruik Vt−1 0.82 0.83

Tabel D.1: Pearson Correlation Coefficient voor verschillende weervariabelen en drinkwaterver-bruik vorige dag voor zowel een heel jaar als voor alleen de zomermaanden.

Referenties

GERELATEERDE DOCUMENTEN

syscope Imago verbrede landbouw Duurzaamheid meten Nieuw Gemengd Bedrijf Horst Innovatiekracht akkerbouw Nieuw concept: ‘Habitatboerderij’ Vervanger van veen... is een kwartaalblad

Dit betekent dus dat in Nederland over de afgelopen jaren door vermindering van het aantal stofdeeltjes meer zonnewarmte de Aarde heeft

Veel van dit materiaal is heden ten dage voor de bouw in- teressant; tras, gemalen tuf is zeer geschikt als specie voor waterdicht metselwerk.. Bims, puimsteenkorrels tot

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of

Het onderzoek van Filip Dewallens naar het statuut van de ziekenhuisarts kon niet op een beter moment komen. Het statuut bestaat nu bijna 30 jaar, maar grondig juridisch onderzoek

Daarbij koppelt de auteur de eigendomsexclusiviteit voor het eerst zeer expli- ciet aan de (actieve) elasticiteit van het eigendomsrecht. Hierdoor komen een aan- tal paradigma’s op

Met deze wijziging worden de beleidsregels aangepast aan de Tweede nadere aanwijzing van de Minister voor Medische Zorg (MZ).. De

Het ontwikkelen van een robuust en betrouwbaar monitoringsysteem op het gebied van instroom, doorstroom en uitstroom van studenten en medewerkers, zodat vooruitgang met betrekking