• No results found

Herontwerp van het voorspellingsproces van TPG Post Pakketservice

N/A
N/A
Protected

Academic year: 2021

Share "Herontwerp van het voorspellingsproces van TPG Post Pakketservice "

Copied!
26
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Het voorspellingsproces

Meer dan alleen de keuze van een voorspellingstechniek

- bijlagen bij openbare versie -

(2)

Herontwerp van het voorspellingsproces van TPG Post Pakketservice

- bijlagen bij openbare versie -

Afstudeerscriptie Technische Bedrijfswetenschappen Universiteit Groningen, Faculteit Bedrijfskunde Juni 2004

Auteur: Bart van Rossenberg

Eerste begeleider: Dr. ir. H. van de Water Tweede begeleider: Prof. dr. J.J. van der Werf Begeleider bedrijf: M.G.M. Groenewegen

(3)

Inhoudsopgave

Bijlage A Overzicht structuur TPG 4

Bijlage B Persbericht Masterplan pakketservice 5 Bijlage C Overzicht van de drie verzorgingsgebieden 6 Bijlage D Overzicht verschillende producten binnen sortering 7

Bijlage E Voorspellingen van Tijdreeksen 8

Bijlage E Voorspellingen van Tijdreeksen 8

Bijlage F Overzicht spreiding grote klanten TPP 23 Bijlage G Karakteristieken van het voorspellingsproces 24 Bijlage H Procedure aanmelden incidentele partij 25

Bijlage I Afkortingen en Begrippen 26

(4)

Bijlage A Overzicht structuur TPG

TPG

TPG is in 1998 ontstaan na de splitsing van Koninklijke PTT Nederland (KPN) in het telecommunicatiebedrijf KPN Telecom en de logistieke dienstverlener TPG. In 1996 had KPN het Australische express- en logistiek- bedrijf TNT gekocht om het concurrentievermogen van het postonderdeel van de organisatie te behouden na de opsplitsing van KPN. Het toen ontstane bedrijf TPG is opgedeeld in de drie divisies Express, Logistics en Mail. De belangrijkste merknamen die gevoerd worden zijn TNT en TPG Post.

De divisies Logistics en Express opereren voornamelijk onder de merknaam TNT. TNT kent twaalf business units in de divisie Express en negen in de divisie Logistiek. De express-markt is vooral zakelijk van aard.

Documenten en pakketten moeten binnen een specifiek gegarandeerd tijdskader op de plaats van bestemming aankomen. De zending wordt door TNT overal ter wereld zelf afgeleverd bij de geadresseerde.

Tot 1 mei 2002 was PTT Post de voornaamste merknaam in de divisie Mail. Per 1 mei 2002 is deze naam omgedoopt tot TPG Post. In figuur A-1 is de organisatiestructuur van TPG te zien.

Supervisory Board

Express Division

Mail Division Logistics Division

Board of Management

Figuur A-1 Divisiestructuur TPG

TPG Post

De divisie Mail biedt de volgende diensten aan:

Collectie, sortering, transport en aflevering van binnenlandse en internationale post;

Distributie van geadresseerde en ongeadresseerde direct mail;

Een breed scala van ondersteunende activiteiten met toegevoegde waarde, waaronder direct marketing en het beheer van fysieke en elektronische informatiestromen.

De activiteiten van de divisie Mail zijn ondergebracht in business units. TPG Post Pakketservice is één van de onafhankelijke businessunits van de divisie Mail. Dit is schematische weergegeven in figuur A-2. De noodzaak om van de pakketdienst een onafhankelijke business unit te maken ligt vooral in het feit dat pakketten veel bewerkelijker zijn dan brieven door de verschillen in afmetingen, gewicht, etc. Brieven zijn gestandaardiseerd en kunnen dus meer als bulkproduct behandeld worden. Het aantal menselijke handelingen dat bij collectie, sorteren en distributie van pakketten verricht moet worden is vele malen groter dan bij het verwerken van brieven.

Mail

Productie BU's Directeur Sales

Staven & Services

Directeur Spring Directeur Cendris

Directeur Mail Nederland Directeur EMN

Staven & Services

Directie mail

Zakelijke Markt Internationaal & Consumentenmarkt Distributie Sortering Pakketservice Transport Grootzakelijk

Figuur A-2 Organisatiestructuur TPG Post

(5)

Bijlage B Persbericht Masterplan pakketservice

- De bijlage is weggelaten aangezien deze vertrouwelijke informatie bevat -

(6)

Bijlage C Overzicht van de drie verzorgingsgebieden

- De bijlage is weggelaten aangezien deze vertrouwelijke informatie bevat -

(7)

Bijlage D Overzicht verschillende producten binnen sortering

- De bijlage is weggelaten aangezien deze vertrouwelijke informatie bevat -

(8)

Bijlage E Voorspellingen van Tijdreeksen

1.1 Inleiding

In deze bijlage wordt gedetailleerd gekeken naar een deel van de kenmerken van de input van het voorspellingsproces: de vraag naar pakketten. Het voorspellingsproces zorgt voor de transformatie van deze historische vraag naar pakketten in een voorspelling van de toekomstige benodigde verwerkingscapaciteit (output). De kenmerken van deze input hebben invloed op het voorspellingsproces en bepalen in hoeverre het mogelijk is om voorspellingen te doen die uitkomen. De historische vraag naar pakketten is beschikbaar in de vorm van een tijdreeks (een verzameling observaties van een variabele in de tijd). Met behulp van de tijdreeks kan een model opgesteld worden waarmee de toekomstige waarden van de tijdreeks voorspeld kunnen worden. Het vinden van geschikte voorspellingsmodellen is het doel van deze bijlage.

De bijlage valt grofweg uiteen in een zestal stappen. Begonnen wordt met de beschrijving van de gebruikte tijdreeks. Vervolgens worden de belangrijkste componenten van deze tijdreeks benoemd en beschreven (decompositie). Hierna wordt een aantal kenmerken van de tijdreeks in detail bekeken (achtergrond). Op deze manier ontstaat een beeld van de beschikbare tijdreeks dat gebruikt kan worden voor de formulering van de voorspellingsmodellen. Deze voorspellingsmodellen zullen worden getest (experimenten) en de resultaten zullen worden geëvalueerd. De belangrijkste conclusies worden vanzelfsprekend gebruikt in het hoofdonderzoek. Figuur E-1 geeft de structuur van deze bijlage weer. In de volgende paragraaf wordt begonnen met de beschrijving van de beschikbare tijdreeks(en).

Figuur E-1 Structuur bijlage Voorspellingen van Tijdreeksen

1.1.1 Beschikbare gegevens

In deze bijlage wordt gebruik gemaakt van twee verschillende tijdreeksen: een tijdreeks van het sorteercentrum Amsterdam (ASD) en een tijdreeks van het totaal (TOT) van de drie sorteercentra (ASD, ZWL en DDT). Met betrekking tot het sorteercentrum Amsterdam zijn gegevens beschikbaar over de periode april 2001 tot en met december 2003 (32 maanden) van de pakketten die voor de eerste maal worden aangeboden op het sorteercentrum Amsterdam1. Van het totaal van de drie sorteercentra zijn gegevens beschikbaar van de jaren: 2001, 2002, 2003 en 2004 (48 maanden). In eerste instantie zullen beide tijdreeksen worden gebruikt in de analyse. Na de decompositie zal de aandacht echter liggen bij de tijdreeks ASD. Uiteindelijk gaat het namelijk om een voorspelling per sorteercentrum en niet voor het totaal.

Zoals eerder omschreven wordt in dit onderzoek minder aandacht besteed aan de voorspellingen voor distributie. Ten eerste is de beschikbaarheid van informatie met betrekking tot de verschillende distributiecentra van TPP uiterst gering. Ten tweede is relevantie van een analyse van de huidige vraag, gezien de voorgenomen overhevelingen van de BU Distributie naar de BU TPP, gering.

1.1.2 De tijdreeks

In een tijdreeks is tijd de onafhankelijke variabele. De afhankelijke variabele (in dit geval het dagelijks aantal te verwerken pakketten) neemt over de tijd verschillende waarden aan. Met behulp van de historische gegevens van deze tijdreeks (gedrag uit het verleden) is het mogelijk om een uitspraak te doen over het toekomstige aantal te verwerken pakketten (gedrag in de toekomst). Een geobserveerde tijdreeks X, bestaande uit t observaties, wordt op de volgende manier weergegeven (vergelijking E-1):

t 2

1,X,...,X X

X= (Vergelijking E-1) De voorspelling op een willekeurig tijdstip (t+n) in de toekomst is:

n

Xˆ t

+ (Vergelijking E-2)

1 Pakketten die voor de eerste maal worden aangeboden worden verwerkt in de eerste sorteerslag. In deze bijlage worden dus alleen voorspellingen gemaakt voor de eerste sorteerslag. Voor (de voorspellingen van) andere sorteerslagen is men afhankelijk van de collega sorteercentra (uitwisseling).

(9)

Vergelijking tussen de werkelijke waarde en de voorspelde waarde maakt het mogelijk om een uitspraak te doen over de voorspellingsfout (et+n). Deze wordt als volgt weergegeven:

n t n t n

t X Xˆ

e + = + + (Vergelijking E-3)

Alle data van de geobserveerde variabele worden de historische data genoemd. De sample data worden gebruikt om het model van de tijdreeks te maken en maken deel uit van de historische data. De voorspellingsperiode is verdeeld in twee gescheiden perioden: de ex post en de ex ante voorspelling. De ex post periode is de periode vanaf de eerste observatie na het einde van de sample periode tot de laatste geobserveerde waarde van de historische data. Ex post voorspellingen kunnen getoetst worden omdat de werkelijke waarden ook beschikbaar zijn: divide and conquer (Eppen et al., 1998, 641).Op deze manier is het mogelijk om de voorspellingsfout te bepalen. De ex ante periode begint na de laatste geobserveerde waarde van de historische data. Van deze periode zijn geen observaties beschikbaar en het is deze periode die voorspeld moet worden met het model. Figuur E-2 geeft dit weer (Gaynor et al., 1994, 8). In deze bijlage worden geen ex ante voorspellingen gemaakt. De gevonden modellen worden getest met behulp van de ex post periode.

Figuur E-2 De historische data en de voorspellingsperiode

1.1.3 Het tijdreekspatroon

Theoretisch zijn in een tijdreeks een viertal componenten (standaardpatronen) te onderscheiden, die het verloop kunnen verklaren (Hanke et al., 1984, 272). In de praktijk bestaan tijdreeksen doorgaans uit een combinatie van twee of meer van deze patronen. Hieronder worden deze patronen nader toegelicht.

De trend (T). Een aanhoudende op- of neerwaartse beweging in de tijdreeks. De trend geeft de lange- termijnontwikkeling weer van de tijdreeks (figuur E-3).

De seizoencomponent (S). Invloeden die regelmatig terugkeren in de tijdreeks. Het gaat om een herhalend patroon binnen een vaste periode (bijvoorbeeld weersinvloeden of vakanties) (figuur E-4).

De cycluscomponent (C). Ook wel conjunctuurcomponent. Het gaat hierbij om een meerjarige cyclische veranderingen als gevolg van periodes van economische groei en economische recessie (figuur E-5).

De toevallige component (E). Component van de tijdreeks als gevolg van onvoorspelbare, toevallige fluctuaties. Door het willekeurige karakter zijn deze variaties niet te voorspellen (figuur E-6).

Figuur E-3 De trend van een tijdreeks Figuur E-4 De seizoenscomponent van een tijdreeks

Figuur E-5 De cyclische component van een tijdreeks Figuur E-6 De toevallige component van een tijdreeks Bovenstaande algemene beschrijving vormt de basis voor de decompositie van de tijdreeks in de volgende paragraaf.

1.2 Decompositie

In deze paragraaf zal aan de hand van de methode van decompositie (Hanke et al., Brand, Gaynor et al.) het gedrag van de tijdreeks worden ontleed (zowel voor ASD als voor TOT). De tijdreeks zal als het ware worden ontrafeld (decompositie) in de, in de vorige paragraaf beschreven, vier algemene componenten. Hierdoor wordt het gedrag van de tijdreeks (deels) verklaard en ontstaat een beeld van de aanwezigheid van eventuele onregelmatigheden in de tijdreeks (grootte van de toevallige component). Waarden van de tijdreeks die niet te

(10)

verklaren zijn, worden namelijk beschouwd als toevallige waarden. Onregelmatigheden in de vraag hebben een negatieve invloed op de voorspelbaarheid. Deze onregelmatigheden zijn niet of niet goed te voorspellen.

Belangrijk is de relatie tussen de in de vorige paragraaf beschreven vier componenten (trend, seizoen, cyclus en toevallig) en de tijdreeks. Een veel gebruikte relatie is de onderstaande, multiplicatieve relatie.

t t t t

t T*S*C*E

X = (Vergelijking E-4 Multiplicatieve relatie)

Bovenstaande relatie geeft het zogenaamde multiplicatieve model weer (in tegenstelling tot het additieve model). Belangrijkste verschil is dat in het additieve model de tijdreeks wordt gevormd door de optelling van de verschillende componenten, terwijl het in het multiplicatieve model gaat om een vermenigvuldiging. Dit heeft tot gevolg dat bij het multiplicatieve model de seizoensafwijking als procentuele correctiefactor van de trend kan worden beschouwd en dus niet altijd even groot is (Buijs, 1994, 373). Wanneer er gekeken wordt naar het verloop van het aantal pakketten op dagbasis dan blijkt dit te kloppen: de seizoenscomponent neemt af (kleinere pieken) en daarnaast is er een dalende trend te zien. In de onderstaande figuren wordt dit getoond aan de hand van het verloop van de tijdreeksen TOT en ASD.

40000 60000 80000 100000 120000 140000 160000 180000

Figuur E-7 Tijdreeks ASD (aantallen pakketten per dag)

50000 150000 250000 350000 450000 550000 650000

Figuur E-8 Tijdreeks TOT (aantallen pakketten per dag) In het vervolg van deze bijlage wordt dan ook een multiplicatieve relatie verondersteld tussen de verschillende componenten van de tijdreeks. De tijdreeksen (TOT en ASD) worden ontleed aan de hand van de klassieke multiplicatieve tijdreeksanalyse (Brand, 1993, 175), bestaande uit vier stappen.

Stap 1: de seizoensindex (St). In de eerste stap wordt aandacht besteed aan de seizoensinvloeden in de tijdreeks. In beide tijdreeksen is het mogelijk om een duidelijk seizoenspatroon te onderscheiden: een jaarlijks terugkerende piek tijdens de Kerst- en NieuwJaars-periode (KNJ-periode) en een jaarlijkse daling in de vraag ten tijde van de zomer (vergelijk figuur E-8 en E-9). Daarnaast is er een periodiek wijziging in de vraag te ontdekken rondom Goede Vrijdag en Hemelvaart.

Met behulp van het gecentreerd voortschrijdende gemiddelde2 (centred moving average) is het mogelijk om de grootte van de seizoensindex te bepalen. Deze seizoensindex maakt het mogelijk om de tijdreeks te corrigeren voor seizoensinvloeden, waardoor een duidelijker beeld ontstaat van de tijdreeks. Essentieel bij de bepaling van de seizoensindex is het aantal seizoensindices dat gebruikt gaat worden. Het aantal seizoensindices is afhankelijk van het periodieke patroon. In het geval van een maandelijkse invloed ligt het voor de hand om twaalf seizoensindices te bepalen. In overleg binnen TPP is in dit geval besloten om een analyse te maken op weekbasis. Belangrijke overweging hierin was bijvoorbeeld de piek ten tijde van de KNJ- periode: eind November wordt de stijging ingezet, maar de daadwerkelijke piek vindt pas twee weken later plaats. Om dit onderscheid te behouden is gekozen voor de analyse van een wekelijks seizoenspatroon, met dientengevolge 52 seizoensindices. Probleem bij de analyse van de wekelijkse data is dat niet alle weken bestaan uit een gelijk aantal werkdagen. Deze weken dienen derhalve gecorrigeerd te worden3. Met behulp van het gecentreerd voortschrijdende gemiddelde is het dan mogelijk om de seizoensindices voor de weken te bepalen. In tabel E-1 zijn de seizoensindices voor de tijdreeks TOT weergegeven.

2 Vergelijking van werkelijke waarde en van het gecentreerde voortschrijdend gemiddelde geeft de seizoensindex (Brand, 1993, 177).

3 Correctie: de wekelijkse waarde wordt gedeeld door het aantal werkdagen en vermenigvuldigt met vijf. Zo ontstaan ‘gelijke’ weken.

(11)

Week St Week St Week St Week St

1 84.0% 14 101.6% 27 95.7% 40 101.7%

2 95.8% 15 100.7% 28 92.2% 41 104.3%

3 104.3% 16 98.6% 29 86.6% 42 104.2%

4 105.2% 17 101.0% 30 80.5% 43 102.3%

5 102.0% 18 100.0% 31 75.4% 44 105.8%

6 103.5% 19 98.1% 32 76.5% 45 107.0%

7 98.1% 20 100.2% 33 85.0% 46 109.3%

8 100.4% 21 99.1% 34 88.4% 47 109.1%

9 98.2% 22 95.5% 35 94.1% 48 113.6%

10 96.4% 23 96.7% 36 98.6% 49 118.3%

11 98.7% 24 97.2% 37 100.0% 50 144.9%

12 101.7% 25 97.8% 38 101.3% 51 155.0%

13 102.5% 26 97.2% 39 101.9% 52 73.8%

Tabel E-1 Seizoensindices TOT

De waarden van de tijdreeks in een week worden gecorrigeerd door de seizoensindices. Zo ontstaat een gecorrigeerde tijdreeks, waarmee het mogelijk is de eventuele aanwezigheid van een trend te bepalen.

Stap 2: de trend (Tt). Tweede stap uit de analyse is de vaststelling van de aanwezigheid van de Trend (lange-termijnontwikkeling). Op basis van de, door middel van de seizoensindices, gecorrigeerde tijdreeks is het mogelijk om een uitspraak te doen over de aanwezigheid van een trend in de tijdreeksen. De gecorrigeerde tijdreeksen ASD en TOT laten een duidelijke lineaire neerwaartse trend zien. Het lijkt dan ook goed mogelijk om de trend te beschrijven aan de hand van een lineaire dalende lijn. De meest gebruikte methode om een lineaire trend te beschrijven is die van de kleinste kwadraten methode. Deze methode minimaliseert de som van de verticale afwijkingen tussen de lineaire trend en de werkelijke waarden. De methode resulteert in een vergelijking van de trend met de volgende kenmerken:

bt a

Tt = + (Vergelijking E-5 Trend)

Hierbij is Tt de waarde van de trend op tijdstip t, a is de waarde van de trend op tijdstip t = 0 (komt overeen met het snijpunt van de trend met de Y-as) en b is de waarde van de gemiddelde stijging of daling voor een tijdsperiode. Toepassing van de methode der kleinste kwadraten levert de volgende lineaire vergelijkingen op:

t 189 , 58 313016

Tt = (Vergelijking E-6 Trend TOT)

t 432 , 16 101230

Tt = (Vergelijking E-7 Trend ASD)

In figuur E-9 worden de trend (witte lijn) en de vergelijking van de trend voor de tijdreeks TOT weergegeven.

Naast de duidelijke lineaire daling zijn er nog een aanzienlijk aantal uitschieters te zien.

Xt = 313016 - 58,189t

0 50 100 150 200 250 300 350 400 450 500

Figuur E-9 Trend TOT (in duizenden)

Stap 3: de cycluscomponent (Ct). Volgende stap is de analyse van de cycluscomponent van de tijdreeks.

Deze component verwijst naar het gegeven dat er in sommige jaren sprake is van economische opbloei en in andere jaren van economische neergang. Bij tijdreeksanalyse kunnen deze conjunctuurgolven herkend worden, wanneer waargenomen uitkomsten voor een langere periode onder of boven de trendlijn liggen. Het

(12)

tijdreeksen is dit verschijnsel niet waargenomen. Hiervoor is de periode waarover gegevens beschikbaar zijn ook vrij kort (met name ASD). Daarnaast hebben berekeningen op basis van het voortschrijdend gemiddelde (seizoensindices) als resultaat dat de uitkomsten al ‘vanzelf’ meegaan met de conjunctuurbeweging (Buijs, 1994, 361) en dat dus impliciet rekening wordt gehouden met deze beweging. In het vervolg van de decompositie van de tijdreeks wordt aangenomen dat er in de beschikbare tijdreeksen geen sprake is van een duidelijk te onderscheiden (relevante) cyclische component.

Stap 4: de toevallige component (Et). Laatste stap van de decompositie is de bepaling van de toevallige component. Deze component van een tijdreeks is het gevolg van onvoorspelbare, toevallige fluctuaties in de tijdreeks. De toevallige component bestaat uit de overgebleven fluctuaties4. In de beschikbare tijdreeksen is het moeilijk om aan te geven of de resterende fluctuaties kunnen worden beschouwd als zijnde toevallige fluctuaties. Problemen liggen met name bij het feit dat de registratie binnen TPP onvoldoende is. Gevolg hiervan is dat eventueel geconstateerde onregelmatigheden simpelweg verklaarbaar zouden kunnen zijn omdat ze het gevolg zijn van speciale acties van klanten of van TPP zelf. Fluctuaties zouden dan, onterecht, als toevallig worden bestempeld, aangezien ze in werkelijkheid niet het gevolg zijn van toevalligheden. Het is dus niet mogelijk om de ‘verklaarbare’ toevallige afwijkingen los te koppelen van de ‘normale’ toevallige afwijkingen. Het belang van een goede registratie van ‘verklaarbare’ afwijkingen is dan ook groot. In de onderstaande figuren worden zowel de grootte, als de verdeling van de toevallige component (ook wel residu) weergegeven voor de tijdreeks TOT.

-60 -40 -20 0 20 40 60 80

Figuur E- 10 Grootte residuen (TOT) in duizenden

0 10 20 30 40 50 60 70 80

Figuur E- 11 Verdeling residuen (TOT ) in duizenden

Stap 5: evaluatie. Laatste stap is het bepalen in hoeverre het verloop van de vraag verklaard kan worden met behulp van de uitgevoerde methode van decompositie. Om hier een uitspraak over te kunnen doen wordt er gekeken naar de grootte van de toevallige component. De formulering van een betrouwbaarheidsinterval zou hier goed van pas kunnen komen. Aan de formulering van een dergelijk interval liggen echter wel een aantal aannames ten grondslag. Een van deze aannames is dat de residuen onderling onafhankelijk moeten zijn (Buijs, 1994, 379). Wanneer dichtbij elkaar liggende residuen elkaar beïnvloeden wordt gesproken van zogenaamde autocorrelatie. Een veel gebruikte analyse (om het bestaan van autocorrelatie vast te stellen) is de Durbin-Watson test (Hanke et al., 1984, 335). Deze test wordt uitgevoerd door middel van de onderstaande vergelijking E-8 (e geeft hierin het residu weer).

= =

= n

1 t

2 t n

2 t

2 1 t

t e ) / e

e (

DW (Vergelijking E-8 Durbin-Watson test)

De grootte van deze waarde bepaalt vervolgens of het bestaan van autocorrelatie verworpen kan worden of niet. Met behulp van de Durbin-Watson tabel (Hanke et al., 1984, 336) is bepaald, dat zowel voor tijdreeks TOT (DW = 1.58), als voor tijdreeks ASD (DW = 1.61) het bestaan van autocorrelatie niet verworpen kan worden. Het is dan ook niet mogelijk om een betrouwbaarheidsinterval te formuleren.

Om toch een uitspraak te kunnen doen over de mate waarin het verloop van beide tijdreeksen verklaard kan worden, is gebruik gemaakt van prestatie-indicatoren. Hiertoe worden kengetallen berekend waarbij de werkelijke waarde per dag wordt vergeleken met de waarden die wordt aangegeven door de uitgevoerde tijdreeksanalyse. De gebruikte kengetallen zijn (Gaynor et al., 1994, 13): de gemiddelde absolute procentuele afwijking (MAPE), de gemiddelde absolute afwijking (MAD) en de wortel uit het gemiddelde van de

4 Verschil tussen de verklaarbare waarde van de tijdreeks (eerst drie componenten) en de werkelijke waarde van de tijdreeks.

(13)

kwadratische afwijking (RMSE). Berekening van deze kwantitatieve maatstaven geschiedt volgens de formules in tabel E-2.

Mean Absolute Percentage Error Mean Absolute Deviation Root Mean Square Error

n X e MAPE

n

1

t t

t

= =

n e MAD

n

1 t

t

= =

n e RMSE

n

1 t

2

t

= = Tabel E-2 Prestatie-indicatoren voor de evaluatie

Gedetailleerde analyse van de residuen laat zien dat de afwijkingen rondom de KNJ-periode enorm zijn. Dit kan verklaard worden door de grote rol van incidentele partijen in die periode (kerstpakketten) en de slechte registratie hiervan. Bij de evaluatie wordt deze uitzonderlijke periode apart vermeld. In tabel E-3 is de evaluatie te vinden van de tijdreeksen TOT en ASD.

Totaal ASD

Gemiddelde 38 42

MAD 12.071 5.201

MAPE 4.40% 5.61%

RMSE 13.501 5.621

MAD (exclusief KNJ) 10.459 4.626 MAPE (exclusief KNJ) 3.66% 4.91%

RMSE (exclusief KNJ) 11.003 4.902 Tabel E-3 Evaluatie decompositie

Uit de bovenstaande tabel blijkt dat, voor het sorteercentrum Amsterdam, de gemiddelde absolute afwijking 4.626 pakketten bedraagt. Dit is dus de gemiddelde afwijking in de eerste sorteerslag (van de andere sorteerslagen wordt geen analyse gemaakt). Wanneer wordt aangenomen dat deze afwijking van de pakketten een gemiddelde samenstelling vertoont (vergelijk tabel 3-12), is het mogelijk om de afwijking in pakketten om te zetten in een afwijking in uren en aantal medewerkers. De afwijking van 4.626 komt neer op een afwijking van ongeveer 30 uur, wat neer komt op 6 sorteermedewerkers. Het gaat hierbij dus om een gemiddelde afwijking in de eerste sorteerslag, op een flink aantal dagen zal de afwijking dan ook vele malen groter of kleiner zijn. Hierbij zijn eventuele afwijkingen in de twee andere sorteerslagen niet meegenomen.

Conclusie. In deze paragraaf is een eerste inzicht verkregen in het verloop van de tijdreeksen. Duidelijk is geworden dat het verloop van de vraag moeilijk te verklaren is. De toevallige component heeft een vrij grote waarde en zorgt ervoor dat de gemiddelde afwijking voor het sorteercentrum stevig is. Dit brengt natuurlijk de nodige onzekerheid met zich mee. Daarnaast zijn echter wel een duidelijke trend- en een seizoenscomponent vastgesteld, die beiden hulp kunnen bieden bij het maken van voorspellingen. Het vermoeden bestaat dat de aanzienlijke invloed van grote klanten een belangrijke rol speelt in de grootte van de toevallige component. In paragraaf 4.2.3 is hier verder op ingegaan.

Op basis van de uitgevoerde analyse is het mogelijk om op een vrij eenvoudige manier voorspellingen te doen van het toekomstige verloop van de tijdreeks. Impliciet liggen hieraan twee belangrijke veronderstellingen ten grondslag: ten eerste wordt verondersteld dat het geïdentificeerde patroon van de tijdreeks zich in de toekomst zal herhalen en ten tweede wordt verondersteld dat aan dit patroon ook daadwerkelijk een lineaire relatie ten grondslag ligt. Dit zijn beiden gevaarlijke veronderstellingen. De kennis van de tijdreeks is te gering om bijvoorbeeld zomaar aan te nemen dat deze tijdreeks een lineair verloop kent.

Het doel van de volgende paragraaf is dan ook de vergroting van de kennis en theoretische achtergrond omtrent de tijdreeks. Hier wordt de basis gelegd voor de voorspellingsmodellen. In het vervolg van deze bijlage zal overigens alleen gebruik worden gemaakt van de tijdreeks ASD (sorteercentrum Amsterdam) Voorspellingen van deze tijdreeks hebben namelijk uiteindelijk het meeste praktische nut.

1.3 Achtergrond van de tijdreeks

In de vorige paragraaf is een globaal beeld ontstaan van het verloop van de tijdreeks en is de omvang van de toevallige component in de tijdreeks vastgesteld. Zoals aangegeven zijn er, naast het bestaan van trend- en seizoensinvloeden, allerlei andere kenmerken van de tijdreeks die van belang zijn voor het uiteindelijke voorspellingsmodel. Tijdreeksen kunnen bijvoorbeeld voorspeld worden met behulp van relatief eenvoudige lineaire voorspellingsmodellen, maar de aanwezigheid van niet-lineair gedrag mag zeker niet zonder meer

(14)

worden uitgevlakt (De Gooijer et.al, 1992, Chatfield, 1989). Dit onderzoek heeft tot doel een gedetailleerd beeld te krijgen van het mechanisme van de tijdreeks, waardoor het mogelijk moet zijn om deze tijdreeks op een goede manier te voorspellen (volgende paragraaf). Aannames over het mechanisme dat aan de tijdreeks ten grondslag ligt zijn van grote invloed op de kwaliteit van het uiteindelijke voorspellingsmodel. Het is dan ook van belang hier grondig bij stil te staan. In deze paragraaf worden de onderstaande kenmerken besproken.

Univariaat vs. Multivariaat;

Discreet vs. Continu;

Lineair vs. Niet-lineair;

Deterministisch vs. Stochastisch.

1.3.1 Univariaat vs. Multivariaat

Univariate voorspellingsmodellen maken voorspellingen op basis van historische data. De voorspelling is volledig gebaseerd op de waarden uit het verleden. Dit in tegenstelling tot multivariate (of causale) modellen, waarbij de voorspelling eveneens afhangt van externe variabelen (Chatfield, 1989, 67). Kijkend naar de beschikbare informatie binnen TPP dan is het alleen mogelijk om een univariaat voorspellingsmodel te maken. Gegevens omtrent externe variabelen zijn simpelweg niet voorhanden.

1.3.2 Discreet vs. Continu

Tijdreeksen kunnen discreet dan wel continu zijn. In het geval van discrete tijdreeksen worden de tijdswaarden weergegeven middels integers, in tegenstelling tot continue tijdreeksen waarin de tijd wordt weergegeven door middel van reële getallen. In deze studie wordt uitgegaan van een discrete tijdreeks.

1.3.3 Lineair vs. Niet-lineair

In veel gevallen wordt gebruik gemaakt van lineaire methoden bij het voorspellen van tijdreeksen. Een voorbeeld hiervan is het, in de vorige paragraaf geformuleerde, multiplicatieve tijdreeksmodel. De veronderstelling die aan lineaire voorspellingsmodellen ten grondslag ligt, is dat een toekomstige waarde (voorspelling) wordt gevormd door een lineaire combinatie van een aantal historische waarden en niet te voorspellen toevallige waarden. Een lineair model maakt een mathematisch model van een dynamisch systeem op basis van gemeten data. Dynamische systemen worden gekenmerkt door een verzameling variabelen en hun wederzijdse afhankelijkheid in de tijd. Figuur E-12 laat een dynamisch systeem zien. Hierin is u de invoer, y de uitvoer en e een ruissignaal. Het modelleringsprobleem bestaat uit het vinden van de manier waarop de drie signalen zich tot elkaar verhouden. In lineaire modellen wordt de invoer over het algemeen bepaald door een aantal historische waarden van de invoer en een aantal historische waarden van de uitvoer. Daarnaast is de uitvoer afhankelijk van de foutbron e.

Figuur E-12 Dynamisch systeem

Er zijn echter talrijke voorbeelden van bestaande tijdreeksen waarvoor dit niet geldt (Chatfield, Gooijer et al., Borovkova). Het mag duidelijk zijn dat een lineair voorspellingsmodel van een tijdreeks met een niet-lineair patroon te wensen over laat. Een niet-lineair voorspellingsmodel zou in een dergelijke situatie uitkomst kunnen bieden. Op dit moment is niet bekend of het mechanisme dat aan de (in dit onderzoek) beschikbare tijdreeks ten grondslag ligt van lineaire of van niet-lineaire aard is. Het volledig analyseren van het eventuele niet-lineaire gedrag van de onderliggende tijdreeks zou in dit onderzoek te ver gaan en vraagt ook een grote mate van ervaring (Gooijer et al., 1992). Uit de theorie blijkt dat het echter goed mogelijk is om een indicatie te krijgen van niet-lineair gedrag middels een relatief eenvoudige manier: de delay-1 map (Borovkova, 1998, 10).

Dit komt neer op de interpretatie van een grafiek met daarin de waarde Xt tegenover de waarde Xt+1. De onderstaande figuur geeft deze weer.

(15)

0 20 40 60 80 100 120 140 160 180 200

0 50 100 150 200

Figuur E-13 Delay-1 Map ASD (X-as = x(t) en Y-as = x(t+1)) in duizenden

Er is sprake van een onduidelijke structuur in de grafiek. Vergelijking met theoretische grafieken laat zien dat deze grafiek mogelijk een niet-lineaire structuur vertoont. Het bestaan van de duidelijk zichtbare lijnen zou hier op kunnen duiden (Borovkova, 1998, 11). Het is en blijft echter een gevaarlijke kwalitatieve uitspraak. Voor het vervolg van het onderzoek blijft het dan ook onduidelijk of het hier een lineair of een niet-lineair mechanisme betreft.

1.3.4 Deterministisch vs. Stochastisch

Tijdreeksen die exact kunnen worden voorspeld noemt men deterministisch. Deterministische modellen zullen bij meerdere simulaties (met gebruik van dezelfde uitgangspunten, grenzen en input), dezelfde uitkomsten genereren. In de praktijk komen deze tijdreeksen echter weinig voor (Borovkova, Chatfield, Belaire-Franche). De meeste tijdreeksen zijn stochastisch van aard, hetgeen betekent dat de toekomst slechts voor een deel bepaald wordt door historische gegevens en dat exacte voorspellingen onmogelijk zijn.

Simulaties met identieke uitgangspunten kunnen dan ook resulteren in verschillende uitkomsten. De toekomstige waarden hebben een kansverdeling die kan worden benaderd met behulp van kennis van historische waarden (Chatfield, 1989, 5).

Het feit dat het gedrag van een deterministisch systeem volledig wordt bepaald door de beginsituatie, betekent niet dat dit gedrag per definitie simpel is (Borovkova, 1998, 6). Integendeel, ontwikkelingen op het vakgebied van niet-lineaire dynamische systemen laten het bestaan van deterministische systemen met grof complex gedrag zien. In deze situaties lijkt veelal alleen het toeval een rol te spelen (dit is dus niet waar). In het geval van niet-lineaire deterministische systemen die complex gedrag vertonen, spreekt men van de zogenaamde chaostheorie (Borovkova, 1998, 6). In de onderstaande figuur (afgeleid uit Takens, 2001) wordt dit grafisch weergegeven. De bovenstaande rij laat het gedrag van een simpel deterministisch systeem zien en de onderste rij het gedrag van een deterministisch systeem dat chaotisch gedrag vertoont.

Figuur E-14 Gedrag op korte (t=0 en t=1) en lange termijn (t=T)

Het bestaan van de mogelijkheid van chaotisch gedrag in tijdreeksen maakt het noodzakelijk dat er een onderscheid wordt gemaakt naar situaties waarin het gedrag puur toevallig is en naar situaties waarin het gedrag chaotisch is (Mulhern et al., 1994). Van de beschikbare tijdreeks is op dit moment niet bekend wat hun exacte gedrag is op dit gebied. Het vermoeden bestaat dat het, net als de meeste tijdreeksen, gaat om een deels stochastische tijdreeks. Met behulp van recentelijk ontwikkelde software (Visual Recurrence Analysis) is het mogelijk om hier, voorzichtig, een aantal uitspraken over te doen.

(16)

Visual Recurrence Analysis (VRA)5. De Visual Recurrence Analysis (VRA) is een via het internet beschikbaar programma6 dat het mogelijk maakt om een zogenaamde recurrence analysis uit te voeren. In eerst instantie is deze analyse met name goed te gebruiken om te bepalen of een tijdreeks stationair is (aanwezigheid van trend) en of de tijdreeks chaotisch gedrag vertoont. (Faggini, 2003). VRA maakt het eenvoudiger om deze analyse uit te voeren en voegt eveneens een aantal aspecten toe. Het programma is ontwikkeld op basis van werken van Webber en Zbilut (Faggini, 2003).

De belangrijkste veronderstelling die aan de recurrence analysis ten grondslag ligt is, dat de geobserveerde tijdreeks de realisatie is van een dynamisch proces (de interactie van de relevante variabelen in de tijd). Een veel gebruikt voorbeeld is het weer. Het weer kan beschouwd worden als een complex systeem met een groot aantal factoren dat het gedrag van dit systeem beïnvloedt. De dagelijkse temperatuur kan dan bijvoorbeeld beschouwd worden als de realisatie van dit dynamische systeem. In dit geval hebben we dus te maken met een multi-dimensionaal dynamisch systeem en een één-dimensionale output. De wiskundige theorie van Takens stelt in dit opzicht dat het mogelijk is om de essentiele aspecten van het originele dynamische systeem te reconstrueren aan de hand van enkel en alleen de geobserveerde output (tijdreeks).

Dit kan gebeuren met behulp van de methode van tijdsvertragingen (Belaire-Franch, 2002), die onderdeel uit maakt van VRA.

Met behulp van de methode van tijdsvertragingen wordt de één-dimensionale tijdreeks weergegeven in een m-dimensionale phase space (toestandsruimte). Hiertoe wordt iedere observatie in de originele tijdreeks vervangen door een vertraagde vector (een zogenaamde reconstructievector)7. Gevoelsmatig verwacht men namelijk dat het gedrag van de gevormde vectoren ons meer vertelt over de onderliggende mechanismen, dan het gedrag van de originele waarden (Borovkova, 1998, 11). Het mag duidelijk zijn dat de keuze van de parameters voor de dimensie (m) en voor de vertraging (d) essentieel is (Belaire Franch, 2004).

De literatuur (bijvoorbeeld Kantz en Schreiber, 1997, 34) noemt technieken voor de juiste bepaling van deze parameters, dit zijn: Mutual Information Function voor de vertraging en False Nearest Neighbors voor de dimensie. Het gaat te ver om de achtergronden van deze technieken te bespreken. Daarbij maakt VRA het mogelijk om deze technieken relatief eenvoudig uit te voeren en de juiste parameters vast te stellen. Het resultaat is de grafische weergave van het gedrag van het systeem in de vorm van het zogenaamde recurrence plot. In figuur E-15 wordt deze weergegeven voor de tijdreeks ASD. Ter vergelijking geeft figuur E- 16 de recurrence plot weer wanneer de tijdreeks door elkaar is gehusseld (‘randomly shuffeld’)8.

Figuur E-15 Recurrence plot dimension 66 en delay 3 Figuur E-16 De gehusselde versie

5 Bespreking van deze analyse is gebaseerd op drie artikelen: Faggini (2003) en Belaire-Franch (2002 en 2004).

6 http://home.netcom.com/~eugenek/download.html

7 De methode van tijdsvertragingen vervangt de scalaire tijdreeks Xt door een rij van zogenaamde reconstructie (vertraagde) vectoren (Xt, Xt+d, Xt+2d,….,Xt+(m-1)d). Hierbij is m de embedding dimension en d is de vertraging. In de onderstaande tabel een voorbeeld:

Voorbeeld d=1 en m=3 t Xt Reconstructie vectoren 1 8029 X(1) = {7900, 7785, 8029}

2 7785 X(2) = {8417, 7900, 7785}

3 7900 etc.

4 8417 etc.

8 Via een toevoeging (add-in) bij MS Excel is het mogelijk om dit uit te voeren (http://www.resample.coml)

(17)

Wat de grafiek weergeeft is een zogenaamde afstandenmatrix waarbij de lichte punten de punten van een korte afstand weergeven. Uit deze figuren kunnen grofweg twee aspecten worden afgeleid. Ten eerste geeft de homogeniteit van de figuur aan in hoeverre het signaal kan worden geïnterpreteerd als stationair (zonder trend), dit is niet geval. In de tijdreeks is dus een trend aanwezig. Ten tweede geven de diagonale witte lijnen aan in hoeverre er sprake is van een deterministisch signaal (de middelste diagonaal telt hier niet mee). De witte lijnen zullen niet te zien zijn bij een toevallig signaal (Faggini, 2003). Uit figuur E-13 valt op te maken dat we hier te maken hebben met de aanwezigheid van deterministische structuren.

Vergelijking met de gehusselde tijdreeks laat zien dat de deterministische structuur hier verdwenen is en dat de homogeniteit groter is (de trend is verdwenen) als gevolg van het husselen. Een goede analyse van deze grafieken vergt een schat aan ervaring op dit gebied. Daarnaast zijn de kenmerken moeilijk te onderscheiden met het blote oog en is de interpretatie kwalitatief. Als oplossing hiervoor is de Recurrence Quantification Analysis opgesteld (Belaire-Franch, 2004). In deze analyse wordt de informatie uit de figuur gekwantificeerd.

Recurrence Quantification Analysis (RQA)9. De Recurrence Quantification Analysis is een analyse die onafhankelijk van de grootte van de beschikbare tijdreeks en onafhankelijk van de aanwezigheid van een trend kan worden uitgevoerd (Faggini, 2003). De analyse is dan ook goed te gebruiken. Zoals omschreven kwantificeert deze analyse de gegevens afkomstig vanuit de recurrence plots. Met behulp van VRA is het mogelijk om deze analyse uit te voeren. Voordeel van VRA is dat het gedrag van de tijdreeks kan worden opgedeeld in ver schillende segmenten zodat het verloop van dit gedrag bekeken kan worden. Voor het kwantificeren van de gegevens worden door de RQA een aantal maatstaven geformuleerd. Met meer kennis op dit gebied zou het mogelijk zijn om al deze maatstaven te gebruiken. In dit onderzoek wordt gebruik gemaakt van drie maatstaven, te weten:

Determinism (DET): Kwantificeert de mate van determinisme in het signaal.

Entropy (ENT): Kwantificeert de complexiteit van het recurrence plot en daarmee de gestructureerdheid van de tijdreeks.

Trend (T): Geeft het bestaan van een trend weer.

In de onderstaande tabel worden de waarden10 van deze maatstaven weergegeven.

Naam Eenheid Origineel Shuffled Determinism (DET) % 61,006 0,000 Entropy (ENT) Bits 4,943 0,000 Trend (T) Units/1000pts -12,339 0,000

Tabel E-4 Recurrence Quantification Analysis

Uit de tabel blijkt dat het percentage determinisme 61% is. Dit geeft aan dat er sprake is van deterministische structuren in de tijdreeks. Vergelijking tussen de entropy van de originele tijdreeks en van de gehusselde tijdreeks laat zien dat in de laatste versie de structuur van de reeks volledig verdwenen is. Ook de aanwezigheid van een trend komt uit deze tabel naar voren en bevestigt daarmee de eerdere constatering.

Kijken we op een nog gedetailleerder niveau (figuren E-17 en E-18) dan zien we dat de aanwezigheid van trend en deterministische structuren niet in alle segmenten van de tijdreeks even groot is.

ttt Trend

Figuur E-17 Trend in verschillende delen van de tijdreeks

DET

Figuur E-18 % DET in verschillende delen van de tijdreeks Belangrijke kanttekening bij deze analyse is, dat het zonder ervaring moeilijk is om de getoonde figuren en signalen op een juiste manier te interpreteren. De VRA software maakt het echter goed mogelijk om een indruk te krijgen van het mechanisme dat aan de tijdreeks ten grondslag ligt. Naast de rechtvaardiging van de eerder geconstateerde trend is ook een bepaalde mate van deterministische structuur (61%) in de tijdreeks aangetroffen. Zoals verwacht kent de tijdreeks voor een deel ook een meer toevallige structuur. Meer ervaring en kennis op dit gebied maken het mogelijk om gedetailleerder in te gaan op de tijdreeks. Hiermee kunnen

‘harde’ bewijzen voor niet-lineair gedrag en chaotisch gedrag worden gevonden (Faggini, Belaire-Franch).

9 Bespreking van deze analyse is gebaseerd op drie artikelen: Faggini (2003) en Belaire-Franch (2002 en 2004).

(18)

1.3.5 Tot slot

Het is niet mogelijk om uit het voorgaande ‘harde’ conclusies te trekken. Veel is namelijk onduidelijk gebleven.

Daarnaast zorgt het vermoedelijke bestaan van onnauwkeurigheden in de tijdreeksen voor een vertekend beeld. Het is dan ook niet duidelijk of we te maken hebben met een tijdreeks met een lineair of een niet-lineair gedrag. Bij de keuze voor de voorspellingsmodellen zal hier rekening mee worden gehouden. Wel is duidelijk geworden dat er een bepaalde mate van determinisme in de tijdreeks aanwezig is. Zoals verwacht (Chatfield, 1989, 5) is de tijdreeks echter niet voor 100% deterministisch. In deze paragraaf is een beter beeld ontstaan van de mechanismen die ten grondslag liggen aan de tijdreeks. Met deze gegevens worden in de volgende paragraaf de voorspellingsmodellen geformuleerd.

1.4 Voorspellingsmodellen

Op basis van de vorige paragrafen wordt in deze paragraaf begonnen met de formulering van voorspellingsmodellen, op basis waarvan de experimenten kunnen worden uitgevoerd. In de vorige paragraaf is onduidelijk gebleven volgens welk mechanisme de tijdreeks verloopt. Met name op het gebied van het al dan niet lineaire gedrag en op het gebied van de stochastische of deterministische structuur is onduidelijkheid blijven bestaan. In deze paragraaf wordt dan ook gekozen voor het volgende onderscheid (Mulhern et al., 1994): eenvoudige lineaire deterministische modellen (bijvoorbeeld exponentiele effening), eenvoudige lineaire stochastische modellen en niet-lineaire modellen. Belangrijke kanttekening is dat de complexiteit van niet-lineaire modellen over het algemeen groter is dan de complexiteit van lineaire modellen. Bij de niet- lineaire modellen zullen dan ook meerdere opties besproken worden.

1.4.1 Eenvoudige lineaire deterministische modellen

Met behulp van MS Excel is het mogelijk om een aantal relatief eenvoudige lineaire voorspellingsmodellen te testen. Bij deze testen is gekeken in hoeverre deze modellen het verloop van de tijdreeks kunnen volgen (de

‘fit’ van het model). Het model dat het beste uit de bus komt zal gebruikt worden voor de experimenten in het volgende hoofdstuk. Hieronder zullen eerst de gebruikte modellen kort worden toegelicht.

Single Exponential Smoothing (enkelvoudige exponentiële effening). Deze methode gaat uit van de gedachte dat de meest recente waarnemingen de meest relevante informatie bevatten over wat er in de toekomst zou kunnen gaan gebeuren en dat zij hiertoe meer gewicht toegekend moeten krijgen dan afnemende gewichten voor eerdere waarnemingen (Brand, 1993, 35). Essentieel bij deze methode is de bepaling van de effeningsconstante (alfa), die de grootte van het gewicht, dat aan de meest recente waarnemingen wordt gekoppeld, bepaalt.

Double Exponential Smoothing (dubbele exponentiële effening). De bovenstaande enkelvoudige exponentiële effening vormt de basis voor deze methode. Eenvoudig gezegd wordt de exponentiële effening in deze methode tweemaal toegepast. Naast de constante alfa hebben we hier eveneens te maken met een tweede constante (bèta) die geoptimaliseerd moet worden.

Seasonal Multiplicative. Dit model kent het bovenstaande enkelvoudige voortschrijdende gemiddelde als basis. Met dit model is het echter ook mogelijk om te corrigeren voor seizoensinvloeden. Hierbij zijn twee constanten relevant: alfa en gamma. Het model veronderstelt een multiplicatieve relatie.

Holt-Winters' Multiplicative. Dit model kent eveneens het bovenstaande enkelvoudige voortschrijdende gemiddelde als basis. De aangepaste versie maakt het echter ook mogelijk om, met de aanwezigheid van een trend en seizoensinvloeden in de tijdreeks om te gaan. Hierdoor moeten er wel drie constanten worden geoptimaliseerd: alfa, bèta, en gamma.

Seasonal Additive. Vergelijk Seasonal Multiplicative. In dit geval wordt een additieve relatie verondersteld.

Holt-Winters' Additive. Vergelijk Holt-Winters' Multiplicative. Hier wordt een additieve relatie verondersteld.

Single Moving Average (enkelvoudig voortschrijdend gemiddelde). Bij deze methode wordt is de voorspelling het gemiddelde van een aantal historische waarden. De vraag is dan ook op hoeveel historische waarde de voorspelling gebaseerd moet worden (parameter).

Double Moving Average (dubbel voortschrijdend gemiddelde). Ook bij deze methode geldt dat de basis wordt gevormd door het bovenstaande enkelvoudig voortschrijdend gemiddelde.

Bovenstaande acht modellen zijn met behulp van MS Excel getest en aan de hand van de eerder geformuleerde prestatie-indicatoren is het mogelijk om te bepalen welke modellen het beste passen bij de tijdreeks van het sorteercentrum Amsterdam. In tabel E-5 wordt een overzicht gegeven. Duidelijk wordt dat het Single Exponential Smoothing model de beste resultaten behaalt (alle drie de parameters). In paragraaf 1.5 zal dit model dan ook gebruikt worden als één van de voorspellingsmodellen.

(19)

Prestatie Parameters Methode

RMSE MAD MAPE Periods Alfa Bèta Gamma 1. Single Exponential Smoothing 9205 5678 6.3% - 0.45 - - 2. Double Exponential Smoothing 9215 5685 6.3% - 0.45 0.001 - 3. Seasonal Multiplicative 9311 5777 6.4% - 0.447 - 0.126 4. Holt-Winters' Multiplicative 9315 5780 6.4% - 0.447 0.001 0.126 5. Seasonal Additive 9320 5816 6.5% - 0.447 - 0.145 6. Holt-Winters' Additive 9324 5818 6.5% - 0.447 0.001 0.145

7. Single Moving Average 9473 5851 6.5% 3 - - -

8. Double Moving Average 10157 6531 7.3% 5 - - - Tabel E-5 Resultaten lineaire voorspellingsmodellen

Het Single Exponential Smoothing model gaat uit van de gedachte dat de meest recente waarnemingen de meest relevante informatie bevatten over wat er in de toekomst zou kunnen gaan gebeuren en kent de volgende vorm (Eppen et al. 1998, 626):

t t

n

t *X (1 )*Xˆ

Xˆ + = α + α (Vergelijking E-9 Model: exponentiële effening)

In dit model is de voorspelling opgebouwd uit de laatst waargenomen werkelijke waarde en de laatst gemaakte voorspelling. Beiden worden vermenigvuldigd met een factor: de effeningsconstante alfa.

Optimalisatie van deze factor geeft alfa een waarde van 0,45 (vergelijk de tabel).

Naast dit model zal ook gebruik worden gemaakt van het eerder geformuleerde multiplicatieve tijdreeksmodel. De resultaten van dit model doen immers niet onder voor de resultaten van het model van exponentiële effening. In paragraaf 1.2 is aan de hand van de decompositie van de tijdreeks dit model geformuleerd. Op basis van de veronderstelling dat het geconstateerde gedrag zich in de toekomst zal voortzetten is het mogelijk om voorspellingen te maken. Dit kan dan gebeuren middels de onderstaande vergelijking:

t t (101230 16,432t)*S

Xˆ = (Vergelijking E-10 Multiplicatieve voorspellingsmodel)

De waarde van de tijdreeks op een willekeurig tijdstip t wordt bepaald door de waarde van de trend (101230 – 16,432t) en de waarde van de seizoenscomponent (St) op dat tijdstip.

1.4.2 Stochastische lineaire modellen

Lineaire voorspellingsmodellen die worden geformuleerd met behulp van de zogenaamde Box-Jenkins- methode (Hanke et al., 1984, 384) verschillen van de bovenstaande lineaire modellen. Belangrijkste verschil is dat de Box-Jenkins-methode niet uitgaat van het bestaan van een bepaald historisch patroon in de datareeks. De Box-Jenkins-methode maakt gebruik van autoregressieve methoden11 en methoden van het voortschrijdend gemiddelde voor de voorspelling van tijdreeksen. Deze voorspellingsmodellen zijn gebaseerd op de aanname dat de toekomstige waarde van de tijdreeks wordt bepaald door een stochastisch proces (Mulhern et al., 1994, Eppen et al., 1998, 640). Daarnaast gaat deze methode uit van stationaire tijdreeksen.

Om hier aan te voldoen is de tijdreeks stationair gemaakt door de eerste verschillen van de reeks te nemen:

zogenaamde differentiatie van de tijdreeks (Brand, 1993, 238).

Bij toepassing van de Box-Jenkins-methode bestaat de keuze uit een aantal verschillende modellen (Brand, 1993, 219). Bij de selectie van het juiste model kan gebruik worden gemaakt van geschatte autocorrelatie- en partiële autocorrelatiecoëfficiënten. Dit zijn twee statistische instrumenten die ons direct veel informatie en inzicht geven in de samenhang tussen de waarnemingen van een datareeks. De autocorrelatiecoëfficiënt geeft de relatie weer tussen de meest recente waarneming in een datareeks en k voorgaande waarnemingen, terwijl de partiële autocorrelatiecoëfficiënt de samenhang weergeeft tussen de meest recente waarneming en een voorgaande waarneming, gegeven de invloed van de tussenliggende waarnemingen op de meest recente waarneming (Brand, 1993, 273). Met behulp van SPSS is het mogelijk om de waarden van de autocorrelatie- en partiële autocorrelatiecoëfficiënten te bepalen en direct in een correlogram12 te plaatsen.

In de onderstaande twee figuren worden deze correlogrammen voor ASD weergegeven. Gevolgd door de theoretische correlogrammen van een autoregressief model van de tweede orde (AR(2)) (Brand, 1993 en Hanke et al., 1984).

11 Modellen waarbij rekening wordt gehouden met het bestaan van autocorrelatie (Hanke et al., 1984, 372).

(20)

ASD

Lag Number

23 21 19 17 15 13 11 9 7 5 3 1

ACF

.5

0.0

-.5

Figuur E-19 autocorrelatie ASD

ASD

Lag Number

23 21 19 17 15 13 11 9 7 5 3 1

Partial ACF

.5

0.0

-.5

Figuur E-20 Partiële autocorrelatie ASD

-1 0 1

k

Figuur E-21 Theoretische autocorrelatie

-1 0 1

k

Figuur E-22 Theoretische partiële autocorrelatie

Een vergelijking tussen de geconstateerde verdeling en de theoretische verdeling, kan helpen bij de selectie van het juiste model. Het model zal echter nooit perfect overeenkomen en het belang van ervaring op dit gebied is groot (Chatfield, 1989, 24). In dit onderzoek is dus gekozen voor een AR(2)-model voor de voorspelling van de tijdreeks. Autoregressieve prognosemodellen houden rekening met het bestaan van autocorrelatie, derhalve wordt de invloed van de eerder geconstateerde autocorrelatie meegenomen. Een lineair AR(2)-model kent de onderstaande vorm (Brand, 1993, 221):

t 2 t 2 1 t 1 0

t X X a

X =φ +φ +φ + (Vergelijking E-11 AR(2)-model)

De variabelen Xt-1 en Xt-2 zijn hierin vertragingsvariabelen. De coëfficiënt ф0 is een constante. De coëfficiënten ф1 en ф2 zijn de autoregressieve coëfficiënten, die de mate van samenhang aangeven tussen de eerste, tweede en derde waarneming in een tijdreeks. De variabele at is een stochastische variabele. Met behulp van SPSS is het mogelijk om de optimale waarden van de verschillende coëfficiënten te berekenen. Voor het voorspellingsmodel zijn deze coëfficiënten om te 10 dagen vernieuwd. Het voorspellingsmodel kent de onderstaande vorm (Brand, 1993, 222).

h t h 2 t 2 h 1 t 1 0 h

t X X a

Xˆ

+ +

+

+ =φ +φ +φ + (Vergelijking E-12 AR(2)-voorspellingsmodel)

Een belangrijk deel van de kracht van de Box-Jenkins-methode ligt in de iteratieve procedure om te komen tot een voorspellingsmodel (Gaynor et al., 1994, 406). In de onderstaande figuur wordt dit weergegeven.

Figuur E-23 Iteratieve Box-Jenkins-procedure

Na de model verificatie kan het proces zonodig herhaald worden om tot een optimaal model te komen. Meer aandacht voor deze iteratieve procedure kan leiden tot verandering (verbetering) van het voorspellingsmodel.

1.4.3 Niet-lineaire modellen

In de vorige paragrafen is aandacht besteed aan lineaire voorspellingsmodellen. In vergelijking met niet- lineaire voorspellingsmodellen zijn deze modellen over het algemeen relatief eenvoudig te noemen. Met behulp van de eerdere genoemde software VRA is het echter mogelijk om op een relatief eenvoudige manier voorspellingen te doen met behulp van een niet-lineair voorspellingsmodel: de k-nearest-neighbor-methode.

Referenties

GERELATEERDE DOCUMENTEN

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of

De visie van nieuwkomers op het lokale ruimtelijke beleid is dat zij vaker dan autochtonen meer natuur wensen en minder nieuwe bedrijventerreinen en woningen.. Voor veel

Zoals we hierboven hebben besproken is de essentie van een tweede-orde Stokes benadering dat we vergelijkingen oplossen die de oorspronkelijke vergelijkingen tot en met termen met

Nadat er afstemming plaats heeft gevonden tussen de drie kwaliteitsfactoren voor een website, kan begonnen worden met de daadwerkelijke bouw van de website. De bouw van de website

In deze paragraaf wordt gekeken naar de theoretische invloed van de strategie, structuur en bedrijfsprocessen van TPP-B op de informatiebehoefte van het management.. Deze analyse

In de markt van pakketproducten met bestemmingen buiten de EU komen zowel TNT Express, TPG Post Mail en TPG Post Pakketservice elkaar tegen op de Nederlandse zakelijke markt voor

Bereken na hoeveel weken Peter even veel geld heeft als

Veronderstel dat er een lineaire combinatie van vectoren in D bestaat die de nulvector oplevert maar waarin niet alle coëfficiënten gelijk zijn aan 0.. Men zegt ook soms dat in