• No results found

Verzekering niet-leven: analyse van afhankelijkheid tussen takken met behulp van vine copula’s

N/A
N/A
Protected

Academic year: 2021

Share "Verzekering niet-leven: analyse van afhankelijkheid tussen takken met behulp van vine copula’s"

Copied!
128
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Departement Wiskunde

Verzekering niet-leven:

analyse van afhankelijkheid tussen takken met behulp van vine copula’s

Proefschrift ingediend met het oog op het behalen van de graad van Master in de Actuari¨ele Wetenschappen

Britt Grootaerd

Promotor: Robert Verlaak

MEI 2013

(2)

Voorwoord

Gedurende mijn actuari¨ele opleiding groeide mijn interesse voor toepassingen in de verzeke- ringswereld. Na vorig jaar een masterproef gemaakt te hebben over vine copula’s en hun toepassing bij financi¨ele data, was mijn promotor onmiddellijk enthousiast om hiermee verder te werken in de context van verzekeringen. Het was een fijne uitdaging waarbij ik veel geleerd heb.

Voor het schrijven van deze masterproef stond ik er niet alleen voor en daarom zou ik graag enkele mensen bedanken. In de eerste plaats bedank ik mijn promotor Robert Verlaak voor de begeleiding tijdens dit academiejaar. Ook dank ik de verzekeringsmaatschappij die mij de data bezorgd heeft. Verder wens ik ook mijn familie, in het bijzonder mijn ouders en groot- ouders, te bedanken voor de steun en aanmoedigingen gedurende heel mijn studieperiode. En als kers op de taart wil ik ook nog mijn vriend bedanken, hij gaf me veel steun en vertrouwen en toonde veel begrip voor alle tijd die ik in deze masterproef gestoken heb.

Britt Grootaerd, mei 2013

i

(3)

De auteur geeft de toelating deze masterproef voor consultatie beschikbaar te stellen en delen van de masterproef te kopi¨eren voor persoonlijk gebruik. Elk ander gebruik valt onder de beperkingen van het auteursrecht, in het bijzonder met betrekking tot de verplichting de bron uitdrukkelijk te vermelden bij het aanhalen van resultaten uit deze masterproef.

Britt Grootaerd, mei 2013

ii

(4)

Inhoudsopgave

Inleiding 1

1 Modellering van afhankelijkheid m.b.v. vine copula’s 3

1.1 Afhankelijkheid . . . 3

1.1.1 Definitie . . . 3

1.1.2 Soorten bivariate afhankelijkheid . . . 4

1.1.2.1 Lineaire afhankelijkheid . . . 4

1.1.2.2 Concordantie . . . 4

1.1.2.3 Staartafhankelijkheid . . . 4

1.1.3 Afhankelijkheidsmaten . . . 5

1.1.3.1 Meten van lineaire afhankelijkheid . . . 5

1.1.3.2 Meten van concordantie . . . 5

1.1.3.3 Meten van staartafhankelijkheid . . . 7

1.2 Copula’s . . . 8

1.2.1 Definities en eigenschappen . . . 8

1.2.1.1 Notaties . . . 8

1.2.1.2 Definities . . . 8

1.2.1.3 Eigenschappen . . . 9

1.2.2 Verband met afhankelijkheidsmaten . . . 12

1.2.2.1 Verband met concordantiematen . . . 12

1.2.2.2 Verband met staartafhankelijkheidsparameters . . . 12

1.2.3 Voorbeelden van copula’s . . . 13

1.2.3.1 Elliptische copula’s . . . 13

1.2.3.2 Archimedische copula’s . . . 14

1.3 Vines en vine copula’s . . . 15

1.3.1 Vines . . . 15

1.3.1.1 Definities en voorbeelden . . . 15

1.3.1.2 Eigenschappen . . . 23

1.3.2 Vine copula’s . . . 24

1.3.2.1 Definitie en eigenschappen . . . 24

1.3.2.2 Kracht en beperkingen . . . 25

2 Analyse van afhankelijkheid tussen niet-levensverzekeringstakken 26 2.1 Inleiding . . . 26

2.2 Data . . . 26

2.3 Afhankelijkheidsanalyse . . . 27

iii

(5)

2.3.1 Bepaling verdeling loss-ratio’s per tak . . . 27

2.3.1.1 Loess-procedure . . . 29

2.3.1.2 Onderzoek lognormaliteit . . . 30

2.3.1.3 Onderzoek gammaverdeling . . . 35

2.3.2 Bepaling bivariate afhankelijkheidsstructuren . . . 38

2.3.2.1 Onderzoek bivariate afhankelijkheid . . . 39

2.3.2.2 Modellering bivariate afhankelijkheid a.d.h.v. copula’s . . . . 46

2.3.3 Bepaling multivariate afhankelijkheidsstructuur . . . 47

2.3.3.1 5-dimensionale normale copula . . . 47

2.3.3.2 Vine copula a.d.h.v. best passende bivariate copula’s . . . 47

2.3.3.3 Vergelijking 5-dimensionale normale copula en enkele vine co- pula’s . . . 54

2.4 Value-At-Risk berekeningen . . . 55

2.4.1 Definitie Value-At-Risk . . . 55

2.4.2 Value-At-Risk per tak . . . 56

2.4.2.1 Theoretische Value-At-Risk per tak . . . 56

2.4.2.2 Simulatieprocedure Value-At-Risk per tak . . . 57

2.4.3 Geschatte geaggregeerde Value-At-Risk . . . 58

2.4.3.1 Variantie-covariantie matrix methode . . . 58

2.4.3.2 Vine copula methode . . . 60

2.4.4 Vergelijking met resultaat op basis van 100000 simulaties . . . 62

Besluit 64 A Appendix 65 A.1 Resultaten Loess-procedure . . . 65

A.1.1 Loess-schattingen en Loess-curves voor de ultimate loss-ratio’s . . . . 65

A.1.2 Loess-schattingen en Loess-curves voor ln(ultimate loss-ratio) . . . 70

A.2 Scatterplots rangen quasi-observaties . . . 76

A.3 Copula-observaties voor de vine copula V . . . 78

A.3.1 Observaties eerste boom . . . 78

A.3.2 Observaties tweede boom . . . 80

A.3.3 Observaties derde boom . . . 82

A.3.4 Observaties vierde boom . . . 83

A.4 Elliptische verdelingsfuncties . . . 84

A.4.1 Definitie . . . 84

A.4.2 Voorbeelden . . . 85

A.4.2.1 Multivariate normale verdeling . . . 85

A.4.2.2 Multivariate Student-t verdeling . . . 85

A.5 Lijst van bivariate copula’s in het pakket ’VineCopula’ . . . 85

A.6 R-code . . . 86

A.6.1 Data inlezen . . . 86

A.6.2 Bepaling verdeling ultimate loss-ratio’s . . . 87

A.6.2.1 Onderzoek lognormaliteit voor alle takken . . . 87

A.6.2.2 Onderzoek gammaverdeling voor tak 1 . . . 94

A.6.3 Onderzoek bivariate afhankelijkheid . . . 96

A.6.4 Bepaling bivariate afhankelijkheidsstructuren . . . 102

(6)

INHOUDSOPGAVE v

A.6.5 Bepaling multivariate afhankelijkheidsstructuren . . . 102

A.6.5.1 5-dimensionale normale copula . . . 102

A.6.5.2 Constructie best passende vine copula . . . 103

A.6.6 Value-At-Risk per tak . . . 107

A.6.6.1 Theoretische Value-At-Risk per tak . . . 107

A.6.6.2 Onafhankelijke simulatie Value-At-Risk per tak . . . 108

A.6.7 Schatting geaggregeerde Value-At-Risk . . . 109

A.6.7.1 Variantie-covariantie matrix methode . . . 109

A.6.7.2 Vine copula methode . . . 110

A.6.8 Berekening BIC-waarden . . . 119

Bibliografie 121

(7)

Bij het modelleren van financi¨ele activa of verzekeringsdata wordt heel vaak gebruik gemaakt van een multivariate normale verdeling. Wanneer men echter het verloop van financi¨ele data of verzekeringsdata bekijkt, blijkt dit vaak zware staarten te hebben of asymmetrisch te zijn.

De normale verdeling is dus zeker geen goede benadering voor de verdeling ervan en gebruik ervan als onderstelling voor de onderliggende verdeling bij een predictiemodel levert dus heel snel verkeerde resultaten op. Als men denkt aan Value-at-Risk berekeningen in het kader van risicobeheer, kan dit voor grote problemen zorgen.

Er was dus nood aan een manier om een gezamenlijke verdelingsfunctie te construeren die zo goed mogelijk bij de data past. De stelling van Sklar (1959) die een gezamenlijke verdelings- functie uitdrukt in functie van een copula enerzijds en marginale verdelingsfuncties anderzijds, was een eerste stap in de goede richting. Copula’s zijn multivariate verdelingsfuncties met uniforme ´e´endimensionale marginale verdelingsfuncties op het interval [0, 1]. Copula’s werden grondig bestudeerd en kennen ondertussen heel wat toepassingen. Naast de constructie van gezamenlijke verdelingsfuncties, worden ze ook gebruikt voor het construeren van bivariate af- hankelijkheidsmaten. Copula’s hebben het voordeel dat ze een multivariate verdelingsfunctie helpen construeren, ongeacht de marginale verdelingsfuncties van de data, welke gerust ver- schillend mogen zijn. Om een gepaste gezamenlijke verdelingsfunctie te constueren, kunnen we dus gebruik maken van multivariate copula’s. Bivariate copula’s werden de voorbije jaren heel goed bestudeerd en zijn groot in aantal. Over multivariate copula’s met een dimensie groter dan twee is echter heel wat minder kennis vergaard. De meest bekende multivariate copula’s zijn de Gaussische of normale copula en de Student-t copula. De Gaussische copula kan geen staartafhankelijkheid modelleren, terwijl de Student-t copula dit wel kan, maar al- leen gelijke onder- en bovenstaartafhankelijkheid toelaat. Vaak vertonen verschillende paren variabelen echter ook verschillende onder- en bovenstaartafhankelijkheid. Het probleem was dus zeker nog niet opgelost.

Er werd verder onderzoek verricht en een aantal jaren later kwamen in 2001 vines op het toneel. Een vine is een grafisch instrument om afhankelijke stochastische veranderlijken te modelleren. Vines hebben hun naam te danken aan de vorm van de grafische voorstelling, deze lijkt vaak op een tros druiven. Het idee was om bivariate copula’s te gebruiken als bouwstenen voor een multivariate verdelingsfunctie. Bij het bouwen van een gezamenlijke verdelingsfunctie voor n variabelen bleken er heel wat mogelijkheden te zijn en om deze gra- fisch te organiseren werd gebruik gemaakt van een vine. Een vine bestaat uit bomen, takken en knopen. Een speciaal vine type is de vine copula of pair-copula constructie, waarbij aan elke tak van de vine een bivariate, al dan niet voorwaardelijke, copula geassocieerd wordt.

Deze bivariate copula’s worden pair-copula’s genoemd. Aan de hand van deze pair-copula 1

(8)

INLEIDING 2

constructie is het mogelijk om een multivariate dichtheid te bouwen die het product is van de marginale ´e´endimensionale dichtheden en de pair-copuladichtheden. A.d.h.v. vine copula’s kan een hele brede range van afhankelijkheid gemodelleerd worden. Ondertussen zijn vine copula’s erg populair en er werd al software ontwikkeld voor onder meer de constructie en de schatting van de parameters ervan.

Het eerste hoofdstuk geeft een inleiding tot het concept afhankelijkheid. In de eerste sectie bekijken we wat afhankelijkheid precies betekent, onderscheiden we enkele soorten bivariate afhankelijkheid en bespreken we daarna enkele veelvoorkomende maten om afhankelijkheid te meten. De tweede sectie handelt over copula’s. We bespreken enkele eigenschappen en voorbeelden en leggen het verband met de afhankelijkheidsmaten die in de eerste sectie aan bod komen. In de derde sectie wordt de vine ingevoerd en bekijken we kort enkele belangrijke eigenschappen. Daarna wordt de vine copula of pair-copula constructie besproken.

In het tweede hoofdstuk onderzoeken we of vine copula’s een meerwaarde kunnen bieden bij de modellering van afhankelijkheid in de context van verzekeringen. We maken hiervoor gebruik van een dataset bestaande uit schadedriehoeken van vijf niet-levensverzekeringstakken. We starten met een beschrijving van de dataset. Daarna bepalen we de verdeling van de geschatte loss-ratio’s voor de toekomst, nadat we eerst een correctie hebben doorgevoerd voor structu- rele wijzigingen in de tijd (de zogenaamde detrending) en determineren we de bivariate en multivariate afhankelijkheidsstructuren. Tot slot gebruiken we deze kennis om via simulatie Value-At-Risk berekeningen uit te voeren.

Het doel van deze thesis is aantonen dat vine copula’s ook bruikbaar zijn voor modellering van afhankelijkheid in de context van verzekeringen, waar de data veel geringer is dan bij financi¨ele data, zoals bijvoorbeeld aandeelprijzen.

(9)

Modellering van afhankelijkheid m.b.v. vine copula’s

Voor dit hoofdstuk steunen we op de eerste vier hoofdstukken van ’Staartafhankelijkheid in vine copula’s en pair-copula constructies’ van Grootaerd [12], tenzij er een andere verwijzing vermeld wordt. Voor meer details en bewijzen wordt naar deze bron verwezen.

In de eerste sectie van dit hoofdstuk gaan we dieper in op wat afhankelijkheid precies bete- kent. We onderscheiden enkele soorten bivariate afhankelijkheid en bespreken daarna enkele veelvoorkomende maten om afhankelijkheid te meten. In de tweede sectie komen copula’s aan bod. We geven een overzicht van de belangrijkste eigenschappen en geven enkele voorbeelden van copula’s. In de derde en laatste sectie vertellen we iets meer over vines en komt concept van een vine copula aan bod.

1.1 Afhankelijkheid

1.1.1 Definitie

Beschouw de kansvariabelen X1, ..., Xn. Intu¨ıtief betekent onafhankelijkheid van deze kans- variabelen dat kennis van ´e´en of meerdere kansvariabelen geen informatie oplevert over de resterende kansvariabelen. Formeel kunnen we onafhankelijkheid omschrijven d.m.v. volgende definitie:

Definitie 1.1 (Onafhankelijkheid). De kansvariabelen X1, ..., Xn met respectieve kans- dichtheidsfuncties f1, ..., fn worden onafhankelijk genoemd als hun gezamenlijke kansdicht- heidsfunctie f1,...,n factoriseert als volgt:

f1,...,n(x1, ..., xn) =

n

Y

i=1

fi(xi) ∀(x1, ..., xn) ∈ Rn.

Bijgevolg worden kansvariabelen X1, ..., Xn afhankelijk genoemd wanneer ze niet onafhan- kelijk zijn volgens bovenstaande definitie.

3

(10)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 4

1.1.2 Soorten bivariate afhankelijkheid 1.1.2.1 Lineaire afhankelijkheid

Definitie 1.2 (Lineaire afhankelijkheid). Twee kansvariabelen X en Y worden lineair afhankelijk genoemd indien er getallen α, β ∈ R bestaan waarvoor

X = αY + β, met α en β niet beide nul.

1.1.2.2 Concordantie

Definitie 1.3 (Concordantie). Beschouw twee observaties (x1, y1) en (x2, y2) van een vector (X, Y ) van continue kansvariabelen De observaties (x1, y1) en (x2, y2) worden concordant genoemd indien

 x1 < x2 y1 < y2 of

 x1 > x2 y1 > y2 , dit is equivalent met (x1− x2)(y1− y2) > 0.

Definitie 1.4 (Discordantie). Beschouw twee observaties (x1, y1) en (x2, y2) van een vec- tor (X, Y ) van continue kansvariabelen De observaties (x1, y1) en (x2, y2) worden discordant genoemd indien

 x1 < x2

y1 > y2 of

 x1 > x2

y1 < y2 , dit is equivalent met (x1− x2)(y1− y2) < 0.

Informeel betekent concordantie van een vector van continue kansvariabelen dat er een grote kans is om grote (resp. kleine) waarden te observeren van beide kansvariabelen, terwijl er weinig kans is om grote (resp. kleine) waarden te observeren van de ene kansvariabele en kleine (resp. grote) van de andere. De betekenis van discordantie kan op een analoge manier omschreven worden.

1.1.2.3 Staartafhankelijkheid

Wanneer men ge¨ınteresseerd is in de waarschijnlijkheid dat twee variabelen tegelijkertijd een bepaalde extreme waarde overschrijden, dient men beroep te doen op een afhankelijkheids- maat voor de onder- of bovenstaart van de verdeling. We voeren hiertoe het concept van bivariate staartafhankelijkheid tussen twee kansvariabelen in.

Definitie 1.5 (Bovenstaartafhankelijkheid). De bovenstaartafhankelijkheidsparameter of upper tail dependence parameter tussen twee kansvariabelen X en Y met marginale verde- lingsfuncties F en G wordt gedefinieerd als

λU = lim

u→1P (X > F(−1)(u)|Y > G(−1)(u)) ∈ [0, 1] .

Indien deze parameter nul is, dan worden X en Y bovenstaartonafhankelijk genoemd.

(11)

Definitie 1.6 (Onderstaartafhankelijkheid). De onderstaartafhankelijkheidsparameter of lower tail dependence parameter tussen twee kansvariabelen X en Y met marginale verde- lingsfuncties F en G wordt gedefinieerd als

λL= lim

u→0P (X ≤ F(−1)(u)|Y ≤ G(−1)(u)) ∈ [0, 1] .

Indien deze parameter nul is, dan worden X en Y onderstaartonafhankelijk genoemd.

In bovenstaande definities stellen F(−1) en G(−1) veralgemeende inverses voor van F en G respectievelijk, zie definitie 1.21.

1.1.3 Afhankelijkheidsmaten

1.1.3.1 Meten van lineaire afhankelijkheid

Een maat voor lineaire afhankelijkheid is de zogenaamde lineaire correlatieco¨effici¨ent. In de literatuur wordt ook wel eens gesproken van Pearson’s productmoment.

Definitie 1.7 (Lineaire correlatieco¨effici¨ent). De lineaire correlatieco¨effici¨ent van twee kansvariabelen X en Y waarvan de varianties bestaan en strikt positief zijn, wordt gedefinieerd als

ρ(X, Y ) = Cov(X, Y ) pV ar(X)pV ar(Y ), waarbij Cov(X, Y ) de covariantie is van X en Y .

Volgens Kadankova [15] bezit de lineaire correlatieco¨effici¨ent een aantal tekortkomingen. Zo impliceert nulcorrelatie geen onafhankelijkheid en geeft de lineaire correlatieco¨effici¨ent alleen informatie over een mogelijk lineair verband. Bovendien is de lineaire correlatieco¨effici¨ent niet gedefinieerd voor sommige verdelingen. Zo bestaat de variantie niet van een Student-t verdeling met ν ≤ 2 vrijheidsgraden. Daarnaast is deze afhankelijkheidsmaat niet invariant onder strikt stijgende niet-lineaire transformaties. Wegens te veel tekortkomingen ging men op zoek naar andere maten om afhankelijkheid te meten.

1.1.3.2 Meten van concordantie

Twee belangrijke maten voor het meten van concordantie zijn Kendall’s tau en Spearman’s rho. We zeggen dat twee kansvariabelen X en Y i.i.d. zijn als ze onafhankelijk zijn en een zelfde verdelingsfunctie bezitten.

Definitie 1.8 (Steekproefversie van Kendall’s tau). Beschouw een willekeurige steek- proef {(x1, y1), . . . , (xn, yn)} van n observaties van een continue stochastische vector (X,Y).

Er zijn

 n 2



verschillende paren (xi, yi) en (xj, yj). Noteer c het aantal concordante pa- ren en d het aantal discordante paren. De steekproefversie van Kendall’s tau t wordt dan gedefinieerd als

t = c − d

c + d = c − d

 n 2

 .

t is dus het verschil tussen de kans op concordantie en de kans op discordantie voor een willekeurig paar observaties (xi, yi) en (xj, yj) van de steekproef.

(12)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 6

Definitie 1.9 (Populatieversie van Kendall’s tau). Beschouw twee continue i.i.d. sto- chastische vectoren (X1, Y1) en (X2, Y2), met een gezamenlijke verdelingsfunctie H, dan wordt Kendall’s tau gedefinieerd als

τ = P [(X1− X2)(Y1− Y2) > 0] − P [(X1− X2)(Y1− Y2) < 0] .

We merken op dat Kendall’s tau ge¨ınterpreteerd kan worden als het verschil tussen de kans op concordantie en de kans op discordantie.

Definitie 1.10 (Steekproefversie van Spearman’s rho). Beschouw een willekeurige steekproef {(x1, y1), . . . , (xn, yn)} van n observaties van een continue stochastische vector (X,Y). Noteer de rangen van deze observaties met (rXi , riY). En definieer di = rXi − rYi . De steekproefversie van Spearman’s rho wordt dan gedefinieerd als

rS = 1 −6Pn i=1di2

n(n2− 1).

Definitie 1.11 (Populatieversie van Spearman’s rho). Beschouw drie continue i.i.d.

stochastische vectoren (X1, Y1), (X2, Y2) en (X3, Y3) met een gezamenlijke verdelingsfunctie H en marginale verdelingsfuncties F en G. Spearman’s rho wordt dan gedefinieerd als

ρS = 3 (P [(X1− X2)(Y1− Y3) > 0] − P [(X1− X2)(Y1− Y3) < 0]) .

Volgens bovenstaande definitie kunnen we Spearman’s rho interpreteren als een maat voor af- hankelijkheid die proportioneel is met het verschil tussen enerzijds de kans op concordantie en anderzijds de kans op discordantie voor de twee vectoren (X1, Y1) en (X2, Y3). Dit is een paar stochastische vectoren met gelijke marginale verdelingsfuncties F en G, maar met verschil- lende gezamenlijke verdelingsfuncties. De stochastische vector (X1, Y1) heeft gezamenlijke verdelingsfunctie H, terwijl de componenten van (X2, Y3) onafhankelijk zijn en deze laatste stochastische vector dus F × G als gezamenlijke verdelingsfunctie heeft. Er dient opgemerkt te worden dat ρ even goed gedefinieerd kon worden a.d.h.v. de stochastische vectoren (X1, Y1) en (X3, Y2). In de literatuur wordt soms ook gesproken van rangcorrelatie.

Eigenschap 1.12 (Verband Kendall’s tau en Spearman’s rho). Beschouw twee continue kansvariabelen X en Y , dan bestaat er volgend verband tussen Kendall’s tau τ en Spearman’s rho ρS:

3τ − 1

2 ≤ ρS≤ 1 + 2τ − τ2

2 , τ ≥ 0, en

τ2+ 2τ − 1

2 ≤ ρS ≤ 1 + 3τ

2 , τ ≤ 0.

De grenzen voor ρS en τ worden weergegeven in figuur 1.1. Voor elke twee continue s.v. X en Y moeten de waarden van Kendall’s tau τ en Spearman’s rho ρS in de grijze zone liggen, deze zone wordt de τ -ρS zone genoemd.

(13)

Figuur 1.1: De τ -ρS zone.

Eigenschap 1.13 (Verband Spearman’s rho en lineaire correlatieco¨effici¨ent).

Spearman’s rho van twee continue kansvariabelen X en Y met respectieve marginale verde- lingsfuncties F en G, is de lineaire correlatieco¨effici¨ent van de kansvariabelen F (X) en G(Y ), m.a.w.

ρS(X, Y ) = ρ(F (X), G(Y )).

Voorgaande eigenschap verklaart waarom Spearman’s rho ook wel eens rangcorrelatie ge- noemd wordt. Als x en y observaties zijn van de continue kansvariabelen X en Y met verde- lingsfuncties F en G, dan hebben deze respectievelijk rang u = F (x) en v = G(y). Eigenschap 1.13 drukt uit dat Spearman’s rho van twee kansvariabelen de lineaire correlatieco¨effici¨ent is van hun rangen.

Volgens Kadankova [15] bezitten Kendall’s tau en Spearman’s rho volgende nuttige eigen- schappen.

Eigenschap 1.14 (Eigenschappen Kendall’s tau en Spearman’s rho). Kendall’s tau en Spearman’s rho bezitten de volgende eigenschappen:

1. Symmetrie: τ (X, Y ) = τ (Y, X) en ρS(X, Y ) = ρS(Y, X), ∀ kansvariabelen X, Y 2. Normalisatie: τ, ρS ∈ [−1, 1]

3. Onafhankelijkheid: X ⊥ Y ⇔ τ (X, Y ) = 0 ⇔ ρS(X, Y ) = 0 4. Schaal-invarantie: invariant onder strikt stijgende transformaties

De eigenschap van schaal-invariantie is zeer nuttig in de praktijk. Deze eigenschap zorgt ervoor dat afhankelijkheid gemeten a.d.h.v. Kendall’s tau of Spearman’s rho, niet wijzigt indien men met strikt stijgende transformaties van de data werkt. In de praktijk wordt de logtransformatie vaak gebruikt.

1.1.3.3 Meten van staartafhankelijkheid

Het meten van staartafhankelijkheid gebeurt a.d.h.v. staartafhankelijkheidsparameters zoals beschreven in definities 1.5 en 1.6.

(14)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 8

1.2 Copula’s

Copula’s zijn nuttig in het modelleren van afhankelijkheid tussen kansvariabelen. Ze kunnen gezien worden als multivariate verdelingsfuncties met uniforme ´e´endimensionale marginale verdelingsfuncties op het interval [0, 1]. Copula’s hebben veel toepassingen. Zo kunnen ze gebruikt worden voor de constructie van een multivariate verdelingsfunctie. Verder hebben ze reeds hun nut bewezen in de context van risicobeheer om Value-At-Risk berekeningen te doen en worden ze ook gebruikt in Monte-Carlo simulatie. We zullen eerst defini¨eren wat een copula is, daarna bespreken we enkele eigenschappen en geven we een aantal voorbeelden van copula’s. Tot slot leggen we het verband met de afhankelijkheidsmaten uit de eerste sectie.

1.2.1 Definities en eigenschappen

Het woord copula is een Latijns woord dat ’link’ betekent. Het woord copula werd voor het eerst gebruikt door Abe Sklar (1959) in de ’Stelling van Sklar’. In die stelling wordt de term copula gebruikt voor de afhankelijkheidsstructuur die ´e´endimensionale marginale verdelingsfuncties koppelt aan een multivariate verdelingsfunctie.

1.2.1.1 Notaties

We noteren met R de volledige re¨ele as (−∞, ∞), terwijl met ¯R de uitgebreide re¨ele as [−∞, ∞] bedoeld wordt. Met a = (a1, ..., an) wordt een punt van ¯Rn aangeduid. Er geldt a ≤ b ⇐⇒ ak ≤ bk, ∀k ∈ {1, . . . , n}. Voor a ≤ b bedoelen we met [a, b] de n-box B = [a1, b1] × [a2, b2] × ... × [an, bn], dit is het Cartesisch product van n gesloten intervallen. De hoekpunten van een n-box B zijn de punten c = (c1, c2, ..., cn) waarbij ck = ak of ck = bk, ∀k ∈ {1, . . . , n}. Het domein van een functie H wordt genoteerd als Dom H, terwijl haar beeldenverzameling genoteerd wordt als Ran H.

1.2.1.2 Definities

Definitie 1.15 (H-volume van een n-box B). Beschouw een functie H met Dom H = S1× S2× ... × Sn en Ran H ⊆ R, waarbij S1, S2, ..., Sn niet-ledige deelverzamelingen zijn van R. Zij B = [a, b] een n-box waarvan alle hoekpunten in Dom H gelegen zijn. Het H-volume¯ van B wordt dan gedefinieerd als

VH(B) = ∆baH(t) = ∆bannabn−1n−1. . . ∆ba22ba11H(t), waarbij

bakkH(t) = H(t1, . . . , tk−1, bk, tk+1, . . . tn) − H(t1, . . . , tk−1, ak, tk+1, . . . tn).

Definitie 1.16 (n-dimensionale copula). Een n-dimensionale copula of n-copula is een functie C : [0, 1]n→ [0, 1] met de volgende eigenschappen:

1. C(u1, . . . , un) = 0 als ui = 0 voor minstens ´e´en i ∈ {1, . . . , n}

2. C(u1, . . . , un) = uk als ui= 1, ∀i 6= k 3. VC([a, b]) ≥ 0, ∀a, b ∈ [0, 1]n met a ≤ b.

(15)

We illustreren bovenstaande definitie a.d.h.v. het eenvoudig voorbeeld van een bivariate on- afhankelijkheidscopula.

Voorbeeld 1.17 (Bivariate onafhankelijkheidscopula). De bivariate onafhankelijkheidsco- pula wordt gedefinieerd door de functie C : [0, 1]2 → [0, 1] die voldoet aan C(u1, u2) = u1u2. Deze functie wordt vaak genoteerd als Π. We gaan na dat deze functie voldoet aan de 3 voorwaarden van een bivariate copula.

1. C(u1, 0) = 0

2. C(u1, 1) = u1 en C(1, u2) = u2

3. Beschouw een willekeurige 2-box [a, b] = [a1, b1] × [a2, b2] in [0, 1]2 met a1 ≤ b1 en a2 ≤ b2. We berekenen het C-volume van deze 2-box:

VC([a, b]) = ∆ba22ba11C(u1, u2)

= ∆ba22[C(b1, u2) − C(a1, u2)]

= C(b1, b2) − C(b1, a2) − C(a1, b2) + C(a1, a2)

= b1b2− b1a2− a1b2+ a1a2

= b1(b2− a2) − a1(b2− a2)

= (b1− a1)(b2− a2)

≥ 0.

1.2.1.3 Eigenschappen

We bespreken nu belangrijke eigenschappen van copula’s.

Stelling 1.18 (Copula-eigenschappen). Een n-dimensionale copula C voldoet aan vol- gende eigenschappen:

1. Continu¨ıteit

2. Niet-dalend in elk argument

3. Schaal-invariantie, d.w.z. invariantie onder strikt stijgende transformaties

De volgende stelling toont aan dat elke n-copula tussen welbepaalde grenzen ligt, deze worden de Fr´echet-Hoeffding grenzen genoemd.

Stelling 1.19 (Fr´echet-Hoeffding grenzen). Zij C een n-copula, dan geldt Wn(u) ≤ C(u) ≤ Mn(u), ∀u ∈ In,

waarbij

• Mn(u) = min(u1, . . . , un)

• Wn(u) = max(u1+ . . . + un− (n − 1), 0).

(16)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 10

We merken op dat Mn een n-copula is voor n ≥ 2. Wn is echter geen n-copula meer voor n > 2. Wnwordt de Fr´echet-Hoeffding ondergrens of countermonotoniciteitscopula genoemd en modelleert perfecte negatieve afhankelijkheid, terwijl Mnde Fr´echet-Hoeffding bovengrens of comonotoniciteitscopula genoemd wordt en perfecte positieve afhankelijkheid modelleert.

Voor n = 2 noteert men deze copula’s kortweg als M en W .

Een heel belangrijke stelling in de copulatheorie is de stelling van Sklar. Hiervoor hebben we eerst nog de notie van marginale verdelingsfunctie en veralgemeende inverse van een verde- lingsfunctie nodig.

Definitie 1.20 (Marginale verdelingsfunctie). Beschouw een n-dimensionale verdelings- functie H met Dom H = ¯Rn. De ´e´endimensionale marginale verdelingsfuncties of marginalen van H zijn de functies Fi, i = 1, . . . , n met Dom Fi= ¯R gegeven door

Fi(x) = H(∞, . . . , ∞, x, ∞, . . . , ∞), ∀x ∈ ¯R,

waarbij x de i-de component is van H. De marginale verdelingsfuncties van H met een hogere dimensie worden gedefinieerd door minder componenten vast (= ∞) te kiezen.

Als een ´e´endimensionale verdelingsfunctie F niet strikt stijgend is, bezit deze geen normale inverse zoals we gewoon zijn. In dat geval kunnen we een zogenaamde veralgemeende inverse defini¨eren.

Definitie 1.21 (Veralgemeende inverse van een verdelingsfunctie). Beschouw een

´

e´endimensionale verdelingsfunctie F . Een functie F(−1) : [0, 1] → ¯R met Dom F(−1) = [0, 1]

wordt een veralgemeende inverse van F genoemd indien voldaan is aan volgende voorwaarden:

1. ∀t ∈ Ran F : F (F(−1)(t)) = t

2. ∀t /∈ Ran F : F(−1)(t) = inf{x|F (x) ≥ t}, met de conventie inf ∅ = ∞.

Voor een strikt stijgende verdelingsfunctie valt de veralgemeende inverse samen de gewone inverse.

Stelling 1.22 (Stelling van Sklar in n dimensies). Zij H een n-dimensionale verdelings- functie met marginalen F1, . . . , Fn. Dan bestaat er een n-copula C zodat ∀x ∈ ¯Rn:

H(x1, . . . , xn) = C (F1(x1), . . . , Fn(xn)) . (1.1) Als de marginalen F1, . . . , Fnbovendien continu zijn, dan is C is uniek, anders is C uniek op Ran F1× . . . ×Ran Fn.

Omgekeerd, als C een n-copula is en F1, . . . , Fn zijn verdelingsfuncties, dan is de functie H gedefinieerd door (1.1) een n-dimensionale verdelingsfunctie met marginalen F1, . . . , Fn. Een interessant gevolg voor de constructie van copula’s is het volgende.

Gevolg 1.23. Definieer H, C en F1, . . . , Fnzoals in de stelling van Sklar. Beschouw eveneens veralgemeende inverses F1(−1), . . . , Fn(−1) van F1, . . . , Fn respectievelijk. Dan geldt

C(u1, . . . , un) = H

F1(−1)(u1), . . . , Fn(−1)(un)

∀u ∈ [0, 1]n. (1.2)

(17)

Eigenschap 1.24 (Uitdrukking copuladichtheid). Beschouw de continue kansvariabelen X1, . . . , Xn met respectieve marginale verdelingsfuncties F1, . . . , Fn en dichtheden f1, . . . , fn en onderstel dat ze een gezamenlijke verdelingsfunctie H en een copula C bezitten. Hun copuladichtheid wordt dan gegeven door

c(u1, . . . , un) = ∂nC(u1, . . . , un)

∂u1. . . ∂un

.

M.b.v. de stelling van Sklar krijgen we voor de gezamenlijke dichtheidsfunctie h van X1, . . . , Xn: h(x1, . . . , xn) = c(F1(x1), . . . , Fn(xn))

n

Y

i=1

fi(xi). (1.3)

Opmerking 1.25.

1. Copula’s kunnen dus op twee manieren gedefinieerd worden. M.b.v. gevolg 1.23 zien we dat copula’s gezamenlijke verdelingsfuncties zijn met uniforme marginale verdelingsfuncties op [0, 1], er geldt immers dat Fi(Xi) ∼Unif [0, 1] , i = 1, . . . , n. Een tweede manier is volgens definitie 1.16.

2. Betekenis van de stelling van Sklar: bij multivariate verdelingsfuncties kunnen we de marginale verdelingsfuncties scheiden van de afhankelijkheidsstructuur. Na de specificatie van de marginale verdelingsfuncties F1, . . . , Fn en een copula C, kunnen we de multivariate verdelingsfunctie defini¨eren door (1.1). Uitdrukking (1.2) daarentegen kan gebruikt worden een copula te vinden indien de multivariate verdelingsfunctie gekend is.

We illustreren nu hoe een bivariate copula geconstrueerd kan worden indien alleen de geza- menlijke verdelingfunctie H gekend is. We inspireren ons hiervoor op Kadankova [15].

Voorbeeld 1.26 (Constructie bivariate copula m.b.v. de stelling van Sklar). Be- schouw twee kansvariabelen X en Y met een gezamenlijke verdelingsfunctie H gegeven door

H(x, y) =

(x+1)(ey−1)

x+2ey−1 als (x, y) ∈ [−1, 1] × [0, ∞]

1 − e−y als (x, y) ∈ ]1, ∞[ × [0, ∞]

0 anders

.

We bepalen eerst de marginale verdelingsfuncties F en G van X en Y respectievelijk. M.b.v.

definitie 1.20 geldt

F (x) = lim

y→∞H(x, y) en G(y) = lim

x→∞H(x, y), waaruit

F (x) =

0 als x < −1

x+1

2 als x ∈ [−1, 1]

1 als x > 1

en G(y) =

 0 als y < 0 1 − e−y als y ≥ 0 . De veralgemeende inverses worden dan als volgt bekomen:

F (F(−1)(u)) = u ⇔ F(−1)(u) + 1

2 = u ⇔ F(−1)(u) = 2u − 1 ∀u ∈ [0, 1] ,

(18)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 12

G(G(−1)(v)) = v ⇔ 1 − e−G(−1)(v) = v ⇔ G(−1)(v) = − ln(1 − v) = ln

 1 1 − v



∀v ∈ [0, 1] . Merk op dat F(−1)(u) ∈ [−1, 1] en G(−1)(v) ∈ [0, ∞] voor alle u, v ∈ [0, 1]. De copula van X en Y wordt dan gegeven door uitdrukking (1.2) van de stelling van Sklar:

C(u, v) = H(F(−1)(u), G(−1)(v))

= (2u − 1 + 1)(eln(1−v1 ) − 1) 2u − 1 + 2eln(1−v1 ) − 1

=

2u

1 1−v − 1 2(u − 1) +1−v2

= u(1 − (1 − v)) (u − 1)(1 − v) + 1

= uv

u + v − uv. 1.2.2 Verband met afhankelijkheidsmaten 1.2.2.1 Verband met concordantiematen

Kendall’s tau en Spearman’s rho bezitten uitdrukkingen die alleen afhangen van copula’s en zijn dus zogenaamde copulagebaseerde afhankelijkheidsmaten. Ze hebben het grote voordeel dat ze invariant zijn onder strikt stijgende transformaties.

Eigenschap 1.27 (Kendall’s tau i.f.v. copula’s). Beschouw twee continue kansvariabelen X en Y met copula C. Kendall’s tau voor X en Y bezit dan een uitdrukking die alleen afhangt van C:

τX,Y = 4 Z Z

I2

C(u, v) dC(u, v) − 1.

Eigenschap 1.28 (Spearman’s rho i.f.v. copula’s). Beschouw twee continue kansvaria- belen X en Y met copula C. Spearman’s rho voor X en Y bezit dan een uitdrukking die alleen afhangt van C:

ρS(X, Y ) = 12 Z Z

I2

uv dC(u, v) − 3 = 12 Z Z

I2

C(u, v) dudv − 3.

1.2.2.2 Verband met staartafhankelijkheidsparameters

Ook de staartafhankelijkheidsparameters zijn copulagebaseerde afhankelijkheidsmaten. Biva- riate staartafhankelijkheid tussen twee kansvariabelen X en Y met marginale verdelingsfunc- ties F en G kan uitgedrukt worden a.d.h.v. staartafhankelijkheidsparameters zoals beschreven in definities 1.5 en 1.6. We kunnen deze ook uitdrukken a.d.h.v. de op [0, 1] uniforme kans- variabelen U = F (X) en V = G(Y ):

λL = lim

u→0P (U ≤ u|V ≤ u) λU = lim

u→1P (U > u|V > u)

= lim

u→0P (U > 1 − u|V > 1 − u).

(19)

Indien X en Y continu zijn en copula C bezitten, wordt dit in termen van hun copula:

λL= lim

u→0

C(u, u)

u en λU = lim

u→0

C(1 − u, 1 − u)¯

u ,

waarbij ¯C de survivalfunctie van C is, deze is gedefinieerd als C(u, v) = P (U > u, V > v),¯ ∀u, v ∈ [0, 1] . 1.2.3 Voorbeelden van copula’s

We geven nu enkele voorbeelden van twee belangrijke klassen van copula’s: de elliptische copula’s en de Archimedische copula’s. We steunen hiervoor op Kandakova [15].

1.2.3.1 Elliptische copula’s

Elliptische copula’s zijn copula’s die geassocieerd worden met elliptische verdelingsfuncties, maar zelf geen elliptische verdelingsfuncties zijn. Voor een definitie van een elliptische verde- lingsfunctie en enkele voorbeelden wordt verwezen naar sectie A.4 van de appendix.

Elliptische copula’s hebben als voordeel dat simulatie ervan eenvoudig is. Ze hebben echter als nadeel dat er geen uitdrukkingen in gesloten vorm bestaan en dat ze symmetrisch zijn.

In veel financi¨ele toepassingen is er vaak sprake van asymmetrie (meestal sterkere afhanke- lijkheid tussen grote verliezen dan tussen grote winsten) en deze kunnen niet gemodelleerd worden a.d.h.v. elliptische copula’s. Twee belangrijke voorbeelden zijn de Gaussische copula en de Student-t copula. Ze worden gedefinieerd m.b.v. de stelling van Sklar.

Voorbeeld 1.29 (Gaussische copula). Beschouw de standaard n-variate normale verdeling ΦnR met correlatiematrix R. De Gaussische copula gedefinieerd als

C(u1, . . . , un; R) = ΦnR φ−1(u1), . . . , φ−1(un) ,

waarbij φ−1 de kwantielfunctie is van een univariate standaardnormale verdeling.

De normale copula laat zowel positieve als negatieve afhankelijkheid toe, maar bezit geen staartafhankelijkheid. Voor n = 2 is R = θ ∈ ]−1, 1[. Er geldt in dit geval

θ→−1lim C(u1, u2, θ) = W (u1, u2), lim

θ→1C(u1, u2, θ) = M (u1, u2), ∀u1, u2 ∈ [0, 1] . Bovendien geldt dat

θ→0limC(u1, u2, θ) = Π(u1, u2), ∀u1, u2 ∈ [0, 1] .

Voorbeeld 1.30 (Student-t copula). Beschouw de n-variate Student-t verdeling tnR,ν met correlatiematrix R en ν > 2 vrijheidsgraden.

C(u1, . . . , un; R, ν) = tnR,ν(tν−1(u1), . . . , t−1ν (un)),

waarbij t−1ν de inverse is van de univariate t-verdeling. In het bivariaat geval wordt de corre- latiematrix R beschreven door slechts 1 parameter θ ∈ ]−1, 1[.

(20)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 14

Een Student-t copula bezit wel staartafhankelijkheid in beide staarten en is dus een betere keuze voor de modellering van extreme afhankelijkheid dan de normale verdeling. We merken echter wel op dat de boven- en onderstaartafhankelijkheidsparameters gelijk zijn voor de Student-t copula. Verder merken we op dat de Student-t copula naar een normale copula nadert als ν → ∞.

1.2.3.2 Archimedische copula’s

Archimedische copula’s worden niet gedefinieerd m.b.v. de stelling van Sklar, maar worden gegenereerd door een zogenaamde Archimedische copula generator. We beperken ons tot het bivariaat geval, daar alleen bivariate copula’s gebruikt worden bij de opbouw van een vine copula.

Definitie 1.31 (Archimedische copula generator). Een Archimedische copula generator is een continue, strikt dalende functie ϕ : [0, 1] → [0, ∞] met ϕ(1) = 0. Deze generator wordt strikt genoemd indien ϕ(0) = ∞.

Definitie 1.32 (Pseudo-inverse van een Archimedische copula generator). De pseudo- inverse ϕ[−1] van een Archimedische copula generator ϕ wordt gedefinieerd door

ϕ[−1](t) =

 ϕ−1(t), t ∈ [0, ϕ(0)]

0, t ∈ [ϕ(0), ∞] .

Definitie 1.33 (Bivariate Archimedische copula). Beschouw een strikte en convexe Ar- chimedische copula generator ϕ : [0, 1] → [0, ∞]. Een Archimedische copula is een functie C : [0, 1]2→ [0, 1] gedefinieerd door

C(u, v) = ϕ[−1](ϕ(u) + ϕ(v)).

We bekijken nu enkele voorbeelden van bivariate Archimedische copula’s.

Voorbeeld 1.34 (Onafhankelijkheidscopula). De bivariate onafhankelijkheidscopula Π(u, v) = uv wordt gegeneerd door ϕ(t) = − ln(t).

Voorbeeld 1.35 (Gumbel copula). De bivariate Gumbel copula wordt gegeven door C(u, v; θ) = exp



−

(− ln(u))θ+ (− ln(v))θ1θ

, θ ≥ 1.

Haar generator wordt gegeven door

ϕθ(t) = (− ln t)θ.

Voorbeeld 1.36 (Clayton copula). De bivariate Clayton copula wordt gegeven door C(u, v; θ) =



u−θ+ v−θ− 11

θ, θ ∈ [−1, ∞) \{0}.

Deze copula wordt ook wel eens de Mardia-Takahasi-Cook-Johnson (MTCJ) copula genoemd. Haar generator wordt gegeven door

ϕθ(t) = t−θ− 1 θ .

(21)

Deze copula bezit volgende eigenschappen:

• limθ→0C(u, v; θ) = Π(u, v).

• Deze copula is niet in staat om sterke negatieve afhankelijkheid te modelleren.

• Deze copula vertoont sterke onderstaartafhankelijkheid en zwakke bovenstaartafhanke- lijkheid.

1.3 Vines en vine copula’s

Een vine is een grafisch instrument om afhankelijkheid tussen kansvariabelen te modelleren.

Vines hebben hun naam te danken aan de vorm van de grafische voorstelling, deze lijkt vaak op een tros druiven. In combinatie met copula’s zijn vines erg nuttig bij het modelleren van afhankelijkheid in hoge dimensies.

We starten met enkele basisdefinities en voorbeelden. Daarna wordt de vine copula of pair- copula constructie besproken.

1.3.1 Vines

1.3.1.1 Definities en voorbeelden

Definitie 1.37 (Verbonden boom). T = {N, E} is een boom met knopen N en takken E, indien E een deelverzameling is van ongeordende paren van knopen uit N zonder een cyclus.

M.a.w. @ rij a1, . . . , ak (k > 2) van elementen van N zodat

{a1, a2} ∈ E, . . . , {ak−1, ak} ∈ E, {a1, ak} ∈ E.

De takken van een boom mogen dus geen gesloten kring vormen.

Een boom T wordt verbonden genoemd als er een pad bestaat tussen elk paar knopen. M.a.w.

∀a, b ∈ N , ∃ rij c2, . . . , ck−1 (k > 2) van elementen van N , zodat {a, c2} ∈ E, {c2, c3} ∈ E, . . . , {ck−1, b} ∈ E.

Definitie 1.38 (Vine). Een vine V op n variabelen is een geordende verzameling van ver- bonden bomen V = {T1, . . . , Tn−1}, waarbij de takken van boom Ti de knopen zijn van boom Ti+1, ∀i ∈ {1, . . . , n − 2}.

Definitie 1.39 (Reguliere vine). Beschouw de verzameling van takken van een vine V = {T1, . . . , Tn−1}:

E(V) = E1∪ . . . ∪ En−1. V is een reguliere vine op n elementen als

∀i ∈ {2, . . . , n − 1} : {a, b} ∈ Ei ⇒ #(a∆b) = 2,

waarbij ∆ de operator is voor het symmetrisch verschil en # staat voor de kardinaliteit voor een verzameling.

(22)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 16

Een reguliere vine is dus eigenlijk een vine waarbij twee takken in boom Ti verbonden worden door een tak in boom Ti+1 alleen in het geval dat deze takken een gemeenschappelijke knoop hebben, i ∈ {1, . . . , n − 2}. De verbondenheid van de bomen opgelegd in de definitie van een vine, zorgt ervoor dat er genoeg takken verbonden worden, zodat er een pad bestaat tussen elk paar knopen. De extra eigenschap die opgelegd wordt voor reguliere vines, ook wel eens de proximiteitseigenschap genoemd, legt een voorwaarde op m.b.t. de situatie waarin twee takken verbonden mogen worden.

Opmerking 1.40. Bij een reguliere vine worden twee takken in een bepaalde boom alleen verbonden door een tak in de volgende boom indien deze takken een gemeenschappelijke knoop bezitten. We zeggen dat deze gemeenschappelijke knopen behoren tot de zogenaamde condi- tionerende verzameling, terwijl de overblijvende niet-gemeenschappelijke knopen behoren tot de zogenaamde geconditioneerde verzameling. In wat volgt noteren we telkens de con- ditionerende verzameling rechts van ”|”, terwijl de geconditioneerde verzameling links ervan genoteerd wordt. De unie van de conditionerende verzameling en de geconditioneerde verza- meling wordt de constraintverzameling genoemd.

Definitie 1.41 (Graad van een knoop). De graad van een knoop in boom Ti is het aantal takken van Ti dat ermee verbonden is.

Er zijn twee soorten reguliere vines met een heel typische structuur: C-vines en D-vines.

Definitie 1.42 (C-vine). Een Canonische vine of C-vine is een reguliere vine waarbij elke boom Ti, met uitzondering van de laatste boom, een unieke knoop van graad n − i heeft. Er is m.a.w. in elke boom, met uitzondering van de laatste boom, een unieke knoop met maximale graad. Deze knoop wordt de wortelvariabele genoemd.

Definitie 1.43 (D-vine). Een D-vine is een reguliere vine waarbij alle knopen in boom T1

hoogstens graad twee hebben.

We illustreren nu voorgaande definities en notaties a.d.h.v. enkele voorbeelden.

Voorbeeld 1.44 (Reguliere en niet-reguliere vine). Figuur 1.2 toont een voorbeeld van een niet-reguliere vine in het geval dat er n = 4 variabelen zijn. Deze figuur is equivalent met figuur 1.3. Figuur 1.4 toont een voorbeeld van een reguliere vine op 4 variabelen. Deze figuur is equivalent met figuur 1.5.

Figuren 1.2 en 1.4 illustreren de oorsprong van de benaming vine. Vine betekent letterlijk wijnstok en op deze figuren zien we dat de grafische voorstelling van een vine op een tros druiven lijkt. Figuren 1.3 en figuur 1.5 daarentegen, geven duidelijker de knopen en takken per boom aan.

We tonen nu voor beide figuren aan dat het wel degelijk om een reguliere of niet-reguliere vine gaat.

(23)

Figuur 1.2: Een niet-reguliere vine op 4 variabelen.

Figuur 1.3: Een niet-reguliere vine op 4 variabelen.

Figuur 1.4: Een reguliere vine op 4 variabelen.

(24)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 18

Figuur 1.5: Een reguliere vine op 4 variabelen.

Voor figuur 1.5 geldt:

• T1: N1= {1, 2, 3, 4} en E1 = {{1, 2}, {2, 3}, {3, 4}}

• T2: N2= E1 en E2 = {{1, 3|2}, {2, 4|3}}

• T3: N3= E2 en E3 = {{1, 4|2, 3}}

We hebben te maken met een vine, want we hebben in de eerste plaats een geordende verzame- ling van verbonden bomen {T1, T2, T3}, waarbij de takken van boom Ti knopen zijn van boom Ti+1, ∀i ∈ {1, 2}. Dit laatste volgt meteen uit de figuur.

Om de verbondenheid van deze bomen te onderzoeken, dienen we na te gaan of er voor elke boom een pad bestaat tussen elk paar knopen van die boom.

• Boom T1:

Beschouw knoop 1 in de eerste boom T1. Het pad tussen knoop 1 en knoop 2 wordt gegeven door tak {1, 2} van boom T1 en het pad tussen knoop 1 en knoop 3 wordt gegeven door tak {1, 2} en tak {2, 3} van boom T1, er is m.a.w. geen rechtstreeks pad, maar er dient omgegaan te worden via knoop 2. Het pad tussen knoop 1 en knoop 4 wordt gegeven door tak {1, 2}, tak {2, 3} en tak {3, 4} van boom T1, er dient dus omgegaan te worden via knoop 2 en knoop 3 van boom T1. Dit toont aan dat er een pad bestaat tussen knoop 1 en alle andere knopen van de eerste boom T1. Voor de andere knopen van de eerste boom geldt op analoge wijze dat er een pad bestaat tussen de betreffende knoop en alle andere knopen van de eerste boom.

• Boom T2:

Beschouw nu knoop {1, 2} van boom T2. Ook hier bestaat opnieuw een pad tussen knoop {1, 2} en de andere knopen {2, 3} en {3, 4} van boom T2. Inderdaad, het pad tussen knoop {1, 2} en knoop {2, 3} wordt gegeven door tak {1, 3|2} van boom T2, terwijl het pad tussen knoop {1, 2} en knoop {3, 4} gegeven wordt door tak {1, 3|2} en tak {2, 4|3}

van boom T2, er dient dus omgegaan te worden via knoop {2, 3} van T2. Voor de andere knopen van boom T2 kan op analoge wijze aangetoond worden dat er een pad bestaat tussen de betreffende knoop en alle andere knopen van de tweede boom.

(25)

• Boom T3:

De derde boom T3 bevat slechts twee knopen, namelijk {1, 3|2} en {2, 4|3} en het pad tussen beide wordt gegeven door tak {1, 4|2, 3} van boom T3.

Deze vine is regulier omdat twee takken in een bepaalde boom alleen verbonden worden door een tak in de volgende boom indien deze takken een gemeenschappelijke knoop bezitten. Om de regulariteit na te gaan dient men in feite na te gaan of elke tak van de vine in een bepaalde boom Ti, opgebouwd is uit twee takken van boom Ti−1 die een knoop van Ti−1 gemeenschap- pelijk hebben, i ∈ {2, 3}.

• Boom T2:

– Beschouw tak e = {1, 3|2} in T2 met conditionerende verzameling {2}, geconditio- neerde verzameling {1, 3} en constraintverzameling {1, 2, 3}. Deze tak verbindt de knopen {1, 2} en {2, 3} van boom T1, welke knoop 2 van boom T1 gemeenschappelijk hebben.

– Beschouw tak e = {2, 4|3} in T2 met conditionerende verzameling {3}, geconditio- neerde verzameling {2, 4} en constraintverzameling {2, 3, 4}. Deze tak verbindt de knopen {2, 3} en {3, 4} van boom T1, welke knoop 3 van boom T1 gemeenschappelijk hebben.

• Boom T3:

Beschouw tak e = {1, 4|2, 3} in T3 met conditionerende verzameling {2, 3}, geconditi- oneerde verzameling {1, 4} en constraintverzameling {1, 2, 3, 4}. Deze tak verbindt de knopen {1, 3|2} en {2, 4|3} van boom T2, welke opgebouwd zijn uit respectievelijk knoop {1, 2} en knoop {2, 3} en knoop {2, 3} en knoop {3, 4} van boom T2 en dus knoop {2, 3}

van boom T2 gemeenschappelijk hebben.

Voor figuur 1.3 geldt:

• T1: N1= {1, 2, 3, 4} en E1 = {{1, 2}, {2, 3}, {3, 4}}

• T2: N2= E1 en E2 = {{2, 4|3}, {1, 2, 3, 4}}

• T3: N3= E2 en E3 = {{1|2, 3, 4}}

Deze vine is niet regulier omdat de proximiteitseigenschap niet voldaan is. Zo worden bij- voorbeeld takken {1, 2} en {3, 4} van T1 verbonden d.m.v. tak {1, 2, 3, 4} van T2, terwijl {1, 2}

en {3, 4} geen enkele knoop gemeenschappelijk hebben. Formeel kunnen we dit uitdrukken als volgt:

1. Beschouw a = {1, 2} ∈ E1 en b = {3, 4} ∈ E1, m.a.w. a en b zijn takken van boom T1. 2. Er geldt:

#(a∆b) = #([{1, 2}\{3, 4}] ∪ [{3, 4}\{1, 2}]) = #({1, 2, 3, 4}) = 4 6= 2.

(26)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 20

Voorbeeld 1.45 (C-vine). In figuur 1.6 wordt een C-vine op 5 variabelen weergegeven.

We hebben in dit geval:

• T1: N1= {1, 2, 3, 4, 5} en E1= {{1, 2}, {1, 3}, {1, 4}, {1, 5}}

• T2: N2= E1 en E2 = {{2, 3|1}, {2, 4|1}, {2, 5|1}}

• T3: N3= E2 en E3 = {{3, 4|1, 2}, {3, 5|1, 2}}

• T4: N4= E3 en E4 = {4, 5|1, 2, 3}.

Het is een C-vine omdat elke boom Ti, uitgezonderd de laatste boom, een unieke knoop heeft met maximale graad n − i. In dit geval is n = 5 en boom T1 heeft wortelvariabele 1 met graad 4, boom T2 heeft wortelvariabele {1, 2} met graad 3 en boom T3 heeft wortelvariabele {2, 3|1}

met graad 2.

Figuur 1.6: Een C-vine op 5 variabelen.

Voorbeeld 1.46 (D-vine). In figuur 1.7 wordt een D-vine op 5 variabelen weergegeven.

We hebben in dit geval:

• T1: N1= {1, 2, 3, 4, 5} en E1= {{1, 2}, {2, 3}, {3, 4}, {4, 5}}

• T2: N2= E1 en E2 = {{1, 3|2}, {2, 4|3}, {3, 5|4}}

• T3: N3= E2 en E3 = {{1, 4|2, 3}, {2, 5|3, 4}}

• T4: N4= E3 en E4 = {1, 5|2, 3, 4}.

Het is een D-vine omdat alle knopen in boom T1 hoogstens graad 2 hebben. Zo hebben knoop 1 en knoop 5 beide graad 1, terwijl de overige knopen uit de eerste boom graad 2 hebben.

(27)

Figuur 1.7: Een D-vine op 5 variabelen.

Voorbeeld 1.47 (Reguliere vine die geen C-vine of D-vine is). In figuur 1.8 wordt een reguliere vine weergegeven die geen C-vine of D-vine is.

We hebben in dit geval:

• T1: N1= {1, 2, 3, 4, 5} en E1= {{1, 2}, {2, 4}, {4, 5}, {2, 3}}

• T2: N2= E1 en E2 = {{1, 4|2}, {2, 5|4}, {1, 3|2}}

• T3: N3= E2 en E3 = {{1, 5|2, 4}, {3, 4|1, 2}}

• T4: N4= E3 en E4 = {3, 5|1, 2, 4}.

Het is geen C-vine, want er bestaat een boom zonder knoop met maximale graad. Dit is bijvoorbeeld het geval voor boom T1. Knoop 2 heeft de hoogste graad, maar die is slechts drie en dus niet maximaal. Deze reguliere vine is ook geen D-vine, want er zijn knopen in boom T1 met een graad hoger dan twee. Dit is opnieuw het geval voor knoop 2 met graad drie.

Er kan nagegaan worden dat deze vine wel voldoet aan de voorwaarden voor een reguliere vine.

(28)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 22

Figuur 1.8: Een reguliere vine op 5 variabelen, die geen C-vine of D-vine is.

Opmerking 1.48. Algemeen hebben we voor een C-vine of D-vine op n variabelen volgende uitdrukkingen:

1. C-vine:

• N1= {1, . . . , n}

E1 = {1, i : i = 2, . . . , n}

Ek = {k, k + i|1, . . . , k − 1 : i = 1, . . . , n − k}, k = 2, . . . , n − 1

• T1 = {N1, E1} en Tk= {Nk, Ek} = {Ek−1, Ek}, k = 2, . . . , n − 1

• Elke tak e = {s, t} van een C-vine heeft m.a.w. volgende gedaante:

e = [j, j + i|1, . . . , j − 1] , met j = 1, . . . , n − 1 en i = 1, . . . , n − j.

Hierbij is {1, . . . , j − 1} de conditionerende verzameling en {j, j + i} de gecondi- tioneerde verzameling.

2. D-vine:

• N1= {1, . . . , n}

E1 = {i, i + 1 : i = 1, . . . , n − 1}

Ek = {i, i + k|i + 1, . . . , i + k − 1 : i = 1, . . . , n − k}, k = 2, . . . , n − 1

• T1 = {N1, E1} en Tk= {Nk, Ek} = {Ek−1, Ek}, k = 2, . . . , n − 1

• Elke tak e = {s, t} van een D-vine heeft m.a.w. volgende gedaante:

e = [i, i + j|i + 1, . . . , i + j − 1] , met j = 1, . . . , n − 1 en i = 1, . . . , n − j.

Hierbij is {i + 1, . . . , i + j − 1} de conditionerende verzameling en {i, i + j} de geconditioneerde verzameling.

(29)

1.3.1.2 Eigenschappen

Eigenschap 1.49. Een reguliere vine op n variabelen bezit n(n−1)2 takken.

Eigenschap 1.50 (Uniciteit constraintverzameling). Beschouw een reguliere vine op n variabelen. Twee takken in dezelfde boom met dezelfde constraintverzameling zijn identiek.

Eigenschap 1.51 (Uniciteit geconditioneerde verzameling). Beschouw een reguliere vine op n variabelen. Twee takken met dezelfde geconditioneerde verzameling zijn identiek.

Het aantal mogelijke reguliere vines groeit heel sterk wanneer het aantal variabelen n toe- neemt, dit blijkt uit volgende stelling.

Stelling 1.52 (Aantal reguliere vines op n variabelen). Er zijn

 n 2



× (n − 2)! × 2(n−2)(n−3)2 reguliere vines op n variabelen.

Eigenschap 1.53 (Aantal C-vines en D-vines).

1. Er bestaan n!2 verschillende C-vines op n variabelen.

2. Er bestaan n!2 verschillende D-vines op n variabelen.

Opmerking 1.54. Uit stelling 1.52 en eigenschap 1.53 volgt dat voor n ≤ 4, de enige reguliere vines op n variabelen C-vines en D-vines zijn. Als n ≥ 5, dan bestaan er reguliere vines die geen C-vine of D-vine zijn. Zo zijn er

 n 2



× (n − 2)! × 2(n−2)(n−3)2 − n!

2 +n!

2



= n!

2 × 2(n−2)(n−3)2 − n!

= n! ×

2(n−2)(n−3)2 −1− 1 .

Tabel 1.1 geeft een overzicht van het aantal reguliere vines, het aantal C-vines en D-vines en het aantal takken per reguliere vine voor 4, 5 en 10 variabelen. Deze tabel illustreert dat het aantal mogelijke reguliere vines heel sterk groeit wanneer het aantal variabelen n toeneemt.

Vooral reguliere vines die geen C-vine of D-vine zijn, zijn sterk vertegenwoordigd. De tabel werd bekomen a.d.h.v. eigenschap 1.49, stelling 1.52 en eigenschap 1.53.

n 4 5 10

Aantal reguliere vines 24 480 4.87 × 1014 Aantal C-vines 12 60 1814400

Aantal D-vines 12 60 1814400

Aantal takken per reguliere vine 6 10 45 Tabel 1.1: Overzicht reguliere vines voor n ∈ {4, 5, 10}.

(30)

HOOFDSTUK 1. MODELLERING VAN AFHANKELIJKHEID M.B.V. VINE

COPULA’S 24

1.3.2 Vine copula’s

1.3.2.1 Definitie en eigenschappen

Een vine copula of een pair-copula constructie is een bivariate copula vine specificatie, die bekomen wordt door met elke tak e van een reguliere vine op n variabelen een bivariate copula Ce te associ¨eren. Er moeten in totaal n(n−1)2 bivariate copula’s toegekend worden, vermits een reguliere vine op n variabelen, wegens eigenschap 1.49, precies n(n−1)2 takken bezit.

De volgende stelling is erg belangrijk en zegt dat er een unieke vine-afhankelijke dichtheids- functie bestaat en geeft tevens de gedaante ervan.

Stelling 1.55 (Bedford en Cooke). Beschouw een reguliere vine V op n variabelen. On- derstel dat met elke tak e ∈ E(V) met geconditioneerde verzameling {i, j} en conditionerende verzameling De, een voorwaardelijke copula Ci,j|De geassocieerd wordt met copuladichtheid ci,j|De. Onderstel verder dat de marginale verdelingsfuncties F1, . . . , Fn gegeven zijn met dichtheden f1, . . . , fn. Dan bestaat er een unieke vine-afhankelijke verdelingsfunctie en de dichtheid ervan wordt gegeven door

f1...n= f1. . . fn Y

e∈E(V)

ci,j|De(Fi|De, Fj|De).

Opmerking 1.56. Als we de uitdrukking voor de vine-afhankelijke dichtheidsfunctie uit de stelling van Bedford en Cooke vergelijken met de dichtheidsfunctie van formule (1.3), afkom- stig van eigenschap 1.24, merken we op dat bij gebruik van reguliere vines, de copuladichtheid c(F1(x1), . . . , Fn(xn)) geschreven kan worden als het product van voorwaardelijke bivariate copuladichtheden. Reguliere vines hebben dus het grote voordeel dat ze voor een grote vereen- voudiging zorgen bij het construeren van een multivariate verdelingsfunctie.

Gevolg 1.57 (Vine-afhankelijke dichtheidsfunctie van een C-vine of D-vine). M.b.v.

opmerking 1.48 bekomen we volgende uitdrukkingen voor de vine-afhankelijke dichtheidsfunc- ties corresponderend met een C-vine of een D-vine op n variabelen.

1. De dichtheid f1...n die correspondeert met een C-vine bezit volgende uitdrukking

f1...n(x1, . . . , xn) =

n

Y

k=1

fk(xk

n−1

Y

j=1 n−j

Y

i=1

cj,j+i|1,...,j−1{Fj|1,...,j−1(xj|x1, . . . , xj−1), Fj+i|1,...,j−1(xj+i|x1, . . . , xj−1)}.

2. De dichtheid f1...n die correspondeert met een D-vine bezit volgende uitdrukking

f1...n(x1, . . . , xn) =

n

Y

k=1

fk(xk) ×

n−1

Y

j=1 n−j

Y

i=1

ci,i+j|i+1,...,i+j−1{Fi|i+1,...,i+j−1(xi|xi+1, . . . , xi+j−1), Fi+j|i+1,...,i+j−1(xi+j|xi+1, . . . , xi+j−1)}.

Het aantal niveaus van een pair-copula constructie kan gereduceerd worden d.m.v. de volgende eigenschap.

Referenties

GERELATEERDE DOCUMENTEN

In het kader van het beheer van de informatieverwerking overeenkomstig de artikelen 44/1 tot 44/11 van de wet op het politieambt van 5 augustus 1992, zoals gewijzigd door de wet van

Het aan de Commissie ter advies voorgelegde ontwerp van koninklijk besluit heeft tot doel de Vlaamse Landmaatschappij toegang te verlenen tot het Rijksregister van de

In class we calculated the relationship between the radius of gyration, R g , and the root-mean square (RMS) end-to-end vector R for a Gaussian polymer coil. a) What three

dere factoren zoals materiaal, methode en fabricage en het te gebruiken gereedschap kan het mogelijk zijn dat men dient af te wijken van deze richtwaarden.. De juiste boormaat

106592 - Afschaffing eigen seniorenregeling is een wijziging van het systeem van het taakbeleid waarvoor instemming van tweederde deel van het personeel vereist

106769 - Het bezwaar tegen de functie medewerker administratie C schaal 5 is ongegrond omdat de waardering van de werkzaamheden past bij het scorepatroon van de toegekende functie

De voldoening als er op vrijdagmorgen drommen enthousiaste congresgangers de locatie binnenstappen, sprekers heel gedreven en begeesterd komen vertellen over hun specifiek vakgebied

ACTIE: secretariaat Verder wordt door de opstellers aangegeven dat de visie een abstracte inhoud heeft, en dat het beleidsplan dat er op volgt praktischer zal zijn. Desgevraagd