• No results found

HeringMaxime Multivariateafhankelijkheid:Devineco-pulaentoepassingenopfinanci¨elerende-menten

N/A
N/A
Protected

Academic year: 2021

Share "HeringMaxime Multivariateafhankelijkheid:Devineco-pulaentoepassingenopfinanci¨elerende-menten"

Copied!
122
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Multivariate afhankelijkheid: De vine co- pula en toepassingen op financi¨ele rende- menten

Proefschrift ingediend met het oog op het behalen van de graad van Master in de Wiskunde

Hering Maxime

Promotor: Prof. dr. Christophe Croux

MEI 2014

(2)

Though the road’s been rocky it sure feels good to me

- B. Marley

(3)

Het meten van afhankelijkheden tussen meerdere variabelen is een complexe taak. De klas- sieke correlatieco¨effici¨ent is vaak ontoereikend, omdat deze enkel lineaire verbanden nagaat, en ge¨ınspireerd is op de bivariate normale verdeling. Vaak zijn bivariate verdelingen echter niet normaal, en we hebben nood aan een flexibele klasse van verdelingen; Copula’s helpen ons hier. De verdelingen van de aparte variabelen worden eerst gekozen, en daarna wordt een copula geselecteerd om de afhankelijkheidsstructuur te modelleren.

In deze meesterproef behandelen we een multivariate versie van copula’s, die toelaat afhan- kelijkheden tussen meerdere, zelfs tientallen variabelen, te modelleren. Hiervoor gebruiken we vines, die de afhankelijkheid tussen meerdere variabelen op een accurate en flexibele ma- nier beschrijft, zonder een te groot aantal parameters te moeten schatten. Het idee is om de multivariate copula-dichtheid te herschrijven als een product van bivariate (conditionele) copula’s. Een vine is een verzameling van bomen, waar elke boom een grafische weergave is van de (conditionele) afhankelijkheden tussen variabelen.

Deze technieken worden toegepast op rendementen van financi¨ele instrumenten, waar er complexe afhankelijkheden kunnen bestaan. De dynamiek van de aparte tijdreeksen, die hier dus de rendementen zijn, wordt eerst gemodelleerd met univariate ARMA-GARCH tijdreeksmodellen. De afhankelijkheden tussen de tijdreeksen worden dan gecapteerd door een vine copula-verdeling tussen de residuen van de univariate modellen. We leggen uit hoe de verschillende bouwstenen van de vine worden bekomen, en hoe de paar-copula ontbinding van een multivariate dichtheidsfunctie kan worden bewezen. Ook wordt gekeken naar twee mogelijke manieren om het model te verbeteren. In eerste instantie wordt er gestreefd naar een vereenvoudiging van het model, die het rekenwerk moet verminderen. Vervolgens wordt gekeken hoe de tijdsvari¨erende afhankelijkheid kan worden ge¨ımplementeerd in het model.

Ter evaluatie van de vine copula wordt op basis van het model de Value-at-Risk dagelijks berekend en vergeleken met de gerealiseerde rendementen.

ii

(4)

Met de recente financi¨ele crisis en de nieuwe Solvency- en Baselregels is het duidelijk gewor- den dat de klassieke statistische modellen die toegepast werden hun beperkingen hebben.

Het is uitermate belangrijk om de afhankelijkheden tussen verschillende financi¨ele instru- menten mee in rekening te brengen. We illustreren in 3 case-studies hoe de vine copula modellen hiervoor gebruikt kunnen worden. In een eerste case worden verschillende vine copulas geconstrueerd voor de maandelijkse rendementen van 14 Europese landen over een periode van 13 jaar en worden deze met elkaar vergeleken. Een tweede dataset bevat de dagelijkse rendementen van de BEL20 index en haar componenten samen met hun sectoren en dit over een periode van 8 jaar. Hierop wordt het Regular Vine Market Sector model toegepast om voor elk aandeel het specifiek en systematisch risico te bepalen. Ook wordt aan de hand van de Value-at-Risk bevestigd dat de vine copula een goed model is.

(5)

Samenvatting ii

Lijst van figuren vii

Lijst van tabellen viii

1 Inleiding 1

2 Copula’s 4

2.1 Fundamentele copula’s . . . 10

2.2 Elliptische copula’s . . . 11

2.3 Archimedische copula’s . . . 12

3 Vine en paar-copula ontbinding 17 3.1 Reguliere vine . . . 18

3.2 Paar-copula ontbinding . . . 24

3.3 D-vine en C-vine . . . 31

4 Toepassing van vines in finance 34 4.1 Tijdreeksen . . . 36

4.2 Vine-structuur . . . 38

4.2.1 Maximum Spanning Tree . . . 39

4.2.2 Paar-copula fit . . . 41

4.2.3 Getransformeerde observaties . . . 43

4.3 Matrix representatie van een reguliere vine . . . 44

4.4 Gesnoeide en vereenvoudigde reguliere vines . . . 47

4.4.1 Gesnoeide reguliere vine . . . 47

4.4.2 Vereenvoudigde reguliere vine . . . 49

4.5 Tijdsvari¨erende copula’s . . . 51

4.5.1 Dynamisch Conditioneel Correlatie-model . . . 52

4.6 Model evaluatie aan de hand van Value-at-Risk . . . 56 iv

(6)

5 Empirische toepassing 59

5.1 Case 1: Maandelijkse rendementen van 14 Europese landen, 1991-2014. . . . 60

5.1.1 Marginale modellen . . . 60

5.1.2 Vine constructie . . . 63

5.1.3 Vergelijken van de reguliere vines, de C-vine en de D-vine . . . 68

5.1.4 Snoeiing en vereenvoudiging van de reguliere vine . . . 70

5.1.5 Multivariate student t copula . . . 72

5.1.6 Dynamische paar-copula’s . . . 72

5.2 Case 2: Dagelijkse rendementen BEL 20 componenten met respectievelijke sectoren, 2006-2014. . . 73

5.2.1 Regulare Vine Market Sector model . . . 76

5.2.2 Systematisch en specifiek risico . . . 79

5.3 Case 3: Value-at-Risk model evaluatie . . . 82

Bibliografie 84 Index 87 A Appendix 88 A.1 Case 1 . . . 88

A.2 Case 2 . . . 99

A.3 Case 3 . . . 108

(7)

2.1 (a) concordante en (b) discordante paren . . . 8

3.1 D-vine voor 5 variabelen . . . 21

3.2 j-fold union voor e met j ∈ (0, 1, 2, 3) . . . 22

3.3 boog e rond top j . . . 24

3.4 Tn−1 en Tn−2 . . . 27

3.5 Reguliere vine voor 3 variabelen . . . 30

3.6 C-vine voor 5 variabelen . . . 33

4.1 5-dimensionale reguliere vine . . . 45

5.1 Geschatte dichtheidsfunctie voor de rendementen van Belgi¨e . . . 61

5.2 Tijdsvari¨erende volatiliteit voor de rendementen van Belgi¨e . . . 62

5.3 Transformatie naar uniform verdeelde tijdreeks . . . 63

5.4 Structuur van de eerste boom in de reguliere vine . . . 65

5.5 (a) Alle mogelijke bogen in boom 3 met overeenkomstige Kendall’s tau, (b) de bekomen boomstructuur door het toepassen van het Prim’s algoritme. . 66

5.6 Structuur van de eerste boom van de D-vine . . . 68

5.7 Tijdsvari¨erende Kendall tau voor de paren variabelen in boom 1 . . . 74

5.8 (a) Boom 1 en (b) boom 2 van RVMS-model voor de BEL20 . . . 78

5.9 Speciek en systematisch risico bij diversificatie . . . 79

5.10 Boom 1 van reguliere vine voor portefeuille . . . 82

5.11 VaR berekeningen en gerealiseerde log-rendementen . . . 83

A.1 Scatterplots boom 1 van reguliere vine . . . 89

A.2 Boom 2 reguliere vine . . . 98

A.3 Boom 3 reguliere vine . . . 98

A.4 Boom 1 reguliere vine . . . 99

A.5 Aandelenkoers van BEL 20 en sectoren . . . 101

A.6 Aandelenkoers van BEL 20 - componenten (1) . . . 101

vi

(8)

A.7 Aandelenkoers van BEL 20 - componenten (2) . . . 102

A.8 Log-rendementen van BEL 20 en sectoren . . . 102

A.9 Log-rendementen van BEL 20 - componenten (1) . . . 103

A.10 Log-rendementen van BEL 20 - componenten (2) . . . 103

A.11 Scatterplots tussen de pseudo-observaties van de BEL20 en de sectoren . . . 104

A.12 Scatterplots tussen de pseudo-observaties van de finanici¨ele sector en haar aandelen . . . 105

A.13 Scatterplots tussen de pseudo-observaties van de consumenten diensten sector en haar aandelen . . . 106

A.14 Scatterplots tussen de pseudo-observaties van de nutssector en haar aandelen en tussen de basis materialen sector en haar aandelen . . . 107

A.15 Scatterplots tussen de pseudo-observaties van de overige sectoren en haar aan- delen . . . 108

A.16 Scatterplots van de pseudo-observaties voor de reguliere vine . . . 109

(9)

5.1 Beschrijvende statistieken van de rendementen van de 14 Europese landen . . 61

5.2 Per boom het aantal paar-copula’s binnen een bepaalde familie . . . 67

5.3 Vergelijking van de verschillende vines . . . 69

5.4 Vuong test tussen de verschillende vines . . . 69

5.5 BIC-waardes voor de verschillende snoeiingsniveau’s . . . 71

5.6 Vuong test statistieken voor het bepalen van het vereenvoudigingsniveau . . 71

5.7 Componenten BEL 20 . . . 75

5.8 Systematisch en specifiek risico voor de componenten van de BEL20 . . . 81

A.1 Geschatte ARMA-GARCH parameters voor de rendementen van de Europese landen . . . 90

viii

(10)

Inleiding

Een van de redenen voor de financi¨ele crisis die begon in 2007 was het niet accuraat vastleg- gen van de afhankelijkheid tussen verschillende activa. Voor een goed financieel risicobeheer is er nood aan een goed model die niet enkel de prijs bepaalt voor een groot aantal financi¨ele instrumenten maar eveneens de afhankelijkheid modelleert tussen de financi¨ele rendementen.

Vroeger werd hiervoor gebruik gemaakt van de correlatieco¨effici¨ent, deze beschrijft goed de afhankelijkheid voor elliptische verdelingen. Maar deze komen in de praktijk zelden voor daar men vaak te maken heeft met zware staarten van de verdeling en asymmetrie, die niet correct worden gemodelleerd aan de hand van elliptische verdelingen. Ook met het oog op de Basel en Solvency regels in de bank- en verzekeringssector, wordt er steeds meer aange- drongen op een geschikt intern model dat het re¨ele risico correct weergeeft.

Een zeer nuttige functie in dit opzicht is de copula-functie. Aan de hand van deze func- tie kan de gezamenlijke verdeling van meerdere toevalsvariabelen onderverdeeld worden in twee bijdragen: de marginale verdeling van iedere variabele en de afhankelijkheid tussen de verschillende variabelen, beschreven aan de hand van de copula functie. Een ander voor- deel van de copula-functie is dat verschillende afhankelijkheidgrootheden kunnen geschreven worden in functie van de onderliggende copula, dit is onder meer het geval voor de Kendall’s Tau, de Spearman’s rang correlatie alsook voor de staart-afhankelijkheid. In hoofdstuk 2 wordt een inleiding gegeven over de copula-functie en worden verschillende bivariate copula- families beschreven met bijhorende eigenschappen die in de financi¨ele toepassingen gebruikt zullen worden. Wanneer men gaat kijken naar multivariate copula’s brengt dit verschil- lende beperkingen met zich mee voor het juist modelleren van de afhankelijkheid. Zo zijn er tegenover de bivariate copula’s maar een beperkt aantal multivariate copula-klassen. De flexibiliteit in de staarten van de verdeling kan beperkt gemodelleerd worden aan de hand van elliptische copula’s. De Gaussiaanse copula heeft geen tail dependence en bij de student t copula is de tail dependence symmetrisch is en hangt die af van ´e´en enkele parameter voor

1

(11)

alle paren variabelen, namelijk het aantal vrijheidsgraden. Voor elliptische copula’s moeten ook veel parameters worden geschat. Bij de multivariate Archimedische copula’s zijn er ook parameter beperkingen die een gelijke afhankelijkheid voor elk paar variabelen veronderstel- len. Dit brengt opnieuw een beperkte flexibiliteit met zich mee. Om deze flexibiliteit bij het modelleren van de multivariate afhankelijkheid te verbeteren wordt er verkozen te werken met vine copula’s eerder dan met multivariate copula’s. Bij een vine copula wordt de mul- tivariate dichtheid ontbonden in een product van univariate dichtheidsfuncties en bivariate copula-dichtheidsfuncties toegepast op de variabelen, hun verdelingsfuncties en conditionele verdelingsfuncties. De bivariate copula’s die worden gebruikt in de vine copula zullen verder paar-copula’s worden genoemd.

Deze vine copula’s kennen vele toepassingen binnen de financi¨ele wereld. Daar is er nood aan een flexibele multivariate afhankelijkheidsstructuur dat het best overeenkomt met de realiteit. Zowel in het centrum als in de staart van de verdeling (Value-at-Risk). Log- rendementen hebben bekende karakteristieken, ze bezitten een zekere graad van asymmetrie en hoge kurtosis. De afhankelijkheidsstructuur tussen paren variabelen zullen sterk vari¨eren gaande van onafhankelijke tot complexe vormen van niet-lineaire afhankelijkheid; de meest gekende multivariate verdelingen kunnen dit niet allemaal correct weergeven. In dit werk zal men de vine copula’s toepassen om de afhankelijkheid tussen log-rendementen van ver- schillende variabelen zo goed mogelijk te modelleren.

In hoofdstuk 3 wordt aangetoond hoe de vine copula wordt geconstrueerd. Hiervoor wordt eerst een korte introductie gegeven rond grafentheorie. De reguliere vine wordt ingevoerd als grafisch model voor het beschrijven van een bepaalde afhankelijkheidsstructuur. Met de bijhorende elementenverzamelingen die de reguliere vine karakteriseren en een aantal ei- genschappen. Gebruikmakende van lemma’s wordt er toegewerkt naar de stelling die de paar-copula ontbinding geeft voor de multivariate verdeling. Tenslotte worden in het hoofd- stuk twee speciale reguliere vines gedefinieerd, namelijk de C-vine en de D-vine. In hoofdstuk 4 vervolgens wordt stap-per-stap beschreven hoe de vine copula in theorie kan worden toege- past op financi¨ele rendementen. Dit gebeurt door eerst een correct model te vinden voor de verschillende univariate tijdreeksen en vervolgens een geschikte vine-structuur te construe- ren. Er wordt ook getoond hoe een vine-copula kan worden beschreven aan de hand van een matrices. Bij het construeren van een vine copula moeten heel wat schattingen en model- vergelijkingen worden uitgevoerd. De hoeveelheid werk gaat stijgen met de dimensie van de dataset; daarom wordt er onderzocht of het mogelijk is van een vine te gaan vereenvoudigen of snoeien. Er wordt eveneens rekening gehouden met het feit dat de afhankelijkheid tussen financi¨ele variabelen varieert met de tijd, daarom wordt gekeken naar dynamische copula’s.

(12)

Eens het volledige model geconstrueerd is moet tenslotte kunnen worden nagegaan of de vine copula de afhankelijkheid van de gekozen portefeuille op een correcte manier beschrijft. Deze evaluatie gebeurd op basis van de Value-at-Risk voorspellingen die worden vergeleken met de gerealiseerde rendementen. Hiermee wordt onderzocht of het model een goede benadering is van de realiteit.

In hoofdstuk 5 tenslotte wordt alles wat in theorie werd beschreven toegepast op twee interes- sante datasets. Een eerste beschrijft de maandelijkse rendementen van 14 Europese landen.

De andere dataset bevat de dagelijkse rendementen van de componenten van de BEL20 in- dex. De implementatie gebeurt in R en men onderschijdt hiervoor drie cases. In de eerste case wordt voor de Europese landen vier verschillende vines geconstrueerd en worden ze met elkaar vergeleken. Ook wordt onderzocht of kan worden vereenvoudigd en gesnoeid en of de afhankelijkheid varieert met de tijd. Op de BEL20 wordt het Regular Vine Market Sector model toegepast die zal toelaten voor elk aandeel van de BEL20 speciefieke risico-factoren te bepalen. In een derde case wordt voor een portefeuille van vijf aandelen een reguliere vine geconstrueerd en worden de rendementen voorspeld gedurende een jaar. Op basis van de Value-at-Risk wordt dan tenslotte de vine ge¨evalueerd.

(13)

Copula’s

In dit hoofdstuk worden de concepten rond copula’s ingeleid aan de hand van Kadankova (2013), Kurowicka & Cooke (2006) en Nelsen (2006) met de nodige definities. Het is dankzij het theorema van Sklar dat de copula-functie zo interessant is. Deze laat toe de multivari- ate verdelingsfunctie te beschrijven aan de hand van de marginale verdelingsfuncties en de afhankelijkheidsstructuur gegeven door de copulafunctie. Vervolgens worden enkele interes- sante afhankelijkheidsgrootheden gegeven die afgeleid kunnen worden uit de copula en die later gebruikt zullen worden om de vine-structuur te, zoals de tail dependence, de Kendall’s tau en de Spearman’s rang correlatie. Tenslotte worden verschillende bivariate copula fami- lies beschreven samen met hun respectievelijke karakteristieken. Deze paar-copula’s zal men gebruiken voor het bekomen van de paar copula ontbinding van de multivariate afhankelijk- heid. Doorheen dit werk beschouwt men continue en inverteerbare verdelingsfuncties.

Zij X = (X1, . . . , Xn) ∈ Rn een vector van willekeurige variabelen met continue en in- verteerbare marginale verdelingsfuncties Fi(x) = P[Xi ≤ x], i ∈ {1, . . . , n} en gezamen- lijke verdelingsfunctie F op Rn met Borel sigma algebra B. Beschouw de vector U = (F1(X1), . . . , Fn(Xn)), waarbij de componenten Ui = Fi(Xi) wegens de probability integral transform uniform verdeeld zijn. Dan hebben we ook Xi = F−1(Ui) voor i ∈ {1, . . . , n}. De copula-functie wordt dan gedefinieerd als volgt.

Definitie 2.1 Een n-dimensionale copula is een functie C : [0, 1]n → [0, 1], dat de verde- lingsfunctie is van een willekeurige vector (U1, . . . , Un) met uniforme marginale verdelingen op [0, 1]

De n-dimensionale copula bezit volgende eigenschappen:

• C is stijgend in iedere component,

• C(1, 1, . . . , ui, . . . , 1) = ui, i ∈ (1, . . . , n), 4

(14)

• C(u1, . . . , un) = 0 als een van de argumenten 0 is,

• rechthoek eigenschap: VC(B) ≥ 0 voor alle rechthoeken B =Qn

i=1[ai, bi], waarbij het C-volume van B gedefinieerd is als

VC(B) =

2

X

i1=1

. . .

2

X

in=1

(−1)i1+...+inC (xi1, . . . , xin)

met xj1 = aj en xj2 = bj.

Vertrekkende van een multivariate kansverdeling, kan de copula functie worden geschreven als,

P (X1 ≤ F−1(u1), . . . , Xn ≤ F−1(un)) = P (U1 ≤ u1, . . . , Un≤ un)

= C(u1, . . . , un) Of ook nog

P (X1 ≤ x1, . . . , Xn≤ xn) = P (F1(X1) ≤ F1(x1), . . . , Fn(Xn) ≤ Fn(xn))

= C (F1(x1), . . . , Fn(xn)) In het bivariaat geval geeft dit dan,

Definitie 2.2 Een bivariate copula is een functie C : [0, 1]2 → [0, 1] met de volgende eigen- schappen voor u1, u2 ∈ [0, 1]:

• C(u1, 1) = u1 en C(1, u2) = u2,

• C(u1, 0) = C(0, u2) = 0,

• C is 2-stijgend, dus voor elke u11, u12, u21, u22 ∈ [0, 1] zodat voor u11≤ u21 en u12 ≤ u22 geldt,

C(u21, u22) − C(u21, u12) − C(u11, u22) + C(u11, u12) ≥ 0.

De populariteit van de copula-functie is te danken aan het theorema van Sklar (1959) die de relatie weergeeft tussen de copula C en de verdeling van X = (X1, . . . , Xn) en aantoont hoe de afhankelijkheid tussen de variabelen kan gescheiden worden van de marginale verdelingen.

Stelling 2.1 (Sklar) Gegeven willekeurige variabelen X1, . . . , Xn met continue verdelings- functies F1, . . . , Fn en gezamenlijke verdelingsfunctie F , dan bestaat er een unieke copula C zodat voor alle x = (x1, . . . , xn) ∈ Rn:

F (x1, . . . , xn) = C(F1(x1), . . . , Fn(xn)) (2.1) Anderzijds, gegeven verdelingsfuncties F1, . . . , Fn en een copula C, F gedefinieerd aan de hand van (2.1) is een n-variate verdelingsfunctie met marginale verdelingen F1, . . . , Fn.

(15)

De copula koppelt dus de marginale verdelingen aan de gezamenlijke verdeling. Uit (2.1) volgt dat de gezamenlijke verdelingsfunctie kan geconstrueerd worden door eerst de marginale verdelingen te bepalen, en vervolgens het onderliggende copula-model te selecteren. Indien de marginale verdelingsfuncties niet continu zijn dan is de copula in (2.1) niet uniek. Het theorema kan ook worden herschreven als

F F1−1(u1) . . . , Fn−1(un) = C (u1, . . . , un) (2.2) Bovenstaande formule geeft weer hoe men de copula kan afleiden uit een bepaalde multiva- riate verdeling met de marginale verdelingen,

Fi(xi) = F (∞, . . . , xi, ∞, . . . , ∞) .

Aangezien de copula-functie een verdelingsfunctie is kan hiervoor ook een copula dichtheid worden afgeleid indien alle afgeleiden bestaan. Dit gebeurt als volgt.

f (x1, . . . , xn) = n∂xF (x1,...,xn)

1...∂xn

= nC(F1∂x(x1),...,Fn(xn))

1...∂xn

= n∂FC(F1(x1),...,Fn(xn))

1(x1)...∂Fn(xn) f1(x1) . . . fn(xn)

= c(F1(x1), . . . , Fn(xn))f1(x1) . . . fn(xn)

In de praktijk zal vaak ook de survival copula worden gebruikt. Zij ¯F (x1, x2) = P[X1 >

x1, X2 > x2] een gezamenlijke survival verdelingsfunctie en ¯F1(x1) = ¯F (x1, ∞) en ¯F2(x2) = F (∞, x¯ 2). Dan geldt

F (x¯ 1, x2) = 1 − F1(x1) − F2(x2) + F (x1, x2) = ¯F1(x1) + ¯F2(x2) − 1 + C(1 − ¯F1(x1), 1 − ¯F2(x2)).

Definitie 2.3 De copula geassocieerd met de gezamenlijke verdeling ¯F is de survival copula C en wordt gedefinieerd als ˆˆ C : [0, 1]2 → [0, 1],

C(uˆ 1, u2) = u1+ u2− 1 + C(1 − u1, 1 − u2).

Men heeft dan ook,

F (x¯ 1, x2) = ˆC( ¯F1(x1), ¯F2(x2)) = 1 − F1(x1) − F2(x2) + C(F1(x1), F2(x2)).

Zoals eerder vermeld heeft de copula als voordeel dat afhankelijkheidsgrootheden in functie van de copula-functie kunnen worden geschreven. Een van deze afhankelijkheidsgrootheden die heel belangrijk is in de financi¨ele wereld is de tail dependence. Ze beschrijft de afhanke- lijkheid van verschillende variabelen in de staart van hun verdeling (zware staarten). De tail

(16)

dependence in het bivariaat geval is de kans dat een gebeurtenis met kans kleiner/groter dan v gebeurt in de eerste variabele gegeven dat een gebeurtenis met kans kleiner/groter dan v gebeurt in de tweede variabele. Men onderscheidt hierbij de lower tail index en de upper tail index.

Definitie 2.4 Zij X1 en X2 twee willekeurige variabelen met marginale verdelingsfuncties F1 en F2 dan wordt de lower tail dependence coefficient gedefineerd als

λL= lim

v→0+P X1 ≤ F1−1(v)|X2 ≤ F2−1(v) = lim

v→0+

C(v, v) v en de upper tail dependence coefficient wordt gedefineerd als

λU = lim

v→1P X1 ≥ F1−1(v)|X2 ≥ F1−1(v) = lim

v→1

1 − 2v + C(v, v) 1 − v .

Indien λL 6= 0 en λU 6= 0 dan zijn de variabelen X1 en X2 respectievelijk lower en upper tail dependent.

Bij het bepalen van de vine-structuur zal het van belang zijn de variabelen met de sterkste afhankelijkheid met elkander te verbinden. Voor het bepalen van de bivariate afhankelijkheid zal men de Kendall’s tau gebruiken, daar deze de algemene afhankelijkheid het best beschrijft.

Andere afhankelijkheidsgrootheden zijn de Pearson’s en de Spearmann’s rang correlatieco- effici¨ent. Voor twee willekeurige variabelen X1 en X2 wordt de Pearson’s correlatie gegeven door

ρ = Corr(X1, X2) = Cov(X1, X2) pVar(X1)Var(X2).

In de praktijk wordt de Pearson’s correlatie als maar minder gebruikt daar deze enkel lineaire afhankelijkheid correct meet en niet invariant is voor niet-lineaire stijgende transformaties.

Hierdoor wordt er meer gewerkt met de Spearmann’s rang correlatie en de Kendall’s tau die enkel afhangen van de onderliggende copula en bijgevolg onafhankelijk zijn van de marginale verdelingen van X1en X2. Ze zijn ook invariant onder monotone stijgende transformaties van de variabelen X1 en X2. Beide grootheden zijn gebaseerd op het concept van concordantie . Definitie 2.5 Twee observaties (x1, y1) en (x2, y2) van een paar continue variabelen (X, Y ) zijn concordant indien beide waarden van het ene paar groter zijn dan de overeenkomstige waarden van het andere paar, dit is als

x1 < x2, y1 < y2 of x1 > x2, y1 > y2.

Ze zijn discordant als voor het ene paar een waarde groter en de ander waarde kleiner is dan het andere paar, dit is als

x1 > x2, y1 < y2 of x1 < x2, y1 > y2.

(17)

Figuur 2.1: (a) concordante en (b) discordante paren

In Figuur 2.1 wordt een voorbeeld gegeven van een concordant en discordant paar.

Zij (X11, X12), (X21, X22) en (X31, X32) onafhankelijk en identiek verdeelde kopies van (X1, X2).

De Spearmann’s correlatieco¨effici¨ent is proportioneel met de kans van concordantie min de kans van discordantie van (X11, X12) en (X21, X32),

ρS(X1, X2) = 3 (P [(X11− X21) (X12− X32) > 0] − P [(X11− X21) (X12− X32) < 0]) . Als X1 en X2 respectievelijk verdelingsfunctie F1 en F2 hebben komt de Spearmann’s corre- latie overeen met de Pearson’s correlatie toegpast op de rangen van de variabelen X1 en X2, ρS = ρ(F1(X1), F2(X2)). De Kendall’s tau wordt op een gelijkaardige manier gedefinieerd, deze wordt gegeven als de kans van concordantie min de kans van discordantie van twee willekeurige variabelen X1 en X2,

τ (X1, X2) = P [(X11− X21) (X12− X22) > 0] − P [(X11− X21) (X12− X22) < 0] . In Kurowicka & Cooke (2006) wordt aangetoond hoe deze twee afhankelijkheidsgrootheden kunnen worden beschreven in functie van de copula-functie.

Stelling 2.2 Zij X1 en X2 continue willekeurige variablen met copula C dan wordt de Ken- dall’s tau gegeven door

τ = 4 Z 1

0

Z 1 0

C(u1, u2)dC(u1, u2) − 1 en de Spearman’s correlatie gegeven door

ρS = 12 Z 1

0

Z 1 0

C(u1, u2)du1du2− 3.

Bewijs: Zij (X11, X12) en (X21, X22) gedefinieerd zoals voordien. Aangezien de variabelen continu zijn geldt

P [(X11− X21) (X12− X22) < 0] = 1 − P [(X11− X21) (X12− X22) > 0] .

(18)

Uit de definitie van de Kendall’s tau op basis van concordantie geldt dan τ (X1, X2) = 2P [(X11− X21) (X12− X22) > 0] − 1.

Men heeft ook dat P [(X11− X21) (X12− X22) > 0] kan herschreven worden als P [X11> X21, X12 > X22] + P [X11 < X21, X12< X22]

en deze kansen kunnen uitgerekend worden door te integreren over de verdeling van (X11, X12).

P [X11> X21, X12 > X22] = P [X21 < X11, X22< X12]

= R

R2P [X21 < x1, X22< x2] dF (x1, x2)

= R

R2C(F1(x1), F2(x2))dC(F1(x1), F2(x2)).

De transformaties u1 = F1(x1) en u2 = F2(x2) geven dan

P [X11> X21, X12> X22] = Z

[0,1]2

C(u1, u2)dC(u1, u2).

Op dezelfde manier werkt men P [X11< X21, X12< X22] uit gebruikmakend van de survival copula,

P [X11 < X21, X12< X22] = P [X21> X11, X22 > X12]

= R

R2P [X21> x1, X22 > x2] dF (x1, x2)

= R

R2

C( ¯ˆ F1(x1), ¯F2(x2))dC(F1(x1), F2(x2))

= R

R21 − F1(x1) − F2(x2) + C(F1(x1), F2(x2))dC(F1(x1), F2(x2)).

Opnieuw de transformaties naar u1 en u2 geven dan P [X11< X21, X12 < X22] =

Z

[0,1]2

1 − u1− u2+ C(u1, u2)dC(u1, u2).

Aangezien C de bivariate verdelingsfunctie is van een paar uniform verdeelde variabelen (U1, U2), geldt E[U1] = E[U2] = 1/2 en dus

P [X11 < X21, X12< X22] = 1 − 1212 +R

[0,1]2C(u1, u2)dC(u1, u2)

= R

[0,1]2C(u1, u2)dC(u1, u2)

(19)

Men verkrijgt dan

P [(X11− X21) (X12− X22) > 0] = 2 Z

[0,1]2

C(u1, u2)dC(u1, u2) wat de gewenst formule geeft voor de Kendall’s tau,

τ (X1, X2) = 2P [(X11− X21) (X12− X22) > 0] − 1 = 4 Z

[0,1]2

C(u1, u2)dC(u1, u2) − 1.

Voor de Spearmann’s correlatie volgt de formule uit de verwachting en de variantie van een uniform verdeelde variabele,

ρS(X1, X2) = ρ(F1(X1), F2(X2)) = ρ(U1, U2) = E(U1U2) − 1/4

1/12 = 12E(U1U2) − 3.

Door opnieuw te integreren over de gezamenlijke verdelingsfunctie van (U1, U2) krijgt men, ρS(X1, X2) = 12

Z

[0,1]2

u1u2dC(u1, u2) − 3.

 Naargelang de afhankelijkheidsstruuctuur van twee variabelen kan men verschillende bivari- ate copula’s defini¨eren. Hierbij wordt steeds gewerkt met u1, u2 ∈ [0, 1].

2.1 Fundamentele copula’s

De fundamentele copula-klasse bevat de copula’s die overeenkomen met onafhankelijkheid en maximale en minimale afhankelijkheid.

Product copula:

C(u1, u2) = Π(u1, u2) = u1u2

Deze copula komt overeen met de onafhankelijkheid en heeft als copula dichtheid c(u1, u2) = ∂2C(u1, u2)

∂u1∂u2 = ∂2u1u2

∂u1∂u2 = 1.

Comonotoniciteits copula:

C(u1, u2) = M (u1, u2) = min(u1, u2)

Deze copula wordt ook de Frechet upper bound genoemd en komt overeen met maximale afhankelijkheid, de perfecte positieve afhankelijkheid.

(20)

Tegencomonotoniciteits copula:

C(u1, u2) = W (u1, u2) = max(u1+ u2− 1, 0)

Deze copula wordt ook de Frechet lower bound genoemd en komt overeen met de minimale afhankelijkheid, de perfecte negatieve afhankelijkheid.

Definitie 2.6 Twee willekeurige variabelen X en Y worden comonotoon genoemd indien er een willekeurige variabele Z en twee niet-dalende functies f en g bestaan zodat X = f (Z) en Y = g(Z).

Definitie 2.7 Twee willekeurige variabelen X en Y worden tegencomonotoon genoemd in- dien er een willekeurige variabele Z, een niet-dalende functie f en een niet-stijgende functie g bestaat zodat X = f (Z) en Y = g(Z).

Voor elke copula geldt:

W (u1, u2) ≤ C(u1, u2) ≤ M (u1, u2).

2.2 Elliptische copula’s

De elliptische copula-klasse bevat copula’s die geassocieerd worden met elliptische verdelin- gen, en zijn van de vorm (2.2). Ze kunnen makkelijk worden uitgebreid naar hogere dimensies n en hebben veel parameters (minstens n(n − 1)/2). Daarentegen kunnen asymmetrie en asymmetrische tail dependence niet worden weergegeven aan de hand van deze copula-klasse.

Simulatie uit elliptische verdelingen is vrij eenvoudig maar de evaluatie van elliptische co- pula’s moet numeriek gebeuren door de vele integraalberekeningen die nodig zijn. Omwille van hun impliciete definitie is er ook geen eenvoudige expliciete uitdrukking voor de copula.

Gaussiaanse (normale) copula:

C(u1, u2, ρ) = Φ(2)ρ Φ−1(u1), Φ−1(u2) ,

met Φ(2)ρ de bivariate normale verdeling met correlatie parameter ρ, en Φ−1 de quantiel- functie van een univariate standaard normaal verdeling. De Gaussiaanse copula heeft noch upper noch lower tail dependence. De hiermee gepaard gaande copula dichtheidsfunctie kan geschreven worden als

c(u1, u2) = 1

p1 − ρ2 exp



−ρ2−1(u1)2+ Φ−1(u2)2) − 2ρΦ−1(u1−1(u2) 2(1 − ρ2)

 .

(21)

In het artikel Recipe for Disaster: The Formula That Killed Wall Street (2009), legt Felix Salmon uit hoe de Gaussiaanse copula mee aan de basis ligt van de financi¨ele crisis die be- gon in 2007. De copula functie was een grote doorbraak in de financi¨ele wereld die toeliet complexe risico’s op een veel eenvoudigere en accurate manier te modelleren. Er was zodanig veel geld mee te verdienen dat in Wall Street de beperkingen van de Gaussianse copula vaak werden genegeerd. De slechte risico-beoordeling aan de hand van deze copula, samen met de daling van de huisprijzen in de Verenigde Staten, zorgden ervoor dat vele tripel A of zogezegde risico-vrije obligaties op springen stonden. Het gevolg was de grootste financi¨ele crisis sinds de Grote Depressie.

Student t copula:

Ct(u1, u2, ν, ρ) = t(2)ν,ρ t−1ν (u1), t−1ν (u2) ,

met t(2)ν,ρ de bivariate t-verdelingsfunctie met correlatie parameter ρ en ν vrijheidsgraden.

t−1ν is de inverse functie van de univariate t-verdeling. De t-copula geeft vaak een betere empirische fit dan de Gaussiaanse copula daar het extreme waarden beter kan beschrijven.

De student t copula heeft dezelfde tail dependence in beide staarten. De tail dependence co¨effici¨ent wordt in Heinen & Valdesogo (2009) gegeven als

λ = λU = λL= 2tν+1



√ν + 1√ 1 − ρ 1 − ρ

 . De copula dichtheidsfunctie wordt gegeven door

Γ(ν + 2/2)/Γ(ν/2)

νπftν(t−1ν (u1))ftν(t−1ν (u2))p1 − ρ2



1 + t−1ν (u1)2+ t−1ν (u2)2− 2t−1ν (u1)t−1ν (u2) ν(1 − ρ2)

ν+22 , met ftν de dichtheidsfunctie van de univariate standaard t verdeling.

2.3 Archimedische copula’s

De Archimedische copula-klasse laat in het bivariaat geval toe een groot aantal copula- families te construeren met verschillende karakteristieken zoals de tail dependence, de posi- tieve en negatieve afhankelijkheid, enzovoort. Als men deze klasse wenst uit te breiden naar meer-dimensionale copula’s worden er echter strenge beperkingen opgelegd voor de varia- belen. De hele afhankelijkheidsstructuur hangt namelijk maar van ´e´en of twee parameters af. In tegenstelling tot de elliptische copula-klasse, is het in de Archimedische copula-klasse wel mogelijk een expliciete uitdrukking te hebben voor de copula-functie. De Archimedische copula’s worden geconstrueerd aan de hand van een generator ϕ, waarvan men de pseudo inverse moet nemen.

(22)

Definitie 2.8 De pseudo inverse van f is gedefinieerd als:

f[−1](x) =

( f−1(x) 0 ≤ x ≤ f (0) 0 f (0) ≤ x ≤ ∞

Definitie 2.9 De generator van een copula is een re¨eelwaardige functie ϕ : [0, 1] → [0, ∞]

dat continu, strikt dalend en convex is met ϕ(1) = 0, ϕ(0) ≤ ∞ en ϕ[−1] de pseudo-inverse van ϕ.

De Archimedische copula met generator ϕ is gedefinieerd als C (u1, u2) = ϕ[−1](ϕ(u1) + ϕ(u2)) .

Enkele eigenschappen in verband met de copula dichtheidsfunctie en de afhankelijkheids- grootheden voor de Archimedische copula worden hier bewezen.

Eigenschap 2.1 De copula-dichtheid van een Archimedische copula met generator ϕ is c(u1, u2) = −ϕ00(C)ϕ0(u10(u2)

ϕ0(C)3

Bewijs: Men herschrijft de definitie van een Archimedische copula met generator ϕ als ϕ(C(u1, u2)) = ϕ(u1) + ϕ(u2).

Men gaat deze formule afleiden naar u1, u2 en u1 en u2: (i)

∂ϕ(C(u1, u2))

∂u1

∂C(u1, u2)

∂u1 = ∂ϕ(u1)

∂u1 , (ii)

∂ϕ(C(u1, u2))

∂u2

∂C(u1, u2)

∂u2 = ∂ϕ(u2)

∂u2 , (iii)

2ϕ(C(u1, u2))

∂u1∂u2

∂C(u1, u2)

∂u1

∂C(u1, u2)

∂u2

+∂ϕ(C(u1, u2))

∂u1

2C(u1, u2)

∂u1∂u2

= 0 Voor een Archimedische copula heeft men dat C(u1, u2) = C(u2, u1) zodat

∂ϕ(C(u1, u2))

∂u1 = ∂ϕ(C(u1, u2))

∂u2 = ϕ0(C) Uit (iii) kan men c(u, v) afleiden,

2C(u1, u2)

∂u1∂u2 = −ϕ00(C)∂C(u∂u1,u2)

1

∂C(u1,u2)

∂u2

ϕ0(C) , (2.3)

(23)

met ϕ00(C) = 2ϕ(C(u∂u 1,u2))

1∂u2 .

Uit (i) en (ii) haalt men respectievelijk

∂C(u1, u2)

∂u1 = ϕ0(u1)

ϕ0(C) en ∂C(u1, u2)

∂u2 = ϕ0(u2) ϕ0(C).

Dit substitueren in (2.3) geeft de gewenste formule voor de copula-dichtheid van een Archi- medische copula.

 In Kurowicka & Cooke (2006) wordt voor een Archimedische copula de Kendall’s tau bewezen in functie van de generator ϕ.

Eigenschap 2.2 Zij X en Y willekeurige variabelen met een Archimedische copula C met generator-functie ϕ. Dan is de Kendall’s tau voor X en Y gegeven door

τ (X, Y ) = 1 + 4 Z 1

0

ϕ(t) ϕ0(t)dt

Bewijs: De definitie van de Kendall’s tau kan herschreven worden als τ = 4

Z 1 0

Z 1 0

C(u1, u2)dC(u1, u2) − 1 = 4 Z

[0,1]2

C(u1, u2)c(u1, u2)du1du2− 1.

Aan de hand van Eigenschap 2.1 kan men dit herschrijven als τ = −

Z

[0,1]2

C(u1, u200(C)ϕ0(u10(u2)

ϕ0(C)3 du1du2− 1. (2.4) Aangezien uit de definitie van de pseudo-inverse van de generator, C(u1, u2) = 0 voor alle (u1, u2) met ϕ(u1) + ϕ(u2) = ϕ(0), kan het domein waarover wordt ge¨ıntegreerd, [0, 1]2, geschreven worden als ϕ(u1) + ϕ(u2) < ϕ(0). Men wenst nu

− Z

ϕ(u1)+ϕ(u2)<ϕ(0)

C(u1, u200(C)ϕ0(u10(u2)

ϕ0(C)3 du1du2 verder uit te werken. Dit doet men door de transformaties

s = C(u1, u2) = ϕ−1[ϕ(u1) + ϕ(u2)] en t = u2

toe te passen. Voor de berekening van de Jacobiaan past men de eigenschap

∂(u1, u2)

∂(s, t) =

 ∂(s, t)

∂(u1, u2)

−1

(24)

toe, met ∂(u∂(s,t)

1,u2) = ϕϕ00(u(C)1). Men krijgt dan

− Z 1

0

Z 1 s

00(s)

ϕ0(s)3ϕ0(u10(t) ϕ0(s) ϕ0(u1)dtds.

Vervolgens integreren naar t geeft Z 1

0

00(s)

ϕ0(s)2ϕ(s)ds. (2.5)

Na partiele integratie met u = sϕ(s) en dv = ϕ0(s)0(s)2 en gebruikmakende van de eigenschappen van de generator krijgt men voor (2.5),

Z 1 0

ϕ(s) ϕ0(s)ds +

Z 1 0

sds = Z 1

0

ϕ(s)

ϕ0(s)ds + 1 2. Wat de gewenste formule geeft na substitutie in (2.4),

τ = 4 Z 1

0

ϕ(t)

ϕ0(t)dt + 1.

 Net zoals bij elliptische copula’s kunnen ze gemakkelijk uitgebreid worden naar n-dimensionale Archimedische copula’s als en slechts als ϕ[−1] ∈ L met

Lm =f : R+ → [0, 1]|f (0) = 1, f (∞) = 0, (−1)kf(k)(x) ≥ 0, k ≤ m .

Of met andere woorden, indien de pseudo-inverse van de generator volledig monotoon is.

In dat geval komt de pseudo-inverse overeen met de inverse van de generator. Zoals eerder vermeldt beschrijven de multivariate Archimedische copula’s de afhankelijkheid niet goed in de praktijk aangezien de beschreven afhankelijkheid niet afhangt van de nummering van de variabelen. Men vermelt hier drie bivariate Archimedische copula’s waarmee in de toe- passingen zal worden gewerkt. Ze bezitten elk hun eigen specifieke karakteristieken en dit zal toelaten in de paar-copula ontbinding om complexe afhankelijkheidsstructuren op een correcte manier te beschrijven.

Gumbel copula: met generator ϕ(t) = (− ln(t))θ, θ > 0,

C (u1, u2, θ) = exp[(− ln(u1))θ+ (− ln(u2))θ]1/θ . De Gumbel copula is upper tail dependent, maar niet lower tail dependent.

Clayton copula: met generator ϕ(t) = 1θ(t−θ− 1), θ ∈ [−1, ∞) {−1}, C (u1, u2, θ) = [max u−θ1 + u−θ2 − 1, 0]−1/θ.

(25)

De Clayton copula is lower tail dependent, maar niet upper tail dependent. Voor θ → 0, wordt onafhankelijkheid beschreven en voor θ → ∞ bekomt men perfecte positieve afhanke- lijheid. Voor geen enkele θ-waarde wordt negatieve afhankelijkheid beschreven.

De Frank copula: met generator ϕ(t) = ln

e−θt−1 e−θ−1



, θ ∈] − ∞, ∞[\ {0},

C (u1, u2, θ) = −θ−1ln



1 + (e−θu1 − 1)(e−θu2 − 1) e−θ− 1

 .

De Frank copula is symmetrisch in beide staarten en laat negatieve afhankelijkheid tussen de variabelen toe, dit is voor een negatieve θ. Voor θ → 0 en θ → ∞ wordt opnieuw respectievelijk onafhankelijkheid en postieve perfecte onafhankelijkheid bekomen. De sterk- ste afhankelijkheid is in het midden van de verdeling en de Frank copula heeft zwakke tail dependence.

(26)

Vine en paar-copula ontbinding

In dit hoofdstuk wordt het concept van vines ingevoerd, en meer specifiek de reguliere vine.

Hiervoor worden hoofdstukken uit Bedford & Cooke (2001) en Bedford & Cooke (2002) uitgewerkt met behulp van Cooke et al. (2011) en Kurowicka & Cooke (2006). Er wordt eerst een kleine introductie gegeven over grafentheorie aangezien het vine-concept daarop gebaseerd is.

Definitie 3.1 Een graaf is een paar verzamelingen, G = (N, E), zodat de bogen E een deel- verzameling zijn van {{x, y} : x, y ∈ N }. De elementen van N worden de toppen genoemd.

Een graaf is ongericht indien de orde van de toppen overeenkomstig met een boog willekeurig is. Indien elke boog een gewicht meekrijgt, w : E → R, wordt de graaf gewogen genoemd.

Indien E = {{x, y} : x, y ∈ N } dan wordt de graaf volledig genoemd. Belangrijke subgrafen zijn het pad en de omloop.

Definitie 3.2 Een pad is een graaf P = (N, E) met N = {v0, v1, . . . , vk} en E = {{v0, v1} , {v1, v2} , . . . , {vk−1, vk}}. Een omloop is een pad met v0 = vk.

Een graaf wordt verbonden genoemd indien tussen elke paar knopen een pad bestaat. De belangrijkste klasse van grafen dat men in dit hoofdstuk zal nodig hebben zijn de bo- men. Een boom is een verbonden graaf zonder omlopen. De boom wordt gekarakteriseerd door volgende stelling waarbij G ± e betekent dat bij het graaf G de boog e wordt toege- voegd/verwijderd.

Stelling 3.1 De volgende eigenschappen zijn equivalent voor een graaf T = (N, E):

• T is een boom.

• Elk paar toppen van T zijn verbonden aan de hand van een uniek pad in T .

• Voor elke boog e ∈ E geldt dat T verbonden is maar T − e is niet verbonden.

17

(27)

• Voor niet-aangrenzende toppen x, y ∈ N geldt dat T geen omloop bevat maar T + {x, y}

wel.

Een spanning tree van een graaf G = (N, E) is een subgraaf T = (NT, ET), dat een boom is met NT = N .

Later in dit hoofdstuk zal aan de hand van elementenverzamelingen, eigenschappen en stel- lingen worden toegewerkt naar de paar-copula ontbinding van de multi-dimensionale dicht- heidsfunctie, deze ontbinding is niet uniek. De mogelijke ontbindingen nemen exponentieel toe met het aantal variabelen waarvan men de afhankelijkheid wenst te bepalen. Om weer te geven op welke manier de ontbinding gebeurt en op welke variabelen er wordt geconditioneerd wordt er gewerkt met vines. Een vine is een grafisch model waarmee multi-dimensionale ver- delingen worden opgebouwd met gegeven marginale verdelingen. Het is een speciaal geval van de Cantor bomen en een veralgemening van de Markov bomen. Markov bomen hebben de strenge voorwaarde dat de variabelen conditioneel onafhankelijk zijn. Een vine V voor n elementen is een verzameling bomen V = {T1, . . . , Tn−1} waarbij de bogen van boom j de toppen van boom j + 1 zijn, j ∈ {1, . . . , n − 2}. Een reguliere vine is een speciaal geval waarbij alle beperkingen twee-dimensionaal of conditioneel twee-dimensionaal zijn, hierbij geldt dat twee bogen in boom j samen een boog in boom j + 1 vormen enkel indien deze bogen een gezamenlijke top delen, j ∈ {1, . . . , n + 2}.

Definitie 3.3 V is een vine voor n elementen als

• V = {T1, . . . , Tm},

• T1 is een verbonden boom met toppen N1 = {1, . . . , n}, en bogen E1; voor i ∈ {2, . . . , m}, Ti is een boom met toppen Ni ⊂ N1∪E1∪. . .∪Ei−1en bogen Ei ⊂ {{e1, e2} : e1, e2 ∈ Ni}.

Nadat de paar-copula ontbinding wordt toegepast in drie dimensies worden tenslotte de D- vine en C-vine gedefinieerd als speciale gevallen van de reguliere vine met een eenvoudigere vine-structuur en paar-copula ontbinding. Men veronderstelt doorheen dit hoofstuk dat alle gezamenlijke, marginale en conditionele verdelingen absoluut continu zijn met overeenkom- stige dichtheidsfuncties.

3.1 Reguliere vine

Op basis van de definitie van de vine, wordt de reguliere vine als volgt gedefinieerd.

Definitie 3.4 V is een reguliere vine voor n elementen met E(V) = E1 ∪ . . . ∪ En−1 de verzameling bogen van V als

(28)

• m = n − 1,

• Ti is een verbonden boom met bogen Ei en toppen Ni = Ei−1 voor i ∈ {2, . . . , n} en card(Ni) = n − (i − 1),

• de proximiteitsvoorwaarde: voor i ∈ {2, . . . , n − 1}, indien a = {a1, a2} en b = {b1, b2} twee toppen zijn in Ni verbonden door een boog e ∈ Ei dan geldt card(a ∩ b) = 1.

Een reguliere vine voor n elementen heeft n − 1 bomen, waarbij elke boom Tj bestaat uit n + 1 − j toppen en n − j bogen. De toppen in de boom Tj zijn nodig om de bogen te bepalen. Twee toppen in Tj+1 en dus twee bogen in Tj, zijn verbonden via een boog in Tj+1 als de twee bogen in Tj een gemeenschappelijke top delen. Een boog e in boom Tj is een ongeordend paar toppen van Tj. Omdat Nj ⊂ E0∪ E1 ∪ . . . ∪ Ej−1, met E0 = N1, bestaan er bogen e1 ∈ Ei en e2 ∈ Ek, i, k < j zodat e = {e1, e2}. De rang van een boog in boom Tj is j − 1, j ∈ {1, . . . , n − 1}. De graad van een top is het aantal buren die het heeft in de boom. De proximiteitsvoorwaarde vereist dat twee bogen in boom Ti verenigd worden in boom Ti+1 enkel en alleen als ze een gemeenschappelijke top delen in Ti.

Er worden nu verschillende verzamelingen toppen en bogen gedefinieerd die handig zullen zijn bij de vine uitwerking en die zullen toelaten de beperkingen te specificeren. De volledige unie van een boog is de verzameling van indexen {1, . . . , n} dat deze boog bevat. Als twee toppen a en b verbonden zijn door een boog dan zijn de conditioned set en de conditioning set van de boog respectievelijk het symmetrisch verschil en de doorsnede van de volledige unies van a en b. Formeel definieert men deze verzamelingen als volgt.

Definitie 3.5 Voor e ∈ Ei, i ∈ {1, . . . , n − 1} geldt dat e1 een element is van e, met e1 ∈ Ei−1= Ni, indien ∃e2 ∈ Ni : e = {e1, e2} of met andere woorden indien de top e1 verbonden is met een andere top e2 door middel van boog e.

Definitie 3.6 Voor elke boog e = ei ∈ Ei, i ≤ n − 1, is de volledige unie van e de deelverza- meling van {1, . . . , n} dat bereikbaar is vanuit e:

Ue = {j ∈ N1 = E0|∃1 ≤ i1 ≤ i2 ≤ . . . ≤ ir = i, eik ∈ Eik, k ∈ {1, . . . , r} , met j ∈ ei1 en eik ∈ eik+1, k ∈ {1, . . . , r − 1}

Er geldt voor e ∈ Ei, i ≤ n − 1, e = {e1, e2} dat Ue = Ue1 ∪ Ue2.

Definitie 3.7 Voor i ∈ {1, . . . , n − 1} , e ∈ Ei, als e = {e1, e2} dan is de conditioning set geassocieerd met e gelijk aan

De = Ue1 ∩ Ue2.

(29)

Definitie 3.8 Voor i ∈ {1, . . . , n − 1} , e ∈ Ei, als e = {e1, e2} dan is de conditioned set geassocieerd met e gelijk aan

{Ce,e1, Ce,e2} =Ue1 \ De, Ue2 \ De .

De constraint set van een reguliere vine bevat alle nodige informatie om het te onderscheiden van andere reguliere vines.

Definitie 3.9 Voor e ∈ Ei, i ≤ n − 1, is de constraint set geassocieerd met e de volledige unie van e. De constraint set voor V is dan

CV = {(Ce,e1, Ce,e2, De) |i ∈ {1, . . . , n − 1} , e ∈ Ei, e = {e1, e2}}

Merk op dat voor e = {e1, e2} , e ∈ Ei:

Ue = Ce,e1 ∪ Ce,e2 ∪ De.

De conditioning set is leeg voor e ∈ E1 en de cardinaliteit van de conditioning set komt overeen met de graad van de boog. De conditioning set De wordt rechts weergegeven van

| en de conditioned set {i1, i2} links ervan, voor i1, i2 ∈ {1, . . . , n} worden de bogen van de reguliere vine opgeschreven als ”i1i2|De” met i1 < i2.

De notatie van de boog e in Ti hangt af van de twee bogen in Ti−1 die wegens de proximi- teitsvoorwaarde een gemeenschappelijke top hebben. Men beschouwt de bogen a = a1, a2|Da en b = b1, b2|Db met respectievelijk Ua = {a1, a2, Da} en Ub = {b1, b2, Db}. De toppen a en b in de boom Ti worden dus verbonden door de boog e = e1, e2|De met

e1 = min {i : i ∈ Ua∪ Ub\De}, e2 = max {i : i ∈ Ua∪ Ub\De}, De = Ua∩ Ub.

Om deze begrippen beter te begrijpen gaat men deze verzamelingen bepalen voor een con- creet voorbeeld. Zij een D-vine1 voor 5 elementen, die er uit ziet zoals in Figuur 3.1.

1dit is speciaal geval van de reguliere vine dat later in dit hoofdstuk zal worden gedefinieerd

Referenties

GERELATEERDE DOCUMENTEN

Om de kans uit te rekenen dat de gemiddelde score van de 132 geteste jongens 8.43 of hoger is, moet je van de gemiddelde score over 132 jongens het gemiddelde en de

Om te bepalen of twee vingerafdrukken identiek zijn, kijkt men naast de Henry classificatie naar andere bijzondere punten in het vingerafdrukpatroon. Een deskundige kiest 12 van

Steeds meer waarnemingen An- derzijds duiden deze gegevens, samen met alle andere waarnemingen, ontegenspreke- lijk op lokale vestiging – terwijl we daarover, tot minder dan

Bij bunzing is er weliswaar nog geen sprake van inteelt, maar bunzings uit West- Vlaanderen vertonen wel een lagere genetische diversiteit dan bunzings uit Limburg!. Op vlak

• To measure the DNA copy number of the Microcystis specific 16S rDNA and microcystin producing genes, mcyB as well as mcyE in order to shed more light on toxin production in

Denkbaar zegt dat hij geen tijd heeft, maar Kassaar voegt hem toe: ‘- Luister naar mijn geschiedenis, heer en begrijp waarom ik mij onderwerp.’ Kassaars geschiedenis is

Deze voorstelling van zaken geeft wel aan dat als een accountantskantoor de pretentie heeft een bedrijf niet alleen als contro­ leur, maar vooral ook als adviseur te

Verder zouden zowel bouwers als kwa- liteitsborgers worden geprikkeld hun werk goed te doen als een bouwwerk niet in gebruik mag worden genomen als de kwaliteit ervan niet met