• No results found

Vine en paar-copula ontbinding

3.2 Paar-copula ontbinding

In dit hoofdstuk wenst men te komen tot de stelling waarbij de n-dimensionale dichtheids-functie wordt herschreven als een product van univariate dichtheidsdichtheids-functies en van paar-copula’s toegepast op de verdelingsfuncties en de conditionele verdelingsfuncties van de variabelen. Dit doet men aan de hand van een reguliere vine. Elke boog van een regu-liere vine is geassocieerd met een beperking op de bivariate of conditionele bivariate verde-ling, weergegeven aan de hand van een paar-copula. Men veronderstelt dat voor elke boog e ∈ Tk, k ∈ {1, . . . , n − 1} en elke mogelijke waarde van de variabelen in de conditioning set De, een copula is gegeven. Voor de boog i1i2|De wordt de overeenkomstige copula ge-noteerd als Ci1i2|De en de copula-dichtheid als ci1i2|De. De toppen uit de eerste boom komen overeen met de variabelen en indien een boog getrokken wordt tussen twee variabelen wordt aan de hand van de paar-copula de afhankelijkheid gemodelleerd tussen die twee variabelen. Voor alle j ∈ N1 is ook de marginale verdeling Fj gegeven. Eerst worden een paar lemma’s bewezen om uiteindelijk tot de hoofdstelling te komen van dit hoofdstuk, de paar-copula ontbinding van multivariate afhankelijkheid.

Definitie 3.12 Een boog e ∈ Ek+1 is rond een top j ∈ Nk indien e de toppen e1 en e2 ∈ Nk+1 verbindt, deze komen overeen met de bogen in Ek verbonden met j.

Figuur 3.3: boog e rond top j Aangezien boog e rond top j is geldt:

De = Ue1 ∩ Ue2 = Ui∪ Uj ∩ U

j ∪ Uk = U

j (3.1)

Lemma 3.3 Zij V een reguliere vine voor n elementen en k een geheel getal 1 ≤ k < n − 1. Gegeven een top i in boom Tk, er zijn precies graad(i) − 1 bogen in Tk+1 rond i.

Bewijs: Men mag zonder verlies van algemeenheid veronderstellen dat k = 1.

(i) Eerst wordt aangetoond dat graad(i) − 1 het maximum aantal bogen is in T2 rond i. Volgens de definitie van de graad van een top, zijn er graad(i) bogen die i verbinden met andere toppen. Deze bogen vormen de toppen ,N2 = E1, in T2 zodat indien

ze worden verbonden door bogen, ze rond i zullen zijn. Omdat T2 een boom moet zijn, kunnen er geen omlopen in voorkomen. Daarom zijn er hoogstens graad(i) − 1 verschillende bogen in T2 rond i.

(ii) Vervolgens wordt aangetoond dat er juist graad(i) − 1 bogen in T2 rond i zijn. Elke boog in T2 kan enkel rond ´e´en top van T1 zijn, anders zou er een omloop voorkomen in T1, dit volgt uit de proximiteitsvoorwaarde van reguliere vines.

Veronderstel dat er een top i in T1 is dat minder dan graad(i) − 1 bogen rond zich heeft in T2, dan kan men het totaal aantal bogen in T2 opsommen als

P

j∈N1# (bogen rond j) < P

j∈N1(graad(j) − 1)

= P

j∈N1(graad(j)) − n

Aangezien er n − 1 bogen zijn in T1 en dat elke boog twee toppen verbindt, geldt er dat P

j∈N1(graad(j)) = 2(n − 1) en bijgevolg is het aantal bogen in T2 gelijk aan 2(n − 1) − n = n − 2. Wat in tegenstelling is met het feit dat T2 n − 1 bogen heeft.

 Om de gezamenlijke verdelingsfunctie te specificeren wordt de reguliere vine-structuur gede-finieerd voor een bepaalde verdeling.

Definitie 3.13 (F, V, B) is een reguliere vine specificatie als

• F = (F1, . . . , Fn) een vector is van continue inverteerbare verdelingsfuncties, • V een reguliere vine is voor n elementen,

• B = {Be(d)|e ∈ Ei, i ∈ {1, . . . , n − 1}} met Be(d) een verzameling van copula’s en d een vector met de waardes van de variabelen in De.

Een gezamenlijke verdeling F1...nvoor de variabelen X1, . . . , Xnheeft reguliere vine-afhankelijkheid als voor elke e ∈ Ei, de copula van XCe,e1 en XCe,e2 gegeven XDe een lid is van Be(XDe) en de marginale verdeling van Xi is Fi, i ∈ {1, . . . , n}.

In volgend lemma wordt de bivariate copula-dichtheid geschreven aan de hand van de biva-riate dichtheidsfunctie en de marginale dichtheidsfuncties.

Lemma 3.4 Zij F12(x1, x2) een verdelingsfunctie met drager B1× B2 ⊂ R2 en dichtheid f12. Veronderstel dat de marginale dichtheden f1 en f2 strikt positief zijn op respectievelijk B1 en B2. Zij C12 de copula van F12 en c12 haar dichtheid, dan geldt

c12(F1(x1), F2(x2)) = f12(x1, y1) f1(x1)f2(x2).

Bewijs: Om dit te bewijzen wordt er gebruikt gemaakt van de dichtheidstransformatie-formule. Deze zegt dat voor de transformaties U = U (X, Y ) en V = V (X, Y ) er geldt dat

fU V(u, v) = fXY(x, y) |∂(u, v)/∂(x, y)|. Onder de transformatie

(x1, x2) 7→ (F1(x1), F2(x2)) en met fXY = f12 en fU V = c12 geeft deze formule

c12(F1(x1), F2(x2)) = f12(x1, y1) |∂(F1(x1), F2(x2))/∂(x1, x2)| waarbij de Jacobiaan |∂(F1(x1), F2(x2))/∂(x1, x2)| = ∂F1(x1) ∂x1 ∂F1(x1) ∂x2 ∂F2(x2) ∂x1 ∂F2(x2) ∂x2 = f1(x1)f2(x2). Wat de gewenste formule geeft voor de copuladichtheid.

 Om de notaties te vereenvoudigen in de komende bewijzen, zal men de dichtheidsfuncties fi(xi), f1...n(x1, . . . , xn) en (conditionele) verdelingsfuncties Fi|De(xie) schrijven als respectie-velijk fi, f1...n en Fi|De.

Stelling 3.2 Zij V = {T1, . . . , Tn−1} een reguliere vine voor n elementen, gegeven Fi en Cij|De zoals voordien, er is een unieke vine-afhankelijke verdeling met dichtheidsfunctie gege-ven door f1...n= n−1 Y m=2 Y e∈Em cij|De Fi|De, Fj|De ! Q (i,j)∈E1fij Q i∈N1(fi)graad(i)−1.

Bewijs: Het bewijs wordt geleverd aan de hand van de omgekeerde inductie dat wordt toegepast op het niveau van de bomen in de vine. Men beweert dat voor alle 2 ≤ M ≤ n − 1 geldt, f1...n= n−1 Y m=M Y e∈Em cij|De Fi|De, Fj|De ! Q e∈EM −1fU∗ e Q k∈NM −1(fU k)graad(k)−1. (3.2) (i) Basisstap: De bewering geldt voor M = n − 1. Zij e = {e1, e2} de enige boog in Tn−1 met Ue1 = {i} ∪ De en Ue2 = {j} ∪ De, met {i, j} /∈ De, dan geldt wegens de definitie van de conditionele dichtheidsfunctie:

f1...n= fij|DefDe.

f1...n = cij|De Fi|De, Fj|De fi|Defj|DefDe = cij|De Fi|De, Fj|DefU ∗e1fU ∗e2

fDe

De boom Tn−2 heeft 3 toppen en 2 bogen, bijgevolg moet ´e´en van de toppen, zij k, graad 2 hebben en is de boog e van Tn−1 rond k, zoals weergegeven in Figuur 3.4. Bijgevolg is volgens (3.1), De= Uk en de bewering (3.2) is bewezen voor M = n − 1.

Figuur 3.4: Tn−1 en Tn−2

(ii) Inductiestap: Men veronderstelt dat de formule (3.2) geldt voor M , men wenst nu aan te tonen dat dit ook het geval is voor M − 1. Men past dus de ontbinding toe voor alle bogen van TM,

f1...n= n−1 Y m=M Y e∈Em cij|De Fi|De, Fj|De ! Q e∈EM −1fU e Q k∈NM −1(fU k)graad(k)−1.

Voor elke boog e ∈ EM −1 zijn er toppen in NM −1, of equivalent bogen in EM −2, dat men e1 en e2 noemt zodat e = {e1, e2}. Bijgevolg geldt

Ue = Ue1 ∪ U e2

= Ce,e1 ∪ Ce,e2 ∪ De = {i, j} ∪ De met Ce,e1 = {i} en Ce,e2 = {j}. Dus kan fU

e verder worden ontbonden zoals in (i), fU

e = fij|DefDe

= cij|De Fi|De, Fj|DefU ∗e1fU ∗e2

fDe

Als men dit laatste substitueert in (3.2) krijgt men

f1...n= n−1 Y m=M −1 Y e∈Em cij|De Fi|De, Fj|De ! Y e∈EM −1 fU e1fU e2 fDe 1 Q k∈NM −1(fU k)graad(k)−1 | {z } (∗)

Men heeft dus de gewenste paar-copula’s in de ontbinding voor M − 1, er rest dus nog te bewijzen dat (∗) gelijk is aan

Q e∈EM −2fU e Q k∈NM −2(fU k)graad(k)−1.

Dit doet men door het product in (∗) op te splitsen in twee delen en te herschrijven:

(1) Eerst kijkt men naar

Q e∈EM −1fU∗ e1fU∗ e2 Q k∈NM −1(fU k)graad(k)−1. (3.3) Elke boog e ∈ EM −1 brengt twee toppen e1, e2 ∈ NM −1 = EM −2 met zich mee. Dus bij het nemen van het product over de bogen van EM −1 geldt voor elke k ∈ NM −1 dat de multipliciteit van fU

k overeenkomt met het aantal keer dat de top k voorkomt in een boog e ∈ EM −1, of anders gezegd met de graad van top k. Bijgevolg geldt dat

Y e∈EM −1 fU e1fU e2 = Y k∈NM −1 fUgraad(k) k .

Als men nu in (3.3) dit laatste substitueert, krijgt men de breuk Q k∈NM −1fUgraad(k) k Q k∈NM −1(fU k)graad(k)−1, dat simpelweg vereenvoudigd kan worden tot

Y k∈NM −1 fU∗ k = Y e∈EM −2 fU∗ e. (2) Tenslotte wenst men Q

e∈EM −1fDe te herschrijven. Voor elke boog e ∈ EM −1 is er een top k ∈ NM −2 waarvoor gedt dat e rond k is en dus is De = Uk. Het bovenstaande product kan worden uitgewerkt gebruikmakend van Lemma 3.3, dat zegt dat voor elke k ∈ NM −2 er graad(k) − 1 bogen zijn in TM −1 rond k,

Y e∈EM −1 fDe = Y e∈EM −1 fU k = Y k∈NM −2 fUgraad(k)−1 k .

Door (1) en (2) toe te passen in (∗) krijgt men de gewenste formule (3.2) voor M − 1, waarmee de inductiestap is bewezen.

Stelling 3.3 (Paar-copula ontbinding) Zij V = {T1, . . . , Tn−1} een reguliere vine voor n elementen, gegeven Fi en Cij|De zoals voordien, er is een unieke vine-afhankelijke verdeling met dichtheidsfunctie gegeven door

f1...n= f1. . . fn n−1 Y m=1 Y e∈Em cij|De Fi|De, Fj|De . Bewijs: Vertrekkende van de ontbinding bekomen in Stelling 3.2:

f1...n= n−1 Y m=2 Y e∈Em cij|De Fi|De, Fj|De ! Q (i,j)∈E1fij Q i∈N1(fi)graad(i)−1,

kan men de bivariate dichtheidsfuncties fij herschrijven aan de hand van Lemma 3.4, fij = cij(Fi, Fj) fifj.

Mits enige vereenvoudiging en dezelfde redenering als bij (ii)(1) van het bewijs van Stelling 3.2 verkrijgt men de gewenste paar-copula ontbinding voor de n-dimensionale dichtheids-functie.

 Bij de paar-copula ontbinding wordt verondersteld dat de conditionele copula-dichtheid cij|De

niet afhangt van de waarden van de variabelen in De. De conditionele waarden hebben enkel invloed op de conditionele verdelingsfuncties Fi|De en Fj|De. In de praktijk geven deze vine copula’s een grote flexibiliteit voor het beschrijven van de afhankelijkheid daar de verschil-lende paar-copula’s onafhankelijk van elkaar kunnen gekozen worden, het is niet nodig dat de bivariate copula’s van dezelfde familie zijn.

Nu dat men de paar-copula ontbinding heeft gevonden op basis van een reguliere vine, gaat men tonen hoe men deze bekomt vertrekkende van de multidimensionale dichtheidsfunctie. Om de paar-copula ontbinding te verkrijgen van een multivariate dichtheidsfunctie, wordt deze recursief ontbonden als een product van conditionele dichtheden. Voor de variabelen (X1, . . . , Xn) geldt dan:

f (x1, . . . , xn) = f (x2, . . . xn|x1)f (x1)

= f (x3, . . . xn|x1, x2)f (x2|x1)f (x1) = . . .

= f (xn|x1, . . . , xn−1) . . . f (x3|x1, x2)f (x2|x1)f (x1) Voor elke term geldt, met Fi|1...j = Fi|1...j(xi|x1, . . . , xj),

f (xi|x1, . . . , xi−1) = f (xi,xi−1|x1,...,xi−2) f (xi−1)

= ci,i−1|1...i−2(Fi|1...i−2f (x,Fi−1|1...i−2)f (xi−1)f (xi)

i−1)

= ci,i−1|1...i−2 Fi|1...i−2, Fi−1|1...i−2 f (xi)

Meer algemeen kan de n-dimensionale dichtheidsfunctie herschreven worden als een product van f (x|v) met v een d-dimensionale vector, d < n. De conditionele dichtheidsfunctie wordt dan herschreven als een product van een paar-copula-dichtheid en een conditionele dichtheidsfunctie,

f (x|v) = cxvj|v−j(F (x|v−j), F (vj|v−j)) f (x|v−j),

waarbij vj de j-de component component van v en v−j de vector v zonder deze component. In Joe (1996) werd bewezen dat de conditionele verdelingsfunctie kan geschreven worden als

F (x|v) = ∂Cx,vj|v−j (F (x|v−j), F (vj|v−j))

∂F (vj|v−j) , (3.4)

met Cx,vj|v−j een bivariate copula. Een multivariate dichtheid kan dus uitgedrukt worden als een product van paar-copula’s, toegepast op verschillende conditionele verdelingen. Deze opbouw gebeurt op een iteratieve manier. Gegeven een bepaalde ontbinding, bestaan er veel verschillende her-parametrisaties.

Voorbeeld: Voor drie willekeurige variabelen X1, X2 en X3 zijn er drie verschillende regu-liere vines mogelijk, telkens met een andere variabele waarop wordt geconditioneerd in de tweede boom. Men veronderstelt dat de reguliere vine eruit ziet zoals in Figuur 3.5.

Figuur 3.5: Reguliere vine voor 3 variabelen

Aangezien men maar met drie variabelen werkt is deze reguliere vine zowel een C-vine als een D-vine2. Men wenst nu de paar-copula ontbinding te bekomen voor f (x1, x2, x3). Er wordt eerst geconditioneerd op de variabele X2 en vervolgens op de variabele X3:

f (x1, x2, x3) = f (x1, x3|x2)f2(x2) = f (x1|x2, x3)f (x3|x2)f2(x2).

De conditionele dichtheidsfuncties worden verder uitgewerkt met behulp van Lemma 3.4, f (x3|x2) = f (x2,x3) f2(x2) = c23(F2(x2),F3(x3)) f2(x2) f2(x2)f3(x3) = c23(F2(x2), F3(x3))f3(x3) en f (x1|x2, x3) = f (x1,x3|x2) f (x3|x2) = c13|2(F (x1|x2),F (x3|x2))f (x1|x2)f (x3|x2) f (x3|x2) = c13|2(F (x1|x2), F (x3|x2))f (x1|x2) = c13|2(F (x1|x2), F (x3|x2))c12(F1(x1), F2(x2))f1(x1) En bijgevolg kan f (x1, x2, x3) herschreven worden als

c13|2(F (x1|x2), F (x3|x2))c12(F1(x1), F2(x2))c23(F2(x2), F3(x3))f1(x1)f2(x2)f3(x3). In Morales N´apoles et al. (2008) wordt bewezen dat voor de verdeling van n variabelen er n22(n−2)(n−3)/2(n − 2)! mogelijke reguliere vines zijn. Hierbij kan men twee speciefieke gevallen onderscheiden met een eenvoudigere vine-structuur, namelijk de D-vine en de C-vine. Elk met een eigen specifieke ontbinding van de afhankelijkheid. Bij een D-vine geldt dat in elke boom, een top hoogstens met twee bogen is verbonden. Voor een C-vine geldt voor elke boom Ti, dat er een unieke top is dat met de andere n − i toppen verbonden is.

3.3 D-vine en C-vine

Naargelang het om een D-vine, C-vine of een andere reguliere vine gaat, zullen de conditioned set en conditioning set vari¨eren. In het geval van de D-vine en de C-vine hebben deze verzamelingen een bepaalde vorm en kan de paar-copula ontbinding op een eenvoudige manier worden samengevat.

Definitie 3.14 Een reguliere vine wordt een D-vine genoemd indien alle toppen in boom T1 een graad hebben die hoogstens twee is.

Voor een D-vine geldt dat elke boog een verschillende conditioning set heeft. In dit geval kan de paar-copula ontbinding worden geschreven als

n Y k=1 f (xk) n−1 Y j=1 n−j Y i=1

ci,i+j|i+1,...,i+j−1 Fi|i+1,...,i+j−1, Fi+j|i+1,...,i+j−1 .

In Figuur 3.1 werd een mogelijke D-vine structuur weergegeven voor 5 variabelen. De ge-zamenlijke dichtheidsfunctie voor een vijf-dimensionale D-vine structuur zoals in Figuur 3.1 wordt dan gegeven door

f12345 = f1f2f3f4f5c12(F1, F2) c23(F2, F3) c34(F3, F4) c45(F4, F5)

×c13|2 F1|2, F3|2 c24|3 F2|3, F4|3 c35|4 F3|4, F5|4 c14|23 F1|23, F4|23 ×c25|34 F2|34, F5|34 c15|234 F1|234, F5|234

Voor een n-dimensionale D-vine, zijn er n! mogelijke manieren om de variabelen te ordenen in de eerste boom T1. Aangezien de bogen ongeordend zijn, cij|D = cji|D, voor elk paar i, j en een willekeurige conditioning set horende bij een D-vine, kan de volgorde in de boom T1 achterstevoren worden genomen zonder dat de overeenkomstige vine-structuur wijzigt. Er zijn dus n!/2 verschillende bomen op het eerste niveau. Omdat de boomstructuren in T2, . . . , Tn−1 volledig bepaald zijn door T1, betekent dit dat er n!/2 verschillende D-vines zijn voor n elementen.

Definitie 3.15 Een reguliere vine wordt een C-vine of canonische vine genoemd indien elke boom Ti een unieke top heeft met graad n − i, i ∈ {1, . . . , n − 1}, met andere woorden indien er juist ´e´en top is met de maximale graad in elke boom.

De top met de hoogste graad wordt zo gekozen dat de conditioning sets dezelfde zijn per boom. Deze verzameling wordt als maar groter naarmate men vordert in de bomen. Voor dit soort vine geldt als paar-copula ontbinding

n Y k=1 f (xk) n−1 Y j=1 n−j Y i=1 cj,j+i|1,...,j−1 Fj|1,...,j−1, Fj+i|1,...,j−1 . Figuur 3.6 geeft een mogelijke C-vine structuur weer voor 5 variabelen.

Figuur 3.6: C-vine voor 5 variabelen

Voor de vijf-dimensionale C-vine zoals in Figuur 3.6 wordt de gezamenlijke dichtheids-functie gegeven door

f12345 = f1f2f3f4f5c12(F1, F2) c13(F1, F3) c14(F1, F4) c15(F1, F5)

×c23|1 F2|1, F3|1 c24|1 F2|1, F4|1 c25|1 F2|1, F5|1 c34|12 F3|12, F4|12 ×c35|12 F3|12, F5|12 c45|123 F4|123, F5|123

Voor een n-dimensionale C-vine zijn op elk boomniveau de conditioning sets van de bogen dezelfde. Dit betekent dat gegeven de conditioning set in Tj−1, er n − j + 2 keuzes zijn voor de conditioning set in de boom Tj, j ∈ {3, . . . , n − 1}. Voor de boom T2 kunnen er n mogelijke conditioning sets worden gekozen. Samen betekent dit dat er n(n − 1) . . . 3 = n!/2 verschillende C-vines bestaan voor n elementen.