Vine copula a.d.h.v. best passende bivariate copula’s

2.3 Afhankelijkheidsanalyse

2.3.3 Bepaling multivariate afhankelijkheidsstructuur

2.3.3.2 Vine copula a.d.h.v. best passende bivariate copula’s

Voor deze sectie steunen we op Grootaerd [12]. Algemeen verloopt het fitten van een gegeven dataset d.m.v. een reguliere vine in drie stappen:

1. Keuze van een geschikte vine-structuur, d.w.z. selectie van onvoorwaardelijke en voor-waardelijke paren.

2. Keuze van een bivariate copulafamilie voor elk geselecteerd paar uit stap 1. 3. Schatting van de corresponderende parameters voor elke copula.

HOOFDSTUK 2. ANALYSE VAN AFHANKELIJKHEID TUSSEN

NIET-LEVENSVERZEKERINGSTAKKEN 48

Voor het vinden van het best passende model zou je dus de tweede en derde stap moeten uitvoeren voor elke mogelijke reguliere vine. Het aantal reguliere vines op n variabelen groeit echter heel sterk aan wanneer n groter wordt, zoals blijkt uit stelling 1.52 van hoofdstuk 1. Praktisch is dit dus niet haalbaar. Een manier om de vine-structuur te bepalen is door gebruik te maken van Kendall’s tau. Hoe groter de absolute waarde van Kendall’s tau, hoe sterker de afhankelijkheid tussen de variabelen. Volgens Dißmann, Brechmann, Czado en Kurowicka [9] is dit een goede manier van werken.

De vine-structuur voor n variabelen bepalen we als volgt:

1. Berekening van Kendall’s tau voor alle mogelijke paren variabelen in de eerste boom. 2. De keuze van de knopen voor de eerste boom wordt bepaald door de n − 1 knopen

waarvoor de som van de absolute waarde van Kendall’s tau maximaal is.

3. Selectie van een copula voor de gekozen paren uit 2. en schatting van de parameters 4. Bepaling van de observaties die nodig zijn voor de tweede boom d.m.v. de parti¨ele

afgeleiden van de copula’s (h-functies: zie opmerking 2.2) in de eerste boom. 5. Herhaling voorgaande stappen tot de vine-structuur gespecificeerd is.

We construeren nu een vine copula opgebouwd uit bivariate copula’s die het best bij de data passen. We maken opnieuw gebruik van de functie ’BiCopSelect’ en beperken opnieuw de mogelijke copulafamilie tot de Gaussische of normale copula, de Student-t copula, de Clayton copula en de Gumbel copula. De resultaten voor de eerste boom worden weergegeven in tabel 2.14. De orde van de variabelen in de vine copula bepalen we a.d.h.v. Kendall’s tau m.b.v. de functie ’BiCopPar2Tau’. De resultaten worden weergeven in tabel 2.16 (=tabel A.11 van de appendix). We zien dat de afhankelijkheid het sterkst is tussen tak 1 en tak 2, tak 1 en tak 5, tak 1 en tak 3 en tak 4 en tak 5. De vijf verzekeringstakken worden in het vervolg aangeduid met knopen 1 t.e.m. 5. Dit zal uiteindelijk resulteren in een reguliere vine die geen C-vine of D-vine is, want knoop 1 heeft graad drie. Figuur 2.8 toont de uiteindelijk geconstrueerde reguliere vine. In dit stadium kennen we alleen de eerste boom. We merken op dat de berekening van Kendall’s tau gebeurt a.d.h.v. eigenschap 1.27, gebruik makend van de best passende bivariate copula’s. De copulaparameters werden geschat a.d.h.v. een maxi-mum pseudo likelihood methode d.m.v. de functie ’BiCopEst’. We spreken van een maximaxi-mum pseudo likelihood methode i.p.v. een gewone maximum likelihood methode omdat we werken met pseudo-observaties.

Knoop 2 Knoop 3 Knoop 4 Knoop 5 Knoop 1 0.3876934 0.2434353 0.0846578 0.2834612 Knoop 2 0.06771423 0.1662091 0.1383746

Knoop 3 0.08135905 0.04370122

Knoop 4 0.1831447

Figuur 2.8: Geconstrueerde vine-structuur.

De geselecteerde paren verzekeringstakken van de eerste boom worden nu knopen in de tweede boom, noteer deze als {1,2}, {1,3}, {1,5} en {4,5}. De takken in de tweede boom worden opnieuw bepaald a.d.h.v. de sterkste afhankelijkheid tussen de knopen, gemeten m.b.v. de absolute waarde van Kendall’s tau. Omdat knopen alleen verbonden kunnen worden door een tak als ze minstens ´e´en knoop gemeenschappelijk hebben, kunnen alleen knoop {1, 2} en knoop {1, 5}, knoop {1, 2} en {1, 3}, knoop {1, 3} en {1, 5} en knoop {1, 5} en {4, 5} aanleiding geven tot een tak. De waarden van Kendall’s tau worden weergegeven in tabel 2.17 (=tabel A.13 van de appendix). We besluiten dat knoop {1, 2} en knoop {1, 5}, knoop {1, 2} en {1, 3} en knoop {1, 3} en {1, 5}, de grootste afhankelijkheid vertonen. Dit geeft echter geen aanleiding tot een reguliere vine, want in een reguliere vine bestaat er tussen elke twee knopen uit de eerste boom een pad, m.a.w. verzekeringstak 4 dient ergens voor te komen. Daarom kiezen we ervoor verder te werken met knoop {1, 2} en knoop {1, 5}, knoop {1, 2} en {1, 3} en knoop {1, 5} en {4, 5}. Deze knopen in de tweede boom geven aanleiding tot de takken {2, 5|1}, {2, 3|1} en {1, 4|5} in de tweede boom. De copula’s geassocieerd met deze takken worden weergegeven in tabel 2.18. Deze werden opnieuw bepaald via de functie ’BiCopSelect’.

HOOFDSTUK 2. ANALYSE VAN AFHANKELIJKHEID TUSSEN

NIET-LEVENSVERZEKERINGSTAKKEN 50

Knoop {1, 3} Knoop {1, 5} Knoop {4, 5} Knoop {1, 2} -0.1580232 -0.2094644

Knoop {1, 3} -0.05092544

Knoop {1, 5} -0.002235978

Tabel 2.17: Kendall tau-waarden voor de best passende bivariate copula’s voor elk paar knopen in de tweede boom.

Tak {2, 5|1} Tak {2, 3|1} Tak {1, 4|5} Copula Student-t Gaussisch Gaussisch

Tabel 2.18: Best passende bivariate copula’s geassocieerd aan takken in de tweede boom.

Voor de derde boom gaan we analoog te werk. De knopen in de derde boom worden gegeven door de takken uit de tweede boom, namelijk {2, 5|1}, {2, 3|1} en {1, 4|5}. Er is nu slechts ´e´en mogelijkheid om deze knopen te verbinden d.m.v. takken, daar alleen knopen die een knoop gemeenschappelijk hebben verbonden kunnen worden door een tak. Zo zien we dat knopen {2, 5|1} en {2, 3|1} aanleiding geven tot tak {3, 5|1, 2}, terwijl knopen {2, 5|1} en {1, 4|5} aanleiding geven tot tak {2, 4|1, 5}. De vierde boom volgt nu meteen uit de derde. Er zijn slechts twee knopen in de vierde boom, namelijk {3, 5|1, 2} en {2, 4|1, 5} en deze geven aanleiding tot tak {3, 4|1, 2, 5} in de vierde boom. De geassocieerde best passende bivariate copula’s aan de takken in de derde en vierde boom worden weergegeven in tabel 2.19.

Tak {3, 5|1, 2} Tak {2, 4|1, 5} Tak {3, 4|1, 2, 5}

Copula Clayton Clayton Gumbel

Tabel 2.19: Best passende bivariate copula’s geassocieerd aan takken in de derde en vierde boom.

Sectie A.3 van de appendix bevat scatterplots van de gebruikte observaties per boom. Voor de eerste boom zijn dit louter de pseudo-observaties (uj), welke eigenlijk de waarde zijn van een lognormale verdelingfunctie of een gammaverdelingsfunctie in een bepaalde quasi-observatie. Voor de andere bomen betreffen het voorwaardelijke verdelingsfuncties (h-functies), berekend via de parti¨ele afgeleide van een copula.

Opmerking 2.2 (h-functies). De zogenaamde h-functies spelen een rol bij de selectie van bivariate copula’s die geassocieerd worden aan de takken van een boom. Voor de eerste boom wordt gebruik gemaakt van de pseudo-observaties. Vanaf de tweede boom dient er echter gebruik gemaakt te worden van voorwaardelijke verdelingsfuncties, vermits de copula’s geas-socieerd aan takken vanaf de tweede boom van de vine voorwaardelijke copula’s zijn. Deze voorwaardelijke verdelingsfuncties worden gegeven door de volgende h-functies:

h(u|v; Θ) = ^∂C^uv^j^|^v^−j^(h(u|v^−j^{), h(v}^j^|v^−j⁾⁾ ∂h(v_j|v_−j)

h(x|y) = ^{∂C(x, y)} ∂y ^.

Hierbij is v_j een willekeurige component van de k-dimensionale vector v, terwijl v−j de vector v zonder de component v_j voorstelt. k stelt het aantal variabelen voor en Θ is de parameter-verzameling van de copula C.

We illustreren het concept van h-functies voor een C-vine op vier variabelen.

Voorbeeld 2.3 (h-functies). Beschouw vier standaard uniforme kansvariabelen U1, U2, U3

en U4. Onderstel dat u1, u2, u3 en u4 respectievelijk de n-dimensionale vectoren van hun pseudo-observaties zijn. We bekijken het geval waarbij berekening van Kendall’s tau een C-vine-structuur oplevert met wortelvariabelen u₁ en {u₁, u₂} in respectievelijk de eerste en de tweede boom.

• De copula’s in de eerste boom maken gebruik van de paren {u₁, u2}, {u₁, u3} en {u₁, u4}. We noteren deze copula’s als C_1,2, C_1,3 en C_1,4. Stel dat de functie ’BiCopSelect’ de Gumbel copula aangeeft voor C_1,2 en de Clayton copula voor C_1,3 en C_1,4. Deze copula’s worden gegeven door

C1,2(u1, u2; θ1,2) = exp −(− ln u1)^θ1,2 + (− ln u2)^θ1,2 1 θ1,2 , θ1,2 ≥ 1 C1,3(u1, u3; θ1,3) = u^−θ1,3 1 + u^−θ1,3 3 − 1⁻ 1 θ1,3, θ1,3 ∈ [−1, ∞) \{0}. C_1,4(u₁, u₄; θ_1,4) = u^−θ1,4 1 + u^−θ1,4 4 − 1⁻ 1 θ1,4, θ_1,4 ∈ [−1, ∞) \{0}.

• Voor de copula’s C_2,3|1 en C_2,4|1 in de tweede boom maken we gebruik van de h-functies. Onderstel dat de functie ’BiCopselect’ opnieuw een Clayton copula aangeeft voor beide copula’s. De verdelingsfuncties van de copula’s C_2,3|1 en C_2,4|1 worden dan gegeven door

C_2,3|1(h(u2|u₁; θ1,2), h(u3|u₁; θ1,3); θ_2,3|1) =h(u₂|u₁; θ_1,2)^−θ2,3|1+ h(u₃|u₁; θ_1,3)^−θ2,3|1− 1⁻ 1 θ2,3|1 , θ_2,3|1∈ [−1, ∞) \{0} en C_2,4|1(h(u2|u₁; θ1,2), h(u4|u₁; θ1,4); θ_2,4|1) = h(u2|u₁; θ1,2)^−θ2,4|1+ h(u4|u₁; θ1,4)^−θ2,4|1− 1⁻ 1 θ2,4|1 , θ_2,4|1 ∈ [−1, ∞) \{0}, met h(u2|u₁; θ1,2) = ^∂C^1,2^(u¹^{, u}²^{; θ}^1,2⁾ ∂u1 = ^C¹²^(u¹^{, u}²^{; θ}^1,2⁾ u₁ ^{(− ln u}¹⁾ θ1,2−1(− ln u₂)^θ1,2 + (− ln u₁)^θ1,2 1 θ1,2⁻¹,

HOOFDSTUK 2. ANALYSE VAN AFHANKELIJKHEID TUSSEN NIET-LEVENSVERZEKERINGSTAKKEN 52 h(u₃|u₁; θ_1,3) = ^∂C^1,3^(u¹^{, u}³^{; θ}^1,3⁾ ∂u₁ = u^−θ₁ ^1,3⁻¹ u^−θ₁ ^1,3 + u^−θ₃ ^1,3 − 1⁻ 1 θ1,3⁻¹ , h(u4|u₁; θ1,4) = ^∂C^1,4^(u¹^{, u}⁴^{; θ}^1,4⁾ ∂u1 , = u^−θ1,4−1 1 u^−θ1,4 1 + u^−θ1,4 4 − 1⁻ 1 θ1,4⁻¹.

• Voor de copula C_3,4|1,2 in de derde en laatste boom maken we opnieuw gebruik van h-functies. Onderstel dat de functie ’BiCopselect’ een Gumbel copula aangeeft voor C_3,4|1,2, dan wordt haar verdelingsfunctie gegeven door

C_3,4|1,2(h(u₃|u₁, u₂; θ_2,3|1), h(u₄|u₁, u₂; θ_2,4|1); θ_3,4|1,2) = exp −(− ln h(u₃|u₁, u₂; θ_2,3|1))^θ3,4|1,2+ (− ln h(u₄|u₁, u₂; θ_2,4|1))^θ3,4|1,2 1 θ3,4|1,2 , θ_3,4|1,2 ≥ 1, met

h(u3|u₁, u2; θ_2,3|1) = ^∂C^2,3|1^(h(u²^|u¹^{; θ}^1,2^{), h(u}³^|u¹^{; θ}^1,3^{); θ}^2,3|1⁾ ∂h(u₂|u₁; θ_1,2) = h(u2|u₁; θ1,2)^−θ2,3|1−1 h(u2|u₁; θ1,2)^−θ2,3|1 + h(u3|u₁; θ1,3)^−θ2,3|1− 1⁻ 1 θ2,3|1⁻¹ en

h(u₄|u₁, u₂; θ_2,4|1) = ^∂C^2,4|1^(h(u²^|u¹^{; θ}^1,2^{), h(u}⁴^|u¹^{; θ}^1,4^{); θ}^2,4|1⁾ ∂h(u2|u₁; θ1,2)

= h(u₂|u₁; θ_1,2)^−θ2,4|1−1h(u₂|u₁; θ_1,2)^−θ2,4|1+ h(u₄|u₁; θ_1,4)^−θ2,4|1− 1⁻ 1 θ2,4|1⁻¹.

Voor de schatting van de parameters van de geconstrueerde vine copula gaan we in twee stappen te werk. In een eerste stap bepalen we startwaarden voor onze parameters m.b.v. een zogenaamde sequenti¨ele schattingsprocedure:

1. Bepaal welke copulafamilies het meest geschikt zijn voor de eerste boom door de pseudo-observaties te plotten of een goodness-of-fit test uit te voeren.

2. Schat de parameters van de geselecteerde copula a.d.h.v. de originele pseudo-observaties. 3. Bepaal de observaties die nodig zijn voor de tweede boom d.m.v. de parti¨ele afgeleiden

van de copula’s (h-functies: zie opmerking 2.2) in de eerste boom.

4. Bepaal welke copulafamilies het meest geschikt zijn voor de tweede boom op volledig dezelfde manier als voor de eerste boom.

We berekenen eveneens de loglikelihood a.d.h.v. de functie ’RVineLogLik’ uit het pakket ’Vi-neCopula’. De resultaten worden weergegeven in tabel 2.20 in de kolom ’startwaarde’. Met de index van de parameters wordt aangeduid aan welke tak van de reguliere vine de be-schouwde bivariate copula geassocieerd werd. Zo is θ_1,3 de parameter van de bivariate copula geassocieerd aan tak {1, 3}, welke de afhankelijkheid modelleert tussen knoop 1 en knoop 3. Omdat de observaties die gebruikt worden om de copula’s te selecteren voor een bepaald niveau van de vine copula afhankelijk zijn van de gekozen copula’s in voorgaande niveaus, leidt deze selectieprocedure niet noodzakelijk tot een globale optimale fit. We gebruiken deze startwaarden dan ook niet als finale waarden voor de te schatten parameters.

In een tweede stap schatten we de copulaparameters gezamenlijk a.d.h.v. een maximum pseudo likelihood methode, gebruik makend van de startwaarden bekomen door voorgaande sequenti¨ele schattingsprocedure. We maken daarvoor gebruik van de functie ’RVineMLE’. De resultaten worden weergegeven in tabel 2.20 in de kolom ’finale waarde’. We berekenen even-eens de loglikelihood. We zien een hele lichte stijging in loglikelihood als we de parameters tegelijkertijd schatten.

Parameter Startwaarde Finale waarde θ_1,3 0.37313633 0.38514734 θ_1,2 1.2663372 1.2490686 θ_1,5 0.791195859 0.80053076 θ_4,5 0.2837313 0.3476593 θ_2,3|1 -0.24568105 -0.26785584 θ_2,5|1 -0.3231214 -0.2997993 ν_2,5|1 2.370608 2.379329 θ_1,4|5 -0.003512259 -0.08993539 θ_3,5|1,2 0.09259941 0.06691308 θ_2,4|1,5 0.3456933 0.3920281 θ_3,4|1,2,5 1.16444136 1.19480528 loglikelihood 11.25623 11.42784

Tabel 2.20: Geschatte parameters voor bivariate copula’s van de geconstrueerde vine copula. We merken op dat de procedure voor de constructie van de best passende vine copula hierbo-ven stapsgewijs uitgewerkt werd om het achterliggende idee duidelijk te maken. In de praktijk kan hetzelfde resultaat zeer snel bekomen worden a.d.h.v. de functie ’RVineStuctureSelect’ uit het pakket ’Vine copula’. Indien men toch onafhankelijkheidscopula’s wenst toe te laten, kan men voor elk paar een voorafgaande onafhankelijkheidstest uitvoeren binnen de functie ’RVineStructureSelect’. Deze test is gebaseerd op de empirische waarde van Kendall’s tau, maar verschilt van deze m.b.t. tabel 2.13. De teststatistiek van de test met als nulhypothese H0 onafhankelijkheid, wordt gegeven door (Schepsmeier, Stoeber en Brechmann [20])

T = s 9n(n − 1) 2(2n + 5) ^{× t} H0 ∼ N (0, 1) als n → ∞,

waarbij n de steekproefgrootte is en t de empirische waarde van Kendall’s tau. Deze test geeft opnieuw aan dat alleen de afhankelijkheid tussen tak 1 en tak 2 significant is op basis van een 5% significantieniveau.

HOOFDSTUK 2. ANALYSE VAN AFHANKELIJKHEID TUSSEN

NIET-LEVENSVERZEKERINGSTAKKEN 54

2.3.3.3 Vergelijking 5-dimensionale normale copula en enkele vine copula’s

In document Verzekering niet-leven: analyse van afhankelijkheid tussen takken met behulp van vine copula’s (pagina 53-60)