Gevolgen financiële crisis op inkomensverdeling en
inkomensongelijkheid
Beer Genet
10643796
23-‐12-‐2015
Begeleider: Kees Jan van Garderen
Faculteit Economie en Bedrijfskunde, Universiteit van Amsterdam Bachelorscriptie en Afstudeerseminar Econometrie, 2015
Inhoudsopgave 1. Introductie ……… 3 2. De methodiek ……….. 5 i. Crises ……… 5 ii. Inkomensverdelingen ……… 6 iii. Parameterschatting ………. 8
iv. Goodness of fit ……… 9
v. Inkomensongelijkheidsmaten ……….. 9
3. Beschrijving van data en onderzoeksopzet ………... 12
i. Inkomensdata ………..… 12
ii. Toepassing theorie ………... 14
4. Resultaten ………... 15 5. Conclusie ………. 24 Bibliografie ………. 26
1. Introductie
In de hedendaagse samenleving is ieder zich bewust van het feit dat de een meer verdient dan de ander. Zo heeft vaak iemand die is afgestudeerd aan de
universiteit later ook een hoger inkomen dan iemand die alleen zijn middelbare school heeft afgemaakt (Satimanon, 2011). Dit verschil in inkomen zorgt voor inkomensongelijkheid binnen de maatschappij. De verschillen in inkomen kunnen met behulp van een inkomensverdeling goed in beeld worden gebracht. Zo heeft Pareto (1895) als eerste een model voorgesteld om met behulp van een kansdichtheid de inkomensverdeling weer te geven. Er is echter veel kritiek op het model van Pareto. Een van deze critici was Gini. Hij was het oneens met de bewering van Pareto dat economische groei voor minder inkomensongelijkheid zorgt. Om dit beter te onderzoeken heeft Gini (1912) zelf een maatstaf bedacht om de grootte van de inkomensongelijkheid weer te geven, de Ginicoëfficiënt. Deze coëfficiënt wordt samen met, onder andere, de Theil-‐ en Atkinson-‐indices tot op heden nog steeds veel gebruikt om de inkomensongelijkheid uit te drukken.
Naar aanleiding van de vele kritiek op het model van Pareto zijn er nog veel andere verdelingsfuncties voorgesteld om de verschillen in inkomen weer te geven. Zo heeft Gibrat (1931) de lognormale verdeling voorgesteld. Echter, het blijkt dat zowel Pareto als Gibrat er niet in geslaagd is om de inkomensverdeling juist weer te geven omdat in beide gevallen de lage inkomens onvoldoende worden benaderd (Parker, 1998). Bandourian, McDonald en Turley (2002) hebben in vrij recent onderzoek aangetoond dat de Weibull (twee parameters), Dagum (drie parameters) en de Generalized Beta of the second kind (vier parameters) wel een adequate representatie van de werkelijke inkomensdata weergeven.
Echter, volgens Card en DiNardo (2002, p. 739) is het opleidingsniveau niet de enige factor die een rol speelt in de bepaling van het inkomen. Zo spelen volgens hun ook de omstandigheden van de financiële markten, vraag naar en aanbod van arbeidskrachten en nieuwe ontwikkelingen binnen de economie een belangrijke rol. Een goed voorbeeld hiervan is de periode 1980-‐1985 waarin de inkomensongelijkheid in de Verenigde Staten toenam. De verklaring hiervoor is
het gevolg van de snelle en grote technologische ontwikkelingen toentertijd. Computertechnologie werd steeds belangrijker waardoor veel bedrijven de mogelijkheid kregen om hun winst te vergroten, hetgeen weer leidde tot hogere inkomens. Galbraith en Hale (2004) zijn van mening dat ook de introductie van het wereldwijde web, wat bijdroeg aan de globalisering van de economie, grote gevolgen heeft gehad voor de financiële markten. De mogelijkheden die het wereldwijde web met zich mee bracht leken eindeloos en het creëerde
vertrouwen in de opkomende internetsector. Volgens Galbraith en Hale was het dit vertrouwen en de vele nieuwe beursgenoteerde informatietechnologie (IT) gerelateerde bedrijven die zorgden voor overinvesteringen in de IT-‐sector op de aandelenmarkt. Dit is de belangrijkste oorzaak van de internetcrisis in 2001. De internetcrisis had een grote waardedaling van IT-‐gerelateerde aandelen tot gevolg. Hierdoor ontstonden grote verliezen in de beleggingsportefeuilles van veel vermogende mensen. Ook de kredietcrisis van 2008 had grote financiële gevolgen. Echter, bij deze crisis waren de slachtoffers vooral mindervermogende mensen met een hypotheekschuld (Mian & Sufi, 2014, p. 25). Het is hiermee duidelijk dat een financiële crisis een groot effect kan hebben op iemands vermogen en inkomen. Echter, hoe groot het effect is op de grote schaal is nog steeds onduidelijk. Daarom wordt in dit verslag onderzocht of een financiële crisis een significante invloed heeft op de inkomensverdeling en de
inkomensongelijkheid.
In dit onderzoek wordt aan de hand van inkomensgegevens uit de Verenigde Staten een juiste inkomensverdeling bepaald voorafgaand aan de internet-‐ en aan de kredietcrisis. Vervolgens wordt er onderzocht of deze inkomensverdeling na de desbetreffende crisis zichtbare veranderingen heeft ondergaan. Naast het bepalen van een juiste inkomensverdeling, wordt ook onderzocht of de grootte van de inkomensongelijkheid constant blijft, toe-‐ of afneemt na een financiële crisis. De grootte van de inkomensongelijkheid wordt bepaald met behulp van de Ginicoëfficiënt en de Theil-‐index.
Het verloop van dit verslag is als volgt ingedeeld. In de volgende paragraaf wordt relevant voorafgaand onderzoek behandeld en toegelicht. Daarna wordt de opzet en de inhoud van dit onderzoek besproken. Vervolgens
worden de resultaten hiervan weergegeven en geanalyseerd. Tot slot volgt de conclusie. 2. De methodiek
Deze paragraaf bestaat uit vijf delen. Als eerste worden kort de perioden rondom de crises besproken. Vervolgens wordt de keuze van geschikte verdelingen om de inkomensdata weer te geven behandeld. Aansluitend wordt toegelicht hoe de parameters van de verdelingen bepaald kunnen worden met behulp van
maximum likelihood. Daarna worden enkele criteria behandeld om de relevantie van de verdelingen te toetsen. Als laatste worden verschillende maten van inkomensongelijkheid behandeld.
Crises
De twee laatste decennia jaren voorafgaand aan het tweede millennium waren vanuit het perspectief van economische groei en –ontwikkeling zeer gunstig in vrijwel alle markten. Het werd steeds duidelijker dat de nieuwe innovaties op het gebied van computertechnologie ongekende commerciële mogelijkheden met zich mee brachten. Erg belangrijk was de ontwikkeling van het wereldwijde web wat de mogelijkheid tot het bereiken van miljoenen potentiele afnemers erg gemakkelijk maakte voor zowel de bestaande multinationals als voor de
nieuwkomers op de markt. Ook veronderstellen Card en DiNardo (2002) dat door de technologische veranderingen de vraag naar hoog opgeleide
werknemers toenam. Dit zorgde ervoor dat ook het verschil in inkomen tussen hoog en laag opgeleide werknemers in de hele wereld toenam. Deze
inkomensongelijkheid bleef toenemen in de periode van 1997 tot begin 2000. Deze periode wordt ook wel de internetzeepbel genoemd, omdat in deze jaren de koersen op de aandelenmarkt gigantisch stegen als gevolg van de groei in de internetsector (Fiorentini, 2014). In 2001 bleek het, volgens Goodnight en Green (2010, p. 127), onontkoombare zich inderdaad voor te doen. Na jaren van
koersstijgingen van vooral IT-‐gerelateerde aandelen spatte de zogenoemde “zeepbel” uiteen, de aandelenkoersen daalde dramatisch.
Hier ging het niet om een “internetzeepbel”, maar om een zogenoemde “vastgoedzeepbel”. In de jaren voorafgaand aan 2008 werden hypotheken gebundeld en als pakket verhandeld en verkocht. Deze pakketten kregen in de meeste gevallen een hoge kredietbeoordeling (AAA) van de rating agencies. Daarom werden ze gezien als een goede en waardevaste investering. Echter, deze pakketten bleken bij lange na niet zo veilig te zijn als men deed voorkomen. Het gevolg, een verlies van miljarden (Ferguson, 2011). Door dit verlies kwamen veel financiële instellingen in de problemen, het vertrouwen in de bancaire wereld en het vertrouwen tussen banken onderling nam dramatisch af. Dit resulteerde uiteindelijk in het faillissement van verschillende banken en er moesten ingrijpende voorzorgsmaatregelen worden genomen om andere banken van hun ondergang te redden. Al deze problemen en maatregelen zorgden voor nog minder vertrouwen in de toenmalige financiële markt (Mian & Sufi, 2014). Dit resulteerde in het verlies van banen, daling van vastgoedprijzen en mensen bleven zonder inkomen met hun hypotheekschuld, vaak hoger dan de waarde van hun onroerend goed, achter. Daarom waren volgens Fiorentini (2014, p. 129) de gevolgen voor het inkomen die de kredietcrisis met zich meebrachten niet direct na 2008 waarneembaar, maar deze volgden pas enkele jaren later. De gevolgen van de kredietcrisis waren veel groter en langduriger dan de gevolgen van de internetcrisis. Dit komt vooral omdat de vastgoedmarkt veel toegankelijker is voor de massa dan de aandelenmarkt (Wisman, 2012, p. 929).
Inkomensverdelingen
Door de jaren heen zijn er vele verdelingen voorgesteld om het inkomen weer te geven. Echter, niet al deze verdelingen bleken een goede fit te zijn voor de
inkomensgegevens. Zo wordt de Pareto verdeling tegenwoordig nog maar zelden gebruikt. Een aantal veelgebruikte verdelingen, waarvan in verschillend
onderzoek is aangetoond dat deze voor een goede weergave van de
inkomensgegevens zorgen, zijn de Gamma (G), de Weibull (W) en de Singh-‐ Maddala (SM) verdelingen. Zo hebben Salem en Mount (1974) onderzocht hoe de G-‐verdeling gebruikt kan worden om de inkomensgegevens uit de Verenigde Staten in de periode 1960-‐1969 te representeren. Verder hebben Singh en Maddala (1976) de SM-‐verdeling geïntroduceerd. Deze verdeling blijkt ook zeer
geschikt om de inkomensgegevens uit de Verenigde Staten te fitten. Ook in recent onderzoek worden deze verdelingen nog steeds veel gebruikt. Zo hebben Bandourian et al. (2002) aangetoond dat deze verdelingen niet alleen voor de Verenigde Staten geschikt zijn, maar ook voor bijvoorbeeld de meeste Europese landen en Australië. Uit hun onderzoek, waarvoor zij inkomensgegevens uit de periode 1967-‐1997 hebben gebruikt, blijkt het dat de Weibullverdeling, samen met de Dagum en de Generalized Beta of the second kind (GB2) de beste keuzes zijn om deze inkomensdata te repliceren. Dastrup et al. (2005) bevestigen in hun onderzoek naar de bepaling van een juiste inkomensverdeling na aftrek van belasting en eventuele overdrachtsbetalingen met behulp van data uit 1979-‐ 2001 de conclusies van Bandourian et al.. Uit het onderzoek van Dastrup et al. blijkt tevens dat de inkomensongelijkheid aannemelijk kleiner is wanneer het netto-‐inkomen wordt onderzocht in plaats van het bruto-‐inkomen. Ook Schluter en Van Garderen (2009) hebben in nog recenter onderzoek, onder andere, de lognormale-‐, de G-‐ en de SM-‐verdeling gekozen met data uit Ivoorkust. McDonald (1984) heeft een verdeling geïntroduceerd waarvan de drie verdelingen, samen met de besproken verdelingen zoals de Pareto en de lognormale, speciale gevallen zijn. Deze verdeling wordt de generalized beta (GB) verdeling genoemd. Deze GB-‐verdeling is gedefinieerd met behulp van de volgende kansdichtheid functie (pdf):
𝐺𝐵 𝑦; 𝑎, 𝑏, 𝑐, 𝑝, 𝑞 =|𝑎|𝑦!"!!(1 − (1 − 𝑐) 𝑦/𝑏 !)!!!
𝑏!"𝐵(𝑝, 𝑞)(1 + 𝑐(𝑦/𝑏)!)!!! , voor 0 < 𝑦! < 𝑏! = 0, anders
met 0 ≤ 𝑐 ≤ 1 en 𝑏, 𝑝, 𝑞 > 0 en 𝐵(𝑝, 𝑞) gelijk aan de bètafunctie. Zo kunnen de SM, G en W verdelingen worden verkregen uit de GB door middel van:
𝑆𝑀 𝑦; 𝑎, 𝑏, 𝑞 = 𝐺𝐵(𝑦; 𝑎, 𝑏, 𝑐 = 1, 𝑝 = 1, 𝑞) 𝐺 𝑦; 𝑏, 𝑝 = 𝐺𝐵(𝑦; 𝑎 = 1, 𝑏, 𝑐 = 1, 𝑝, 𝑞 → ∞) 𝑊 𝑦, 𝑎, 𝑏 = 𝐺𝐵(𝑦; 𝑎, 𝑏, 𝑐 = 1, 𝑝 = 1, 𝑞 → ∞)
In figuur 1 is de zogenoemde verdelingsboom weergegeven. Met behulp van deze boom kan gemakkelijk worden gezien hoe een verdeling afstamt van de GB-‐ verdeling.
Figuur 1 -‐ Verdelingsboom
Bron: Dastrup et al., 2005
Het is duidelijk dat de, in dit onderzoek beschouwde, verdelingen allemaal afstammen van de GB2 verdeling, ofwel het zijn speciale gevallen van de GB2 verdeling. Dit worden ook wel geneste verdelingen genoemd. Zo is de W-‐ verdeling een geneste verdeling van de SM-‐verdeling.
Parameterschatting
Elke verdeling is afhankelijk van verschillende parameters. Zo is de G-‐verdeling afhankelijk van twee parameters en de SM-‐verdeling afhankelijk van drie parameters. Zulke parameters van verdelingen kunnen worden geschat met behulp van maximumlikelihood (ML). Wanneer de inkomensgegevens in
groepen worden weergegeven kan ML ook worden toegepast met behulp van de multinomiallikelihoodfunctie. Zo hebben Bandourian et al. (2002) in hun
onderzoek de inkomensgegevens in twintig groepen onderverdeeld, met in elke groep een gelijk aantal waarnemingen. De multinomiallikelihoodfunctie is als volgt gedefinieerd: 𝐿 𝜃 = 𝑁! (𝑝!(𝜃))!! 𝑛!! ! !!!
met 𝑝! 𝜃 = 𝐹 𝑌!; 𝜃 − 𝐹(𝑌!!!; 𝜃), waarbij 𝐹() gelijk is aan de cumulatieve kansverdelingsfunctie (CDF) van de gebruikte verdeling, 𝜃 een vector van de parameters, 𝑔 gelijk aan het aantal verschillende inkomensgroepen, 𝑛! gelijk aan het aantal observaties binnen groep 𝑖 en 𝑁! gelijk aan het totale aantal
observaties. Vervolgens kunnen de maximumlikelihoodschatters worden bepaald door het volgende te maximaliseren:
𝑙 𝜃 = 𝑛 log 𝑝! 𝜃
!
!!!
Hierbij is 𝑛 een constante die gelijk is aan het totaal aantal observaties gedeeld door het aantal groepen (𝑛 = 𝑁/𝑔). De termen die niet afhankelijk zijn van parameters zijn weggelaten, omdat deze geen invloed hebben bij de bepaling van de maximumlikelihoodschatters.
Goodness of fit
Om te bepalen welke verdeling het beste bij de inkomensdata past kunnen een aantal maten worden berekend. In dit onderzoek worden de sum of squared errors (SSE), de sum of absolute errors (SAE) en de chi-‐kwadraat ( 𝜒!) gebruikt om de juistheid van de verdeling weer te geven. Deze worden gegeven door:
𝑆𝑆𝐸 = 𝑛! 𝑁 − 𝑝! 𝜃 ! ! !!! , 𝑆𝐴𝐸 = 𝑛! 𝑁 − 𝑝! 𝜃 ! !!! en 𝜒! = 𝑁 𝑛! 𝑁 − 𝑝! 𝜃 ! 𝑝! 𝜃 ! !!!
Ook kunnen geneste verdelingen met elkaar worden vergeleken met behulp van de Likelihood Ratio (LR) test. Deze test is als volgt gedefinieerd:
𝐿𝑅 = 2 𝑙 𝜃 − 𝑙 𝜃!
met 𝑙 𝜃 gelijk aan de log-‐likelihood van de ongeneste verdeling en 𝑙 𝜃! gelijk aan de log-‐likelihood van de geneste verdeling. Bij benadering is 𝐿𝑅
asymptotisch verdeeld, namelijk: 𝐿𝑅 ~ χ!(𝑟). Hierbij is het aantal vrijheidsgraden 𝑟 gelijk aan het verschil in aantal parameters tussen de verdelingen
Inkomensongelijkheidsmaten
Voor het meten van de inkomensongelijkheid wordt gebruikgemaakt van de Ginicoëfficiënt (G) en de Theil-‐index (T). Deze worden als volgt berekend:
𝐺 =2𝜇1 𝑥 − 𝑦 𝑓 𝑥 𝑓 𝑦 𝑑𝑥𝑑𝑦 ! ! ! ! 𝑇 = 𝑦 𝜇 𝑙𝑛 𝑦 𝜇 ! ! 𝑑𝐹(𝑦)
met 𝜇 gelijk aan het gemiddelde. De Theil-‐index is oorspronkelijk afkomstig uit de familie van de Generalized Entropy (GE) Indices. De GE wordt gegeven door:
𝐺𝐸 𝛼, 𝐹 = 1 𝛼!− 𝛼 𝑦!𝑑𝐹(𝑦) 𝜇! − 1 voor 𝛼 ≠ {0,1} − ln 𝑦 𝜇 𝑑𝐹 𝑦 voor 𝛼 = 0 𝑦 𝜇 𝑙𝑛 𝑦 𝜇 𝑑𝐹 𝑦 voor 𝛼 = 1
waarbij 𝛼 een willekeurige sensitiviteitsparameter is en 𝐹 de desbetreffende inkomensverdeling. Hoe groter deze 𝛼, hoe gevoeliger de index wordt voor veranderingen in de top van de inkomensverdeling (Schluter & Van Garderen, 2009). Hierbij is de Theil-‐index het speciale geval 𝑇 = 𝐺𝐸(1).
In tabel 1 worden de verschillende kansdichtheidsfuncties en de bijbehorende Ginicoëfficiënten van vier verdelingen weergegeven.
Tabel 1 -‐ Kansdichtheidsfuncties en Ginicoëfficiënten
Verdeling pdf Gini Gamma 𝐺 𝑦; 𝑏, 𝑝 = 𝑦!!! 𝑏!Γ(𝑝)exp (−𝑦/𝑏) Γ(𝑝 + 1/2) Γ(𝑝 + 1) π Lognormale 𝐿𝑁 𝑦; 𝜇, 𝜎 = exp − ln 𝑦 − 𝜇 𝜎 2 ! 𝑦𝜎 2𝜋 2 1 2π𝑒 !!!! − 1 Weibull 𝑊 𝑦; 𝑎, 𝑏 = 𝑎 𝑦!!! 𝑏! exp (−(𝑦/𝑏)!) 1 − 1 2!/! Singh-‐ Maddala 𝑆𝑀 𝑦; 𝑎, 𝑏, 𝑞 = 𝑎 𝑞𝑦!!! 𝑏!(1 + 𝑦/𝑏)!!! 1 − Γ(𝑞)Γ(2𝑞 − 1/𝑎) Γ(𝑞 − 1/𝑎)Γ(2𝑞) Bron: Dastrup et al., 2005
Ook de Theil-‐index kan voor elke verdeling worden berekend. Zo is de Theil-‐ index van de gamma functie gelijk aan:
T = 1
𝑝+𝜓 𝑝 − ln (𝑝)
Met 𝜓 𝑝 = !
!"𝑙𝑛 Γ 𝑝 = !!(!)
!(!) de digamma functie (McDonald & Jensen, 1979).
Het valt op dat zowel de Ginicoëfficiënt van de Gamma-‐ en Weibull-‐ verdeling en de Theil-‐index van de Gamma-‐verdeling slechts afhankelijk zijn van één enkele parameter. De andere parameter heeft geen invloed op de grootte van de coëfficiënt/index en kan hierom worden beschouwd als een schaalparameter. Hetzelfde geldt voor de weggelaten parameter in de berekening van de
Ginicoëfficiënt van de Singh-‐Maddalaverdeling.
De Ginicoëfficiënt is afgeleid van de Lorenzcurve (Brakel-‐Hofmans, 2007, p. 11). en is de meest gebruikte maat voor inkomensongelijkheid. De waarde van deze coëfficiënt ligt tussen de 0 en 1, waarbij 0 correspondeert met totale
gelijkheid (iedereen heeft hetzelfde inkomen) en 1 correspondeert met totale ongelijkheid (één persoon heeft al het inkomen). Deze coëfficiënt is daarom uiterst geschikt voor het vergelijken van verschillende perioden. Een nadeel van de coëfficiënt is dat deze gevoelig is voor veranderingen rondom de gemiddelde inkomens en minder gevoelig is voor de veranderingen aan de staarten van de inkomensverdeling (Allison, 1978). In dit onderzoek kan dit nadelige gevolgen hebben omdat wordt verwacht dat juist de lagere inkomens na de kredietcrisis en de hogere inkomens na de internetcrisis de meeste veranderingen
doormaken.
De Theil-‐index heeft, net als de Ginicoëfficiënt, een waarde 0 als iedereen hetzelfde inkomen heeft. Echter, bij totale inkomensongelijkheid is de waarde van de index niet gelijk aan 1 maar aan ln (𝑛), waarbij 𝑛 gelijk is aan het aantal observaties in de steekproef. Volgens Theil (1967, p. 92) is de afhankelijkheid van 𝑛 een zeer functionele eigenschap omdat op deze manier de ongelijkheid nog beter wordt weergegeven. Immers, in het geval dat de steekproef slechts uit twee personen bestaat en één persoon bezit al het inkomen (𝑇 = ln (2)) is dit minder ongelijk verdeeld dan in het geval van een steekproef van tien personen met één persoon met al het inkomen (𝑇 = ln (10)). Helaas is de afhankelijkheid van 𝑛 zelf weer nadelig wanneer sprake is van verschillende steekproeven met een verschillende 𝑛. Om dit probleem op te lossen, kan de relatieve Theil-‐index worden berekend. De relatieve Theil-‐index is gelijk aan de Theil-‐index gedeeld
door zijn maximale waarde (𝑇/ln (𝑛)). Deze index varieert dan, net als de
Ginicoëfficiënt, tussen de 0 en 1 (Brakel-‐Hofmans, 2007). Een andere eigenschap van de Theil-‐index is dat deze sterk reageert op veranderingen aan de top van de inkomensverdeling, hiermee is de Theil-‐index een goede aanvulling op de
Ginicoëfficiënt (Allison, 1978).
3. Beschrijving van data en onderzoeksopzet
In deze paragraaf wordt stapsgewijs toegelicht hoe dit onderzoek wordt
uitgevoerd. Als eerste worden de gebruikte data besproken en vervolgens wordt de theorie uit de vorige paragraaf toegepast op de in dit onderzoek relevante verdelingen. Zo wordt uitgelegd hoe ML kan worden toegepast en de
inkomensongelijkheidsmaten voor de verschillende verdelingen worden gegeven.
Inkomensdata
De data waar in dit onderzoek mee wordt gewerkt zijn afkomstig uit de databank van de Luxembourg Income Study (LIS). De verzamelde data van LIS is cross-‐ sectioneel en bevatten gegevens van de meeste westerse landen. In de LIS-‐
databank zijn gegevens te vinden die dateren van meerdere decennia geleden tot op heden. De data van de LIS zijn verzameld met behulp van enquêtes.
In dit empirisch onderzoek worden data gebruikt afkomstig uit de Verenigde Staten die zijn gedateerd rond de perioden van de internet-‐ en de kredietcrisis. De beschikbare datasets rondom deze perioden dateren uit de jaren 2000, 2004, 2007 en 2010. Voor zowel de internet-‐ als de kredietcrisis zijn er data aanwezig van het voorafgaande jaar aan de crisis, namelijk de jaren 2000 en 2007 respectievelijk. Er wordt verwacht dat het effect van een crisis niet direct aantoonbaar is. Daarom zijn de jaren 2004 en 2010 naar verwachting geschikt om het effect van de crisissen te onderzoeken. Mogelijk is het effect van de internetcrisis op de inkomensverdeling in het jaar 2004 moeilijker
waarneembaar wegens de te grote tussenliggende periode. Echter, het kan dat het effect van de crisis ook op de lange termijn van invloed is op de
De inkomensdata waar in dit onderzoek mee wordt gewerkt heeft betrekking op het factor huishoudelijk inkomen. Dit inkomen bestaat uit inkomen gegenereerd uit arbeid, onroerend goed en kapitaal. Enkele
componenten van het factorinkomen zijn daarom: arbeidsloon, huur, dividend en interest. Het is belangrijk dat een inkomensmaat wordt gekozen waarbij het dividend ook van toepassing is, omdat bij zowel de internet-‐ als kredietcrisis er grote verliezen in de aandelenportefeuille zijn gemaakt. Het factor
huishoudelijke inkomen is bruto. Hier is voor gekozen omdat met behulp van dit bruto-‐inkomen de ongelijkheid in inkomen beter aantoonbaar is dan bij een netto-‐inkomen (Dastrup et al., 2005).
De LIS staat niet toe dat de microdata wordt gekopieerd of gedistribueerd. Echter, de LIS heeft eigen programma “Lissy” met een
ingebouwde Stata-‐operator. In dit programma kunnen waarnemingen uit de microdata worden gewist en vervolgens kunnen de overgebleven waarnemingen worden opgedeeld in groepen. Het programma Lissy staat wel toe dat de grenzen van deze groepen worden weergegeven, zodat het ook mogelijk is om met
behulp van andere programmatuur de gegroepeerde inkomensdata te onderzoeken.
In dit onderzoek worden een aantal waarnemingen uit het factor-‐ inkomen gewist, met als reden dat de allerlaagste en -‐hoogste inkomens de inkomensongelijkheid te sterk beïnvloeden. Allereerst worden alle jaarinkomens kleiner dan 500$ uit de data gewist. Daarna worden zowel de 2,5% laagste als hoogste inkomens uit de data verwijderd. Vervolgens wordt de overgebleven data in zowel tien als dertig groepen onderverdeeld, met in iedere groep een gelijk aantal waarnemingen. Met behulp van de tien inkomensgroepen worden voor elke periode histogrammen opgesteld met daarin de beschouwde
verdelingen. Deze histogrammen dienen alleen ter illustratie over hoe het inkomen is verdeeld en geven slechts een indicatie over de efficiëntie van de beschouwde verdelingen om de inkomensdata te fitten. Vervolgens worden met de dertig inkomensgroepen de berekeningen uitgevoerd om vervolgens daarop een conclusie te baseren.
Toepassing theorie
In dit onderzoek worden de berekeningen uitgevoerd met behulp van Matlab. Zo worden de parameters van de verdelingen geschat door de negatieve log-‐
likelihood functie −𝑙(𝜃) te minimaliseren. Aangezien de 30 groepen waarmee
wordt gewerkt een gelijk aantal observaties bevat, is 𝑛 voor iedere groep gelijk.
Zodra de geschatte parameters van elke verdeling zijn verkregen kunnen de betrouwbaarheidsintervallen (BI) worden bepaald. Er wordt een
significantie-‐waarde van 𝛼 = 5% gehanteerd. De BI worden bepaald met behulp van de asymptotische-‐verdeling van de maximumlikelihoodschatter. Als de log-‐ likelihoodfunctie juist gespecificeerd is, dan is de maximumlikelihoodschatter consistent, asymptotisch efficiënt en asymptotisch normaal verdeeld. Er geldt:
𝑛 𝜃!"− 𝜃! ~ 𝑁 0, 𝔗!!!
waarin 𝔗! de asymptotische Informatiematrix geëvalueerd in 𝜃!, ofwel 𝔗! = lim!→! !!𝔗!(𝜃!) . Waarin geldt dat
𝔗! 𝜃! = 𝐸 𝜕𝑙 𝜕𝜃 𝜕𝑙 𝜕𝜃′ = −𝐸 𝜕!𝑙 𝜕𝜃𝜕𝜃! = −𝐻! 𝜃!
de Informatiematrix geëvalueerd in 𝜃 = 𝜃! is voor een steekproefomvang met grootte 𝑛 en 𝐻 gelijk aan de Hessiaanmatrix. Dit betekend dat, asymptotisch, bij benadering het volgende geldt:
𝜃!" ≈ 𝑁 𝜃!, 𝔗!!! 𝜃
!" = 𝑁 𝜃!, −𝐻!!! 𝜃!"
Uit de relatie van een normale-‐ en chi-‐kwadraat verdeling (als 𝓏 ∼ 𝑁 0, 𝑉 dan is 𝓏′𝑉!!𝓏 ∼ 𝜒!(𝑔)) kan worden afgeleid dat het volgende ook bij benadering geldt:
𝑋 = (𝜃!"− 𝜃!)′ −𝐻(𝜃!") (𝜃!"− 𝜃!) ≈ 𝜒!
!,!"(𝑣)
hierbij zijn het aantal vrijheidsgraden 𝑣 gelijk aan het aantal parameters. Met behulp van deze benadering kan een betrouwbaarheidsinterval voor 𝜃! worden opgesteld. Dit betrouwbaarheidsinterval van mogelijke parameterwaarden heeft de vorm van een ellips voor verdelingen met twee parameters. Voor verdelingen met drie parameters heeft dit betrouwbaarheidsinterval de vorm van een
zeppelin.
Nadat de betrouwbaarheidsintervallen voor alle parameters zijn bepaald kunnen vervolgens ook de betrouwbaarheidsintervallen van de
ongelijkheidsmaten geldt het dat de schaalparameters van de verdelingen niet van invloed zijn. Zodoende is slechts één parameter van invloed op de grootte van de inkomensongelijkheidsmaat in het geval deze is berekend met behulp van de Gamma-‐, de lognormale-‐ of de Weibullverdeling. In het geval dat de
inkomensongelijkheidsmaten zijn berekend met behulp van de Singh-‐ Maddalaverdeling zijn slechts twee parameters relevant. De Ginicoëfficiënt, berekend met behulp van data van het netto huishoudelijke inkomen uit de Verenigde Staten, in de periode vanaf 1980 tot en met 2010 is van 0,307 tot 0,380 gestegen (OECD, 2010). Gemiddeld is dit een stijging van 0,00243 per jaar. Een gemiddelde stijging per jaar van de Ginicoëfficiënt boven deze waarde wordt als groot beschouwd en stijging lager dan deze waarde als klein.
Zodra ook de betrouwbaarheidsintervallen voor de
inkomensongelijkheidsmaten zijn berekend is het van belang om een uitspraak te doen over de efficiëntie van de verdelingen om de inkomensdata te fitten. Want in het geval een verdeling niet in staat is om de data goed te fitten, is hiermee ook de bijbehorende inkomensongelijkheidsmaat ongeschikt om een betrouwbare uitspraak te doen over de gesteldheid van de
inkomensongelijkheid. Door middel van het vergelijken van de
maximumlikelihoodwaarde, de SSE, de SAE en de chi-‐kwadraat kan worden bepaald welke verdeling het meest geschikt is om de inkomensgegevens weer te geven. Vervolgens wordt, wanneer nodig, ook een LR-‐test uitgevoerd om de toegevoegde waarde van de opgenomen extra parameter in de SM-‐verdeling ten opzichte van de W-‐verdeling te bepalen. Hiervoor wordt gebruikgemaakt van de chi-‐kwadraat verdeling met één enkele vrijheidsgraad. Zodra de vier verdelingen met elkaar zijn vergeleken wordt bepaald welke verdeling de beste fit oplevert bij de data van ieder jaar. Met behulp van deze verdeling wordt vervolgens een uitspraak gedaan over de grootte van de inkomensongelijkheid van het
desbetreffende jaar.
4. Resultaten
In tabel 2 zijn de algemene gegevens van elk onderzocht jaar weergegeven. Het aantal observaties is per jaar verschillend. Dit betekent dat het noodzakelijk is
om de relatieve Theil-‐index, variërend van 0 tot 1, te bepalen om hiermee een uitspraak te doen over een eventuele toe-‐ of afname van de
inkomensongelijkheid. Naast het aantal observaties per jaar worden ook het gemiddelde jaarinkomen en het hoogste inkomen weergegeven. Deze inkomens worden beide weergeven in termen van de Amerikaanse dollar. Ook is een Theil-‐ index bepaald met behulp van de micro-‐data van de LIS en het programma Stata. Omdat deze Theil-‐index is berekend met de micro-‐data van de LIS, voorafgaand aan het schatten van een verdeling, geeft deze al een goede indicatie van hoe de inkomens zijn verdeeld. Deze Theil-‐index wordt de werkelijke Theil-‐index genoemd.
Tabel 2 -‐ Gegevens factor inkomen van het huishouden in de VS Jaar Observaties Gemiddelde
($) Maximum ($) Werkelijke Theil Relatieve Theil 2000 65475 52354,66 196000 0,2498 0,0225 2004 62613 56831,19 207595 0,2558 0,0232 2007 62439 64257,30 231800 0,2526 0,0229 2010 60259 64129,28 242000 0,2739 0,0249
Het valt op dat de gemiddelde-‐ en maximale inkomens door de loop van de jaren toenemen. Alleen het gemiddeld inkomen in het jaar 2010 is ten opzichte van het jaar 2007 iets afgenomen. Deze daling van het gemiddeld inkomen samen met de toename van het maximale inkomen bevestigd het vermoeden van een
toenemende inkomensongelijkheid. Voordat wordt onderzocht welke van de verschillende verdelingen de beste fit oplevert met de gegroepeerde
inkomensdata kan al een uitspraak worden gedaan over de
inkomensongelijkheid in termen van de relatieve Theil-‐index. Uit de tabel blijkt dat van de periode 2000 naar 2004 een lichte stijging waarneembaar is van 0,0232 − 0,0225 = 0,0007. Deze stijging van de inkomensongelijkheid is niet overeenkomstig met de verwachting dat de ongelijkheid juist afneemt na de internetcrisis. Deze afname werd verwacht, omdat het vooral de top van de inkomens waren die veel geld verloren toen de “internetzeepbel” barstte. De
(lichte) stijging van de ongelijkheid kan het resultaat zijn van de economisch zeer gunstige periode voorafgaand aan het barsten van de zeepbel, waarin de top van de inkomens juist een nog groter kapitaal hebben verworven toen de IT-‐ gerelateerde aandelenkoersen gigantisch stegen.
De stijging van de relatieve Theil-‐index is bijna drie keer zo groot rondom de periode van de kredietcrisis. Deze is gestegen met 0,0249 − 0,0229 = 0,0020. Deze bevindingen dragen bij aan de verwachting dat de inkomensongelijkheid sterk is toegenomen na de kredietcrisis. Dit werd verwacht omdat na deze crisis, in tegenstelling tot de internetcrisis, de slachtoffers vooral de mensen met een lager inkomen waren.
Om een beter idee te krijgen over hoe het inkomen in elke periode is verdeeld worden voor elk jaar de inkomensdata onderverdeeld in tien groepen met elk een gelijk aantal observaties. Met behulp van deze tien groepen wordt voor elke periode een histogram van het inkomen weergegeven. In de
histogrammen worden ook de verdelingen met hun geschatte parameters weergegeven.
Uit de bovenstaande histogrammen blijkt het dat de lognormale verdeling er niet in slaagt om de lagere inkomens, rond de 25000, goed weer te geven. De andere verdelingen lijken op het eerste gezicht een goede fit op te leveren met de
inkomensdata. Het valt op dat de Weibull-‐ en de Singh-‐Maddalaverdeling vrijwel gelijk lopen. Dit kan betekenen dat er geen significant verschil waarneembaar is tussen de efficiëntie van deze verdelingen om de inkomensdata te fitten.
Aangezien de Weibullverdeling een geneste verdeling is van de Singh-‐
Maddalaverdeling kan dit mogelijk betekenen dat de extra parameter van de Singh-‐Maddalaverdeling geen toegevoegde waarde heeft, als het om het schatten van een inkomensverdeling gaat. Om dit beter te onderzoeken worden de
inkomensdata nu niet in tien groepen onderverdeeld, maar in dertig groepen, met elk een gelijk aantal observaties. Vervolgens wordt de log-‐likelihood gemaximaliseerd. In tabel 3 wordt, voor iedere verdeling in elke periode, het betrouwbaarheidsinterval van de geschatte parameters weergegeven. Er is een significantie-‐waarde van 𝛼 = 5% gehanteerd.
De schaalparameter van de SM-‐verdeling, gedefinieerd als 𝑞 in tabel 1, is in tabel 3 weergegeven in de vijfde kolom. We weten dat de Weibull-‐ en de SM-‐ verdeling overeenkomen wanneer 𝑞 → ∞ (zie verdelingsboom, figuur 1). Deze hoge schaalparameter kan een indicatie zijn dat de extra parameter in de SM-‐ verdeling, ten opzichte van de Weibull verdeling, geen toegevoegde waarde heeft. Voor de schaalparameter van de SM-‐verdeling is, in tegen stelling tot alle andere parameters, alleen de puntschatter weergegeven. Voor deze parameter is
geen betrouwbaarheidsinterval bepaald, omdat deze parameter geen invloed heeft op de grootte van de inkomensongelijkheidsmaat.
Tabel 3 – Betrouwbaarheidsintervallen Gemiddelde en Parameters
Jaar Model BI Parameters
Gam (1,684 – 1,718) (30409,928 – 31136,988) -‐ 2000 Logn (10,550 – 10,561) (0,879 – 0,888) -‐ Wbl (56995,090 – 57655,003) (1,392 – 1,409) -‐ SM (1078,070 – 3020,714) (1,309 – 1,490) 13317085,369 Gam (1,635 – 1,669) (33967,470 – 34801,489) -‐ 2004 Logn (10,621 – 10,633) (0,897 – 0,906) -‐ Wbl (61663,409 – 62404,742) (1,370 – 1,387) -‐ SM (1021,709 – 2844,985) (1,290 – 1,469) 14941498,537 Gam (1,666 – 1,701) (37663,867 – 38584,733) -‐ 2007 Logn (10,750 – 10,762) (0,881 – 0,890) -‐ Wbl (69825,793 – 70660,260) (1,381 – 1,398) -‐ SM (1258,076 – 3258,076) (1,305 – 1,477) 18174224,750 Gam (1,519 – 1,551) (41181,608 – 42222,456) -‐ 2010 Logn (10,713 – 10,727) (0,934 – 0,944) -‐ Wbl (68943,488 – 69828,594) (1,310 – 1,326) -‐ SM (1770,269– 3770,269) (1,248 – 1,389) 28385071,971
In tabel 4 zijn voor iedere periode en voor iedere verdeling de bijbehorende betrouwbaarheidsintervallen van de Ginicoëfficiënt, de Theil-‐index en de relatieve Theil-‐index weergegeven. Er is weer een significantie-‐waarde van 𝛼 = 5% gehanteerd.
Tabel 4 – Betrouwbaarheidsintervallen inkomensongelijkheidsmaten
Jaar Model BI Gini BI Theil BI relatieve Theil
Gam (0,401 – 0,404) (0,264 – 0,268) (0,0238 – 0,0242) 2000 Logn (0,466 – 0,470) (0,386 – 0,394) (0,0348 – 0,0355) Wbl (0,389 – 0,392) (0,247 – 0,252) (0,0223 – 0,0227) SM (0,372 – 0,411) (0,226 – 0,278) (0,0204 – 0,0251) Gam (0,406 – 0,409) (0,271 – 0,276) (0,0245 – 0,0250) 2004 Logn (0,474 – 0,478) (0,402 – 0,410) (0,0364 – 0,0371) Wbl (0,393 – 0,397) (0,253 – 0,258) (0,0229 – 0,0234) SM (0,376 – 0,416) (0,231 – 0,285) (0,0209 – 0,0258) Gam (0,402 – 0,406) (0,266 – 0,271) (0,0241 – 0,0245) 2007 Logn (0,467 – 0,471) (0,388 – 0,396) (0,0352 – 0,0359) Wbl (0,391 – 0,395) (0,250 – 0,255) (0,0227 – 0,0231) SM (0,375 – 0,412) (0,229 – 0,280) (0,0207 – 0,0253)
Gam (0,418 – 0,422) (0,289 – 0,294) (0,0263 – 0,0267) 2010 Logn (0,491 – 0,496) (0,437 – 0,446) (0,0397 – 0,0405) Wbl (0,407 – 0,411) (0,272 – 0,278) (0,0247 – 0,0252) SM (0,393 – 0,426) (0,253 – 0,300) (0,0230 – 0,0273)
De resultaten, weergegeven in tabel 4, lijken aan te sluiten bij de beweringen die eerder zijn gedaan. De inkomensongelijkheid, gemeten in de Ginicoëfficiënt en de relatieve Theil-‐index, lijken licht gestegen, in de periode 2004 ten opzichte van 2000. Dit verschijnsel is waar te nemen doordat de puntschatters van zowel de Ginicoëfficiënten als van de relatieve Theil-‐indices, voor elk van de verdelingen is gestegen. De inkomensongelijkheid is meer toegenomen in de periode 2010 ten opzichte van 2007. De puntschatters van de Ginicoëfficiënten en de relatieve Theil-‐indices zijn aanzienlijk groter voor elk van de verdelingen. Ook de betrouwbaarheidsintervallen van de ongelijkheidsmaten, op basis van het 5% significantie-‐level, overlappen elkaar nergens. Er mag
geconcludeerd worden dat de inkomensongelijkheid significant is toegenomen. Om te onderzoeken of er uitspraken mogen worden gedaan met de berekende inkomensongelijkheidsmaten, worden eerst de goodness of fit maten van de beschouwde verdelingen berekend. Zodra deze maten zijn berekend kan worden nagegaan welke verdeling de beste fit oplevert met de inkomensdata. Vervolgens worden de inkomensongelijkheidsmaten die berekend zijn met behulp van deze meest geschikte verdeling als relevant beschouwd.
De goodness of fit maten worden in tabel 5 weergegeven.
De hoogte van de log-‐likelihood geeft een indicatie van welke verdeling voor welke periode het meest geschikt is om de inkomensdata te fitten. Voor elk van de perioden is de log-‐likelihood van de Weibullverdeling het hoogste (ook voor de periode 2007, echter door afronding van de log-‐likelihood waarde in tabel 5 komt deze overeen met die van de Singh-‐Maddalaverdeling). Dit betekent dat de Weibullverdeling, volgens de waarden van de log-‐likelihood, voor elk van de perioden het meest geschikt is. De definitie van de SSE, de SAE en de chi-‐ kwadraat toets zegt dat hoe lager de uitkomst, hoe geschikter een verdeling is om de data te fitten. Voor de perioden 2004, 2007 en 2010 lijken deze waarden dezelfde indicatie te geven als de log-‐likelihood waarde, want al deze waarden zijn voor de Weibullverdeling het laagste (door afronding in tabel 5 komen de
waarden in sommige gevallen overeen met de waarden van de Singh-‐ Maddalaverdeling, echter zijn de werkelijke waarden lager voor de Weibullverdeling).
Tabel 5 -‐ Goodness of fit
Jaar Model Log-‐L SSE SAE Chi^2
Gam -‐223621 0,00043 0,09149 864 2000 Logn -‐228150 0,00282 0,24238 8355 Wbl -‐223184 0,00024 0,06992 503 SM -‐223185 0,00024 0,06978 500 Gam -‐214194 0,00069 0,11795 1300 2004 Logn -‐218727 0,00314 0,25870 8736 Wbl -‐213755 0,00049 0,08684 995 SM -‐213756 0,00049 0,08692 998 Gam -‐213349 0,00041 0,08210 765 2007 Logn -‐217524 0,00252 0,22783 7550 Wbl -‐212974 0,00029 0,07442 571 SM -‐212974 0,00029 0,07444 572 Gam -‐206008 0,00053 0,09779 989 2010 Logn -‐210280 0,00280 0,24690 7710 Wbl -‐205681 0,00042 0,08385 808 SM -‐205682 0,00042 0,08385 808
In de periode 2000 gebeurt iets merkwaardigs, want de uitkomsten van de log-‐ likelihood en de SSE, de SAE en de chi-‐kwadraat toets spreken elkaar tegen. Volgens de log-‐likelihood waarde is de Weibullverdeling het meest geschikt om de inkomensdata te fitten, maar de andere goodness of fit waarden geven een indicatie dat de Singh-‐Maddalaverdeling een betere keuze is. Echter, het verschil in de waarden is verwaarloosbaar. Verder blijkt uit tabel 5 dat de lognormale verdeling er het minst in slaagt om de inkomensdata te fitten. Dit blijkt uit de lage log-‐likelihood waarde en juist de hoge waarden van de SSE, de SAE en de chi-‐kwadraat toets.
Het is opvallend dat de Singh-‐Maddalaverdeling een minder goede keuze blijkt te zijn dan de Weibullverdeling. Dit spreekt tegen met de theorie dat een verdeling waaruit een andere verdeling genest is, een op zijn minst even goede fit moet geven als de geneste verdeling. De Singh-‐Maddalaverdeling moet daarom een op zijn minst even goede fit op kunnen leveren als de
Weibullverdeling. De verklaring waarom dit niet het geval is ligt in de
schaalparameter 𝑞. Zodra de log-‐likelihood wordt gemaximaliseerd wordt ook de schaalparameter 𝑞 geschat. Echter, aangezien de Weibullverdeling een betere fit oplevert dan de Singh-‐Maddalaverdeling, kan worden aangenomen dat de Singh-‐ Maddalaverdeling pas een even goede fit geeft zodra de parameter 𝑞 naar
oneindig gaat. De puntschatter van parameter 𝑞 wordt in de vijfde kolom van tabel 3 weergegeven. Het verschil tussen de efficiëntie van de Weibull-‐ en de Singh-‐Maddalaverdeling om de inkomensdata te fitten, zoals blijkt uit tabel 5, is echter verwaarloosbaar. Er wordt geconcludeerd dat de Weibullverdeling de beste keuze is om de inkomensdata, uit de Verenigde Staten in de hier
onderzochte perioden, weer te geven. Daarom worden ook de inkomensongelijkheidsmaten die berekend zijn met behulp van de Weibullverdeling als relevant beschouwd in dit onderzoek.
In tabel 6 worden de betrouwbaarheidsintervallen van de relevante inkomensongelijkheidsmaten overzichtelijk weergegeven.
Tabel 6 – Inkomensongelijkheidsmaten
Jaar Gini Wbl Theil Wbl Rel. Theil Wbl 2000 (0,389 – 0,392) (0,247 – 0,252) (0,0223 – 0,0227) 2004 (0,393 – 0,397) (0,253 – 0,258) (0,0229 – 0,0234) 2007 (0,391 – 0,395) (0,250 – 0,255) (0,0227 – 0,0231) 2010 (0,407 – 0,411) (0,272 – 0,278) (0,0247 – 0,0252)
Het blijkt dat voor iedere periode de werkelijke Theil-‐index, weergegeven in tabel 2, in het met de Weibullverdeling geschatte betrouwbaarheidsinterval van de Theil-‐index valt. Dit geldt hiermee ook voor de werkelijke relatieve Theil-‐ index. Ook dit is een bewijs dat de Weibullverdeling een goede keuze is om de inkomensdata van de Verenigde-‐Staten in deze perioden weer te geven. Om een uitspraak te doen over hoe de inkomensongelijkheid na een periode van crisis is veranderd (constant gebleven, toe-‐ of afname), worden de relevante
Ginicoëfficiënten en de relevante relatieve Theil-‐indices met elkaar vergeleken. Het blijkt dat de betrouwbaarheidsintervallen van de ongelijkheidsmaten, van de periode voorafgaand en aansluitend aan een crisis, in beide gevallen elkaar niet overlappen. Daarom kan geconcludeerd worden dat de inkomensongelijkheid,
gemeten in termen van de Ginicoëfficiënt en de relatieve Theil-‐index, zowel na de internetcrisis als na de kredietcrisis is gestegen. Om de stijging van de
inkomensongelijkheidsmaten te kwantificeren, wordt per periode uitgegaan van het gemiddelde van het betrouwbaarheidsinterval. Deze gemiddelden worden in tabel 7 weergegeven.
Tabel 7 – Gemiddelde inkomensongelijkheidsmaten
Jaar Gini Wbl Theil Wbl Rel. Theil Wbl
2000 0,391 0,250 0,0225
2004 0,395 0,256 0,0232
2007 0,393 0,253 0,0229
2010 0,409 0,275 0,0250
Wat opvalt aan de Theil-‐indices is dat deze voor de perioden 2000, 2004 en 2007 (na afronding) overeenkomen met de Theil-‐indices die berekend zijn met behulp van de micro-‐data. Voor de periode 2010 is de Theil-‐index slechts 0,001 hoger dan de Theil-‐index die berekend is met behulp van de micro-‐data. Het blijkt dat de Ginicoëfficiënt in de periode na de internetcrisis, gemeten in 2004, met 0,004 is gestegen in vergelijking tot het jaar 2000. Dit is een gemiddelde stijging van 0,001 per jaar. In dit onderzoek wordt een gemiddelde stijging van 0,00243 per jaar (OECD, 2010) als normaal beschouwd. De stijging van de Ginicoëfficiënt die zich voor heeft gedaan na de internet crisis wordt daarom als laag beschouwd. Ook de relatieve Theil-‐index uit 2004 is toegenomen, namelijk met 0,0007 ten opzichte van 2000.
Na de kredietcrisis is de ongelijkheid aanzienlijk meer toegenomen. Het verschil tussen de waarde van de Ginicoëfficiënt uit 2007 en deze coëfficiënt gemeten in 2010 is 0,016. Dit is gemiddelde een stijging van meer dan 0,005 per jaar. Deze gemiddelde stijging is meer dan twee keer zo groot als de in dit
onderzoek gehanteerde normale gemiddelde stijging van 0,00243. Ook de relatieve Theil-‐index blijkt significant gestegen, namelijk met 0,0021. Per jaar kan men uitgaan van een gemiddelde stijging van 0,0007. Deze gemiddelde jaarlijkse stijging is in vergelijking tot de gemiddelde jaarlijkse stijging na de internetcrisis vier keer zo groot.
5. Conclusie
In dit onderzoek is de invloed van een financiële crisis op de inkomensverdeling en de inkomensongelijkheid onderzocht. Hierin stonden de internetcrisis van 2001 en de kredietcrisis uit 2008 centraal. Uit dit onderzoek is gebleken dat zowel na de periode van de internetcrisis als na de kredietcrisis een significante stijging van inkomensongelijkheid is opgetreden. De inkomensdata, afkomstig van de LIS, had betrekking op het factor inkomen van een ruime steekproef (voor elke waargenomen periode groter dan 60000 observaties) uit de Verenigde Staten. Er zijn vier verdelingen in beschouwing genomen om de
inkomensgegevens weer te geven. Deze verdelingen waren: de Gamma-‐, de lognormale-‐, de Weibull-‐ en de Singh-‐Maddalaverdeling. Het is gebleken dat de Weibullverdeling voor iedere periode de beste fit oplevert met de inkomensdata. De Weibullverdeling is een geneste verdeling van de Singh-‐Maddalaverdeling. Het is opmerkelijk dat de extra parameter van de Singh-‐Maddalaverdeling geen toegevoegde waarde heeft in het fitten van de inkomensdata uit de Verenigde Staten in de beschouwde perioden.
Om een uitspraak te doen over hoe de inkomensongelijkheid verandert na een periode van crisis, zijn de Ginicoëfficiënten en de Theil-‐indices van de
beschouwde verdelingen berekend. Vervolgens zijn de conclusies onderbouwd met behulp van de ongelijkheidsmaten die zijn berekend met behulp van de Weibullverdeling, omdat deze verdeling de beste fit opleverde met de
inkomensdata. Ook zijn Theil-‐indices bepaald voor elke beschouwde periode met behulp van de microdata van het factorinkomen van de LIS. Deze Theil-‐indices kwamen vrijwel exact overeen met de berekende Theil-‐indices van de
Weibullverdeling. Deze overeenkomst tussen de Theil-‐indices draagt bij aan de conclusie dat de Weibullverdeling inderdaad de best mogelijke fit oplevert met de beschouwde inkomensdata.
Het is gebleken dat de inkomensongelijkheid, na de internetcrisis en gemeten in 2004, slechts licht is toegenomen. Deze lichte stijging is lager dan de gemiddelde stijging (die is berekend over de periode 1980-‐2010) en
vermoedelijk niet het gevolg van de internetcrisis, maar slechts een effect van economische groei en –ontwikkeling. Het is goed mogelijk dat de