• No results found

Inkomensongelijkheid in de Verenigde Staten : is er een significante verandering van de inkomensongelijkheid in de Verenigde Staten en hoe blijkt dit uit verschillende ongelijkheidsmaten?

N/A
N/A
Protected

Academic year: 2021

Share "Inkomensongelijkheid in de Verenigde Staten : is er een significante verandering van de inkomensongelijkheid in de Verenigde Staten en hoe blijkt dit uit verschillende ongelijkheidsmaten?"

Copied!
32
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Faculteit Economie en Bedrijfskunde

Bachelorscriptie Econometrie

Inkomensongelijkheid in de Verenigde Staten

Is er een significante verandering van de inkomensongelijkheid in de Verenigde Staten en

hoe blijkt dit uit verschillende ongelijkheidsmaten?

22 december 2015

Door:

Matthijs Bootsman

10631372

(2)

Inhoudsopgave

1 Inleiding 1

2 Mogelijke ongelijkheidsmaten en benaderende kansverdelingen 4

2.1 Ongelijkheidsmaten... 4 2.2 Inkomensverdelingen en schattingsmethode... 7 3 Onderzoeksopzet 10 3.1 Selectie kansverdeling ... 10 3.2 Ongelijkheidsmaten... 11 3.3 De data...12 4 Resultaten en analyse 14 4.1 Geschatte inkomensverdelingen... 14 4.2 Ongelijkheidsmaten... 17 5 Conclusie 22 Bibliografie 24 Appendix 26 A Maximumlikelihood schattingsresultaten ... 26 B Toetsingsgrootheden likelihoodratiotest ... 28

(3)

1

1. Inleiding

Ongelijkheid in welvaart en inkomen tussen verschillende bevolkingsgroepen is een

terugkerend discussiepunt in de Nederlandse politiek. De grootste politieke partijen nemen een duidelijk standpunt in met betrekking tot maatregelen om de welvaart in Nederland te herverdelen, wat in verkiezingstijd leidt tot verhitte debatten over bijvoorbeeld

lastenverlichting voor werkenden. Eind 2014 laaide de discussie opnieuw op naar aanleiding van het bezoek van econoom en schrijver Tomas Piketty aan de Tweede Kamer

(Klompenhouwer, 2014). Piketty beschrijft in zijn boek Kapitaal in de 21ste eeuw hoe de ongelijkheid tussen rijk en arm toeneemt als gevolg van het verschil tussen de groei van de gehele economie enerzijds en het rendement op vermogen anderzijds. Hij toont in zijn boek vooral simpele maatstaven van ongelijkheid, zoals het percentage van het totale inkomen dat de rijkste tien procent van de bevolking verdient. Deze maat laat een sterke stijging zien vanaf het einde van de Tweede Wereldoorlog tot nu. De significantie van deze groei in ongelijkheid is echter lastig te bepalen, omdat er voor onderzoeken naar ongelijkheid vooral gebruik wordt gemaakt van data uit een steekproef. Hierbij wordt de inkomensdata van de rijkste 10 procent voor een groot deel geschat, omdat waarnemingen van deze inkomensgroep lastig te

verkrijgen zijn (Piketty, 2013). Er zijn echter ook andere, meer gecompliceerde maten om ongelijkheid te meten. Deze maatstaven maken gebruik van informatie uit de gehele

inkomensverdeling, en niet alleen van het inkomen van de bovenste tien of zelfs één procent. Een van deze maatstaven om ongelijkheid te meten, is de veelgebruikte

Ginicoëfficiënt. Deze maatstaf is opgesteld door de Italiaanse statisticus Corrado Gini (1912) en bepaalt de inkomensongelijkheid in een land door gebruik te maken van een met

parameters geschatte inkomensverdeling . Enkele empirische onderzoeken, zoals dat van Bandourian, McDonald en Turley (2002) en Dastrup, Hartshorn en McDonald (2005),

beschrijven de ongelijkheid van de geschatte inkomensverdeling van een land met behulp van de Ginicoëfficiënt. Vervolgens beschrijven Bandourian et al. (2002) en Dastrup et al. (2005) de verandering van de ongelijkheid in de tijd, door de verschillende waarden van de

Ginicoëfficiënt met elkaar te vergelijken. In deze vergelijking wordt geen rekening gehouden met de eventuele onnauwkeurigheid van de schattingen, waardoor de onderzoekers hun uitspraken baseren op een vergelijking van puntschatters. Zonder het opstellen van een

(4)

2

betrouwbaarheidsinterval voor de schatters kan er echter niet worden bepaald of de verandering van de inkomensongelijkheid in een land daadwerkelijk significant is.

Daarnaast is het in de meeste empirische onderzoeken naar inkomensongelijkheid de gewoonte om voorafgaand aan het onderzoek te kiezen welke ongelijkheidsmaat er wordt gebruikt. Het Nederlandse Centraal Bureau voor de Statistiek (2014) rapporteert naast de Ginicoëfficiënt onder andere ook de Theilindex in zijn publicaties. Onderzoeken van Deininger en Squire (1996), Bandourian et al. (2002) en Dastrup et al. (2005) kiezen daarentegen op voorhand slechts één ongelijkheidsmaat. De keuze voor een bepaalde ongelijkheidsmaat brengt echter een bepaalde mate van subjectiviteit met zich mee en zorgt ervoor dat er impliciet aannames moeten worden gemaakt. Deze aannames zijn niet altijd wenselijk en kunnen van invloed zijn op de uitkomst van het onderzoek (Jenkins, 1991, p.19).

Om hoofd te bieden aan de hierboven genoemde problemen, wordt er in dit

dataonderzoek gebruikgemaakt van meerdere ongelijkheidsmaten. Hierbij staat het onderzoek naar de verandering van inkomensongelijkheid in de Verenigde Staten centraal, waarbij er uitspraken worden gedaan over de significantie van deze veranderingen in verschillende ongelijkheidsmaten. Het uiteindelijke doel van dit onderzoek is dan ook om de verandering van de inkomensongelijkheid te onderzoeken, uitgedrukt in verschillende ongelijkheidsmaten, en de oorzaken van eventuele verschillen te analyseren. Om uitspraken te kunnen doen over de significantie van deze veranderingen worden er betrouwbaarheidsintervallen opgesteld van de gekozen ongelijkheidsmaten. Een betrouwbare methode om de ongelijkheidsmaten en hun betrouwbaarheidsintervallen te bepalen, is door de inkomensdata te benaderen met een reeds bestaande kansverdeling. De parameters van deze kansverdeling worden geschat met behulp van de maximumlikelihood schattingsmethode . Vervolgens kunnen verschillende kansverdelingen tegen elkaar worden getoetst met behulp van de gevonden maximale likelihoodwaarde.

De opbouw van dit is onderzoek is als volgt. Allereerst wordt er in het volgende hoofdstuk een overzicht gepresenteerd van de mogelijke ongelijkheidsmaten en

kansverdelingen. Hierbij is er vooral voortgebouwd op eerder empirisch onderzoek en de conclusies daarvan. In Hoofdstuk 3 volgt vervolgens de onderzoeksopzet. Hierin is de volledige methodiek toegelicht en worden de gebruikte ongelijkheidsmaten beschreven en gedefinieerd.

(5)

3

Daarnaast vermeldt dit hoofdstuk ook welke data er is gebruikt en worden er verschillende kenmerken van de data besproken. Vervolgens worden de resultaten van het onderzoek gepresenteerd in Hoofdstuk 4. In dit hoofdstuk worden deze resultaten ook toegelicht en geanalyseerd, door onder andere gebruik te maken van beschrijvende statistiek van de dataset. Tot slot worden de conclusies van het onderzoek besproken in Hoofdstuk 5. Na Hoofdstuk 5 volgt de Appendix, met daarin uitgebreidere resultaten van onder andere de schattingsmethoden en de toetsingsprocedure voor de te kiezen kansverdeling.

(6)

4

2. Mogelijke ongelijkheidsmaten en benaderende kansverdelingen

In dit hoofdstuk worden de eigenschappen van enkele ongelijkheidsmaten besproken, alsmede hun zinvolheid met betrekking tot de inkomensongelijkheid. Hierbij wordt er ook gelet op de keuzes van andere onderzoekers in eerdere empirische onderzoeken. Vervolgens worden er enkele kansverdelingen besproken die mogelijk geschikt zijn voor het benaderen van

inkomensdata. Tot slot wordt de schattingsmethode binnen de reeds gekozen kansverdeling besproken en worden de belangrijkste resultaten uit het theoretisch kader samengevat, alvorens de onderzoeksopzet volgt in Hoofdstuk 3.

2.1 Ongelijkheidsmaten

Veruit de meest gebruikte ongelijkheidsmaat met betrekking tot het inkomen is de Ginicoëfficiënt. Jenkins (1991) beschrijft hoe deze coëfficiënt nauw verbonden is met de Lorenzcurve en een waarde heeft die ligt tussen de 0 en de 1. De Lorenzcurve illustreert het verband tussen het cumulatieve percentage van inkomensontvangers en het cumulatieve inkomen dat zij ontvangen. De Ginicoëfficient meet hoeveel de Lorenzcurve afwijkt van een inkomensverdeling met perfecte inkomensgelijkheid, en wordt het beste geïllustreerd door onderstaande figuur .

(7)

5

V geeft de oppervlakte aan van het gebied tussen de lijn van perfecte gelijkheid en de werkelijke Lorenzcurve. B staat voor de oppervlakte van het gebied onder de werkelijke Lorenzcure. De Ginicoëfficiënt kan worden berekend met

, maar een algemenere

formule van de Ginicoëfficiënt is

∫ ∫| | (Cowell, 2000).

De Ginicoëfficiënt is door zijn definitie gevoelig voor inkomensverschillen rond het midden van de inkomensverdeling en varieert minder onder veranderingen in de staarten van de inkomensverdeling (Maasoumi, 1997). De Maio (2007) stelt dat dit niet per se een nadeel hoeft te zijn van het gebruik van de Ginicoëfficiënt, omdat het grootste deel van de

huishoudens ongeveer een modaal inkomen heeft, en zij zich dus juist in het midden van de verdeling bevinden. Een nadeel van de Ginicoëfficiënt is echter wel dat deze niet uniek is voor een bepaalde vorm van ongelijkheid (De Maio, 2007). Beschouw bijvoorbeeld twee populaties: in populatie één verdeelt de rijkste helft van de bevolking al het inkomen onderling op een gelijke manier en ontvangt de armste helft van de bevolking niets. In populatie twee verdelen de armste 75% van de bevolking 25% van het inkomen en wordt de overige 75% gelijk verdeeld over de rijkste 25% van de bevolking. De ongelijkheid in deze populaties is niet hetzelfde, maar toch resulteren beide gevallen in een Ginicoëfficiënt van 0,5.

Een groep ongelijkheidsmaten die wel uniek is voor de inkomensverdeling, is de Generalized Entropy (GE) Index. Daarnaast geldt voor de GE-maatstaven dat het mogelijk is om een gevoeligheidsparameter te kiezen, die bepaalt op welk deel van de inkomensverdeling de nadruk wordt gelegd bij het bepalen van de ongelijkheid (De Maio, 2007). De algemene formule voor de maatstaven is:

{

∫ (

)

∫ (

) (

)

met ∫ het αe moment (Cowell, 2000, p.23-24).

Hierbij kan de gevoeligheidsparameter α zo worden gekozen dat de ongelijkheidsmaat gevoeliger is voor een grotere ongelijkheid in de linker- dan wel rechterstaart van de

(8)

6

inkomensverdeling. Hierbij geldt dat hoe positiever α is, hoe gevoeliger GE(α) is voor ongelijkheden in de rechterstaart van de inkomensverdeling (De Maio, 2007). De speciale gevallen waarin α gelijk is aan nul of één staan ook wel bekend als de ‘mean log deviation’ (MLD) voor α = 0 en Theil’s (T) index voor α = 1 (Theil, 1967). De uitkomst van de

ongelijkheidsmaat voor α = 2 is gelijk aan de helft van de ‘coefficient of variation’ in het kwadraat (Cowell, 2000).

Mussard et al. (2003) noemen als ander voordeel van het gebruik van

ongelijkheidsmaten uit de GE-familie, dat het mogelijk is om de ongelijkheidsmaat op te splitsen naar bijdrage. In het bijzonder is het mogelijk om de totaal gemeten ongelijkheid te splitsen naar ongelijkheid gemeten tussen verschillende inkomensgroepen (bijvoorbeeld tussen de decielen uit een Lorenzcurve) en ongelijkheid gemeten binnen de verschillende inkomensgroepen (in eerder genoemd voorbeeld zal dit de ongelijkheid zijn binnen een bepaald deciel uit de Lorenzcurve) (Mussard et al., 2003). Op deze manier geldt dat

.

Evenals de Ginicoëfficiënt zijn de ongelijkheidsmaten uit de GE-familie invariant voor schaling (Maasoumi, 1997). Deze invariantie heeft als voordeel dat het voor de

ongelijkheidsmaat niet uitmaakt of het inkomen in dollars, euro’s of in eurocenten wordt gemeten. Het is evident dat deze eigenschap gerechtvaardigd is voor een maat van inkomensongelijkheid.

Verwant aan de GE-familie is de Atkinsonindex. Deze index maakt gebruik van een parameter ε, die de mate van ongelijkheidsaversie aangeeft. Waar de Theilindex afkomstig is uit de informatietheorie (Maasoumi, 1997), vloeit de Atkinsonindex voort uit welvaartfuncties. De Atkinsonindex heeft de volgende formule:

[∫

] (Cowell,

2000). Deze formule lijkt sterk op die van de algeme GE-index met α≠{0,1} en deze indices hebben dan ook dezelfde vorm als geldt dat α = 1 – ε. Hierbij is ε opnieuw een

gevoeligheidsparameter, ook wel omschreven als de mate van ongelijkheidsaversie. Bij een hoge aversie van ongelijkheid, en dus een hoge ε, is de index gevoeliger voor de positie van de lagere inkomensgroepen (De Maio, 2007). De Atkinsonindex is een specifiek geval binnen de GE-familie en is daarom ook invariant voor schaling (Cowell, 2000).

(9)

7 2.2 Inkomensverdelingen en schattingsmethode

De hierboven genoemde ongelijkheidsmaten maken zonder uitzondering gebruik van informatie uit een inkomensverdeling. Deze inkomensverdeling is niet bekend, maar kan worden geschat op basis van beschikbare inkomensdata. Hierbij kan er gebruik worden gemaakt van steekproefmomenten, maar kan ook de inkomensverdeling als geheel worden benaderd door een reeds bekende kansverdeling. Bij kleinere steekproeven is de

laatstgenoemde methode betrouwbaarder dan het gebruik van steekproefmomenten. Om deze reden wordt in dit onderzoek de inkomensverdeling benaderd door een bekende

kansverdeling, waarbij de parameters van de kansverdeling worden geschat met behulp van de maximumlikelihood schattingsmethode. Dit kan voor meerdere kansverdelingen worden gedaan, waarna vervolgens de meest geschikte kansverdeling kan worden gekozen.

In dit onderzoek wordt de inkomensdata benaderd door meerdere geneste

verdelingen. Dit houdt in dat de ene verdeling een speciaal geval is van de andere verdeling, bijvoorbeeld door een parameterrestrictie. Deze restrictie kan vervolgens getoetst worden, waarbij er wordt bepaald of een extra parameter een significant betere beschrijving van de data geeft. Onder andere Bandourian et al. (2002) en Dastrup et al. (2005) gebruiken deze methode. Zij maken hierbij gebruik van de ‘Generalized Beta’ (GB) familie van kansverdelingen. McDonald en Xu (1995) hebben de eigenschappen van deze familie uitgewerkt, en

concluderen dat deze familie zich goed leent voor het benaderen van inkomensverdelingen. Onderdeel van deze familie is ook de GB2-verdeling. McDonald (1984) concludeert eerder al dat de GB2-verdeling uit deze familie het meest geschikt is om een inkomensverdeling te benaderen. Deze conclusie is later empirisch bevestigd door Majumdar en Chakravarty (1990). Om deze reden worden in dit onderzoek de kansverdelingen uit de GB2-subfamilie geschat. De algemene formule voor de GB2-subfamilie volgt hieronder en is afkomstig uit McDonald en Xu (1995, p.4). In Figuur 2 is te zien hoe de verschillende kansverdelingen binnen de gehele GB-familie genest zijn, waarbij voor dit onderzoek vooral de GB2-subGB-familie aan de rechterkant van de figuur van belang is.

| |

(10)

8

Figuur 2. Verschillende verdelingen binnen de GB-familie

Bron: Bandourian et al.(2002)

Uit bovenstaande figuur blijkt dat onder andere de Singh-Maddala- en de

Dagumverdeling, twee verdelingen die eerder door Singh en Maddala (1976) en Dagum (1977) zijn aangedragen als geschikte verdelingen om inkomensverdelingen te benaderen, onderdeel zijn van de GB2-subfamilie. Deze gerestricteerde verdelingen kunnen daarom worden getoetst tegen de GB2-verdeling. De parameterrestricties van deze verdelingen kunnen worden

getoetst met behulp van de likelihoodratiotest, zoals McDonald (1984, p. 659) dat doet. De toetsingsgrootheid [ ( ) ( )] volgt dan de Chi-kwadraatverdeling met evenzoveel vrijheidsgraden als het verschil in parameters tussen de ongerestricteerde

verdeling met en de gerestricteerde verdeling met . De likelihoodratiotest tussen de GB2-verdeling en de Dagumverdeling volgt bijvoorbeeld een Chi-kwadraatverdeling met één vrijheidsgraad.

Voordat de likelihoodratiotest kan worden uitgevoerd, dienen eerst de parameters van de betreffende kansverdelingen te worden geschat. Schatten met de maximumlikelihood-methode levert niet alleen de benodigde parameters, maar maximaliseert ook de likelihood die gebruikt dient te worden in de likelihoodratiotest. Het op deze manier schatten van de parameters van kansverdelingen, zoals Bandourian et al. (2002) en Dastrup et al. (2005) dat

(11)

9

ook doen, ligt dus voor de hand. Hierbij kan worden opgemerkt dat de resultaten van de maximumlikelihood schattingsmethode asymptotisch gelijk zullen zijn aan de resultaten die volgen uit het minimaliseren van het Chi-kwadraatcriterium (Maasoumi, 1997, p. 224). Daarnaast kan op basis van de likelihoodwaarde van een verdeling ook een

betrouwbaarheidsinterval voor de betreffende parameters worden bepaald. Door het verschil tussen de likelihoodwaarde van een set parameters en de maximale likelihoodwaarde met

parameters gelijk te stellen aan een kritieke waarde , kan een set parameters

worden gevonden dat voldoet aan de vergelijking ( ) ( ) .

Hierbij is een vector met parameterwaarden die allen voldoen aan deze vergelijking, met

het aantal vrijheidsgraden gelijk aan de hoeveelheid parameters in . Door vervolgens van

deze vectoren de minimale en de maximale parameterwaarden te nemen, kan een betrouwbaarheidsinterval worden opgesteld voor de betreffende parameters.

Samenvattend volgt er uit de theorie dat het mogelijk is om twee geneste

kansverdelingen tegen elkaar te toetsen door gebruik te maken van de maximumlikelihood-schattingsmethode. Hierbij kan met een eenvoudige verdeling, bijvoorbeeld de

Weibullverdeling, worden gestart en kan er vervolgens worden getoetst of deze verdeling verworpen kan worden ten gunste van een verdeling zonder een betreffende

parameterrestrictie. Dit kan worden herhaald totdat er een kansverdeling is gevonden die significant beter presteert dan alle geneste verdelingen en niet verworpen wordt ten gunste van een verdeling met meer parameters. Deze eenvoudigste acceptabele kansverdeling kan vervolgens worden gebruikt om een scala aan ongelijkheidsmaten (en hun

(12)

10

3. Onderzoeksopzet

In dit hoofdstuk wordt de in dit onderzoek gevolgde methodiek gepresenteerd. Allereerst volgt er een beschrijving van de procedure waarmee uiteindelijk de kansverdeling wordt gekozen die de inkomensdata het beste beschrijft. Hierbij wordt ook de manier waarop de parameters van deze kansverdelingen kunnen worden geschat besproken. Vervolgens worden de in dit onderzoek te gebruiken ongelijkheidsmaten gekozen en gedefinieerd. Tot slot volgt er een beschrijving van de gebruikte inkomensdata en de dataset waaruit deze afkomstig zijn. 3.1 Selectie kansverdeling

Om te beginnen worden de parameters en de maximale likelihoodwaarden van de gehele GB2-subfamilie geschat met behulp van de maximumlikelihood schattingsmethode. Hiertoe worden met behulp van enkele optimalisatie algoritmen in MATLAB de likelihoodfuncties

gemaximaliseerd aan de hand van de beschikbare inkomensdata.

Na de schatting van de parameters en de maximale likelihoodwaarden van de te onderzoeken kansverdelingen, kunnen de likelihoodratiotests worden uitgevoerd. Zo kunnen bijvoorbeeld de parameterrestricties van de kansverdelingen die direct in de GB2-verdeling genest zijn, respectievelijk de Generalized-gammaverdeling ( , de Beta2-verdeling ( , de Singh-Maddalaverdeling ( en de Dagumverdeling ( , worden getoetst tegen de ongerestricteerde GB2-verdeling. De waarde van de toetsingsgrootheid [ ( ) ( )] , volgt in dit geval de Chi-kwadraatverdeling met één

vrijheidsgraad. Hierin is ( ) de logaritme van de maximale likelihoodwaarde van de

GB2-verdeling, zoals die hierboven is bepaald. De waarde van ( ) is hier de logaritme van de maximale likelihoodwaarde van de gerestricteerde verdeling. Als de waarde van de toetsingsgrootheid groter is dan de kritieke waarde , wordt gerestricteerde verdeling

verworpen ten gunste van de ongerestricteerde verdeling, in dit geval de GB2-verdeling. Hierbij is er in dit onderzoek gekozen voor een significantieniveau van α gelijk aan vijf procent. Dit resulteert in een kritieke waarde van 3,841 voor toetsen met één parameterrestrictie.

In het geval dat alle geneste verdelingen worden verworpen, wordt de GB2-verdeling gebruikt om de ongelijkheidsmaten te bepalen. In het geval dat slechts één gerestricteerde verdeling met een parameterrestrictie niet wordt verworpen, wordt deze verdeling verder

(13)

11

getoest tegen zijn geneste verdelingen (zie Figuur 2). In het geval er twee of meer

gerestricteerde kansverdelingen niet worden verworpen, worden deze vergeleken op basis van hun SSE- en SAE-waarde. Vervolgens wordt de best scorende verdeling getoetst tegen zijn geneste verdelingen, die opnieuw volgen uit Figuur 2. Dit proces wordt herhaald totdat er slechts één verdeling uit Figuur 2 over blijft. Het is echter aannemelijk dat, zoals ook blijkt uit de onderzoeken van McDonald (1984) en Majumdar en Chakravarty (1990), de GB2-verdeling veelal significant beter zal presteren dan zijn geneste verdelingen.

3.2 Ongelijkheidsmaten

Vervolgens worden op basis van de gekozen verdelingen verschillende ongelijkheidsmaten berekend, beginnend met de Ginicoëfficiënt. Deze coëfficiënt wordt berekend door gebruik te maken van de formules zoals gegeven in McDonald (1984, p. 4-5).

Naast de Ginicoëfficiënt worden enkele veelgebruikte maatstaven onderzocht die verwant zijn met de Generalized Entropyfamilie. Drie bijzondere gevallen hiervan zijn de GE(0), de GE(1) en de GE(2), respectievelijk de ‘mean log deviation’ (MLD), Theil’s T-index en de helft van de ‘coefficient of variation’(CV) in het kwadraat. Omdat de Atkinsonindex een specifiek geval is die veel lijkt op de hierboven genoemde maatstaven, wordt deze niet in dit onderzoek meegenomen. De formule’s van de overige ongelijkheidsmaten volgen hieronder, en zijn afkomstig uit Cowell (2000, p.23-24). De benodigde momenten van de verschillende verdelingen zijn te vinden in het onderzoek van McDonald(1984, p.4-5)

∫ (

)

∫ (

) (

)

Door de eerder geschatte parameters te laten variëren over hun

betrouwbaarheidsintervallen, kan er voor de bovenstaande ongelijkheidsmaten ook een betrouwbaarheidsinterval worden opgesteld. In dit onderzoek is hierbij gekozen voor een

(14)

12

significantieniveau van vijf procent, wat betekent dat we met

95%-betrouwbaarheidsintervallen te maken hebben. Door vervolgens de intervallen van diezelfde ongelijkheidsmaat door de tijd heen te vergelijken, kan er een conclusie worden getrokken over de verandering van de betreffende ongelijkheidsmaat. Als de opgestelde

betrouwbaarheidsintervallen niet overlappen, is sprake van een significante verandering. Vervolgens is het mogelijk om conclusies te trekken over het verband tussen de veranderingen van de verschillende maatstaven.

3.3 Data

Om de verandering van de inkomensongelijkheid te bepalen, wordt er in dit onderzoek gebruikgemaakt van inkomensdata uit meerdere jaren. Door voor jaartallen te kiezen die niet direct op elkaar volgen is het mogelijk om de langetermijnverandering te onderzoeken. In het bijzonder zal er in dit onderzoek gebruik worden gemaakt van inkomensdata uit 1980, 1990, 2000 en 2010. De data is afkomstig uit de Panel Study of Income Dynamics (PSID). Deze database bevat onder andere data over gezondheid, afkomst en scholing, maar bevat ook voor dit onderzoek relevantere data, zoals inkomen (PSID, z.j.). In de PSID is informatie beschikbaar van zowel individuen als huishoudens, waardoor er gekozen kan worden voor een specifieke vorm van ongelijkheid. In dit onderzoek zal er, in navolging van Bandourian et al. (2002) en Dastrup et al. (2005), worden gekozen voor inkomensdata van huishoudens. Het inkomen wordt hierbij gedefinieerd als het totale inkomen, opgebouwd uit het belastbaar inkomen van zowel de man als de vrouw, voor betaling belasting. Een logische aanname is dat de

ongelijkheid minder hoog zal uitvallen na het betalen van belasting, en dit wordt dan ook bevestigd door Dastrup en al. (2005).

De gebruikte variabele uit de PSID is het Total Family Income, zoals gemeten in de jaren 1980, 1990, 2000 en 2010. Deze variabele bevat voor elk van de jaren meer dan 6500 waarnemingen. Doordat de omvang van de steekproeven niet geheel gelijk zijn, dient er bij het vergelijken van Theil’s T-index gecorrigeerd te worden voor de grootte van de steekproef per jaar (van den Brakel, 2007). Deze correctiefactor is gelijk aan en varieert voor de gebruikte data tussen 8,80 en 9,14.

(15)

13

namelijk verwijderd uit de data, in navolging van Bandourian et al. (2002), Dastrup et al. (2005) en Schluter en Van Garderen (2009). Dit resulteert in het verwijderen van maximaal 87

waarnemingen voor het jaar 2010 en heeft geen grote impact op de steekproefomvang. In het volgende hoofdstuk wordt de inkomensdata benaderd door een reeds bekende kansverdeling met behulp van de maximumlikelihood schattingsmethode. Vervolgens worden enkele ongelijkheidsmaten berekend om zo de ongelijkheid in de Verenigde Staten tussen 1980 en 2010 te kwantificeren.

(16)

14 4. Resultaten en Analyse

In dit hoofdstuk worden de in Hoofdstuk 3 beschreven methoden en toetsen toegepast op Amerikaanse inkomensdata uit 1980, 1990, 2000 en 2010. Allereerst worden de

kansverdelingen uit de GB2-subfamilie geschat met behulp van de maximumlikelihood schattingsmethode. Vervolgens worden deze verdelingen tegen elkaar getoetst in een likelihoodratiotest en wordt op basis hiervan de meest geschikte verdeling per jaar gekozen. Vervolgens worden voor deze verdelingen de verschillende in Hoofdstuk 3 benoemde ongelijkheidsmaten berekend en vergeleken.

4.1 Geschatte inkomensverdelingen Tabel 1. ML-schattingsresultaten 1980 VS 1980 Parameters Likelihood 1 2 3 4 LogLik Weibull 21824,91 1,20 -71923,5 Gamma 1,6 12740,06 -71749,9 Lognormal 9,58 0,89 -71829,2 Gen Gamma 1243,9 2,56 0,57 -71639,6 Beta2 11003951549 1,6 863714,3 -71749,9 Singh-Maddala 38151,55 1,6027 3,1379 -71570,7 Dagum 3,04 25698,31 0,44 -71592,3 GB2 1,79 34914,14 0,85 2,55 -71569,7

Hierboven zijn de geschatte parameters en de maximale likelihoodwaarde voor de verschillende kansverdelingen te vinden. Hierbij zijn de verdelingen gesorteerd op de hoeveelheid parameters. Per groep is de beste verdeling, op basis van de maximale likelihoodwaarde, dikgedrukt weergegeven. Op basis van deze waarde presteert de Weibullverdeling het minst in 1980 , met een maximale likelihoodwaarde van -71923,5. De Singh-Maddalaverdeling, waarin de Weibullverdeling genest is (zie Figuur 2), benadert de data significant beter met een maximale likelihoodwaarde van -71570,7. De toetsingsgrootheid

(17)

15

voor deze twee verdelingen volgt onderaan deze pagina. Ook grafisch is het verschil tussen deze twee verdelingen duidelijk waarneembaar, zoals te zien is in onderstaande figuur.

Figuur 3. Gefitte Weibull en SM-verdeling voor inkomensdata 1980

De Singh-Maddalaverdeling volgt de inkomensdata beter dan de Weibullverdeling, waarbij vooral het gedrag van de verdeling in de rechterstaart interessant is. De

Weibullverdeling gaat hier namelijk snel naar nul, waardoor het de hogere inkomens ‘mist’. De Singh-Maddalaverdeling ligt zowel bij de modale inkomens als in de rechterstaart boven de Weibullverdeling, wat resulteert in een betere fit op basis van de maximumlikelihoodwaarde. De toetsingsgrootheden voor deze en de overige verdelingen staan vermeld in onderstaande tabel.

Tabel 2. Toetsingsgrootheden likelihoodratiotest inkomensdata 1980

LR test 1980 Dagum GenGam SM Beta2 Lognorm Gamma Weibull

Tegen GB2 45,16 139,72 2,04 360,3 518,88 360,32 707,54

Tegen Singh-Maddala X X X X X X 705,5

Tegen Beta2 X X X X X 0,02 X

(18)

16

In Tabel 2 worden de toetsingsgrootheden van de likelihoodratiotest vermeld, indien het mogelijk is om de test uit te voeren. De kruisen in de tabel duiden erop dat de betreffende verdeling in de kolom van de tabel niet genest is in de betreffende verdeling in de rij van de tabel. In het geval van de Weibulverdeling en de Singh-Maddalaverdeling is de

toetsingsgrootheid gelijk aan 705,5, wat veel groter is dan de kritieke waarde = 3,841. De gerestricteerde Weibullverdeling kan daarom, zoals eerder al gested, worden verworpen ten gunste van de ongerestricteerde Singh-Maddalaverdeling.

Om te bepalen welke verdeling het beste gekozen kan worden op basis van de inkomensdata, wordt er gestart met het meest algemene model, namelijk de GB2-verdeling. Vervolgens wordt deze verdeling vergeleken met zijn geneste verdelelingen. Hieruit blijkt dat de Singh-Maddalaverdeling (met een toetsingsgrootheid van 2,04) als enige verdeling niet wordt verworpen ten gunste van de GB2-verdeling. De geneste Weibullverdeling wordt daarnaast wel verworpen ten gunste van de Maddalaverdeling, waardoor de Singh-Maddalaverdeling de eenvoudigste acceptabele kansverdeling is die we kunnen gebruiken voor het bepalen vande ongelijkheidsmaten.

De resultaten voor de overige jaren zijn weergegeven in de onderstaande tabel, waarbij de uiteindelijk gekozen verdeling dik is gedrukt. De uitgebreide resultaten zijn te vinden in de appendix.

Tabel 3. Maximale likelihoodwaarden

Verdeling 1980 1990 2000 2010 Weibull -71923,49 -106090,27 -88264,87 -106608,81 Gamma -71749,88 -105992,85 -88155,36 -106540,92 Lognormal -71829,16 -106346,59 -88127,01 -106879,25 Gen Gamma -71639,58 -105924,83 -87903,94 -106396,96 Beta2 -71749,87 -105992,84 -88155,34 -106540,91 Singh-Maddala -71570,74 -105870,88 -87754,2 -106264,14 Dagum -71592,3 -105899,83 -87733,66 -106242,26 GB2 -71569,72 -105869,14 -87733,66 -106238,06 Hoeveelheid waarnemingen 6604 9306 7362 8820

(19)

17 4.2 Ongelijkheidsmaten

Uit Tabel 3 blijkt dat de eenvoudigste acceptabele verdelingen voor de verschillende jaartallen respectievelijk de Singh-Maddalaverdeling (voor 1980 en 1990), de Dagumverdeling (voor 2000) en de GB2-verdeling (voor 2010) zijn. Omdat deze verdelingen niet hetzelfde zijn voor alle jaren, kunnen de ongelijkheidsmaten niet voor alle jaren onderling worden vergeleken. Voor 1980 en 1990 kunnen de ongelijkheidsmaten, gebaseerd op de Singh-Maddalaverdeling, wel onderling worden vergeleken. Dit gaat echter niet op voor de ongelijkheidsmaten tussen 2000 en 2010, die respectievelijk gebaseerd zijn op de parameters van de Dagumverdeling en de GB2-verdeling. Om deze reden wordt er bij het vergelijken van de ongelijkheidsmaten (en hun betrouwbaarheidsintervallen) vooral gelet op de maten die gebaseerd zijn op de

parameters van de GB2-verdeling. Deze verdeling benadert de data namelijk nooit slechter dan zijn geneste verdelingen, en is in het uiterste geval gelijk aan één van zijn geneste verdelingen (zie de schattingsresultaten voor de GB2-verdeling en de Dagumverdeling in 2000).

Naast de ongelijkheidsmaten voor de GB2-verdeling, zijn ook die van de Weibull-, Dagum- en Singh-Maddalaverdeling opgenomen, waarbij de Weibullverdeling enkel is opgenomen voor vergelijkingsdoeleinden. Voor elk van de vier verdelingen zijn de

ongelijkheidsmaten in de vier jaren berekend. De puntschatters zijn hierbij berekend op basis van de parameters die volgden uit de maximumlikelihood schattingsmethode, en staan recht onder de naam van de betreffende ongelijkheidsmaat weergegeven. Zo is de puntschatter van de Ginicoëfficiënt uit 1980 op basis van de GB2-verdeling gelijk aan 0,412. Links en rechts van de puntschatters staan de grenzen van het betrouwaarheidsinterval weergegeven. Voor bovengenoemde maat respectievelijk 0,336-0,498.

(20)

18

Tabel 4. Ongelijkheidsmaten en hun betrouwbaarheidsintervallen 1980 Verdeling Gini MLD Theil's T GE(2) Wbl 0,434 0,439 0,444 0,408 0,42 0,432 0,311 0,319 0,327 0,34 0,35 0,361 SM 0,402 0,412 0,422 0,314 0,33 0,348 0,273 0,287 0,303 0,329 0,354 0,382 Dagum 0,395 0,415 0,437 0,309 0,348 0,392 0,277 0,308 0,343 0,39 0,457 0,518 GB2 0,336 0,412 0,498 0,208 0,332 0,53 0,187 0,287 0,441 0,209 0,356 0,659 1990 Verdeling Gini MLD Theil's T GE(2) Wbl 0,443 0,448 0,452 0,429 0,44 0,452 0,325 0,333 0,34 0,358 0,369 0,379 SM 0,435 0,443 0,451 0,377 0,393 0,41 0,321 0,335 0,35 0,4 0,448 0,454 Dagum 0,429 0,447 0,466 0,374 0,415 0,459 0,33 0,362 0,397 0,509 0,591 0,669 GB2 0,385 0,441 0,503 0,286 0,395 0,544 0,249 0,335 0,449 0,293 0,431 0,66 2000 Verdeling Gini MLD Theil's T GE(2) Wbl 0,47 0,476 0,481 0,496 0,51 0,524 0,37 0,379 0,388 0,421 0,434 0,448 SM 0,449 0,461 0,474 0,385 0,408 0,433 0,36 0,384 0,412 0,554 0,627 0,719 Dagum 0,444 0,464 0,483 0,382 0,422 0,467 0,372 0,409 0,452 0,758 0,932 1,149 GB2 0,345 0,464 0,62 0,219 0,422 0,833 0,207 0,41 0,935 0,268 0,944 12,65 2010 Verdeling Gini MLD Theil's T GE(2) Wbl 0,476 0,481 0,486 0,511 0,524 0,538 0,38 0,388 0,397 0,435 0,448 0,461 SM 0,461 0,471 0,481 0,427 0,446 0,467 0,37 0,388 0,407 0,503 0,543 0,589 Dagum 0,456 0,475 0,494 0,424 0,468 0,518 0,383 0,42 0,462 0,699 0,838 0,992 GB2 0,39 0,471 0,56 0,297 0,457 0,699 0,262 0,396 0,62 0,335 0,655 2,159

Allereerst blijkt uit Tabel 4 dat, op basis van de GB2-verdeling, geen enkele ongelijk-heidsmaat significant toe- of afneemt tussen 1980 en 2010. Op basis van de GB2-verdeling is er dus geen significante toe- of afname van de inkomensongelijkheid in de Verenigde Staten gevonden. De oorzaak hiervan ligt mogelijk in de grootte van de steekproef van de PSID, waardoor de intervallen van de ongelijkheidsmaten op basis van de GB2-verdeling relatief zeer breed zijn.

De inkomensongelijkheid kan tussen 1980 en 1990 echter ook vergeleken worden op basis van de parameters van de Singh-Maddalaverdeling. Op basis van deze verdeling neemt de inkomensongelijkheid wel degelijk significant toe voor alle ongelijkheidsmaten. Voor de

(21)

19

overige jaren is de Singh-Maddalaverdeling echter verworpen ten gunste van de GB2-verdeling, waardoor de inkomensongelijkheid voor de overige combinaties van jaartallen vergeleken dient te worden op basis van de GB2-verdeling.

Hoewel de verandering niet significant is, nemen (twee later te bespreken

uitzonderingen daargelaten) alle puntschatters op basis van de GB2-verdeling wel degelijk toe in de tijd1. Deze toename is niet lineair tussen de verschillende decennia. De toename van de inkomensongelijkheid is namelijk groter tussen 1980 en 2000 dan tussen 2000 en 2010. (voor bijvoorbeeld de Ginicoëfficiënt gemiddeld 0,0246 per decennium tussen 1980 en 2000 en 0,0053 tussen 2000 en 2010). Dit heeft mogelijk te maken met de sterkte stijgingen van de aandelenkoersen tussen 1981 en 2000, zoals te zien in onderstaande figuur. Deze redenatie is in lijn met die van Piketty (2013), die in zijn boek stelt dat een relatief groot deel van de aandelen in handen is van de rijkste 10 procent van de bevolking, waardoor deze groep meer baat heeft bij een hoog rendement op vermogen dan de rest van de bevolking. De precieze verdeling van de particulieren aandelen en het verloop hiervan in de tijd is te vinden in Figuur 5 en is afkomstig uit The state of working America (2012). In deze figuur is te zien dat

ongeveer 80% van de aandelen in particulier bezit eigendom was van de rijkste 10% van de bevolking. Als door de waardestijging van de aandelen juist deze hoge inkomens

disproportioneel toenemen, kan dit een toename van de inkomensongelijkheid tot gevolg hebben.

Figuur 4. S&P 500, gecorrigeerd voor inflatie

Bron: http://www.multpl.com/inflation-adjusted-s-p-500

1

(22)

20

Figuur 5. Verdeling particuliere aandelen per welvaartsgroep

Bron: Mishel et al. (2012)

Op de stijgende trend van de ongelijkheidsmaten zijn echter twee uitzonderingen. De eerste is de afname van de GE-index met een alpha gelijk aan twee, in de periode van 2000 tot 2010. Voor zowel de Singh-Maddala-, Dagum- als GB2-verdeling neemt deze maat in die periode af. De oorzaak hiervan is mogelijk dat er in het jaar 2000 de inkomens die in de rechterstaart van de inkomensverdeling liggen relatief hoog zijn. De Maio (2007) stelt namelijk dat de GE(2)-maat gevoelig is voor veranderingen in de rechterstaart van de verdeling,

waardoor een relatief grote toename van de hoge inkomens de waarde van deze

ongelijkheidsmaat hoger kan doen uitvallen. De aannemelijkheid van deze redenering wordt ondersteund door de onderstaande tabel.

Tabel 5. Gemiddelde inkomens van bepaalde groepen

Alle inkomens Laagste 5% Hoogste 5%

1980 20393 2033 75434

1990 33552 2609 99397

2000 59536 4300 282731

(23)

21

Het gemiddelde inkomen van de rijkste 5% respondenten uit de dataset van 1990 tot 2000 neemt procentueel inderdaad ongeveer 2 maal harder toe dan het gemiddelde inkomen van alle respondenten (184,5% versus 77,4%), waardoor de GE(2)-maat relatief veel toeneemt. De procentuele toename van het gemiddelde inkomen van de rijkste 5 procent in de periode van 2000 tot 2010 is echter procentueel kleiner dan de toename van het gemiddelde inkomen van alle respondenten in die periode (4,2% versus 10,1%), waardoor de GE(2)-maat mogelijk afneemt. De verklaring van het verschil in toename van de hogere inkomens ligt mogelijk ook in de oplopende aandelenprijzen tussen 1991 en 2000 (zoals te zien in Figuur 4), en de stagnatie hiervan tussen 2001 en 2010.

Een uitzondering op de uitzondering is echter dat de GE(2)-maat niet daalt als deze gebaseerd is op de parameters van de Weibullverdeling. De reden van het ontbreken van deze daling, kan worden afgeleid uit Figuur 3. Hier kon eerder worden geconcludeerd dat de

rechterstaart van de Weibullverdeling snel naar 0 gaat, waardoor een verandering van de inkomens in deze staart niet van grote invloed zal zijn op de parameters van de geschatte verdeling en dus ook niet op de GE(2)-maat.

De tweede uitzondering is de afname van Theil’s T-index in de periode van 2000 tot 2010 voor de GB2 verdeling. Deze afname kan op eenzelfde manier verklaard worden als de afname van de GE(2)-maat in 2010. Theil’s T-index is namelijk gevoelig voor veranderingen in de linkerstaart van de verdeling. In de periode van 2000 tot 2010 daalt het gemiddelde inkomen van de armste 5 procent met 18,7%, terwijl het gemiddelde inkomen van alle respondenten juist met 10,1% toeneemt. De GB2-verdeling heeft significant de beste fit voor de data uit 2010 en zal daarom ook de lage inkomens het beste beschrijven. Mogelijk neemt om deze reden Theil’s T-index wel af voor de parameters van de GB2-verdeling, en gebeurt dit niet voor de overige verdelingen.

(24)

22 5. Conclusie

In dit onderzoek is de inkomensongelijkheid in de Verenigde Staten tussen 1980 en 2010 geanalyseerd voor verschillende ongelijkheidsmaten. Hierbij is er, in tegenstelling tot de onderzoeken van Deininger en Squire (1996), Bandourian et al. (2002) en Dastrup et al. (2005), niet alleen gebruik gemaakt van de Ginicoëfficiënt. Ook de Generalized Entropy Indices voor α gelijk aan 0, 1 en 2 zijn berekend, alsmede betrouwbaarheidsintervallen voor de verschillende ongelijkheidsmaten. De ongelijkheidsmaten en hun intervallen zijn berekend op basis van parameters van een reeds bekende kansverdeling, die werd geselecteerd op basis van zijn maximale likelihoodwaarde.

Voor de jaren 1980 en 1990 is de Singh-Maddalaverdeling de eenvoudigste acceptabele verdeling, omdat deze verdeling niet werd verworpen ten gunste van de GB2-verdeling op basis van de likelihoodratiotest. In het jaar 2000 geldt hetzelfde voor de

Dagumverdeling, en in 2010 werden alle geneste kansverdelingen verworpen ten gunste van de GB2-verdeling.

Tussen 1980 en 1990 wordt er een significante toename van alle ongelijkheidsmaten gevonden op basis van de Singh-Maddalaverdeling. Omdat voor de overige combinaties van jaartallen de gekozen kansverdeling verschillen, zijn de ongelijkheidsmaten vergeleken op basis van de parameters van de GB2-verdeling, omdat deze verdeling de data nooit slechter

beschrijft dan zijn geneste verdelingen. Het vergelijken van de betrouwbaarheidsintervallen van de vier ongelijkheidsmaten resulteert in de conclusie dat de inkomensongelijkheid in de Verenigde Staten tussen 1980 en 2010 niet significant toeneemt. Deze conclusie zou anders zijn geweest als de ongelijkheidsmaten werden vergeleken op basis van de Singh-Maddala- of de Dagumverdeling. Op basis van deze verdelingen is er namelijk wel een significante toename van de inkomensongelijkheid tussen 1980 en 2010 te vinden voor alle gebruikte

ongelijkheidsmaten.

Hoewel deze niet significant is, is er wel een toenemede trend gevonden voor alle onderzochte ongelijkheidsmaten. De grootste toename van de ongelijkheid is hierbij te vinden tussen 1980 en 2000. Deze toename wordt mogelijk verklaard door de sterk stijgende

aandelenkoersen tussen 1981 en 2000..

(25)

23

Theil’s T-index en de GE(2)-maat tussen 2000 en 2010. Deze afname van de GE(2)-maat volgt hierbij zowel op basis van de parameters van de Singh-Maddala- en Dagumverdeling, als voor de GB2-verdeling. Theil’s T-index neemt slechts af als deze maat wordt gebaseerd op de parameters van de GB2-verdeling.

Door de gevoeligheid van de GE(2)-maat voor veranderingen in de rechterstaart van de inkomensverdeling, wordt deze afwijking mogelijk verklaard door de disproportionele

toename van de hogere inkomens in de rechterstaart van de benaderende kansverdelingen. Doordat de rechterstaart van de Weibullverdeling naar nul nadert voor hogere inkomens, is de afwijking in de GE(2)-maat niet waarneembaar als deze gebaseerd is op de parameters van deze verdeling.

Theil’s T-index is gevoeliger voor veranderingen in de linkerstaart van de

inkomensverdeling. De afname van deze maatstaf kan daardoor mogelijk worden verklaard door een disproportionele afname van de lagere inkomens in 2000. Deze verandering is echter alleen waarneembaar als de maatstaf gebaseerd is op de parameters van de GB2-verdelingen, mogelijk doordat deze verdeling de linkerstaart van de werkelijke inkomensverdeling het beste beschrijft.

(26)

24

Bibliografie

Bandourian, R. , J.B. McDonald, and R.S.Turley (2002). A Comparison of Parametric Models of Income Distribution Across Countries and Over Time. Working Paper Brigham Young University.

Centraal Bureau voor de Statistiek. (2014). Inkomensongelijkheid; particuliere huishoudens naar diverse kenmerken. Geraadpleegd op 25 oktober 2015, van

http://statline.cbs.nl/Statweb/publication/?DM=SLNL&PA=71511ned&D1=4-8&D2=a&D3=0&D4=a&HDR=G2,T&STB=G1,G3&VW=T

Cowell, F. A. (2000). Measurement of inequality. In A.B. Atkinson and F.Bourguignon (Eds.).

Handbook of income distribution, Chapter 2, Amsterdam: North Holland.

Dagum, C. (1977). New model of personal income-distribution-specification and estimation.

Economie appliquée, 30(3), 413-437.

Dastrup, S.R., R. Hartshorn, J.B. McDonald (2005). The Impact of Taxes and Transfer Payments on the Distribution of Income: a Parametric Comparison. Luxembourg Income Study Working Paper Series.

Deininger, K., & Squire, L. (1996). A new data set measuring income inequality.The World Bank

Economic Review, 10(3), 565-591.

De Maio, F. G. (2007). Income inequality measures. Journal of epidemiology and community

health, 61(10), 849-852.

Gini, C. (1912). Variabilita’ e mutabilita. Studio Economicogiuridici, Universita di Cagliari. Opnieuw gedrukt in C. Gini (1955), 211-382.

Jenkins, S. (1991). The measurement of income inequality. In L. Osberg (Ed.), Economic

Inequality and Poverty (pp. 4-38). Londen: M.E. Sharpe.

Klompenhouwer, L. (2014, 05 november). Wat vond de Tweede Kamer van het ‘gezond verstand’ van Piketty? Geraadpleegd op 21 november 2015, van

http://www.nrc.nl/nieuws/2014/11/05/meekijken-thomas-piketty-spreekt-met-de-tweede-kamer/

Maasoumi, E. (1997), Empirical Analyses of Inequality and Welfare, in M.H.Pesaran and P.Schmidt (Eds.) Handbook of Applied Econometrics, Chapter 5. Oxford: Blackwell.

(27)

25

Majumder, A., & Chakravarty, S. R. (1990). Distribution of personal income: Development of a new model and its application to US income data.Journal of Applied Econometrics,5(2),

189-196.

McDonald, J. B. (1984). Some generalized functions for the size distribution of income.

Econometrica: Journal of the Econometric Society, 52(3), 647-663. McDonald, J. B., & Xu, Y. J. (1995). A generalization of the beta distribution with applications. Journal of Econometrics, 66(1), 133-152.

Mishel, L., Bivens, J., Gould, E., & Shierholz, H. (2012). The state of working America. Cornell University Press.

Mussard, S., Seyte, F., & Terraza, M. (2003). Decomposition of Gini and the generalized entropy inequality measures. Economics Bulletin, 4(7), 1-6.

Piketty, T. (2013) Kapitaal in de 21ste eeuw. Parijs: Éditions du Seuil.

PSID. (z.j.). The Panel Study of Income Dynamics. Geraadpleegd op 27 oktober 2015, van https://psidonline.isr.umich.edu/.

Schluter, C., & van Garderen, K. J. (2009). Edgeworth expansions and normalizing transforms for inequality measures. Journal of Econometrics, 150(1), 16-29.

Singh, S. K., & Maddala, G. S. (1976). A Function for Size Distribution of Incomes. Econometrica, 44(5), 963-970.

Theil, H. (1967). Economics and information theory (Vol. 7). Amsterdam: North-Holland.

van den Brakel-Hofmans, M. (2007). Meten van inkomensongelijkheid. Geraadpleegd op 20 december 2015, van

(28)

26 Appendix A. Maximumlikelihood schattingsresultaten VS 1980 Parameters Likelihood 1 2 3 4 LogLik Weibull 21824,91 1,20 -71923,49 Gamma 1,6 12740,06 -71749,88 Lognormal 9,58 0,89 -71829,16 Gen Gamma 1243,9 2,56 0,57 -71639,58 Beta2 11003951549 1,6 863714,26 -71749,87 Singh-Maddala 38151,55 1,6027 3,1379 -71570,74 Dagum 3,04 25698,31 0,44 -71592,3 GB2 1,79 34914,14 0,85 2,55 -71569,72 VS 1990 Parameters Likelihood 1 2 3 4 LogLik Weibull 12740,06 1,17 -106090,27 Gamma 1,4 24023,63 -105992,85 Lognormal 10,02 0,99 -106346,59 Gen Gamma 6671,44 1,87 0,68 -105924,83 Beta2 13580488174 1,4 565288,22 -105992,84 Singh-Maddala 73382,87 1,4325 3,5311 -105870,88 Dagum 2,85 43716,46 0,41 -105899,83 GB2 1,64 63530,58 0,83 2,71 -105869,14

(29)

27 VS 2000 Parameters Likelihood 1 2 3 4 LogLik Weibull 61465,29 1,07 -88264,87 Gamma 1,3 457371,81 -88155,36 Lognormal 10,56 0,99 -88127,01 Gen Gamma 1102,61 2,53 0,46 -87903,94 Beta2 16545378848 1,3 361744,53 -88155,34 Singh-Maddala 72107,4 1,59 1,97 -87754,2 Dagum 2,49 62506,72 0,54 -87733,66 GB2 2,5 62367,84 0,54 0,99 -87733,66 VS 2010 Parameters Likelihood 1 2 3 4 LogLik Weibull 67139,49 1,06 -106608,81 Gamma 1,21 54204,33 -106540,92 Lognormal 10,62 1,08 -106879,25 Gen Gamma 10165,93 1,75 0,62 -106396,96 Beta2 20734533405 1,21 382536,67 -106540,91 Singh-Maddala 121594,34 1,38 2,97 -106264,14 Dagum 2,59 80028,69 0,44 -106242,26 GB2 2,16 88183,97 0,54 1,36 -106238,06

(30)

28

B. Toetsingsgrootheden likelihoodratiotest

LR test 1980 Dagum Gen Gam SM Beta2 Lognorm Gamma Weibull

Tegen GB2 45,16 139,72 2,04 360,3 518,88 360,32 707,54

Tegen Singh-Maddala X X X X X X 705,5

Tegen Beta2 X X X X X 0,02 X

Tegen Gen Gamma X X X X 379,16 220,6 567,82

LR test 1990 Dagum Gen Gam SM Beta2 Lognorm Gamma Weibull

tegen GB2 61,38 111,38 3,48 247,4 954,9 247,42 442,26

Tegen Singh-Maddala X X X X X X 438,78

Tegen Beta2 X X X X X 0,02 X

Tegen Gen Gamma X X X X 843,52 136,04 330,88

LR test 2000 Dagum Gen Gam SM Beta2 Lognorm Gamma Weibull

tegen GB2 0 340,56 41,08 843,36 786,7 843,4 1062,42

Tegen Singh-Maddala X X X X X X 1021,34

Tegen Beta2 X X X X X 0,04 X

Tegen Gen Gamma X X X X 446,14 502,84 721,86

LR test 2010 Dagum Gen Gam SM Beta2 Lognorm Gamma Weibull

tegen GB2 8,4 317,8 52,16 605,7 1282,38 605,72 741,5

Tegen Singh-Maddala X X X X X X 689,34

Tegen Beta2 X X X X X 0,02 X

(31)

29

C. Toelichting gebruikte code

De resultaten uit Tabel 1, Tabel 2, Tabel 3, Appendix A en Appendix B zijn verkregen door de likelihihoodfuncties van de betreffende kansverdelingen te maximaliseren. Hiervoor is de negatieve likelihoodfunctie geminimaliseerd door gebruik te maken van de fminsearch-functie. De likelihoodwaarden die hieruit volgen zijn vervolgens gebruikt om de toetsingsgrootheden van de likelihoodratiotest te berekenen via [ ( ) ( )].

De benodigde 9 bestanden om deze waarden uit te rekenen zijn:

 MaximaliserenAlleVerdelingen.m o LikelihoodfunctieBeta2.m o LikelihoodfunctieDagum.m o LikelihoodfunctieGamma.m o LikelihoodfunctieGB2.m o LikelihoodfunctieGenGam.m o LikelihoodfunctieLognormal.m o LikelihoodfunctieSM.m o LikelihoodfunctieWeibull.m

De resultaten uit tabel 4 zijn bepaald via de betrouwbaarheidsintervallen voor de vier verdelingen. Hierbij zijn steeds alleen betrouwbaarheidsintervallen opgesteld van de parameters die geen schaalparameter zijn, en werden de zogenaamde nuisance parameters constant gehouden. De irrevante parameter voor de Weibullverdeling is in dit onderzoek de tweede parameter, en voor de Singh-Maddala-, Dagum- en GB2-verdeling zijn dit

respectievelijk de eerste, tweede en tweede parameter.

Voor de Weibullverdeling is het interval bepaald via de in MATLAB ingebouwde mle-functie. Voor de Singh-Maddala en de Dagumverdeling zijn de tweedimensionale

betrouwbaarheidsintervallen bepaald via de contour-functie in MATLAB, waarbij de parameters die voldoen aan ( ) ( ) het

betrouwbaarheidsinterval vormen. Door vervolgens uit al deze parameterwaarden de minima en maxima te gebruiken voor de ongelijkheidsmaten, wordt er op eenzelfde manier een betrouwbaarheidsinterval opgesteld voor de betreffende ongelijkheidsmaten.

In het geval van de GB2-verdeling is het betrouwbaarheidsinterval echter drie dimensionaal, waardoor er voor deze verdeling slechts een contourplot werd gemaakt van de eerste en de vierde parameter. De derde parameter werd hierbij gevarieerd over een aannemelijke grid,

(32)

30

waarbij er via een while-statement net zo lang contourplots werden gemaakt totdat er geen oplossingen meer waren voor ( ) ( ) .

Omdat de contourplots langs een diagonaal bewegen, worden er voor uiterste waarden van de derde parameter ook uiterste waarden voor de eerste en de vierde parameter gevonden. Zo ligt het maximum van de vierde parameter en het minimum van de eerste parameter bij de maximale waarde voor de derde parameter, en liggen het respectievelijke minimum en maximum van de vierde en eerste parameter bij het minimum van de derde parameter. Door vervolgens deze extreme waarden uit de contouren te halen via de min- en max-functies uit MATLAB, kunnen er betrouwbaarheidsintervallen worden opgesteld voor de

ongelijkheidsmaten. De berekening van de Ginicoëfficiënt maakt voor de GB2-verdeling echter gebruik van een hypergeometrische reeks. Deze functie (hypergeom) is in Matlab zeer traag, en aangeraden wordt daarom om de HypergeometricPFQ-functie in Mathematica te

gebruiken. Voor beide programma’s is code opgenomen in het betreffende script, en bijgevoegd is ook een Mathematica-workbook met berekeningen en resultaten. Samenvattend zijn voor het bepalen van de betrouwbaarheidsintervallen van de ongelijkheidsmaten de volgende bestanden nodig:

 OngelijkheidsmatenWeibull.m  OngelijkheidsmatenSM.m o LikelihoodfunctieSMgek.m  OngelijkheidsmatenDagum.m o LikelihoodfunctieDagumLang.m o pdfvandagum.m  OngelijkheidsmatenGB2.m o LikelihoodfunctieGB2Lang.m o pdfvangb2.m o GinicoëfficiëntenGB2.nb

Voor alle berekeningen is de gebruikte data nodig (in Excelformat). Tot slot worden de gemiddelde inkomens uit Tabel 5 berekend via:

 GemiddeldeInkomensTabel5.m

 DataPSIDCensored4jaartallen.xlsx

Referenties

GERELATEERDE DOCUMENTEN

De Ruimtevaartindustrie is in tegenstelling tot wat (Timmermans, 2016) meedeelde in zijn interview een enorm gereguleerde industrie. Vooral de commerciële ruimtevaartindustrie

Vrijwel alle evolutionisten zijn het er nu over eens dat de verschillende volksgroepen geen afzonderlijke oorsprongen hebben gehad. Dat betekent dat in hun geloofssysteem

inrichtingen, terwijl sommige (o.m. Georgia) bedreigd werden met een algehele overname van het gevangenissysteem door het federale gerechtshof wegens schending van

De benutting van drijfmest N kan bij voldoende klaver op sommige bedrijven mogelijk nog omhoog, door mest nog meer aan te wenden voor de eerste snede(n), mits de voorziening met

Van de naar schatting 419.000 Assyriers wonen er zo'n 110.000 in de Verenigde Staten en Canada, bijna net zoveel als op dit moment in Irak.' De grootste gemeenschap van Assyriers

·schemeren, dat hij vooral bègrip had voor de klachten over de onvoldoend-e sala- riëring der onderwijzers. Op korte ter- mijn zal hij deze kwestie bekijken. Op

Daar moet de pers zich mee bezighouden, en niet alleen maar de emotionele kant van de zaak belichten. We hebben het hier verdorie toch niet

Wat betreft de exportprodukten, zoals tarwe, voergranen, rijst, sojabonen en katoen, staan de Verenigde Staten een vrij handelsbeleid voor, maar dit wil helemaal niet zeggen dat