• No results found

Gevolgen financiele crisis op inkomensverdeling en inkomensongelijkheid

N/A
N/A
Protected

Academic year: 2021

Share "Gevolgen financiele crisis op inkomensverdeling en inkomensongelijkheid"

Copied!
27
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Gevolgen  financiële  crisis  op  inkomensverdeling  en  

inkomensongelijkheid  

 

Beer  Genet  

10643796  

 

23-­‐12-­‐2015  

 

 

Begeleider:  Kees  Jan  van  Garderen  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Faculteit  Economie  en  Bedrijfskunde,  Universiteit  van  Amsterdam   Bachelorscriptie  en  Afstudeerseminar  Econometrie,  2015  

(2)

Inhoudsopgave     1. Introductie  ………  3   2. De  methodiek  ………..  5   i. Crises  ………  5     ii. Inkomensverdelingen  ………  6     iii. Parameterschatting  ……….  8  

iv. Goodness  of  fit  ………  9  

v. Inkomensongelijkheidsmaten  ………..  9  

3. Beschrijving  van  data  en  onderzoeksopzet  ………...  12  

i. Inkomensdata  ………..…  12    

ii. Toepassing  theorie  ………...  14  

4. Resultaten  ………...  15   5. Conclusie  ……….  24   Bibliografie  ……….  26                    

(3)

1.  Introductie    

In  de  hedendaagse  samenleving  is  ieder  zich  bewust  van  het  feit  dat  de  een  meer   verdient  dan  de  ander.  Zo  heeft  vaak  iemand  die  is  afgestudeerd  aan  de  

universiteit  later  ook  een  hoger  inkomen  dan  iemand  die  alleen  zijn  middelbare   school  heeft  afgemaakt  (Satimanon,  2011).  Dit  verschil  in  inkomen  zorgt  voor   inkomensongelijkheid  binnen  de  maatschappij.  De  verschillen  in  inkomen   kunnen  met  behulp  van  een  inkomensverdeling  goed  in  beeld  worden  gebracht.   Zo  heeft  Pareto  (1895)  als  eerste  een  model  voorgesteld  om  met  behulp  van  een   kansdichtheid  de  inkomensverdeling  weer  te  geven.  Er  is  echter  veel  kritiek  op   het  model  van  Pareto.  Een  van  deze  critici  was  Gini.  Hij  was  het  oneens  met  de   bewering  van  Pareto  dat  economische  groei  voor  minder  inkomensongelijkheid   zorgt.  Om  dit  beter  te  onderzoeken  heeft  Gini  (1912)  zelf  een  maatstaf  bedacht   om  de  grootte  van  de  inkomensongelijkheid  weer  te  geven,  de  Ginicoëfficiënt.   Deze  coëfficiënt  wordt  samen  met,  onder  andere,  de  Theil-­‐  en  Atkinson-­‐indices   tot  op  heden  nog  steeds  veel  gebruikt  om  de  inkomensongelijkheid  uit  te   drukken.  

  Naar  aanleiding  van  de  vele  kritiek  op  het  model  van  Pareto  zijn  er  nog   veel  andere  verdelingsfuncties  voorgesteld  om  de  verschillen  in  inkomen  weer  te   geven.  Zo  heeft  Gibrat  (1931)  de  lognormale  verdeling  voorgesteld.  Echter,  het   blijkt  dat  zowel  Pareto  als  Gibrat  er  niet  in  geslaagd  is  om  de  inkomensverdeling   juist  weer  te  geven  omdat  in  beide  gevallen  de  lage  inkomens  onvoldoende   worden  benaderd  (Parker,  1998).  Bandourian,  McDonald  en  Turley  (2002)   hebben  in  vrij  recent  onderzoek  aangetoond  dat  de  Weibull  (twee  parameters),   Dagum  (drie  parameters)  en  de  Generalized  Beta  of  the  second  kind  (vier   parameters)  wel  een  adequate  representatie  van  de  werkelijke  inkomensdata   weergeven.  

  Echter,  volgens  Card  en  DiNardo  (2002,  p.  739)  is  het  opleidingsniveau   niet  de  enige  factor  die  een  rol  speelt  in  de  bepaling  van  het  inkomen.  Zo  spelen   volgens  hun  ook  de  omstandigheden  van  de  financiële  markten,  vraag  naar  en   aanbod  van  arbeidskrachten  en  nieuwe  ontwikkelingen  binnen  de  economie  een   belangrijke  rol.  Een  goed  voorbeeld  hiervan  is  de  periode  1980-­‐1985  waarin  de   inkomensongelijkheid  in  de  Verenigde  Staten  toenam.  De  verklaring  hiervoor  is  

(4)

het  gevolg  van  de  snelle  en  grote  technologische  ontwikkelingen  toentertijd.   Computertechnologie  werd  steeds  belangrijker  waardoor  veel  bedrijven  de   mogelijkheid  kregen  om  hun  winst  te  vergroten,  hetgeen  weer  leidde  tot  hogere   inkomens.  Galbraith  en  Hale  (2004)  zijn  van  mening  dat  ook  de  introductie  van   het  wereldwijde  web,  wat  bijdroeg  aan  de  globalisering  van  de  economie,  grote   gevolgen  heeft  gehad  voor  de  financiële  markten.  De  mogelijkheden  die  het   wereldwijde  web  met  zich  mee  bracht  leken  eindeloos  en  het  creëerde  

vertrouwen  in  de  opkomende  internetsector.  Volgens  Galbraith  en  Hale  was  het   dit  vertrouwen  en  de  vele  nieuwe  beursgenoteerde  informatietechnologie  (IT)   gerelateerde  bedrijven  die  zorgden  voor  overinvesteringen  in  de  IT-­‐sector  op  de   aandelenmarkt.  Dit  is  de  belangrijkste  oorzaak  van  de  internetcrisis  in  2001.  De   internetcrisis  had  een  grote  waardedaling  van  IT-­‐gerelateerde  aandelen  tot   gevolg.  Hierdoor  ontstonden  grote  verliezen  in  de  beleggingsportefeuilles  van   veel  vermogende  mensen.  Ook  de  kredietcrisis  van  2008  had  grote  financiële   gevolgen.  Echter,  bij  deze  crisis  waren  de  slachtoffers  vooral  mindervermogende   mensen  met  een  hypotheekschuld  (Mian  &  Sufi,  2014,  p.  25).  Het  is  hiermee   duidelijk  dat  een  financiële  crisis  een  groot  effect  kan  hebben  op  iemands   vermogen  en  inkomen.  Echter,  hoe  groot  het  effect  is  op  de  grote  schaal  is  nog   steeds  onduidelijk.  Daarom  wordt  in  dit  verslag  onderzocht  of  een  financiële   crisis  een  significante  invloed  heeft  op  de  inkomensverdeling  en  de  

inkomensongelijkheid.  

  In  dit  onderzoek  wordt  aan  de  hand  van  inkomensgegevens  uit  de   Verenigde  Staten  een  juiste  inkomensverdeling  bepaald  voorafgaand  aan  de   internet-­‐  en  aan  de  kredietcrisis.  Vervolgens  wordt  er  onderzocht  of  deze   inkomensverdeling  na  de  desbetreffende  crisis  zichtbare  veranderingen  heeft   ondergaan.  Naast  het  bepalen  van  een  juiste  inkomensverdeling,  wordt  ook   onderzocht  of  de  grootte  van  de  inkomensongelijkheid  constant  blijft,  toe-­‐  of   afneemt  na  een  financiële  crisis.  De  grootte  van  de  inkomensongelijkheid  wordt   bepaald  met  behulp  van  de  Ginicoëfficiënt  en  de  Theil-­‐index.  

  Het  verloop  van  dit  verslag  is  als  volgt  ingedeeld.  In  de  volgende   paragraaf  wordt  relevant  voorafgaand  onderzoek  behandeld  en  toegelicht.   Daarna  wordt  de  opzet  en  de  inhoud  van  dit  onderzoek  besproken.  Vervolgens  

(5)

worden  de  resultaten  hiervan  weergegeven  en  geanalyseerd.  Tot  slot  volgt  de   conclusie.       2.  De  methodiek    

Deze  paragraaf  bestaat  uit  vijf  delen.  Als  eerste  worden  kort  de  perioden  rondom   de  crises  besproken.  Vervolgens  wordt  de  keuze  van  geschikte  verdelingen  om   de  inkomensdata  weer  te  geven  behandeld.  Aansluitend  wordt  toegelicht  hoe  de   parameters  van  de  verdelingen  bepaald  kunnen  worden  met  behulp  van  

maximum  likelihood.  Daarna  worden  enkele  criteria  behandeld  om  de  relevantie   van  de  verdelingen  te  toetsen.  Als  laatste  worden  verschillende  maten  van   inkomensongelijkheid  behandeld.    

Crises  

De  twee  laatste  decennia  jaren  voorafgaand  aan  het  tweede  millennium  waren   vanuit  het  perspectief  van  economische  groei  en  –ontwikkeling  zeer  gunstig  in   vrijwel  alle  markten.  Het  werd  steeds  duidelijker  dat  de  nieuwe  innovaties  op   het  gebied  van  computertechnologie  ongekende  commerciële  mogelijkheden   met  zich  mee  brachten.  Erg  belangrijk  was  de  ontwikkeling  van  het  wereldwijde   web  wat  de  mogelijkheid  tot  het  bereiken  van  miljoenen  potentiele  afnemers  erg   gemakkelijk  maakte  voor  zowel  de  bestaande  multinationals  als  voor  de  

nieuwkomers  op  de  markt.  Ook  veronderstellen  Card  en  DiNardo  (2002)  dat   door  de  technologische  veranderingen  de  vraag  naar  hoog  opgeleide  

werknemers  toenam.  Dit  zorgde  ervoor  dat  ook  het  verschil  in  inkomen  tussen   hoog  en  laag  opgeleide  werknemers  in  de  hele  wereld  toenam.  Deze  

inkomensongelijkheid  bleef  toenemen  in  de  periode  van  1997  tot  begin  2000.   Deze  periode  wordt  ook  wel  de  internetzeepbel  genoemd,  omdat  in  deze  jaren  de   koersen  op  de  aandelenmarkt  gigantisch  stegen  als  gevolg  van  de  groei  in  de   internetsector  (Fiorentini,  2014).  In  2001  bleek  het,  volgens  Goodnight  en  Green   (2010,  p.  127),  onontkoombare  zich  inderdaad  voor  te  doen.  Na  jaren  van  

koersstijgingen  van  vooral  IT-­‐gerelateerde  aandelen  spatte  de  zogenoemde   “zeepbel”  uiteen,  de  aandelenkoersen  daalde  dramatisch.    

(6)

Hier  ging  het  niet  om  een  “internetzeepbel”,  maar  om  een  zogenoemde   “vastgoedzeepbel”.  In  de  jaren  voorafgaand  aan  2008  werden  hypotheken   gebundeld  en  als  pakket  verhandeld  en  verkocht.  Deze  pakketten  kregen  in  de   meeste  gevallen  een  hoge  kredietbeoordeling  (AAA)  van  de  rating  agencies.   Daarom  werden  ze  gezien  als  een  goede  en  waardevaste  investering.  Echter,   deze  pakketten  bleken  bij  lange  na  niet  zo  veilig  te  zijn  als  men  deed  voorkomen.   Het  gevolg,  een  verlies  van  miljarden  (Ferguson,  2011).  Door  dit  verlies  kwamen   veel  financiële  instellingen  in  de  problemen,  het  vertrouwen  in  de  bancaire   wereld  en  het  vertrouwen  tussen  banken  onderling  nam  dramatisch  af.  Dit   resulteerde  uiteindelijk  in  het  faillissement  van  verschillende  banken  en  er   moesten  ingrijpende  voorzorgsmaatregelen  worden  genomen  om  andere  banken   van  hun  ondergang  te  redden.  Al  deze  problemen  en  maatregelen  zorgden  voor   nog  minder  vertrouwen  in  de  toenmalige  financiële  markt  (Mian  &  Sufi,  2014).   Dit  resulteerde  in  het  verlies  van  banen,  daling  van  vastgoedprijzen  en  mensen   bleven  zonder  inkomen  met  hun  hypotheekschuld,  vaak  hoger  dan  de  waarde   van  hun  onroerend  goed,  achter.  Daarom  waren  volgens  Fiorentini  (2014,  p.   129)  de  gevolgen  voor  het  inkomen  die  de  kredietcrisis  met  zich  meebrachten   niet  direct  na  2008  waarneembaar,  maar  deze  volgden  pas  enkele  jaren  later.     De  gevolgen  van  de  kredietcrisis  waren  veel  groter  en  langduriger  dan  de   gevolgen  van  de  internetcrisis.  Dit  komt  vooral  omdat  de  vastgoedmarkt  veel   toegankelijker  is  voor  de  massa  dan  de  aandelenmarkt  (Wisman,  2012,  p.  929).    

Inkomensverdelingen  

Door  de  jaren  heen  zijn  er  vele  verdelingen  voorgesteld  om  het  inkomen  weer  te   geven.  Echter,  niet  al  deze  verdelingen  bleken  een  goede  fit  te  zijn  voor  de  

inkomensgegevens.  Zo  wordt  de  Pareto  verdeling  tegenwoordig  nog  maar  zelden   gebruikt.  Een  aantal  veelgebruikte  verdelingen,  waarvan  in  verschillend  

onderzoek  is  aangetoond  dat  deze  voor  een  goede  weergave  van  de  

inkomensgegevens  zorgen,  zijn  de  Gamma  (G),  de  Weibull  (W)  en  de  Singh-­‐ Maddala  (SM)  verdelingen.  Zo  hebben  Salem  en  Mount  (1974)  onderzocht  hoe  de   G-­‐verdeling  gebruikt  kan  worden  om  de  inkomensgegevens  uit  de  Verenigde   Staten  in  de  periode  1960-­‐1969  te  representeren.  Verder  hebben  Singh  en   Maddala  (1976)  de  SM-­‐verdeling  geïntroduceerd.  Deze  verdeling  blijkt  ook  zeer  

(7)

geschikt  om  de  inkomensgegevens  uit  de  Verenigde  Staten  te  fitten.  Ook  in   recent  onderzoek  worden  deze  verdelingen  nog  steeds  veel  gebruikt.  Zo  hebben   Bandourian  et  al.  (2002)  aangetoond  dat  deze  verdelingen  niet  alleen  voor  de   Verenigde  Staten  geschikt  zijn,  maar  ook  voor  bijvoorbeeld  de  meeste  Europese   landen  en  Australië.  Uit  hun  onderzoek,  waarvoor  zij  inkomensgegevens  uit  de   periode  1967-­‐1997  hebben  gebruikt,  blijkt  het  dat  de  Weibullverdeling,  samen   met  de  Dagum  en  de  Generalized  Beta  of  the  second  kind  (GB2)  de  beste  keuzes   zijn  om  deze  inkomensdata  te  repliceren.  Dastrup  et  al.  (2005)  bevestigen  in  hun   onderzoek  naar  de  bepaling  van  een  juiste  inkomensverdeling  na  aftrek  van   belasting  en  eventuele  overdrachtsbetalingen  met  behulp  van  data  uit  1979-­‐ 2001  de  conclusies  van  Bandourian  et  al..  Uit  het  onderzoek  van  Dastrup  et  al.   blijkt  tevens  dat  de  inkomensongelijkheid  aannemelijk  kleiner  is  wanneer  het   netto-­‐inkomen  wordt  onderzocht  in  plaats  van  het  bruto-­‐inkomen.  Ook  Schluter   en  Van  Garderen  (2009)  hebben  in  nog  recenter  onderzoek,  onder  andere,  de   lognormale-­‐,  de  G-­‐  en  de  SM-­‐verdeling  gekozen  met  data  uit  Ivoorkust.       McDonald  (1984)  heeft  een  verdeling  geïntroduceerd  waarvan  de  drie   verdelingen,  samen  met  de  besproken  verdelingen  zoals  de  Pareto  en  de   lognormale,  speciale  gevallen  zijn.  Deze  verdeling  wordt  de  generalized  beta   (GB)  verdeling  genoemd.  Deze  GB-­‐verdeling  is  gedefinieerd  met  behulp  van  de   volgende  kansdichtheid  functie  (pdf):    

𝐺𝐵 𝑦; 𝑎, 𝑏, 𝑐, 𝑝, 𝑞 =|𝑎|𝑦!"!!(1 − (1 − 𝑐) 𝑦/𝑏 !)!!!

𝑏!"𝐵(𝑝, 𝑞)(1 + 𝑐(𝑦/𝑏)!)!!! , voor  0 < 𝑦! < 𝑏!   = 0,  anders  

met  0 ≤ 𝑐 ≤ 1  en  𝑏, 𝑝, 𝑞 > 0  en  𝐵(𝑝, 𝑞)  gelijk  aan  de  bètafunctie.  Zo  kunnen  de   SM,  G  en  W  verdelingen  worden  verkregen  uit  de  GB  door  middel  van:  

𝑆𝑀 𝑦; 𝑎, 𝑏, 𝑞 = 𝐺𝐵(𝑦; 𝑎, 𝑏, 𝑐 = 1, 𝑝 = 1, 𝑞)   𝐺 𝑦; 𝑏, 𝑝 = 𝐺𝐵(𝑦; 𝑎 = 1, 𝑏, 𝑐 = 1, 𝑝, 𝑞 → ∞)   𝑊 𝑦, 𝑎, 𝑏 = 𝐺𝐵(𝑦; 𝑎, 𝑏, 𝑐 = 1, 𝑝 = 1, 𝑞 → ∞)  

In  figuur  1  is  de  zogenoemde  verdelingsboom  weergegeven.  Met  behulp  van  deze   boom  kan  gemakkelijk  worden  gezien  hoe  een  verdeling  afstamt  van  de  GB-­‐ verdeling.    

(8)

Figuur  1  -­‐  Verdelingsboom  

  Bron:  Dastrup  et  al.,  2005  

 

Het  is  duidelijk  dat  de,  in  dit  onderzoek  beschouwde,  verdelingen  allemaal   afstammen  van  de  GB2  verdeling,  ofwel  het  zijn  speciale  gevallen  van  de  GB2   verdeling.  Dit  worden  ook  wel  geneste  verdelingen  genoemd.  Zo  is  de  W-­‐ verdeling  een  geneste  verdeling  van  de  SM-­‐verdeling.  

 

Parameterschatting  

Elke  verdeling  is  afhankelijk  van  verschillende  parameters.  Zo  is  de  G-­‐verdeling   afhankelijk  van  twee  parameters  en  de  SM-­‐verdeling  afhankelijk  van  drie   parameters.  Zulke  parameters  van  verdelingen  kunnen  worden  geschat  met   behulp  van  maximumlikelihood  (ML).  Wanneer  de  inkomensgegevens  in  

groepen  worden  weergegeven  kan  ML  ook  worden  toegepast  met  behulp  van  de   multinomiallikelihoodfunctie.  Zo  hebben  Bandourian  et  al.  (2002)  in  hun  

onderzoek  de  inkomensgegevens  in  twintig  groepen  onderverdeeld,  met  in  elke   groep  een  gelijk  aantal  waarnemingen.  De  multinomiallikelihoodfunctie  is  als   volgt  gedefinieerd:   𝐿 𝜃 = 𝑁! (𝑝!(𝜃))!! 𝑛!! ! !!!  

met  𝑝! 𝜃 = 𝐹 𝑌!; 𝜃 − 𝐹(𝑌!!!; 𝜃),  waarbij  𝐹()  gelijk  is  aan  de  cumulatieve   kansverdelingsfunctie  (CDF)  van  de  gebruikte  verdeling,  𝜃  een  vector  van  de   parameters,  𝑔  gelijk  aan  het  aantal  verschillende  inkomensgroepen,  𝑛!  gelijk  aan   het  aantal  observaties  binnen  groep  𝑖  en  𝑁!  gelijk  aan  het  totale  aantal  

(9)

observaties.  Vervolgens  kunnen  de  maximumlikelihoodschatters  worden   bepaald  door  het  volgende  te  maximaliseren:  

𝑙 𝜃 = 𝑛 log 𝑝! 𝜃

!

!!!

 

Hierbij  is  𝑛  een  constante  die  gelijk  is  aan  het  totaal  aantal  observaties  gedeeld   door  het  aantal  groepen  (𝑛 = 𝑁/𝑔).  De  termen  die  niet  afhankelijk  zijn  van   parameters  zijn  weggelaten,  omdat  deze  geen  invloed  hebben  bij  de  bepaling  van   de  maximumlikelihoodschatters.    

 

Goodness  of  fit  

Om  te  bepalen  welke  verdeling  het  beste  bij  de  inkomensdata  past  kunnen  een   aantal  maten  worden  berekend.  In  dit  onderzoek  worden  de  sum  of  squared   errors  (SSE),  de  sum  of  absolute  errors  (SAE)  en  de  chi-­‐kwadraat  (  𝜒!)  gebruikt   om  de  juistheid  van  de  verdeling  weer  te  geven.  Deze  worden  gegeven  door:  

𝑆𝑆𝐸 = 𝑛! 𝑁 − 𝑝! 𝜃 ! ! !!! ,   𝑆𝐴𝐸 = 𝑛! 𝑁 − 𝑝! 𝜃 ! !!!  en   𝜒! = 𝑁 𝑛! 𝑁 − 𝑝! 𝜃 ! 𝑝! 𝜃 ! !!!  

Ook  kunnen  geneste  verdelingen  met  elkaar  worden  vergeleken  met  behulp  van   de  Likelihood  Ratio  (LR)  test.  Deze  test  is  als  volgt  gedefinieerd:  

𝐿𝑅 = 2 𝑙 𝜃 − 𝑙 𝜃!    

met  𝑙 𝜃  gelijk  aan  de  log-­‐likelihood  van  de  ongeneste  verdeling  en  𝑙 𝜃!  gelijk   aan  de  log-­‐likelihood  van  de  geneste  verdeling.  Bij  benadering  is  𝐿𝑅  

asymptotisch  verdeeld,  namelijk:  𝐿𝑅  ~  χ!(𝑟).  Hierbij  is  het  aantal   vrijheidsgraden  𝑟  gelijk  aan  het  verschil  in  aantal  parameters  tussen  de   verdelingen  

 

Inkomensongelijkheidsmaten  

Voor  het  meten  van  de  inkomensongelijkheid  wordt  gebruikgemaakt  van  de   Ginicoëfficiënt  (G)  en  de  Theil-­‐index  (T).  Deze  worden  als  volgt  berekend:  

(10)

𝐺 =2𝜇1 𝑥 − 𝑦 𝑓 𝑥 𝑓 𝑦 𝑑𝑥𝑑𝑦 ! ! ! !      𝑇 = 𝑦 𝜇 𝑙𝑛 𝑦 𝜇 ! ! 𝑑𝐹(𝑦)  

met  𝜇  gelijk  aan  het  gemiddelde.  De  Theil-­‐index  is  oorspronkelijk  afkomstig  uit   de  familie  van  de  Generalized  Entropy  (GE)  Indices.  De  GE  wordt  gegeven  door:    

𝐺𝐸 𝛼, 𝐹 = 1 𝛼!− 𝛼 𝑦!𝑑𝐹(𝑦) 𝜇! − 1  voor  𝛼 ≠ {0,1} − ln 𝑦 𝜇 𝑑𝐹 𝑦  voor  𝛼 = 0 𝑦 𝜇 𝑙𝑛 𝑦 𝜇 𝑑𝐹 𝑦  voor  𝛼 = 1  

waarbij  𝛼  een  willekeurige  sensitiviteitsparameter  is  en  𝐹  de  desbetreffende   inkomensverdeling.  Hoe  groter  deze  𝛼,  hoe  gevoeliger  de  index  wordt  voor   veranderingen  in  de  top  van  de  inkomensverdeling  (Schluter  &  Van  Garderen,   2009).  Hierbij  is  de  Theil-­‐index  het  speciale  geval  𝑇 = 𝐺𝐸(1).    

In  tabel  1  worden  de  verschillende  kansdichtheidsfuncties  en  de   bijbehorende  Ginicoëfficiënten  van  vier  verdelingen  weergegeven.    

Tabel  1  -­‐  Kansdichtheidsfuncties  en  Ginicoëfficiënten  

Verdeling   pdf   Gini   Gamma   𝐺 𝑦; 𝑏, 𝑝 = 𝑦!!! 𝑏!Γ(𝑝)exp  (−𝑦/𝑏)   Γ(𝑝 + 1/2) Γ(𝑝 + 1) π   Lognormale   𝐿𝑁 𝑦; 𝜇, 𝜎 = exp − ln 𝑦 − 𝜇 𝜎 2 ! 𝑦𝜎 2𝜋     2 1 2π𝑒 !!!! − 1   Weibull   𝑊 𝑦; 𝑎, 𝑏 = 𝑎 𝑦!!! 𝑏!  exp  (−(𝑦/𝑏)!)   1 − 1 2!/!   Singh-­‐ Maddala   𝑆𝑀 𝑦; 𝑎, 𝑏, 𝑞 = 𝑎 𝑞𝑦!!! 𝑏!(1 + 𝑦/𝑏)!!!   1 − Γ(𝑞)Γ(2𝑞 − 1/𝑎) Γ(𝑞 − 1/𝑎)Γ(2𝑞)   Bron:  Dastrup  et  al.,  2005  

 

Ook  de  Theil-­‐index  kan  voor  elke  verdeling  worden  berekend.  Zo  is  de  Theil-­‐ index  van  de  gamma  functie  gelijk  aan:  

(11)

T = 1

𝑝+𝜓 𝑝 − ln  (𝑝)  

Met  𝜓 𝑝 = !

!"𝑙𝑛 Γ 𝑝 = !!(!)

!(!)  de  digamma  functie  (McDonald  &  Jensen,  1979).  

Het  valt  op  dat  zowel  de  Ginicoëfficiënt  van  de  Gamma-­‐  en  Weibull-­‐  verdeling  en   de  Theil-­‐index  van  de  Gamma-­‐verdeling  slechts  afhankelijk  zijn  van  één  enkele   parameter.  De  andere  parameter  heeft  geen  invloed  op  de  grootte  van  de   coëfficiënt/index  en  kan  hierom  worden  beschouwd  als  een  schaalparameter.   Hetzelfde  geldt  voor  de  weggelaten  parameter  in  de  berekening  van  de  

Ginicoëfficiënt  van  de  Singh-­‐Maddalaverdeling.  

De  Ginicoëfficiënt  is  afgeleid  van  de  Lorenzcurve  (Brakel-­‐Hofmans,  2007,   p.  11).  en  is  de  meest  gebruikte  maat  voor  inkomensongelijkheid.  De  waarde  van   deze  coëfficiënt  ligt  tussen  de  0  en  1,  waarbij  0  correspondeert  met  totale  

gelijkheid  (iedereen  heeft  hetzelfde  inkomen)  en  1  correspondeert  met  totale   ongelijkheid  (één  persoon  heeft  al  het  inkomen).  Deze  coëfficiënt  is  daarom   uiterst  geschikt  voor  het  vergelijken  van  verschillende  perioden.  Een  nadeel  van   de  coëfficiënt  is  dat  deze  gevoelig  is  voor  veranderingen  rondom  de  gemiddelde   inkomens  en  minder  gevoelig  is  voor  de  veranderingen  aan  de  staarten  van  de   inkomensverdeling  (Allison,  1978).  In  dit  onderzoek  kan  dit  nadelige  gevolgen   hebben  omdat  wordt  verwacht  dat  juist  de  lagere  inkomens  na  de  kredietcrisis   en  de  hogere  inkomens  na  de  internetcrisis  de  meeste  veranderingen  

doormaken.  

  De  Theil-­‐index  heeft,  net  als  de  Ginicoëfficiënt,  een  waarde  0  als  iedereen   hetzelfde  inkomen  heeft.  Echter,  bij  totale  inkomensongelijkheid  is  de  waarde   van  de  index  niet  gelijk  aan  1  maar  aan  ln  (𝑛),  waarbij  𝑛  gelijk  is  aan  het  aantal   observaties  in  de  steekproef.  Volgens  Theil  (1967,  p.  92)  is  de  afhankelijkheid   van  𝑛  een  zeer  functionele  eigenschap  omdat  op  deze  manier  de  ongelijkheid  nog   beter  wordt  weergegeven.  Immers,  in  het  geval  dat  de  steekproef  slechts  uit   twee  personen  bestaat  en  één  persoon  bezit  al  het  inkomen  (𝑇 = ln  (2))  is  dit   minder  ongelijk  verdeeld  dan  in  het  geval  van  een  steekproef  van  tien  personen   met  één  persoon  met  al  het  inkomen  (𝑇 = ln  (10)).  Helaas  is  de  afhankelijkheid   van  𝑛  zelf  weer  nadelig  wanneer  sprake  is  van  verschillende  steekproeven  met   een  verschillende  𝑛.  Om  dit  probleem  op  te  lossen,  kan  de  relatieve  Theil-­‐index   worden  berekend.  De  relatieve  Theil-­‐index  is  gelijk  aan  de  Theil-­‐index  gedeeld  

(12)

door  zijn  maximale  waarde  (𝑇/ln  (𝑛)).  Deze  index  varieert  dan,  net  als  de  

Ginicoëfficiënt,  tussen  de  0  en  1  (Brakel-­‐Hofmans,  2007).  Een  andere  eigenschap   van  de  Theil-­‐index  is  dat  deze  sterk  reageert  op  veranderingen  aan  de  top  van  de   inkomensverdeling,  hiermee  is  de  Theil-­‐index  een  goede  aanvulling  op  de  

Ginicoëfficiënt  (Allison,  1978).    

 

3.  Beschrijving  van  data  en  onderzoeksopzet    

In  deze  paragraaf  wordt  stapsgewijs  toegelicht  hoe  dit  onderzoek  wordt  

uitgevoerd.  Als  eerste  worden  de  gebruikte  data  besproken  en  vervolgens  wordt   de  theorie  uit  de  vorige  paragraaf  toegepast  op  de  in  dit  onderzoek  relevante   verdelingen.  Zo  wordt  uitgelegd  hoe  ML  kan  worden  toegepast  en  de  

inkomensongelijkheidsmaten  voor  de  verschillende  verdelingen  worden   gegeven.  

 

Inkomensdata  

De  data  waar  in  dit  onderzoek  mee  wordt  gewerkt  zijn  afkomstig  uit  de  databank   van  de  Luxembourg  Income  Study  (LIS).  De  verzamelde  data  van  LIS  is  cross-­‐ sectioneel  en  bevatten  gegevens  van  de  meeste  westerse  landen.  In  de  LIS-­‐

databank  zijn  gegevens  te  vinden  die  dateren  van  meerdere  decennia  geleden  tot   op  heden.  De  data  van  de  LIS  zijn  verzameld  met  behulp  van  enquêtes.    

  In  dit  empirisch  onderzoek  worden  data  gebruikt  afkomstig  uit  de   Verenigde  Staten  die  zijn  gedateerd  rond  de  perioden  van  de  internet-­‐  en  de   kredietcrisis.  De  beschikbare  datasets  rondom  deze  perioden  dateren  uit  de   jaren  2000,  2004,  2007  en  2010.  Voor  zowel  de  internet-­‐  als  de  kredietcrisis  zijn   er  data  aanwezig  van  het  voorafgaande  jaar  aan  de  crisis,  namelijk  de  jaren  2000   en  2007  respectievelijk.  Er  wordt  verwacht  dat  het  effect  van  een  crisis  niet   direct  aantoonbaar  is.  Daarom  zijn  de  jaren  2004  en  2010  naar  verwachting   geschikt  om  het  effect  van  de  crisissen  te  onderzoeken.  Mogelijk  is  het  effect  van   de  internetcrisis  op  de  inkomensverdeling  in  het  jaar  2004  moeilijker  

waarneembaar  wegens  de  te  grote  tussenliggende  periode.  Echter,  het  kan  dat   het  effect  van  de  crisis  ook  op  de  lange  termijn  van  invloed  is  op  de  

(13)

De  inkomensdata  waar  in  dit  onderzoek  mee  wordt  gewerkt  heeft   betrekking  op  het  factor  huishoudelijk  inkomen.  Dit  inkomen  bestaat  uit   inkomen  gegenereerd  uit  arbeid,  onroerend  goed  en  kapitaal.  Enkele  

componenten  van  het  factorinkomen  zijn  daarom:  arbeidsloon,  huur,  dividend   en  interest.  Het  is  belangrijk  dat  een  inkomensmaat  wordt  gekozen  waarbij  het   dividend  ook  van  toepassing  is,  omdat  bij  zowel  de  internet-­‐  als  kredietcrisis  er   grote  verliezen  in  de  aandelenportefeuille  zijn  gemaakt.  Het  factor  

huishoudelijke  inkomen  is  bruto.  Hier  is  voor  gekozen  omdat  met  behulp  van  dit   bruto-­‐inkomen  de  ongelijkheid  in  inkomen  beter  aantoonbaar  is  dan  bij  een   netto-­‐inkomen  (Dastrup  et  al.,  2005).  

De  LIS  staat  niet  toe  dat  de  microdata  wordt  gekopieerd  of   gedistribueerd.  Echter,  de  LIS  heeft  eigen  programma  “Lissy”  met  een  

ingebouwde  Stata-­‐operator.  In  dit  programma  kunnen  waarnemingen  uit  de   microdata  worden  gewist  en  vervolgens  kunnen  de  overgebleven  waarnemingen   worden  opgedeeld  in  groepen.  Het  programma  Lissy  staat  wel  toe  dat  de  grenzen   van  deze  groepen  worden  weergegeven,  zodat  het  ook  mogelijk  is  om  met  

behulp  van  andere  programmatuur  de  gegroepeerde  inkomensdata  te   onderzoeken.  

In  dit  onderzoek  worden  een  aantal  waarnemingen  uit  het  factor-­‐ inkomen  gewist,  met  als  reden  dat  de  allerlaagste  en  -­‐hoogste  inkomens  de   inkomensongelijkheid  te  sterk  beïnvloeden.  Allereerst  worden  alle  jaarinkomens   kleiner  dan  500$  uit  de  data  gewist.  Daarna  worden  zowel  de  2,5%  laagste  als   hoogste  inkomens  uit  de  data  verwijderd.  Vervolgens  wordt  de  overgebleven   data  in  zowel  tien  als  dertig  groepen  onderverdeeld,  met  in  iedere  groep  een   gelijk  aantal  waarnemingen.  Met  behulp  van  de  tien  inkomensgroepen  worden   voor  elke  periode  histogrammen  opgesteld  met  daarin  de  beschouwde  

verdelingen.  Deze  histogrammen  dienen  alleen  ter  illustratie  over  hoe  het   inkomen  is  verdeeld  en  geven  slechts  een  indicatie  over  de  efficiëntie  van  de   beschouwde  verdelingen  om  de  inkomensdata  te  fitten.  Vervolgens  worden  met   de  dertig  inkomensgroepen  de  berekeningen  uitgevoerd  om  vervolgens  daarop   een  conclusie  te  baseren.  

   

(14)

Toepassing  theorie  

In  dit  onderzoek  worden  de  berekeningen  uitgevoerd  met  behulp  van  Matlab.  Zo   worden  de  parameters  van  de  verdelingen  geschat  door  de  negatieve  log-­‐

likelihood  functie  −𝑙(𝜃)  te  minimaliseren.  Aangezien  de  30  groepen  waarmee  

wordt  gewerkt  een  gelijk  aantal  observaties  bevat,  is  𝑛  voor  iedere  groep  gelijk.  

Zodra  de  geschatte  parameters  van  elke  verdeling  zijn  verkregen  kunnen   de  betrouwbaarheidsintervallen  (BI)  worden  bepaald.  Er  wordt  een  

significantie-­‐waarde  van  𝛼 = 5%  gehanteerd.  De  BI  worden  bepaald  met  behulp   van  de  asymptotische-­‐verdeling  van  de  maximumlikelihoodschatter.  Als  de  log-­‐ likelihoodfunctie  juist  gespecificeerd  is,  dan  is  de  maximumlikelihoodschatter   consistent,  asymptotisch  efficiënt  en  asymptotisch  normaal  verdeeld.  Er  geldt:  

𝑛 𝜃!"− 𝜃!  ~  𝑁 0, 𝔗!!!  

waarin  𝔗!  de  asymptotische  Informatiematrix  geëvalueerd  in  𝜃!,  ofwel   𝔗! = lim!→! !!𝔗!(𝜃!) .  Waarin  geldt  dat  

𝔗! 𝜃! = 𝐸 𝜕𝑙 𝜕𝜃 𝜕𝑙 𝜕𝜃′ = −𝐸 𝜕!𝑙 𝜕𝜃𝜕𝜃! = −𝐻! 𝜃!  

de  Informatiematrix  geëvalueerd  in  𝜃 = 𝜃!  is  voor  een  steekproefomvang  met   grootte  𝑛  en  𝐻  gelijk  aan  de  Hessiaanmatrix.  Dit  betekend  dat,  asymptotisch,  bij   benadering  het  volgende  geldt:  

𝜃!"   ≈ 𝑁 𝜃!, 𝔗!!! 𝜃

!"   = 𝑁 𝜃!, −𝐻!!! 𝜃!"    

Uit  de  relatie  van  een  normale-­‐  en  chi-­‐kwadraat  verdeling  (als  𝓏 ∼ 𝑁 0, 𝑉  dan  is   𝓏′𝑉!!𝓏 ∼ 𝜒!(𝑔))  kan  worden  afgeleid  dat  het  volgende  ook  bij  benadering  geldt:  

𝑋 = (𝜃!"− 𝜃!)′ −𝐻(𝜃!") (𝜃!"− 𝜃!)   ≈   𝜒!

!,!"(𝑣)  

hierbij  zijn  het  aantal  vrijheidsgraden  𝑣  gelijk  aan  het  aantal  parameters.  Met   behulp  van  deze  benadering  kan  een  betrouwbaarheidsinterval  voor  𝜃!  worden   opgesteld.  Dit  betrouwbaarheidsinterval  van  mogelijke  parameterwaarden  heeft   de  vorm  van  een  ellips  voor  verdelingen  met  twee  parameters.  Voor  verdelingen   met  drie  parameters  heeft  dit  betrouwbaarheidsinterval  de  vorm  van  een  

zeppelin.  

Nadat  de  betrouwbaarheidsintervallen  voor  alle  parameters  zijn  bepaald   kunnen  vervolgens  ook  de  betrouwbaarheidsintervallen  van  de    

(15)

ongelijkheidsmaten  geldt  het  dat  de  schaalparameters  van  de  verdelingen  niet   van  invloed  zijn.  Zodoende  is  slechts  één  parameter  van  invloed  op  de  grootte   van  de  inkomensongelijkheidsmaat  in  het  geval  deze  is  berekend  met  behulp  van   de  Gamma-­‐,  de  lognormale-­‐  of  de  Weibullverdeling.  In  het  geval  dat  de  

inkomensongelijkheidsmaten  zijn  berekend  met  behulp  van  de  Singh-­‐ Maddalaverdeling  zijn  slechts  twee  parameters  relevant.  De  Ginicoëfficiënt,   berekend  met  behulp  van  data  van  het  netto  huishoudelijke  inkomen  uit  de   Verenigde  Staten,  in  de  periode  vanaf  1980  tot  en  met  2010  is  van  0,307  tot   0,380  gestegen  (OECD,  2010).  Gemiddeld  is  dit  een  stijging  van  0,00243  per  jaar.   Een  gemiddelde  stijging  per  jaar  van  de  Ginicoëfficiënt  boven  deze  waarde  wordt   als  groot  beschouwd  en  stijging  lager  dan  deze  waarde  als  klein.    

Zodra  ook  de  betrouwbaarheidsintervallen  voor  de  

inkomensongelijkheidsmaten  zijn  berekend  is  het  van  belang  om  een  uitspraak   te  doen  over  de  efficiëntie  van  de  verdelingen  om  de  inkomensdata  te  fitten.   Want  in  het  geval  een  verdeling  niet  in  staat  is  om  de  data  goed  te  fitten,  is   hiermee  ook  de  bijbehorende  inkomensongelijkheidsmaat  ongeschikt  om  een   betrouwbare  uitspraak  te  doen  over  de  gesteldheid  van  de  

inkomensongelijkheid.  Door  middel  van  het  vergelijken  van  de  

maximumlikelihoodwaarde,  de  SSE,  de  SAE  en  de  chi-­‐kwadraat  kan  worden   bepaald  welke  verdeling  het  meest  geschikt  is  om  de  inkomensgegevens  weer  te   geven.  Vervolgens  wordt,  wanneer  nodig,  ook  een  LR-­‐test  uitgevoerd  om  de   toegevoegde  waarde  van  de  opgenomen  extra  parameter  in  de  SM-­‐verdeling  ten   opzichte  van  de  W-­‐verdeling  te  bepalen.  Hiervoor  wordt  gebruikgemaakt  van  de   chi-­‐kwadraat  verdeling  met  één  enkele  vrijheidsgraad.  Zodra  de  vier  verdelingen   met  elkaar  zijn  vergeleken  wordt  bepaald  welke  verdeling  de  beste  fit  oplevert   bij  de  data  van  ieder  jaar.  Met  behulp  van  deze  verdeling  wordt  vervolgens  een   uitspraak  gedaan  over  de  grootte  van  de  inkomensongelijkheid  van  het  

desbetreffende  jaar.    

   

4.  Resultaten    

In  tabel  2  zijn  de  algemene  gegevens  van  elk  onderzocht  jaar  weergegeven.  Het   aantal  observaties  is  per  jaar  verschillend.  Dit  betekent  dat  het  noodzakelijk  is  

(16)

om  de  relatieve  Theil-­‐index,  variërend  van  0  tot  1,  te  bepalen  om  hiermee  een   uitspraak  te  doen  over  een  eventuele  toe-­‐  of  afname  van  de    

inkomensongelijkheid.  Naast  het  aantal  observaties  per  jaar  worden  ook  het   gemiddelde  jaarinkomen  en  het  hoogste  inkomen  weergegeven.  Deze  inkomens   worden  beide  weergeven  in  termen  van  de  Amerikaanse  dollar.  Ook  is  een  Theil-­‐ index  bepaald  met  behulp  van  de  micro-­‐data  van  de  LIS  en  het  programma  Stata.   Omdat  deze  Theil-­‐index  is  berekend  met  de  micro-­‐data  van  de  LIS,  voorafgaand   aan  het  schatten  van  een  verdeling,  geeft  deze  al  een  goede  indicatie  van  hoe  de   inkomens  zijn  verdeeld.  Deze  Theil-­‐index  wordt  de  werkelijke  Theil-­‐index   genoemd.  

 

Tabel  2  -­‐  Gegevens  factor  inkomen  van  het  huishouden  in  de  VS   Jaar   Observaties   Gemiddelde  

($)   Maximum   ($)   Werkelijke   Theil   Relatieve   Theil   2000   65475   52354,66   196000   0,2498   0,0225   2004   62613   56831,19   207595   0,2558   0,0232   2007   62439   64257,30   231800   0,2526   0,0229   2010   60259   64129,28   242000   0,2739   0,0249    

Het  valt  op  dat  de  gemiddelde-­‐  en  maximale  inkomens  door  de  loop  van  de  jaren   toenemen.  Alleen  het  gemiddeld  inkomen  in  het  jaar  2010  is  ten  opzichte  van  het   jaar  2007  iets  afgenomen.  Deze  daling  van  het  gemiddeld  inkomen  samen  met  de   toename  van  het  maximale  inkomen  bevestigd  het  vermoeden  van  een  

toenemende  inkomensongelijkheid.  Voordat  wordt  onderzocht  welke  van  de   verschillende  verdelingen  de  beste  fit  oplevert  met  de  gegroepeerde  

inkomensdata  kan  al  een  uitspraak  worden  gedaan  over  de  

inkomensongelijkheid  in  termen  van  de  relatieve  Theil-­‐index.  Uit  de  tabel  blijkt   dat  van  de  periode  2000  naar  2004  een  lichte  stijging  waarneembaar  is  van   0,0232 − 0,0225 = 0,0007.  Deze  stijging  van  de  inkomensongelijkheid  is  niet   overeenkomstig  met  de  verwachting  dat  de  ongelijkheid  juist  afneemt  na  de   internetcrisis.  Deze  afname  werd  verwacht,  omdat  het  vooral  de  top  van  de   inkomens  waren  die  veel  geld  verloren  toen  de  “internetzeepbel”  barstte.  De  

(17)

(lichte)  stijging  van  de  ongelijkheid  kan  het  resultaat  zijn  van  de  economisch   zeer  gunstige  periode  voorafgaand  aan  het  barsten  van  de  zeepbel,  waarin  de  top   van  de  inkomens  juist  een  nog  groter  kapitaal  hebben  verworven  toen  de  IT-­‐ gerelateerde  aandelenkoersen  gigantisch  stegen.    

De  stijging  van  de  relatieve  Theil-­‐index  is  bijna  drie  keer  zo  groot  rondom   de  periode  van  de  kredietcrisis.  Deze  is  gestegen  met  0,0249 − 0,0229 = 0,0020.   Deze  bevindingen  dragen  bij  aan  de  verwachting  dat  de  inkomensongelijkheid   sterk  is  toegenomen  na  de  kredietcrisis.  Dit  werd  verwacht  omdat  na  deze  crisis,   in  tegenstelling  tot  de  internetcrisis,  de  slachtoffers  vooral  de  mensen  met  een   lager  inkomen  waren.  

  Om  een  beter  idee  te  krijgen  over  hoe  het  inkomen  in  elke  periode  is   verdeeld  worden  voor  elk  jaar  de  inkomensdata  onderverdeeld  in  tien  groepen   met  elk  een  gelijk  aantal  observaties.  Met  behulp  van  deze  tien  groepen  wordt   voor  elke  periode  een  histogram  van  het  inkomen  weergegeven.  In  de  

histogrammen  worden  ook  de  verdelingen  met  hun  geschatte  parameters   weergegeven.  

 

(18)

   

Uit  de  bovenstaande  histogrammen  blijkt  het  dat  de  lognormale  verdeling  er  niet   in  slaagt  om  de  lagere  inkomens,  rond  de  25000,  goed  weer  te  geven.  De  andere   verdelingen  lijken  op  het  eerste  gezicht  een  goede  fit  op  te  leveren  met  de  

inkomensdata.  Het  valt  op  dat  de  Weibull-­‐  en  de  Singh-­‐Maddalaverdeling  vrijwel   gelijk  lopen.  Dit  kan  betekenen  dat  er  geen  significant  verschil  waarneembaar  is   tussen  de  efficiëntie  van  deze  verdelingen  om  de  inkomensdata  te  fitten.  

Aangezien  de  Weibullverdeling  een  geneste  verdeling  is  van  de  Singh-­‐

Maddalaverdeling  kan  dit  mogelijk  betekenen  dat  de  extra  parameter  van  de   Singh-­‐Maddalaverdeling  geen  toegevoegde  waarde  heeft,  als  het  om  het  schatten   van  een  inkomensverdeling  gaat.  Om  dit  beter  te  onderzoeken  worden  de  

inkomensdata  nu  niet  in  tien  groepen  onderverdeeld,  maar  in  dertig  groepen,   met  elk  een  gelijk  aantal  observaties.  Vervolgens  wordt  de  log-­‐likelihood   gemaximaliseerd.  In  tabel  3  wordt,  voor  iedere  verdeling  in  elke  periode,  het   betrouwbaarheidsinterval  van  de  geschatte  parameters  weergegeven.  Er  is  een   significantie-­‐waarde  van  𝛼 = 5%  gehanteerd.  

  De  schaalparameter  van  de  SM-­‐verdeling,  gedefinieerd  als  𝑞  in  tabel  1,  is   in  tabel  3  weergegeven  in  de  vijfde  kolom.  We  weten  dat  de  Weibull-­‐  en  de  SM-­‐ verdeling  overeenkomen  wanneer  𝑞 → ∞    (zie  verdelingsboom,  figuur  1).  Deze   hoge  schaalparameter  kan  een  indicatie  zijn  dat  de  extra  parameter  in  de  SM-­‐ verdeling,  ten  opzichte  van  de  Weibull  verdeling,  geen  toegevoegde  waarde   heeft.  Voor  de  schaalparameter  van  de  SM-­‐verdeling  is,  in  tegen  stelling  tot  alle   andere  parameters,  alleen  de  puntschatter  weergegeven.  Voor  deze  parameter  is  

(19)

geen  betrouwbaarheidsinterval  bepaald,  omdat  deze  parameter  geen  invloed   heeft  op  de  grootte  van  de  inkomensongelijkheidsmaat.    

 

Tabel  3  –  Betrouwbaarheidsintervallen  Gemiddelde  en  Parameters  

Jaar   Model   BI  Parameters  

  Gam   (1,684  –  1,718)   (30409,928  –  31136,988)   -­‐   2000   Logn   (10,550  –  10,561)   (0,879  –  0,888)   -­‐     Wbl   (56995,090  –  57655,003)   (1,392  –  1,409)   -­‐     SM   (1078,070  –  3020,714)   (1,309  –  1,490)   13317085,369     Gam   (1,635  –  1,669)   (33967,470  –  34801,489)   -­‐   2004   Logn   (10,621  –  10,633)   (0,897  –  0,906)   -­‐     Wbl   (61663,409  –  62404,742)   (1,370  –  1,387)   -­‐     SM   (1021,709  –  2844,985)   (1,290  –  1,469)   14941498,537     Gam   (1,666  –  1,701)   (37663,867  –  38584,733)   -­‐   2007   Logn   (10,750  –  10,762)   (0,881  –  0,890)   -­‐     Wbl   (69825,793  –  70660,260)   (1,381  –  1,398)   -­‐     SM   (1258,076  –  3258,076)   (1,305  –  1,477)   18174224,750     Gam   (1,519  –  1,551)   (41181,608  –  42222,456)   -­‐   2010   Logn   (10,713  –  10,727)   (0,934  –  0,944)   -­‐     Wbl   (68943,488  –  69828,594)   (1,310  –  1,326)   -­‐     SM   (1770,269–  3770,269)   (1,248  –  1,389)   28385071,971    

In  tabel  4  zijn  voor  iedere  periode  en  voor  iedere  verdeling  de  bijbehorende   betrouwbaarheidsintervallen  van  de  Ginicoëfficiënt,  de  Theil-­‐index  en  de   relatieve  Theil-­‐index  weergegeven.  Er  is  weer  een  significantie-­‐waarde  van   𝛼 = 5%  gehanteerd.    

 

Tabel  4  –  Betrouwbaarheidsintervallen  inkomensongelijkheidsmaten  

Jaar   Model   BI  Gini   BI  Theil   BI  relatieve  Theil  

  Gam   (0,401  –  0,404)   (0,264  –  0,268)   (0,0238  –  0,0242)   2000   Logn   (0,466  –  0,470)   (0,386  –  0,394)   (0,0348  –  0,0355)     Wbl   (0,389  –  0,392)   (0,247  –  0,252)   (0,0223  –  0,0227)     SM   (0,372  –  0,411)   (0,226  –  0,278)   (0,0204  –  0,0251)     Gam   (0,406  –  0,409)   (0,271  –  0,276)   (0,0245  –  0,0250)   2004   Logn   (0,474  –  0,478)    (0,402  –  0,410)   (0,0364  –  0,0371)     Wbl   (0,393  –  0,397)   (0,253  –  0,258)   (0,0229  –  0,0234)     SM   (0,376  –  0,416)   (0,231  –  0,285)   (0,0209  –  0,0258)     Gam   (0,402  –  0,406)   (0,266  –  0,271)   (0,0241  –  0,0245)   2007   Logn   (0,467  –  0,471)   (0,388  –  0,396)   (0,0352  –  0,0359)     Wbl   (0,391  –  0,395)   (0,250  –  0,255)   (0,0227  –  0,0231)     SM   (0,375  –  0,412)   (0,229  –  0,280)   (0,0207  –  0,0253)  

(20)

  Gam   (0,418  –  0,422)   (0,289  –  0,294)   (0,0263  –  0,0267)   2010   Logn   (0,491  –  0,496)   (0,437  –  0,446)   (0,0397  –  0,0405)     Wbl   (0,407  –  0,411)   (0,272  –  0,278)   (0,0247  –  0,0252)     SM   (0,393  –  0,426)   (0,253  –  0,300)   (0,0230  –  0,0273)    

De  resultaten,  weergegeven  in  tabel  4,  lijken  aan  te  sluiten  bij  de   beweringen  die  eerder  zijn  gedaan.  De  inkomensongelijkheid,  gemeten  in  de   Ginicoëfficiënt  en  de  relatieve  Theil-­‐index,  lijken  licht  gestegen,  in  de  periode   2004  ten  opzichte  van  2000.  Dit  verschijnsel  is  waar  te  nemen  doordat  de   puntschatters  van  zowel  de  Ginicoëfficiënten  als  van  de  relatieve  Theil-­‐indices,   voor  elk  van  de  verdelingen  is  gestegen.  De  inkomensongelijkheid  is  meer   toegenomen  in  de  periode  2010  ten  opzichte  van  2007.  De  puntschatters  van  de   Ginicoëfficiënten  en  de  relatieve  Theil-­‐indices  zijn  aanzienlijk  groter  voor  elk  van   de  verdelingen.  Ook  de  betrouwbaarheidsintervallen  van  de  ongelijkheidsmaten,   op  basis  van  het  5%  significantie-­‐level,  overlappen  elkaar  nergens.  Er  mag  

geconcludeerd  worden  dat  de  inkomensongelijkheid  significant  is  toegenomen.         Om  te  onderzoeken  of  er  uitspraken  mogen  worden  gedaan  met  de   berekende  inkomensongelijkheidsmaten,  worden  eerst  de  goodness  of  fit  maten   van  de  beschouwde  verdelingen  berekend.  Zodra  deze  maten  zijn  berekend  kan   worden  nagegaan  welke  verdeling  de  beste  fit  oplevert  met  de  inkomensdata.   Vervolgens  worden  de  inkomensongelijkheidsmaten  die  berekend  zijn  met   behulp  van  deze  meest  geschikte  verdeling  als  relevant  beschouwd.  

De  goodness  of  fit  maten  worden  in  tabel  5  weergegeven.  

De  hoogte  van  de  log-­‐likelihood  geeft  een  indicatie  van  welke  verdeling   voor  welke  periode  het  meest  geschikt  is  om  de  inkomensdata  te  fitten.  Voor  elk   van  de  perioden  is  de  log-­‐likelihood  van  de  Weibullverdeling  het  hoogste  (ook   voor  de  periode  2007,  echter  door  afronding  van  de  log-­‐likelihood  waarde  in   tabel  5  komt  deze  overeen  met  die  van  de  Singh-­‐Maddalaverdeling).  Dit  betekent   dat  de  Weibullverdeling,  volgens  de  waarden  van  de  log-­‐likelihood,  voor  elk  van   de  perioden  het  meest  geschikt  is.  De  definitie  van  de  SSE,  de  SAE  en  de  chi-­‐ kwadraat  toets  zegt  dat  hoe  lager  de  uitkomst,  hoe  geschikter  een  verdeling  is   om  de  data  te  fitten.  Voor  de  perioden  2004,  2007  en  2010  lijken  deze  waarden   dezelfde  indicatie  te  geven  als  de  log-­‐likelihood  waarde,  want  al  deze  waarden   zijn  voor  de  Weibullverdeling  het  laagste  (door  afronding  in  tabel  5  komen  de  

(21)

waarden  in  sommige  gevallen  overeen  met  de  waarden  van  de  Singh-­‐ Maddalaverdeling,  echter  zijn  de  werkelijke  waarden  lager  voor  de   Weibullverdeling).  

 

Tabel  5  -­‐  Goodness  of  fit  

Jaar   Model   Log-­‐L   SSE   SAE   Chi^2  

  Gam   -­‐223621   0,00043   0,09149   864   2000   Logn   -­‐228150   0,00282   0,24238   8355     Wbl   -­‐223184   0,00024   0,06992   503     SM   -­‐223185   0,00024   0,06978   500     Gam   -­‐214194   0,00069             0,11795           1300   2004   Logn   -­‐218727   0,00314               0,25870             8736     Wbl   -­‐213755   0,00049             0,08684             995     SM   -­‐213756   0,00049   0,08692   998     Gam   -­‐213349   0,00041           0,08210         765   2007   Logn   -­‐217524   0,00252             0,22783               7550     Wbl   -­‐212974   0,00029           0,07442             571     SM   -­‐212974   0,00029   0,07444   572     Gam   -­‐206008   0,00053           0,09779           989   2010   Logn   -­‐210280   0,00280             0,24690             7710     Wbl   -­‐205681   0,00042             0,08385             808     SM   -­‐205682   0,00042   0,08385   808    

In  de  periode  2000  gebeurt  iets  merkwaardigs,  want  de  uitkomsten  van  de  log-­‐ likelihood  en  de  SSE,  de  SAE  en  de  chi-­‐kwadraat  toets  spreken  elkaar  tegen.   Volgens  de  log-­‐likelihood  waarde  is  de  Weibullverdeling  het  meest  geschikt  om   de  inkomensdata  te  fitten,  maar  de  andere  goodness  of  fit  waarden  geven  een   indicatie  dat  de  Singh-­‐Maddalaverdeling  een  betere  keuze  is.  Echter,  het  verschil   in  de  waarden  is  verwaarloosbaar.  Verder  blijkt  uit  tabel  5  dat  de  lognormale   verdeling  er  het  minst  in  slaagt  om  de  inkomensdata  te  fitten.  Dit  blijkt  uit  de   lage  log-­‐likelihood  waarde  en  juist  de  hoge  waarden  van  de  SSE,  de  SAE  en  de   chi-­‐kwadraat  toets.  

Het  is  opvallend  dat  de  Singh-­‐Maddalaverdeling  een  minder  goede  keuze   blijkt  te  zijn  dan  de  Weibullverdeling.  Dit  spreekt  tegen  met  de  theorie  dat  een   verdeling  waaruit  een  andere  verdeling  genest  is,  een  op  zijn  minst  even  goede   fit  moet  geven  als  de  geneste  verdeling.  De  Singh-­‐Maddalaverdeling  moet   daarom  een  op  zijn  minst  even  goede  fit  op  kunnen  leveren  als  de  

(22)

Weibullverdeling.  De  verklaring  waarom  dit  niet  het  geval  is  ligt  in  de  

schaalparameter  𝑞.  Zodra  de  log-­‐likelihood  wordt  gemaximaliseerd  wordt  ook  de   schaalparameter  𝑞  geschat.  Echter,  aangezien  de  Weibullverdeling  een  betere  fit   oplevert  dan  de  Singh-­‐Maddalaverdeling,  kan  worden  aangenomen  dat  de  Singh-­‐ Maddalaverdeling  pas  een  even  goede  fit  geeft  zodra  de  parameter  𝑞  naar  

oneindig  gaat.  De  puntschatter  van  parameter  𝑞  wordt  in  de  vijfde  kolom  van   tabel  3  weergegeven.  Het  verschil  tussen  de  efficiëntie  van  de  Weibull-­‐  en  de   Singh-­‐Maddalaverdeling  om  de  inkomensdata  te  fitten,  zoals  blijkt  uit  tabel  5,  is   echter  verwaarloosbaar.  Er  wordt  geconcludeerd  dat  de  Weibullverdeling  de   beste  keuze  is  om  de  inkomensdata,  uit  de  Verenigde  Staten  in  de  hier  

onderzochte  perioden,  weer  te  geven.  Daarom  worden  ook  de   inkomensongelijkheidsmaten  die  berekend  zijn  met  behulp  van  de   Weibullverdeling  als  relevant  beschouwd  in  dit  onderzoek.  

  In  tabel  6  worden  de  betrouwbaarheidsintervallen  van  de  relevante   inkomensongelijkheidsmaten  overzichtelijk  weergegeven.    

 

Tabel  6  –  Inkomensongelijkheidsmaten  

Jaar   Gini  Wbl    Theil  Wbl    Rel.  Theil  Wbl   2000   (0,389  –  0,392)   (0,247  –  0,252)   (0,0223  –  0,0227)   2004   (0,393  –  0,397)   (0,253  –  0,258)   (0,0229  –  0,0234)   2007   (0,391  –  0,395)   (0,250  –  0,255)   (0,0227  –  0,0231)   2010   (0,407  –  0,411)   (0,272  –  0,278)   (0,0247  –  0,0252)      

Het  blijkt  dat  voor  iedere  periode  de  werkelijke  Theil-­‐index,  weergegeven  in   tabel  2,  in  het  met  de  Weibullverdeling  geschatte  betrouwbaarheidsinterval  van   de  Theil-­‐index  valt.  Dit  geldt  hiermee  ook  voor  de  werkelijke  relatieve  Theil-­‐ index.  Ook  dit  is  een  bewijs  dat  de  Weibullverdeling  een  goede  keuze  is  om  de   inkomensdata  van  de  Verenigde-­‐Staten  in  deze  perioden  weer  te  geven.  Om  een   uitspraak  te  doen  over  hoe  de  inkomensongelijkheid  na  een  periode  van  crisis  is   veranderd  (constant  gebleven,  toe-­‐  of  afname),  worden  de  relevante  

Ginicoëfficiënten  en  de  relevante  relatieve  Theil-­‐indices  met  elkaar  vergeleken.   Het  blijkt  dat  de  betrouwbaarheidsintervallen  van  de  ongelijkheidsmaten,  van  de   periode  voorafgaand  en  aansluitend  aan  een  crisis,  in  beide  gevallen  elkaar  niet   overlappen.  Daarom  kan  geconcludeerd  worden  dat  de  inkomensongelijkheid,  

(23)

gemeten  in  termen  van  de  Ginicoëfficiënt  en  de  relatieve  Theil-­‐index,  zowel  na  de   internetcrisis  als  na  de  kredietcrisis  is  gestegen.  Om  de  stijging  van  de  

inkomensongelijkheidsmaten  te  kwantificeren,  wordt  per  periode  uitgegaan  van   het  gemiddelde  van  het  betrouwbaarheidsinterval.  Deze  gemiddelden  worden  in   tabel  7  weergegeven.  

 

Tabel  7  –  Gemiddelde  inkomensongelijkheidsmaten  

Jaar   Gini  Wbl    Theil  Wbl    Rel.  Theil  Wbl  

2000   0,391   0,250   0,0225  

2004   0,395   0,256   0,0232  

2007   0,393     0,253   0,0229  

2010   0,409   0,275   0,0250  

 

Wat  opvalt  aan  de  Theil-­‐indices  is  dat  deze  voor  de  perioden  2000,  2004  en  2007   (na  afronding)  overeenkomen  met  de  Theil-­‐indices  die  berekend  zijn  met  behulp   van  de  micro-­‐data.  Voor  de  periode  2010  is  de  Theil-­‐index  slechts  0,001  hoger   dan  de  Theil-­‐index  die  berekend  is  met  behulp  van  de  micro-­‐data.  Het  blijkt  dat   de  Ginicoëfficiënt  in  de  periode  na  de  internetcrisis,  gemeten  in  2004,  met  0,004   is  gestegen  in  vergelijking  tot  het  jaar  2000.  Dit  is  een  gemiddelde  stijging  van   0,001  per  jaar.  In  dit  onderzoek  wordt  een  gemiddelde  stijging  van  0,00243  per   jaar  (OECD,  2010)  als  normaal  beschouwd.  De  stijging  van  de  Ginicoëfficiënt  die   zich  voor  heeft  gedaan  na  de  internet  crisis  wordt  daarom  als  laag  beschouwd.   Ook  de  relatieve  Theil-­‐index  uit  2004  is  toegenomen,  namelijk  met  0,0007  ten   opzichte  van  2000.    

Na  de  kredietcrisis  is  de  ongelijkheid  aanzienlijk  meer  toegenomen.  Het   verschil  tussen  de  waarde  van  de  Ginicoëfficiënt  uit  2007  en  deze  coëfficiënt   gemeten  in  2010  is  0,016.  Dit  is  gemiddelde  een  stijging  van  meer  dan  0,005  per   jaar.  Deze  gemiddelde  stijging  is  meer  dan  twee  keer  zo  groot  als  de  in  dit  

onderzoek    gehanteerde  normale  gemiddelde  stijging  van  0,00243.  Ook  de   relatieve  Theil-­‐index  blijkt  significant  gestegen,  namelijk  met  0,0021.  Per  jaar   kan  men  uitgaan  van  een  gemiddelde  stijging  van  0,0007.  Deze  gemiddelde   jaarlijkse  stijging  is  in  vergelijking  tot  de  gemiddelde  jaarlijkse  stijging  na  de   internetcrisis  vier  keer  zo  groot.  

(24)

5.  Conclusie    

In  dit  onderzoek  is  de  invloed  van  een  financiële  crisis  op  de  inkomensverdeling   en  de  inkomensongelijkheid  onderzocht.  Hierin  stonden  de  internetcrisis  van   2001  en  de  kredietcrisis  uit  2008  centraal.  Uit  dit  onderzoek  is  gebleken  dat   zowel  na  de  periode  van  de  internetcrisis  als  na  de  kredietcrisis  een  significante   stijging  van  inkomensongelijkheid  is  opgetreden.  De  inkomensdata,  afkomstig   van  de  LIS,  had  betrekking  op  het  factor  inkomen  van  een  ruime  steekproef  (voor   elke  waargenomen  periode  groter  dan  60000  observaties)  uit  de  Verenigde   Staten.  Er  zijn  vier  verdelingen  in  beschouwing  genomen  om  de  

inkomensgegevens  weer  te  geven.  Deze  verdelingen  waren:  de  Gamma-­‐,  de   lognormale-­‐,  de  Weibull-­‐  en  de  Singh-­‐Maddalaverdeling.  Het  is  gebleken  dat  de   Weibullverdeling  voor  iedere  periode  de  beste  fit  oplevert  met  de  inkomensdata.   De  Weibullverdeling  is  een  geneste  verdeling  van  de  Singh-­‐Maddalaverdeling.   Het  is  opmerkelijk  dat  de  extra  parameter  van  de  Singh-­‐Maddalaverdeling  geen   toegevoegde  waarde  heeft  in  het  fitten  van  de  inkomensdata  uit  de  Verenigde   Staten  in  de  beschouwde  perioden.    

  Om  een  uitspraak  te  doen  over  hoe  de  inkomensongelijkheid  verandert  na   een  periode  van  crisis,  zijn  de  Ginicoëfficiënten  en  de  Theil-­‐indices  van  de  

beschouwde  verdelingen  berekend.  Vervolgens  zijn  de  conclusies  onderbouwd   met  behulp  van  de  ongelijkheidsmaten  die  zijn  berekend  met  behulp  van  de   Weibullverdeling,  omdat  deze  verdeling  de  beste  fit  opleverde  met  de  

inkomensdata.  Ook  zijn  Theil-­‐indices  bepaald  voor  elke  beschouwde  periode  met   behulp  van  de  microdata  van  het  factorinkomen  van  de  LIS.  Deze  Theil-­‐indices   kwamen  vrijwel  exact  overeen  met  de  berekende  Theil-­‐indices  van  de  

Weibullverdeling.  Deze  overeenkomst  tussen  de  Theil-­‐indices  draagt  bij  aan  de   conclusie  dat  de  Weibullverdeling  inderdaad  de  best  mogelijke  fit  oplevert  met   de  beschouwde  inkomensdata.  

  Het  is  gebleken  dat  de  inkomensongelijkheid,  na  de  internetcrisis  en   gemeten  in  2004,  slechts  licht  is  toegenomen.  Deze  lichte  stijging  is  lager  dan  de   gemiddelde  stijging  (die  is  berekend  over  de  periode  1980-­‐2010)  en  

vermoedelijk  niet  het  gevolg  van  de  internetcrisis,  maar  slechts  een  effect  van   economische  groei  en  –ontwikkeling.  Het  is  goed  mogelijk  dat  de  

Referenties

GERELATEERDE DOCUMENTEN

Van eigenzinnig ingenieur naar sociaal econoom: Jan Goudriaan jr. 115

Gezien zijn staat van dienst voor TPEdigitaal en – daar aan voorafgaand – het Tijdschrift voor Politieke Ekonomie achtte de redactie deze benoeming niet meer dan vanzelfsprekend:

In de heterodoxe literatuur wordt de daling van de loonquote in verband gebracht met het verschijnsel financialisering (zie bijvoorbeeld Hein 2013; Stockhammer 2013; Lin

Consumptie en productie zijn dus noodzakelijkerwijs aan elkaar gelijk, ook al omdat binnenlandse goederen niet kunnen worden opgeslagen voor consumptie op een later tijdstip..

Hogere armoedecijfers zijn echter wel gecorreleerd met een hogere mate van solidariteit, wellicht omdat mensen zich bewust zijn van het feit dat armoede negatieve gevolgen kan

De herverdelende werking van de progressieve inkomstenbelasting wordt bovendien teniet gedaan door belastingen op consumptie en ziektekostenpremies, die in de loop der

uurloon verdienen, minder vaak werkloos zijn en vaker participeren op de arbeidsmarkt, zijn de verschillen in opleidingsniveau tussen personen met en zonder migratieachtergrond

Dit resultaat is stabiel met slechts één uitzondering: wanneer de Latijns-Amerikaanse landen worden weggelaten en er gecontroleerd wordt voor welvaart is er geen effect