• No results found

4 Data

4.1 Dataverzameling

De data voor dit kwantitatieve onderzoek bestaat uit data van Amerikaanse ondernemingen voor de fiscale jaren 2010 tot 2018. De financiële gegevens over Amerikaanse ondernemingen komen uit de Compustat database. Tijdens de dataselectie in de Compustat database worden de financiële ondernemingen niet geselecteerd. Data voor de CEO-beloning wordt verkregen uit de Execucomp database waarbij alle data wordt gedownload waarvan de variabele ceoann de naam CEO bevat. De twee databasegegevens worden samengevoegd a.d.h.v. gvkey (company identifier) en fyear (fiscal year).

4.2 Dataselectie

De Execucomp database geeft verschillende componenten van de beloning en andere gegevens weer m.b.t. de CEO, maar ook de CFO. Voor dit onderzoek worden alleen de gegevens gebruikt indien in Execucomp de CEO bekend is. Financiële instellingen (banken, verzekeringsmaatschappijen en financiële bedrijven) worden tijdens de query in Compustat uitgefilterd. Na de samenvoeging van de databases blijven 13,884 bruikbare waarnemingen over. Met deze waarnemingen worden de variabelen berekend die nodig zijn voor de regressie waarna alle berekende variabelen met één of meer ontbrekende velden worden verwijderd. Waarnemingen voor 2012 en na 2016 worden ook verwijderd. Deze periode is gekozen omdat alleen de waarnemingen van na de economische crisis voor het onderzoek gebruikt zullen worden. Volgens Cimini (2015) waren er in 2011 weer signalen van economische groei in de Verenigde Staten en beschouwde hij 2008 tot 2012 als crisisjaren. Variabelen in de formule totale accruals die outliers bevatten worden per fiscale jaar onder de 0.5% kwantiel en boven de 99.5% kwantiel gewinsorized. In navolging op Core et al. (1999) worden de variabelen in de formule LogCompensation niet gewinsorized. Dit resulteert in 6,647 bruikbare waarnemingen.

4.3 Toepassen hulpmodellen

De volgende subparagrafen tonen de jaarlijkse overzichten van de geschatte coëfficiënten. De tabellen worden a.d.h.v. de hulpmodellen uit subparagraaf 3.2.1 respectievelijk 3.2.2 gecreëerd.

4.3.1 Excess beloning

In subparagraaf 3.2.1 is vermeld dat met behulp van onderstaande formule, de jaarlijkse coëfficiënten kunnen worden geschat.

!"#(%"&'()*+,-")).=

1K+ 1C!"#(7()89().+ 1L:;&= 500.+ 1M!"#(;+A(*).BC+ 1ND7F.BC+ S.

De geschatte coëfficiënten zijn te vinden in tabel 1. De coëfficiënten zijn gebruikt om de Expected Compensation en vervolgens de Residual(Compensation) te berekenen en uiteindelijk de variabele dExcessComp te bepalen.

Tabel 1 - Regressie-coëfficiënten LogCompensation per fiscale jaar

Variabele 2012 2013 2014 2015 2016 1aK 5.5522 5.6688 5.6503 5.8880 6.0165 1aC 0.0252 0.0352 0.0444 0.0121 0.0724 1aL 0.2871 0.3593 0.3110 0.3570 0.4411 1aM 0.3548 0.3339 0.3476 0.3222 0.2905 1aN -0.1999 -0.0951 -0.2136 -0.0988 -0.0650 4.3.2 Discretionary accruals

In subparagraaf 3.2.2 is vermeld dat met behulp van onderstaande formule, de jaarlijkse coëfficiënten kunnen worden geschat.

7J.= 1C Z 1

J.BC\ + 1L[∆GH^.] + 1M[==H.] + S.

De geschatte coëfficiënten zijn te vinden in tabel 2. De regressie voor bovenstaand model wordt zonder 1K uitgevoerd. De coëfficiënten zijn gebruikt om de nondiscretionary accruals en vervolgens de geschatte discretionary accruals te berekenen.

Tabel 2 - Regressie-coëfficiënten Modified Jones model per fiscale jaar Variabele 2012 2013 2014 2015 2016 1aC -0.8910 -0.6182 1.2791 -2.0487 -3.1374 1aL 0.0225 0.0018 0.0331 0.0404 0.0098 1aM -0.0558 -0.0558 -0.0586 -0.0653 -0.0592 4.4 Beschrijvende statistiek

In de volgende subparagrafen worden ter controle van de gebruikte data, de kernstatistiek, correlatiematrix en de multicollineariteit besproken.

4.4.1 Kernstatistiek

M.b.t de kernstatistiek wordt in tabel 3 de cijfers voor de gemiddelde, mediaan, standaarddeviatie minima en maxima weergegeven.

Tabel 3 - Kernstatistiek voor 2012-2016

Variabele Gemiddelde Mediaan St. deviatie Min. Max.

|DA| 0.0394 0.0261 0.0530 0.0000 1.3503 dExcessComp 0.5691 1.0000 0.4952 0.0000 1.0000 LogAt 7.7544 7.6710 1.6773 1.2720 12.9087 RET 0.0435 0.0287 0.2376 -7.4930 3.6554 ROA 0.0376 0.0480 0.1427 -3.1504 3.5974 |DA|dDiensten 0.0073 0.0000 0.0272 0.0000 0.5184 |DA|dOverig 0.0136 0.0000 0.0373 0.0000 1.3503 |DA|dS&P 500 0.0087 0.0000 0.0275 0.0000 0.5646 dDiensten 0.1677 0.0000 0.3737 0.0000 1.0000 dOverig 0.3496 0.0000 0.4769 0.0000 1.0000 dS&P 500 0.2663 0.0000 0.4420 0.0000 1.0000

De tabel toont de kernstatistiek voor de drie gebruikte regressiemodellen voor de hypotheses voor de jaren 20012 tot en met 2016 waarin |DA| en dExcessComp als afhankelijke variabelen dienen. De steekproef bestaat uit 6,647 waarnemingen.

Tabel 4 - Correlatiematrix voor 2012-2016

|DA| dExcess

Comp LogA

t RET ROA dS&P

500 dDiensten |DA| dOverig |DA| dS&P 500 |DA| dDiensten dOverig

|DA| 1 dExcessComp 0.0069 1 LogAt -0.174*** 0.122*** 1 RET 0.0152 0.0473*** 0.0406*** 1 ROA -0.145*** 0.0226 0.129*** 0.0905*** 1 dS&P 500 -0.0780*** 0.0059 0.656*** 0.0819*** 0.128*** 1 |DA|dDiensten 0.350*** 0.0286* -0.0950*** 0.0097 -0.0255* -0.0021 1 |DA|dOverig 0.527*** -0.0499*** 0.0074 0.0111 -0.128*** -0.0267* -0.0972*** 1 |DA|dS&P 500 0.337*** 0.0198 0.316*** 0.0975*** 0.0552*** 0.523*** 0.335*** 0.130* 1 dDiensten 0.0382** 0.0533*** -0.128*** 0.0031 -0.0025 -0.0453*** 0.601*** -0.162* 0.0467*** 1 dOverig -0.0083 -0.125*** 0.204*** -0.0177 -0.0398** 0.0486*** -0.196*** 0.496* 0.0108 -0.326*** 1

4.4.2 Correlatiematrix

De waarden in een correlatiematrix geven de sterkte en de richting van de lineaire samenhang weer tussen twee variabelen waarbij de waarde van de correlatiecoëfficiënt de waarde tussen de -1.0 en +1.0 kan aannemen. De min- en pluswaarde geeft aan of de variabelen negatief of positief gecorreleerd zijn. De correlatiematrix voor de variabelen van de drie modellen wordt weergegeven in tabel 4. De meeste correlatiecoëfficiënten blijven, absoluut gezien, binnen de grens van 0.3 wat inhoudt dat er nauwelijks of geen correlatie is tussen de variabelen. De variabelen |DA|dOverig en |DA|, dS&P 500 en LogAt, |DA|dS&P 500 en dS&P 500, dDiensten en|DA|dDiensten en

dOverig en|DA|dOverig hebben een correlatiecoëfficiënt tussen de 0.5 en 0.7 wat betekent dat deze combinaties een middelmatige correlatie hebben. Gezien de aard van de variabelen is dit niet opmerkelijk. In de correlatiematrix is geen waarde onder de -0.9 of boven de +0.9 waargenomen waardoor gesteld kan worden dat geen indicatie is voor multicollineariteit.

4.4.3 Multicollineariteit

Multicollineariteit ontstaat wanneer tussen twee of meerdere onafhankelijke variabelen een sterke lineaire samenhang bestaat. Indien sprake is van multicollineariteit wordt de berekening van de regressie beïnvloed waardoor de betrouwbaarheid van de regressie afneemt. Multicollineariteit kan gevonden worden via de Variance Inflation Factor (VIF). De correlatiematrix geeft geen sterke indicatie voor multicollineariteit.

Tabel 5 - VIF-waarden voor 2012-2016

Variabele Hypothese 1 Hypothese 2 Hypothese 3

|DA| 2.20 5.03 LogAt 1.89 2.89 3.75 ROA 1.03 1.08 1.09 RET 1.01 1.11 1.11 dS&P 500 1.88 2.80 |DA|dS&P 500 2.25 dOverig 3.00 |DA|dOverig 3.91 dDiensten 2.17 |DA|dDiensten 2.75

Bij de VIF wordt rekening gehouden met meervoudige onderlinge correlaties. Volgens Myers (1990) bestaat pas bij een VIF-waarde van 10 een reden om bezorgd te zijn. Tabel 5 toont dat er geen sprake is van multicollineariteit omdat alle VIF-waarden onder de 10 zijn.

5 Onderzoeksresultaten

In dit hoofdstuk worden de onderzoeksresultaten weergegeven. Eerst wordt in paragraaf één een totaaloverzicht over de jaren 2012-2016 van de drie regressies samen in tabel 6 gepresenteerd. Vervolgens wordt in paragraaf 2 de verwachte richting van de bèta’s besproken. In de daaropvolgende paragrafen wordt per hypothese de regressieresultaten besproken. De afhankelijke variabelen voor de drie hypothesemodellen betreffen de absolute waarden van de discretionary accruals (hypothese 1) en dExcessCompensatie (hypotheses 2 en 3).

5.1 Regressieresultaten

Tabel 6 toont de resultaten van de drie regressiemodellen uit paragraaf 2.5. De eerste regressie betreft een OLS-regressie. Voor deze regressie is de !" gebruikt. De tweede en derde regressie zijn logistische regressies. Hiervoor is de Nagelkerke !" is gebruikt. Nagelkerke (1991) stelt dat de !" het deel van de variantie in het regressiemodel verklaart waardoor de !" als maatstaf bruikbaar is voor het succesvol voorspellen van de onafhankelijke variabele via de afhankelijke variabelen. Bij een logistische regressie waarbij de observaties (y) voor 50% uit nul bestaat en 50% uit 1, is de !" 0.75. Dit is volgens Nagelkerke (1991) onacceptabel. De rekenmethode van de Nagelkerke !" corrigeert dit waardoor de berekende waarden tussen de 0 en 1 liggen. Tabel 6 toont dat de !" een waarde heeft van 0.044 en de Nagelkerke !" een waarde heeft van 0.0678 en 0.0587. Dit geeft aan dat de gebruikte variabelen in de drie modellen voor respectievelijk 4.4%, 6.78% en 5.87% de variantie in het model verklaren. Dit is op zich een laag percentage. Omdat de drie modellen uit twee hulpmodellen zijn opgesteld is het niet duidelijk hoe dit kan worden verbeterd omdat de hulpmodellen een aantal verklarende variabelen bevatten waardoor deze niet meegenomen kunnen worden in de hypothesemodellen.