• No results found

3. Methodologie

3.2 Statische dataverwerking

3.2.1 Variabelen Afhankelijke variabele

De afhankelijke variabele in het onderzoek (variabele waarover een voorspelling wordt gedaan) betreft de mate van ethisch redeneren. Gemeten wordt middels een Likert schaal. Hierbij is sprake van elkaar uitsluitende categorieën, waarbij sprake is van een rangorde. Het meten van de mate van ethisch redeneren middels de Likert schaal voldoet aan de voorwaarden voor het hanteren van een ordinale meetschaal.

Onafhankelijke variabelen algemeen

De onafhankelijke variabelen waarover in dit onderzoek hypothesen gesteld zijn, betreffen structurele variabelen met betrekking tot grootte van

accountantsorganisaties (waarbij op basis van theoretisch onderzoek gekozen is voor mate van formalisering, mate van centralisatie en gemiddeld aantal

medewerkers).

Structurele variabelen verklaren naar verwachting maar een deel van de mate van ethisch redeneren (zie o.a. paragraaf 2.1 en 2.2) van respondenten. De in de statistiek zogenoemde ‘omitted variable bias’. Een substantieel deel van het ethisch redeneren wordt naast structurele factoren beïnvloed door individuele factoren. Door het weglaten van deze variabelen is het mogelijk dat een statistisch model de structurele variabelen te zwaar of te licht zal wegen.

Individuele factoren, waarvan op basis van theoretisch onderzoek bekend is dat deze invloed hebben op ethisch redeneren, worden derhalve tevens opgenomen als onafhankelijke variabelen. Deze onafhankelijke variabelen betreffen leeftijd, werkervaring, geslacht, politieke voorkeur, religiositeit, functie en opleiding.

De ‘omitted variable bias’ wordt door het opnemen van enkele individuele

factoren verkleind, maar niet volledig weggenomen. Redenen hiervoor zijn dat op basis van eerder onderzoek niet exact bekend is welke variabelen invloed hebben op het ethisch redeneren van respondenten, het feit dat een statistisch model door het vergroten van variabelen een grotere N nodig heeft om stabiel te blijven en het risico dat variabelen worden opgenomen die helemaal geen relatie hebben tot ethisch redeneren.

Onafhankelijke variabelen met een ordinale meetschaal

De variabelen formalisering en centralisatie worden net als de afhankelijke variabele gemeten middels een Likert schaal en worden gecategoriseerd als ordinale meetschalen. Inzake de variabelen functie en opleiding is tevens sprake van een rangorde, met elkaar uitsluitende categorieën.

Onafhankelijke variabelen met een nominale meetschaal

Van een nominale meetschaal is sprake bij de variabelen geslacht, politieke voorkeur en religiositeit. Bij deze variabelen is tevens sprake van categorieën die elkaar uitsluiten, maar is geen sprake van een rangorde.

Onafhankelijke variabelen met een ratio meetschaal

De resterende structurele en individuele factoren, zijnde grootte in aantal medewerkers, leeftijd en werkervaring, behoren tot deze categorie. Deze variabelen hebben een absoluut nulpunt, waardoor alle rekenkundige bewerkingen mogelijk zijn.

3.2.2 Analyse van verbanden tussen variabelen

In paragraaf 3.2.1 is vastgesteld dat de afhankelijke variabele een ordinale meetschaal heeft. Onderzocht wordt de invloed op de afhankelijke variabele van meerdere onafhankelijke variabelen. Deze onafhankelijke variabelen worden gemeten op ordinaal, nominaal en ratio niveau.

Voor analyse van het verband tussen meerdere onafhankelijke variabelen en een afhankelijke variabele gemeten met een Likert schaal zie o.a. het onderzoek door Jamieson (2004). Door Jamieson (2004) wordt gesteld dat in de praktijk twee wijzen van analyse gehanteerd worden:

- Meervoudige regressie;

- Ordinale regressie.

Meervoudige regressie is van toepassing indien de afhankelijke variabele een interval- of ratiovariabele is. Dit is bij een Likert schaal niet het geval. Blaikie (2003) geeft aan dat door veel onderzoekers wordt gesteld dat de intervallen tussen verschillende waarden in de Likert schaal gelijk zijn. Dit onderzoek sluit zich echter aan bij het statement van Kuzon Jr. et al. (1996): “the average of ‘fair’ and ‘good’ is not ‘fair-and-a-half’.”

Een ordinaal regressiemodel wordt gebruikt om het effect van onafhankelijke variabelen op een ordinale categoriale uitkomstmaat te analyseren. De uitkomstmaat bestaat dus uit (meer dan twee) categorieën, die een logische ordening hebben. Dit model is direct van toepassing op de onderzoeksdata en zal derhalve gehanteerd worden voor het onderzoek.

Ordinale regressie wordt in de statistiek opgedeeld in twee subcategorieën, namelijk de ordered logit en de ordered probit.

Beide modellen zijn sterk gelijkwaardig. Bij de ordered probit wordt echter een standaard normale verdeling van de populatie verondersteld. Bij een ordered logit is de basis een logische functie.

De mutliple vingettes aproach zoals gehanteerd in dit onderzoek (zie paragraaf 3.1) is door o.a. Conroy et al. (2010) en van der Kolk (2010) getoetst op een normale verdeling. Door beide onderzoekers wordt bevonden dat deze normale verdeling afdoende aanwezig is. De normale verdeling wordt derhalve voor het huidige onderzoek verondersteld aanwezig te zijn. In hoofdstuk 4 zal middels verkregen onderzoeksresultaten een toets worden uitgevoerd op daadwerkelijke aanwezigheid van een benaderde normale verdeling in dit onderzoek.

Door veronderstelde aanwezigheid van een normale verdeling zal analyse worden uitgevoerd middels een ordered probit analyse.

Een onderliggende relatie die middels de ordered probit analyse onderzocht wordt ziet er als volgt uit:

x' ,

Hierbij is y* de exacte, maar niet waargenomen afhankelijke variabele en x de vector van de onafhankelijke variabelen en de vector van de te schatten regressiecoëfficiënten. De y* is niet waar te nemen, maar een benadering middels de categorieën uit de Likert schaal wel:

Figuur 2 – Relatie tussen y* en y in ordered probit model

De ordered probit analyse gebruikt de categorieën y om een uitspraak te doen over y*.

De nulhypothese voor een regressiemodel betreft in het algemeen dat de invloed van alle onafhankelijke variabelen gelijk aan nul is. De alternatieve hypothese betreft een invloed van ongelijk aan nul. Hieruit volgt:

Nulhypothese per stelling: y = 0

Alternatieve hypothese per stelling: y ≠ 0

De ordered probit analyse wordt per casus betreffende ethisch redeneren uitgevoerd (derhalve 30 maal).

Een ordinaal regressiemodel heeft algemeen als eigenschap dat onafhankelijke variabelen met een ratio-, ordinale- en nominale meetschaal opgenomen kunnen worden. Voor het gebruik van ordinale meetschalen en nominale meetschalen dienen echter zogenoemde dummy variabelen aangemaakt te worden.

Een dummy variabele wordt gehanteerd om de aanwezigheid of afwezigheid van een effect aan te geven dat invloed heeft op de uitkomst van een

regressieanalyse. Nominale of ordinale variabelen worden omgezet naar

dichtonome variabelen die een waarde 1 of 0 hebben. De categorie 0 betreft de referentiecategorie. De uitkomsten van de invloed van de dummy met waarde 1 op y wordt altijd vergeleken met de invloed van de referentiecategorie op y. Het is mogelijk om voor een variabele meer dan twee categorieën aan te maken. Het aantal dummy variabelen betreft altijd aantal categorieën minus de

referentiecategorie.

Voor het behandelen van de diverse onafhankelijke variabelen voor invoer in de ordered probit analyse zie paragraaf 3.2.3.

3.2.3 Behandeling onafhankelijke variabelen ten behoeve van ordered probit analyse

Diverse (uitkomsten van) onafhankelijke variabelen dienen aangepast te worden, voordat deze gehanteerd kunnen worden in de ordered probit analyse. Zie

onderstaand voor de aanpassingen die per onafhankelijke variabele zijn uitgevoerd.

Leeftijd

Betreft een variabele met een ratio meetschaal. Geen aanpassing benodigd voor gebruik in ordered probit analyse.

Jaren werkervaring

Betreft een variabele met een ratio meetschaal. Geen aanpassing benodigd voor gebruik in ordered probit analyse.

Aantal medewerkers

Betreft een variabele met een ratio meetschaal. Geen aanpassing benodigd voor gebruik in ordered probit analyse. Het aantal medewerkers van geselecteerde kantoren (zie paragraaf 3.1.3) is bepaald als het gemiddeld aantal medewerkers per 31-12-2010. Reden voor deze peildatum is dat van deze datum voor alle geselecteerde kantoren de benodigde gegevens beschikbaar zijn. Wegens relatief grote verschillen in aantal medewerkers per non Big-Four kantoor (van 2000 tot kleiner dan 10) worden door personeelsmutaties na de peildatum geen

significante effecten op de onderzoeksresultaten verwacht.

Mate van formalisering

Het toetsen van de mate van formalisering geschiedt middels vijf vragen uit de opgestelde enquête, die middels een Likert schaal gemeten worden (zie paragraaf 3.1.2). Het meetniveau is ordinaal, derhalve dient een dummy variabele

aangemaakt te worden.

Verwerkingswijze is als volgt:

- Het totaal van de uitkomsten uit de enquête per respondent wordt opgeteld;

- Dit totaal wordt gedeeld door het aantal vragen met betrekking tot mate van formalisering. Nu is een gemiddeld beschouwde mate van formalisering per respondent beschikbaar. Deze gemiddelde mate van formalisering kan

theoretisch van 1 tot en met 7 lopen. De uitkomsten zijn gelijk aan het aantal categorieën uit de Likert schaal.

- Op basis van de verdeling van gemiddelde uitkomsten per respondent worden twee of drie categorieën aangemaakt. Deze betreffen:

o ‘Hoge mate van formalisering’ en ‘Lage mate van formalisering’ of

o ‘Hoge mate van formalisering’, ‘Gemiddelde mate van Formalisering’ en ‘Lage mate van Formalisering’

- Op basis van het aantal aanwezige categorieën worden een of twee dummy variabelen aangemaakt. De referentiecategorie is in beide gevallen ‘Lage mate van formalisering’.

Mate van centralisatie

Politieke oriëntatie

Betreft een variabele met een nominale meetschaal. Er zijn op basis van de enquête drie categorieën aanwezig, namelijk politiek links, midden en rechts. Op basis van onderzoeken door Conroy et al. (2010) en van der Kolk (2010) wordt verwacht dat een grote meerderheid van de respondenten politiek rechts is. Er wordt een dummy variabele politiek rechts aangemaakt. De referentiecategorie betreft politiek links en midden. Reden dat geen drie categorieën aangemaakt worden is het beperken van het aantal onafhankelijke variabelen. Het opnemen van teveel onafhankelijke variabelen kan problemen veroorzaken bij de analyse van resultaten (zie paragraaf 3.2.1). Doordat verwachting is dat een relatief groot deel van de respondenten politiek rechts zal antwoorden kunnen adequate

conclusies getrokken worden middels twee categorieën.

Religiositeit

Gevraagd wordt of een respondent zichzelf als religieus of niet religieus

beschouwd, derhalve is sprake van een nominale verdeling met twee categorieën. Er wordt een dummy variabele ‘religieus’ aangemaakt. Als referentiecategorie geldt ‘niet religieus’.

Functie

Er worden vier functiecategorieën aangemaakt ten behoeve van de enquête. Deze betreffen:

- Beginnend Assistent Accountant;

- Gevorderd Assistent Accountant;

- Controleleider;

- Registeraccountant.

Er is sprake van een ordinale meetschaal voor deze variabele.

Op basis van de verdeling over de verschillende functiecategorieën worden twee of drie categorieën aangemaakt. Meer categorieën worden in verband met de op basis van dezelfde overweging als bij politieke oriëntatie niet toegevoegd. Op basis van het aantal aanwezige categorieën worden een of twee dummy

variabelen aangemaakt. De referentiecategorie bestaat uit de categorie met de laagste functieniveaus.

Opleiding

Er zijn drie opleidingsniveaus van toepassing op het onderzoek, namelijk:

- Bachelor;

- Master;

- Post Master.

Er is sprake van een ordinale meetschaal. Verdeling vindt plaats als bij de variabele functie.

3.2.4 Toetsen van de validiteit van het model

De ordered probit analyse wordt uitgevoerd per casus. Voordat de resultaten geanalyseerd worden, wordt eerst vastgesteld of het model voldoende valide is om significante conclusies te trekken. De verschillende toetsen die worden uitgevoerd per casus op de uitkomst van de ordered probit analyse worden onstaand toegelicht.

Voldoende benadering van normale verdeling

Een normal probability plot geeft een cumulatieve verdeling van de afhankelijke variabele weer, die wordt vergeleken met de cumulatieve verdeling die verwacht zou worden bij een normale verdeling. Analyse vindt plaats middels een

spreidingsdiagram (Q-Q plot). Punten uit de Q-Q plot dienen gerangschikt te zijn rond de lijn die in het spreidingsdiagram de normale verdeling weergeeft. Bij inschatting van een te grote afwijking van de normale verdeling worden resultaten uit de ordered probit analyse als niet valide beschouwd en niet meegenomen in de resultaten van het onderzoek.

Totale betrouwbaarheid/significantie van het model

Het significantieniveau is het risico wat genomen wordt dat de nulhypothese ten onrechte wordt verworpen. Bij elke toets wordt de P-waarde weergegeven. Deze P-waarde betreft de kans dat de toetsingsgrootheid wordt overschreden als nulhypothese juist is. Een algeheel aanvaard percentage voor de P-waarde is 5%. Deze betrouwbaarheid zal ook worden aangehouden bij het toetsen van de

significantie van het model. Indien de P-waarde hoger is dan 0.05 (5%) wordt het risico op het ten onrechte verwerpen van de nulhypothese te groot geacht en wordt de uitkomst niet meegenomen in de resultaten van het onderzoek.

Naast de P-waarde kan de betrouwbaarheid van het model ingeschat worden middels de Log-Likelihood. De Log-Likelihood is een methode om de coëfficiënten voor een regressiemodel in te schatten. Middels de Log-Likelihood wordt de waarschijnlijkheid gemeten dat een specifieke set van afhankelijke variabelen geobserveerd wordt in het model. Hoe hoger de Log-Likelihood, hoe groter de kans dat de specifieke set gemeten wordt.

Voorafgaand aan het uitvoeren van de ordered probit analyse kan nog geen grens voor de Log-Likelihood gesteld worden, omdat deze waarde afhankelijk is van onderzoeksresultaten. Wel kan gesteld worden dat een uitkomst van een ordered probit analyse met een fors lagere Log-Likelihood dan gemiddeld wordt

uitgesloten uit het onderzoek. Deze resultaten worden als niet betrouwbaar geacht.

Multicollineariteit tussen variabelen

Bij meervoudige regressie kan multicollineariteit optreden wanneer de

onafhankelijke variabelen onderling sterk correleren. Beide variabelen verklaren dan dezelfde variatie in y. Het gevolg daarvan is dat het model instabiel wordt en de uitkomsten onbetrouwbaar. De regressiecoëfficiënten gaan sterk variëren bij kleine veranderingen in de data en de standaardfouten worden uitvergroot. Er is geen standaard waarde voor een te hoge multicollineariteit, maar een algehele stelregel is dat een multicollineariteit van meer dan 90% te hoog is.

Mate waarin variabelen de variantie verklaren

De Nagelkerke R2 is een pseudo-maat voor de verklaarde variantie. Dit is het percentage variantie in de afhankelijke variabele dat wordt verklaard door de opgenomen onafhankelijke variabelen. Er is in dit onderzoek sprake van tien onafhankelijke variabelen. Gesteld wordt dat deze tenminste 25% van de

variantie in de afhankelijke variabele dienen te verklaren. Indien dit niet het geval is, wordt de uitkomst als niet relevant voor het onderzoek beschouwd.

3.2.5 Toetsen van de validiteit van de uitkomsten per onafhankelijke variabele

Indien de validiteit van het ordered probit model is vastgesteld, wordt een

analyse uitgevoerd op de validiteit van uitkomsten van individuele onafhankelijke variabelen. Deze validiteit wordt vastgesteld door de significantie te bepalen. De significantie is gelijk aan de significantie van het model en wordt derhalve op 0.05 (5%) gesteld.

Per casus wordt de significantie van de invloed van onafhankelijke variabelen vastgesteld. Van de dertig casussen dient per onafhankelijke variabele een afdoende aantal significante bevindingen aanwezig te zijn, om met voldoende betrouwbaarheid conclusies te trekken over de invloed van de onafhankelijke variabele op de afhankelijke variabele. Hiernaast dienen geen grote

tegenstrijdigheden te bestaan tussen significante positieve en significante

negatieve invloeden van de onafhankelijke variabele op de afhankelijke variabele. Het totaal aantal benodigde significante bevindingen en limiet aan tegenstrijdige significante bevindingen wordt voorafgaand aan de resultaatanalyse niet

gekwantificeerd. Reden hiervoor is dat vooraf de N van de steekproef niet nauwkeurig genoeg bekend is.

3.2.6 Het vergelijken van twee onafhankelijke steekproeven Hypothese 4 behelst een vergelijking tussen de resultaten uit het huidige onderzoek en de resultaten uit het onderzoek door van der Kolk (2010). Er worden twee onafhankelijke steekproeven vergeleken waarbij wordt gesteld dat deze redelijkerwijs niet uit dezelfde populatie getrokken zijn. De huidige

steekproef is immers van toepassing op een populatie van non Big-Four

accountants en de steekproef door van der Kolk op een populatie van Big-Four accountants.

Door Keller (2008 p. 438-460) worden twee toetsen weergegeven voor het vergelijken van twee onafhankelijke steekproeven:

- De Wilcoxon rank-sum test;

- De t-toets.

De Wilcoxon rank-sum test vergelijkt de onderlinge ligging van steekproefelementen en verwacht een ordinale verdeling.

De t-toets wordt gehanteerd om na te gaan of er een verschil is tussen de

gemiddelden van twee steekproefpopulaties. Deze toets is van toepassing bij een ratio- of interval meetniveau.

De Wilcoxon rank-sum test is het meest geschikt voor hypothese 4, omdat afhankelijke variabelen in beide onderzoeken een ordinaal meetniveau hebben. Toch wordt de t-toets gehanteerd. Reden hiervoor is simpelweg dat er niet afdoende data aanwezig is voor het uitvoeren van de Wilcoxon rank-sum test. Enkel gemiddelden, standaarddeviatie en omvang van de steekproef door van der Kolk (2010) zijn bekend.

Het hanteren van een interval meetniveau voor het meten van de afhankelijke variabelen, zoals verkregen uit een Likert-schaal, heeft zoals aangegeven in paragraaf 3.2.2 geen voorkeur. Deze ‘foutieve’ werkwijze wordt echter in een groot scala aan wetenschappelijke onderzoeken gehanteerd, zodat ondanks beperkingen verwacht wordt dat afdoende significante bevindingen verkregen kunnen worden.

Voor het vergelijken van twee onafhankelijke steekproeven wordt derhalve de t-toets gehanteerd. Het uitgangspunt bij de berekening van t zijn het gemiddelde, de standaarddeviatie en de omvang van beide steekproeven.

Figuur 3 – model voor t-toets

Een voorwaarde voor het hanteren van de t-toets is een (benadering van de) normale verdeling. Voor het toetsen van de normale verdeling zie paragraaf 3.2.4.

Voor het uitvoeren van de t-toets wordt als nulhypothese gesteld dat de gemiddelden van de steekproefpopulatie non Big-Four en Big-Four aan elkaar gelijk zijn. Alternatieve hypothese luidt dat de twee gemiddelden niet aan elkaar gelijk zijn. Er wordt derhalve tweezijdig getoetst.

Nulhypothese: gemiddelde mate van ethisch redeneren non Big-Four

medewerkers = gemiddelde mate van ethisch redeneren Big-Four medewerkers. Alternatieve hypothese: gemiddelde mate van ethisch redeneren non Big-Four medewerkers ≠ gemiddelde mate van ethisch redeneren Big-Four medewerkers.

Een negatieve t in de uitkomst van de toets wijst erop dat de gemiddelde tolerantie van een ethisch discutabele situatie bij non Big-Four medewerkers lager ligt dan bij Big-Four medewerkers. Een positieve uitkomst geeft het tegenovergestelde aan.

Bij het uitvoeren van de t-toets wordt, op basis van dezelfde overwegingen, net als bij de ordered probit analyse een significantie van 0.05 (5%) gehanteerd.