• No results found

Beschrijvende statistiek

4. Onderzoeksresultaten

4.1 Beschrijvende statistiek

4.1.1 Missing values

Voordat begonnen kan worden met het analyseren van de data, moet eerst onderzocht worden of in de dataset sprake is van missing values. Missing values (ontbrekende waarden) ontstaan doordat niet bij alle variabelen een waarde ingevoerd kan worden (Basishandboek SPSS 21, 2013; p. 19/47). In dit onderzoek zijn missing values ontstaan, doordat in een aantal cellen geen score ingevuld kan worden vanwege het ontbreken van relevante informatie in de onderzochte Integrated Reports. In

onderstaande tabel zijn van de onderzochte variabelen de missing values opgenomen.

Onderneming ROA Ondernemings-grootte FRE FOG Chairman’s Statement Stakeholder Engagement Corporate Governance Chairman’s Statement Stakeholder Engagement Corporate Governance Valid Missing 59 47 56 56 37 53 55 37 50 0 12 3 3 22 6 4 22 9

Tabel 5: Missing values

Uit bovenstaande tabel blijkt dat bij alle variabelen sprake is van missing values. De vraag die nu gesteld kan worden, is wat met deze missing values gedaan moet worden. Eén van de methoden om met missing values om te gaan, is de pairwise deletion of missing values. In dit onderzoek wordt deze methode toegepast, omdat bij toepassing van andere methoden te veel waarden aan het onderzoek worden onttrokken waardoor het onderzoek mogelijk minder betrouwbare uitkomsten oplevert. Bij de pairwise deletion of missing values methode worden alleen de missing values niet meegenomen in het onderzoek, terwijl de daaraan gekoppelde waarden gewoon worden meegenomen

(Basishandboek SPSS 21, 2013; p.47-48). Voor dit onderzoek betekent dit dat alleen de cellen zonder score niet worden meegenomen, terwijl de andere ingevulde waarden van de betreffende

onderneming wel degelijk worden meegenomen.

4.1.2 Aanwezigheid outliers

Een volgende stap in de voorbereiding op de data-analyse is het onderzoeken of de data mogelijke outliers bevat. Een outlier (uitbijter / uitschieter) is een extreme waarde die niet lijkt te passen bij de overige waarden en relatief ver af ligt van de overige waarden. Een outlier kan de resultaten

beïnvloeden, doordat deze de normaalassumptie verstoort. Het is daarom van belang om outliers zorgvuldig te bestuderen. Om outliers op te sporen, wordt vaak gebruik gemaakt van een boxplot (Basishandboek SPSS 21, 2013; p.140/205-207).

Voor alle onafhankelijke, afhankelijke en controlevariabele(n) uit dit onderzoek is apart een boxplot gemaakt, waarbij de outliers per variabele zijn weergegeven. In bijlage II zijn al deze boxplots opgenomen. Uit deze boxplots valt op te maken dat bij enkele variabelen wel degelijk outliers in de data aanwezig zijn. Het is van belang om de reden van deze outliers op te sporen. Een aantal outliers hadden te maken met een invoerfout, deze waarden zijn dan ook direct aangepast in de dataset.

Daarnaast zijn er outliers waarvan de waarde wel degelijk klopt. Een aantal van deze outliers hebben een negatieve waarde, dit wordt veroorzaakt door een negatieve net income. Het is begrijpelijk dat deze negatieve waarden als extreme waarden worden beschouwd in het statistische programma SPSS, doordat ze door hun negatieve waarde ver af liggen van de rest van de waarden.

Voor dit onderzoek is besloten om de outliers, waarvan de waarde wel degelijk klopt, buiten dit onderzoek te houden (Basishandboek SPSS 21, 2013; p.140/p.205-207). Door het uitsluiten van de outliers in dit onderzoek, worden de resultaten niet beïnvloed en wordt de normaalassumptie niet verstoord. De uitgesloten outliers zijn al verwerkt in tabel 4 waarin de missing values per variabele zijn opgenomen.

4.1.3 Beschrijvende analyse

De mate van leesbaarheid van het Integrated Report staat in dit onderzoek centraal. In tabel 5 zijn het minimum, het maximum, het gemiddelde en de standaarddeviatie per element uit het Integrated Report weergegeven. Uit de tabel valt af te lezen dat de waarden tussen de elementen van het Integrated Report van elkaar verschillen.

In paragraaf 3.3 zijn voor zowel de FRE- als de FOG-formule tabellen weergegeven met

leesbaarheidsscorecategorieën en de daarbij behorende interpretatie. Een leesbaarheidsscore tussen de 0 en 49 wordt onder de FRE-formule als moeilijk tot zeer moeilijk omschreven. In onderstaand tabel is te zien dat alle waarden, berekent door middel van de FRE-formule, tussen de 0 en 49 zitten. Hieruit kan geconcludeerd worden dat volgens de FRE-formule het Integrated Report moeilijk leesbaar is. De overige waarden, berekend door middel van de FOG-formule, geven aan hoe complex een bepaalde tekst is. Uit onderstaande tabel blijkt dat de minimumwaarden overeenkomen met een ‘gemiddeld’ complexe tekst, terwijl de maximumwaarden overeenkomen met een hoge complexiteit omtrent de teksten uit de Integrated Reports.

N Minimum Maximum Mean Std. Deviation

FLESCH Chairman’s Statement 56 13,86 46,66 32,8284 9,04011

FLESCH Stakeholder Engagement 37 1,30 44,71 20,9486 10,85700

FLESCH Corporate Governance 53 1,90 37,13 23,2092 8,81221

FOG Chairman’s Statement 55 12,10 21,34 16,6373 2,19618

FOG Stakeholder Engagement 37 14,31 23,64 18,7657 2,29501

FOG Corporate Governance 50 14,49 23,70 18,5870 2,16624

Tabel 6: Beschrijvende statistieken leesbaarheid Integrated Report

In tabel 7 zijn de belangrijkste beschrijvende statistieken van de controlevariabele

ondernemingsgrootte weergegeven. De ondernemingsgrootte is in dit onderzoek berekend middels de logaritme van de totale omzet. De totale omzet is uitgedrukt in euro’s. Uit de tabel blijkt dat niet voor elke onderneming de logaritme van de omzet berekend kon worden, er zijn namelijk 3 missing values. Voor de verdere interpretatie van deze beschrijvende statistieken geldt dat deze waarden in samenhang met de andere variabelen moeten worden bestudeerd.

Tabel 7: Beschrijvende statistieken Ondernemingsgrootte

In tabel 8 zijn de belangrijkste beschrijvende statistieken van de afhankelijke variabele financiële prestaties weergegeven. Uit de tabel blijkt dat niet voor elke onderneming de ROA berekend kon worden, er zijn namelijk 12 missing values. Aangezien in dit onderzoek getest wordt of de financiële prestaties van invloed zijn op de mate van leesbaarheid van het Integrated Report, is het van belang om onderstaande statistieken in samenhang met de mate van leesbaarheid te onderzoeken. In paragraaf 4.3 wordt deze hypothese getoetst.

Aangezien de financiële prestaties van een onderneming gemeten worden door middel van de ROA, is het niet van belang in welke munteenheid de financiële prestaties worden uitgedrukt. De ROA betreft namelijk een verhouding.

Tabel 8: Beschrijvende statistieken Financiële prestaties

In tabel 9 zijn de frequenties van de sectoren en de daarbij horende percentages weergegeven. Uit de tabel blijkt dat de Integrated Reports uit de sectoren ‘Manufacturing’ en ‘Finance, Insurance en Real Estate’ in dit onderzoek oververtegenwoordigd zijn. De twee sectoren vertegenwoordigen samen net iets meer dan de helft van alle Integrated Reports in dit onderzoek.

Sector Frequency Percent

Mining 5 8,5 %

Construction 2 3,4 %

Manufacturing 15 25,4 %

Transportation, Communications, Electric, Gas and Sanitary Services

11 18,6 %

Retail Trade 1 1,7 %

Finance, Insurance and Real Estate

15 25,4 %

Services 10 16,9 %

Totaal 59 100 %

Tabel 9: Frequentietabel sectoren

In bijlage III zijn twee tabellen opgenomen die belangrijke beschrijvende statistieken per sector en per element van het Integrated Report weergegeven. Uit de eerste tabel blijkt dat de waarden per sector en per element sterk van elkaar verschillen.

Ondernemingsgrootte Valid Missing 56 3 Mean 22,4482 Std. Deviation 1,93744 Minimum 17,64 Maximum 26,44 Financiële prestaties Valid Missing 47 12 Mean 5,1428 Std. Deviation 3,83294 Minimum -1,33 Maximum 13,94

Toch blijkt dat de spreiding van de waarden in de oververtegenwoordigde sectoren kleiner is dan de waarden van sectoren waarvan enkele Integrated Reports zijn meegenomen in dit onderzoek. Ook hier kan geconcludeerd worden dat de leesbaarheid van het Integrated Report in alle sectoren als zeer moeilijk tot moeilijk wordt ervaren. Dit is te zien aan de weergegeven mean in de tabel. De andere tabel in bijlage III laat ook beschrijvende statistieken zien per sector en per element van het Integrated Report, maar dan berekend volgens de FOG-formule. Uit deze tabel blijkt dat de

gemiddelde waarden per sector en per element hoog zijn. Hieruit kan geconcludeerd worden dat er sprake is van een hoge complexiteit omtrent de teksten in het Integrated Report.

In tabel 10 worden beschrijvende statistieken weergegeven omtrent de verschillende stakeholders die in de Integrated Reports zijn genoemd. Uit de tabel blijkt dat de ondernemingen die deelnemen aan dit onderzoek veel verschillende stakeholders in hun Integrated Reports noemen. In totaal zijn in de 59 Integrated Reports 318 keer een stakeholder genoemd. Het gemiddeld aantal stakeholders genoemd in een Integrated Report is 5,39.

In bijlage VII is een lijst met alle stakeholders en de daarbij horende percentages opgenomen. Hieruit blijkt dat de employees (+ unions), de customers (clients) en de community in meer dan de helft van de Integrated Reports worden benoemd. De groep ‘overige’ bestaat uit stakeholders die maar een enkele keer in een Integrated Report zijn genoemd, zoals de European Union.

Stakeholders

Aantal keer in IR’s 318

Aantal soorten stakeholders