Instrumentarium - (Een) goede raad is goud waard

3. Onderzoeksontwerp

3.2 Onderzoeksmethodiek

3.2.3 Instrumentarium

Wanneer is gekozen voor een ervaringssurvey als methode van dataverzameling, kunnen verschillende communicatiemethoden worden gekozen om de gewenste data te bemachtigen. Voorbeelden hiervan zijn persoonlijke interviews, telefonische interviews en surveys die respondenten zelf moeten uitvoeren (Blumberg et al., 2005, p. 249). Zoals in paragraaf 3.2.2 reeds naar voren is gekomen, kies ik voor de laatste communicatiemethode: ik zal door middel van het enquêteren van vennootschapssecretarissen de benodigde data verkrijgen voor het empirische gedeelte van het onderzoek. De vragenlijst is als Bijlage 1 bij deze scriptie opgenomen.

Door middel van een enquệte kunnen redelijk ontoegankelijke en discrete respondenten als vennootschapssecretarissen, verspreid over Nederland, toch worden bereikt. Ook gaat de dataverzameling sneller en hebben mensen bij toegestuurde enquêtes de mogelijkheid om goed na te denken over de antwoorden die zij geven. Ook past deze methode mijns inziens het beste binnen de randvoorwaarden van dit onderzoek: er zijn lage kosten aan verbonden, de methode is relatief weinig arbeidsintensief en goed zonder de medewerking van andere onderzoekers uit te voeren, en anonimiteit van respondenten wordt relatief goed gewaarborgd.

Een beperking van deze methode is de ‘non-response error’, die ontstaat als gevolg van het feit dat er altijd mensen zijn die de enquête niet ingevuld terugsturen en over hen en hun redenen daarvoor niets bekend is (Blumberg et al., 2005, p. 264). In dit kader zou van belang kunnen zijn welk gedeelte van de NIVE-secretarissen en welk gedeelte van de apart aangeschreven secretarissen de vragenlijst heeft teruggestuurd. Ik ben echter van mening dat de groepen secretarissen niet wezenlijk verschillen, waardoor deze verhouding in dit onderzoek niet erg relevant is (zie paragraaf 3.3). Wel is het überhaupt van belang de non-response error zo veel mogelijk te beperken. Deze error kan verminderd worden door een hogere response rate. Uit de verschillende methodologische artikelen op dit gebied, blijkt een aantal variabelen positief gerelateerd aan de response rate (Blumberg et al., 2005, p. 265). Hiervan pas ik er een aantal toe in dit onderzoek. Zo wordt de vragenlijst bij de NIVE-secretarissen van tevoren aangekondigd in hun gespreksgroepen, zal ik een herinnering sturen als de deadline is verstreken en doet de leider van de gespreksgroepen, die de secretarissen persoonlijk kennen, dit na het verstrijken van de tweede deadline. Bovendien leidt het vermelden van de namen PricewaterhouseCoopers en NIVE in de vragenlijst en de e-mail wellicht tot een hogere respons (‘survey sponsorship’). PwC zou door vennootschapssecretarissen als een niet-onafhankelijke partij kunnen worden gezien, waardoor de medewerking van deze organisatie juist af zou kunnen schrikken.

Naar mijn idee is dit echter niet erg waarschijnlijk, met name doordat PwC zelf geen belang heeft bij een bepaalde uitkomst en PwC een goede reputatie heeft met betrekking tot het discreet uitvoeren van corporate governance onderzoeken. Ik tracht het terugsturen te versimplificeren door het aanbieden van drie mogelijkheden hiervoor: via de e-mail, via de reguliere post en per fax. Ook wordt de anonimiteit benadrukt, door dit zowel in de e-mail/brief als in de vragenlijst te benoemen en ‘vet’ te drukken. Om te voorkomen dat secretarissen de vragenlijst niet zullen invullen in verband met de tijd die dit kost, vermeld ik in de vragenlijst en de e-mail/brief hoeveel tijd het ze zal kosten (15 minuten). De eerste deadline zal twee weken na het versturen zijn, daar dit in de praktijk de termijn is gebleken waarop respondenten veelal reageren. De secretarissen die apart zijn aangeschreven ken ik niet bij naam; om toch respons van deze groep te krijgen, zal ik de vragenlijsten adresseren aan de functie (‘t.a.v. de vennootschapssecretaris’).

De elementen die in hoofdstuk 2 zijn geïdentificeerd, vraag ik terug aan de secretarissen middels onderdeel B van de vragenlijst. Ik stel één vraag, die voor de verschillende elementen moet worden

beantwoord: Welke kenmerken zijn volgens u in het algemeen bepalend voor de effectiviteit van de

RvC? Voor alle 37 elementen, onder elkaar opgesomd en onderverdeeld in de drie categorieën (structuukenmerken, persoons- en gedragskenmerken en interactiekenmerken), dienen de respondenten aan te geven in welke mate de genoemde kenmerken volgens hen in het algemeen bepalend zijn voor het functioneren van de RvC (zie de volgende alinea voor de gehanteerde schaalverdeling). Ik heb gekozen voor een gesloten vraag om het aantal mogelijke antwoorden vooraf te beperken. Dit vergroot de bruikbaarheid van de antwoorden, en vergemakkelijkt de verwerking van de antwoorden en het trekken van conclusies. Wel wordt een open vraag gesteld of er additionele kenmerken van belang zijn die niet in de vragenlijst aan de orde zijn gekomen, om te voorkomen dat bepalende kenmerken niet worden geïdentificeerd.

De vragen 1 t/m 3 in onderdeel A maken het mogelijk om de respondenten verder onder te verdelen. Op deze manier kan ik de vragenlijsten afkomstig van de voor mij relevante secretarissen selecteren (zie paragraaf 3.3 en 3.4). Vraag 4 achterhaalt of de secretarissen momenteel werkzaam zijn in een monistische of dualistische bestuursstructuur. Een aantal elementen heeft namelijk betrekking op een monistische structuur, terwijl het waarschijnlijk is dat secretarissen in Nederland alleen ervaring hebben met het dualistische model. Dit zou invloed kunnen hebben op de antwoorden die worden gegeven. Er wordt gevraagd in welk model ze werkzaam zijn, om te kunnen kijken of dit inderdaad het geval lijkt te zijn. De laatste vraag van onderdeel A vraagt naar de tijdsbesteding van de secretarissen. De functie van secretaris kent geen eenduidige omschrijving en wordt in elke onderneming anders ingevuld. Met het oog op de relevantie van secretarissen als databron voor dit onderzoek, is het van belang dat de vennootschapssecretarissen voldoende kennis en ervaring hebben met betrekking tot de raadskamers om hier uitspraken over te kunnen doen. Vraag 5 laat zien of de secretarissen inderdaad een groot gedeelte van hun tijd aan de secretarisfunctie en corporate

governance besteden. Zo niet, dan moet dit nader worden geadresseerd, daar de conclusies in dat geval minder betrouwbaar zijn.

Schaalconstructie

In de vragenlijst hanteer ik een ratingschaal. Er wordt gevraagd naar de mate waarin de respondenten een bepaald element van belang achten voor de effectiviteit van intern toezicht, waarbij onderscheid wordt gemaakt tussen vier gradaties: beperkt van belang, redelijk van belang, belangrijk en zeer belangrijk. Een vijfde optie, een nadere specificatie van beperkt van belang, is ten behoeve van het onderzoek met PwC en NIVE toegevoegd: compliance gedreven, maar in de praktijk slechts beperkt van belang. Deze nadere specificatie is echter voor mijn onderzoek niet relevant, daar ik met het oog op de onderzoeksvraag enkel geïnteresseerd ben in de mate van belang. Ik behandel de antwoorden in deze categorie dan ook als beperkt van belang.

De schaalverdeling die ik hanteer, vertoont overeenkomsten met een Likert-schaal, die vaak wordt gebruikt bij het meten van meningen. Bij deze schaalverdeling worden de vragen echter veelal als stellingen geformuleerd, waarbij de respondenten aangeven in welke mate zij het met de stelling eens zijn. In plaats van de mate waarmee de respondenten het met de stelling eens zijn, kunnen zij aangeven hoe belangrijk zij het voorgelegde element achten. De meest voorkomende vorm van de Likertschaal is de 5-punts schaal. Ik heb er echter voor gekozen om de categorie ‘neutraal’/‘geen mening’ weg te laten, waardoor de respondenten als het ware gedwongen worden tot het maken van een keuze tussen wel of niet van belang (ook wel de forced-choice techniek genoemd). De ervaring leert namelijk dat veel respondenten deze optie kiezen, indien aanwezig, vanwege het veilige karakter ervan. De schaalverdeling in de vragenlijst is dus 4-punts. De Likert-schaal wordt vaak vergezeld door een visueel-analoge schaal, zoals ook in mijn onderzoek het geval is. Bovenaan in de tabel zijn de scores in oplopende rating weergegeven, zodat vervolgens per element de ‘check-box’ die van toepassing is, kan worden aangevinkt.

De categorisatie van de antwoorden geeft een ordinale schaalverdeling weer, ondanks dat ik aan deze gradaties een cijfer van 1 t/m 4 heb toegekend (wat zou kunnen duiden op een intervalschaalverdeling). De cijfers geven namelijk een rangorde weer, waarbij naar mijn mening niet gezegd kan worden dat het verschil tussen redelijk van belang en beperkt van belang even groot is als het verschil tussen belangrijk en zeer belangrijk. Of dergelijke ordinale gegevens statistisch als intervalvariabelen behandeld mogen worden, is een belangrijk onderwerp van discussie onder verschillende onderzoekers. Ik ben het met Blumberg et al. (2005, p. 397) eens dat het passend is om gegevens voorzichtigheidshalve als ordinaal te behandelen, wanneer men niet zeker is van gelijke intervallen. Symmetrie in de categorieën, zoals in een standaard 5-punts Likert-schaal, zou een intervalbehandeling kunnen rechtvaardigen. In de voorgelegde vragenlijst is echter geen sprake van symmetrie rond de middelste categorie, daar de optie ‘neutraal’ ontbreekt.

Het gebruik van een schaalverdeling brengt een aantal implicaties met zich mee. Doordat beoordelingen altijd in belangrijke mate zijn gebaseerd op een subjectief inschatten van de betreffende respondenten, kunnen zowel toevallige als systematische fouten van invloed zijn op de verkregen uitkomsten (Theuns, 1999). Onder de systematische fouten kunnen de ‘halo bias’, de ‘generosity bias’, de tendens naar het midden en de contrast fout worden genoemd. De halo bias verwijst naar de tendens om bij beoordelingen de algemene indruk die men over iets of iemand heeft te laten weerklinken in alle beoordelingen. Beoordelingen op specifieke dimensies worden daarbij als het ware gecontamineerd door de algemene indruk (Theuns, 1999). De generosity bias staat in verband met het concept referentiekader. Verschillende beoordelaars vertalen hun subjectieve indruk op een verschillende manier in een getal of score. Daarnaast lijken sommige beoordelaars extreme responscategorieën te vermijden (tendens naar het midden), waardoor de beoordelingsschaal voor het beoordelen van extreme stimuli anders wordt gebruikt dan bij meer gematigde stimuli: grote verschillen in extremen leveren slechts kleine verschillen in beoordelingen, terwijl kleinere verschillen tussen stimuli toch verschillende beoordelingen leveren. De contrast fout houdt in dat beoordelaars hun eigen positie hanteren als een ankerpunt om vanuit daar anderen te beoordelen. Zo kan iemand die zelf heel erg precies is snel geneigd zijn om een ander wanordelijk te noemen.

Met betrekking tot dit onderzoek betekent dit bijvoorbeeld dat het huidige functioneren van de RvC in de onderneming van de respondenten van invloed kan zijn op hun mening omtrent de elementen in het algemeen. Ook zou een secretaris die over het algemeen van mening is dat structuurkenmerken niet belangrijk zijn, alle elementen in die categorie laag te scoren. Deze systematische fouten moeten in het achterhoofd gehouden worden bij het interpreteren van de conclusies.

De genoemde gevaren zijn inherent aan het gebruiken van een schaal en zullen dus altijd in meer of mindere mate blijven bestaan. Wel kan een aantal dingen worden gedaan om de kans erop te beperken. Belangrijk hierbij is dat de referentiekaders van de verschillende respondenten niet te ver uiteen liggen. Om deze reden leg ik in de introductie van de vragenlijst enkele begrippen uit, zoals effectiviteit van intern toezicht, om te voorkomen dat ze door verschillende mensen anders worden geïnterpreteerd.

Om dezelfde reden heb ik de elementen die in hoofdstuk 2 uit de literatuur naar voren komen als mogelijk bepalend, zo veel mogelijk onveranderd in de vragenlijst terug laten komen. Dit zijn vaak tegelijkertijd de begrippen zoals die ook gehanteerd worden in het bedrijfsleven. Op die manier is mijns inziens de kans het grootst dat verschillende secretarissen hetzelfde verstaan onder de begrippen. Daarnaast heb ik bij enkele elementen die mogelijk niet geheel eenduidig te interpreteren zijn, een verduidelijking tussen haakjes toegevoegd: bijvoorbeeld “De dominantie van de CEO binnen het bestuur (‘CEO model’).” Het gevaar dat onder een element door verschillende mensen iets anders wordt verstaan, zal blijven bestaan, maar wordt nu mijns inziens zo veel mogelijk beperkt.

Pre-testing

Voordat de vragenlijst wordt uitgezet, heeft een klankbordgroep vanuit de steekproef naar de vragenlijst gekeken. Het is namelijk gebruikelijk dat het proces van dataverzameling begint met een pilot test (Blumberg et al., 2005, p. 68). Door het uitvoeren van een dergelijke test kunnen eventuele zwakheden in het onderzoeksontwerp en gehanteerde instrumentarium worden gedetecteerd. Een specifieke vorm van pilot testing is pre-testing, waarbij respondenten uit de steekproef worden ingezet om het meetinstrument te verfijnen. De klankbordgroep die voor het uitzetten de vragenlijst grondig zal bekijken en van feedback zal voorzien, kwalificeert als deze vorm van pilot testing. De pilot verschaft mij voornamelijk informatie over de vorm van de vragenlijst, bijvoorbeeld de lengte, de manier van vragen stellen en de houding naar de respondenten. Ook kan de klankbordgroep het aangeven als ik inhoudelijk iets belangrijks over het hoofd heb gezien. Pre-testing zal de kwaliteit van de uiteindelijke versie ten goede komen.

Uit de pre-test zijn enkele kleine verbeterpunten naar voor gekomen, voornamelijk met betrekking tot de (on)duidelijkheid van de vragenlijst. Zo heb ik naar aanleiding van de pre-test een uitleg aan de begrippen one en two tier toegevoegd; ook heb ik nog sterker benadrukt dat onderdeel B betrekking heeft op bepalende elementen in het algemeen en onderdeel C en D specifiek op de onderneming waar de betreffende secretaris werkzaam is.

Toezending

De questionnaire zal via e-mail aan de NIVE-respondenten worden toegezonden; zij kunnen de lijst digitaal invullen en via e-mail, per post of per fax terugsturen. De overige secretarissen stuur ik een brief en kunnen van dezelfde media gebruik maken om deze te retourneren.

Gebruik gedeelte vragenlijst

De door mij opgestelde vragenlijst die de secretarissen zal worden voorgelegd, tracht een aantal zaken te achterhalen: welke factoren in het algemeen volgens vennootschapssecretarissen bepalend zijn voor effectief intern toezicht, én hoe het interne toezicht binnen Nederlandse organisaties eventueel verbeterd kan worden, welke factoren deze mogelijke verbeteringen in de weg zouden kunnen staan en hoe de secretarissen denken over hun eigen rol en positie (met betrekking tot corporate governance). Deze master thesis betreft alleen het eerste onderwerp, waardoor ik voor dit onderzoek dus een gedeelte van de vragenlijst zal gebruiken (vergelijk Cornforth, 2001). Het onderdeel dat ik gebruik is in Bijlage 1 rood omrand.

Het gebruiken van een deel van de vragenlijst is niet zonder gevaar: het feit dat naast de elementen die over het algemeen bepalend zijn voor effectief intern toezicht, ook wordt gevraagd naar de situatie binnen de eigen onderneming omtrent dit onderwerp, kan van invloed zijn op de

betrouwbaarheid van de antwoorden op eerstgenoemde vragen. Dit punt wordt nader geadresseerd in de paragraaf ‘vorm en implicaties samenwerking met externe partijen’ (paragraaf 3.4).

In document (Een) goede raad is goud waard (pagina 58-63)