Waarom ontbreekt big data in de planning- en risicobeoordelingsfase : uitdagingen bij de implementatie van big data in de plannings- en risicobeoordelingsfase van een audit

(1)

Waarom ontbreekt big data in de planning- en risicobeoordelingsfase

Uitdagingen bij de implementatie van big data in de plannings- en risicobeoordelingsfase van

een audit

Jacob Zwiers

11024453

Begeleider:

Dhr. dr. E.E.O. Roos Lindgreen

BSc Accountancy & Control

Universiteit van Amsterdam

Eerste versie

26 juli 2018

Woordentotaal:

8460

(2)

Verklaring eigen werk

Hierbij verklaar ik, Jacob Zwiers, dat ik deze scriptie zelf geschreven heb en dat ik de volledige verantwoordelijkheid op me neem voor de inhoud ervan.

Ik bevestig dat de tekst en het werk dat in deze scriptie gepresenteerd wordt origineel zijn en dat ik geen gebruik heb gemaakt van andere bronnen dan degene die in de tekst en in de referenties worden genoemd.

De Faculteit Economie en Bedrijfskunde is alleen verantwoordelijk voor de begeleiding tot het inleveren van de scriptie, niet voor de inhoud.

(3)

Abstract

Big data-analyse heeft de potentie de plannings- en risicobeoordelingsfase van de audit aanzienlijk te veranderen. Echter, vooralsnog is implementatie van deze analysemethoden uitgebleven. In dit literatuuronderzoek wordt antwoord gegeven op de hoofdvraag: Welke uitdagingen belemmeren de implementatie van big data-analyse in de plannings- en

risicobeoordelingsfase van een audit. Dit onderzoek draagt bij aan de bestaande literatuur op twee manieren: Ten eerste worden toepassingen van big data-analyse in de plannings- en

risicobeoordelingsfase van de jaarrekeningaudit geïdentificeerd, waarna uitdagingen worden geïdentificeerd die implementatie in de weg staan. Ten tweede kan het uitgevoerde onderzoek waarin literatuur over big data-analyse in auditing wordt samengevoegd dienen als verwijspunt voor verder onderzoek. Uit dit onderzoek blijkt dat de benodigde analytische vaardigheden, de

vertrouwelijkheid van informatie, en het belang van theorie bij de interpretatie van resultaten uitdagingen zijn die de auditprofessie zal moeten overkomen om succesvol van big data-analyse gebruik te kunnen maken.

(4)

Inhoudsopgave

1. INLEIDING ...5 2. THEORETISCH KADER ...7 2.1ALGEMENE THEORIE ...7 2.2PLANNINGS- EN RISICOBEOORDELINGSFASE ...8 2.3BIG DATA ... 10

2.3.1 Drie V’s: Volume, Velocity en Variety ... 10

2.3.2 Veracity, Variability (and Complexity) en Value ... 11

2.4BIG DATA-ANALYSE ... 11 2.4.1 Tekstanalyse ... 12 2.4.2 Audioanalyse ... 12 2.4.3 Videoanalyse ... 13 2.4.4 Socialemedia-analyse ... 13 2.4.5 Voorspellende analyse ... 13

3 BIG DATA IN PLANNING EN RISICOBEOORDELING ... 14

4 UITDAGINGEN BIJ DE IMPLEMENTATIE VAN BIG DATA ... 17

4.1ANALYTISCHE VAARDIGHEDEN ... 17

4.2VAN CAUSATIEF NAAR CORRELATIEF ... 19

4.3THEORIE ACHTER CORRELATIE ... 21

(5)

1. Inleiding

De auditprofessie staat al enige tijd onder druk. Deze conclusie valt te trekken uit het groenboek (Europese Commissie, 2010). Hierin wordt gesteld dat de ‘redelijke mate van zekerheid’ die de auditor dient te verschaffen over de vraag of de financiële verslaggeving een getrouw beeld geeft van de werkelijkheid, in de praktijk meer is gericht op de vraag of de verslaggeving is opgesteld conform de normen van het geldende financiële stelsel. Ook verscheen in 2014 in Nederland een rapport van de Autoriteit Financiële Markten (AFM), waarin veertig wettelijke controles uitgevoerd door de Big Four accountantsorganisaties (KPMG, Deloitte, PricewaterhouseCoopers en Ernst & Young), tien per kantoor, werden beoordeeld op de hoeveelheid en geschiktheid van de verkregen controle-informatie. Uit het rapport bleek dat de AFM van mening was dat in 52 procent van de beoordeelde wettelijke controles (grotendeels uitgevoerd in 2013) geen voldoende en geen geschikte controle-informatie was verkregen (AFM, 2014).

De opkomst van big analyse heeft volgens verschillende auteurs uit de Big

data-forumeditie van Accounting Horizons de potentie de audit op verschillende manieren te veranderen (American Accounting Association, 2015). Vasarhelyi, Kogan, en Tuttle (2015) beschrijven in hun overzicht ‘Big data in accounting’ bijvoorbeeld de mogelijkheid gedetailleerde in plaats van samengevatte transactiedata te controleren, intern en extern gegenereerde data met traditionele financiële gegevens te integreren, en non-financiële gegevens (bijvoorbeeld afkomstig van sociale media of nieuwspagina’s) te gebruiken als benchmark in het auditproces. Wellicht ligt hierin de toekomst voor de auditprofessie. Uit een onderzoek uitgevoerd door Gartner in 2014 onder 302 organisaties bleek dat 72 procent van plan was te investeren, of al had geïnvesteerd in big data en big data-analysemethoden (Gartner, 2014). In 2015 herhaalde Gartner dit onderzoek en vond dat het percentage gestegen was naar 75 procent (Rossi, 2015). Uit deze percentages valt te concluderen dat het onderwerp big data op zijn minst de aandacht heeft getrokken (Gartner, 2014).

Ondanks de investeringsplannen (Gartner, 2014) en de potentie die big data-analyse te bieden heeft volgens de auteurs uit de forumeditie van Accounting Horizons (American Accounting Association, 2015) heeft er nog geen succesvolle implementatie van big data-analyse in de

auditprofessie plaatsgevonden. In dit onderzoek zal daarom worden gekeken naar de implementatie van big data-analyse bij het uitvoeren van een audit, en dan specifiek naar de plannings- en

risicobeoordelingsfase van de audit. In deze fase wordt de keuze gemaakt een klant al dan niet aan te nemen of te behouden, waarna de organisatie en de omgeving van de klant worden onderzocht. Aan de hand daarvan worden risico-inschattingen gemaakt (Arens, Elder, Beasley & Hogan, 2016, pp. 260-300). Juist bij het uitvoeren van deze activiteiten kan op verschillende manieren gebruik worden gemaakt van big data. Supermarktketen Walmart bijvoorbeeld past big data-analyse toe, en kreeg zo

(6)

inzicht in de verbanden tussen de weersverwachting en de verkoop van specifieke producten (Hays, 2004). Zo ging bij orkaandreigingen de verkoop van ontbijtsnack Pop-Tarts omhoog met factor zeven. Dit soort informatie kan worden gebruikt om per geografische locatie nauwkeurige voorspellingen te doen met betrekking tot verkoopverwachtingen (Cao, Chychyla en Stewart, 2015). Bollen, Mao en Zeng (2011) analyseerden sociale media en voorspelden met succes fluctuaties in de Dow Jones Industrial Average-koers. Informatie over het financieel vooruitzicht kan vervolgens bijdragen aan de beoordeling van opgenomen voorzieningen (Krahel & Titera, 2015).

In dit onderzoek wordt antwoord gegeven op de volgende vraag:

Welke uitdagingen staan de implementatie van big data-analyse in de plannings- en risicobeoordelingsfase van de audit in de weg?

Hoewel er inmiddels veel is geschreven over de potentiële voordelen van big data maar implementatie vooralsnog uitblijft, is nader onderzocht welke factoren deze innovatie belemmeren. Deze vraag wordt beantwoord aan de hand van een literatuuronderzoek. Dit draagt op de volgende manieren bij aan de bestaande literatuur. Ten eerste worden toepassingen van big data-analyse in de plannings- en risicobeoordelingsfase van de jaarrekeningaudit behandeld, waarna uitdagingen worden geïdentificeerd die implementatie in de weg staan. Ten tweede kan het uitgevoerde onderzoek waarin literatuur over big data-analyse in auditing wordt samengevoegd dienen als verwijspunt voor verder onderzoek.

Het onderzoek is als volgt gestructureerd. In hoofdstuk 2 wordt de plannings- en

risicobeoordelingsfase van de audit uiteengezet. Ook worden hierin big data en een vijftal big data-analysemethoden beschreven. In hoofdstuk 3 worden mogelijke toepassingen van big data-analyse in de plannings- en risicobeoordelingsfase beschreven, waarna in hoofdstuk 4 uitdagingen met

betrekking tot de implementatie worden geïdentificeerd. Hierbij wordt rekening gehouden met de verschillen in uitdagingen voor grote en middelgrote tot kleine accountantskantoren. In hoofdstuk 5 volgt een discussie over de resultaten uit hoofdstuk 4, gevolgd door een conclusie met het antwoord op de onderzoeksvraag.

(7)

2. Theoretisch kader

In deze paragraaf wordt de theorie die relevant is voor dit onderzoek uiteengezet. Eerst wordt algemene theorie met betrekking tot het uitvoeren van een audit besproken. Daarna wordt de plannings- en risicobeoordelingsfase van de audit behandeld. Als laatste komt big data en een vijftal big data-analysemethoden aan bod.

2.1 Algemene theorie

Voor theorie met betrekking tot de auditprofessie is voornamelijk gebruikgemaakt van het werk van Arens et al. uit 2016.

Het uitvoeren van een audit is het verzamelen en beoordelen van bewijsmateriaal aan de hand waarvan de mate van overeenstemming met gevestigde criteria wordt vastgesteld en

gerapporteerd. Een audit moet door een bekwaam en onafhankelijk persoon uitgevoerd worden. Bij het uitvoeren van een jaarrekeningaudit focust de auditor op het controleren of de financiële rapportage een getrouw beeld geeft van de economische gebeurtenissen uit de accountingperiode (Arens et al., 2016, pp. 27-47). Auditors spelen volgens Arens et al. (2016) een belangrijke rol in het reduceren van het informatierisico. Dit is het risico dat informatie die is gebruikt voor besluitvorming onjuist is. Auditbewijs is elke bron van informatie die gebruikt wordt door de auditor om te bepalen of de informatie waarop de audit wordt uitgevoerd overeenstemt met de gevestigde criteria. Auditbewijs kan onder andere de vorm aannemen van elektronische of schriftelijke transactionele data, elektronische of schriftelijke communicatie, observaties door de auditor of een mondelinge getuigenverklaring door de klant (Arens et al., 2016, pp. 27-47). De audit voorziet gebruikers van de financiële rapportages van een oordeel of de rapportage met een redelijke mate van zekerheid vrij is van materiële fouten of omissies (Arens et al., 2016. pp. 166-218). Fouten of omissies zijn materieel wanneer de omvang van de fout of omissie gezien de omstandigheden waarschijnlijk de

oordeelsvorming van een redelijk denkend persoon, die van de juistheid van de gegevens uitgaat, zou beïnvloeden (Arens et al., 2016. pp. 260-300).

Voor het doel van dit onderzoek is het noodzakelijk categorieën aan te brengen op basis van de grootte van accountantskantoren. Arens et al. (2016) onderscheiden drie categorieën: Big Four-kantoren (Deloitte, PwC, Ernst & Young en KPMG), nationale en regionale Four-kantoren (deze kunnen beschikken over internationale capaciteiten maar zijn aanzienlijk kleiner dan Big Four-kantoren) en lokale kantoren (deze verrichten voornamelijk diensten voor kleinere organisaties en

non-profitorganisaties op beperkte afstand van het kantoor). In dit onderzoek zal onderscheid worden gemaakt tussen grote kantoren, dit zijn de Big Four-kantoren, en middelgrote tot kleine kantoren, dit zijn de nationale, regionale en lokale kantoren.

(8)

Aangezien dit onderzoek zich specifiek richt op de plannings- en risicobeoordelingsfase van de audit, wordt deze fase hieronder eerst nader omschreven.

2.2 Plannings- en risicobeoordelingsfase

Auditplanning begint bij het accepteren van de klant. De auditor start een onderzoek naar het financiële vooruitzicht en de stabiliteit van de klant. Daarnaast onderzoekt hij de relatie van de potentiële klant met de vorige auditor, en stelt hij vast dat hij aan alle vereisten van de controle die de organisatie verlangt kan voldoen. De auditor wenst de keuze een klant te behouden of aan te nemen vroeg te maken, voordat significante kosten worden gemaakt waar niets tegenover staat. Hierbij moet hij rekening houden met het engagement risk. Dit is het risico op nadelige

consequenties voor de auditor als gevolg van zijn relatie met de klant, of het rapport dat hij heeft uitgebracht nu correct is of niet. Het engagement risk is hoog wanneer de kans op faillissement van de klant groot is, omdat in dit geval betaling van de auditor mogelijk uitblijft en de kans bestaat op een rechtszaak jegens de auditor met de hieraan verbonden kosten.

Na acceptatie van de klant wordt het team samengesteld dat de audit zal uitvoeren (Arens et al., 2016, pp. 260-300). Vervolgens start de auditor een onderzoek naar de organisatie en haar omgeving. Wanneer de auditor zich met de omgeving bekend heeft gemaakt, maakt hij een inschatting van het client business risk, het risico dat de klant zijn doelstellingen niet haalt. Knechel (2001, pp. 86-119) onderscheidt vijf risicofactoren die het client business risk beïnvloeden: het management, de industrie of sector, de bedrijfsvoering, de mogelijkheid tot diefstal en de internebeheersingsmaatregelen. Voor het beoordelen van het client business risk schrijft hij een drietal analyses voor (Knechel, 2001, pp. 120-146). De eerste is de strategische risicoanalyse, waarbij de positie van de organisatie tegenover externe zaakgelastigden en belanghebbenden wordt

onderzocht. Arens et al. (2016, pp. 301-336) schrijven een vergelijkbare strategische analyse voor, waarin het analyseren van het businessmodel centraal staat. Hierbij wordt gekeken naar de bron van inkomsten, klanten en financiering. De tweede analyse die Knechel (2001, pp. 120-146) voorschrijft om het client business risk te bepalen is een procesrisicoanalyse. In deze analyse worden de

processen onderzocht waarmee de klant reageert op strategische risico’s en zijn strategische doelen probeert te behalen. Arens et al. (2016, pp.301-336) schrijven als tweede stap een beoordeling van organisatiestructuur, ethische code en prestatieindicatoren voor. De strategieën van de klant worden door Arens et al. (2016, pp.301-336) beoordeeld op betrouwbaarheid van de financiële rapportage, effectiviteit, efficiëntie, en overeenstemming met regulering en wetgeving. De derde analyse die Knechel (2001, pp. 120-146) voorschrijft is de resterende risicoanalyse. In deze laatste stap worden

(9)

de risico’s onderzocht die onvoldoende worden beheerst of die geen directe schade aanrichten aan de organisatie.

Na het vaststellen van het client business risk stelt de auditor het inherente risico (IR) vast. Dit is het risico dat materiële fouten zich voordoen, ongeacht de getroffen

internebeheersingsmaatregelen (Arens et al., 2016, pp. 301-336). Hiervoor is het noodzakelijk eerst een materialiteitsgrens vast te stellen. Dit is de grens uitgedrukt in een monetaire eenheid vanaf waar fouten in de financiële verslaggeving worden beschouwd als materieel. De materialiteitsgrens wordt vaak gesteld op een percentage van het netto-inkomen van een organisatie, omdat voor commerciële organisaties winst vaak een benchmark is voor het beoordelen van materialiteit (Arens et al., 2016, pp. 260-300). Deze materialiteitsgrens wordt opgedeeld in

uitvoeringsmaterialiteitsgrenzen, dit zijn materialiteitsgrenzen voor individuele auditsegmenten (Arens et al., 2016, pp. 260-300). De auditor maakt een inschatting van het inherente risico voor elk auditsegment aan de hand van voorbereidende analytische procedures (vaak ratioanalyses), observaties bij de klant en interviews met personeel. Het inherente risico wordt bepaald door significante bedrijfsspecifieke risico’s die het gevolg kunnen zijn van fraude of fouten. Het is van invloed op de hoeveelheid auditbewijs dat nodig is om een acceptabel auditrisico (AAR) te behalen. Dit is een voor de auditor acceptabel risico dat de financiële rapportage materiële fouten bevat nadat de audit is afgerond en een goedkeurend rapport is afgegeven (Arens et al., 2016, pp. 301-336). Om het risico op fraude vast te stellen wordt gebruik gemaakt van de fraudedriehoek die bestaat uit drie risicofactoren voor de aanwezigheid van fraude: Een prikkel of drijfveer voor het plegen van fraude, een gelegenheid voor het plegen van fraude en een persoonlijke rationalisering voor het plegen van fraude (Arens et al., 2016, pp. 337-374).

Na het vaststellen van het inherente risico maakt de auditor een inschatting van het controlerisico (CR), het risico dat een fout niet wordt ontdekt door het

internebeheersingsmaatregelen van de klant. Ook dit risico wordt vastgesteld voor elk segment van de audit. Bij de beoordeling van het controlerisico wordt vaak gebruikgemaakt van een risicomatrix, waarbij de auditdoelen met betrekking tot de interne controle samen met de

internebeheersingsmaatregelen in een matrix worden geplaatst. In de matrix wordt aangegeven welke maatregelen zijn getroffen om de internebeheersingsdoelen te bereiken (Arens et al., 2016, pp. 375-397). De controlemiddelen dragen bij aan betrouwbaardere verslaggeving, effectieve en efficiënte bedrijfsprocessen, en een rapportage die in overeenstemming is met controlestandaarden. Wanneer er sprake is van een sterke interne controle zal de auditor minder auditbewijs hoeven te verzamelen, omdat afwijkingen en fouten door het controlesysteem zullen worden geïdentificeerd (Arens et al., 2016, pp. 375-397).

(10)

Op basis van deze planning- en risico-inschattingen wordt de auditstrategie ontworpen. Hierbij wordt gebruikgemaakt van het auditrisicomodel. De uitkomst van het auditrisicomodel is het

planned detection risk (PDR). Dit is het risico dat bij het verzamelen van het auditbewijs mogelijke

materiële fouten niet worden ontdekt. Het auditrisicomodel kent de volgende vorm: PDR = AAR / (IR x CR). Het model helpt de auditor te bepalen hoeveel auditbewijs er verzameld moet worden om een acceptabel auditrisico te behalen. De auditor kiest hierna welke controles hij uit gaat voeren. Deze controles hebben betrekking op het internebeheersingssysteem, de correctheid van transacties, analytische procedures om de prognoses van de auditor te vergelijken met de werkelijke cijfers, en controle van de balansposten (Arens et al., 2016, pp. 448-473).

2.3 Big data

Het begrip big data wordt in de huidige literatuur op verschillende manieren gedefinieerd. Gandomi en Haider (2015) spreken van big data wanneer traditionele analysetechnieken niet langer tijdig de informatiebehoefte van een organisatie kunnen bevredigen. Maniyaka et al. (2011) stellen dat het begrip big data refereert aan datasets waarvan de omvang het ontvangen, opslaan,

structureren en analyseren van deze data door middel van traditionele software-analysetools onmogelijk maakt. Wanneer dit kantelpunt wordt bereikt, werkt een organisatie met big data, en zouden big data-analysetechnieken een oplossing bieden. Het begrip kan worden opgesplitst in een aantal kenmerken. Verschillende auteurs behandelen big data aan de hand van een verschillend aantal kenmerken, uiteenlopend van drie V’S tot zes V’s.

2.3.1 Drie V’s: Volume, Velocity en Variety

McAfee, Brynjolfsson, Davenport, Patil, en Barton (2012) bespreken drie kenmerken van big data: volume, velocity en variety. Volume geeft de omvang van de datasets aan. Volgens McAfee et al. (2012) worden big data gekenmerkt door een volume uitgedrukt in petabytes (een petabyte is een miljoen gigabytes). Volgens Tanwar, Duggal & Khatri (2015) kunnen big data qua volume beginnen bij terabytes en oneindig oplopen. Een duidelijke ondergrens aan het volume van big data blijft dan ook uit in de huidige literatuur; verschillende auteurs houden er verschillende meningen op na. Gandomi en Haider (2015) stellen dan ook dat een harde norm met betrekking tot het volume van big data onmogelijk is, en wel om de volgende twee redenen. Ten eerste bestaat er geen algemeen geaccepteerde definitie voor big data, en ten tweede zal wat beschouwd wordt als big data in hetzelfde tempo groeien als de opslagmogelijkheid van deze data.

Het tweede kenmerk dat McAfee et al. bespreken is variety, oftewel variëteit. Veel van de belangrijkste databronnen zijn volgens hen relatief nieuw. Deze bronnen kunnen onder andere zijn:

(11)

socialemediaplatformen, mobiele telefoons, bewakingscamera’s, scanners en sensoren. Daarom stellen ook Gandomi en Haider (2015) dat big data worden gekenmerkt door structurele

heterogeniteit binnen datasets. Slechts vijf procent van alle data is gestructureerd, dat wil zeggen tabellarische data in spreadsheets of databases. De overige vijfennegentig procent omspant een continuüm tussen semigestructureerde en ongestructureerde datasets, afkomstig uit verscheidene bronnen.

Het derde kenmerk besproken door McAfee et al. (2012) is velocity, de snelheid waarmee nieuwe data worden gegenereerd. Volgens hen is het tempo waarop data worden gegenereerd belangrijker dan het volume, omdat dit de snelheid bepaalt waarmee er op deze data gereageerd moet worden. Volgens Tanwar et al. (2015) was negentig procent van de totale bestaande data in 2015 afkomstig uit de twee voorafgaande jaren, en groeit de generatie van data exponentieel. Tijdige verwerking van data kan om deze reden volgens Gandomi en Haider (2015) bijdragen aan de opbouw van een concurrentievoordeel.

2.3.2 Veracity, Variability (and Complexity) en Value

Gandomi en Haider (2015) bespreken als toevoeging op deze drie kenmerken nog drie recentelijk toegevoegde kenmerken van big data: veracity, toegekend door International Business Machines Corporation (IBM), variability and complexity toegekend door Statistical Analysis Systems Institute (SAS) en value toegekend door de Oracle Corporation. Het kenmerk veracity heeft

betrekking op de onbetrouwbaarheid van de data. Big data kunnen onnauwkeurig en onzeker van aard zijn, waardoor analysetools ontworpen voor onzekere datasets vereist zijn (Gandomi & Haider, 2015). Het kenmerk variability verwijst naar de periodieke pieken en dalen in de generatie van data. Complexity verwijst naar het verzamelen en combineren van data uit verschillende bronnen, deze vergelijkbaar maken en opschonen (Gandomi & Haider, 2015). Het laatste kenmerk is value, en heeft betrekking op de waarde in relatie tot het volume. Deze waarde wordt gecreëerd door de informatie die aan data kan worden onttrokken (Gandomi & Haider, 2015).

2.4 Big data-analyse

Volgens Tanwar et al. (2015) kan big data-analyse worden beschreven als het proces van het verzamelen, opslaan en analyseren van datasets met een hoog volume, een hoge generatiesnelheid en een hoge diversiteit aan brondata, met als doel het ontdekken van patronen, tegenstrijdigheden en inzichten. Deze definitie is bewust subjectief, omdat wat beschouwd wordt als een hoog volume, hoge snelheid, en hoge diversiteit aan brondata is onderworpen aan verandering naarmate

(12)

In de volgende paragraaf worden tekst-, audio-, video-, socialemedia- en voorspellende analyses besproken. Van deze technieken worden alleen de relevante aspecten voor de

jaarrekeningaudit uiteengezet. Andere big data-analysetechnieken kunnen tevens relevant zijn voor de jaarrekeningaudit, maar in verband met de omvang van het onderzoek is voor deze vijf methoden gekozen. De gekozen technieken worden in de volgende paragraaf in de context van de audit

geplaatst. Het is van belang de werking van de besproken analyses te begrijpen, omdat dit bijdraagt aan de kennis die vereist is om uitdagingen bij de implementatie van deze analyses te herkennen.

2.4.1 Tekstanalyse

Tekstanalyse, ofwel tekstmining, refereert aan het onttrekken van informatie aan tekstuele data. Informatie-extractie is een techniek waarbij algoritmes gebruikt worden om gespecificeerde gegevens te onttrekken aan ongestructureerde of semigestructureerde datasets. Twee gegevens die onttrokken worden aan de brontekst die door zowel Tanwar et al. als Gandomi en Haider worden besproken, zijn entiteiten en relaties. Entiteitsextractie richt zich op het vinden van namen van personen, organisaties en plaatsen. Ook jaartallen kunnen worden herkend (Jiang, 2012, pp. 34-35). Relatie-extractie richt zich op het vinden van de semantische relatie tussen twee entiteiten. Deze relaties kunnen verschillende vormen aannemen, bijvoorbeeld: fysiek, wanneer twee entiteiten fysiek dicht bij elkaar liggen, persoonlijk of sociaal, wanneer er sprake is van familie, maar ook een werkrelatie of verwantschap is mogelijk, bijvoorbeeld een voorkeur voor een politieke partij (Jiang, 2012, pp. 34-35). Een tweede techniek is sentimentanalyse, ook wel opinion mining genoemd. Sentimentanalysetechnieken kunnen volgens Tanwar et al. (2015) worden gebruikt om de mening van een auteur aan opiniegeladen tekst te onttrekken. Ook wordt onttrokken waar de opinie op gericht is. Dit kunnen bijvoorbeeld individuen, organisaties, merken, films of evenementen zijn. Feldman (2013) stelt dat het resultaat van de analyse wordt uitgedrukt op een vooraf vastgestelde schaal. Hierbij wordt gebruikgemaakt van een beschikbaar gestelde encyclopedie waarin de betekenis van verschillende waardeoordelen liggen vastgelegd. Algoritmes worden gebruikt om gewicht aan elk waardeoordeel toe te kennen.

2.4.2 Audioanalyse

Audioanalyse is het proces waarbij informatie wordt onttrokken aan ongestructureerde gesproken audiodata. De term spraakanalyse wordt gebruikt wanneer deze methode wordt toegepast op gesproken tekst (Tanwar et al., 2015). Bij de Large Vocabulary Continuous Speech Recognition-methode (LVCSR) zijn er twee fases te onderscheiden. In de eerste fase worden de gesproken audiodata omgezet in tekst door middel van automatische spraakherkenning. De gesproken woorden worden geïdentificeerd en gegenereerd aan de hand van een in het proces

(13)

opgenomen woordenboek. De output van deze fase is een document waarin de gesproken woorden uit het audiobestand staan opgeschreven. In de tweede fase kan dit document worden geanalyseerd door middel van tekstanalysetechnieken (Gandomi & Haider, 2015).

2.4.3 Videoanalyse

Videoanalyse wordt door Tanwar et al. (2015) omschreven als het monitoren, analyseren en afleiden van inzichten uit videodata. De voornaamste bronnen zijn volgens hen closed-circuit television-systemen (CCTV), camera’s en videosharingwebsites als YouTube. In de context van de audit biedt videoanalyse de mogelijkheid een helder beeld te vormen van de klanten van een organisatie en hun koopgedrag. Door gebruik te maken van algoritmische functies kan waardevolle informatie over de klant zoals geslacht, leeftijd en etniciteit aan videobeeld worden onttrokken (Gandomi & Haider, 2015).

2.4.4 Socialemedia-analyse

Zowel Tanwar et al. (2015) als Gandomi en Haider (2015) beschrijven socialemedia-analyse als de analyse van inhoud afkomstig van sociale platforms zoals blogs, sociale netwerken, sociaal nieuws, mediasharing platforms, open encyclopedieën, fora en reviewwebsites. Binnen

socialemedia-analyse zijn er twee informatiebronnen: de door een gebruiker gegenereerde inhoud, en de interactie tussen twee gebruikers. De content kan de vorm aannemen van tekst, foto, video, audio of een combinatie hiervan. Om de inhoud afkomstig van deze platforms te analyseren, kan om deze reden een combinatie van tekst-, audio-, en videoanalyse gebruikt worden (Gandomi & Haider, 2015).

2.4.5 Voorspellende analyse

Bij voorspellende analyses wordt gebruikgemaakt van historische data om toekomstige uitkomsten te voorspellen. Deze vorm van analyse baseert voorspellingen op gevonden patronen en relaties in historische data (Gandomi & Haider, 2015). Onderscheid kan worden gemaakt tussen twee categorieën. De eerste zoekt naar patronen in historische data en extrapoleert deze naar

toekomstige gebeurtenissen. De tweede categorie zoekt naar onderlinge afhankelijkheid tussen variabelen en gebruikt deze afhankelijkheid als basis voor een voorspelling. Beide analyses zijn voornamelijk gebaseerd op statistische methodologie (Gandomi & Haider, 2015).

(14)

3 Big data in planning en risicobeoordeling

In dit hoofdstuk worden mogelijke toepassingen van big data-analyse in de plannings- en risicobeoordelingsfase van de audit besproken. In de planningsfase van de audit worden

voorbereidende analytische procedures uitgevoerd om risico’s toe te wijzen aan auditsegmenten (Arens et al., 2016, pp. 301-323). Arens et al. (2016) schrijven dat bij het onderzoeken van de organisatie en de externe omgeving van de klant alle soorten relevante data moeten worden onderzocht die kunnen bijdragen aan het onderzoek. Gezien de omvang van verschillende soorten data die tegenwoordig beschikbaar zijn, zijn Rose, Rose, Sanderson en Thibodeau (2017) van mening dat het gebruik van big data-analyse de potentie heeft de voorbereidende analytische procedures effectiever te maken.

Het eerste voordeel van het gebruik van big data-analyse is een sterk voorspellend vermogen (Alles & Gray, 2016). Dit kan, in combinatie met tekst-, audio-, en videoanalyse, op verschillende manieren worden ingezet. Voorspellingen kunnen door de auditor worden gebruikt als benchmark (Yoon, Hoogduin & Zhang, 2015). Zo ontstaat de mogelijkheid tekstanalyse toe te passen op sociale media om de financiële stabiliteit van een klant te beoordelen. Door gebruik te maken van

sentimentanalyse wisten Bollen et al. (2011) in hun onderzoek met succes voorspellingen te doen over fluctuaties in de Dow Jones Industrial Average (DJIA). Hiervoor werd gebruikgemaakt van tekstberichten afkomstig van Twitter. In twee vergelijkbare onderzoeken door Chan (2003) en Mittermayer (2004) werden nieuwsartikelen gebruikt om met succes fluctuaties in aandelenprijzen te voorspellen. Het gebruik van sentimentanalyse toegepast op sociale media of nieuwsartikelen biedt de auditor de mogelijkheid de financiële situatie van een klant te beoordelen op basis van extern gegenereerde data. Deze toepassing, besproken door Cao et al. (2015), kan bijvoorbeeld bijdragen aan een betere inschatting van het engagement risk, en een verkleining van de kans op juridische geschillen die kunnen ontstaan in geval van faillissement van de klant.

Daarnaast kunnen big data-analysetechnieken worden gebruikt om verkoopverwachtingen per locatie te voorspellen en beoordelen (Cao et al., 2015). Zoals blijkt uit een artikel van Hays (2004) maakt supermarktketen Walmart gebruik van big data-analyse om zijn voorraad op peil te houden. Walmart analyseert de verkoop van producten in bepaalde regio’s en zoekt naar verbanden met de regionale weersverwachting. Dit resulteerde onder andere in het nieuwe inzicht dat bij

orkaandreigingen de ontbijtsnack Pop-Tarts zeven keer meer verkocht werd. Op basis van geografische en demografische data kunnen volgens Cao et al. (2015) potentieel nauwkeurige schattingen worden gedaan met betrekking tot verkooptrends en verwachtingen. Dit resulteert in een extern gegenereerde benchmark waarmee verkoopverwachtingen van de klant kunnen worden vergeleken. Ook kunnen deze voorspellende analyses worden gebruikt om inschattingen te maken

(15)

van posten als dubieuze debiteuren, kredietvoorzieningen, geleden maar nog niet gerapporteerde schadeclaims en garantie- en pensioenkosten. Dit kan leiden tot het nauwkeuriger inschatten van het inherente risico (Krahel & Titera, 2015).

Een ander voorbeeld van het sterke voorspellende vermogen van big data-analyse is het gebruik van tekstanalyse om klanttevredenheid te meten (Yoon et al., 2015). Op basis van deze informatie kan de auditor zich een duidelijk beeld vormen van de klantenkring van een organisatie en de verkoopverwachtingen van producten. Warren, Moffitt en Byrnes (2015) stellen voor

audioanalyse toe te passen op telefoongesprekken met klanten als een alternatieve manier om klanttevredenheid te meten. Deze informatie is van belang bij het inschatten van het klantrisico en inherente risico (Arens et al., 2016, pp. 301-323). Zoals besproken in Yoon et al. (2015) kunnen big data betrouwbare informatie opleveren, omdat de grootte van de datasets en de snelheid waarmee de data gegenereerd worden het moeilijk maken de data te bewerken. Ook stellen zij dat een bepaalde mate van onbetrouwbaarheid wegvalt tegen het volume van de totale dataset. Echter, Yoon et al. (2015) stellen dat bij het gebruik van dergelijke analyses rekening moet worden gehouden met het feit dat het platform waarop de analyse wordt uitgevoerd wellicht de volledige populatie niet eerlijk vertegenwoordigt.

Het tweede voordeel van big data-analyse is het identificeren van afwijkingen en

tegenstrijdigheden in grote datasets, zoals het geval kan zijn bij frauduleuze activiteit (Alles & Gray, 2016). Volgens Allen en Gray is het onwaarschijnlijk dat fraudeurs alle voorafgaande non-financiële transacties kunnen wijzigen om fraude te verhullen. Zo kan volgens hen bijvoorbeeld het witwassen van geld worden ontdekt door facturen te vergelijken met het gewicht van scheepscontainers. Holton (2009) past sentimentanalyse toe op interne bedrijfsmails om ontevredenheid op te sporen. Hoewel bij het analyseren van bedrijfsmails geen sprake hoeft te zijn van big data, spreekt het resultaat van het onderzoek toch voor de mogelijkheden. Door toepassing van sentimentanalyse kan de mogelijke aanwezigheid van een moeilijk te observeren onderdeel van de fraudedriehoek in kaart worden gebracht, namelijk rationalisatie. Andere factoren van de fraudedriehoek zijn besproken in papragraaf 2.2. Warren et al. geven aan dat audiofragmenten uit conferentiegesprekken,

directeursvergaderingen, bedrijfstelefoongesprekken en surveillancemicrofoons voor dezelfde doeleinden geanalyseerd kunnen worden. De uitkomst van de analyse zou gebruikt kunnen worden om de kans op personeelsfraude in te schatten. Dit risico is vervolgens van invloed op het inherente risico dat de auditor toekent aan een klant.

Warren et al. (2015) benoemen een laatste toepassing die opgenomen kan worden in de plannings- en risicobeoordelingsfase, namelijk het inzetten van videoanalyse om bij te houden wanneer en hoe vaak mensen gesloten ruimten binnengaan. Deze informatie kan waardevol zijn bij het inschatten van de mogelijkheid tot diefstal. Ook stellen ze de mogelijkheid voor videoanalyse toe

(16)

te passen op interviews met het management, met als doel het analyseren van non-verbale communicatie. Warren et al. (2015) beweren dat deze analyse een waardevol beeld van de gezondheid van een organisatie kan geven.

(17)

4 Uitdagingen bij de implementatie van big data

In dit hoofdstuk worden de uitdagingen bij het gebruik van big data-analyse in de plannings- en risicobeoordelingsfase van de audit geïdentificeerd. Hierbij wordt aandacht besteed aan de verschillen tussen grote en middelgrote tot kleine accountantskantoren.

4.1 Analytische vaardigheden

Om met succes gebruik te kunnen maken van big data-analyse moet een auditor data verzamelen uit een grotere verscheidenheid aan bronnen, waaronder non-financiële bronnen waarmee hij tot op heden niet in aanraking is geweest (Brown-Liburd, Issa & Lombardi, 2015). Hoewel de auditor bekend is met het gebruik van computer assisted auditing techniques (CTAA’s) hebben deze programma’s volgens Brown-Liburd et al. (2015) een beperkt statistisch rekenkundig vermogen, en is het analyseren van ongestructureerde non-financiële informatie hierbij niet mogelijk. Bij het gebruik van CTAA’s is het aan de auditor om door het gebruik van query’s

parameters op te stellen, op basis waarvan hij tegenstrijdigheden kan ontdekken in gestructureerde datasets. Aangezien big data een hoog volume, hoge generatiesnelheid en een grote

verscheidenheid aan bronnen kennen, zijn big data-analysemethoden een vereiste om informatie te kunnen onttrekken aan deze data (Tanwar et al., 2015). Hierin ligt een bedreiging voor de auditor. Earley (2015) en Brown-Liburd et al. (2015) stellen dat door het gebrek aan expertise van de auditor op het gebied van geavanceerde analyses, datawetenschappers mogelijk kunnen gaan concurreren op de auditmarkt. Echter, Richins, Stapleton, Stratopoulos, en Wong (2017) beargumenteren dat niet alleen analytische vaardigheden maar ook een grondige kennis van de organisatie nodig is om het resultaat van de analyse te interpreteren. In dit opzicht heeft de auditor volgens hen een

concurrentievoordeel ten opzichte van datawetenschappers. Alles (2015) beargumenteert dat de beroepsgroep langzaam reageert op technologische vooruitgang, en dat de druk die door

datawetenschappers op de auditmarkt wordt gelegd wellicht de drijfveer zou kunnen zijn voor auditors om big data-analyse te implementeren.

De eerste uitdaging die kan worden opgemaakt uit de bovenstaande literatuur is dus de omgang met de benodigde expertise om met succes big data te kunnen analyseren. Cao et al. (2015) beweren dat training in big data-analyse mogelijk het academische niveau van de auditor te boven gaat. Dit zou betekenen dat auditors van externe partijen gebruik moeten maken, waarbij Cao et al. (2015) aantonen dat dit problemen in verband met de privacy met zich mee kan brengen. Hierbij plaatsen ze de kanttekening dat dit niet de eerste keer zou zijn; auditors maken bij het uitvoeren van een audit nu ook al gebruik van externe partijen, zoals banken. Richins et al. (2017) beargumenteren dat training van de auditor wel binnen de mogelijkheden ligt. Volgens hen kunnen bijvoorbeeld

(18)

gespecialiseerde forensische accountants, die bekend zijn met analyse van gestructureerde data en tekstmining bij het opsporen van fraude, getraind worden om dezelfde principes toe te passen op semi- en ongestructureerde datasets.

Uit het bovenstaande kan worden geconcludeerd dat bij de implementatie van big data-analyse de vaardigheden het eerste obstakel zijn. Big Four-kantoren met gespecialiseerd analytisch personeel en het budget om personeel op te leiden in het gebruik van big data hebben de

mogelijkheid intern big data-analyses uit te voeren. Ook kunnen deze kantoren proberen datawetenschappers aan te trekken als toevoeging op het bestaande auditteam. Hierin schuilt opnieuw een uitdaging. Patil en Davenport riepen in hun artikel uit 2012 ‘datawetenschapper’ uit tot het meest sexy beroep van de 21e eeuw, waarbij ‘sexy’ uit werd gelegd als het hebben van schaarse kwaliteiten die erg in trek zijn. Zij stellen dat het vinden van talent in de datawetenschap een beperkende factor zal zijn in verschillende delen van het bedrijfsleven. Dit wordt versterkt door het feit dat er in 2012, ten tijde van de publicatie van het artikel van Patil en Davenport, nog geen universitaire programma’s bestonden voor het opleiden van datawetenschappers. Dit terwijl Brown-Liburd et al. (2016) aangeven dat de toenemende complexiteit van data accountantskantoren onder druk zal zetten meer datawetenschappers aan te trekken en meer te investeren in geavanceerde analytische software. Willen accountantskantoren datawetenschappers aantrekken, zal echter niet alleen de financiële compensatie in orde moeten zijn. Volgens Patil en Davenport (2012) zal de uitdaging van het werken aan de meest intrigerende problemen en met de meest volumineuze datastromen het aantrekken van datawetenschappers bevorderen. Dit maakt het voor middelgrote tot kleine accountantskantoren des te moeilijker. Alles (2015) beargumenteert dat marktwerking de onbalans tussen vraag en aanbod wellicht kan herstellen op twee manieren. Als eerste door de ontwikkeling van universitaire programma’s om mensen op te leiden op het gebied van big analyse. De tweede manier bestaat uit de ontwikkeling van gebruiksvriendelijkere big data-analysesoftware, wat de noodzaak voor het aannemen van gespecialiseerd personeel reduceert.

De bereidheid en mogelijkheid te investeren in eigen datawetenschappers, via het opleiden of aannemen van personeel, zal in ieder geval op korte termijn bepalen welke accountantskantoren intern big data-analyses kunnen uitvoeren. Dit betekent dat op korte termijn het gebruik van big data-analyse enkel beschikbaar zal zijn voor grote accountantskantoren die bereid zijn te investeren. Een factor die deze bereidheid mogelijk tempert, is volgens Alles en Gray (2016) de

organisatiestructuur die binnen de accountancy voorkomt. Zij stellen dat de bereidheid te investeren wordt getemperd doordat partners kunnen berekenen hoeveel de investering hen persoonlijk gaat kosten via de winstverdelingsformule van het voorgaande jaar. Dit is niet het geval bij organisaties waar partnerschap niet voorkomt. Op de lange termijn zal marktwerking er wellicht voor zorgen dat

(19)

door middel van een groter aanbod aan datawetenschappers en gebruiksvriendelijkere big data-analysesoftware, big data-analyse ook beschikbaar wordt voor middelgrote tot kleine kantoren.

4.2 Van causatief naar correlatief

Bij het gebruik van big data-analysemethoden verschuift de gedachtegang van causatief naar correlatief (Alles & Gray, 2016). Bij een causatieve gedachtegang wordt er geredeneerd vanuit oorzaak-gevolg relaties. Bij een correlatieve gedachtegang wordt er geredeneerd vanuit in

wisselwerking staande verbanden. Bij toepassing van big data-analyse wijst de analyse op verbanden die nader onderzocht dienen te worden door de auditor. Dit staat tegenover het analyseren van traditionele data om te zoeken naar vooraf vastgestelde onderzoeksonderwerpen, zoals bijvoorbeeld de aanwezigheid van fraude. Cukier en Mayer-Schoenberger (2013) zijn voorstander van deze

overstap, en beargumenteren dat het ontdekken van patronen om toekomstige gebeurtenissen te voorspellen waardevoller kan zijn dan het vinden van een exacte oorzaak voor een gebeurtenis. Ze komen tot deze conclusie vanuit de stelling dat mensen zijn geneigd naar oorzaken te zoeken, ook wanneer deze niet aanwezig zijn. Dit kan volgens hen misleidend zijn. Zij stellen dat het beter is om uit te gaan van in data gevonden verbanden. Anderson (2008) heeft een vergelijkbare mening en schrijft in zijn artikel getiteld ‘The End of Theory: The Data Deluge Makes the Scientific Method Obsolete’ dat correlatie genoeg is. Het vinden van oorzaak-gevolgrelaties en het opstellen van modellen is volgens hem overbodig wanneer statistische algoritmes patronen kunnen vinden die de wetenschap niet weet te ontdekken. Hij stelt vervolgens dat wetenschap zich ook zonder

samenhangende modellen en alomvattende theorieën kan ontwikkelen. Deze verschuiving betekent volgens Alles en Gray (2016) dat het opstellen van hypotheses aan de hand van gevonden patronen of afwijkingen een belangrijkere rol gaat spelen dan het testen van gevormde hypotheses. Hoewel big data-analyse volgens Rose et al. (2017) de potentie heeft voorbereidende analytische procedures in de plannings- en risicobeoordelingsfase van de audit effectiever te maken door het identificeren van patronen en tegenstrijdigheden, betekent dit dat er grotere hoeveelheden ongestructureerde data moeten worden geanalyseerd. De rol van theorie bij het interpreteren van gevonden correlaties wordt in paragraaf drie besproken. In deze paragraaf worden uitdagingen met betrekking tot het opvragen van de benodigde data beschreven.

Om het vinden van correlaties in grote ongestructureerde datasets mogelijk te maken moet echter nog een tweetal uitdagingen worden overwonnen. De eerste ligt in het opvragen van informatie over de klant door de auditor. Alles en Gray (2016) wijzen op het feit dat het opvragen van informatie waarvan vooraf niet duidelijk is waarvoor deze gebruikt zal worden tegen de principes van de auditor ingaat, aangezien hij zich behoudend dient op te stellen en elke handeling die hij

(20)

verricht dient te kunnen verantwoorden. Het opvragen van informatie ter analyse zonder een duidelijk vooraf vaststaande reden is daarom niet problematisch vanuit het oogpunt van een datawetenschapper, maar wel vanuit het oogpunt van de auditor. Ook bespreken Alles en Gray (2016) dat auditors mogelijk een sceptische houding zullen hebben tegenover het accepteren van een conclusie die gebaseerd is op een correlatie die niet wordt ondersteund door een causaal verband, in het bijzonder wanneer deze conclusie als basis voor nieuwe wet- en regelgeving wordt gebruikt. De kern van het probleem bij het gebruik van correlatie is volgens hen dat auditors informatie gebruiken om een controle uit te voeren, in tegenstelling tot managers die informatie gebruiken om acties te verantwoorden. Zij geven als voorbeeld een sterke correlatie die wordt gevonden tussen recentelijk gescheiden werknemers en problemen met factureren. Een vervolgactie hierop uitgaande van de gevonden correlatie zou kunnen zijn recentelijk gescheiden werknemers te onderwerpen aan nauwkeurig onderzoek. Maar verifieerbaarheid en geloofwaardigheid moeten volgens Alles en Gray (2016) centraal staan wanneer acties worden ondernomen met betrekking tot specifieke werknemers. Dit betekend dat in deze situatie enkel uitgaan van correlatie zonder enige andere indicatie dat er iets mis is een probleem vormt. Dit betekent dat big data een groter obstakel vormen bij accountantscontrole dan voor een manager die big data gebruikt om bijvoorbeeld een marketingcampagne te starten. Wanneer de campagne mislukt, kan deze worden stopgezet. Controles dienen echter mogelijk te worden opgenomen in wet- en regelgeving. Daarom zal de auditor volgens Alles en Gray (2016) sceptisch zijn tegenover handelen enkel gebaseerd op

correlatie. Hoewel dergelijke correlaties in de plannings- en risicobeoordelingsfase effectief gebruikt kunnen worden voor het louter inschatten van het risico, zou dit in een latere fase kunnen leiden tot nader onderzoek van de correlaties die leiden tot een hoger toegekend risico. En dus wordt het in een latere fase alsnog belangrijk deze correlaties uit te kunnen leggen.

Daarnaast speelt privacy een belangrijke rol. Zoals besproken door Cao et al. (2015) zal om correlaties te vinden in big data wellicht informatie van de klant opgevraagd worden die normaliter niet opgevraagd zou worden. De mogelijkheid persoonlijke informatie te controleren is een uitdaging die implementatie van big data in de audit in de weg staat (Yoon et al., 2015). Alles en Gray (2016) stellen dat het verzamelen van vertrouwelijke informatie van klanten verantwoordelijkheid over deze informatie met zich meebrengt. Dit houdt in dat vertrouwelijke data en de verbanden tussen

datapunten niet aan derden vrijgegeven mogen worden (Ciriani et al., 2009). Auditors dienen ervoor te zorgen dat er geen schending van vertrouwelijke informatie plaatsvindt. Ook kunnen volgens Yoon et al. (2015) organisaties of werknemers zich tegen het gebruik van privacygevoelige informatie verzetten. Het gebruik van bijvoorbeeld bedrijfsmails bij het opsporen van fraude kan volgens hen leiden tot een gevoel van privacyschending onder werknemers. Ook stellen zij dat het gebruik van

(21)

alleen nog maar zullen versterken. Om deze reden stellen ze voor dat auditors samenwerken met klanten om hun werknemers te informeren dat elke vorm van werkgerelateerde databronnen gebruikt kan worden bij het uitvoeren van een audit, waarbij ook duidelijk wordt gemaakt dat bepaalde vormen van auditbewijs enkel voor vaststaande doelen worden gebruikt. Als laatste kan privacygevoelige informatie volgens hen worden geanonimiseerd, tenzij fraude wordt ontdekt.

Bij het analyseren van big data zal de nadruk komen te liggen op correlatie boven het vinden van oorzaak-gevolgrelaties. Het vinden van correlaties in big data levert een sterk voorspellend vermogen op, en geeft mogelijk het meest robuuste beeld van de activiteiten van de klant (Alles & Gray, 2016). De uitdagingen die dit met zich meebrengt met betrekking tot het verzamelen van data en de privacybescherming van werknemers raken zowel grote als middelgrote tot kleine

accountantskantoren. Er zullen afwegingen moeten worden gemaakt tussen de bruikbaarheid van informatie en het beschermen van vertrouwelijke informatie. Nader onderzoek moet uitwijzen hoe de juiste balans kan worden gevonden tussen het benutten van bruikbare informatie en het

beschermen van vertrouwelijke en persoonlijke informatie (Schneider, Dai, Janvrin, Ajayi & Raschke, 2015). Yoon et al. (2015) beargumenteren dat schaalvoordelen mogelijkheden bieden voor grote accountantskantoren, gezien de kosten verbonden aan het gebruik van big data en het beschermen van vertrouwelijke gegevens. Het gebruik van big data kan vervolgens leiden tot hogere

toegangsdrempels voor nieuwkomers op de markt voor gespecialiseerde audits, waar big data in het bijzonder voordelen kunnen bieden. Hierdoor stellen Yoon et al. (2015) dat vooral grote kantoren gebruik zullen maken van big data-analyse. Het nemen van beslissingen gebaseerd op correlatie zonder onderbouwende theorie is een uitdaging die eveneens zowel grote als middelgrote tot kleine kantoren raakt. De rol van theorie wordt in de volgende paragraaf verder besproken.

4.3 Theorie achter correlatie

Keltanen (2013) beweert dat het lastigste aan het gebruik van big data, namelijk het bepalen welke correlaties significant zijn, nog steeds mensenwerk is. Hij schrijft dat er geen algoritmes bestaan die kunnen aangeven welke correlaties van significante waarde zijn, of hoe ze

geïnterpreteerd dienen te worden. Brooks (2013) voegt hieraan toe dat een enorme hoeveelheid zaken met elkaar correleert, waardoor correlaties geen helder beeld schetsen. Hij stelt dat big data geschikt zijn om de aandacht te vestigen op zaken die nader onderzocht dienen te worden, maar om in te grijpen en daadwerkelijk actie te ondernemen moet eerst naar een oorzaak gezocht worden. Alles en Gray (2016) beargumenteren dat een theoriegedreven aanpak voor het gebruik van big data wellicht beter past in de auditpraktijk. Naast de argumenten die zijn aangedragen in de vorige paragraaf kan gesteld worden dat een theoriegedreven aanpak een leerproces faciliteert, waarbij

(22)

opgedane kennis mee kan worden genomen in latere auditprocessen. Het standpunt van Brooks wordt ondersteund door verschillende auteurs (Schneider et al., 2015; Rose et al., 2017; Yoon et al., 2015; Brown-Liburd et al., 2015), die beargumenteren dat de betrouwbaarheid en bruikbaarheid van big data achteruitgaat wanneer de auditor wordt overspoeld met correlaties waarvan maar een klein deel bruikbaar is. Brown-Liburd et al. (2015) stellen in hun artikel dat een overdaad aan informatie leidt tot het maken van suboptimale keuzes bij het uitvoeren van de audit. Dit is in het bijzonder problematisch voor de auditor, aangezien hij uit grote hoeveelheden informatie moet kiezen waarop hij zijn oordeelsvorming gaat baseren. Daarom beargumenteren ze dat om effectief gebruik te kunnen maken van big data-analysemethoden een gegronde voorkennis van de data vereist is, zodat significante patronen kunnen worden herkend. Zonder gegronde voorkennis van de te analyseren data kan een overdaad aan informatie als gevolg van big data-analyse leiden tot een minder effectief en efficiënt besluitvormingsproces, een langduriger besluitvormingsproces, complicaties in het onderscheiden van relevante en irrelevante informatie, en veronachtzaming van aanzienlijke hoeveelheden informatie (Brown-Liburd et al., 2015). Een mogelijke manier om met succes gebruik te maken van big data-analyse volgens Issa (2013) is een op regels gebaseerd systeem, waarbij aan uitkomsten van big data-analyses een prioriteit wordt gegeven door een commissie van experts. Op deze manier kunnen big data de aandacht vestigen op een selectie aan afwijkingen en verbanden, waarna de expertise van senior auditors wordt gebruikt om deze te rangschikken op belangrijkheid. Bij deze aanpak is voorkennis een belangrijk element.

Rose et al. (2017) onderzochten wanneer big data-analyse het beste kan worden gebruikt, voor of na het inspecteren van traditioneel auditbewijs. Ze schrijven dat ondervraagde partners in accountantskantoren in de veronderstelling verkeren dat het in het voordeel van de auditors is eerst patronen uit big data te onderzoeken voordat er conclusies worden getrokken uit traditionele informatiebronnen. Rose et al. (2017) concludeerden dat het beter is eerst verwachtingen te vormen door traditionele informatiebronnen te onderzoeken en traditionele analyses uit te voeren. Auditors, zo bleek uit het onderzoek, die big data onderzoeken vóór traditionele informatiebronnen hebben moeite relevante verbanden en patronen te herkennen. Het vormen van verwachtingen voordat big data worden geanalyseerd helpt de auditor keuzes te maken welke verbanden relevant zijn voor zijn oordeelsvorming (Rose et al., 2017).

(23)

5. Discussie en Conclusie

In dit onderzoek is gezocht naar een antwoord op de vraag: ‘Welke uitdagingen staan de implementatie van big data-analyse in de plannings- en risicobeoordelingsfase van de audit in de weg?’ Hiervoor is een literatuuronderzoek uitgevoerd waarin eerst mogelijke toepassingen van big data-analyse in de plannings- en risicobeoordelingsfase van de audit zijn geïdentificeerd. Daarna zijn uitdagingen die succesvolle implementatie in de weg staan behandeld. Uit de resultaten zijn een drietal uitdagingen gebleken. In dit hoofdstuk zullen argumenten uit hoofdstuk 4 worden besproken en geïnterpreteerd waarna een conclusie zal worden geformuleerd.

De eerste uitdaging heeft betrekking tot de benodigde analytische vaardigheden. Zoals besproken in paragraaf 4.1 zal op de korte termijn de schaarste aan datawetenschappers ertoe leiden dat het intern uitvoeren van big data-analyses enkel is weggelegd voor accountantskantoren die bereid zijn en over de mogelijkheid beschikken aanzienlijk te investeren in het opleiden van personeel in het uitvoeren van big data-analyses of het aannemen van datawetenschappers ter versterking van het bestaande auditteam. Een factor die deze bereidheid tot investeren mogelijk tempert is de partnerschapsstructuur die voorkomt onder accountantskantoren (Alles en Gray, 2016). Op de lange termijn zal marktwerking de onbalans op de markt voor big data-analyses toegepast binnen de audit kunnen herstellen via twee wegen: Het opleiden van een voldoende aantal datawetenschappers en het ontwikkelen van analysesoftware die minder vaardigheden vereisen van de gebruiker (Alles, 2015).

Op basis van dit onderzoek lijkt het aannemelijk dat om deze redenen middelgrote tot kleine kantoren die gebruik willen maken van big data-analyse op korte termijn externe partijen zullen moeten inschakelen gezien de beperkte mogelijkheid tot investeren en aantrekken van schaarse datawetenschappers. Grote kantoren kunnen op de korte termijn big data-analyse implementeren mits er de bereidheid bestaat te investeren in scholing of gekwalificeerd personeel. Alles (2015) beargumenteert dat de beroepsgroep accountants doorgaans langzaam reageert op technologische vooruitgang en Alles en Gray (2016) stellen vervolgens dat de partnerschapsstructuur mogelijk het investeren belemmert, deze factoren dragen mogelijk bij aan de afwezigheid van big data-analyses in de plannings- en risicobeoordelingsfase tot op heden. Op de lange termijn zal marktwerking ervoor zorgen dat analytisch vermogen niet langer een obstakel is voor de implementatie van big data-analyse. Echter, onder de veronderstelling dat big data-analyse de plannings- en

risicobeoordelingsfase van de audit efficiënter kan maken zoals gesuggereerd door (Rose et al., 2017), zullen kantoren die het eerst big data-analysetechnieken adopteren naar waarschijnlijkheid in een eerder stadium het leerproces starten dat leidt tot effectief gebruik van deze analyses. Op deze manier kan snelle implementatie bijdragen aan het behalen van een concurrentievoordeel. Hierdoor

(24)

zou de accountantsmarkt mogelijk verder kunnen polariseren. Wanneer het gebruik van big data-analyse leidt tot efficiëntere audits en enkel grote kantoren in het beginstadium van deze data-analyses gebruik kunnen maken, kan dit leiden tot schevere verhoudingen tussen de werkzaamheden verricht door grote en middel tot kleine accountantskantoren. Echter zal deze verbeterde efficiëntie

waarover Rose et al. (2017) spreken eerst in de praktijk moeten worden bewezen.

De tweede uitdaging ligt in het vinden van een balans tussen bruikbare informatie en het beschermen van vertrouwelijke informatie zoals besproken in paragraaf 4.2. Om gebruik te maken van big data-analyse met als doel het vinden van patronen en verbanden in datasets zal de auditor data moeten verzamelen afkomstig uit bronnen waaruit hij normaliter geen data bij een klant opvraagt (Brown-Liburd et al, 2015). Organisaties of werknemers binnen deze organisaties kunnen zich verzetten tegen het gebruik van persoonlijke informatie wanneer dit leidt tot een gevoel van privacyschending. Het opvragen van vertrouwelijke informatie brengt daarnaast een

verantwoordelijkheid met zich mee vertrouwelijke data en verbanden tussen datapunten gevonden in deze data te beschermen. Dit kan leiden tot schaalvoordelen voor grote kantoren gezien de kosten verbonden aan het beveiligen van big data-hoeveelheden vertrouwelijke data. Deze schaalvoordelen kunnen leiden tot hogere toegangsdrempels voor nieuwkomers op de auditmarkt. In het bijzonder op de markt voor gespecialiseerde audits waar big data-analyse in het bijzonder voordelen biedt ten opzichte van traditionele methoden (Yoon et al., 2015).

Deze mogelijke schaalvoordelen en hogere toegangsdrempels in combinatie met de voordelen verbonden big data-analyseadoptie in een vroeg stadium zoals eerder besproken bieden potentieel grote kantoren een aanzienlijk voordeel over middel tot kleine kantoren. Nader onderzoek dient uit te wijzen hoe de juiste balans tussen gebruikmaken van nuttige data en het behoud van vertrouwelijkheid van data kan worden bereikt. Afspraken en bewustwording onder werknemers rondom welke data gebruikt kan worden bij het uitvoeren van een audit kan mogelijk het gevoel van privacyschending inperken. Mogelijk kan ook wetgeving op dit gebied duidelijkheid scheppen, echter zal dit in nader onderzoek moeten worden bewezen.

Een derde uitdaging zoals besproken in paragraaf 4.3 ligt in het gebruik van theorie om resultaten van big data-analyse te interpreteren. Bij het gebruik van big data-analyse is het gebruikelijk te handelen op basis van gevonden patronen en verbanden. Binnen de auditprofessie blijft theorie aangaande oorzakelijke verbanden belangrijk om de resultaten van big data-analyse te interpreteren om twee redenen. De eerste is dat de auditor zich behoudend dient op te stellen en zijn handelingen moet kunnen verantwoorden. Handelingen enkel gebaseerd op gevonden correlatie doet afbreuk aan de principes van verifieerbaarheid en geloofwaardigheid die de auditor toepast bij het uitvoeren van zijn werkzaamheden. De tweede reden is dat wanneer de auditor geen gegronde

(25)

de big data-analyse, er een grotere kans is dat hij overbelast wordt door de gevonden verbanden en patronen (Issa, 2013; Rose et al., 2017). Dit heeft vervolgens een negatief effect op de

besluitvorming van de auditor (Rose et al., 2017).

Om een overbelasting door gevonden correlaties te voorkomen zal de auditor naar

waarschijnlijkheid op zijn professionele oordeelsvorming moeten steunen om significante correlaties te identificeren. Mensen zoeken naar verbanden ook wanneer deze niet aanwezig zijn (Cukier & Mayer-Schoenberger, 2013). Hierdoor kunnen auditors overweldigd raken door gevonden correlaties en de instinctieve drang hier oorzakelijke verbanden aan te verbinden. Zoals besproken door Rose et al. (2017) is de timing van het gebruik van big data-analyse binnen de audit een belangrijke factor in het voorkomen van een overbelasting. Het gebruik van theorie om gevonden correlaties te verklaren vergt een andere manier van denken, waarbij de auditor hypotheses opstelt aan de hand van

gevonden patronen en verbanden zonder zich te laten overweldigen door het resultaat van big data-analyse. Dit betekent dat de auditor professionele oordeelsvorming moet ontwikkelen op een nieuw vlak, en op zijn minst kennis moet nemen van de beginselen van big data-analyse om significante correlaties te herkennen.

Hieruit kan de conclusie worden getrokken dat drie uitdagingen bij de implementatie van big data in de plannings- en risicobeoordelingsfase van de audit zijn het uitbreiden van het analytisch vermogen, de omgang met vertrouwelijke informatie en het gebruik van theorie in het interpreteren van big data-analyseresultaten. In welke mate de potentiële voordelen van big data-analyse in planning en risicobeoordeling de eerste fase van de audit zullen beïnvloeden zal blijken wanneer deze uitdagingen worden behandeld. Nader onderzoek in de vorm van een casestudie kan worden verricht naar het effect van big data-analyse op de plannings- en risicobeoordelingsfase van een audit. Ook kan een casestudie uitwijzen of een concurrentievoordeel te behalen is door middel van het gebruik van big data-analyse. Nader onderzoek dient tevens uit te wijzen hoe er een balans kan worden gevonden in het gebruikmaken van vertrouwelijke data voor het uitvoeren van big data-analyses en het behoud van de vertrouwelijkheid. In een laatste casestudie kan worden onderzocht welke strategie in het gebruik van big data-analyse de kans op een informatieoverbelasting als gevolg van deze analyse minimaliseert.

Ten slotte kent dit onderzoek een aantal beperkingen. De eerste daarvan is dat big data-analyse een recente ontwikkeling is waar momenteel veel onderzoek naar wordt gedaan. Het is mogelijk dat dit nieuwe onderzoek de opvattingen waarop dit onderzoek is gebaseerd verandert. Ook wordt er in dit onderzoek uitgegaan van de stappen en procedures die beschrijven hoe een audit zou moeten worden uitgevoerd, dit kan verschillen van hoe een audit werkelijk wordt uitgevoerd. Als laatste zou een definitie van big data in de auditcontext kunnen leiden tot waardevoller en

(26)

non-traditionele databronnen worden geanalyseerd ten aanvulling op non-traditionele financiële data. Ook wanneer deze data bij de huidige subjectieve maatstaf niet als big data wordt aangeduid.

(27)

Referenties

Alles, M. G. (2015). Drivers of the Use and Facilitators and Obstacles of the Evolution of Big Data by the Audit Profession. Accounting Horizons, 29(2), 439-449.

Alles, M. G., & Gray, G. L. (2016). Incorporating big data in audits: Identifying inhibitors and a

research agenda to address those inhibitors. International Journal of Accounting Information

Systems, 22, 44-59.

American Accounting Association. (2015). Forum: Big Data. Accounting Horizons, 29(2), 337-476. Anderson, C. (2008). The end of theory: The data deluge makes the scientific method obsolete. Wired

magazine, 16(7), 16-07.

Arens, A. A., Elder, R. J., Beasley, M. S., & Hogan, C. E. (2016). Auditing and assurance services. New York, NY: Pearson.

Autoriteit Financiële Markten. (2014). Uitkomsten onderzoek kwaliteit wettelijke controles Big

4-accountantsorganisaties. Geraadpleegd van

https://www.afm.nl/~/profmedia/files/rapporten/2014/onderzoek-controles-big4.pdf Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood predicts the stock market. Journal of

Computational Science, 2(1), 1-8.

Brooks, D. (2013, 15 april). What You’ll Do Next. Geraadpleegd van

https://www.nytimes.com/2013/04/16/opinion/brooks-what-youll-do-next.html Brown-Liburd, H., Issa, H., & Lombardi, D. (2015). Behavioral implications of Big Data's impact on

audit judgment and decision making and future research directions. Accounting Horizons,

29(2), 451-468.

Cao, M., Chychyla, R., & Stewart, T. (2015). Big Data analytics in financial statement audits.

Accounting Horizons, 29(2), 423-429.

Chan, W. S. (2003). Stock price reaction to news and no-news: drift and reversal after headlines.

(28)

Ciriani, V., Di Vimercati, S. D. C., Foresti, S., Jajodia, S., Paraboschi, S., & Samarati, P. (2009,

September). Keep a few: Outsourcing data while maintaining confidentiality. Geraadpleegd van http://spdp.di.unimi.it/papers/esorics09.pdf

Cukier, K., & Mayer-Schoenberger, V. (2013). The rise of big data: How it's changing the way we think about the world. Foreign Affairs, 92(3), 28.

Earley, C. E. (2015). Data analytics in auditing: Opportunities and challenges. Business Horizons, 58(5), 493-500.

Europese Commissie. (2010). GROENBOEK Beleid inzake controle van financiële overzichten: lessen

uit de crisis (COM(2010) 561 definitief). Geraadpleegd van

https://eur-lex.europa.eu/legal-content/NL/TXT/PDF/?uri=CELEX:52010DC0561&from=NL

Feldman, R. (2013). Techniques and applications for sentiment analysis. Communications of the ACM,

56(4), 82-89.

Gandomi, A., & Haider, M. (2015). Beyond the hype: Big data concepts, methods, and analytics.

International Journal of Information Management, 35(2), 137-144.

Gartner. (2014, 17 september). Gartner Survey Reveals That 73 Percent of Organizations Have Invested or Plan to Invest in Big Data in the Next Two Years. Geraadpleegd van https://www.gartner.com/newsroom/id/2848718

Hays, C. L. (2004). What Wal-Mart knows about customers’ habits. Geraadpleegd van http://www.laisumedu.org/DESIN_Ibarra/salon/si2/wm-59.pdf

Holton, C. (2009). Identifying disgruntled employee systems fraud risk through text mining: A simple solution for a multi-billion dollar problem. Decision Support Systems, 46(4), 853-864. Issa, H. (2013). Exceptional exceptions (Doctoral dissertation). Geraadpleegd van

https://rucore.libraries.rutgers.edu/rutgers-lib/41484/PDF/1/play/

Jiang, J. (2012). Information extraction from text. In C. C. Aggarwal & C. X. Zhai (Red.). Mining text

data (pp. 11-41). Berlijn, Duitsland: Springer.

Keltanen, M. (2013, 16 april). Why 'lean data' beats big data. Geraadpleegd van

https://www.theguardian.com/media-network/media-network-blog/2013/apr/16/big-data-lean-strategy-business

(29)

Knechel, W. R. (2001). Auditing: Assurance and risk. Nashville, TN: South-Western College Publishing. Krahel, J. P., & Titera, W. R. (2015). Consequences of Big Data and formalization on accounting and

auditing standards. Accounting Horizons, 29(2), 409-422.

Manyika, J., Chui, M., L Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., & Byers, A. H. (2011, mei). Big

data: The next frontier for innovation, competition, and productivity. Geraadpleegd van

https://www.mckinsey.com/~/media/McKinsey/Business%20Functions/McKinsey%20Digital /Our%20Insights/Big%20data%20The%20next%20frontier%20for%20innovation/MGI_big_da ta_full_report.ashx

McAfee, A., Brynjolfsson, E., Davenport, T. H., Patil, D. J., & Barton, D. (2012). Big data: the management revolution. Harvard Business Review, 90(10), 60-68.

Mittermayer, M. A. (2004, January). Forecasting intraday stock price trends with text mining

techniques. Geraadpleegd van

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.201.5765&rep=rep1&type=pdf Patil, T. H. D. J., & Davenport, T. (2012). Data scientist: the sexiest job of the 21st century. Harvard

Business Review.

Richins, G., Stapleton, A., Stratopoulos, T. C., & Wong, C. (2017). Big Data analytics: Opportunity or threat for the accounting profession?. Journal of Information Systems, 31(3), 63-79. Rose, A. M., Rose, J. M., Sanderson, K. A., & Thibodeau, J. C. (2017). When should audit firms

introduce analyses of Big Data into the audit process?. Journal of Information Systems, 31(3), 81-99.

Rossi, B. (2015, 16 september). 75% of businesses will invest in big data in the next two years Gartner. Geraadpleegd van http://www.information-age.com/75-businesses-will-invest-big-data-next-two-years-gartner-123460178/

Schneider, G. P., Dai, J., Janvrin, D. J., Ajayi, K., & Raschke, R. L. (2015). Infer, predict, and assure: Accounting opportunities in data analytics. Accounting Horizons, 29(3), 719-742.

Tanwar, M., Duggal, R., & Khatri, S. K. (2015). Unravelling unstructured data: A wealth of information in big data. Geraadpleegd van

(30)

Vasarhelyi, M. A., Kogan, A., & Tuttle, B. M. (2015). Big Data in accounting: An overview. Accounting

Horizons, 29(2), 381-396.

Warren, J. D., Jr., Moffitt, K. C., & Byrnes, P. (2015). How Big Data will change accounting. Accounting

Horizons, 29(2), 397-407.

Yoon, K., Hoogduin, L., & Zhang, L. (2015). Big Data as complementary audit evidence. Accounting