• No results found

Big Data Bla Bla

N/A
N/A
Protected

Academic year: 2021

Share "Big Data Bla Bla"

Copied!
2
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Amsterdam University of Applied Sciences

Big Data Bla Bla

van Bussel, G.J.

Publication date 2015

Document Version Final published version Published in

IP: Vakblad voor Informatieprofessionals License

Unspecified Link to publication

Citation for published version (APA):

van Bussel, G. J. (2015). Big Data Bla Bla. IP: Vakblad voor Informatieprofessionals, (4), 25.

https://informatieprofessional.nl/2015/05/column-big-data-bla-bla/

General rights

It is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons).

Disclaimer/Complaints regulations

If you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, stating your reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please contact the library:

https://www.amsterdamuas.com/library/contact/questions, or send a letter to: University Library (Library of the University of Amsterdam and Amsterdam University of Applied Sciences), Secretariat, Singel 425, 1012 WP Amsterdam, The Netherlands. You will be contacted as soon as possible.

Download date:27 Nov 2021

(2)

04 / 2015 | IP | vakblad voor informatieprofessionals - 25

x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x xx x x x x x x x x xx x x x x x x x x x x xx xx xx

x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x xx x x x x x x x x xx x x x x x x x x x x xx xx xx

trouwbaar en onjuist zijn en/of de verkeerde gegevens zijn verza- meld of geselecteerd. In Science werd aangetoond dat betrouwbare voorspellingen voor de versprei- ding van griep mogelijk zijn als de analyses uit big data gecom- bineerd worden met traditionele, wetenschappelijke vormen van gegevensverzameling en -analyse.

Een van de problemen van GFT (en andere analyses uit big data) is dat de resultaten veelal niet gerepliceerd kunnen worden. Dit komt vooral doordat algoritmes, formules, zoektermen en dataselecties geheim zijn en eigendom van private be- drijven.

Ik waag te betwijfelen of we wel alleen op data kunnen vertrouwen als indicator voor beslissingen, welvaart of zingeving.

Jay Liebowitz propageert in zijn boek Bursting the Big Data Bubble om naast de resultaten van data-analyse in beslis- singsprocessen (met dan ook nog een voorkeur voor ‘small data’) ruimte te la- ten voor ervaring en intuïtie.

Het is zeker dat door ervaring en intuïtie fouten gemaakt (en voorkomen!) worden.

Het is zeker dat data beslissingen kun- nen verbeteren (als ze objectief worden gebruikt!). Het is ook aangetoond dat we gegevens negeren als ze niet overeenko- men met wat we subjectief denken (zelfs als de objectiviteit van die gegevens vast- staat!).

Big data-evangelisten verkondigen dat

‘you can only manage what you measu- re’. Blabla. Want de fi nanciële crisis heeft aangetoond dat we slecht zijn in het ma- nagen van wat we meten. Mislukte fusies en productlanceringen, veelvuldige imago- problemen en social media-escapades geven aan dat we vooral beter moeten worden in het managen van datgene wat we niet kunnen meten.

Met of zonder big data. <

‘Gemakshalve wordt eraan voorbijgegaan dat 55 procent van alle big data-projecten mislukt’

In 2008 schreef Chris Anderson, redacteur bij Wired, dat de zond- vloed aan data (later big data ge- noemd) en nieuwe analysetools de wetenschappelijke methode onnodig maakten en een nieuwe manier waren om de wereld te begrijpen. ‘Correlation superse- des causation, and science can advance even without coherent models, unifi ed theories, or really any mechanis- tic explanation at all’.

Big data-blabla’ers (ook evangelisten genoemd) hebben deze idee met vele anekdotes ondersteund en verkondigd.

Volgens hen breekt er een nieuwe tijd aan: de datafi catie van onze maatschap- pij maakt alles meetbaar en doet alle be- staande problemen verdwijnen. Gemaks- halve wordt eraan voorbijgegaan dat (zoals onderzoeksbedrijf Gartner stelt) 55 procent van alle big data-projecten mislukt, vooral omdat ze niet de optimis- tische resultaten leveren die vooraf zijn ingecalculeerd. Zélfs het paradepaardje van de big data-evangelisten niet: het in 2008 gestarte Google Flu Trends (GFT). Het geprofeteerde succes bleek rafelrandjes te kennen. In 2014 werd in Science aangetoond dat de resultaten (nog steeds) niet overeenkwamen met de ‘echte’ feiten. Het voorspellen van grieptrends lukte vele malen beter met drie weken oude, op traditionele wijze verzamelde en geanalyseerde gegevens van griepcentra.

De 500 miljoen zoekvragen per dag van Google leveren gevisualiseerd dus nog geen accuraat beeld van wat er werke- lijk gaande is. Dat kan niet als (zoals bij GFT) de gebruikte gegevens onbe-

Geert-Jan van Bussel

COLUMN

Big Data Bla Bla

Geert-Jan van Bussel is ondernemer en lector Digital Archiving & Compliance bij de Hogeschool van Amsterdam

25_ColumnGeertJan.indd 25 26-04-2015 14:18

Referenties

GERELATEERDE DOCUMENTEN

Vervolgens kunnen verschil- lende technieken worden gebruikt om data te verkennen, zoals descriptieve statistische analyses (gemiddelde, modus, mediaan en spreiding),

Given the use of the RUF as a prototype resource-based VNSA by Weinstein in his work (Weinstein, 2005), it comes as no surprise that the RUF ticks all the boxes on its inception.

 Toepassing Social Media Data-Analytics voor het ministerie van Veiligheid en Justitie, toelichting, beschrijving en aanbevelingen (Coosto m.m.v. WODC), inclusief het gebruik

Doordat het hier vooral gaat om teksten worden (veel) analyses door mid- del van text mining -technieken uitgevoerd. Met behulp van technieken wordt informatie uit

Opgemerkt moet worden dat de experts niet alleen AMF's hebben bepaald voor de verklarende variabelen in de APM's, maar voor alle wegkenmerken waarvan de experts vonden dat

Table 6.2 shows time constants for SH response in transmission for different incident intensities as extracted from numerical data fit of Figure 5.6. The intensities shown

For the purpose of this study patient data were in- cluded based on the following criteria: (1.1) consec- utive adults who underwent a full presurgical evalua- tion for refractory

De blanke lezer wordt niet uitgesloten als publiek, maar moet zich ervan bewust zijn dat hij niet hetzelfde sentiment deelt als de groep die Wright beoogd heeft, waardoor hij niet