Big data een inbreuk op privacy?

(1)

13-07-2018 A. Meulemans Bachelor's thesis

Studiejaar 2017/ 2018 Semester 2 periode 5

Big data een inbreuk op privacy?

Sophie Koster 11044810

Abstract

Er is onderzoek gedaan naar de relatie tussen het gebruik van big data en de ervaren inbreuk op privacy. Hiervoor zijn de big five karaktereigenschappen gebruikt als moderator, gezien individuen met verschillende persoonlijkheden anders zullen reageren op situaties. Big data is gemeten aan de hand van drie situaties; 1) waarbij data verzameld wordt met een klantenkaart van een supermarkt, 2) gegevens·die gevraagd worden bij het aanmaken van een social media account, 3) verschillende cookies waarvan websites gebruik van kunnen maken. Echter is uit het onderzoek gebleken dat de big five karaktereigenschappen geen significant effect hadden als moderator op de relatie tussen big data en de ervaren inbreuk op privacy. De resultaten laten zien dat van de drie verschillende situaties van gebruik van big data alleen de relatie tussen de situatie met de klantenkaart van de supermarkt en de ervaren inbreuk op privacy significant is.

1. Introductie

Er is veel discussie in literatuur over het conflict tussen big data en privacy. Een recent voorbeeld hiervan is Facebook die in het nieuws is gekomen met de Facebook-pixel. Dit is een onzichtbare pixel op websites van derden die de informatie van wat mensen opzoeken doorstuurt naar Facebook, waar het aan een account gekoppeld wordt. Uit een onderzoek van de NOS is gebleken dat 18 van de 40 onderzochte zorgverzekeraars een tracking-pixel gebruikte. Ze gaven aan dat ze dit deden voor marketingdoeleinden, zodat ze mensen later advertenties konden sturen via Facebook om meer klanten te krijgen (Aantal zorgsites, 2018).

Het voorbeeld van Facebook is een van de manieren waarop bedrijven big data verzamelen en gebruiken in de praktijk. Big data is het verzamelen en analyseren van een groot volume aan data van verschillende bronnen (Sax, 2016). Hoewel het gebruik van big data als een geweldig middel gezien wordt op het gebied van marketing (De Swaan Arons, van den Driest, & Weed, 2014), zoals ook in het voorbeeld hierboven, brengt dit een probleem met zich mee wat betreft de privacy. Door het analyseren van de verschillende bronnen van data kunnen gegevens van een individu achterhaald worden, zoals de identificatie, ook als de bronnen zelf de privacy van deze individuen beschermen (Lazar,

(2)

2015). Aan de hand van dit probleem is de onderzoeksvraag gesteld: In hoeverre wordt het gebruik van big data als een inbreuk op privacy gezien?

In voorgaand onderzoek is er wel een verband tussen privacy en big data, en de bezorgdheid over privacy in een online omgeving onderzocht, maar er is nog niet gekeken hoe individuen de inbreuk op privacy ervaren als het gaat om big data in het algemeen (zie theoretisch kader). Daarom is om deze onderzoeksvraag te beantwoorden een enquête gemaakt, zodat de ervaren inbreuk op privacy bij gebruikt van big data gemeten kan worden. In de enquête zijn er drie situaties gegeven met voorbeelden van gebruik van big data om te kijken of er een inbreuk op privacy wordt ervaren. Daarnaast is het karakter van de

respondenten vastgesteld, om te kijken of dit invloed heeft op hoe zij de inbreuk op privacy ervaren. Het aantal responses voor de enquête is 82, en het aantal responses waarbij de vragenlijst voor het bepalen van de big five karaktereigenschappen volledig ingevuld is, was 77. Dit aantal is niet hoog, maar de sterkte van de steekproef wordt bepaald door de

significantie van de resultaten en niet door het aantal responses. Ook is er een model bij de onderzoeksvraag opgesteld met het verband tussen big data en de ervaren inbreuk op privacy. In het model worden de big five karaktereigenschappen als moderator en de definitie van privacy als variabele meegenomen.

Er zijn wel wetten die de privacy van individuen beschermen bij het gebruik van big data (Kucuk, & Krishnamurthy, 2007), hier wordt voor dit onderzoek niet op ingegaan. Het onderzoek is vooral gericht op hoe inbreuk op privacy ervaren wordt bij gebruik van big data.

In de tweede paragraaf worden de belangrijke begrippen uitgelegd, het probleem toegelicht, en de relatie tussen privacy en de big five karaktereigenschappen genoemd. In de derde paragraaf wordt het model uitgelegd. In de vierde paragraaf wordt de methode toegelicht. In de vijfde paragraaf worden de resultaten gegeven en toegelicht. In de zesde paragraaf worden de resultaten besproken. In de zevende paragraaf wordt de conclusie \ gegeven. In de achtste paragraaf worden de beperkingen van het onderzoek en suggesties

(3)

2.1 Big five karaktereigenschappen

In deze paragraaf worden de begrippen de Big five karaktereigenschappen, big data en privacy uitgelegd. Ook worden het probleem tussen big data en privacy en de relatie tussen privacy en de big five karaktereigenschappen uitgelegd.

Het Big Five model voor karaktereigenschappen bestaat uit vijf relatief onafhankelijke dimensies: extraversie, vriendelijkheid, zorgvuldigheid, emotionele stabiliteit en openheid voor ervaringen. Waarbij extraversie verwijst naar de mate van sensorische stimulatie waarbij een individu zich prettig voelt. Extraversie is gerelateerd aan de ervaring van positieve gebeurtenissen. Extraverte individuen zijn uitgaand en energiek, hebben veel vrienden en kennissen, en bevinden zichzelf vaak in sociale situaties. Vriendelijkheid verwijst naar het aantal bronnen die een individu gebruikt om de normen van goed gedrag vast te stellen. Daarnaast verwijst het naar de mate van empathie naar anderen door het uiten van bezorgdheid en gevoeligheid. Individuen die hoog op vriendelijkheid scoren zijn vaak tolerant, betrouwbaar, coöperatief, zachtmoedig en goedaardig. Zorgvuldigheid verwijst naar het aantal doelen waarop een individu gefocust is. Individuen die hier hoog op scoren hebben veel aandacht voor details, houden standaarden aan, en zijn gericht op success, uitmuntendheid en efficiëntie. Daarnaast zijn ze meer doelgericht, hebben een grote mate van zelfdiscipline en beraadslaging. Emotionele stabiliteit verwijst naar het aantal, en de sterkte van prikkels die nodig zijn om negatieve emoties in een individu uit te lokken. Deze karaktereigenschap uit zich in de mate van stemmingswisselingen, periodes van angst of ongerustheid, en hoe goed individuen met stress kunnen omgaan. Openheid voor

ervaringen verwijst naar het aantal interesses waar iemand zich tot aangetrokken voelt en de mate waarin deze interesses worden nagestreefd. Ook geeft het de mate van

nieuwsgierigheid en neiging naar nieuwe ervaringen van een individu aan. Individuen die hoog op openheid voor ervaringen scoren, voelen zich over het algemeen aangetrokken tot kunst en cultuur doordat ze een avontuurlijke en creatieve geest hebben (Kumar, Bakhshi & Rani, 2009; Skrinjaric, Budak, & Zokalj, 2018).

2.2 Big data

Big data wordt gedefinieerd als een groot volume aan data verzameld van verschillende bronnen, ook die met een minder betrouwbare kwaliteit, die gecombineerd worden in een grotere dataset, waar vervolgens analyses mee gedaan worden (Sax, 2016). Met deze analyses kunnen bedrijven nieuwe inzichten krijgen (George, Haas, & Pentland, 2014;

O'Leary, 2015). Met deze inzichten kan informatie asymmetrie verminderd worden tussen de bedrijven en de informatiebronnen, bijvoorbeeld andere bedrijven of individuen (O'Leary, 2015). Deze inzichten kunnen door de bedrijven gebruikt worden om een

(4)

marketing bijvoorbeeld wordt big data gebruikt om het sturen van gerichte reclame te

verbeteren. Bedrijven die goed presteren worden onderscheiden door hun vermogen om de data over wat consumenten doen en waarom ze het doen te verzamelen en integreren. Dit leidt tot nieuwe inzichten van wat de consumenten nodig hebben en hoe de bedrijven deze behoeften het best kunnen bevredigen (De Swaan Arons, van den Driest, & Weed, 2014).

Een voorbeeld van een bedrijf dat big data gebruikt is Nike+. Als gevolg van hun lijn van persoonlijke fitness producten en diensten kan Nike+ een diep begrip van hoe atleten in elkaar zitten en hun behoeften combineren met een grote hoeveelheid data. Nike+ verwerkt sensortechnologie in hardloopschoenen en draagbare apparaten die verbonden kunnen worden met het internet, apps voor smartphones en tablets, trainingsprogramma's, en sociale netwerken. Naast het bijhouden van hardloop routes en tijden, zorgt Nike+ voor motiverende feedback en koppelt gebruikers aan gemeenschappen van vrienden, andere atleten en zelfs trainers. De gebruikers krijgen gepersonaliseerde trainingsprogramma's die de vooruitgang bijhoudt. Ook worden de gebruikers beloond voor goede prestaties, ze kunnen hun prestaties delen op social media, en ze kunnen hun prestaties vergelijken met anderen in de Nike+ gemeenschap, waarvan ze ook kunnen leren (De Swaan Arons, van den Driest, & Weed, 2014).

Er zijn verschillende soorten bronnen waaruit big data verzameld kan worden. Hieronder vallen wat er aangeklikt wordt op internet, mobiele transacties, inhoud

gegenereerd door gebruikers zoals links, teksten en labels, video- en audiobestanden, en informatie gegenereerd door interactie op social media (George, Haas, & Pentland, 2014; Milan, & Gutiérrez, 2015). Daarnaast wordt ook met opzet data gegenereerd door

bedrijfstransacties zoals verkoop aanvragen, verkooptransacties (George, Haas, & Pentland, 2014).

Big data wordt gekenmerkt door vijf termen; volume, snelheid, verscheidenheid, juistheid en waarde. Waarbij volume staat voor de hoeveelheid aan data die verzameld wordt. Snelheid staat voor het tempo waarmee de data gegenereerd en verspreid wordt. Verscheidenheid staat voor de verschillende type data die beschikbaar zijn over individuen en entiteiten. Juistheid staat voor de kwaliteit en betrouwbaarheid van de data. Waarde staat voor de waarde die gegenereerd kan worden door de toename aan volume, snelheid,

verscheidenheid en juistheid van data (O'Leary, 2015; Zikopoulos, et al., 2013).

Er zijn vijf hoofdbronnen van data met een hoog volume: publieke data, private data, data-uitlaat, gemeenschaps data en zelf-kwantificerende data.

Publieke data is data die wordt verzameld door de overheid, overheidsinstellingen en lokale gemeenschappen. Deze data kan mogelijk gebruikt worden voor uiteenlopende bedrijf en management toepassingen. Bijvoorbeeld data over transport, energie verbruik, en

(5)

individuen te beschermen (George, Haas, & Pentland, 2014). De overheid geeft de door hen verzamelde data echter in bepaalde gevallen vrij zodat het publiek deze data kan gebruiken (Milan, & Gutiérrez, 2015). Private data is data die verzameld wordt door private bedrijven, non-profit organisaties en individuen die privé informatie reflecteren die nog niet klaar is om toegeschreven te worden aan publieke bronnen. Voorbeelden hiervan zijn klanten

transacties, radio frequentie labels die gebruikt worden door toeleveringsketens, verkeer van de goederen en middelen van een bedrijf, het surfen op een website, en gebruik van een mobiele telefoon. Data-uitlaat verwijst naar de omgeving gegevens die passief verzameld worden. Dit zijn geen kerngegevens en hebben een gelimiteerde of geen waarde voor degene die deze data verzameld. Deze data wordt verzameld voor een andere reden, maar het kan ook gecombineerd worden met andere databronnen om een nieuwe bron van

waarde te creëren. Wanneer individuen nieuwe technologieën gaan gebruiken, genereren ze omgeving gegevens als bijproducten van hun dagelijkse activiteiten. Individuen kunnen ook passief informatie uitzenden tijdens het dagelijks leven, zoals wanneer ze aankopen doen, van basisgezondheidszorg gebruik maken of wanneer ze omgaan met anderen. Een andere bron van data-uitlaat is informatie zoekend gedrag waaruit de behoeftes, verlangen en intenties van individuen afgeleid kunnen worden. Gemeenschaps data is een analyse van ongestructureerde data, voornamelijk tekst, in een dynamisch netwerk die sociale trends weergeeft. Voorbeelden hiervan zijn product recensies van consumenten, mogelijkheden te stemmen op websites bijvoorbeeld om aangeven of je een recensie handig vind, en Twitter berichten. Deze data kan vervolgens samengevoegd en geanalyseerd worden om er

patronen in de sociale structuur uit af te leiden. Zelf-kwantificerende data zijn typen data die verkregen worden door de persoonlijke acties en het gedrag van een individu te meten. Een voorbeeld hiervan is een armband die beweging registreert, de verzamelde data wordt dan naar een app verzonden waar het gevolgd en samengevoegd kan worden (George, Haas, & Pentland, 2014).

2.3 Privacy

Er zijn verschillende definities van privacy, hierdoor is de definitie gekozen die het beste past

_,..._

,,--

in kader van dit onderzoek. Deze definitie is: privacy is het vermogen om een informatie asymmetrie over de data van een individu te behouden

of

:erzekere~,ve-i,-te-~A-tcpleren welke informatie er gedeeld wordt !Bansal, Zahedi, & Gefen, 2016; (O'Leary, 2GJ_5;

Demmers, Van Dolen, & Welte eden, 2018). Hiermee wordt bedoela-dat-êeni hdividu door middel van privacy kan voorkomen at anderen iets over hen te weten komen/ waardoor een informatie asymmetrie ontstaat (O'Lea , 5).

(6)

Persoonlijke privé informatie verschilt in mate van gevoeligheid. Gevoelige privé informatie is een bepaald soort informatie waarbij, wanneer deze informatie bekend wordt gemaakt, het schade kan veroorzaken bij een individu op financieel of sociaal gebied. Zo

kan het vrijgeven van de bankgegevens of het burgerservicenummer leiden tot

identiteitsdiefstal, wat grote schade veroorzaakt. De bezorgdheid over de blootstelling aan zulke gevaren leidt tot het geloof dat individuen gevaar kunnen lopen wanneer ze van het internet gebruik maken. Dit heeft als gevolg dat individuen steeds terughoudender worden om hun persoonlijke gegevens te delen (Bansal, Zahedi, & Gefen, 2016). Ook zorgt het ervoor dat individuen verkeerde of fictieve informatie zullen invullen op een website, hun computer instellen om cookies te weigeren, of te weigeren om aankopen te doen op

bepaalde websites (Bansal, Zahedi, & Gefen, 2016; Wirtz, Lwin, & Williams, 2007). Volgens de communicatie privacy management theorie ervaren individuen spanning tijden het maken van de afweging tussen privacy en openbaring als ze beslissen om informatie wel of niet met anderen te delen. Bij het maken van deze beslissing spelen de risico's en voordelen van het delen van de informatie voor het individu een grote rol. Volgens deze theorie geloven

mensen dat hun informatie beschermd wordt door privé en

yxr6îiek;~

ge zen, die bepaald wor~en door regels die geworteld zijn in de sociale norm (~~o, 199 , 2002, zoals aang~aald-tA-Ea · Brinson, Doorey, & Wilçgx, 2016").~H'oewel dez theorie origineel ontwikkeld is voor persoonlijke interactie, is gevonden dat dezelfde afwegingen en grenzen gelden voor een online omgeving (Eastin, Brinson, Doorey, & Wilcox, 2016).

Doordat mobiele en web applicaties steeds complexer zijn geworden is de

verantwoordelijkheid voor het behouden van privacy bij het individu gekomen, hierdoor is het moeilijk voor individuen om hun privacy te beschermen en tegelijkertijd optimaal te kunnen functioneren (Mehrpouyan, Azpiazu, & Pera, 2017). Volgens de privacy regulerings theorie streven individuen ernaar om een optimaal niveau te behalen. Wanneer het gewenste niveau van sociale interactie hoger ligt dan het daadwerkelijke niveau dan zal een individu zich eenzaam of geïsoleerd voelen. Wanneer het gewenste niveau van sociale interactie lager ligt dan het daadwerkelijke niveau, dan zal een individu een gebrek aan privacy ervaren (Demmers, Van Ooien, & Weltevreden, 2018). In een fysieke omgeving kunnen individuen het niveau van sociale interactie reguleren door gebruik te maken van beperking mechanismen. Hieronder vallen persoonlijke ruimte, territorium, verbaal en nonverbaal gedrag. In een online omgeving, met name op social media, zijn er vijf types van beperking mechanismen. Het eerste mechanisme is relatie beperkingen, waarbij er wordt gekeken naar wie een individu toelaat tot zijn of haar sociale netwerk en wat de gepaste interacties zijn gegeven het type relatie. Het tweede is netwerk beperkingen, dit is de toegang die anderen hebben tot de netwerk connecties van een individu. Het derde is territoriale beperkingen, dit verwijst naar welke inhoud beschikbaar is op plaatsen met interactie. Het

(7)

vierde is openbaarmaking beperkingen, dit verwijst naar de persoonlijke informatie die openbaar gemaakt wordt binnen het netwerk van een individu. Het vijfde is interactie beperkingen, dit verwijst naar of de individu het mogelijk maakt om interactie aan te gaan met anderen (Demmers, Van Dolen, & Weltevreden, 2018).

2.4 Big Data tegenover privacy

Het probleem wat ontstaat bij gebruik van big data ten opzichte van privacy is dat de doelen fundamenteel tegenover elkaar staan. Het doel van big data is om zoveel mogelijk informatie te verzamelen en zo de informatie asymmetrie te verkleinen, terwijl het doel van privacy is om deze informatie asymmetrie te behouden (O'Leary, 2015). Door de statistische technieken gebruikt voor het analyseren van de verschillende bronnen van data is het mogelijk dat het gebruik van big data tot nieuwe inzichten leidt die niet verkregen konden worden uit de bronnen apart (George, Haas, & Pentland, 2014; Lazar, 2015; O'Leary, 2015). Dit is ook het geval als de informatie van een van de bronnen de privacy van een individu beschermd. Zo kan de analyse bijvoorbeeld de identificatie van een individu mogelijk maken uit bronnen die de privacy beschermen door deze samen te voegen (Lazar, 2015; O'Leary, 2015). Hieruit blijkt dat de controle die een individu heeft over de data over zichzelf die verzameld wordt gelimiteerd wordt door het gebruik van big data (Baruh, & Popescu, 2017). Dit is in strijd met de definitie van privacy wat betreft het vermogen van individuen om te controleren wat voor informatie er over hen gedeeld wordt (Bansal, Zahedi, & Gefen, 2016). Daarnaast wijst onderzoek uit dat de kennis die individuen hebben over de digitale economie onvoldoende is om hun privacy te kunnen beschermen, doordat ze bijvoorbeeld de termen in het privacy beleid niet begrijpen of dat ze het beleid helemaal niet lezen (Baruh, & Popescu, 2017; Lazar, 2015).

Uit onderzoek is gebleken individuen bezorgd zijn over hun privacy wanneer het gaat om gebruik van vormen van big data, en willen weten wat er met hun data gebeurd. Dit is vooral bij gebruik van het internet het geval (Baruh, & Popescu, 2017; Wirtz, Lwin, &

Williams, 2007). Door de verschuiving van bijvoorbeeld de marketing en klantenservice naar het internet zijn er zorgen ontstaan wat betreft privacy, wat resulteerde in negatieve reacties van consumenten. Daarbij gaat het voornamelijk om het enorme volume aan persoonlijke data dat verzameld wordt, de proliferatie van databanken, en de kans op de schending van privacy en het verlies aan controle tijdens het process van het verzamelen, het toegang krijgen tot en gebruiken van deze informatie (Wirtz, Lwin, & Williams, 2007).

Niet alleen bij het gebruik van het internet in het algemeen zijn er zorgen over privacy. Individuen ervaren dit ook bij de informatie die verzameld wordt door het gebruik van mobiele telefoons (O'Leary, 2015; Eastin, Brinson, Doorey, & Wilcox, 2016). Als gevolg van de ontwikkeling en verspreiding van mobiele technologie, en hierdoor de mobiele

(8)

marketing, zijn mobiele apparaten enorme een opslagruimte geworden voor persoonlijke informatie. Dit heeft derde partijen de mogelijkheid gegeven om deze persoonlijke informatie te gebruiken voor andere doeleinden. Zo hebben marketeers tegenwoordig de mogelijkheid om, door gebruik te maken van big data, verschillende informatiebronnen te combineren om zo persoonlijke profielen van consumenten te creëren. Deze profielen kunnen gebruikt worden om individuen te gericht verschillende vormen van marketing communicaties te sturen. Hierbij hebben de marketeers wel vaker grenzen overschreden van wat individuen goedkeuren en wat als storend wordt ervaren (Eastin, Brinson, Doorey, & Wilcox, 2016). Ook hebben marketeers tegenwoordig de mogelijkheid om de huidige locatie van een mobiel te traceren en dat te gebruiken om persoonlijke berichten te sturen gerelateerd aan de locatie van een individu (Eastin, Brinson, Doorey, & Wilcox, 2016; O'Leary). Uit een onderzoek is gebleken dat 68% van de respondenten een ongunstig beeld hebben van gepersonaliseerde advertenties in het algemeen, en dat veel consumenten angstig zijn over het verzamelen van persoonlijke informatie via zoekmachines, websites en mobiele

telefoons (Purcell, Brenner, & Rainie, 2012, zoals aangehaald in Eastin, Brinson, Doorey, &

Wilcox, 2016). Er zijn twee redenen gegeven die verklaren dat consumenten negatief

reageren op gepersonaliseerde advertenties, namelijk wanneer het bericht niet goed aansluit bij hun behoeftes en interesses, en wanneer het bericht problemen wat betreft de

bezorgdheid over privacy oproept (Eastin, Brinson, Doorey, & Wilcox, 2016).

Hiertegenover staat echter dat ondanks dat verschillende onderzoeken laten zien dat individuen bezorgd zijn om hun privacy online (Demmers, Van Dolen, & Weltevreden, 2018; Wirtz, Lwin, & Williams, 2007), individuen niet bereid zijn om meer te betalen om privacy te behouden. Dit is uit een rapport van the European Network Information and Security Agency gebleken. Er is gevonden dat minder dan een derde van de participanten was bereid om meer te betalen zodat hun data niet gebruikt wordt voor marketingdoeleinden (ENSIA, 2012, zoals aangehaald in Van Dijck, 2014). Hierdoor is data voor individuen een betaalmiddel geworden om gebruik te kunnen maken van communicatiediensten en veiligheid. De data die zo verzameld wordt, is voor het grootste deel verwerkt buiten de originele context en zonder dat individuen zich hiervan bewust zijn. Social media bedrijven verkopen deze data aan adverteerders en data bedrijven. Daarnaast delen ze de data met overheidsinstellingen, waaronder inlichtingendiensten. Bedrijven en overheidsinstellingen maken gebruik van de groeiende hoeveelheid data die verzameld wordt door social media en communicatie platforms zoals Facebook, Twitter, Whatsapp, Linkedln, YouTube, en gratis e-maildiensten zoals gmail en hotmail. Van de verzamelde data kunnen persoonlijke eigenschappen en attributen van individuen voorspeld en gevolgd worden door de bedrijven en

overheidsinstellingen. Bijvoorbeeld is het zo dat in het geval van Facebook likes gebruikt kunnen worden om een reeks gevoelige persoonlijke eigenschappen zeer precies en

(9)

automatisch te voorspellen. Hieronder vallen: seksuele oriëntatie, religieuze en politieke standpunten, karaktereigenschappen, etniciteit, intelligentie, geluk, gebruik van verslavende middelen, leeftijd, geslacht, en ouderlijke scheiding. Deze data zou door bedrijven gebruikt kunnen worden om gepersonaliseerde platform diensten te optimaliseren (Van Dijck, 2014).

Het identificeren van de gedrags- en activiteit patronen uit de data die onbewust worden achtergelaten op social media sites heeft als doel om toekomstig gedrag van individuen te voorspellen. Deze patronen zouden bijvoorbeeld door inlichtingendiensten gebruikt kunnen worden beginnende terroristische activiteit te voorspellen en de veiligheid te bewaren (Van Dijck, 2014). Hierdoor worden veiligheid en privacy tegenover elkaar gezet, wat bij individuen de wens oproept voor een beleid dat de privacy beschermt en het balanceert met veiligheid (Van Dijck, 2014; O'Leary, 2015).

2.5 De relatie tussen de big five karaktereigenschappen en privacy Er zijn verschillende onderzoeken gedaan naar de relatie tussen de big five

karaktereigenschappen en privacy in de digitale omgeving. Hierbij is gekeken naar de invloed die de big five karaktereigenschappen hebben op bezorgdheid over privacy (Bansal, Zahedi, & Gefen, 2016; Skrinjarió, Budak, & Zokalj, 2018). Uit het onderzoek van Bansal, Zahedi en Gefen (2016) is gebleken dat van de vijf karaktereigenschappen extraversie, vriendelijkheid en emotionele stabiliteit invloed hebben op de bezorgdheid over privacy. Bansal, Zahedi en Gefen (2016) stellen dat openheid voor ervaringen en zorgvuldigheid geen invloed hebben op de bezorgdheid over privacy verklaard wordt door het feit dat privacy ontstaat in een context met sociale interacties en dat de karaktereigenschappen in verschillende mate van sociale interacties worden gemeten. De manier waarop de

karaktereigenschappen zorgvuldigheid en openheid voor ervaringen gemeten worden, zoals aandacht besteden aan details in het geval van zorgvuldigheid, en dingen snel begrijpen in het geval van openheid voor ervaringen, hebben weinig met sociale interactie te maken, maar zijn gerelateerd aan de activiteiten en prestaties van het individu zelf hierdoor hebben ze geen invloed op privacy.

Extraversie en vriendelijkheid daarentegen zijn direct gerelateerd aan sociale

interacties. Extraversie wordt onder andere gemeten door het ervan genieten het middelpunt van de aandacht te zijn. Vriendelijkheid wordt gemeten door de mate van sympathieke gevoelens voor en gedragingen met anderen. Hierdoor hebben deze karaktereigenschappen invloed op privacy, de mate van hun invloed wordt bepaald door de gevoeligheid van de context. Emotionele stabiliteit wordt gemeten door de mate van stress, irritatie en verdriet die een individu ervaart. Deze emoties ontstaan soms door sociale interactie, hierdoor heeft emotionele stabiliteit in verschillende mate invloed op privacy. Dit is afhankelijk van de aard van de context (Bansal, Zahedi, & Gefen, 2016).

(10)

In een onderzoek naar de relatie Facebook activiteit en bezorgdheid over privacy is eveneens gevonden dat extraversie, emotionele stabiliteit en vriendelijkheid een positief effect hebben op de bezorgdheid over privacy (Sumner, Byers, & Shearing, 2011 ). Dit bevestigd de conclusties. Er zijn echter ook onderzoeken die dit tegenspreken. Zo is een onderzoek naar de relatie tussen bezorgdheid en social media platforms een positieve relatie gevonden tussen vriendelijkheid en zorgvuldigheid (Osatuyi, 2015). De verschillen in resultaten kunnen verklaard worden door het feit dat de onderzochte relaties van elkaar verschillen. Dit zorgt ervoor dat andere karaktereigenschappen een significant effect hebben op de relaties met bezorgdheid over privacy.

Het meest recente onderzoek van Skrinjaric, Budak en Zokalj (2018) bevestigd dat extraversie en emotionele stabiliteit invloed hebben op de bezorgdheid over privacy. Hier is echter neuroticisme gebruikt in plaats van emotionele stabiliteit. Dit is het tegenovergestelde van emotionele stabiliteit, wat inhoud dat een individu die hier hoog op scoort vaak

stemmingswisselingen heeft, niet goed kan omgaan met stress en veel angst ervaart. Ook zijn neurotische individuen vaak bezorgd, makkelijk geïrriteerd en boos. Hoe hoger een individu op extraversie of neuroticisme scoort hoe bezorgder de individu is over privacy. In dit onderzoek is er geen effect gevonden van vriendelijkheid op bezorgdheid over privacy. Skrinjarió, Budak en Zokalj (2018) geven aan dat dit effect ambigu is in de literatuur en dat ze dit effect niet hebben kunnen aantonen. In twee onderzoeken is de relatie tussen de big five karaktereigenschappen. Voor beide onderzoeken is dezelfde methode gebruikt, echter '\ zijn er tegen~.rijdige resultaten g~vonden betreft vriendelijkheid (Skrinjarió, Budak en Zokalj,

2018). Korz~an en Boswell (200 ) vonden een positief resultaat over de relatie tussen vriendelijkdeid en bezorgdhei egenover privacy, terwijl Junglas, Johnson en Spitzmüller (2008) een positieve relatie tussen deze twee variabelen gevonden hebben.

~ / De big five karaktereigenschappen kunnen ook gebruikt worden voor het voorspellen van de privacy voorkeuren van individuen in verschillende situaties. Er zijn echter verschillen in de voorkeuren van individuen en groepen voor dezelfde soort informatie, waardoor er niet één beleid kan worden opgesteld voor een bepaald soort informatie. Daarnaast is eruit het onderzoek gekomen dat individuen sterk de neiging hebben om informatie privé te houden voor verkopers, social media en vreemden (Mehrpouyan, Azpiazu, & Pera, 2017). Bij dit onderzoek is echter niet gekeken naar de verschillen tussen de soorten karakters, hierdoor kan er niet gesteld worden of de verkregen resultaten verschillen tussen individuen met andere karakters.

(11)

3. Model

Big Data

_<====~>

Definitie

privacy

Big five

karaktereigenschapp

Ervaren

inbreuk op

In deze paragraaf wordt het bovenstaande model beschreven aan de hand van

onderzoeksvragen. Deze onderzoeksvragen zijn met opzet breed genomen, omdat er hierdoor voorkomen kan worden dat er belangrijke aspecten niet mee worden genomen in het onderzoek. Ook worden er hypotheses gegeven op basis van de literatuur.

De eerste onderzoeksvraag is: Wat is het verband tussen big data en privacy? Deze vraag gaat om de pijl tussen big data en definitie privacy. Dit is om te kijken wat de invloed is van big data op privacy en omgekeerd, gezien deze begrippen in de literatuur tegenover elkaar geplaatst worden, zoals genoemd in het theoretisch kader. Dit verband wordt niet in de enquête behandeld, maar is onderzocht aan de hand van literatuur, zie paragraaf 2.4.

De tweede onderzoeksvraag is: Heeft perceptie van privacy in een situatie waarbij gebruik wordt gemaakt van big data invloed op hoe een individu een inbreuk van privacy ervaart? Deze vraag gaat om de pijl tussen definitie privacy en ervaren inbreuk op privacy. Dit is om te kijken of de perceptie van privacy invloed heeft op de mate waarin een inbreuk op privacy ervaren wordt en wanneer dit ervaren wordt in verband met het gebruik van big data. Hierbij is aan de hand van de theorie besproken in paragraaf 2.3 de volgende

hypothese opgesteld;

H1: Hoe gevoeliger of persoonlijker de informatie is waarom gevraagd wordt hoe groter de ervaren inbreuk op privacy zal zijn.

De derde onderzoeksvraag is: Wat is de invloed van persoonlijkheid op hoe individuen inbreuk op privacy ervaren? Deze vraag gaat om de pijl van de Big five karaktereigenschappen. Dit is om te kijken of mensen verschillende persoonlijkheden de inbreuk op privacy ook verschillend ervaren. Hierbij wordt de persoonlijkheid gemeten aan de hand van de Big five karaktereigenschappen. Aan de hand van de theorie besproken in paragraaf 2.5 zijn de volgende hypotheses opgesteld, hier wordt uitgegaan van de meest recente literatuur, namelijk het onderzoek van Skrinjaric, Budak en Zokalj (2018);

H2: De karaktereigenschappen emotionele stabiliteit en extraversie zullen invloed hebben op de ervaren inbreuk op privacy.

(12)

H3: De karaktereigenschappen vriendelijkheid, zorgvuldigheid en openheid voor ervaringen zullen geen invloed hebben op de ervaren inbreuk op privacy.

(13)

4. Methode

Dit onderzoek is een kwantitatief onderzoek met een exploratief doel. Dit houdt in dat er gezocht wordt naar nieuwe inzichten, het is niet bedoeld om een definitief antwoord te geven op de vragen die worden gesteld (Saunders, Lewis, & Thornhill, 2016, p. 716).

De onderzoeksmethode waarvoor is gekozen is een enquête, omdat het ervoor zorgt dat de informatie op een gestandaardiseerde manier kan worden verzameld, waardoor het makkelijk te vergelijken is (Saunders, Lewis, & Thornhill, 2016, pp. 182- 183). In de enquête zal eerst de persoonlijkheid vastgesteld worden, aan de hand van de vragenlijst voor de big five karaktereigenschappen, om te kijken of dit invloed heeft op hoe mensen een inbreuk op privacy ervaren. Hiervoor is een 50 item versie van de vragenlijst gebruikt, deze versie geeft een hogere mate van betrouwbaarheid dan versies die minder items bevatten (Skrinjarié, Budak, & Zokalj, 2018). Daarna zullen er drie soorten situaties voorgelegd worden waarbij voorbeelden worden gegeven voor het verkrijgen en gebruik van big data door bedrijven, en gevraagd worden of en in welke mate er een inbreuk op privacy ervaren wordt. Het eerste voorbeeld gaat om een klantenkaart van een supermarkt waarmee de supermarkt data kan verzamelen als klanten het gebruiken. Om van de klantenkaart gebruik te kunnen maken moeten individuen hun naam, e-mail en adres invullen. Hierbij worden er twee situaties gegeven, in de eerste situatie krijgen de klanten geen voordelen bij het gebruik van de klantenkaart. In de tweede situatie krijgen de klanten persoonlijke kortingen bij het gebruik van de klantenkaart. Na beide situaties is gevraagd in hoeverre men dit als een inbreuk op privacy zien en of ze gebruik zouden maken van de klantenkaart. Het tweede voorbeeld gaat om welke persoonlijke gegevens de respondenten zouden invullen bij het aanmaken van een social media account. Hierbij gaat het om persoonlijke gegevens zoals naam, e- mail, geslacht tot gevoelige informatie zoals waar de respondent woont, werkt of naar school gaat. Het derde voorbeeld gaat om wat voor soorten cookies websites gebruiken en of mensen de websites zouden bezoeken als ze weten dat ze deze cookies gebruiken. Hierbij varieert het van een website die geen cookies gebruikt, cookies gebruikt om het aantal bezoekers zij te houden en de website goed te kunnen laten functioneren, dit zijn de analytische en de functionele cookies, en cookies die de bezoeker van de website volgt tijdens en soms ook na het bezoek, dit zijn de tracking cookies, cookies van derden en flash cookies (Meijnen, 2018; Verschillende soorten cookies, 2018).

De situaties die beschreven zijn in de enquête die voor dit onderzoek gebruikt is, zijn gebaseerd op situaties genoemd in eerder onderzoek (Van Dijck, 2014; Lazar, 2015;

Jegatheesan, 2013), maar komen niet uit een eerder gebruikte enquête. Er is met opzet gekozen om geen concrete websites of supermarkten te noemen om te voorkomen dat de respondenten associaties hebben met de bedrijven, waardoor resultaten beïnvloed kunnen worden (Demmers, Van Dolen, & Weltevreden, 2018). De vragenlijst voor het bepalen van

(14)

de big five karaktereigenschappen is wel eerder gebruikt op verschillende vakgebieden (Mehrpouyan, Azpiazu, & Pera, 2017).

Voor het onderzoek wordt gebruikt gemaakt van internet enquêtes. Hiervoor is gekozen omdat er op die manier zo veel mogelijk individuen bereikt kunnen worden voor een goede steekproefgrootte. De link naar enquête is verspreid via Facebook, verschillende websites waar studenten de link naar hun enquête te verspreiden en

RespondentenDatabase.nl. Uiteindelijk zijn er 82 respondenten verkregen. Om de resultaten van enquêtes kwantitatief te analyseren is het programma SPSS gebruikt. Om vast te stellen of er relaties zijn tussen de variabelen en zo ja wat deze relaties zijn.

(15)

5. Resultaten

In deze paragraaf worden de resultaten gegeven. Ten eerste zullen de resultaten voor de betrouwbaarheid van de enquête gegeven worden. Ten tweede zullen de correlaties besproken worden. Ten derde de twee modellen voor regressieanalyses. Ten vierde zullen de resultaten van de drie verschillende situaties op zich gegeven worden.

De vragenlijst voor het bepalen van de big five karaktereigenschappen is zo vaak gebruikt op verschillende vakgebieden dat betrouwbaarheid ervan al gevalideerd is (Mehrpouyan, Azpiazu, & Pera, 2017). Voor dit onderzoek de Cronbach's alpha van de gehele vragenlijst wel getest om de betrouwbaarheid te bevestigen. De Cronbach's alpha die voor vragenlijst gevonden was 0, 772. De waarde ligt tussen de 0,6 en 0,8 dit geeft aan dat de betrouwbaarheid redelijk is.

Ook is de betrouwbaarheid aan de hand van de Cronbach's alpha gemeten voor de drie situaties van het gebruik van big data, omdat deze nog niet eerder zijn getest. Voor de eerste situatie met de klantenkaart van de supermarkt was de Cronbach's alpha 0, 704. Voor tweede de situatie met het aanmaken van een social media account was de Cronbach's alpha 0.797. Voor de derde situatie met de verschillende soorten Cookies was de Cronbach's alpha 0.763 (Tabel 1). Alle drie de waardes liggen tussen 0,6 en 0,8 wat betekent dat de betrouwbaarheid redelijk is. Daarnaast is de betrouwbaarheid van alle drie de situaties bij elkaar vastgesteld. Hiervan was de Cronbach's alpha 0,759, wat inhoud dat de betrouwbaarheid redelijk is.

Doordat bij het onderzoek gekeken wordt naar het effect van de big five

karaktereigenschappen op de ervaren inbreuk op privacy, is er gekeken naar de verschillen tussen de vijf karaktereigenschappen. Gezien individuen met verschillende karakters verschillend op bepaalde situaties reageren wanneer het om privacy gaat, zoals eerder beschreven in paragraaf 2.5, is er in dit onderzoek onderscheid gemaakt tussen de verschillende karakters en zijn deze apart getest.

Uit de resultaten zijn gebleken dat alleen de correlaties tussen social media en vriendelijkheid, en supermarkt en zorgvuldigheid significant zijn. De correlatie tussen social media en vriendelijkheid is -0,266 (p-waarde < 0,05), dit betekent dat er een matig negatief verband is tussen deze twee variabelen. De correlatie tussen supermarkt en zorgvuldigheid is -0,299 (p-waarde < 0,05), hier is er ook sprake van een matig negatief verband (Tabel 1).

Tabel 1

Variab Gemi Stand Gesla Leeftij Super Social Cooki Open Vriend Extrav Zorgv Emoti elen ddeld aardd cht d markt media es heid elijkhe ersie uldigh onele

(16)

e eviatie id eid stabilit eit Geslac 1,510 0,503 ht Leeftij 3,570 1,729 -0, 172 d Super 8,189 2,846 0,047 -0, 104 (0,704 markt ) Social 12,66 2,350 -0,022 0.160 0,283* (0,797 media 7 ) Cookie 9,013 2,842 -0, 117 0,193 0,578 0,299* (0,763 s

.

) Openh 37,09 6,749 0,016 -0,56 0,078 -0, 158 -0, 175 eid 7 Vriend 37,74 6,128 0,241 * 0,069 -0, 139 - -0,163 0,461 * elijkhei 3 0,266*

.

d Extrav 32,59 8,010 -0,032 -0,066 -0,096 -0, 168 0,036 0,626* 0,280 ersie 5

.

Zorgvu 31,88 5,331 0, 115 -0,064 - -0,198 0,057 0,194 0,314* 0,236* ldighei 7 0,292*

.

d Emotio 32,97 6,953 - 0,309* -0,142 0,128 0,024 0,234 0,177 0,296* 0,045 nele 2 0,245*

.

stabilit eit ..

*. Correlatie Is slqnificant b1J een waarde van 0,05 (tweezjjdiq) **. Correlatie is significant bij een waarde van 0,01 (tweezijdig) (. .. ) Cronbach's alpha

Om te kijken wat de invloed is van big data op de ervaren inbreuk op privacy, en of de big five karaktereigenschappen hier als moderator invloed op hebben zijn er regressieanalyses gedaan. De resultaten van deze analyses zijn te zien in de twee modellen weergegeven in Tabel 2. De resultaten van beide modellen als geheel zijn significant bevonden (p-waarde = 0.000 voor beide modellen). Model 1 heeft een R2 van 0,789, dit houdt in dat 78,9% van de totale variantie verklaard wordt door het model. Voor model 1 zijn er 2 regressie analyses gedaan, de eerste analyse was om te kijken of de drie situaties van big data invloed hebben op de ervaren inbreuk op privacy. Van deze drie situaties had alleen de situatie van de klantenkaart van de supermarkt een significante invloed op de ervaren inbreuk van privacy (p-waarde = 0.000). De beta van 0,868 laat zien dat deze situatie een sterk positief verband heeft met de ervaren inbreuk op privacy. De tweede regressieanalyse was om te kijken of de big five karaktereigenschappen invloed hadden op de ervaren inbreuk op privacy. Hieruit is gebleken dat geen van de big five karaktereigenschappen een significante invloed had op de ervaren inbreuk op privacy.

(17)

In model 2 is er een interactie variabele toegevoegd om te kijken of de big five karaktereigenschappen als moderator invloed heeft op de relatie tussen big data en de ervaren inbreuk op privacy. Model 2 heeft een R2 van 0,792, hier wordt 79,2% van de totale variantie verklaard wordt door het model. Dit model verklaart iets meer van de totale

variantie dan het eerste model. Uit deze regressieanalyse is wederom gekomen dat van de drie situaties, alleen de situatie van de klantenkaart van de supermarkt een significante invloed heeft op de ervaren inbreuk op privacy (p-waarde = 0.000). De beta voor deze situatie is gedaald ten opzichte van de beta uit model 1 naar 0,854. Hierbij is net als bij model 1 gevonden dat de big five karaktereigenschappen geen significante invloed hebben op de relatie tussen het gebruik van big data en de ervaren inbreuk op privacy.

Tabel2

Ervaren Model 1 Model 2

inbreuk (AV)

Coeffiecie SE Beta Coeffiecie SE Beta

ënt ënt (Constant) 0,780 0,602 1,958 0,047 Su perm ark 0,212 0,017 0,868 0,209 0,018 0,854 t Social 0,015 0.023 0.049 0,014 0,023 0,046 media Cookies -0,033 0,031 -0,072 -0,036 0,031 -0,078 Extraversi 0, 101 0,008 0, 110 0,010 0,008 0, 116 e Openheid -0,013 0,010 -0, 124 -0,013 0,010 -0, 127 Vriendelijk 0,001 0,009 0,012 0,002 0,009 0,13 heid Emotionel -0,003 0,007 -0,027 -0,002 0,007 -0,025 e stabiliteit Zorgvuldig -0,009 0,010 -0,062 -0,008 -0,010 -0,054 heid Big data* 0,000 0,001 0,058 Big five R2 0,789 0,792 N = 77

(18)

Dat uit de regressie is gebleken dat de situaties van het social media account en de cookies niet significant zijn in beide modellen, kan aan de manier waarop deze twee

situaties gemeten zijn liggen. De situaties zijn gemeten op basis van ja/ nee vragen, hierdoor wordt er geen gewicht gegeven aan de verschillende onderdelen waaruit deze vragen

bestaan. Er is alleen gekeken of de respondenten deze informatie vrij zouden willen geven in de situatie van het social media account en in de situatie van de cookies of de

respondenten van de website gebruik zouden maken als de website gebruik maakt van bepaalde cookies. Wel is uit het onderzoek gekomen dat hoe gevoeliger de informatie werd hoe meer respondenten ervoor kozen om dit niet vrij te geven en hoe meer de cookies de website bezoekers volgen hoe minder respondenten van deze website gebruik zouden maken (Tabel 3; Tabel 4). In Tabel 3 is te zien dat de meerderheid van de respondenten bereid was om minder gevoelige informatie voor- en achternaam (87,65% en 72,84%), e- mail (80,25%), geslacht (88,89%) en geboortedatum (72,84%) vrij was te geven. Zodra de informatie als persoonlijk ervaren werd daalde het aantal respondenten dat nog bereid om deze informatie vrij te geven naar tussen de 25,93% en 39,51 % voor de verschillende onderdelen. In Tabel 4 is te zien dat tussen de 70,37% en 87,65% van de respondenten bereid was om gebruik te maken van een website die of helemaal geen cookies gebruik of cookies gebruikt die ervoor zorgen dat de website beter functioneert en het aantal bezoekers bijhoud. Zodra het ging om websites die cookies gebruiken die ervoor zorgen dat de

bezoeker gevolgd kan worden, daalde het percentage respondenten dat bereid was om deze websites te gebruiken naar tussen de 22,22% en 26,25% voor de verschillende onderdelen.

(19)

Tabel3

Social media account % Ja % Nee

Voornaam 87,65 12,35 Achternaam 72,84 27,16 Geboorte datum 72,84 27,16 Geslacht 88,89 11, 11 E-mail 80,25 19,75 Telefoonnummer 25,93 74,07 Adres 28,40 71,60

Waar je naar school gaat of 39,51 60,49

ging

Waar je werkt 28,75 71,25

N = 82

Tabel4

Soorten cookies % Ja % Nee

Geen cookies 87,65 12,35

Analytische cookies 70,37 29,63

Functionele cookies 79,01 20,99

Tracking cookies 26,25 73,75

Cookies van derden 22,22 77,78

Flash cookies 23,46 76,54

N = 82

Voor de situatie van de klantenkaart van de supermarkt zijn de meningen van de respondenten redelijk verdeeld (Tabel 5). Deze situatie is gemeten aan de hand van een 5- punts likert scale, om te meten of respondenten helemaal geen tot een hele erge inbreuk op privacy ervaren bij deze situatie. Er is weinig verschil tussen de twee varianten van de situatie waarbij er wel en geen persoonlijke korting wordt gegeven. Al is in Tabel 5 te zien dat de percentages waarbij er niet echt of helemaal geen inbreuk op privacy ervaren wordt toenemen wanneer er wel korting wordt gegeven ten opzichte van de situatie zonder korting.

(20)

Hetzelfde geldt echter ook voor het percentage van de respondenten wat een hele erge inbreuk op privacy ervaart.

Tabel 5

Ervaren inbreuk privacy % Zonder korting % Met korting klantenkaart supermarkt Helemaal niet 19,54 21,84 Niet echt 10,34 13,79 Neutraal 36,78 33,33 Een beetje 17,24 13,79 Heel erg 16,09 17,24 N = 82

(21)

6. Discussie

In deze paragraaf worden de resultaten besproken. Ook zal worden aangegeven of deze resultaten te verwachten waren aan de hand van de literatuur.

Uit de resultaten is gebleken dat geen van de big five karaktereigenschappen invloed hebben op hoe individuen de inbreuk op privacy ervaren. Voor de karaktereigenschappen openheid voor ervaringen en zorgvuldigheid was dit verwacht, gezien dit overeenkomt met de resultaten uit eerdere onderzoeken zoals genoemd in paragraaf 2.5 en met hypothese H3. Het is onverwacht dat extraversie en emotionele stabiliteit ook geen invloed hadden op de ervaren inbreuk op privacy, gezien dit wel het geval was in eerdere onderzoeken, zoals dat van Skrinjaric, Budak en Zokalj (2018). Doordat deze twee karaktereigenschappen geen significante invloed hebben wordt hypothese H2 verworpen. Dit kan verklaart worden door het feit dat deze karaktereigenschappen gemeten zouden worden aan de hand van sociale interactie en daardoor een effect zouden hebben op de bezorgdheid over privacy, zoals genoemd door Bansal, Zahedi en Gefen (2016). Bij de enige situatie van big data waarbij een significant effect gemeten is, namelijk de klantenkaart van de supermarkt, is niet echt sprake van sociale interactie. De enige interactie aanwezig in deze situatie is dat de individu de klantenkaart laat scannen bij het doen van een aankoop. Ook kan het verschil verklaard worden doordat er voor dit onderzoek een andere relatie wordt gemeten waarbij de big five karaktereigenschappen als moderator zouden functioneren, dan de relaties in de besproken in paragraaf 2.5.

Zoals eerder genoemd, zijn er voor de situaties van het social media account en de cookies geen significante effecten gemeten. Dit is verklaard door de manier waarop deze situaties gemeten zijn, namelijk aan de hand van ja/ nee vragen. Hierbij is geen gewicht gegeven aan de punten die behandeld zijn, alleen of de respondenten deze informatie zouden vrijgeven voor het aanmaken van een account, of van de website gebruik zouden maken wanneer er gebruik gemaakt wordt van bepaalde cookies. Gezien deze situaties zelf al niet significant waren is het begrijpelijk dat de big five karaktereigenschappen hier geen significante invloed op de relatie hadden. De situatie van de klantenkaart van de supermarkt heeft wel een significante invloed op de ervaren inbreuk van privacy, hier geeft de beta (0,854) een positief effect aan tussen deze variabelen. Als de waarde van variabele van de klantenkaart met 1 toeneemt dan zal de ervaren inbreuk op privacy stijgen met 0,854.

Hoewel er bij de regressieanalyse geen significante resultaten zijn gevonden voor de big five karaktereigenschappen, zijn er wel significante correlaties gevonden tussen

zorgvuldigheid en de situatie van de klantenkaart van supermarkt (r2 = -0,299), en

vriendelijkheid en de situatie van het social media account (r2 = -0,266). Dit geeft aan dat er een zwak negatief verband aanwezig is voor beide relaties. Hoe hoger een individu scoort op zorgvuldigheid hoe negatiever de reactie zal zijn op de klantenkaart. Hoe hoger een

(22)

individu scoort op vriendelijkheid hoe minder hij of zij zou invullen bij het aanmaken van een social media account.

Uit het onderzoek is gekomen dat voor de situaties met het social media account en de cookies, hoe gevoeliger de informatie werd hoe meer respondenten ervoor kozen om dit niet vrij te geven en hoe meer de cookies de website bezoekers volgen hoe minder

respondenten van deze website gebruik zouden maken. Dit komt overeen met de theorie uit het artikel van Bansal, Zahedi, en Gefen (2016) waarin gesteld wordt dat individuen minder bereid zijn om privé informatie te delen wanneer deze gevoeliger wordt, en schade zou kunnen toebrengen als deze informatie bekend gemaakt wordt. Deze resultaten bevestigen deels H 1; er is niet gemeten hoe groot de ervaren inbreuk van privacy is, maar laten wel zien dat individuen niet bereid zijn om gevoelige informatie te delen.

7. Conclusie

Big data wordt als steeds belangrijker hulpmiddel gezien door onder andere marketing bedrijven om zo veel mogelijk te weten te komen over consumenten. Dit brengt echter een probleem met zich mee in verband met de privacy van individuen. Om dit probleem te onderzoeken is de volgende onderzoeksvraag opgesteld:I In hoeverre wordt het gebruik van big data als een inbreuk op privacy gezien?

Uit de regressieanalyse is gebleken dat de situatie van de klantenkaart van de

supermarkt een significante positieve invloed heeft op de ervaren inbreuk op privacy. Hieruit kan geconcludeerd worden dat er inbreuk op privacy ervaren wordt. Om te kunnen bepalen in hoeverre dit ervaren wordt is ook gekeken naar de percentages van de respondenten die hebben aangegeven een inbreuk op privacy te ervaren bij het gebruik van een klantenkaart van een supermarkt. In de eerste situatie waarbij er geen persoonlijke korting wordt gegeven bij het gebruik van de klantenkaart ervaarden 17,24% van de respondenten een beetje inbreuk van privacy en 16,09% hele erge inbreuk op privacy. In de tweede situatie waarbij er wel persoonlijke korting wordt gegeven bij het gebruik van de klantenkaart hebben 13,79% van de respondenten aangegeven een beetje inbreuk op privacy te ervaren en 17,24% heeft aangegeven hele erge inbreuk op privacy te ervaren. Voor beide situaties kan gezegd

worden dat ongeveer ½ van de respondenten een beetje tot hele erge inbreuk op privacy ervaren. De meerderheid van de respondenten waren neutraal tegenover de situatie of geen hebben inbreuk ervaren op privacy ervaren. Hieruit kan geconcludeerd worden dat het aan de persoon ligt of, en zo ja, in hoeverre er een inbreuk op privacy ervaren wordt.

8. Beperkingen en suggesties

Een van de beperkingen van dit onderzoek is dat er maar drie soorten van big data getest zijn, zoals aangegeven in het theoretisch kader zijn er veel meer verschillende soorten van

(23)

big data. Mede door de beperkte tijd en om de enquête niet te lang te maken is er gekozen om drie verschillende soorten te gebruiken voor het onderzoek.

Een andere beperking is dat door een gebrek aan respondenten in het begin van het onderzoek, was er een beperkte tijd om de resultaten te verwerken en het onderzoek af te ronden.

Voor een vervolgonderzoek is het aan te raden om voor de situaties van het social media account en de cookies voor ieder punt een likert scale te gebruiken, om zo gewicht te geven aan de verschillende onderdelen. Hierdoor voor ieder onderdeel de ervaren inbreuk op privacy gemeten worden. Daarnaast is het handig om voor vervolgonderzoek de tien item versie van de vragenlijst voor het bepalen van de big five karaktereigenschappen te

gebruiken in plaats van de 50 item versie. Ondanks de verminderde betrouwbaarheid van deze schaal, levert het wel een voordeel op doordat de 50 item versie te lang is en

respondenten afschrikt om het in te vullen.

Ook is het aan te raden om voor een vervolgonderzoek meer dan drie soorten van big data te onderzoeken.

(24)

Bibliografie

Aantal zorgsites stopt met tracking-pixel van Facebook. (2018, April 12). nos.nl. Verkregen van: https:! /nos. nl/artikel/2226957 -aantal-zorgsites-stopt-met-tracking-pixel-van- facebook. html

Bansal, G., Zahedi, F. M., & Gefen, D. (2016). Do context and personality matter? Trust and privacy concerns in disclosing private information online. Information &

Management, 53(1), 1-21.

Baruh, L., & Popescu, M. (2017). Big data analytics and the limits of privacy self-management. New media & society, 19(4), 579-596.

De Swaan Arons, M., van den Driest, F., & Weed, K. (2014). The Ultimate Marketing Machine. Harvard Business Review, 92(7/8), 55-63.

Demmers, J., Van Dolen, W. M., & Weltevreden, J. W. (2018). Handling Consumer Messages on Social Networking Sites: Customer Service or Privacy Infringement?.

International Journal of Electronic Commerce, 22(1 ), 8-35.

Eastin, M. S., Brinson, N. H., Doorey, A., & Wilcox, G. (2016). Living in a big data world: Predicting mobile commerce activity through privacy concerns. Computers in

Human Behavior, 58, 214-220.

George, G., Haas, M. R., & Pentland, A. (2014). Big data and management. Academy of

management Journal, 57(2), 321-326.

Jegatheesan, S. (2013). Cookies Invading Our Privacy for Marketing Advertising and Security Issues. arXiv preprint arXiv:1305.2306.

Junglas, I. A., Johnson, N. A., Spitzmüller, C. (2008). "Personality traits and concern for privacy: an empirical study in the context of location-based services", European

Journal of Information Systems, (17), 4: 387-402.

Kucuk, S. U., & Krishnamurthy, S. (2007). An analysis of consumer power on the Internet.

Technovation, 27(1-2), 47-56.

Kumar, K., Bakhshi, A., & Rani, E. (2009). Linking the 'Big Five' personality domains to Organizational citizenship behavior. International journal of Psychological studies,

1(2), 73.

Lazar, N. (2015). The big picture: Big data and privacy. Chance, 28(1 ), 39-42.

Mehrpouyan, H., Azpiazu, I. M., & Pera, M. S. (2017). Measuring Personality for Automatic Elicitation of Privacy Preferences. In Privacy-Aware Computing (PAC), 2017 IEEE

Symposium on (pp. 84-95).

Meijnen, D. (2018, Maart 17). Flash cookies: Wedden dat jij ze hebt?. Verkregen van: https://www.karelgeenen.nl/17 /flash-cookies-wedden-dat-jij-ze-hebt/

Milan, S., & Gutiérrez, M. (2015). Citizens' media meets big data: The emergence of data activism. Mediaciones, 11(14), 120-133.

.v

u

(25)

O'Leary, D. E. (2015). Big data and privacy: Emerging issues. IEEE Intelligent Systems,

30(6), 92-96.

Osatuyi, B. (2015). "Personality Traits and Information Privacy Concern on Social Media Platforms", Journal of Computer Information Systems, (55), 4: 11-19.

Saunders, M., Lewis, P., & Thornhill, A, (2016). Research methods for business students. l,

Harlow: Pearson Education limited.

Sax, M. (2016). Big data: Finders keepers, losers weepers? Ethics and Information Technology, 18(1 }, 25-31. DOI: 10.1007/s10676-016-9394-0

Skrmiaric, B., Budak, J., & Zokalj, M. (2018). The effect of personality traits on online privacy concern. Ekonomski pregled, 69(2), 106-130.

Sumner, C., Byers, A,

&

Shearing, M. (2011 ). "Determining personality traits

&

privacy concerns from Facebook activity", Black Hat Briefings, (11 ): 197-221.

Van Dijck, J. (2014). Datafication, dataism and dataveillance: Big Data between scientific paradigm and ideology. Surveillance & Society, 12(2), 197.

Verschillende soorten Cookies. (2018). CookiePolicy.nl. Verkregen van: http://cookiepolicy.nl/soorten-cookies/

Wirtz, J., Lwin, M. 0., & Williams, J. D. (2007). Causes and consequences of consumer online privacy concern. International Journal of Service Industry Management,

18(4), 326-348.

Zikopoulos, P., Deroos, D., Parasuraman, K., Deutsch, T., Corrigan, D., & Giles, J. (2013).

Harness the power of big data: The IBM big data platform. New York, NY: McGraw-Hill.

u

Appendix 1 Gender • Man • Women

(26)

Age

•

10-20

•

21-30

•

31-40

•

41-50

•

51-60 • 61- or older

Fill in what applies to you.

Disagree

Disagree a

little Neutral Agree a little Agree I am the life of the party

I feel little concern for others I am always prepared I get stressed out easily

I have rich vocabulary I don't talk a lot I am interested in people

I leave my belongings around

I am relaxed most of the time

I have difficulty understanding abstract

ideas

I feel comfortable around people

I insult people I pay attention to details

(27)

I have a vivid imagination

I keep in the background

I sympathize with other's feelings

I make a mess of things

I seldom feel blue

I am not interested in abstract ideas

I start conversations

I am not interested in other people's problems

I get chores done right away

I am easily disturbed

I have excellent ideas

I have little to say

I have a soft heart

I often forget to put things back in their proper place

I get upset easily

I do not have a good imagination

I talk to a lot of different people at parties

I am not really interested in others

I like order

(28)

I am quick to understand things

I don't like to draw attention to myself

I take time out for others

I shirk my duties

I have frequent mood swings

I use difficult words

I don't mind being the center of attention

I feel others' emotions

I follow a schedule

I get irritated easily

I spend time reflecting on things

I am quiet around strangers

I make people feel at ease

I am exacting in my work

I often feel blue

I am full of ideas

A supermarket offers a customer loyalty card. If you want to use it, you have to fill out your name, e-mail and address. If you use this card the supermarket can track what you buy and they use this information to make analysis, for example to see how likely it is that you buy certain products.

(29)

To what extend do you feel this is a violation of

your privacy?

Would you use this customer loyalty card?

• Yes • No

The supermarket uses the same customer loyalty card from the previous questions. Only now they offer you personal discounts if you use it.

Not at all Not really Neutral A little Very much To what extend do you

feel this is a violation of your privacy?

Would you use this customer loyalty card?

• Yes • No

In order to create an account for a social media site they ask for the following information. Would you give them the following information?

Yes No First name Last name Date of brith Gender E-mail Phone number Address Where you go or went to

school Where you work

(30)

1. Analytic cookies - keep track of visitors statistics.

2. Functional cookies - are needed to let the website function better, for example they keep track of what is in the shopping carts.

3. Tracking cookies - follow the visitor while browsing on the website and sometimes after. 4. 3rd party cookies - a website gives an advertiser permission to place a cookie on their site. The advertiser can see that you visited the website. If you visit different websites the advertiser placed cookies on they can see this and get more information than the different websites apart.

5. Flash cookies - makes use of Adobe Flash and can keep tracking the browsing behaviour of people even if the cookie settings are limited and all cookies are erased from the

computer.

Would you use a website if it uses ...

Yes No No cookies Analytic cookies Functional cookies Tracking cookies 3rd party cookies Flash cookies

(31)

Appendix 2

Correlations

Social TCo TConsci TEmotio TSuper _-medi okie TOpe TAgree TExtro entousn nal_stab Gen

market a s nness bleness version ess ility der Age TSupermar Pearson 1 .283 .065 .078 -.139 -096 -.292 -.142 .047 -.104 ket Correlation Sig. (2- .015 .587 .521 .259 .421 .015 .240 .695 .380 tailed) N 74 73 73 70 68 72 69 70 72 74 Social_med Pearson .283 1 .299 -.158 -.266 -.168 -.198 .128 - 022 .160 ia Correlation Sig. (2- .015 .010 .186 .026 .153 .097 .285 .850 .169 tailed) N 73 75 74 72 70 74 71 72 73 75 TCookies Pearson .065 .299

-

1 -.175 -.163 .036 .057 .024 -.117 .193 Correlation Sig. (2- .587 .010 .145 .182 .764 .637 .841 .326 .097 tailed) N 73 74 75 71 69 73 70 71 73 75 TOpenness Pearson .078 -.158 -.175 1 .461

-

.626

-

.194 .234 .016 -056 Correlation Sig. (2- .521 .186 .145 .000 .000 .109 .051 .897 .638 tailed) N 70 72 71 72 68 71 69 70 70 72 TAgreeblen Pearson -.139 -.266 -.163 .461

-

1 .280 .314

-

.177 .241 .069 ess Correlation Sig. (2- .259 .026 .182 .000 .020 .010 .149 .046 .572 tailed) N 68 70 69 68 70 69 67 68 69 70 TExtroversi Pearson -.096 -.168 .036 .626

-

.280 1 .236 .296 -.032 - 066 on Correlation Sig. (2- .421 .153 .764 .000 .020 .049 .012 .785 .579 tailed)

(32)

N 72 74 73 71 69 74 70 72 73 74 TConscient Pearson -.292 -.198 .057 .194 .314

-

.236 1 .045 .115 -.064 ousness Correlation Sig. (2- .015 .097 .637 .109 .010 .049 .712 .347 .598 tailed) N 69 71 70 69 67 70 71 70 69 71 TEmotional Pearson -.142 .128 .024 .234 .177 .296 .045 1 - 309

-

_stability Correlation .245 Sig. (2- .240 .285 .841 .051 .149 .012 .712 .039 .008 tailed) N 70 72 71 70 68 72 70 72 71 72 Gender Pearson .047 -022 -.117 .016 .241 -.032 .115 -.245 1 -.172 Correlation Sig. (2- .695 .850 .326 .897 .046 .785 .347 .039 .143 tailed) N 72 73 73 70 69 73 69 71 74 74 Age Pearson -.104 .160 .193 -.056 .069 -066 -.064 .309

-

-.172 1 Correlation Sig. (2- .380 .169 .097 .638 .572 .579 .598 .008 .143 tailed) N 74 75 75 72 70 74 71 72 74 76 Model Summary Std. Error of the Model R R Square Adjusted R Square Estimate

1 .888• .789 .756 .34996

a. Predictors: (Constant), Social_media, TExtroversion, TConscientousness, TCookies, TSupermarket, TEmotional_stability, TAgreebleness, TOpenness

ANOVAa

(33)

1 Regression 23.779 8 2.972 24.269 .000°

Residual 6.369 52 .122

Total 30.148 60

a. Dependent Variable: Ervaren_inbreuk

b. Predictors: (Constant}, Social_media, TExtroversion, TConscientousness, TCookies, TSuperm arket, TEmotional_stability, î Agreebleness, TOpenness

Coefficients3

Standardized Unstandardized Coefficients Coefficients

Model B Std. Error Beta t Sig.

1 (Constant) .780 .602 1.296 .201 TExtroversion .010 .008 .110 1.269 .210 TOpenness - 013 .010 -.124 -1.347 .184 TConscientousness -.009 .010 -.062 -.911 .367 TAgreebleness .001 .009 .012 .160 .874 TEmotional_stability -003 .007 -.027 -.388 .700 TCookies - 033 .031 -.072 -1.065 .292 TSupermarket .212 .017 .868 12.174 .000 Social_media .015 .023 .049 .687 .495

(34)

Std Error of the Model R R Square Adjusted R Square Estim ate

1 .890. .792 .755 .35098

a. Predictors: (Constant). interaction, Openness_meancentered, Social_mediam c, Conscientiousnessmc, Em otional_stabilitymc, Cookiesm c, Superm arketmc, Agreeblenessmc, Extroversion_mc

ANOVAa

.

Model Sum of Squares df Mean Square F Sig

1 Regression 23.865 9 2.652 21.526

.ooo"

Residual 6.282 51 .123

Total 30.148 60

b. Predictors: (Constant). interaction, Openness_meancentered, Social_mediamc, Conscientiousnessmc, Emotional_stabilitymc, Cookiesmc, Supermarketmc, Agreeblenessmc, Extroversion_mc

Coefficients"

Standardized Unstandardized Coefficients Coefficients

Model B Std. Error Beta t Sig.

1 (Constant) 1.958 .047 41.738 .000 Extroversion_mc .010 .008 .116 1.336 188 Emotional_stabilitymc -.002 .007 -.025 -.353 .726 Conscientiousnèssmc -.008 .010 · 054 -.779 .440 Agreeblenessmc .002 .009 .013 .174 .863 Openness_meancentered • 013 .010 -127 -1.370 .177

(35)

Superrn arketmc .209 .018 .854 11.613 .000

Social_mediamc .014 .023 .046 .640 .525

Cookiesmc - 036 .031 -078 -1.135 .262

interaction 000 .001 .058 .836 .407