• No results found

De waarde van intieme technologie voor de psychologische wetenschap

N/A
N/A
Protected

Academic year: 2021

Share "De waarde van intieme technologie voor de psychologische wetenschap"

Copied!
25
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

De Waarde van Intieme Technologie voor de Psychologische Wetenschap

Vincent de Haan

Bachelorthese Psychologie Aantal woorden: 6053

Begeleider: Max van der Linden Studentnummer: 5795591

(2)

Inhoudsopgave Inleiding 2 N = 1-onderzoek 4 Big data 9 Fysiologie en emotie 14 Conclusies 18 Literatuur 20 1

(3)

Vroeger was er een duidelijke scheiding tussen mens en machine. De mens leidde zijn leven, en gebruikte daar af en toe een hulpmiddel bij in de vorm van een machine. Hoewel deze machines in de loop der eeuwen technologisch steeds hoogstaander geworden zijn, bleven deze machines lange tijd echt los van de mens staande hulpmiddelen. De grens tussen mens en machine begint bij sommige vormen van technologie echter steeds meer te vervagen. Technologie waarbij deze grens vervaagt, wordt intieme technologie genoemd (Est, 2014).

Er zijn verschillende manieren waarop de grens tussen mens en machine kan vervagen. De machine kan in het lichaam van een mens worden ingebracht, zodat de grens tussen mens en machine letterlijk verdwenen is. Een voorbeeld hiervan is een brain-computer interface. Dat is een instrument waarbij met een sensor signalen uit het brein aan een computer door worden gegeven, die deze vervolgens verwerkt, bijvoorbeeld om een prothese mee aan te sturen. De grens tussen mens en machine vervaagt echter ook als mensen hun smartphone altijd bij de hand hebben en deze gebruiken voor taken die voorheen door het lichaam zelf werden uitgevoerd, zoals dingen onthouden. Zo kenden mensen vroeger belangrijke

telefoonnummers uit hun hoofd, maar is dat tegenwoordig niet meer nodig omdat de telefoon deze kan onthouden, en de telefoon altijd bij de hand is. Volgens sommige filosofen, zoals Clark en Chalmers (1989), kan dan gesteld worden dat mensen deze telefoonnummers nog steeds ‘kennen’, en dat de geest zich uitstrekt tot in de telefoon.

Ook is er sprake van intieme technologie bij sensoren die op het lichaam gedragen worden, zoals bijvoorbeeld een hartslagmeter. Deze sensoren nemen ook een functie van het lichaam over: voorheen vroeg iemand zich af hoe hij zich voelde door zijn lichaam aan te voelen; tegenwoordig leest hij dit af van een sensor. In sommige gevallen – bijvoorbeeld wanneer een suikerpatiënt zijn bloedsuikerspiegel prikt – is de sensor veel betrouwbaarder dan het onderbuikgevoel.

(4)

Deze intieme technologie wordt aangegrepen door de Quantified Self-beweging: een Quantified Self is iemand die allerlei psychologische en fysiologische gegevens over zichzelf bijhoudt (Swan, 2013). Een voorbeeld hiervan is Larry Smarr (2012). Hij houdt al tien jaar allerlei gegevens over zijn lichaam bij. Dit heeft er uiteindelijk onder meer toe geleid dat hij werd gediagnosticeerd met de ziekte van Crohn. Deze informatie verzamelen is op vele manieren – bijvoorbeeld met papieren logboekjes – mogelijk, maar intieme technologie is bijzonder handig om langdurig allerlei gegevens bij te houden. Fysiologische metingen kunnen in veel gevallen volledig automatisch verricht worden. Psychologische metingen kunnen bijvoorbeeld verricht worden met een app op een smartphone die enkele keren per dag een paar vragen stelt. Merk overigens op dat het Quantified Self zonder intieme technologie kan, bijvoorbeeld door papieren logboekjes bij te houden, en dat vice versa intieme

technologie ook niet altijd hoeft te leiden tot een Quantified Self, bijvoorbeeld als het

verzamelen van de data volledig automatisch en buiten de proefpersoon om gaat. Toch blijkt in de praktijk dat mensen met een Quantified Self vaak gebruikmaken van intieme

technologie. Daarom zullen in dit artikel soms voorbeelden met betrekking tot een Quantified Self worden gebruikt.

Binnen de beweging die zich bezighoudt met het Quantified Self zijn verschillende groepen te onderscheiden: er zijn eenlingen, zoals Larry Smarr (2012), die hierboven

beschreven werd, maar ook organisaties die van grotere groepen mensen data verzamelen en zo op groepsniveau uitspraken kunnen doen. Deze laatste groep is onder te verdelen in organisaties met een wetenschappelijke achtergrond en organisaties met een commerciële achtergrond (Swan, 2013).

Op het eerste gezicht lijkt intieme technologie zeer goed toepasbaar om te gebruiken bij wetenschappelijk onderzoek. Zeer veel mensen beschikken over een smartphone, dus daarmee kan een bijna eindeloze bron van proefpersonen worden aangeboord. Miller (2012) verwacht

(5)

dat er rond 2025 ruim vijf miljard smartphonegebruikers zijn, en ziet hierin grote

mogelijkheden voor psychologisch wetenschappelijk onderzoek. Elke smartphone beschikt namelijk over allerlei sensoren en wordt het grootste deel van de dag door zijn eigenaar gedragen. Dit kan waardevolle informatie opleveren. Een van de voorbeelden die hij noemt, is dat vrouwen anders lopen als ze vruchtbaar zijn dan wanneer ze dit niet zijn. Dit kan met bewegingssensors in smartphones op grote schaal en zeer nauwkeurig worden onderzocht, als de proefpersonen hun telefoon aan hun heup dragen tijdens het lopen. Toch heeft onderzoek met smartphones ook beperkingen, zowel op technisch als op ethisch gebied (Raento et al., 2009).

In dit artikel zal worden onderzocht op welke manier intieme technologie een rol kan spelen bij de wetenschappelijke beoefening van de psychologie. Hierbij zal worden ingegaan op drie deelgebieden waarop mogelijk problemen liggen voor intieme technologie, en hoe deze opgelost kunnen worden. Ten eerste wordt beoordeeld of het feit dat studies met intieme technologie vaak slechts op één persoon betrekking hebben, afdoet aan hun wetenschappelijke karakter. Daarna wordt gekeken naar mogelijke problemen met de analyse van de verzamelde data, die in het bijzonder te verwachten zijn bij het gebruik van intieme technologie omdat met intieme technologie vaak zeer grote hoeveelheden data verzameld worden. Ten slotte wordt meer theoretisch gekeken naar de relatie tussen fysiologie en emotie, die in veel studies die gebruik maken van intieme technologie, wordt verondersteld.

N = 1-onderzoek

Eén van de problemen die Swan (2013) noemt, is dat onderzoek naar het Quantified Self vaak slechts met één persoon plaatsvindt. Ze schrijft over een ‘small sample size of n = 1’,

(6)

maar deze formulering is niet scherp. Er is namelijk een belangrijk verschil tussen een studie waarin meerdere groepen vergeleken worden (between subjects) die door allerlei praktische beperkingen te klein zijn, en een studie waarin slechts één persoon wordt onderzocht die met zichzelf wordt vergeleken (N=1-onderzoek, within subjects). Deze studies hebben een geheel verschillend design. Een between subjects design met te kleine groepen, leidt waarschijnlijk niet tot significante resultaten. Voor een within subjects design geldt dat niet, zolang er maar per proefpersoon voldoende metingen verricht worden.

Criteria voor een goede N=1-studie

Om een goede N=1-studie te doen, moet echter wel enige zorgvuldigheid in acht worden genomen. Tate et al. (2008) hebben een schaal opgesteld aan de hand waarvan dergelijke studies beoordeeld kunnen worden. Zo kan de kwaliteit van deze studies in een getal worden uitgedrukt. De schaal is het gevolg van de bestudering van vele case studies door zes onderzoekers die jarenlange ervaring hebben met dergelijk onderzoek. Hoewel niet gezegd kan worden dat onderzoek onder een bepaalde score niet wetenschappelijk is, en daarboven wel, kan het wel instructief zijn de gebruikte criteria nader te onderscheiden.

Een gedeelte van de criteria heeft te maken met de verslaglegging. Hoewel belangrijk, is dat niet in het bijzonder van belang voor de vraag of intieme technologie gebruikt kan worden voor wetenschappelijk onderzoek. Daarom wordt hierna niet op deze criteria ingegaan. De eerste twee inhoudelijke criteria zijn dat het design van het onderzoek geschikt moet zijn om een causale relatie vast te stellen als deze onderzocht wordt. Dit betekent dat

baselinemetingen gedaan moeten worden, en dat herhaaldelijk moet worden bekeken of een eventuele interventie steeds hetzelfde effect heeft.

Ten tweede is het belangrijk dat er een voldoende grote steekproef genomen wordt. Hiermee wordt het bezwaar van Swan (2013) weerlegd: niet relevant is het aantal

(7)

proefpersonen, maar het aantal metingen per cel. In het geval van een N=1-onderzoek, bevindt zich in elke cel slechts één proefpersoon, namelijk, dezelfde. Dan moet per

proefpersoon dus een voldoende groot aantal metingen worden verricht. Hoeveel metingen dat in een specifiek geval zijn, moet worden berekend met een poweranalyse.

Voorts is van belang dat de interbeoordelaarsvaliditeit voldoende gewaarborgd is. Dit kan gedaan worden door verschillende beoordelaars te gebruiken die zich niet bewust zijn van de hypothese. Bij intieme technologie waarbij de proefpersoon zelf gevraagd wordt een bepaalde eigenschap in een app in te vullen, zal dit in de praktijk moeilijk worden. De

interbeoordelaarsvaliditeit is echter wel heel groot als gebruik gemaakt wordt van een sensor: een door een sensor gemeten waarde wordt niet beïnvloed door de subjectieve opvattingen van de proefpersoon.

Ten slotte wordt aandacht besteed aan de conclusies die dan uit een dergelijke studie getrokken mogen worden. Hier worden twee aspecten onderscheiden: generalisatie van hetzelfde effect naar verschillende personen (door Tate et al. replicatie genoemd) en generalisatie naar verwante effecten die tijdens de studie niet direct zijn onderzocht. De replicatie is hier van belang. Een N=1-studie leidt vanzelfsprekend alleen tot conclusies over de onderzochte proefpersoon. Tot ook andere proefpersonen onderzocht zijn, kan niet worden vastgesteld of het gevonden effect juist een – overigens wel stabiele – eigenaardigheid is van de betreffende proefpersoon, of een algemene eigenschap, die zich dan vanzelfsprekend ook in één proefpersoon manifesteert. Als de onderzoeker zich hier goed van bewust is, is dit op zich geen beperking van deze onderzoeksmethode.

Voordelen van N=1-studies

Dat de resultaten van een N=1-studie niet altijd generaliseerbaar zijn naar andere proefpersonen, kan ook als een voordeel gezien worden. Dit komt namelijk doordat de

(8)

studie juist die eigenschappen van een proefpersoon in kaart kan brengen, die hem van anderen onderscheidt. Kravitz et al. (2008) betogen dat vooral in de medische

behandelpraktijk N=1-studies een zeer krachtig middel kunnen zijn om tot geïndividualiseerde en betere behandelmethoden te komen.

Als op basis van onderzoek gebleken is dat bij een bepaalde diagnose medicijn X in 40% van de gevallen werkt, en medicijn Y in 60% van de gevallen, dan kan in het algemeen gezegd worden dat medicijn Y beter werkt. Echter, aan een individuele patiënt zal dan toch verteld moeten worden dat er, als hij medicijn Y krijgt, nog een kans van 40% is dat het medicijn niet aanslaat. Tegelijkertijd is het mogelijk dat indien medicijn Y niet aanslaat, medicijn X juist wel aan zou slaan, omdat de patiënt een variant van de ziekte heeft die juist op medicijn X beter reageert dan op medicijn Y. In plaats van elke patiënt met medicijn Y naar huis te sturen, zou het dus, zo betogen Kravitz et al. (2008) beter zijn om per patiënt te onderzoeken welk van de twee medicijnen het beste werkt. Intieme technologie kan hier mogelijk voor gebruikt worden. Zo kan besloten worden om eerst aan elke patiënt medicijn Y voor te schrijven, en vervolgens met intieme technologie het effect daarvan te monitoren. Als het medicijn dan niet effectief blijkt, kan snel alsnog medicijn X worden gegeven.

Dit argument is ook in een psychologische context toepasbaar. Er is nauwelijks een verband in de psychologie te vinden dat precies een correlatie van 1 heeft. Een bepaalde manipulatie leidt meestal tot een verhoogde kans op bepaald gedrag, maar zelden tot een zekerheid dat het gedrag zal optreden. Eén manier om dit probleem te ondervangen, is door het onderzoeksprotocol aan te passen, bijvoorbeeld door de manipulatie sterker te maken, of de meetinstrumenten nauwkeuriger. Een andere manier is echter om te onderzoeken op welke proefpersonen het verband wel en op welke het niet van toepassing is. Zo is het heel goed mogelijk dat een bepaald effect in een hele populatie niet of nauwelijks te vinden is, maar dat het voor specifieke personen wel degelijk bestaat. Hiervoor kunnen N=1-studies een

(9)

belangrijke rol spelen. Binnen de groep proefpersonen waarop het effect wel van toepassing is, zal de correlatie tussen de manipulatie en het effect dan ook dichter bij 1 (of -1) liggen dan binnen de gehele populatie.

Statistische methoden voor N=1-studies

Een andere moeilijkheid bij N=1-studies is het toepassen van statistische methoden. Een N=1-design is namelijk heel anders dan een within subjects design met groepen. In dit laatste geval is er namelijk per paar metingen (één in de controle- en één in de experimentele

conditie) wel samenhang, maar zijn de metingen binnen één conditie onafhankelijk. Bij een N=1-design is dat niet zo. Dit vraagt om ongebruikelijke statistische methoden.

Het voert hier te ver om in te gaan op de wiskundige details van verschillende

statistische methoden. Welke men kiest, zal immers afhangen van de precieze details van het experiment. Parker en Brossart (2003) hebben zeven verschillende methoden vergeleken. Zij hebben deze methoden toegepast op 50 verschillende datasets. Per methode werd de power, de effectgrootte, de covariantie met de andere methoden en de autocorrelatie bepaald. Hieruit bleek dat de methode beschreven door Allison en Gorman (1993, aangehaald in Parker & Brossart, 2003) en de methode van Center, Skiba en Casey (1985-1986, aangehaald in Parker & Brossart, 2003) in het algemeen het beste presteren, maar dat er datasets zijn waarop deze methoden juist weer grote afwijkingen vertonen. Zij concluderen dan ook dat het voor N=1-studies moeilijker is de juiste statistische methoden te vinden dan voor groepsN=1-studies.

N=1-studies op groepsniveau

Tot nu toe werd telkens aangenomen dat het de professionele wetenschapper is die een N=1-studie uitvoert. Er is echter ook een andere context denkbaar die binnen de Quantified Self regelmatig voorkomt. Hierin zijn het de proefpersonen die zichzelf bestuderen in hun

(10)

eigen N=1-experiment, en vervolgens worden zij als groep bestudeerd door de professionele wetenschapper.

Een voorbeeld hiervan is de studie die Kirwan et al. (2012) verrichtten. Zij

onderzochtten of het gebruik van een smartphone om hardloopresultaten bij te houden effect had op de afstand die de deelnemers liepen. Hierbij vergeleken zij twee groepen, één groep van proefpersonen die het aantal stappen dat zij liepen met een smartphone app bijhield, en één groep die dit via een website op de computer deed. Uit de resultaten bleek dat de groep die een smartphone app gebruikte gemiddeld meer stappen maakte, dan de groep die de website gebruikte.

In deze studie voerden de deelnemers voor zichzelf op verzoek van de onderzoekers weliswaar een N=1-studie uit, waarbij ze zich voor zichzelf – buiten het onderzoek van Kirwan et al. (2012) – allerlei dingen hebben kunnen afvragen. De professionele wetenschappers voerden echter een groepsstudie uit.

Groepsstudies die gebruikmaken van smartphones bieden veel nieuwe mogelijkheden voor onderzoek (Dufau et al., 2011; Miller, 2012). Met een studie die via smartphones wordt uitgevoerd, kan gemakkelijk een veel grotere groep proefpersonen bereikt worden dan in het laboratorium. Ook is te verwachten dat deze groep representatiever is dan de proefpersonen in het laboratorium, die doorgaans psychologiestudenten zijn. Nog steeds zullen echter bepaalde selectie-effecten optreden: zo is een smartphone niet weggelegd voor de allerarmsten, hebben jonge mensen vaker een smartphone dan oudere mensen, en is het ook niet ondenkbaar dat alleen mensen met bepaalde karakteristieken zich bezighouden met apps voor psychologisch onderzoek. Ook komt het voor dat bepaalde apps zich via sociale netwerken onder vrienden verspreiden (MacKerron & Mourato, 2013) en daardoor binnen bepaalde sociale kringen meer voorkomen dan binnen andere. Toch is de breedte van de aangeboorde groep proefpersonen

(11)

wel een stuk groter dan wanneer hoofdzakelijk psychologiestudenten geworven worden. Uiteraard is dit een claim die alleszins aannemelijk klinkt, maar die als smartphones een gangbaar instrument voor psychologisch onderzoek worden, ook aan empirische toetsing zal moeten onderworpen.

Casus: Mappiness

Mappiness (www.mappiness.org.uk) is een app die een of meerdere keren per dag aan de gebruiker vraagt een aantal vragen te beantwoorden. Er wordt onder meer gevraagd hoe vrolijk de gebruiker is, met wie hij is en of hij binnen of buiten is. Tevens verstuurt de smartphone de locatie van de gebruiker met de data mee. Mappiness werkt op twee niveaus: de individuele gebruiker kan grafieken zien die zijn vastgesteld op basis van zijn eerdere antwoorden. Hieruit kan hij mogelijk conclusies trekken over waar hij gelukkig van wordt; Mappiness geeft echter geen interpretaties, maar slechts visuele weergaven van de data. Dit is zijn eigen N=1-studie, waarvoor Mappiness hem een handig hulpmiddel biedt. De

professionele wetenschapper verzamelt aan de andere kant data uit heel Engeland en kan zo in kaart brengen op welke plaatsen en tijdstippen mensen het meest gelukkig zijn. Op de website van Mappiness is zelfs een ‘hedonimeter’ te zien die op elk moment van de dag aangeeft hoe gelukkig mensen in Engeland gemiddeld zijn.

Mappiness is een goed voorbeeld van hoe wetenschappers smartphones kunnen gebruiken om gemakkelijk veel data te verzamelen. Bij deze bespreking zijn echter de

statistische moeilijkheden die zich mogelijk voordoen, buiten beschouwing gelaten. De eerste resultaten zijn inmiddels overigens gepubliceerd (MacKerron & Mourato, 2013).

Conclusie

Er moet een belangrijk onderscheid gemaakt worden tussen groepsstudies met een kleine steekproef en N=1-studies. Deze laatste soort kan zeer waardevolle gegevens

(12)

opleveren, zolang aan de volgende zaken aandacht wordt besteed: het design van de studie moet geschikt zijn om de onderzoeksvraag te beantwoorden; dit kan vooral problematisch zijn als een causaal verband gezocht wordt. Ook moet worden opgelet dat uit één of enkele N=1-studie niet te algemene conclusies getrokken worden. Een N=1-N=1-studie kan echter ook grote voordelen hebben, bijvoorbeeld bij het onderzoeken van eigenschappen die alleen bij sommige personen aanwezig zijn. Het enkele feit dat intieme technologie dus vaak gebruik maakt van N=1-studies, is dus geen enkele belemmering om haar te gebruiken in

psychologisch wetenschappelijk onderzoek.

Big data

Intieme technologie kan tot hoeveelheden data leiden die een orde van grootte groter zijn dan gebruikelijke psychologische onderzoeksmethoden. In het geval dat het gaat om technologie die automatisch data verzamelt, zoals stappentellers en hartslagmeters, kan dit tot moeilijk behapbare hoeveelheden data leiden. Ook als de proefpersoon zelf in actie zal moeten komen om de data te verzamelen, bijvoorbeeld door twee keer per dag enkele vragen op zijn smartphone te beantwoorden, leidt dit na verloop van tijd tot een grote hoeveelheid metingen, vooral omdat via het internet gemakkelijk zeer veel proefpersonen gerekruteerd kunnen worden. Swan (2013) noemt een voorbeeld: een hartslagmeter verricht 250 keer per seconde een meting. Dat leidt al snel tot 9 gigabyte data per maand. Als deze data bij

miljoenen proefpersonen geautomatiseerd wordt verzameld – bijvoorbeeld door alle

hartpatiënten systematisch met een hartslagmeter op pad te sturen – leidt dat tot hoeveelheden data die met de huidige stand van techniek niet te behappen zijn. Met de toenemende

opslagcapaciteit en bandbreedte van het internet, zal dat echter op termijn niet meer het voornaamste probleem zijn. Een blijvend probleem is echter dat om op basis van zulke

(13)

enorme datasets conclusies te kunnen trekken, zorgvuldig met de data omgegaan moet worden goede statistische methoden moeten worden gebruikt. Hierna zal onderzocht worden of dat bij het gebruik van intieme technologie goed mogelijk is.

Kanskapitalisatie

De belangrijkste reden om statistiek te gebruiken, is dat het soms moeilijk is om op het blote oog te zien of twee groepen getallen significant van elkaar verschillen. Vanzelfsprekend zijn er overduidelijke gevallen, maar in veel gevallen die in de praktijk van het onderzoek voorkomen, is aan een grafiek wel te zien dat er een verschil is, maar niet of dit verschil ook significant is, of vice versa. Uit onderzoek van Simmons et al. (2011) blijkt echter dat het onjuist toepassen van statistische methoden tot zeer ernstige gevolgen kan leiden.

In hun artikel beschrijven Simmons et al. (2011) een studie met een zeer wonderlijke uitkomst: de deelnemers luisterden eerst naar muziek. In één conditie luisterden ze ‘When I’m Sixty-Four’, in de andere conditie ‘Kalimba’. Vervolgens werd hun geboortedatum en de geboortedatum van hun vader gevraagd. Uit de data bleek met een p-waarde van .040 dat degenen die naar ‘When I’m Sixty-Four’ geluisterd hadden, bijna anderhalf jaar jonger waren dan degenen die naar ‘Kalimba’ geluisterd hadden. Hieruit moet worden geconcludeerd dat het luisteren naar bepaalde muziek van invloed is op de geboortedatum.

Het is duidelijk dat dat onmogelijk is. Op het eerste gezicht is echter niet duidelijk wat de onderzoekers (in dit geval opzettelijk) fout gedaan hebben. Ze hebben de juiste toets toegepast en de p-waarde goed uitgerekend. Later in hun artikel blijkt echter dat ze hebben nagelaten enkele dingen te rapporteren: er was nog een derde conditie waarin proefpersonen naar een ander nummer moesten luisteren. Tussentijds werden er analyses uitgevoerd om te kijken of er nog meer proefpersonen nodig waren om een significant resultaat te krijgen. Behalve de leeftijd van zichzelf en van hun vader werd ook gevraagd hoe ze zich voelden,

(14)

hoeveel ze van een diner zouden genieten, wat de wortel was van 100 en nog een handvol andere volledig ongerelateerde variabelen.

Tussen de conditie en al deze andere variabelen werd geen verband gevonden. Echter, door genoegen te nemen met een p-waarde van .05, is de kans op een vals-positief 1 op 20. Als zoals in dit experiment zeer veel variabelen worden gemeten, is de kans groot dat ten minste één van die variabelen geheel toevallig samenhangt met de manipulatie – en dus een vals-positief oplevert. Dit verschijnsel wordt kanskapitalisatie genoemd. Door vervolgens alleen deze samenhang te rapporteren, kan ten onrechte de indruk gewekt worden dat er een verband bestaat tussen de manipulatie en de gerapporteerde variabele. Hieruit blijkt dat zelfs als de onderzoeker de statistische methoden op zich correct toepast, het nog steeds niet zeker is dat zijn conclusie correct is als hij niet ook goed oplet dat hij zijn onderzoek op de juiste wijze inricht en beschrijft.

Nu met intieme technologie relatief gemakkelijk zeer veel data verzameld kan worden, is er een groot kanskapitalisatie. Het gevaar bestaat immers dat onderzoekers zonder een vast idee een willekeurige verzameling eenvoudig meetbare variabelen gaan meten in de hoop hier dan later een verband tussen te vinden.

Voortdurende metingen

Een van de aanbevelingen die Simmons et al. (2011) doen om het door hen beschreven probleem te voorkomen, is dat voor elke studie vooraf vastgesteld moet worden hoeveel data verzameld wordt en welke hypothese daarmee getoetst zal worden. Dit sluit ook aan bij de praktijk van een laboratoriumstudie, waarbij vooraf een hypothese opgesteld wordt, deze getoetst wordt, en vervolgens wordt omgezet in een publicatie. Veel intieme technologie wordt echter gebruikt om proefpersonen permanent te onderzoeken. Dan zullen dus andere manieren bedacht moeten worden om vast te stellen hoeveel data verzameld moet worden, of

(15)

op basis van welke data conclusies getrokken moeten worden. Niet alleen zal deze data voortdurend gemeten worden, maar in sommige gevallen ook zal voortdurend gekeken worden of sprake is van een afwijking van eerder gemeten data. Dat betekent dat er met het verstrijken van de tijd zeer veel hypotheses getoetst zullen worden.

Een voorbeeld hiervan is het volgende: stel dat een bedrijf intieme technologie gebruikt om voortdurend de cortisolspiegel – als indicator van stress – van zijn werknemers in de gaten te houden. Het bedrijf hanteert een beleid dat medewerkers met een voortdurend verhoogde cortisolspiegel, bij de bedrijfsarts worden uitgenodigd. Wat is dan het moment waarop vastgesteld wordt dat er niet meer sprake is van een statistische fluctuatie, maar van een statistisch significante verhoging? In dit specifieke voorbeeld zijn verschillende oplossingen te bedenken: ten eerste is het mogelijk weliswaar continu data te verzamelen, maar slechts een paar keer per jaar de tot dan toe verzamelde data te toetsen. Zo wordt het aantal te toetsen hypotheses verkleind, waardoor ook minder kanskapitalisatie optreedt. Dit gaat echter wel weer ten koste van de mogelijkheid om snel een afwijking te signaleren. Een andere

mogelijkheid is om een lager significantieniveau te kiezen, maar dit zal er toe leiden dat meer situaties vals-negatief worden. Welke statistische methode in een concreet geval het beste werkt, zal afhangen van de specifieke situatie. In het algemeen is echter duidelijk dat bij voortdurende metingen het probleem van kanskapitalisatie een belangrijke rol speelt.

Causaliteit

Een heel ander probleem bij veel studies die gebruik maken van intieme technologie, is dat er geen causale relaties kunnen worden vastgesteld omdat er geen variabele wordt

gemanipuleerd. Het is echter maar de vraag of dat een inherent probleem van intieme technologie is of dat het slechts toevallig zo is dat er op dit moment weinig studies zijn die gebruikmaken van intieme technologie en een manipulatie uitvoeren.

(16)

Er zijn echter wel wat moeilijkheden om een manipulatie uit te voeren met intieme technologie. Het belangrijkste bezwaar is dat intieme technologie niet in het laboratorium, maar in het dagelijks leven gebruikt wordt. Een manipulatie kan dus zeer ingrijpende gevolgen hebben voor de deelnemer aan het onderzoek. Een deelnemer die besluit zich een uur in een laboratorium aan proefjes te onderwerpen, zal bereid zijn zich – een vergoeding in het vooruitzicht gesteld – veel meer te manipuleren dan een deelnemer wiens dagelijks leven wordt beïnvloed.

Een voorbeeld kan dit duidelijker maken. Kramer et al. (2014) manipuleerden hun proefpersonen via Facebook. Zij onderzochten of emotional contagion, het verschijnsel positieve en negatieve emoties op anderen kunnen worden overgebracht, ook op sociale netwerken van toepassing is. In het laboratorium was dit effect al uitvoerig aangetoond. Hiertoe deelden zij (met medewerking van Facebook) hun proefpersonen in in twee groepen: een groep waarbij emotionele verslagen van vrienden een grote kans hadden om te

verschijnen in het nieuwsoverzicht, en een groep waarbij deze verslagen een kleine kans hadden om te verschijnen. Merk op dat de verslagen zelf niet gemanipuleerd werden, maar alleen de kans dat deze in het beginscherm van Facebook werden getoond. Op basis van dit onderzoek werd geconcludeerd dat emotional contagion ook op sociale netwerken kan worden aangetoond. De manipulatie lijkt op het eerste gezicht zeer onschuldig: Facebook maakt altijd al een selectie van relevante verslagen, dus dat niet alle verslagen weergeven worden is normaal. De onderzoekers voegden zelf ook geen verslagen toe die niet echt waren, en ook de niet weergegeven verslagen waren alsnog beschikbaar als de gebruiker naar het Facebookprofiel van de betreffende vriend ging. Toch blijkt uit dit experiment dat een relatief simpele manipulatie als deze veranderingen teweeg kan brengen in emoties van de

proefpersonen. Zij hadden nooit uitdrukkelijk toestemming gegeven voor de uitvoer van dit experiment, anders dan door akkoord te gaan met de algemene voorwaarden van Facebook,

(17)

waarin in zeer algemene bewoordingen staat dat Facebook experimenten mag verrichten op de gebruikers. Hoewel technisch mogelijk, is dus te beargumenteren dat dit experiment niet voldoet aan de ethische normen voor experimenten met mensen.

Er zijn echter ook meer onschuldige voorbeelden te bedenken. Zo is een app die op een willekeurig moment op de dag de melding geeft: ‘Doe nu vijf ademhalingsoefeningen,’ en vervolgens allerlei fysiologische variabelen meet, waarschijnlijk niet bezwaarlijk. Bij een dergelijke manipulatie doet zich echter ook weer een praktisch probleem voor: het is veel moeilijker dan in het laboratorium om te controleren of de deelnemer de opdracht ook (goed) uitvoert. Er zijn dus wel manieren te bedenken waarop causaal onderzoek gedaan kan worden met behulp van intieme technologie, maar dit zal wel veel moeilijker zijn dan in het

laboratorium.

Casus: Mood Panda

Mood Panda (www.moodpanda.com) is een app die de stemming van de gebruiker bijhoudt. De gebruiker krijgt een of enkele keren per dag een bericht met de vraag om aan te geven hoe hij zich voelt op dat moment, en hierbij ook een reden aangeven. Vervolgens maakt de app hier allerlei visualisaties van, waaronder grafieken waarin de stemming tegen de tijd wordt uitgezet, een kalender waarin de stemming per dag met kleuren wordt aangegeven en een kaart waarop aangegeven wordt waar andere gebruikers zich bevinden en welke

stemming zij hebben.

Waar bij het eerder besproken Mappiness de nadruk ligt op het bestuderen van een populatie door de professionele wetenschapper, is Mood Panda duidelijk bedoeld om het individu met een Quantified Self te ondersteunen. Op de website van Mood Panda is te lezen: ‘It’s easy, and can help make you happier.’ Hoe dit precies werkt, wordt niet gesteld, maar er wordt gesuggereerd dat door het bijhouden van de stemming, de gebruiker patronen hierin

(18)

zou kunnen ontdekken. Hij kan dan leren wat hem wel en niet in een goede stemming brengt, en de situaties die hem wel in een goede stemming brengen vaker opzoeken. Dat op zich is een uitstekende theorie. De effectiviteit staat of valt echter bij de vraag of de patronen die de gebruiker ondekt werkelijke (causale) relaties zijn, of slechts het gevolg van statistische fluctuaties. De vraag is of deze app daaraan bij kan dragen, en zo niet, of hij zou kunnen worden aangepast zodat dat wel kan.

De kennis over mogelijke verbanden moet de gebruiker volledig afleiden uit visuele inspectie van de grafieken. Hier worden ook geen hulplijnen met betrouwbaarheidsintervallen of voortschrijdende gemiddelden in aangegeven. Op basis daarvan is het heel gemakkelijk om verbanden te zien die er niet zijn, of verbanden die er wel zijn over het hoofd te zien. Voor zover deze app dus bedoeld is om verbanden te leren kennen tussen bepaalde situaties en geluk, is hij dus ongeschikt.

Op basis van de data die door Mood Panda verzameld worden, is het echter heel goed mogelijk om allerlei hypotheses te toetsen, zoals: ‘Op zondag ben ik gelukkiger dan op de andere dagen.’ Nu deze app ontwikkeld is voor een breed publiek, is het logisch dat de

makers geen p-waarden hebben willen weergeven, maar het zou op zich mogelijk moeten zijn om de app een paar voor de hand liggende hypotheses (zoals relaties tussen geluk en de dag van de week) te laten toetsen en hier in woorden over te laten rapporteren.

Conclusie

Het gebruik van intieme technologie kan leiden tot het verzamelen van zeer veel data. Behalve enkele praktische problemen, vereist dit oplettendheid bij het toepassen van

statistiek. In het bijzonder moet worden opgelet dat er geen kanskapitalisatie optreedt. Ook zal het in veel gevallen moeilijk zijn om een causaal verband aan te tonen, omdat een manipulatie ofwel om praktische, ofwel om ethische redenen moeilijk uitvoerbaar is.

(19)

Fysiologie en emotie

De hierboven besproken voorbeelden hadden vaak betrekking op het meten van gedrag of het ervaren van emoties. Veel mensen met een Quantified Self houden zich echter ook bezig met het meten van fysiologische variabelen. Het is te verwachten dat deze interesse nog meer zal toenemen nu de voortschrijdende techniek het steeds makkelijker maakt allerlei fysiologische variabelen volledig automatisch te meten. Hoewel er geen reden is om in het algemeen te twijfelen aan de kwaliteit van deze meetinstrumenten, moet wel kritisch gekeken worden naar de waarde van deze fysiologische metingen.

Om de waarde van deze metingen te bepalen, moet bekend zijn wat het uiteindelijke doel van het onderzoek is. Wetenschappers binnen de psychologie zullen uiteindelijk geïnteresseerd zijn in psychologische variabelen als gedachten, gevoelens of gedrag. Ook niet-wetenschappelijke gebruikers van intieme technologie zullen in de meeste gevallen uiteindelijk als doel hebben hun gedrag of gevoelens te leren kennen en verbeteren. De fysiologische metingen moeten daar dus nuttig voor kunnen zijn.

In de literatuur is er weliswaar overeenstemming dat er enig verband is tussen de activatie van het autonome zenuwstelsel en emoties, maar er is nog wel discussie over hoe dit verband precies werkt (Levenson, 2014). Deze discussie gaat bijvoorbeeld over hoe specifiek dit verband is. Volgens Lang (2014, aangehaald in Levenson, 2014) is er slechts een verband met twee brede categorieën van responsen: reacties tegen bedreigingen en reacties op

beloningen. Kreibig (2010) onderscheidt echter zes negatieve en acht positieve emoties en beschrijft relaties tussen deze emoties en het autonome zenuwstelsel.

Wat van dit debat ook de conclusie moge zijn, op dit moment lijkt het toch handiger om iemands blijheid te meten door de vraag ‘Bent u blij?’ te stellen (of eventueel door het

(20)

afnemen van een daartoe bestemde vragenlijst, waarvan de validiteit voldoende is komen vast te staan), dan door allerlei fysiologische metingen te verrichten. Toch lijken de fysiologische metingen erg veel aantrekkingskracht te hebben. Dit komt mogelijk doordat zij een schijn van nauwkeurigheid hebben. Een fysiologische meting wordt verricht volgens

natuurwetenschappelijke principes en de uitkomst ervan is zeer goed kwantificeerbaar. Toch is deze nauwkeurigheid gedeeltelijk slechts schijn. Nog los van de eventuele

natuurwetenschappelijke problemen die aan een bepaalde meting kleven, is een fysiologische variabele als maat voor een psychologisch construct slechts nauwkeurig als met een redelijke mate van zekerheid is komen vast te staan dat de fysiologische variabele en het psychologisch construct in grote mate met elkaar samenhangen. Dat is in veel gevallen nog discutabel.

Casus: stress en cortisol

Het Amerikaanse bedrijf The Cortisol Connection (www.cortisol.com) heeft zijn hele bedrijfsmodel opgehangen aan het feit dat er een relatie bestaat tussen de cortisolspiegel, gemeten via het speeksel, en stress. Op de website geeft het bedrijf aan waarom het belangrijk is om dagelijks de cortisolspiegel te meten: het kan helpen te ontdekken of iemand te veel stress heeft en of er zich te veel vet ophoopt, omdat volgens The Cortisol Connection deze verschijnselen samenhangen met een verhoogde cortisolspiegel. Op deze gedachte zijn twee duidelijke punten van kritiek te leveren.

Ten eerste is de cortisolspiegel in het speeksel een zeer indirecte maat voor de

cortisolspiegel in de relevante delen van het lichaam en heeft, afhankelijk van allerlei andere omstandigheden een bepaalde stijging van de cortisolspiegel soms meer en soms minder effect. Hoewel het waar mag zijn dat stress door cortisol veroorzaakt wordt, is duidelijk dat dit niet wordt veroorzaakt door het cortisol in het speeksel, maar door het cortisol dat zich in de hersenen bevindt. Dat de spiegel in de hersenen, die uiteraard moeilijk te meten is,

(21)

overeenkomt met de spiegel in het speeksel, is een aanname die niet altijd correct is (Hellhammer et al., 2009).

Ten tweede dringt de vraag zich op waarom iemand die zich afvraagt of hij stress heeft, op een stukje kauwgom moet kauwen, dit in een buisje moet stoppen, dit op moet sturen, acht dagen moet wachten en $30 moet betalen om het antwoord op deze vraag te krijgen. Is het niet veel makkelijker als hij gewoon even stilstaat bij de vraag ‘Heb ik stress?’ Voor de beantwoording van de vraag of hij overtollig vet met zich meedraagt, kan een keer goed in de spiegel kijken ook voldoende zijn.

The Cortisol Connection maakt handig gebruik van het feit dat mensen blijkbaar fysiologische metingen waardevoller achten dan metingen van emoties. Er is echter geen goede wetenschappelijke rechtvaardiging voor het product dat dit bedrijf verkoopt.

Conclusie

Hoewel het nuttig kan zijn fysiologische metingen te verrichten, moet altijd de vraag worden gesteld wat een fysiologische meting eigenlijk meet, en welke conclusies daaraan op gedragsniveau kunnen worden verbonden. Fysiologische metingen lijken de voorkeur te hebben boven metingen van gedrag, maar in sommige gevallen berust dit slechts op de schijn van nauwkeurigheid van deze metingen.

Conclusies

In het voorgaande zijn drie uitdagingen besproken voor het gebruik van intieme technologie. Hoewel deze uitdagingen het bijna grenzeloze optimisme van bijvoorbeeld Miller (2012) enigszins beperken, zijn deze uitdagingen overkomelijk, mits de juiste voorzorgsmaatregelen getroffen worden. Hieruit blijkt dat er dus inderdaad plaats is voor

(22)

intieme technologie binnen de wetenschappelijke beoefening van de psychologie. Daarbij moet echter wel rekening worden gehouden met een aantal aanbevelingen.

Het enkele feit dat intieme technologie vaak gebruikt wordt bij N=1-studies, hoeft geen beperking te zijn, maar kan het onderzoek juist verrijken. Dan moeten wel de juiste

afwegingen gemaakt worden bij het maken van de onderzoeksopzet: het design van de studie moet geschikt zijn om de onderzoeksvraag te beantwoorden en uit één of enkele studies moeten niet te algemene conclusies worden getrokken. Bovendien moet goed onderscheid gemaakt worden tussen twee perspectieven: dat van het Quantified Self die zijn eigen N=1-experiment uitvoert om zichzelf in kaart te brengen, en dat van de professionele

wetenschapper die op groepsniveau mensen bestudeert die zelf N=1-experimenten uitvoeren.

Ook het analyseren van de data moet zeer zorgvuldig gebeuren. Dit is uiteraard zo voor elke vorm van wetenschappelijk onderzoek, maar nu het met intieme technologie heel

gemakkelijk is om zeer veel data te produceren, bestaat er een specifiek risico:

kanskapitalisatie. Dit is echter te voorkomen door duidelijk van tevoren vast te stellen welke hypotheses getoetst zullen worden, en op welke manier wordt vastgesteld wanneer voldoende data verzameld is. Verder is het belangrijk dat alle variabelen die gemeten worden, ook worden gerapporteerd.

Ten slotte moeten de meetinstrumenten goed worden uitgezocht bij de te beantwoorden onderzoeksvraag. Een onderzoeksvraag over gedrag en ervaren emoties kan vaak goed beantwoord worden met meetinstrumenten die gedrag en ervaren emoties meten, zoals

vragenlijsten of observatie. Er is geen enkele reden om naar fysiologische metingen te grijpen, alleen omdat de technische mogelijkheid zich daartoe aandient. Dit brengt alleen maar een risico van onnauwkeurigheid met zich mee, als voor de betreffende fysiologische meting niet

(23)

goed is aangetoond dat deze sterk correleert met het construct waar men eigenlijk in geïnteresseerd is.

Een ander punt, dat in de rest van dit artikel grotendeels buiten beschouwing gebleven is, is dat het gebruik van intieme technologie ook grote ethische vragen met zich mee kan brengen. Zo kan het voortdurend verzamelen en opslaan van data gemakkelijk als een inbreuk op de privacy van proefpersonen gezien worden. Ook is het gebruik van manipulaties in het dagelijks leven niet zonder kritiek. Miller (2012) en Raentu et al. (2009) gaan uitgebreid op deze ethische vraagstukken in.

Met deze aandachtspunten in acht genomen kan intieme technologie een nuttig hulpmiddel zijn binnen de wetenschappelijke beoefening van de psychologie. Het biedt immers een goede vervanging voor sommige laboratoriumstudies, die tijdrovend zijn en niet altijd de juiste proefpersonen aantrekken. Daarmee is het een nuttige uitbreiding van de gereedschapskist van de psychologische wetenschapper.

(24)

Literatuur

Dufau, S., Duñabeitia, J. A., Moret-Tatay, C., McGonigal, A., Peeters, D., Alario, F. X., & Grainger, J. (2011). Smart phone, smart science: how the use of smartphones can revolutionize research in cognitive science. PloS one, 6(9), e24974.

Hellhammer, D. H., Wüst, S., & Kudielka, B. M. (2009). Salivary cortisol as a biomarker in stress research. Psychoneuroendocrinology, 34(2), 163-171.

Kirwan, M., Duncan, M. J., Vandelanotte, C., & Mummery, W. K. (2012). Using smartphone technology to monitor physical activity in the 10,000 Steps Program: a matched case– control trial. Journal of medical Internet research, 14(2).

Kravitz, R. L., Duan, N., Niedzinski, E. J., Hay, M. C., Subramanian, S. K., & Weisner, T. S. (2008). What Ever Happened to N‐of‐1 Trials? Insiders' Perspectives and a Look to the Future. Milbank Quarterly, 86(4), 533-555.

Kreibig, S. D. (2010). Autonomic nervous system activity in emotion: A review. Biological Psychology, 84(3), 394-421.

Levenson, R. W. (2014). Emotion and the Autonomic Nervous System: Introduction to the Special Section. Emotion Review, 6(2), 91-92.

MacKerron, G., & Mourato, S. (2013). Happiness is greater in natural environments. Global Environmental Change, 23(5), 992-1000.

Miller, G. (2012). The smartphone psychology manifesto. Perspectives on Psychological Science, 7(3), 221-237.

(25)

Parker, R. I., & Brossart, D. F. (2003). Evaluating single-case research data: A comparison of seven statistical methods. Behavior Therapy, 34(2), 189-211.

Raento, M., Oulasvirta, A., & Eagle, N. (2009). Smartphones an emerging tool for social scientists. Sociological Methods & Research, 37(3), 426-454.

Est, R. van, m.m.v. V. Rerimassie, I. van Keulen & G. Dorren (2014). Intieme technologie: de slag om ons lichaam en gedrag, Den Haag, Rathenau Instituut.

Kramer, A. D., Guillory, J. E., & Hancock, J. T. (2014). Experimental evidence of massive-scale emotional contagion through social networks. Proceedings of the National Academy of Sciences, 111 (24), 8788-8790.

Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-positive psychology undisclosed flexibility in data collection and analysis allows presenting anything as significant. Psychological Science, 22(11), 1359-1366.

Smarr, L. (2012). Quantifying your body: A how‐to guide from a systems biology perspective. Biotechnology Journal, 7(8), 980-991.

Swan, M. (2013). The quantified self: Fundamental disruption in big data science and biological discovery. Big Data, 1(2), 85-99.

Talking20 (2013). Opgehaald 3 juni 2014, van http://talking20.me/2013/06/07/results/

Tate, R. L., Mcdonald, S., Perdices, M., Togher, L., Schultz, R., & Savage, S. (2008). Rating the methodological quality of single-subject designs and n-of-1 trials: Introducing the Single-Case Experimental Design (SCED) Scale. Neuropsychological Rehabilitation, 18(4), 385-401.

Referenties

GERELATEERDE DOCUMENTEN

Op het beeld van een 'tevreden meerderheid' die zich, ter continuering van haar verworven positie verzet tegen de sociale stijging van anderen (en dus tegen de

Als je je doel of ambitie kunt vertalen naar waarde voor mens, markt en maatschappij ben je in staat meer en hechtere relaties te smeden met de mensen die jou, je medewerkers,

Dit zijn veelal artikelen die relatief weinig koolhydraten en vetten bevatten en relatief veel eiwitten en groente.. Grijp deze kans aan om ze te proberen om erachter te komen wat

We hebben weer een krant vol toestan- den: bewoners voeren actie om de bus- dienst terug door de wijk te krijgen, her en der worden er vrijwilligers gezocht om de samenleving

Wanneer men probeert om bij kleine fluctuaties in te grijpen, (door bijvoorbeeld bij een iets te lage waarde te proberen de waarde van het proces te verhogen) dan zal het middel

Grondstoffen ontgonnen binnen Vlaanderen (productieperspectief) en door de Vlaamse consumptie (consumptieperspectief) in 2016 volgens het Vlaamse IO-model... MOBILITEIT,

[r]

Naast de CleverMove Weerstand cursussen, verzorgen wij ook meerdere online lessen per week.. U sport samen met anderen en jullie motiveren elkaar via