Discussie - Hoezo spontaan?

6.1. Perceptie-experiment

6.1.1. Blij en boos niet herkend

Het eerste doel van dit scriptieonderzoek was om te onderzoeken of mensen verschillende high arousal emoties van elkaar konden onderscheiden als zij alleen de intonatie konden horen. Hiervoor is een perceptie-experiment gehouden waarbij 52 participanten naar 20 boze en 22 blije fragmenten moesten luisteren. Deze fragmenten klonken alsof iemand achter een deur stond te praten, want alle frequenties boven de 500Hz waren verwijderd. Uit de resultaten is gebleken dat de participanten in dit onderzoek de fragmenten niet konden herkennen als boos of blij. Gemiddeld genomen hadden de participanten 24 van de 42 fragmenten goed herkend, een getal dat bijna gelijk is aan de gokkans.

Deze uitkomst in is lijn met de hypothese die eerder gesteld was. Op basis van de literatuur werd verwacht dat het verschil tussen een boze en een blije emotie in spraak niet te horen zou zijn. Boze en blije emoties hebben namelijk allebei een hoge mate van arousal, dat wil zeggen dat de het stemgeluid niet alleen luider, sneller en intenser wordt, maar ook dat de toonhoogte gemiddeld genomen hoger ligt, de pitch range groter is en er meer dominante pitches aanwezig zijn dan bij emoties met een lage mate van arousal (Gilbers et al., 2015). Dat mensen dan toch emoties op basis van hun waarde kunnen herkennen (Banse en Schrerer, 1996), zal waarschijnlijk niet te maken hebben met de toonhoogte en pitch range, want deze waren in dit experiment nog duidelijk hoorbaar. Om erachter te komen welke parameters dan wel een rol spelen bij het onderscheiden van high arousal emoties, zal gezocht moeten worden in meer subtielere parameters, zie paragraaf 6.2.2.

6.1.2. Geacteerde fragmenten vaker correct herkend dan spontane fragmenten

In het perceptie-experiment waren 21 spontane fragmenten opgenomen en 21 geacteerde fragmenten. Deze fragmenten bestonden uit dezelfde uitingen, uitgesproken door verschillende personen. Uit de resultaten is gebleken dat de geacteerde fragmenten significant vaker juist werden herkend dan de spontane fragmenten. Hoewel dit in lijn is met de gestelde hypothese, is dit wel een opvallend resultaat.

Allereerst ligt het wel in de lijn der verwachtingen dat geacteerde fragmenten eerder herkend zouden worden dan spontane fragmenten, want bij geacteerde spraak hoeft geen rekening gehouden te worden met de constraint least-effort. Hierdoor wordt in geacteerde spraak een meer optimale realisatie gecreëerd waarbij de ideaalpatronen voor emotionele spraak duidelijker tot uiting komen. Omdat de participanten tijdens het perceptie-onderzoek luisterden naar gemaskeerde fragmenten, moesten zij op basis van de prosodie het binnenkomende spraaksignaal proberen te matchen met hun eigen cognitieve templaten/ideaalpatronen van boze en blije spraak. Met behulp van de intonatie in de fragmenten, konden de participanten de emotie

in de geacteerde spraak beter herkennen dan de emotie in de spontane spraak. In spontane spraak wordt de emotie immers minder ideaal gerealiseerd, waardoor participanten deze spraak moeilijk konden matchen met hun cognitieve templaten.

Opvallend is dit resultaat wel, omdat uit eerder onderzoek is gebleken dat boze en blije emoties in spraak niet te herkennen zijn met behulp van de mean pitch en pitch range. Toch herkenden participanten significant vaker de geacteerde emotie dan de spontane emotie. Dit zou kunnen komen doordat de kwaliteit van de geacteerde fragmenten in sommige gevallen beter was dan die van de spontane fragmenten. De spontane fragmenten waren namelijk van de televisie gehaald en daar was soms meer ruis te horen dan bij de geacteerde fragmenten die waren opgenomen in de studio. Maar er is ook een andere mogelijke verklaring. In Tatham en Morton (2004) is namelijk een tabel opgenomen van het onderzoek van Stibbard (2001) waaruit blijkt dat boze en blije emoties wel hetzelfde zijn qua mean pitch en pitch range, maar verschillen qua F0 variatie. Dat wil zeggen dat de veranderingen in toonhoogtes bij boze emoties anders verlopen dan bij blije emoties, namelijk onregelmatig bij boosheid en soepel (smooth) bij blijdschap. De variatie in toonhoogte is nog wel te horen wanneer alle frequenties boven de 500 Hz worden weggehaald in spraak, dus hieraan hebben de participanten de emoties wellicht herkend. Dit betekent ook dat in geacteerde spraak dus duidelijkere variatie in toonhoogte aanwezig is dan in spontane spraak. Daarnaast was in het perceptie-expriment naast de toonhoogtes natuurlijk ook het ritme van de spraak nog te horen in de gemaskeerde fragmenten.

Waar wel rekening mee gehouden moet worden bij het trekken van conclusies, is dat de spontane fragmenten zijn ingesproken door allemaal verschillende personen en dat de geacteerde fragmenten zijn ingesproken door twee personen. De geacteerde fragmenten kunnen dus niet rechtstreeks vergeleken worden met de spontane fragmenten, omdat ze niet uitgesproken zijn door dezelfde persoon.

6.2. Analyses emotionele spraak

Voor dit scriptie-onderzoek is niet alleen een perceptie-experiment gedaan, maar de fragmenten die daarvoor gebruikt zijn, zijn ook geanalyseerd op pitch range en Voice Onset Time. In paragraaf 6.2.1. zullen de resultaten die de pitch range betreffen worden bediscussieerd en in paragraaf 6.2.2. zal een kleine discussie over de Voice Onset Time volgen.

6.2.1. Pitch range

Met behulp van het programma PRAAT is de pitch range van de geselecteerde fragmenten vastgesteld. Uit de resultaten is gebleken dat de pitch range van boze emoties niet significant verschilde van de pitch range van blije emoties. Eerder onderzoek heeft dit ook aangetoond, dus dit is geheel in lijn met de verwachtingen.

De pitch range van geacteerde fragmenten verschilde ook niet significant van de pitch range van spontane fragmenten. De verwachting was dat de pitch range groter zou zijn bij de

geacteerde spraak, omdat deze spraak vaak veel overdrevener is gerealiseerd dan spontane spraak. Toch is in dit onderzoek geen significant verschil gevonden in de pitch range tussen spontane en geacteerde spraak. Deze bevindingen moeten echter wel met enige voorzichtigheid behandeld worden, want naast het feit dat de spontane fragmenten van andere sprekers komen dan de geacteerde fragmenten, speelt de vraag hoe spontaan de fragmenten echt zijn ook een rol. De spontane fragmenten komen namelijk uit televisieprogramma’s zoals Utopia (real life soap) en De Wereld Draait Door (talkshow), waarin de kandidaten zich waarschijnlijk wel bewust zijn van de camera’s die op hen gericht staan. Het grote probleem is dan ook de onrealistische aanname dat spraak uit de media een directe expressie is van het ‘echte’ gevoel van de spreker (Scherer, 2013). Hoewel we hebben aangenomen dat de spraak op televisie niet vooraf bedacht is, zou het wel mogelijk zijn dat bijvoorbeeld Utopia gescript is. Bovendien is het niet ondenkbaar dat de mensen in programma’s als De Wereld Draait Door of RTL Late Night zich zodanig bewust zijn van hun publiek en de camera’s dat ze hun spraak daaraan aanpassen. Wanneer geacteerde spraak in de toekomst zal worden vergeleken met spontane spraak, zal de spontane spraak streng geselecteerd moeten worden.

6.2.2. Voice Onset Time

Uit eerder onderzoek én uit dit onderzoek is gebleken dat emoties met een hoge mate van arousal niet van elkaar onderscheiden kunnen worden met behulp van mean pitch en pitch range. Om toch een verschil te kunnen beschrijven, lijkt het van belang om naar subtielere parameters te gaan kijken. Gilbers et al. (2015) toonden immers aan dat emoties als blijdschap en boosheid door participanten in het algemeen goed worden waargenomen, wanneer naar onzinzinnen wordt geluisterd. Er moeten dus indicatoren zijn die het verschil maken tussen boze en blije spraak. Uit eerder onderzoek van Kienast en Sendlemeier (2001) bleek al dat boze spraak qua articulatie nauwkeuriger was dan blije spraak. Dat wil zeggen dat er minder segmenten weggelaten worden en er minder assimilatie plaatsvindt dan in blije spraak.

Om erachter te komen hoe mensen het verschil tussen boze en blije spraak maken, is ook aan de acteurs gevraagd hoe zij denken te articuleren wanneer zij boos of blij acteren. Hun antwoorden waren als volgt:

 Actrice: “Als ik toneelspeel, boos of blij, gebruik ik opeens de huig-r terwijl ik normaal altijd

de tongpunt-r gebruik. Daarnaast vond ik mijzelf af en toe haast Fries klinken. Als ik blij acteer ga ik hoger praten en als ik boos acteer ga ik harder en luider, de articulatie is dan pittiger en ik spreek echt alles duidelijk uit. Dat doe ik niet bij blij, omdat het voor mijn gevoel bij boos belangrijker is dat alles goed over komt.”

 Acteur: “Ik heb het idee dat ik, als ik blij acteer, de lange klinker iets verder uitrek. En als ik

boos doe, leg ik meer de nadruk op de korte klinkers. Maar ik kan niet echt vertellen wat ik bewust doe om blij of boos te acteren.”

Uit de resultaten is gebleken dat er qua toonhoogte geen verschil te vinden is tussen de boze en de blije spraak, daarom is ook een analyse uitgevoerd die de intensiteit betreft. In dit geval is de Voice Onset Time van stemloze plofklanken aan het begin van een lettergreep gemeten. De verwachting was dat de VOT in boze spraak groter zou zijn, omdat de acteurs aangeven pittiger en meer staccato te articuleren. Toch is dat uit de resultaten van dit onderzoek niet gebleken, in blije spraak leek de VOT zelfs groter te zijn. Maar duidelijke conclusies kunnen hier niet uit getrokken worden, er is namelijk maar van 17 stemloze plofklanken van één persoon de VOT gemeten. Om representatievere resultaten te verkrijgen, zou van meer klanken en meer personen de VOT gemeten moeten worden. In toekomstig onderzoek kan dan ook gekeken worden naar deze en andere subtiele parameters die de kracht van articulatie beschrijven, bijvoorbeeld naar de ratio van sterke en zwakke lettergrepen of naar reductieprocessen.

6.2.3. Dominante pitches en modaliteit

Uit het onderzoek van Schreuder (2006) is gebleken dat Teigetje en Iejoor in respectievelijk majeur- en mineurmodaliteit spreken. Vervolgens heeft het onderzoek van Gilbers en Van Eerten (2010) aangetoond dat modaliteiten meer in geacteerde spraak voorkomen dan in spontane spraak. In dit scriptieonderzoek is gebleken dat in geacteerde spraak inderdaad meer dominante pitches voorkomen dan in spontane spraak, maar in de blije spraak was geen majeurmodaliteit aan te wijzen. Een verklaring hiervoor is dat Teigetje en Iejoor veel extremer acteren dan de acteurs in dit onderzoek. Bij Teigetje en Iejoor is het communicatieve doel dan ook om aan kinderen hun vrolijke en sombere karakter over te brengen, daarbij worden blijkbaar de modaliteiten die we kennen uit de muziek toegepast als een soort ideaalpatroon.

Hoewel er in geacteerde spraak niet altijd muzikale modaliteit aan te wijzen is, is er in de meeste gevallen wel te zeggen dat er meerdere dominante pitches aanwezig zijn. In geacteerde spraak wordt binnen een bepaalde pitch range gesproken over verschillende toonhoogtes, er is dus meer variatie te horen dan in spontane spraak. Wellicht dat de variatie in toonhoogte ook een rol speelt bij het verschil tussen blij en boze spraak, omdat geacteerde fragmenten in het perceptie-experiment beter werden herkend dan de spontane fragmenten. In toekomstig onderzoek zou gekeken kunnen worden hoe de pitchvariatie en andere force of articulation-karakteristieken bij blije en boze spraak verschillen. Er moet dan echter wel naar geacteerde spraak gekeken worden, omdat in spontane spraak minder variatie voorkomt.

In document Hoezo spontaan? (pagina 29-33)