Hoofdstuk 4: Effect metaforen in medische informatieve teksten
4.2 Resultaten
4.2.2 Effect metaforen tekstbegrip
Het algemene effect van metaforen op het begrip van leken in de werking van ziektes wordt getoetst door de gemiddelde scores van proefpersonen die zijn behaald na het lezen van respectievelijk een zuiver medische uitleg, een uitleg met een goede metafoor en een uitleg met een slechte metafoor, met elkaar te vergelijken. Hierbij bestaat de score per proefpersoon uit het gemiddelde percentage correct gegeven antwoorden. Aangezien er drie vragen per soort uitleg werden gesteld over de werking van de betreffende ziekte, kan er van deze drie gegeven antwoorden een gemiddelde score per proefpersoon worden gemaakt. Hierbij worden in dit geval het correcte medische en metaforische antwoord allebei als een juist gegeven antwoord gezien, terwijl het incorrecte medische en metaforische antwoord en de optie ‘helemaal geen idee’ als een onjuist gegeven antwoord worden gezien. Heeft een proefpersoon bijvoorbeeld twee van de drie vragen juist beantwoord (wat voor soort antwoord dit ook mag zijn), dan geeft dit een gemiddelde score van 66,7%. Heeft een proefpersoon slechts één van de drie vragen juist beantwoord, dan geeft dit een gemiddelde score van 33,3%, etc. Door de gemiddelde scores van alle proefpersonen per soort uitleg met elkaar te vergelijken, kan op die manier worden vastgesteld welke soort uitleg klaarblijkelijk het beste werd begrepen en of metaforen daarmee een positief, negatief of geen effect hebben op het tekstbegrip van de proefpersonen.
Om het algemene effect van metaforen op het begrip van de werking van ziektes daadwerkelijk te kunnen toetsen, moet eerst worden onderzocht of de items (de drie fictieve ziektes) als één geheel kunnen worden gezien of juist apart behandeld moeten worden. Omdat het niet mogelijk is om de effecten van de soort uitleg op de drie verschillende ziektes per proefpersoon te meten en met elkaar te vergelijken ‐ wat de meest nauwkeurige uitslag had gegeven, maar onmogelijk is omdat de proefpersonen niet alle negen versies voor ogen kregen, maar slechts drie (zie 4.1.2.2.) ‐, wordt er in plaats van een Repeated Measures ANOVA‐toets een Oneway ANOVA‐ toets44 uitgevoerd. Uit deze toets blijkt dat er wel een verschil is in de manier waarop er op de verschillende ziektes werd gescoord, maar deze verschillen zijn niet significant (p=0,10). Belangrijker nog, er is bij geen enkele ziekte een significant verschil tussen de condities (de manier van uitleg) geconstateerd; alle p‐waardes45 zijn namelijk groter dan .26. Dat wil zeggen dat er op de verschillende ziektes wel anders is gescoord (omdat de werking van de ene ziekte wellicht
44 De outputs van alle uitgevoerde SPSS‐toetsen zijn te vinden in bijlage III
45 Onder de p‐waarde wordt de kans verstaan dat een verschil door toeval veroorzaakt wordt. Normaliter
wordt een significantieniveau van 0,05 aangehouden, wat inhoudt dat met 95% zekerheid gesteld kan worden dat de betreffende uitslag niet ontstaan is door toeval. Bij een p‐waarde tussen de 0,10 en 0,05 wordt er
eenvoud verschill verschill M gezegd w algemee ziekte. D gemidde Er zijn w bovensta per soor proefper antwoor minder metafoo die nu g aangeno 4.2.3 Re Nu het a belang t
diger te beg ende ziekte ende ziektes Met de conc worden dat e en een positi
Dit is aange elde scores p wel kleine v aand diagra rt uitleg in ka rsonen na rden), scoord goed (78,4% or het slechts goed of slech omen wordt. etrieval effe algemene eff te weten of 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Gemi ddel d perc enta ge juist gegeven an twoor d e n grijpen was es vergelijkb s apart te be clusie dat de er geen bew ef dan wel n etoond midd per soort uitl verschillen t m, waarin h aart is gebra het lezen den de proe %) en scoord st (75,8%). H ht zijn) hebb ect fect van met er een verba Custos Infir
dan de and baar waren. handelen en e verschillen wijs is gevond negatief effe dels een Re eg op individ ussen score het gemidde acht), maar d
van de zui efpersonen n den de proe iermee kan ben geen eff
taforen op he and is tusse rmus Pravu Betreffende z dere), maar Daarom is n kunnen de de ziektes a den dat meta ct hebben o epeated Me dueel niveau
es en de ma lde percenta deze zijn nie
iver medisc na het lezen efpersonen n
dan ook gest fect op het
et begrip van n de manier us Emissarius
ziekte en soort u
dat de effe er geen re ziektes als é als één item aforen (of di p het begrip easures ANO u berekent. anier waaro age juist geg
t significant che uitleg h
van de uitle na het lezen teld worden begrip van n de werking r van uitleg e Vitium Hiatu itleg ecten van de eden om de én item wor behandeld e nu goed of p van leken in OVA‐toets, d p ziektes w geven antwo bevonden (p het best (8
eg met een n van de uit dat de hypo leken in de
g van ziektes en de manie us Algehe Gee Goe Slec
e soort uitle e resultaten rden gezien.
kunnen wor f slecht zijn) n de werking die de versc
werden uitge oorden per z
p=0,20). Zo s 84,3% juist
goede meta tleg met een othese ‘meta werking van s bekend is, i er van het ge ele scores en metafoor ede metafoor chte metafoor
eg op de n van de rden, kan over het g van een chillen in elegd (zie ziekte en scoorden gegeven afoor iets n slechte aforen (of n ziektes’ s het van even van
een antwoord is. Met andere woorden, hanteren proefpersonen de gelezen metafoor bij het terughalen van medische kennis en daarmee het geven van hun antwoord (retrieval [Steen, 1994])? Deze onderzoeksvraag kan getoetst worden door te onderzoeken of metaforische antwoorden significant vaker gegeven worden wanneer er een uitleg met metafoor gelezen is dan wanneer de uitleg zuiver medisch was en wanneer er een ander soort metafoor in de uitleg betrokken was (een adequate metafoor dan wel inadequate metafoor). Door dit middels een Repeated Measures ANOVA‐toets te doen, kan gesteld worden dat proefpersonen op individueel niveau en ten opzichte van de twee andere soorten uitleg marginaal significant vaker kiezen (p=0,09) voor een correct metaforisch antwoord bij een goede metafoor in de uitleg. Met andere woorden, het correcte metaforische antwoord werd vaker gegeven wanneer er een goede metafoor in de uitleg werd gebruikt, wat de indruk wekt dat dit ‐ in lichte mate ‐ significante verschil aan retrieval (Steen, 1994) te wijten lijkt te zijn. Wanneer er een goede metafoor is gelezen, wordt deze metafoor dus ook onthouden en gehanteerd bij het geven van de antwoorden.
Daarnaast is het ook van belang om te weten of proefpersonen die een slechte metafoor in de uitleg hebben gelezen, ook vaker voor het incorrecte metaforische antwoord kiezen dan de andere twee groepen. Wederom worden daarom de frequenties van gegeven incorrecte metaforische antwoorden met elkaar vergeleken. De uitslag van deze Repeated Measures ANOVA‐ toets laat blijken dat de groep die een slechte metafoor in de uitleg heeft gelezen hoogstwaarschijnlijk niet aan retrieval (Steen, 1994) doen. Er kon namelijk geen daadwerkelijk significant verschil aangetoond worden (p=0,13 gaat).
4.2.4 Effect opleidingsniveau op tekstbegrip/retrieval
Omdat opleidingsachtergrond ook een effect zou kunnen hebben op de mate waarop de werking van een ziekte begrepen wordt, wordt ook het verband tussen het opleidingsniveau en de scores van proefpersonen onderzocht. Dit wordt gedaan door de resultaten van alle drie de groepen (VMBO’ers en MBO’ers, HBO’ers en WO’ers) middels een Oneway ANOVA‐toets met elkaar te vergelijken. Hieruit blijkt dat de lager en middelbaar opgeleiden (VMBO en MBO) de werking van de ziektes klaarblijkelijk het minst goed begrepen, door een gemiddelde score van 66,7% te behalen. De hoger opgeleiden (HBO) scoorden met een gemiddelde score van 77,4% beter. Tenslotte begrepen de hoogst opgeleiden in dit experiment (WO) de werking van de ziektes klaarblijkelijk het best, met een gemiddelde score van 87%. Deze verschillen in scores zijn volgens de gehanteerde Oneway ANOVA‐ toets in lichte mate significant (p=0,09) en op lineair niveau; hoe hoger het opleidingsniveau, hoe hoger de score, simpelweg gesteld. De lichte mate van significantie zou mogelijk te wijten zijn aan het kleine aantal N bij de laagopgeleiden (N=6). Waren er meer laagopgeleiden bij het experiment betrokken geweest, dan was de mate van significantie mogelijk ook hoger geweest. Hierover valt
echter niets met zekerheid te zeggen. Al met al kan wel geconcludeerd worden dat er redenen zijn om aan te nemen dat het begrip van de werking van een ziekte samenhangt met opleidingsniveau. Hoe hoger men opgeleid is, hoe beter men de werking van een ziekte begrijpt.
Is er dan ook een verband tussen het opleidingsniveau en de mate waarin aan retrieval (Steen, 1994) werd gedaan? Met andere woorden, zorgt een bepaald opleidingsniveau er voor dat er vaker metaforen gehanteerd worden in het terughalen van medische kennis? Om dit te toetsen worden de frequenties van gegeven correcte en incorrecte metaforische antwoorden aan de hand van de verschillende opleidingniveaus met elkaar vergeleken. De eerste Oneway ANOVA‐toets wijst uit dat er geen significant verschil is (p=0,64) tussen de opleidingsniveaus wat betreft het kiezen van het correcte metaforische antwoord bij het lezen van een goede metafoor. De groepen hanteren vrijwel net zo vaak de goede metafoor in het terughalen van kennis46. Ook in de frequentie waarop de verschillende opleidingsniveaus de slechte metafoor gebruiken om kennis terug te halen zijn geen verschillen aangetoond (p=0,14)47. Mogelijk is deze mate van significantie te wijten aan het feit dat er minder laagopgeleiden dan hoog opgeleiden en wetenschappelijk opgeleiden aan het experiment meededen. Zouden er meer laagopgeleiden mee hebben gedaan die op dezelfde manier scoorden, dan zou de mate van significantie mogelijk ook hoger liggen. Vooralsnog zijn er echter geen redenen om aan te nemen dat opleidingsniveau met de mate van retrieval (Steen, 1994) samenhangt.
4.2.5 Effect medische kennis op tekstbegrip/retrieval
Naast dit verband tussen opleidingsniveau en tekstbegrip, wordt ook het verband tussen de mate van medische kennis die de proefpersonen hadden en de score die zij behaalden onderzocht. Zorgt een hogere mate van medische kennis er voor dat er ook hoger wordt gescoord? Hierbij zijn de groepen ingedeeld in gradaties van medische kennis, namelijk ‘weinig medische kennis’ (3 en 4 op een schaal van 0 ‐ 10), ‘matige medische kennis’ (5 en 6 op een schaal van 0 ‐ 10) en ‘veel medische kennis (7 en 8 op een schaal van 0 ‐ 10).
De groep die van zichzelf vond dat ze weinig medische kennis had, had de beste score van alle drie de groepen (83,3%). De groep die van zichzelf vond dat ze over matig medische kennis beschikt (de overgrote meerderheid), had een gemiddelde score van 78,2% goed gegeven antwoorden, waarmee zij het slechtst scoort van alle drie de groepen. Tenslotte scoort de groep die van zichzelf vindt dat ze over veel medische kennis beschikt iets beter als de voorgaande groep, met een score van 79,6% goed gegeven antwoorden. Het verschil in gemiddelde scores tussen deze drie groepen kan niet als significant worden gezien (p=0,66). Dat wil zeggen dat de Oneway ANOVA‐toets 46 VMBO/MBO’ers kiezen na het lezen van een goede metafoor in de uitleg in gemiddeld 44,8% van de gevallen voor het correcte metaforische antwoord, tegenover 37,2% bij HBO’ers en 45,3% bij WO’ers. 47
VMBO/MBO’ers kiezen na het lezen van een slechte metafoor in de uitleg in gemiddeld 38,9% van de
uitwijst dat alle drie de groepen over het algemeen even goed hebben gescoord en er dus geen aanwijzingen zijn om te geloven dat het begrip van de werking van een ziekte samenhangt met de mate van medische kennis die reeds aanwezig is. Is er dan wel een verschil in de mate waarop de groepen aan retrieval (Steen, 1994) doen? Ook hier kan geen bevestigend antwoord op worden gegeven. Er is namelijk geen significant verschil (p=0,32) aan te tonen wat betreft het verschil in aantal gegeven correcte metaforische antwoorden na het lezen van de uitleg met de goede metafoor. Daarnaast is er ook geen significant verschil (p=0,43) aan te tonen wat betreft het verschil in aantal gegeven incorrecte metaforische antwoorden na het lezen van de uitleg met de slechte metafoor. Een kantlijn die hierbij geplaatst kan worden is dat de groep met veel medische kennis relatief klein was (N=6). Echter, omdat de significantieniveaus in beide gevallen heel laag zijn, is er geen reden om te geloven dat de mate waarin er aan retrieval (Steen, 1994) gedaan wordt en de mate van medische kennis waarover men beschikt met elkaar samenhangt.
4.2.6 Verband gegeven cijfer en soort uitleg
Tenslotte wordt er getoetst of er een verschil is in de manier waarop de verschillende soorten uitleg gewaardeerd worden. Hierbij konden de proefpersonen een score geven van 1 tot en met 10. Uit de vragenlijsten bleek dat de zuiver medische manier van uitleg door de proefpersonen het beste gewaardeerd werd, door deze soort uitleg een gemiddeld cijfer van 7,2 toe te kennen. De uitleg met de goede metafoor werd iets minder gewaardeerd; deze soort uitleg kreeg een 7,0 toegekend. Tenslotte werd de uitleg met een slechte metafoor over het algemeen het minst gewaardeerd, door deze soort uitleg gemiddeld een 6,8 toe te kennen.
Het verschil tussen de waardering voor de verschillende manieren van uitleg lijkt op het eerste gezicht klein, maar blijkt zeer significant te zijn (p=0,02). Dit resultaat lijkt voornamelijk te liggen aan het verschil in waardering tussen de uitleg op een puur medische manier en de uitleg aan de hand van een slechte metafoor (p=0,01). Toch waarderen de proefpersonen de zuiver medische uitleg ook marginaal significant beter dan de uitleg met een goede metafoor (p=0,09).
4.3 Conclusies
Allereerst valt uit de resultaten van het experiment op dat metaforen (of die nu goed of slecht zijn) geen significant positief of negatief effect hebben op het begrip van leken in de werking van ziektes. De werking van een ziekte wordt dus even goed begrepen wanneer deze op een zuiver medische manier wordt uitgelegd, als aan de hand van een goede of slechte metafoor. Dit resultaat is in strijd met zowel de theorie van conceptuele integratie (waarbij adequate BLENDS ‐ in dit geval metaforen ‐
idealiter een positief effect op het tekstbegrip zouden hebben, als met de theorieën van Badeer en Hicks (1992), Spiro et al (1989) en Miller (1976) (waarbij metaforen ‐ of die nu goed of slecht zijn ‐ een negatief effect op het tekstbegrip zouden moeten hebben). Maar waarom hadden de goede metaforen geen aantoonbaar effect (of dat nu positief of negatief is) op het begrip van de werking van ziektes? En waarom werd er naar aanleiding van een uitleg met een slechte metafoor vergelijkbaar gescoord als bij de andere twee groepen?
Op deze vragen zijn verschillende antwoorden mogelijk. Allereerst kan het verstandig zijn na te gaan waarom de groep die de uitleg van een ziekte op een puur medische manier niet koos voor de onjuiste antwoorden en daarom het beste scoorde; in meer dan 8 van de 10 gevallen koos zij namelijk voor het juiste antwoord. De onjuiste antwoorden bestonden uit twee vormen: het medische onjuiste antwoord en het metaforische onjuiste antwoord. Omdat deze groep in hun uitleg geen metafoor had gelezen, is de kans kleiner dat ze voor het metaforische antwoord kiest. Als dit ook nog een metaforisch antwoord is die heel moeilijk te rijmen is met hetgeen ze in de uitleg heeft gelezen, zal ze hier niet snel voor kiezen. De medische informatie die de proefpersonen in de uitleg lazen, moeten ze bij het lezen van de meerkeuzemogelijkheden namelijk zelf herkennen in de metaforische antwoorden. Als dit metaforische antwoord vergelijkbaar is met de medische informatie die ze hebben gelezen, dan zouden ze eenvoudig voor dit metaforische juiste antwoord kunnen kiezen. Gaat het echter om een metaforisch antwoord wat niet snel te rijmen is met de medische informatie die ze hebben gelezen, dan zullen ze hier minder snel voor kiezen. Met andere woorden, het zou makkelijker kunnen zijn een juist antwoord te kiezen wanneer de ziekte op een zuiver medische manier is uitgelegd, omdat dan niet in termen van de metafoor wordt gedacht. Op die manier worden de antwoordmogelijkheden die in andere (metaforische) termen zijn omschreven, in plaats van medische termen, minder in overweging overgenomen. Het lijkt dan vooral een keuze te zijn tussen het juiste medische antwoord en het juiste metaforische antwoord, waarbij het medische antwoord in de meeste gevallen wint.
Dan het uitblijven van een eventueel positief effect van een goede metafoor op het begrip van de werking van ziektes. Het moeilijk kunnen maken van een juiste keuze voor de groep die een goed passende metafoor in de uitleg gepresenteerd kreeg, zou op eenzelfde manier verklaard kunnen worden. Omdat deze proefpersonen wel met een metafoor te maken kregen, worden er
twee INPUT‐ruimtes gecreëerd, tegenover één INPUT‐ruimte van de groep die de ziektes op een zuiver medische manier kreeg uitgelegd. Omdat de metaforische terminologie in de antwoordmogelijkheden op die manier bij deze groep wél past bij wat ze in de uitleg hebben gelezen, ontstaat er bij deze groep meer twijfel ‐ zeker wanneer de gelezen metafoor maar gedeeltelijk is onthouden ‐ tussen welk metaforisch antwoord de juiste is: het juiste metaforische antwoord of het onjuiste metaforische antwoord. De termen die in deze beide antwoordmogelijkheden gebruikt zijn, komen namelijk sterk met elkaar overeen. Het gaat namelijk in beide gevallen om iets wat bijvoorbeeld met doorgangsbanen, transport, etc. te maken heeft. Om dan het afwijkende aspect van de slechte metafoor (hetgeen wat niet ‘klopt’ in het antwoord) te ontdekken, blijkt moeilijk te zijn. Immers, de metafoor is misschien wel onthouden, maar de specifieke details daarvan soms niet (of het bijvoorbeeld nu om een vertraging of complete afsluiting van een treinstation gaat). Omdat deze groep op die manier meer twijfelt tussen de metaforische antwoordmogelijkheden, zou ze ook kunnen beginnen te twijfelen aan het onjuiste medische antwoord. Het metaforische onjuiste antwoord zou proefpersonen in verwarring kunnen brengen, waardoor ze ook gaan twijfelen aan hoe de ziekte nu precies werkt (de MEDISCHE INPUT‐ruimte). Vanwege deze verwarring zouden ze sneller dan de groep die de ziekte op een puur medische uitgelegd kreeg, voor het onjuiste medische antwoord kunnen kiezen. Al met al zou deze verwarring het eventuele positieve effect van een metafoor kunnen neutraliseren, waardoor de groep uiteindelijk vrijwel net zo goed scoort als de groep die een puur medische uitleg had gelezen.
De uitkomst dat de groep die de ziektes met behulp van een slecht passende metafoor vrijwel even goed scoort als de andere twee groepen, is een interessante uitkomst die lastig, maar wel verklaard kan worden. Op basis van de theorie van conceptuele integratie en de theorieën van Badeer en Hicks (1992), Spiro et al (1989) en Miller (1976) zou verwacht worden dat deze groep (veel) minder goed zou scoren. Bovendien zou het feit dat proefpersonen de ziektes op twee manieren kregen uitgelegd ‐ op een juiste medische manier en op een onjuiste metaforische manier ‐ alleen al voor onduidelijkheid kunnen zorgen. Verwacht werd dan ook dat de meerderheid van de proefpersonen, wanneer ze aan retrieval (Steen, 1994) zouden doen, zich zou laten leiden door deze onjuiste metaforische informatie. Uit de resultaten blijkt dat een deel van de proefpersonen dit ook wel doet; werd er een fout gemaakt door de proefpersonen, dan lag dit aan veruit de meeste gevallen aan de metafoor die in de uitleg werd gebruikt en bij het geven van het antwoord werd