• No results found

Hoofdstuk 4:  Effect metaforen in medische informatieve teksten

4.2  Resultaten

4.2.2  Effect metaforen tekstbegrip

Het algemene effect van metaforen op het begrip van leken in de werking van ziektes wordt getoetst  door de gemiddelde scores van proefpersonen die zijn behaald na het lezen van respectievelijk een  zuiver medische uitleg, een uitleg met een goede metafoor en een uitleg met een slechte metafoor,  met elkaar te vergelijken. Hierbij bestaat de score per proefpersoon uit het gemiddelde percentage  correct  gegeven  antwoorden.  Aangezien  er  drie  vragen  per  soort  uitleg  werden  gesteld  over  de  werking van de betreffende ziekte, kan er van deze drie gegeven antwoorden een gemiddelde score  per  proefpersoon  worden  gemaakt.  Hierbij  worden  in  dit  geval  het  correcte  medische  en  metaforische  antwoord  allebei  als  een  juist  gegeven  antwoord  gezien,  terwijl  het  incorrecte  medische  en  metaforische  antwoord  en  de  optie  ‘helemaal  geen  idee’  als  een  onjuist  gegeven  antwoord  worden  gezien.  Heeft  een  proefpersoon  bijvoorbeeld  twee  van  de  drie  vragen  juist  beantwoord  (wat  voor  soort  antwoord  dit  ook  mag  zijn),  dan  geeft  dit  een  gemiddelde  score  van  66,7%. Heeft een proefpersoon slechts één van de drie vragen juist beantwoord, dan geeft dit een  gemiddelde score van 33,3%, etc. Door de gemiddelde scores van alle proefpersonen per soort uitleg  met elkaar te vergelijken, kan op die manier worden vastgesteld welke soort uitleg klaarblijkelijk het  beste werd begrepen en of metaforen daarmee een positief, negatief of geen effect hebben op het  tekstbegrip van de proefpersonen.  

Om  het  algemene  effect  van  metaforen  op  het  begrip  van  de  werking  van  ziektes  daadwerkelijk te kunnen toetsen, moet eerst worden onderzocht of de items (de drie fictieve ziektes)  als  één  geheel  kunnen  worden  gezien  of  juist  apart  behandeld  moeten  worden.  Omdat  het  niet  mogelijk is om de effecten van de soort uitleg op de drie verschillende ziektes per proefpersoon te  meten  en  met  elkaar  te  vergelijken  ‐  wat  de  meest  nauwkeurige  uitslag  had  gegeven,  maar  onmogelijk  is  omdat  de  proefpersonen  niet  alle  negen  versies  voor  ogen  kregen,  maar  slechts  drie  (zie  4.1.2.2.)  ‐,  wordt  er  in  plaats  van  een  Repeated  Measures  ANOVA‐toets  een  Oneway  ANOVA‐ toets44  uitgevoerd.  Uit  deze  toets  blijkt  dat  er  wel  een  verschil  is  in  de  manier  waarop  er  op  de  verschillende ziektes werd gescoord, maar deze verschillen zijn niet significant (p=0,10). Belangrijker  nog,  er  is  bij  geen  enkele  ziekte  een  significant  verschil  tussen  de  condities  (de  manier  van  uitleg)  geconstateerd;  alle  p‐waardes45  zijn  namelijk  groter  dan  .26.  Dat  wil  zeggen  dat  er  op  de  verschillende  ziektes  wel  anders  is  gescoord  (omdat  de  werking  van  de  ene  ziekte  wellicht        

44 De outputs van alle uitgevoerde SPSS‐toetsen zijn te vinden in bijlage III 

45  Onder  de  p‐waarde  wordt  de  kans  verstaan  dat  een  verschil  door  toeval  veroorzaakt  wordt.  Normaliter 

wordt een significantieniveau van 0,05 aangehouden, wat inhoudt dat met 95% zekerheid gesteld kan worden  dat  de  betreffende  uitslag  niet  ontstaan  is  door  toeval.  Bij  een  p‐waarde  tussen  de  0,10  en  0,05  wordt  er 

eenvoud verschill verschill   M gezegd w algemee ziekte.  D gemidde     Er  zijn  w bovensta per soor proefper antwoor minder  metafoo die  nu  g aangeno 4.2.3 Re Nu het a belang t

diger  te  beg ende  ziekte ende ziektes Met  de  conc worden dat e en een positi

Dit  is  aange elde scores p wel  kleine  v aand  diagra rt uitleg in ka rsonen  na  rden),  scoord goed  (78,4% or het slechts goed  of  slech omen wordt. etrieval effe algemene eff te weten of  0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Gemi ddel d  perc enta ge  juist  gegeven  an twoor d e n grijpen  was  es  vergelijkb s apart te be clusie  dat  de er geen bew ef dan wel n etoond  midd per soort uitl verschillen  t m,  waarin  h aart is gebra het  lezen  den  de  proe %)  en  scoord st (75,8%). H ht  zijn)  hebb     ect  fect van met er een verba Custos Infir

dan  de  and baar  waren.  handelen en e  verschillen wijs is gevond negatief effe dels  een  Re eg op individ ussen  score het  gemidde acht), maar d

van  de  zui efpersonen  n den  de  proe iermee kan  ben  geen  eff

taforen op he and is tusse rmus Pravu Betreffende z dere),  maar  Daarom  is  n kunnen de  de  ziektes  a den dat meta ct hebben o epeated  Me dueel niveau

es  en  de  ma lde  percenta deze zijn nie

iver  medisc na  het  lezen efpersonen  n

dan ook gest fect  op  het 

et begrip van n de manier us Emissarius

ziekte en soort u

dat  de  effe er  geen  re ziektes als é als  één  item  aforen (of di p het begrip easures  ANO u berekent.  anier  waaro age  juist  geg

t significant  che  uitleg  h

van  de  uitle na  het  lezen teld worden begrip  van  n de werking r van uitleg e Vitium Hiatu itleg ecten  van  de eden  om  de én item wor behandeld  e nu goed of p van leken in OVA‐toets,  d p  ziektes  w geven  antwo bevonden (p het  best  (8

eg  met  een  n  van  de  uit  dat de hypo leken  in  de 

g van ziektes en de manie us Algehe Gee Goe Slec

e  soort  uitle e  resultaten rden gezien. 

kunnen  wor f slecht zijn) n de werking die  de  versc

werden  uitge oorden  per  z

p=0,20). Zo s 84,3%  juist 

goede  meta tleg  met  een othese ‘meta werking  van s bekend is, i er van het ge ele scores en metafoor ede metafoor chte metafoor

eg  op  de  n  van  de  rden,  kan  over het  g van een  chillen  in    elegd  (zie  ziekte  en  scoorden  gegeven  afoor  iets  n  slechte  aforen (of  n  ziektes’  s het van  even van 

een  antwoord  is.  Met  andere  woorden,  hanteren  proefpersonen  de  gelezen  metafoor  bij  het  terughalen van medische kennis en daarmee het geven van hun antwoord (retrieval [Steen, 1994])?    Deze  onderzoeksvraag  kan  getoetst  worden  door  te  onderzoeken  of  metaforische  antwoorden  significant  vaker  gegeven  worden  wanneer  er  een  uitleg  met  metafoor  gelezen  is  dan  wanneer  de  uitleg  zuiver  medisch  was  en  wanneer  er  een  ander  soort  metafoor  in  de  uitleg  betrokken  was  (een  adequate  metafoor  dan  wel  inadequate  metafoor).  Door  dit  middels  een  Repeated  Measures  ANOVA‐toets  te  doen,  kan  gesteld  worden  dat  proefpersonen  op  individueel  niveau en ten opzichte van de twee andere soorten uitleg marginaal significant vaker kiezen (p=0,09)  voor een correct metaforisch antwoord bij een goede metafoor in de uitleg. Met andere woorden,  het  correcte  metaforische  antwoord  werd  vaker  gegeven  wanneer  er  een  goede  metafoor  in  de  uitleg werd gebruikt, wat de indruk wekt dat dit ‐ in lichte mate ‐ significante verschil aan retrieval  (Steen, 1994) te wijten lijkt te zijn. Wanneer er een goede metafoor is gelezen, wordt deze metafoor  dus ook onthouden en gehanteerd bij het geven van de antwoorden.  

  Daarnaast is het ook van belang om te weten of proefpersonen die een slechte metafoor in  de  uitleg  hebben  gelezen,  ook  vaker  voor  het  incorrecte  metaforische  antwoord  kiezen  dan  de  andere  twee  groepen.  Wederom  worden  daarom  de  frequenties  van  gegeven  incorrecte  metaforische  antwoorden  met  elkaar  vergeleken.  De  uitslag  van  deze  Repeated  Measures  ANOVA‐ toets  laat  blijken  dat  de  groep  die  een  slechte  metafoor  in  de  uitleg  heeft  gelezen  hoogstwaarschijnlijk  niet  aan  retrieval  (Steen,  1994)  doen.  Er  kon  namelijk  geen  daadwerkelijk  significant verschil aangetoond worden (p=0,13 gaat).  

4.2.4 Effect opleidingsniveau op tekstbegrip/retrieval 

Omdat opleidingsachtergrond ook een effect zou kunnen hebben op de mate waarop de werking van  een  ziekte  begrepen  wordt,  wordt  ook  het  verband  tussen  het  opleidingsniveau  en  de  scores  van  proefpersonen onderzocht. Dit wordt gedaan door de resultaten van alle drie de groepen (VMBO’ers  en  MBO’ers,  HBO’ers  en  WO’ers)  middels  een  Oneway  ANOVA‐toets  met  elkaar  te  vergelijken.  Hieruit  blijkt  dat  de  lager  en  middelbaar  opgeleiden  (VMBO  en  MBO)  de  werking  van  de  ziektes  klaarblijkelijk het minst goed begrepen, door een gemiddelde score van 66,7% te behalen. De hoger  opgeleiden  (HBO)  scoorden  met  een  gemiddelde  score  van  77,4%  beter.  Tenslotte  begrepen  de  hoogst opgeleiden in dit experiment (WO) de werking van de ziektes klaarblijkelijk het best, met een  gemiddelde score van 87%. Deze verschillen in scores zijn volgens de gehanteerde Oneway ANOVA‐ toets  in  lichte  mate  significant  (p=0,09)  en  op  lineair  niveau;  hoe  hoger  het  opleidingsniveau,  hoe  hoger  de  score,  simpelweg  gesteld.  De  lichte  mate  van  significantie  zou  mogelijk  te  wijten  zijn  aan  het  kleine  aantal  N  bij  de  laagopgeleiden  (N=6).  Waren  er  meer  laagopgeleiden  bij  het  experiment  betrokken  geweest,  dan  was  de  mate  van  significantie  mogelijk  ook  hoger  geweest.  Hierover  valt 

echter niets met zekerheid te zeggen. Al met al kan wel geconcludeerd worden dat er redenen zijn  om aan te nemen dat het begrip van de werking van een ziekte samenhangt met opleidingsniveau.  Hoe hoger men opgeleid is, hoe beter men de werking van een ziekte begrijpt.  

Is  er  dan  ook  een  verband  tussen  het  opleidingsniveau  en  de  mate  waarin  aan  retrieval  (Steen, 1994) werd gedaan? Met andere woorden, zorgt een bepaald opleidingsniveau er voor dat er  vaker  metaforen  gehanteerd  worden  in  het  terughalen  van  medische  kennis?  Om  dit  te  toetsen  worden  de  frequenties  van  gegeven  correcte  en  incorrecte  metaforische  antwoorden  aan  de  hand  van de verschillende opleidingniveaus met elkaar vergeleken. De eerste Oneway ANOVA‐toets wijst  uit dat er geen significant verschil is (p=0,64) tussen de opleidingsniveaus wat betreft het kiezen van  het  correcte  metaforische  antwoord  bij  het  lezen  van  een  goede  metafoor.  De  groepen  hanteren  vrijwel net zo vaak de goede metafoor in het terughalen van kennis46. Ook in de frequentie waarop  de verschillende opleidingsniveaus de slechte metafoor gebruiken om kennis terug te halen zijn geen  verschillen aangetoond (p=0,14)47. Mogelijk is deze mate van significantie te wijten aan het feit dat er  minder  laagopgeleiden  dan  hoog  opgeleiden  en  wetenschappelijk  opgeleiden  aan  het  experiment  meededen. Zouden er meer laagopgeleiden mee hebben gedaan die op dezelfde manier scoorden,  dan zou de mate van significantie mogelijk ook hoger liggen. Vooralsnog zijn er echter geen redenen  om aan te nemen dat opleidingsniveau met de mate van retrieval (Steen, 1994) samenhangt.  

4.2.5 Effect medische kennis op tekstbegrip/retrieval 

Naast  dit  verband  tussen  opleidingsniveau  en  tekstbegrip,  wordt  ook  het  verband  tussen  de  mate  van medische kennis die de proefpersonen hadden en de score die zij behaalden onderzocht. Zorgt  een  hogere  mate  van  medische  kennis  er  voor  dat  er  ook  hoger  wordt  gescoord?  Hierbij  zijn  de  groepen  ingedeeld  in  gradaties  van  medische  kennis,  namelijk  ‘weinig  medische  kennis’  (3  en  4  op  een schaal van 0 ‐ 10), ‘matige medische kennis’ (5 en 6 op een schaal van 0 ‐ 10) en ‘veel medische  kennis (7 en 8 op een schaal van 0 ‐ 10).  

De groep die van zichzelf  vond dat ze  weinig  medische  kennis  had, had de  beste score van  alle  drie  de  groepen  (83,3%).  De  groep  die  van  zichzelf  vond  dat  ze  over  matig  medische  kennis  beschikt  (de  overgrote  meerderheid),  had  een  gemiddelde  score  van  78,2%  goed  gegeven  antwoorden, waarmee zij het slechtst scoort van alle drie de groepen. Tenslotte scoort de groep die  van zichzelf vindt dat ze over veel medische kennis beschikt iets beter als de voorgaande groep, met  een score van 79,6% goed gegeven antwoorden. Het verschil in gemiddelde scores tussen deze drie  groepen kan niet als significant worden gezien (p=0,66). Dat wil zeggen dat de Oneway ANOVA‐toets         46 VMBO/MBO’ers kiezen na het lezen van een goede metafoor in de uitleg in gemiddeld 44,8% van de gevallen  voor het correcte metaforische antwoord, tegenover 37,2% bij HBO’ers en 45,3% bij WO’ers.   47

  VMBO/MBO’ers  kiezen  na  het  lezen  van  een  slechte  metafoor  in  de  uitleg  in  gemiddeld  38,9%  van  de 

uitwijst  dat  alle  drie  de  groepen  over  het  algemeen  even  goed  hebben  gescoord  en  er  dus  geen  aanwijzingen zijn om te geloven dat het begrip van de werking van een ziekte samenhangt met de  mate van medische kennis die reeds aanwezig is.  Is er dan wel een verschil in de mate waarop de groepen aan retrieval (Steen, 1994) doen?  Ook hier kan geen bevestigend antwoord op worden gegeven. Er is namelijk geen significant verschil  (p=0,32) aan te tonen wat betreft het verschil in aantal gegeven correcte metaforische antwoorden  na  het  lezen  van  de  uitleg  met  de  goede  metafoor.  Daarnaast  is  er  ook  geen  significant  verschil  (p=0,43) aan te tonen wat betreft het verschil in aantal gegeven incorrecte metaforische antwoorden  na het lezen van de uitleg met de slechte metafoor. Een kantlijn die hierbij geplaatst kan worden is  dat de groep met veel medische kennis relatief klein was (N=6). Echter, omdat de significantieniveaus  in beide gevallen heel laag zijn, is er geen reden om te geloven dat de mate waarin er aan retrieval  (Steen,  1994)  gedaan  wordt  en  de  mate  van  medische  kennis  waarover  men  beschikt  met  elkaar  samenhangt.  

4.2.6 Verband gegeven cijfer en soort uitleg 

Tenslotte wordt er getoetst of er een verschil is in de manier waarop de verschillende soorten uitleg  gewaardeerd worden. Hierbij konden de proefpersonen een score geven van 1 tot en met 10. Uit de  vragenlijsten  bleek  dat  de  zuiver  medische  manier  van  uitleg  door  de  proefpersonen  het  beste  gewaardeerd werd, door deze soort uitleg een gemiddeld cijfer van 7,2 toe te kennen. De uitleg met  de  goede  metafoor  werd  iets  minder  gewaardeerd;  deze  soort  uitleg  kreeg  een  7,0  toegekend.  Tenslotte werd de uitleg met een slechte metafoor over het algemeen het minst gewaardeerd, door  deze soort uitleg gemiddeld een 6,8 toe te kennen.   

  Het  verschil  tussen  de  waardering  voor  de  verschillende  manieren  van  uitleg  lijkt  op  het  eerste  gezicht  klein,  maar  blijkt  zeer  significant  te  zijn  (p=0,02).  Dit  resultaat  lijkt  voornamelijk  te  liggen aan het verschil in waardering tussen de uitleg op een puur medische manier en de uitleg aan  de hand van een slechte metafoor (p=0,01). Toch waarderen de proefpersonen de zuiver medische  uitleg ook marginaal significant beter dan de uitleg met een goede metafoor (p=0,09).   

4.3 Conclusies 

Allereerst valt uit de resultaten van het experiment op dat metaforen (of die nu goed of slecht zijn)  geen significant positief of negatief effect hebben op het begrip van leken in de werking van ziektes.  De  werking  van  een  ziekte  wordt  dus  even  goed  begrepen  wanneer  deze  op  een  zuiver  medische  manier wordt uitgelegd, als aan de hand van een goede of slechte metafoor. Dit resultaat is in strijd  met zowel de theorie van conceptuele integratie (waarbij adequate BLENDS ‐ in dit geval metaforen ‐ 

idealiter een positief effect op het tekstbegrip zouden hebben, als met de theorieën van Badeer en  Hicks (1992), Spiro et al (1989) en Miller (1976) (waarbij metaforen ‐ of die nu goed of slecht zijn ‐  een  negatief  effect  op  het  tekstbegrip  zouden  moeten  hebben).  Maar  waarom  hadden  de  goede  metaforen geen aantoonbaar effect (of dat nu positief of negatief is) op het begrip van de werking  van  ziektes?  En  waarom  werd  er  naar  aanleiding  van  een  uitleg  met  een  slechte  metafoor  vergelijkbaar gescoord als bij de andere twee groepen? 

  Op deze vragen zijn verschillende antwoorden mogelijk. Allereerst kan het verstandig zijn na  te gaan waarom de groep die de uitleg van een ziekte op een puur medische manier niet koos voor  de  onjuiste  antwoorden  en  daarom  het  beste  scoorde;  in  meer  dan  8  van  de  10  gevallen  koos  zij  namelijk  voor  het  juiste  antwoord.  De  onjuiste  antwoorden  bestonden  uit  twee  vormen:  het  medische onjuiste antwoord en het metaforische onjuiste antwoord. Omdat deze groep in hun uitleg  geen metafoor had gelezen, is de kans kleiner dat ze voor het metaforische antwoord kiest. Als dit  ook nog een metaforisch antwoord is die heel moeilijk te rijmen is met hetgeen ze in de uitleg heeft  gelezen, zal ze hier niet snel voor kiezen. De medische informatie die de proefpersonen in de uitleg  lazen,  moeten  ze  bij  het  lezen  van  de  meerkeuzemogelijkheden  namelijk  zelf  herkennen  in  de  metaforische  antwoorden.  Als  dit  metaforische  antwoord  vergelijkbaar  is  met  de  medische  informatie die ze hebben gelezen, dan zouden ze  eenvoudig voor dit metaforische juiste antwoord  kunnen  kiezen.  Gaat  het  echter  om  een  metaforisch  antwoord  wat  niet  snel  te  rijmen  is  met  de  medische informatie die ze hebben gelezen, dan zullen ze hier minder snel voor kiezen. Met andere  woorden,  het  zou  makkelijker  kunnen  zijn  een  juist  antwoord  te  kiezen  wanneer  de  ziekte  op  een  zuiver medische manier is uitgelegd, omdat dan niet in termen van de metafoor wordt gedacht. Op  die  manier  worden  de  antwoordmogelijkheden  die  in  andere  (metaforische)  termen  zijn  omschreven,  in  plaats  van  medische  termen,  minder  in  overweging  overgenomen.  Het  lijkt  dan  vooral een keuze te zijn tussen het juiste medische antwoord en het juiste metaforische antwoord,  waarbij het medische antwoord in de meeste gevallen wint.  

Dan het uitblijven van een eventueel positief effect  van een goede metafoor op het begrip  van de werking van ziektes. Het moeilijk kunnen maken van een juiste keuze voor de groep die een  goed  passende  metafoor  in  de  uitleg  gepresenteerd  kreeg,  zou  op  eenzelfde  manier  verklaard  kunnen  worden.  Omdat  deze  proefpersonen  wel  met  een  metafoor  te  maken  kregen,  worden  er 

twee INPUT‐ruimtes gecreëerd, tegenover één INPUT‐ruimte van de groep die de ziektes op een zuiver  medische  manier  kreeg  uitgelegd.  Omdat  de  metaforische  terminologie  in  de  antwoordmogelijkheden op die manier bij deze groep wél past bij wat ze in de uitleg hebben gelezen,  ontstaat  er  bij  deze  groep  meer  twijfel  ‐  zeker  wanneer  de  gelezen  metafoor  maar  gedeeltelijk  is  onthouden ‐ tussen welk metaforisch antwoord de juiste is: het juiste metaforische antwoord of het  onjuiste metaforische antwoord. De termen die in deze beide antwoordmogelijkheden gebruikt zijn,  komen  namelijk  sterk  met  elkaar  overeen.  Het  gaat  namelijk  in  beide  gevallen  om  iets  wat  bijvoorbeeld  met  doorgangsbanen,  transport,  etc.  te  maken  heeft.  Om  dan  het  afwijkende  aspect  van de slechte metafoor (hetgeen wat  niet ‘klopt’ in het antwoord) te ontdekken, blijkt moeilijk te  zijn. Immers, de metafoor is misschien wel onthouden, maar de specifieke details daarvan soms niet  (of het bijvoorbeeld nu om een vertraging of complete afsluiting van een treinstation gaat). Omdat  deze groep op die manier meer twijfelt tussen de metaforische antwoordmogelijkheden, zou ze ook  kunnen  beginnen  te  twijfelen  aan  het  onjuiste  medische  antwoord.  Het  metaforische  onjuiste  antwoord zou proefpersonen in verwarring kunnen brengen, waardoor ze ook gaan twijfelen aan hoe  de  ziekte  nu  precies  werkt  (de MEDISCHE INPUT‐ruimte).  Vanwege  deze  verwarring  zouden  ze  sneller  dan  de  groep  die  de  ziekte  op  een  puur  medische  uitgelegd  kreeg,  voor  het  onjuiste  medische  antwoord  kunnen  kiezen.  Al  met  al  zou  deze  verwarring  het  eventuele  positieve  effect  van  een  metafoor  kunnen  neutraliseren,  waardoor  de  groep  uiteindelijk  vrijwel  net  zo  goed  scoort  als  de  groep die een puur medische uitleg had gelezen.  

De  uitkomst  dat  de  groep  die  de  ziektes  met  behulp  van  een  slecht  passende  metafoor  vrijwel even goed scoort als de andere twee groepen, is een interessante uitkomst die lastig, maar  wel verklaard kan worden. Op basis van de theorie van conceptuele integratie en de theorieën van  Badeer  en  Hicks  (1992),  Spiro  et  al  (1989)  en  Miller  (1976)  zou  verwacht  worden  dat  deze  groep  (veel)  minder  goed  zou  scoren.  Bovendien  zou  het  feit  dat  proefpersonen  de  ziektes  op  twee  manieren kregen uitgelegd ‐ op een juiste medische manier en op een onjuiste metaforische manier ‐  alleen  al  voor  onduidelijkheid  kunnen  zorgen.  Verwacht  werd  dan  ook  dat  de  meerderheid  van  de  proefpersonen, wanneer ze aan retrieval (Steen, 1994) zouden doen, zich zou laten leiden door deze  onjuiste metaforische informatie. Uit de resultaten blijkt dat een deel van de proefpersonen dit ook  wel  doet;  werd  er  een  fout  gemaakt  door  de  proefpersonen,  dan  lag  dit  aan  veruit  de  meeste  gevallen  aan  de  metafoor  die  in  de  uitleg  werd  gebruikt  en  bij  het  geven  van  het  antwoord  werd