BEOORDELEN: FUNCTIE, AANPAK, CONTEXT (bij 2.6)

5.1 Meten, evalueren, toetsen, beoordelen

Terminologie is niet het belangrijkste, maar voor effectieve communicatie wel onmisbaar. Helaas is de terminologie op dit terrein niet helemaal eenduidig. Hieronder worden enkele lijnen getrokken.

Meten is een algemene term die wordt gebruikt voor het op een bepaalde schaal toekennen van numerieke waarden aan kenmerken van objecten. Een goede meting moet aan bepaalde eisen voldoen, afhankelijk van het meetmodel dat men hanteert. Dit kan als volgt worden toegelicht. In het onderwijs worden leerresultaten gemeten voor het toekennen van cijfers en daarop gebaseerde beslissingen over bevordering en diplomering. Op grond van diploma's ontstaan rechten op toegang tot vervolgonderwijs. In het onderwijs gebeurt toekenning van cijfers vaak op grond van een impliciet meetmodel, waarin lage scores voor het ene onderdeel kunnen worden gecompenseerd door hoge scores voor het andere onderdeel. Dit gebeurt dan in feite vaak ongeacht de onderlinge samenhang en het relatieve belang van de betreffende kennis- en vaardigheidsonderdelen. In beroepsopleidingen worden kennis en vaardigheden gemeten op grond waarvan beroepsbeoefenaren kunnen worden gecertificeerd. Zij krijgen dan het recht de betreffende beroepsmatige handelingen te verrichten. In deze beroepsopleidingen en bij de certificering van beroepsbeoefenaren worden vaak expliciet niet-compensatorische modellen gebruikt. Een procesoperator, een accountant, een arts enzovoort, zij dienen op elk relevant deelgebied apart aan bepaalde minimumeisen te voldoen, omdat slechts op basis daarvan een competente (en verantwoorde) beroepsuitoefening mogelijk is.

Evalueren betekent: de waarde van iets bepalen. Evalueren gebeurt meestal met het oog op bepaalde beslissingen. Evaluaties in het onderwijs kunnen bedoeld zijn om zicht te krijgen op de mogelijkheden om het onderwijs te verbeteren, om inzicht te krijgen in de kwaliteit van een onderdeel en om verantwoording af te leggen aan derden. Voor evaluaties worden ook vaak leerlingresultaten verzameld en verwerkt. Wat geëvalueerd wordt zijn echter niet de leerlingen, maar (onderdelen of aspecten van) het onderwijs.

Toetsen is een term die in het algemeen wordt gebruikt voor het controleren van beweringen of verwachtingen, meer specifiek voor het controleren van leervorderingen. De term is op te vatten als werkwoord, maar ook als meervoudsvorm van een zelfstandig naamwoord. In deze tweede betekenis zijn toetsen gestandaardiseerde meetinstrumenten voor kennis en vaardigheden.

Beoordelen is een term die wordt gebruikt voor metingen die zijn gebaseerd op zorgvuldige beoordeling door kundige personen. Hierbij kunnen diverse methoden en hulpmiddelen worden gebruikt. Voor het beoordelen van kennis, vaardigheden en houdingen van leerlingen kan gebruik worden gemaakt van: gestandaardiseerde toetsen, zelf gemaakte proefwerken, mondelinge beurten, observaties, meer en minder gesloten opdrachten, demonstraties door leerlingen, werkstukken, gemaakte producten, beoordelingen door leerlingen van elkaars werk, beoordelingen door leerlingen van hun eigen werk. Beoordelingen kunnen op allerlei zaken betrekking hebben. In het onderwijs kan het gaan om beoordeling van bijvoorbeeld de kwaliteit van een curriculum, leermiddel of examenprogramma, het klimaat op een school, de professionaliteit van een leraar en de kennis, vaardigheden en houdingen van leerlingen. Hulpmiddelen bij het beoordelen zijn onder meer meetinstrumenten en beoordelingsmodellen. Bij het beoordelen van kennis en vaardigheden van leerlingen kunnen ook de hiervoor genoemde toetsen een rol spelen. Het beoordelen van kennis,

vaardigheden en houdingen van leerlingen kan verschillende functies hebben: selectie, plaatsing van leerlingen in bepaalde stromen, diagnose van leerproblemen, feedback aan leerlingen, evaluatie van het onderwijs, geven van cijfers, beslissingen over bevordering, diplomering.

In ons onderzoek najaar 1998 bleek dat rond 85% van de docenten met het beoordelen beoogt om leerlingen te motiveren en te stimuleren serieus aan het werk te gaan, om leerlingen feedback te geven (over wat ze goed en fout hebben gedaan) en om een cijfermatige interpretatie te kunnen geven van de prestaties van de leerlingen. In mindere mate (60%) streven docenten met het beoordelen na dat in kaart wordt gebracht in hoeverre leerlingen zich bepaalde vaardigheden eigen hebben gemaakt en waar het nog aan schort (docenten economie geven dit vaker aan dan de docenten van de andere vakken).

5.2 Beoordelingscriteria, scoringsmodel, normering, cijfers

De criteria waarop een docent het onderzoekswerk van leerlingen beoordeelt, zullen verschillen alnaargelang de doelen die met onderzoek door leerlingen worden nagestreefd en de stappen of vaardigheden in een onderzoek waarop eventueel het accent is gelegd.

Een goede beoordeling is bovendien afgestemd op de gekozen didactische aanpak. De docent die bijvoorbeeld leerlingen stapsgewijs dingen aanleert en laat oefenen, veronderstelt een stapsgewijze opbouw van kennis en vaardigheid en zal dan ook vaak per stap beoordelen. Wie leerlingen meer 'in het diepe gooit', zal eerder geneigd zijn het onderzoekswerk van de leerlingen als één geheel te beoordelen.

De docent zal moeten beslissen welke aspecten of onderdelen van het werk zullen worden beoordeeld en aan de hand van welke criteria dat gebeurt. Deze essentiële informatie over de wijze en criteria van beoordeling behoort vooraf aan de leerlingen te worden meegedeeld.

Vervolgens moet worden besloten welke vorm de deeloordelen zullen hebben (v-tjes (voldaan); minnetjes en plusjes; onvoldoende, voldoende, goed; cijfers). Tenslotte is de vraag hoe de deeloordelen zullen worden gecombineerd (bijvoorbeeld ongewogen of met een bepaalde weging) en uitgedrukt in één bepaalde maat (bijvoorbeeld: onvoldoende, voldoende of goed; of een cijfer).

Beoordelen van werk van leerlingen valt dus niet samen met het geven van een cijfer, maar gaat eraan vooraf. Beoordelen gebeurt in termen van de kennis en vaardigheden waar het om gaat en leidt tot inzicht in sterke en zwakke punten. Het geven van één eindcijfer vergt dat de deeloordelen worden gecombineerd en dat de combinatie wordt geprojecteerd op de voor schoolcijfers gebruikelijke schaal (van 1 tot 10).

Het vooraf expliciteren van een scoringsmodel of scoringsvoorschrift lijkt wellicht overdreven, maar is nodig om inzichtelijk, betrouwbaar en objectief te kunnen beoordelen.

Het combineren van deelscores tot een totaaloordeel gebeurt vaak door optelling. Daardoor kunnen deelscores voor elkaar compenseren. Is deze werkwijze wel verstandig? De bij onderzoek relevante deelvaardigheden (zoals: opstellen van een werkplan, verzamelen van gegevens, trekken van conclusies, rapporteren) hangen niet alle duidelijk met elkaar samen. Een leerling kan goed zijn in het ene en zwak in het andere, maar door onderlinge compensatie hetzelfde

(voldoende) eindcijfer krijgen. Aangezien een onderzoek slechts met succes kan worden uitgevoerd en afgerond als alle relevante vaardigheden in voldoende mate worden beheerst, is het wenselijk op z'n minst ook te verlangen dat per deelvaardigheid een voldoende oordeel wordt behaald.

Docenten zullen hun beoordelingen ook moeten (leren) normeren: welk prestatieniveau kan, respectievelijk moet worden verwacht? Omdat in veel vakken bij veel docenten open onderzoek door leerlingen een nieuw fenomeen is, zullen docenten er eerst meer ervaring mee moeten opdoen. Vanuit de normen die gelden voor wetenschappelijk onderzoek kan wel worden aangegeven op welke criteria moet worden gelet. Dat zijn in feite de te onderscheiden vaardigheden. De vraag 'wanneer is het goed genoeg' kan echter niet in absolute zin worden beantwoord. Realistische normen daarvoor ontstaan in de praktijk bij bekwame docenten en gemotiveerde leerlingen.

Gezien de condities waaronder docenten onderzoeken van leerlingen moeten beoordelen, is het niet zo zinvol cijfers te geven in decimalen. Eindtotalen kunnen wel op zo'n 'nauwkeurig' cijfer uitkomen, maar de betreffende vaardigheden zijn gewoon niet zo precies te meten. Anderzijds is een simpele driedeling (onvoldoende, voldoende, goed) wellicht wat grof. De praktijk moet uitwijzen tot welke mate van differentiatie zinvol beoordelingen kunnen worden gegeven en gebruikt.

In ons onderzoek najaar 1998 bleek 50% van de docenten cijfers in decimalen te geven, 33% in halve punten, 17% in hele punten en 4% in termen van onvoldoende, voldoende en goed. Er waren hierin geen duidelijke verschillen tussen de in het onderzoek betrokken vakken.

5.3 Registreren, communiceren en verantwoorden

De bij beoordelingen gevolgde aanpak en verkregen resultaten moeten op de een of andere manier worden vastgelegd (al dan niet in aansluiting op de manier waarop andere gegevens worden geregistreerd, bijvoorbeeld in een leerlingvolg- systeem). De beoordelingen moeten ook kunnen worden gecommuniceerd naar de leerlingen, ouders en collega's. Het verdient in het algemeen aanbeveling een scoringsmodel te hanteren waarin op een niet te grove, maar ook niet te gedifferentieerde manier een beoordeling plaatsvindt van een aantal onderdelen of aspecten (deelvaardigheden), zodat inzicht wordt verkregen in de sterke en zwakke punten van de leerling. Zulke bevindingen zeggen meer dan alleen een eindoordeel of totaalcijfer en vormen daardoor meer zinvolle feedback. Met een dergelijk scoringsmodel kan ook de manier waarop de beoordelingen tot stand komen goed worden verduidelijkt en verantwoord, niet alleen aan de leerlingen, ouders en collega's, maar zonodig ook aan de schoolleiding en de inspectie.

In ons onderzoek najaar 1998 bleek dat 80% van de docenten de beoordelingscriteria schriftelijk vastlegt; ongeveer de helft legt meer vast dan alleen de criteria, zoals de te behalen scores per criterium en het antwoordmodel. De gegeven beoordelingen worden bijna altijd vastgelegd. Ze worden evenwel (slechts) door ongeveer de helft van de docenten altijd of meestal nabesproken (de overigen doen dit regelmatig, soms, of nooit). Bij ruim 80% van de docenten tellen de beoordelingen altijd of meestal mee voor het rapport (bij ongeveer 10% nooit) en bij ruim 60% voor het schoolexamen (bij een kleine 20% nooit).Er waren hierin geen duidelijke verschillen tussen de in het onderzoek betrokken vakken.

Deel III Keuzemogelijkheden en overwegingen

In document Beoordelen van onderzoeksvaardigheden van leerlingen (pagina 35-38)