• No results found

1.1 Verschillen tussen groepen

N/A
N/A
Protected

Academic year: 2021

Share " 1.1 Verschillen tussen groepen "

Copied!
46
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)
(2)

Inhoudsopgave

1.0 Statistiek 4

1.1 Verschillen tussen groepen 6

1.2 Data in beeld 12

1.3 Computerpracticum 22

1.4 Onderzoek 1 / Spiekbriefje 24

1.5 Samenvatting paragraaf 1.1 t/m 1.4 25

1.6 Verschillen meten 27

1.7 Gemiddelde en standaarddeviatie 32

1.8 Effectgrootte 39

1.9 Onderzoek 2 44

1.10 Samenvatting paragraaf 1.6 t/m 1.9 45

Bij dit hoofdstuk hoort een digimap. Daarin staan opgaven waarbij er iets met ict valt te beleven.

Ze hebben hetzelfde nummer als de bijbehorende opgave in deze tekst. Je herkent ze aan het icoontje

   

.Via de digimap kom je bij VU-Statistiek of op een website terecht.

De opgaven in de digimap kunnen op drie manieren worden gebruikt:

- niet,

- aanvullend op de corresponderende opgave in deze tekst, - vervangend voor de corresponderende opgave in deze tekst.

Colofon

© 2010 cTWO

Experimentele uitgave Kansrekening en Statistiek, vwo, wiskunde A en C versie 3 november 2012

auteurs Leon van den Broek, Maris van Haandel, Bert Nijdam

met medewerking van Simon Biesheuvel, Carel van de Giessen, Sieb Kemme, Peter Kop,

(3)

Vergelijk de bevolkingspiramides uit 1932 van Nederland, Frankrijk en Duitsland.

Nederland is een braaf groeiend landje.

Uit de piramides is een dramatisch stukje geschiedenis af te lezen.

Kijk maar eens naar de leeftijdklassen tussen 20 en 40 jaar van Frankrijk en Duitsland.

elk figuurtje = 22500 personen

elk figuurtje = 125000 personen

elk figuurtje = 200000 personen elk figuurtje = 125000 personen elk figuurtje = 22500 personen

elk figuurtje = 200000 personen leeftijdsboom

duitsland leeftijdsboom frankrijk leeftijdsboom

nederland leeftijd in jaren 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5- 9 0- 4

leeftijd in jaren 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5- 9 0- 4

leeftijd in jaren 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5- 9 0- 4

(4)

1.0 Statistiek

1 We bekijken drie beweringen.

Onze zomers worden steeds natter.

Anneke beweert dat de zomers in Nederland steeds natter worden. Want vorig jaar nog was haar vakantie in eigen land helemaal verregend.

a Wat vind je van Annekes argument?

Meisjes moeten zich niet laten vaccineren tegen baarmoederhalskanker.

Anneke laat zich niet inenten tegen baarmoederhalskanker. Haar vriendinnen doen dat ook niet.

Want zij heeft gelezen dat in de VS meisjes ernstig ziek zijn geworden van de inenting.

b Wat vind je van Annekes argument?

Het fileprobleem is veel erger geworden.

Anneke beweert dat het fileprobleem de laatste jaren veel erger is geworden. Want gisteren en eergisteren heeft ze twee uur in de file gestaan tussen Amsterdam en ’s-Hertogenbosch.

c Wat vind je van Annekes argument?



wat is statistiek?

Om verantwoorde uitspraken te kunnen doen in onzekere situaties, is statistiek nodig.

- Je begint met een vraag of een bewering.

- Dan moet je keuzes maken. Bijvoorbeeld wat het fileprobleem betreft.

• Hoever ga je terug in de tijd? Onderscheid je verschillende seizoenen?

• Kijk je alleen naar Nederland of betrek je ook andere landen in je onderzoek?

Onderscheid je verschillende delen van Nederland?

• Let je op het aantal files per dag, of hoe lang ze zijn, of …

• Let je op oorzaken van files? Wegwerkzaamheden, weer, vakanties, …

• Als je gemiddeldes neemt, doe je dat dan per dag, per week, per maand?

• Wat is de invloed van economische factoren?

- Vervolgens ga je gegevens verzamelen.

- Dat levert een gigantische verzameling getallen op waar je in het begin geen grip op hebt.

Daartoe ga je ze ordenen en in beeld brengen.

- Dan moet je de gegevens analyseren: je berekent bijvoorbeeld gemiddeldes en de spreiding.

- Tot slot worden er conclusies getrokken; je beantwoordt de vraag.

Statistiek is ontstaan in Duitsland in de achttiende eeuw. In Nederland werden voor het eerst in 1802 te Leiden statistiekcolleges gegeven, door de hoogleraar Adriaan Kluit.

Het vak heette toen nog statenkunde en bestond uit kennis die nodig was voor een goed bestuur van een land, zoals over de bevolking, het leger, het klimaat, de handel, enz.

(5)

2 Iedereen krijgt wel eens te maken met files.

a Noem enkele beroepsgroepen die moeten weten hoe het fileprobleem zich ontwikkelt.

b Waarom is statistisch onderzoek daarvoor onmisbaar?

c Wie doen in Nederland statistisch onderzoek?

De politiechef van Amsterdam zegt dat de criminaliteit hoog is onder Marokkanen.

Waarom is statistisch onderzoek hierbij belangrijk?

Hoe zou jij dit statistisch onderzoeken?

Uit Wikipedia (bewerkt)

Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken, interpreteren en presenteren van gegevens. Het is een onderdeel van de wiskunde.

Statistici trachten informatie over een populatie te krijgen uit de waarneming van een (meestal) beperkt deel van die populatie, de zogenaamde steekproef. De zo verkregen informatie is uiteraard onvolledig en daardoor onnauwkeurig. Een goede beheersing van deze onnauwkeurigheid is dan ook een essentieel onderdeel van de statistiek. De

uitkomsten kunnen voor allerlei aspecten van de wetenschap, de politiek, de economie, de psychologie en sociologie, de media en de samenleving van belang zijn.

Het woord statistiek is afkomstig van de moderne Latijnse benaming statisticum collegium (les over staatszaken), waar het Italiaanse woord statista van is afgeleid, wat

"staatsman" of "politicus" betekende (vergelijk ons woord status) en het Duitse Statistik, wat oorspronkelijk analyse van staatsgegevens betekende.

(6)

1.1 Verschillen tussen groepen

datamatrix

Op de meeste scholen kies je aan het eind van klas 3 voor een profiel met een wiskundevak.

In deze paragraaf ga je je bezighouden met de statistische vraag: “In welk opzicht verschillen de leerlingen die wiskunde A of C hebben gekozen van leerlingen die hebben wiskunde B hebben gekozen?”

3 In onderstaande tabel bekijken we vijf kenmerken van leerlingen. De tabel staat ook op het werkblad.

Elk van de kenmerken heeft min of meer invloed op de keuze wiskunde A/C of wiskunde B.

Verschillen tussen leerlingen met wis A/C en wis B

Kenmerk geen gering matig tamelijk groot

Eindcijfer wiskunde in klas 3 Gem. alle eindcijfers in klas 3 Leeftijd

Aantal vreemde talen in pakket Belangstelling voor kunst

a Kruis op het werkblad per kenmerk aan hoe sterk het verschil is dat je verwacht.

b Bedenk nog twee kenmerken waarop je een duidelijk verschil vermoedt.



Als je wilt onderzoeken of de verschillen tussen de A/C- en B-kiezers inderdaad zijn zoals je vermoedt, dan zul je gegevens moeten verzamelen. Bijvoorbeeld met behulp van de vragenlijst op het werkblad.



4 Vul voor jezelf de vragenlijst op het werkblad in.

Op het Amalia College is de vragenlijst voorgelegd aan de 154 vwo4-leerlingen. De resultaten zijn verzameld in een tabel: een zogenaamde datamatrix. Hieronder staat een deel van de datamatrix.

leerling geslacht gebjaar gebmnd gewicht lengte kunstbel talen cijfwis cijfgem huiswerk wisgroep profiel leuk tedoen past advies

16 v 91 12 52 170 4 2 8 7,3 10 B NG 3 1 2 4 17 v 92 1 59 165 3 3 8 7,0 15 A/C EM 1 2 4 3 18 m 92 3 69 186 2 2 7 7,5 10 B NG 4 1 4 4 19 m 91 10 75 190 2 2 6 6,5 7 A/C EM 2 1 4 3 20 m 91 12 80 178 3 2 8 7,0 7 A/C CM 2 1 4 3 21 v 92 6 61 177 3 2 8 7,4 6 B NG 4 4 1 4 22 m 92 6 80 189 1 1 7 6,8 1 A/C EM 3 1 2 4 Boven de zeventien kolommen staan de variabelen, in dezelfde volgorde als in de vragenlijst.

Variabelen zijn kenmerken of eigenschappen van (in dit geval) een leerling.

(7)

Per regel staan van een leerling alle antwoorden, de scores.

De eerste variabele is niet de naam van de leerling, maar een nummer dat aan de leerling is gegeven. Die nummers lopen in ons geval van 1 tot en met 154.



5 a Hoe oud in jaren en maanden was leerling 18 op 1 januari 2008?

b Heeft leerling 18 een slank postuur?

c Vond leerling 18 het gegeven advies over het profiel belangrijk?

d Welke leerling heeft het meeste talent, nr. 17 of nr. 22?



6 Uit de datamatrix kun je van elke leerling de scores terugvinden. Je hebt nu de gegevens, maar je weet nog niet in hoeverre de wiskunde A/C-leerlingen verschillen van de wiskunde B-leerlingen.

a Welke leerlingen uit het getoonde stukje van de datamatrix hebben wiskunde B?

b Heeft die ‘groep’ een hoger cijfer voor wiskunde gehaald in de derde klas dan de wiskunde A/C-groep?

c Op welke twee variabelen verwacht je een duidelijk verschil tussen wiskunde A/C-leerlingen en wiskunde B-leerlingen? Ga na of die verschillen er ook zijn.

kruistabellen

In opgave 3 heb je aangegeven op welke kenmerken de groep leerlingen met wiskunde B ver- moedelijk verschilt van de groep met wiskunde A/C. Nu ga je kijken naar de variabele geslacht.

Hieronder zie je nog eens de datamatrix voor de zeven leerlingen.

leerling geslacht gebjaar gebmnd gewicht lengte kunstbel talen cijfwis cijfgem huiswerk wisgroep profiel leuk tedoen past advies

16 v 91 12 52 170 4 2 8 7,3 10 B NG 3 1 2 4 17 v 92 1 59 165 3 3 8 7,0 15 A/C EM 1 2 4 3 18 m 92 3 69 186 2 2 7 7,5 10 B NG 4 1 4 4 19 m 91 10 75 190 2 2 6 6,5 7 A/C EM 2 1 4 3 20 m 91 12 80 178 3 2 8 7,0 7 A/C CM 2 1 4 3 21 v 92 6 61 177 3 2 8 7,4 6 B NG 4 4 1 4 22 m 92 6 80 189 1 1 7 6,8 1 A/C EM 3 1 2 4



7 a Wat is de verhouding A/C : B onder de meisjes?

b Wat is de verhouding jongens : meisjes in de A/C-groep?

Met een kruistabel waarin je de variabele geslacht combineert (“kruist”) met de variabele wisgroep krijg je een goed overzicht hoe de verdeling meisjes-jongens samenhangt met de keuze A/C-B. Voor de leerlingen uit de datamatrix krijg je de volgende kruistabel.

geslacht

wisgroep

totaal

A/C B

man 4

vrouw 3

totaal 4 3 7

De frequenties (aantallen) zijn nog niet allemaal ingevuld.

(8)



8 Met de gegevens van alle 154 vwo4-leerlingen van het Amalia College krijg je de volgende kruistabel:

geslacht

wisgroep

totaal

A/C B

man 13 56 69

vrouw 30 55

totaal 154

a Vul op het werkblad de ontbrekende aantallen in.

b Vind je dat de A/C- en de B-keuze veel verschillen in de verdeling op de variabele geslacht?

Waarom wel/niet?

Voor een goede vergelijking kun je beter nagaan hoeveel jongens en meisjes er relatief zijn in beide groepen, door de aantallen te herleiden tot percentages.

Het percentage meisjes in de groep wiskunde A/C is C wiskundeA/

met leerlingen aantal

totaal

C wiskundeA/

met meisjes

aantal × 100%.



9 a Bereken dit percentage met de gegevens van opgave 8.

b Bereken ook het percentage meisjes in de groep wiskunde B.

c Zet in de kruistabel op het werkblad per wisgroep de percentages jongens en meisjes in de cellen.

d Wat is je conclusie?

Als je het goed gedaan hebt, is het verschil in percentage meisjes in de A/C-groep en in de B- groep 20%. Dit verschil in percentage geeft een goede indicatie hoe sterk de verdeling op geslacht verschilt tussen beide groepen.

10 Stel dat de percentages meisjes in de ene groep en in de andere groep 0% verschillen.

a Wat is dan je conclusie over de samenhang van geslacht en wiskunde-keuze?

Stel dat de percentages meisjes in de ene groep en in de andere groep 100% verschillen.

b Wat is dan je conclusie over de samenhang van geslacht en wiskunde-keuze?

Als je verschillen constateert, moet je die vervolgens interpreteren. Dan krijg je met de vraag te maken of het geconstateerde verschil gering, redelijk, groot of extreem is. En dat is subjectief. In een situatie zoals in opgave 9 vinden statistici dat er vanaf bijvoorbeeld 30% sprake is van een (redelijk) groot verschil.



11 a Wat is het verschil in percentage jongens in de A/C-groep en de B-groep?

Dat verschil in percentages jongens is precies gelijk aan het verschil in percentages meisjes. En dat is niet toevallig.

b Leg uit dat die verschillen in percentages altijd beslist gelijk zijn.

(9)

Hierboven heb je verticaal gepercenteerd. De kolomtotalen zijn op 100% gezet en die 100% is verdeeld over de cellen erboven. Je hebt de tabel verticaal gepercenteerd omdat je wilde weten wat het verschil was in de verdeling jongen-meisje in de A/C-groep en in de B-groep. De twee percentages vergelijk je vervolgens horizontaal: je neemt het verschil van de naast elkaar geplaatste percentages.

Je kunt ook horizontaal percenteren. Dan wil je weten hoe de verdeling wiskunde AC- wiskunde B is onder de meisjes en onder de jongens. Dan zet je de rijtotalen op 100% en vergelijkt vervolgens de gevonden percentages verticaal.



12 a Percenteer op het werkblad de tabel horizontaal.

b Wat is het percentageverschil?

Is dit gelijk aan het percentageverschil bij verticaal percenteren?

Bij een kruistabel kun je de percentages dus op twee manieren uitrekenen en met elkaar vergelijken.

- Je kunt per kolom de percentages uitrekenen. Onderaan in de kolommen kom je dan op 100%

uit. Deze percentages vergelijk je dan horizontaal met elkaar. Dit heet verticaal percenteren, horizontaal vergelijken.

- Je kunt ook per rij de percentages berekenen. Rechts aan het eind van de rijen krijg je 100%.

Deze percentages vergelijk je dan verticaal met elkaar. Dit heet: horizontaal percenteren, verticaal vergelijken.

graduele verschillen

Wiskunde A en wiskunde C bereiden voor op een studie in de alfa- of gammavakken. Je kunt je dus afvragen of je tussen wiskunde A/C- en wiskunde B-leerlingen verschillen vindt in

‘belangstelling voor kunst’. Die is gemeten met de variabele kunstbel. Deze variabele kan de waarden 1 tot en met 6 hebben (1 = geen belangstelling, 6 = veel belangstelling).

leerling geslacht gebjaar gebmnd gewicht lengte kunstbel talen cijfwis cijfgem huiswerk wisgroep profiel leuk tedoen past advies

16 v 91 12 52 170 4 2 8 7,3 10 B NG 3 1 2 4 17 v 92 1 59 165 3 3 8 7,0 15 A/C EM 1 2 4 3 18 m 92 3 69 186 2 2 7 7,5 10 B NG 4 1 4 4 19 m 91 10 75 190 2 2 6 6,5 7 A/C EM 2 1 4 3 20 m 91 12 80 178 3 2 8 7,0 7 A/C CM 2 1 4 3 21 v 92 6 61 177 3 2 8 7,4 6 B NG 4 4 1 4 22 m 92 6 80 189 1 1 7 6,8 1 A/C EM 3 1 2 4



13 Bekijk de scores op kunstbel.

a Wie scoren het hoogst, de B-leerlingen of de A/C-leerlingen? Hoe heb je dat vastgesteld?

Als je de frequenties in een kruistabel zet, krijg je in dit geval een zogenaamde 6×2-tabel, want

(10)

kunstbel

wisgroep

totaal

A/C B

1. geheel niet 2. niet zo groot 3. middelmatig 4. tamelijk groot 5. groot

6. erg groot

totaal 4 3 7

b Vul op het werkblad de frequenties in de kruistabel in.

c Vind jij dat de verdeling op kunstbel veel verschilt tussen A/C- en B-leerlingen?

Waarom?

Als je voor alle 154 leerlingen de frequenties in een kruistabel zet, krijg je:

kunstbel

wisgroep

totaal

A/C B

1. geheel niet 8 11 19

2. niet zo groot 11 26 37

3. middelmatig 11 44 55

4. tamelijk groot 9 17 26

5. groot 2 10 12

6. erg groot 2 3 5

totaal 43 111 154

14 Waarom is het lastig in de tabel de A/C-leerlingen en de B-leerlingen met elkaar te vergelijken wat kunstbelangstelling betreft?

Vanwege de ongelijke groepsgroottes kun je weer beter overgaan op relatieve frequenties.



15 a Vul op het werkblad de percentages in voor beide wiskundevakken. Rond af op hele percentages.

b In welk opzicht krijg je nu een beter inzicht in de verschillen?

c In welk opzicht is het vergelijken nog steeds lastig?

(11)

 Een autobedrijf wil weten wat de klanten van het bedrijf vinden en stelt daarom een vragenlijst op.

Noem een aantal variabelen die daarbij een rol kunnen spelen?

 Een klein onderzoek naar drugsgebruik onder jongeren leverde de volgende gegevens op.

gebruikt drugs

geen drugs

totaal

allochtoon 8 12

autochtoon 4 20

totaal

Wat het verschil in percentage drugsgebruikers bij allochtonen en autochtonen?

Wat is het verschil in percentage allochtonen bij drugsgebruikers en geen-drugsgebruikers?

 We bekijken de resultaten van een tweede onderzoek naar drugsgebruik onder jongeren:

gebruikt drugs

geen drugs

totaal

allochtoon 20 30 50

autochtoon 80

totaal

Vul de tabel verder in als er geen verschil is in drugsgebruik tussen allochtone en autochtone jongeren.

Hoe ziet de tabel eruit als er een extreem verschil in drugsgebruik is tussen allochtone en autochtone jongeren?

(12)

1.2 Data in beeld

geclusterd staafdiagram, reepdiagram, cumulatief frequentiepolygoon Bij de variabele geslacht zijn er maar twee waarden mogelijk: ‘man’ en ‘vrouw’. In dat geval kon je met het percentageverschil goed aangeven hoezeer beide wisgroepen verschillen.

De variabele kunstbel heeft zes mogelijke waarden. Dan is het veel lastiger om het verschil tussen beide wisgroepen te karakteriseren.

In de kruistabel staat freq voor frequentie (= aantal) en p voor percentage.

kunstbel

wisgroep

A/C B

freq p freq p

1. geheel niet 8 18,6% 11 9,9%

2. niet zo groot 11 25,6% 26 23,4%

3. middelmatig 11 25,6% 44 39,6%

4. tamelijk groot 9 20,9% 17 15,3%

5. groot 2 4,7% 10 9,0%

6. erg groot 2 4,7% 3 2,7%

totaal 43 100,1% 111 99,9%



16 Het totale percentage A/C is niet precies 100%.

a Hoe komt dat?

Bij A/C is het totale percentage 0,1% te groot en bij B 0,1% te klein.

b Is dat toeval?

Met de percentages is het geclusterde staafdiagram hieronder gemaakt. Daarin staat hoe de belangstelling voor kunst verdeeld is over de verschillende waarden, van beide groepen, in procenten. Je krijgt meteen al een eerste indruk van de verschillen: de B-groep heeft een veel hoger percentage op de score middelmatig en ook een hoger percentage op de score groot; op de andere scores zijn de percentages lager dan van de A/C-groep.

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

1 2 3 4 5 6

kunstbel

A/C B

p

(13)



17 a Welk niveau van belangstelling komt het meeste voor als je de hele groep bekijkt?

In de grafiek zie je dat de aantallen niet symmetrisch zijn verdeeld rond 3,5. De aantallen links ervan zijn groter dan de aantallen rechts ervan.

b Wat betekent dat voor de algemene belangstelling voor kunst in deze groep leerlingen?

c Vind jij dat er veel verschil is in belangstelling voor kunst tussen beide groepen? Waarom wel/niet?

Om de groepen beter te kunnen vergelijken, kijken we naar de cumulatieve percentages. Je neemt dan de percentages tot en met een bepaalde score. Bijvoorbeeld het percentage A/C- leerlingen met een score t/m middelmatig is 18,6% + 25,6% + 25,6% = 69,8%, afgerond 70%.

kunstbel

wisgroep

A/C B

freq cf cp freq cf cp

1. geheel niet 8 8 19% 11 11 10%

2. niet zo groot 11 19 44% 26 … …%

3. middelmatig 11 30 70% 44 … …%

4. tamelijk groot 9 39 91% 17 … …%

5. groot 2 41 95% 10 … …%

6. erg groot 2 43 100% 3 … 100%

totaal 43 111

In de kolom cf staan de cumulatieve (= opgetelde) frequenties en cp staat voor cumulatief

percentage. Zo is bij de A/C-groep de cumulatieve frequentie van “middelmatig” 30, want er zijn 8+11+11 = 30 A/C-leerlingen met middelmatige of lagere belangstelling voor kunst, en dat is ongeveer 70%.

Cumulatief betekent samenvoegend, ophopend.



18 Vul op het werkblad de ontbrekende cumulatieve percentages voor de B-groep in.

Door de staven in het staafdiagram van de vorige bladzijde te stapelen, krijg je automatisch de cumulatieve percentages in beeld. Dat zie je in het reepdiagram. De zes percentages van een groep (kolom cp in de kruistabel) zijn er opgestapeld weergegeven door (gekleurde) blokjes in een reep. Voor de duidelijkheid zijn de grenzen tussen de blokjes nog met stippellijnen

verbonden.

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

A/C. B.

erg groot groot

tamelijk groot middelmatig niet zo groot helemaal geen

(14)

1 2 3 4 5 6



19 a Komt een lagere belangstelling voor kunst (dat is “helemaal geen” of “niet zo groot”) meer voor bij de B- dan bij de A/C-groep?

b Wat is je conclusie over het verschil in kunstbel voor beide groepen?

Je kunt de verschillen tussen de cumulatieve percentages bekijken: cp(A/C) – cp(B).

Deze percentageverschillen noemen we Vcp.



20 a Vul op het werkblad de kolom Vcp in en stel vast wat het grootste absolute verschil is.

b Hoe zie je in het reepdiagram wat het grootste verschil is?

We tekenen de lijngrafieken van de cumulatieve percentages cp van beide groepen.



21 a Lees uit de grafiek af hoeveel procent van de B-leerlingen middelmatig of minder belangstelling voor kunst hebben.

b Lees uit de grafiek af hoeveel procent van de B-leerlingen tamelijk grote belangstelling voor kunst hebben (dat is categorie 4)?

c Hoe zie je in de grafiek dat er procentueel meer A/C-leerlingen zijn met tamelijk grote belangstelling (categorie 4) voor kunst dan B-leerlingen?

d Hoe zie je aan deze lijngrafieken dat de belangstelling voor kunst in de wiskunde B-groep (iets) groter is dan in de wiskunde A-groep?

Een lijngrafiek zoals hierboven heet een cumulatieve frequentiepolygoon.

Polygoon betekent letterlijk veelhoek. Je tekent die door de losse punten (hier bij de cumulatieve percentages) te verbinden. Je krijgt zodoende in het algemeen een grafiek met knikken.

De variabele advies zegt in hoeverre het advies van mensen belangrijk was voor een leerling om het gekozen profiel te kiezen. 1 betekent minst belangrijk, 4 betekent meest belangrijk.

Hieronder staat de kruistabel van advies tegenover de wisgroep.

(15)

A/C B

leerlingen

advies

wisgroep

A/C B

freq cf cp freq cf cp

1. niet belangrijk 3 10

2. minder belangrijk 2 14

3. belangrijk 14 25

4. erg belangrijk 24 62

totaal 43 111



22 a Vul op het werkblad de tabel verder in.

b Teken de cumulatieve procentuele frequentiepolygonen voor beide wisgroepen in één figuur.

c Lees hieruit af voor welke groep het advies het zwaarst telde.

histogram, cumulatief frequentiepolygoon, boxplot

We gaan het gemiddelde rapportcijfer van de A/C- en de B-leerlingen vergelijken, bij de overgang van klas 3 naar klas 4. Dit gemiddelde is op één decimaal afgerond.

We gaan deze data op allerlei manieren weergeven:

• met een dotplot

• met een staafdiagram

• met een histogram

• met een cumulatieve frequentiepolygoon

• met een boxplot

Dotplots

De dotplot geeft alle data weer van beide groepen. Van alle leerlingen is het gemiddelde rapportcijfer aangegeven door een stip. Verticaal staan de cijfers, horizontaal de (genummerde) leerlingen, links A/C en rechts B.



23 Welk verschil tussen beide groepen valt onmiddellijk op als je de dotplot van de A-groep vergelijkt met de dotplot van de B-groep?

(16)

Staafdiagrammen

De hoogte van een staaf geeft aan hoe vaak de betreffende score voorkwam.

De staafdiagrammen maken je niet veel wijzer over de verschillen tussen beide groepen. Er ontstaat een overzichtelijker beeld als de gemiddelde eindcijfers worden ingedeeld in klassen.

Histogrammen

24 Welk verschil tussen beide wisgroepen valt nu het meeste op?

De balk boven score 6 in het histogram voor de B-groep geeft weer dat 3 leerlingen een cijfer hadden tussen 5,5 en 6,5. Om precies te zijn: minstens een 5,5 en lager dan een 6,5. Die grenzen worden door de maatstreepjes op de horizontale as aangegeven. De score 7 is een klasse van scores, met klassegrenzen 6,5 en 7,5 en met klassemidden 7.

Voordat je een histogram maakt, kies je een geschikte klasse-indeling van de scores.

Tip

Afhankelijk van de situatie zorg je ervoor dat er niet teveel (minder dan 10) en niet te weinig (ten minste 5) klassen zijn.

“Histogram” is afgeleid uit het Grieks: histos = balk, graphein = schrijven.

frequentie frequentie

frequentie

6,0 7,0 8,0 9,0 cijfgem

frequentie frequentie

frequentie

6,0 7,0 8,0 9,0 cijfgem

cijfgem A/C cijfgem B

6,0 7,0 8,0 9,0 cijfgem 6,0 7,0 8,0 9,0 cijfgem

cijfgem B cijfgem A/C

(17)

0,0 20,0 40,0 60,0 80,0 100,0 120,0

1,0

Series1 Series2 120

100

80

60

40

20

0

6,0 6,5 7,0 7,5 8,0 8,5 9,0

cijfgem A/C cijfgem B

%

cijfgem Opmerking

De begrippen staafdiagram en histogram lijken veel op elkaar. Omdat het gemiddelde cijfer in principe alle waarden kan aannemen tussen 1 en 10, heb je hier te maken met een continue variabele. In de praktijk gebruik je een histogram alleen bij continue variabelen. In alle andere gevallen maak je een staafdiagram met losse staven; de variabele neemt dan alleen losse waarden aan, zoals 7,5 ; 7,6 ; 7,7 ; enz.

25 Doordat elk cijfer eigenlijk een klasse is, worden er veel cijfers op één hoop gegooid.

Welke informatie ben je kwijtgeraakt als je de histogrammen met de staafdiagrammen vergelijkt?

Cumulatieve relatieve frequentiepolygonen

Een betere mogelijkheid om het verschil tussen de A/C-groep en de B-groep in beeld te brengen is de cumulatieve relatieve frequentiepolygoon of relatieve somfrequentiepolygoon. Op de horizontale as staan de gemiddelde cijfers, op de verticale as de cumulatieve percentages.

26 Bekijk de figuur hierboven.

a Bij welke waarde van cijfgem is het verschil tussen de cumulatieve percentages van de twee groepen het grootst?

b Hoe groot is dat verschil?

c Geef je mening over de verschillen tussen beide groepen wat het gemiddelde cijfer in vwo 3 betreft.

(18)

Je kunt ook een cumulatieve relatieve frequentiepolygoon maken door uit te gaan van de histogrammen (in plaats van van de waarden zelf).

Hieronder staan de cumulatieve frequentiepolygonen voor de A/C- en B-groep in één figuur.

De stip boven 7,5 op de polygoon voor de B-groep zegt dat in de B-groep het percentage leerlingen met gemiddelde cijfer 7,5 of lager bijna 70% is.



27 a. Lees uit de cumulatieve frequentiepolygonen af hoeveel procent van de A/C-leerlingen meer dan 6,5 en hoogstens 7,4 als gemiddelde hadden.

b. Lees dit percentage ook af uit de figuur op de vorige bladzijde.

c. Hoe zie je in de figuur dat de gemiddelde rapportcijfers van de B-leerlingen hoger waren dan die van de A/C-leerlingen?

Boxplots



Een andere manier om naar de gegevens te kijken is de volgende. Deel de populatie in in vier gelijke stukken (kwarten). Zet daarvoor eerst alle data op volgorde van grootte. Als voorbeeld nemen we de gemiddelde cijfers in de A/C-groep. Dat zijn er 43:

6,0 ; 6,0 ; 6,1 ; 6,5 ; 6,5 ; 6,5 ; 6,5 ; 6,5 ; 6,5 ; 6,6 ; 6,6 ; 6,8 ; 6,8 ; 6,8 ; 6,9 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,0 ; 7,2 ; 7,3 ; 7,3 ; 7,3 ; 7,5 ; 7,5 ; 7,5 ; 7,5 ; 7,5 ; 7,6 ; 7,8 ; 7,8 ; 8,0

Deze verzameling cijfers verdeel je in twee gelijke helften van elk 21 cijfers. Het middelste cijfer is 7,0; dat is hierboven vet gemaakt. Links daarvan staan 50% van de data en rechts daarvan ook.

Dit is de mediaan van de cijfers. Bij een even aantal cijfers zijn er twee middelsten. In dat geval nemen we het gemiddelde van die middelsten; dat is dan de mediaan.

De mediaan verdeelt de cijfers in twee even grote helften.

Op dezelfde manier bepaal je het middelste cijfer van de linkerhelft en ook van de rechterhelft.

Die zijn onderstreept: 6,6 en 7,3. Dat zijn de zogenaamde kwartielen. 6,6 is het eerste kwartiel, 7,3 is het derde kwartiel.

Het tweede kwartiel is de mediaan. De kwartielen verdelen de verzameling van alle data dus in vier gelijke stukken; elk van (ruwweg) 25%.

cijfgem cumulatieve relatieve frequentiepolygoon

B A/C

%

5,5 6,5 7,5 8,5 9,5

(19)

Opmerking

Het gaat hier om een globale verdeling; kwartielen worden gebruikt voor grote databestanden.

Dan doet het er niet toe of je de mediaan zelf wel of niet mee laat doen bij de kleinste helft om het eerste kwartiel te bepalen. Voorbeeld:

het eerste kwartiel van de lengtes van Nederlandse 18-jarige jongens is 178,4 cm; dat betekent dat 25% van de Nederlandse 18-jarige jongens korter dan 178,4 cm is en 75% langer dan 1,78,4 cm. Niemand is exact 178,4 cm; de precieze lengte van 178,4 cm is niet interessant.

Om misverstanden te voorkomen zullen we de volgende afspraak gebruiken:

- het eerste kwartiel is de mediaan van de linkerhelft, exclusief de eventuele middelste score, - het derde kwartiel is de mediaan van de rechterhelft, exclusief de eventuele middelste score.



28 Kijk naar de 25%-, 50%- en 75%-waarden op de verticale as van de A/C-polygoon op bladzijde 17 en zoek de bijbehorende cijfers op de horizontale as.

Welke cijfers zijn dat?

Hieronder zie je nog eens de cumulatieve frequentiepolygoon van gemiddelde rapportcijfers van de B-groep. Daaronder is de zogenaamde boxplot getekend.



Een boxplot wordt getekend door op schaal de uiterste waarden en de kwartielen aan te geven.

In de “box” (de rechthoek tussen de kwartielen) zit 50% van de waarden. In dit geval:

• laagste waarde: 6,0

• eerste kwartiel: 6,95

(want de 25% lijn valt midden tussen de 6,9 en de 7,0)

• mediaan: 7,42

• derde kwartiel: 7,73

kleinste waarde eerst kwartiel mediaan derde kwartiel grootste waarde

%

B-groep

6,0 6,5 7,0 7,5 8,0 8,5 9,0 cijfer

(20)



29 a Teken op het werkblad de boxplot voor de A/C-groep onder de boxplot voor de B-groep.

b Beschrijf op grond van de boxplots het verschil tussen beide groepen met betrekking tot het gemiddelde eindcijfer in klas 3.

c Heeft het eindcijfer voor wiskunde in klas 3 een rol gespeeld bij de keuze voor wiskunde A/C of wiskunde B? Geef argumenten.

Tussen het eerste en het derde kwartiel zit de helft van de scores. De afstand van het eerste en derde kwartiel heet kwartielafstand. Dat is de breedte van de box.

Als de kwartielafstand groot is, is de spreiding van de scores dat ook, dwz de scores liggen dan ver uit elkaar. (We komen hier later op terug.)

Steelbladdiagram



Nauw verwant aan het histogram is het zogenaamde steelbladdiagram. We leggen dat uit aan de hand van de gewichten van de leerlingen in de A/C-groep.

Op de bovenste regel staan de gewichten 41, 46 en 48 kg. De "4" staat in de "steel", de "1", "6"

en "8" zijn de bladeren.

30 a Hoe maak je van het steelbladdiagram een histogram? Met welke klassebreedte?

b Hoeveel A/C-leerlingen wegen meer dan 70 kg?

c Bepaal de kwartielen en de mediaan op de manier van bladzijde 18.

d Teken de cumulatieve relatieve frequentiepolygoon.

e Bepaal de mediaan en de kwartielen uit de cumulatieve relatieve frequentiepolygoon.

f Teken de boxplot.

4 1 6 8

5 0 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 9 9 9 6 0 0 1 3 3 3 4 4 5 5 5 7

7 2 4 5 5 6 8 0 0 0

(21)

100%

0%

rependiagrammen

0%

100%

1 2 3 4 5

zeer hoog hoog laag zeer laag

• Mensen is gevraagd naar hun interesse voor de aanstaande verkiezingen voor het Europese parlement. De antwoorden worden weergeven in een reepdiagram.

We bekijken vijf theoretisch mogelijke reepdiagrammen.

Zeg bij elk van deze reepdiagrammen in woorden wat het jou vertelt.

• De scores op een of andere variabele lopen van 120 tot 220. Ze worden verdeeld in tien klassen, met klassebreedte 10. Veronderstel dat de scores uniform verdeeld zijn, dat wil zeggen dat alle klassen evenveel scores tellen.

Wat zijn dan de kwartielen?

Wat is de kwartielafstand?

Hoe ziet het steelbladdiagram eruit, als de steel bestaat uit "12", "13", …, "22”

Teken de boxplot.

Hoe ziet het reepdiagram eruit?

Hoe ziet de dotplot eruit?

Hoe ziet de cumulatieve freqentiepolygoon eruit?

• Bekijk de twee cumulatieve frequentie- polygonen, van Amsterdammers en van Rotterdammers op een of andere variabele.

Hoe kun je zien welke stad de meeste spreiding in de antwoorden heeft?

Schets de boxplot van elk van de steden. A'dam

R'dam reepdiagrammen

(22)

1.3 Computerpracticum

Bij grote databestanden is het ondoenlijk om met de hand het tel- en tekenwerk te doen. Met een statistiekprogramma neemt de computer je al dit werk uit handen. Er bestaan veel statistiek- programma’s. Ze hebben allemaal hun voordeel en hun nadeel. We gebruiken in dit practicum het programma VUStat om de gegevens van de 154 vwo4-leerlingen te analyseren.

► Dubbelklik in Digimap op Verschillen en vervolgens op Copmputerpracticum.

Je krijgt een datatabel (datamatrix).

Hiernaast zie je het linkerbovengedeelte van de tabel.

We gaan een kruistabel maken waarbij het geslacht wordt uitgezet tegen het profiel.

► Kies in het menu Tabel > Kruistabel

► Selecteer de variabele geslacht en klik bij Rijvariabele op ; selecteer zo ook de kolomvariabele profiel.

Je krijgt het volgende resultaat:

VUStat kan de aantallen in de kruistabel ook omzetten in percentages.

► Kies rij-percentages.

► Kies kolom-percentages.

• We gaan de verdeling van de jongens over de vier profielen grafisch weergeven. We beginnen met het staafdiagram en reepdiagram.

► Kies in het menu Grafiek>Staafdiagram, selecteer de variabele geslacht.

►Voor een opdeling in profielen klik je op de knop Splitsen. Selecteer de splitsvariabele profiel.

► Kies het (reep)diagram en vink Procenten aan.

► Doe hetzelfde te beginnen met profiel en als splitsvariabele geslacht.

leerling geslacht gebjaar gebmnd gewicht lengte kunstbel

1 m 92 april 70 190 middelmatig

2 m 92 mei 55 170 niet zo groot

3 m 92 januari 60 170 niet zo groot

4 v 91 november 52 160 niet zo groot

5 v 92 september 60 175 middelmatig

6 v 92 januari 65 178 middelmatig

7 v 92 januari 55 169 middelmatig

8 v 91 mei 52 168 groot

9 v 91 oktober 52 168 tamelijk groot

10 v 92 september 64 175 tamelijk groot

profiel

geslacht CM EM NG NT Totaal

jongen 2 15 17 35 69

meisje 9 27 43 6 85

Totaal 11 42 60 41 154

>

(23)

►Maak een geclusterd diagram met de knop

NB. Met de knop Splitsing opheffen kun je een splitsing ongedaan maken.

We gaan een cirkeldiagram maken

In een cirkeldiagram (of sectordiagram) komt de grootte van elk cirkelsegment overeen met de relatieve frequentie van een score.

Je gaat een cirkeldiagram maken bij de profielkeuze van de jongens.

► Kies in het menu Grafiek > Cirkeldiagram en selecteer variabele profiel.

Voor een groepsindeling splits je op de variabele geslacht.

Als Bijschrift is hier Label&Percentage geschikt.

We maken ook een cirkeldiagram voor de verdeling van de meisjes over de profielen. Daarvoor moeten we eerst de meisjes uit het hele bestand selecteren.

► Kies Data > Selectiefilter > Filter ; selecteer de variabele geslacht en dan label v.

► Kies Grafiek > Cirkeldiagram enz.

NB. Via Data kun je de selectie opheffen.

We gaan een histogram maken van de lengten van de leerlingen.

► Kies in het menu Grafiek > Staafdiagram en selecteer de variabele lengte.

Je krijgt meer inzicht in de verdeling van de variabele lengte als je ook andere klasse-indelingen bekijkt.

► Klik op Indeling en zet het aantal klassen op 3; kies een klassebreedte.

► Bekijk zo verschillende indelingen.

We gaan een cumulatieve frequentiepolygoon maken van de kunstbelangstelling van de leerlingen.

► Kies in het menu Grafiek > Lijndiagram en selecteer de variabele kunstbel.

► Vink Cumulatief aan, en eventueel Procenten.

We gaan een boxplot maken.

Je gaat een boxplot maken maken van het gewicht van de leerlingen.

► Kies in het menu Grafiek > Boxplot en selecteer de variabele gewicht.

Klik op en dan op OK. >

(24)

1.4 Onderzoek



Het bestand sportprestaties.vus (voor VU-Statistiek) bevat gegevens van 74 leerlingen over de drie sporten Sprint, Verspringen en Vergooien (met een gewicht van 200 gram).

De onderzoeksvraag is:

Hoe verschillen jongens en meisjes op elk van deze drie onderdelen en wat is het effect van de leeftijd op de prestaties?

Onderzoek de data op deze vraag met behulp van VUStat. Breng de verschillen in beeld en geef aan hoe groot deze verschillen zijn.

Verwerk in je conclusie in ieder geval de volgende aandachtpunten:

• beargumenteer je keuze van de diagrammen: waarom heb je juist die diagrammen gekozen?

• interpreteer de grootte van de waargenomen verschillen: vind je ze groot of klein? Waarom?

Spiekbriefje voor VU-Statistiek

► Dubbelklik in Digimap op Onderzoek 1

Kruistabel

Kies in het menu Tabel > Kruistabel.

Selecteer een rijvariabele en een kolomvariabele.

Kies rij-percentages of kolom-percentages en sluit af met OK.

Staafdiagram / Reepdiagram

Kies in het menu Grafiek>Staafdiagram, selecteer een variabele.

Klik op de knop Splitsen.

Selecteer een splitsvariabele.

Kies het (reep)diagram en vink Procenten aan.

Kies geclusterd diagram .

Cirkeldiagram

Kies in het menu Grafiek > Cirkeldiagram en selecteer een variabele.

Kies een Bijschrift.

Histogram

Kies in het menu Grafiek > Staafdiagram en selecteer een continue variabele (blz. 17).

Klik op Indelingen en kies het aantal klassen en de klassebreedte.

Frequentiepolygoon

Kies in het menu Grafiek > Lijndiagram en selecteer een continue variabele (blz. 17).

Vink Cumulatief aan voor een cumulatieve frequentiepolygoon.

Boxplot

Kies in het menu Grafiek > Boxplot en selecteer een continue variabele (blz. 17).

• Probeer eens uit te zoeken of leerling 24 een jongen of een meisje is.

(25)

1.5 Samenvatting par. 1.0 t/m 1.4

Statistiek begint met het stellen van een vraag, bijvoorbeeld naar de verschillen tussen twee groepen leerlingen. Om die vraag te kunnen beantwoorden worden gegevens verzameld,

bijvoorbeeld door middel van een enquête. De verzamelde gegevens worden gerangschikt in een datamatrix. In de verticale kolommen van de matrix staan de scores van de gemeten variabelen, in de horizontale rijen staan de objecten van het onderzoek.

Vaak is de datamatrix zo uitgebreid, dat je daaruit niet rechtstreeks conclusies kunt trekken.

Daarom worden de data gerepresenteerd in getallen, kleinere tabellen of in diagrammen.

In getallen: mediaan, kwartielen

In kleinere tabellen: frequentietabel, kruistabel

In diagrammen cirkeldiagram, staafdiagram, histogram, frequentiepolygoon, boxplot.

De mediaan is de waarde die de op volgorde gezette scores van een variabele in twee helften verdeelt: 50% van de scores heeft een waarde die kleiner is dan de mediaan en 50% een waarde die groter is dan de mediaan. De kwartielen zijn de waarden die de geordende scores in vier opeenvolgende kwarten verdelen.

Bij een oneven aantal is de mediaan de middelste waarneming, bij een even aantal het gemiddelde van de middelste twee waarnemingen.

In een frequentietabel staat hoe vaak de verschillende scores op een variabele voorkomen.

De relatieve frequentie van een score is het percentage van het totaal waarin de score voorkomt.

In formule: frequentie (

relatieve frequentie (in %) = 100%) totale aantal ×

Een cumulatieve (relatieve) frequentie van een score is de (relatieve) frequentie van die score plus die van alle lagere waarden (in procenten).

In een kruistabel worden twee variabelen tegen elkaar uitgezet. Er staan de frequenties of de relatieve frequenties in waarin de combinaties van scores voorkomen. Voorbeeld:

geslacht

wisgroep

totaal

A/C B

man 13 56 69

vrouw 30 55 85

totaal 43 111 154

Een steelbladdiagram geeft een overzicht van alle scores, gerangschikt in een verticale “steel”

en horizontale “bladeren”. In een cirkeldiagram worden de percentages van de scores uitgezet als sectoren in een cirkel. Voorbeeld:

6 1 3 3 4

6 5 5 6 6 6 7 8 9 9 9 9 7 0 0 0 1 1 1 2 3 3 4 7 5 5 6 6 6 6 7 8 9 8 0 2 2 4

8 8 9 0

(26)

In een staafdiagram worden de (relatieve) frequenties van de scores uitgezet als losse staven.

Een histogram is een staafdiagram bij een continue variabele (de scores kunnen in principe alle getallen in een domein aannemen). De scores zijn ingedeeld in klassen. De staven staan aan elkaar vast.

Voorbeeld van een reepdiagram (links) en een geclusterd staafdiagram (rechts):

Een frequentiepolygoon is een lijndiagram bij een continue variabele die de (relatieve) frequenties met elkaar verbindt.

Bij een cumulatieve frequentiepolygoon zijn de (relatieve) cumulatieve frequenties in een lijngrafiek gezet. Daaruit kun je bij een waarde aflezen hoeveel procent van de data een kleinere of gelijke waarde heeft.

Als je de uiterste waarden, de mediaan en het eerste en derde kwartiel kent, kun je de boxplot maken. Voorbeeld:

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

A/C. B.

erg groot groot tamelijk groot middelmatig niet zo groot helemaal geen

0 5 10 15 20 25 30 35 40 45

helemaal geen niet zo groot middelmatig tamelijk groot groot erg groot

A/C.

B.

kleinste waarde eerst kwartiel mediaan derd kwartiel grootste waarde

%

B-groep

6,0 6,5 7,0 7,5 8,0 8,5 9,0 cijfer

(27)

1.6 Verschillen meten

Temperatuur meet je met een thermometer. Of de een het nu wat aan de kille kant vindt en de ander juist een lekker temperatuurtje, de thermometer is onverbiddelijk. De thermometer geeft een getalswaarde aan de temperatuur die los staat van je persoonlijke mening.

Iets soortgelijks doet zich voor in de statistiek (en in veel meer gebieden van de wetenschap). In het voorgaande hebben we naar verschillen gekeken tussen twee groepen. Over de grootte van die verschillen kun je twisten. De een vindt dat ze aanzienlijk zijn, een ander vindt dat dat wel meevalt. We gaan nu proberen de verschillen te meten, dat wil zeggen uit te drukken in een getal.

Welke manier van meten je kiest, hangt af van de situatie en soms van je persoonlijke voorkeur.

Net zoals bij de thermometer: de Amerikanen doen het met Fahrenheit en in Europa houden we het op Celsius.

Maximale percentageverschil



Je zou kunnen verwachten dat leerlingen die voor wiskunde A/C gekozen hebben, meer belang- stelling hebben voor kunst dan wiskunde B-leerlingen. De variabele kunstbel van de leerling- enquête geeft hier informatie over. De volgende kruistabellen geven de resultaten van het denk- beeldige Amalia College.

In de linker tabel staan de frequenties, in de rechter tabel de cumulatieve aantallen.

kunstbel A/C B

niet 8 11

gering 11 27

middelmatig 11 43

vrij groot 9 17

groot 2 10

zeer groot 2 3

43 111

Vervolgens kijken we naar de cumulatieve percentages en hun verschillen Vcp. Die staan in onderstaande tabel. In het reepdiagram daarnaast zijn die percentages in beeld gebracht.

kbel cum. A/C B Vcp

niet 19% 10% 9%

gering 44% 34% 10%

middelmatig 70% 73% 3%

vrij groot 91% 88% 3%

groot 95% 97% 2%

zeer groot 100% 100% 0%

kunstbel A/C B

niet 8 11

gering 19 38

middelmatig 30 81 vrij groot 39 98

groot 41 108

zeer groot 43 111

8

10 11

27 11

43

9 17

2 10

2 3

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1 2

Reeks6 Reeks5 Reeks4 Reeks3 Reeks2 Reeks1 zeer groot groot vrij groot middelmatig gering niet

A/C B

11

(28)

Je zoekt nu de maximale waarde van Vcp op. Dat is een geschikte maat voor het verschil tussen beide groepen op de variabele kunstbel. Hij heet het maximale cumulatieve percentageverschil In dit geval is max. Vcp = 10%. Deze waarde zie je bij de reepdiagrammen terug als de meest steile verbindingslijn tussen de beide staven.

In stappen bepaal je het max. cp-verschil dus als volgt:

• Bepaal de cumulatieve frequenties van beide groepen.

• Zet die om in de cumulatieve percentages.

• Bepaal per waarde het (absolute) verschil van de cumulatieve percentages tussen de groepen.

• Neem van die verschillen de grootste waarde; dat is max.Vcp.

In de praktijk hanteert men de regel:

als max. Vcp kleiner dan 15% is, is het verschil gering,

als max. Vcp tussen 15% en 30% is, is het verschil middelmatig,

als max. Vcp groter dan 30% is, is het verschil groot.

31 Hieronder zie je de kruistabel van aantal vreemde talen en wiskundekeuze (A/C of B).

Bereken op het werkblad voor dit geval max. Vcp. Is het verschil tussen beide groepen groot?

aantal vreemde talen

wiskundegroep

Vcp A/C

freq cf cp

B

freq cf cp

een 7 16

twee 26 58 drie 10 30

vier 0 7

totaal 43 111

32 Bij de hoogste waarde van de variabele is Vcp altijd 0. Leg dat uit.

33 Iemand overweegt bij de variabele profiel ook max. Vcp te bereken om de jongens en de meisjes te vergelijken.

Waarom is dat niet zinvol?

34 Je zou als verschilmaat ook het gemiddelde van alle verschillen Vcp kunnen kiezen.

Bedenk een voor- en een nadeel van deze keuze ten opzichte van max. Vcp.

35 In de kruistabel hiernaast , weer van het Amalia College, is het geslacht tegen de wiskundekeuze uitgezet.

a Neem de tabel over en percenteer die verticaal.

b Waarom is het in dit geval niet zinvol om max.Vcp uit te rekenen?

c Nu max.Vcp als maat is afgevallen om het verschil in wiskundekeuze bij jongens en meisjes uit te drukken, moet je een andere maat bedenken. Welke maat bedenk jij?

geslacht A/C B tot

m 13 56 69

v 30 55 85

totaal 43 111 154

Referenties

GERELATEERDE DOCUMENTEN

• Steeds meer mensen uit de eerste en tweede groep gaan diensten aanbieden.. Ze krijgen een

Leerlingen die door psychische problemen niet mee kunnen komen in het regulier onderwijs, krijgen een beschikking om (voortgezet) speciaal onderwijs ((V)SO) te volgen of

Leen organisatorische elementen 2aD1 Welke POCs lenen de groep.. Te preciseren

Leen organisatorische elementen 2aD1 Welke POCs lenen de groep.. Te preciseren

Aan een antwoord waarin alleen aangeven wordt dat er een verschil is in abiotische factoren, wordt geen punt toegekend.

Cohen stelde in 1962 voor de effectgrootte bij een vergelijking van twee groepen als volgt te berekenen: neem het verschil tussen de gemiddeldes en deel dat door de

Zowel het verschil tussen jongens en meisjes in de omgang met computers, het zelfvertrouwen dat ze hebben en de kennis en vaardigheden die verschillen bij beide groepen zijn redenen

-De vragen over gezond lijnen (dikmakende voeding vermijden, voedsel met weinig calorieën eten, minder eten dan een bepaald aantal calorieën, een dag minder eten na een dag