Vergelijking van alternatieve scoringsprocedures voor de vragenlijst van Slade & Jenner [Comparison of alternative scoring procedures for the questionnaire of Slade & Jenner]

(1)

Vergelijking van scoringsprocedures bij

schaalconstructie geïllustreerd met de vragenlijst van

Slade en Jenner

P.M. Kroonenberg, B.C.S. Pangemanann' en D. Bakker2 Vakgroep Algemene Pedagogiek, Rijksuniversiteit Leiden

ABSTRACT

Several different scoring rules for a Dutch translation of a questionnaire by Slade and Jenner (1978) to measure attitudes to females' social role are compared. Correlations between different scoring alternatives, external validity and reliability of the scorings alternatives are investigated. Cross-validation with another sample is carried out, as well as a brief comparison with other scales. The overall conclusion is that the scoring rules lead to essentially the same total scores and external validity, but that reliability seems more variable, and sensitive to inhomogeneities in the samples.

INLEIDING

Het oorspronkelijke doel van het hier gerapporteerde onderzoek was het vergelijken van alternatieve scoringsprocedures voor de Nederlandse versie van een Engelse vragenlijst die bedoeld is om de houding van mensen ten opzichte van de sociale rol van vrouwen te bepalen (Slade & Jenner, 1978). Hierbij werd gebruik gemaakt van standaard principale componen-tenanalyse en van niet-lineaire componencomponen-tenanalyse programma's (HOMALS en PRIN-CALS) ontwikkeld door de vakgroep Datatheorie in Leiden. De resultaten van dit onderzoek waren zodanig dat we ons afvroegen (met name geïnspireerd door een anonieme beoordelaar van een eerdere versie) in hoeverre deze resultaten gekruisvalideerd konden worden en in hoeverre soortgelijke vragenlijsten, zoals in onderwijskundig en sociaal-wetenschappelijk onderzoek in het algemeen gebruikelijk zijn, vergelijkbare resultaten zouden opleveren. De resultaten lijken erop te wijzen dat het nut van alternatieve scoringsprocedures, zoals die van HOMALS, bij het soort vragenlijsten als hier beschreven wordt relatief gering is. Veel effectiever lijkt HOMALS te zijn voor het opsporen van inhomogeniteiten, uitbijters, en schendingen van de ordinaliteit. In eerste instantie zullen we ons concentreren op de vragenlijst van Slade en Jenner, om later kort de algemeenheid van de resultaten af te tasten.

SLADE EN JENNER VRAGENLIJST

De vragenlijst bestaat uit 25 items en is ontwikkeld en getest voor een Britse populatie. In een eerder onderzoek (Hubbard, Van Uzendoorn & Tavecchio, 1982) is de vragenlijst vertaald in

Adres: Vakgroep Algemene Pedagogiek, Rijksuniversiteit Leiden, Postbus 9555,2300 RB Leiden ' Thans werkzaam bij: Instituut voor Psychologisch Marktonderzoek, Rotterdam

(2)

het Nederlands en is, na validering voor een Nederlandse populatie, het aantal items teruggebracht tot twintig.

Slade en Jenner hebben in hun antwoordcategoriëen de 'neutrale' categorie weggelaten om zodoende de respondent te dwingen de antwoorden 'zeer mee oneens', 'min of meer mee oneens', 'min of meer mee eens' of 'zeer mee eens' te gebruiken. Deze antwoordcategoriëen zijn door Slade en Jenner gewogen met respectievelijk O, l, 3 en 4 of omgekeerd, afhankelijk van de richting waarin het item is geformuleerd. De score van een persoon op de vragenlijst als geheel is dan de som van de itemscores met een mogelijk waarde van O tot 80, wanneer men uitgaat van de gereduceerde lijst met 20 items. Een score in de buurt van nul is een indicatie van een attitude die 'passende' mannelijke en vrouwelijke functies sterk onderscheidt en een score in de buurt van de 80 indiceert een houding zonder sexetypering.

Hubbard et al. zijn echter na analyse van hun data met het computerprogramma HOMALS (Gifi, 198la) tot de conclusie gekomen dat de categoriegewichten niet O, l, 3, en 4 moeten zijn, maar O, l, 2 en 4, omdat het gemiddelde interval tussen de HOMALS schaalgewichten voor de categorieën 3 en 4 tweemaal zo groot is als dat voor O en l en voor l en 3. Voor deze laatste twee waren de gemiddelde intervallen nagenoeg gelijk.

Centraal blijft nu de vraag of deze twee Scoringsprocedures bij het gebruik van de schaal andere resultaten opleveren wat betreft de ordening van de totaalscores van de proefpersonen en de relatie van de totaalscores met andere variabelen. Indien dit het geval is, kan men zich afvragen of er nog andere zinvolle Scoringsprocedures te bedenken zijn die weer van deze twee verschillen en welke van zulke Scoringsprocedures het meest betrouwbaar is. Verder kan men zich afvragen of herziening van categoriewaarden op basis van optimale schaaltechnie-ken wel zin heeft. Immers, de data-afhankelijke aanpassingen zouden wel eens minder robuust kunnen zijn dan schaalwaarden bepaald op inhoudelijke gronden. Gedeeltelijk is hier al aan tegemoet gekomen door Hubbard et al. door niet de HOMALS kwantificaties zelf te gebruiken maar geheeltallige waarden afgeleid van deze kwantificaties.

In ons onderzoek is uitgegaan van de vertaalde vragenlijst gereduceerd tot 20 items zoals Hubbard et al. die gebruikt hebben (zie aldaar voor de preciese benaming van de items), zodat een vergelijking met dit laatste onderzoek mogelijk wordt. Daarnaast is een vragenlijst met 30 items gebruikt, die door ons zelf is opgesteld, om enig inzicht in de achtergrond van de respondenten te krijgen. De vragen hierin hebben betrekking op leeftijd, sexe, houding ten aanzien van ouders, van politiek, van vrouwenemancipatie en dergelijke.

METHODE Homals en Princals

Voor de analyse van de Slade & Jenner vragenlijst is veelvuldig gebruik gemaakt van het computerprogramma HOMALS (Gifi, 198la). Dit programma is een implementatie van Guttman's principale componenten analyse voor nominale schalen. Categoriegewichten worden zo gekozen dat een kleinste kwadraten verliesfunktie geminimaliseerd wordt. Nishisato (1980, p. 100) merkt op dat Lord (1958) heeft laten zien dat dit overeenkomt met het maximaliseren van zowel de gekwadrateerde gemiddelde item-totaal correlatie als ook Cronbach's a. Naast de analyse met HOMALS is een analyse met het programma PRINCALS (Gifi, 1981b, p. 184 e.v.) gedaan. Ook hierbij wordt Cronbach's a gemaximali-seerd (De Leeuw, 1986, pers. comm.)1, maar nu (in ons geval) onder de restrictie dat de

categorieën ordinaal zijn. Met PRINCALS kan dus een optimale schaling van gerangor-dende scores bereikt worden. Beide programma's zijn thans ook opgenomen in het statistische pakket SPSS, versie 4.0.

(3)

kwadraten (ALS) algoritme en wijzen optimale scores aan proefpersonen toe. Elementaire uiteenzettingen over de gebruikte niet-lineaire analyse technieken zijn te vinden in Meerling (1988, p. 145-149,252) en vele technische en praktische details zijn te vinden in Gifi (198 Ib, in druk). Niet-lineaire analysetechnieken worden onder andere gebruikt om inzicht te krijgen in de invloed van andere (d. w.z 'optimale') scoringsmethoden voor de categorieën. Tevens kan nagegaan worden in hoeverre de intervalaannames van Slade en Jenner en van Hubbard et al. terecht waren. Daarnaast wilden we inzicht krijgen in de ordinaliteit van de categorieën binnen de items. Met andere woorden of voor elk item de antwoordcategorieën monotoon waren ten opzichte van de onderliggende één-dimensionale schaal.

Respondenten

De twee vragenlijsten zijn tegelijk afgenomen aan 211 tweede- en derdejaars studenten pedagogiek aan de Rijksuniversiteit te Leiden. Van deze 211 vielen er 18 af wegens het niet volledig invullen van de Slade & Jenner vragenlijst en na een HOMALS analyse op de vragenlijst naar de kenmerken van de proefpersonen zijn een viertal proefpersonen afgevallen wegens hun extreme scores. Hierdoor bleef er een groep over bestaande uit 151 vrouwen en 36 mannen (Van twee personen was het geslacht niet bekend). Bij de antwoorden van de 189 respondenten op de Slade & Jenner vragenlijst waren bij acht items twee of minder personen die in een uiterste categorie scoorden. Deze enkele extreme scoorders domineerden de HOM ALS analyses zodanig dat de oplossing niet meer representatief geacht werd voor de groep als geheel, zodat de homogeniteit van de vragenlijst als geheel niet meer goed beoordeeld kon worden (zie ook Gifi, 1981b, p. 115). Daarom zijn die extreme categorieën hercodeerd of 'teruggetrokken' naar de de naastbijliggende categorie, zodat er dus items ontstaan met ingedikte categorieën. Met behulp van HOM ALS is daarna geconstateerd dat er geen verdere multivariate uitbijters meer waren.

De bovengeschetste procedure is duidelijk nogal subjectief en daardoor niet zonder gevaar. Dit is dan ook de reden dat we ter vergelijking ook de gewone (ongeschaalde) totaalscores hebben gebruikt zonder dat items ingedikt zijn.

Een één-dimensionale HOM ALS oplossing voor de ingedikte items is berekend voor de 20 items van de Slade & Jenner vragenlijst. De scores van de proefpersonen ('objectscores') uit deze analyse zijn in de verdere analyse gebruikt; aangeduid met [HOM]. Op basis van de HOMALS categoriekwantiflkaties zijn een driepuntsschaal en een zevenpuntsschaal gemaakt, waarbij de schaal met kwantifikaties in respektievelijk drie en zeven stukken is opgedeeld. Zo beslaat voor de driepuntsschaal categorie l de categorie-kwantifikaties die groter dan -.50 zijn; categorie 2 heeft die tussen -1.50 en -.50; en categorie 3 heeft die kleiner dan -1.50. Voor de zevenpuntsschaal zijn de bereiken voor de categorieën l t/m 7 respec-tievelijk >.50,0 tot .50, -.50 tot O, -1.00 tot -.50, -1.50 tot -1.00, -2.00 tot -1.50 en <-2.00. De originele itemscores zijn op deze wijze hercodeerd naar een drie- en zevenpuntsschaal. Door optelling van deze scores is voor iedere persoon een somscore berekend, respectievelijk aangeduid met [3CAT] en [7CAT].

Daarnaast zijn natuurlijk de somscores gebruikt zoals berekend via de scoringsprocedures van Slade en Jenner [S&J], die van Hubbard et al. [HUB], die waarbij 'gewoon' de waarden l, 2,3, en 4 gebruikt worden met de indikking zoals boven beschreven [INDIK], en die zonder indikking [1234]. Op de ingedikte items is ook een één-dimensionale PRINCALS toegepast. Ook van deze analyse zijn de objectscores [PRIN] gebruikt als een alternatief voor somscores. (Een volledig overzicht van de per item gebruikte kwantificaties kan bij de auteurs worden opgevraagd.)

(4)

Over de HOM ALS oplossing kan nog vermeld worden, dat bij vijf variabelen (items 4,6,7, 11, en 14) de kwantificaties na optimale schaling niet monotoon zijn met de oorspronkelijke categorieën. Met andere woorden voor deze groep kan een hogere gemiddelde gekwadra-teerde item-totaal correlatie verkregen worden door de volgorde van de oorspronkelijke categorieën te veranderen. In een inhoudelijk gericht onderzoek zou men dit verschijnsel op zijn minst aan een nader onderzoek moeten onderwerpen, ook al besluit men om er bij verdere analyses geen aandacht meer aan te schenken. De PRINCALS analyse met ordinaliteitsrestricties handhaaft de oorspronkelijke volgorde door net zoveel naburige categorieën van de problematische categorie gelijke waarden te geven tot er geen schendingen meer zijn van de monotonie.

RESULTATEN

Samenvattend zijn er dus voor elk individu zes somscores, namelijk [S&J], [HUB], [INDIK], [1234], [3CAT], [7CAT], en samen met de twee objectscores uit HOM ALS [HOM] en PRINCALS [PRIN] levert dat een achttal alternatieve scores op. Deze acht zijn met elkaar gecorreleerd en om enig inzicht te krijgen in de invloed van de herk wantificaties op de externe validiteit zijn ze ook gecorreleerd met Vraag 26 [V26] uit onze eigen vragenlijst: 'Hoe staat u tegenover vrouwenemancipatie in het algemeen?", waarbij men op een zevenpuntsschaal kon scoren met een indeling van l =zeer sympathiek, via 3=neutraal naar 7=zeer afwijzend. Tabel l geeft deze correlaties. Daarnaast geeft deze tabel de Cronbach a's voor elk van de vragenlijsten berekend via de procedure Reliability uit SPSS-X (SPSS, Inc., 1985). Bij de objectscores van de HOMALS en de PRINCALS oplossing is gebruik gemaakt van de volgende formule voor de berekening van de Cronbach's a (zie Nishisato, 1980, p. 101):

a=H(l-62)/(n-l)o2]

waarbij 62 de eigenwaarde van de eerste dimensie is, zoals die door het programma berekend

is, en n is het aantal items. (Voor het gebruik van deze formule bij PRINCALS moet enig voorbehoud uitgeoefend worden, zie ook voetnoot 1).

Tabel 1. Correlaties van scoringsalternatieven met elkaar en met de variabele 'Houding t.a.v. vrouwenemancipatie in het algemeen' (V26)

(HOM] [7CAT] [PRIN] [3CAT] [INDIK] [HUB] [S&J] [1234] [V.26]

(5)

Uit Tabel l valt op te maken dat de onderlinge correlaties tussen de acht somscores allemaal erg hoog zijn (tussen .91 en 1.00). Met name de correlaties tussen de HOM ALS scores en de uit HOMALS ontwikkelde scores (3- en 7-puntsschaal - [3CAT] en [7CAT]) zijn erg hoog (.98 -1.00). Zo ook de correlaties tussen deze drie scores en de PRINCALS scores. Deze vier alternatieven hebben ieder een iets hogere Cronbach's « dan de andere vier alternatieven. Het verschil tussen de hoogste waarde bij [HOM], 0.87, en die bij [1234] ,0.73, is niet onaanzienlijk, en op dit verschil komen we later nog terug. De correlaties met de externe variabele [V26] zijn echter vrijwel gelijk (tussen -.47 en -.51).

De beoordelaars van een eerdere versie van dit artikel wezen er terecht op dat optimale schaalprocedures door hun optimaal gebruik van de beschikbare gegevens en dus ook van hun eigenaardigheden, gevoelig zijn voor kanskapitalisatie en dus doorgaans ook minder robuust zijn (zie ook Wainer, 1976, en de uit dit artikel voortvloeiende discussie in Psychological Bulletin). In het huidige geval zou dit er toe leiden dat de winst in Cronbach's a van .08 bij de HOMALS oplossing [HOM] ten opzichte van de oorspronkelijke Slade & Jenner codering [S&J] en van .14 ten opzichte van de rechttoe rechtaan 1,2,3,4 codering [1234], bij kruisvalidatie weer als sneeuw voor de zon zou verdwijnen.

Kruisvalidatie

Onafhankelijk van het vorige onderzoek, werd de Nederlandse versie van de Slade & Jenner ook gebruikt in een inventarisatie van ouderschapsmotivaties (Tavecchio & Van IJzendoorn, 1987). De Slade & Jenner vragenlijst werd uitvoeriger geanalyseerd door Bakker ( 1988), en de gegevens van de moeders van de door haar beschreven steekproef konden gebruikt worden voor de kruisvalidatie. Bij deze laatste steekproef is alleen gekeken naar de [HOM] en de [1234] variant, dat wil zeggen kwantiflcaties l, 2, 3, en 4 zonder indikken, omdat deze de uitersten vormden in de vorige steekproef. Tegelijkertijd zijn er bij deze moeders nog enkele schalen afgenomen die later nog kort aan de orde zullen komen.

Voor de kruisvalidering zijn wederzijds de categoriekwantificaties uit de andere steekproef gebruikt, dat wil zeggen dat om de somscore van een persoon te berekenen, de score op ieder item is vervangen door de bijbehorende categoriekwantificatie uit de HOMALS analyse op de andere steekproef. Bij de steekproef moeders zijn de kruisvalidatiecorrelaties (0.88;0.86) rond .10 lager vergeleken met de correlatie (0.99) tussen de twee interne scorings varianten (Tabel 2). Bij de steekproef studenten is de enig beschikbare kruisvalidatiecorrelatie (0.94) vrijwel gelijk aan de 'interne' correlatie (0.95). Wat betreft de betrouwbaarheid zien we in de eerste plaats dat deze bij de steekproef moeders hoger (0.91) ligt dan bij de studenten (0.73; 0.87), en dat daar de HOMALS betrouwbaarheid geen enkele verbetering geeft op de al zeer hoge betrouwbaarheid van [1234].

Tabel 2. Kruisvalidatie van de Slade & Jenner Vragenlijst

Steekproef Moeders Steekproef Studenten

Scoringsvariant [1234] [HOM-m] [HOM-s] ~1234] [HOM-m] [HOM-s] [1234]

[HOM-m] 0.99 7?

[HOM-s] 0.88 0.86 0.95 0.94

Cronbach's a 0.91 0.91 0.85 0.73 ?? 0.87 Noten: Vet gedrukte waarden geven kruisvalidatiecorrelaties aan.

[HOM-m]=scores op basis van de categoriekwantifïcaties van de steekproef moeders; [HOM-s] idem voor de steekproef studenten.

(6)

De kruisvaliderende betrouwbaarheid bij de steekproef moeders is .85, hoger dan die van de oorspronkelijke [1234] codering en in de buurt van de [HOM] van de steekproef studenten. Zoals we later zullen betogen, vermoeden we dat dit een effect is van de (vermeende) grotere homogeniteit van de steekproef ten opzichte van de studentensteekproef. De corresponde-rende kruisvalidecorresponde-rende betrouwbaarheid en de correlatie tussen [1234] en [HOM-m] bij de studenten is helaas onbekend, daar de ruwe studentengegevens jammerlijk teloor zijn gegaan. De over het algemeen bescheiden toename in betrouwbaarheid van de HOMALS scores ten opzichte van de oorsponkelijke score varianten (afgezien van [1234]) doet de vraag rijzen of dit soms het gevolg is van de reeds aanzienlijke tot hoge betrouwbaarheid van de Slade & Jenner vragenlijst. Om hier een - zij het vluchtig - inzicht in te krijgen hebben we voor een aantal schalen over ouderschapsmotivatie die apart aan de moeders en hun echtgenoten waren voorgelegd dezelfde procedure als hierboven toegepast. Totaalscores werden bepaald door de itemscores op te tellen [DIRECT], HOM ALS objectscores werden berekend [HOM], de betrouwbaarheden voor beide scoringen, en de correlaties tussen de totaalscores en de objectscores werden bepaald. De resultaten hiervan staan in Tabel 3. Ter vergelijking zijn ook de reeds bepaalde waarden voor de Slade & Jenner toegevoegd.

Tabel 3. Correlaties tussen Scoringsalternatieven en Betrouwbaarheden uit Onderzoek naar Ouderschapsmotivatie Ouder Ma Ma Ma Ma Pa Pa Pa Pa Ma Pa * Schaal Affectie Normgedrag Kosten Reflectie Affectie Normgedrag Kosten Reflectie Slade & Jenner Slade & Jenner Slade & Jenner

no. items 21 16 8 5 21 16 8 5 20 20 20 Cronbach's a [DIRECT] 0.88 0.84 0.77 0.60 0.88 0.82 0.76 0.61 0.91 0.89 0.73 [HOM] 0.89 0.87 0.80 0.64 0.89 0.88 0.79 0.66 0.91 0.91 0.87 ([ Verschil 0.01 0.03 0.03 0.04 0.01 0.06 0.03 0.05 0.00 0.02 0.14 r DIRECT], [HOM]) 0.98 0.97 0.95 0.90 0.99 0.91 0.75 0.93 0.99 V 0.95 no. cases 362 373 377 381 333 362 378 379 384 384 187

Noten: *=steekproef studenten; ??=waarde onbekend.

(7)

DISCUSSIE EN CONCLUSIES

Door diverse vragenlijsten te analyseren, met name die van Slade & Jenner over de houding ten aanzien van de rol van de vrouw in de maatschappij, hebben we geprobeerd enig inzicht te verkrijgen over de vergelijkbaarheid van diverse scoringsprocedures, over hun betrouw-baardheid en hun relatie met een externe variabele. De algemene conclusie is dat de correlaties tussen de diverse scoringsprocedures dermate hoog zijn en dat de correlaties met de externe variabele zo weinig verschillen, dat het blijkbaar niet zo belangrijk is welke gewichten men aan de categorieën toekent. Dit sluit aan bij de bevindingen van Wilks (1938) die bewees dat onder zeer algemene condities (gemiddelde onderlinge correlaties positief en niet in de buurt van 0; gewichten positief en onafhankelijk van de intercorrelaties) de correlatie tussen twee gewogen lineaire combinaties naar l .00 gaat als het aantal variabelen in de lineaire combinaties groot wordt. Zoals Green (1977) opmerkt: 'The theorem says what many practitioners have found from experience: differential weighting of items has little value.' (p. 264). De eerder genoemde discussie, ook opgerakeld door Wainer (1976, 1978; Keren & Laughlin, 1976; Molenaar, 1976; Pruzek & Frederick, 1976; Rozeboom ( 1979); zie ook Gifi, 198Ib, p. 76), onderstreept dit nog eens.

Merk evenwel op dat de situatie hier iets subtieler ligt. Hier praten we niet over verschillende gewichten voor gehele items, deze blijven gelijk en we tellen ze ongewogen op, maar over verschillende gewichten die de categorieën van de items krijgen vóór de optelling. In feite zijn per item (althans voor de meeste items) de scoringen monotone transformaties van elkaar, en als zodanig hebben de verschillende scoringsalternatieven van een item meestal een redelijke positieve correlatie met elkaar, zodat daardoor het effect van differentieel wegen gering zou kunnen zijn. De kruisvalidatie laat zien, zij het niet eenduidig, dat er sprake kan zijn van kanskapitalisatie bij het gebruik van optimale categoriekwantificaties. Immers bij de steekproef moeders correleren de eigen HOMALS-scores en de scores gebaseerd op de HOMALS-kwantificaties van de studenten 0.86 tegen een 'interne' correlatie van 0.99. Bij de steekproef studenten is de kruisvaliderende correlatie echter 0.94, geheel vergelijkbaar met de onderlinge correlaties van de diverse scoringsvarianten.

De hoogte van Cronbach's a is variabeler, zowel binnen als tussen steekproeven: de coëfficiënt is sterk afhankelijk van het aantal items, meer afhankelijk van de scoringsmethode en meer afhankelijk van de steekproef. Zo is bijvoorbeeld de kruisvaliderende betrouwbaar-heid bij de steekproef moeders, gebruikmakend van de studenten categoriekwantificaties, (0.85), hoger dan menige betrouwbaarheidsbcpaling in de studentensteekproef zelf. De sterke indruk bestaat dat Cronbach's a niet alleen gevoelig is voor de interne consistentie van de vragenlijst, maar evenzeer voor inhomogeneteiten in de steekproef. Zo vermoeden wij dat de steekproef moeders homogener is dan die van de studenten, en dat dit tot uiting komt in de hogere betrouwbaarheid van de Slade & Jenner, ook voor de codering 1,2,3,4 zonder indikking. De relatief lage betrouwbaarheid (0.73) van de [1234] scoring bij de studenten is aantoonbaar het gevolg van enige uitbijters en wanneer de categorieën waarin zij scoren zijn samengevoegd met de naastliggende categorieën [INDIK] dan klimt de betrouwbaarheid naar (0.81). Een dergelijke observatie is natuurlijk niet nieuw. Lumsden (1978) schreef eens een artikel getiteld 'Tests are perfectly reliable', implicerend dat de personen er voor zorgen dat vragenlijsten niet betrouwbaar zijn.

(8)

waarbij de proefpersonen de geïmpliceerde rangorde van de antwoordcategorieën meestal als zodanig opvatten, en waar doorgaans redelijke correlaties bestaan tussen de items. Intelligentietesten die in het onderwijs gebruikt worden, vallen bijvoorbeeld ook in deze categorie. We hebben in onze vragenlijsten geen voorbeelden, waarbij de proefpersonen als groep deze ordinaliteit op zeer grove wijze schenden, en over dat soort situaties kunnen we dan ook niet veel zeggen. Ook hebben we geen informatie over situaties zoals gerapporteerd bij Van der Kloot & Brouwer (1982), die aan de hand van triaden via specifieke scoringsregels personen een score toekenden op items van de Mach-V schaal. In hun geval slaagden zij er in om met behulp van PRINCALS de betrouwbaarheid voor een 20-item schaal op te vijzelen van rond de 0.35 tot rond de 0.68. Of dit ligt aan de zeer lage betrouwbaarheid bij toch een redelijke lange schaal, is op grond van dit en hun onderzoek niet te zeggen.

Als men op basis van dit onderzoek een waarde voor de betrouwbaarheid aan de Nederlandse vertaling van de Slade & Jenner wil toekennen , die redelijk toepasbaar en (kruis)valideerbaar is, lijkt ons 0.80 een goede waarde. Al naar gelang van de homogeniteit van de steekproeven zal deze dan hoger of lager uitvallen.

Bij schaalconstructie, waar men, als het goed is, juist met een homogene verzameling items te maken heeft, kan de geciteerde literatuur als theoretische ondersteuning dienen voor de gepresenteerde empirische demonstratie dat het er niet veel toe doet welke scoringsprocedure men gebruikt om tot een somscore te komen. In ieder geval geldt voor de vragenlijst van Slade & Jenner dat men in de analyse de eenvoudigste scoringsprocedure kan gebruiken, namelijk gewoon l, 2,3,4 voor opeenvolgende categorieën.

LITERATUUR

Bakker, D. (1988). Het moeras van oorzaak en gevolg. Een onderzoek naar het effekt van de verbreding van het opvoedingsmilieu op de door ouders waargenomen veiligheid van hun kinderen. (AP Reeks, AP 88-01-SW). Doktoraalscriptie Vakgroep Algemene Pedagogiek, Rijksuniversiteit Leiden. Gifi, A. (1981a). Homals users guide. Leiden: Rijksuniversiteit, Vakgroep Datatheorie.

Gifi, A. (1981b). Nonlinear multivariate analysis (voorlopige editie). Leiden: Vakgroep Datatheorie, Rijksuniversiteit Leiden [Definitieve versie verschijnt bij Wiley].

Green, B.F. (1977). Parameter sensitivity in multivariate methods. Multivariate Behavioral Research. 12, 263-287.

Hubbard, F.O.A., Van Uzendoorn, M.H. & Tavecchio, L.W.C. (1982). Validation of a questionaire measuring attitudes toward females' social roles for a Dutch population. Psychological Reports, 51,491-498.

Keren, G., & Newman, J.R. (1978). Additional considerations with regard to multiple regression and equal weighting. Organizational Behavior and Human Performance, 22,143-164.

Laughlin, J.E. (1978). Comment on 'Estimating coefficients in linear models: It don't make no nevermind". Psychological Bulletin, 85,247-253.

Lord, P.M. (1958). Some relations between Guttman's principal components of scale analysis and other psychometric theory. Psychometrika, 23, 291-296.

Lumsden, J. (1978). Tests are perfectly reliable. British Journal of Mathematical and Statistical Psychology, 31,19-26.

Meerling (1988). Methoden en technieken van psychologisch onderzoek, Deel2(2e editie). Meppel: Boom. Molenaar, I. W. (1978). Wainer on regression, some empirical results. (Heymans Bulletins,

nr.HB-78-398-EX). Groningen: Subfaculteit Psychologie, Rijksuniversiteit Groningen.

Nishisato, S. (1980). Analysis of categorical data: Dual scaling and its applications. Toronto: University of Toronto Press.

Pruzek, R.M., & Frederick, B.C. (1978). Weighting predictors in linear models: Alternatives to least squares and limitations of equal weights. Psychological Bulletin, 85,254-266.

(9)

Slade, P. & Jenner, F.A. (1978). Questionnaire measuring attitudes to female social roles. Psychological Reports, 43, 351-354.

SPSS Inc. (1983). SPSS-X User's manual (2nd Edition).

Tavecchio, L.W.C., & Van Uzendoorn, M.H. (1987). Perceived security and extension of the child's rearing context: A parent-report approach. In L.W.C. Tavecchio & M.H. van Uzendoorn (Red.), Attachment in social networks: Contributions to the Bowlby-Ainsworth attachment theory (pp. 35-92). Amsterdam: North Holland.

Van der Kloot, W. A. & Brouwer, P. (1982). A revised scoring procedure for the Mach V scale: a rationale and some results. Gedrag- Tijdschrift voor psychologie, 10,282-293.

Wainer, H. (1976). Estimating coefficients in linear models: It don't make no nevermind. Psychological Bulletin. 83,213-217.

Wainer, H. (1978) On the sensitivity of regression and regressors. Psychological Bulletin, 85,267-273. Wilks, S.S. (1938). Weighting systems for linear functions of correlated variables when there is no

dependent variable. Psychometrika, 3,23-40. Manuscript ontvangen 11-5-1989