De kroonjuwelen : kwantitatieve modellen en methoden in verleden, heden en toekomst

(1)

De kroonjuwelen : kwantitatieve modellen en methoden in

verleden, heden en toekomst

Citation for published version (APA):

Fortuin, L., Zijlstra, M., Besselaar, H., & Groot, de, K. (1992). De kroonjuwelen : kwantitatieve modellen en methoden in verleden, heden en toekomst. (CQM monograph; Vol. 4). CQM.

Document status and date: Gepubliceerd: 01/01/1992 Document Version:

Uitgevers PDF, ook bekend als Version of Record Please check the document version of this publication:

• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.

• The final author version and the galley proof are versions of the publication after peer review.

• The final published version features the final layout of the paper including the volume, issue and page numbers.

Link to publication

General rights

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain

• You may freely distribute the URL identifying the publication in the public portal.

If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:

www.tue.nl/taverne Take down policy

If you believe that this document breaches copyright please contact us at: openaccess@tue.nl

(2)

M016493

De

Kroonjuwelen

Kwantitatieve modellen

en methoden in verleden,

heden en toekomst

Redactie

:

Leonard Fortuin

Mynt Zijlstra

Hie

k

e Besselaar

Karin de Groot

.

~

1 • •

~

···

··

·

•

(3)

De Kroonjuwelen

Kwantitatieve modellen en methoden In verleden, heden en toekomst

(4)

(5)

De

Kroonjuwelen

Kwantitatieve modellen

en methoden in verleden,

heden en toekomst

Liber amicorum voor

dr. J.PM. (Jos) de Kroon,

aangeboden ter gelegenheid

van zijn afscheid

op 11 december 1992

.

~····

···

··

···

Redactie:

Leonard Fortuin

Mynt Zijlstra

Hieke Besselaar

Karin de Groot

••

•••

• •••••

(6)

Niets in deze uitgave mag worden verveelvoudigd en/of openbaar gemaakt door middel van druk, fotokopie, microfilm of op welke andere wijze qok zonder vooraf-gaande schriftelijke toestemming van de eigenaar.

(7)

Lezer, gegroet!

door Leonard Fortuin, Mynt Zijlstra, Hieke Besselaar en Karin de Groot

Op 1 december 1979 werd aan het toen nog stevige Philips-bolwerk een stafafdeling toegevoegd met een geheel nieuw karakter. Verlangd werd namelijk door "hogerhand" dat die afdeling kosten-neutraal zou gaan werken door betaalde opdrachten uit te voeren. Dit

Centre tor Quantitative Methods ontstond doordat Cor-porate ISA en de Centrale TEO, twee stafdiensten met een lange geschiedenis binnen het Gloeilampenconcern, hun capaciteit en activiteiten op het gebied van kwantita-tieve methoden bundelden. Sedertdien opereert het CQM als competence centre op dit vakgebied.

Dat het CQM inderdaad aan het werk kon gaan, is te danken aan de visie en vasthoudendheid van één man: Dr. J.P.M. de Kroon, bij velen ook bekend als Jos, bij sommigen als "de chef". Tegen alle verdrukking in, want de twijfel aan de levensvatbaarheid van het CQM was groot in den beginne, heeft hij het CQM opgericht en er een succesvol adviesbureau van gemaakt. Eerst gebeur-de dat door potentiële klanten uit te leggen wat voor geweldige hulp het CQM hen zou kunnen geven, kort daarna door benarde managers te vertellen van met succes uitgevoerde projecten. Veel nieuwe opdrachten kwamen tot stand op de tennisbaan.

Het CQM groeide en kreeg weldra de wind in de zeilen.

Als een kapitein stond Jos op de brug, om klippen en zandbanken te vermijden. Een bekwame bemanning voerde enthousiast zijn bevelen uit. Stormen staken op en ook de Orkaan Centurion kwam voorbij. Jos stuurde zijn CQM er doorheen zonder veel averij.

Zo'n man dient bij zijn vertrek geëerd te worden met een

liber amicorum, een vriendenboek gevuld met bijdragen van mensen die hem een warm hart toedragen en bereid zijn dat te bewijzen door pen of"tekstverwerker ter hand te nemen. Het spreekt vanzelf dat voor een boek van zoveel historisch belang het schrijverscollectief met zorg gekozen diende te worden. De keus viel op vakgenoten en oud-vakgenoten van de scheidende functionaris. "De

(8)

rol van kwantitatieve modellen en methoden in onze wereld, in het verleden, nu en in de toekomst" werd het thema waarmee de "Kroongetuigen" aan de slag zijn gegaan.

Het aantal bijdragen is verheugend groot, gezien de niet geringe aanslag op vrije en andere tijd. De verscheiden-heid in vorm en inhoud, in stijl en toènzetting stemt ons hoopvol over de toekomst van cultuur en wetenschap in ons vader- en moederland. Doorwrochte beschouwingen met een streng-wetenschappelijk karakter bereikten onze burelen, maar ook luchtiger proza en zelfs poëzie. Uit praktische overwegingen hebben wij de bijdragen opge -nomen in volgorde van binnenkomst1

•

Het resultaat is een schitterende verzameling Kroon-juwelen, met als ondertitel "Kwantitatieve modellen en

methoden, in verleden, heden en toekomst". Over de inhoud kan gecorrespondeerd worden. Als lezing Jos de Kroon plezier geeft, dan is ons doel bereikt. Als de bun-del ook anderen een ogenblik van lering of vermaak verschaft, dan is dat mooi meegenomen. De "Kroongetui-gen" zijn wij zeer dankbaar voor de wijze waarop ze onze uitnodiging hebben aanvaard.

De redactie

Met dank aan Frans Nijenhuis voor de hulp bij het afdrukken van de computerbestanden.

(9)

Inhoud

1. Wie graag Jos de Kroon

(A.H.G. Rinnooy Kan) . . . 1 2. Proefopzetten, een gereedschap voor de

bedrijfsleiding (P.M. Upperman) ... .... 3 3. De Kroon op het Werk

0/V.

Schaafsma) ... .... 9 4. De zaak van de ontbrekende kroongetuige

0/V.

Albers) ... .. ... ... .... ... . . 15 5. Halverwege de vijftiger jaren (G.J. Leppink) 23 6. On the number of first-rate statisticians

(F.W. Steutel) ... ... ... 25 7. Beslissen met statistische selectiemethoden

(P. van der Laan) . .. ... .. ... 31 8. Operations Research methods in the hands

of their masters (F.A. Lootsma) ... ... .. .... 47 9. Jos de Kroon en het 1 ntern Overleg (A. Trip) . . . 59

1 O. En De Kroon, hij adviseerde voort

0/V

.

Molenaar) .. .. ... .. ... .... .. .. .. 65 11. Wijsheid en voorraden (B. van der Veen) . . . 73 12. De Drie Gratiën of: De Schone Helena en

Haar Lelijke Zusters? (J. Wessels) . . . 77 13. In vino veritas? (l. Fortuin) ... . .... 89 14. Zit er nog rek in de handelsreiziger?

(E.H.L. Aarts en P.J.M. van Laarhoven) ... . .. 99 15. Managers, miskleunen en KM (P. van Beek) .. 109 16. Een voorbeeld van een weinig aannemelijke

(10)

17. De Kroon verdwijnt van het werk

(P.C. Sander) . . . . . . . . . . . . . . . . . . . . . . 119 18. Pleitbezorger voor kwantitatieve methoden

(L. Hoving) . . . . . . . . . . . . . . . . . . . . . 123 19. Een innemende man (T.J. Terpstra) . . . . . . 129 20. Discussie over parapsychologie in 1966

(C.L. Scheffer) . . . . . . . . . . . . . . . . . . . 131 21. Een overpeinzing bij het afscheid van

Jos de Kroon (E.M. de Jager) . . . . . . . . 135 22. Statistica! mis - modeling (R. van Strik) . . . . 139 23. Het behendigheidsniveau van Black Jack in

Holland Casino's (B.B. van der Genugten) . . . 143 24. Produktiebesturing in een gemengd order- en

voorraadgestuurde omgeving: een toepassing van dynamische programmering

(W.H.M. Zijm) . . . ... 155 25. Combinatoriek op zondagmiddag

(H.A. Fleuren) . . . . . . . . . . . . . . . . . . . . . . 169 26. De Kroon, procesbeheersing en Kwantitatieve

Methoden (P. Banens) . . . . . . . . . . . . . 177 27. De opleiding tot industrieel statisticus

(R.J.M.M. Does) . . . . . . . . . . . . . . . . . . . 183 28. Over cols, PSV en indexcijfers (M. Hasselaar,

J. Oudemans en B. Schriever) . . . . . . . . . . . . 191 29. Produktieplanning in praktijk en theorie

(C.P.M. van Hoesel, C.A.J. Hurkens,

J.K. Lenstra en M.W.P. Savelsbergh ... .... 201 30. Lof der schoonheid (A.G. de Kok) . . . . . . . . . 213 31. Over voorspellingsmodellen en de

verzelf-standiging van CQM (J. Engel) . . . . . . . . . . . . 221 32. Och, heden ja! (M. Zijlstra) . . . .. 227

(11)

33. Design and analysis of international distribution networks

(J.B.M. van Dorernalen) . . . . . . . . . . . 235 De Kroongetuigen . . . . . . . . 249 De Kroon getuigt ... ... .. ... ... 253

(12)

1. Wie graag

Jos de Kroon

door Alexander Rinnooy Kan

Wie graag Jos de Kroon voor zijn werk wil belonen zal daarmee het werk van De Kroon dus bekronen en zet daarmee dan -dat is zeer ongewoon -met één klap de kroon op het werk van De Kroon. Hij creëert CQM op geheel eigen kracht

en het wordt een succes dat geen mens had verwacht. De kroon op het werk van De Kroon's vele jaren is dat het op eigen kracht verder kan varen.

(13)

2. Proefopzetten, een

gereedschap voor de

bedrijfs 1

ei ding

door P.M. Upperman

2.1 Inleiding

Het vak proefopzetten heeft al jarenlang mijn grote be-langstelling. Hoewel er een groot aantal boeken en arti-kelen op dit terrein zijn gepubliceerd, ben ik van mening dat men er onvoldoende in is geslaagd de bedrijfsleiding duidelijk te maken dat het vakgebied een belangrijke bijdrage kan leveren tot een meer rendabele bedrijfsvoe-ring. In deze publikatie wordt een poging gedaan om de kloof tussen het vak proefopzetten en de toepassing ervan door de bedrijfsleiding enigszins te verkleinen. Het risico dat deze bijdrage als mosterd na de maaltijd komt, neem ik op de koop toe.

De uiteenzetting bestaat uit drie delen. Eerst wordt een algemene beschouwing gegeven over het vakgebied. Vervolgens wordt een toepassing behandeld en tenslotte zal iets over de organisatie van een experiment worden gezegd.

2.2 Algemeen

Kwaliteitskenmerken van een produkt of proces worden door veel factoren beïnvloed. De lichtopbrengst van een gloeilamp hangt bijvoorbeeld af van de dikte van de spiraal, de spoed van de wikkeling, de diameter van de wikkeldoorn, de gasvulling, enz. De kwaliteit van een soldeerverbinding wordt beïnvloed door de temperatuur van het soldeerbad, het type flux, de soldeersnelheid en dergelijke. De kwaliteit van een spuit-gietprodukt is af-hankelijk van factoren als matrijs-temperatuur, holtedruk, materiaalsoort, etc.

Soms, zoals in het geval van de gloeilamp, zijn de me-chanische, chemische en fysische modellen tamelijk goed bekend zodat men, gegeven de spiraaldikte, spoed,

(14)

diameter wikkeldoorn en gasvulling de lichtopbrengst kan voorspellen. In veel andere gevallen zijn deze slechts ten dele of helemaal niet bekend. Eén van de redenen waar-om afdelingen research en ontwikkeling experimenteel onderzoek doen is dan ook om die modellen te leren kennen. Bovendien gelden veel fysische wetten alleen in ideale omstandigheden, zoals perfecte maatvoering, zuivere grondstoffen, geen gereedschapslijtage, geen temperatuurgradiënt in de oven en dergelijke. Vaak is uitgebreid experimenteel onderzoek noodzakelijk om het effect van afwijkingen van de ideale toestand vast te stellen.

Een schrikbeeld voor iedere manager, maar een ver-schijnsel dat helaas nog al te vaak voorkomt, is dat er in een goed lopend produktieproces zeer ernstige kwali-teitsproblemen optreden, waarbij men in korte tijd van een proces met nauwelijks uitval terecht komt in een situatie met zeer veel uitval, dat soms tientallen procen-ten bedraagt. Omdat er dan zelden gebrek is aan menin-gen, helaas niet altijd gebaseerd op zorgvuldig verzamel-de metingen inzake verzamel-de oorzaak van verzamel-de kwaliteitsproble-men, worden er vaak grote aantallen kleine proeven uitgevoerd, waarbij men de ene factor na de andere onderzoekt.

Het behoeft geen betoog dat deze aanpak wel kostbaar maar niet gestructureerd is. Ze leidt dan ook meestal niet tot de oplossing van de kwaliteitsproblemen. Het is bo-vendien niet ongebruikelijk, indien men zo bezig is, dat

•: de kwaliteitsproblemen even geruisloos verdwijnen als ze

· i. zijn gekomen. Hoewel dit laatste op zich genomen erg

''prettig is, kan de hoge uitval elk moment opnieuw optre-den, aangezien de fundamentele oorzaken ervan niet opgespoord en weggenomen zijn. Het proces is onvoor-stelbaar onvoorspelbaar geworden.

Uit het bovenstaande is duidelijk geworden dat het vak uitgeoefend door research, ontwikkeling en afdelingen die zich bezighouden met het oplossen van kwaliteits-problemen minstens één gemeenschappelijk doel heeft, namelijk het kennen en bepalen van mechanische, che-mische en fysische modellen. Indien research en ont-wikkeling hun taak echter goed vervullen, met andere woorden een grondig inzicht verkrijgen in de bovenge-noemde modellen, zal het zelden of nooit voorkomen dat zich naderhand onverwachte kwaliteitsproblemen in de fabricage voordoen.

(15)

Het vak proefopzetten, een onderdeel van de toegepaste statistiek, is een uitstekend hulpmiddel om deze model-len te leren kennen. Het is daarom uitermate belangrijk dat dit gereedschap niet alleen bij het oplossen van kwaliteitsproblemen maar vooral ook in research en ont-wikkeling wordt gebruikt, opdat naderhand kwaliteitspro-blemen in de fabricage worden voorkomen. Het is in dit verband veelbetekenend dat de Japanner G. Taguchi spreekt van "Off-line quality control', hetgeen onder andere de toepassing van proefopzetten bij research en ontwikkeling inhoudt.

Men kan proefopzetten definiëren als een experimentele strategie om het effect van factoren of variabelen op kwaliteitskenmerken vast te stellen, zodanig dat men een minimum aan inspanning gebruikt om een maximum aan informatie uit experimenten te verkrijgen. Het uiteindelijke motief om proefopzetten te gebruiken is dat de toepas-sing ervan tijd en geld bespaart, want het is een onmis-baar gereedschap in kwaliteits- en procesbeheersing, bij het oplossen van opbrengst-problemen in de produktie en het verbetert ook het rendement van fundamenteel onderzoek en ontwikkeling.

In de volgende paragraaf zal aan de hand van een voor-beeld worden aangetoond dat het gebruik van proefop-zetten tot grote kostenbesparing kan leiden en aldus in belangrijke mate tot het rendement van de onderneming bijdraagt.

2.3 Een toepassing van een proefopzet Probleemstelling

Een bepaald produkt vertoonde grote variatie in de ge-middelde waarde van een zeker kwaliteitskenmerk. Deze variaties waren zodanig groot dat er niet alleen uitval optrad, maar zich ook regelmatig klantenklachten voor-deden. Daarom werd besloten een diepgaand onderzoek in te stellen.

Onderzoek en analyse

Het produktieproces bevat een groot aantal stappen, maar op advies van ontwikkeling besloot men zich op een deel van het fabricageproces te concentreren. In een bepaalde fase van het produktieproces moest dit produkt geëtst worden en hierna werd een zeer dunne metaallaag aangebracht. Om allerlei redenen, die we hier

(16)

niet uitvoerig zullen behandelen, werd in samenwerking met medewerkers van de afdelingen ontwikkeling, kwali-teit en produktie, besloten een tweetal etstijden en twee metaalopdampklokken te onderzoeken. Om de nauwkeu-righeid van het experiment te verhogen werd besloten het experiment vier keer op vier verschillende dagen te herhalen.

Aangezien bekend was dat de standaardafwijking van het betrokken kwaliteitskenmerk groot was, werden voor elk van de zestien "cellen" circa honderd produkten gemaakt en gemeten. Het gemiddelde van deze metin-gen is gegeven in elke "cel" van tabel 1. Het getal

rechtsonder in elke "cel" geeft de volgorde aan waarin de zestien experimentele eenheden worden gemaakt.

Etstijd 3 23

Dag minuten minuten

van de Metaal- 1 Il 1 Il week opdampklok 01 22.3 26.6 22.0 22.7 3 4 1 2 02 16.1 12.6 13.9 14.0 6 8 5 7 03 11.6 11.0 8.4 8.4 10 11 9 12 04 13.2 14.8 11.7 9.4 15 16 14 13

Tabel 1. Ets- en metaalopdampexperiment

Deze volgorde is voor elke dag willekeurig om te voor-komen dat systematische tijdseffecten samenvallen met verschillen tussen metaalopdampklokken of etstijden. Wanneer we de gegevens van tabel 1 analyseren, vin-den we een klein effect van etstijd maar grote verschillen tussen dagen. Het laatstgenoemde effect was onver-wacht maar zeer belangrijk, omdat het aangeeft dat er een onbekende factor is die een groot effect heeft en waarvan de instelling veranderde gedurende de vier dagen waarin het experiment werd uitgevoerd. In samen-werking met verschillende afdelingen zoals ontwikkeling, kwaliteit, produktie en statistiek, werd er een werkgroep gevormd met de opdracht deze onbekende factor te vin-den. Gedurende een periode van verschillende maanden

(17)

werden er toen experimenten uitgevoerd en deze aanpak leidde tenslotte tot succes.

Oplossing

Uit deze experimenten bleek dat de hoeveelheid pasta, die gebruikt wordt om een dunne draad op het produkt te bevestigen zeer kritisch was. Vervolgens nam men maat-regelen om deze hoeveelheid exact te doseren met als gevolg dat de uitval tot vrijwel 0% werd gereduceerd, waardoor de klantenklachten tot het verleden behoorden en een kostenbesparing van vele tienduizenden guldens op jaarbasis werd gerealiseerd.

2.4 De organisatie van een experiment

Experimenten zijn niet alleen essentieel voor fundamen-teel onderzoek en ontwikkeling, maar ze zijn ook tijdro-vend en duur. Het is daarom niet verrassend dat veel bedrijven veel geld hebben geïnvesteerd in laboratoria en apparatuur waarin en waarmee hoog opgeleide mede-werkers hun taak uitoefenen.

In de voorafgaande paragrafen is getracht duidelijk te maken dat de toepassing van statistische principes bij het opzetten van proeven net zo belangrijk is als het hebben van een goed uitgerust laboratorium.

Goed opgezette experimenten zijn het resultaat van een intensieve samenwerking tussen onderzoekers en statistici of personen met een gedegen kennis van proef-opzetten. Het is essentieel dat elke betrokkene zijn of haar professionele kennis volledig gebruikt. De onderzoe-ker gebruikt z'n vakmanschap om de geschikte factoren en bijbehorende niveaus te kiezen. De statisticus kan hulp bieden betreffende de keuze van een proefopzet, verloting, de blokindeling, aantal experimentele eenhe-den, statistische analyse, enz.

Er dient een rapport over het uit te voeren experiment te worden geschreven. Dit rapport dient alle mogelijke details te bevatten, zoals de proefopzet, factoren, ni-veaus, verlotingsprocedure, het wiskundige model van de

waarnemingen, etc. ·

Dit rapport dient aan alle betrokkenen te worden toe-gezonden voordat het experiment begint.

De ervaring heeft aangetoond dat een rapport over een proefopzet heel vaak ideeën genereert om de opzet te verbeteren, waarna deze kan worden aangepast. Het is ook voorgekomen dat de bespreking van en de discussie

(18)

over een opzet zoveel ideeën voor verbetering oplever-de, dat kwaliteitsproblemen werden opgelost voordat het experiment werd uitgevoerd!

Een rapport met een beschrijving van een proefopzet structureert het desbetreffende probleem, verzekert een succesvolle samenwerking tussen verschillende afdelin-gen en disciplines en zal alle betrokkenen motiveren, omdat de opzet het resultaat is van hun werk aan een uitstekende experimentele strategie.

Beste Jos,

Het was voor mij een aangename verrassing dat de redactie van het vriendenboek mij uitnodigde aan deze publikatie een bijdrage te leve-ren. Zoals je gezien hebt behandelt mijn bijdrage, hoe kan het ook

anders, een aspect van proefopzetten. Ongetwijfeld zul je de "case" die

ik beschreven heb, herkennen.

Op het moment dat ik deze zinnen opschrijf, denk ik met veel genoe-gen terug aan de vele goede contacten die we hadden en aan de discussies die we over proefopzetten en de daarbij behorende ana-lyses hebben gevoerd.

Eén bepaalde uitspraak van je heb ik altijd onthouden, nl. "Variantie-analyse is eigenlijk niets anders dan de stelling van Pythagoras". Deze zin sprak mij bijzonder aan, omdat ik toen inzag dat het verschil tussen geodesie, mijn oorspronkelijke vakgebied, en de toegepaste statistiek minder groot was dan ik dacht.

Gaarne gebruik ik deze gelegenheid om mede namens Jenny, jou,

Femmy en jullie dochters met hun gezinnen vele goede jaren toe te wensen. Dat de aangename dingen des levens, zoals in het bijzonder de muziek en vele PSV-overwinningen hiertoe een belangrijke bijdrage

mogen leveren, wens ik je van harte toe.

(19)

3. De Kroon op het Werk

door Willem Schaafsma

3.1 Inleiding

Bij allerlei gepieker en gepeins, gepraat en gedoe vervalt men van de ene onzekerheid in de andere. Je kunt pro-beren daar iets aan te doen door data te verzamelen en in de beschouwing te betrekken, door kwantitatieve mo-dellen te maken, enz. Sommige onzekerheden verdwij-nen dan als sneeuw voor de zon, maar voor andere geldt dat niet. Ook ontstaan nieuwe onzekerheden, namelijk bij het ontwikkelen van de kwantitatieve methoden om de data in ogenschouw te kunnen nemen.

Vaak gaat dat ietwat primitief: men toetst wat, men schat wat en verwoordt dat in een verhaaltje. De "wis"kundigen van onzekerheid hebben de taak dit gedoe te perfectio-neren. Zij zouden de kroon op het werk moeten zetten door een superieure vlijmscherpe analyse te geven. Bij de meeste van deze "statistische discussies" is het ech-ter niet enkel goud wat er blinkt. Er vinden bijmengingen plaats omdat het echte goud, de verzameling data, on-toereikend en wormstekig is. Soms is er eigenlijk hele-maal geen goud aanwezig maar enkel een hoopje roes-tige spijkers.

Maar kom, dit is niet de juiste gelegenheid om een zwaarwichtig en naargeestig betoog te houden over de beperkingen van de statistiek. Beter is het Jos te ple-zieren met een eenvoudig en concreet geval.

3.2 Een controverse uit Science

Een statisticus heeft klanten nodig zoals een vampier mensenbloed. Mijn interessantste klant is de fysisch antropoloog Van Vark. Het geval dat ik nu ga bespreken komt bij hem vandaan.

Mag uit de aanwezige "steekproef" gegevens (over roes-tige spijkers gesproken!) worden geconcludeerd dat de Levantijnse laat-Pleistocene menselijke populatie een

(20)

grotere biologische variatie heeft vertoond dan de heden-daagse mens? De antropoloog Wolpoff heeft recentelijk in Science beweerd dat de Levantijnen onderling niet significant meer verschillen dan gebruikelijk bij één popu-latie (bijv. "Detroit") en dat daarvan de Levantijnen niet verder hoeven te worden onderverdeeld.

Van Vark en zijn collega Bilsborough (Durham, U.K.) zijn in de pen geklommen om Wolpoff op ietwat neerbuigen-de wijze te vertellen dat hun "multivariate" analyses anders uitwezen. Wolpoff reageerde daar weer op met een vergelijking van 13 Levantijnen met 388 Londenaren uit de 17e en 18e eeuw en met een herhaling van stand-punten.

Wat is de kern van deze controverse? Is het het verschil tussen de bevolking van Detroit of Londen die Wolpoff hanteerde en de hedendaagse wereldbevolking die er bij Van Vark en Bilsborough achter zit? Is het het verschil tussen univariate en multivariate analyses? Dat Wolpoff soms wat eenzijdig redeneert is duidelijk. Maar het is ook duidelijk dat hij geheel gelooft in zijn stellingname. Zou er bij mijn klant Van Vark en zijn collega iets mis kunnen zijn? Van hun beschrijving van de hedendaagse wereld-bevolking heb ik een paar bouwstenen aangedragen. Ook voor hun multivariate toetsing draag ik enige verant-woordelijkheid. Heb ik mijzelf iets te verwijten? Valt hier niet iets te leren? Mijn analyse van de controverse is als volgt.

Hoe Wolpoff zijn analyse uitvoerde is duidelijk, hoewel ietwat ongebruikelijk. Hij vergeleek voor elk van 14 varia-belen de range van de 13 Levantijnen met die van 388 Londenaren. Steeds hadden de Levantijnen de kleinste range, zelfs als de grootste en de kleinste scores bij de Londenaren werden weggelaten. Dat vormde voor Wolpoff de aanleiding om de Levantijnen tot "niet hetero-gener dan Detroit of Londen" te verklaren.

Hoe Van Vark en Bilsborough hun analyses uitvoerden is ook duidelijk. Zij gebruikten de variantie-covariantie-matrix ~ van de hedendaagse wereldbevolking als maat-staf. Dat ding is door Van Varken zijn medewerkers berekend uit Howells' (Harvard) beroemde data set, een soort gestratificeerde steekproef uit de hedendaagse wereldbevolking. De matrix 1: die Van Varken

(21)

werkelijke matrix. Men moet daarbij weten welke fracties van de populatie door de diverse strata worden gerepre-senteerd. Daarbij treden enige moeilijkheden op. Howells zelf had bijvoorbeeld kritiek op het oorspronkelijke voor-stel om die fracties aan de hedendaagse wereldbevolking te ontlenen. De Chinezen krijgen dan een groter gewicht dan ze volgens Howells dienden te krijgen als men in de oorsprongspopulatie is geïnteresseerd.

Natuurlijk zijn er verschillen tussen Detroit of Londen en de hedendaagse wereldbevolking. Maar ik geloof toch niet dat daar de oorzaak van de controverse ligt. Van Vark liet mij zijn data zien en daarbij bleek dat, evenals bij Wolpoff, sommige variabelen bij de Levantijnen een kleinere spreiding hadden (in één geval zelfs een statis-tisch significant kleinere spreiding) dan bij de heden-daagse wereldbevolking. Bij andere variabelen (1 O van de 14) was het omgekeerd.

Welke 11

multivariate11

analyse hebben Van Vark en Bilsborough precies uitgevoerd om zichzelf ervan te overtuigen dat het samenvattend oordeel moet zijn dat de Pleistocene Levantijnen een statistisch significant

grotere biologische variabiliteit vertonen? Ze werken niet met de oorspronkelijke (p) variabelen maar met een kleiner aantal (q) eruit gedestilleerde gestandaardiseerde principale componenten. Die worden berekend op grond van de matrix L en hebben dus de variantie-covariantie-matrix lq voor de hedendaagse wereldbevolking, tenmin-ste als we L voor waar aannemen. Bij de Levantijnen komt daar natuurlijk niet precies lq uit, maar iets anders, zeg rq. De toets die Van Varken Bilsborough gebruiken en voor welk gebruik ik medeverantwoordelijk ben, is een toets om de nulhypothese H₀: rq

=

lq te toetsen. Daar zit

weer het volgende achter.

Van Vark en zijn medewerkers beleven plezier aan het berekenen van allerlei Mahalanobis afstanden tussen individuen. Omdat bij de principale componenten de variantie-covariantie matrix precies lq is, is de

Mahalanobis afstand niet~ anders dan de Euclidische afstand tussen de vector van p.c. scores van het ene individu en die van het andere. Als toetsgrootheid sugge-reerde Van Vark de som van de kwadraten van de on-derlinge afstanden tussen de

n

Levantijnen. Een beetje herschrijven leert dat dat hetzelfde is, op een constante na, als de som van de steekproefvarianties van de

q

(22)

p.c.'s. Zo ontstaat natuurlijk een heel eenvoudige ~

toets voor de nulhypothese Ha: rq

=

lq. Met q(n-1) vrij-heidsgraden, natuurlijk. Had Van Vark niet de som der kwadraten genomen, maar de som der onderlinge afstan-den zelf (een soort multivariaat analogon van Gini's

mean difference) of had hij de som van de standaard-deviaties genomen in plaats van de varianties, enz., dan was de verdeling onder H_{0 :}

r

q

=

lq lang niet zo mooi geweest als nu. Dus over die alternatieve mogelijkheden niet gezeurd. De data van Van Vark en Bilsborough waren zo dat (als q minstens 3 of, soms, 4 is) Ha beslist moet worden verworpen. De rechteroverschrijdingskans van de waargenomen uitkomst in de ~(n-

1

> verdeling was zo verschrikkelijk klein dat Ha : ra

=

lq niet waar kan zijn. Van Vark en Bilsborough concluderen hieruit dat de bio-logische variatie bij de Levantijnen klaarblijkelijk groter is dan bij de hedendaagse wereldbevolking.

Maar wat is dat eigenlijk, die biologische variatie? Van Vark en Bilsborough hebben dat begrip geoperationali-seerd door de som van de kwadraten van de onderlinge afstanden te nemen of, wat op hetzelfde neerkomt, de som van de varianties van de p.c.'s. Dat had natuurlijk ook anders gekund. Zij hadden ook het produkt van die varianties kunnen nemen, of de determinant van de steekproef-covariantie-matrix, de zogenaamde gegene-raliseerde variantie. Dat maakt natuurlijk wel iets uit. Maar wat wellicht belangrijker is, is dat de door Van Vark en Bilsborough gekozen definitie van biologische variatie inhoudt dat zij niet hadden moeten kijken naar Ha :

r

q

=

lq, dat die niet deugt dat verbaast niemand, maar naar de nulhypothese H: spoor (r q)

=

q. (Onder het spoor van een matrix verstaat men ae som van de diagonaal ele-menten). Zij horen zichzelf en mij eigenlijk te kwellen met de vraag of het spoor van

rq

kleiner is dan q of groter dan

q.

De bijbehorende nulhypothese H is echter veel groter dan de onrealistische nulhypothese Ha. De ~ toets die werd uitgevoerd was van het juiste niveau voor

Ha maar niet voor de meer relevante nulhypothese H.

Hoe H zou moeten worden getoetst heb ik niet hoeven uitzoeken 1 want Van Vark en zijn geleerde collega leg-gen de prioriteit bij het bestrijden van hun opponent. Zij beschouwen zo'n statistische discussie rondom H mis-schien nog wel als de kroon op het werk, maar dan als een soort doornenkroon. Nu heb ik er ook weinig zin in om dat ding met al die roestige spijkers op mijn hoofd te

(23)

zetten. Vandaar dat ik het geval bij dezen aan Jos aan-bied.

1

Anders zou ik eerst proberen Van Vark en zijn collega ervan te over-tuigen dat het toetsen van H1 : determinant (r

J

=

1 op vrijwel hetzelfde neerkomt. Daar is dan weer iets gemakkelijks voor; niet zo gemakkelijk als die eerdere >f toets, maar toch. De stand van zaken is thans zo dat Van Vark, na dit verhaal te hebben gelezen, voorkeur heeft voor de determinant boven het spoor omdat hij het een nadeel vindt van het spoor dat de buiten-diagonaal elementen niet meedoen. Maar mis-schien is het werken met het multivariate analogon van Geni's mean difference nog leuker vanwege de robuustheid ervan.

(24)

4. De zaak van de

ontbrekende

kroon-getuige

door W. Albers

Als thema heeft de redactie gekozen: "De rol van kwantitatieve modellen en methoden in onze wereld in het verleden, nu en in de toekomst". Deze keuze is geïnspireerd door de conclusie dat Jos de Kroon voort-durend en onvermoeibaar heeft geijverd voor de erken-ning van de rol van deze methoden. Graag wil ik mij bij deze conclusie aansluiten en naar ik hoop en vrees, geldt dit voor velen met mij. Dat ik dit hoop, behoeft geen toelichting; dat ik het vrees, misschien wel. Welnu, deze verwachte algemene instemming met genoemde conclu-sie zou licht kunnen leiden tot nogal eensgezinde en daarom vrij eensluidende bijdragen. Om deze reden kies ik er in mijn reactie voor om slechts een zeer klein facet van het onderwerp te belichten, zo klein dat er bijna sprake is van een nulverzameling. De kans op overlap met andere bijdragen hoort hiermee, zoals wij allen beroepshalve weten, op doeltreffende wijze tot vrijwel nul te zijn gereduceerd.

De redactie roept ons op ook eens het quasi-weten

-schappelijke genre te beoefenen (hierbij overigens voor-bijgaand aan het feit dat velen van ons wellicht niet anders gewend zijn, maar dit terzijde). Een dergelijke oproep verdient honorering en daarom zal ik mijn betoog met ongebruikelijke zorgvuldigheid opzetten. Eerst zal ik mijn bijna-nulverzameling in algemene zin beschouwen, om vervolgens in het tweede deel van mijn verhaal over te gaan tot een speciaal geval. In de zo ontstane dubbel-nulverzameling spitst het betoog zich dan toe op mijn persoonlijke contacten met Jos. Hoewel, juist in het gegeven voorbeeld zou beter gesproken kunnen worden over het ontbreken van persoonlijk contact. Maar hier-over later meer ""

(25)

Uitgangspunt op weg naar mijn zeldzame gebeurtenissen is het genoemde onvermoeibare ijveren van Jos om kwantitatieve methoden ingang te doen vinden. Van groot belang hierbij is om het begrip van en voor deze methoden bij de beoogde gebruikers te bevorderen. Obstakels die dit begrip belemmeren, dienen met kracht bestreden te worden. Zo kon (en neem ik aan, kan) Jos zich behoorlijk boos maken over verhullend taalgebruik. 1 n het voorwoord voor de Statistische Dag van 1987

merkt hij op: "De wijze waarop reeds thans woorden als significant, optimaal en suboptimaal in gezwollen hoog-van-de-toren zinnen of on-zinnen voorkomen is - althans in mijn perceptie - ronduit weerzinwekkend. Om over het woord 'integraal' nog maar te zwijgen. Laten we het gebruik van onze vak-kretologie beperkt houden tot eigen kring ... ". Strijdlustig meldde hij in de bestuursvergadering waarop hij het voorwoord inleverde: "En zet er maar rustig mijn naam onder!" (Tot dan toe was het voorwoord meestal anoniem).

Het is dus geheel in de geest van Jos om ons druk te maken over de vraag of onze fraaie methoden wel over-komen bij de gebruiker. Ik beperk me hierbij verder tot mijn eigen terrein binnen de kwantitatieve methoden,

namelijk de statistiek. Eén van de begripsmatige obsta

-kels bij uitstek is hier de onzekerheid. Het is en blijft moeilijk klanten uit te leggen dat de voorgeschotelde oplossingen waarschijnlijk goede procedures en/of cor-recte beslissingen opleveren, maar dat dit helaas niet zeker is. Hoe onzeker iets is kunnen we meten, maar zeker valt niets te weten! Zelfs al zou de WS deze laatste spreuk op grote schaal als relatiegeschenk in de vorm van een wandtegeltje verspreiden, dan nog vrees ik dat we keer op keer zullen moeten blijven uitleggen waarom er sprake is van ongrijpbare zekerheid, c.q. van een zekere ongrijpbaarheid. En als het dan al lukt om een gepast gevoel van onzekerheid op de gebruiker over te dragen, dan is het nog maar de vraag of dit op de juiste plaats terecht komt. Hoe vaak zien we bijvoorbeeld niet dat onze onvolprezen onbetrouwbaarheid a opgevat wordt als de kans dat de nulhypothese onwaar is!

Maar toch, met moed, beleid en betrouwbaarheid valt hier uiteindelijk nog veel te bereiken. Er blijven echter zwarte gaten in het gekweekte begrip over en op één daarvan wil ik mij verder concentreren. Het betreft hier

(26)

gelukkig een zeldzaam verschijnsel, vandaar de verwij-zing naar nulverzamelingen in mijn inleiding. Deze zeld-zaamheid draagt er overigens wel toe bij dat het betref-fende fenomeen met ongeloof en onbegrip tegemoet ge-treden wordt. Ik doel hier op het verschijnsel dat een statistische procedure de raadselachtige eigenschap kan bezitten dat deze soms tot een onzinnige, of tot helemaal geen oplossing blijkt te geraken. Men kan er over twisten welk van de twee ontsporingen het ergst is, maar dat ze beide ongewenst zijn lijkt buiten kijf. De mathematisch-statisticus redt zich uit het dilemma door er op te wijzen dat "soms" echt ontzéttend soms is, in de zin dat de bijbehorende kans exponentieel klein is, zodat we ons daar niet druk over hoeven te maken. De formalist wijst er fijntjes op dat een procedure die zulk gedrag kan vertonen, niet deugt en dus vermeden dient te worden. Toch zijn deze remedies niet echt bevredigend in de praktijk. Het blijft pijnlijk een klant te moeten vertellen dat er een kansje, hoe klein dan ook, bestaat dat hij/zij maar iets moet invullen - wat doet er niet toe - omdat de pro-cedure even niet meewerkt. En het uitsluiten van de procedure is ook wat precair als deze in allerlei opzichten optimaal is en duidelijke alternatieven geheel ontbreken. Na deze bespiegelingen wordt het waarschijnlijk hoog tijd om wat voorbeelden aan te dragen, in een poging de lezer ervan te overtuigen dat het hier bijna, en niet hele-maal, een nulverzameling betreft. Een eerste voorbeeld, uit respectabele bron, ontleen ik aan Lehmann (1983), blz. 114. Hij geeft hier aan hoe het principe van zuiver-heid tot problemen kan leiden. Bij een N(;,a2)-verdeling hebben we voor ;2 de UMVU-schatters

X:

2 - a2/n bij

be-kende a en

X:

2 -S2/n bjj onbekende a, waarin

X

en S2 respectievelijk het steekproefgemiddelde en de steek-proefvariantie zijn. Maar beide schatters kunnen negatie-ve waarden aannemen, hetgeen voor een niet-negatienegatie-ve parameter zoals ;2 nogal onzinnig is. Beschouw als tweede voorbeeld drie varianties, gerelateerd via

a;

=

cf,

+ ~· Als er zuivere schatters

CT;

en

CT;

voor res-pectievelijk ~ en

a;

ziin, kan

cf,

zuiver geschat worden door middel van

if,

=

ö; -

~· Ook

if,

kan echter weer negatief worden. Wat een flauwe voorbeelden, hoor ik u denken. Offer in dit soort gevallen de zuiverheid op en gebruik bijvoorbeeld (if,f = max(O,if,) als schatter voor

cf,,

dan zitten we weer keurig in de toegestane

verzame-ling. Maar stel nu dat 0₁voorkomt in de noemer van een beoogde toetsingsgrootheid. Zie Albers (1978) voor een

(27)

echt, maar wat ingewikkelder voorbeeld van dit type. Dan moet er • studentization'' toegepast worden, dat wil zeg-gen

a,

moet door een schatter vervangen worden. Maar deze is met positieve kans nul en blaast dan de t-toet-singsgrootheid op. Ook daar is wel weer een mouw aan te passen, we kunnen max(c,~ - ~ als schatter nemen, voor een goed gekozen constante c > 0. Mathematisch-statistisch gezien is deze aangepaste mouw makkelijk rechtgebreid, maar u ziet dat de vraag "Hoe vertel ik het mijn klanten" toch steeds neteliger is geworden. Dat vond ook een van de referees bij mijn bovengenoemde artikel, blijkens zijn opmerking: "The author seems to be

unaware of the embarrassment of having to teil

a

c/ient that one cannot compute one's teststatistic because the data fall in an exceptional set with an asymptotica/ly negligib/e probability".

· Misschien heeft u toch nog uw twijfels over een en an-der. Het is dan blijkbaar wel zo dat er rare oplossingen bestaan, die moeilijk uit te leggen zijn. Maar is het niet zo dat zulke rare oplossingen alleen opduiken bij het bekijken van rare problemen? Met andere woorden, als de mathematisch-statisticus zo'n storm oogst, dan zal hij eerst zelf wel wind gezaaid hebben. Het volgende voor-beeld kan hopelijk deze indruk wegnemen. Behalve de gloeilampenfabriek in het zuiden des lands, waar Jos connecties mee heeft, is er ook een vliegtuigbouwer in het westen des lands. Bij dit bedrijf bestaat begrijpelijker-wijs sinds jaar en dag een levendige interesse voor levensduurverdelingen. In het kader hiervan heb ik met een student gekeken naar meest aannemelijke schatters voor drie-parameter lognormale verdelingen (v.d. Oever

(1991 )}. Het blijkt nu dat in dit bonafide, uit het leven gegrepen, uiterst praktische probleem, deze schatters zich op de meest bizarre wijze misdragen. Le Cam (1990) merkt in dit verband op (blz. 153) dat nog in 1970 de problemen met meest aannemelijke schatters door L.J. Savage in zijn Fisher-lezing werden voorgesteld als zaken die R.A. Fisher zelf als "mathematica/ cavi/ing', wiskundig gevit dus, zou hebben beschouwd. Om deze zienswijze te ontkrachten, geeft Le Cam een aantal voorbeelden, waaronder dat van de drie-parameter log-normale verdeling. Elders (Le Cam (1986), blz. 623) merkt hij over dit geval nog eens op: "The log norma/

was certainly not invented on purpose to make troub/e for maximum likelihood'. Kortom, dit is een echt pro-bleem en het is dus ook echt vervelend dat de meest

(28)

- - - ,aannemelijke schatters-soms-niet-blij-ken te-bestaan. Nog vervelender is dat allerlei alternatieven (de gecorrigeerde ML van Cheng en lles, de gemodificeerde ML van Cohen en Whitten, enz.) hetzelfde euvel vertonen: soms leiden ze niet tot een oplossing. In dit soort, gelukkig zeldzame, situaties valt het niet mee om de door Jos zo sterk be-pleite erkenning van de rol van kwantitatieve methoden te bevorderen!

Na bovenstaande beschouwingen ga ik nu over tot het speciale geval, toegespitst op mijn contacten met Jos. Deze hebben met name betrekking op de periode dat hij voorzitter van de WS was en ik vice-voorzitter. In deze contacten heb ik van nabij mee kunnen maken dat Jos ook in deze rol onvermoeibaar ijverde voor de verbrei-ding van kwantitatieve methoden. Eveneens heb ik kun-nen constateren dat hij een voortreffelijk organisator en inspirator is. Ik denk dat dergelijke conclusies door velen gedeeld zullen worden en dat Jos onveranderlijk als "uiterst bekwaam" uit de vele bijdragen naar voren zal komen. Dit drijft mij toch weer enigszins in de contramine en brengt mij tot de volgende benadering. Vaak werkt het verhelderend om de zaken goed in perspectief te plaat-sen. Ook is het zo dat wij allen weten en geloven dat "de uitzondering de regel bevestigt". Kortom, om de groot-heid van Jos te belichten, is niets beter geschikt dat het verhalen over een van zijn (vermeende) misstappen.

Uiteraard betreft het hier een extreme zeldzaamheid, zodat hiermee tevens het verband met het voorafgaande gelegd is: weer bevinden we ons in een bijna-nulverza-meling!

Het gaat hier om een episode die ik min of meer verge-ten was maar die weer geheel tot leven kwam toen ik ter voorbereiding van deze bijdrage de notulen van de

WS-bestuursvergaderingen nog eens doorbladerde. Op een bepaald moment in 1986 tref ik daar de aantekening aan dat op verzoek van een van de sectie-voorzitters een bijeenkomst belegd zal worden, met namens het bestuur o.a. De Kroon en Albers en verder de voorzitters van de secties. Aan de orde dienen te komen beleidsaspecten, zoals ledenwerving. Ter voorbereiding van deze bijeen-komst heeft Jos vervolgens een gesprek gehad met de betreffende sectievoorzitter, die als vervolg hierop hem een brief schreef met de openingszin: "Naar aanleiding van Uw verzoek om een 'praatpapier' op te stellen voor een informele bijeenkomst van enkele

(29)

hoofdbestuurs-leden met de sectie-voorzitter, doe ik ... ". Had ik toen maar alvast het eerder hier geciteerde voorwoord van Jos voor de Statistische Dag van 1987 tot mijn beschik-king gehad, dan had ik kunnen voorzien dat hier iets fout zou gaan. Immers, gezien de bezwaren die Jos daarin uit tegen vak-kretologie, had de benaming 'praatpapier' in zijn perceptie toch ronduit weerzinwekkend moeten zijn. Dit inzicht was toen echter nog niet gerijpt, zodat ik niets-vermoedend voortging. In de erop volgende notulen wor-den tijd en plaats voor de bijeenkomst genoemd, verge-zeld van de mededeling dat namens het bestuur o.a. De Kroon en Albers hierheen zullen gaan.

Voordat de bijeenkomst plaatsvond, werd echter duidelijk dat Jos uiteindelijk verhinderd zou zijn. Maar dat gaf niet, zonder hem zou het ook best lukken. Per slot van reke-ning had ik een praatpapier! Dus op het juiste moment toog ik opgewekt naar het midden des lands om de be-treffende vergadering voor te zitten. Alle sectievoorzitters kwamen opdagen, eveneens van heinde en verre en keken mij verwachtingsvol aan. Behalve dan die ene, op wiens verzoek de vergadering bijeengeroepen was. Die kwam namelijk niet. Althans dat werd ons allengs duide-lijk. Niet alleen De Kroon, maar ook de kroongetuige ontbrak dus. (Achteraf bleek de convocatie hem op mys-terieuze wijze niet bereikt te hebben, maar dat wist ik toen niet). Nu schijnt het verschijnsel dat men in verga-dering bijeen zit zonder dat iemand eigenlijk weet wat de bedoeling is, zich vaker voor te doen, maar in zodanig ongerepte en sublieme vorm als het zich toen openbaar-de, zal men het toch zelden aantreffen. Kafka had het niet beter kunnen verzinnen.

Is dit een blunder? Hier moeten wij toch voorzichtig over oordelen. Als ik de notulen van de betreffende bijeen-komst erbij pak, val ik weer van de ene verbazing in de andere. Wat een verstandige dingen zijn er blijkbaar toch nog gezegd en wat een zinvolle onderwerpen zijn er aan de orde gesteld. Het is wonderbaarlijk wat beoefenaars der kwantitatieve methoden in hun mars hebben als men ze een geschikt praatpapier voert! Nu het voorval door de tijd gerijpt is, wordt toch meer en meer duidelijk dat hier niet van een echte, doch slechts van een vermeende misstap van Jos sprake is. Met ragfijn spel wist hij zijn mede-bestuursleden tot voor hen ongekende hoogten op te krikken. Uiteraard ben ik hem daar diep dankbaar

(30)

voor. Dat geldt ook voor de wijze lessen die ik er aan overhield:

1) Ga niet naar een vergadering, tenzij het echt niet anders kan.

2) Laat je niet ontmoedigen als je geen idee hebt waar het over/om gaat, dat geldt voor de rest vast net zo. 3) Blijf opgewekt en zoek de positieve punten (wel

dóór-zoeken).

Dus tot slot nogmaals: Bedankt Jos!

Literatuur

1) Albers, W. (1978). Testing the mean of a normal population under dependence. Ann. Statist§., 1337-1344.

2) Le Cam, L. (1986). Asymptotic methods in statistica/ decision theory. Springer, New York.

3) Le Cam, L. (1990). Maximum likelihood: an introduc-tion. International Statistica/ Review 58, 153-171. 4) Lehmann, E.L. (1983). Theory of point estimation,

Wiley, New York.

5) Oever, J.G. v.d. (1991). Comparison of estimation methods for the three-parameter lognormal distribu-tion. Doctoraalverslag faculteit Toegepaste Wiskunde, Universiteit Twente/Fokker-Report ST-12.

(31)

(32)

5. Halverwege de vijftiger

•

Jaren

door Gerard Leppink

Halverwege de vijftiger jaren ontmoette ik je voor het eerst. Je kwam als jongste staflid van de Afdeling Bewer-king Waarnemingsuitkomsten TNO mij verjagen van een heel klein kamertje naast de "rekenkamer". Met kennis nul van de statistiek, maar met een aanbeveling van Freudenthal dat je tot de top van zijn studenten had behoord.

Ik durf niet te zeggen dat je van mij iets hebt geleerd; waarschijnlijk kon je jezelf wel redden. Wel realiseer ik me nu pas hoe gezellig we het daar hadden en hoe zorgeloos het leven was met betrekkelijk weinig verant-woordelijkheid. Als het ècht moeilijk werd waren er altijd nog onze baas Erlee en onze senior collega Drion. Onze gezinnen woonden in hetzelfde flatgebouw aan de Parelmoerhorst. Dat leverde veel extra contact op. Mak-kelijk was ook, dat ik met jouw eend mocht meerijden naar kantoor.

Ik heb je gestrikt als paranimf bij mijn promotie. Dat heeft je veel werk gekost: drukproeven corrigeren en optreden als chauffeur voor de drukker in Leiden. Geen wonder dat de paranimfen aan de door hèn bedachte stellingen hun gironummer toevoegden!

We zijn elkaar nu wat uit het oog verloren. Toch trad je nog wel op als spreker bij mijn afscheid van de univer-siteit. Wat in elk geval blijft, is een aantal prettige herin-neringen.

Ter afsluiting een paar gevleugelde uitspraken uit de ABW-tijd:

1. Ik ben het niet helemaal met U eens.

(33)

3. Ben jij er ook tussen de middag?

Met een vertaling voor buitenstaanders: 1. Ik heb nog nooit zoiets doms gehoord. 2. Een fout van de spreker zelf.

3. Ben jij ook op werk tussen Kerstmis en Nieuwjaar? (dat kàn in die tijd nog).

Jos, het ga je goed met Femmy, de kinderen en de kleinkinderen!

(34)

Een sandwich

1 voor

Jos de Kroon

door Fred W. Steutel

Your first SONY?

Heer Josef uit Geertruidenberge is niet zo gemak'lijk te tergen; maar met lof op Japans dan loop je de kans

op een aanval, en meestal een erge!

6. ON THE NUMBER OF FIRST-RATE STATISTJCIANS

Felicitatie

Een Jos die verliest wel zijn haren, maar zijn streken die zal-ie bewaren: Hij stemt KVP

en hij steunt PSV,

mèt zijn Fem tot in lengte van jaren!

1

(35)

6. On the number of

first-rate statisticians

by F.W. Steutel

6.1 lntroductlon

Clearly, the best statistician can be regarded as the optimum in a large sample. Since most everything in this world is linear and discrete, we shall study the behaviour of the (quality of the) best statistician as the maximum of

n i.i.d

., non-negative (!), integer-valued random variables as n tends to infinity. lt appears that quite surprising

things may happen.

6.2 General theory

Before introducing the genera! model we present a special case recently considered by Ráde [4]; translated into the best-statistician-contest language it is as fellows. A (statistica!) question is put to each of a group of n

statisticians, and those who fail to give the right answer (probability 1-p) are removed from the contest. Then a second question is put to the remaining statisticians, and this goes on until the last one has made his mistake --even the best horse is entitled to a little stumble!

1 n terms of plain probability theory we are looking for the

maximum in a sample of n geometrically distributed

random variables. The problem is that the maximum is not necessarily unique: we may end up with more than one best statistician! For large

n however, there will often

be only one champion, as, of course, we all expect; some might even have a conjecture as to his identity! We now introduce some notation. Let N_{1 ,} N₂,." be i.i.d.,

positive, integer-valued r.v.'s, and let

Mn

=

max(N₁, "., Nn).

We shall be interested in the number of best statisticians defined by

(36)

Kn

=

# {j E N : N₁

=

MJ.

We give a brief outline of the theory below, without proofs; for details we refer to [2]. The following result is easily verified.

Lemma 1 : Let Kn be as above and write

P₁

=

P(N1=J),

Pi

=

P(N1 :s; J), j=1,2, ".

Then

The following corollary is of special interest.

Corollary:

00

P(Kn

=

1)

=

n ~ p₁P

1

~;1 • 1~1

In what fellows we assume that the r.v.'s N₁are un-bounded, i.e.,

THE POSSIBLE QUALITY OF STATISTICIANS

IS WITHOUT LIMIT.

Under this, very mild, hypothesis things develop as one would expect; this is illustrated by the following result.

Theorem 1: lf p₁

=

P(N₁=J)

=

cj'a

U

=

1, 2, ".; a > 1), then

P(Kn

=

2 i.o.)

=

0 .

This means that in a contest of any appreciable size there will be only one winner, and, of course, most of us know who this winner is! For those who don't we include the following corollary.

Corollary: Under the conditions of Theorem 1 we have Kn ----> K with probability 1 , where

(37)

(*) P(K

=

1)

=

1.

Remark 1: Theorem 1 is proved by the Borel-Cantelli lemma if a < 2, and by the refinement of this lemma by Barndorff-Nielsen [1] if a O!!: 2; this last result was

communicated to me by dr. John Einmahl.

Remark 2: Result (*) holds under more general con-ditions than those in Theorem 1; it seems reasonable, not to say obvious, that it should hold in all non-patho-logical circumstances!

6.3 Ráde's model

We naw return to the Rade case (cf. [4]). Here some-thing unexpected seems to happen; it seems as if Kn would converge to something else than K = 1, but, in fact, there is no convergence at all!

Theorem 2: Let P(N₁

=

J)

=

p(1 - p)i-1

U

=

1, 2, ".; O <

p

< 1), and let "A.

=

-log(1 - p). Then, as

n

--> oo,

k

P(K = k) = _e__ F (8 ·"J...) + o(1)

n k! k n• •

where en= "A.·1_1og_{n - ["A.-}1_log_{n], and}_Fk(e;"A.)_{is a}_periodic

function of

e.

This means that in this case Kn has no limit, not even in distribution, clearly a pathological case!

For moderate values of

p

(and hence of "A.) the function Fk is almost constant. For example, in the, somewhat insulting, case that

p ""'

1 /2, where the statisticians give wrong answers to 50 percent of the questions, we have

k

P(Kn = k)""' p (k = 1,2, ... ), -k log(1-p)

a logarithmic series distribution; however, the hypothesis p ... 1/2 seems utterly unrealistic! lf, on the other hand, we allow p to depend on n, and, for large n, take

P

=

Pn

=

(1 - µ/n),

(38)

then for

n

--> oo we obtain:

k

P(Kn

=

k) -e-µ

~!

(k

=

1,2, ... ) ,

whereas P(Kn

=

n) --> e·µ, which would lead toa, clearly ridiculous, infinite number of first-rate statisticians with positive probability.

6.4 Concluslon

Summing-up the results of the previous sections, we can draw the following conclusion: Barring pathological cases, where rio limiting distributions exist, or an infinite number is possible, and perhaps a few ethers, the limiting number of first-rate statisticians is given by

K=1

with probability one. For corroborating evidence we refer to [3], p. 4, column f.

References

[1] 0. Barndorff-Nielsen, On the rate of growth of the partial maxima of a sequence of independent ident-ically distributed random variables, Math. Scand. ~.

1961, 383-394.

[2] J.J.A.M. Brands, F.W. Steutel and R.J.G. Wilms, On the number of maxima in a discrete sample,

Memorandum COSOR 92-16, Eindhoven U.T., 1992. [3] J.P.M. de Kroon, The asymptotic behaviour of

additive functions in algebraic number theory, thesis, Noordhoff, Groningen, 1966.

[4] L. Ràde, Problem E3436, Amer. Math. Monthly ~ 1991, 366.

(39)

(40)

7. Beslissen met

statistische

selectie-methoden

door Paul van der Laan

''A quality improvement process is a change process. " "lf you think that statistica/ selection methods are not important, think again!"

7.1 lnleldlng

In de industriële periode waarin we nu leven, worden we geconfronteerd met een stroom van veranderingen en mogelijkheden tot verandering. Een stroom zo krachtig en sterk dat het in bedrijfsleven en technologie een bij-kans overheersende rol speelt of zal gaan spelen. Dit is te wijten (of te danken?) aan de verbazingwekkende expansie in schaal en omvang van veranderingsmogelijk-heden. Wat de toekomst ons nog zal brengen, zullen we in het midden laten. Een Chinees spreekwoord leert ons: "Voorspellen is uiterst moeilijk, vooral met betrekking tot de toekomst."

Aangezien veranderingen onze technologie en bedrijfs-kunde kunnen verbeteren en daarmee ons bestaan, is het zinvol om een en ander nader te beschouwen en de problemen die hiermee samenhangen onder de loupe te nemen. In het bijzonder zullen we aandacht besteden aan beslissen met behulp van statistische selectiepro-cedures. Alvorens daar nader op in te gaan, zullen we in de eerstvolgende twee hoofdstukken enkele algemene opmerkingen maken over de informatiestroom en het beslissen.

(41)

7.2 De Informatiestroom

De sterke stijging van het aantal veranderingen en de mogelijkheden tot verandering resp. verbetering worden onder andere veroorzaakt door de versnelling in de infor-matiestroom. Deze versnelling in de informatiestroom kan wellicht het eenvoudigst ge'fllustreerd worden door enkele gegevens, geput uit Toffler (1981 ). Achtduizend jaar vóór het begin van onze jaartelling is men begonnen met het opslaan van nuttige informatie. Gedurende de laatste vier duizend jaar is het pas mogelijk geworden effectief met elkaar te communiceren doordat tweeduizend jaar vóór het begin van onze jaartelling het schrijven mogelijk werd. Het gedrukte woord kwam zo'n vierhonderd jaar geleden tot stand. Tot op de dag van heden hebben zich in de loop der jaren allerlei verfijningen in het drukpro-cédé gerealiseerd. Vóór het jaar 1500 produceerde Euro-pa zo'n 103 boeken per jaar, in 1950 zo'n 1.2

*

105 en in 1960 was dit aantal 1.6

*

105 _{boeken per jaar. Op}

we-reldniveau werden in 1965 ongeveer 103 _{boeken per dag}

uitgegeven, dat is ruwweg 3.6

*

105 boeken per jaar. Omstreeks 1970 werden op wetenschappelijk en tech-nisch gebied zo'n 6

*

107 _{bladzijden tekst per jaar}

ge-produceerd. Dit komt overeen met zo'n 55 boeken van 300 pagina's per dag! Het belang van dit alles kan on-derstreept worden met de volgende uitspraak van U Thant, voormalig secretaris-generaal van de Verenigde Naties: "lt is no longer resources that limit decisions. Jt is the decision that makes resources. This is the fundamen-tal revolutionary change -- perhaps the most revoluti-onary man has ever known", aangehaald in Cox (1965).

Zeer recent is de personal computer op de markt geko-men en heeft zijn intrede gedaan in bedrijfs- en privé

-leven. Deze maakt het mogelijk op talloze plaatsen in bedrijf en daarbuiten ongekend veel informatie op te slaan en te verwerken.

De personal computer heeft onweerspreekbaar onze mogelijkheden informatie te gebruiken en al of niet statis-tisch te analyseren sterk vergroot. Het analyseren van grote hoeveelheden informatie aanwezig in de resultaten van expeiimenten en waarnemingen aan verschijnselen, is meer dan ooit mogelijk. De computer, en in het bijzon-der de personal computer, is in zekere zin een drijvende kracht geworden achter de versnelling in de stroom van mogelijke verbeteringen bij de beslissingsvoorbereiding.

(42)

De versnelling in de informatiestroom en het personal computergebruik, gecombineerd met statistisch gereed-schap voor het ontwerpen en analyseren van

experimenten en de computerpakketten, hebben de mogelijkheden tot het nemen van verantwoorde beslissin-gen sterk vergroot.

Op een folder las ik "Wordt 't geen tijd om de informatie-stroom in de juiste banen te leiden?" Het antwoord op deze vraag moet mijns inziens bevestigd zijn en dit arti-kel is hopelijk een kleine bijdrage tot het in juiste banen leiden van de informatiestroom, althans als het om be-slissen gaat en dan nog wel in het bijzondere geval van selectie.

7.3 Het beslissen

Veel situaties vereisen het nemen van beslissingen; soms zijn deze complex. De versnelling in wetenschap en technologie noopt tot snelle, maar ook tot verantwoor-de beslissingen.

Nieuwe behandelingen, nieuwe processen, nieuwe mate-rialen, nieuwe medicijnen en nieuwe potentiële tarweras-sen vragen om verantwoorde en betrouwbare, maar vaak ook om snelle beslissingen. Aan de ene kant vereist de snelle(re) stroom van nieuwe inzichten en gewijzigde omstandigheden het snel(ler) nemen van beslissingen, aan de andere kant brengen de gewijzigde omstandighe-den en totaal nieuwe situaties met zich mee dat voor verantwoorde en betrouwbare beslissingen een gedegen analyse van de problematiek gewenst is.

Er zijn beslissingen die routinematig zijn, maar vele beslissingen vragen om een deugdelijke onderbouwing. De zorgvuldige beslisser steunt niet alleen op de me-ningen van experts, maar in het algemeen ook op statis-tische analyses van experimenten en verschijnselen. Statistiek houdt zich bezig met het ontwerpen van ex-perimenten en het opzetten van steekproeven uit popula-ties teneinde een gespecificeerde hoeveelheid informatie te verkrijgen tegen minimale kosten en het optimaal benutten van deze informatie voor gevolgtrekkingen voor een populatie en daarmee gepaard gaande besluitvor-ming.

(43)

In een bedrijfsorganisatie is veel informatie "domweg" opgeslagen in het brein van personen, daarom niet voor niets experts genoemd. Ook qeze kennis dient bij de bedrijfsvoering bruikbaar gemaakt te worden voor het nemen van beslissingen. Voor nadere informatie verwij-zen we naar Cooke (1990) en Goel & Zellner (1986). Echter, naast deze "expert opinion" dient een objectieve inbreng gebaseerd op kwantitatieve informatie een be-langrijke basis te zijn waarop beslissingen tot stand moeten komen. Statistische analysemethoden (en goed ontworpen experimenten) vormen de ondergrond van het objectief en kwantitatief beslissen. Computerapparatuur en bijbehorende software, met name statistische pro-grammapakketten, maken het mogelijk een steeds groter wordende informatiestroom op te slaan en te analyseren. Absolute zekerheid omtrent de correctheid van beslissin-gen is moeilijk, gewoonlijk zelfs onmogelijk. Waarnemin-gen aan technologische processen en experimenten zijn gewoonlijk stochastisch van aard en de konklusies ge-trokken uit dergelijke gegevens niet zeker. We zullen in het algemeen genoegen moeten nemen met een zekere controle van de grootte en de frequentie van de fouten die we kunnen maken. Wat we willen is een zekere, wel omschreven betrouwbaarheid van de beslissingen. Sta-tistische technieken en procedures kunnen ons helpen om dergelijke beslissingen voor te bereiden. Enkele vooraanstaande personen op het gebied van statistische analyse zijn geweest: Ronald Fisher (algemene aspek-ten, proefopzetten), Jerzy Neyman (toetsingstheorie) en Abraham Wald (beslissingstheorie).

Een speciale klasse van beslissingen kan met selectie worden aangeduid. Hierover zullen we een en ander uiteenzetten in de volgende hoofdstukken.

7.4 Selectie

Een interessante klasse van problemen is die van selec

-tieproblemen. De problematiek van selectie kan ruwweg aangeduid worden met de vraag: "Welke behandeling (proces, populatie, materiaal, systeem,"") is het beste?".

Hierbij is "beste" vaak gedefinieerd als grootste verwach-te opbrengst, laagsverwach-te produktiekosverwach-ten, minst schadelijk voor milieu, enz. Bovenstaande vraag kan uiteraard gemodificeerd worden, maar het wezen van selectiepro

(44)

-blematiek kan met de gestelde vraag gekarakteriseerd worden. Voor dergelijke selectieproblemen zal een selec-tie gewoonlijk gebaseerd zijn op stochastische waarne-mingen afkomstig van experimenten en verschijnselen. De variabiliteit in de waarnemingen zal met zich mee-brengen dat een correcte selectie niet met absolute zekerheid te doen is.

De vraag rijst nu hoe dergelijke selectieproblemen aan-gepakt dienen te worden. Het is mijns inziens opmerkelijk dat in een tijdperk van steeds grotere communicatiemo-gelijkheden adequate aanpakken van selectieproblemen, die reeds omstreeks 1960 gepubliceerd zijn, in de toe-passingswereld nauwelijks doorgedrongen zijn. Deze aanpakken brengen met zich mee dat selectieprocedures gekonstrueerd kunnen worden waarbij de bijbehorende selectie een betrouwbaarheid heeft die minstens gelijk is aan een van te voren gegeven waarde. De twee belang-rijkste aanpakken staan bekend onder de namen "indiffe-rentie zone aanpak" (indifference zone approach; iza), respectievelijk "selectie van een deelverzameling"

(sub-set se/ection approach; svd). De iza is voorgesteld, ge-formuleerd en ontwikkeld door Robert Bechhofer (1954). Het idee van svd is afkomstig van Shanti Gupta (1965). De theoretische ontwikkelingen, modificaties en gene-ralisaties hebben forse schreden voorwaarts gemaakt. Een bibliografie van Dudewicz & Koo (1982) geeft zo'n 1000 referenties.

Het wezen van een selectieprobleem kan als volgt weer-gegeven worden. Gegeven zijn k (:ë!: 2) behandelingen

beschreven door middel van kwalitatieve variabelen. De verzameling bestaande uit de k behandelingen geven we aan met V

=

(8_{1 ,}8_{2 , •••},8k). Bij elke behandeling ~

(i

=

1,2, ... ,k) wordt verondersteld dat een Normaal ver-deelde responsie

x;

met verwachting µ; en bekende con-stante variantie

a2-

wordt waargenomen. De parameter-ruimte Q is gedefinieerd als

De geordende parameters duiden we aan met µ₁₁₁s µ₁₂₁s ". s _µlk1.De behandeling korresponderend met µp₁geven

(45)

we aan met B(i>" We voeren een afstandsmaat ö₁₁in, die, zoals in het beschouwde geval van locatieparameters, gedefinieerd wordt als µm - µlil.

Verondersteld wordt dat voor

x;

n

onafhankelijke her-halingen gegeven zijn, aan te geven met

Het bijbehorende steekproefgemiddelde geven we aan met

- 1 n

x

1 = - ~

x"

(i=1.2, ... ,k) . n 1=1 9

De geordende steekproefgemlddelden geven we aan met

Xc

₁₁s

Xc

₂₁s ... s

XJk

_1•Op basis van de k waargenomen steekproefgemiddelden willen we de ongeordende verza-meling met de t beste behandelingen B<k-t+lJ•···•B(kJ• kor-responderend met µ!k-i+_{11, ••• ,}µJkJ• aanwijzen (1 s t < k). Als knopen optreden, dan veronderstellen we dat de t beste eenduidig aangegeven zijn. Het steekproefgemiddelde bij B₁₁l geven we aan met X(il (i

=

1,2,".,k). De vraag "Welke ziJn de t(1 s t < k) beste behandelingen?" dient beant-woord te worden, zodanig dat de kans op foute selectie onder controle is. De beantwoording van deze vraag kan ruwweg op twee manieren gebeuren, en wel met behulp van de aanpakken iza en svd. De aanpakken iza en svd zullen achtereenvolgens kort besproken worden.

7.5 Indifferentie zone aanpak

Bij de iza wordt de parameterruimte Q in twee disjuncte deelverzamelingen opgesplitst:

waarbij

Q(ö*)

= {

µ: ök·l+1 k-1 <!: ö*}

c

Q

met ö* > 0. De deelruimte Q(ö*) wordt de voorkeurszone genoemd en Qc(ö*) de indifferentie zone. Het doel van de selectie is de verzameling V op te splitsen in V₁

c

Ven