• No results found

Adaptieve verdelingsvrije toets voor het k-steekproevenprobleem

N/A
N/A
Protected

Academic year: 2021

Share "Adaptieve verdelingsvrije toets voor het k-steekproevenprobleem"

Copied!
25
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

steekproevenprobleem

Citation for published version (APA):

Smeulders, T., Rooijakkers, R. V. H., Doornbos, R., & Dijkstra, J. B. (1983). Adaptieve verdelingsvrije toets voor het k-steekproevenprobleem. (Computing centre note; Vol. 14-15). Technische Hogeschool Eindhoven.

Document status and date: Gepubliceerd: 01/01/1983

Document Version:

Uitgevers PDF, ook bekend als Version of Record

Please check the document version of this publication:

• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.

• The final author version and the galley proof are versions of the publication after peer review.

• The final published version features the final layout of the paper including the volume, issue and page numbers.

Link to publication

General rights

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain

• You may freely distribute the URL identifying the publication in the public portal.

If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:

www.tue.nl/taverne

Take down policy

If you believe that this document breaches copyright please contact us at:

openaccess@tue.nl

providing details and we will investigate your claim.

(2)

Eindhoven University of Technology Computing Centre Note 14

Adaptieve verdelingsvrije toets voor het k-steekproevenprobleem.

T. Smeulders

Stage Statistische Analyse o.l.v.: prof.dr. R. Doornbos

drs. ~.8. niikstra

BIBLIOTHEEK

8 303119

T.H.EiNDHOVEN

(3)

INHOUD

pagina

1. Inleiding 3

2. Methode 4

3. Criteria 5

4.

Testen van de toets 8

5. Suggesties voor nader onderzoek 10

6. Literatuur 11

Histogrammen behorende bij

4.

12 Tabellen behorende bij 4. 15

VDWAERDENTEST Bijlage 1

(4)

1. Inleiding.

In de k1assieke statistiek wordt voor een probleem een nauw om-schreven model opgesteld. Binnen dat model wordt vervolgens de optimale procedure gezocht. Het prob1eem is echter dat de model-aannamen meestal op zijn best bij benadering vervuld zijn. Op zich is dat niet zo erg, maar het bIijkt dat vele klassieke pro-cedures nogal gevoelig zijn voor afwijkingen van de modelaanna-men, met andere woorden ze zijn niet erg robuust.

In het Iicht hiervan heeft het zin om te zoeken naar procedures die weI robuust zijn, terwijl hun re1atieve doeltreffendheid ten opzichte van de optima1e procedure voldoende hoog is.

lets dergelijks gaan we doen in deze stage. Op het moment wordt op de THE voor het k-steekproevenprobleem voornamelijk een verde-lingsvrije toets gebruikt, en weI die van Kruskal en Wallis. We weten (zie [1) dat deze toets optimaal is voor onderliggende logistieke verdeling. Tevens is bekend dat bij verdelingen met

I

dikkere staarten (dubbelexponenti~le verdeling), of met dunnere staarten (normale verdeling) andere toetsen beter zijn, dat wil zeggen een groter onderscheidend vermogen bezitten. Bij een

dub-belexponenti~le verdeling is de Mediaantoets het best, en bij de normale verdeling de Van der Waerdentoets. De toets van Kruskal en Wallis zal dus niet altijd even goed zijn om te gebruiken. Wij gaan nu een verdelingsvrije toets ontwerpen die zichzelf aanpast aan het datamateriaal. Dit houdt in dat we kijken uit welke ver-deling de waarnemlngen afkomstig zijn, en vervolgens de toet-singsgrootheid berekenen op de manier die het beste is voor die verdeling.

(5)

2. Methode.

Zoals a1 vermeld gaan we een verdelingsvrije toets voor het k-steekproevenprobleem ontwerpen die zichzelf aanpast aan het data-materiaal. We nemen aan dat de waarnemingen uit de i-de steek-proef afkomstig zijn uit de verdeling met verdelingsfunctie F(x-8

i). De nulhypothese luidt 61 - •••

=

8k, ofte weI aIle waar-nemingen afkomstig uit dezelfde verdeling. Ons eerste probleem is te kijken wat F is. Dit doen we op de bekende manier: we kijken naar de staartlengte. Om de staartlengte te meten zijn verschil-lende criteria aanwezig (zie hoofdstuk 3). Wij gebruiken een gesuggereerd door Hogg [2]. Met behulp van deze zogeheten

compartimentator kunnen we dan de onderliggende verdeling schat-ten: bij kleine waarden zeggen we normale verdeling, bij middel-matige waarden logistieke verdeling, en bij grote waarden houden we het op een dubbelexponenti~le verdeling. Vervolgens gebruiken we die toetsingsgrootheid die voor die verdeling het grootste onderscheidend vermogen oplevert.

Bij dit alles moe ten we nog met een feit rekening houden. Ais aIle k steekproeven een behoorlijk groot () 10) aantal waarne-mingen bevatten, dan weten we dat de toetsingsgrootheid van zowel de Van der Waerden-, de Mediaan-, als de Kruskal en Wallistoets

2

bij benadering X -verdeling heeft met k-l vrijheidsgraden. AlB er echter een kleine steekproef aanwezig is weten we aIleen dat de Kruskal en Wallistoetsingsgrootheid bij benadering een

e-verdeling heeft. Van de andere twee toetsingsgrootheden weten we niets omtrent de verdeling, en we zouden voor de berekende waar-den dus geen vergelijkingsmateriaal bezitten. We lossen dit pro-bleem op door bij aanwezigheid van een kleine steekproef altijd de toetsingsgrootheid van Kruskal en Wallis te gebruiken, en slechts als aIle steekproeven groot genoeg zijn gaan we kiezen tussen de drie hierboven vermelde toetsingsgrootheden.

(6)

3~ Criteria voor het meten van de staartlengte.

Het vinden van een goede compartimentator is niet zo eenvoudig, en we zullen daarom hier de door ons gebruikte mogelijkheden weergeven.

De meest gebruikte methode voor het meten van de staartlengte is de steekproefkurtosis. Ais

XI""X

n een steekproef is uit een bepaalde verdeling dan heeft de kurtosis de waarde:

E(X

i

-X)4

In

K = - 3

[l:(x

i

-x)2 /

n

f

De kurtosis is lokatie- en schaalinvariant, en heeft voor norma-Ie, logistieke en dubbelexponenti~le verdeling respectlevelijk de waarden 0, 1.2 en 3. Als breekpunten nemen de de middens tussen deze waarden.

Wij hebben nu te maken met waarnemingen uit verschillende steek-proeven: Xl' " ' , X n X IX nl+l' ••• , n1+n Z X· n + +n +1"'" X + + 1 ••• k-1 '£11 ••• ~

Een eerste mogelijkheid is de kurtosis over aIle waarnemingen te berekenen, en deze waarde als compartimentator te gebruiken. Ais de bij de steekproeven behorende verdelingsfuncties F(~6i) ten opzichte van elkaar van Iokatie verschoven zijn, ofte weI de nulhypothese geldt niet, dan kunnen we echter volgens de formule verwachten (Xi-X is dan groot) dat de K te kleine waarden krijgt. Dit bleek inderdaad het geval.

(7)

Een tweede mogelijkheid is om eerst de waarnemingen te centrali-seren, ervoor zorgen dat aIle waarnemingen bij benadering uit dezelfde verdeling afkomstig zijn, en vervolgens de kurtosis te berekenen. Het meest voor de hand liggend is dan van elke steek-proef het steeksteek-proefgemiddelde af te trekken. Daar bij verde-lingen met dikke staarten het steekproefgemiddelde geen goede schatter is voor de verwachting, en we wat verdelingsvrij willen blijven werken, trekken we in plaats van het steekproefgemiddelde de mediaan van de steekproef af. Waarschijnlijk worden de waarne-mingen op deze manier nog niet genoeg gecentraliseerd (de steek-proeven zijn vrij klein), want de kurtosis kreeg weer over het algemeen te kleine waarden.

Een derde mogelijkheid is om per steekproef de kurtosis te bepa-len, en dan de gevonden waarden te middelen. Daar de kurtosis lokatie invariant is zou deze methode goed moe ten werken. Het enige nadeel is dat de kurtosis nu telkens berekend wordt over een vrij klein aantal waarnemingen, wat bij verdelingen met dikke staart nogal uiteenlopende waarden kan opleveren. Dit was waar-schijnlijk dan ook de reden dat de resultaten weer niet bevredi-gend waren.

Na deze drie mogelijkheden kunnen we concluderen dat de kurtosis aIleen een goed criterium is als aIle waarnemingen uit dezelfde verdeling afkomstig zijn, en de steekproef niet te klein is. Hogg en Davenport [2,3] geven een ander criterium aan dat beter zou zijn dan de kurtosis. De formule luidt:

10(UO OS-LO 05)

Q

=

(u'

-L •

J

,waarbij weer wordt uitgegaan van ~en

steek-0.5 0.5

proef ter grootte n, uit een verdeling. Hierbij is

Ua(La)

de som van de grootste (kleinste) n.B waarnemingen (met eventueel frac-ties van waarnemingen als n.B niet geheel).

Ook op dit criterium kunnen we bovenstaande drie mogelijkheden toepassen. Het centraliseren leek ons het beste, en hebben we het eerst uitgevoerd. Dit gaf duidelijk betere resultaten dan de vorige methodes, en hoewel het zeker niet foutloos werkt, hebben we besloten dit criterium voor het meten van staartlengte verder te gebruiken.

(8)

Dat deze methode onder de nul hypothese goed werkt is als voIgt in te zien. Onder de nulhypothese zullen de medianen van de ver-schillende steekproeven ongeveer gelijk zijn, dus van elke steek-proef wordt practisch hetzelfde afgetrokken. Daar ook deze com-partimentator lokatie invariant is krijgen we bevredigende oplos-singen.

Voor de normale en dubbelexponentiele verdeling is de waarde van

Q volgens Hogg

[2]

respectievelijk 2.58 en 3.30.

Voor de logistieke verde1ing hebben we zelf de waarde empirisch bepaald op 2.85. Als breekpunten voor onze compartimentator nemen we weer de middens, zodat we uiteindelijk de volgende indeling krijgen:

als Q < 2.71 normale verdeling

2.71

(Q

< 3.07: logistieke verdeling

(9)

4. Testen van de toets.

Het testen van de toets kunnen we opsplitsen in twee delen. 1) Een vereiste voor een goede toets is dat hij onder de

nulhypo-these voldoet aan de onbetrouwbaarheid a. We hebben dit als voIgt getest. We nemen aan dat we vier steekproeven hebben elk ter grootte 15. Vervolgens nemen we een aselecte trekking ter grootte 60 uit normale, logistieke of dubbelexponenti~le ver-deling, en verdelen de waarden over de vier groepen. We weten dat de toetsingsgrootheid nu x2-verdeeld is met drie vrij-heidsgraden, dus we kunnen de overschrijdingskansen berekenen. Dit alles doen we 500 keer voor iedere verdeling. Als dan de overschrijdingskansen uniform verdeeld zijn over [0,1], dan kunnen we zeggen dat aan de gestelde eis wordt voldaan. Als de overschrijdingskansen niet uniform verdeeld zijn, maar de oorzaak van niet-uniformiteit ligt niet in het begin van het interval [0,1J dan mogen we toch aannemen dat we een goede toets hebben.

Het blijkt dat voor de normale verdeling de overschrijdings-kansen uniform verdeeld zijn, maar voor de logistieke en

dub-belexponenti~le verdeling is dit niet het geval. Voor deze twee verdelingen kunnen we echter uit de histogrammen op pagi-na 13, 14 concluder en dat de oorzaak van niet-uniformiteit niet in het begin ligt.

Voor aIle drie de verdelingen geldt dus: onder de nuIhypothese voidoet de toets aan de onbetrouwbaarheid.

2) De tweede test bestaat uit het vergelijken van het onderschei-dend vermogen van onze toets met die van Kruskal en Wallis. Dit kunnen we doen door onder de alternatieve hypothese de waarden van de toetsingsgrootheden te vergelijken. Hiervoor nemen we weer vier steekproeven ter grootte 15 uit de drie verdelingen, maar de steekproeven zijn nu ten opzichte van elkaar van lokatie verschoven. Bij elke verschuiving doen we vijf aselecte trekkingen. Als we de resultaten op pagina IS, 16 en 17 vergelijken, dan zien we helaas dat het onderschei-dend vermogen van onze adaptieve toets niet echt groter (soms groter, soms kleiner) is dan dat van die van Kruskal en

Wallis. De reden hiervoor wordt misschien door Albers [4] aangegeven: de keuzevrijheid in deze vorm van aanpassing is te groote

(10)

Opmerking: Bij het vergelijken van het onderscheidend vermogen traden af en toe zulke grote waarden voor de

toetsingsgrootheid op dat de nulhypothese zelfa bij

~ < 0.001 nog verworpen zou worden. Zulke waarden

zijn niet zo relevant. Ret gaat erom dat we waarden kunnen vergelijken die behoren bij practische waar-den voor a, zo tussen 0.25 en 0.001.

(11)

5. Suggesties veer nader onderzoek.

Tot slot volgen hier nog een tweetal suggesties voor een even-tueel nader onderzoek.

1) Wat is de verdeling van de toetsingsgrootheid van Mediaan-, en Van der Waerdentoets voor kleine steekproeven? Blj klein aan-tal waarnemingen blijven namelijk over het algemeen problemen ontstaan.

2) Misschien is er een betere compartimentator te bedenken. Voor grote steekproeven bijvoorbeeld lijkt ons het middelen beter dan het centraliseren.

(12)

6. Literatuur.

[1 ] J. Hajek en / Z. Sidak V I Theory of rank tests Academic Press, 1967

[2]

Robert

V.

Hogg

Adaptive Robust Procedures: A Partial Review and Some Suggestions for Future Applications and Theory

JASA (69), 1974

[3] Ronald H. Randles, John S. Ramberg and Robert V. Hogg An adaptive procedure for selecting the population with

largest location parameter

Technometrics (15, No.4), November 1973 [4] \~. Albers

Robuustheid en zich aanpassende verdelingsvrije procedures Kwantitatieve Methoden (3), 1981.

(13)

0.0 J:l ''''; .-I (!) "0 H (!) :> (!) .-I ttl a H 0 :z p~1Ua=lUl:

.

Ul:

.

·U.l:t?t?.M. It?=lut?t?

~

o M LI"\ N N o o

.

o co

·

o

r--·

0 \0

·

0 LI"\

·

0 -:t

·

o M

·

o N

·

o

·

o o

(14)

ffl

..-I.j..l 1\1 r:: I .j..l .... :;d r:: C".l 1\1 r:: <d .... Ln

r

70 .p-o (Xl 65 60 55 50 45 w 40 35 30 25 20 15 10 5

o

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 overschrijdingskans

(15)

QJ r-l.w CIl I=l .w • .-I ~ I=l CIl·.-I

1

70 65 60 55 50 45 40 35 30 25 20 15 10 5

o

O. I 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 fo

~

I ~ (J Ul .p-o 00 .p-overschrijdingskans

(16)

0 0.4 1.4 1.9 0 1 2 3 0 0.4 0.8 1.2 0 0.2 0.9 1.5 0 0.8 1.6 2.3 comparti-menta tor 2.69 2.69 2.07 2.43 2.64 2.47 2.54 2.69 2.20 2.93 2.69 3.14 2.61 2.70 2.99 2.39 2.55 2.46 2.77 2.53 2.72 2.86 2.56 2.56 2.44 -adaptieve toets 19.43 20.53 22.51 24.10 23.20 34.45 32.82 28.54 40.24 34.77 4.88 7.60 19.67 10.41 7.51 20.17 13.06 17.35 15.35 16.32 19.27 30.63 18.21 28.47 25.41 Kruskal en Wallis 19.81 20.62 22.17 23.36 24.88 35.05 34.88 30.91 41.95 34.77 3.81 12.18 17.67 11.48 7.51 19.60 12.78 18.16 15.35 16.21 19.27 30.63 17.23 30.32 24.78

(17)

0 0.4 1.4 1.9 0 1 2 3 0 0.4 0.8 1.2 0 0.2 0.9 1.5 0 0.8 1.6 2.3 Logistieke verdeling x2-waarden comparti-mentator 2.79 2.65 3.02 3.27 2.34 3.23 2.86 2.78 2.99 2.71 2.99 3.33 2.42 2.78 3.06 2.93 -3.46 2.84 3.20 3.10 2.69 2.84 2.94 3.15 3.11 adaptieve toets 6.42 11.13 10.24 7.60 5.51 17.04 20.85 23.62 20.81 16.64 19.30 11.80 10.32 6.24 4.44 6.74 15.47 4.83 5.51 23.34 19.43 17.00 25.99 9.70 14.95 Kruskal en Wallis 6.42 10.81 10.24 6.92 4.83 16.40 20.85 23.62 20.81 16.64 19.30 7.15 -8.53 6.24 4.44 6.74 16.89 4.83 6.51 21.93 19.09 17.00 25.99 17.30 20.33

(18)

0 0.4 1.4 1.9 0 1 2 3 0 0.4 0.8 1.2 0 0.2 0.9 1.5 0 0.8 1.6 2.3 x2-waarden comparti-mentator 3.49 3.07 3.28 3.38 2.75 3.15 2.75 3.27 3.40 4.24 2.89 3.39 2.93 3.35 2.99 2.98 2.92 2.75 4.05 3.22 3.65 3.29 3.24 3.54 3.46 adaptieve toets 17.04 15.47 12.85 20.19 21.44 22.29 33.12 19.14 26.48 32.25 5.94 11.80 8.11 13.90 11.75 16.76 4.10 9.54 14.95 14.95 11.28 18.09 19.14 18.09 19.14 Kruskal en Wallis 20.88 16.76 17.08 24.69 21.44 19.25 33.12 29.50 28.08 32.22 5.94

-15.44 8.11 15.54 11. 75 16.76 4.10 9.54 14.10 14.69 11.64 15.17 23.71 20.73 19.09

(19)

Twee verdellngsvrije toetsen voor het k-steekproeven probleem. (Voorlopige uitgave).

(20)

VDWAERDENTEST

Korte functiebeschrijving

Voor een combinatie van steekproeven, niet noodzakelijk van gelijke grootte, wordt de toetsingsgrootheid van Van der Waerden bepaald. De nulhypothese luidt dat de steekproeven uit dezelfde verdeling afkomstig zijn.

De toetsingsgrootheid wordt benaderd met een x4-verdeling.

De steekproefgrootte behoort groter te zijn dan 5.

Procedure heading

PROCEDURE VDWAERDENTEST (X,GROUP,M,N,NUMBEROFGROUPS,CHISQUARE, DEGREESOFFREEDOM);

VALUE M,N,NUMBEROFGROUPS;

INTEGER M,N,NUMBEROFGROUPS,DEGREESOFFREEDOM; REAL CHISQUAREj

INTEGER ARRAY GROUP[*];

REAL ARRAY X[*];

Formele parameters

X bevat bij aanroep de waarnemingen, na afloop de

bijbehorende rangnummers. GROUP

M,N

NUMBEROFGROUPS

bevat bij aanroep voor ieder element van X het

nummer van de groep waartoe dit element behoort.

kleinste, respectievelijk grootste index voor X en

GROUP.

bevat bij aanroep het aantal groepen. Deze groepen zijn genummerd van 1 tot NUMBEROFGROUPS.

CHI SQUARE bevat de toetsingsgrootheid die vergeleken moet

worden met de X4-ve rdeling.

DEGREESOFFREEDOM bevat het aantal vrijheidsgraden voor de X2-verdeling.

(21)

Methode

AIle waarnemingen worden geordend, onafhankelijk van de groep waar-uit ze afkomstig zijn.

De kleinste waarneming krijgt aldus rangnummer 1, de een na kleinste rangnummer 2, " ' , de grootste waarneming rangnummer N ,. (n-m+l). Blj gelijke waarnemingen worden de desbetreffende rangnummers opge-teld en gemiddeld. Aan iedere gelijke waarneming wordt nu dit gemid-delde rangnummer toegekend.

De toetsingsgrootheid van Van der Waerden is nu:

N -1 k N R

w"

(N-l) {

r

[t/{_L)]2}

~

_1_ [

r

j

~{~)J2

i-1 N+1 j-l nj i-No +1 N+1 r1

waarbij ~ ,. inverse van de standaardnormale verdelingsfunctie k

=

NUMBEROFGROUPS

nj ,. aantal waarnemingen in de j-de steekproef

Nj -

n

1+n2

+···+n

j ; NO

=

0

Ri ,. rangnummer i-de waarneming

CHISQUARE := W

DEGREESOFFREEDOM ,. k-l

Externe relaties

Uit de procedurebibliotheek worden aangeroepen: ABORT,MIDRANK,NORMALPROBABILITY en ZEROINAB.

De procedure MIDRANK is beschreven in [2], NORMALPROBABILITY in [3], en ZEROINAB in [4].

(22)

Opmerkingen

1. Bij ongeschikte invoer wordt door de procedure ABORT een passende melding afgeleverd.

2. Voor het toetsen kan gebruik gemaakt worden van de procedure CHISQUAREPROBABILITY, die te vinden is in [3].

Eventueel kan gebruik worden gemaakt van een tabellenboek ([5]).

Literatuur

[ ]

/ v /

1 J. Hajek en Z. Sidak Theory of rank tests Academic Press, 1967 [2] RC-Informatie PP-4.10 Verdelingsvrije toetsen [3] RC-Informatie PP-4.11 Verdelingsfuncties [4] RC-Informatie 60.1

BEATHE procedure voor het oplossen van de vergelijking f(x) - 0 met de Regula Falsi

[5] A.J. Bosch en H.J.L. Kamps Statistisch Compendium THE-dictaat 2.218.

(23)

ADAPTIVETESTKSAMPLES

Korte functiebeschrijving

Van een combinatie van steekproeven, niet noodzakelijk van gelijke grootte, maar weI allemaal groot genoeg ( ) 10), wordt bekeken wat de onderliggende verdeling is.

Vervolgens wordt, afhankelijk van de gevonden verdeling, de toet-singsgrootheid van Mood en Brown, Kruskal en Wallis, of

Van der Waerden bepaald. Als er een kleine steekproef aanwezig is wordt direct de toetsingsgrootheid van Kruskal en Wallis bepaald. De nulhypothese luidt dat de steekproeven uit dezelfde verdeling afkomstig zijn.

Als er een kleine steekproef bij is, moet de toetsingsgrootheid

benaderd worden met een 6-verdeling, anders met een x4-ve rdeling,

vandaar dat zowel de toetsingsgrootheden BETA als CHISQUARE geleverd worden.

Procedure heading

PROCEDURE ADAPTIVETESTKSAMPLES (X,GROUP,M,N,NUMBEROFGROUPS,BETA, BETAPAR1,BETAPAR2,CHISQUARE, DEGREESOFFREEDOM);

VALUE M,N,NUMBEROFGROUPS;

REAL ARRAY X

[*

J;

INTEGER ARRAY GROUP

[*];

INTEGER M,N,NUMBEROFGROUPS,DEGREESOFFREEDOM; REAL BETA,BETAPAR1,BETAPAR2,CHISQUAREj

Formele parameters

X bevat bij aanroep de waarnemingen, na afloop de

bijbehorende rangnummers. GROUP

M,N

NUMBEROFGROUPS

bevat bij aanroep voor ieder element van X het nummer van de groep waartoe dit element behoort. kleinste, respectievelijk grootste index voor X en GROUP.

bevat bij aanroep het aantal groepen.

Deze groepen zijn genummerd van 1 tot NUMBEROF-GROUPS.

(24)

BETA

BETAPAR1

bevat na afloop de toetsingsgrootheid die vergeIe-ken moet worden met de S-verde1ing.

bevat na afloop de eerste parameter voor de S-verdeling.

BETAPAR2 bevat de tweede parameter voor de S-verdeling. CHI SQUARE bevat de toetsingsgrootheid die verge1eken moet

worden met de x4-verdeling.

DEGREESOFFREEDOM bevat het aantal vrijheidsgraden voor de x4-verde-ling.

Methode

Om de onderliggende verdeling te bepalen is het nodig dat aIle waar-nemingen uit dezelfde verdeling afkomstig zijn. Eventuele lokatie-verschuivingen tussen de verschillende groepen worden daarom te niet gedaan door van iedere groep de mediaan van de groep af te trekken. Vervolgens worden de zo verkregen waarden gerangschikt naar opklim-mende volgorde, onafhankelijk van de groep waaruit ze afkomstig

zijn. We kunnen nu de verdeling bepalen met behulp van de volgende compartimentator:

Q _ 10(UO.OS-LO.OS) UO.S-LO•S

Hierbij is US(LS) de som van de grootste (kleinste) (n-m+I)S waarden (met eventuele fracties van waarden als (n-m+l)S niet geheel).

Als Q < 2.71 handelen we alsof de waarnemingen afkomstig zijn uit een normale verdeling, en berekenen we de toetsingsgrootheid met behuip van de VDWAERDENTEST.

Als 2.71 ( Q < 3.07 handelen we alsof de waarnemingen afkomstig zijn uit een logistieke verdeling, en berekenen we de toetsingsgrootheid met behulp van de KRUSKALWALLISTEST.

Als Q ) 3.07 handelen we alsof de waarnemingen afkomstig zijn uit een dubbelexponentiele verdeling, en berekenen we de toetsingsgroot-heid met behulp van de MOODBROWNTEST.

Als er een kleine

«

10) steekproef aanwezig is wordt niet naar de onderliggende verde1ing gekeken, maar wordt meteen de toetsings-grootheid berekend met behulp van de KRUSKALWALLISTEST.

(25)

Externe relaties

Uit de procedurebibliotheek worden de procedures VDWAERDENTEST, KRUSKALWALLISTEST,MOODBROWNTEST,ABORT,ABS,WWORDTV aangeroepen. De procedure WWORDTV is beschreven in [1].

Opmerkingen

1. Deze toets is verdelingsvrij en past zichzelf aan aan het

datamateriaal om een zo groot mogelijk onderscheidend vermogen te verkrijgen.

2. Als aIle steekproeven minstens 10 waarnemingen bevatten, en Q ) 2.71 worden BETA,BETAPARI en BETAPAR2 niet berekend.

3. Bij ongeschikte invoer wordt door de procedure ABORT een passende melding afgeleverd.

4. Voor het toetsen kan gebruik gemaakt worden van de procedures BETAPROBABILITY en CHISQUAREPROBABILITY, die te vinden zijn in

[2]. Eventueel kan gebruik gemaakt worden van een tabellenboek

([3]).

Literatuur

[1] RC-Informatie PP-3.51

Het rekenen met matrices en vectoren [2] RC-Informatie PP-4.11

Verdelingsfuncties

[3] A.J. Bosch en H.J.L. Kamps Statistisch Compendium THE-dictaat 2.218 [4]

,:f.

Albers

Robuustheid en zich aanpassende verdelingsvrije procedures Kwantitatieve Methoden (3), 1981

[S] Robert V. Hogg

Adaptive Robust Procedures: A Partial Review and Some Suggestions for Future Applications and Theory

JASA (69), 1974

[6] Ronald H. Randles, John S. Ramberg and Robert V. Hogg

An adaptive procedure for selecting the population with largest location parameter

Technometrics (15, No.4), November 1973 [7] J. H;jek"en Z. Sid~k

Theory of rank tests Academic Press, 1967

Referenties

GERELATEERDE DOCUMENTEN

Uit het Oligoceen zijn er vrij veel exemplaren in het Stern- berger Gestein (Chattien van Duitsland) (plaat 2) aange- troffen en uit het oudere Mioceen van Nederland, België

sulcicostatus and demonstrated the utility of the microsatellite- and mitochondrial markers developed in the current study, allowing future studies to provide sufficient

7.19 Model fit between the free trajectories and the feature values of the master train data and test data sets using forced alignment to segment the train data and free

Dank voor de creativiteit en de betrokkenheid is deze bijzondere periode. Weet dat de inspecteurs-begeleiders jullie graag bijstaan met raad en daad in de keuzes die

Maar de ware Geest overtuigt een mens ervan dat zijn staat goed en zeker is, omdat hij niet alleen deze Christus gesmaakt heeft, maar Hem ook heeft gekocht, zoals die

De Senegal Classic, tien- daagse mountainbiketocht van Vredeseilanden met ex-wereld- kampioen mountainbike Filip Meirhaeghe in Senegal, doet den- ken aan vakantie en dat

Waarom heeft er geen gesprek plaats gevonden van het college met de verontruste bewoners van Bergen aan Zee, zoals meer dan een jaar geleden is beloofd voordat het college een

In deze PBLQatie hanteren we een aanpak die is gebaseerd op de samen- hang tussen de burger en zijn digitale vaardigheden, het beleid dat de overheid voert bij het inrichten van