"(k-1)-mean significance levels" van de asymptotische versie van de methode voor simultane uitspraken voor het k-steekproevenprobleem gebaseerd op de toets van Kruskal en Wallis

(1)

"(k-1)-mean significance levels" van de asymptotische versie

van de methode voor simultane uitspraken voor het

k-steekproevenprobleem gebaseerd op de toets van Kruskal en

Wallis

Citation for published version (APA):

Oude Voshaar, J. H. (1976). "(k-1)-mean significance levels" van de asymptotische versie van de methode voor simultane uitspraken voor het k-steekproevenprobleem gebaseerd op de toets van Kruskal en Wallis.

(Memorandum COSOR; Vol. 7627). Technische Hogeschool Eindhoven.

Document status and date: Gepubliceerd: 01/01/1976 Document Version:

Uitgevers PDF, ook bekend als Version of Record Please check the document version of this publication:

• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.

• The final author version and the galley proof are versions of the publication after peer review.

• The final published version features the final layout of the paper including the volume, issue and page numbers.

Link to publication

General rights

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain

• You may freely distribute the URL identifying the publication in the public portal.

If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:

www.tue.nl/taverne

Take down policy

If you believe that this document breaches copyright please contact us at:

openaccess@tue.nl

providing details and we will investigate your claim.

(2)

Onderafdeling der Wiskunde

SECTIE KANSREKENING, STATISTIEK EN OPERATIONS RESEARCH

Memorandum COSOR 76-27

"(k-l )-mean significance levels" van de asymptotische versie van de methode voor simultane uitspraken voor het k-steekproeven-probleem gebaseerd op de toets van Kruskal en Wallis

door

J.H. Oude Voshaar

Eindhoven, December 1976 Nederland

(3)

het k-steekproevenprobleem gebaseerd op de toets van Kruskal en Wallis

I.. Inleiding en samenvatting

Laat ~Il"""'" ~ln~;""";~kl"""" ~k~ onafhankelijke stochas-tische grootheden zijn, waarbij 1 .. een kontinue verdelingsfunktie F.

1J 1

heef t ( k <!: 3 ).

Een verdelingsvrije toets voor de nulhypothese H

O: F1

=

F2

=

de toets van Kruskal en Wallis met als toetingsgrootheid:

= F is k 12 H:= N(N+I) n.1 (R.- 1 ' 12 k _

=

~~~

l

n R - 3N(N+I) N(N+I) ier. i - i . waarbij

N:=

nemingen is. k

l

n. i=1 ~ Verder:

en R.. het rangnummer van v •. onder aIle

waar--lJ ~lJ n. 1 1

R.:- - '

I

-1 n. ,- 1 ~ : J-en

R

:=

i

l

R •• .. i,j --J.J N+l = -2

Bij de onbetrouwbaarheidsdrempel a verwerpen we H

Oals H > ha•

Als H_Overworpen wordt weten we hiermee echter nog niet, voor welke paren (i,j) F. en F. verschillend zijn. Maar gebruik makend van het

1 J

lemma:

als c > 0, dan geldt:

k

l

i=l

k k 2 ~ k

d.e.s.d.1

l

a.y.

I

s;

c(l

a.)· voor alle(a1, ••• ak)ER i=1 1 1 i=1 1

viiiden-

we

dat uit

(1. 1) PH .{H S; h } - a

o

.v(

~ ]-a voIgt:

,

N(N+I) (

1-

+ _1_) voor J2 n. n. ~ J alle i en j} <!: ]-a

(4)

We konkluderen dus dat F. ~ F. a1& geldt: 1. J 1 - -

j

>0

_h N(N+) )( R. -R. 12 -1.. -J a. n. 1. + _1) ' n. J .

en deze methode heeft (onder H

O) een simultane onbetrouwbaarheid kleiner of gelijk aan a..

Opmerking: Deze methode is afkomstig van Nemenyi (1963).

Het nadeel van deze methode is echter, dat de simultane

onbetrouwbaar-heid, vooral voor grotere waarden van k, veel kleiner is dan a. (zie tabel 4.1),

omdat in (1.1) niet alle lineaire kombinaties uit het lemma gebruikt worden.

In het geval van steekproeven van gelijke omvang, d.w.z. n

1

=

n2

= .••-

~ = n, is, voor grotere n, de methode te verbeteren tot:

(1.2) konkludeer F. ~ F. als

IR

1. J _1.. _ _R

I

> d \ /k (kn+ 1) \ qk,oo

V

12

j. waarin qa.

k,00de rechterkritieke waarde is van de verdeling van de range

van k standaard-normaal verdeelde grootheden (een grootheid met deze verdeling noteren we wel eens ~ a. ).

-K,'"

Deze methode (1.2) heeft voor n ~ 00 een simultane onbetrouwbaarheid

die exakt gelijk is aan a. (zie 4.2).

We zijn echter niet alleen in deze onbetrouwbaarheid onder H

O gein~eres seerd: stel dat van de verdelingsfunkties F

1, ••••• ,Fk er p gelijk zijn

en de overige k-p verschillen. Dan gaat onze belangstelling nu vooral uit naar de kans dat uit die p identleke verdelingsfunkties toch sommige verschillend verklaard worden.

Miller (1966) noemt deze kans, gemaximaliseerd over alle mogelijke verdelingsfunkties F1, .•• ,F

k waarvan er p gelijk zijn, de "p-mean signi-ficance level a. ".

- p

Omdat R. diskreet verdeeld 1.S, is het te moeilijk om a. te bepalen voor

~. p

de methode gebaseerd op formule (1.1).

Voor methode (1.2) is het wel mogelijk a. te bepalen als n ~ 00. We zullen

p

ons hier beperken tot het geva:l-p'= k-l, d.w.z. er zijn kontinue verdelingsfunkties F en G zodat geldt: F

I= .•.•• =Fk_1 = F en Fk • G en we ~ragen ons af of hierbij (voor n ~ (0) geldt:

(5)

waarin

k(kn+t)}

12

We berekenen hiertoe eerst (in hoofdstuk 2) de verwachting en variantie

-

-van R. en R. , zodat we, gebruik makend van de in hoofdstuk 3 te

be--1.' -J'

wijzen asymptotische normaliteit van de vektor (!I" ••.~ , ~_l~),de asymptotische verdeling van max

IR. -

R. I

kennen (hoofdstuk 4).

I~i,j~k-I -1.' -J'

Als we, behalve kontinuiteit, geen andere beperkingen aan F en G opleggen, dan zal blijken dat voor de gangbare waarden van a geldt:

a

k_1 > a (zie hoofdstuk 5). Beperken we ons echter tot de klasse van

t

-Lehmann-alternatieven (G

=

F voor zekere t.E(O,oo), dan geldt weI:

a

k_1 < a (hoofdstuk 6).

Voor verschuivingsalternatieven zullen we in hoofdstuk 7 vinden: Als F symmetrisch en unimodaal (= eentoppig) is, dan geldt: a

k_1 < a.

2. Verwachting, variantie en kovariantie van R

I., ••••• , -K-) ,~ We veronderstellen dus dat F

I

=

F2

= ... =

Fk_1 (F en G kontinu) en verder n

l = •••••• = nk = n. Dan zijn !I.' •••••,~-Jo identiek verdeeld. We definieren de funktie u door:

'{ 0 als z < 0 u(z) :-' 1 als z ~ 0 = F en F k

=

G dan n R I :=

l

RI· - 0 - 1 . i=1 Nu geldt dat: =

I

rrU(Zli -

1.

J'f.)

+.t

n(n+l) i-I j.-2 R-=I

E

[u(Zu - I.j1) ] •

rr:i:

1:

~""

,k-I

(2.1) waarin p:=P(1KI~ y 11) =

f

G(y)dF(y) zodat: I k-I 2 I

E

(!I ) = "::'fi

l

n + pn + zn(n+l) 2 j=2

(6)

en dus [(!I.) •- 2'(kn+l)1 I ( = -(N+ 1) Z + (p-

~)n

1 . + (p-2")n ,)

Voor de berekening van var(!l.) vatten we de waarnemingen op als 3 steekproeven:

met verdelingsfunkties F, F en G. Dan geldt nu:

R -I· n

=

I

i=1 (k-Z)n

I

j=1 n u(X.₁i-X.Zj) +

l

i=1

Vanwege de onafhankelijkheid hebben we:

1

als i;it i' en j ;it j' dan £[u(v1,-YZ')u(v .,-Y .,)] =-4

"" 1. - J ""11 -2J

als i ;it i' en i ;it i' dan

([u(1.li-.lk.Q,)u(X.ii'-~i')]

=

pZ

= p

= u(z) voor aIle z):

1 = -Z 1 dan£. [u(1.1i-.lZj)u(X.ii'-~i)] =

2P

Z geldt (omdat u (z) Z

E.

[u (.lli-.lZj)] en

l

[uZ(x.li-X.ld)] en als i ;it i Verder

Ais j ;it j' dan

1

=

-3 (omdat F kontinu is)

Ais i ;it i' dan

1

=

(7)

als R. ;t R. dan

als i ;ti' dan

= GI-F(y»2G(y8

l~::

+ 2

I

(I-F(y»G(y)dF(y) • = 2

J

G(y)dF(y) - 2

J

F(y)G(y)dF(y) = 2(p-r) en tot slot geldt dat:

£.

[u(l.li-1.2j

)u(l.IC~R.)J

=

I

F(y)G(y)dF(y) = r Hierbij zijn q en r gedefinieerd door:

(2.2)

q: =

J

G 2 (y)dF(y) r: =

J

F(y)G(y)dF(y) We vinden dan: n (k-2)n =

L

i=1 j=1 + 2 n (k-2)n

L

i-I j= I I I = ~(n-I)(k-2)n {(k-2)n-l} + ~(k-2)n{(k-2)n-l} + 4 3 1 I 2 + ~(n-I)(k-2)n + zn(k-2)n + p n(n-I)n(n-I) + 2 2 1 2 + qn (n-I) + 2(p-r)n(n-l)n + pn + 202Pn(n-I)(k-2)n + 2 I 1 2 l2 2 + 2 rn(k-2)n + n(n+I){zn(kn+l) + (p-z)n } - ~ (n+l)

(8)

zodat:

1 2 1 2 1

=

12

k n + (2r - p - 4)kn + (4p - 2p + q - 6r + 6)n +

1 2 1

+

T2

k - P + P - q + 2r 6

Teneinde de kovariantie van !I. en !2.te berekenen vatten we de waar-nemingen op als 4 steekproeven:

1.11'· •• '1.1 n ;1.21' ••• ,1.2n ;1.31 ' ••. '1.3 (k-3)n;iit I" •• 'iitn met verdelingsfunkties F, F, F en G.

Dan geIdt:

n n 1

+

L L

u(.l2·-~) + ~(n+l)

j=1 m=1 J

Door !1.!2. op dezelfde manier als bij de berekening van E.

(!~.)

term voor term uit te vermenigvuldigen en de verwachting te nemen, vinden we (hierbij gebruik makend van de definities van p,q en r):

(2.4) cov(R 1.'!2) =

~

[(!j.!2) - (t.R_{1.)(E!2) =} n _ 1 l'n + (3 2 4 I ) 1 =

W

p - p -

r+TI n -12

Opmerking 1: Onder H O (d.w.z. F = G) geIdt: 1 1 p="2 enq =r='3

(9)

zodat dan

hetgeen overeenkomt met de bekende uitdrukkingen hiervoor (zie bij-voorbeeld Miller, page 171).

Opmerking 2:

Voor nl, •.• ,n

k niet aIle gelijk vindt men op dezelfde wijze: var

R

= _I_{ ~2 - I ' n l 12 2 2 I 2 + (q-p )n k + (2r-p)M~ +

izM

+ (2r-p-q+p )nk} k-I waarin M:= L_ n. = N - n 1 - ~ i-2 1.

3. Asymptotische normaliteit van (!I" !2.'.···'~-1,.)

In hoofdstuk 4 zullen we nodig hebben, dat (!l"""~-I,.) asymptotisch multi-normaal verdeeld is voor n + 00

nit

is d.e.s.d. het geval als

elke lineaire kombinatie k-I

L

i=1

c.R. asymptotisch normaal verdeeld is

1.-1 •

en dit laatste bewijzen we met stelling 2.I uit Hajek,(1968) •. De.VQonl-aarden van deze stelling zijn hier v~rvuld d.e.s.d. ala

"...

a~(k~1

c.R. ) naar oneindig gaat voor n -+-

00:

1-1'

i-I

Voordat we deze voorwaarde verifieren formuleren we echter eerst de volgende lemma's:

lemma 3.1:

k-l

en het gelijkteken geldt d.e.s.d. als var

I

R =

a

(10)

Bewijs: Ret gestelde voIgt uit:

var( k.

r

l !1'.) = (k-I) { var(R. ) + (k-Z) eov(!1'.'!Z) } 2': 0

1=1 - 1 ·

Q.E.D.

lemma 3.Z:

Bewijs: Onder de voorwaarde ~ = k-I _

geldt dat L R. = konstant, dus voor

i=l -10

lemma 3.1 geeft:

1

-

--

_k-Z

waarli1tvolgf:- eov(!I.'!Z) = L eov(!I.'!z.1 ~=rk)·p(~=rk)< 0 r k Q.E.D. lemma 3.3 k-I

2 2

e . e .

s

(k-Z) t • . 1 J 1'=1 1. ;tJ

•

Z e. en het geIijkteken 1

Bewijs: De bewering voIgt uit de ongelijkheid van Cauchy-Schwarz:

(k-I) k-I

2

i= 1 Z e. 1 ( k-l

)2

k-I 2':

2

e.

=

2 2

e . e . +

2

i=1 1 i;tj 1 J i=1

2 e. 1 Q.E.D. Als we definieren: (3.1) zodat: 1 1.2 ( I) 4 2pZ 6 1 a l:= ~ + 2r - F -

4

k + P - + q - r +

6

1 Z 1 a 2:=

12

k - p + P - q + 2r -

6

1 Z 1 a 3:= -

12

k + 3p - p - 4r +

12

-var

!I.

_{= a 1n} + _a2

(11)

dan geldt:

I I

. . C.c.

l.;tJ 1,.) l:c.2

1

Uit de lemma's 3.1 en 3.2 volgt: -a

l S (k-2)a3 S 0 zodat k-l

var(

L

c.,i..) naar oneindig gaat voor n ... eo als de volgende twee

i-J 1.-J.

voorwaarden zijn vervuld:

(3.3) i i i a > 0 1 k-l

I I

c.C. < (k-2)

l

c~

. ' l.J ' l l . 1 ;tJ 1=_

of

-ai'

-<

(k-2) a - 1 3 Dus als -a

1 < (k-2)a3C-dan eGklil >

Or,

daR

gelcft

dat de vektor

-

-(~I.""'~_I,.) asymptotisch normaal verdeeld is. Nu geldt: -a

l < (k-2)a3 d.e.s.d. als:

2 2

(2p - 2r - p )(k-I) + q - p > 0

waarin:

2p - 2r - p2 =

f

(1-F)2dG - (JGdF)2 =

=

J(I-F)2dG - (f(I-F)dG)2

=

IiF - IFdG}2 dG

~

a

en

q_

p2 ... JG24,F - (fGdF)2 ...

-f{G -

JGdF}2dF

~

a

2p - 2r - p2 en q - p2 zl.·J·n bel.·de ge l.Jl"k aan nu1 dII .e.s •• a sd 1

(3.4) G gelijk l.S aan 0 of 1 op de drager van F.

We hebben dus dat, behalve wanneer (3.4) geldt, de vektor (il."."~-I.) asymptotisch normaal verdeeld is.

Als (3.4) wel geldt,dan is a

l gelijk

(want k ~ 3), zodat volgens (3.3) en

1 2 1 1 d " f aan 12k - ~ +

6

en us posl.tl.e k-I -lemma 3.3. L c.R 1 asymptotisch i=1 l.-. normaal k-I

-E R. i=1 -l..

verdeeld is, als niet aIle c. 's ge1ijk zijn. Verder is dan l.

konstant, zodat, ook als (3.4) geldt, (il.' .."~-l.) asympto-tisch normaal verdeeld is, maar met een dimensie lager, n1. dimensie k-2.

(12)

• 4. De asymptotische verde ling van max

1si,j sk-I

I

i{ -

R

I

-I· . -j.

Teneinde de asymptotische verdeling van max

la. -

R. I

te

be--~. -J'

l:si,jsl

rekenen voor n -+ CXI, beschouwen we de volgende (k-I)-dimensionale

stoch&stische vektor v gedefinieerd door:

41

-

-( R - €:R -1 . - I ' v = (v I'····,v k 1):= , ••••• , 41 41 41, -

In

~-J.-E(~_l

,l)

In

Volgens hoofdstuk 3 is v voor n -+ CXI asymptotisch multi-normaal verdeeld

-n met kovariantiematrix: a 1 a3

...

a3

"

"- I a_{1 "-} II

"-I

'a _&3 1 "- _" "-a 1

Definieren we w_{-ni' -ni}'=v - yv -n waarin y:= I • en v := 1 -n k-) k-t \ v .

L-nJ

j=1

dan is ( ~I""!n,k-I) voor n -+ CXI asymptotisch multi-normaal verdeeld

met als kovariantiematrix (a

_l

-a

3)Ik_1 (waarin met Ik-1 de

identiteits-matrix van afmeting k-l bedoeld wordt), zodat de range van

w 41,k-1

... , V

a t -a 3 '

voor n -+ 00 qk-l,co verdeeld is.

Hieruit voIgt dat ook de range -,...

,

..

".

,

ook qk-I,oo verdeeld is zodat we vinden voor n -+ 00:

(4. 1)

(13)

Op dezelfde wijze bewijst men dat onder HO(F=G) voor n + m geldt:

(4.2) _p{

_I

_{Iio -}

~jol

<

<1.:,_

~2k2n

voor alle i,j } = 1 - a

(want onder H O

-R . -10 1S

-vn'

,

...

-~. _{asymptotisch normaal verdeeld}

met varianties i2k(k-l) en kovarianties -1

12

I k )

Onder het door ons beschouwde alternatief F

I =

=

Fk-I

=

F en F

k = G is de kans om uit uit {FI, .•• , Fk_l} sommige verschillend van elkaar te verklaren gelijk aan:

p

{max

I~.

-

!J'~

f

>

qi'f¥JHV~

2k2nJ} =

I::;i,j::;k-I

=

P {Q. > ...&k-I,m zodat: (4.3) _sup _P{ _~-I,m F,G F en G kontinu

Ji;;

1 2 a 12 } > qk m a-a , I 3 Hierin hangen a l en a3 van F en G af (zie(2.1),(2.2) en (3.1»0 Opmerking:

We kunnen nu ook de echte simultane onbetrouwbaarheid voor n + m berekenen

van de methode gebaseerd op formule (1.1). Vanwege de asymptotische

2

X

k- I - verde ling van de toetsingsgrootheid van Kruskal-Wallis is die echte onbetrouwbaarheid (die afhangt van a en k) gelijk aan:

lim P { max n+"" I::;i,j::;k = lim P n+""

IR.

_~o max

IR.

- 10 { l::;i,j::;k

- R.

I>

0

2<a)

-r

k-I - R_-JO

I

> 2 I k n+k } 6

(14)

20 IS 12 10 9 8 7 6 5

Tabel 4.1: Simultane onbetrouwbaarheid van de methode gebaseerd op formule (1.1) als n -+ <Xl

k= 3 4

(1=0. 10 .081 .060 .042 .029 .019 .012 .0079 .0050 .0019 .00044 .00003 0.05 .038 .027 .018 .011 .0071 .0044 .0027 .0016 .00057 .00011 .000008 0.01 .0068 .0042 .0025 .0014 .00082 .00046 .00025 .00014 .000042 .000007 .0000003

5. Berekening van (1k_1 zonder restrikties op F en G

Als we, behalve kontinuiteit, geen andere beperkingen opleggen aan de F en G uit formule (4.3) waarover het supremen genomen wordt, dan zal

blijken dat voor de gangbare waarden van (1 geldt (1k_1 > (1. (zie tabel 5.1). Dit bewijzen we als volgt:

de kans in formule (4.3) is maximaal voor die F en G waarvoor a

l - a3 maxi-maal is. Nu geldt: (5. I )

--

I 12 waarin: 2r-p = f(2F-l)GdF =

f

(2F-I)GdF + J (2F-l)GdF {xl F(x)c

n

{x

I

F(x»

n

(5.2)

zodat 2r-p maximaal is als er getallen X

o

en Xl bestaan (xO<xl), waarvoor

geldt dat :---F(x O)

=

F(X)l

=

i

G(x) = 0 voor X < X

_o

en G(x) = I voor x > XI 2

Nu is q-p juist ook maximaal in deze situatie, want altijd geldt:

(5.3) q_p2 = JG2dF - p2

~

J

GdF - p2 = p(l-p)

~

1

en als (5.2) geldt, dan

~

- p2 =

I

Voor een F en Gals in (5.2) geldtdus:

I 2 a 1 - a3 = T2(k + k + 1) zodat we vinden: (5.4) (1 k-l }

(15)

M.b.v. een tabel van de verdelingsfunktie van de range van

normaal

ver-deelde grootheden, bijvoorbeeld Harter (1969), vinden we:

tabel 5.1: ~k-I zonder restricties op F en G voor ~ = 0.01, ~ = 0.025,

~ = 0.05 en ~ = 0.10. k= 3 4 5 6 7 8 9 10 12 15 20 ~=0.01 .0153 .0181 .0182 .0178 .0172 .0167 .0162 .0158 .0151 .0143 .0134 0.025 .0303 .0361 .0386 .0385 .0379 .0372 .0365 .0358 .0347 .0334 .0318 0.05 .0512 .0643 .0682 .0690 .0688 .0682 .0674 .0667 .0652 .0633 .0612 0.10 .0877 .1123 .1208 .1240 .1250 .1250 .1245 .1238 .1'224 .1202 .1172 · - ~ ·_ _ O _ O O . O 6. ~k-l voor Lehmann-alternatieven

Nemen we in formule (4.3) het supremum aIleen over die paren F,G waarvoor

t

geldt: G= F voor zekere t E (O,m), dan zal blijken dat weI geldt: ~k-I < ~.(tabel 6.1) Als: G = Ft dan: OJ t P =. F dF ... 1

t+T

r

=

q = fF2tdF =

~I~

2t+l

f

Ft+1dF = _1_ t+2

zodat invullen in (5.1) geeft:

~2 ( ) ( 2 I I) ' 0 0 1

a_l_{-a3 = 12} + k-l

t+'2 -

t+1 -

6' •

2t+1 ""7(-t1+--::1~)""2 - - II2

In de volgende tabel z~Jn voor verschillende waarden van k de maximaie k2

waarden van a

l-a3-

12

als funktie van t gegeven:

k= 3 4 5 6 7 8 9 10 12 15 20

k2

.01625 .02112 .02600 • a

(16)

zodat we voor a k- 1 vinden: tabel 6.1: a k_1 voor Lehmann-alternatieven: k= 3 4 5 6 7 8 9 10 12 15 20 a=O.O1 .0040 .0057 .0067 .0073 .0078 .0081 .0083 .0085 .0088 .0090 .0093 0.025 .0100 .0144 .0168 .0184 .0194 .0202 .0208 .0213 .0220 .0226 .0233 0.05 .0204 .0291 .0339 .0370 .0391 .0406 .0418 .0427 .0440 .0454 .0466 0.10 .0408 .0597 .0690 .0750 .0790 .0820 .0842 :0860 .0886 .091 1 .0935 7. a k_1 voor verschuivingsalternatieven

We beschouwen nu alternatieven waarvoor een a E Bbestaatt zodat G(x)=F(x-u) voor alle x E B.

Verder nemen we eerst even aan dat a > 0 (verschuiving naar rechts). Dan geldt: G(x) s F(x) veer alle x

zodat: 2r -

p.f

G (2F-l) dF ...

...

' f

G(2F-1) (iF +

J

G(2F-1) dF S {xIF(x)S~} {xIF(x»~} (7.1) s 0 +

J

(2F2-F) dF hIF(x»D

verder geldt nog steeds (zie 5.3):

2 < 1

q - P - 4

2

We kunnen echter nog wel een scherpere bovengrens veer q-p vinden

(waarvan bevendien de geldigheid niet alleen beperkt is tot verschuivings-al ternatieven) : Stelling 7: 1: (7.2) Bewijs: 2 q - P :5 2r - p

(17)

=

(7.3) = I - p' (I-p)

Ret laatste gelijkteken geldt vanwege de onafhankelijkheid van ZII' ZI2'

Zkl en ~2

We vinden m.b.v. (7.3):

waarbij het laatste gelijkteken voIgt uit:

IF

2dG

=

I - 2fFGdF (partiele integratie) Vullen we (7.1) en (7.2) in in (5.1) dan volgt:

Q.E.D.

(7.4)

voor G(x) = F(x-a) met a > O.

Ais a < 0 (verschuiving naar links) daar kijken we naar:

-1..1 I ' • • ., -1..1 n; •••. ••• ; -Zk I ' • • •• ; -1..kn

Ais F' de verdelingsfunktie is van -ZII en G' die van -~I dan geldt: F' (x) = I-F(-x)

en G'(x) = F'(x+a)

G' is dus een verschuiving van F' naar rechts (omdat a < 0). Verder geldt: als !ij het rangnummer is van -Zij onder aIle -1..11"·" -~n dan:

R~. = N - R •• + -1J "J.J

I

-zodat a -a

=

lim --2 var(R

I - R ) I 3 n+<x> n - . -2 • = n~l';m 2n var -I'I (R' - -2'

R' )

= a' - at I 3 I , , 1 ( 2 I ) 1 . , h Nu ge dt dat a

l-a3 ~

12

k + 2k+1 , omdat G een verschu1v1ng naar rec ts is van F', zodat (7.4) ook geldt als a <

o.

(7.4) geeft een bovengrens voor a

1-a3 bij verschuivingsalternatieven. Dat deze bovengrens niet erg veeI verlaagd kan worden, blijkt uit het volgende voorbeeld:

(18)

voorbeeld 7: 1:

Neem F gedefinieerd door

=

[x

x

+

i

F(x) -_C +

i

al8 al8

-i :::;

x :::; 0

o :::;

x :::; !c en G gedefinieerd door G(x)

=

F(x-!)

dan geldt (onderstel c > i):

ic

2r - p =

f

G(2F-l)dF ->

J

(F(x) - ic)(2F(x) -1) dF(x) =

o

en q

-G

3 1 2 1

JF=-!C·

5

C

= ~ - -(1 +c)F + -=-c F = - - - . 3 2 2 F=! 24 4 p2 = ~ +

&(.!.)

192 C zonder geldt:

Bij deze F en G geldt dus voor C ~ ~:

1 (2 1 5

a

1 - a3 ~

12

k + 2k +

16)

Als we deze waarde van a

1 - a3 en die uit (7.4) invullen in (4.3), dan vinden we de volgende onder- en bovengrenzen voor a :

p

Tabe17.1

Onder-en bovengrenzen voor a bij verschuivingsalternatieven.

k-l

a= 0.01 a=0.025 a=0.05 a=O. 10 k=3 .00790-.0100 .0175- .021 3 .0325-.0381 .0612-.0695 4 .0101-.0119 .0230-.0263 .0431-.0483 .0816-.0894 5 .0109- .0123 .0253-.0279 .0478-.0519 .0909-.0972 6 .0113-.0124 .0263-.0284 .0501-.0535 .0958-.1009 7 .0114-.0123 .0268-.0285 .0514-.0541 .0987-.1030 8 .01 14- . 0 121 .0271-.0285 .0521-.0544 .1005-.1040 9 .0114-.0120 .0273-.0284 .0526-.0544 . 1019- . 1046 10 .0114- .01 19 .0273-.0283 .0529-.0544 .1025-.1049 12 .01 14- .01 17 .0273-.0281 .0531-.0543 .1034-.1053 15 .0112-.0115 .0272-.0277 .0532-.0540 .1039-.1052 20 .0111-.0112 .0270-.0273 .0530-.0534 • 104 1- . 1049

(19)

We zien in tabel 7.1 dat voor verschuivingsalternatieven in het algemeen niet geldt dat a

k-1 ~ a(hoewel het niet veel scheelt). Als we echter twee extra eisen aan F opleggen (die in de praktijk wel eens vervuld zijn), dan blijkt dat altijd geldt dat a

k- 1 ~ a.

Stelling 7.2: Als G een verschuiving van F is, waarbij F symmetrisch en unimodaal is ( en kontinu), dan geldt:

(7.5) 2 <

__I

r - p - 6

Bewij s:

Daar het probleem translatie-invariant is, is het geen beperking om F symmetrisch in x = 0 te nemen.

o

~

2r - p = f F (x-a)(2F(X)-I)dF(X)

+I

F(x-u) (2F(x)-I)dF(x)

-~ 0 Nu geldt: (omdat F(-x) = 1 - F(x»:

o

I

F(x-a) (2F(x)-I) -~

o

=

J

F(-y-a) {2F(-y)-1 }dF(-y) =

+~ ~ zodat GO =

f

F(-y-a) {1-2F(y)dF(y) =

o

~

f{F(y+a) - I}{ 2F(y)-1 }dF(y)

o

(7.6)

(7.7)

2r - p =

J{

F(x+a) + F(x-a) - I} {2F(x)-I} dF(x)

o

Voor x ~ 0 geldt: F(x+a) + F(x-a) ~ 2F(x)

Als x ~ lal geldt dit vanwege de unimodaliteit van F, hetgeen betekent dat F konkaaf is voor x ~ O.

Voor 0 ~ x < lal heeft men de symmetrie en unimodaliteit beide nodig om in te zien dat (7.7) geldt.

Deor (7.7) in te vullen in (7.6) vinden we:·

2< - P <

J

oo (2F(Xl-ll2dF(Xl

=

~(2F(Xl

-o

~

F(X)=1 1 ) 3 .

=.!..

F(:i:)=~ 6 Q.E.D.

Met behulp van stelling 7.1 vinden we dat onder de voorwaarden van stelling 7.2 ook geldt:

(7.8) q - P2 < -1

(20)

Invullen van (7.5) en (7.8) in (5.1) geeft: zodat geldt: a

W;2}

a_{k- I} S P{

_Stt-

_I _co> _qk _co - _{2 · .} , , k +1 tabel 7.2: Bovengrens voor a

k_1 voor verschuivingen van symmetrische, unimodale verdelingen. k= 3 4 5 6 7 8 9 10 12 15 20 -0.01 .0057 .0071 .0077 .0081 .0083 .0085 .0086 .0087 .0089 .0091 .0093 0.025 .0135 .0173 .0190 .0200 .0206 .02 11 .0214 .0217 .0222 .0227 .0232 0.05 .0262 .0349 .0375 .0396 .0410 .0421 .0429 .0435 .0445 .0455 .0465

o.

10 .0498 .0673 .0749 .0793 .0823 .0845 .0860 .0872 .0893 .0913 .0933

.

a

Opmerking: Als we de symmetrie-eis laten vallen, dan zitten we weer in de situatie van tabel 7.1, omdat de F uit voorbeeld 7.1 unimodaal is.

Literatuur:

Hajek J., Asymptotic mormality of simple linear rank statistics under alternatives, The Annals of Mathematical Statistics, vol.39

(1968), page 325-346.

Harter H.L, Order statistics and their use in testing and estimation, vol I, Aerospace Research Laboratories,Government Printing Office, Washington (1969)

Miller R.G, Simultaneous statistical inference, McGraw-Hill, New York (1966) Nemenyi P., Distribution-free multiple comparisons.