"(k-1)-mean significance levels" van de asymptotische versie
van de methode voor simultane uitspraken voor het
k-steekproevenprobleem gebaseerd op de toets van Kruskal en
Wallis
Citation for published version (APA):
Oude Voshaar, J. H. (1976). "(k-1)-mean significance levels" van de asymptotische versie van de methode voor simultane uitspraken voor het k-steekproevenprobleem gebaseerd op de toets van Kruskal en Wallis.
(Memorandum COSOR; Vol. 7627). Technische Hogeschool Eindhoven.
Document status and date: Gepubliceerd: 01/01/1976 Document Version:
Uitgevers PDF, ook bekend als Version of Record Please check the document version of this publication:
• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.
• The final author version and the galley proof are versions of the publication after peer review.
• The final published version features the final layout of the paper including the volume, issue and page numbers.
Link to publication
General rights
Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain
• You may freely distribute the URL identifying the publication in the public portal.
If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:
www.tue.nl/taverne
Take down policy
If you believe that this document breaches copyright please contact us at:
openaccess@tue.nl
providing details and we will investigate your claim.
Onderafdeling der Wiskunde
SECTIE KANSREKENING, STATISTIEK EN OPERATIONS RESEARCH
Memorandum COSOR 76-27
"(k-l )-mean significance levels" van de asymptotische versie van de methode voor simultane uitspraken voor het k-steekproeven-probleem gebaseerd op de toets van Kruskal en Wallis
door
J.H. Oude Voshaar
Eindhoven, December 1976 Nederland
het k-steekproevenprobleem gebaseerd op de toets van Kruskal en Wallis
I.. Inleiding en samenvatting
Laat ~Il"""'" ~ln~;""";~kl"""" ~k~ onafhankelijke stochas-tische grootheden zijn, waarbij 1 .. een kontinue verdelingsfunktie F.
1J 1
heef t ( k <!: 3 ).
Een verdelingsvrije toets voor de nulhypothese H
O: F1
=
F2=
de toets van Kruskal en Wallis met als toetingsgrootheid:
= F is k 12 H:= N(N+I) n.1 (R.- 1 ' 12 k _
=
~~~l
n R - 3N(N+I) N(N+I) ier. i - i . waarbijN:=
nemingen is. kl
n. i=1 ~ Verder:en R.. het rangnummer van v •. onder aIle
waar--lJ ~lJ n. 1 1
R.:- - '
I
-1 n. ,- 1 ~ : J-enR
:=i
l
R •• .. i,j --J.J N+l = -2Bij de onbetrouwbaarheidsdrempel a verwerpen we H
Oals H > ha•
Als HOverworpen wordt weten we hiermee echter nog niet, voor welke paren (i,j) F. en F. verschillend zijn. Maar gebruik makend van het
1 J
lemma:
als c > 0, dan geldt:
k
l
i=l
k k 2 ~ k
d.e.s.d.1
l
a.y.I
s;c(l
a.)· voor alle(a1, ••• ak)ER i=1 1 1 i=1 1viiiden-
we
dat uit(1. 1) PH .{H S; h } - a
o
.v(
~ ]-a voIgt:,
N(N+I) (1-
+ _1_) voor J2 n. n. ~ J alle i en j} <!: ]-aWe konkluderen dus dat F. ~ F. a1& geldt: 1. J 1 - -
j
>0
h N(N+) )( R. -R. 12 -1.. -J a. n. 1. + _1) ' n. J .en deze methode heeft (onder H
O) een simultane onbetrouwbaarheid kleiner of gelijk aan a..
Opmerking: Deze methode is afkomstig van Nemenyi (1963).
Het nadeel van deze methode is echter, dat de simultane
onbetrouwbaar-heid, vooral voor grotere waarden van k, veel kleiner is dan a. (zie tabel 4.1),
omdat in (1.1) niet alle lineaire kombinaties uit het lemma gebruikt worden.
In het geval van steekproeven van gelijke omvang, d.w.z. n
1
=
n2= .••-
~ = n, is, voor grotere n, de methode te verbeteren tot:(1.2) konkludeer F. ~ F. als
IR
1. J 1.. _ _RI
> d \ /k (kn+ 1) \ qk,ooV
12
j. waarin qa.k,00de rechterkritieke waarde is van de verdeling van de range
van k standaard-normaal verdeelde grootheden (een grootheid met deze verdeling noteren we wel eens ~ a. ).
-K,'"
Deze methode (1.2) heeft voor n ~ 00 een simultane onbetrouwbaarheid
die exakt gelijk is aan a. (zie 4.2).
We zijn echter niet alleen in deze onbetrouwbaarheid onder H
O gein~eres seerd: stel dat van de verdelingsfunkties F
1, ••••• ,Fk er p gelijk zijn
en de overige k-p verschillen. Dan gaat onze belangstelling nu vooral uit naar de kans dat uit die p identleke verdelingsfunkties toch sommige verschillend verklaard worden.
Miller (1966) noemt deze kans, gemaximaliseerd over alle mogelijke verdelingsfunkties F1, .•• ,F
k waarvan er p gelijk zijn, de "p-mean signi-ficance level a. ".
- p
Omdat R. diskreet verdeeld 1.S, is het te moeilijk om a. te bepalen voor
~. p
de methode gebaseerd op formule (1.1).
Voor methode (1.2) is het wel mogelijk a. te bepalen als n ~ 00. We zullen
p
ons hier beperken tot het geva:l-p'= k-l, d.w.z. er zijn kontinue verdelingsfunkties F en G zodat geldt: F
I= .•.•• =Fk_1 = F en Fk • G en we ~ragen ons af of hierbij (voor n ~ (0) geldt:
waarin
k(kn+t)}
12
We berekenen hiertoe eerst (in hoofdstuk 2) de verwachting en variantie
-
-van R. en R. , zodat we, gebruik makend van de in hoofdstuk 3 te
be--1.' -J'
wijzen asymptotische normaliteit van de vektor (!I" ••.~ , ~_l~),de asymptotische verdeling van max
IR. -
R.
I
kennen (hoofdstuk 4).I~i,j~k-I -1.' -J'
Als we, behalve kontinuiteit, geen andere beperkingen aan F en G opleggen, dan zal blijken dat voor de gangbare waarden van a geldt:
a
k_1 > a (zie hoofdstuk 5). Beperken we ons echter tot de klasse van
t
-Lehmann-alternatieven (G
=
F voor zekere t.E(O,oo), dan geldt weI:a
k_1 < a (hoofdstuk 6).
Voor verschuivingsalternatieven zullen we in hoofdstuk 7 vinden: Als F symmetrisch en unimodaal (= eentoppig) is, dan geldt: a
k_1 < a.
2. Verwachting, variantie en kovariantie van R
I., ••••• , -K-) ,~ We veronderstellen dus dat F
I
=
F2= ... =
Fk_1 (F en G kontinu) en verder nl = •••••• = nk = n. Dan zijn !I.' •••••,~-Jo identiek verdeeld. We definieren de funktie u door:
'{ 0 als z < 0 u(z) :-' 1 als z ~ 0 = F en F k
=
G dan n R I :=l
RI· - 0 - 1 . i=1 Nu geldt dat: =I
rrU(Zli -
1.
J'f.)+.t
n(n+l) i-I j.-2 R-=IE
[u(Zu - I.j1) ] •rr:i:
1:
~""
,k-I(2.1) waarin p:=P(1KI~ y 11) =
f
G(y)dF(y) zodat: I k-I 2 IE
(!I ) = "::'fil
n + pn + zn(n+l) 2 j=2en dus [(!I.) •- 2'(kn+l)1 I ( = -(N+ 1) Z + (p-
~)n
1 . + (p-2")n ,)Voor de berekening van var(!l.) vatten we de waarnemingen op als 3 steekproeven:
met verdelingsfunkties F, F en G. Dan geldt nu:
R -I· n
=
I
i=1 (k-Z)nI
j=1 n u(X.1i-X.Zj) +l
i=1Vanwege de onafhankelijkheid hebben we:
1
als i;it i' en j ;it j' dan £[u(v1,-YZ')u(v .,-Y .,)] =-4
"" 1. - J ""11 -2J
als i ;it i' en i ;it i' dan
([u(1.li-.lk.Q,)u(X.ii'-~i')]
=
pZ= p
= u(z) voor aIle z):
1 = -Z 1 dan£. [u(1.1i-.lZj)u(X.ii'-~i)] =
2P
Z geldt (omdat u (z) ZE.
[u (.lli-.lZj)] enl
[uZ(x.li-X.ld)] en als i ;it i VerderAis j ;it j' dan
1
=
-3 (omdat F kontinu is)
Ais i ;it i' dan
1
=
als R. ;t R. dan
als i ;ti' dan
= GI-F(y»2G(y8
l~::
+ 2I
(I-F(y»G(y)dF(y) • = 2J
G(y)dF(y) - 2J
F(y)G(y)dF(y) = 2(p-r) en tot slot geldt dat:£.
[u(l.li-1.2j)u(l.IC~R.)J
=I
F(y)G(y)dF(y) = r Hierbij zijn q en r gedefinieerd door:(2.2)
q: =J
G 2 (y)dF(y) r: =J
F(y)G(y)dF(y) We vinden dan: n (k-2)n =L
L
i=1 j=1 + 2 n (k-2)nL
L
i-I j= I I I = ~(n-I)(k-2)n {(k-2)n-l} + ~(k-2)n{(k-2)n-l} + 4 3 1 I 2 + ~(n-I)(k-2)n + zn(k-2)n + p n(n-I)n(n-I) + 2 2 1 2 + qn (n-I) + 2(p-r)n(n-l)n + pn + 202Pn(n-I)(k-2)n + 2 I 1 2 l2 2 + 2 rn(k-2)n + n(n+I){zn(kn+l) + (p-z)n } - ~ (n+l)zodat:
1 2 1 2 1
=
12
k n + (2r - p - 4)kn + (4p - 2p + q - 6r + 6)n +1 2 1
+
T2
k - P + P - q + 2r 6Teneinde de kovariantie van !I. en !2.te berekenen vatten we de waar-nemingen op als 4 steekproeven:
1.11'· •• '1.1 n ;1.21' ••• ,1.2n ;1.31 ' ••. '1.3 (k-3)n;iit I" •• 'iitn met verdelingsfunkties F, F, F en G.
Dan geIdt:
n n 1
+
L L
u(.l2·-~) + ~(n+l)j=1 m=1 J
Door !1.!2. op dezelfde manier als bij de berekening van E.
(!~.)
term voor term uit te vermenigvuldigen en de verwachting te nemen, vinden we (hierbij gebruik makend van de definities van p,q en r):(2.4) cov(R 1.'!2) =
~
[(!j.!2) - (t.R1.)(E!2) = n _ 1 l'n + (3 2 4 I ) 1 =W
p - p -r+TI n -12
Opmerking 1: Onder H O (d.w.z. F = G) geIdt: 1 1 p="2 enq =r='3zodat dan
hetgeen overeenkomt met de bekende uitdrukkingen hiervoor (zie bij-voorbeeld Miller, page 171).
Opmerking 2:
Voor nl, •.• ,n
k niet aIle gelijk vindt men op dezelfde wijze: var
R
= _I_{ ~2 - I ' n l 12 2 2 I 2 + (q-p )n k + (2r-p)M~ +izM
+ (2r-p-q+p )nk} k-I waarin M:= L_ n. = N - n 1 - ~ i-2 1.3. Asymptotische normaliteit van (!I" !2.'.···'~-1,.)
In hoofdstuk 4 zullen we nodig hebben, dat (!l"""~-I,.) asymptotisch multi-normaal verdeeld is voor n + 00
nit
is d.e.s.d. het geval alselke lineaire kombinatie k-I
L
i=1
c.R. asymptotisch normaal verdeeld is
1.-1 •
en dit laatste bewijzen we met stelling 2.I uit Hajek,(1968) •. De.VQonl-aarden van deze stelling zijn hier v~rvuld d.e.s.d. ala
"...
a~(k~1
c.R. ) naar oneindig gaat voor n -+-00:
1-1'i-I
Voordat we deze voorwaarde verifieren formuleren we echter eerst de volgende lemma's:
lemma 3.1:
k-l
en het gelijkteken geldt d.e.s.d. als var
I
R =a
Bewijs: Ret gestelde voIgt uit:
var( k.
r
l !1'.) = (k-I) { var(R. ) + (k-Z) eov(!1'.'!Z) } 2': 01=1 - 1 ·
Q.E.D.
lemma 3.Z:
Bewijs: Onder de voorwaarde ~ = k-I _
geldt dat L R. = konstant, dus voor
i=l -10
lemma 3.1 geeft:
1
-
--
k-Zwaarli1tvolgf:- eov(!I.'!Z) = L eov(!I.'!z.1 ~=rk)·p(~=rk)< 0 r k Q.E.D. lemma 3.3 k-I
2 2
e . e .s
(k-Z) t • . 1 J 1'=1 1. ;tJ•
Z e. en het geIijkteken 1Bewijs: De bewering voIgt uit de ongelijkheid van Cauchy-Schwarz:
(k-I) k-I
2
i= 1 Z e. 1 ( k-l)2
k-I 2':2
e.=
2 2
e . e . +2
i=1 1 i;tj 1 J i=12 e. 1 Q.E.D. Als we definieren: (3.1) zodat: 1 1.2 ( I) 4 2pZ 6 1 a l:= ~ + 2r - F -
4
k + P - + q - r +6
1 Z 1 a 2:=12
k - p + P - q + 2r -6
1 Z 1 a 3:= -12
k + 3p - p - 4r +12
-var!I.
= a 1n + a2dan geldt:
I I
. . C.c.l.;tJ 1,.) l:c.2
1
Uit de lemma's 3.1 en 3.2 volgt: -a
l S (k-2)a3 S 0 zodat k-l
var(
L
c.,i..) naar oneindig gaat voor n ... eo als de volgende tweei-J 1.-J.
voorwaarden zijn vervuld:
(3.3) i i i a > 0 1 k-l
I I
c.C. < (k-2)l
c~
. ' l.J ' l l . 1 ;tJ 1=_of
-ai'-<
(k-2) a - 1 3 Dus als -a1 < (k-2)a3C-dan eGklil >
Or,
daRgelcft
dat de vektor-
-(~I.""'~_I,.) asymptotisch normaal verdeeld is. Nu geldt: -a
l < (k-2)a3 d.e.s.d. als:
2 2
(2p - 2r - p )(k-I) + q - p > 0
waarin:
2p - 2r - p2 =
f
(1-F)2dG - (JGdF)2 ==
J(I-F)2dG - (f(I-F)dG)2=
IiF - IFdG}2 dG
~
a
en
q_
p2 ... JG24,F - (fGdF)2 ...-f{G -
JGdF}2dF~
a
2p - 2r - p2 en q - p2 zl.·J·n bel.·de ge l.Jl"k aan nu1 dII .e.s •• a sd 1
(3.4) G gelijk l.S aan 0 of 1 op de drager van F.
We hebben dus dat, behalve wanneer (3.4) geldt, de vektor (il."."~-I.) asymptotisch normaal verdeeld is.
Als (3.4) wel geldt,dan is a
l gelijk
(want k ~ 3), zodat volgens (3.3) en
1 2 1 1 d " f aan 12k - ~ +
6
en us posl.tl.e k-I -lemma 3.3. L c.R 1 asymptotisch i=1 l.-. normaal k-I-E R. i=1 -l..
verdeeld is, als niet aIle c. 's ge1ijk zijn. Verder is dan l.
konstant, zodat, ook als (3.4) geldt, (il.' .."~-l.) asympto-tisch normaal verdeeld is, maar met een dimensie lager, n1. dimensie k-2.
• 4. De asymptotische verde ling van max
1si,j sk-I
I
i{ -
R
I
-I· . -j.
Teneinde de asymptotische verdeling van max
la. -
R.
I
tebe--~. -J'
l:si,jsl
rekenen voor n -+ CXI, beschouwen we de volgende (k-I)-dimensionale
stoch&stische vektor v gedefinieerd door:
41
-
-( R - €:R -1 . - I ' v = (v I'····,v k 1):= , ••••• , 41 41 41, -In
~-J.-E(~_l
,l)
In
Volgens hoofdstuk 3 is v voor n -+ CXI asymptotisch multi-normaal verdeeld
-n met kovariantiematrix: a 1 a3
...
a3"
"- I a1 "- II"-I
'a &3 1 "- " "-a 1Definieren we w-ni' -ni'=v - yv -n waarin y:= I • en v := 1 -n k-) k-t \ v .
L-nJ
j=1dan is ( ~I""!n,k-I) voor n -+ CXI asymptotisch multi-normaal verdeeld
met als kovariantiematrix (a
l
-a3)Ik_1 (waarin met Ik-1 de
identiteits-matrix van afmeting k-l bedoeld wordt), zodat de range van
w 41,k-1
... , V
a t -a 3 'voor n -+ 00 qk-l,co verdeeld is.
Hieruit voIgt dat ook de range -,...
,
..
".,
ook qk-I,oo verdeeld is zodat we vinden voor n -+ 00:
(4. 1)
Op dezelfde wijze bewijst men dat onder HO(F=G) voor n + m geldt:
(4.2) p{
I
Iio -~jol
<<1.:,_
~2k2n
voor alle i,j } = 1 - a(want onder H O
-R . -10 1S-vn'
,
...
-~. asymptotisch normaal verdeeld
met varianties i2k(k-l) en kovarianties -1
12
I k )Onder het door ons beschouwde alternatief F
I =
=
Fk-I=
F en Fk = G is de kans om uit uit {FI, .•• , Fk_l} sommige verschillend van elkaar te verklaren gelijk aan:
p
{maxI~.
-
!J'~
f
>qi'f¥JHV~
2k2nJ} =I::;i,j::;k-I
=
P {Q. > ...&k-I,m zodat: (4.3) sup P{ ~-I,m F,G F en G kontinuJi;;
1 2 a 12 } > qk m a-a , I 3 Hierin hangen a l en a3 van F en G af (zie(2.1),(2.2) en (3.1»0 Opmerking:We kunnen nu ook de echte simultane onbetrouwbaarheid voor n + m berekenen
van de methode gebaseerd op formule (1.1). Vanwege de asymptotische
2
X
k- I - verde ling van de toetsingsgrootheid van Kruskal-Wallis is die echte onbetrouwbaarheid (die afhangt van a en k) gelijk aan:
lim P { max n+"" I::;i,j::;k = lim P n+""
IR.
~o maxIR.
- 10 { l::;i,j::;k- R.
I>
0
2<a)-r
k-I - R-JOI
> 2 I k n+k } 620 IS 12 10 9 8 7 6 5
Tabel 4.1: Simultane onbetrouwbaarheid van de methode gebaseerd op formule (1.1) als n -+ <Xl
k= 3 4
(1=0. 10 .081 .060 .042 .029 .019 .012 .0079 .0050 .0019 .00044 .00003 0.05 .038 .027 .018 .011 .0071 .0044 .0027 .0016 .00057 .00011 .000008 0.01 .0068 .0042 .0025 .0014 .00082 .00046 .00025 .00014 .000042 .000007 .0000003
5. Berekening van (1k_1 zonder restrikties op F en G
Als we, behalve kontinuiteit, geen andere beperkingen opleggen aan de F en G uit formule (4.3) waarover het supremen genomen wordt, dan zal
blijken dat voor de gangbare waarden van (1 geldt (1k_1 > (1. (zie tabel 5.1). Dit bewijzen we als volgt:
de kans in formule (4.3) is maximaal voor die F en G waarvoor a
l - a3 maxi-maal is. Nu geldt: (5. I )
--
I 12 waarin: 2r-p = f(2F-l)GdF =f
(2F-I)GdF + J (2F-l)GdF {xl F(x)cn
{xI
F(x»n
(5.2)zodat 2r-p maximaal is als er getallen X
o
en Xl bestaan (xO<xl), waarvoorgeldt dat :---F(x O)
=
F(X)l=
i
G(x) = 0 voor X < Xo
en G(x) = I voor x > XI 2Nu is q-p juist ook maximaal in deze situatie, want altijd geldt:
(5.3) q_p2 = JG2dF - p2
~
J
GdF - p2 = p(l-p)~
1
en als (5.2) geldt, dan~
- p2 =I
Voor een F en Gals in (5.2) geldtdus:
I 2 a 1 - a3 = T2(k + k + 1) zodat we vinden: (5.4) (1 k-l }
M.b.v. een tabel van de verdelingsfunktie van de range van
normaal
ver-deelde grootheden, bijvoorbeeld Harter (1969), vinden we:tabel 5.1: ~k-I zonder restricties op F en G voor ~ = 0.01, ~ = 0.025,
~ = 0.05 en ~ = 0.10. k= 3 4 5 6 7 8 9 10 12 15 20 ~=0.01 .0153 .0181 .0182 .0178 .0172 .0167 .0162 .0158 .0151 .0143 .0134 0.025 .0303 .0361 .0386 .0385 .0379 .0372 .0365 .0358 .0347 .0334 .0318 0.05 .0512 .0643 .0682 .0690 .0688 .0682 .0674 .0667 .0652 .0633 .0612 0.10 .0877 .1123 .1208 .1240 .1250 .1250 .1245 .1238 .1'224 .1202 .1172 · - ~ ·_ _ O _ O O . O 6. ~k-l voor Lehmann-alternatieven
Nemen we in formule (4.3) het supremum aIleen over die paren F,G waarvoor
t
geldt: G= F voor zekere t E (O,m), dan zal blijken dat weI geldt: ~k-I < ~.(tabel 6.1) Als: G = Ft dan: OJ t P =. F dF ... 1
t+T
r=
q = fF2tdF =~I~
2t+lf
Ft+1dF = _1_ t+2zodat invullen in (5.1) geeft:
~2 ( ) ( 2 I I) ' 0 0 1
al-a3 = 12 + k-l
t+'2 -
t+1 -6' •
2t+1 ""7(-t1+--::1~)""2 - - II2In de volgende tabel z~Jn voor verschillende waarden van k de maximaie k2
waarden van a
l-a3-
12
als funktie van t gegeven:k= 3 4 5 6 7 8 9 10 12 15 20
k2
.01625 .02112 .02600 • a
zodat we voor a k- 1 vinden: tabel 6.1: a k_1 voor Lehmann-alternatieven: k= 3 4 5 6 7 8 9 10 12 15 20 a=O.O1 .0040 .0057 .0067 .0073 .0078 .0081 .0083 .0085 .0088 .0090 .0093 0.025 .0100 .0144 .0168 .0184 .0194 .0202 .0208 .0213 .0220 .0226 .0233 0.05 .0204 .0291 .0339 .0370 .0391 .0406 .0418 .0427 .0440 .0454 .0466 0.10 .0408 .0597 .0690 .0750 .0790 .0820 .0842 :0860 .0886 .091 1 .0935 7. a k_1 voor verschuivingsalternatieven
We beschouwen nu alternatieven waarvoor een a E Bbestaatt zodat G(x)=F(x-u) voor alle x E B.
Verder nemen we eerst even aan dat a > 0 (verschuiving naar rechts). Dan geldt: G(x) s F(x) veer alle x
zodat: 2r -
p.f
G (2F-l) dF ......
' f
G(2F-1) (iF +J
G(2F-1) dF S {xIF(x)S~} {xIF(x»~} (7.1) s 0 +J
(2F2-F) dF hIF(x»Dverder geldt nog steeds (zie 5.3):
2 < 1
q - P - 4
2
We kunnen echter nog wel een scherpere bovengrens veer q-p vinden
(waarvan bevendien de geldigheid niet alleen beperkt is tot verschuivings-al ternatieven) : Stelling 7: 1: (7.2) Bewijs: 2 q - P :5 2r - p
=
(7.3) = I - p' (I-p)
Ret laatste gelijkteken geldt vanwege de onafhankelijkheid van ZII' ZI2'
Zkl en ~2
We vinden m.b.v. (7.3):
waarbij het laatste gelijkteken voIgt uit:
IF
2dG=
I - 2fFGdF (partiele integratie) Vullen we (7.1) en (7.2) in in (5.1) dan volgt:Q.E.D.
(7.4)
voor G(x) = F(x-a) met a > O.
Ais a < 0 (verschuiving naar links) daar kijken we naar:
-1..1 I ' • • ., -1..1 n; •••. ••• ; -Zk I ' • • •• ; -1..kn
Ais F' de verdelingsfunktie is van -ZII en G' die van -~I dan geldt: F' (x) = I-F(-x)
en G'(x) = F'(x+a)
G' is dus een verschuiving van F' naar rechts (omdat a < 0). Verder geldt: als !ij het rangnummer is van -Zij onder aIle -1..11"·" -~n dan:
R~. = N - R •• + -1J "J.J
I
-zodat a -a
=
lim --2 var(RI - R ) I 3 n+<x> n - . -2 • = n~l';m 2n var -I'I (R' - -2'
R' )
= a' - at I 3 I , , 1 ( 2 I ) 1 . , h Nu ge dt dat al-a3 ~
12
k + 2k+1 , omdat G een verschu1v1ng naar rec ts is van F', zodat (7.4) ook geldt als a <o.
(7.4) geeft een bovengrens voor a
1-a3 bij verschuivingsalternatieven. Dat deze bovengrens niet erg veeI verlaagd kan worden, blijkt uit het volgende voorbeeld:
voorbeeld 7: 1:
Neem F gedefinieerd door
=
[x
x
+i
F(x) -C +i
al8 al8-i :::;
x :::; 0o :::;
x :::; !c en G gedefinieerd door G(x)=
F(x-!)dan geldt (onderstel c > i):
ic
2r - p =f
G(2F-l)dF ->J
(F(x) - ic)(2F(x) -1) dF(x) =o
en q-G
3 1 2 1JF=-!C·
5C
= ~ - -(1 +c)F + -=-c F = - - - . 3 2 2 F=! 24 4 p2 = ~ +&(.!.)
192 C zonder geldt:Bij deze F en G geldt dus voor C ~ ~:
1 (2 1 5
a
1 - a3 ~
12
k + 2k +16)
Als we deze waarde van a
1 - a3 en die uit (7.4) invullen in (4.3), dan vinden we de volgende onder- en bovengrenzen voor a :
p
Tabe17.1
Onder-en bovengrenzen voor a bij verschuivingsalternatieven.
k-l
a= 0.01 a=0.025 a=0.05 a=O. 10 k=3 .00790-.0100 .0175- .021 3 .0325-.0381 .0612-.0695 4 .0101-.0119 .0230-.0263 .0431-.0483 .0816-.0894 5 .0109- .0123 .0253-.0279 .0478-.0519 .0909-.0972 6 .0113-.0124 .0263-.0284 .0501-.0535 .0958-.1009 7 .0114-.0123 .0268-.0285 .0514-.0541 .0987-.1030 8 .01 14- . 0 121 .0271-.0285 .0521-.0544 .1005-.1040 9 .0114-.0120 .0273-.0284 .0526-.0544 . 1019- . 1046 10 .0114- .01 19 .0273-.0283 .0529-.0544 .1025-.1049 12 .01 14- .01 17 .0273-.0281 .0531-.0543 .1034-.1053 15 .0112-.0115 .0272-.0277 .0532-.0540 .1039-.1052 20 .0111-.0112 .0270-.0273 .0530-.0534 • 104 1- . 1049
We zien in tabel 7.1 dat voor verschuivingsalternatieven in het algemeen niet geldt dat a
k-1 ~ a(hoewel het niet veel scheelt). Als we echter twee extra eisen aan F opleggen (die in de praktijk wel eens vervuld zijn), dan blijkt dat altijd geldt dat a
k- 1 ~ a.
Stelling 7.2: Als G een verschuiving van F is, waarbij F symmetrisch en unimodaal is ( en kontinu), dan geldt:
(7.5) 2 <
_I
r - p - 6
Bewij s:
Daar het probleem translatie-invariant is, is het geen beperking om F symmetrisch in x = 0 te nemen.
o
~2r - p = f F (x-a)(2F(X)-I)dF(X)
+I
F(x-u) (2F(x)-I)dF(x)-~ 0 Nu geldt: (omdat F(-x) = 1 - F(x»:
o
I
F(x-a) (2F(x)-I) -~o
=
J
F(-y-a) {2F(-y)-1 }dF(-y) =+~ ~ zodat GO =
f
F(-y-a) {1-2F(y)dF(y) =o
~f{F(y+a) - I}{ 2F(y)-1 }dF(y)
o
(7.6)
(7.7)
2r - p =
J{
F(x+a) + F(x-a) - I} {2F(x)-I} dF(x)o
Voor x ~ 0 geldt: F(x+a) + F(x-a) ~ 2F(x)
Als x ~ lal geldt dit vanwege de unimodaliteit van F, hetgeen betekent dat F konkaaf is voor x ~ O.
Voor 0 ~ x < lal heeft men de symmetrie en unimodaliteit beide nodig om in te zien dat (7.7) geldt.
Deor (7.7) in te vullen in (7.6) vinden we:·
2< - P <
J
oo (2F(Xl-ll2dF(Xl=
~(2F(Xl
-o
~
F(X)=1 1 ) 3 .=.!..
F(:i:)=~ 6 Q.E.D.Met behulp van stelling 7.1 vinden we dat onder de voorwaarden van stelling 7.2 ook geldt:
(7.8) q - P2 < -1
Invullen van (7.5) en (7.8) in (5.1) geeft: zodat geldt: a
W;2}
ak- I S P{Stt-
I co> qk co - 2 · . , , k +1 tabel 7.2: Bovengrens voor ak_1 voor verschuivingen van symmetrische, unimodale verdelingen. k= 3 4 5 6 7 8 9 10 12 15 20 -0.01 .0057 .0071 .0077 .0081 .0083 .0085 .0086 .0087 .0089 .0091 .0093 0.025 .0135 .0173 .0190 .0200 .0206 .02 11 .0214 .0217 .0222 .0227 .0232 0.05 .0262 .0349 .0375 .0396 .0410 .0421 .0429 .0435 .0445 .0455 .0465
o.
10 .0498 .0673 .0749 .0793 .0823 .0845 .0860 .0872 .0893 .0913 .0933.
aOpmerking: Als we de symmetrie-eis laten vallen, dan zitten we weer in de situatie van tabel 7.1, omdat de F uit voorbeeld 7.1 unimodaal is.
Literatuur:
Hajek J., Asymptotic mormality of simple linear rank statistics under alternatives, The Annals of Mathematical Statistics, vol.39
(1968), page 325-346.
Harter H.L, Order statistics and their use in testing and estimation, vol I, Aerospace Research Laboratories,Government Printing Office, Washington (1969)
Miller R.G, Simultaneous statistical inference, McGraw-Hill, New York (1966) Nemenyi P., Distribution-free multiple comparisons.