Het Behrens-Fisher probleem
Citation for published version (APA):Linssen, H. N. (1987). Het Behrens-Fisher probleem. (Memorandum COSOR; Vol. 8702). Technische Universiteit Eindhoven.
Document status and date: Gepubliceerd: 01/01/1987
Document Version:
Uitgevers PDF, ook bekend als Version of Record
Please check the document version of this publication:
• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.
• The final author version and the galley proof are versions of the publication after peer review.
• The final published version features the final layout of the paper including the volume, issue and page numbers.
Link to publication
General rights
Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain
• You may freely distribute the URL identifying the publication in the public portal.
If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:
www.tue.nl/taverne
Take down policy
If you believe that this document breaches copyright please contact us at:
openaccess@tue.nl
providing details and we will investigate your claim.
TECHNISCHE UNIVERSITEIT EINDHOVEN
Faculteit Wiskunde en Informatica
Memorandum COSOR 87 - 02
HET BEHRENS-FISHER PROBLEEM
by
H.N. LINSSEN
Eindhoven, Nederland Januari 1987
HET BEHRENS-FISHER PROBLEEM H. N. Linssen Januari 1987 Inhoud Probleemstelling en notatie-afspraken 2 Waarnemingsreductie 2 2 3 De simultane verdeling van (01'02)
4 5 6 7 2 2 De verdeling van q
=
01/02 Resume De Behrens-verdeling Voorwaardelijke eigenschappen 8 Referenties 2 4 6 7 8 11HET BEHRENS-FISHER PROBLEEM
1 Probleemstelling en notatie-afspraken
Bij het Behrens-Fisher probleem gaat het om betrouwbaarheidsuitspraken over het verschil in lokatie van twee ongespecificeerde normale populaties. Steekproeven (x
1, ••• ,xn) en (Yl' ••• 'Yn) zijn gegeven. De interessante para-meter is '\l - l.l •
x Y
De kansdichtheid respectievelijk kansverdeling van x in t wordt genoteerd als p (t) respectievelijk x
P
x (t).De fiduciedichtheid respectievelijk verdeling van
e
in t wordt genoteerd als feet) respectievelijk Fe(t).Kortheidshalve wordt ook gedefinieerd: p(x) := p (x)
x en
p(x) en F (e) worden analoog gedefinieerd. Parameters worden zonodig achter ';' opgenomen. Voorbeelden: px(t;e) en fe(t;x). Een of meer van de argumenten kan worden weggelaten omwille van de eenvoud. Zo kan f (q;q)
q
worden genoteerd als f (q) of als f(q) of als f , afhankelijk van de
con-q q
text.
2 Waarnemingsreductie
Voldoende is x, _ _ y, s2, 52. Omdat aIleen het lokatie-vepsahil interessant x Y _ _
is, is x - Y relevant, maar x + y niet. Er geldt:
2 2 ( ax +
Oy)
i -
y ...
N lJ x - lJy , n ' 2 2zodat bij VGste s en s x y x - y - ().lx - l1y) t := ...
N
(0 ,
/'(5 2 + S2)In
x y 2 2o~
+O~)
S + S x y2
-De 'spil' t kan ook
~pgevat
worden als fiducievariabele bij vastea~
eno~.
Ais we definieren . (2 2) m1n (J ,0 x y en 2 2 max(o ,0 ) x y 2 2en 51 en s2 analoog, dan geldt dus fiducieel:
Samenvattend:
Van deze voorwaardelijke fiducieverdeling kan een onvoorwaardelijke (mar-gina Ie) worden gemaakt door de verwachting ervan te bepalen met betrekking
2 2 tot de 5imultane fiducieverdeling van (0
1'°2)'
2 2
3 De sirnultane verdeling van (a, ,( 2)
Zij \I = n - 1. dukt van twee
De simultane kansverdeling van \152/02
2 x x
X -verdelingen en wordt genoteerd als
\I
1
(t t)
2 2 ( :
~'-1
o x°
0 (Jy x y Daaruit voIgt meteen:
2/ 2 . h
en \IS 0 1S et
pra-y y (: ( • , • ), zoda t :
waarbij 0 ~ t, ~ t2 en gebruik gemaakt is van de eigenschap:
3
-De simultane kansverdeling van q door:
P (h , q-)
= -
h { .... h
q (:(~ q ' h) + ~(-,.. q,qh}
.... h) met qDe reden om over te gaan op deze nieuwe variabelen is dat de marginale verdeling van q aIleen van q afhangt en dat de fiducieverdeling van q
daarmee kan worden bepaald (zie verder). De kansverdeling van h gegeven q kan dan dienen voor de bepaling van de fiducieverdeling van h gegeven q.
Opmerking. Als kansvariabele opgevat varieert h in de steekproefruimte via s; bij vaste
o~.
Als fiducievariabele opgevat varieert h in de parameter-ruimte bij vaste s~. De grootheid h is een spil (pivot) van de fiduciele inversie. De kansverdeling is voorwaardelijk q en de fiducieverdeling is voorwaardelijk q. Er geldt: Er geldt: Phlq{h)=
Ph,q(h,q)/Pq(q) v-1 -ha/2 -hb/2 «h (e + e ) , met a=
1 + q/q en b=
1/q +q •
Er geldt ook (zie eerder):
zodat ftl h q,
=
N(O,cv/h) (X) met c=
(l+q)/(l+q) , ft1q(t)=
f
ft1q,x(t) fh1q(x) dxo
(X)J
!
-xt2 v-1 -ax -bx« 0 x exp 2cv • x (exp -2- + exp -2-)dx
4
--v-~
(
t2)-V-!
-v-~
(
t2)-v-~
«a 1 + - - +b l + -b acv cv waarbij a1
=
lac/2 en a2=
IbC72
en t v,o (t) de dicbtbeid in t is van eengescbaalde Student-verdeelde grootbeid met v vrijbeidsgraden en scbaal-parameter a, met andere woorden: Als t standaard-Student verdeeld is dan is cr.t gescbaald Student-verdeeld met schaalparameter a.
De fiducieverdeling is compleet (integreert tot 1), dus:
De fiducieverdeling van t gegeven q is dus een mengsel van twee gescbaalde Student-verdelingen.
Als q
=
1 geldt a=
b=
l+q en c 0:: 2/(1+q) en dusf
=
ttlq=l 2v,1'
Om tenslotte de marginale verdeling van t te vinden is bet nodig de fiducie-verdeling van q te kennen.
4 De verdeling van q =
o~
10;
Er geldt: P(q)
waarbij f een F-verdeelde kansvariabele is met v vrijbeidsgraden voor
v
teller en noemer.
De afgeleide naar
q
levert de met q geparametriseerde kansdicbtbeid vanq
OPt terwijl (min de) afleide naar q de met
q
geparametriseerdefiducie-dicbtbeid van q oplevert:
f(q)
=
q
p (S) - qp (qq)2 f q f
q v v
(0 ;;i q ;;i 1) •
5
-De fiducieverdeling is dus niet compleet. Er geldt
1 l/q fid :=
I
fq(x)dx = AI Pf (x)dx < 1 ! ! v 0 qDe fiducieverdeling voor q ~s compleet te maken door de niet-toegewezen fiducie (gelijk aan fid) toe te wijzen aan q
=
1. De fiducieverdelingis dan singulier in q = 1 met singuliere fiducie 1 - fide
Met betrekking tot de aldus gedefinieerd fiducieverdeling wordt nu de marginale verdeling van t bepaald. Tenslotte dus:
1
f(t) =
I
ft1q(t)f(q)dq + (l-fid) t 2v ,1(t) •o
Deze verdeling geven we de naam
'Wilkinson-verdeling',
omdat G.N. Wilkinson deze oplossing van het Behrens-Fisher probleem op verschillende plaatsen gesuggereerd heeft, o.a. in [1] en in een brief aan de auteur, echter zonder een gedetailleerde uitwerking te publiceren.Speciale gevallen
Als
q
dan is a = b = 1 + q, c = 2/(1+q) en dus £(t) = t2v, 1 (t). Als q ~ 0 dan fid t 1 en
f -j. t t q 2\1,a 1 2 met
a,
=
a/2 • Omdat fA (x) -+ Pf (x) geldt q,q v f(t) -+I
(1
q
2-\l-!
+ t ) v(l+x)h-l
_x _ _ _ dx • (l+x)vSubstitutie van y = xl (z+x) met z = 1 + t2 Iv leert: f(t)-+t ,(t).
5 Resume Waarnemingsmodel: 2 x. ""N{ll ,cr) 1. X X 6 -2 y. ,.., N{ll ,cr ) 1 Y Y 2 2
Voldoende grootheden: x, y, Sx en Sy.
(i
=
1, .•• , n) •De parameter van interesse is II - II • Daarom is relevant:
x y x - y , en Irrelevant is:
-x + y en sgn{ln{s /s )} 2 2 x y V~~r de fiducievariabele geldt: II - II - (x -y)
x y t :=
-;:;:::;::::::=:;:::::;:::::--{(s~ + s~)ln b1J .. gegeven cr2 1 en 02. 2De steekproefdichtheid wordt gefactoriseerd volgens:
Uit PA en de waarde van
q
voIgt door inversie de (incomplete)fiducie-q
verdeling voor q. Deze wordt compleet gemaakt door de niet-toegewezen
2
fiducie toe te wijzen aan q
=
1. Uit PS2Iq
en s2 voIgt de fiducieverdeling voor0;
gegeven q. Het produkt van deze2twee verdelingen is de simultane2
verdeling van q en 02. De marginale verdeling van t is nu de verwachting
van de verdeling van t gegeven q en
0;
met betrekking tot deze simuitane verdeling.7
-6 De Behrens-verdeling
Indien simultane uitspraken vereist zijn voor ~ x en ~ y dan is de simultane verdeling van IJ
_ - 2 2 x en ~y nodig. De minimaal voldoende grootheid is (x,y,s ,s ), die tevens relevant is voor de simultane uitspraken. x y Het is bekend dat:
~ ~ x + t fs2
2/n en IJ analoog verdeeld.
x v y
De simultane dichtheid is het produkt van de marginale dichtheden. De marginale verdeling daaruit bepaald van
t == (IJ x -~ y - (x-y»/f(S2 +s2)/n x y
wordt de Behrens-verdeling genoemd en is getabelleerd in New Cambridge elementary statistical Tables (1984) [2]. De verdeling kan worden geschre-ven als:
00
F' (q k) == (t/1+k - xYk)dx
De dichtheid is een mengsel van (standaard) Student verdelingen. De Behrens-verdeling geeft onnodig conservatieve intervallen voor IJ
x- lJy omdat irrelevante waarnemingscomponenten niet zijn geelimineerd. Enkele percentagepunten van de Behrens-verdeling worden in onderstaande tabel naast de overeenkomstige percentagepunten van de in deze notitie afgeleide Wilkinson-verdeling.
8
-Tabel
97.5% punten van de
Behrens (B) en Wilkinson (W) verdelingen
B
=
W B W B W W "", 1 12.71 15.56 13.57 17 .36 9.50 17.97 4.30 2 4.30 4.41 4.39 4.56 4.11 4.62 2.78 3 3.18 3.19 3.23 3.13 3.24 2.45 4 2.78 2.77 2.78 2.75 2.79 2.31 5 2.57 2.56 2.56 2.55 2.57 2.23 6 2.45 2.44 2.44 2.43 2.44 2.18 7 2.36 2.36 2.35 2.35 2.14 8 2.31 2.30 2.29 2.29 2.12 10 2.23 2.22 2.22 2.21 2.09 12 2.18 2.17 2.17 2.17 2.06 24 2.06 2.06 2.06 2.06 2.01 00 1.96 1. 96 1.96 1.96 7 Voorwaardelijke eigenschappenHet is niet moeilijk te zien dat Pt1q(';q)
=
ft1q(·;q). Immers:100 Ptlq(o;q)
=
I
Ptlq,h(o;q,X)Phlq(x;q)dx =o
100 =I
ftlq,h(o;q,x)fhlq(x;q)dx=
ft1q(*;q) •o
9
-De steekproefverdeling van t voorwaardelijk
q
is dus ook een mengsel van twee geschaalde Student-verdelingen met 2\1 vrijheidsgraden. Er geldtwaarbij
Bij gegeven
q
zijn de (on)waarheidskansen van betrouwbaarheidsintervallen ongelijk aan de nominale (on)betrouwbaarheid en afhankelijk van q.V~~r Wilkinson- en Behrens-intervallen zijn in de onderstaande tabel de
op <l geconditioneerde onwaarheidskansen van tweezijdige
95%-betrouwbaar-heidsintervallen voor \I
=
1 weergegeven.onwaarheidskansen % (voorwaardelijk
q,
afhankelijk q) van op de Wilkinson- en Behrens-verdeling gebaseerdetweezijdige betrouwbaarheidsintervallen (nominale onbetrouwbaarheid
=
5%) Wilkinson Behrens q+ q+ -1 -2 -3 -1 -2 -3 <li-S 5 5 <li-S 5 5 1 5.0 8.5 24.0 52.5 1 0.3 0.6 2.0 8.6 5 -1 0.8 1.1 2.9 10.3 5 -1 0.4 0.5 1.4 5.6 5 -2 0.5 0.6 0.9 2.4 5 -2 0.4 0.4 0.6 1.7 5 -3 0.5 0.5 0.6 0.9 5 -3 0.5 0.5 0.6 0.9Behrens-intervallen zijn soms aanzienlijk conservatiever dan Wilkinson-intervallen. De deelverzameling van de steekproefruimte gegeven door
<l = 1 is negatief semi-relevant voor Wilkinson-interval len.
Bij iedere
q
is de verwachte onwaarheidskans met betrekking tot de fiducie-verdeling van q gelijk aan de nominale onbetrouwbaarheid.Welch en Aspin [3] construeerden betrouwbaarheidsintervallen zodanig dat, voor iedere q, de verwachte onwaarheidskans met betrekking tot de steek-proefverdeling van
q
gelijk is aan de nominale onbetrouwbaarheid. Dan ontstaat de artefact dat <l = 1 een negatief relevante deelverzameling van de teekproefruimte definieert (zie tabel).10
-onwaarheidskansen % voor Wilkinson- en Welch-interval len (nominale onbetrouwbaarheid 5%, v
=
8,q
=
1)q+
2 -1 2 -2 2 -3 Wilkinson 5.0 6.2 10.9 20.1 Welch-Asp in 5.4 6.8 11.6 21.0
Voor v
=
8 zijn de verschillen niet groot. Voor kleinere aantal vrijheids-graden zijn de Welch-waarden helaas niet getabelleerd. Tabellen in [4]. In het geval datq
=
1, zijn de Welch-Aspin intervallen altijd bevat in de intervallen die je krijgt als je mag aannemen dat q=
1, hetgeen strijdig is met de intuitie.Een approximatie voor de Welch-Aspin-tabelwaarden is gegeven door Welch [5]. Daarbij wordt de gewone Student-verdelingstabel gebruikt met een benaderend aantal vrijheidsgraden
v
gegeven door<v
= v 2 .
Er geldt:
v
= v ~q
=
0 env
=
2v ~q
= 1.Als
v
niet geheel is kan er lineair geinterpoleerd worden tussen de Student-tabelwaarden voor de naburige gehele aantallen vrijheidsgraden.De voorwaardelijke eigenschappen van op de lineair geinterpoleerde benade-rende t-waarde van Welch gebaseerde tweezijdige betrouwbaarheidsintervallen is vergeleken met die van de Wilkinson-intervallen (zie tabel).
11
-onwaarheidskansen l.n % voor Wilkinson- en benaderende
Welch-interval len (nominale onbetrouwbaarheid
=
5%, v=
1) Wilkinson Welch-benadering q-+ q-+ -1 -2 -3 -1 -2 -3-
5 5 5 Ci+ 5 5 5 q+ 1 5.0 8.5 24.0 52.5 1 5.0 8.5 24.0 52.5 5 -1 0.8 1.1 2.9 10.3 5 -1 1.1 1.6 4.2 14. 1 5 -2 0.5 0.6 0.9 2.4 5 -2 0.7 0.8 1.2 3.1 5 -3 0.5 0.5 0.6 0.9 5 -3 0.6 0.6 0.7 1.0Het oordeel of de benadering van Welch een bevredigende approximatie levert van de Wilkinson-waarden is niet zonder meer te geven en hangt af van het criterium dat gekozen wordt.
8 Referenties
[1] G.N. Wilkinson, 1977, On Resolving the Controversy in Statistical
Interference, J.R. Statist. Soc. B, 39, 119-171
[2] New Cambridge Elementary Statistical Tables, 1984, D.V. Lindley &
W.F. Scott, Cambridge University Press.
[3] A.A. Aspin, 1949, Tables for use in comparisons whose accuracy involves two variances, separately estimated. Biometrika 36, 1949, 290-293.
[4] Biometrika Tables for Statisticians, 1970, E.S. Pearson & H.O.
Hartley, Cambridge University Press.