Het Behrens-Fisher probleem

(1)

Het Behrens-Fisher probleem

Citation for published version (APA):

Linssen, H. N. (1987). Het Behrens-Fisher probleem. (Memorandum COSOR; Vol. 8702). Technische Universiteit Eindhoven.

Document status and date: Gepubliceerd: 01/01/1987

Document Version:

Uitgevers PDF, ook bekend als Version of Record

Please check the document version of this publication:

• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.

• The final author version and the galley proof are versions of the publication after peer review.

• The final published version features the final layout of the paper including the volume, issue and page numbers.

Link to publication

General rights

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain

• You may freely distribute the URL identifying the publication in the public portal.

If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:

www.tue.nl/taverne

Take down policy

If you believe that this document breaches copyright please contact us at:

openaccess@tue.nl

providing details and we will investigate your claim.

(2)

TECHNISCHE UNIVERSITEIT EINDHOVEN

Faculteit Wiskunde en Informatica

Memorandum COSOR 87 - 02

HET BEHRENS-FISHER PROBLEEM

by

H.N. LINSSEN

Eindhoven, Nederland Januari 1987

(3)

HET BEHRENS-FISHER PROBLEEM H. N. Linssen Januari 1987 Inhoud Probleemstelling en notatie-afspraken 2 Waarnemingsreductie 2 2 3 De simultane verdeling van (01'02)

4 5 6 7 2 2 De verdeling van q

=

01/02 Resume De Behrens-verdeling Voorwaardelijke eigenschappen 8 Referenties 2 4 6 7 8 11

(4)

HET BEHRENS-FISHER PROBLEEM

1 Probleemstelling en notatie-afspraken

Bij het Behrens-Fisher probleem gaat het om betrouwbaarheidsuitspraken over het verschil in lokatie van twee ongespecificeerde normale populaties. Steekproeven (x

1, ••• ,xn) en (Yl' ••• 'Yn) zijn gegeven. De interessante para-meter is '\l - l.l •

x Y

De kansdichtheid respectievelijk kansverdeling van x in t wordt genoteerd als p (t) respectievelijk _x

P

_x(t).

De fiduciedichtheid respectievelijk verdeling van

e

in t wordt genoteerd als feet) respectievelijk Fe(t).

Kortheidshalve wordt ook gedefinieerd: p(x) := p (x)

x en

p(x) en F (e) worden analoog gedefinieerd. Parameters worden zonodig achter ';' opgenomen. Voorbeelden: px(t;e) en fe(t;x). Een of meer van de argumenten kan worden weggelaten omwille van de eenvoud. Zo kan f (q;q)

q

worden genoteerd als f (q) of als f(q) of als f , afhankelijk van de

con-q q

text.

2 Waarnemingsreductie

Voldoende is x, _{_} _{_} y, s2, 52. Omdat aIleen het lokatie-vepsahil interessant _x _{Y _} _{_}

is, is x - Y relevant, maar x + y niet. Er geldt:

2 2 ( ax +

Oy)

i -

y ...

N lJ x - lJy , n ' 2 2

zodat bij VGste s en s _x y x - y - ().lx - l1y) t := ...

N

(0 ,

/'(5 2 + S2)

In

x y 2 2

o~

+

O~)

S + S x y

(5)

2

-De 'spil' t kan ook

~pgevat

worden als fiducievariabele bij vaste

a~

en

o~.

Ais we definieren . (2 2) m1n (J ,0 x y en 2 2 max(o ,0 ) x y 2 2

en 51 en s2 analoog, dan geldt dus fiducieel:

Samenvattend:

Van deze voorwaardelijke fiducieverdeling kan een onvoorwaardelijke (mar-gina Ie) worden gemaakt door de verwachting ervan te bepalen met betrekking

2 2 tot de 5imultane fiducieverdeling van (0

1'°2)'

2 2

3 De sirnultane verdeling van (a, ,( 2)

Zij \I = n - 1. dukt van twee

De simultane kansverdeling van \152/02

2 x x

X -verdelingen en wordt genoteerd als

\I

1

(t t)

2 2 ( :

~'-1

o _x

°

0 (J

y x y Daaruit voIgt meteen:

2/ 2 . h

en \IS 0 1S et

pra-y y (: ( • , • ), zoda t :

waarbij 0 ~ t, ~ t2 en gebruik gemaakt is van de eigenschap:

(6)

3

-De simultane kansverdeling van q door:

P (h _,q-)

= -

h { .... h

_q (:(~ _{q '}h) + ~(-_{,.. q,q}

h}

.... h) met q

De reden om over te gaan op deze nieuwe variabelen is dat de marginale verdeling van q aIleen van q afhangt en dat de fiducieverdeling van q

daarmee kan worden bepaald (zie verder). De kansverdeling van h gegeven q kan dan dienen voor de bepaling van de fiducieverdeling van h gegeven q.

Opmerking. Als kansvariabele opgevat varieert h in de steekproefruimte via s; bij vaste

o~.

Als fiducievariabele opgevat varieert h in de parameter-ruimte bij vaste s~. De grootheid h is een spil (pivot) van de fiduciele inversie. De kansverdeling is voorwaardelijk q en de fiducieverdeling is voorwaardelijk q. Er geldt: Er geldt: Phlq{h)

=

Ph,q(h,q)/Pq(q) v-1 -ha/2 -hb/2 «h (e + e ) , met a

=

1 + q/q en b

=

1/q +

q •

Er geldt ook (zie eerder):

zodat ftl h _q,

=

N(O,cv/h) (X) met c

=

(l+q)/(l+q) , ft1q(t)

=

f

ft1q,x(t) fh1q(x) dx

o

(X)

J

!

-xt2 v-1 -ax -bx

« 0 x exp 2cv • x (exp -2- + exp -2-)dx

(7)

4

--v-~

(

t2

)-V-!

-v-~

(

t2

)-v-~

«a 1 + - - +b l + -b acv cv waarbij a

1

=

lac/2 en a2

=

IbC72

en t v,o (t) de dicbtbeid in t is van een

gescbaalde Student-verdeelde grootbeid met v vrijbeidsgraden en scbaal-parameter a, met andere woorden: Als t standaard-Student verdeeld is dan is cr.t gescbaald Student-verdeeld met schaalparameter a.

De fiducieverdeling is compleet (integreert tot 1), dus:

De fiducieverdeling van t gegeven q is dus een mengsel van twee gescbaalde Student-verdelingen.

Als q

=

1 geldt a

=

b

=

l+q en c 0:: 2/(1+q) en dus

f

=

t

tlq=l 2v,1'

Om tenslotte de marginale verdeling van t te vinden is bet nodig de fiducie-verdeling van q te kennen.

4 De verdeling van q =

o~

10;

Er geldt: P(q)

waarbij f een F-verdeelde kansvariabele is met v vrijbeidsgraden voor

v

teller en noemer.

De afgeleide naar

q

levert de met q geparametriseerde kansdicbtbeid van

q

OPt terwijl (min de) afleide naar q de met

q

geparametriseerde

fiducie-dicbtbeid van q oplevert:

f(q)

=

q

p (S) - qp (qq)

2 f q f

q v v

(0 ;;i q ;;i 1) •

(8)

5

-De fiducieverdeling is dus niet compleet. Er geldt

1 l/q fid :=

I

_fq(x)dx= AI Pf (x)dx < 1 ! ! v 0 q

De fiducieverdeling voor q ~s compleet te maken door de niet-toegewezen fiducie (gelijk aan fid) toe te wijzen aan q

=

1. De fiducieverdeling

is dan singulier in q = 1 met singuliere fiducie 1 - fide

Met betrekking tot de aldus gedefinieerd fiducieverdeling wordt nu de marginale verdeling van t bepaald. Tenslotte dus:

1

f(t) =

I

_{ft1q(t)f(q)dq + (l-fid) t 2v ,1(t) •}

o

Deze verdeling geven we de naam

'Wilkinson-verdeling',

omdat G.N. Wilkinson deze oplossing van het Behrens-Fisher probleem op verschillende plaatsen gesuggereerd heeft, o.a. in [1] en in een brief aan de auteur, echter zonder een gedetailleerde uitwerking te publiceren.

Speciale gevallen

Als

q

dan is a = b = 1 + q, c = 2/(1+q) en dus £(t) = t

2v, 1 (t). Als q ~ 0 dan fid t 1 en

f -j. t t q 2\1,a 1 2 met

a,

=

a/2 • Omdat fA (x) -+ Pf (x) geldt q,q v f(t) -+

I

(1

q

2

-\l-!

+ t ) v(l+x)

h-l

_x _ _ _ dx • (l+x)v

Substitutie van y = xl (z+x) met z = 1 + t2 Iv leert: f(t)-+t ,(t).

(9)

5 Resume Waarnemingsmodel: 2 x. ""N{ll ,cr) 1. X X 6 -2 y. ,.., N{ll ,cr ) 1 Y Y 2 2

Voldoende grootheden: x, y, Sx en Sy.

(i

=

1, .•• , n) •

De parameter van interesse is II - II • Daarom is relevant:

x y x - y , en Irrelevant is:

-x + y en sgn{ln{s /s )} 2 2 x y V~~r de fiducievariabele geldt: II - II - (x -

y)

x y t :

=

-;:;:::;::::::=:;:::::;:::::--{(s~ + s~)ln b1J .. gegeven cr2 ₁en 02. 2

De steekproefdichtheid wordt gefactoriseerd volgens:

Uit PA en de waarde van

q

voIgt door inversie de (incomplete)

fiducie-q

verdeling voor q. Deze wordt compleet gemaakt door de niet-toegewezen

2

fiducie toe te wijzen aan q

=

1. Uit PS2

Iq

en s2 voIgt de fiducieverdeling voor

0;

gegeven q. Het produkt van deze2twee verdelingen is de simultane

2

verdeling van q en 02. De marginale verdeling van t is nu de verwachting

van de verdeling van t gegeven q en

0;

met betrekking tot deze simuitane verdeling.

(10)

7

-6 De Behrens-verdeling

Indien simultane uitspraken vereist zijn voor ~ _x en ~ _y dan is de simultane verdeling van IJ

_ - 2 2 x en ~y nodig. De minimaal voldoende grootheid is (x,y,s ,s ), die tevens relevant is voor de simultane uitspraken. _x _y Het is bekend dat:

~ ~ x + t fs2

2/n en IJ analoog verdeeld.

x v y

De simultane dichtheid is het produkt van de marginale dichtheden. De marginale verdeling daaruit bepaald van

t == (IJ _x-~ _y- (x-y»/f(S2 +s2)/n _x _y

wordt de Behrens-verdeling genoemd en is getabelleerd in New Cambridge elementary statistical Tables (1984) [2]. De verdeling kan worden geschre-ven als:

00

F' (q k) == (t/1+k - xYk)dx

De dichtheid is een mengsel van (standaard) Student verdelingen. De Behrens-verdeling geeft onnodig conservatieve intervallen voor IJ

x- lJy omdat irrelevante waarnemingscomponenten niet zijn geelimineerd. Enkele percentagepunten van de Behrens-verdeling worden in onderstaande tabel naast de overeenkomstige percentagepunten van de in deze notitie afgeleide Wilkinson-verdeling.

(11)

8

-Tabel

97.5% punten van de

Behrens (B) en Wilkinson (W) verdelingen

B

=

W B W B W W "", 1 12.71 15.56 13.57 17 .36 9.50 17.97 4.30 2 4.30 4.41 4.39 4.56 4.11 4.62 2.78 3 3.18 3.19 3.23 3.13 3.24 2.45 4 2.78 2.77 2.78 2.75 2.79 2.31 5 2.57 2.56 2.56 2.55 2.57 2.23 6 2.45 2.44 2.44 2.43 2.44 2.18 7 2.36 2.36 2.35 2.35 2.14 8 2.31 2.30 2.29 2.29 2.12 10 2.23 2.22 2.22 2.21 2.09 12 2.18 2.17 2.17 2.17 2.06 24 2.06 2.06 2.06 2.06 2.01 00 1.96 _1.96 _1.96 1.96 7 Voorwaardelijke eigenschappen

Het is niet moeilijk te zien dat Pt1q(';q)

=

ft1q(·;q). Immers:

100 Ptlq(o;q)

=

I

Ptlq,h(o;q,X)Phlq(x;q)dx =

o

100 =

I

ftlq,h(o;q,x)fhlq(x;q)dx

=

ft1q(*;q) •

o

(12)

9

-De steekproefverdeling van t voorwaardelijk

q

is dus ook een mengsel van twee geschaalde Student-verdelingen met 2\1 vrijheidsgraden. Er geldt

waarbij

Bij gegeven

q

zijn de (on)waarheidskansen van betrouwbaarheidsintervallen ongelijk aan de nominale (on)betrouwbaarheid en afhankelijk van q.

V~~r Wilkinson- en Behrens-intervallen zijn in de onderstaande tabel de

op <l geconditioneerde onwaarheidskansen van tweezijdige

95%-betrouwbaar-heidsintervallen voor \I

=

1 weergegeven.

onwaarheidskansen % (voorwaardelijk

q,

afhankelijk q) van op de Wilkinson- en Behrens-verdeling gebaseerde

tweezijdige betrouwbaarheidsintervallen (nominale onbetrouwbaarheid

=

5%) Wilkinson Behrens q+ q+ -1 -2 -3 -1 -2 -3 <li-S 5 5 <li-S 5 5 1 5.0 8.5 24.0 52.5 1 0.3 0.6 2.0 8.6 5 -1 0.8 1.1 2.9 10.3 5 -1 0.4 0.5 1.4 5.6 5 -2 0.5 0.6 0.9 2.4 5 -2 0.4 0.4 0.6 1.7 5 -3 0.5 0.5 0.6 0.9 5 -3 0.5 0.5 0.6 0.9

Behrens-intervallen zijn soms aanzienlijk conservatiever dan Wilkinson-intervallen. De deelverzameling van de steekproefruimte gegeven door

<l = 1 is negatief semi-relevant voor Wilkinson-interval len.

Bij iedere

q

is de verwachte onwaarheidskans met betrekking tot de fiducie-verdeling van q gelijk aan de nominale onbetrouwbaarheid.

Welch en Aspin [3] construeerden betrouwbaarheidsintervallen zodanig dat, voor iedere q, de verwachte onwaarheidskans met betrekking tot de steek-proefverdeling van

q

gelijk is aan de nominale onbetrouwbaarheid. Dan ontstaat de artefact dat <l = 1 een negatief relevante deelverzameling van de teekproefruimte definieert (zie tabel).

(13)

10

-onwaarheidskansen % voor Wilkinson- en Welch-interval len (nominale onbetrouwbaarheid 5%, v

=

8,

q

=

1)

q+

2 -1 2 -2 2 -3 Wilkinson 5.0 6.2 10.9 20.1 Welch-Asp in 5.4 6.8 11.6 21.0

Voor v

=

8 zijn de verschillen niet groot. Voor kleinere aantal vrijheids-graden zijn de Welch-waarden helaas niet getabelleerd. Tabellen in [4]. In het geval dat

q

=

1, zijn de Welch-Aspin intervallen altijd bevat in de intervallen die je krijgt als je mag aannemen dat q

=

1, hetgeen strijdig is met de intuitie.

Een approximatie voor de Welch-Aspin-tabelwaarden is gegeven door Welch [5]. Daarbij wordt de gewone Student-verdelingstabel gebruikt met een benaderend aantal vrijheidsgraden

v

gegeven door

<v

= v 2 .

Er geldt:

v

= v ~

q

=

0 en

v

=

2v ~

q

= 1.

Als

v

niet geheel is kan er lineair geinterpoleerd worden tussen de Student-tabelwaarden voor de naburige gehele aantallen vrijheidsgraden.

De voorwaardelijke eigenschappen van op de lineair geinterpoleerde benade-rende t-waarde van Welch gebaseerde tweezijdige betrouwbaarheidsintervallen is vergeleken met die van de Wilkinson-intervallen (zie tabel).

(14)

11

-onwaarheidskansen l.n % voor Wilkinson- en benaderende

Welch-interval len (nominale onbetrouwbaarheid

=

5%, v

₌

1) Wilkinson Welch-benadering q-+ q-+ -1 -2 -3 -1 -2 -3

-

5 5 5 Ci+ 5 5 5 q+ 1 5.0 8.5 24.0 52.5 1 5.0 8.5 24.0 52.5 5 -1 0.8 1.1 2.9 10.3 5 -1 1.1 1.6 4.2 14. 1 5 -2 0.5 0.6 0.9 2.4 5 -2 0.7 0.8 1.2 3.1 5 -3 0.5 0.5 0.6 0.9 5 -3 0.6 0.6 0.7 1.0

Het oordeel of de benadering van Welch een bevredigende approximatie levert van de Wilkinson-waarden is niet zonder meer te geven en hangt af van het criterium dat gekozen wordt.

8 Referenties

[1] G.N. Wilkinson, 1977, On Resolving the Controversy in Statistical

Interference, J.R. Statist. Soc. B, 39, 119-171

[2] New Cambridge Elementary Statistical Tables, 1984, D.V. Lindley &

W.F. Scott, Cambridge University Press.

[3] A.A. Aspin, 1949, Tables for use in comparisons whose accuracy involves two variances, separately estimated. Biometrika 36, 1949, 290-293.

[4] Biometrika Tables for Statisticians, 1970, E.S. Pearson & H.O.

Hartley, Cambridge University Press.