• No results found

Fiducierekening

N/A
N/A
Protected

Academic year: 2021

Share "Fiducierekening"

Copied!
49
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Citation for published version (APA):

Linssen, H. N. (1986). Fiducierekening. (Memorandum COSOR; Vol. 8615). Technische Universiteit Eindhoven.

Document status and date: Gepubliceerd: 01/01/1986

Document Version:

Uitgevers PDF, ook bekend als Version of Record

Please check the document version of this publication:

• A submitted manuscript is the version of the article upon submission and before peer-review. There can be important differences between the submitted version and the official published version of record. People interested in the research are advised to contact the author for the final version of the publication, or visit the DOI to the publisher's website.

• The final author version and the galley proof are versions of the publication after peer review.

• The final published version features the final layout of the paper including the volume, issue and page numbers.

Link to publication

General rights

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain

• You may freely distribute the URL identifying the publication in the public portal.

If the publication is distributed under the terms of Article 25fa of the Dutch Copyright Act, indicated by the “Taverne” license above, please follow below link for the End User Agreement:

www.tue.nl/taverne

Take down policy

If you believe that this document breaches copyright please contact us at:

openaccess@tue.nl

providing details and we will investigate your claim.

(2)

Memorandum COSOR 86-15

FIDUCIEREKENING

H.N. Linssen

Notities t.b.v. een aantal voordrachten voor de Studiegroep Statistiek te Eindhoven in het najaar van 1985

(met later commentaar en gewijzigde volgorde).

(3)

1. INLEIDING

1.1. Notatie

1.2. Fiduciele inversie

2. DE FIDUCIELE METHODE VOOR MEER PARAMETERS 9

2.1. Schatting in lokatie-schaal families 10

2.2. Relevante deelverzamelingen van de steekproefruimte 13 2.3. Parameterschatting in de standaard-Weibull verdeling 15

2.4. Het lineaire model 17

2.5. Schatting in de uniforme familie 19

2.6. Parameterschatting in de Pareto-verde ling 22

2.7. Parameterschatting in de inverse Gauss-verdeling 26

3. HET BEHRENS-FISHER PROBLEEM: EEN CRUClAAL GEVAL 27

4. FIDUCIEEL TOETSEN 32

4.1. Meervoudige vergelijkingen 40

4.2. Schatten en toetsen met betrekking tot de kleinste

(4)

1. INLEIDING

1.1. Notatie

Stochastische variabelen worden onderstreept.

De kansdichtheid respectievelijk verdelingsfunctie van x in x wordt

aange-geven met Px respectievelijk Px{x). Kansuitspraken van de vorm x E Xworden

aangegeven met P{~ E X).

Fiduciele variabelen worden bovenstreept.

De fiducieverdeling respectievelijk cumulatieve fiducieverdeling van e in e wordt aangegeven met fe{e) respectievelijk Fe{e). Fiducie-uitspraken van

de vorm

e

E 0 worden aangegeven met F{e E 0).

De indices worden kortheidshalve weggelaten volgens de afspraak: p{x) :: p (x) x en p{x) :: P{x ~ x)

=

P (x) x 1.2. FiduciE!le inversie

Als p{x;e)

=

q (met 0 ~ q ~ 1) een eeneenduidig verband tussen x en e

defi-nieert is fiduciele inversie mogelijk volgens:

a) Fisher: dP

=

ap dx

ax

formeel equivalent met: dP f(e;x) = Iap/aeI .

ap

=

as

de

b) Wilkinson frequentieuitspraken als: de kans dat x ~ x (e) 15 gelijk

- p

aan p, is na waarneming x te inverteren tot: de 'kans' (= fiducie) dat

e ~ x-1{x) is P (of l-p) (e

=

fiducievariabele). p

Op deze manier wordt een fiducieverdeling gedefinieerd op de parameter-ruimte. Deze verdeling kent de gebruikelijke frequentie-interpretatie.

p{x;e) is uniform verdeeld en wordt de spil (pivot) van de inverse genoemd.

(5)

Objectief ware frequentieuitspraken uitgaande van hypothetische parameter-waarden worden geinverteerd tot objectief verifieerbare 'kans' uitspraken uitgaande van de waarneming (zie figuur).

p(xle)

=

1-!a fiducieel interval

e

(onbekend)

e

t

x (waargenomen) __ x

Hoe werkt dat?

P(x;lJ)

=

x-lJ

J

q>(t)dt -co Anders gezegd: inversie - ( ) ~ "'" N(lJ,1) -+ ~-lJ '" N(O,1) -+ II '" N x,1 •

x-ll

=

u definieert hetzelfde verband als P(x;lJ) = p, daarom is X-ll ook

p

als spil van de inversie te gebruiken.

In wat ik maar ruwweg de Amerikaanse school noem, wordt de beslissings-theoretische aanpak gekozen ('acceptance sampling'). Kwadratische verlies minimaliseren, of onderscheidingsvermogen maximaliseren voeren daarbij de boventoon bij de construe tie van sehatters of van kritieke gebieden en betrouwbaarheidsintervallen. In wat ik de logica van de statistische besluitvorming noem, is dat niet nodig, zelfs niet gewenst, want criteria

optimaliseren betekent bijna altijd dat er relevante deelverzamelingen van

de steekproefruimte ontstaan, dat zijn verzamelingen die van andere steek-proefverzamelingen aIleen verschillen met betrekking tot eomponenten, die

(6)

niet van de parameter afhangen, en waarop de betrouwbaarheid van betrouw-baarheidsinterva11en afwijkt van de nominale betrouwbaarheid. Snel een voorbeeld (Cox).

meetapparaat 1: ~ ~ N(~,l) (kans ~).

meetapparaat 2: ~ ~ N(~,02) (kans ~, 02 » 1, bekend).

waarneming: (t,x), t

=

1 voor apparaat 1, 2 voor apparaat 2.

HO: ~

=

0 wordt getoetst tegen H

1: ~

=

1. Het kritieke gebied volgens Neyman-Pearson is:

t

=

1 dan x > 1.28 (voorw. onbetrouwb.

=

10%)

t = 2 dan x > 50 (voorw. onbetrouwb. = 0%).

Dit is bes1issingstheoretisch misschien ooit 1n orde te praten, maar in wetenschappe1ijke context absurd.

!

is een zogenaamde anailZair, want zijn verde1ing hangt niet van de

para-meter af. Wat we uit dit voorbee1d leren, is dat er geconditioneerd moet worden op anci11airen.

(Conditioneringsprinaipe van Fisher)

Stel dat de waarneming(en) x opgesplitst wordt als

waarbij a1 en a

2 ancil1airen Z1Jn en xR de relevant geachte component. Het conditioneringsprincipe zegt nu dat de statistische besluitvorming gebaseerd moet worden op f(xRJa

1,a2). A1s bovendien geldt dat deze voor-waardelijke frequentieverdeling niet van a2 afhangt, dan heet a2 'irrele-vant' en mag geen invloed hebben op de bes1uitvorming. Dit is het reZevan-tieprinaipe, dat zegt "AI het relevante meenemen (bij de besluitvorming), a1 het irrelevante niet".

(16 augustus 1986: Niet correct. Ook niet-ancillairen kunnen niet-relevant

zijn. Voorbeeld: twee onafhankelijke normale steekproeven kunnen door toe-passing van het conditioneringsprincipe gereduceerd worden tot de steek-proefgemidde1den en -spreidingen. De twee gemiddelden zijn equivalent met hun som en verschil. Als aIleen het lokatieverschil de interessante para-meter is, dan is de som van de gemiddelden niet relevant (intersubjectieve overeenstemming).)

(7)

Voorbeeld. ~ ~N(~,l) met I~I de interessante parameter. Dan:

x

=

(Ixl,sgn(x» ,

waarbij sgn(x) irrelevant. Besluitvorming baseren op p(lxl).

Voorbeeld. Als ~2 _ X2(e2 ), hoe een rechtseenzijdig 1-a interval voor e2

te construeren? Methode: bij gegeven x2 en e2 zodanig dat p(X2(e2

) >x2 ) a~

Voor x

=

0 bestaat er geen interval en voor andere x niet aIle, want

p(X2(e2)

> x2 ) ~ P(X2 > x2 ).

Als ~ ~ N(e,l) dan bestaan er l-a intervallen voor e voor aIle x. Rieruit

kun je dus niet intervallen voor e2 afleiden.

Dit voor betrouwbaarheidsintervallen bekende verschijnsel heet in fiduciele termen het principe van de onsamenhangendheid (incoherence): uit de fiducie-verdeling voor een parameter kan niet de fiduciefiducie-verdeling voor een functie van de parameter worden afge1eid (tenzij die functie eeneenduidig is), omdat dan de frequentie-interpretatie verloren gaat. Fiducieverdelingen voldoen niet aan Kolmogorov, popu1air gezegd.

Een 1eerzame illustratie van onsamenhangendheid levert de 'paradox' van

Stein:

N( 1) - N(x 1) (Stein) - ~ N (x,1)

~i - ~i' -+ lli ,... i' -+ 11 n (i = 1, •••,n) •

T

f(ll;X) levert correcte uitspraken over lli en over A ll' Stein gaat echter

nog een stapje verder en beweert:

~

~ ,... Nn(x,1) -+

T

II II ,... X2 ( T )

n x x

T en construeert daaruit als betrouwbaarheidsinterval voor II ll:

Echter

n + xTx ± O(1I1)

E(xTx)

=

n + llTll

} actuele betrouwbaarheid -+ 0 voor n -+ 00 !!!

De correcte fiduciele redenering is:

(x ) ( T f· . b 1)

1, ••;,xn

=

x x, con 19urat1e op 0 •

Besluitvorming verdeling voor

De configuratie is niet relevant.

T 2 T

baseren op x x ,... X (ll ll).

- - n

T 1 .

~ II vo gt U1t

(8)

fiducie-Niet toegewezen fiducie: P(X2 > X2) =: pf. n

Als ~. = 0 dan is pf uniform verdeeld. Deze zogenaamde puntfiducie is

voor-waardelijk interpreteerbaar en geeft een zuivere toets voor ~

=

0 versus

~ # O.

Als pf ~ ~ dan ~ = 0 verwerpen.

Als je wilt geeft de puntfiducie ook een modeZtoets.

Model wordt dan verworpen als pf ~ 1-~.

Deze toets is zuiver met be trekking tot 02 = 1 versus 02 < 1, waarbij

02 = var(x.) die in het model gelijk is aan 1.

1.

Dat 'ancillariteit' het centrale begrip 1.S en niet 'voldoendheid' moge

blijken uit het volgende voorbeeld. x."-JN(~,1) ,

-1. i = 1,2 ,

echter ook

Uit p(x11x1-x2) voIgt door middel van fiduciele inversie dat

"Door te conditioneren kun je informatie 'terughalen '" (Fisher).

AX1 + ~x2 (A+~

#

0) zijn voorwaardeZijk voZdoende (exhaustive).

Soms komt de fiduciele inversie neer op het verwisselen van variabelen, zoals we bij de normale verdeling gezien hebben:

(9)

Dit 1S ook het geval voor: a) l-parameter r-verdeling: (AX)a e-AX p(X;A) = r (a) X a vast, 0 ~ X , x AX a-l P(X;A)

J

p(t;A)dt

J

t - t dt = f('Q) e

,

0 0 f(A;X) = -elF aA

o

~ A •

b) Uniforme verdeling (speciale parametrisatie):

p(X;A)

=

A , P(X;A)

=

AX

o

~ x ~ l/A , f(A;X) = -elP = elA X ,

o

~ A ~ l/x • c) Lokatie-Cauchy verdeling: p(X/A) = -·----~21 1

.

11 1 + (X-A)

De fiduciele inversie levert een verdeling over de parameterruimte Ope Puntschatters zijn van zeer betrekkelijke waarde, zoals moge blijken uit de fiduciele inversie bij 1 waarneming uit de exponentiele verdeling:

p(X;A)

De ML-schatter voor A is l/x, die tevens gelijk is aan de fiduciele ver-wachting. De mediaan van f(A;X) is gelijk aan log 2/x en de modus is gelijk aan O.

De MSE van die puntschatters is gelijk aan A2 voor de modus, en gelijk aan

(10)

Je bent dus in de situatie, dat je interpreteerbare uitspraken over de parameter doen kunt, terwijl de MSE van de puntschatters aIleen dan eindig

is als de schatter altijd nul 15. (Bij nader inzien: misschien zegt

boven-staande minder over de waarde van de puntschatters, maar meer over het criterium waarmee ze worden beoordeeld.)

Wat kun je nou met die fiducieverdeling doen? Bij een exponentiele

verde-ling is het vaak interessant om een uitvalkans te schatten: p(~ ~ x

O). Er geldt

Dit is een monotone functie van A, hetgeen je toestaat 'Kolmogoroviaans'

te rekenen:

-AX

F(y := e 0

~

y) =

F(~ ~

(0 ~ y ~ 1) •

Dit is een fiducieverdeling voor de uitvalkans.

Tot slot van deze aantekeningen het 'voorbeeld van Moors~, dat laat zien

welke artefacten er volgen uit het werken met verliesfuncties: ~,... B(n,8) ,

waarbij het waardenbereik van 8 beperkt is tot l-q ~ 8 ~ q met ~ < q < 1.

Met betrekking tot de kwadratische verliesfunctie is ontoelaatbaar de

puntschatter:

G= {

x/n mits l-q ;:;; x/n ;:;; q l-q mits x/n < l-q

q mits x/n > q

.

Ik weet niet of Moors er intussen al in geslaagd is toelaatbare schatters te construeren. De fiduciele redenering is te beschrijven als voIgt (al-thans voor grote n):

spil

X - n8

-;:::::;:==;. ,...

u In8(1-8)

De quantielen 8 van de fiducieverdeling voor

e

volgen uit:

(11)

(zie bijvoorbeeld Statistisch Compendium). x- nS

p

=

u v'i~n-s--;(...,..1--S...) p

p p

Gezien het beperkte waardenbereik 1S dit niet aItijd oplosbaar. Niet

oplos-baar voor p < Pe en P > Pr met

x - n(1-q) = Inq ( 1-q)

en x - nq

Inq ( 1-q)

De fiducieverdeling heet onvoZZedig. Quantielpunten S Z1Jn aIleen

gedefi-p

nieerd voor pe< p < p • De niet-toegewezen puntfiducies pr e en 1-pr zijn

voorwaardeZijk interpreteerbaar, want uniform verdeeld onder S

=

1-p,

respectievelijk S

=

p, en Ieveren zuivere toetsen voor die hypothesen, ten

aanzien van de alternatieve hypothese S < t-p respectievelijk S > p.

De onvolledige fiducieverdeling kent de gebruikelijke frequentie-interpre-tatie.

(12)

2. DE FIDUCIELE METHODE VOOR MEER PARAMETERS

(Wilkinson~ JRSS-B, 1977)

Steekproef x

1" •• ,xn' De dicbtbeid van xi kent twee parameters, zeg 91 en 6

2, Fiduciele besluitvorming is mogelijk als de volgende stappen uitvoer-baar zijn (en niet altijd onmogelijk als dat niet zo is (Wilkinson: 'afge-leide' fiducieverdelingen».

z E JRn-2 is ancillair. AIle frequentieverdelingen worden daar nu op gecon-ditioneerd.

(2) De (voorwaardelijke) dichtheid van Yl is aIleen een functie van 6 1: P(Y1;91). Door middel van fiduciele inversie voIgt de fiduaieverdeZing voor 9

1: f(91;Y1).

(3) De dichtbeid van Y2 1Y l is een functie van 91 en 62: P(Y2IY1; 61,62), Bij vaste 61 levert dit de fiducieverdeling van 62: f( 62161; Y1'Y2)' De simuZtane (fiduciele) diahtheid is bet produkt van f(61) en f(62Is1).

(4) Uitspraken over 6

2 aIleen kunnen worden geconstrueerd met bebulp van de 'verwaahte' (= marginale) fiduaieverdeZing:

£(62) :=

I

fCS2Is1)f(61)d61 • 9

1

Zo ontstaat in het normale geval de Student-verdeling:

ii ""

t

i

+ t 1 s/m .

n-(fiducieel! )

De interpretatie van de 'directe' fiducieverdeling voor 6

1 en die van de 'verwacbte' voor 6

2 verscbillen (positief relevante deelverzamelingen voor Student-intervallen, zie verderop),

N.B. Omdat de fiducieverdelingen voor niet-eeneenduidige functies van de parameters niet samenbangen, lijkt bet duidelijk dat de fiduciele

(13)

verwach-ting met betrekking tot evan een functie $(x,e) genomen moet worden met betrekking tot zijn eigen fiducieverdeling. Voor p(e2) betekent dit, dat p(e2Ie1) en 6

1 eeneenduidig op elkaar afbeeldbaar moeten zijn (moeten 'samen-hangen '), Deze conditie wordt 'kruissamenhang' (cross-coherence t) genoemd.

2. 1. Schatting in lokatie-schaal families

(Fisher, Stat. Methods & Scientific Inf., 1956, p. 159)

1 x-a +

x met dichtheid

S

exp(cp(-e-»' a E::R, S E ::R , $ bekend. Steekproef x

1, ••• ,xn met log likelihood

met

MZ-sahatters A en

B

volgen uit:

n S(y) :=

1.

i=1 y. • 1 en n + S (X;A <J>' (X;A»

=

0 •

Definieer nu de grootheden u door:

x = A + Bu •

«u) is de aompZexie ('complexion') van de steekproef.) Er geldt

S(<J>'(u»

=

0 en n + S(u<J>'(u»

=

0 .

De grootheden u definH~ren n - 2 onafhankelijke anaiHairen. Ancillairen, omdat hun verdeling niet van parameters afhangt. Lokatie- en schaal trans-formaties beinvloeden de complexie immers niet. De volgende opsplitsing van de waarnemingen is tot stand gebracht:

waarbij u

1 en u2 gedefinieerd gedacht worden als functies van u3, ••• ,un•

A, B en u1, ••• ,u

n zijn zodanig dat

x.

=

A + Bu.

(14)

De besluitvorming moet gebaseerd worden op de gerealiseerde complexie (conditioneringsprincipe). Er geldt: Tevens geldt zodat

I

d(X 1,···,X)

I

=

d (A ,B, •••

,~

) n u n Bdu

/a

u3 Bdu2Jdu3 B

o

De marginale dichtheid van B is te schrijven als

(op een constante nat) ,

met 0:> tCs):=

J

exp

SC~Ct+us»dt

• -co Bau/aun Bau/aun

o

B n-2 a: B ,

Deze hangt niet van a af en kan dus gebruikt worden voor de fiducieZe inversie met betrekking tot

S.

Er geldt:

B/a

J

tn-2

PCB) a: ~(t)dt •

o

De fiduciele dichtheid van

a

is (in dit geval min) de afgeleide: (op constante nat) •

(15)

Bij vaste

5

kan de fiduciele inversie met betrekking tot a. worden uitge-voerd met behuip van

Er geIdt:

(A-o.)/e

J

exp S ( 4> (t + u

]-»)

d t • De fiduciele dichtheid van 0. (bij vaste 5!) is de afgeleide:

1 (A-o. B )

ef

(B

7

f3) exp S

4><-15-

+ u

i3) .

De simuZtane diChtheid van 0. en

5

is het produkt van de dichtheid van a en

die van 0. gegeven

6:

1 ( o . - x )

f(o.,l3) 0: I3n+

1 exp S Ifi(- -13-)

Een heel knappe prestatie van Fisher! Zonder de ML-schatters of de ancil-lairen te expliciteren toch de fiducieverdeling afleiden. De ML-schatters worden gebruikt om de relevante splitsing tot stand te brengen.

Gegeven Ifi en de steekproef x is de simultane fiducieverdeling bepaald op een factor na. Die factor voIgt uit de eis dat de totale fiducie, geinte-greerd over a. en 13, gelijk moet zijn aan 1.

De (marginale) fiduciele verdeling van 0. kan worden verkregen door f(o.,a)

te integreren over 6. In het normale geval ontstaat zo de Student-verdeling. De fiduciele verdeling van f3 is direct interpreteerbaar. Daarentegen is de

verdeling van a. van het 'Student-type'. Dit betekent dat er positief reIe-vante deeiverzamelingen van de steekproefruimte optreden (zie verderop).

Voorbeelden.

1. Normaal: 4>(t)

=

c -

it

2

(16)

3. Cauchy: ,(t)

=

c - In(1+t2 ) •

Ret niet bestaan van de minimum variance unbiased estimator is aangetoond (zie Kendall & Stuart). De genormaliseerde likelihood convergeert niet. Ret aantal valse maxima van de likelihood is in de limiet Poisson-verdeeid met parameter lIn (Reeds, Ann. Stat., 1985, 775).

4. Logistisch: ~(t)

= -

t - 2 In(1+e-t) • 5. Laplace: ~(t)

=

c - It I

Opmerking. In geval 1 zijn x en S2 minimaal voidoende. In de andere

geval-len bestaan er geen minimaal voldoende grootheden. WeI is het zo dat de ML-schatters in die gevallen 'voorwaardelijk voldoende' zijn, dit betekent dat ze, na conditionering op de ancillairen, de steekproef 'uitputten'.

(Fisher's exhaustive statistics.)

Iedere equivariante schatter voor a en 8 is voorwaardelijk voldoende.

Let op! AIleen in het normale geval hangen de fiducieverdelingen van a en 8 van de complexie slechts via de steekproefgrootte af. Geen lStudent'-tabellen voor niet-normale verdelingen!! WeI (in deze tijd) procedures met parameters ~ en x.

2.2. ReJevante deelverzamelingen van de steekproefruimte

Een onderwerp van enig belang, dat een rol speeit en gespeeld heeft 1n de discussie over grondslagen. Terminologie:

Een deelverzameling wordt semi-relevant genoemd als op die deelverzameling de betrouwbaarheid van betrouwbaarheidsuitspraken ongelijk is aan de nomi-nale betrouwbaarheid (btrbrhd).

Relevant heet zo'n verzameling als voor alle mogelijke parameterwaarden geldt dat de nominale en de voorwaardelijke btrbrhd meer dan 6 verschillen, met 0 > O.

Positief (semi-) relevant als de voorwaardelijke btrbrhd groter is dan de nominale btrbrhd en negatief in het andere geval.

(17)

Ben stukje van de discussie, waarin relevante deelverzamelingen figureren, wil ik nu weergeven. Het startpunt is het roemruchte Behrens-Fisher pro-bleem: Welke uitspraken kunnen gedaan worden over het verschil in

verwach-ting van twee, niet nader gespecificeerde, normale populaties aan de hand van een steekproef uit beide populaties?

- 1955 (JRSS). Fisher valt de Welch-Aspin-oplossing van het BF-probleem aan. De deelverza~eling met 8

1

=

s~ is negatief relevant.

Ais S2 = S2 en 02 = 02 dan is het Welch-Aspin-interval (waarbij je

voor-1 2 1 2'

geeft niet te weten dat o~

=

o~) smaller dan het Student-interval met v

=

2n - 2

*

(waarbij je gebruikt dat o~

=

o~). Dit is duidelijk absurd: meer informatie moet in het algemeen leiden tot preciezere uitspraken,en

zou je zo zeggen, zeker als de informatie de vorm heeft van een hypothese (o~

=

o~) die je op grond van waarnemingen (s~

=

s~) op geen enkel signi-ficantieniveau kunt verwerpen.

- 1963 (AMS). Buehler en Feddersen zeggen:

"Fisher's fiducial intervals based on Student's t could be criticized in very nearly the same way as Fisher himself has criticized the Welch

solu-tion",

op grond van het bestaan van positief-reZevante deeZverzameZingen bij tweezijdige t-intervallen. Zij conditioneren op deelverzamelingen van de vorm Ixl/s < c, waarbij S2

=

I(x

i-i)2/n • Voor het speciale geval n

=

2 en a

=

.5 geldt voor aIle ~ en 0 2 :

P(.?!.(O < 1.1 < ~(2)

I

I~II! ~ 3/2) ~ .518 terwijl

P(~(1) < }J < ~(2»

=

.500 •

Merk op de verschillen: Fisher toont het bestaan aan van negatief rele-vante deelverzamelingen en conditioneert op een anaiZlair.

N.B. Positief relevantie van de deelverzameling impliceert in dit geval negatief semi-relevantie op het complement!

(18)

- 1968 (AMS). Brown scherpt de resultaten van Buehler en Feddersen aan en laat zien dat voor aIle ~ en 02:

P.(!.(1) < ~ <!.(2)

I

Ixl/!:;; 1+/'I) ~ 2/3. Hij merkt op:

" ••• it is not clear that the results of this note can possibly lead to any practically useful new procedures. (It is not even clear that any remotely reasonable test procedures exist for this problem which do not have conditional properties similar to those described here.)".

Dat eigenschappen van schattings- (en toetsings-) procedures niet vrij kunnen worden voorgeschreven is ook de recente mening van

- 1984 (CWI-voordracht) Lehmann. Hij concludeert dat ook maximalisatie van het onderscheidingsvermogen leidt tot anomalieen (voorbeeid Cox). Hij vindt echter ook dat procedures bestand moeten zijn tegen "some forms of

betting'~. Zijn mening is dat de aanwezigheid van negatief-relevante deel-verzamelingen in ieder geval niet acceptabel is.

Conclusie. Van statistische methoden kun je teveel veriangen. Minimum (kwadratisch) verlies en maximum onderscheidingsvermogen is teveel ge-vraagd. Echter: afwezigheid van negatief-relevante deelverzamelingen kun

je weI eisen. In die zin is de Welch-Aspin oplossing van het BF-probleem niet acceptabel.

2.3. Parameterschatting in de standaard-Weibull verdeling

De Weibull kan worden gezien als een generalisatie van de exponentiele verdeling:

p(y;e,y) = 1 - exp (-(xle»Y , y,6,y > 0 •

Deze verdeling is al 100 jaar bekend onder de naam 'levensduurverdeling van Gompertz'.

Dichtheid:

(

y-l

[

YJ

(19)

Steekproef Y,' •• "Yn met anci11airen

In Y

./y.

1

~ ~+

De dichtheid van x ::;

(i

=

2, ••• ,n-1) •

In ~ wordt gegeven door

1 [x-a x-a]

p(x;a,S) -

i

exp --e- - eXP(--a--) , waarbij a := In e en S := 1/y.

Dit is een lokatie-schaal familie met ~(t)

voor a en S wordt gegeven door:

t

= t - e • De f iduc ieverde 1 ing

1 ( a - x )

Ha, S) a: an+

1 exp S ~(- -6-) , a,e variabe1, x 'parameter'.

De reliability functie R is gedefinieerd door (t,e,y > 0) •

Thoman, Bain en Antle (Technometrics 1969) geven tabe1len met behulp waar-van onvoorwaardelijke btrbrhdsinterva11en voor R(t) kunnen worden berekend. Voorwaardelijke interval1en kunnen worden berekend met behu1p van f(a,S). Voor het gemak definieren we:

ljJ

=

1n(-ln R)

=

On t - a)/S.

Omdat ljJ en a bij vaste a 'samenhangen' (eenduidi\ op e1kaar afbee1dbaar zijn), net zoa1s ljJ en

a

bij vaste a, is f(a,S) relevant voor ljJ. Daarom geldt:

ClO ClO

FC1/!) ::;

F(~

G In t - a1/!) a:

I

~+1

I

exp

s(cpc-

C1~X»)

do: de

o

a lnt-a1/! De fiduciele dichtheid van ~ wordt gegeven door:

ClO

f(1/!)

=

;1/! F(1/!) a:

I

S~

exp S(!j>(ljJ - In

~-

x») da •

(20)

Wat overblijft is een numeriek probleem (integreren). Het is niet mogelijk een tabel te construeren van percentagepunten van $ met als ingangen bij-voorbeeld

a,

S

en n. De 'complexie' (de verzameling ancillairen) is immers relevant met betrekking tot $. De fiduciele dichtheid van R

=

exp(- exp $) wordt gegeven door:

2.4. Het lineaire model

!

=

XS

+ e -e ,.." N (O,an 2I ) · , . . , a € :m.P • Definieer:

P •• = I - X(XTX)-1 XT , . projector ~ < X > ,

x

Dimensie: p 1 n-p-l

relevant voor:

S

complexie

De complexie is een punt op de eenheidsbol in:m. ,en is niet relevant n-p

met betrekking tot

S

en a2 • De complexie kan weI benut worden voor overall-modeltoetsing (Residuenanalyse met betrekking tot normaliteit. onderlinge onafhankelijkheid, autoregressie). De overall modeitoets en de modelpara-meterschatting zijn fiducieel onafhankelijk.

De fiducieverdeling voor a2 voIgt uit:

Deze verdeling is direct interpreteerbaar. Uit

(21)

Anders gezegd:

De fiducieverdeling voor B voIgt uit:

Deze verdeling is direct interpreteerbaar indien 02 bekend is.

Fiducieel middelen geeft de verwaahte fiduaieverdeling voor B:

co

£(s)

=

of

f(S\cr')f(cr')dcr'

met als resultaat:

voor a He R, •

(Denk aan de positief relevante deelverzamelingen!)

N.B.

Als je geinteresseerd bent in bijvoorbeeld IISII 2 dan verandert aUes

(onsamenhangendheid!). Oplossing onbekend. Zou je (1) gebruiken om btrbrhds-intervallen te construeren voor liS ,,2 dan gaat de feitelijke btrbrhd van die interval len naar nul voor n + co. Dit is een vorm van de 'paradox van Stein t •

Indien IIxa1l2 de interessante parameter is dan gebruiken we:

FiduciEHe inversie geeft de (incomplete) functieverdeling voor IJXall. Aan

Xa

=

0 wordt puntfiducie toegewezen ter grootte van

pf := p(X2 > yT Q y) •

p x

Als Xa

=

0 dan is pf uniform verdeeld en geeft een zuivere toets voor

(22)

In het voorgaande is 02

=

1 gesteld. Als 02 onbekend, dan is pf

afhanke-lijk van 02• Fiducieel middelen met betrekking tot de verdeling van 02

geeft dan de gewone F-toets.

2.5. Schatting in de uniforme familie

x. ,..,. U(a-b,a+b)

- 1 (i = 1, ••• ,n) •

De order-statistics zijn relevant •

....

ML-schatters: b

=

(x(n) - x(1»}2

De reZevante spZitsing wordt gegeven door:

(x(l),···,x(n»

=

(a,b,u(2),···,u(n_l» , waarbij u ancillair is, gedefinieerd door

en Er geldt zodat .... A An-2-n p(a,b,u)

=

2n! b (2b) • = 1 •

De ML-schatters

a

en

b

zijn onafhankelijk van de ancillairen: 2-n

p(u)

=

(nr-2) I 2

Bet is eenvoudig in te zien dat

.... ....n-2 -n A

p(b;b)

=

n(n-l)b b (b-b) en

(b :;;

b)

(23)

I

"

-1 "'-1

pea b;asb)

=

2 (b-b) (a-b+b ~ a ~ a+b-b) De fiducieverdelingen volgen hieruit:

f ' ' ' ' .... n-1 n+1 f'

f(b;o)

=

IdP(b;b)/dbl

=

n(n-1)b b (b-o) (b i::: 1» , en

- -1 "'-1

f(alb;a,b)

=

2 (b-b) (a-b+b ~ a ~ a+b-b) • De verwaehte (= marginale) ve~deZing van a is:

00

£(a)

=

2-1 n(n-l)bn- 1

J

b-n-1 db

=

2-1(n-l)bn-1(b+a-a)-n , b+a-a

voor a ~ a, en is symmetrisch rond a. Tweezijdige (l-a)-intervallen volgen uit de cumulatieve fiducieverdeling

- -1 -1 "'l-n

F(a)

=

2 + 2 (1 - (1 + (a-a)/b) ) en kunnen worden genoteerd als:

1 ... 1-n

a

E

a

± b(a - 1) •

(a t: a)

Zij hangen natuurIijk niet af van de anciliairen (analoog met Student). Er bestaan positief ~elevante deelve~zamelingen bij deze interval len. Voorbeeld: als n

=

2 dan is het 50%-interval gegeven door x(l) < a ~ x(2)' In figuur 1 op bIz. 21 is dat aangegeven. ABC is de support van de uni-forme dichtheid van (~(1)'~(2» voor a

=

O. Als a

=

b dan is de support gelijk aan OFG etc. Het vierkant DBEO is het gebied waar de uitspraak x(1) < a < x(2) waar is (frequentie !). De deelverzameling van de steek-proefruimte gedefinieerd door x(2) > 2x(1) (x(l) ~ 0) en x(2) > !x(l)

(x(1) ~ 0) is positief relevant. De voorwaardelijke betrouwbaarheden VB in de tabel op bIz. 21 zijn uit figuur 1 af te lezen. De VB als functie van a is weergegeven in figuur 2. Er geldt:

(24)

Tabel 4b Figuur 1 3b B b D a: maat deelverzameling: VB:

o

3/4 2/3 b b 1/2 3/3 2b 2b 1/8 1

- -- --

-

-

- - -

-

-;---,

3/4 2/3 I-~-"::--1/2 1/8 b 2b 3b 3b 4b 3b

o

Figuur 2: VB(t - a

(25)

N.B. Ret complement van de positief relevante deelverzameling is negatief semi-relevant. De tweezijdige fiducie-intervallen in het bijzonder en de fiduciele methode in het algemeen zouden kunnen worden gedisqua1ificeerd als het bestaan van negatief-re1evante deelverzame1ingen zou kunnen worden aangetoond. Roe te bewijzen dat ze er niet zijn?

Positief relevant zijn ook de dee1verzame1ingen gedefinieerd door x(2) > dX(1) (x(1) ~ 0) en x(2) > x(1)/d (x(1) ~ 0) voor aIle d met

1 < d < ~. Ret grensgeval met d

=

~ is niet relevant (waarom niet?). Ten aanzien van de uitspraak:

a <

is de deelverzameling negatief relevant.

2.6. Parameterschatting in de Pareto-verdeling

(economie-inkomensverde1ing)

De cumulatieve kansverdeling wordt gegeven door:

Definieer x

=

log y, a = log 6

1, a

=

1/62, dan:

1

p(x;a,a) = "j3 exp [-(x-a)IBl (B > 0, x > a) •

(Lijkt op 10katie-schaa1 familie (verschoven exponentiee1).} a

=

'lokatie'parameter,

e

=

schaa1parameter.

Steekproef x(1) •••• 'x(n) met dichtheid:

n!

De log likelihood log n! - n log

e -

n(i-a)/a is maximaa1 voor a = a = x ( 1 ) en

e

= b = i-a •

(26)

De anciliairen worden nu gedefinieerd door:

zodat bijvoorbeeld

n

= n -

I

U(i) i=3

en U := (u(3), ••• ,u(n» n-2 onafhankelijke ancillairen definieert. Er geldt n-2 H3x/a(a,b,u)ll ~ b , zodat n-2 -n(a+b-a) p(a,blu) ~ p(a,b,u) ~ b e (a > a) •

De marginale verde ling van b wordt gegeven door

co

p(b;S)

=

J

p(a,b)da

~

bn-2 e-nb/S a

(b > 0)

en is geen functie van a. Er voIgt eenvoudig dat

P (b; 13) nb/13 1

J

tn-2

=

7(n--~2:"':")~! e - t dt,

o

zodat 1

(~b)n-l

nb f (S;b)

=

fHn-2)!.., exp (-

13)

(13 > 0) De voorwaardelijke verdeling van a gegeven b voIgt uit

p(alb)

=

p(a,b)/p(b) ~ exp {-n(a-a)/S} (a > a) •

N.B. De ML-schatters a en b zijn onafhankelijk van u en zijn dus minimaal voldoende. Het paar (x(1)'~) dus ook. De parameters a en

B

zijri fiducieel afhankelijk, terwijl a en b onafhankelijk zijn (analogie met normale familie) •

(27)

De (voorwaardelijke) fiducieverdeling van a gegeven

a

is:

f(aIS;a,b) = lap(alb)/aal = n/s exp {n(a-a)/s} (a < a) •

De marginale verdeling van a vinden we op de gewone manier:

""

f(a;a,b)

-)

(a < a) •

Cumulatief:

(a < a) •

Rieruit is het y-quantiel gemakkelijk te berekenen:

Voor n

=

2 is dit te schrijven als

In plaats van de ML-schatter a voor a, verdient wellicht de 'het kan vrie-zen - het kan dooien ' schatter a

i de voorkeur:

1 1

n-1 n-1

-ai = 2 x(1) - (2 - l)(x-x(O) •

Deze mediaanschatter is altijd kleiner dan a (= x(1»' Ret verschil met a is evenredig met

i-

x(1) bij vaste n, en gaat naar 0 voor n -+ "", hetgeen redelijk is.

N.B. De fiducieverdeling van de oorspronkelijke variabelen:

en

(28)

met (allicht)

De mediaan m van de Pareto-verdeling is gelijk aan a + 6 log 2.

Bet is duidelijk dat fp(a,6) relevant is voor m. De fiducieverdeling van m maakt uitspraken over het 'mediane' inkomen mogelijk. Bet is interessant en

instructief om na te gaan of x(1) < m < x(2) een 50% uitspraak is voor

n

=

2. Voor m ~ a geldt: 00 m-6 log 2 F(m)

=

J

dS

J

f(a,S)da

=

o

-00 ()O m-6 log2

=

2b

f

d6

J

~

exp

{-~

62 6 6

o

-00 (b-a+a)}da

=

=

t(1+t)-1, waarbij t

=

(a-m)/b •

V~~r m ~ a is het integreren wat bewerkelijker:

00 m-6 log 2 m - a

I I

F(m)

=

F 6(log 2) + d6 f (a,6)da == (m-a) Ilog 2 -00 Er geldt == a en x(2)

=

a + 2b F (a)

=

t en F (a+2b)

=

l , m m

zodat inderdaad x(1) < m < x(2) een 50% uitspraak is.

m a 6

t

a - a 8

t

m-a log 2 _ a

(29)

Er geldt niet

maar

F

(X(1)

+

X(2»)

=

F (a+b)

=

(1 + log 4)/4

~

.60 •

m 2 m

2.7. Parameterschatting in de inverse Gauss verdeling

Likelihood vergelijkingen i1-X=O Er geldt Indien dan geldt:

r

u.

=

n • 1. Hoe verder? (niet opgelost)

(30)

3. HET BEHRENS-FISHER PROBLEEM: EEN CRUCJAAL GEVAL

Gegeven een steekproef uit twee normale populaties:

(i = 1, ••• , n) •

Gevraagd: uitspraken over ~1 - ~2'

Voldoende zijn xl'

X

2' s~ en s~. De gestandaardiseerde residuen zijn niet relevant, altbans met betrekking tot ~1 - ~2' Ze zijn natuurlijk weI rele-vant met betrekking tot modeltoetsing.

De parameter van belang is ~1 - V2' Daaruit voIgt dat xl + x2 niet rele-vant is. Immers, lokatietransformaties mogen de besIuitvorming niet bein-vloeden. Als relevant blijft ten slotte over:

I. De opJossing van Welch

Deze is gedisqualificeerd door de aanwezigheid van negatief relevante deeIverzameIingen. Het is strijdig met bet gezonde verstand dat extra informatie leidt tot vagere uitspraken, zeker als de informatie pracbtig in overeenstemming is met de waarnemingen (zie eerder).

II. De oplossing van Fisher

Gevraagd een fiducieverdeling voor 0 :=

v

1 - ~2' Er geldt

zodat, in fiduciele zin:

~ '" N(d, (cr~ + ap/n) , voorwaardelijk op cr~ + cr~.

De verwachte fiducieverdeling van 0 voIgt door middelen met betrekking tot de simultane fiducieverdeling van cr~ en cr~. Hoe wordt die afgeleid?

(31)

Er geldt:

en

De verdeling van Q is aIleen een functie van Q • Er geldt

s 0

Q ,.., Q F\I met \I

=

n - 1 •

-s 0 \I

Hieruit voIgt eenvoudig de fiducieverdeling voor Q • Deze is direct inter-o

preteerbaar. Omdat

voIgt de fiducieverdeling van o~

I

Q

o uit de dichtheid van .!~

+.!2

,,gs. Definieer:

dan

(Inormaal ') •

Dus:

co

f(t

I

Qo) =

J

f(t

I

Qo,o~)f(o~

I

Qo)dO~

o

zodat ten slotte:

co

J

f (t

I

Q )£ (Q ) dQ

0 0 0

o

('geschaalde Student')

Hieruit volgen uitspraken over t en dus over 0

=

Vl - v2"

Opmerking 1. Indien de parameter van belang c1

v,

+ c2P2 is, dan is

c,x

1 + c2x2 relevant en czx, -

c

1x2 niet. Wat relevant is of niet, wordt bepaald door de parameter(s) van belang.Als je geinteresseerd bent in het

(32)

werken met de simultane fiducieverdeling van ~1 en P2' die te noteren is als:

De fiducieverdelingen voor de verschillende gevallen hangen niet samen. De interpretatie van de fiducie-uitspraken is steeds verschillend.

(Opmerking achteraf: dit is nog maar de vraag voor de Fisher-oplossing.)

Oproerking 2. Er geldt

fp(t) ~ t als Q ~ 00 of Q ~ 0 •

v s s

Dit is ook intuitief duidelijk.

II I. De oplossing van Wilkinson

Wilkinson definieert de eis van 'kruissamenhang': Omdat fiducieverdelingen voor functies van parameters niet samenhangen, is het logisch dat de fidu-ciele verwachting van gee) genomen moet worden met betrekking tot zijn eigen fiducieverdeling. De verwachting van gee) mag aIleen dan geIijk genomen worden aan

J

g(e)f(e)de als g(e)

t

e (g is 'bijectief') • Wilkinson merkt op dat voor vaste t:

f (t

I

Q )

t

min (Q t 1 / Q )

= :

Q* •

(] (] (] (]

De steekproefverdeling van Q* s is relevant voor Q*. (] Blijkbaar is

(x

1

-x

2t s(1),s(2» minimaal voldoende en niet (X1-X2tS~,s~). De fiducie: verdelingen van Q* en Q hangen niet samen. De fiducieverdeling voor Q

(] (] (]

voIgt uit de steekproefverdeling van Q*. De fiduciele inversie is niet s

compleet: Aan Q*

=

1 wordt puntfiduaie toegewezen ter grootte:

(]

P(FV < Q* of FV > l/Q*) := pf •

(33)

We hebben dit fenomeen a1 eerder gezien: a1$ ~ ~ N(e,1) en 92 de parameter van be1ang is, dan is sgn(x) niet relevant en volgen de p-quantielen

e

2

p van

e

2 uit:

waarbij aan

e

=

0 singuliere fiducie toegewezen wordt ter grootte:

Wilkinson middelt met betrekking tot de fiducieverdeling van Q* (inclusief o

het singuliere deel) en vindt:

1

=

pf • f(t

I

Q* ... 1) +

I

f(t

I

Q*)£(Q*)dQ* o 0 0 0 Omdat f (t

I

Q~ == 1) ... tzv geldt: als Q* -+ 1 • s

o

Voor kleine waarden van Q* zijn de twee oplossingen praktisch identiek. s

De resultaten zijn weergegeven in onderstaande figuur.

t P

t

t v,p t 2v,p Welch

o

Fisher Wilkinson - Q s

(34)

Merk op dat pf ~ 1 als Q* ~ 1. De reguliere fiducie is dan ~ 0 en er z~Jn

s

geen verifieerbare uitspraken over Q* mogelijk. De singuliere fiducie is

a

aIleen voorwaardelijk interpreteerbaar: Ais a~

=

a~ dan is pf ~ U(O,1). Het kritieke gebied van een zuivere toets van a~

=

a~ ten opzichte van

a~ I

ai

met betrouwbaarheid 1-a wordt gegeven door pf < a.

Slotopmerking. Ais

at

=

ai,

maar we weten dat niet, dan moeten de uitspra-ken over 0 vager (interval len breder) zijn dan in het geval dat we dat weI weten. Als a~

=

a~ dan is de betrouwbaarheid van interval len gebaseerd op t2v gelijk aan de nominale betrouwbaarheid. De bredere interval len die we vinden, als we niet weten dat a~

=

a~, zijn in dat geval conservatief en daar is dus niets aan te doen. Je kunt niet eisen dat de nominale betrouw-baarheid gelijk is aan de gerealiseerde zonder te komen tot een vreemd resultaat als dat van Welch.

(35)

4. FJDUCIEEL TOETSEN

Tot nu toe ging onze interesse uit naar fiducie-uitspraken over het waarden-bereik van de interessante parameter(s). Vaak echter is een onderzoeker geinteresseerd of de waarnemingen in overeenstemming zijn met een van tevoren gespecificeerde stand van zaken, oftewel hypothese, en is het waar-nemen vooral gericht op het doen van uitspraken daarover.

In het voorgaande is enkele malen sprake geweest van singuZiere fiduaie, of puntfiducie, die voorwaardelijk interpreteerbaar bleek te zijn. Met behulp ervan kunnen op eenvoudige wijze zuivere toetsen worden geconstru-eerd.

Bij schattingsproblemen speelt reguliere fiducie en de daarmee verbonden frequentie-interpretatie een hoofdrol, terwijl bij toetsing de singuliere fiducie en de daarmee corresponderende voorwaardelijke interpretatie de hoofdrol speelt.

Bet nu volgende is niet meer dan het allereerste begin van een fiduciele toetsingstheorie. Bet aantal problemen is groot en oplossingen zijn er weinig.

Voorbeeld 1 (zie eerder)

Situatie: x. ~ N(e,02) (i

=

1, ••• ,n); 02 bekend (= 1).

- l .

De parameter van belang 1S 82•

Puntfiducie in

e

=

0: pf

=

p(x2 > IIx112) •

n

Indien

e

=

0, dan is pf uniform verdeeld en stochastisch groter dan pf in het geval dat 8 ; O. Ret kritieke gebied van een zuivere toets met betrouw-baarheid 1-a van

e =

0 ten opzichte van

a ;

0 wordt gegevn door pf < a. Ret kritieke gebied van een zuivere toets met betrouwbaarheid 1- ~ van

02

=

1 ten opzichte van 02 < 1 wordt gegeven door pf >

1-e.

Model- en hypothesetoets in een.

Voorbeeld 2.

(36)

De stand van zaken, die je wilt toetsen, is:

e =

a (a bekend). Een metriek die de speciale status van het punt 6

=

a tot uitdrukking brengt is:

6

=

(16-al,sgn(6-a» •

Voor de eenvoud is vanaf nu a

=

O. Er geldt: 6

=

(161,sgn(e» en x

=

(Ixl,sgn(x» •

Er zijn als het ware 2 waarnemingen (Ixl en sgn(x» en 2 parameters (sgn(6) en lei). Noteer:

t

~(t)

=

(2~)-~

exp(-t2/2) en wet)

=

J

~(u)du

-co

Er geldt:

p(lxl ~ Ixl)

=

w(lxl-e) - w(-Ixl-e)

=

=

~(Ixl-e) + ~(Ixl+e) - 1

=

=

Hlxl-Iel) + ~(Ixl+lel) - 1 •

De fiduciele inversie met betrekking tot lei hebben we al eerder gezien. Er geldt:

p(lxl;lel)

=

dP/dlxl

=

~(Ixl-Iel) + ~(Ixl+lel) , f(lel;lxl)

=

IdP{d161 I

=

~(161-lxl) - ~(Iel+lxl) •

De fiducieverdeling van lei is niet voZledig. Aan 6

=

0 wordt puntfiducie toegewezen ter grootte:

pf

=

2 (1 - H I x I) • Er geldt:

p(sgn(x) I Ixl)

=

p(x)/p(lxJ)

=

<t>(x-e)/s , waarbij

s

=

~(Ixl-Iel) + ~(Ixl+lel) • Schematisch weergegeven wordt dit:

(37)

sgn(x) ~ +

sgn(e) '" + rp(jxl-Iel)/s rp(lxl+lel)/s

4>(lxl+lel)/s rp(lxl-leJ)/s

zodat:

f(sgn(e)

I

leI)

=

Ij>(e-x)/s

=

rp(sgn(e)-Iel - sgn(x)-Ixl)/s • De verdeling van e is nu gelijk aan:

£(e)

=

f(lel)f(sgn(e)

I

leI) =

= {rp(lxl-lel) - 4>(ixl+lel)} ·Ij>(x-e)/s =

=

tanh(lexl)rp(e-x) •

Deze is niet compleet. Puntfiducie pf in

e

=

o.

Ret resultaat'is weergegeven in onderstaande figuur. Er geldt:

00

J

f(e)de + pf

=

1 •

singulier

regulier

(38)

Schatten en tcetsen in een

pf is voorwaardelijk interpreteerbaar: Het kritieke gebied van een zuivere toets van niveau 1- a voor de hypothese 6 = 0 wordt gegeven door pf < a. of:

~(Ixl) > 1 - ~ •

N.B. Uitbreiden naar n-waarnemingen en onbekende 02 levert naast

regu-liere fiducie-uitspraken ook de gewone t-toets.

- Er kan nu zinvol gesproken worden over de 'kansen1 dat 6

< 0, 6 = 0 (!) en 6 > O.

- Ridge-schatters kunnen worden gedefinieerd.

Voorbeeld 3. Het multivariate geval

Geval 1. Indien!l

=

Oen 62

=

0 de interessantehypothesen zijn, is de

fiducieverdeling van (6

1,62) het produkt van 2 singuliere verdelingen zoals in voorbeeld 2 afgeleid. In de onderstaande tabel wordt dit schema tisch weergegeven:

o

=F 0

o

=F 0 f 1f2 (1-f1)f2 f2 £1(1-f 2) (1-f 1)( 1-f 2) 1:--f 2 f 1 1-f1 1

De elementen van de tabel zijn fiducies. met f.

=

2(1- ~(lx.I». In gewone

J. J.

taal kun je zeggen dat de 'kans' dat 61

=

0 en 62 I 0 gelijk is aan

f1(1-f2). De interpretatie van zo'n uitspraak is dan dat reguliere fiducie-uitspraken mogelijk zijn over 62 I 0 (fiducie ~ 1-f2) onder de hypothese

(39)

dat 6

1

=

0, die op zijn beurt een voorwaardelijk te interpreteren 'kans' f

1 heeft.

De (singuliere) fiducie dat 6

1

=

62

=

0 is gelijk aan f1f2 en is voorwaar-delijk te interpreteren. Als 6

1

=

62

=

0 dan is

!

l f2 verdeeld als het pro-dukt van 2 uniforme stochasten. Het kritieke gebied van een zuivere toets

met betrouwbaarheid 1- a voor de hypothese 6

1

=

62

=

0 wordt gegeven door:

(0

Geval 2. Indien!l = 6

2 = 0 de interessante hypothese is, dan hangt de

corresponderende fiducieverdeling niet samen met die in geval 1. De

rele-vante metriek wordt nu gegeven door:

en - (rx,4> ) •x

De fiduciele inversie voIgt uit:

o

is de singuliere fiducie gelijk aan:

Ret kritieke gebied van een ZU1vere toets met betrouwbaarheid 1-a voor de

hypothese 6

1

=

62

=

0 wordt dan gegeven door P(x~ > r~) < a, oftewel

x~ + x~ > log 1/a2 • (2)

Let op!

- De toetsen gegeven door (1) en (2) zijn zuiver, betreffen dezelfde

nulhypo-thesen en alternatieve hyponulhypo-thesen, maar zijn niet equivalent. Het geval dat 6

1

=

0 en 62

=

0 de interessante hypothesen zijn levert (1) op, terwijl de toets gegeven door (2) van toepassing is als 6

1

=

62

=

0 de interessante hypothese is. In onderstaande tabel worden beide toetsen vergeleken voor het geval x2 + x2

=

6.

(40)

Toetsen (1) en (2), x2 x2 P(X~ > x~+ xp Pl p2(1 - log(P1P2

»

1 2 0 6 .050 .075 1 5 .050 .046 2 4 .050 .042 3 3 .050 .041

- De reguliere fiducie-uitspraken voor geval 2 verschillen natuurlijk van die in geval 1, met name in de buurt van 8

1

=

0 of 82

=

o.

In het geval dat x. ~ N(8.,1) is nu een zuivere toets geconstrueerd voor

1. 1.

de hypothese H

O: 81

=

=

8n

=

0 die erop gebaseerd is dat

1

...

_-_2_1_0g_!._N_X2_ 2

n_l·

waarbij n f

=

n

i=l f. 1. met

Deze toets is een alternatief voor de zuivere toets gebaseerd op

1

x.2 2

~ X

-1. n als

Het verschil wordt nog eens geillustreerd in onderstaande tabel.

x12 x22 x32 x42 P(X~ > 12) P(X~ > - 2 log(P1 P2 P3 P4)

3 3 3 3 .017 .011

0 4 4 4 .017 .018

0 0 6 6 .017 .030

(41)

De nieuwe toets is conservatiever in de buurt van x

=

O. Zoals we gezien hebben is dat ook het kritieke gebied van de modeltoets die we ter beschik-king hebben. Als het model niet klopt hangt de hypothesetoets in de lucht. Ret is daarom (tenminste voor mij) niet gek dat je wat aan de voorzichtige

kant blijft in de buurt van x

=

O. Maar goed, feit is dat de nieuwe toets

zuiver is en exact, en ten opzichte van de andere toets conservatief is als de waarnemingen zeer van elkaar verschillen en 'progressief' als de waarnemingen van dezelfde orde van grootte zijn.

De uitspraak:

u: 8.

=

0 voor i E I en 8. ~ 0 voor j ~ 1

1 J

waarbij I een indexverzameling is, heeft fiducie:

f

=

u

n

iEI

f.

n

(l-f.)

1 j~i J

Daar p. uniform verdeeld is onder R

O' is 1-p. dat ook en geldt:

1 1

- 2 lo~.f .~ X2 •

. -u 2n

De simultane verdeling van de e.'s is het produkt van de reguliere stukken J

van de marginale fUnctieverdelingen. Door nu aIle uitspraken met te kleine

fiducie te verwerpen kan controZe op eerste soort fouten worden

gegaran-deerd. De kritieke waarde f wordt zo gekozen dat

a

p(

~

f.

~

fa

I

8

1

=

i=l 1

=

8

n

=

0)

=

a • Dan geldt voor aIle uitspraken u:

P(f ~ f

I

8.

=

0, i E I) ~ p(f ~ f

I

81

= ••• =

8

=

0)

=

a •

-u a 1 -u a n

Immers, als functie van 81. is f1· stochastisch maximaal in 8. = 0, en 1 - f.

- 1 1

minimaal.

Ret probleem dat overblijft is, dat je meer dan een uitspraak overhoudt die niet verworpen is. Een van de overblijvende wil of moet je kiezen. Ret onderscheidingsvermogen in algemene zin wordt gemaximaliseerd door de uitspraak met maximale fiducie te kiezen.

Wil je het onderscheidingsvermogen maximaliseren ten aanzien van de ver-zameling van alternatieve hypothesen:

(42)

fpreeies een van de

e's

is ongelijk aan 0' dan kies je de uitspraak 6

j # 0, 6i = 0 (1 # j) waarvan de fidueie maxi-maal is in j en groter dan f • Ret is duidelijk dat bij zo'n strategie het

a

onderseheidingsvermogen ten aanzien van andere alternatieve hypothesen ernstig wordt aangetast. Een en ander wordt geillustreerd met behulp van onderstaande tabel. geval: u (1) a b ab e ae be abc totaal

Fiducies bij uitspraken u (u

=

ae betekent 6, en 63

#

0, 6 2 = 0) P

=

oversehrijdingskans onder RO 2 2 2 8 Xl + x2 + x3

=

I II III x 2 = X 2 =x 2 = 8/3 1 2 3 x 2 =

1 ' x 2 =x2=4 2 3 x 2=x2 =0' x2=8 1 2 ' 3

fid.% P% rid.% P% fid.% P%

• 1 3 .2 5 .5 10 1 16 0 0 1 16 4 39 0 8 54 0 0 1 16 4 39 100 100 8 54 0 0 8 54 91 100 0 72 100 0 0 100 100 100 Op betrouwbaarheidsniveau 95% is de uitspraak (1) (6 1

=

e

2

=

63

=

0) voor geval III niet in strijd met de waarnemingen. Aeeeptabel zijn onder meer de uitspraak a voor geval I, b voor geval II en c voor geval III. De uit-spraken met de grootste fidueie zijn respeetievelijk abc, be en e, hetgeen niet verwonderlijk is.

(43)

Kan het bovenstaande worden gebruikt om het probleem van de meervoudige vergelijkingen op te lossen?

If.l. Meervoudige vergeJijkingen

Voor onderling onafhankelijke x.'s geldt:

].

Voor welke i en j geldt p.

=

p. ? ]. J Er geldt:

De som s is een (irrelevante) anciliair. De paarsgewijze verschillen d.

].

zijn autoregressief van eerste orde en kunnen worden georthogonaliseerd:

Definieer 8i := Pi+1 - Pi1 dan geldt voor de 0.0. Yi's:

i-1 y. l.

=

d. 1 + --.-l. y. 1-1 ' i-1

=

8. + --.-8. 1 1 1 1- + ••• en Uit Y

1 voIgt door fiduciele inversie de (singuliere) fiducieverdeling van 81, uit Y2 die van

821a1,

uit Y3 die van 8

3

1<8

1,8 2) etc. Bijvoorbeeld:

zodat

Definieer:

f. := p(x2 > 2iy~/(i+0) (i = 1, ••• ,n-0 .

(44)

Nu is de theorie van de vorige paragraaf toepasbaar. Er geldt bijvoorbeeld onder de nulhypothese ~1

= •••

=

~n:

n-1

- 2 log

n

f..., X22 2 '

i=l -~

n-Echter: de x'en kunnen in n! volgordes worden gezet. Bij iedere volgorde doe je aIleen singuliere uitspraken van de soort ~.

=

~. 1 en niet van de

~ ~+

soort ~1

=

~n' bijvoorbeeld. De

simultane fiduaieverdeling is verschillend

voor iedere volgorde,

omdat de verzameling van singuliere uitspraken

ver-schilt van volgorde tot volgorde.

Een voor de hand liggende keus van de volgorde is die van de orderstatis-tics: x(l), ••• ,x(n)' Als ~[i] het bij xCi) horende populatiegemiddelde voorstelt dan geldt fiducieel:

Bij de volgorde x(l), ••• ,x(n) kunnen uitspraken van de vorm:

en ~[i-l] ;::: lJ[i+l]

niet worden afgeleid en dat is dus ook niet nodig.

Nu heeft het er aIle schijn van dat we klaar zijn. AIle uitspraken die je zou willen en kunnen doen hebben de vorm:

waarbij • staat voor

=

of voor ~.

Bij de ongelijkheden horen reguliere fiducie-uitspraken over de grootte van het verschil. Bij iedere uitspraak u hoort een fiducie f , waarvoor geldt:

u - 2 log f ...., -u X22 n-2 als aIle ~'s gelijk zijn.

De fiducies sommeren tot 1. Uitspraken als

komen niet v~~r.

Deze methode is acceptabel en leidt tot heldere en eenvoudig interpreteer-bare uitspraken.

(45)

Vraag. Moeten we ons weI of niet iets aantrekken van het feit dat de methode zoals hier geschetst niet invariant is ten opzichte van teken-wisseling bij de waarnemingen?

(Opmerking achteraf: De verdelingsuitspraak over - 2 log f is niet

cor-- \ !

recto Neem de uitspraak P[l]

= ••• =

p[n]' De bijbehorende fiducie is voor aIle n! volgordes, waarin je de waarnemingen kunt zetten. verschillend maar identiek verdeeld. Omdat je echter niet aselect kiest uit de n! volgordes wordt de verde ling van f anders. Om te komen tot de correcte

u

controle op de toets moet de steekproefverdeling van f u (behorend bij volgorde x(1), ••• ,x(n)!!!) apart worden afgeleid. Pas dan kan deze methode worden vergeleken met bijvoorbeeld die van Tukey.)

Als geen speciale punten worden onderscheiden, doet de volgorde er niet toe.

0.0.

X1 - N(6 l ,1) ; 61 - N(Yl,l) ,

X2 - N(6 Z+!6 1,!)

f

ezla1 -

N(YZ-!6 1,!) •

Als de volgorde geen invloed heeft moet gelden

Dit voIgt uit:

zodat

(46)

N.B. Bovenstaande kan ook gezien worden als een direct gevolg van:

4.2. Schatten en toetsen met betrekking tot de kleinste van twee lokatieparameters

Situatie: ~1 ~ N(e

1

,1}

onafhankelijk ~2 ~ N(e2

,1) •

Vraagstelling ('schatten'): Zijn beide s's groter dan 0, anders gezegd: is min(e

1 ,62) > 0 ?

De interessante parameter is dus min(Sl,e 2}.

Notatie:

v := d :=

Iv I •

(Mogelijk) reZevante spZitsingen: (x1'x2)

=

(s,d,sgn(v» ,

waarbij d ancillair is met betrekking tot A en sgn(v) irrelevant. Ook:

De fiducieverdeling van 0 voIgt uit

en is gelijk aan

f(o}

=

~(o-d) - $(o+d) (zie eerder). In 0

=

0 is puntfiducie aanwezig ter grootte:

(47)

De fiducieverdeling van ~Io voIgt uit: .! '" N (~+ 0, 1)

t

>:

1'5 ....,

N (s-0, 1) •

De onvooPWaaraeZijke fiduaieveraeZing van A is de verwachting met betrek-king tot de verdeling van 0 (inclusiefhet singuliere deel!):

co

teA)

=

I

¢(A-s+o)f(o)do + p(x2 > d2)¢(A-S)

=

o

De eerste term is regu1ier interpreteerbaar en de tweede singulier of d 1 "k ( d ~ 0') D t II' 11'\ > 0".". De

voorwaar e 1J voorwaar e: u

= .•

e vraags e 1ng was: A

fiducie in deze uitspraak wordt gegeven door:

i(A > 0)

=

J

f(A)dA

=

o

co

=

f

{~(d'-y)¢(d'+y)

-

~(-dt-y)cp(d'-y)}

dy +

-5/12

+ 2~(-dH(s) t met d' :=

dIn.

N.B. Let op de analogie met het BF-probleem. Bet verschil is dat BF een Zokatie-sahaaZ probleem is, terwijl het onderhavige geval een Zokatie-Zokatie probleem genoemd mag worden. Bij het BF-probleem is een fiducie-yerdeling nodig voor Ilog(a~/a~)1 met singuliere fiducie in a~

=

a~, ter-wij 1 hier een fiducieverdeling nodig is voor 161 - 621 met singuliere fiducie in 8

1

=

82" Speciale gevallen:

d = 0 dan F(~ > 0)

=

~(s)

(48)

i

,

h.

l '

"

d=o

"-De twee eerste gevallen zijn interpreteerbaar onder 6

1 • 820 Bet derde geval is in de limiet direct interpreteerbaar, hetgeen intuitief duidelijk is. De twee termen in

F(r

> 0), een regulier en een voorwaardelijk inter-preteerbaar, kunnen worden onderscheiden:

F

(r

> 0)

=

F

(-r

> 0) +

F

(-r

> 0) •

r s

Onderstaande figuur geeft Fr en Fs als functie van xl en x2"

(-.-= fiduciehoogtelijn. gegeven 6 1

=

62)

'-X,z.

.~

..

,

t

..

,

..

"'-

/

/

/

/7:;.=.5

...

/

• 5 '\.

..

' /

'"

...

> ..

"

..

/"

"-'"

..

/"

..

. /

"-'"

..

--

1

"

'"

F:..5"

... /

..

J\.

"-

..

/

..

/ '

,

'\.

..

...

/

~ X'j.

/r:;.=.J

'"

'\.

..

/ '

...

'"

..

/ ' / '

"'-

..

/ '

>,

---

--

"

---

"

"-

~'"

.f

,

,

"-

"

"

"

+" ... ,

(49)

In dit verband zie ook:

Chambers, H.L., " ••• frequentist and bayesian solutions", JRSS, B, 32, 278-82, 1970.

Vraagstelling 2 ('toetsen'): Is de kleinste

e

gelijk aan 0, anders gezegd, is min(6

2,62) == O?

We gaan te werk analoog als bij vraagstelling 1. Echter nu voIgt uit:

dat; voorwaardelijk op 0:

f(A)

=

tanh I(S-O)AI ~(A-S+O) , pf == P(X2 > (8-0)2) ,

vanwege de aanwezigheid van het 'interessante' punt A

=

O.

De totale singuliere fiducie in A

=

0 is dan gelijk aan de verwachting met betrekking tot de verdeling van 0:

co fs:==

J P(X

2 > (s-0)2)f(0) do + p(X2 > d2)p(X2 > S2)

=

o

co ==

J

p(X2 >

(s-0)2){~(0-d)

- 4>(o+d)} do +

o

Speciale gevallen: d == 8 == 0 dan f

=

1 s d

=

0 dan f

=

p(X2 > s2) • S d + 00 dan fs + p(x2 >

2x(1»

(1)

"

(Opmerking achteraf: De laatste opmerking is niet waara Dat is dus een probleem! )

Referenties

GERELATEERDE DOCUMENTEN

Georg Ohm was een Duitse natuurkundige die onderzoek deed naar, en een wet ontwikkelde die, een relatie legt tussen spanning,.. weerstand

Behalve uitgangspunten, proposities en conclusie is er meer nodig, zoals aanduidingen waarom een bepaalde stap in een redenering gezet mag worden.. Vaak zijn

Het mooie van de discussies is dat goed naar voren komt welk type vragen je bij redeneringen kunt stel- len en je kunt afvragen wat nu eigenlijk uitgangspunten (aannames) zijn en hoe

Vervang de tweede premisse en de conclusie achtereen- volgens door de volgende uitspraken en onderzoek of de redenering dan nog steeds logisch correct is (gebruik eventueel

Voor een beschrijving van alle mogelijke zinnen in onze taal zijn natuurlijk veel meer regels nodigd. Deze methode biedt echter mogelijkheden om taalstructuren te onderzoeken en

In aanvulling op het vierde lid voldoet bij een ingrijpende renovatie als bedoeld in artikel 2 van de herziene richtlijn energieprestatie gebouw en w aarbij een technisch

Abstract—We propose an isolation network to simultaneously improve the input return loss, output return loss and isolation of the Wilkinson power divider in a wide bandwidth..

Vergelijking van het percentage in hoger beroep gevorderde en opgelegde straffen terzake van weigeren van de bloed- proef (art. 33a, lid 3 of 5 WVW), mannelijke