• No results found

Het benaderen van de normale verdeling

N/A
N/A
Protected

Academic year: 2021

Share "Het benaderen van de normale verdeling"

Copied!
24
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

NN31545.1048

NOTA 1048 april 1978 9 r f * •"-» * f

BiBLï ?--;

Droevcnda^lscsk-e»*

:

>a

Postbus 241

6700 AE Wageningen

HET BENADEREN VAN DE NORMALE VERDELING

J . R . M a a s s e n

Nota's van het Instituut zijn in principe interne communicatiemidde-len, dus geen officiële publikaties.

Hun inhoud varieert sterk en kan zowel betrekking hebben op een eenvoudige weergave van cijferreeksen, als op een concluderende discussie van onderzoeksresultaten, In de meeste gevallen zullen de conclusies echter van voorlopige aard zijn omdat het onderzoek nog niet is afgesloten.

Bepaalde nota's komen niet voor verspreiding buiten het Instituut in aanmerking

(2)

I N H O U D

b l a .

INLEIDING !

BENADERING VOLGENS HASTINGS 1

HET VERBAND MET DE NORMALE VERDELING 5

DE INVERSE FUNCTIE 6

TOEPASBAARHEID 7

PROGRAMMA ERROR 9

LITERATUUR 10

(3)

INLEIDING

Het berekenen van kansen van een normale verdeling kan niet rechtstreeks. De oorzaak hiervan is het feit dat de integraal die de verdeling beschrijft niet oplosbaar is. De numerieke waarde van kansen van een normale verdeling is te verkrijgen uit numerieke integratie of uit benaderingsformules. Hier werd gewerkt met bena-deringsfuncties zoals die ontwikkeld zijn door HASTINGS (1955).

BENADERING VOLGENS HASTINGS

Hastings geeft een benaderingsformule voor de in de fysica bekend zijnde zogenaamde error-functie welke met de normale verdeling verwant is.

$ (x) = 2 [*-t2

Z e C dt (1)

TTT

waarbij x • o of positief reëel en eindig

e » basis van het natuurlijk logarithmenstelsel

De benaderingsfunctie is als volgt opgebouwd:

Indien

waarin p = constante (zie fig- 1, 2 en 3)

(4)

* ( X ) = /TT - t2d t O < X < oo n = 1 1 + pX * * ( X ) = 1 - U j T i + a ^ n2 + a3n3) * ' ( X ) p = . 4 7 0 4 7 a] = .3084284 a2 = -.0849713 a3 = .6627698 fout 00002 0 r\ririr\r> \ 1 \ . 5 J

1

/ ' \ 1.0

\

l l . S / ^ " X 2 . 0

Fig. 1. Benadering van de error-functie met een 3e~graads functie van n (volgens HASTINGS)

(5)

M X )

= —

2_ VTT

f -t'dt

e 0 < X <

n =

l + pX $*(X) = 1 - (ajn + a2n2 + a3n"3 + a4nA)«'(X) P = .381965 fout 3j = .12771538 a2 = .54107939 a3 = -.53859539 a. = .75602755 4 -.000001

Fig. 2. Benadering van de error-functie met een 4e-graads functie van n (volgens HASTINGS)

(6)

*(X) = 2

"AT

2 -t dt O < X < « 1 + D X 2 3 4 5 $*(X) = 1 - (an + a2n + a n + a4n + a5n ) $'(X) p = .3275911 al = a2 = a3 = a4 = ar = .225836846 -.252128668 1.259695130 -1.287822453 .940646070 fout ,00000015r--.0000001 5- u

Fig. 3. Benadering van de error-functie met een 5e-graads functie van n (volgens HASTINGS)

(7)

dan wordt als benadering voor de error-functie gegeven

$*(x) = 1 - c(n).$'(x) (3)

waarin $'(x) de afgeleide is van $(x) naar x

en c = een functie van ri

2 -x2

In (3) is dan $' (x) = -r— e

VTT

Afhankelijk van de gewenste nauwkeurigheid, wordt door Hastings een 3e-, 4e-of 5e-graads functie van r\ gegeven. In fig. 1, 2 en 3

is deze functie nader uitgewerkt. Tevens is bij elke figuur de fout weergegeven die bij de betreffende benadering wordt gemaakt. Opvallend is dat bij waarden van x die groter zijn dan 1,50 de gemaakte fout zeer snel naar 0 loopt.

HET VERBAND MET DE NORMALE VERDELING

De error-functie $ houdt als volgt verband met de cumulatieve normale verdeling F:

$(x) = 2 F(x/2) - 1 (4)

waarin

F (...) = verdelingsfunctie van de normale verdeling met verwachting 0 en variantie 1

dus

F(x/2) = 4(1 + *(x)} (5)

Met de benaderingen voor $ door $* geeft dit

F*(x/2) = i(\ + <S>*(x)} en, in verband met (.3),

(8)

Stel nu dat _u normaal verdeeld is met parameters W en o, dan

is de transformatie naar de standaard-normale verdeling de functie F(z) waarin

a

(6)

Uit (4) volgt x =

72

zodat

Verder is gegeven dat n =

TTTö

j

1+pX dus de b e n a d e r i n g wordt F

*

(

H_E) =

i { 2

-

c

(

n

) . * » £ £ > }

l , ( ^ j

W T

DE INVERSE FUNCTIE

Uitgaande van de normale verdeling is het mogelijk om van een overschrijdingskans de bijbehorende drempelwaarde x(q) terug te berekenen.

x(q)

Fig. 4. p = kans op een waarde •$ x(q)

(9)

Ais we de kans dat een variabele een waadde kleiner of gelijk x, aanneemt gelijk stellen aan p, dan is de kans dat dit niet gebeurt gelijk aan 1-p, hetgeen we q noemen (gearceerd in fig. 4)

er i t' (?)

Nu geldt

an

2

X(q)

Door HASTINGS wordt gesteld dat als

n « /Ïnl-L) (8)

q

een benadering voor x(q) gegeven kan worden door

X*(q) = n - d(n) 19)

Hierin is d een rationele 3e graad« functie van n.

In fig- 5 is de term d gegeven en is de fout weergegeven die bij de benadering wordt gemaakt.

TOEPASBAARHEID

Gebleken is dat de toepasbaarheid van de functies van HASTINGS groot is. Bovendien zijn de functies gemakkelijk en goedkoop te

programmeren. Dit was aanleiding ten behoeve van een neers^ag-ronder-zoek het programma ERROR te ontwikkelen. Voor het bepalen van

kansen in een normale verdeling bleek de formule van Hastings een zeer goede benadering te zijn. Zelfs zo nauwkeurig dat het niet mogelijk bleek op de conventionele manier, dit is via numerieke

integratie volgens de symplex^meçhode, een even nauwkeurig resultaat te verkrijgen, binnen dezelfde grenzen, zowel wat betreft computertijd als computerkosten. Bij stapgrootte van 10 bleek de CYBER-»computer van IWIS-TNO al meer dan 1 uur rekentijd nodig te hebben om van een

(10)

kwam er nog een vrij grote onnauwkeurigheid in de resultaten voor, De benadering van Hastings is daarentegen altijd tot minstens 6 decimalen nauwkeurig, wordt direkt berekend en gaat binnen een fractie van de tijd benodigd voor het integreren.

1 I - | t2d t x(q) 0 < q < .5 n • /

In

X*(q)

= n

-aQ + ajH + a2n 1 + b n + b2n + b3n aQ = 2.515517 1.432788 Hj = .802853 b2 = .189269 a2 = .010328 .001308 fout ,0004 .0004

-Fig. 5. Benadering van de drempelwaarde met een 3e-*graads functie van n (volgens HASTINGS)

(11)

PROGRAMMA ERROR

Het programma ERROR is zodanig ontwikkeld dat men er kansen en drempelwaarden mee kan berekenen voor verdelingen die al dan niet afgeknot zijn. Voorwaarde is dat de verdelingen wel normaal zijn. Tevens is het mogelijk de verwachtingswaarde van afgeknotte verde-lingen te berekenen. Voor het berekenen van kansen is de benadering uit fig. 3 gebruikt, omdat deze het nauwkeurigst is. Het berekenen van de verwachtingswaarde onder afknotting, zal aan de hand van fig. 6 duidelijk worden.

Fig. 6. Voorbeeld van een afgeknotte verdeling

Stel we hebben een normale verdeling met verwachtingswaarde p. Als nu bekend is dat waarden die kleiner zijn dan x niet kunnen

o

voorkomen, dan kunnen we de verdeling beschouwen als zijnde afgeknot in het punt x . Het is dan ook duidelijk, dat als het gearceerde

gedeelte in fig. 6 niet 'meedoet', het gemiddelde, dus de verwachtings-waarde E(x), naar rechts opschuift. Deze nieuwe verwachtings-waarde E(x) wordt in programma ERROR ook berekend.

Afhankelijk van wat men in de eerste gegeven-kaart opgeeft, wordt een aantal berekeningen uitgevoerd. In deze eerste gegeven-kaart worden globale gegevens aan de computer verstrekt, die in volgende kaarten

gespecificeerd moeten worden. Wordt b.v. in de eerste gegeven-kaart opgegeven dat de verdeling niet standaard-normaal is, dan moeten

(12)

in de tweede gegeven-kaart de parameters van de verdeling worden gespecificeerd. Wordt opgegeven dat de verdeling is afgeknot, dan moet in een volgende kaart opgegeven worden in welk punt de ver-deling is afgeknot. Evenzo moet in de eerste gegeven-kaart opge-geven worden welke bewerking men uitgevoerd wil hebben: het be-rekenen van onderschrijdingskansen, het bebe-rekenen van de verwach-tingswaarde onder afknotting, of het uit een op te geven

over-schrijdingskans terugberekenen van de drempelwaarde.

Wil men een combinatie van bewerkingen uit laten voeren, dan is dit ook mogelijk. Aan de hand van voorbeelden in de bijlagen wordt dit verduidelijkt.

LITERATUUR

HASTINGS, C , 1955. Approximations for digital computers, Princeton University Press, Princeton, New Yersey, pp. 201

(13)

bijlage 1

Ter verduidelijking van de positie van de gegevens op ponskaart staan de kaartkolomnummers vermeld op de input-voorbeelden.

voorbeeld nr. 1 van in/output programma ERROR

In de programma-besturingskaart wordt opgegeven dat alle bewerkingen gewenst zijn.

In de 2e kaart worden de parameters van de verdeling opgegeven

In de 3e kaart wordt opgegeven waar de verdeling is afgeknot

In de 4e kaart wordt een aantal waarden opgegeven waarvoor de onderschrijdingskans moet worden berekend

In de 5e kaart wordt de overschrijdingskans opgegeven, waarvoor de bijbehorende drempelwaarde moet worden berekend.

(14)

bijlage 1 vervolg s co Si N. Ei •-e CG ; i i 1 1 ! ! « | CM ;_! ET S X

-z.

!—i 1 — <r

<r

r— CO J — C S • t CO i i i ; i i i <Si • 1 CM i LL! Fi •—! _ i 1:! CC LU E Si CD 0--_l CO iC < ! et: <r -r : j"t"t <C CM CM I <C SI Si CO LO O 12

(15)

vervolg b i j l a g e 1

CS CS CS CS s i! <r E CD t - i CO 2 : LU CS es « es il 3 E KS *•*£ n 1-1 M r n • y i—i _ l LU a e t LU I > LU C l X « I > CTJ Ä LU -— uJ E <r ce <r a. ^ r LU O !"r"' <r <x 3 , i i . : 0_ E LU e t A -U i r> ! : i en !:! cri a. O Lu a 3 : LU o ! O "*"> LÜ O ££! -••.•.' c r> i—i CS ts CS CS a *<r* -. d l CS • © u !3Ü <r r> „ i LU CD <r V— en 2 : <r i £ CS! CS G! X 33 II X n H-1 -^ h-O 2 : ü LU CD U . <T CO 1—1 CD Z 1—( _ j LU C5 cc: LU :> LU O s i K K ' es; 5 0".: CS CS CS CS i-r: N . O-% N . (Si co « 1 3 G-I © S i © a T " O-- ? T L0 CK IX -•r 0 -co -•0 CM œ •-0 CD CS CS CS CS « CS CS CS CS CS CS CS « CS CS CS CS CS CS CS 1 <«r i CS CS CS CS S i M CS CS CS CS CS CS CS « CS W CS 1 CS CS CS CS CS CS CS CS co i !! S i CS CS CS S i CS CS CS li 1—i X X O. Lf.i CO CO N . O-K « h -CD <r <r cc 0 LU Q3 CS S i CS CS h -2 : ID a. 1 -LU X Z : !—1 CD 2 : !—1 r - H-O •z. ü Lu < I CC LU O 2 : O LU O er: <r <r 3 œ en 2 : M l — X CJ <z 3 e t LU 3 LU a -T N . <! 1 LU 0 cc <r zs _ l LU a. E LU CC Û LU Û I--CC O O "*-CS CS CS CS • •<--. CS CS 8 CS ; _ • *2; 2 : <r :> CS CS Lü CS _ j CS i-i CS LL-CS CS L . LO O « >-CO 0 . 2 : 0 <r 0 x en ac <*• CD U I 2 ; K •-< LL. Q Û <Z cc n 0 M O O Cd LU LU x CE: cc: CJ LU 1X1 1— -. cc: 2; es LU TJ z> 0 0 0 2 : LU LU Q >~i n 0 i-i UJ ca 13

(16)

bijlage 2

voorbeeld nr. 2 van in/output programma ERROR

In de programma-besturingskaart wordt opgegeven dat de verdeling standaard-normaal en niet afgeknot is. Gevraagd wordt kansen en de drempelwaarde, behorend bij een op te geven overschrijdingskans, te berekenen.

In de 2e kaart wordt een aantal waarden opgegeven waarvoor de onderschrijdingskans moet worden berekend

In de 3e kaart wordt de overschrijdingskans opgegeven, waarvoor de bijbehorende drempelwaarde moet worden berekend.

(17)

bijlage 2 vervolg CO i 1 I 1 1 ! ! i © » 1 r--, i i i i © » ! •o 1 i I i 1 i | © • ! si; : C l n w CO i • * - i 1 ! Lü ! I O © « ! I -r i i ! i I i ! i O i © i !— ! I I I ! ! i X © • ! I CO i I •Z. ! I *-* I I ! I H - I i <r ! i <r •«- i !— ! i ! CO i ! © « i i h N i I -i ! I CL. " i •Z. ! j ! i UJ I N I - t .

n

1—! 1 Ui •*•.*** n' LLi 3 Lu O H © » r"[ *•*•• Il CO © N. ï£ •« f- LO C i ••*• <c co <L" CV v ; -<r" i ! ! i 1 i 1 ! <C ! * U. ! <X CO O ! * 1 LU * N! LO t © • I i

i

;

i

! 1 i ü . i O ! LU i J^ 1 16

(18)

b i j l a g e 2 vervolg

S! Si S3 (S3 Ui O

cc

<z

<x

3 _! Ui Cu E UJ ® c o © S3 S3 S3 S3 S3 S3 • LO • CO >C I CC C * » UJ Cs CC S3 -T <r S3 l> 3 S3 » _ l « -T Ld CM CVi O . fv E rx LU cc- cc Û Û S3 -3" S3 hs H-S3 <r cc • -T o •*- co o - r CO i-i

«r

E CD HH CO 2: LU S3 S3 • S3 II 3 E s* z

n

M N CO z 1—1 _J LU Û

ce

UJ > LU Û z

<r

:>

co

ce:

Ui i~

Lu

E

<r

oc

«r

ü_ LU Ui CD Ui CD Cu

o

UI O 3E Ui CD _J LU Ci cc

o

o

z> i"""I S3 S3 S3 S3 « <«--. S3 S3 * S3 « — i Z Z

<r

> _i Ui

co

<c

h-co

z <z i£ f—

o

z ÏC UI CD U

<c

H-Ul t-i 2 CO t-t CD Z u-< _l UI O cc Ui D-UI Cl « S3 S3 S3 S3 S3 S3 » S3 S3 S3 Si S3 LTJ 1 S 3 SD S 3 CM S 3 L O « L O •*- - 0 1 CO LO T « S3 -O S3 S3 S3 S3 • LO CM N. i CM CM S3 » S3 N. S3 CN S3 CK • *<r co co 1 -<-S3 S3 » Il il M X X CU a. X LU >-CC Û Ui H-U UI H-Ul Û -J LO _J

<r

E CO •«-««T* O CC O LU »-i—

z

Ui E ^2 CD CO E Z3 Z CC

o

CC ce: cc

<r

UI S3 S3 S3 S3 a •< -S3 S3 * S3 u

z

z

<r

S3 S3 Ui S3 _i S3 *~i Si Lu S3 S3 U LO O • > co o_

z

o

<r u y co cc •«• CD LU Z h-H l l û Û <r cc

n o

i-H Q o ce: ui ui x ce: ce: U LU co * -CC Z S3 ui n

> o

O CJ z Ui Ui

o

1-4

n o

M UI CO 17

(19)

bijlage 3

voorbeeld nr. 3 van in/output programma ERROR

In de programma-besturingskaart wordt opgegeven dat van de standaard-normale verdeling de verwachtingswaarde onder afknotting moet worden berekend.

In de 2e kaart wordt opgegeven waar de verdeling is afgeknot.

(20)

bijlage 3 vervolg

o

_! CD Ld E O Gl 02 S3 ••O CO U0 Si UJ -z. iSl 00 f-S3 Z3 O. 2E i-l LU

n

S-l _J Ui Ü a: UI 3 UI Û E IS O C* _l CO O N. ü O H LO ce: *r <r f o <r CM Ï £ •*-* • * i o * ui 20

(21)

bijlage 3 vervolg

o © ca es co CD CD <E ca <r es cc CO o CD UI • ai O I! CO CS <r « E CS CD CS *-* L O CO i 2 I -UJ 3E CL CD H CD UI X CD => z E w O. O. H UI X X H- _J «• UI UI O M z z u . n >- >- x HH CO OD U. U N <t O o o CD UI UI C O -2 : K H- UI Q. w O CJ Û O _l ui ui z u UI H- H O

o

ui ui cc «-CC O Û UIUI UI Û H :> CC u. o -ILO _ l LO <t <E CC UI - J ' * " _J ^ <C O . 0 <r "«- <r <" 3 0 0 E : E : CO UI VUI Z CD C O CD C C CC <E Z U i Z> O C C O C C W H -O U I -O UI H- Z C-O CO H- CO H- CO X 3 CC E E U O UI I - 3 h- 3 4 U H- -Z.-Z.-Z.-Z. 3 Z UI UI Ui CC UI E E CC E CC Ui <c 3 0 3 0 > w CC CD CC O CC o <X CC CC CC CC UIUI 0. <C Ui <X Ui o 21

(22)

bijlage 4

voorbeeld nr. 4 van in/output programma ERROR

In de programma-besturingskaart wordt opgegeven dat alle bewerkingen gewenst zijn

In de 2e kaart worden de parameters van de verdeling opgegeven

In de 3e kaart wordt opgegeven waar de verdeling is afgeknot

In de 4e kaart wordt een aantal waarden opgegeven waarvoor de onderschrijdingskans moet worden berekend

In de 5e kaart wordt de overschrijdingskans opgegeven, waarvoor de bijbehorende drempelwaarde moet worden berekend.

(23)

b i j l a g e 4 v e r v o l g es co N. Si ' I CO

w

^v. { co LiJ

o

2 ~J •—! _l E O !— ÜJ X •z. \—i i— <r <r H-co i—

n

o. •z. !—1 Ui "*•.'" Si • 1 LO 1 1 1 1 ! f { i i i S ) ' 1 ** ! i 1 1 1 1 t 1 i SI « ! CO ! ! 1 i 1 i 1 i I Si « 1 CM i i ! i i ! I •<r Si •«r -1 W 1

n

_J uu V ££. UI 3 U!

a

E Si « O 0-_i CO CD N, ^ <! 5- LO u£ -*• <I co <I CvJ •^ x -i i LO 1 1 t i ! <C CVI • ! <E CO Lu Lu 1 <r 1 CO O LO O ! <t I Ld • Lü 1 <E ^ i S ^ 24

(24)

bij lafe 4 vervolg

ts

(S S3 Ei a LO il

<r

E: CD i — i

co

2 LÜ

o

CS e

cv

!l

n

E at z

n

i~-> Ni CD 2 i — t __i LU û

cc:

LU IJ-LU c> 2

<c

:>

en

tx LU fc— Lü E <I

.->-<r

A z Lü O Cf.'

<r

<r

3 i Lu O. E Lu

cc

Cl 2: Lü Z> LU CD LU CD

a.

o

LU O 2: LU CD _l C ^> LU Q

ce:

o

o

r>

i — i © CS S3 IS c LO -, Si IS « 04 > — < ^ 2:

<r

~*k _j LU CO

<r

H-co

2 <C "X' El CS Ei • CO ! ii X

n

i-i CD !— O 2 V ^ LU CD u. <C CO 1-1

o

2 !—1 _i LU C-j

o:

LU *"> LU O o -a-CS! 04 Si 0-> <c-CO o-Cs

O-«r

a Ei CC CS 0-i Ei fv s *r-04 N. LO Si -T a si co Si co Sl IN • Si •*- LO Hf CO 8 Si O-Ei "•" © f 0 « œ Si O £53 04 04 e Si CO CS •* 155 <i « 0s *«- o5 ! N.

co

M T 8 Ei C3 Ei 04 Ei 04 • CO 04 04 1 CO O E" « Ei CS Si CS CS El » Ei 03 Si 1 Ei S3 CS s CSl ii 1! i — 1 - T " X Cu Ei Si Ei CO CO V** 9 CO i— CD

<c

<r

Cf Cl LU CD Ei

ca

Si V CO ! f— 2 Zi

o.

H-LÜ X 2 i — i CD 2 i — i h-O 2 •£. LL.

<r

o:

Ui Cl 2

o

Lu f^: SX

<c

<c

3 CO CD 2 i—i ï— X U

<r

3 tx LU Z> LU Q CN O-Cs II 04 Lü C' cc <r

<x

3 -J UI CL. E LU tx O LU O 1—

cc

o

o

X r-i El Ei £1 E! R LO •* CS Ei a 04 l _ : 2 2 <E Z> Ei Q LU Si _l El t-i CS u_ Ei S3 Lu LO O n -j-co o. 2 O

*? °

*2u to ei "f CD Lu 2 1-M U_ O a <r cc

n o

M Û U CC LU LU •x. cetx U LU DO 1— -CC* 2 El LU 3 > O O CJ 2 Lu' LU O >-f

,n o

M LU CD 25

Referenties

GERELATEERDE DOCUMENTEN

 Bereken dit exact met behulp van je rekenmachine.  Bereken dit benaderend door ervan uit te gaan dat de verdeling normaal is. De tijdsduur van lokale telefoongesprekken is

De relatie tussen de huidige overschrijdingskans en de bijbehorende overstromingskans zou in beeld moeten worden gebracht om indien nodig goed onderbouwd terug

Wanneer er voor de afnemers gericht op extrinsieke waarde wordt gekozen, moet Scholma Druk meer aanbieden dan productwaarde alleen.. Deze afnemers focussen zich voornamelijk op wat

In deze opgaven kunnen de leerlingen vooruitlopend op de volgende paragraaf zelf een aantal regelmatigheden in de klokvormige verdeling ontdekken die

c) Geef een schatting van het percentage van de Nederlandse mannen met een voetlengte van meer dan 44 cm. d) Schat ook op basis van de gegevens in de database het gemiddelde en de

Daardoor zal de verdeling scheef zijn: mannen met een groot gewicht komen veel vaker voor.... Je moet dan

De afgelopen vijf jaar was de verpleegduur in Nederlandse ziekenhuizen voor heupoperaties ongeveer normaal verdeeld met een gemiddelde van 4,5 dagen en een standaardafwijking van

is ongeveer 2 maal zo groot, de kans op 10% afwijking is veel groter geworden.. In het