• No results found

CORRELATIEREKENING ALS HULPMIDDEL BIJ BEDRIJFS­ ECONOMISCHE ANALYSES

N/A
N/A
Protected

Academic year: 2021

Share "CORRELATIEREKENING ALS HULPMIDDEL BIJ BEDRIJFS­ ECONOMISCHE ANALYSES"

Copied!
11
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

C O R R E L A T IE R E K E N IN G A LS H U L P M ID D E L BIJ B E D R IJF S ­ E C O N O M IS C H E A N A L Y S E S

door H . A . A . de M elverda IV

Enkelvoudige kromlijnige correlatie.

H e t v o o rg a an d e w as uitsluitend v an toepassing op de enkelvoudige rechtlijnige correlatie. D a arn aa st b estaat echter de mogelijkheid, d at de „puntenw olk” een enigszins kromlijnige vorm heeft, zodat zij beter kan w orden benaderd door een kromme lijn, i.p.v. een rechte lijn.

D e m ethode, die wij nu zullen volgen, b estaat hierin, d a t wij door substitutie het verband rechtlijnig maken en daard o o r terugbrengen tot zijn eenvoudigste vorm. Enige voorbeelden kunnen dit duidelijk maken.

1. Stel het verband tussen X en Y kan het best w orden b enaderd door de vergelijking Y ' — a + b.log X . E en dergelijk verband kan men gem akkelijk constateren door de puntenw olk op zgn. enkel-logarith- misch papier, d a t in de handel verkrijgbaar is, te tekenen, daarbij X uitzettende op de horizontale logarithm ische verdeling en Y op de verticale norm ale verdeling; vindt men aldus een lineair verband, dan geeft bovenstaande vergelijking de beste benadering. E en d e r­ gelijk verband wijst erop, d a t de toenam e van X volgens een m eet­ kundige reeks sam engaat met een toenam e van Y volgens een reken­ kundige reeks. W ij kunnen het w aarnem en bij allerlei groeiverschijn- selen zoals toenam e van de productie, toenam e van de bevolking in de loop der tijd, enz.

D e te volgen m ethode om de correlatiecoëfficiënt en de regressielijn te berekenen is analoog aan de grafische voorstelling en b estaat hierin, d at wij nu log X vervangen door Z , zodat wij krijgen het lineaire verband Y ' = a + b Z , w aarin wij a en b op de gebruikelijke wijze berekenen en vervolgens voor Z w eer log X substitueren. M en zou kunnen aanvoeren, dat wij nu berekenen voor de corre­ latiecoëfficiënt het verband tussen Y en log X (i.p.v. tussen Y en X ) , doch dit is geen bezw aar, aangezien bij volm aakte correlatie tussen Y en log X de correlatie tussen Y en X óók volm aakt moet zijn, terwijl bij volkomen afw ezigheid van correlatie tussen Y en log X de correlatie tussen Y en X óók afwezig moet zijn, zodat de aldus berekende correlatiecoëfficiënt een goede m aatstaf blijkt voor de m ate van correlatie tussen X en Y. 6)

2. Kan het verband tussen X en Y het best w orden aangegeven door de vergelijking log Y ' *= a + b log X , dan levert de grafische voor­ stelling, than s getekend op zgn. dubbel-logarithm isch papier, w eder­ om een rechte lijn op. Bij onderzoek van vraagcurven kan men dit verband w el tegenkom en, echter met b negatief.

O ok deze vergelijking w ordt tot de lineaire vergelijking terugge­ b rach t door substitutie van log Y ' = U en L og X = V , w a arn a er komt U t = a i+ b V .

6) Indien men toch de waarde l/~ ^ -w = t / ^ ^ l — berekent, dan spreekt men bij r s y2 ' S r

(2)

3. Is het verband van de aa rd y j Y ' = b y / X , dan kan men de logarith­ men bepalen log Y ' s = 2 Zog 6 + Zog X , w a ard o o r deze vorm gaat gelijken op die onder no. 2 behandeld. Evenzo kan men handelen, als men een verband heeft als b.v.

Y ’ t = b y X ; log Y ’ e= log b + y 2 log X . Y ' = b X 2; Zog Y ' Zog b + 2 Zog X . Y ' i = b c x ; log Y ' c = Zog b + X log c.

4.

5.

6

.

H et laatste geval (d e z.g. exponentiële curve) komt b.v. voor bij toenam en volgens sam engestelde interest: K t = K 0 (1 + r ) 1; ook in de toenam e van het verkeer kan men w el een hierop gelijkende curve vinden, w aarbij de gem iddelde verkeerstoenam e p er ja a r (r) d er­ halve statistisch moet w orden bepaald. In al deze gevallen kan het karak ter der curve op dubbel- of enkel logarithm isch papier w orden opgespoord.

T re e d t in de functies van 3 achter het gelijkteken nog een constante op, b.v. Y ' <= a + b \ j X , dan kan men met de logarithm ische m ethode niets uitrichten. M en moet dan voor y j X c= Z substitueren. D it verband kan men opsporen door de grafische voorstelling op norm aal grafisch papier te tekenen, doch op de horizontale as, in plaats van op gelijke afstan d en de natuurlijke getallen, de quad raten dier ge­ tallen te zetten. O p dit enkel-quadratisch papier v indt men dan een rechte lijn.

H e eft men als functie Y ’ = a + b X 2, dan moet men dus X 2 = Z substitueren. D e grafische voorstelling kan men transform eren tot een rechte lijn door op de horizontale as, in plaats van op gelijke afstan d en de oorspronkelijke getallen, de w ortels dier getallen te zetten.

E en verband echter als Y ’ e= a + bcx kan men noch logarithm isch m aken noch door substitutie oplossen. O ok de hogere w iskunde levert geen bevredigende oplossing, w a n t men kan nu eenm aal niet de m acht uitrekenen van een getal, d a t nog onbekend is (c).

D e enige oplossing is nu: proberen, n.1. door te schrijven: ( Y ' — a) <= <= bcx en dan log ( Y ' — a) c = log b + X l o g c. D oor nu voor a verschillende w aard en te proberen kan men de juiste w a ard e van a benaderen. S tatistisch kunnen de verschillende m ogelijkheden w orden onderzocht, d a a r voor de beste w aard e van a ook de hoogste corre- latie-coëfficiënt (tussen log ( Y ' — a) en X ) moet w orden gevonden.

X

H e eft men een zgn. hyperbolisch verband, b.v. Y ' <= -— ---- ^ , dan b + c X levert substitutie van U <= 1

Y " en van V !

X de volgende vergelijking op: U = c + b V . Indien men dus een dergelijk hyperbolisch verband verm oedt, dan kan men dit grafisch onderzoeken door op beide assen in plaats v an de oorspronkelijke getallen de reciproke w aard en d a a r­ van a f te zetten.

(3)

H e t kennen van het verloop van een aantal d er m eest voorkom ende functies kan ons daarbij goede diensten bewijzen, w a arn a het ver­ m oeden kan w orden getoetst aan de han d van een grafische voor­ stelling, w aarin de lijn kunstm atig recht is gem aakt door in de plaats van de oorspronkelijke getallen op één öf op beide assen de logarithm e, h et quadraat, de w ortel of de reciproke dier getallen af te zetten. H e t kan voorkomen, d at het op het oog niet gem akkelijk te consta­ teren is of de ene of de andere benadering de beste is. In die ge­ vallen zal de correlatiecoëfficient, voor beide benaderingen berekend, deze vraag m oeten beslissen.

Is in de regel door bepaalde kunstgrepen het w el mogelijk om een enkelvoudige kromlijnige correlatie om te zetten in een enkelvoudige lineaire correlatie, in sommige gevallen blijkt dit niet mogelijk. Doch dan kan men zijn toevlucht zoeken to t om zetting in een m eervoudige lineaire correlatie, zoals onderstaande voorbeelden zullen doen zien. 7. B estaat er een parabolisch verband van de algem ene vorm

Y ' <= a + b X + c X 2, dan kan men door substitutie van X 2 — X 2 hiervoor schrijven Y ' = a + b X x + c X 2, (w aarin X x = X is). 8. F requentieverdelingen hebben een exponentieel karakter. Z o geeft

b.v. de vergelijking Y ' = g X he ~ kx een curve aan, die in de oorsprong aan v an g t (X e= 0 geeft Y ' = 0, snel opstijgt tot een bepaald m axi­ mum en d aa rn a geleidelijk afd aalt ( X <= co geeft Y ' = 0 ). In d er­ gelijke gevallen kan men eerst de logarithm en bepalen:

log Y ' e= log g + h log X —■ k X log e, w aarin e <= 2,71828.. S ubstitutie kan ook hier leiden tot een m eervoudige vergelijking n.1. van de gedaante U = a + b V 1 — c V 2.

D e hier sub 7 en 8 gegeven voorbeelden van substitutie doen het voor­ komen, alsof er niet één oorzaak m aar twee verschillende oorzaken in­ w erken, terw ijl tussen deze oorzaken een functioneel verband bestaat; zo is in 7 X 2 identiek met X 2 en in 8 is log V 2 identiek m et V 1.

D e oplossing voor deze, eigenlijk enkelvoudige, correlaties w ordt hier­ onder bij de m ultipele (d.i. m eervoudige) correlatie behandeld.

M ultipele correlatie.

D oor het slot van de vorige p a rag ra af zijn wij al ongem erkt het domein van de multipele correlatierekening binnen gegaan. V a n practisch belang zijn hier slechts de lineaire correlaties: de andere correlaties kunnen door substitutie hiertoe herleid w orden of zijn zó m onstrueus, d at wij ons van een mogelijke oplossing moeten distantiëren. H e t algem een verband is dus van het karakter

Y ' t = a + b i X ^ -j- b2X 2 -4- ...

G em akshalve zullen wij ons eerst bepalen tot het geval, d a t er slechts tw ee variabelen X t en X 2 zijn. Z u lk een geval kan zich voordoen als er tw ee producten w orden vervaardigd, w aarv an de functie der totale kosten resp. w ordt aangegeven door Y x' <= a 1 + b 1X 1

en door Y 2 = a 2 + b2X 2

(4)

D e berekening van de gezochte regressielijn g aa t geheel analoog aan de berekening, die wij hebben gevolgd bij de enkelvoudige correlatie. O m deze reden geven wij hier uitsluitend de algebraïsche bew erking.

W ij gaan hier uit van Y — a + b xX x + b2X 2 ,+ e, w aarin e de w a a r­ nem ingsfout Y — Y ' voorstelt.

H iervan trekken wij a f Y t = a + b 1X 1 + b2X 2, w a araa n geen w a a r­ nem ingsfout kleeft, d aa r het punt Y , X x, X 2 op het gezochte v l a k 7) moet liggen. W ij houden n a aftrekking d an over y = b xx x + b2x 2 + e, w aaruit volgt:

e = y — b xx x — b2x 2

W o r d t nu aangenom en, d a t de w aarnem ingsfout e w o rd t veroorzaakt door storende invloeden uitsluitend in de w aarnem ing van Y , dan moet er afw ezigheid zijn van enige correlatie tussen e en en x2, m.a.w. wij vinden als norm aalvergelijkingen

2 x xe <= 0 2 x 2e <= 0

V ullen wij hierin de w a ard e e in, dan vinden wij 2 x xy = b x 2 x 2 + b 2 2 x xx 2 2 x 2y = b x 2 x xx 2 + b2 2 x 2

H ierm ede hebben wij tw ee vergelijkingen met tw ee onbekenden, zodat de bepaling van de beide regressiecoëfficiënten ( b x en b2) verder een kw estie van rekenen is.

A ls pasklaar gem aakte formules vinden wij: 2 x xy 2 x \ — X x 2y 2 x xx 2 1 X x 2t X x j — (X x xx 2) 2 , 2 x xy — b x X x \ O o --- --- ---2 x xx ---2 a c = F — b xX x — b2ÿ 2 (IV 1)

V o o r de berekening volgens de crude d a ta m ethod kan men op over­ eenkom stige wijze gebruik m aken van de formules (III 5a t/m c) b.v.:

^ __ v v v 2 X x X X 2 2 x xx 2 -— 2 Ax-A2 — ---

---O ok de controle op de berekening g aa t geheel als bij de enkelvoudige correlatie. M en stelt nu Q = Y + X x + X 2 en vindt dan:

2 X x Q = 2 X x Y + 2 X f + CS X x X 2 ... (a)

x

x

2

q

= a 2 y + s X x X2 + 2 X ^ . . . .

(b)

X Y Q <= X Y 2 + 2 X xY + 2 X 2Y ... (c)

(IV 2)

D e controle volgt d an (zoals men gemakkelijk kan verifiëren) als volgt:

(5)

a en b goed en c „ b

verkeerd, dan fout te zoeken bij S Y 2 a b a b c c c .. a „ , „ „ „ 6 e n c „ , „ „ „ a „ c „ , „ „ „ a „ b ... „

M en ziet uit een en ander, d a t alléén de berekeningen iets om slach­ tiger zijn gew orden, doch d at in w ezen de m aterie even eenvoudig is als bij de enkelvoudige correlatierekening.

Z X \ % X \ 2 X 2Y 2 x xy 2 X xX 2

D e algemeen gestelde oplossing.

D e algem een gestelde oplossing voor correlatie tussen y enerzijds en * i, * 2...x n anderzijds zal nu w el geen moeilijkheden opleveren.

A ls norm aalvergelijkingen vinden wij dan: 2 * i e = 0

2 x 2e — 0

2 x ne 0

(IV 3)

D e w illekeurige norm aalvergelijking 2 x ke levert nu als uitkom st 2 x ke = 2 *k ( y — y ') ^ = 2 x ky — 2 x ky ' = 0, w aaru it volgt: 2 x ky — 2 x ky', hetgeen door invulling van de uitw erking voor y ' oplevert:

2 x ky c = 2 x k ( b 1x 1 + b2x 2 + ... + bnx j

D e uitgew erkte serie norm aalvergelijkingen ziet er dan als volgt uit: 2 x xy — b 1 X x ^ + b2 2 x xx 2 + b3 X x xx 3 + ... + bn 2 x xxn ■

2 * 2y bi 2 * i* 2 + b2 2 * 2 + 6 3 2 * 2 * 3 + ••• + 6 n 2 * 2* n

2 x ny — b x 2 * i* n + b2 2 x 2x n + b3 2 * 3* n + ... + bn 2 *n2

D oor het sym m etrisch k arak ter dezer serie is zij gem akkelijk op te schrijven. U it deze vergelijkingen kunnen de regressiecoëfficiënten w or­ den opgelost. Z o als men ziet moet men van de variabelen alle quadraten en alle onderling mogelijke producten berekenen.

D it vereist heel w at rekenw erk, doch d aa r is niet veel aan te doen; pasklare formules zijn nu niet op eenvoudige w ijze te geven. V o o r aller­ lei bew erkingen hebben wij q uadraten of w ortels van getallen nodig; daarom kan een tabel voor de q uadraten der getallen 1 — 10.000 hier zeer goede diensten bewijzen. V o o rts zal een rekenm achine van veel nut zijn om rekenfouten te voorkom en en tijd uit te winnen.

D e m ultipele correlatiecoëfficiënt.

(6)

anderzijds slechts in zijn geheel sam envatten, als de correlatiecoëfficiënt voor het verband tussen y en y ' w o rd t berekend.

2 ( y y ' ) 2 w' S i / 2 . 2 ( y ' ) 2

N u is 2 y y ' = 2 y (bj Xi + b2x 2 + b3x 3 + . .. ) =

= b 1 X x 1y + b2 % x 2y + b3 % x 3y + ... D it kan door toepassing van de boven gevonden gelijkheid 2 x ky = 2 x ky ' w orden ge­ schreven als: 2 y y ' — b 1 2 X i y ' + b2 2 x 2y ' + b3 2 x 3y ' + ... = 2 y ' ( b 1x 1 + b2x 2 + b3x 3 + ... ) Dus: 2 y y ' = 2 ( y ' ) 2 ... (IV 5) H ieruit volgt: 2 — s y y ' __ s ( y ' ) 2 yy' 2 y 2 2 y 2 (IV 6)

D eze formule geldt algem een voor alle lineaire correlaties. W ij zien hieruit, dat de correlatiecoëfficiënt geheel w o rd t bepaald door de mate, w aarin 2 ( y ' ) 2 kleiner is dan 2 y 2, d.w.z. door de m ate, w aarin de v aria­ tie van de berekende w aard e Y ’ kleiner is dan de variatie van de w erke­ lijke w aard e Y .

V o o r practisch gebruik is de volgende uitgew erkte formule het meest geschikt, w aarin voor 2 y y ' de uitgew erkte vorm w o rd t ingevuld, welke wij hierboven reeds vonden:

2 y y '

r fcj 2 X \ y + b2 2 x 2y +

% 7 2 (IV 7)

H e t correlatie-e[[ect van nieuwe variabelen.

M en zal zich afvragen, w a t het effect zal zijn van de toevoeging van een nieuwe variabele op de reeds verkregen correlatie, w an t van dit effect zal het afhangen of die toevoeging zin heeft of niet. A an de hand van

2 y x x 2 x \ — 2 y x 2 2 x xx 2 de formule voor drie variabelen voor fo, i = ————-— ---y—--- -r-—

2 x \ 2 x \ — (2 x xx 2) 2 kunnen wij reeds direct iets naders daarom trent zeggen. Immers de noe­ mer mag niet gelijk aan nul w orden, wil men een reële uitkom st voor b x verkrijgen. D eze noem er kan echter alleen nul w orden in het geval

■o o ,__ /"s? 19 • J - __ ^1^2) “ 2 xi. C= (2 XXX2) 2 IS, ----

---w aarin 2 x 2. d.w.z. w anneer

1 is.

2 x 2 2 x22

H e t blijkt dus nodig, d at er tussen ^ en x 2 geen volm aakte correlatie bestaat. D eze conclusie is natuurlijk plausibel, w ant bij volm aakte corre­ latie is er een vaste verhouding tussen en x 2, zodat men dan y als het w are tw eem aal uit dezelfde reeks zou w illen verklaren. V o o r dat geval is het duidelijk, d a t toevoeging van de nieuw e variabele de corre­ latie niet in het minst verbetert, zodat r 2 , <= r 2 = t 2 is.

y y y * i y*2

(7)

ant-w oord te vinden, transform eren ant-wij bovenstaande formule voor b 1 eerst door teller en noem er te delen door 2 x \ 2 x \ :

bi 5 y x i l x ] 2 y x 2 2 x xx 2 2 x] 2 x 2 1 ( t x xx 2) 2 X x 2 2 xj

V o o r de noem er kunnen wij schrijven 1 — r2 . D e teller transform eren wij nog iets verder als volgt:

M 10 [ f è y x j 2 ï y x i . 2 yx2 . 2 x xx 2 2 yx± \ 2 y 2 2 * 2 y s y2 2 x] . V 2 y 2 2 x 2 . V 2 x 2X x\ zodat wij th an s kunnen schrijven b 1

Evenzo vinden wij voor bn =

2 y 2 r2yxi ryxi •■ rxy» • rxiX2 2 y x i ' 1 — - r 2 *1*2

2 y2 r2y*2 fyxi • **yx2 • ^*xix2 X y x 2 ' 1 —- r2xiX2 V ullen wij deze uitkom sten in de formule voor de multipele correlatie- coëfficiënt, w elke wij thans aangeven met ry.xix2 (te lezen als: de corre- latiecoëfficiënt voor de correlatie tussen y enerzijds met x± en x 2 an d e r­ zijds) dan vinden wij:

r2 Y-xm t> 1 s y x1 X y xo _ 2 y 2 + 2 2 y2 + r2 2rx

Toevoeging van x 2 doet nu dus de correlatiecoëfficiënt rxyi toenem en tot ry.X3X2, zodat ry Xm — r 2^ deze toenam e w eergeeft. D e w aard e hier­ voor is dan

r2 = r2*1*2 •— 2rv:

+

hetgeen vereenvoudigd kan w orden tot: r2 y .r ,x 2• r2yxi (fyx2 rx , ) 5

1 — r 2»1X2 (IV 8)

U it deze formule is direct te zien, d at bij r xlX2 = 0 de teller gelijk aan r 2xjw o rd t en de noem er gelijk aan 1, zodat w e voor d at geval vinden: r 2 y .x ii2 — r 2 = r 2 , d.w.z. de correlatie verbetert dan maximaal. G e-y x, yx2 makkelijk is nu in te zien, dat de m ultipele correlatie beter w o rd t n a a r­ m ate de correlatie tussen X\ en x 2 slechter is; of algem een gezegd: de m ultipele correlatie w o rd t beter naarm ate de nieuw toegevoegde variabele slechter correleert met de vorige variabelen. H ieruit zien wij tevens, d at elke nieuwe variabele de correlatie verbetert; óók dus als de toevoeging onlogisch is.

D e partiële correlatiecoëfficiënten.

(8)

ver-antw oord is, d.w.z. de correlatie voldoende verbetert. D eze m aat vindt men vanzelfsprekend als men de w erkelijke toenam e (in ons geval r 2 y.xix2 — r 2 ) deelt door de m axim aal moqelijke toenam e (in ons qevaly x i' °

r2 __ r2

h an g t het dus af, of dus 1 — r 2 ). V a n de verhouding —y --- y

y*r 1 — r 2

y * i de toevoeging van x 2 wel redelijk verantw oord is.

A an deze verhouding kunnen wij nu bovendien nog een speciale be­ tekenis hechten. D it kan w orden ingezien als men bedekt, d a t de corre­ latie tussen een constante factor en een variabele factor altijd gelijk aan

(^i Z7.XN ) ^ ^ 11) ^ nul is. Z o u x-i constant zijn, dan w as r 2 = ——— — —— = 0,

1 1 y*' 2 y 2 2 x 2 2 y 2

w a n t 2 y «= 0; evenzo zou ook rxix2 = 0 zijn. M a a r in d at geval w ordt de teller van bovenstaande verhouding, zoals wij reeds zagen, gelijk aan

r 2 en de noem er gelijk aan 1, d.w.z. de verhouding w ordt

. - 1 — r 2y x i

gelijk aan r2x2 bij constant veronderstelde w aard e van Xj. D aarom schrijft men deze correlatiecoëfficiënt wel ryx2.xi (te lezen als: de correlatie- coëfficiënt voor de correlatie van y met x 2 bij constant veronderstelde w aard e van x x). M en geeft aan dit soort coëfficiënten de naam van par­ tiële correlatiecoëfficiënten. V o o r ons geval h adden wij dus r2x =

«.2 __ ,2

—. O p dezelfde wijze kunnen wij berekenen de partiële 1

correlatiecoëfficiënt voor y ten opzichte van x± bij constant veronder-r2 _ r-2

stelde w aard e van x 2, n.1. r 2 :

1 — r2

In het algem een zal de partiële correlatiecoëfficiënt voor de toege­ voegde nieuw e variabele x k gelijk zijn aan de verhouding van de w e r­ kelijke toenam e van de m ultipele correlatiecoëfficiënt to t de maxim aal mogelijke toenam e daarvan, w elke door deze toevoeging w ordt veroor­ zaakt. D it kan in formule w orden uitgedrukt als volgt:

y .y ' - x k

y x k .y — x k (IV 9)

y y ' - * k

O pgem erkt zij, d a t wij hierdoor tevens een m iddel hebben, om de in­ vloed van een bepaalde grootheid ten aanzien van het geheel geïsoleerd te beschouwen. Dikwijls spreekt men in de economie van ,,ceteris pari­ b u s”, d.w.z. alle overige factoren gelijkblijvende. D oor de correlatie- rekening kan men nu echter ook q uantitatief nag aan w a t er gebeuren zal, als dit ceteris paribus niet alleen een theoretische fictie w as, m aar een harde werkelijkheid; hierdoor kan de economische analyse op vrijwel dezelfde basis w orden gebracht als het proefondervindelijk laboratorium ­ onderzoek in de physische w etenschappen.

D e sta n d a a rd fo u t.

(9)

tw ee punten een rechte lijn gaat, als het verband tw ee-dim ensionaal is, (d.w .z. als er slechts tw ee variabelen zijn, derhalve slechts * en y ) ; fouten kunnen dan slechts optreden als er meer dan tw ee w aarnem ingen zijn, derhalve is bij 2 dimensies het aa n ta l vrijheidsgraden N — 2.

Z ijn er drie dimensies (y, en x 2) , dan w o rd t het gezochte lineaire verband m eetkundig voorgesteld door een vlak in de ruim te. Z u lk een vlak is bepaald door drie punten; fouten kunnen eerst optreden, als er meer dan drie punten zijn; derhalve is bij 3 dim ensies het aan tal vrij­ heidsgraden N — 3.

In analogie kunnen wij nu besluiten, d a t bij d dimensies het aan tal vrijheidsgraden N — d zal zijn.

- A A 9 2 e2 ES ( y — y ' ) 2

W il vinden dus: se2 — ve — -=r=--- r = ---- ---N — d N — d D e teller kan nu als volgt v eranderd w orden:

2 ( y — y ' ) 2 = 2 { y 2 — 2 y y ' + ( y f) 2} = 2 y 2 - 2 2 y y ’ + 2 ( y ' ) 2 = = S y 2 — 2 y y ’ = ES y 2 (1 — ry2, ,1, zodat wij de algem ene formule vinden:

= 1/

2 y 2 (1 - ry2yJ

N — d (IV 10)

Betrouwbaarheid van de correlatiecoëfficiënt.

E en bepaalde w a ard e voor de correlatiecoëfficiënt heeft niet steeds dezelfde betekenis. D it kunnen wij gemakkelijk begrijpen, als wij het zeer eenvoudige geval van enkelvoudige correlatie bij tw ee w aarnem ingen hebben: er zijn dan slechts tw ee punten, w aardoorheen steeds een rechte lijn gaat, zodat wij altijd voor de correlatiecoëfficiënt + 1 of — 1 vin­ den, hoe ra a r of overigens de punten ook mogen liggen. U it de w aarde + 1 mag men d an nog zeker geen conclusie trekken, d at er sprake zal zijn van volm aakte correlatie.

V o o rts kunnen wij direct begrijpen, d a t de kans, d a t door 3 w a ar- nem ingspunten een rechte lijn gaat, heel w at groter is dan door 100 w aarnem ingspunten. In het laatste geval zou m en met grote zekerheid een functioneel verb an d kunnen aannem en, (d.w .z. een volm aakte corre­ latie) ook al zou men het aa n tal w aarnem ingen aanm erkelijk uitbreiden. In het eerste geval (slechts 3 w aarnem ingen) echter is de kans op vol­ m aakte correlatie bij uitbreiding van het aantal w aarnem ingen d aa ren ­ tegen w el uiterst gering. T och zal men voor beide gevallen voor r de w aard e 1 vinden.

D e conclusie is dus, d at de betrouwbaarheid (significance) van de uitkom st stijgt met het toenem en van het aan tal w aarnem ingen, zodat wij behalve de correlatiecoëfficiënt ook nog een m aatstaf nodig hebben voor de betrouw baarheid daarvan, teneinde voldoende zeker te zijn van onze conclusies.

(10)

-niveau. H e t bereiken van het 5 % -niveau w o rd t m eestentijds al voldoende geacht; w o rd t het 1 % -niveau behaald, of zelfs overschreden, dan kan men spreken van een hoogbetrouw bare conclusie.

O n d e rstaan d e bijlage, met de berekening w aarv an wij de lezer niet behoeven te vermoeien, geeft zowel de vereiste w aard en bij het 5 % - als bij het 1 % -niveau aan. H e eft men b.v. 24 w aarnem ingen en is de ge­ zochte formule van het type y = a + b xx 2 + b2x 2 + b3x 3, d.w.z. d = 4, dan is dus N — d = 20.

M en moet dan een correlatiecoëfficiënt hebben van tenm inste 0,563 wil het gevonden verband niet zuiver toevallig zijn in 1 van de 20 wille­ keurige steekproeven. O verschrijdt de correlatiecoëfficiënt echter de w a a r­ de 0,652, dan kan men zeggen, d at het gevonden verband slechts zuiver toevallig k an zijn in 1 op de meer dan 100 w illekeurige steekproeven van telkens 24 w aarnem ingen, w aarbij men deze steekproeven in gedachten getrokken beschouw t uit een onmetelijk reservoir van mogelijke w a a r­ nemingen.

D e m ate van betrouw baarheid mag men niet in de plaats doen treden voor de m ate van correlatie, die w o rd t aangegeven door de correlatie­ coëfficiënt. M en mag dus niet zeggen, d at in bovenstaand geval een correlatiecoëfficiënt van 0,7 nu ook een hoge m ate van correlatie aa n ­ geeft, w a n t d a t zou niet juist zijn. M en mag dan slechts concluderen, d a t deze correlatiecoëfficiënt slechts bij hoge uitzondering door louter toeval tot stan d zou kunnen zijn gekomen, zodat er een hoge kans be­ sta a t op het in d erd aad aanw ezig zijn van enige afhankelijkheid, zij het d a t deze nog niet bepaald groot is. O m te kunnen spreken van een red e­ lijke correlatie moet men in de regel méér d an 0,7 vinden en heeft men pas een vrij goede correlatie als men m éér dan 0,9 vindt.

TABEL V O O R D E BEO O R DELING V A N D E B ET R O U W BA A R H EID V A N D E CORRELATIECOËFFICIËNT.

(Bovenste getal geeft 5 %-niveau en onderste getal 1 %-niveau aan).

(11)

Referenties

GERELATEERDE DOCUMENTEN

O MDAT VEEL NIEUWKOMERS ONBEKEND ZIJN MET HET DOEN VAN VRIJWILLIGERSWERK , DE N EDERLANDSE TAAL NIET SPREKEN , NIET PRECIES WETEN HOE HET HIER WERKT , VOELT HET VOOR HEN PRETTIG

persconferentie afwachten, dan volgt daarna bericht van de bisschop waarin zij de vertaalslag maken naar de kerken en vervolgens moeten wij dat weer vertalen naar onze kerk, die

Voor het bepalen van de geraamde kostprijs van rechten en heffingen waarmee kosten in rekening worden gebracht, en van goederen, werken en diensten van de gemeente, die worden

leefomgeving te bieden waarbij kinderen beschermd worden tegen risico’s met ernstige gevolgen en leren omgaan met kleine risico’s. Dit beleidsplan is geldig vanaf 1 januari 2018.

[r]

Om daar achter te komen moet er gekeken worden naar welke sfeer Secret Society uitstraalt en wat voor soort etablissement in Rotterdam daar op aansluit. Ook wordt er gekeken naar

De steun, onze steun (ja, we zijn met veel meer) is er voor jou. Die steun is er altijd geweest. Alleen door alle ruis of programma’s, zoals jullie het nu noemen, is dit lange

ten van den arbeid, noodig om de jaarrekening te beoordeelen, kunnen bekend worden. De heer Van Haagen spreekt over het onderzoek, dat voor de vaststelling van