• No results found

Teoretiese begronding van outeurskapidentifikasie

Hoofstuk 4: Bepaling van ʼn idiolek: outeurskapidentifikasie

4.2 Outeurskapidentifikasie

4.2.2 Teoretiese begronding van outeurskapidentifikasie

Coulthard (2004:431) stel dit onomwonde dat die taalkundige die vraag oor outeurskapidentifikasie vanuit ’n teoretiese oogpunt moet benader en dat dit belangrik is om in gedagte te hou dat elke individu (spreker) oor ’n eie en bepalende variasie van die taal wat hulle praat, beskik. Hierdie persoonlike, unieke variasie word ’n idiolek (vgl.

3.6) genoem. Elke taalgebruiker beskik oor ʼn groot, aktiewe woordeskat, wat oor ʼn aantal jare opgebou is. Hierdie woordeskat verskil van ander individue s’n, aangesien daar verskillende invloede in elke individu se lewe is, en ook aangesien daar verskillende taalkeuses gemaak sal word. Love (2002:21) sluit by die vraagstuk rondom idiolek en outeurskapidentifikasie aan as daar gestel word dat “as each individual has his own appearance, his own voice, his own character and disposition, so each has his own style of writing. And the quality of mind is manifest in speech even more than the likeness of the body is reflected in a mirror”. Coulthard (2004:1) argumenteer dat wanneer ʼn spreker enige woord op enige gegewe tydstip gebruik, die betrokke individu doelbewuste taalkeuses aangaande verkose woorde maak.

Coulthard (2004:1) sluit af deur te verklaar dat die voorafgaande impliseer dat dit moontlik moet wees om ʼn metode te bewerkstellig waardeur die linguistiese vingerafdruk, oftewel die linguistiese indruk van die individu te identifiseer. Die

Unabomber-saak, soos reeds bespreek (vgl. 4.2.1), dien as ʼn goeie voorbeeld van hoe

outeurskapidentifikasie van nut kan wees.

Outeurskapidentifikasie, volgens Kotze (2010:185), omvat ʼn wye veld van aktiwiteite en ʼn interdissiplinêre spektrum van toepassings wat strek van teologie, letterkunde en opvoedkunde, nasionale en kommersiële intelligensie sowel as die regstelsel. Die forensiese toepassing was tot ʼn paar dekades gelede beperk tot handskrifontleding en die opspoor van plagiaat. Die fokus van die vakgebied het egter ontwikkel en gegroei en vandag word die linguistiese inhoud van dokumente ondersoek om sodoende nie net die outeur van selfmoordbriewe, dreigbriewe, eisbriewe, testamente en biegbriewe nie, maar ook idiolektiese merkers te identifiseer. Stamatatos (2009:3) sluit hierby aan deur te noem dat die vakgebied bydra tot outeurskapidentifikasie (om sodoende te bepaal wie die werklike outeur van ʼn teks is), plagiaatopsporing, outeurkarakterisering (om die outeur van ʼn teks se ouderdom, opvoeding, geslag en dies meer te bepaal) sowel as om stilistiese inkonsekwenthede te bepaal (veral wanneer meer as een outeur betrokke is by ʼn gegewe teks).

Chaski (2010:184) sluit by die bogenoemde aan deur te beweer dat sy in die praktyk van forensiese linguistiek (vanaf 1992) met sake gewerk het wat die volgende behels:

 moorde,

 selfmoorde,

 ontvoerings,

 bomdreigemente wat gelei het tot dood en die vernietiging van eiendom,

 terreuraanvalle,

 seksuele aanrandings en die seksuele misbruik van minderjariges,

 haatmisdade,

 obstruksie van die gereg,

 diefstal,

habeas corpus51,

 skending van kopiereg,

 patenteregskending,  werknemersdispute,  toesigsdispute,  erflatingsdispute,  plagiaat en  diskriminasie,

Chaski (2010:185) gaan voort deur te argumenteer dat tekstipes soos bloginskrywings, korporatiewe e-posse, liefdesbriewe sowel as dagboeke ook as linguistieke bewysstukke gedien het. In sommige gevalle is betwyfelbare individue tot ondersoeke verbind deur spesifieke rekenaarsleutelborde. In ander witboordjiesake is persone aangekeer aangesien hulle oor inligting beskik het waarvan slegs die betrokke skuldige partye kon kennis dra.

In ʼn studie gedoen deur Louwerse (2004) word daar klem gelê op die navorsing wat deur Fokkema en Ibsch gedoen is. Hierdie (soos Fokkema en Ibsch) studie het daartoe gelei dat Louwerse (2004:4-5) vier hipoteses daargestel het. Dit lui soos volg:

1. Idiolektiese hipotese: Linguistiese verskynsels in tekste, geskryf deur een outeur, sal nie merkbaar van mekaar verskil nie, terwyl tekste deur verskillende outeurs oor duidelike linguistiese verskille sal beskik.

2. Sosiolektiese-gender-hipotese: Hierin word beweer dat tekste, geskryf deur mans, linguisties met mekaar sal ooreenstem. Terwyl daar minder ooreenkoms moet wees wanneer tekste, geskryf deur mans, vergelyk word met tekste geskryf deur vroue.

3. Sosiolektiese-tyd-hipotese: Tekste wat in dieselfde tydsperiode geskryf word, moet grotendeels ooreenstem in terme van linguistiese merkers, en tekste vanuit verskillende tydsperiodes moet verskil.

4. ʼn Modernistiese-kode-hipotese: Modernistiese tekste moet nie net oor homogeniteit beskik nie, maar moet verskil van realistiese tekste, en die modernistiese tekste moet ook oor ʼn hoër frekwensie van ʼn sekere semantiese veld beskik.

Outeurskapidentifikasie is nie noodwendig net van belang vir statistiese analise deur akademici of letterkundige kenners nie, maar die gebruikersveld kan ook individue insluit soos: onderwysers wat tekens van plagiaat wil opspoor, joernaliste wat die geldigheid van ’n dokument wil bevestig, beamptes wat ’n oortreding ondersoek of prokureurs wat ’n testament betwis (Juola, 2006:18).

Hughes (1996:124) voer in dié verband aan dat geskrewe taal bloot die uitbeelding van die primêre vorm, gesproke taal, is. Sy (Hughes, 1996:74) beweer egter ook dat outeurs die “regte” woorde moet kies wanneer keuses rakend die dialek van karakters gemaak word. Hughes (1996:77) voer dus aan dat die voorkoms van ʼn idiolek betwyfel moet word, en dat wanneer die diskoers informatief van aard is, dit eerder aspekte soos gender, ouderdom en diskoersdoelwitte is wat kenmerkend moet wees. Vir die doel van dié studie word die faktore, soos deur Hughes genoem, egter in gedagte gehou, en word dit ondersoek as aspekte52 wat ’n invloed op die individu se idiolek kan hê

52 Verwys na 2.7.4 (Queer-Teorie), 3.4.3.1 (Sosiale veranderlikes), 3.4.3.2 (Gender as veranderlike), 3.4.3.3

(Homoseksualiteit), 3.4.3.4 (Ouderdom as veranderlike), 3.4.3.5 (Etniese veranderlikes) en 3.4.4 (Sosiolingustiek en kommunikasie)

Juola (2006:14) werp lig op die aangeleenthede rakende genre, korpusgrootte sowel as die verteenwoordigingsgraad, en die voorstellingsmoontlikhede in ʼn korpusondersoek. In letterkundestudies kan ’n korpusgrootte van etlike honderde duisende woorde verwag en ondersoek word, terwyl ’n forensiese ondersoek slegs uit ’n paar honderd woorde kan bestaan. In letterkunde is daar ook die genreverskille53 wat in ag geneem moet

word, en daarom (Juola, 2006:14) is dit baie moeiliker om outeurs oor die grense van genres te identifiseer.

Nog ’n belangrike aspek om in gedagte te hou, is die feit dat dit moeilik is om ’n “skoon” (suiwer) teks vir analise te bekom. Juola (2006:15) argumenteer dat teorie vereis dat slegs data waarvoor die outeur direk verantwoordelik is, gebruik moet word in ’n korpusondersoek. Prakties is hierdie vereiste nie noodwendig uitvoerbaar nie, aangesien die meeste gepubliseerde tekste gesien kan word as die eindproduk van vele individue, soos die outeur, teksredakteur, lettersetter en selfs die drukker (Juola, 2006:15). Wanneer ʼn skoon teks beskikbaar is, kan daar na spelling en grammatikale foute ondersoek ingestel word, aangesien hierdie eienskappe ook eie aan die outeur sal wees (Koppel & Schler, 2003:2). Aangesien die redigeringsproses egter die bogenoemde tipe foute uitskakel, is dit in die moderne, tegnologiese era baie moeiliker om van hierdie beginsels gebruik te maak.

Juola (2006:15) is verder van mening dat wanneer daar van masjien-leesbare tekste (soos Google Scholar, JSTOR of die Gutenberg-projek) gebruik gemaak word, kan die skanderings- en digitaliseringsproses ook die teks beïnvloed. Selfs die sogenaamde suiwer tekste kan problematies wees. Probleme sluit in (vgl. Juola, 2006:16):

 opskrifte (titel, opskrifte en subopskrifte),

 nommers (beide die nommers van die bladsye en by die opskrifte) en

 aanhalings.

Dit is dus die navorser se taak om te verseker dat aspekte van die teks (soos die bogenoemde) wat ’n invloed op die resultate kan hê, voor die aanvang van die korpusanalise uit die teks verwyder word. Hierdie probleme sluit dus aanhaling, numering en opskrifte in, wat nie as eie aan die outeur beskou kan word nie. Juola

(2006:16) gaan voort deur te argumenteer dat deur data vanuit die teks te verwyder, word daar tog ook aan die oorspronklikheid van die teks geraak.

Chaski (2007) stel dat in die geval van ’n forensiese ondersoek moet die betrokke teks deur ’n onafhanklike party outentiek verklaar word. As dit nie gedoen kan word nie, skep dit alreeds die vermoede dat die teks nie geloofwaardig is nie, en dat die verdagte en/of die prokureur nie die waarheid rakende die betrokke teks vertel nie.

Dit is dus duidelik dat ’n teks nie net eenvoudig gebruik kan word nie, inteendeel, alvorens ’n teks as data gebruik kan word, is daar eers ’n proses wat gevolg moet word om te verseker dat die bevindinge wat vanuit die betrokke teks gemaak kan word die akkuraatste moontlik is. Die taal, genre en grootte van die beskikbare tekste vir korpuslinguistiese analise is dus ook van uiterse belang.

Chaski (2010:186) argumenteer dat forensiese linguistiek gebruik maak van toegepaste taalkundige teorieë en metodes. Beide die kwantitatiewe en kwalitatiewe navorsingsbenaderings moet gevolg word. Dus is dit voor die hand liggend dat daar van forensiese linguistiese metodes gebruik gemaak kan word wanneer daar korpuslinguisties te werk gegaan word om ’n hipotese te ondersoek.

Chaski (2010:187) hou die volgende tabel voor om te verduidelik hoe taalkunde (korpuslinguistiek) en forensiese linguistiek ooreenstem:

Forensiese linguistiek vra Linguistieke ondersoek benodig

Wie is te woord in die boodskap of verklaring? Fonetiek, fonologie, morfologie, dialektologie, sosiolinguistiek, rekenaarlinguistiek

Wie is die outeur van die boodskap of dokument? Sintaksis, morfologie, dialektologie, korpuslinguistiek, psigolinguistiek. Is die tydsraamwerk van die dokument wel

korrek?

Leksikografie, taalverandering, dialektologie, sosiolinguistiek.

Is die verklaring of dokument lasterlik? Leksikografie, psigolinguistiese eksperimente, sintaksis, semantiek en diskoersanalise

Tabel 4.1 Forensiese linguistiek en taalkundige benaderings Geneem vanuit Chaski (2010:187)

Vanuit tabel 4.1 is dit dus duidelik dat die forensiese linguistiek spesifiek ondersoek instel na wie het die teks geskryf, wanneer is die betrokke tekste geskryf en is daar die moontlikheid van geregtelike ondersoeke in terme van die outeur en die inhoud van die teks. Die linguistieke ondersoek verwys na die taalkundige ondersoek, waar sintaksis, leksikografie, fonologie, morfologie en dies meer ondersoek word. Die resultate wat

deur middel van hierdie tipe ondersoeke gekry word sal egter ook die outeur, die tyd waarin die dokumente geskryf, sowel as die spreker in die dokumente kan aandui. Juola (2006:21) beweer dat die taalgebruik van die mens ’n komplekse en moeilike sisteem is om te bestudeer, aangesien dit as ’n kombinasie van groot hoeveelhede variëteite in teenstelling met verrassende subtiele reëlmatighede is. Hubbard (1994:57) argumenteer dat daar sekere aspekte van taalgebruik is wat nie soseer afhanklik is van die bewuste nie. Hy, Hubbard (1994:57), postuleer dat hierdie onderbewuste gewoontes is, wat ontwikkel en van individu na individu verskil. Dit is op hierdie “onderbewuste” vlak van taalgebruik waar idiosinkrasieë gevorm word, wat aanleiding gee tot die idiolek. Volgens Louwerse (2004:1) is idiolekte persoon-afhanklike ooreenkomste in taalgebruik. Dit dui daarop dat ʼn teks van een bepaalde outeur oor meer taalooreenkomste sal beskik as tekste van twee verskillende outeurs. Sosiolekte verwys na die groepsgebonde ooreenkomste in tekste. Dit verwys, volgens Louwerse (2004:1), na die feit dat skrywers in ʼn bepaalde era of genre se tekste ook ooreenkomste sal toon. Om hierdie ooreenskomste te identifiseer, is dit nodig om van korpuslinguistiese beginsels gebruik te maak. Die korpuslinguistiese beginsels en die metodes waarvolgens daar te werk gegaan kan word, word voorts ondersoek en kortliks bespreek.

Die vraag ontstaan dus, nadat die teoretiese agtergrond geskep is, wat is die beste metode waarmee die beste resultate gevind kan word met die verskeidenheid tegnieke wat bestaan om outeurskapidentifikasie te ondersoek. Vervolgens gaan daar na verskillende metodes verwys word wat gebruik kan word in die studie na die idiolek van Joan Hambidge, oor die grense van genres, alvorens daar in Hoofstuk 5 (Empiriese studie) ’n gedetailleerde oorsig van die gekose metode uiteengesit sal word.