• No results found

Open dialectendata

N/A
N/A
Protected

Academic year: 2021

Share "Open dialectendata"

Copied!
1
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Open dialectendata

R

ond 1900 groef de Engelse ar-cheoloog Sir Arthur Evans bij Knossos op Kreta kleitabletten op met teksten in twee onbekende schriften, die hij Lineair A en B noemde. Toen het hem niet lukte Li-neair B te ontcijferen, hield hij de kleitabletten moedwillig weg van andere onderzoekers. Pas tien jaar na zijn dood ontcijferde Michael Ventris het schrift, nadat hij had be-wezen dat de teksten Grieks waren.

De Münchense onderzoekster An-nelies Kammenhuber hamsterde de-cennialang kleitabletten met tek-sten in Hettitisch spijkerschrift, na-dat zij rond 1965 was begonnen aan een uitgebreid woordenboek van het Hettitisch: een taal die van 1700 tot 1200 voor Christus werd gespro-ken in Turkije en die een verre ver-want is van de Germaanse talen. Erg opschieten deed het woordenboek niet: bij haar dood in 1995 was zij ge-vorderd tot de G. Ondertussen was het materiaal al die tijd onbereik-baar voor haar Engelse collega’s. Die schermden op hun beurt hun Hetti-tische teksten in hiërogliefenschrift voor de Duitse onderzoekers af.

Dit zijn slechts een paar van de ve-le verhave-len over geesteswetenschap-pers die hun gegevens weghielden van anderen. Evans en Kammenhu-ber zijn nog positieve uitzonderin-gen omdat ze daadwerkelijk over

hun onderwerp publiceerden. Er zijn ook verzamelaars die het stadi-um van verzamelen niet overstijgen.

Over dergelijke hamsterwoedes werd vroeger wel geroddeld, maar veel meer konden onderzoekers er niet aan doen.

Tegenwoordig ligt dat anders: de academische wereld stelt steeds meer regels op om te garanderen dat data toegankelijk zijn of komen voor andere onderzoekers. Zo pleit de Koninklijke Nederlandse Akade-mie van Wetenschappen in het vorig jaar verschenen advies Zorgvuldig en

integer omgaan met wetenschappelijke onderzoeksgegevensvoor vrije toegang tot wetenschappelijk materiaal, dus open data.

In de geesteswetenschappen blij-ven gegeblij-vens lange tijd waardevol. Dit in tegenstelling tot veel bèta-onderzoek: daar zijn resultaten vaak bouwstenen waarop onmiddellijk wordt voortgebouwd, waardoor on-derzoekers niet meer teruggrijpen naar oorspronkelijke gegevens. In de geesteswetenschappen gaat het vaker over nieuwe interpretaties van oude gegevens. Geesteswetenschap-pers hoef je niet te vertellen dat ze dwergen zijn op de schouders van reuzen.

Die wijsheid uit de twaalfde eeuw is actueler dan ooit. In deze digitale tijd wordt het voortbouwen op

eer-der oneer-derzoek steeds gemakkelijker. Grote hoeveelheden oude en nieuwe gegevens kunnen semi-automatisch aan elkaar worden gekoppeld. Juist deze aanpak zal leiden tot allerlei nieuwe vondsten en inzichten bin-nen de geesteswetenschappen. Een concreet voorbeeld hiervan, waar-aan we momenteel hard werken, is de inrichting van een elektronische Woordenbank van de Nederlandse Dialecten.

In de loop van de tijd zijn er veel woordenboeken van Nederlandse dialecten gepubliceerd. Die dialect-woordenboeken zijn vervaardigd door professionele dialectlexicogra-fen en amateurs, en ze beschrijven de woordenschat van een enkele plaats, zoals het Weerts, of van gro-tere gebieden, zoals het Limburgs, Brabants, Vlaams of Overijssels. De gegevens van deze woordenboeken zijn – laat ik het voorzichtig zeggen – niet optimaal toegankelijk. Als er digitale bestanden van bestaan, zwerven die meestal bij particulie-ren. De oudere gedrukte woorden-boeken, daterend vanaf begin 19de eeuw, liggen in bibliotheken te ver-stoffen.

Onze kennis van de Nederlandse dialecten, en de veranderingen die deze sinds de 19de eeuw hebben doorgemaakt, zal sterk toenemen als we alle beschikbare gegevens uit

de dialectwoordenboeken aan elkaar koppelen: op die manier ontstaat een compleet nieuw onderzoeksin-strumentarium voor dialectonder-zoek. Om dit te verwezenlijken heb ik vorig jaar aan de Nederlandse dia-lectlexicografen en streektaalfuncti-onarissen gevraagd of ze hun digita-le diadigita-lectwoordenboeken aan het Meertens Instituut willen overdra-gen. Vlaamse en Friese collega’s ver-zamelen de woordenboekbestanden uit hun taalgebied.

Vrijwilligers zijn inmiddels be-gonnen met het corrigeren van ge-scande oudere dialectwoordenboe-ken en het overtikdialectwoordenboe-ken van manu-scripten. De Data Curation Service van de Radboud Universiteit Nijme-gen (bekostigd door het nationale infrastructuurprogramma CLARIN) zal straks alle digitale bestanden omzetten naar een eenvormig com-puterformaat.

Om de verschillende

dialectwoor-denboeken aan elkaar te kunnen koppelen, worden ze verrijkt met extra gegevens: vrijwilligers en stu-denten voegen aan alle dialecttref-woorden de Standaardnederlandse vormen toe. De Standaardneder-landse vorm kan dienen als input voor karteringssoftware. Die softwa-re tekent automatisch kaarten met de verbreiding van woorden, klan-ken, vervoegingen en verbuigingen over het Nederlandse taalgebied. Dat zal veel nieuwe inzichten ople-veren. Veel dialectsprekers menen bijvoorbeeld dat in hun dialect unie-ke woorden of uitdrukkingen voor-komen – of dat waar is, zal nu aan het licht komen, en ik voorzie veel lange gezichten… Ook kan uit de kaarten blijken hoe de verbreiding van een dialectverschijnsel in de loop van de tijd is veranderd.

Het aan elkaar verbinden van zo-veel mogelijk dialectwoorden biedt nog veel meer spannende mogelijk-heden. Dat zal in de toekomst blij-ken, als de elektronische Woorden-bank van de Nederlandse Dialecten is gelanceerd. Vooruitlopend daarop vraag ik lezers van deze krant die een digitaal dialectwoordenboek of ongepubliceerd manuscript op de plank hebben liggen, dit naar me op te sturen, zodat het opgenomen kan worden in het grote net van open dialectendata.

C O L U M

N

N I C O L I N E V A N D E R S I J S

Vroeger was er weinig te

doen aan

wetenschappe-lijke hamsterwoede

Referenties

GERELATEERDE DOCUMENTEN

106 Zoals Kale-Leie Archeologische Dienst (KLAD) en Streekontwikkeling Land van Aalst (SOLvA).. Bij alle instanties is de dominantie van veldwerk op bedreigde sites waar te

Daarentegen zijn er ook zielen die deze zaken juist wel allemaal doorleefd hebben, maar die zichzelf niet kunnen verklaren, en nog minder de opgeblazen woorden zouden

Voor 1 punt eenduidiger maken, niet zo veel antwoorden goed rekenen?. Fout= ruggemerg droogt

Je komt vast en zeker gemakkelijk te weten hoe de maanden tegenwoordig heten.. Deze maand is vernoemd naar de Romeinse

Op het beeld van een 'tevreden meerderheid' die zich, ter continuering van haar verworven positie verzet tegen de sociale stijging van anderen (en dus tegen de

When focusing on the factors that might contribute to the academic underachievement of Grade nine learners it is important to consider their level of development in various

forms of co-management organisations and governance systems and their associated leadership challenges are discussed, before turning towards collaborative

Table 9.22: Results of two-way factorial ANOVA to test for differences between the Pielou`s evenness index (J′) for plant diversity in Localities (Amersfoort, Potchefstroom,