• No results found

De data librarian in Nederland, een verkennend onderzoek naar digitale onderzoeksdata en de rol van universiteitsbibliotheken

N/A
N/A
Protected

Academic year: 2021

Share "De data librarian in Nederland, een verkennend onderzoek naar digitale onderzoeksdata en de rol van universiteitsbibliotheken"

Copied!
100
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

De data librarian in Nederland

een verkennend onderzoek naar digitale onderzoeksdata en

de rol van universiteitsbibliotheken

Masterscriptie Culturele Informatiewetenschap juli 2011

Universiteit van Amsterdam Faculteit der Geesteswetenschappen Scriptiebegeleider: Dr. H.J. Voorbij

J.W. Puttenstein Studentnummer 5779731 Gerstakker 12, 8091 NB Wezep wiljan.puttenstein@gmail.com

(2)

INHOUDSOPGAVE

VOORWOORD ………. 4

SAMENVATTING ……… 5

1 INLEIDING EN ONDERZOEKSOPZET ……….. 7

1.1 Aanleiding en doel van het onderzoek ………. 7

1.2 Probleemstelling ………. 7

1.3 Onderzoeksmethode ……….. 8

1.4 Begrippen en afbakening van het onderzoek ……….. 8

1.4.1 Digitale onderzoeksdata ……… 8

1.4.2 Universiteitsbibliotheken ………. 9

1.4.3 De levenscyclus van digitale onderzoeksdata ……….. 9

1.5 Beknopt overzicht van de inhoud ………. 10

2 ONDERZOEKSDATA ……….. 11

2.1 Inleiding ……….. 11

2.2 Definities van onderzoeksdata ……….. 11

2.3 De explosieve groei van digitale onderzoeksdata ……… 13

2.4 Aspecten van digitale onderzoeksdata ………. 15

2.4.1 Organisatorische aspecten ……… 15

2.4.2 Waardering en selectie van onderzoeksdata ………. 17

2.4.3 Technische aspecten ………. 19

2.4.4 Juridische aspecten ………... 19

2.5 Het delen van onderzoeksdata ……….. 20

2.5.1 Inleiding ……… 20

2.5.2 Redenen om onderzoeksdata te delen ………... 21

2.5.3 Redenen om onderzoeksdata niet te delen ……… 22

2.5.4 De wensen van onderzoekers zelf ……… 23

2.6 Het faciliteren van databeheer ……….. 24

2.6.1 Lokale of externe opslag ……….. 24

2.6.2 Met onderzoeksdata verrijkte publicaties ……… 25

2.7 Conclusies ……… 26

3 ONTWIKKELINGEN IN WETENSCHAPPELIJKE BIBLIOTHEKEN ………... 28

3.1 Inleiding ………... 28

3.2 De historische ontwikkeling van de universiteitsbibliotheek ………. 28

3.3 Technologische ontwikkelingen: kans of bedreiging? ……… 29

3.4 Repositories ……… 31

3.5 Onderzoeksdata en de universiteitsbibliotheek ……….. 32

3.5.1 Inleiding ……… 32

3.5.2 De mogelijke rol van universiteitsbibliotheken ……… 32

3.5.3 Enkele voorbeelden uit het buitenland ………. 33

3.6 De data librarian ……… 34

(3)

4 ONDERZOEKSDATA IN NEDERLANDSE UNIVERSITEITSBIBLIOTHEKEN …….. 39

4.1 Inleiding ………... 39

4.2 Opzet van de deskresearch ……… 39

4.3 Algemene samenvatting van de resultaten van de deskresearch ………... 41

4.4 Resultaten van de deskresearch per universiteit ………. 43

4.4.1 Universiteit van Amsterdam ………. 43

4.4.2 Vrije Universiteit (Amsterdam) ……… 43

4.4.3 Technische Universiteit Delft ………... 44

4.4.4 Technische Universiteit Eindhoven ……….. 44

4.4.5 Universiteit Twente (Enschede) ………45

4.4.6 Rijksuniversiteit Groningen ……….. 46

4.4.7 Universiteit Leiden ………... 47

4.4.8 Universiteit Maastricht ………. 47

4.4.9 Radboud Universiteit Nijmegen ………... 47

4.4.10 Erasmus Universiteit Rotterdam ………. 48

4.4.11 Universiteit van Tilburg ………. 48

4.4.12 Universiteit Utrecht ……… 49

4.4.13 Wageningen University & Research centre ……… 49

4.5 Interviews ……… 50

4.5.1 Opzet interviews ………... 50

4.5.2 Stand van zaken ……… 51

4.5.3 Huidig en toekomstig beleid ………. 52

4.5.4 Samenwerking met andere organisaties ………53

4.5.5 Data librarian ……… 54

4.6 Het beleid van samenwerkingspartners ………... 55

4.6.1 UKB ………. 55 4.6.2 Koninklijke Bibliotheek ………... 56 4.6.3 DANS ………... 57 4.6.4 SURFfoundation ……….. 58 4.7 Conclusies ……… 60 5 CONCLUSIES EN AANBEVELINGEN ………... 62 5.1 Inleiding ………... 62

5.2 Digitale onderzoeksdata en wetenschappelijke bibliotheken ………. 62

5.3 Nederlandse universiteitsbibliotheken ………. 63

5.4 De data librarian ……… 64

5.5 Aanbevelingen voor vervolgonderzoek ……… 65

GERAADPLEEGDE LITERATUUR ………. 66

INTERNETBRONNEN ……… 73

BIJLAGEN ………. 74

Bijlage 1 Gegevens deskresearch ……… 74

Bijlage 2 Interviewvragen ……… 89

(4)

VOORWOORD

Met het voltooien van deze masterscriptie komt een einde aan mijn studieperiode aan de Universiteit van Amsterdam, die in september 2007 begon. De opleiding heette toen nog Documentaire Informa-tiewetenschap. Op het moment dat ik in september 2009 met de master begon, veranderde deze van naam in Culturele Informatiewetenschap. De leerzame colleges en de goede contacten met docenten en medestudenten (die in een aantal gevallen ook collega’s bleken te zijn) heb ik als zeer verrijkend ervaren.

Het onderwerp voor de scriptie diende zich aan in oktober 2009 in de Koninklijke Bibliotheek. De NVB afdeling Wetenschappelijk Bibliotheken organiseerde een studiemiddag over de rol van de bibliotheek bij het ontsluiten van datasets. Doel was om het onderwerp op de agenda te zetten van wetenschappelijke en speciale bibliotheken en een discussie op gang te brengen over het nut van en de verantwoordelijkheden bij het opslaan en ontsluiten van datasets. Een boeiend en actueel onder-werp, dat inmiddels volop de belangstelling heeft, zoals uit deze scriptie zal blijken.

Mijn begeleider Henk Voorbij dank ik voor zijn adviezen en opmerkingen over het opzetten van het onderzoek en de ondersteuning tijdens het schrijven van de scriptie. Mijn werkgever, de Protestantse Theologische Universiteit dank ik voor het scheppen van de financiële voorwaarden voor het volgen van deze studie. Een woord van dank komt ook hen toe, die ik ten behoeve van mijn onderzoek in het kader van deze scriptie mocht interviewen.

Het in eigen tijd volgen van een academische studie naast een volledige baan vergt niet alleen veel van de student, maar ook van het thuisfront. Mijn vrouw en kinderen dank ik in het bijzonder voor hun begrip en geduld als ik weer eens avonden en weekenden achter de laptop op de studeerkamer doorbracht.

(5)

SAMENVATTING

Het huidige wetenschappelijk onderzoek is data-intensief. Wetenschappers onderkennen meer en meer het belang van goed databeheer tijdens de onderzoeksfase en van het duurzaam bewaren van digitale data na afloop van het onderzoek met het oog op hergebruik. Dit is een internationale trend. Ook in Nederland staat sinds enkele jaren het bewaren en beschikbaar stellen van digitale data sterk in de belangstelling.

Universiteitsbibliotheken ondersteunen wetenschappers bij het doen van onderzoek en het geven van onderwijs door het aanbieden en beheren van grote hoeveelheden wetenschappelijke in-formatie. Dit gebeurt steeds vaker in uitsluitend digitale vorm. In deze scriptie staat de vraag cen-traal in hoeverre universiteitsbibliotheken een rol kunnen spelen in het beheren en beschikbaar stel-len van digitale onderzoeksdata, zowel tijdens als na afloop van wetenschappelijk onderzoek.

Het onderzoek heeft een verkennend karakter en bestaat uit drie delen. In de eerste plaats is literatuuronderzoek verricht om het begrip digitale onderzoeksdata en de daarmee samenhangende aspecten te beschrijven. Literatuuronderzoek is ook gedaan om de ontwikkelingen, die van invloed zijn op de positie en functie van de wetenschappelijke bibliotheek vanaf de jaren zestig van de twin-tigste eeuw in kaart te brengen. In de tweede plaats is een deskresearch uitgevoerd in de websites van de dertien Nederlandse universiteitsbibliotheken. Doel hiervan was enerzijds om de stand van zaken met betrekking tot digitale onderzoeksdata op te maken en anderzijds om aan de hand van beschikbare meerjarenbeleidsplannen het huidig en toekomstig beleid te analyseren. In de derde plaats zijn interviews gehouden met een achttal functionarissen, die zich in hun dagelijks werk bezig houden met digitale onderzoeksdata.

Elk van de onderzochte Nederlandse universiteitsbibliotheken biedt inmiddels diensten aan met betrekking tot digitale onderzoeksdata of is voornemens dit te gaan doen. Uit de deskresearch en de interviews blijkt dat bibliotheken in elke fase van het onderzoeksproces een mogelijke rol voor zichzelf zien weggelegd. Tijdens de onderzoeksfase kunnen bibliotheken faciliteiten bieden om datasets voor de korte of middellange termijn op te slaan. Na afloop van het onderzoek is vooral het koppelen van datasets aan publicaties een veelgenoemde activiteit.

Voor onderzoekers en studenten is nog lang niet altijd zichtbaar welke diensten met betrek-king tot databeheer een bibliotheek kan aanbieden. Belangrijk is het peilen van de behoefte bij on-derzoekers naar ondersteuning in databeheer om te bepalen welke diensten door bibliotheken aange-boden kunnen gaan worden en in welke omvang. Eveneens is het wenselijk wetenschappers bewust te maken van het belang van goed databeheer. Door het instellen van een dataloket kan elke biblio-theek een centrale dienst creëren, waar onderzoekers terecht kunnen voor advisering en ondersteu-ning met betrekking tot onderzoeksdata. Ook kunnen bibliotheken studenten al tijdens de studie wijzen op het belang van datamanagement door dit onderdeel op te nemen in de programma’s voor academische vaardigheden.

(6)

Bibliotheken geven op twee manieren invulling aan de functie van data librarian. In de eerste plaats krijgen de al aanwezige informatie- en collectiespecialisten uitbreiding van hun taken-pakket. Dat is met name het geval als nog onvoldoende helder is hoe groot de behoefte aan onder-steuning onder wetenschappers is en nog niet vast te stellen valt hoe groot de omvang van de dienst-verlening en de bijbehorende formatie zal zijn. In de tweede plaats worden data librarians aange-steld, die zich volledig richten op het ondersteunen van wetenschappers op het gebied van digitale onderzoeksdata. In beide gevallen werkt de data librarian nauw samen met wetenschappers. Daar-door zit de bibliotheekmedewerker dicht op het primaire onderzoeksproces. Wordt deze uit de ver-trouwde omgeving van de traditionele bibliotheek gehaald en in de directe onderzoeksomgeving van de wetenschapper geplaatst, kan het model van de embedded librarian worden toegepast. Indien het takenpakket zich vrijwel volledig richt op het bieden van ondersteuning op het terrein van datama-nagement en de informatiespecialist in de directe omgeving van de onderzoeker werkzaam is, kan gesproken worden van de embedded data librarian.

(7)

1 INLEIDING EN ONDERZOEKSOPZET

1.1 Aanleiding en doel van het onderzoek

In Nederland staat sinds enkele jaren het bewaren en beschikbaar stellen van digitale onderzoeksdata sterk in de belangstelling. Met name door de enorme stortvloed aan digitale data, die in alle weten-schapsdisciplines ontstaan en gebruikt worden, is bij wetenschappers het besef doorgedrongen, dat goed databeheer tijdens en na afloop van hun onderzoek van groot belang is.

Uiteraard zoeken universiteitsbibliotheken naar nieuwe wegen en nieuwe vormen van dienstverlening om wetenschappers te ondersteunen in het doen van onderzoek en het geven van onderwijs. Katalysator daarin is het bewust zijn van de zeer snelle toename van uitsluitend digitaal beschikbare wetenschappelijke informatie. De vraag dient zich dan ook aan in hoeverre Nederlandse universiteitsbibliotheken in staat zijn een ondersteunende rol te spelen met betrekking tot digitale onderzoeksdata en wat die rol dan zou moeten zijn.

Doel van dit onderzoek is om de stand van zaken in Nederlandse universiteitsbibliotheken met betrekking tot digitale onderzoeksdata inzichtelijk te maken en te onderzoeken in hoeverre zij een bijdrage kunnen leveren aan het beheren van digitale onderzoeksdata om daarmee het delen en beschikbaar stellen van onderzoeksdata door wetenschappers te bevorderen.

1.2 Probleemstelling

In deze scriptie staat de rol van de Nederlandse universiteitsbibliotheken in de verschillende fasen uit de levenscyclus - creatie, beheer en hergebruik - van digitale onderzoeksdata centraal. De onder-zoeksvraag luidt dan ook:

In hoeverre kunnen universiteitsbibliotheken in Nederland een ondersteunende rol spelen in de verschillende fasen uit de levenscyclus van digitale onderzoeksdata?

Deze probleemstelling leidt tot de volgende vier deelvragen:

1. Welke met digitale onderzoeksdata samenhangende aspecten zijn te onderscheiden? 2. Welke ontwikkelingen hebben invloed op positie en functie van wetenschappelijke bibliotheken in een universitaire organisatie?

3. Welke rol zien Nederlandse universiteitsbibliotheken voor zichzelf weggelegd met betrekking tot digitale onderzoeksdata en wat is hun huidig en/of toekomstig beleid hierin? 4. Hoe kan een data librarian of soortgelijke functionaris bijdragen aan de ondersteunende rol van Nederlandse universiteitsbibliotheken met betrekking tot digitale onderzoeksdata?

(8)

1.3 Onderzoeksmethode

Dit onderzoek heeft een beschrijvend en verkennend karakter. Om het begrip digitale onderzoeksda-ta en de hiermee samenhangende aspecten te kunnen beschrijven is uitgebreid literatuuronderzoek verricht en zijn relevante websites geraadpleegd. Daarbij is met name gekeken naar de ontwikkelin-gen in Nederland op het gebied van het verwerven en beheren van digitale onderzoeksdata en voor zover relevant tevens naar vergelijkbare initiatieven elders. Eveneens is literatuuronderzoek uitge-voerd om de ontwikkelingen te beschrijven, die momenteel van invloed zijn op de positie en de func-tie van de wetenschappelijke bibliotheek. Daarbij is niet alleen gekeken naar de actuele situafunc-tie, maar wordt ook de historische ontwikkeling van universiteitsbibliotheken geschetst met name vanaf de jaren zestig van de twintigste eeuw.

Om de huidige stand van zaken met betrekking tot digitale onderzoeksdata te kunnen be-schrijven en anderzijds het ontwikkelde of nog te ontwikkelen beleid hierin te onderzoeken, is een inventariserend onderzoek gehouden onder de dertien Nederlandse universiteitsbibliotheken. Daartoe is deskresearch gedaan door de websites van deze dertien universiteitsbibliotheken en andere rele-vante organisaties te bestuderen en is gebruik gemaakt van recente literatuur en beleidsnota’s. Rele-vante literatuur verschenen tot en met mei 2011 is meegenomen in het onderzoek.

Daarnaast zijn interviews gehouden met acht sleutelfunctionarissen, die zich in hun dage-lijks werk bezig houden met digitale onderzoeksdata of beleidsmatig hierbij betrokken zijn. Het betreft zowel personen werkzaam binnen als buiten de context van een universiteitsbibliotheek.

1.4 Begrippen en afbakening van het onderzoek

De kernbegrippen uit de probleemstelling - te weten digitale onderzoeksdata, Nederlandse universi-teitsbibliotheken en de levenscyclus van onderzoeksdata - worden in deze paragraaf nader omschre-ven en waar nodig afgebakend.

1.4.1 Digitale onderzoeksdata

Primair ligt de nadruk op digitale onderzoeksdata, die door wetenschappers van de eigen universiteit zijn geproduceerd. Niet uitvoerig wordt ingegaan op onderzoeksdata, die door universiteiten extern zijn verkregen. Toch kunnen data van andere instanties (bijvoorbeeld van overheden) of vrij in het publieke domein beschikbare data zodanig bewerkt worden, dat een nieuw databestand wordt opge-bouwd. In dat geval is sprake van een nieuwe door eigen onderzoekers gegenereerde dataset. Ook worden digitale of gedigitaliseerde publicaties en archivalia, die in verschillende met name geestes-wetenschappelijke disciplines als onderzoeksdata zijn te beschouwen, slechts zijdelings in het on-derzoek betrokken. Deze zijn immers al gemeengoed in bibliotheken.

(9)

In dit onderzoek wordt geen onderscheid gemaakt tussen de verschillende typen digitale onderzoeksdata. Binnen de natuurwetenschappen kunnen die van een geheel andere aard zijn dan binnen een geesteswetenschappelijke discipline. Ook per universiteit kan dit sterk verschillen. Op een technische universiteit gebruiken wetenschappers andere onderzoeksdata dan op een rechtenfa-culteit. Het in digitale vorm zijn van de onderzoeksdata is het voornaamste criterium.

Wanneer in deze scriptie gesproken wordt over (onderzoeks)data of datasets worden altijd

digitale onderzoeksdata bedoeld, tenzij nadrukkelijk anders vermeld.

1.4.2 Universiteitsbibliotheken

Dit onderzoek heeft betrekking op de dertien Nederlandse universiteitsbibliotheken, die samen met de Koninklijke Bibliotheek verenigd zijn in het UKB, het Samenwerkingsverband Universiteitsbi-bliotheken & Koninklijke Bibliotheek.1 De rol van de Koninklijke Bibliotheek zal voor zover rele-vant apart ter sprake komen.

In het UKB is als geassocieerd lid de Koninklijke Akademie van Wetenschappen (KNAW) opgenomen.2 Voor dit onderzoek is speciaal het KNAW-instituut Data Archiving and Networked Services (DANS) relevant. DANS draagt zorgt voor de opslag en blijvende toegankelijkheid van onderzoeksgegevens in de alfa- en gammawetenschappen in Nederland.3 Niet in het onderzoek

be-trokken zijn de geassocieerde leden van het UKB, welke zijn de Open Universiteit en de bibliothe-ken verenigd in de Werkgroep Speciale Wetenschappelijke Bibliothebibliothe-ken (WSWB).

1.4.3 De levenscyclus van digitale onderzoeksdata

De levenscyclus van digitale onderzoeksdata kent een drietal hoofdfasen te weten: de creatiefase, de fase van duurzaam bewaren en toegankelijk maken en tenslotte de fase van gebruik en hergebruik van data. Deze indeling wordt ook in Nederlandse onderzoeken gehanteerd4 en is afgeleid van het zogeheten DCC Curation Lifecycle Model van het in het Engelse Edinburgh gevestigde Digital Cu-ration Centre (DCC).5 Het complete model kent elf gedetailleerde fasen en biedt een stappenplan bij het daadwerkelijk beheren van digitale onderzoeksdata.6

In het kader van deze scriptie zijn de genoemde drie hoofdfasen als uitgangspunt genomen. In de creatiefase vindt het wetenschappelijk onderzoek plaats. Naast het genereren van data worden tevens metadata van administratieve, beschrijvende en technische aard vastgelegd. In de fase van het duurzaam bewaren en toegankelijk maken staan activiteiten centraal als het zorgdragen voor de authenticiteit en betrouwbaarheid van data. In de fase van het (her)gebruik van onderzoeksresultaten 1 http://www.ukb.nl. 2 http://www.knaw.nl. 3 http://www.dans.knaw.nl. 4

Bijvoorbeeld Van der Graaf en Waaijer 2010: 41; Verhaar e.a. 2010: 23-25. 5

http://www.dcc.ac.uk. 6

(10)

is het gecontroleerd toegang bieden tot de digitale data ten behoeve van andere wetenschappers de belangrijkste activiteit.

1.5 Beknopt overzicht van de inhoud

In hoofdstuk 2 wordt uitgebreid ingegaan op het begrip digitale onderzoeksdata en worden de diver-se aspecten die daarmee verband houden beschreven. In hoofdstuk 3 komt de sterk veranderende functie en positie van de wetenschappelijke bibliotheek aan bod. In hoofdstuk 4 worden de resulta-ten van het empirisch onderzoek naar de stand van zaken en het beleid binnen Nederlandse universi-teitsbibliotheken met betrekking tot digitale onderzoeksdata uitgewerkt. Hoofdstuk 5 tenslotte bevat de conclusies en aanbevelingen.

(11)

2 ONDERZOEKSDATA

2.1 Inleiding

Wetenschappers, zowel werkzaam binnen als buiten een universiteit, kunnen zonder data geen on-derzoek doen. Onon-derzoeksdata ontstaan tijdens wetenschappelijk onon-derzoek bijvoorbeeld door het uitvoeren van experimenten, het doen van metingen of het interviewen van personen. Naast het ge-nereren van eigen onderzoeksdata maken wetenschappers veelvuldig gebruik van gegevens, die door collega’s zijn verzameld of bijvoorbeeld door overheidsorganisaties zijn geproduceerd.

In kenniscreërende organisaties, zoals universiteiten, is de driedeling data, informatie en kennis gemeengoed. Door het toekennen van betekenis en structuur aan data transformeren deze in informatie. Binnen de universitaire wereld wordt deze informatie veelal vastgelegd en openbaar ge-maakt in wetenschappelijke publicaties. Deze informatie wordt vervolgens beoordeeld en geverifi-eerd en al dan niet voor waar aangenomen. Dat laatste leidt tot nieuwe kennis over een bepaald on-derwerp.7 Onderzoeksdata zijn daarom het fundament van wetenschappelijk onderzoek en van de toename van wetenschappelijke kennis in de wereld.

In dit hoofdstuk wordt een uitgebreide analyse gegeven van het begrip onderzoeksdata. In-gegaan wordt op de definitie en de verschillende aspecten ervan. Bijzondere aandacht krijgt de bij-drage van de wetenschapper ten aanzien van het delen van zijn of haar onderzoeksdata met derden. Wetenschappers dienen immers wel bereid te zijn om data te delen en beschikbaar te stellen. Vervol-gens wordt een kort overzicht gegeven van de verschillende mogelijkheden om databeheer te facili-teren. Het hoofdstuk wordt afgesloten met een aantal conclusies.

2.2 Definities van onderzoeksdata

Het begrip onderzoeksdata of onderzoeksgegevens is niet eenduidig te omschrijven. Binnen het in Nederland gangbare onderscheid tussen de alfa-, bèta- en gammawetenschappen8 is de diversiteit aan onderzoeksdata namelijk groot.

Voor alfa- of geesteswetenschappen is de volgende definitie bruikbaar: ‘Alle gegevens die op een of andere wijze in het kader van wetenschappelijk onderzoek zijn verzameld’.9 Daarbij kan onderscheid gemaakt worden tussen primaire data dat wil zeggen empirische, waargenomen en ge-meten data en secundaire data, die als afgeleide geproduceerd zijn uit bestaande bronnen als door de overheid gepubliceerde cijferreeksen, eerder gevormde dataverzamelingen, gegevens uit archieven

7

Choo 2006: 131-135. 8

In het Angelsaksische taalgebied is de volgorde sciences (natuurwetenschappen), social sciences (sociale wetenschappen) en humanities (geesteswetenschappen) gebruikelijk.

9

(12)

en gepubliceerde of ongepubliceerde teksten. Binnen de bèta- of natuurwetenschappen is de volgen-de volgen-definitie gangbaar: ‘Een gegeven is een element dat relevantie en semantische waarvolgen-de heeft […] Met gegevens worden kenmerken van personen, zaken, handelingen e.d. uit de werkelijkheid be-schreven’.10

Borgman geeft de volgende algemeen aanvaarde en voor alle wetenschappen bruikbare defi-nitie: ‘A reinterpretable representation of information in a formalized manner suitable for communi-cation, interpretation, or processing’.11 Deze definitie beschouwt data vanuit een technisch perspec-tief. Voorbeelden van onderzoeksdata zijn bijvoorbeeld een reeks bits en bytes, een tabel met getal-len, de karakters op een pagina, een film of -geluidsopname of een brok maansteen. Bekeken vanuit sociaal perspectief is het begrip complexer. Onderzoeksdata kunnen voor de ene onderzoeker van wezenlijk belang zijn voor het eigen onderzoek, terwijl diezelfde data voor een andere onderzoeker niet meer dan als achtergrondinformatie kunnen dienen.12

Onderzoeksgegevens kunnen op verschillende manieren worden verzameld. Borgman noemt vier categorieën. Daarbij wordt geen onderscheid gemaakt tussen de drie hierboven vermelde wetenschapsgebieden. Ten eerste data, die zijn verzameld door middel van observatie. Voorbeelden zijn het vastleggen van klimatologische meetgegevens of het registreren van menselijk gedrag in bepaalde omstandigheden, op een bepaalde tijd en plaats. Ten tweede data, die door het uitvoeren van calculaties middels computermodellen of -simulatie worden geproduceerd. De derde categorie is experimentele data. Die zijn het resultaat van laboratoriumonderzoek in de natuurwetenschappen of een gecontroleerd experimenteel onderzoek binnen een gedragswetenschappelijke discipline. De laatste categorie betreft archieven en dataverzamelingen van overheden en bedrijfsleven en uit openbare en private bronnen van personen.13

Ook op andere manieren vallen onderzoeksdata te onderscheiden. Zo maakt Borgman on-derscheid tussen primaire, secundaire en tertiaire bronnen. Data beschouwt zij als primaire bronnen, publicaties en onderzoeksrapporten als secundaire bronnen en toegangen als catalogi en indexen tot data en publicaties als tertiaire bronnen.14 Al kunnen in bepaalde geesteswetenschappelijke discipli-nes ook secundaire en zelfs tertiaire bronnen als primaire onderzoeksdata worden beschouwd. Feijen citeert een Fins rapport over Open Access en hergebruik van onderzoeksdata, waarin juist op negen punten een duidelijk onderscheid gemaakt wordt tussen onderzoeksdata en onderzoekspublicaties.15 Onderzoeksdata zijn daarin met name ruwe data.

Tjalsma en Rombouts onderscheiden twee typen onderzoeksdata in de verschillende fasen van het onderzoeksproces. Allereerst de primaire data, dat wil zeggen de ruwe nog onbewerkte data.

10

De Cock Buning e.a. 2009: 5. 11 Borgman 2007: 119-120. 12 Borgman 2008: 30. 13 Borgman 2007: 120. 14 Borgman 2007: 122. 15 Feijen 2010: 15.

(13)

Ten tweede de secundaire of procesdata, die in het onderzoek al een vorm van bewerking hebben ondergaan en gedeeld kunnen worden met andere onderzoekers via een data-archief of als verrijking van een publicatie.16 De onderverdeling in zogenaamde data domeinen pas hier goed bij, dat wil zeggen de fasen waarin onderzoeksdata zich kunnen bevinden. Het eerste domein is het private on-derzoeksdomein, waarin een kleine groep wetenschappers direct onderzoek doet. Het tweede domein betreft het gedeelde onderzoeksdomein, waarin onderzoekers hun data of een deel daarvan ook open-stellen voor een beperkte groep wetenschappers buiten hun directe omgeving. Het derde domein is het publieke domein, waarin de data na afloop van het onderzoek en nadat de onderzoeksresultaten zijn gepubliceerd beschikbaar komen voor algemeen gebruik.17

Onderzoeksgegevens staan niet op zichzelf. Ze ontstaan in een context en worden met een bepaald doel geproduceerd, geïnterpreteerd, geëvalueerd en gepubliceerd. Om wetenschappelijk onderzoek te kunnen beoordelen is het niet alleen van belang om over de juiste data te beschikken, maar ook om daar toegang toe te hebben. Deze gegevens over de data worden metadata genoemd. Deze geven de eigenschappen van de data weer, zoals eigenaar, taal, waar en wanneer geproduceerd, omvang, opslagformaat, gebruikte meetinstrumenten etc. Deels kan dit geautomatiseerd worden uitgevoerd, maar vaker dienen metadata handmatig door menselijke inbreng te worden toegevoegd. Daarbij kan ook gedacht worden aan het toevoegen van thesaurustermen, samenvatting of andere manieren om de data te voorzien van een juiste omschrijving. Goede metadata zijn van belang om de onderzoeksgegevens op de juiste wijze te kunnen interpreteren en beoordelen, maar ook om de be-treffende data vindbaar te maken voor andere onderzoekers, die op zoek zijn naar bepaalde gegevens voor hergebruik voor nieuw onderzoek.

2.3 De explosieve groei van digitale onderzoeksdata

Wereldwijd neemt de hoeveelheid digitaal opgeslagen data enorm toe. Datzelfde geldt voor zoeksdata. In alle wetenschapsdisciplines neemt de productie en het gebruik van digitale onder-zoeksdata zeer sterk toe. Enerzijds worden steeds meer data uitsluitend digitaal verzameld, ander-zijds vinden grote digitaliseringsprojecten plaats van papieren documenten en andere gegevensdra-gers, die oorspronkelijk uitsluitend in analoge vorm beschikbaar waren, zoals boekcollecties, ar-chiefmateriaal en geluidsbestanden op tape. Om deze ontwikkeling te duiden, introduceerden Hey en Trefethen de term data deluge.18

Deze stortvloed aan data zorgt voor een onomkeerbare andere wijze van wetenschapsbeoe-fening. De term data deluge is inmiddels een vast begrip geworden om de stortvloed aan data te omschrijven en heeft geleid tot diverse varianten op deze omschrijving. Zo gaf Carlson zijn artikel

16

Tjalsma en Rombouts 2010: 13. 17

Treloar en Harboe-Ree 2008: 5-6. Ook geciteerd in Feijen 2010: 15-16. 18

(14)

in The Chronicle of Higher Education de titel ‘Lost in a sea of science data’ en verscheen een rap-port van de Europese Commissie onder de titel Riding the wave: how Europe can gain from the

rising tide of scientific data.19 De stortvloed aan digitale onderzoeksdata komt niet alleen voor in wetenschappen als de geneeskunde en de astronomie, de zogenaamde big science, maar ook in de ‘kleinere’ wetenschapsdisciplines, de little science.20

De fundamenteel veranderende wijze van het doen van wetenschappelijk onderzoek wordt omschreven met de term e-science.21 De e in deze term staat voor enhanced (verrijkt), waarmee bedoeld wordt dat door de nieuwe met name technische mogelijkheden het doen van wetenschappe-lijk onderzoek nog gemakkewetenschappe-lijker en beter gedaan kan worden. Kenmerkend voor e-science is de wereldwijde samenwerking tussen wetenschappers, mogelijk gemaakt door het internet en de daar-mee samenhangende toegang tot grote hoeveelheden digitale data. E-science heeft dus betrekking op de wetenschappelijke informatie-infrastructuur en is voornamelijk gericht op de nieuwe mogelijk-heden van ICT. Of zoals computerwetenschapper Jim Gray (1944-2007) in 2007 zei: ‘eScience is where “IT meets scientists”’.22 Overigens dient te worden opgemerkt, dat in Nederland de term e-research gebruikelijker is dan e-science, hoewel er hetzelfde mee wordt bedoeld.23 Borgman sluit hierbij aan en beschouwd e-science als onderdeel van het bredere e-research, een begrip dat alle wetenschappelijke infrastructuur voor alle disciplines omvat.24 Met science wordt formeel immers de natuurwetenschappen bedoeld. Het begrip research omvat ook de andere wetenschappen, name-lijk de geesteswetenschappen en de sociale wetenschappen.

De reeds aangehaalde Jim Gray is ook de persoon, die het data-intensieve onderzoek het vierde wetenschappelijk paradigma noemde. Het eerste en oudste paradigma is de empirische tenschap. Daarna kwam de theoretische wetenschap, de laatste tientallen jaren gevolgd door de we-tenschap, die gebruik maakt van simulatie met behulp van computertechnologie. Het data-intensieve onderzoek staat echter niet op zichzelf, maar brengt het empirisch, theoretisch en

simulatie-onderzoek bij elkaar en versterkt deze zelfs.25 Het plaatst data in het hart van het nieuwe weten-schappelijke ecosysteem.26 Datasets staan niet op zichzelf, maar maken onderdeel uit van de, zoals

19

Zie Carlson 2006 en European Commission 2010. Eric Schmidt, topman bij Google, sprak in 2010 zelfs al van een data tsunami. Zie bericht op: http://www.itworld.com/internet/116426/google-brace-yourselves-data-explosion (geraadpleegd 10 maart 2011).

20

Borgman, Wallis en Enyedy 2006. 21

Jankowski 2007. De schrijfwijze van e-science is ook eScience of e-Science. 22

Hey, Tansley en Tolle 2009: XX. 23

Jankowski 2007. In 2011 hebben SURF en NWO het Netherlands eScience Center (NLeSC) opgericht, dat zich als kennis- en expertisecentrum voor eScience in Nederland richt op de alfa-, bèta- en gammawetenschap-pen. Zie: http://www.esciencecenter.nl/.

24

Borgman 2007: 20. Dit wordt ook beaamd door Clifford Lynch in zijn bijdrage in: Hey, Tansley en Tolle 2009: 178 (noot 1).

25

In Hey, Tansley en Tolle 2009, The fourth paradigma wordt de visie van Jim Gray verder uitgewerkt. 26

(15)

Borgman dat noemt ‘value chain of scholarship’, verwijzend naar de waardeketen van de Ameri-kaans bedrijfseconoom Michael E. Porter.27

2.4 Aspecten van digitale onderzoeksdata

In deze paragraaf wordt beknopt een aantal belangrijke aspecten met betrekking tot digitale onder-zoeksdata beschreven. Achtereenvolgens wordt ingegaan op organisatorische aspecten, de waarde-ring en selectie van onderzoeksdata, technische aspecten en digitalisewaarde-ring en tot slot juridische as-pecten. Het zijn name deze aspecten, die ook voor wetenschappelijke bibliotheken relevant zijn. Een volledig overzicht van alle met digitale onderzoeksdata samenhangende aspecten biedt Borgman in

Scholarship in the digital age.28

2.4.1 Organisatorische aspecten

Om digitale onderzoeksdata te beheren, duurzaam te bewaren en beschikbaar te stellen is een goede organisatie met voldoende financiële middelen noodzakelijk. Voor onderzoeksdata zijn een aantal opties te noemen: de universiteiten zelf en nationale en internationale data-archieven al dan niet ge-richt op een bepaald wetenschapsgebied. Een goede organisatie-infrastructuur is van belang om on-derzoeksdata duurzaam te beheren en ook op de langere termijn beschikbaar te stellen. Dit kan we-tenschappers namelijk stimuleren om hun data onder te brengen bij een intern repository of extern data-archief in plaats van onderzoeksdata zelf te bewaren op de eigen computer.

Van der Graaf komt tot een verdeling in vier organisatievormen voor onderzoeksdata. Ten eerste noemt hij datacollecties georganiseerd in datacentra rond disciplinaire of thematische onder-zoeksactiviteiten. In de tweede plaats zijn er data-archieven en repositories gericht op hergebruik van onderzoeksdata. De derde vorm betreft de door onderzoekers zelf georganiseerde opslag en beschik-baarstelling. Als vierde onderscheidt Van der Graaf opslag van datacollecties georganiseerd rond wetenschappelijke tijdschriften.29 Over het delen en beschikbaar stellen van onderzoeksdata zal in de paragraaf 2.5 uitgebreid worden ingegaan.

De term data-archief is niet nieuw. Al in de jaren zestig van de vorige eeuw werden in veel Europese landen data-archieven opgezet. In Nederland was in 1964 het Steinmetz Archief voor soci-aalwetenschappelijke onderzoeksgegevens de koploper. De toenemende digitalisering leidde ertoe, dat steeds meer aandacht kwam voor het duurzaam bewaren en behouden van wetenschappelijk digi-tale informatie, waarbij zowel data-archieven als de universiteiten en hun bibliotheken als belangrij-ke spelers werden aangemerkt.30 In 2005 ontstond DANS - Data Archiving and Networked

27 Borgman 2007: 116. 28 Borgman 2007: 115-147. 29

Van der Graaf 2010: 19-25. 30

(16)

ces31 - uit een samenvoeging van het Steinmetz Archief met een aantal andere domeinspecifieke data-archieven uit de alfa- en gammawetenschappen.32 DANS biedt onder andere historici en sociale wetenschappers de mogelijkheid hun data zelf duurzaam te deponeren.33 Als voorbeeld van een initi-atief van universiteiten kan het 3TU.Datacentrum worden genoemd, een gezamenlijk project van de bibliotheken van de Technische Universiteiten van Delft, Eindhoven en Twente. Doel van het project is om technisch-wetenschappelijke onderzoeksdata duurzaam op te slaan en toegankelijk te houden voor hergebruik.34

In andere landen vinden vergelijkbare initiatieven plaats. Een voorbeeld is het Verenigd Koninkrijk, waar in 2004 het Digital Curation Centre werd opgericht.35 In 2007 verscheen Dealing

with data, waarin rechten, verantwoordelijkheden en relaties van betrokken organisaties in het Vere-nigd Koninkrijk met betrekking tot onderzoeksdata werden uitgewerkt. Dit rapport wil een brug slaan tussen theorie en praktijk van databeheer.36 In Europees verband startte in 2008 het project PARSE.Insight - Permanent Access to Records of Science in Europa - waarin de levensduur en kwetsbaarheid van onderzoeksdata werden belicht en waarin de nadruk lag op het belang voor de benodigde infrastructuur voor permanente toegang, vindbaarheid en begrijpelijkheid van onder-zoeksdata. Het project werd in 2010 afgesloten en leidde tot een flink aantal onderzoeksrapporten.37

Oktober 2010 verscheen in opdracht van de Europese Commissie het rapport Riding the

wave over de belangrijkste uitdagingen met betrekking tot onderzoeksdata. Deze betreffen het duur-zaam bewaren van data, het beschermen van de integriteit en het beschrijven van de context en her-komst van data, evenals de kosten van alles wat met opslag en beheer te maken heeft en het be-schermen van de privacy van personen genoemd in datasets.38 De onderzoekers zien als toekomstvi-sie in 2030 een wetenschappelijke infrastructuur die naadloos toegang, gebruik, hergebruik en be-trouwbaarheid van data ondersteunt.39 Om dit te bereiken doen zij zes aanbevelingen:

1. Develop an international framework for a Colloborative Infrastructure; 2. Earmark additional funds for scientific e-infrastructure;

3. Develop and use new ways to measure data value, and reward those who contribute it; 4. Train a new generation of data scientist, and broaden public understanding;

5. Create incentives for green technologies in the data infrastructure;

31

http://www.dans.knaw.nl. Zie ook: Sesink en Witkamp 2010. 32

Doorn 2010b. 33

DANS 2009a en 2009b. 34

http://www.datacentrum.3tu.nl. Zie ook: Rombouts e.a. 2009. 35

http://www.dcc.ac.uk/. In dit kader is ook van belang de UK Research Data Service (UKRDS), zie: http://www.ukrds.ac.uk.

36

Lyon 2007. 37

http://www.parse-insight.eu/. Over met name organisatorische aspecten zie: PARSE.Insight 2010a. 38

European Commission 2010: 16-17. 39

(17)

6. Establish a high-level, intern-ministerial group on a global level to plan for data infrastruc-ture.40

Ook buiten Europa staan onderzoeksdata in de belangstelling. Zo is de Australian National Data Service (ANDS) opgericht om onderzoeksdata openbaar toegankelijk te maken.41 In internationaal verband is in 2009 DataCite opgericht. DataCite heeft als doel het ondersteunen van onderzoekers bij het vinden, identificeren en citeren van datasets. Belangrijk middel daarbij is de Digital Object Iden-tifier (DOI), waarmee een dataset voorzien kan worden van een zogenaamde persistent idenIden-tifier. Een DOI-naam is inmiddels gemeengoed voor wetenschappelijke artikelen.42

2.4.2 Waardering en selectie van onderzoeksdata

De stortvloed aan onderzoeksdata maakt het noodzakelijk om uitsluitend die gegevens te bewaren, waarvan is aangetoond, dat het van belang is deze langdurig te bewaren. Daar gaat een proces van waardering en selectie aan vooraf. De belangrijkste redenen om onderzoeksdata te bewaren zijn:

1. Verplicht door financier van het onderzoek met het oog op hergebruik; 2. Verplicht met het oog op verificatie van onderzoek;

3. Voor wetenschapshistorisch onderzoek en data te beschouwen als cultureel erfgoed.43 Ook als er geen formele verplichting is, kan het toch van belang zijn onderzoeksdata te bewaren. Veel onderzoek door middel van observaties en interviews kan niet op exact dezelfde wijze herhaald worden en levert daardoor unieke gegevens op. Het blijvend bewaren van data kan gelegen zijn in de omvang van het onderzoek, de ermee gemoeide kosten, het innovatieve karakter of het nationale of internationale belang ervan.44 Data kunnen eveneens voor onderwijsdoeleinden bruikbaar zijn. Ook kunnen oudere data door nieuwe technieken van data-analyse hergebruikt worden en nieuwe inzichten opleveren. Bepaalde typen data kunnen belangrijk blijven, omdat de onderzoekslocatie niet meer bestaat, bijvoorbeeld bij archeologische opgravingen.45

Met het oog op verificatie van onderzoek is De Nederlandse Gedragscode

Wetenschapsbe-oefening van belang.46 Aan deze gedragscode hebben alle Nederlandse universiteiten zich gecon-formeerd. Paragraaf III.3 van deze code vermeldt: ‘De bewaartermijn van ruwe onderzoeksgegevens is minimaal 5 jaar. Deze gegevens worden op aanvraag ter beschikking gesteld aan andere weten-schapsbeoefenaren’.47 Dat betekent, dat de activiteit van waardering en selectie van onderzoeksdata

40

European Commission 2010: 30-33. 41

http://www.ands.org.au. Zie ook: Burton en Treloar 2010. 42

http://datacite.org/. Zie ook: Brase en Farquhar 2011. Een voorbeeld van publiceren en citeren van onder-zoeksdata is STD-DOI Publication and Citation of Scientific Primary Data, een in Duitsland opgezet project. Zie: http://www.std-doi.de/front_content.php (geraadpleegd 25 maart 2011). Zie hierover ook: Klump e.a. 2006. 43 Tjalsma en Rombouts 2010. 44 Tjalsma en Rombouts 2010: 9. 45 Borgman 2007: 118-119. 46 VSNU 2004. 47 VSNU 2004: 7.

(18)

in principe na vijf jaar gaat spelen. Tjalsma en Rombouts pleiten echter voor selectie op het moment dat de data ontstaan als daar beleid voor is opgesteld of technische infrastructuur voorhanden is. Indien dit geen optie is, kan de selectie ook plaatsvinden, wanneer de data ondergebracht worden in een data-archief of op een later moment. Dat laatste kan aan de orde zijn als een bestaande dataset opnieuw wordt gebruikt.48

Naast genoemde redenen om onderzoeksdata te bewaren, dient ook aan een aantal rand-voorwaarden te worden voldaan. Tjalsma en Rombouts noemen er zes:

1. Technisch: data formats, software, hardware;

2. Metagegevens: beschikbaarheid, volledigheid, context; 3. Gegevens: ruwe data, halfbewerkte data, gepubliceerde data;

4. Intellectuele eigendomsrechten: duidelijkheid hieromtrent, waarborging privacy; 5. Infrastructuur: beschikbaarheid via data-archief of institutioneel datarepository; 6. Kosten: voor selectie, conversie, duurzame bewaring en beschikbaarstelling van data.49 Deze randvoorwaarden leggen de nadruk op kwaliteit. De Nederlandse Gedragscode

Wetenschaps-beoefening schrijft in paragraaf III.2 voor: ‘de kwaliteit van de dataverzameling, data-invoer, da-taopslag en dataverwerking wordt goed bewaakt’.50

Van der Graaf en Waaijers hebben de kwaliteitsbeoordeling van onderzoeksdata onderzocht en komen tot een tweetal aspecten. Ten eerste kwaliteitszorg bij het creëren van data vastgelegd in de documentatie en in het verlengde daarvan bij het datamanagement als het gaat om de metadata. Primaire doel daarbij is om de toegankelijkheid van data voor hergebruik door andere wetenschap-pers te verhogen. In de tweede plaats de meer inhoudelijke kwaliteitstoets, waarbij het gaat om de wetenschappelijke waarde van de data. Primaire doel hiervan is om te beoordelen of de data zinvol genoeg zijn voor hergebruik door anderen.51 Wetenschappers zien kwaliteitsbeoordeling van data-sets het liefst uitgevoerd worden in de vorm van tijdschriften voor datapublicaties, het mogelijk maken van het citeren van datasets en het na hergebruik kunnen becommentariëren van datasets. Die commentaren kunnen vervolgens toegevoegd worden aan het data-archief, waarin de datasets zijn opgenomen.52 Relevant in verband met kwaliteitszorg is ook het Datakeurmerk van DANS opge-steld voor de sociale en geesteswetenschappen.53

48 Tjalsma en Rombouts 2010: 32. 49 Tjalsma en Rombouts 2010: 10. 50 VSNU 2004: 7. 51

Van der Graaf en Waaijers 2010: 14. Zie ook: Waaijers en Van der Graaf 2011. 52

Van der Graaf en Waaijers 2010: 35. DANS heeft eind 2010 een pilot uitgevoerd naar het becommentariëren van datasets onder gebruikers van hun data-archief EASY. Belangrijkste aanbeveling is om een continue vorm van datareview in te voeren. Zie: Grootveld, Van Egmond en Sørensen 2011.

53

(19)

2.4.3 Technische aspecten

In de vorige paragraaf zijn technische eisen als eerste randvoorwaarde genoemd. Duurzame opslag en beschikbaar stellen van data vergen een betrouwbare technische infrastructuur. Om het vinden en hergebruiken van onderzoeksdata te verbeteren zijn standaarden voor de opslag van data en metada-ta van groot belang.54

Spelen de technische aspecten bij het creëren, beheren en hergebruiken van digitale zoeksdata een belangrijke rol, dat geldt nog des te meer bij het digitaliseren van analoge onder-zoeksgegevens of bij pogingen om data opgeslagen op verouderde hard- en software duurzaam te gaan bewaren. Het laatste wordt wel digitale archeologie genoemd.55 In Nederland is het belang van het behoud van wetenschappelijke digitale academische informatie al vroeg onderkend.56 Ook zijn initiatieven ontwikkeld om digitale onderzoeksdata opgeslagen op verouderde formaten als disket-tes, magneetbanden en back-uptapes achteraf duurzaam te archiveren en te bewaren.57

2.4.4 Juridische aspecten

Het intellectueel eigendomsrecht en de privacy vormen de voornaamste juridische aspecten met betrekking tot onderzoeksdata. Deze twee aandachtspunten komen overeen met die voor publicaties en kennen diverse juridische obstakels. Borgman verwijst naar Creative Commons licenties voor wetenschappelijke onderzoek om ook onderzoeksdata vrij beschikbaar te stellen zonder juridische beperkingen.58

In Nederland is in 2009 een wegwijzer gepubliceerd over de juridische status van ruwe data. Hierin worden met name de juridische beschermingsregimes van het auteursrecht, het databanken-recht en de onpersoonlijke geschriftenbescherming behandeld. Laatstgenoemde is alleen aan de orde als de andere twee regimes niet van toepassing zijn. Doel van de wegwijzer is onderzoekers, die data van anderen willen hergebruiken informatie te geven over wat zij wel of niet met de data mogen doen. Ook dient te worden vastgesteld of toestemming van de maker of eigenaar vereist is.59 Ook contractueel kunnen voorwaarden vastgelegd zijn, die hergebruik belemmeren. In zulke gevallen kan het contractenrecht van toepassing zijn.60

Privacywetgeving is in het geding als onderzoeksdata persoonsgegevens bevatten, zoals bij sociaalwetenschappelijk en medisch onderzoek het geval kan zijn. Data kunnen dan alleen gedeeld en hergebruikt worden als de persoonsgegevens zijn geanonimiseerd. Indien de data herleid kunnen worden tot personen, dient in beginsel de persoon in kwestie toestemming te geven.61 Van belang in

54 Borgman 2007: 142. 55 Tjalsma en Rombouts 2010: 30. 56 Mostert e.a. 1998. 57

Balkestein en Tjalsma 2007. Het volledige onderzoek is beschreven in Tjalsma 2006. 58

Borgman 2007: 143. Zie ook: http://creativecommons.org/science. 59 De Cock Buning 2009. 60 Ringnalda 2011: 33. 61 Ringnalda 2011: 33.

(20)

deze is de Wet Bescherming Persoonsgegevens. Nederlandse universiteiten kennen sinds 2005 de

Gedragscode voor gebruik van persoonsgegevens in wetenschappelijk onderzoek.62

2.5 Het delen van onderzoeksdata

2.5.1 Inleiding

Eén van de grootste obstakels om data duurzaam te bewaren en beschikbaar te stellen aan andere wetenschappers voor hergebruik is het zelf niet bereid zijn van onderzoekers om hun data te delen. Zij beschouwen het delen van onderzoeksdata juist als een vorm van gratis weggeven ervan, terwijl ze zelf - in ieder geval voor een bepaalde periode - als eerste profijt van de data willen hebben in de vorm van publicaties en credits. Het ontbreekt onder wetenschappers vaak aan een cultuur van data delen.

En als er mogelijkheden zijn om de eigen onderzoeksdata beschikbaar te stellen, worden deze echter niet of nauwelijks benut, blijkt uit Amerikaans onderzoek. Nelson beschrijft in zijn in

Science verschenen artikel ‘Empty archives’ de inspanningen van Amerikaanse universiteiten en hun bibliotheken met investeringen van honderdduizenden dollars om digitale archieven en repositories in te richten. De verwachting was, dat onderzoekers massaal hun data zouden inleveren. Zoals de titel van het artikel al aangeeft, bleken de archieven na een aantal jaren nog grotendeels leeg te zijn.63 Een gebrek aan digitale data is niet het probleem. Uit onderzoek onder Australische wetenschappers blijkt, dat 90% van hen digitale onderzoeksdata produceert. Van de overige 10% niet-digitale data had een deel ook digitaal gegenereerd kunnen worden of bestaat de mogelijkheid deze alsnog te digi-taliseren.64

Het delen van digitale onderzoeksdata staat ook in Nederland al bijna tien jaar in de belang-stelling. In 2002 verschenen twee rapporten over het beleid rond digitale onderzoeksdata en het de-len van data.65 Vanaf 2008 heeft SURFfoundation binnen het SURFshare-programma het beheren en beschikbaar stellen van onderzoeksdata uitgebreid vanuit verschillende invalshoeken (technisch, organisatorisch, juridisch) onderzocht. Enkele onderzoeken lopen nog.66 Naast publicaties, die het onderwerp discipline-onafhankelijk beschrijven, verschijnen nationaal en internationaal ook publica-ties, die zich richten op databeheer en data delen in een specifieke wetenschapsdiscipline, zoals in de evolutiebiologie67, de kunstgeschiedenis, vergelijkende kunstwetenschap en de mediastudies68, psy-chologie69 en de sociologie70. Februari 2011 verscheen een speciaal nummer van Science in

62 VSNU 2005. 63 Nelson 2009. 64 Henty e.a. 2008: 3-4. 65

Wouters 2002; Wouters en Schröder 2003. 66

http://www.surffoundation.nl/toegangtotdata (geraadpleegd 4 april 2011). 67 Greenberg 2009. 68 Verhaar e.a. 2010. 69 Voorbrood 2010.

(21)

werking met Science Signaling, Science Translational Medicine en Science Careers onder de titel ‘Dealing with data’, waarin allerlei aspecten rond databeheer en data delen binnen diverse disciplines centraal staan.71

In hun artikel in Science and Engineering Ethics beschrijven Fischer en Zigmond de funda-mentele grondregels voor het delen van data zonder daarbij een bepaalde wetenschapsdiscipline voor ogen te hebben. Naast technische en organisatorische aspecten beschouwen zij het delen van data vanuit ethisch perspectief.72

2.5.2 Redenen om onderzoeksdata te delen

De zojuist genoemde Fischer en Zigmond beschrijven vier hoofdredenen om data te delen.73 In de eerste plaats kan wetenschappelijke kennis daardoor sneller en fundamenteler toenemen. Onderzoe-kers bouwen immers veelal voort op de resultaten en ideeën van anderen. Zij kunnen leren van de ervaringen van anderen, hoeven niet meer het volledige wetenschapsterrein te kennen en te overzien en kunnen zich daardoor gaan specialiseren. Data delen zorgt er tevens voor, dat meerdere weten-schappers tegelijkertijd dezelfde data kunnen gebruiken en deze vanuit verschillende disciplines en perspectieven kunnen onderzoeken.

In de tweede plaats draagt het delen van data bij aan een veel efficiëntere inzet van midde-len. Het voorkomt onnodige duplicering van onderzoek, waardoor kosten en inzet van menskracht worden bespaard. Ook zorgt data delen voor een optimaal gebruik ervan. Dezelfde datasets kunnen meerdere keren voor meerdere doeleinden worden gebruikt en daarmee leiden tot nieuwe weten-schappelijke inzichten. Onderzoeksresultaten kunnen met gedeelde datasets opnieuw worden geana-lyseerd en geïnterpreteerd. Duplicering van onderzoek dient in dat geval als controlemiddel om eventuele fouten in eerder onderzoek te corrigeren. Uit onderzoek blijkt verder, dat publicaties voortkomend uit een gedeelde dataset vaker worden geciteerd en daarmee hun impact en reputatie vergroten.74 In bepaald onderzoek is het moeilijk om de juiste proefpersonen of proefdieren te vinden of is het ethisch onverantwoord om veel proefpersonen of proefdieren te gebruiken. Gedeelde data-sets uit verschillende onderzoeksomgevingen kunnen worden gecombineerd, waardoor nieuwe gro-tere datasets ontstaan voor hergebruik.

Ten derde zorgt het delen van data voor een verrijking van het klimaat van de gehele weten-schappelijke gemeenschap. Wanneer onder wetenschappers delen de norm is, zullen zij nog meer dan voorheen zorgvuldig te werk gaan. Een andere onderzoeker kan immers eenvoudig het

70

Nicholson en Bennett 2011; King 2011. King beschrijft het delen van data vanuit een technische invalshoek door te wijzen op de mogelijkheden van The Dataverse Network (DVN) Project, een open source applicatie voor databeheer. Zie over The Dataverse Network ook: Crosas 2011 en de website http://thedata.org. 71

Zie voor een overzicht van de artikelen: http://www.sciencemag.org/site/special/data. 72

Fischer en Zigmond 2010. 73

Fischer en Zigmond 2010: 785-789. 74

(22)

zoek repliceren. Een open cultuur van data delen draagt bij aan een transparante wijze van weten-schapsbeoefening met als doel het stimuleren van nieuwe ideeën en inzichten.

Het verplicht stellen van het delen van onderzoeksdata is de vierde hoofdreden. Onder-zoeksfinanciers eisen van wetenschappers, dat zij hun data beschikbaar stellen. Zo verstrekt de Ne-derlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) subsidies aan universiteiten onder voorwaarde, dat data beschikbaar worden gesteld aan andere onderzoekers.75 Ook wetenschappelij-ke tijdschriften eisen steeds vawetenschappelij-ker van onderzoewetenschappelij-kers om hun data beschikbaar te stellen. Zo vraagt het wetenschappelijk tijdschrift Nature auteurs ‘to make materials, data and associated protocols promptly available to readers without preconditions’.76

2.5.3 Redenen om onderzoeksdata niet te delen

Hoewel veel wetenschappers de voordelen van delen inzien, hebben velen moeite om hun eigen data met anderen te delen. Daarvoor zijn een aantal obstakels te noemen. Fischer en Zigmond beschrij-ven vier categorieën, die grotendeels overeenkomen met Borgman.77 Als eerste onderscheiden zij de negatieve impact, die data delen op de carrière van de onderzoeker kan hebben. Wetenschappers willen namelijk zelf als eerste profiteren van de eigen onderzoeksdata en op basis daarvan veel pu-blicaties genereren. Als ze verplicht worden om direct na de eerste publicatie hun onderzoeksdata beschikbaar te stellen aan derden, is de kans aanwezig, dat andere onderzoekers eveneens profijt halen uit de dataset ten koste van henzelf. Sommige onderzoekers zijn huiverig om hun data be-schikbaar te stellen, omdat ze vinden dat anderen niet de middelen en de kennis hebben om hun onderzoek te repliceren. Beloning in de vorm van prestige, promotie en onderzoekssubsidies ont-vangen wetenschappers met name voor aantallen geproduceerde publicaties en niet voor het be-schikbaar stellen van data.

Ten tweede bemoeilijkt een gebrek aan voldoende financiële en personele middelen weten-schappers om hun data te delen. Hun tijd besteden ze bij voorkeur aan het doen van onderzoek. On-derzoekssubsidies zijn vaak volledig nodig voor het onderzoek zelf. Naast tijd ontbreekt het ook vaak aan gekwalificeerd personeel om data geschikt te maken om te delen met anderen of om andere onderzoekers te ondersteunen in het hergebruik van de data. In bepaalde gevallen kan het voor derzoekers te kostbaar zijn om de objecten van onderzoek beschikbaar te houden of is dat zelfs on-mogelijk, zoals in het geval van proefdieren.

In de derde plaats speelt het probleem van de intellectuele eigendomsrechten. Indien het mogelijk is onderzoeksresultaten te gelde te maken en bijvoorbeeld patent aan te vragen voor een wetenschappelijke vinding, is data delen niet of nauwelijks mogelijk. Ook kan het delen uitgesteld

75

http://www.nwo.nl. De Regeling subsidieverlening NWO (2007) vermeldt: ‘Databanken met bijbehorende toelichting worden in elk geval […] op door NWO aan te geven wijze beschikbaar gesteld voor gebruik door andere wetenschappelijk onderzoekers’ (Hoofdstuk 3, bepaling 19).

76

Geciteerd in: Nelson 2009: 163. 77

(23)

worden door data een bepaalde periode onder embargo te stellen, waarmee het exclusieve gebruik van de onderzoeksgegevens in ieder geval tijdelijk wordt gegarandeerd. Ook kan slechts een deel van de data voor hergebruik beschikbaar worden gesteld. Borgman stelt, dat niet altijd duidelijk is wie formeel eigenaar is en daarmee zeggenschap over de data heeft. Eveneens is het voor onderzoe-kers, die data van derden willen hergebruiken, niet altijd goed te achterhalen, wie de eigenaar is en aan welke voorwaarden hergebruik exact moet voldoen.78

Als vierde en laatste reden noemen Fischer en Zigmond ethische en wettelijke aspecten als obstakels om data te delen. Vertrouwelijkheid en privacywetgeving kunnen belemmerend werken. Onderzoeksdata ontdoen van persoonsgegevens kan de waarde van de dataset verminderen. Het kan tijdrovend en kostbaar zijn om toestemming te vragen aan bijvoorbeeld alle respondenten in een onderzoek of proefpersonen in een medisch onderzoek. Ook overheden kunnen beperkingen opleg-gen aan wetenschappers om bepaalde data, die verband houden met de nationale veiligheid, te delen. In het verlengde daarvan kan ook een embargo tegen een bepaald land een belemmering zijn om data beschikbaar te stellen aan anderen.

2.5.4 De wensen van onderzoekers zelf

Zonder medewerking van onderzoekers is het delen van data niet of nauwelijks mogelijk. Dat bete-kent, dat barrières weggenomen dienen te worden en de wensen van onderzoekers uitgangspunt moeten zijn. Feijen onderzocht met dat doel waar onderzoekers specifiek behoefte aan hebben als het gaat om opslag en toegang tot onderzoeksdata. Dit werd onderzocht door het analyseren van vijftien rapporten uit de periode 2008-2010 afkomstig uit Nederland, Verenigde Staten, Australië79, Verenigd Koninkrijk80 en Europa. Feijens rapport vormt het uitgangspunt voor deze paragraaf.81

Feijen komt op basis van zijn literatuuronderzoek tot twee hoofdconclusies. Ten eerste vin-den onderzoekers de opslag van de onderzoeksdata, die zij dagelijks gebruiken van groot belang. Om hun data te beschermen willen zij graag ondersteuning. In de tweede plaats willen zij controle houden over hun data. Zij vinden het belangrijk te weten wie hun gegevens hergebruikt en onder welke condities. Feijen concludeert, dat wetenschappers een duidelijk onderscheid maken tussen enerzijds opslag en toegang tot data tijdens de onderzoeksfase en anderzijds het beheer van de data na publicatie van de onderzoeksresultaten.

Onderzoekers hechten groot belang aan goede ondersteuning in beheer en bescherming van data tijdens de onderzoeksfase. Diensten, die ondersteuning kunnen bieden, moeten volgens hen wel aan een aantal eisen voldoen. Feijen noemt maar liefst acht door onderzoekers genoemde voorwaar-den. Zij willen:

1. afstemming van tools en diensten op hun werkprocessen; 78 Borgman 2007: 196. 79 Henty e.a. 2008. 80

o.a. Beagrie, Beagrie en Rowlands 2009. 81

(24)

2. geen van boven af opgelegde regeling of verplichting;

3. een keuze kunnen maken uit een pakket van diensten, zogenaamde ‘cafetaria-model’; 4. gebruiksvriendelijke tools en diensten;

5. controle hebben over hun data en er van op aan kunnen, dat de beheerder van hun data, zoals een universiteitsbibliotheek of datacentrum, hun belangen respecteert;

6. vooral ondersteuning van tools en diensten tijdens hun dagelijkse onderzoekspraktijk; 7. direct de voordelen zien van de ondersteuning en niet pas op een later tijdstip; 8. lokale ondersteuning, die praktisch is en voor handen als de onderzoekers deze wenst. Opvallend is dat onderzoekers veel minder interesse hebben in duurzame archivering van hun data na afloop van het onderzoek.82 Toch wensen ze wel controle over de data, wanneer deze voor herge-bruik aan derden worden verstrekt. Feijens laatste conclusie luidt dan ook, dat het bewaren van on-derzoeksdata na afronding van het onderzoek en na de publicatiefase alleen mogelijk is, wanneer tijdens de onderzoeksfase het beheer van de data goed geregeld is. Terecht pleit Feijen voor beter databeheer tijdens de onderzoeksfase om daarmee de kwaliteit van het duurzaam bewaren van data na afloop van het onderzoek te verhogen.

2.6 Het faciliteren van databeheer

Onderzoekers hechten groot belang aan goede ondersteuning bij het beheer van hun data tijdens de onderzoeksfase. Van wie denken onderzoekers deze ondersteuning te krijgen?

2.6.1 Lokale of externe opslag

In de vorige paragraaf werd reeds vermeld, dat onderzoekers bij voorkeur lokale ondersteuning wil-len. Feijen noemt daarnaast de mogelijkheid databeheer buiten de eigen organisatie bij een datacen-trum onder te brengen, maar spreekt geen speciale voorkeur voor lokaal of extern uit.83 Wel meldt Feijen uit een rapport uit 2010 van het Research Information Network, dat onderzoekers in het Ver-enigd Koninkrijk van mening zijn, dat bibliotheken weinig proactief zijn als het gaat om op hen toegespitste ondersteuning.84 Dat leidt in het rapport tot de aanbeveling aan bibliotheken om te gaan samenwerken met het onderzoekondersteuningsbureau, het zogeheten Research Support Office (RSO). Bibliotheken dienen ook hun voorzieningen voor de ondersteuning van onderzoekers te her-zien en speciale aandacht te geven aan het onderbrengen in faculteiten en onderzoeksgroepen van

82

Dat blijkt ook uit Amerikaans onderzoek onder faculteitsmedewerkers. Het duurzaam bewaren van datasets vindt circa 50% van de natuurwetenschappers en sociale wetenschappers erg belangrijk, terwijl van de gees-teswetenschappers maar 25% dit erg belangrijk vindt. Zie: Schonfeld en Housewright 2010: 22.

83

Feijen 2011: 30. Een nieuwe ontwikkeling is het beheren en gebruiken van onderzoeksdata via cloud compu-ting. Via een webapplicatie kan met de data gewerkt worden zonder dat op de lokale computer hard- en soft-ware nodig is. Zie het bericht ‘Putting research data into the cloud’, Research Information (april/mei 2011): 10. 84

(25)

informatiespecialisten met relevante kennis van en ervaring in het betreffende onderzoeksterrein.85 Uit een ander Brits onderzoek van de UK Research Data Service (UKRSD) blijkt, dat wetenschap-pers juist van de bibliotheek en/of de ICT-afdeling de noodzakelijke ondersteuning verwachten.86

Fischer en Zigmond wijzen op een aantal mogelijkheden om het delen van data door weten-schappers te vergemakkelijken. Zo dienen wetenweten-schappers data delen als een vanzelfsprekend on-derdeel van hun onderzoekspraktijk te zien en dienen organisaties als universiteiten en subsidiever-leners geld en menskracht beschikbaar te stellen.87 Zij geven echter niet aan welke personen onder-zoekers zouden moeten ondersteunen. In een reactie op hun artikel geeft Giffels wel een antwoord. Hij stelt voor gebruik te maken van de reeds beschikbare informatieprofessionals en bibliothecaris-sen om onderzoekers te ondersteunen in het beheren en beschikbaar stellen van hun data. Bibliothe-carissen hebben de expertise om de waarde van gegevens en informatie te beoordelen. Zij weten immers hoe ze collecties moeten beheren en dwarsverbanden tussen collecties moeten leggen. Eveneens hebben zij kennis van het zorgvuldig archiveren van informatiematerialen, zodat deze nu en in de toekomst beschikbaar blijven. Voor wat betreft de technische ondersteuning is samenwer-king met ICT-afdelingen onmisbaar.88

2.6.2 Met onderzoeksdata verrijkte publicaties

Digitale datasets kunnen als zelfstandige eenheid lokaal in een bibliotheek of datacentrum of extern in een data-archief opgeslagen en beschikbaar gesteld worden. Datasets kunnen echter ook onderdeel van een publicatie zijn. Er zijn ook dan twee opslagmogelijkheden, namelijk lokaal in het repository van de universiteitsbibliotheek en extern bij wetenschappelijke uitgevers.

Een online publicatie met een dataset wordt een verrijkte publicatie genoemd. Naast onder-zoeksdata kunnen publicaties als boeken en artikelen verrijkt worden met delen van het onderzoek zelf, procesbeschrijvingen, beeldmateriaal, links naar internetbronnen en commentaren.89 Naast de reeds genoemde voordelen van het delen van data90 biedt een verrijkte publicatie in het bijzonder de mogelijkheid de onderzoeksoutput, zoals een dissertatie of een wetenschappelijk artikel, te publice-ren in samenhang met de onderliggende onderzoeksdata. Onderlinge relaties tussen meerdere publi-caties van onderzoekers, die dezelfde dataset hebben gebruikt worden op deze wijze inzichtelijk gemaakt. Deze verbanden kunnen grafisch weergeven worden, waardoor het mogelijk wordt ‘te bla-deren door een netwerk van wetenschappelijke kennis’.91

Zowel in Nederland als in Europees verband zijn de afgelopen jaren projecten gestart om het koppelen van publicaties en onderzoeksdata technisch en organisatorisch mogelijk te maken.

85

RIN 2010: 21. 86

Beagrie, Beagrie en Rowlands 2009. Zie ook: http://www.ukrds.ac.uk. 87

Fischer en Zigmond 2010: 795-797. 88

Giffels 2010: 802. 89

Van Westrienen e.a. 2010: 10. 90

Zie paragraaf 2.5.2. 91

(26)

foundation ondersteunt en financiert sinds 2007 enkele daarvoor bedoelde projecten in Nederland.92 In Europees verband heeft het project DRIVER - Digital Repositories Infrastructuur Vision for Eu-ropean Research - in 2007 een infrastructuur voor repositories ontwikkeld.93 In 2009 is de tweede fase van het project DRIVER II uitgevoerd, waarin de enhanced publication speerpunt was. De re-sultaten van dit project met betrekking tot verrijkte publicaties zijn uitvoerig in een drietal rapporten gepubliceerd.94

De grote aandacht voor de voordelen van verrijkte publicaties heeft inmiddels geleid tot de vanzelfsprekendheid, dat de wetenschappelijke publicatie en de onderliggende onderzoeksdata bij elkaar horen.95

2.7 Conclusies

Binnen elke wetenschapsdiscipline zijn digitale onderzoeksdata inmiddels niet meer weg te denken. Zowel in de alfa- als bèta en gammawetenschappen wordt onderzoek verricht met grote hoeveelhe-den digitale onderzoeksgegevens. De explosieve groei van het data-intensieve onderzoek wordt wel omgeschreven als de data deluge.

Hoewel de wijze waarop onderzoeksdata worden verzameld per discipline sterk kan ver-schillen, kunnen een aantal aan onderzoeksdata gerelateerde discipline-overschrijdende aspecten worden onderscheiden. Zo is voor het opslaan en beheren van digitale onderzoeksdata een goede organisatorische structuur van groot belang om data duurzaam te bewaren en voor hergebruik be-schikbaar te houden. Een ander aspect is de waardering en selectie van onderzoeksdata. Het bewaren van onderzoeksdata is vaak verplicht gesteld door ondermeer de onderzoeksfinancier en nodig in het kader van verificatie van onderzoek. Ook zijn data met het oog op wetenschapshistorisch onderzoek te beschouwen als cultureel erfgoed. Dat vergt een goede kwaliteitszorg bij zowel het produceren van data tijdens het wetenschappelijk onderzoeksproces als bij het achteraf beoordelen van de we-tenschappelijke waarde van data. Het technische aspect heeft met name betrekking op het zorgdra-gen voor een goede en betrouwbare technische infrastructuur en het ontwikkelen van standaarden. Op juridisch vlak zijn intellectuele eigendomsrechten en privacy de belangrijkste aspecten.

Ook al zijn goede faciliteiten gerealiseerd om datasets op te slaan en te beheren, toch hou-den wetenschappers bezwaren tegen het beschikbaar stellen van hun data voor met name hergebruik. Deels heeft dat te maken met het zelf eerst profijt willen hebben van de data in de vorm van publica-ties en credits. Ook kan het onderzoekers aan tijd en geld ontbreken om data voor hergebruik toe-gankelijk te maken. Zij beschouwen zich vaak als eigenaar van de data of menen dat in verband met de vertrouwelijkheid en privacygevoeligheid het beschikbaar stellen van hun data aan anderen niet

92

http://www.surffoundation.nl/verrijktepublicaties (geraadpleegd 9 april 2011). 93

http://www.driver-repository.eu/. 94

Van Godtsenhoven e.a. 2009; Van der Graaf 2009; Woutersen-Windhouwer e.a. 2009. 95

(27)

mogelijk is. Geconstateerd kan worden dat voor het delen van data onder wetenschappers een cul-tuuromslag nodig is.

Wetenschappers hechten echter wel degelijk belang aan goed databeheer. Het gaat daarbij met name om het opslaan en beschermen van de data, die ze dagelijks tijdens het verrichten van onderzoek gebruiken. Daarnaast willen zij controle houden over de data door op de hoogte te zijn van wie hun gegevens gebruikt en onder welke voorwaarden. Wetenschappers eisen daarom lokale ondersteuning met gebruikersvriendelijke tools en diensten afgestemd op hun werkprocessen en altijd voor handen zonder verplichting. Zij moeten er van op aan kunnen dat de beheerder van hun datasets hun belangen respecteert en hen controlemogelijkheden biedt over hun onderzoeksdata.

Als lokale beheerder van onderzoeksdata kan binnen de universiteit de bibliotheek of een datacentrum een bijdrage leveren. Wetenschappers verwachten ook van de bibliotheek een actieve rol ten aanzien van databeheer. Bibliotheken kunnen mede op basis van hun expertise met het behe-ren en beoordelen van grote hoeveelheden gegevensbestanden ondersteuning bieden op het gebied van databeheer, waarbij samenwerking met afdelingen ICT onmisbaar is. Andere opties zijn externe opslag bij een data-archief of als onderdeel van een verrijkte publicatie.

(28)

3 ONTWIKKELINGEN IN WETENSCHAPPELIJKE BIBLIOTHEKEN

3.1 Inleiding

In dit hoofdstuk worden de ontwikkelingen in wetenschappelijke bibliotheken vanaf de jaren zestig van de twintigste eeuw geschetst. De toen ingezette veranderingen hebben bibliotheken sindsdien voortdurend gestimuleerd tot herbezinning op hun positie in de academische wereld.

Na een korte historische schets komen achtereenvolgens technologische ontwikkelingen als digitalisering, repositories en virtuele kenniscentra aanbod. Uitgebreider aandacht wordt besteed aan de universiteitsbibliotheek in relatie tot onderzoeksdata en de daaruit voortvloeiende rol voor de data librarian. Doel van dit hoofdstuk is om aan te tonen, dat de rol die wetenschappelijke bibliothe-ken kunnen spelen in de levenscyclus van digitale onderzoeksdata even natuurlijk als vanzelfspre-kend is.

3.2 De historische ontwikkeling van de universiteitsbibliotheek

Bibliotheekhistoricus Schneiders constateert, dat vanaf het midden van de jaren zestig van de vorige eeuw het wetenschappelijk bibliotheekwezen zich in een permanente staat van verandering be-vindt.96 Vanaf deze periode begon ook de automatisering in bibliotheken ingang te vinden. Admini-stratieve processen als acquisitie, catalogisering en uitlening werden geautomatiseerd.97

De jaren zestig kenmerken zich nog door een sterke focus op collectievorming. Op 2 mei 1960 hield L. Brummel zijn inaugurele rede Bibliotheek, wetenschap en bibliotheekwetenschap, waarmee hij als eerste het ambt van bijzonder hoogleraar in de bibliotheekwetenschap aan de Uni-versiteit van Amsterdam aanvaardde. Brummel beschouwde collectievorming als de belangrijkste en primaire taak van de wetenschappelijke bibliotheek. Hij citeert een verzamelaar, die ooit - vrij naar een Bijbeltekst over geloof, hoop en liefde - schreef: ‘Collecting, libraries, publication, those three, and first of these - without wich the other two would not exist - is collecting’.98 Brummel meent, dat een bibliothecaris met zijn aankoopbeleid het wetenschappelijk onderzoek vóór moet zijn, dat wil zeggen met vooruitziende blik literatuur verzamelen in de hoop, dat deze in de toekomst gebruikt zal gaan worden.

In 1965 verscheen Libraries of the future van J.C.R. Licklider, waarin deze een vervanging van het document door gedigitaliseerde informatie voorzag. Hij ging daarbij uit van de toekomstige informatiebehoefte van de wetenschapper. Licklider stelde dat ‘if the human interaction with the body of knowledge is conceived as a dynamic process involving repeated examinations and 96 Schneiders 1998: 36. 97 Klugkist 1989: 119. 98 Brummel 1960: 12.

Referenties

GERELATEERDE DOCUMENTEN

This approach showed that the standstill in the decrease of the numbers of fatalities and serious road injuries is most prominent for the follow- ing groups of road users:.. •

Voor dit onderzoek is gekozen voor een benadering waarbij een conservatieve schatting wordt gemaakt van het aantal databases waarin de gemiddelde Nederlander

In Table 6 vowels are epenthesised word-finally to remove syl- lable codas, since Shona native phonology does not allow them. It is interesting to note that in four of the

How do residents respond to the territorial stigmatisation of their neighbourhood and what is, according to them, the impact of area-based policy on the neighbourhood’s reputation..

This method is aimed to enhance sensemaking on both the consequences of future uncertainties on the organisation which influences real estate management, and on the types

Children living in poor communities, such as the community in North West province where this research was done, face challenges regarding their safety, poverty and limited

Deze correctie is voor de Nederlandse gegevens (nog) niet toegepast, omdat het aantal gemiste vangrondes in geldige seizoenen klein is en omdat de verhouding tussen de aantallen