• No results found

Archief in bewerking: een constante factor in de netwerkmaatschappij

N/A
N/A
Protected

Academic year: 2021

Share "Archief in bewerking: een constante factor in de netwerkmaatschappij"

Copied!
57
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Archief in bewerking: een constante factor in de

netwerkmaatschappij

Een onderzoek naar Social Tagging als web 2.0 instrument bij de ontsluiting, het beheer en de toegankelijkheid van archieven

Boy Gerrits

Chaussee des Grenadiers 73 Masterscriptie

B-4690 EBEN-EMAEL Master Archiefwetenschap

06-13633348 Universiteit van Amsterdam

boygerrits@icloud.com Eben-Emael, 21 november 2013

(2)

Inhoudsopgave

Inleiding 3 2. Onderzoeksopzet 5 2.1 Probleemstelling 5 2.2 Onderzoeksvraag 9 2.3 Methode 10

3. Het toegankelijkheidsbegrip in een archiefwetenschappelijke context 14

3.1 Toegankelijkheid van informatie 14

3.2 Toegankelijkheid in historisch perspectief 16

3.3 Nieuwe inzichten binnen het discours 19

4. Toegankelijkheid in de netwerkmaatschappij 22

4.1Archieven in de search engine society 22

4.2 Retrieval in het web 2.0 25

4.3 Heterogene collectiebeheersystemen 27

5. Social Tagging als web 2.0 instrument 31

5.1 Definities en dimensies 31

5.2 Aspecten en gebruik 33

5.3 Toepassingen 36

6. Social Tagging en cultureel erfgoed 38

6.1 Web 2.0 instrumenten en archieven 38

6.2 Toegepast onderzoek 40

6.3 Negatieve aspecten Social Tagging 46

7. Discussie Social Tagging en archieven 49

7.1 Archieven en social media 49

7.2. Relevante aspecten Social Tagging 49

7.3 Social Tagging als complementaire context van archieven 51

8. Conclusie en aanbevelingen 52

(3)

Inleiding

“De gebruiker stuurt de toegang maar de toegang stuurt ook het gebruik”1 (Thomassen et al., 2001)

Het archiefwezen in Nederland kent een rijke en diepgewortelde traditie in het toegankelijk maken van blijvend te bewaren informatie als kennisbron voor de samenleving. Met de komst van de Handleiding eind negentiende eeuw voor het ordenen en beschrijven van archieven was de eerste codificatie van de moderne archiefwetenschap een feit.2 Tot op de dag van vandaag hanteert het archiefwezen de archiefconcepten uit die Handleiding. Inventarissen worden tegenwoordig nog altijd opgesteld vanuit de grondgedachte dat een archief wordt beschreven “door ze [registers, liassen en bundels] eenvoudig in de volgorde hunner plaatsing te vermelden en zonder de daarin voorkomende stukken afzonderlijk bekend te maken”.3 Met de komst van de handleiding werd eind negentiende eeuw definitief afscheid genomen van het ontsluiten van de inhoud van archieven door archivarissen. De kern van een inventaris

bestond eruit om op een overzichtelijke wijze de structuur en de ordening van archieven weer te geven. De beschrijving van het archiefstuk vormde een stabiele factor met authentieke en integere contextgegevens als metadata.

In de huidige digitale informatiemaatschappij is de maatschappelijke vraag naar integere en betrouwbare informatie bijzonder groot. Stabiele factoren zijn schaars geworden in de online dynamiek. De immense volumes beschikbare informatie via internet, maakt de behoefte aan betrouwbare informatie nog groter. Internet is uitgegroeid tot het centrale platform waarop informatiebehoeften vanuit de samenleving worden bevredigd. Deze nieuwe wijze van kennisvergaring heeft consequenties voor de traditionele ‘instituties van kennis’ zoals

bibliotheken, archieven en musea. Wil men de collecties van deze traditionele instellingen als informatie- en kennisbron aanbieden aan het publiek, dan zal dat vooral moeten plaatsvinden via het internet. Archiefinstellingen hebben om die reden de inventarissen van hun collecties via websites toegankelijk gemaakt via internet. Hiermee wordt aan het publiek betrouwbare en integere informatie gedeeld over de collecties archieven in beheer. Een steeds groter

1

Thomassen, T., Duits, H., Stroet, J., Vijn, A. Vuuren van, R. (2001). Archiefontsluiting vanuit de context. In:

Toegang. Ontwikkelingen in de ontsluiting van archieven. SAP Jaarboek 2001.

2

Horsman, P.J., Ketelaar, F.C.J., Thomassen, T.H.P.M. (1998). Tekst en context van de handleiding voor het

ordenen en beschrijven van archieven van 1898. Hilversum: Verloren. Inleiding.

3

(4)

wordend probleem is echter dat de informatie over archiefcollecties moeilijk vindbaar is via internet. Fysieke toegankelijkheid is wezenlijk anders dan digitale toegankelijkheid via internet. Zoeken en vinden via internet is letterlijk hogere wiskunde. Doordat zoekmachines efficiënte algoritmen gebruiken om informatiebehoeften direct te bevredigen door in relevante zoekresultaten te voorzien, is de samenleving gewend geraakt aan deze vorm van informatie- en kennisvergaring via internet. De gebruiker wordt in de informatiesamenleving op zijn wenken bedient; men spreekt dan ook over de democratisering van informatie. De

samenleving eist betrouwbare informatie van de traditionele kennis-, overheid-, en media-instituties die vervolgens in een nieuwe context kan worden (her)gebruikt. De digitale toegankelijkheid van archiefcollecties is afhankelijk geworden van factoren die buiten de traditionele scope van de archiefwetenschap of het archiefwezen liggen. Bijvoorbeeld: de onderzoeksresultaten uit de wetenschappelijke discipline van het zoeken en vinden van informatie via internet, information retrieval, zijn relevant voor de vraagstukken van toegankelijkheid in de archiefwetenschap.

Binnen het archiefwezen en de archiefwetenschap zijn nieuwe paradigma’s ontstaan die antwoorden trachten te verschaffen op digitale toegankelijkheidsvraagstukken. Want hoever moet een archiefinstelling gaan in het digitaal toegankelijk maken van zijn archiefcollecties? Deze scriptie gaat dieper in op die vraag met een technologische innovatie, Social Tagging, als lijdend voorwerp. Deze innovatie is ontstaan door de doorontwikkeling van internet en wordt sinds tien jaar ingezet door erfgoedinstellingen bij het beheer, het ontsluiten en de toegankelijkheid van erfgoedcollecties. In deze scriptie wordt aan de hand van een

literatuuronderzoek een overzicht gegeven van de eigenschappen, functies, kenmerken, voor- en nadelen van Social Tagging. Uiteindelijk zal worden getracht inzicht te verschaffen of Social Tagging ook ingezet zou kunnen worden bij de ontsluiting, het beheer en de toegankelijkheid van archieven voor de samenleving.

(5)

2. Onderzoeksopzet

"All that is solid melts into air, all that is holy is profaned.”4

2.1 Probleemstelling

Deze scriptie gaat over de toegankelijkheid van archieven en hoe deze wordt beinvloed door fundamentele maatschappelijke veranderingen. Door de informatie- en communicatierevolutie (ICT-revolutie) leven we, volgens de wereldbefaamde socioloog Manuel Castells, in een nieuwe maatschappij waar de meeste burgers functioneren in een combinatie van analoge, maar bovenal digitale en internationale sociale netwerken.5 Aan het einde van de twintigste eeuw is hierdoor een nieuwe maatschappijvorm ontstaan: de netwerkmaatschappij. De belangrijkste ‘grondstof’ van deze samenleving wordt gevormd door informatie:

“Our world, and our lives, are being shaped by the conflicting trends of globalization and identidty. The information technology revolution, and the restructuring of capitalism, have induced a new form of society, the network society.” (Castells, 1997)

De complexe informatiestromen binnen de huidige netwerkmaatschappij zijn nagenoeg geheel digitaal en vinden plaats via internet.6 Het internet is het platform geworden waar een steeds groter gedeelte van onze communicatie en informatievergaring plaatsvindt. De omvang van de informatiestromen zijn tot een dermate schaal gegroeid dat relevante informatie enkel gevonden kan worden met behulp van ingewikkelde algoritmen en indexeringen die worden gecreëerd door zoekmachines, zoals Google en Bing.7 Zonder de tussenkomst van

commerciële zoekmachines, is het haast onmogelijk geworden om relevante informatie te vinden via het internet. Zoekmachines zijn ontwikkeld tot uiterst efficiënte makelaars van informatie, die goed in staat blijken te zijn om de menselijke informatiebehoefte te

bevredigen, gezien de stijging van het aantal gebruikers van zoekmachines. Een effect daarvan is een maatschappelijke verwachting dat voorheen niet op trefwoord doorzoekbare datacollecties, nu wel zijn uitgerust met een laagdrempelige zoekfunctie die zoekmachines

4

Marx & Engels (1848). Communist Manifesto.

5

Castells, M. (1997). Vol. 2: The power of identity. Oxford Press. P. 1f.

6

Westpalm van Hoorn, N., Waters, P. & Wisse, P. (2011). Interoperabel Nederland. Forum Standaardisatie.

7

De hoeveelheid data op internet is niet bekend. Ook het aantal geïndexeerde data door zoekmachines zijn schattingen: de zoekmachine Google heeft circa 40 miljard webpagina’s geïndexeerd (volgens

www.worldwidewebsize.com). Dit vormt slechts 20% van het totale internet dat wordt doorzocht door zoekmachines (Ratzan, L. (2006). Mining the deep web: search strategies that work. In: Computerworld, december II.

(6)

gebruiken.8 Bijvoorbeeld telefoonnummers of adresgegevens was voor de komst van internet alleen door middel van een telefoonboek of via betaalde telefonische diensten te verkrijgen. Via het gratis verstrekte telefoonboek kon men per gemeente en per familienaam en

voorletters het juiste telefoonnummer vinden, binnen een bepaald gebied. Nu is de

samenleving gewend geraakt aan het idee dat dat soort datacollecties eenvoudig door middel van een trefwoord (familienaam of bedrijfsnaam) doorzoekbaar zijn en dat een zoekmachine binnen een aantal seconden het gezochte telefoonnummer gegenereerd. Zoekmachines worden steeds machtiger en gaan steeds meer winst maken uit adverteren als het aanbod van informatie via internet toeneemt en de gebruikers evenredig toenemen. Hoe groter de schaal van de te doorzoeken data, hoe meer de mens afhankelijk wordt van zoekmachines voor de bevrediging van haar informatiebehoefte. De grootste en meest snelgroeiende zoekmachine is Google; de Oxford English Dictionary heeft “to google” zelfs opgenomen als werkwoord en vertaald met: “to search for information about (a person or thing)”.9 Zoekmachines staan steeds meer synoniem voor ‘informatie zoeken en vinden’.

Met de komst van de netwerkmaatschappij eind twintigste eeuw, ontstond parallel hieraan het zogenaamde internet 1.0. Deze eerste vorm van internet werd vooral gekenmerkt door de voortzetting van de typische pre-internet wijze van informatieaanbod: eenzijdig en passief te consulteren door de gebruiker. De grootste expansie van de informatiestromen die beschikbaar kwamen via internet, ontstond met de komst van internet 2.0. In plaats van passieve consultatie van informatie, is de kern van web 2.0 dat informatie wordt verrijkt, bewerkt, doorgestuurd, gedeeld en herbewerkt in sociale netwerken. Binnen deze patronen vindt een voortdurend proces van hercontextualisatie van informatie plaats. Met

hercontextualisatie wordt bedoeld dat bestaande informatie wordt voorzien van een nieuwe context telkens als deze wordt verrijkt, doorgestuurd, gedeeld, bewerkt of herbewerkt. Met elke bewerking van informatie of handeling door gebruikers binnen sociale netwerken op internet, wordt als het ware een nieuwe betekenislaag toegevoegd aan de informatie. De gebruiker is de voornaamste producent van informatie aan het begin van de eenentwintigste eeuw. En hoe meer data gebruikers verwerken en bewerken, hoe sterker de relatie wordt tussen de mate van toegankelijkheid van informatie en de afhankelijkheid van zoekmachines. Meer en meer wordt er derhalve gesproken over de search engine society, als metafoor voor de evoluerende netwerkmaatschappij. De doorontwikkeling van web 2.0 komt momenteel in een stroomversnelling, want door de toegenomen socialisering op het internet is het

8

Halavais, A. (2009). Search engine Society. Digital media and society series. Cambridge: Polity Press. P. 10.

9

(7)

zogenaamde semantische web of web 3.0 binnen handbereik. In deze virtuele omgeving staat de gebruiker in zijn sociale omgeving nog meer centraal dan in web 2.0:

“It is likely that search will continue to become more closely tied to social relationships, moving to provide information not only about text, but about people who may have the expertise a searcher is seeking”10

Het pre-internet tijdperk wordt veelal geassocieerd met het concept dat er een aanbieder is van informatie (gevestigde instituties) en de gebruiker die het tot zich kan nemen. Een groot deel van het huidige archiefwezen is nog steeds ingericht op basis van zo een eenzijdig

aanbodconcept. Sinds de komst van de netwerkmaatschappij is deze inrichting steeds problematischer geworden voor de klassieke archiefinstellingen. Archiefinstellingen weten namelijk niet goed hoe ze naast de traditionele communicatiekanalen, in contact kunnen treden met de web 2.0 gebruikers. Ook worstelen archiefinstellingen met de vraag of de context van archieven nog wel met de klassieke ontsluitingsvorm van de traditionele inventarissen voldoende is om gevonden te worden in de huidige search engine society. Ik bedoel hiermee aan te geven dat de huidige ontsluiting van archieven door middel van het opstellen van inventarissen vanuit de traditie stamt waarin de toegankelijkheid van archieven werd bepaald door de logisch ordening van de archiefbescheiden in hun fysieke

omstandigheden. Het is maar de vraag of deze traditionele ontsluitingsvormen voldoende zijn in een virtuele 2.0 of web 3.0 omgeving. Want informatie, en dus ook die uit - of over

archiefbronnen, is gedemocratiseerd geraakt en wordt geacht toegankelijk te zijn voor de archiefgebruikers via de zoekmachines die binnen het wereldwijde web actief zijn.11 Hiermee heeft het er alle schijn van dat de staat van de toegankelijkheid van archieven, een

kernconcept binnen het archiefwezen en de -wetenschap, in correlatie is met de mate van vindbaarheid en gebruik ervan via internet. De veranderde wijze van kennisvergaring binnen de netwerkmaatschappij heeft fundamentele implicaties binnen de archiefwetenschap en de praktijk van het ontsluiten, beheren en toegankelijk maken van archieven door

archiefinstellingen. Binnen de archiefwetenschap zijn hierdoor nieuwe paradigma’s ontwikkeld die hebben gezorgd voor nieuwe benaderingen in vraagstukken omtrent het beheer, de ontsluiting en de toegankelijkheid van archieven, omdat de voorheen geldende paradigma’s onvoldoende verklaringen konden genereren binnen de huidige

10

Halavais, A. (2009). Search engine Society. Digital media and society series. Cambridge: Polity Press. P. 9.

11

(8)

netwerkmaatschappij. De klassieke verhoudingen tussen de archiefinstelling en de

archiefgebruiker zijn dermate veranderd met de komst van de netwerkmaatschappij, dat vele archiefwetenschappers en archivarissen redeneren vanuit het non-custodiale paradigma. In het pre-internet tijdperk waren cultureel erfgoed collecties toegankelijk door een bibliotheek, museum of archiefinstelling (fysiek) te bezoeken. Met de digitalisering van archieven, werden foto's en documenten uit archiefbronnen beschikbaar gesteld aan archiefbezoekers via

internet. Beschrijvingen van cultureel erfgoed, waaronder ook archieven, worden gekenmerkt door de strikte hantering van formele classificatieschema’s of ontologieën. Deze worden vervolgens beheerd in database-achtige collectiebeheersystemen, waarbij de kwaliteit van de beschrijvingen van cultureel erfgoed consistent moet zijn. Dat is belangrijk omdat het zoeken in een database-achtige omgeving vereist dat de beschrijvingen overeen moeten komen met de termen uit een query. Bij een andere manier van zoeken, namelijk in tekstdocumenten, worden door middel van inzichten uit information retrieval bepaald welke zoekresultaten relevant zijn voor de ingevoerde zoektermen op basis van precision en recall. De laatste twee termen en information retrieval zullen uitgebreid aan bod komen in het tweede hoofdstuk. Bij een zoekresultatenlijst dat met behulp van full-text retrieval tot stand is gekomen, staan de meest relevante zoekresultaten bovenaan en de minst relevante onderaan. Met deze

information retrieval technieken bepalen zoekmachines ook de relevantie van zoekresultaten voor de gebruiker. Een nadeel van zoeken in een database dat deze slechts een honderd procent relevant zoekresultaat kent. Dat gegeven zorgt ervoor dat zoeken in database-achtige omgevingen veel potentieel relevante informatie per definitie niet zal genereren omdat er geen exacte match plaatsvindt met de zoekterm.

Voor het zoeken en vinden in database omgevingen waarin archieven worden beheerd is het belangrijk dat de beschrijvingen van hoge kwaliteit zijn. Hiervoor heeft het

archiefwezen beschrijvingsstandaarden ontwikkeld. In deze standaarden staat voorgeschreven hoe beschrijvingen moeten worden opgesteld en met welk vocabulaire. Het consistent gebruik van dit soort controlled vocabularies blijkt in de praktijk van het beschrijven van archieven lastig uit te voeren, omdat het een zeer tijdrovende bezigheid is waar vaak onvoldoende financiële middelen voor beschikbaar zijn. Ook worden door musea, bibliotheken en archiefinstellingen verschillende standaarden gebruikt voor het beschrijven van cultureel erfgoed.12 De hierboven beschreven kenmerken van archiefcollecties zijn typerend voor het klassieke, heterogene karakter van de toegankelijkheid van archieven. In hoofdstuk 2 zal deze

12

Koolen, M., Kamps, J., Keijzer de, V. (2009). Information Retrieval in Cultural Heritage. In: Interdisciplinary

(9)

problematiek uitvoerig aan bod komen, maar voor de probleemstelling is het belangrijk om te begrijpen dat de taal van de informatie experts, zoals archivarissen, slecht aansluit bij de taal van de gebruikers (controlled vocabularies versus user vocabularies).

Tegen deze achtergrond wordt in de volgende paragraaf de relatie geproblematiseerd tussen de huidige wijze van informatievergaring in de netwerkmaatschappij en de gevolgen voor de ontsluiting, het beheer en de toegankelijkheid van archieven.

2.2 Onderzoeksvraag

Het doel van deze scriptie is inzicht bieden in bepaalde aspecten van de ontsluiting, het beheren en de toegankelijkheid van archieven binnen de huidige web 2.0 omgeving. Hiervoor heb ik gekozen om de toegankelijkheidsaspecten van archieven vanuit een multidisciplinaire invalshoek te benaderen. Met name de inzichten uit (deel)disciplines, zoals information retrieval, technologie- en mediastudies, maar ook cultuurwetenschappen, zijn van belang om (sociale) mechanismen binnen de netwerkmaatschappij bloot te leggen die vervolgens van invloed zijn op de toegankelijkheid van archieven. Om die reden worden publicaties uit diverse disciplines gebruikt in deze scriptie, weliswaar benaderd vanuit het perspectief van de archivaris. Het is geenszins de intentie om een coherent sluitende these te presenteren over de ideale wijze van het ontsluiten en beheren van archieven; het doel van deze scriptie is enkel om inzicht te bieden en het begrijpelijk te maken dat toegankelijkheid van archieven in de netwerkmaatschappij complex is en geassocieerd is met vele factoren die traditioneel niet binnen de grenzen van de archiefwetenschap en het archiefwezen liggen. Het enige wat deze scriptie beoogt is het expliciteren van de huidige situatie en het (h)erkennen van de eventuele mogelijkheden die web 2.0 tools, met name Social Tagging instrumenten, kunnen bieden bij het ontsluiten, het beheren en toegankelijk maken van archieven. Hierbij worden publicaties uit verschillende wetenschappelijke disciplines geanalyseerd door middel van een

literatuurstudie. Publicaties die aanknopingspunten zouden kunnen bieden voor een interdisciplinaire dialoog en het herkennen van raakvlakken. Vanuit de wetenschappelijke discipline information retrieval is een oproep gedaan om met archiefwetenschappers meer samen te werken in de benadering van toegankelijkheidsvraagstukken in het domein van cultureel erfgoed.13De interdisciplinaire benadering in deze scriptie kan aanleiding vormen

13

Koolen, M., Kamps, J., Keijzer de, V. (2009). Information Retrieval in Cultural Heritage. In: Interdisciplinary

(10)

voor diepere reflectie en het ontdekken van nieuwe parallellen tussen verschillende disciplines.

De onderzoeksvraag luidt:

Hoe kunnen archieven (aanvullend) ontsloten, beheerd en toegankelijk worden gemaakt met de inzet van het web 2.0 instrument social tagging?

Deze onderzoeksvraag is op te splitsen in een aantal deelvragen:

 Welk archiefwetenschappelijk debat wordt er op dit moment gevoerd met betrekking tot de concepten en theoretische modellen die gemoeid zijn bij het ontsluiten, beheren en toegankelijk maken van archieven?

 Hoe vindt het ontsluiten, beheren en toegankelijk maken van archieven plaats en hoe verhoudt zich deze praktijk tot de wijze van informatievergaring via internet?  Welke inzichten en onderzoeksresultaten uit andere disciplines zijn relevant voor

de ontsluiting, beheer en toegankelijkheid van archieven vanuit het perspectief van een archivaris?

 Wat zijn de eigenschappen en kenmerken van Social Tagging en wie gebruiken het?

 Hoe functioneert Social Tagging en wat zijn de voor- en nadelen als web 2.0 tool bij de ontsluiting, het beheer en het toegankelijk maken van cultureel erfgoed?

De onderzoeksvraag zal in de volgorde van de deelvragen worden beantwoord in deze scriptie. In deze scriptie wordt niet expliciet voortgebouwd op bestaand onderzoek, maar er wordt aan de hand van literatuurstudies een inzicht gegeven in aspecten, dimensies en

achtergronden van de toepassing van het web 2.0 instrument Social Tagging bij het ontsluiten, beheren en toegankelijk maken van cultureel erfgoed.

2.3 Methode

In de vorige paragraaf beschreven onderzoeksvraag en de deelvragen gaan onderzocht worden aan de hand van een literatuurstudie. Een archiefwetenschappelijke benadering van de

ontsluiting, het beheer en de toegankelijkheid van archieven begint met de afbakening en de definiëring van het concept toegankelijkheid. Volgens de Nederlandse Archiefterminologie uit 1962 is de definitie van toegankelijkheid van archieven: “een toestand, waarbij die

(11)

archieven zodanig zijn geordend en van ingangen voorzien, dat zij kunnen worden geraadpleegd.”14 In deze definitie ging men uit van fysieke, analoge raadpleging van archieven. Uit de Archive Service Accreditation Glossary van de National Archives van het Verenigd Koninkrijk is ‘Acces’ als volgt omschreven: “Right, opportunity or means of

finding, using or approaching items and/ or information about items.” Beide definities, zowel de Nederlandse als de Britse gelden onverminderd in de huidige tijd nog steeds, met dien verstande dat “raadpleging” en “means of finding, using or approaching (…)” als gebruik(en) een fundamentele verandering heeft ondergaan sinds de opkomst van de

netwerkmaatschappij. De conclusie van een studie van de National Archives bevestigd dat deze gebruikersverandering van de raadpleging ook gevolgen heeft voor de toegankelijkheid van archieven:

“ ‘ (…) that people have come to expect information to be accessible online, at all times, and their approach to archives is no different. It is essential that the archives sector is able to respond to this challenge and continues to increase the proportion of records that are accessible online.’”15

De essentie van de verandering dat het begrip toegankelijkheid heeft ondergaan, is dat archieven niet alleen fysiek kunnen worden geraadpleegd, maar bovenal virtueel mits deze online toegankelijk zijn. Het bovenstaande citaat toont ook aan dat, vanuit een sociaal-maatschappelijke perspectief, toegankelijkheid niet alleen een technische kwestie is (zoals in de definitie uit 1962), maar ook een sociaal-culturele kwestie. Want in de huidige

netwerkmaatschappij, met haar nauwelijks te bevatten hoeveelheid informatie dat toegankelijk is via internet, veranderen culturele gebruiken, met name, de wijze van informatie waarderen en vergaren.16 Dit heeft ertoe geleid dat informatie een dagelijks gebruiksitem is geworden, dat constant en massaal wordt gebruikt en hergebruikt afhankelijk van de individuele context. Deze notie is problematiserend voor de ontsluiting, het beheer en de toegankelijkheid van archieven:

14

Nederlandse archiefterminologie / door J.L. van der Gouw, H. Hardenberg, W.J. van Hoboken en G.W.A. Panhuysen - Zwolle : Tjeenk Willink, 1962.

15

National Archives (2009a). Archives for the 21st century, Consultation Draft, retrieved, juni 2013, from:

http://www.nationalarchives.gov.uk/documents/information-management/archives-for-the-21st-century.pdf

16

Convery, N. (2012). Information management, records management, knowledge management: the place of archives in a digital age. In: Hill, J. (2012). The future of archives and recordkeeping. A reader. London: Facet Publishing. P. 192.

(12)

“(…) postmodern multiplicity of information contexts generated through a search for individualism and identity challenges the defining archival practices of appraisal, preservation and acces.”17

In deze scriptie worden de deelvragen vanuit het problematische archiefwetenschappelijke concept ‘toegankelijkheid’ benaderd. Het archiefwetenschappelijke debat, met name de grenzen en relaties tussen opeenvolgende paradigma’s zullen onderzocht worden door de publicaties van archiefwetenschappers te analyseren en te duiden. Hierin zullen vooral de tegenstellingen en overeenkomsten geanalyseerd worden tussen de archiefwetenschappelijke publicaties met een custodiaal karakter en die met een non-custodiale of postcustodiale benadering van de toegankelijkheid van archieven. Bij de bestudering van publicaties uit andere disciplines zal met name binnen de information retrieval gezocht worden naar nieuwe invalshoeken die zijn ontstaan in de afgelopen decennia door een sterke toename van

onderzoek dat heeft plaatsgevonden. Vooral naar de werking van information retrieval modellen en de toepassing ervan bij het toegankelijk maken van cultureel erfgoed, is veel onderzoek gedaan. Ik spreek bewust hier over cultureel erfgoed omdat toegepast onderzoek in het domein van archieven nauwelijks heeft plaatsgevonden. Bij de beantwoording van de onderzoeksvraag zal de literatuurstudie noodgedwongen verbreed worden tot de grenzen van cultureel erfgoed. De mechanismen en effecten van het te onderzoeken web 2.0 instrument Social Tagging kent geen grote verschillen bij de toepassing op museumcollecties,

bibliotheekcollecties of archiefcollecties. De gemeenschappelijke factor tussen

museumcollecties, bibliotheekcollecties en archiefcollecties is dat in alle drie de collecties (informatie)objecten worden voorzien van context door deze te beschrijven met metadata. Bij de beantwoording van de onderzoeksvraag is de aanwezigheid van deze gemeenschappelijke factor voldoende om de onderzoeksresultaten die worden geanalyseerd uit het brede domein cultureel erfgoed, te duiden vanuit een archiefwetenschappelijk perspectief. Vanwege de beperking van de afwezigheid van toegepast onderzoek met Social Tagging in archieven, zal in hoofdstuk 7 een uitgebreide discussie aan bod komen. In deze discussie zullen de

onderzoeksresultaten geëxtrapoleerd worden, met alle nodige nuanceringen, naar het domein van archieven. Bij de beantwoording van deelvraag vier focust de literatuurstudie zich op verbanden en relaties tussen de archiefwetenschappelijke literatuur, de wijze van ontsluiting,

17

Convery, N. (2012). Information management, records management, knowledge management: the place of archives in a digital age. In: Hill, J. (2012). The future of archives and recordkeeping. A reader. London: Facet Publishing. P. 192.

(13)

het beheer en de toegankelijkheid van archieven, en de bevindingen op dit gebied uit information retrieval, technologie- en mediastudies en cultuurwetenschappen. De laatste deelvragen behelzen een literatuurverdieping op Social Tagging aspecten binnen de hierboven genoemde wetenschappelijke disciplines. Bij de beantwoording van de laatste deelvraag zullen verschillende dimensies van Social Tagging aan bod komen vanuit een

interdisciplinaire benadering: naast de sociale dimensie, zullen ook onderzoeksresultaten worden geanalyseerd waarin experimenten zijn uitgevoerd waarbij Social Tagging ook als ontsluitingstool is ingezet. Met name de publicaties die betrekking hebben op het ontsluiten van beeldmateriaal met behulp van Social Tagging bieden hier aanknopingspunten voor. Maar ook andere dimensies zullen bij de beantwoording van de laatste deelvragen worden

geanalyseerd, zoals de relatie tussen information retrieval, Social Tagging en de

toegankelijkheid van cultureel erfgoed, maar ook onderzoeken met betrekking tot de typen gebruikers, alsook de kenmerken en eigenschappen van Social Tagging worden betrokken bij de beantwoording van de laatste twee deelvragen.

De literatuurstudies vormen het corpus van deze scriptie met als doel om de functies en de achtergrond van Social Tagging beter te doorgronden en te begrijpen, en inzichten te bieden hoe dit web 2.0 instrument in te zetten bij de ontsluiting, het beheer en de toegankelijkheid van archieven. Hierbij worden andere web 2.0 instrumenten zoals blogs of email niet behandeld in deze scriptie.

(14)

3 het toegankelijkheidsbegrip in een archiefwetenschappelijke

context

“Archive: the set of all events which can be recalled across time and space.” (Bowker, 2010)

3.1 Toegankelijkheid van informatie

Bovenstaande definitie van archieven geeft aan dat in een volledig (vooralsnog fictieve) gedigitaliseerde samenleving, de definitie van archieven haast grenzeloze proporties gaat aannemen. Als alle informatie digitaal zou zijn en van metadata kan worden voorzien, zou deze in principe door tijd en ruimte kunnen worden doorzocht en worden gevonden. Als daarbij ook nog eens de digitale opslagcapaciteit geen issue zou zijn, vervalt de noodzaak om informatie te waarderen en te selecteren. In zo een constellatie worden archieven niet meer verbonden met eigenaarschap of fysieke eigenschappen, maar zijn ze niets meer dan een dataset dat onderdeel is van het wereldwijde web.18 Waardering en selectie van informatie vindt dan volledig geautomatiseerd plaats door zoekmachines; algoritmen berekenen de mate van potentiële relevantie van webpagina’s met documenten door deze wel of niet in de index op te nemen om vervolgens aan de hand van de informatiebehoefte van de specifieke

gebruiker, de meest relevante zoekresultaten te genereren. Door deze mechanismen worden gebruikers een bepalende factor van het ‘internet-archief’:

“We are the archive. We are living it, living in it, and it is us as well in all our partialities. We participate, “as we may think”, as searchers, in determing what belongs in the archive even as Google freely constructs (partly through interpolating us as searchers) the ever-evolving form its digital archive takes.” 19

Archivarissen zijn zich er in toenemende mate van bewust dat de wijze van informatie vergaren dusdanig veranderd is in de huidige netwerkmaatschappij, dat archivistische concepten zoals waardering en selectie, maar ook ontsluiting, beheer en toegankelijkheid sterk aan verandering onderhevig zijn. Met de komst van internet zijn fundamentele veranderingen ontstaan in de manier waarop we werken en leven. Maatschappelijke - en

18

Hilis, K. et al. (2013). Google and the culture of search. New York: Routledge. P. 164.

19

(15)

culturele waarden zijn getransformeerd door een nieuwe sociale cultuur, met name op het deelgebied van informatie produceren en vergaren (kennis vergaren), maar ook

communiceren.20 De individualisering, actieve participatie en het deelnemen aan online sociale en culturele netwerken, vormen tezamen momenteel de drijvende krachten achter de explosief gestegen informatieproductie. Informatiebronnen worden niet meer exclusief beheerd en ontsloten door de (klassieke) informatieprofessional, maar is gedemocratiseerd geraakt. Dat betekent dat gebruikers informatie constant gebruiken, hergebruiken, bewerken en delen in steeds wisselende contexten en sociale netwerken, onder invloed van

individualisering- en identiteitsmechanismen.21 Deze postmoderne benadering van de huidige complexiteit van informatie, heeft gevolgen voor de ontsluiting, het beheer en de

toegankelijkheid van archieven. In de netwerkmaatschappij is de klassieke grensverdeling tussen de gecreëerde informatieobjecten in een archief, de daaropvolgende

bewerkingsprocessen van de archivaris en de uiteindelijke gebruiker ervan, poreus en interactief geworden. In plaats van deze ontwikkeling tegen te houden roepen

archiefwetenschappers, waaronder Cook, juist op deze grensvervagingen niet alleen te onderkennen, maar juist te omarmen omdat:

“As a result, archives as concept, as practice, as institution, and as profession may be transformed to flourish in our digital era, especially one where citizens have a new agency and a new voice, and where they leave through digital social media all kinds of new and potentially exciting, and potentially archival, traces of human life, of what it means to be human, to which trace we as archivists, historians, researchers of all kinds, have rarely had such sustained acces before.”22

Het heeft er alle schijn van dat door de explosief toegenomen informatieproductie en de komst van internet, er nog nooit eerder in de geschiedenis zoveel informatie geproduceerd wordt. Gebruikers en zoekmachines zijn belangrijke factoren geworden van de mate van toegankelijkheid van informatie. Ten behoeve van de onderzoeksvraag in deze scriptie zal vooral de focus gelegd worden op de toegankelijkheid van een specifiek soort informatie,

20

Convery, N. (2012). Information management, records management, knowledge management: the place of archives in a digital age. In: Hill, J. (2012). The future of archives and recordkeeping. A reader. London: Facet Publishing. P. 192.

21

Idem. P. 193.

22

Cook, T. (2013). Evidence, memory, identity, and community: four shifting archival paradigms. In: Archival

(16)

namelijk procesgebonden informatie.23 In plaats van procesgebonden informatie zou de term netwerkgebonden informatie de betekenis van archieven in de netwerkmaatschappij beter kunnen duiden. Zowel de gebruikers als zoekmachines zijn, naast archivarissen, belangrijke factoren in de toegankelijkheid van netwerkgebonden informatie of archieven. De gebruikers zijn uiteindelijk degenen die sociale netwerken vormen. Om een beter inzicht te verkrijgen welke functie het archiefwezen, als institutie en de archivaris, als professie, in de

eenentwintigste eeuw heeft in de toegankelijkheid van archieven, is het eerst van belang om te begrijpen hoe het toegankelijkheidsbegrip in het archiefwezen in de afgelopen honderd jaar is geëvolueerd.

3.2 Toegankelijkheid in historisch perspectief

Het toegankelijk maken van archieven is ontstaan in een tijdperk waarin voornamelijk de juridische bewijswaarde voorop stond. De belangrijkste uitdrager van de juridische en historische bewijswaarde van archieven was Sir Hilary Jenkinson, archieftheoreticus, die als volgt de ideale archivaris beschreef circa honderd jaar geleden:

“His Creed, the Sanctity of Evidence; his Task, the Conservation of every scrap of Evidence attaching to the Documents committed to his charge; his Aim, to provide, without prejudice or afterthought, for all who wish to know the Means of Knowledge…the Good Archivist is

perhaps the most selfless devotee of Truth the modern world produces…”

Jenkinson zag de archivaris als de objectieve schatbewaarder en beheerder van archieven. Begin twintigste eeuw volgde deze klassieke archiefwetenschappelijke benadering het preparadigmatisch negentiende-eeuwse tijdperk op. De doelstelling van de klassieke archiefwetenschap was het fysiek en intellectueel beheer van archieven, waardoor de

bewijswaarde kon worden behouden. Deze doelstelling ging gepaard met het beschrijven van de ontvangen fysieke documenten volgens een formele ordeningstructuur, die een

afspiegeling vormde van de organisatie van de archiefvormer.24 Hierin is duidelijk het eerder gestelde concept te herkennen van het neutrale archief dat is opgemaakt door een bestuur of ambtenaar en hierop vinden vervolgens de ‘objectieve’ bewerkingen en processen plaats van de archivaris. De belangrijkste paradigmatische verschuiving die heeft plaatsgevonden begin

23

Thomassen, T.H.P.M. (1998). Uit een bewerking van, onder andere, de rede: Before and after the Dutch

Manual: Paradigm Shifts in Archival Science. Gehouden tijdens een studiemiddag van de KVAN, 23 oktober

1998.

24

(17)

twintigste eeuw was dat niet meer de focus door archivarissen was gericht op de uiteindelijke publicaties op basis van archiefbronnen, maar op de toegankelijkheid van de archiefbronnen voor derden. De focus verschoof van de inhoud van de archieven naar de vorm. Archieven moesten op een efficiënte manier bevraagd kunnen worden met de toepassing van een universele structuur op basis van het herkomstbeginsel.25 Met de komst van de Handleiding van Muller, Feith en Fruin werd het voor het eerst mogelijk op een uniforme wijze archieven te ontsluiten en op die manier voor een breder publiek toegankelijk te maken. Deze nieuwe benadering binnen het archiefwezen vormde de voornaamste vernieuwing in de twintigste eeuw: enkel door consistent, consciëntieus en objectief beheer van archieven, werden deze ook toegankelijk, zodanig dat de bewijswaarde bleef behouden. De focus op het beheer van archieven vormt de kern van het custodiale paradigma binnen de archiefwetenschap. Hiervoor werd wel, in het algemeen, een belangrijke aderlating gedaan: met de komst van de

Handleiding was de ontsluiting op de inhoud van de archieven afgelopen; alle energie ging op in nauwkeurig classificeren en ordenen van archieven op vorm.

Met de komst van de ICT-revolutie eind jaren tachtig van de twintigste eeuw ontstond een internationale standaardisatie in het ontsluiten en beheren van archieven:

“De archivarissen van vandaag moeten beschrijvingen maken die zodanig gestandaardiseerd zijn, dat ze binnen een geautomatiseerde context overal op een gelijkaardige manier beheerd, gepresenteerd en bevraagd kunnen worden. Van hen wordt verwacht dat ze de daarvoor relevante internationale normen beheersen en die efficiënt en kwaliteitsgericht kunnen implementeren.”26

Bovenstaand citaat uit 1997 is, archiefwetenschappelijk beschouwd, afkomstig uit de denkkaders van het custodiale paradigma van honderd jaar eerder. Het gestandaardiseerd aanbrengen van structuur en orde in archieven was de belangrijkste voorwaarde voor de toegankelijkheid ervan in de traditie van de Handleiding. Hiervoor werden in de twintigste eeuw steeds meer beschrijvingsstandaarden en –normen bedacht en gebruikt. Met deze standaarden worden informatieobjecten nauwkeurig beschreven en middels een

classificatieschema in een inventaris ontsloten. Het is een wezenlijk kenmerk van het

25

Thomassen, T.H.P.M. (1998). Uit een bewerking van, onder andere, de rede: Before and after the Dutch

Manual: Paradigm Shifts in Archival Science. Gehouden tijdens een studiemiddag van de KVAN, 23 oktober

1998.

26

Heyrman, P., Nelissen, M. (1997). De lettersoep voorbij. Naar een internationaal genormeerde en contextuele archiefbeschrijving. In: Y. Bos-Rops, G. Janssens, C. Jeugens en E. Ketelaar red. Lezen ! Teksten over het

(18)

klassieke paradigma dat deze beschrijvingen, op een consistent wijze, alleen door geschoolde archivarissen kunnen worden opgesteld. Met de komst van computers, werden deze

beschrijvingen digitaal bewaard in een MARC formaat (Machine Readable Cataloguing) binnen een databaseachtige omgeving. Tot de dag van vandaag is de meerderheid van alle beschrijvingen van informatieobjecten en het toegangenapparaat in de erfgoedsector georganiseerd in structuren afgeleid van formele standaarden en normen, en vervolgens worden deze in het algemeen beheerd in databases. Dit gegeven impliceert dat beschrijvingen consistent, precies, correct en compleet moeten zijn opgenomen in de database, anders is het niet toegankelijk voor het publiek. In de probleemstelling werd al besproken dat

informatieobjecten beheren in een database gevolgen heeft voor de zoekmethode. Een zoekopdracht kent binnen een database alleen een honderd procent relevant zoekresultaat, namelijk een exacte match, of geen zoekresultaat. In theorie zijn de ontsluitingsmethoden uit het klassieke of custodiale paradigma een toonbeeld van perfectie en consistentie. Maar dat vereist een consequente toepassing van beschrijvingsstandaarden en structureel onderhoud van het collectiebeheersysteem. Deze klassieke methoden bestaan uit vastgelegde taal in de vorm van archiefterminologie, thesauri, taxonomieën, maar ook normen voor beschrijvingen en normen voor classificaties. Maar ondanks de erkenning van een noodzakelijke universele methode bij het ontsluiten van archieven, is er in de praktijk sprake van een sterk

gediversifieerde werkwijze.27 Zo heeft elk land, soms regio, maar vaak ook archiefinstelling een andere werkwijze bij het ontsluiten (en ook beschrijven), het beheren en toegankelijk maken van archieven. Soms zelfs binnen een archiefinstelling worden verschillende normen gehanteerd.28 Een andere reden dat de consistentie van de archiefontsluiting negatief

beïnvloedt wordt, is het feit dat er vaak geen budget is om redactie te voeren op de ingevoerde beschrijvingen.29 Een laatste reden waarom de beschrijvingen van archieven meestal

inconsistent zijn, omdat er geen tijd en geld is om (ver)oude(rde) toegangen te moderniseren naar nieuwere, in gebruik zijnde standaarden of normen. De toegankelijkheid van archieven is door de standaardisering van consistent archiefbeheer in theorie optimaal gewaarborgd in het klassieke paradigma. Echter, in de praktijk is gebleken dat de formele beschrijvingsnormen en classificatieschema’s zeer moeilijk uit te voeren zijn. In de volgende paragraaf zullen de

27

Koolen, M., Kamps, J., Keijzer de, V. (2009). Information Retrieval in Cultural Heritage. In: Interdisciplinary

Science Reviews, vol. 34 no 2-3, 2009.

28

Binnen het Historisch Centrum Limburg: het Sociaal Historisch Centrum voor Limburg hanteert de ‘Amsterdamse methode’ voor de opmaak van inventarissen en het Regionaal Historisch Centrum Limburg de ‘Haagse Rijksmethode’ (jargon).

29

Koolen, M., Kamps, J., Keijzer de, V. (2009). Information Retrieval in Cultural Heritage. In: Interdisciplinary

(19)

gevolgen van deze discrepantie tussen theorie en praktijk binnen het archiefwezen worden geduid met het toegankelijkheidsbegrip in het huidige non-custodiale paradigma.

Aan het einde van de 20ste eeuw vertoonden gevormde archieven steeds minder samenhang door de komst van nieuwe communicatie- en informatietechnologie. Deze ontwikkeling ontstond door de komst van personal computers, digitale

communicatienetwerken en later ook mobiele apparatuur waardoor archieven steeds moeilijker te definiëren zijn als stabiele documenten met een duidelijke herkomst. De connectie tussen het document en de organisatie die deze heeft gevormd, oftewel het herkomstbeginsel uit het klassieke paradigma, werd steeds poreuzer.30 Dit had ook grote gevolgen voor het ontsluiten van deze archieven:

“Traditional definitions of provenance, original order, and the resulting archival fonds, let alone descriptive architectures which archivists presented to researchers, were quite inadequate to represent the new record-making and record-keeping realities.”31

Binnen het klassieke paradigma was het van cruciaal belang dat de bewijswaarde van de archieven moest worden geconserveerd door het toepassen van een strikt en rigide beheerssysteem. De Handleiding vormde de codificatie van deze benadering. In het daaropvolgende custodiale paradigma werd de focus gelegd op het consistente beheer van archieven. Doorheen de gehele twintigste eeuw werden verschillende ordeningssystemen, beschrijvingsstandaarden en normen opgesteld om het beheerssysteem op een universele wijze vorm te geven. Ook in het digitale tijdperk werden er vele standaarden en normen opgesteld, zoals ISAD-G, MoReq2, OAIS en vele ISO normen om de ontsluiting, het beheer en de toegankelijkheid van archieven op een gestandaardiseerde wijze mogelijk te maken.32

3.3 Nieuwe inzichten binnen het discours

Tegenover, of naast, de klassieke notie van het rigide toepassen van standaarden ter behoud van de bewijswaarde, ontstonden nieuwe (postmoderne) inzichten binnen de

archiefwetenschap. Eerder werd reeds beargumenteerd dat de, in theorie consistente

archiefbeheer methoden nauwelijks in de praktijk uit te voeren waren om moverende redenen. Met de komst van digitale communicatienetwerken en computers, werd het concept van

30

Cook, T. (2013). Evidence, memory, identity, and community: four shifting archival paradigms. In: Archival

Science (2013) 13:95–120

31

Idem. P. 110.

32

(20)

herkomstbeginsel uit het klassieke paradigma steeds moeilijker toe te passen in de nieuwe realiteit van de netwerkmaatschappij. In plaats van de bewijswaarde voorop te stellen, beargumenteerden steeds meer archiefwetenschappers vanaf het begin van de jaren negentig, dat archieven niet statische, monolithische entiteiten zijn, maar juist pluralistisch, meerdere relaties bevattend naargelang verschillende contexten op basis van waarden, keuzes en beslissingen.33 Eveneens een onderdeel van deze benadering, is het inzicht dat ook het archiveringsproces, archiveringssystemen en archiefbeheerssystemen dynamische factoren zijn omdat deze onder invloed staan van constant veranderende culturen.34 Samuels

problematiseerde reeds in 1992 de formele ontsluitingsmethoden uit het custodiale paradigma, door te stellen dat door de “fluidity of organizational structures” de focus verschoof van het beschrijven van de vorm, naar het beschrijven van de onderliggende (bedrijfs)functies die aan de basis stonden van de archiefvorming.35 Met name doordat de informatie- en

communicatiecultuur sterk is gedemocratiseerd, zijn de traditionele hiërarchische

informatiestromen aangevuld met horizontale, vaak sociale, informatienetwerken. Constant veranderende sociale netwerken waarin archiefvormers functioneren is typerend voor de netwerkmaatschappij. Deze typische postmoderne benadering ‘bevrijdt’ de archieven in de netwerkmaatschappij van de stringente noties uit het klassieke paradigma en legt de nadruk op archieven als onderdeel van een dynamisch collectief geheugen. Ik bedoel met het laatste dat in de netwerkmaatschappij, naast de formele hiërarchische informatiestromen, ook horizontale, sociale netwerken betrokken moeten worden bij de waardering, selectie en ontsluiting van archieven. De kern van de tegenstelling tussen de custodiale benadering en de non-custodiale in de archiefwetenschap, bestaat het fundamentele twistpunt of archieven die buiten de formele hiërarchische structuren ontstaan, wel als zodanig gekwalificeerd kunnen worden. Vanuit een custodiale benadering, gericht op archiefbeheer, met haar strikt formele waarderings- en ontsluitingsmodellen gebaseerd op hiërarchische structuren, blijkt het

onmogelijk om de neerslag van sociale web 2.0 netwerken duurzaam te archiveren. In de non-custodiale benadering worden deze sociale netwerken juist beschouwd als een unieke kans voor het archiefwezen om gebruikers te betrekken in de ontsluiting en het beheer van

33

Cook, T. (2013). Evidence, memory, identity, and community: four shifting archival paradigms. In: Archival

Science (2013) 13:95–120. P. 111-112.

34

Ketelaar, F.C.J. (1998). Archivalisering en archivering. Rede uitgesproken bij de aanvaarding van het ambt

van hoogleraar in de archiefwetenschap aan de Universiteit van Amsterdam op vrijdag 23 oktober 1998. Alphen

aan de Rijn, 1998.

35

Samuals, H. (1992). Varsity Letters: documenting modern colleges and universities, Society of American

(21)

archieven.36 In de non-custodiale benadering zoekt men naar methoden om de gebruikers, die als sociale groepen, netwerken vormen in de netwerkmaatschappij mee te laten beslissen over de waardering van informatie. Volgens Terry Cook ligt er een taak van de archivaris of het archiefwezen bij het betrekken van de gebruikers:

“How these strands of evidence and memory may be reconciled requires, in my view, a much more active engagement by the profession in the society and communities it serves, an external reorientation towards hospitality rather than an inward isolating gaze.”37

Waar de non-custodiale benadering (nog) niet in voorziet, zijn praktische instrumenten of methoden waardoor gebruikers betrokken worden in de ontsluiting en het beheer van archieven. In het volgende hoofdstuk zal de notie van toegankelijke informatie in de netwerkmaatschappij worden geduid vanuit een non-custodiale benadering. Het doel is om inzicht te verkrijgen in de werking van web 2.0, als de ruggengraat van de

netwerkmaatschappij, om vervolgens te analyseren welke invloed dat heeft op de ontsluiting en het beheer van archieven.

36

Cook, T. (2013). Evidence, memory, identity, and community: four shifting archival paradigms. In: Archival

Science (2013) 13:95–120. P. 97.

37

(22)

4 Toegankelijkheid in de netwerkmaatschappij

38

“The algorithms that orchestrate our ads are starting to orchestrate our lives”39

4.1 Archieven in de search engine society

Archiefwetenschappers, waaronder Helen Tibbo, beargumenteren in publicaties dat de archiefgebruikers in staat moeten worden gesteld om (grote) delen van het beheer van archieven zelf in handen te nemen en er verantwoordelijkheid voor te dragen.40 Haar

voornaamste argument daarbij is dat, indien archieven niet alleen beschreven worden vanuit de eigen archiefinstelling binnen haar veilige institutionele context, maar ook, en misschien juist vooral, vanuit de maatschappelijke context waarop de archieven betrekking hebben, ontstaan een meer nauwkeurigere afspiegeling van de vernetwerkte informatiestromen. Tibbo stelt terecht vast dat de vernetwerkte informatiestromen met name gevormd en van inhoud voorzien worden door gebruikers binnen sociale netwerken. Deze netwerken zijn niet gebaseerd op hiërarchische processtructuren, waarin recordsmanagement geborgd kan worden. Bijvoorbeeld binnen de context van een ambtelijk werkproces, is het realiteit geworden dat een zaakdossier niet meer tot stand komt volgens een verticale, hiërarchische beslissingsboom, maar binnen sociale netwerkstructuren. Voor een milieuvergunning

bijvoorbeeld, zal de behandelende ambtenaar contact zoeken met een collega van de provincie via Pleio, en mocht hij extra advies willen over een bepaald onderdeel, doet men een beroep op een collega via Linkedin. In het werkproces wordt ook nog een aantal keer gemaild, gebeld, een aantal basisregistraties geraadpleegd of andere nationale databases. Het moet duidelijk zijn dat archieven in de netwerkmaatschappij bestaan uit de neerslag van

veelsoortige en wisselende communicatievormen in niet-hiërarchische netwerkstructuren. De vernetwerkte informatiestromen zijn in het algemeen een uitdaging voor het

recordsmanagement, niet alleen door de digitale vorm waarin deze netwerken informatie produceren. Want de archivering van digitale informatieobjecten brengt

duurzaamheidsaspecten met zich mee. In tegenstelling tot analoge archieven, moeten de

38

Delen uit dit hoofdstuk zijn overgenomen uit de paper: Gerrits, B. (2013). Archieven zoeken, vinden en

beheren in de netwerkmaatschappij met behulp van Social Tagging. Eindpaper vak Information Retrieval.

Universiteit van Amsterdam.

39

Pariser, E. (2011). The Filtre Bubble: What the internet is hiding from you. New York: Penguin. P. 9.

40

Tibbo, H. (2006). Creating, Managing, and Archiving Records: changing roles and realities. In: the digital era.

In Butikofer, N., Hofman, H. and Ross, S. (eds). Managing and archiving Records in the Digital Era: changing professional orientations, hier + jetzt.

(23)

duurzaamheidsaspecten al bij de creatie van het informatieobject worden geborgd. Hierdoor speelt de diegene die het informatieobject creëert, een belangrijke rol in de blijvende

bewaring (en dus ook de toegankelijkheid) op lange termijn.41 Wat Tibbo bedoeld met het in beheer nemen van archieven door gebruikers, is de uiteindelijke consequentie van de

hedendaagse wijze van archiefvorming. Want als diegene die digitale objecten creëert verantwoordelijk is voor de juiste metadatering, zodat het object op lange termijn ook toegankelijk blijft, waarom zou een geïnstitutionaliseerde archiefinstelling dan nog het alleenrecht moeten hebben in het bepalen van de beheerwijze? De gebruikers en producenten van de vernetwerkte informatiestromen worden, volgens Tibbo en Convery, met de web 2.0 mogelijkheden in staat gesteld om, naast het gebruik en de productie, ook bepaalde delen van het beheer over te nemen.42 Deze stelling impliceert een nieuwe rol voor de archivaris als informatieprofessional:

“Technology has shifted the power away from the organization (and the information

professional) towards the individual user, and the information professions need to find a way of dealing with this power shift. (…) It is archivists, records and knowledge managers who provide the expertise and the methodologies to exploit the knowledge of the masses in a structured and productive way for organisations.”43

Volgens Cook, Convery en Tibbo zou de archivaris juist gebruik moeten maken van de web 2.0 mogelijkheden die toegang verschaffen tot de vernetwerkte informatiestromen.444546De archivaris heeft, bijvoorbeeld, de kennis om de noodzakelijke digitale duurzaamheid bij de bron te laten inbouwen door geavanceerde web 2.0 technologieën. Zonder het borgen van digitale duurzaamheid bij de bron van informatieobjecten, kan er geen sprake zijn van

toegankelijkheid op lange termijn. Ook biedt het web 2.0 instrumentarium mogelijkheden om

41

Tibbo, H. (2006). Creating, Managing, and Archiving Records: changing roles and realities. In: the digital era. In Butikofer, N., Hofman, H. and Ross, S. (eds). Managing and archiving Records in the Digital Era: changing professional orientations, hier + jetzt.

42

Convery, N. (2012). Information management, records management, knowledge management: the place of archives in a digital age. In: Hill, J. (2012). The future of archives and recordkeeping. A reader. London: Facet Publishing. P. 200.

43

Idem. P. 201.

44

Cook, T. (2013). Evidence, memory, identity, and community: four shifting archival paradigms. In: Archival

Science (2013) 13:95–120. P. 114.

45

Convery, N. (2012). Information management, records management, knowledge management: the place of archives in a digital age. In: Hill, J. (2012). The future of archives and recordkeeping. A reader. London: Facet Publishing. P. 200.

46

Tibbo, H. (2006). Creating, Managing, and Archiving Records: changing roles and realities. In: the digital era. In Butikofer, N., Hofman, H. and Ross, S. (eds). Managing and archiving Records in the Digital Era: changing professional orientations, hier + jetzt.

(24)

gebruik te maken van crowdsourcing bij de ontsluiting van archieven.47 In het volgende hoofdstuk zal het centrale web 2.0 instrument van deze scriptie, Social Tagging, benaderd worden vanuit de onderzoeksvraag of dit instrument ingezet kan worden bij de ontsluiting, het beheer en de toegankelijkheid van archieven. Volgens de archiefwetenschappers die

archieven in de netwerkmaatschappij benaderen vanuit het non-custodiale paradigma is de archivaris als kennismanager structureel onderdeel van de vernetwerkte informatiestromen.

Dit staat in schril contrast met de custodiale benadering, waarin de archiefvorming en het beheer van archieven geïnstitutionaliseerd is binnen de muren van de overheidsorganisatie en archiefinstelling. De ontsluiting van archieven vindt plaats door professionals, zoals

archivarissen, met een hoog expertgehalte. Volgens de custodiale benadering kunnen alleen de informatieprofessionals immers beoordelen of de inhoud van de archiefbronnen relevant genoeg is om te ontsluiten en hoe deze vervolgens toegankelijk te maken. Met de komst van web 2.0 technologieën en de daaruit voortvloeiende vernetwerkte informatiestromen, is deze klassieke notie van ‘relevante informatie’ problematisch geworden:

“In a digital, networked society control over information through custody is no longer a valid concept. Access to e-books, e-journals, online newspapers and the unimaginable richness of information online from any computer and now even any mobile phone calls the idea of libraries and archives as physical spaces of information provision and authentication of what is deemed to be valuable information into question.”48 (Deegan & Tanner, 2002)

De toepassing van klassieke kernconcepten uit de archiefwetenschap, zoals het

herkomstbeginsel, is problematisch in de authenticiteit van digitale archiefbronnen. De archiefwetenschapper Tredinnick beargumenteert dat authenticiteit in een digitale wereld niet meer een onderdeel is van het informatieobject zelf, maar dat authenticiteit steeds meer bepaald wordt door het gebruik en de (her)contextualisatie ervan.49 Binnen deze

non-custodiale benadering is de archiefgebruiker de belangrijkste actor; hij of zij is degene die de archiefbron immers (her)contextualiseert. De authenticiteit in analoge archieven wordt juist bepaald door het vastleggen (of ‘bevriezen’) van de context waarin de archieven tot stand komen. Vervolgens mag de gebruiker deze archieven in de, door de archivaris, geannoteerde

47

Zajac, L. (2013). Social Metadata Use in Art Museums: The Case of Social Tagging. In: PNLA Quarterly 77:2 (2013). P. 67

48

Hill, J. (2012). The future of archives and recordkeeping. A reader. London: Facet Publishing. P. 193.

49

(25)

context deze raadplegen volgens het toegangenstelsel van de archiefinstelling.

Het is niet zo dat de traditionele archiefinstellingen voorbij gaan aan de digitalisering van de samenleving. De analoge inhoud van de bewaardepots in de klassieke

archiefinstellingen wordt in steeds grotere mate gedigitaliseerd en toegankelijk gemaakt via online inventarissen en/ of digitale representaties van de analoge bronnen. Parallel aan dit digitaliseringsproces is de constatering dat er een ontwikkeling gaande is waarbij de klassieke archiefinstellingen steeds meer hun mandaat verliezen als de exclusieve bewaarders van het ‘nationaal geheugen’.50 Ook zijn archiefinstellingen reeds een aantal jaren bezig, weliswaar in mindere mate dan het digitaliseren, met het moderniseren van de toegankelijkheid van hun archieven op het web 2.0. Web 2.0 is de opvolger van web 1.0, dat de eerste tien jaar van het bestaan van internet typeerde. Internet 1.0 was vooral een voortzetting van de pre-internet benadering van het solistisch aanbieden van informatie en een gebruiker die deze tot zich kon nemen. Het internet is geëvalueerd naar een web 2.051: gebruikers maken zelf content, en gebruiken andermans informatie om nieuwe informatie te creëren. Archiefinstellingen en archivarissen zouden hierbij de positie als de beheerder van hun informatie of archieven moeten loslaten:

“…there is now more information than ever available tot the public but less and less of it is held in archival custody. Information is no longer authenticated through preservation in official custody and is used, re-used and re-contextualized without the need for interference from the traditional source keeper.”52

4.2 Retrieval in het web 2.0

Een belangrijke voorwaarde is, voordat archiefgebruikers in staat kunnen worden gesteld om delen van het archiefbeheer over te nemen, dat deze archieven wel toegankelijk moeten zijn via het web 2.0. In eerste instantie zal de vindbaarheid een belangrijk criterium vormen van de mate van toegankelijkheid, los van de vraag of de toegankelijkheid verhoogd kan worden door het inzetten van specifieke web 2.0 instrumenten. Uit publicaties blijkt dat er reeds veel

50

Hill, J. (2012). The future of archives and recordkeeping. A reader. London: Facet Publishing. P. 194.

51

Web 2.0 is a substrate of the Social Web that provides platforms and Technologies (e.g. wikis, blogs, tags, RSS feeds) for online communication and collaboration. Ding, Y., et al. (2009). Perspectives on Social Tagging. In: Journal of the American Society for information science and technology, 60 (12): 2388-2401. P. 2388.

52

(26)

onderzoek is gedaan naar de mate van vindbaarheid (information - en/ of web retrieval) van cultureel erfgoed (het domein waarbinnen archieven ook worden gecategoriseerd). De

wetenschappelijke deeldiscipline information retrieval vindt zijn oorsprong in de negentiende eeuw, waarin pogingen werden ondernomen om indexen en catalogussen te creëren in het bibliotheekwezen. In de twintigste eeuw zorgden de zogenaamde Cranfield experimenten voor een stroomversnelling binnen het information retrieval onderzoek. Deze experimenten beoogden een methodiek te vinden waarbij met een gegeven zoekvraag en een gegeven set data met een vooraf bepaald classificatieschema, men de meest relevante zoekresultaten zou kunnen genereren.53 Dit werd bepaald door de recall en de precision van de zoekresultaten: de eerste duidt de hoeveelheid relevante zoekresultaten aan en de tweede het aantal relevante documenten binnen de totale hoeveelheid zoekresultaten. Een belangrijke conclusie die kon worden getrokken uit de Cranfield experimenten was dat het indexeren en zoeken van documenten beter kon worden gedaan met natural language in plaats van formele indextermen uit een classificatieschema.54 Oftewel de taal van de gebruikers speelt een belangrijke rol bij het vinden van de meest relevante informatie. Wat information retrieval onderscheidt van andere disciplines, is het feit dat de kernconcepten worden gevormd door de noties: ranking en best match. In tegenstelling tot een typische databasestructuur waarbij iedere query wordt gekoppeld aan een 100% relevant zoekresultaat of totaal niet relevant is, wordt bij text retrieval van een set documenten de relevantie bepaald volgens een algoritme. Door toepassing van deze algoritmes, ontstaat een best match zoekresultaat die wordt weergegeven in een bepaalde ranking (volgorde). Zoekmachines, die aan de hand van de gegeven query het internet doorzoeken, gebruiken ingewikkelde (geheime) algoritmen die op basis van best match een lijst zoekresultaten presenteren die relevant zijn voor de

informatiegebruiker. Het is belangrijk om de werking van deze zoekmachines te onderkennen en te begrijpen.

Zoekmachines indexeren websites en webpagina’s op basis van (hyper)link structuren en anchor text (tekst dat onder een hyperlink zich bevindt). Google heeft op deze manier ongeveer 40 miljard webpagina’s geïndexeerd.55 Dit lijkt heel veel, maar deze index is incompleet: onderzoek toont aan dat slechts 20% van het totaal aantal webpagina’s (inclusief het zogenaamde deep web) wordt doorzocht door zoekmachines.56 Anderen schatten deze

53

Koolen, M., Kamps, J., Keijzer de, V. (2009). Information Retrieval in Cultural Heritage. In: Interdisciplinary

Science Reviews, vol. 34 no 2-3, 2009. P. 271

54

Idem. P. 271

55

http://www.worldwidewebsize.com/

56

(27)

aantallen niet-doorzochte pagina’s veel groter in: van elke gevonden pagina in een zoekmachine, worden er 500 gemist.57 Zoekmachines doorzoeken het internet met een crawler op basis van de hoeveelheid (nieuwe) links dat elke webpagina bevat; hoe meer (nieuwe) links naar een webpagina, hoe hoger deze in de ranking zal verschijnen. Ook andere factoren worden betrokken bij de web retrieval door zoekmachines, maar het ranken op basis van links is de voornaamste factor dat de werking bepaald van de indexering door

zoekmachines. Vanzelfsprekend zoekt een crawler alleen binnen die webpagina’s waarin de termen uit de query van de gebruiker staan met behulp van text retrieval. Zoekmachines maken daarbij gebruik van een inverted index: een index waarbij de query termen gekoppeld zijn aan bepaalde webpagina’s. De crawler en de inverted index vormen samen de meest belangrijke componenten van een zoekmachine. We constateerden eerder al dat de mate van toegankelijkheid van archieven, mede afhankelijk is van de vindbaarheid op het internet door zoekmachines. In de volgende paragraaf zullen we dit gegeven verder problematiseren aan de hand van de gangbare ontsluitingswijze van cultureel erfgoed in het algemeen.

4.3 Heterogene collectiebeheersystemen

Beschrijvingen van cultureel erfgoed, waaronder ook archieven, worden gekenmerkt door de strikte hantering van formele classificatieschema’s of ontologie. Deze worden vervolgens beheerd in database-achtige beheersystemen, waardoor het cruciaal is dat de beschrijvingen van cultureel erfgoed consistent, compleet en correct dient plaats te vinden. Eerder werd reeds geschetst dat informatieobjecten met een databasestructuur gevonden kunnen worden als een honderd procent relevant zoekresultaat, namelijk een volledige match tussen de query en het zoekresultaat. Het nadeel van de databasestructuur dat relevante tekstdocumenten die een andere structuur kennen, niet gevonden worden als een relevant zoekresultaat. Het is dus van belang dat de metadata in database-achtige beheersystemen correct zijn ingevoerd, wil het bijbehorende informatieobject ook gevonden worden. Hiervoor zijn er

beschrijvingsstandaarden opgesteld om de invoer van metadata op een uniforme wijze te laten plaatsvinden met een afgesproken vocabulaire. Dat het consistent gebruik van dit soort

controlled vocabularies in de praktijk lastig blijkt uit te voeren, werd reeds in hoofdstuk 2 geconstateerd. Ook worden door musea, bibliotheken en archiefinstellingen verschillende standaarden gebruikt voor het beschrijven van cultureel erfgoed.58

57

. Halavais, A. (2009). Search engine Society. Digital media and society series. Cambridge: Polity Press. P. 40.

58

Koolen, M., Kamps, J., Keijzer de, V. (2009). Information Retrieval in Cultural Heritage. In: Interdisciplinary

(28)

Problematisch voor de vindbaarheid van relevante zoekresultaten van beschrijvingen van cultureel erfgoed objecten is het feit dat de gehanteerde termen in beschrijvingen uit strikte classificatieschema’s gemaakt zijn door experts, opgesteld met een hoog technisch gehalte.59 Deze termen zijn niet bekend bij de gemiddelde informatiegebruiker en heeft negatieve effecten op de toegankelijkheid van deze beschrijvingen en de bronnen waar ze betrekking op hebben. Vooral binnen het archiefwezen zijn beschrijvingen van archiefbronnen bijzonder statisch en technisch van aard. Bijvoorbeeld het onderscheid tussen de term ‘archiefblok’ en ‘archiefvormer’ is verwarrend voor de gebruiker. De term archiefblok drukt vooral uit dat het om een fysiek geheel gaat, dat niet noodzakelijkerwijs samenvalt met het archief in logische zin.60 Sowieso zegt de term ‘archiefblok’ de gebruiker niet veel, blijkt uit een rondvraag binnen een groep leken. Uitsluitend strikt hiërarchische beschrijvingsstandaarden worden gehanteerd bij het toegankelijk maken van archieven vanuit een beheercontext. Een typische seriële beschrijvingstandaard is de aggregatie tussen verzamelbeschrijvingen, enkelvoudige- en deelbeschrijvingen om de hiërarchische structuur te presenteren in het beheersysteem. Deze database-achtige manier van presenteren is in eerste instantie gericht op het structureren van het institutioneel beheer van archieven en richt zich niet op de inhoud van

archiefbronnen. Een typische seriële ontsluiting is de verzamelbeschrijving: Notulen, met als deelbeschrijving: 1955 – 1980. Hiermee is de archiefbron weliswaar ontsloten, maar deze beschrijving zegt niets over de concrete inhoud. Eerder werd reeds geconstateerd dat deze benadering in het ontsluiten van archieven, gericht op beheer en vorm, typerend zijn binnen het custodiale paradigma.

Een aantal factoren zijn verantwoordelijk voor het heterogene karakter van archieven, zoals: inconsistente beschrijvingen, het hanteren van verschillende standaarden en het

ontsluiten met database-achtige beheersystemen. Uit onderzoek blijkt dat, binnen een museale context, het doorzoeken van heterogene collecties door bovengenoemde factoren bemoeilijkt wordt.61 Koolen, Kamps en de Keijzer stellen vast dat het gebruik van tekst gebaseerd zoeken (text retrieval), in plaats van zoeken in een database, voor een betere toegankelijkheid kan zorgen omdat meer relevante zoekresultaten gegenereerd kunnen worden op basis van best match. Bij text retrieval wordt elke vorm van structuur genegeerd en alle beschrijvingen

59

Vliet, H. & Hekman, E. (2012). Enhancing user involvement with digital cultural heritage: The usage of social tagging and storytelling. In:First Monday, Volume 17, Number 5 - 7 May 2011

60

Horsman, P. (2001). Eenheid in verscheidenheid: de smalle weg naar een nationaal archievenoverzicht. In:

Toegang. Ontwikkelingen in de ontsluiting van archieven. SAP Jaarboek 2001. Den Haag: Stichting

Archiefpublicaties. P. 239

61

Koolen, M., Kamps, J., Keijzer de, V. (2009). Information Retrieval in Cultural Heritage. In: Interdisciplinary

Referenties

GERELATEERDE DOCUMENTEN

Granger causality test confirmed the presence of causal relationship running from export and import to GDP implying that export-led and import-led growth theory is valid for

In de verzekerdenraming 2014 zijn de verzekerden woonachtig in het buitenland evenredig verdeeld over de afslagklasse en de positieve klasse op basis van de relatieve prevalenties

Field vegetable production in the Red River Delta (RRD) plays an important role in food security and nutrition security for the region. In the RRD vegetable crops are mainly rotated

Beheer van adulte Stierkikkers kan dus best gebeuren op het moment dat de dieren geconcentreerd voorkomen op wel af- gelijnde locaties, zijnde tijdens het zomerseizoen langsheen

In dit project worden de mogelijkheden voor beheersingsstrategieën voor bovengrondse pathogenen (valse meeldauw), ondergrondse pathogenen (Fusarium, aaltjes) en onkruid

Uit het onderzoek in 1980, waarbij proeven op kleine schaal zijn uitgevoerd, was reeds gebleken dat 2 pallets pootjesbakken tomaten achter elkaar inder- daad gekoeld kunnen worden in

Met STRELIN zijn voor 12 tweemaandelijkse tijdvakken in de periode 1985/1986 berekeningen uitgevoerd voor de bestaan- de situatie en voor een scenario met wateraanvoer naar het

Met deze verkenning hopen we lessen te trekken voor (nieuwe) politieke partijen, maar ook over de algemene aantrekkingskracht van de lokale politiek: Veel inwoners