• No results found

6. Analyse

6.1. De eisen nader bekeken

De designated communities (doelgroepen) zijn duidelijk gedefinieerd en periodiek wordt bekeken of de aangeboden informatie nog aansluit bij de kennis en competenties van de gebruiker.

Ondanks dat het definiëren van de doelgroepen een belangrijk onderdeel is van het OAIS model heeft geen van de instellingen de designated communities duidelijk gedefinieerd. Alleen bij de zogenaamde uitplaatsing van digitaal archief is de designated community min of meer bekend, namelijk het organisatieonderdeel van de overheid dat de stukken ook heeft aangeleverd. In deze gevallen is de

producer gelijk aan de consumer en is het definiëren van de designated community voor de kortere

termijn van minder belang. Het OAIS model gaat er van uit dat informatie niet in het systeem zelf wordt aangemaakt maar dat het altijd wordt aangeleverd door een externe partij. In de praktijk van het e-depot betekent dit dat archiefdocumenten in eerste instantie worden gearchiveerd in bijvoorbeeld een document management systeem en pas in een later stadium worden overgedragen aan een e-depot. In deze document management systemen worden de overheidsarchieven alleen toegankelijk gemaakt voor het ambtelijk apparaat.

Omdat de organisatorisch, functionele en technische context in de hoofden van de ambtenaren zitten is er geen behoefte om dit ook nog expliciet vast te leggen in de systemen. Ambtenaren kunnen op korte termijn het digitaal archief nog redelijk makkelijk begrijpen en op de juiste manier

interpreteren. Echter door de tendens om niet te lang in dezelfde functie te blijven werken en de steeds snellere veranderende organisaties (zowel qua organisatie als qua taken) wordt het vinden, goed begrijpen en interpreteren van digitale informatie op de iets langere termijn snel minder makkelijk. Een verschijnsel dat zonder uitzonderingen bij ieder onderzoek naar misstanden bij de overheid aan

43

het licht komt. Het bovengenoemde probleem doet zich nog sterker voor na de wettelijke

overbrenging. Het digitaal archief wordt dan geacht voor iedere Nederlandse burger goed toegankelijk te zijn. Omdat iedere burger zijn eigen kennis en competenties heeft is er geen sprake van één

duidelijk te definiëren designated community.

De informatieobjecten (de data) en de bijbehorende metagegevens worden gezamenlijk beheerd als information packages.

Information package is één van de centrale begrippen in het OAIS model. Het informatieobject is

onlosmakelijk verbonden met de metagegevens en deze moeten daarom in één pakket worden beheerd. Zowel de OAIS standaard als de NEN-ISO 23081 norm hebben als uitgangspunt dat het zwaartepunt van duurzame toegankelijkheid niet ligt bij het informatieobject zelf , maar bij de metagegevens in combinatie met het fysieke object. Bij geen van de e-depots wordt er echter gebruik gemaakt van de

information packages. Het duidelijkst is dit in Amsterdam. De fysieke objecten worden opgeslagen in

het bewaardepot, de metagegevens in het collectiebeheersysteem. In Den Haag en Rotterdam worden de metagegevens en digitaal archiefstuk wel opgenomen in de e-depot applicatie via één SIP, echter ook binnenin dit systeem worden ze gescheiden van elkaar opgeslagen. Eén van de vereisten van een e-depot is de duurzame opslag van documenten in de vorm waarin ze oorspronkelijk zijn opgenomen. Echter naast dit formaat zullen er vaak ook nieuwe formaten voor archivering (AIP) en raadpleging (DIP) worden gemaakt en bewaard. Elke representatie deelt dezelfde contextuele en beschrijvende metagegevens, maar heeft zijn eigen metagegevens met technische kenmerken en

preserveringsacties.103

De projectdocumentatie laat zien dat er nog nauwelijks nagedacht wordt over de

duurzaamheid van metagegevens. Dit is opmerkelijk want de duurzame archivering van information

packages gaat over de essentiële functionaliteit van een e-depot. Het digitale depot is zoals we hebben

gezien ook zelf een archiveringsysteem en is net zoals alle informatiesystemen door zijn

afhankelijkheid van hard- en software niet bestemd om op langere termijn operationeel te blijven. Niet het systeem zelf moet duurzaam zijn, maar de inhoud van het systeem inclusief de meestal vele complexe relaties tussen de verschillende data.104 Niet voor niets is volgens David Bearman "widely

accepted that electronic records are at greatest risk of losing their "record-ness" at moments when they are transitioning between states, e.g., when control is being passed to different systems... or when the system is updated or replaced".105

103 Filip Boudrez, Is een DMS bruikbaar als digitaal depot, (Antwerpen 2013), p. 4.

104 ‘Fundamenten in verandering: E-depots’ in: Archievenblad, jaargang 114, nummer 2 (2010), p. 12.

105 David Bearman ‘Moments of risk: Identifying threats to electronic records’ in: Archivaria 62 (Herfst 2006), p. 15-46, alhier p. 24.

44

Er is beleid gemaakt voor de preservering van de verschillende type information packages en er is een technology watch ingericht.

Het preserveringsbeleid is bij alle drie de e-depots vooral gericht op twee onderdelen. Als eerste wordt er veel aandacht besteed aan de preservering van bitstreams. Daarnaast wordt er gekeken naar de veroudering van bestandsformaten. Alleen Amsterdam neemt op dit moment ook expliciet de

benodigde viewers op in het e-depot. Wat verder opvalt bij bestudering van het preserveringsbeleid is dat dit vooral gericht is op individuele bestanden, zoals tekstdocumenten, e-mails, spreadsheets en foto's die zijn opgenomen in een directory structuur of in een document management systeem.

Figuur 9: Genetwerkte informatie van de overheid 106

Tegenwoordig is nog maar een klein deel van het digitale archief vastgelegd in deze meer traditionele digitale documenten. De data in deze documenten is ongestructureerd en daarom lastig te vinden, vooral ook omdat voor veel informatieverzoeken tegenwoordig een koppeling tussen

verschillende data moet worden gemaakt. In plaats van het wegstoppen van de belangrijkste variabelen in deze documenten kunnen deze gegevens ook worden opgeslagen in processpecifieke datasets.107 Hierdoor zijn ze gestructureerd en makkelijk te vinden. Er is een ontwikkeling aan de gang van digitale documenten met metadata, naar data met metagegevens.108 De informatie uit deze datasets wordt in deze genetwerkte samenleving ook steeds vaker gekoppeld aan andere informatie

106 https://twitter.com/tokmetzis/status/580456541238726656. (Getweet door Dimitri Tokmetzis op 24 maart 2015 om 20:49)

107 Denk bijvoorbeeld aan de gemeentelijke basisregistraties. Zie: http://e-overheid.nl /onderwerpen /stelselinformatiepunt/stelsel-van-basisregistraties/basisregistraties.

108 Marjolein Bryant, ‘De processpecifieke dataset heeft de toekomst’, in: Overheidsdocumentatie 7 (oktober- november 2013), p. 24-25.

45

(bijvoorbeeld aan internetbestanden). Informatie wordt in steeds wisselende context voor nieuwe processen gebruikt en hergebruikt. 109 Denk bijvoorbeeld aan sociale media, gis bestanden, en data sets in financiële systemen en samenwerkingsplatforms als Sharepoint, Alfresco en Pleio. Er wordt nog nauwelijks preserveringsbeleid gemaakt voor digitaal archief opgenomen in dit soort

informatiesystemen.

Bij de inrichting van een technology watch kunnen ongeveer dezelfde conclusies getrokken worden als voor het preserveringsbeleid. De conclusie die Annemieke Adema in 2011 trok, dat niet alle bouwstenen van een digitaal informatieobject, zoals hardware, software, drager en bitstream, evenveel aandacht krijgen bij de technology watch is nog steeds geldig.110 Volgens Mies Langelaar is dit goed te verklaren. Zij stelt dat ondanks dat er hiervoor nieuwe medewerkers zijn aangenomen bij de instellingen, de techniek te snel gaat om op elk gebied helemaal up-to-date te blijven. Er zal nog meer moeten worden samengewerkt en misschien ook wel minder vrijblijvend. Er zijn plannen om een landelijk expertisecentrum op te richten onder de hoede van de Nationale Coalitie Digitale

Duurzaamheid. Een probleem dat Langelaar constateert is dat er wel veel enthousiasme is, maar dat het in verband met organisatorische versnippering binnen de archief - en erfgoedsector vaak ontbreekt aan tijd en geld.111

De organisatorische en functionele context (bedrijfsactiviteit, actor, mandaat) en de relaties tussen deze verschillende contexten en de records zijn blijvend vastgelegd op het juiste aggregatieniveau.

Om een archiefstuk goed te kunnen begrijpen en interpreteren is het vastleggen van de context van wezenlijk belang. Zeker in het digitale tijdperk, waarbij archief makkelijk kan worden gebruikt en hergebruikt, zal een digitaal archiefstuk vaak een relatie hebben met meerdere processen en/of

archiefvormers. In het theoretisch entiteitenmodel van de NEN-ISO 23081 norm is de bedrijfsactiviteit (het proces) de centrale entiteit. Dit past goed bij de definitie dat een archief procesgebonden

informatie is. In alle vier de toepassingsprofielen112 wordt echter uitgegaan van een één-

entiteitenmodel met de entiteit "record" als centrale en onmisbare rol. Alle contextinformatie zal moeten worden opgenomen in de metagegevens bij de entiteit "record". De keuze voor een één- entiteitenmodel is een praktische. In het Toepassingsprofiel Rijk wordt aangegeven dat ze 'ergens

moeten beginnen en het niet meteen al te ingewikkeld moeten maken'. 113 In het Rotterdamse toepassingsprofiel wordt aangegeven dat er nog nauwelijks toepassingen binnen de gemeente zijn

109 Dennis Broeder, Colette Cuijpers en Corien Prins(red.), De Staat van informatie, (Amsterdam 2011), p. 21. 110 Annemieke Adema, Ten minste houdbaar tot, tijdig samenwerken aan duurzame toegankelijkheid, scriptie UvA 2011, p. 25.

111 Interview met Mies Langelaar gehouden op 26 maart 2015. 112

Dit is het Toepassingsprofiel Metagegevens Rijksoverheid, het Toepassingsprofiel metadatering Lokale Overheden, het Toepassingsprofiel metagegevens voor overdracht van digitale informatieobjecten naar het e- depot Rotterdam en de Metadatastandaard voor digitale informatieoverdracht Stadsarchief Amsterdam. 113 KennisLAB Digitale Informatiehuishouding, Toepassingsprofiel metagegevens rijksoverheid, versie 1.0. (2010), p.7.

46

waar daadwerkelijk gebruikt wordt gemaakt van meerdere entiteiten en dat ook de e-depot applicatie nog niet zo is ingericht dat er een overdracht kan plaatsvinden waarbij sprake is van meerdere entiteiten.

Er zijn in de toepassingsprofielen drie manieren waarop functionele contextinformatie in metagegevens kan worden vastgelegd bij het record. De eerste manier is dat een ordeningsstructuur vertaald kan worden naar het aggregatieniveau "serie". In de klassieke inventaris gebeurde dit ook al via de rubriek. Alle bestanddelen onder een rubriek hadden vaak dezelfde organisatorische eenheid. Tegenwoordig worden de dossiers gekoppeld aan processen en kan onder een serie een bedrijfsproces of zaaktype worden verstaan. 114 Het probleem van deze manier is dat bestanddelen alleen hiërarchisch aan één proces kunnen worden gekoppeld waardoor multicontextualiteit niet mogelijk is. De tweede manier is om op het aggregatieniveau "dossier" het element classificatie te gebruiken. Een classificatie is een samenvoeging van archiefbestanddelen tot één nieuw geheel met een eigen identiteit. Tot aan het eind van de 20e eeuw was in Nederland de belangrijkste methode van classificeren de

basisarchiefcode. Ook hier zie je een verschuiving naar classificeren op zaaktype en processen. Omdat dit element herhaalbaar is kan een bestanddeel onder meerdere zaaktype en/of processen hangen. Het nadeel is dat er binnen dit element slechts enkele velden beschikbaar zijn, waardoor er alleen een code en een korte beschrijving aan een zaak of proces kunnen worden gegeven. De derde manier is om de elementengroep ontstaanscontext te gebruiken verdeeld over de elementen "actor" en

"activiteit/werkproces". Het voordeel hiervan is dat de context uitgebreider beschreven kan worden in meerdere velden.

Ondanks dat het wel mogelijk is om via manier drie meer informatie over de functionele context vast te leggen, zie je in de praktijk dat alleen enkele kenmerkende metagegevens op

hoofdlijnen worden vastgelegd via manier twee. Ook van de organisatorische context wordt vaak niet meer vastgelegd dan alleen de naam van de archiefvormer. Dit gebeurd zo omdat er uitgegaan wordt van de metagegevens die al vastgelegd zijn in de bronsystemen. Zoals al bij de eerste eis over de

designated communities vermeld, zit deze context vaak in de hoofden van de ambtenaren en worden ze

niet expliciet vastgelegd in de systemen. Ondanks dat de noodzaak van goede contextinformatie voor duurzame toegankelijkheid wordt onderkend zijn er nog weinig concrete plannen om dit op te pakken. Het Stadsarchief Rotterdam verwijst hiervoor terug naar de archiefvormer die meer contextgegevens zou moeten vastleggen in bijvoorbeeld zaaktypecatalogi. Aan de andere kant bestaat er bij het Nationaal Archief het idee om alle institutionele archiefvormers bij de overheid te beschrijven in een zogenaamde kernregistratie. De beschrijvingen in het e-depot kunnen dan worden gekoppeld aan de beschrijving in deze kernregistratie waardoor ze worden verrijkt met organisatorische context.115

114 Nationaal archief, MeDuSa. Xml-metagegevensschema van het e-depot. Toelichting. p. 5.

115 Petra Helwig en Roland Bisscheroux, 'Landelijk archieven referentie architectuur', in: Informatie, jaargang 56/9, november 2014, p. 45.

47

De plaatsgevonden en de nog in de toekomst plaats te vinden beheersactiviteiten ten behoeve van de records zijn gedocumenteerd en vastgelegd in metagegevens en er zijn daarnaast metagegevens die zorgen voor de identificering, de beschrijving en het gebruik van de records.

De basis van alle vier de toepassingsprofielen is de NEN-ISO 23081 standaard. Het is dan ook niet verwonderlijk dat alle vier de toepassingsprofielen globaal gezien aan deze eis voldoen. Om precies aan te geven waar de verschillen tussen de profielen liggen is niet zo makkelijk aan te geven. Dit komt omdat het doel waarmee de toepassingsprofielen zijn gemaakt niet voor alle vier de profielen helemaal hetzelfde is. De toepassingsprofielen van Amsterdam en Rotterdam zijn praktisch ingericht en hebben primair tot doel om de overdracht van digitaal archief mogelijk te maken. In deze profielen zijn alle elementen opgenomen die het e-depot nodig heeft om de digitale bestanden op lagere termijn goed te kunnen beheren. In beide profielen is per aggregatieniveau bekeken welke gegevens verplicht of optioneel zijn. De toepassingsprofielen van het Rijk en de Lokale Overheden hebben een bredere scope. In deze profielen is beschreven welke metagegevens er minimaal moeten worden vastgelegd om duurzame toegankelijkheid van digitaal archief te garanderen. Er is geen onderscheid gemaakt tussen de aggregatieniveaus. Hooguit worden er in de opmerkingen aanbevelingen gedaan op welk niveau een bepaald gegeven het best kan worden vastgelegd.

Een ander probleem bij het vergelijken van de profielen is dat niet overal dezelfde

terminologie wordt gebruikt. In het Amsterdams profiel komen bijvoorbeeld de elementen "bewaar- of vernietigingscategorie" en "bewaartermijn" voor. In de andere profielen kan deze informatie ook worden vastgelegd, maar dan in element "event plan". Het gaat immers over een beheeractiviteit die in de toekomst zal plaatsvinden.116

Een vraag die wel gesteld moet worden is in hoeverre het gebruik van de toepassingsprofielen zal zorgen voor duurzame toegankelijkheid. De profielen gaan vooral uit van formele archivistische gegevenselementen. Voor het beschrijven van de inhoud heb je in het toepassingsprofiel Lokale Overheden alleen het veld "titel" voor een korte formeel-inhoudelijke beschrijving en het veld "omschrijving" voor nadere informatie over het record. Uit de verschillende pilots117 blijkt echter dat er veel meer informatie zit in de verschillende informatiesystemen bij de archiefvormer. De informatie in document management systemen en recordmanagement systemen is gekoppeld aan andere

systemen zoals bijvoorbeeld zaaksystemen en procesapplicaties die ook vaak veel inhoudelijke metagegevens bevatten van het record. Bij bijvoorbeeld digitale bouwdossiers wordt ook info vastgelegd over de aanvrager van de vergunning, de architect, de locatie van het bouwwerk, etc. Een gebruiker heeft binnen deze informatiesystemen veel verschillende ingangen om de juiste informatie te vinden.

116 Zie de bijlagen 4, 5 en 6 voor een overzicht van de beschreven elementen per toepassingsprofiel. 117 zie bijvoorbeeld het Rapport metadata. Pilot 'uitplaatsing digitaal archief gemeente Haarlem' (22 oktober 2014) en het Eindverslag Werkpakket Metadata. Pilot e-depot gemeente Utrecht & Het Utrechts Archief (2014).

48

Door digitale documenten uit deze systemen te halen en op te bergen in een e-depot, waarbij voornamelijk de formele metagegevens zoals beschreven in de toepassingsprofielen zullen worden meegenomen, zullen gebruikers veel verlies van toegankelijkheid ondervinden. Dit is te vergelijken met het 'plat slaan' van een spreadsheetbestand of een bestand met geo-informatie tot een pfd/a formaat. Formules zijn hierdoor niet meer zichtbaar of verschillende lagen in de informatie zijn niet meer te onderscheiden. De toegankelijkheid van de informatie wordt hierdoor een stuk minder.118 Wat zich bij het converteren naar pdf/a van digitale bestanden in het klein voordoet, gebeurt in het groot door documenten uit systemen te halen en op te bergen in e-depots. Ingebouwde functionaliteit en een groot deel van inhoudelijke data wordt niet meegenomen. Voor de mate van toegankelijkheid is dit hetzelfde als het digitaliseren van klassieke toegangen en hierbij niet de nadere toegangen meenemen.

De oplossing die voor dit probleem is bedacht is een vrij veld waarin zogenaamde agent specifieke metagegevens kunnen worden opgeslagen. De archiefvormer zal hierbij zelf een inschatting moeten maken welke metagegevens hiervoor in aanmerking komen. Dit is echter maar een deel van de oplossing. Nog steeds worden alleen de gegevens meegenomen en niet de vele netwerk relaties die tussen de gegevens bestaan. Een andere oplossing is om deze inhoudelijke metagegevens niet op te nemen bij de records maar in de metagegevens van het record te verwijzen naar de

registratiesystemen. Dit zal echter wel betekenen dat deze registratiesystemen in zijn geheel moeten worden meegenomen in het e-depotbeleid. Zeker als de systemen zullen worden vervangen of als de data wordt gemigreerd naar andere systemen zullen de gemaakte koppelingen betrouwbaar en duurzaam moeten zijn.

De informatie is beschikbaar voor een gebruiker via een digitale zoekingang. De gebruiker krijgt overzichtelijk de metadata gepresenteerd, waarna hij daarna de data in een bruikbare vorm krijgt aangeboden. (Descriptive Information Packages).

Toegang is misschien wel de belangrijkste functie van een e-depot. Zonder toegang maakt het weinig uit welke informatie je hebt overgebracht naar een e-depot en hoe deze informatie is gemetadateerd en geordend. Je kunt er namelijk toch niet bij. Echter nog geen van de onderzochte e-depots beschikken over een digitale zoekingang met alle daarbij behorende functionaliteit.119 Een voorbeeld van deze functionaliteit is dat de rechten van verschillende gebruikersgroepen zijn ingeregeld. Een ambtenaar die zijn eigen nog niet officieel overgedragen archief wil inzien kan meer rechten hebben dan een burger. Het Stadsarchief Amsterdam is het verst met hun zoekingang. Ze gebruiken hiervoor de archiefbank die in eerste instantie ontwikkeld is voor de raadpleging van de scans van analoge documenten. De e-depotapplicatie die wordt gebruikt door het Stadsarchief Rotterdam en het

118 Petra Helwig en Roland Bisscheroux, 'Landelijk archieven referentie architectuur', in: Informatie, jaargang 56/9, november 2014, p. 43.

119 Kwaliteitsinstituut Nederlandse Gemeenten (KING), Onderzoek functionaliteit e-depot decentrale overheden, versie 1.0 (2 februari 2015), p. 24.

49

Nationaal Archief heeft wel functionaliteit om informatieobjecten terug te vinden en te raadplegen. Dit is echter alleen te gebruiken voor de beheerder van het e-depot. Het is geen zoekingang voor de overige gebruikers.120

Zoals het er nu naar uit ziet zal de toegang bij alle e-depotprojecten moeten gaan lopen via het collectiebeheersysteem. Hierbij zullen de niet-manifestatieafhankelijke metagegevens, dus met name de inhoud en de context, worden doorgezet naar de collectiebeheersystemen. De bestaande digitale zoekingangen voor analoog archief kunnen dan gebruikt worden voor zoeken en vinden en presenteren van de gebruiksvriendelijke representaties en de metagegevens (DIP). Het voordeel hiervan is dat dit relatief snel kan worden ingeregeld omdat deze infrastructuur al bestaat. Het nadeel is dat de huidige collectiebeheersystemen en de zoekingangen gemaakt zijn voor analoog archief. Qua functionaliteit zal het dus beperkt zijn. Bij analoog materiaal kan er bijvoorbeeld maar op één aggregatieniveau stukken worden aangevraagd. De aanvraag- en raadpleeg functionaliteit is alleen voor dat niveau ingebouwd. Bij digitaal materiaal zou het niet moeten uitmaken op welk aggregatieniveau je het materiaal aanvraagt, de huidige functionaliteit echter maakt dit niet direct mogelijk.