• No results found

De Richtlijn Metagegevens Overheidsinformatie (RMO) is, zoals eerder genoemd, de Nederlandse uitwerking van de internationale standaard ISO 23081. Deze richtlijn gaat uit van een vijf-

entiteitenmodel met de entiteiten Record, Actor, Activiteit, Mandaat en Relaties. De metagegevens die in de RMO worden voorgeschreven zijn uitgewerkt in toepassingsprofielen die specifiek voor lagen van de Nederlandse overheid zijn: TMLO is bedoeld voor de lokale overheden en TMR voor de rijksoverheden. De gegevens die moeten worden vastgelegd volgens deze toepassingsprofielen kunnen worden hergebruikt bij de archiefinstellingen ten behoeve van een archivistische

beschrijving. Een vergelijking is nuttig, want hierdoor wordt duidelijk welke metadata al voorhanden zijn wanneer de archiefbestanden in het beheer van de archiefinstelling komen en of die eventueel nog dienen te worden aangevuld.

4.3.1 Concepten en principes

In het tweede hoofdstuk is reeds uitleg gegeven over de concepten en principes achter TMLO en TMR. In de bovenliggende richtlijn (RMO) wordt toegelicht dat het RC-model wordt gehanteerd. In de toelichtingsdeel van de RMO staat beschreven dat informatieobjecten duurzaam toegankelijk en betrouwbaar moeten zijn. Dit doel is niet haalbaar als er achteraf metagegevens toegekend worden, zoals bij analoge bescheiden mogelijk is, maar moet al bij het ontstaan gebeuren.98 Digitale

informatieobjecten vragen om een andere benadering.

De ISO 23081, de moederstandaard van TMLO en TMR hanteert een meer-entiteitenmodel, met de entiteiten Record, Agent, Business en Mandate. TMLO en TMR zijn zelf uitgewerkt als een één- entiteitmodel, waarbij de centrale entiteit Record is. Deze toepassingsprofielen, maar ook de standaard zelf kennen geen ER-model.

4.3.2 Waardering

Het eerste verschil tussen RiC enerzijds en TMLO en TMR anderzijds, is dat bij laatstgenoemde met profielen aan de beschrijvingselementen een waardering is gegeven in vier categorieën: Verplicht (V), Verplicht indien van toepassing (v.i.v.t.), Pas toe of leg uit (P) of Optioneel (O). In TMLO en TMR zijn vier elementen verplicht en dertien verplicht indien van toepassing. Per toepassingsprofiel (TMLO of

98 Richtlijn Metagegevens Overheidsinformatie: Toelichting, raadpleegbaar via:

https://www.nationaalarchief.nl/archiveren/kennisbank/metadata. p. 3. Geraadpleegd op 10-05-2018. Hierna: RMO.

50 TMR) verschilt deze waardering, omdat dit per sector anders is.

In RiC wordt echter geen waardering aan de elementen gegeven. De motivatie voor het ontbreken hiervan is niet aanwezig. Maar in de praktijk is er veel kritiek op het ontbreken van de waardering. De Nederlandstalige commentaargroep is mening dat deze waardering noodzakelijk is, omdat de

standaard in de huidige vorm te omvangrijk is.99 De verplichte elementen zorgen voor een minimale toegankelijkheid die zowel nationaal, als internationaal gelijk is en het maakt dat de standaard werkbaar blijft. Kortom, een set verplichte elementen is nodig en gewenst om een standaard werkbaar te houden.

4.3.3 Entiteiten

In zowel RiC als in de RMO worden entiteiten gehanteerd. In de RMO zijn dit er vijf en RiC telt er veertien. In tabel 4 staan de entiteiten uit RiC en hun equivalenten uit de RMO naast elkaar. Dit aantal verschilt behoorlijk van elkaar: RiC telt er veel meer. Bogdan Popovici, lid van de EGAD, geeft daarvoor een verklaring. Hij legt in zijn nadere toelichting op RiC uit dat een uitbreiding van het aantal entiteiten nodig was, omdat er nieuwe ideeën zijn over de aard van informatieobjecten en de manier waarop de informatieobjecten met de context interacteren.100

Ook wordt onderkend dat RiC meer in overeenstemming moet worden gebracht met ISO 23081. De huidige set is vooral gericht op ISO 15489. Hoe de overeenstemming eruit gaat zien, wordt ook niet gemeld door de EGAD, maar die zit vermoedelijk in de toepassing van een meer-entiteitenmodel van ISO 23081.

Entiteiten RiC Entiteiten RMO

Record Record Record Component Record Set Documentary form Agent Actor Position Occupation Function (abstract) Function Activity Activiteit Mandate Mandaat 99 Commentaargroep, paragraaf 1d.

51 Place

Date

Concept/Thing

Relaties

Tabel 4 Overzicht van entiteiten in RiC en de equivalente entiteiten in RMO.

In het derde hoofdstuk is reeds besproken dat een deel van dit aantal entiteiten voortkomt uit een opsplitsing van eerder gebruikte elementen. Dit zorgt voor mogelijkheden om specifieker naar informatie te zoeken. Maar als deze informatie niet als zodanig bij creatie wordt vastgelegd, dan kunnen deze meer specifieke entiteiten, zoals Function en Record Component niet ingevuld worden en dan raken ze in onbruik. Er dient dus ook door de EGAD voor het nieuwe concept goed gekeken te worden naar welke gegevens andere standaarden vastleggen. En als de ene standaard specifieker is dan de ander, dan dient daar een goede onderbouwing bij gegeven te worden wat de toegevoegde waarde is van nieuwe entiteiten. Dat zorgt ervoor dat de entiteiten daadwerkelijk toegepast kunnen gaan worden.

4.3.4 Beschrijvingselementen

Om te kunnen beoordelen of een eenduidige invulling van beschrijvingselementen mogelijk is, is er ook een vergelijking gemaakt tussen de elementen van RiC en die van TMLO en TMR. In bijlage 3 is deze vergelijking op elementniveau opgenomen. Ook hier zijn de voorbeelden geselecteerd op willekeurigheid omwille van de afbakening van dit onderzoek.

4.3.4.1 Hoofdelementen

Uit de vergelijking in bijlage 3 is af te leiden dat voor bijna elk hoofdelement in TMLO en TMR (zonder verdere toevoeging van een punt gevolgd door een nummer) een passende eigenschap uit RiC beschikbaar is. De uitzonderingen zijn elementen 9 Dekking, 13 Event Plan en 14 Nationaliteit. Het eerste element heeft weliswaar geen directe equivalent in RiC, maar de TMLO subelementen 9.1 In Tijd en 9.2 In Plaats zijn wel respectievelijk in te vullen met de entiteiten Date en Place.

Het tweede element Event Plan bevat veelal informatie over het beheer van een Record. Echter is door de EGAD aangegeven dat de categorie met beheersinformatie (Control) voor de eerste versie van RiC buiten beschouwing is gelaten. Wellicht dat er in de toekomst wel een geschikte eigenschap van RiC beschikbaar komt die overeenkomt met dit hoofdelement uit TMLO en TMR. Het laatste element 14 Nationaliteit is wel in TMLO aanwezig, maar wordt niet gebruikt in TMR en ook dit element kent ook geen equivalent in RiC.

Dat elk hoofdelement uit TMLO en TMR een equivalent in RiC kent, is een positief teken. Dit betekent namelijk dat in de grote lijnen alle benodigde archivistische metadata wordt ondersteund door andere standaarden. Dit betekent dat de archivistische metadata hergebruikt kan worden, wat de werkbaarheid van de standaard ten goede komt.

52

4.3.4.2 TMLO en TMR meer gedetailleerd

In de vergelijking valt op dat sommige elementen uit TMLO en TMR meer uitgewerkt zijn dan de eigenschappen in RiC. Een voorbeeld hiervan zijn de elementen 17 Vertrouwelijkheid en 18

Openbaarheid uit TMLO en TMR. De overeenkomstige eigenschap uit RiC is P18 Conditions of access. Het doel van deze eigenschap in RiC is om uit te leggen waarom een Record niet raadpleegbaar is. Dit kan zijn omdat uit privacyoverwegingen, of omdat het Record gewoonweg nog niet openbaar mag zijn. RiC voegt hier nog aan toe dat het Record niet raadpleegbaar kan zijn omdat het stuk in slechte staat verkeerd. In RiC wordt dit element dus gebruikt voor veel verschillende restricties, en om het beheer beter uit te kunnen voeren, zou het juist praktisch zijn om deze restricties uit te splitsen, zoals nu in TMLO en TMR gebeurd. Doordat dit niet uitgesplitst kan worden in RiC, is er geen eenduidig gebruik voor dit beschrijvingselement, en daardoor is de invulling ook niet eenduidig.

4.3.4.3 RiC gedetailleerder dan TMLO en TMR

In sommige gevallen is juist RiC gedetailleerder in de eigenschappen van TMLO en TMR. Een voorbeeld hiervan is dat RiC twee eigenschappen kent voor een plaatsaanduiding, namelijk P64 Address en P65 Coördinates. Het equivalent hiervan in TMLO en TMR is element 7 Plaats. Beide eigenschappen uit RiC kennen een andere invulling: de eerste is zowel alfabetisch als numeriek, bijvoorbeeld straatnaam en huisnummer. De tweede eigenschap kent alleen een numerieke aanduiding. Door deze verschillen is een ander technisch beheer van belang en daarom is het gescheiden houden van deze informatie nuttig. Hierdoor zijn de eigenschappen van RiC beter geschikt voor digitale documenten dan TMLO en TMR en dit maakt dat deze elementen wel geschikt zijn voor een eenduidige invulling.

4.3.4.4 Knelpunten in de vergelijking

Een goede vergelijking tussen TMLO en TMR enerzijds en RiC anderzijds is lastig omdat de elementen in beide onderling grote verschillen vertonen. Veel elementen in TMLO en TMR bijvoorbeeld, worden nader gespecificeerd met een subelement Datum, zoals het geval is bij element 5 of 12. In RiC is er een entiteit Date die in relatie kan worden gebracht met een andere entiteit om deze nader te specificeren. Alhoewel beide standaarden een optie kennen om een datum toe te voegen en daarmee te specificeren, worden deze subelementen niet op dezelfde manier toegepast: tussen de entiteiten Record en Date kan een relatie worden gedefinieerd omdat het de datum van creatie van het Record is, of omdat er een andere associatie tussen de twee entiteiten is. In RiC kan er dus alleen een relatie worden gelegd tussen twee entiteiten en door middel van het woordgebruik wordt duidelijk wat de relatie tussen de twee entiteiten is. Wat echter niet mogelijk is, is een eigenschap uit RiC nader definiëren met een entiteit.

53 Een andere lastige vergelijking is de invulling van element 21 Formaat in TMLO en TMR.101 Dit

element wordt in tien subelementen opgedeeld en een deel daarvan kent een equivalent in RiC, maar een deel ook niet. Dit maakt een vergelijking lastig, want bijvoorbeeld in de omschrijving van subelement 21.3 Type wordt aangegeven dat in dit element kan worden beschreven of een bestand onderdeel uitmaakt van een groep of dat een Record uit meerdere onderdelen bestaat. Vervolgens wordt door middel van subelement 21.10 Relatie duidelijk gemaakt welke onderdelen, die allemaal apart als Record zijn beschreven, bij elkaar horen. In RiC is dit anders ingericht. Wanneer een Record uit meerdere onderdelen bestaat, bijvoorbeeld een e-mail met bijlagen, dan wordt de e-mail als entiteit Record beschreven en de bijlage als entiteit Record Component. En wanneer de Record onderdeel is van een serie, dan kan de serie nader beschreven worden met de entiteit Record Set. De methode die RiC hanteert voor onderdelen van Records is duidelijker, want door het gebruik van een andere entiteit voor dit soort gevallen is het direct helder dat een informatieobject onderdeel is van iets groters. In TMLO is de relatie een onderdeel van de Recordbeschrijving en hierdoor valt de relatie met andere gerelateerde Recordbeschrijvingen niet op, waardoor de toegankelijkheid en vindbaarheid van informatie voor gebruikers afneemt.

Uit de vergelijking van de beschrijvingselementen kan worden geconcludeerd dat RiC niet voldoende eenduidig kan worden ingevuld met metadata die nu met TMLO en TMR wordt vastgelegd. Voor een groot gedeelte zijn er wel equivalenten, maar soms is RiC ook algemener dan de twee

toepassingsprofielen. Dat RiC soms algemener is, betekent dat de elementen van RiC niet eenduidig ingevuld kunnen worden met de elementen die nu met TMLO en TMR voor handen zijn. In dat geval dienen er twee gegevens bij elkaar gevoegd te worden, om te passen. Het juist gesplitst laten, maakt het beheer ervan makkelijk, dus deze ontwikkeling is ongewenst en zorgt ervoor dat de elementen van RiC niet eenduidig ingevuld kunnen worden.

4.4 Conclusie

In dit hoofdstuk is onderzocht hoe RiC zich verhoudt tot de huidige in gebruik zijnde standaarden in de Nederlandse archiefpraktijk. Hiertoe is een vergelijking gemaakt op elementniveau tussen RiC en de set ICA-standaarden en TMLO en TMR. Deze vergelijking is met behulp van commentaren van de Nederlandse commentaargroep en InterPARES en literatuurstudie van context voorzien, waarna is beoordeeld of de geconstateerde verandering gewenst is of niet. Door de combinatie van vergelijking met de reacties vanuit het werkveld is het mogelijk om te beoordelen of de laatste twee

kwaliteitscriteria, eenduidige invulling van beschrijvingselementen met zo min mogelijk ruimte voor variatie en de werkbaarheid, worden bereikt.

54 Uit de vergelijking tussen RiC en de huidige ICA-standaarden is gebleken dat een aantal elementen opgesplitst is. Dit is voor het eerste kwaliteitscriterium, het eenduidig toepassen van de

beschrijvingselementen, in principe een stap in de goede richting. De opsplitsing levert namelijk meer duidelijkheid op, en maakt tevens de aansluiting op de digitale wereld beter mogelijk. Door binaire keuzes en vooraf ingevulde opties wordt de opname in een systeem vergemakkelijkt. Door duidelijk te hebben wat wel en wat niet onder een bepaalde entiteit of eigenschap valt, kan deze keuze worden geautomatiseerd. Dit komt ten goede aan het beschrijvingsproces: er hoeft zo minder handmatig te worden ingevuld, waardoor er efficiënter kan worden gewerkt. Echter is de opsplitsing niet geheel consequent doorgevoerd: er zijn nog elementen in RiC die opgesplitst zouden kunnen worden, zoals P5 Authenticity and Integrity Note. Echter is opsplitsing niet de enige factor die bijdraagt aan een meer eenduidige invulling: ook de definities van kernbegrippen en van de eigenschappen dragen hier aan bij. Doordat de EGAD zijn keuzes niet verantwoordt en geen

definities geeft van kernbegrippen, zijn meerdere interpretaties mogelijk. Dit is niet het doel van een standaard, daarvoor moet er juist maar een enkele interpretatie mogelijk zijn. Vandaar ook dat zowel de commentaargroep als InterPARES benadrukken dat keuzes beter dienen te worden verantwoord. De tweede kwaliteitseis vereiste dat de standaard werkbaar diende te blijven. Het beoordelen van de werkbaarheid is, zoals eerder gezegd, subjectief. Het is niet mogelijk om dit middels meetbare gegevens te toetsen. In dit onderzoek is daarom gekozen om de werkbaarheid te toetsen aan de hand van de reacties van de archiefpraktijk op RiC. Uit deze toetsing blijkt dat RiC te omvangrijk wordt bevonden in de Nederlandse praktijk, met name het onderdeel Relaties wordt hierbij

aangehaald. De bezwaren op dit onderdeel komen vooral voort uit twee onduidelijkheden. De eerste is dat het niet duidelijk is of de EGAD voor zich ziet of de relaties automatisch toegekend zouden moeten worden, of dat dit bij de archiefinstelling moet worden gedaan. De tweede onzekerheid is de vraag tot in welke mate de relaties toegekend moeten worden. Er zijn vele relaties tussen alle

entiteiten te bedenken en wanneer deze allemaal zo ver mogelijk toegekend moeten worden, dan is dat een omvangrijke klus. Daarbij is in RiC ook het aantal entiteiten met eigenschappen toegenomen en dat alles bij elkaar maakt dat deze standaard als omvangrijk wordt ervaren. De oplossing die in de reacties wordt voorgesteld is om de verschillende elementen (entiteiten, eigenschappen en relaties) van een waardering te voorzien. Dit zou aansluiten op de huidige ICA-standaarden, waarin wel een verplichte set elementen is opgenomen. Ook TMLO en TMR kennen een waardering van elementen. Een bijkomend voordeel is dat een verplichte set elementen zorgt voor een basis van

toegankelijkheid die overal hetzelfde is.

In het kort kan er worden gesteld dat RiC niet voldoet aan de laatste twee gestelde kwaliteitscriteria: het eenduidig kunnen invullen van beschrijvingselementen en de werkbaarheid van de standaard. Er

55 is nog te veel verwarring over de toepassing van de kernbegrippen en ook de elementen zelf hebben in sommige gevallen extra voorbeelden nodig om goed te kunnen worden toegepast. Ook de

werkbaarheid wordt niet beter door de grote hoeveelheid entiteiten en relaties. Onduidelijk is nu waar de grens ligt in het beschrijven en welke elementen een absoluut vereiste zijn om te voorzien in voldoende toegankelijkheid en vindbaarheid.

56

Samenvatting en conclusie

In dit onderzoek stond de vraag centraal welke bijdrage de conceptstandaard Records in Contexts zou kunnen leveren aan een kwaliteitsverbetering van het archivistisch beschrijven van digitale

documenten in Nederland. Om tot beantwoording van deze vraag te komen zijn er drie deelvragen geformuleerd, die door middel van een literatuuranalyse en interviews zijn onderzocht. In de eerste deelvraag is aan de hand van een analyse van de historische ontwikkeling nagegaan aan welke kwaliteitscriteria een nieuwe standaard zou moeten voldoen. Vervolgens is in de tweede en derde deelvraag onderzocht of Records in Contexts aan deze kwaliteitscriteria voldoet. De resultaten worden hier samengevat, om vervolgens tot de beantwoording van de hoofdvraag over te gaan. De analyse van de historische ontwikkeling, de eerste deelvraag, heeft geresulteerd in vier kwaliteitscriteria: op het conceptuele niveau moet een nieuwe standaard het vigerende model incorporeren, in dit geval is dat het RC-model. Daarnaast moet de standaard een structurering hanteren volgens het ER-model. Op praktisch niveau dient de standaard zo min mogelijk ruimte te laten voor verschillende interpretaties en moet de standaard werkbaar blijven. Aan deze eisen dient een nieuwe beschrijvingsstandaard in ieder geval te voldoen. Op conceptueel niveau bleek RiC het RC-model slechts ten dele te volgen, doordat de EGAD geen samenwerking heeft gezocht met bijvoorbeeld records managers om de standaard breed gedragen te laten zijn. De EGAD is wel van mening dat het gewenst is om de traditionele scheiding tussen archivarissen en records managers op te heffen, maar hanteert in RiC alleen archivistische principes en is er dus geen samenwerking gezocht met records managers om die scheiding daadwerkelijk kleiner te maken. Hiermee is de eerste kwaliteitseis door RiC niet gehaald.

Het ER-model wordt wel gevolgd. De EGAD licht in de inleiding van RiC toe dat deze

ordeningsmethodiek is toegepast en dit is ook goed terug te zien in de manier waarop de standaard is vormgegeven. De entiteiten kunnen door middel van binaire relaties met elkaar in verband worden gebracht. Dit is precies wat het Entity-Relationship model voorschrijft, en daarmee voldoet RiC aan deze kwaliteitseis.

Voor de beoordeling van de praktische kwaliteitseis van eenduidigheid zijn de

beschrijvingselementen van RiC vergeleken met de huidige set ICA-standaarden en TMLO en TMR, zodat de verschillen en overeenkomsten duidelijk zouden worden. Deze vergelijking is aangevuld met reacties uit de praktijk om te kunnen beoordelen of veranderingen gewenst zijn of juist niet en of er eventueel nog onduidelijkheden zijn. Uit deze analyse is gebleken dat er veel elementen uit de huidige set ICA-standaarden een meer eenduidige invulling hebben gekregen, echter er zijn nog elementen die niet opgesplitst zijn. Daarnaast is er veelgehoorde kritiek op de invulling van de

57 kernbegrippen Entity, Property en Relation. Dat geldt ook voor het feit dat de EGAD de keuzes niet verantwoordt, waardoor het doel van bepaalde veranderingen niet duidelijk is. Kortom: de

kwaliteitseis dat er zo eenduidig mogelijk, zonder variaties beschreven kan worden, is niet gehaald in RiC.

De laatste kwaliteitseis was dat de standaard werkbaar moet zijn. Hoewel deze eis een subjectieve eis is, hangt deze nauw samen met een minimale set verplichte beschrijvingselementen. Deze verplichte elementen ontbreken in RiC. Wat ook niet bijdraagt aan de werkbaarheid is de grote hoeveelheid relaties, op welke manier de gelegd gaan worden en waar de grens ligt om deze relaties