• No results found

Bijlage: gedetailleerde informatie vergelijking projecten

9 Bijlagen

9.2 Bijlage: gedetailleerde informatie vergelijking projecten

Open data-project Informatie

data.gov data.gov.uk data.overheid.nl

Historie en achtergrond Sinds februari 2009 in gebruik genomen door Vivek Kundra, de toenmalige –en eerste- CIO van de Verenigde Staten. De Amerikaanse president Barack Obama heeft meteen na zijn inauguratie werk gemaakt om de overheid transparanter te maken.

In januari 2010 is data.gov.uk gelanceerd en komt voort uit de Open Government Data (OGD) community. Hiermee is een

webportaal opgericht voor alle open overheidsdata in Groot-Brittannië. De site bevordert openheid en beschikbaarheid van data. Er zijn technische samenwerking en ondersteuning van Sir Tim Berners- Lee en professor Nigel Shadbolt.

Het Nederlandse register van Open Data (data.overheid.nl) is in

september 2011 gelanceerd. Sinds januari 2011 was er een betaversie van de website beschikbaar. Data.overheid.nl is nog in

ontwikkeling, voor 2014 staat er in een update gepland. Het portaal is expliciet genoemd in het Actieplan Open Overheid van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties.

Doel Het is een centrale website voor

Amerikaanse overheidsdata en wil openheid creëren over

overheidsinformatie en daarbij de mogelijkheid aan private partijen om met de gegevens tot innovatieve toepassingen te komen.

Openheid (transparantie) van overheidsgegevens en het beschikbaar maken van gegevens voor burgers. Op de site wordt data bij elkaar gebracht van verschillende departementen van de centrale overheid.

Data.overheid.nl is het nationale register voor Open Data binnen Nederland. De website is een initiatief van het ministerie van Binnenlandse Zaken en

Koninkrijksrelaties.

Aantal datasets Meer dan 110.000 Meer dan 18.000 unieke datasets Ongeveer 5700 datasets, maar hierop kan geen duidelijk antwoord gegeven worden.

Aantal organisaties 185 overheidsorganisaties 1192 verschillende ‘publishers’ Rond de 50 Publicatieproces Data moet voldoen aan verschillende

reglementen voordat het

gepubliceerd kan worden. Data.gov maakt alleen de data beschikbaar door links op te nemen. Zodra de

Op data.gov.uk kan geen persoonlijke informatie worden geplaatst of informatie met

staatsgevoelige informatie. Voordat een dataset wordt gepubliceerd,

Het webportaal heeft net zoals data.gov en data.gov.uk een functie om datasets bij elkaar te brengen. De informatie wordt aangeleverd, waarna het gepubliceerd wordt. Er

54 Open data-project

Informatie

data.gov data.gov.uk data.overheid.nl

website data.gov wordt verlaten, valt een bezoeker onder het beleid van die organisatie. Data.gov brengt slechts data bij elkaar voor het gemak van gebruikers en zorgt dat alles met elkaar gelinkt is.

Voordat een dataset via data.gov beschikbaar wordt gesteld, vindt er een interne check plaats van de organisatie waar de data vandaan komt. Bij data.gov zal een technisch manager nagaan of de data accuraat is en klaar voor gebruik is. Na goedkeuring, vindt er een check plaats op het Mosaic-effect. Dit wil zeggen dat er wordt gekeken of de data in alle gevallen niet tot personen herleidbaar is. Zo kan het zijn dat in dunbevolkte gebieden bepaalde cijfers rechtstreeks tot individuen kan leiden, terwijl dezelfde cijfers in grote steden voldoende anonimiteit waarborgt. De data die als Open Data wordt aangeboden, is voor een ander doel vastgelegd door organisaties.

vindt er een check plaats en wordt dit soort informatie uitgesloten. In principe is verder alle informatie die is voortgebracht door

overheidsorganisaties geschikt voor plaatsing. De informatievastlegging van de organisaties vindt uiteraard al veel langer plaats dan het openbaar maken van de gegevens als Open Data. Privacyregels zijn minder duidelijk gesteld dan bij data.gov. De datasets worden gepubliceerd in open formats en zijn gestructureerd.

vindt daarvoor wel een check plaats, dat is niet inhoudelijk, maar er wordt bekeken of de data op de juiste manier wordt aangeboden. De organisaties die de data aanleveren, zijn verantwoordelijk voor de inhoud van de datasets. Vanuit het

ministerie van Binnenlandse Zaken wordt Open Data gepropageerd en men trek “het land in” voor meer bekendheid, in de hoop dat dat ook meer datasets oplevert op

data.overheid.nl.

Wat voor dit project, maar ook de andere projecten geldt, is dat Open Data niet een doel op zich is geweest. Er is besloten om data openbaar te maken, maar origineel voor een ander doel door

overheidsorganisaties verzameld en vastgelegd.

Datakwaliteit Data moet voldoen aan verschillende reglementen voordat het

gepubliceerd kan worden.

Er worden verschillende standaarden aangehouden waaraan datasets moeten voldoen. Hiermee wordt

Er zijn zowel kwaliteitsborgen bij bronorganisaties voordat het aangeleverd wordt aan

55 Open data-project

Informatie

data.gov data.gov.uk data.overheid.nl

 Quality of Information Act (O.L. 106-554). Organisaties die data aanleveren voor data.gov hebben bevestigd dat aan deze eis is voldaan.  Section 508 US Rehabilitation

Act

 Alle informatie moet voldoen aan de vertrouwelijkheid, integriteit en beschikbare controlemaatregelen voldoen die door Federal Information Processing Standard (FIPS) en National Institute of Standards and Technology (NIST) zijn vastgesteld.

 Regels over tot personen herleidbare informatie en nationale veiligheid Een verklaring over datakwaliteit is ook terug te vinden in de metadata. In die verklaring staat of er wordt voldaan aan de Information Quality Guidlines.

De overheidsorganisaties die de data vrijgeven zijn verantwoordelijk en aansprakelijk voor de data en de kwaliteit van de data, niet data.gov.

afgedwongen dat datasets accuraat en volledig genoeg zijn. Data.gov.uk geeft geen garanties dat datasets worden aangevuld.

 Code of Practice for Official Statistics, principle 4 (sound methods and assured quality)

data.overheid.nl, als bij BZK die verantwoordelijk is voor de publicatie van de data.

Een kwestie in Nederland wat de datakwaliteit beïnvloedt, is dat het in Nederland lastig is om zonder restricties data te hergebruiken. Gegevens over download en gebruik van Open Data mogen niet worden bijgehouden, omdat dat in strijd zou zijn met restricties. Hierdoor kan er geen lering getrokken worden uit bijvoorbeeld de hoeveelheid gebruikers en hoe data wordt gebruikt.

56 Open data-project

Informatie

data.gov data.gov.uk data.overheid.nl

Data en semantic Technologies zodat gebruikers datasets kunnen vinden en verkrijgen. Het biedt meer mogelijkheden dan ‘read-only’ datasets. Al meer dan 1000 datasets zijn beschikbaar gemaakt met behulp van RDF met in totaal zo’n 6 miljard triples. Er zijn meer dan 15 duizend links naar andere Linked Data. Buiten de overheidsdata zijn deze getallen nog hoger, omdat er ook linking aanwezig is met data die niet van de overheid is.

Data.gov ziet zichzelf als trekker voor het gebruiken van Linked Data en delen van data over de wereld.

Linked Data. Samen met data.gov is data.gov.uk een van de grotere Linked Data projecten ter wereld. Hoewel Open Data veel gebruikt wordt overal ter wereld, heeft Linked Data een minder snelle doorstart gemaakt.

geringe semantische laag

aangebracht bij Open Data. Er wordt wel steeds meer gebruik gemaakt van Linked Data en net zoals bij data.gov en data.gov.uk zijn er directe lijnen met de academische wereld.

Niveau binnen vijfsterrenmodel Alle datasets zijn tenminste vier sterren (URL’s), de meeste zelfs vijf sterren omdat gelinkt zijn met andere data.

De datasets varieren van één tot vijf sterren.

De datasets varieren van één tot vier sterren.

License aanwezig? Ja, op de site is een licensing aanwezig waarin beschreven staat dat data vrij en zonder beperkingen kan worden gebruikt.

85 procent van de datasets heeft een Open License (of: Open Government License), zodat de data gratis en zonder beperkingen kan worden gebruikt. Er is daarnaast ook een ‘code of conduct’ opgesteld regels voor ontwikkelaars die data van data.gov.uk gebruiken.

Hier is in verschillende interviews anders op geantwoord. Vanuit de academische wereld wordt aangegeven dat in Nederland nog geen goed gebruik wordt gemaakt van licenties. Het ministerie van Binnenlandse Zaken geeft juist aan dat er verschillende soorten licenties worden afgegeven, zoals

57 Open data-project

Informatie

data.gov data.gov.uk data.overheid.nl

geeft het ministerie aan liever geen voorschriften te geven, omdat dat niet past binnen Open Data. Bronvermelding van de data is niet gevraagd en niet vereist, omdat gebruikers geen enkele

verplichtingen zouden moeten hebben.

Aansprakelijk Data.gov is niet aansprakelijk voor fouten in de data. Dit geldt ook als er basis van een dataset bijvoorbeeld een app is gebouwd die door gebruik kan leiden tot ongelukken. Er is geen sprake van aansprakelijkheid als de kwaliteit van de data niet goed genoeg is, waardoor gebruikers vertrouwd hebben op onjuiste data als organisaties. De enige

uitzondering hierop is wanneer er fraude heeft plaatsgevonden waardoor de datakwaliteit niet goed genoeg is.

Data.gov.uk is niet aansprakelijk voor fouten of onvolledigheden van de data.

Zie bij het hoofdstuk over beschrijving van risico’s de

aansprakelijkheid: dit is de situatie zoals die in Nederland geldt.

Provenance/metadata Ja, er wordt gebruik gemaakt van provenance en metadata. Informatie over het citeren van datasets is opgenomen in de metadata. Er is een lijst opgenomen met metadata-punten die door overheidsorganisaties mag worden uitgebreid.

Er wordt gebruik gemaakt van provenance, maar het is tegelijkertijd de grootste uitdaging. Er wordt gebruik gemaakt van metadata. Gebruikers van data van de site moeten altijd de bron vermelden

In de metadata wordt een bijsluiter geplaatst waarin wordt aangegeven hoe en waarvoor de data is

58 Open data-project

Informatie

data.gov data.gov.uk data.overheid.nl

In de metadata wordt ook informatie meegegeven over mogelijke fouten in de data (die bijvoorbeeld de datakwaliteit aantasten). Hierdoor ontstaat er een feedback-loop van bekende fouten en problemen, zodat dit ook kan worden aangepast. Ervaringen met onvoldoende

datakwaliteit?

Eigenlijk niet, er kan ook altijd direct contact opgenomen worden met de “data-eigenaar” als er onjuiste gegevens zijn gepubliceerd. Het komt niet zozeer voor dat data onjuist is, maar dat er eerder kwesties zijn in de gedetailleerdheid waarin data is bijgehouden in loop der tijd, of het verschil in velden. Ook zijn er wel eens problemen met het format waarin data is

gepubliceerd, maar dat kan

verholpen worden als contact wordt opgenomen met de eigenaar van de data. Als er fouten zijn in de data gaat het eerder om het feit dat de data niet geheel volledig is, dan dat het niet accuraat is. In de praktijk zullen burgers zelf niet snel

slachtoffer worden van onvoldoende datakwaliteit, omdat de meeste gebruikers/organisaties de datasets gebruiken voor het ontwikkelen van

Feedback is via de website meteen mogelijk naar de beheerder van de data en wordt niet rechtstreeks naar data.gov.uk verzonden.

Het webportaal maakt alleen de data beschikbaar en het is dus niet zo dat zij direct zicht hebben op fouten in de data of onvolledigheid van data. Het is wel zo dat publicerende partijen te kennen geven dat de datakwaliteit verbetert door het publicatieproces. Doordat men dan intern bezig is te beoordelen of de data gereed is voor publicatie, worden soms al fouten of onvolledigheden uit de datasets gehaald.

59 Open data-project

Informatie

data.gov data.gov.uk data.overheid.nl

toepassingen. Het gebeurt niet vaak dat burgers zelf direct in de datasets zoeken die beschikbaar zijn gemaakt. Vaak is er sprake van tussenpartijen die toepassingen maken die

vervolgens door burgers worden gebruikt. Burgers gebruiken Open Data doorgaans indirect.

Leerpunten die de partij zelf aangeeft

 Beter weten wat gebruikers (ontwikkelaars, journalisten, onderzoekers, bedrijven) nodig hebben.

 Pro-actiever zijn welke data er precies beschikbaar is,

 Thema’s op data.gov uitbreiden en bijhouden.

 Belangrijk om te weten welk doel er moet worden gediend voordat Open Data wordt gepubliceerd en je af te vragen of je dit kunt bereiken. Wat kun je als organisaties het beste openbaar maken en hoe kan ik dat doen?

 Leer van andere landen, ook als iedereen jou ziet als voorloper.

 Het voor elkaar krijgen dat nog niet gepubliceerde informatie daadwerkelijk wordt gepubliceerd.

 Provenance blijft nog steeds het grootste probleem en dus ook een leerpunt.

 Voor veel ontwikkelaars zijn Linked Data technieken zoals SPARQL en RDF een nieuw fenomeen, dus wellicht meer handleidingen.

 Wegnemen van weerstand bij verschillende

overheidsorganisatie als het gaat om Open Data.

 Pro-actief zijn in

bekendmaken met doelen en voordelen die Open Data kan bieden.

 Het verzamelen van statistieken om meer te weten te komen over hergebruik van Open Data, hoewel dit een lastig punt is waarover nog discussie is. Een groep is voor, omdat je er van kunt leren en Open Data beter kunt afstemmen op gebruikers. Er is ook een groep tegen, omdat het niet zo horen en je gebruikers niet restrictievrij en zonder voorwaarden data laat

60 Open data-project

Informatie

data.gov data.gov.uk data.overheid.nl

gebruiken. Hergebruik wordt gedefinieerd als succes van Open Data, maar er is geen zicht op hergebruik.

Tabel 1: informatie interviews over Open Data-projecten

Bronnen behorende bij bovenstaande tabel:  Interviews

o Jeanne Holm, data evangelist data.gov, en Chief Knowledge Architect, NASA

o Paul Suijkerbuijk, projectleider Open Data en Imke Arts, beleidsmedewerker o.a. visie en strategie Open Data, Ministerie van Binnenlandse Zaken en Koninkrijksrelaties

o Joris Hulstijn, assistent professor Technology Policy and Management,Technische Universiteit Delft, o Pim Boers, onderzoeker, Algemene Rekenkamer

o Hayo Schreijer, projectleider Open Data en Linked Data, Kennis- en Exploitatiecentrum Officiele Overheidspublicaties o Laurens Rietveld, promovendus Knowledge Representation and Reasoning, Vrije Universiteit Amsterdam

o Rinke Hoekstra, postdoc onderzoeker Knowledge Representation and Reasoning, Vrije Universiteit Amsterdam o Rense Posthumus, beleidsadviseur o.a. Open Spending, Ministerie van Financiën

 Informatie verkregen naar aanleiding van interviews:

o Artikel US Government Linked Open Data: Semantic.data.gov (Hendler, Holm, Musialek, & Thomas, 2012) o Presentatie John Sheridan, Head Legislations Great-Britain (W3C, 2010)

61