• No results found

GDPR Workshop "Anonimiseren en pseudonimiseren"

N/A
N/A
Protected

Academic year: 2022

Share "GDPR Workshop "Anonimiseren en pseudonimiseren""

Copied!
25
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

GDPR

Workshop "Anonimiseren en

pseudonimiseren"

(2)

Inleiding

(3)

Definities

Pseudonimiseren

Bescherming tegen directe identificatie Data minimalisatie

Anonimiseren

Bescherming tegen directe + indirecte identificatie

Soms moeilijk te anonimiseren

(4)

Pseudonimiseren vs. anonimiseren

Dataverzameling, controle en koppeling

Opmaken van de statistieken

Onderzoekers

(vertrouwelijkheidscontract)

(5)

Public use files

Momenteel enkel 2 PUFs, via Eurostat:

https://ec.europa.eu/eurostat/cros/content/puf-public-use- files_en

“The files are prepared in such a way that individual entities cannot be identified; this goes with a loss in information value”.

Loss  Big loss !

(6)

Pseudonimiseren

(7)

Pseudonimiseren

Vernietiging van alle directe identificatiemiddelen (naam, …), behalve het unieke identificatienummer (bv: rijksregister

nummer), dat wordt omgezet in een "pseudoniem".

3 mogelijke technieken voor omzetting 1. Correspondentietabel

2. Encryptie van de identificatie

3. Hash function + salt

(8)

Hash function + salt

Salt = zeer lange “geheime code”

Arbitraire_code = Md5(uniek_identificatienummer, Salt)

(9)

Hash function + salt

Eenvoudig te programmeren (in elke programmeertaal)

Pseudoniem

 sleutel van 32 karakters (kleiner in base64)

 mogelijk om grootte van de sleutel te reduceren tot 16 karakters zonder risico op overlap

create table output.TF_CENSUS as

select %md5_of(variable=NR_RIJKSREGISTER,secret_key=&salt) as ID_PSEUDONYM length=32,

… lijst van variabelen (alleen maar indirect identifiers + analyse variabeleen) … from input.TF_CENSUS

order by 1;

(10)

Beheer van salts

Link tussen verschillende tabellen mogelijk

 zelfde salt

 nuttig, bv. voor panels

Link tussen verschillende tabellen onmogelijk

 verschillende salts

 nuttig als de onderzoeker meerdere aanvragen over de tijd

heeft ingediend

(11)

Anonimiseren

(12)

Risico’s bij microgegevens

1. Heridentificatie  zie https://cpg.doc.ic.ac.uk/individual-risk/

2. Mogelijkheid om informatie over iemand af te leiden

(13)

Beschermingsmethodes

Veralgemenen

Noise addition

 Nauwkeurigheid attribuut ↓

 Algemene distributie blijft dezelfde

Permutation

 Verwisselen waarden van attributen tussen individuen

 Range en distributie blijven dezelfde

(14)

Concepten

K-anonimity

Minstens k individuen met hetzelfde profiel

L-diversity

Binnen elke klasse moeten alle attributen minsten L verschillende waarden hebben

(15)

Tools

Micro-gegevens

 Mu-Argus

 SdcMicro (R package)

Aggregaten

 Tau-Argus

 SdcTable (R package)

(16)

Lectuur

Handbook on statistical disclosure control

http://neon.vb.cbs.nl/casc/SDC_Handbook.pdf

 onze « Bijbel »

“Estimating the success of re-identifications in incomplete datasets using generative models”, Luc Rocher, Julien M.

Hendrickx & Yves-Alexandre de Montjoye, 2019, Nature Communications

 generative copula-based method that can accurately

(17)

Data-aanvragen

(18)

Procedure aanvragen microdata

Contacteer uw Statbel-statisticus of statbel@economie.fgov.be

Dien na het contact een formele data-aanvraag in:

 Document met aanvraagformulier, contract en conformiteitsverklaring:

https://statbel.fgov.be/nl/over-statbel/privacy/microdata-voor-onderzoek

 De formele aanvraag moet ondertekend zijn door de verwerkingsverantwoordelijke (of DPO).

 De verwerkingsverantwoordelijke is de wettelijke vertegenwoordiger van de organisatie die verantwoordelijk is als er iets mis gaat.

 Documenten indienen in Word en PDF via statbel.datarequests@economie.fgov.be

(19)

Volledig en correcte aanvraag

Aantonen dat de finaliteit enkel statistisch en wetenschappelijk onderzoek is. Geen administratieve gevolgen voor de betrokkenen.

• Administraties dienen aan te geven welke technische en

organisatorische maatregelen ze nemen om dit te garanderen.

• Beleidsvoorbereidend onderzoek valt ook onder deze finaliteit.

De wettelijke basis vermelden indien er een is.

Enkel gepseudonimiseerde gegevens vragen (geen directe identificatie).

Duidelijk aangeven als er een koppeling is met gegevens van andere leveranciers, hun goedkeuring en wie er optreedt als vertrouwde derde.

Er is een verkorte procedure indien het gaat om een verlenging of uitbreiding van een bestaande overeenkomst.

(20)

Microdata as a service

Officiële data-

aanvraag Advies Beslissing

DPO Verzenden

contract

 In 2019 al een 80-tal aanvragen behandeld.

 Snelle en efficiënte administratieve afhandeling van de aanvraag.

 Multidisciplinair team (DPO, jurist, statistici en DWH)

 Bij vragen ivm de datalevering

statbel.datarequests@economie.fgov.be

(21)

Trusted third party

(22)

Koppelen van gepseudonimiseerde gegevens

Omwille van privacy redenen gebeurt wetenschappelijk onderzoek op basis van gepseudonimiseerde gegevens.

Voor sommige onderzoeken is het noodzakelijk om gegevens van verschillende bronnen te koppelen.

Het is niet mogelijk om gepseudonimiseerde gegevens te koppelen.

Wetgever voorziet dat voor de koppeling een beroep kan gedaan worden op een vertrouwde derde - Trusted Third party - TTP

(23)

Wet van 30 juli 2018

Artikel 202

 §1 Als meerdere bronnen moeten gekoppeld worden zijn er twee mogelijkheden voor het anonimiseren of pseudonimiseren van gegevens:

• Optie 1: door één van de verantwoordelijken voor de oorspronkelijke verwerking.

• Optie 2: door een derde vertrouwenspersoon (TTP)

 § 2. Als meerdere bronnen moeten gekoppeld worden waarvan tenminste één van gevoelige gegevens:

• Optie 1: door de verantwoordelijke voor de oorspronkelijke verwerking van gevoelige gegevens

• Optie 2: door een derde vertrouwenspersoon (TTP)

(24)

Werkwijze

In België zijn Statbel, het DWH van de KSZ en E-Health erkend als TTP.

 Onderzoekers moeten de intentie tot koppeling met andere bronnen en het beroep doen op een TTP expliciet vermelden bij hun data-aanvraag.

Een TTP kan pas optreden als er een uitdrukkelijke toelating is van de leveranciers van de te koppelen bronnen.

De TTP:

 Ontvangt de niet-gepseudonimiseerde gegevens van alle te koppelen bronnen.

 Koppelt de verschillende gegevens.

 Pseudonimiseert het gekoppelde bestand

(25)

Voorbeeld van een traject

Referenties

GERELATEERDE DOCUMENTEN

Nu is Biggs echter verantwoordelijk voor strategievorming, new business en externe zaken, terwijl zijn co-leiders, Vice Chairman Martin Leibowitz, leiding geeft aan de

In het validatiescherm kan per pagina gecheckt worden of alle woorden juist gemarkeerd zijn en waar mogelijk moet worden aangepast. Naarmate de gebruiker de regels beter en

 Stelling 2 - We moeten pseudonieme en/of anonieme gegevens kunnen delen in het kader van een publicatie..  Stelling 3 - We verwerken pseudonieme gegevens in onderzoek, dus we

̶ […] Gepseudonimiseerde persoonsgegevens die door het gebruik van aanvullende gegevens aan een natuurlijke persoon kunnen worden gekoppeld →

Met dit verdiepende keuzedeel doet de beginnend beroepsbeoefenaar kennis en vaardigheden op waarmee zij een inspirerend, relevant en passend aanbod voor de kinderen kan vormgeven

§ bezit brede kennis van samenstelling, werking, onderhoud, storingen en montagevoorschriften van hydromotoren, pompen, hydraulische componenten, apparatuur en installaties toegepast

Auto-poule oude duiven eendaagse fond vervalt. Auto-poule oude duiven: A29 St. Men hoeft alleen maar aantallen op te geven. Op deze vlucht tellen de bovenste getekenden van het

§ bezit brede en specialistische kennis van de werking van samengestelde en complexe componenten in dieselmotoren. § bezit kennis van begrippen met betrekking tot het koelproces