• No results found

Watermerken maken gebruik van verschillende eigenschappen, zoals waarneembaarheid, capaciteit, robuustheid en beveiliging.126 Deze eigenschappen zijn niet altijd complementair maar vormen vaak een trade-off die voor een belangrijk deel afhankelijk is van de gewenste toepassing. Zo is de capaciteit van het watermerk van invloed op de waarneembaarheid ervan. Bij de inzet van watermerken zal men derhalve keuzes moeten maken in de functie van het doel dat men met de inzet van het watermerk beoogt te bereiken.127 Een uniform pakket van eisen is om die reden dan ook lastig te geven. In deze paragraaf worden verschillende

126 Petitcolas, Anderson & Kuhn 1999; Hartung & Kutter 1999; Langelaar, Setywan & Lagendijk 2000, p. 21. Cox, e.a. 2007, p. 36 onderscheiden er tien. Een aantal van deze eigenschappen is door mij vanwege het overzicht samengebracht in paragraaf 2.4.1 (embedden en detectie).

47 eigenschappen besproken die van invloed zijn op de keuze voor een bepaalde watermerktechniek. Men mag immers niet vergeten dat de keuzes die zijn gemaakt van invloed zijn op de betrouwbaarheid van het watermerk als bewijsmiddel. Daarnaast heeft deze paragraaf als doel de verschillende onderwerpen van de (huidige) watermerkliteratuur, veelal in de vorm van papers, een plaats te geven voor juristen. Voor uitgebreidere informatie (over elkaar bijtende eigenschappen van watermerken) wordt verwezen naar andere literatuur.128 De eerste twee subparagrafen over detectie en embedden (zie hieronder) sluiten aan bij de eerder in paragaaf 2.3 genoemde fasen. De subparagrafen behandelen enkele keuzes ten aanzien van technieken die worden gebruikt bij het embedden en detecteren van watermerken. Deze paragraaf begint met een beschrijving van detectiesystemen omdat de keuze voor een embed- en detectie-algoritme onder meer afhankelijk is van de wijze van detectie. 129 De daarop volgende paragrafen behandelen keuzes die gemaakt moeten worden ten aanzien van achtereenvolgens de waarneembaarheid, capaciteit, robuustheid en beveiliging. De laatste eigenschap die wordt besproken betreft de keuze ten aanzien van kosten van watermerken. Voor het overzicht wordt de paragraaf afgesloten met enkele conclusies.

2.4.1 Detectie

Ten aanzien van de detectie van watermerken worden in de literatuur drie soorten watermerksystemen onderscheiden. Het onderscheid ziet op de vraag wat er nodig is om het watermerk te extraheren.130 Ten eerste de zogenoemde private of non-blind watermerk-systemen.131 Deze systemen maken voor de detectie van het watermerk gebruik van het (niet gewatermerkte) origineel of informatie daaruit en wordt ook wel aangeduid als geïnformeerde detectie (Informed Detection).132 Het (non-blind) detectie-algortime heeft met andere woorden een directe toegang nodig tot het originele bestand en is derhalve ook alleen te gebruiken wanneer toegang tot het origineel mogelijk is. Dit betekent in de regel dat er een databank nodig is. Deze detecteeralgoritmen worden in de literatuur afgekort tot non-blind detection. In relatie tot de andere nog te noemen systemen zijn deze het meest robuust. Voor een aantal applicaties of toepassingen is een dergelijk systeem echter niet mogelijk of wenselijk.133 Dit geldt met name voor grote collecties waarvoor dan tevens alle originele bestanden moeten worden bewaard in een databank en kunnen worden opgeroepen bij de detectie. Dit vereist de nodige opslagcapaciteit. Zo is het bijvoorbeeld bij video niet praktisch

128 Zie voor een overzicht o.m. Raj & Ali 2012; Cox e.a. 2008 die in bijna 600 pagina’s meerdere systemen van watermerken beschrijven. Veel watermerkliteratuur is in de vorm van papers ook online raadpleegbaar.

129 Zie voor voorbeelden en overzichten van algoritme o.m. Cox e.a. 1997; Swanson, Kobayashi & Tewfik 1998; Wang, Doherty & Dyck 2002; Shieh e.a. 2003 ; Cox, e.a. 2007, p. 137.

130 Kutter & Petitcolas 1999, p. 227; Katzenbeisser & Petitcolas 2000, par. 5.3, p. 103; Langelaar, Setywan & Lagendijk 2000, p. 22.

131 Ook aangeduid als Nonoblivious watermarking (Langelaar 2000 (diss.) par. 1.2, p. 4; Langelaar, Setywan & Lagendijk 2000, p. 22.).

132 De terminologie van privaat en publiek refereert de toepassing van het watermerksysteem en daarmee naar de vraag of een selecte (private) in staat moet worden gesteld om het watermerk te detecteren of dat iedereen (public) moet kunnen. Omdat originele objecten in beginsel alleen beschikbaar zijn bij private toepassingen kan de informed detection niet plaatsvinden in bij publieke watermerksystemen.

48

om gebruik te maken van de originele film omdat daarvoor een (te) grote hoeveelheid data moet worden verwerkt.

Een tweede type systeem is de semi-blind of semi-private. Dit systeem maakt voor het antwoord op de vraag of het gast-object een watermerk bevat geen gebruik van het origineel maar enkel van het gewatermerkte bestand.134 Beide systemen kunnen en worden mede vanwege de robuustheid toegepast voor het bewijs van eigendom (authenticiteit) en fingerprinting voor identificatie van de licentienemer of gepirateerde kopieën.

Het laatste en derde type watermerksysteem is het zogenoemde blinde of publieke watermerksysteem waarbij zowel het origineel als het gewatermerkte gastobject niet nodig zijn om de eerder genoemde vraag naar detectie van het watermerk op te lossen (blind detection).135 Deze techniek wordt met name ingezet voor kopieerbeveiliging, indexering en tracering. De (blind) extractie-algoritmen hebben in dit geval geen toegang nodig tot het origineel en worden in de literatuur afgekort tot blind detectors.

Watermerksystemen die, zoals in dit onderzoek, het mogelijk moeten maken om veel bestanden snel van een watermerk te voorzien en te kunnen detecteren en bedoeld zijn voor de authenticatie en tracing zullen in de regel gebruik maken van semi dan wel blinde of publieke watermerksysteem en daarbij gebruik maken van blind detection. Dit gaat weliswaar ten koste van de robuustheid, maar bespaart op de aanwezigheid van het origineel en maakt een hogere detecteersnelheid mogelijk. Voor de toepassing hiervan op het internet is het van belang dat wanneer er bij de opsporing van (vermeend) inbreukmakend materiaal gebruik wordt gemaakt van applicaties zoals webcrawlers de extractie van het watermerk niet te complex mag zijn om het watermerk snel en goed uit te kunnen lezen.

Een succesvol watermerk is uiteindelijk een watermerk dat na detectie resulteert in een (positieve) detectie.136 De effectiviteit van het systeem is de kans op detectie na embedding en voor latere verstoringen, zoals aanvallen of transmissie (effectiveness rate). Een honderd procent score is alleen mogelijk tegen hoge kosten in relatie tot de andere eigenschappen. Afhankelijk van de gewenste toepassing zal de gebruiker een afweging moeten maken. Zo zal een website, die duizenden foto’s per dag wil voorzien van een watermerk om later duidelijk te kunnen maken wie als rechthebbende is aan te merken (proof of ownership), hoge eisen stellen aan de (on)waarneembaarheid van het watermerk.137 Wanneer men zou besluiten om watermerken in te zetten zal men een keus moeten maken tussen het toestaan van meer verstoring of meer effectiviteit in de vorm van een hogere kans op detectie. De effectiviteit

134 Dat betekent dat de uitgever van het watermerk voor de detectie een kopie van het gewatermerkte bestand moet bewaren. Ook bij deze systemen zijn er referentiecijfers nodig maar deze zijn in aantallen veel kleiner dan bij niet-blinde technieken.

135 Ook aangeduid als Oblivious watermarking door Langelaar 2000 (diss.), p. 4; Langelaar, Setywan & Lagendijk 2000, p. 22.

136 Zie o.m. Cox, e.a. 2008, p. 37.

49 kan op een aantal wijzen worden gemeten, zoals analytisch of empirisch door een serie testen uit te voeren bij een serie foto’s die vanzelfsprekend voldoende representatief moet zijn en uitgevoerd in het verwachte of gebruikte proces.138

Een ander belangrijk aspect van detectie betreft zoals eerder genoemd, de zogenoemde fout-positief of false positive.139 Bij een fout-positief geeft de detector ten onrechte aan dat het object een watermerk bevat. Het aantal te verwachten fout-positieven in een bepaald aantal runs van de detector wordt aangeduid met de term ‘fals positive rate’.140 Een dergelijke verwarring kan ontstaan doordat de detectiealgoritmen zelf ook werken op basis van kansberekening. Aan de mate van zekerheid worden door de onderzoekers grenzen gesteld, zodat het antwoord ‘heel zeker’ wordt. Aan de hand van verschillende parameters kan de rechthebbende tot een zekere hoogte zelf bepalen wat de kans is op een fout-positief resultaat. Zo kan hij onder meer op basis van het aantal gebruikers zelf bepalen wat de kans is op een valse identificatie. In de praktijk zal bepaald moeten worden welk kans op een fout-positief (tegen welke andere kosten) aanvaardbaar is en zal er uiteindelijk een keuze worden gemaakt.

2.4.2 Embedden

Watermerksystemen die het mogelijk maken om veel bestanden snel van een watermerk te voorzien, te kunnen detecteren en bedoeld zijn voor authenticatie en tracing zullen in de regel gebruik maken van semi dan wel blinde of publieke watermerksysteem en daarbij gebruik maken van zogeheten blind detection (par. 2.4.2). Er kunnen drie verschillende soorten algoritme voor blind embedding worden onderscheiden: hard embedding, informed embed-ding en informed encoembed-ding.

De meeste basisalgoritmen kunnen geclassificeerd worden als hardembedding technieken. Bij deze techniek creëert het algoritme een willekeurig patroon zonder gebruik te maken van (informatie over) het originele bestand. Dit patroon vormt het watermerk en wordt dan aan het gastobject toegevoegd.

Informed embedding technieken creëren eveneens onafhankelijk van het originele bestand een patroon maar embedden dit partroon (watermerk) afhankelijk van het origineel. Bijvoorbeeld door het watermerk te plaatsen daar waar de vertekening door het embedden van het watermerk minder opvalt en daardoor sterker is.

De informed encoding technieken brengen één watermerk aan, waarbij gekozen kan worden uit een reeks watermerken waarbij je datgene kiest dat het beste “past” bij het cover work. Op

138 Voor voorbeelden van een analytische benadering zie o.m. Cox e.a. 2008, p. 250.

139 Cox e.a. 2007, p. 39. Zie ook par. 2.3.3.

140 Miller, Cox & Bloom 1998, p. 75. Cox, e.a. 2007, p. 39. Ook hier bestaat een trade-off tussen de false positive rate en het aantal gemiste detecties zoals bij iedere detector het geval is. Een verlaging van de false positive rate leidt er doorgaans dan ook toe dat er een verhoging optreedt van het aantal gemiste detecties. Zie o.m. TNO 2010, p. 32.

50

basis van informatie over het originele bestand wordt gekozen welk watermerk het best functioneert.

Alle voorgaande technieken maken op een verschillende wijze en in verschillende fases gebruik van het origineel (coverwork). De informed embedding codes maken daarbij gebruik van het gast-object tijdens het creëeren van het watermerk. Informed encoding technieken maken gebruik van het gastobject zowel tijdens het creëeren van het watermerk als tijdens het embedden daarvan. Kennis van het gastobject is niet alleen nodig om te beoordelen of het voldoende opslagcapaciteit biedt, maar ter beoordeling van de mate van verstoring of ruis (interference or noise) die op kan treden. Het gaat hier om de capaciteit om op de meest betrouwbaar wijze informatie te transporteren door een specifiek kanaal (Channel capacity).141 Zo kan verstoring optreden door het embedden van een watermark, maar ook door het verspreidingskanaal.142

Iedere embeddingstechniek kan worden toegepast op representaties van beelden, audio of video in verschillende domeinen, zoals ruimtelijk (spatial), tijd (time), frequentie (frequency) en wavelet domeinen. Verschillende transformaties maken het mogelijk om de representaties als het ware naar een ander domein te vertalen. Voor beelden wordt vaak gebruikt gemaakt van het ruimtelijke domein waar de waarde voor iedere pixel is gegeven. Deze waarden representeren de kleur van de pixel die weer in verschillende waarden kan worden weergegeven zoals RGB, YUV, etc. In het frequentiedomein worden verschillende grootheden voor verschillende frequentie componenten berekend met behulp van

141 Deze term wordt met name gebruikt in de computerwetenschappen, electrotechniek en informatietheorie.

142 Zie o.m. Pierre Moulin, Joseph A. O’Sullivan, Information-Theoretic Analysis of Watermarking; Koch, E. and Zhao, J., Towards Robust and Hidden Image Copyright Labeling, presented at IEEE Workshop on Nonlinear Signal and Image Processing, 1995.

Watermerken

Digitaal Analoog

Waarneembaar Onwaarneembaar

Blind Non-Blind

Hard embedding Informed embedding Informed encoding

Soort

Zichtbaarheid

Soort detectie

Soort embedding

51 verschillende relaties of transformatie(formules), zoals Discrete Fourier Transform (DFT), Discrete Cosine Transform (DCT), Block-based Discrete Cosine Transform (Block based DCT) en Fourier-Mellin Transform. Een ander veelgebruikt domein is het wavelet domein waar coëfficiënten van de wavelettransformatie veranderd worden in verschillende schalen, zoals Haar-transform of Daubechies wavelets. Deze wavelettransformaties bieden in beginsel goede weerstand tegen compressietechnieken.143

2.4.3 Waarneembaarheid

Een belangrijke eigenschap voor onzichtbare watermerken is de waarneembaarheid (perceptual transparancy or fidelity).144 Onwaarneembare watermerken krijgen dan ook veel aandacht in de literatuur. Het embeddingsalgoritme moet het mogelijk maken om zonder noemenswaardig kwaliteitsverlies het watermerk in het gastobject aan te brengen. Het gaat hier om de vraag of er sprake is van een door mensen waarneembaar verschil tussen het origineel en het gewatermerkte object (Just Noticeable Difference; JDN).145 In de literatuur spreekt men ook wel over de mate waarin vertekening optreedt door de inzet van watermerktechnieken. Als gevolg van de testkosten zijn modellen ontwikkeld die het menselijk oog nabootsen zoals het Human Visual System (HVS).146

De waarneembaarheid is van belang voor zowel de commerciële waarde als voor de kwaliteit van de bescherming van het object. Voor de commerciële waarde is het van belang dat de kwaliteit zo hoog mogelijk is.147 De mate van de gewenste kwaliteit kan per toepassing verschillen. Zo wordt het verschil tussen het origineel en het gewatermerkte object van audio op AM-radio onwaarneembaar vanwege de lage kwaliteit van de uitzendtechnologie. Bij uitzendingen in HDTV of DVD (audio en video) is de kwaliteit veel hoger en zullen er hogere eisen moeten worden gesteld aan de waarneembaarheid.148

Voor de bescherming is het van belang dat het watermerk niet waarneembaar is omdat het daardoor lastiger te verwijderen is. Zelfs op het oog onwaarneembare veranderingen worden zichtbaar wanneer men het gewatermerkte object en het origineel kan vergelijken. De eindgebruiker zal in het algemeen niet beschikken over het origineel en daardoor deze vergelijking niet kunnen maken.149 Ook hier zijn keuzes afhankelijk van de toepassing en de

143 Het zal duidelijk zijn dat in het verslag een expert duidelijk zal moeten maken wat de waarde is van de verschillende technieken. De waarde ervan zal mede afhangen van de vraag waar het watermerk toe dient.

144 Perceptual transparancy (Langelaar, Setywan & Lagendijk 2000, p. 21); Imperceptibility (Kutter & , Hartung 2000, p. 106); Cox, e.a. (2007 p. 36) drukken dit uit in fidelity als ‘the perceptual similarity between the unwatermarked and watermarked Works at the point at which they are presented to a consumer’.

145 Swanson, Kobayashi & Tewfik 1998, p. 1066; Langelaar, Setywan & Lagendijk 2000, p. 21; Niu e.a 2010.

146 Meetingen worden o.m. verricht in termen van Mean Squared Error (MSE), Signal-to-Noise Ratio (SNR), Peak Signal-to-Noise Ratio (PSNR) of Structural Similarity (SSIM), mean squared error (MSE), signal-to-noise ratio (SNR), peak signal-to-noise ratio (PSNR), structural similarity (SSIM). Zie o.m. Delaigle, Vleeschouwer & Macq 1998; Eyadat & Vasikarla 2005; Zhu & Liu 2009

147 Zie o.m. Carver, Yeo & Yeung 1998, p. 47.

148 Cox e.a., p. 38

52

gewenste eigenschappen. Zo kan een filmmaatschappij in zijn productieproces ervoor kiezen om in de beginfase van de productie de zichtbaarheid van watermerken in het ruwe materiaal toe te staan in ruil voor een hogere robuustheid of lagere kosten.

Voor onzichtbare watermerken is het derhalve van belang dat de veranderingen niet door mensen kunnen worden waargenomen en dat het gewatermerkte object niet kan worden vergeleken met het origineel.

2.4.4 Capaciteit

Het laadvermogen of capaciteit (payload, capacity) van een watermerk ziet op de hoeveelheid bits die nodig zijn om het watermerk zonder waarneembaar kwaliteitsverlies aan te brengen in het gast-object.150 Het gaat met andere woorden om de hoeveelheid informatie die in het gewatermerkte bestand kan worden aangebracht. Afhankelijk van zowel het doel als het soort gastobject (audio, video, afbeeldingen) moet worden bepaald hoeveel bits nodig en wenselijk zijn.151

Bij veel toepassingen dient het detectiemechanisme twee functies. Ten eerste moet het duidelijk maken of er een watermerk aanwezig is in het gast-object en bij een positieve uitslag moet het ten tweede de boodschap kunnen detecteren.152 De capaciteit van het watermerk is direct van invloed op andere eigenschappen, zoals de zichtbaarheid en robuustheid van het watermerk, maar ook op de embedding en detectie.153 In de literatuur wordt aangenomen dat er een mate van standaardisatie gewenst zal zijn in de hoeveelheid te embedden gegevens zoals bij de International Standard Recording Code (ISRC, 12 nummers) dat bestaat uit een code voor het land, eigenaar, jaar van opname en een serienummer.154 Daar zou het jaar van auteursrecht (© 2012), de verleende toestemming (licentievoorwaarden) en de waardering aan toe moeten worden gevoegd. Dit zou voor deze informatie neerkomen op 60 tot 70 bit aan informatie in het gast-object.155 Langelaar, Setywan & Lagendijk wijzen daarbij tevens op de granulariteit van watermerken dat verwijst naar de hoeveelheid data dat nodig is om één eenheid informatie (watermerk) te embedden en te detecteren.156 Centraal staat daarbij de

150 Zie o.m. Langelaar, Setywan & Lagendijk 2000, p. 21; Cox e.a., p. 38. Bij audio ziet dit op het aantal bits dat per seconde getransporteerd wordt. Bij foto’s ziet dit op het aantal bits dat in de afbeelding (host-data) en bij video op het aantal bits per veld of frame of het aantal per seconde. Watermerksystemen die N bits coderen worden N-bit watermerken genoemd.

151 Zie voor een verdere uitwerking o.m. Langelaar, Setywan & Lagendijk 2000, p. 21; Cox e.a., p. 38 en de daar aangehaalde literatuur.

152 Zie o.m. Kutter & Petitcolas 1999, p. 9 (online versie); Cox e.a. 2008, p. 38 Deze watermerksystemen worden ook wel aangeduid als one-bit of zero-bit watermerk(systemen) omdat er twee mogelijke uitkomsten zijn: aanwezig of afwezigheid van een watermerk. Andere systemen worden ook wel aangeduid als multiple-bit of non-zero-bit systemen.

153 Kutter & Petitcolas 1999, p. 227; zie ook par. 2.4.1.

154 Kutter & Petitcolas 1999, p. 227; Langelaar, Setywan & Lagendijk 2000, p. 21

155 Fridrich and Goljan 1999; Kutter & Petitcolas 1999, p. 227; Langelaar, Setywan & Lagendijk 2000, p. 21. Zie ook Cox e.a. 2008, par. 2.3.3, p. 38 voor voorbeelden in het kader van copycontrol.

156 Langelaar, Setywan & Lagendijk 2000, p. 21. Granulariteit ziet op de mate waarin een groter geheel wordt opgesplitst in kleinere onderdelen.Granuliteit wordt ook wel omschreven als de kleinste eenheid waarin nog

53 verdeling van het watermerk. Stel dat het embedden van 70 bits aan informatie wordt verspreid over één videobeeld of verspreid over bijvoorbeeld 100 videobeelden.157 De verspreiding over 100 is niet wenselijk omdat iedereen die maar 70 videobeelden gebruikt ervoor kan zorgen dat het watermerk niet meer te detecteren of te interpreteren is. Bij digitale video’s wordt in de literatuur één seconde als kleinste auteursrechtelijke entiteit gezien.158 Het watermerk zal geëmbed moeten worden in minder dan één seconde (fragment) van de video, dat veelal samenvalt met 25 videobeelden (frame rate). De bitrate zal dan hoger worden dan 70 bits/s.

Vanwege de onvermijdelijke trade-off lijkt het voorkeur te verdienen om de boodschap te laten bestaan uit een code die weinig ruimte inneemt en door middel van een databank naar de licentienemer verwijst. De eerder genoemde traitor tracingscodes van Tardos (par. 2.3.1.) bieden op dit moment de beste code.

2.4.5 Robuustheid

Robuustheid (robustness) ziet op mogelijkheid om het watermerk te detecteren na het verwerken van het signaal.159 Robuustheid van een watermerk ziet met andere woorden op de capaciteit van watermerken om bewuste dan wel onbewust aanvallen te overleven. Het belang van robuustheid wordt bepaald door de gewenste toepassing. Voor het aantonen van de authenticiteit van het gastobject wordt vaak gebruikt gemaakt van fragiele watermerken. Deze watermerken hebben als voornaamste kenmerk dat de robuustheid met opzet afwezig is. Iedere verandering leidt bij deze watermerken tot aantasting of verwijdering van het watermerk waardoor later kan worden aangetoond dat het niet langer authentiek is.160

Voor toepassingen waarbij het watermerk belangrijke informatie bevat, zoals informatie over de licentienemer is wel van belang dat het watermerk in het gast-object blijft en dus voldoende robuust is. Het moet met andere woorden met name in staat zijn om voldoende weerstand te bieden tegen bewuste aanvallen die gericht zijn op de aantasting of verwijdering