• No results found

Style characterization of machine printed texts - Samenvatting*

N/A
N/A
Protected

Academic year: 2021

Share "Style characterization of machine printed texts - Samenvatting*"

Copied!
3
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

UvA-DARE is a service provided by the library of the University of Amsterdam (https://dare.uva.nl)

UvA-DARE (Digital Academic Repository)

Style characterization of machine printed texts

Bagdanov, A.D.

Publication date

2004

Link to publication

Citation for published version (APA):

Bagdanov, A. D. (2004). Style characterization of machine printed texts.

General rights

It is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons).

Disclaimer/Complaints regulations

If you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, stating your reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please Ask the Library: https://uba.uva.nl/en/contact, or a letter to: Library of the University of Amsterdam, Secretariat, Singel 425, 1012 WP Amsterdam, The Netherlands. You will be contacted as soon as possible.

(2)

Samenvatting* *

Inn dit proefschrift zijn drie meetbare stijlelementen in gedrukte documenten onderzocht. Déé visuele stijl van een document maakt onmiddellijke indruk op de lezer, en maakt hett mogelijk dat in één oogopslag onderdelen van een document onderscheiden kunnen wordenn zonder analyse van de onderliggende structuur. Daarnaast is de structurele

stijlstijl een maat voor de organisatie van de inhoud van een document in homogene delen,

hunn fysieke dimensies, en hun onderlinge samenhang. Tot slot omvat de textuelé stijl dee karakteristieke vorm van de verschillende elementen binnen homogene delen, de stijll van regels tekst, de woorden, en de daarin bevatte karakters. De combinatie van dezee stijlelementen leidt tot impliciete regels die schrijvers en vormgevers gebruiken om gegevenss in documenten te coderen, zodanig dat lezers deze informatie weer kunnen ontcijferen.. Door karakterisering van in gedrukte documenten toegepaste stijlelementen kunnenn deze impliciete stijlregels worden aangewend in documentbegripssystemen.

Dee gecombineerde verzameling van stijlelementen wordt in dit proefschrift aange-duidd met de term document genre. Ben document genre is een categorie van do-cumentenn die gekarakteriseerd wordt door een overeenkomst in expressie, stijl, vorm, off inhoud. De textuelé, structurele, en visuele stijlelementen vormen daarbij de ele-mentairee bestanddelen van een genre. Daarnaast definieert stilistische consistentie een klassee van vergelijkbare documenten - ofwel een genre. Door individuele karakterisering vann deze stijlelementen, en door identificatie van consistentie, is een aantal technieken ontwikkeldd voor het karakteriseren van genres in gedrukte documenten.

Hoofdstukk 2 beschrijft een uitbreiding van eerste orde willekeurige grafen, die gebaseerdd is op continue Gaussische verdelingen voor het modelleren van de dichtheid vann willekeurige elementen in een graaf. Eerste orde Gaussische grafen zijn met name interessantt vanwege hun eenvoud in leerprocessen en representatie. Deze eenvoud komt naarr voren in het leren van verdelingen van elementen in willekeurige grafen, met slechts eenn klein aantal voorbeelden, en zonder dat een discretisatie van de onderliggende ken-merkenruimtee benodigd is. Daarnaast heeft het gebruik van een strategie waarbij willekeurigee grafen slechts bij benadering vergeleken worden een positieve invloed op dee efficiëntie van de methode, zonder dat daarbij het onderscheidend vermogen ver-lorenn gaat. Experimentele resultaten geven aan dat de techniek een effectieve methode iss voor het classificeren van de structuur van documenten.

Bijj het vergelijken van documenten op basis van hun visuele overeenkomst is het moeilijkk de juiste schaal te bepalen, alsmede de juiste kenmerken voor documentrépré-sentatie.. Hoofdstuk 3 beschrijft een vorm van meervoudig variante granulometrieën die zijnn gebaseerd op rechthoeken die variëren in grootte en aspect ratio. Deze rechthoekige

yy in Dutch

(3)

144 4

granulometriéënn worden gebruikt om de visuele structuur van een document t e in-specteren.. De hieruit verkregen rechthoekige grootte verdelingen worden gebruikt «ds documentbeschrijving.. Experimentele resultaten geven aan dat rechthoekige grootte verdelingenn een effectieve manier zijn om visuele overeenkomst van documenten te beschrijven,, en een inzichtelijke interpretatie leveren van classificatie resultaten in de originelee

beeldruimte-Eenn morfologische aanpak voor de karakterisering van textuele stijl wordt gepre-senteerdd in Hoofdstuk 4. Het beschrijft verschillende hulpmiddelen en technieken voor hett evalueren van de stijl van karakters, woorden, en tekstregels. Het presenteert een inhaligg algoritme voor het op efficiënte wijze vinden van woorden in beelden van tekst-regels,, dat is gebaseerd op lineaire kenmerken van grootte verdelingen. Door een iets aangepastee benadering van morfologische grootte verdelingen, en door introductie van eenn generatief model voor grootte verdelingen van gedrukte tekst, wordt een perspectief bereiktt dat het gebruik van principale component analyse op grootte verdelingen recht-vaardigt.. Deze technieken borduren voort op de in Hoofdstuk 3 ontwikkelde ideeën, en gevenn eveneens antwoord op een aantal belangrijke vragen aangaande het gebruik van morfologischee grootte verdelingen voor het karakteriseren van de stijl van documenten. Problemenn die specifiek te maken hebben met de introductie van kleur in stijlka-rakteriseringg worden behandeld in Hoofdstuk 5. Bij hoge scanresoluties blijft de vorm vann halftone punten bewaard, wat het uitvoeren van latere stijlmetingen bemoeilijkt. Inn dit hoofdstuk wordt een lineaire diffusie techniek voorgesteld voor het verkrijgen vann continuous tone kleurenbeelden uit halftone kleurenbeelden. De techniek maakt gebruikk van een maat voor locale autocorrelatie, die de diffusie stuurt en begrenst. Experimentenn tonen aan hoe de visuele versdujnmg van gescande halftone beelden verbetert.. De diffusietechniek dempt het hoogfrequente halftone signaal, maar be-houdtt belangrijke visuele details. Door vergelijking van de betrouwbaarheid van uit kunstmatigee haltone beelden gereconstrueerde beelden wordt eveneens aangetoond dat dee diffusietechniek prestaties levert die vergelijkbaar zijn met een groot aantal niet-klassiekee halftoning algoritmen. Er wordt ook aangetoond hoe gediffundeerde beelden opp meer effectieve wijze gereduceerd kunnen worden tot de perceptueel saillante kleuren opp een documentpagina. Dit resulteert in beelden die visueel meer aansprekend zijn, en beterr reproduceerbaar. Tevens schalen deze beelden op een voorspelbare wijze omdat dee door halftoning patronen veroorzaakte hoogfrequente onzuiverheden verwijderd zijn. Hett leidt daarnaast tot een versimpelde representatie van een gescand kleurenbeeld die trouww blijft aan het origineel.

Hoofdstukk 6 beschrijft een functionele aanpak voor experimenteel software ontwerp voorr beeldverwerking en computer vision. De beschreven ideeën zijn een direct gevolg vann observaties van de wijze waarop beeldverwerkers dagelijks hun onderzoek uitvoeren. Err wordt aangegeven hoe een moderne, type-afleidende functionele programmeertaal gebruiktt kan worden om beeldverwerkingssoftware te ontwikkelen dat een juiste balans levertt tussen betekenisvolheid en bruikbaarheid. Het beschreven systeem maakt het mogelijkk functionaliteit en betekenisvolle abstracties op afroep te leveren, en schaalt probleemlooss van een prototype naar een productieversie.

Referenties

GERELATEERDE DOCUMENTEN

th.. farmers and ranchers continued until August 19 th by attending various events throughout Eastern Wyoming. The surveys were used to gather data on eastern Wyoming farms

Leonardo Bruni (15 th -century Italian humanist and historian) n.419, n.513 Leonardo da Vinci (Italian High Renaissance Painter and Inventor) 81.. Lessing, Gotthold Ephraim (18

Crouching Venus (antique Roman statue after a Hellenistic original) 87, ill.5-16a+b, 5-17a+b Cupid and Psyche (antique statue taken from Rome to Paris by Napoleon as spoil of

and modelling from casts in terracotta or plaster, as well as original antique statues in the Capitoline.. collection in Rome. By this point in time the most renowned sculptures

Antiquity in plaster : production, reception and destruction of plaster copies from the Athenian Agora to Felix Meritis in Amsterdam..

Het gebruik van gips (of stucco zoals het in deze periode ook wel genoemd werd) als materiaal voor sculptuur van klein formaat naar klassieke voorbeelden, al dan niet gepatineerd

Enduring neural and behavioral effects of early life adversity: Consequences of the absence of maternal melatonin and of

Enduring neural and behavioral effects of early life adversity: Consequences of the absence of maternal melatonin and of