• No results found

University of Groningen Deep learning and hyperspectral imaging for unmanned aerial vehicles Dijkstra, Klaas

N/A
N/A
Protected

Academic year: 2021

Share "University of Groningen Deep learning and hyperspectral imaging for unmanned aerial vehicles Dijkstra, Klaas"

Copied!
5
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

University of Groningen

Deep learning and hyperspectral imaging for unmanned aerial vehicles

Dijkstra, Klaas

DOI:

10.33612/diss.131754011

IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document version below.

Document Version

Publisher's PDF, also known as Version of record

Publication date: 2020

Link to publication in University of Groningen/UMCG research database

Citation for published version (APA):

Dijkstra, K. (2020). Deep learning and hyperspectral imaging for unmanned aerial vehicles: Combining convolutional neural networks with traditional computer vision paradigms. University of Groningen. https://doi.org/10.33612/diss.131754011

Copyright

Other than for strictly personal use, it is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), unless the work is under an open content license (like Creative Commons).

Take-down policy

If you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediately and investigate your claim.

Downloaded from the University of Groningen/UMCG research database (Pure): http://www.rug.nl/research/portal. For technical reasons the number of authors shown on this cover page is limited to 10 maximum.

(2)

Samenvatting

Faculty of Science and Engineering

Bernoulli Institute for Mathematics, Computer Science and Artificial Intelligence

Dissertatie

Deep Learning and Hyperspectral Imaging for Unmanned Aerial Vehicles

Combining convolutional neural networks with traditional computer vision paradigms

door Klaas Dijkstra

Recent is er veel belangstelling voor onderzoek naar, en toepassingen van, hyperspectrale beeldverwerkingstechnologie. Hyperspectrale camera’s nemen informatie op uit meerdere banden van het elektromagnetische spectrum. Het doel van deze camera’s is om een spectrogram per pixel op te nemen zodat een hyperspectrale kubus gevormd kan worden. Het toepassingsgebied van dit type camera’s is breed en variëert van vegetatie-inspectie tot het chemische typeren van materialen.

Kleine multi-copters op batterijen, genaamd Unmanned Aerial Vehicles (UAVs), hebben recentelijk een groot potentieel getoond voor een groot aantal toepassingsgebieden. Een camera wordt gemonteerd op een UAV en deze wordt gebruikt voor de inspectie van grote objecten of grote oppervlakken. Op het gebied van precisielandbouw worden ze bijvoorbeeld gebruikt voor het meten van Chlorofyl om de gezondheid van gewassen te bepalen. Verder worden ze gebruikt voor de inspectie van windturbines, om beelden te maken van scheuren, gaatjes en andere defecten.

(3)

SAMENVATTING

Toepassingen van UAVs zouden nog talrijker kunnen worden door meer gebruik te maken van hyperspectrale beeldverwerkingstechnologie, maar deze apparaten hebben intrinsieke beperkingen die het gebruik ervan, in combinatie met elkaar, uitdagend maken. Dit wordt voornamelijk veroorzaakt door de gevoeligheid voor beweging of de lage resolutie van de hyperspectrale camera’s in combinatie met de beperkte payload mogelijkheden van UAVs.

Deep learning of, meer specifiek, Convolutional Neural Networks (CNNs) hebben state-of-the-art prestaties laten zien in een veelheid van onderzoeksgebieden. Veel toepassingen profiteren al van deep learning. Gewoonlijk worden deze deep learning modellen rechtstreeks getraind met behulp van data op een end-to-end manier. Dit proefschrift draait om de vraag of algoritmes, uit het veld van deep learning, de moeilijkheden kunnen mitigeren die worden veroorzaakt door de beperkingen die worden ondervonden bij het combineren van hyperspectrale cameratechnologie en UAVs. Deze drie-eenheid van technologieën: deep learning, hyperspectrale beeldverwerking en UAVs, dient als een kader waarbinnen dit onderzoek is gedefinieerd.

In Hoofdstuk1wordt een introductie gegeven in de onderwerpen die in dit proefschrift aan de orde komen. Dat hoofdstuk geeft een overzicht en analyse van de onderzoeksvragen en stelt verschillende gebieden voor binnen de drie-eenheid van technologieën waarop onderzoek wordt uitgevoerd.

In Hoofdstuk 2 wordt een hyperspectraal Liquid Crystal Tunable Filter (LCFT) systeem van 28 banden gebruikt om onderscheid te maken tussen Alternaria infecties en Ozon (O3) schade aan aardappelbladeren. Als er een kleine subset van spectrale banden kan worden gevonden die nog steeds in staat is om onderscheid te maken tussen ziekten is het beter mogelijk om een multi-camera systeem te ontwikkelen dat kan worden gebruikt op een UAV. De technieken die gebruikt worden om een subset van spectrale banden te selecteren zijn bandextractie- en selectietechnieken op basis van Principal Component Analysis (PCA) en Linear Discriminant Analysis (LDA). Dit wordt gecombineerd met classificatie-experimenten om de prestatieverschillen tussen Multi Layer Perceptron (MLP), Support Vector Machine (SVM), k-Nearest Neighbor (kNN) en Gaussian-model classifiers te onderzoeken. Met behulp van een per-pixel classificatie bleek de ziekte op het blad geïdentificeerd te kunnen

(4)

worden met een goede nauwkeurigheid die afhankelijk is van de gekozen feature extractie methode, feature selectie methode en het type classifier.

In Hoofdstuk 3 worden verschillende nieuwe architecturen voor overspraakcorrectie en het demozaïken van hyperspectrale kubussen besproken. Een sensor met een Multispectral Color Filter Array (MCFA) bevat een mozaïek van kleine optische filters om een hyperspectraal beeld te produceren. Overspraak tussen spectrale banden en een lage resolutie zijn ongewenste neveneffecten van dit type sensoren. Echter, andere eigenschappen zoals gewicht en afmeting maken camera’s die deze sensoren bevatten ideaal voor gebruik op een UAV. Dat hoofdstuk laat de kwantitatieve en kwalitatieve resultaten zien van CNN architecturen die een hyperspectrale kubus opschalen naar 16 keer de oorspronkelijke resolutie. De experimenten laten zien dat de hiervoor ontworpen CNNs geschikt zijn voor het corrigeren van overspraak en het gelijktijdige opschalen van de hyperspectrale kubus, terwijl een spatiële en een spectrale reconstructie behouden blijft met een Structural Similarity (SSIM)-waarde van 0,89. Ook bleek dat het schijnbaar ongewenste effect van sensoroverspraak eigenlijk helpt bij het opschalen. Dit toont aan dat deep learning verschillende beperkingen van dit soort hyperspectrale camera’s kan mitigeren bij gebruik op een UAV.

In Hoofdstuk 4 wordt CentroidNet geïntroduceerd. Deze nieuwe hybride deep learning architectuur kan worden gebruikt om centrums van objecten te detecteren. CentroidNet gebruikt een U-Net CNN als backbone. Dit CNN is getraind om een veld van 2 dimensionale vectoren te produceren die individueel wijzen naar de dichtstbijzijnde centrums van objecten die zich in de afbeelding bevinden. Een computer vision algoritme geïnspireerd op een Hough transformatie wordt gebruikt om alle vectoren op te tellen tot een landschap van stemmingen. Posities in het beeld die een groot aantal stemmen krijgen, worden beschouwd als centrums van objecten. Één van de sterke eigenschappen van CentroidNet is dat het model getraind kan worden op uitsnedes van beelden en dat het network naadloos kan worden toegepast op beelden met een volledige resolutie. Experimenten tonen aan dat CentroidNet beter, gebaseerd op F1-score, presteert dan de You Only Look Once Version 2 (YOLOv2) en RetinaNet modellen voor het lokaliseren en tellen van aardappelgewassen in beelden gemaakt met een UAV.

(5)

SAMENVATTING

voorgesteld dat ook vectoren produceert voor de omtrek van objecten zodat de grootte en vorm van de objecten en hun centrums kunnen worden geschat. Verschillende ablatiestudies worden uitgevoerd met verschillende backbones: U-Net en drie varianten van Deeplab V3+ met een ResNet50, ResNet101 en Xception backbone. In deze studie wordt ook het gebruik van, een combinatie van, Mean Squared Error (MSE) loss, Vector Loss (VL), Cross-entropie loss en Intersection over Union (IoU) loss onderzocht. Drie datasets werden gebruikt in de experimenten: luchtfoto’s van aardappelplanten, microscopische celkernen en bacteriekolonies in Petrischalen. CentroidNetV2 wordt vergeleken met You Only Look Once Version 3 (YOLOv3) en Mask Recurrent Convolutional Neural Network (MRCNN). Op alle drie de datasets heeft CentroidNetV2 de hoogste recall en op twee van de drie datasets heeft CentroidNetV2 de hoogste F1 score. Het beste segmentatiemasker en de hoogste precision wordt behaald door MRCNN, maar kleine objecten worden slechter gedetecteert in vergelijking met CentroidNetV2.

In Hoofdstuk 6 worden de resultaten besproken en conclusies gegeven. Dit onderzoek werd ingekaderd binnen de drie-eenheid van technologieën: deep learning, hyperspectrale beeldverwerking en UAVs. Tijdens dit onderzoek is gebleken dat het ontwikkelen van oplossingen met een sterke nadruk op de toepassingen zelf, gunstig is geweest voor het resultaat. De modellen die specifiek ontworpen zijn voor de optische eigenschappen van de hyperspectrale camerasensor, laten uitstekende resultaten zien voor overspraakcorrectie en het vergroten van hyperspectrale kubussen. Het is ook gebleken dat wanneer een CNN gebruikt wordt om afbeeldingen voor te bewerken en een, speciaal hiervoor ontworpen, beeldverwerkingsalgoritme objecten detecteerd, dat dit beter presteert dan modellen die uitsluitend gebaseerd zijn op deep learning. Dit toont aan dat traditionele beeldverwerkingsparadigma’s nuttig zijn in combinatie met deep learning zodat prestaties beter worden. Het idee is dat voorkennis over de toepassing impliciet of expliciet aan het model wordt toegevoegd, waardoor het model minder algemeen maar wel nauwkeuriger wordt.

Referenties

GERELATEERDE DOCUMENTEN

Deep learning and hyperspectral imaging for unmanned aerial vehicles: Combining convolutional neural networks with traditional computer vision paradigms.. University

Hyperspectral cubes with 28 wavelengths of different potato leaves have been recorded to classify between Healthy leaf, Alternaria damage and ozone damage using several

We hypothesize that hyperspectral demosaicking could actually benefit from spectral and spatial correlations in the image data. This will be investigated by demosaicking images

An additional advantage of using small patches is that CentroidNet can be trained on small patches and validated on the full-resolution images to measure the impact of using

Deep learning and hyperspectral imaging for unmanned aerial vehicles: Combining convolutional neural networks with traditional computer vision paradigms.. University

Deep learning and hyperspectral imaging for unmanned aerial vehicles: Combining convolutional neural networks with traditional computer vision paradigms.. University

Deep learning and hyperspectral imaging for unmanned aerial vehicles: Combining convolutional neural networks with traditional computer vision paradigms.. University

Deep learning and hyperspectral imaging for unmanned aerial vehicles: Combining convolutional neural networks with traditional computer vision paradigms.. University