• No results found

University of Groningen Deep learning for lung cancer on computed tomography Zheng, Sunyi

N/A
N/A
Protected

Academic year: 2021

Share "University of Groningen Deep learning for lung cancer on computed tomography Zheng, Sunyi"

Copied!
7
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

University of Groningen

Deep learning for lung cancer on computed tomography

Zheng, Sunyi

DOI:

10.33612/diss.171374829

IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document version below.

Document Version

Publisher's PDF, also known as Version of record

Publication date: 2021

Link to publication in University of Groningen/UMCG research database

Citation for published version (APA):

Zheng, S. (2021). Deep learning for lung cancer on computed tomography: early detection and prognostic prediction. University of Groningen. https://doi.org/10.33612/diss.171374829

Copyright

Other than for strictly personal use, it is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), unless the work is under an open content license (like Creative Commons).

Take-down policy

If you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediately and investigate your claim.

Downloaded from the University of Groningen/UMCG research database (Pure): http://www.rug.nl/research/portal. For technical reasons the number of authors shown on this cover page is limited to 10 maximum.

(2)
(3)

123

》》》CHAPTER 9

NEDERLANDSE SAMENVATTING

Longkanker is een van de dodelijkste kankers ter wereld en de belangrijkste doodsoorzaak bij zowel mannen als vrouwen. Het overlevingspercentage van 5 jaar voor longkankerpatiënten is slechts tussen 10% en 20%. Het sterftecijfer kan echter worden verlaagd als longkanker in een vroeg stadium wordt gediagnosticeerd en een snelle behandeling wordt gegeven. Om longkanker eerder op te sporen, zijn in veel landen longkankerscreeningsonderzoeken uitgevoerd. Dit betekent echter dat er tal van scans geëvalueerd moeten worden, wat arbeidsintensief is. Er bestaat dan ook een sterke behoefte om de huidige screeningprocedures te optimaliseren.

Nadat longkanker in een vroeg stadium is geconstateerd bij screening, is een nauwkeurige prognostische voorspelling voor patiënten van belang, aangezien de klinische respons van longkanker in een vroeg stadium na behandeling kan verschillen tussen patiënten. Om de efficiëntie van longkankerscreening te verbeteren en om gepersonaliseerde behandelstrategieën voor patiënten te bieden, hebben we ons in dit proefschrift daarom gericht op de ontwikkeling van deep learning-algoritmen voor automatische detectie van longknobbels en het voorspellen van de algehele overleving van longkanker.

Vroegtijdige opsporing van longkanker is een fundamentele stap voor het terugdringen van de sterfte als gevolg van longkanker. Hoewel onderzoekers inspanningen hebben geleverd om detectiesystemen voor longknobbels te ontwikkelen, kunnen de detectieprestaties nog worden verbeterd. Om de haalbaarheid te onderzoeken voor het gebruik van een klinische methodologie, maximale intensiteit projectie (MIP), ter verbetering van automatische longknobbeldetectie, stelden wij voor om het in Hoofdstuk 2 MIP-gebaseerd systeem te gebruiken dat gebruik maakt van convolutionele neurale netwerken. Het systeem is ontwikkeld op basis van 888 scans met 1186 longknobbels uit de openbare LIDC-IDRI-dataset. De netwerken, getraind door 1 mm axiale sectieschijven, 5, 10, 15 mm MIP-schijven bereikten een gevoeligheid van respectievelijk 82.8%, 87.9%, 90.0% en 88.7%, met respectievelijk 14.6, 11.0, 7.8 en 6.3 valse positieven of false positives (FP's) per scan. Deze resultaten toonden aan dat het in aanmerking nemen van MIP-afbeeldingen niet alleen de gevoeligheid kan verhogen, maar ook het aantal valse positieven in de detectiestadium van de nodulekandidaat kan verlagen. Na het samenvoegen van de resultaten van de axiale plakjes in vier verschillende plaatdikte-instellingen, detecteerde het systeem 95.4% van de knobbeltjes, hoewel er meer verdachte bevindingen (19.1 FP's per scan) waren opgenomen. Om de resultaten te verfijnen, hebben we een fout-positief reductiemodel geïmplementeerd dat twee pijplijnen met meerdere volumes als invoer gebruikte. Uiteindelijk had het voorgestelde systeem een gevoeligheid van 92.7% met 1 FP per scan. We hebben aangetoond dat het gebruik van MIP effectief is om meer longknobbeltjes te identificeren in vergelijking met gewone plakjes en dat deep learning voordelen kan opleveren voor knobbeldetectie in combinatie met de klinische procedure.

Om het op MIP gebaseerde knobbeldetectiesysteem in de klinische praktijk te valideren, werd een evaluatiestudie uitgevoerd in een Chinees screeningsprogramma voor longkanker. Hoofdstuk 3 beschrijft de validatieresultaten op 360 lage dosis CT-scans,

(4)

9

waarbij honderdtachtig individuen met knobbeltjes op de baseline LDCT-scan willekeurig werden gecombineerd met een gelijk aantal controlescreeners zonder longknobbeltjes in een verhouding van 1:1. Deze scans werden eerst beoordeeld met een dubbele aflezing door acht radiologen. Nadat het systeem was geëvalueerd, gebruikten twee onafhankelijke senior radiologen de resultaten van de dubbele aflezing en het systeem om de referentiestandaard af te leiden die 262 longknobbeltjes omvatte met een diameter groter dan 4 mm. Het op MIP gebaseerde systeem bereikte een gevoeligheid van 90.1% (95% BI: 86.4-93.7) bij 1 FP per scan, terwijl dubbele aflezing 76.0% (95% BI: 70.7-81.2) knobbeltjes vaststelde met slechts 0.04 FP per scan. Opgemerkt wordt dat het op MIP gebaseerde systeem 63 longknobbeltjes vaststelde die werden gemist door dubbele aflezing. Ondanks het hogere percentage valse positieven in het op MIP gebaseerde systeem in vergelijking met dubbele uitlezingen, sloot het systeem 70% van de negatieve scans veilig uit. Op basis van de resultaten concludeerden we dat het op MIP gebaseerde systeem dat gebruikmaakt van deep learning, radiologen kan helpen bij het opsporen van knobbels bij longkankerscreening.

Het is bewezen dat de MIP-techniek haalbaar is voor het verbeteren van de prestaties van deep learning bij automatische knobbeldetectie. De optimale plaatdikte in MIP voor deep learning-systemen was echter onbekend. Om de optimale parameter te vinden voor het verbeteren van de efficiëntie van deep learning-systemen die de MIP-techniek toepasten, werd het effect van het gebruik van MIP met verschillende plaatdikte-instellingen onderzocht. In Hoofdstuk 4 werd het convolutionele neurale netwerk voor de detectie van nodulekandidaten in het MIP-gebaseerde systeem getraind door meerdere MIP-segmenten afzonderlijk op de 888 scans van de grootschalige LIDC-IDRI dataset. De geëvalueerde plaatdikte-instellingen van MIP varieerden van 3 mm tot 50 mm. De gevoeligheid bereikte een piek (90%) bij een plaatdikte van ongeveer 10 mm. Het heeft ook een vergelijkbare trend voor de gevoeligheden van drie knobbel-subgroepen gestratificeerd naar diameters, zoals weergegeven in tabel 3 van hoofdstuk 4. We hebben waargenomen dat het gebruik van MIP-beelden met een plaatdikte kleiner dan 15 mm een verbetering kan hebben in de detectie van longknobbels, ongeacht van grootte in vergelijking met gewone axiale plakjes. Bovendien vertoonde het aantal FP's met toenemende plaatdikte een andere curve, waarbij de curve in het begin snel daalde en daarna stabiel was bij 4 FPs / scan nadat de plaatdikte groter was dan 30 mm. We gebruikten de F2 score die rekening hield met gevoeligheid en valse positieven. De plaatdikte-instelling van 25 mm had de grootste F2 waarde, wat betekent dat de detectiefase van de kandidaat-knobbel van het systeem het meest efficiënt was bij deze instelling. Hoewel er slechts 2.1% verschillen in gevoeligheid waren tussen 25 mm en 10 mm, was de gevoeligheid van 10 mm significant hoger dan de andere. Aangezien het detecteren van meer knobbeltjes zinvoller is in het stadium van detectie van knobbelkandidaten en een groot aantal valse positieven later kan worden uitgesloten door andere methoden, werd uiteindelijk 10 mm bepaald als de optimale plaatdikte in het stadium van detectie van knobbelkandidaten. Interessant is dat we opmerkten dat 10 mm ook de dikte van de MIP-plaat was die gewoonlijk wordt gebruikt bij het lezen van mensen.

Hoewel de detectiesnelheid van kleine knobbeltjes kan worden verhoogd door MIP te gebruiken, werden er nog steeds veel kleine knobbeltjes en andere typen knobbeltjes toch gemist. Om de prestatie van knobbeldetectie verder te verbeteren, hebben we geprobeerd een systeem te ontwerpen dat een van de andere klinische procedures nabootste, namelijk

(5)

125

》》》CHAPTER 9

multi-planaire reconstructie (MPR). In Hoofdstuk 5 werd een geoptimaliseerd op deep learning gebaseerd systeem voorgesteld, op grond van axiale, coronale en sagittale vlakken. In vergelijking met het op MIP gebaseerde systeem werden meer geavanceerde deep learning-algoritmen toegepast, waaronder U-net ++ en multi-scale dichte convolutionele neurale netwerken toegepast. Om meer knobbeltjes te detecteren, gebruikte de studie ook MIP-plakjes met de optimale plaatdikte van 10 mm, geanalyseerd in Hoofdstuk 4, voor het trainen van het deep learning-algoritme U-net ++. Het op MPR gebaseerde systeem behaalde veelbelovende prestaties (gevoeligheid: 96.0%, FP: 2.0) op de LUNA16-dataset, terwijl het op MIP gebaseerde systeem een gevoeligheid had van 94.2% met 2 FP's / scan alleen gebaseerd op het axiale vlak. De verbetering was niet alleen op de algehele prestatie, maar ook op de identificatie van kleine knobbeltjes. De gevoeligheid van knobbeltjes kleiner dan 6 mm werd verbeterd van 90.4% naar 93.4% met 1 FP / scan. Met betrekking tot de detectie in verschillende soorten knobbeltjes, toegeschreven aan coronale en sagittale vlakken, stelde het systeem nog 23 knobbeltjes vast waarvan 2 niet-vaste, 4 gedeeltelijk vaste en 17 solide knobbeltjes waren. Voor deze drie typen knobbeltjes werd een hoge gevoeligheid van respectievelijk 91%, 100% en 98% bereikt. We hebben aangetoond dat het MPR-gebaseerde deep learning-systeem met geavanceerde algoritmen in staat is om nauwkeurig knobbeltjes in verschillende grootten en typen te vangen.

De nauwkeurige detectie van longknobbeltjes geeft de mogelijkheid om longkanker in een vroeg stadium van screening te identificeren. Radiotherapie kan een goed alternatief zijn voor patiënten in een vroeg stadium die niet operabel zijn. De algehele overlevingskansen van patiënten na behandeling kan echter aanzienlijk variëren tussen studies. Om de prognose van de patiënt te verbeteren, presenteerde Hoofdstuk 6 een hybride op deep learning gebaseerd systeem dat zowel klinische variabelen als beeldkenmerken integreerde om de 2-jaars totale overleving te voorspellen. Een gebied onder de curvewaarde van het systeem op de testsets UMCG en Maastro was respectievelijk 0.76 en 0.64. Kaplan-Meier-overlevingscurves lieten een statistisch significante scheiding zien tussen groepen met een laag en een hoog sterfterisico op twee datasets. De resultaten gaven aan dat het voorgestelde hybride systeem kan worden gebruikt om oncoloog radiotherapeuten te helpen bij de selectie van patiënten met een hoog sterfterisico die baat zouden kunnen hebben bij systemische behandeling.

Dit proefschrift presenteerde technische implementaties en klinische evaluaties van automatische detectie van longknobbels en voorspelling van de algehele overleving voor patiënten met longkanker in een vroeg stadium. De ontwikkelde op deep learning gebaseerde systemen hebben het potentieel om de efficiëntie van longkankerscreeningsprocedures te verhogen en het sterftecijfer van longkanker te verminderen na vroege detectie van longkanker en een nauwkeurige prognose. De bijdragen in het proefschrift kunnen de gezondheidszorg voor longkanker verder verbeteren.

(6)
(7)

Referenties

GERELATEERDE DOCUMENTEN

Inspired by the clinical methodology of radiologists, we aim to explore the feasibility of applying MIP images to improve the effectiveness of automatic lung nodule detection

Therefore, the aim of this study was to explore the effect of MIP slab thickness on the performance of the DL-CAD system at the nodule candidate detection stage and to find

To further boost the performance, results of the proposed system on ten mm axial maximum intensity projection-based slices were merged since the ten mm slices had the

In the future, richer data resources, such as clinical factors, image features on CTs and PET-CTs, and gene expression, will be available for prognostic outcome predictions, and

Therefore, in this thesis, to improve the efficiency of lung cancer screening and to provide personalized treatment strategies for patients, we focused on the development of

Matthijs Oudkerk, thank you for widening my eyes from clinical perspectives and your wealth of knowledge in lung cancer screening is inspiring.. I appreciate that you enlighten me

Tianjin Medical University Cancer Institute and Hospital, National Clinical Research Centre of Cancer, Key Laboratory of Cancer Prevention and Therapy, Department of

van Ooijen, “Automatic Pulmonary Nodule Detection in Low-dose CT Scans Using Convolutional Neural Networks Based on Maximum Intensity Projection”.. European Congress of