University of Groningen Managing technical debt through software metrics, refactoring and traceability Charalampidou, Sofia

(1)

Managing technical debt through software metrics, refactoring and traceability

Charalampidou, Sofia

IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document version below.

Document Version

Publisher's PDF, also known as Version of record

Publication date: 2019

Link to publication in University of Groningen/UMCG research database

Citation for published version (APA):

Charalampidou, S. (2019). Managing technical debt through software metrics, refactoring and traceability. University of Groningen.

Copyright

Other than for strictly personal use, it is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), unless the work is under an open content license (like Creative Commons).

Take-down policy

If you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediately and investigate your claim.

Downloaded from the University of Groningen/UMCG research database (Pure): http://www.rug.nl/research/portal. For technical reasons the number of authors shown on this cover page is limited to 10 maximum.

(2)

Managing Technical Debt through

Software Metrics, Refactoring and

Traceability

Phd thesis

to obtain the degree of PhD at the University of Groningen

on the authority of the Rector Magnificus prof. E. Sterken

and in accordance with the decision by the College of Deans. This thesis will be defended in public on

Friday 28 June 2019 at 12.45 hours

by

Sofia Charalampidou

born on 9 February 1988 in Thessaloniki, Greece

(3)

Prof. P. Avgeriou Co-supervisor Dr. A. Ampatzoglou

Assessment Committee Prof. F. Arcelli Fontana Prof. A. Martini Prof. A.C. Telea

(4)

Supervisor Prof. P. Avgeriou Co-supervisor Dr. A. Ampatzoglou

Assessment Committee Prof. F. Arcelli Fontana Prof. A. Martini Prof. A.C. Telea

The research reported in this thesis has been carried out in the Software Engineer-ing and Architecture group of the Bernouli Institute for Mathematics, Computer Science and Artificial Intelligence of the University of Groningen, The Nether-lands. This research work has been partially funded by the ITEA2 project 11013 PROMES.

Cover Design by: Christos Gousidis || www.ci-gousidis.com Printed by: ProefschriftMaken || www.proefschriftmaken.nl

ISBN: 978-94-034-1775-2 (printed version) ISBN: 978-94-034-1774-5 (electronic version)

(5)

(6)

To my ghosts and my fairies… And those who dared to love us all!

(7)

(8)

VII

S

AMENVATTING

Techniche Schuld (oftewel TD: Technical Debt) is een geleend concept uit de financiële sector om de extra onderhoudskosten uit te drukken die worden veroorzaakt door korte termijn oplossingen om aan urgente zakelijke eisen te voldoen. Deze korte termijn oplossingen beïnvloeden de interne kwaliteit van de software. TD kan zich voordoen tijdens de levenscyclus van software ontwikkeling en kan gerelateerd worden aan verschillende artefacten. Er zijn verschillende types TD, waarvan Code TD, Ontwerp TD en Documentatie TD de meest voorkomende zijn. Verscheidene activiteiten kunnen worden uitgevoerd voor een efficiënte aanpak van TD, zoals de identificatie en prioritering van TD instanties, activiteiten gericht op terugbetaling van TD, evenals activiteiten om ophoping van TD te voorkomen.

De probleemstelling die in dit proefschift behandeld wordt gaat over de aanpak van TD met betrekking tot drie voorgenoemde types TD (i.e. Code-, Ontwerp- en Documentatie TD). Betreffende Code TD gaat het om het gebrek aan hoge nauwkeurigheid in tooling dat de identificatie, prioriteitenstelling en oplossing van

bad smells ondersteund. In termen van Ontwerp TD gaat het om het gebrek aan

systematische ondersteuning voor het identificeren van incorrecte geïnstantieerde ontwerppatronen en het gebrek aan begeleiding voor het herstructureren van het ontwerp. Documentatie TD betreft het ontbreken van hulpmiddelen om te voorkomen dat er onvoldoende, onvolledige of verouderde requirements documentatie komt. De algehele oplossing bestaat uit de toepassing van softwarestatistieken, evenals refactoring- en traceerbaarheidstechnieken om deze tekortkomingen te verlichten. Deze oplossing wordt in de volgende paragrafen per TD-type uitgewerkt.

(9)

VIII

Met betrekking tot Code TD biedt dit proefschrift tools voor het identificeren, prioriteren en oplossen van bad smells (met name long methods, een van de meest voorkomende en hardnekkige bad smells); de voorgestelde tools zijn empirisch gevalideerd en vertonen hoge mate van nauwkeurigheid. Specifiek, in de long

methods identificatie, hebben we een casestudy uitgevoerd op Java open-source

systemen met long method smells die kunnen worden opgelost door de extract

method refactoring. De studie onderzocht empirisch het vermogen van maat- en

cohesiestatistieken om het bestaan en de urgentie van de refactoring (een manier van TD-prioritering) van long method optredens te voorspellen. De resultaten van de studie suggereren dat één maat- en vier cohesiestatistieken in staat zijn om de noodzaak en urgentie voor het oplossen van de long method bad smell te karakteriseren, met een hogere nauwkeurigheid vergeleken met de eerdere studies. Met betrekking tot de prioriteitstelling van verschillende soorten bad smells zijn er drie code smells onderzocht (long methods, codeduplicaties en conditionele complexiteit) door de bijbehorende rendement waarschijnlijkheid te bepalen (i.e. de kans dat een module rendement genereert tijdens de evolutie van de software). Als een maatstaf voor de smellrendement waarschijnlijkheid zijn de frequentie van

smell gebeurtenissen en de neiging tot veranderen van de modules waarin ze

voorkomen gebruikt. Om dit doel te bereiken, presenteerden we een casestudy over 47.751 methoden die zijn geëxtraheerd uit twee bekende open source-projecten. De resultaten van de casestudy suggereren dat: (a) modules waarin code smells veel voorkomen vatbaarder zijn voor veranderingen dan smell-free modules, (b) er specifieke soorten code smell zijn die zich concentreren in de meest veranderbare modules en (c) de rendement waarschijnlijkheid van codeklonen hoger lijkt te zijn dan de andere twee onderzochte code smells. Deze resultaten zijn nuttig voor zowel onderzoekers als ontwikkelaars, in die zin dat de eersten hun onderzoek kunnen richten op het oplossen van code smells met de hoogste rendement waarschijnlijkheid, en de laatsten de prioriteit van hun terugbetaling strategie en hun training kunnen verbeteren.

Ten slotte, gericht op het bieden van ondersteuning bij Code TD terugbetaling, hebben we een aanpak geïntroduceerd (vergezeld van een tool) die gericht is op het identificeren van extract method kansen; deze verwijzen naar delen van de broncode die samenwerken om een specifieke functionaliteit te bieden, en kunnen worden onttrokken als afzonderlijke methoden. De nauwkeurigheid van de voorgestelde aanpak is empirisch gevalideerd, zowel in een industriële als een open-source omgeving. In het eerste geval was de aanpak in staat om functioneel gerelateerde statements te identificeren binnen twee industriële long methods (elk

(10)

IX