• No results found

Machine learning methodes voor het voorspellen van VO 2max uit sub-maximale inspanning

N/A
N/A
Protected

Academic year: 2022

Share "Machine learning methodes voor het voorspellen van VO 2max uit sub-maximale inspanning"

Copied!
85
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Machine learning methodes voor het

voorspellen van VO 2max uit sub-maximale inspanning

Arne De Brabandere

Thesis voorgedragen tot het behalen van de graad van Master of Science in de ingenieurswetenschappen:

computerwetenschappen, hoofdspecialisatie Artificiële intelligentie Promotoren:

Prof. dr. J. Davis Prof. B. Vanwanseele Dr. ir. W. Meert Assessor:

Dr. ir. T. Heyman Begeleider:

Ir. T. Op De Beéck

(2)

Zonder voorafgaande schriftelijke toestemming van zowel de promotoren als de au- teur is overnemen, kopiëren, gebruiken of realiseren van deze uitgave of gedeelten ervan verboden. Voor aanvragen tot of informatie i.v.m. het overnemen en/of ge- bruik en/of realisatie van gedeelten uit deze publicatie, wend u tot het Departement Computerwetenschappen, Celestijnenlaan 200A bus 2402, B-3001 Heverlee, +32-16- 327700 of via e-mail info@cs.kuleuven.be.

Voorafgaande schriftelijke toestemming van de promotoren is eveneens vereist voor het aanwenden van de in deze masterproef beschreven (originele) methoden, pro- ducten, schakelingen en programma’s voor industrieel of commercieel nut en voor de inzending van deze publicatie ter deelname aan wetenschappelijke prijzen of wed- strijden.

(3)

Voorwoord

Veel sporters gebruiken tegenwoordig mobiele applicaties die tijdens het sporten in- formatie geven over hun fysieke inspanning. Zowel recreatieve sporters als topspor- ters dragen sporthorloges en fitness trackers of gebruiken een app op hun smartphone om hun trainingsactiviteiten op te volgen. Die applicaties maken steeds vaker ge- bruik van machine learning technieken om allerlei variabelen te voorspellen die ge- relateerd zijn aan vermoeidheid, fitheid, bewegingsefficiëntie, enz. Met deze master- thesis hoop ik een bijdrage te leveren aan de ontwikkeling van dit soort applicaties door een nauwkeurig model te ontwikkelen voor de voorspelling van fysieke fitheid.

Bij deze wil ook enkele mensen bedanken die bijgedragen hebben aan de verwe- zenlijking van dit werk. Allereerst bedank ik mijn begeleider, Tim Op De Beéck, voor de ideeën en feedback in onze wekelijkse bijeenkomsten. Daarnaast wil ook Kurt Schütte bedanken die eveneens ideeën gaf in verschillende bijeenkomsten en bovendien de gegevens verzameld heeft die in dit werk gebruikt worden. Ik bedank ook mijn promotors: Jesse Davis, Benedicte Vanwanseele en Wannes Meert. Zij boden de mogelijkheid om aan dit onderwerp te werken en gaven tijdens enkele sa- menkomsten nuttige feedback om mee verder te gaan. Tot slot bedank ik ook mijn ouders en vrienden voor hun steun en voor de hulp bij het nalezen van de tekst.

Arne De Brabandere

(4)

Voorwoord i

Samenvatting iii

Lijst van figuren en tabellen iv

Lijst van afkortingen en symbolen v

1 Inleiding 1

1.1 Context . . . 1

1.2 Onderzoeksvragen . . . 2

1.3 Werkwijze . . . 2

1.4 Structuur van de tekst . . . 3

2 Achtergrond 5 2.1 Maximaal zuurstofverbruik . . . 5

2.2 Gerelateerd werk . . . 5

2.3 Accelerometrie en biomechanische variabelen . . . 8

3 Data 11 3.1 Protocol . . . 11

3.2 Metingen . . . 12

3.3 Deelnemers . . . 15

4 Kenmerken om VO2max te voorspellen 19 4.1 Kenmerken . . . 19

4.2 Selectie van kenmerken. . . 22

4.3 Experimenten . . . 24

4.4 Besluit . . . 32

5 Voorspellingsmethodes 37 5.1 Regressiemethodes . . . 37

5.2 Vergelijking van methodes . . . 40

5.3 Besluit . . . 43

6 Betrouwbaarheid van voorspellingen 45 6.1 Motivatie . . . 45

6.2 Betrouwbaarheidsintervallen voorspellen . . . 45

6.3 Experiment . . . 46

6.4 Besluit . . . 47

(5)

Inhoudsopgave

7 Besluit 51

7.1 Resultaten. . . 51 7.2 Voor- en nadelen van het model. . . 51 7.3 Toekomstig werk . . . 52

A Wetenschappelijk artikel 55

B Poster 69

Bibliografie 71

(6)

Maximale zuurstofopname (VO2max) is een variabele die een indicatie geeft van iemands uithoudingsvermogen. Deze variabele is gedefiniëerd als de maximale hoe- veelheid zuurstof die iemand kan opnemen en gebruiken per tijdseenheid en wordt uitgedrukt in ml/kg/min. VO2max wordt gemeten met een maximale inspannings- test. Atleten kunnen zo’n test echter niet regelmatig uitvoeren omwille van zowel fysieke als praktische beperkingen. Daarom zijn verschillende modellen ontwikkeld om VO2maxte voorspellen uit sub-maximale inspanning. Bestaande modellen maken echter maar beperkt gebruik van variabelen die de bewegingen van lopers beschrij- ven.

In plaats van alleen domeinkennis te gebruiken, stelt deze masterthesis een data- gedreven methode voor om variabelen te vinden die loopbewegingen beschrijven. Het doel is om een model op te stellen voor de voorspelling van VO2maxuit sub-maximale inspanning op een loopband, met als invoer variabelen berekend uit hartslag en ac- celerometermetingen. Het uiteindelijk model is een lineair regressiemodel met vier variabelen (geslacht, lichaamsgewicht, inverse van gemiddelde hartslag en inverse van de standaardafwijking van de totale versnelling gemeten op het scheenbeen) en heeft een verklaarde variantie (R2) van 0,784 en een gemiddelde absolute fout van 2,35 ml/kg/min.

Dit werk toont aan dat de combinatie van hartslag en accelerometervariabelen nuttig is om VO2max te voorspellen en stelt een methode voor om deze variabelen automatisch te selecteren. De variabelen worden berekend uit twee sensoren – een hartslagmeter en een accelerometer – bevestigd op het lichaam van de lopers. Om een voorspelling te maken, is een lichte inspanning van vier minuten aan 8 of 9 km/u vereist. Het model kan daarom gebruikt worden in een praktische toepassing om de VO2max van atleten op regelmatige basis op te volgen en trainingsadaptaties te meten.

(7)

Lijst van figuren en tabellen

Lijst van figuren

2.1 Zuurstofopname tijdens een inspanningstest . . . 6

2.2 Grafiek voor intercept en richtingscoëfficiënt kenmerken in het model van Tönis et al. . . 7

3.1 Verloop van de looptest . . . 11

3.2 Voorbeeld van het effect van een mediaanfilter op de hartslagmetingen . 13 3.3 Berekening van VO2max . . . 13

3.4 Posities van de accelerometers. . . 14

3.5 Intervaldetectie voor de accelerometermetingen . . . 15

3.6 Anterieur-posterieure, mediolaterale en verticale richting . . . 16

4.1 Voorbeeld van een phase plot van het signaal van een accelerometer op de onderrug . . . 21

4.2 Plot met hartslag en activiteitsniveau tijdens de looptest. . . 23

4.3 Lineaire regressiemodellen met voorwaartse selectie . . . 26

4.4 Lineaire regressiemodellen met selectie op basis van correlaties en PCA 27 4.5 Contacttijd uit anterieur-posterieure scheenbeenversnelling. . . 30

4.6 Contacttijd uit verticale onderrugversnelling. . . 31

4.7 Voorbeeld van het signaal gemeten met een krachtplaat . . . 32

4.8 Lineair regressiemodel met t−1c /HR en geslacht . . . 32

5.1 Kleinste kwadraten lineaire regressie vergeleken met Huber lineaire regressie . . . 41

5.2 Lasso regressie zonder voorwaartse selectie. . . 41

6.1 80%-betrouwbaarheidsintervallen . . . 47

6.2 95%-betrouwbaarheidsintervallen . . . 47

6.3 80%-betrouwbaarheidsintervallen met conforme voorspelling . . . 48

6.4 95%-betrouwbaarheidsintervallen met conforme voorspelling . . . 48

(8)

Lijst van tabellen

3.1 Karakteristieken van de deelnemers (gem. ± SD) . . . 16

4.1 Overzicht van beschrijvende kenmerken, hartslagkenmerken en accelerometerkenmerken met afkortingen. . . 20

4.2 Onderlinge correlaties van de kenmerken geselecteerd met S4a− M1 . . 28

4.3 Vergelijking van S1, S2, S3, S4a en S4b . . . 28

4.4 Lineaire regressiefuncties gevonden voor S1, S2, S3, S4a en S4b . . . 29

5.1 Vergelijking van lineaire regressiemethodes. . . 40

5.2 Vergelijking van andere regressiemethodes . . . 42

(9)

Lijst van afkortingen en symbolen

Afkortingen

Gem. Gemiddelde SD Standaarddeviatie

MAE Gemiddelde absolute fout (Eng. mean absolute error) LOSOCV Leave-one-subject-out cross-validation

OLS Kleinste kwadraten lineaire regressie (Eng. ordinary least squares) SVR Support vector regressie

NN Nearest neighbor regressie

Symbolen

VO2 Zuurstofverbruik

VO2max Maximaal zuurstofverbruik R2 Verklaarde variantie

R2adj Gecorrigeerde verklaarde variantie

g Eenheid voor versnelling (1g = 9, 81m/s2) y Gemeten VO2max-waarden

ˆ

y Voorspelde VO2max-waarden

x Waarden van k kenmerken voor 1 looptest (vector van lengte k) X Waarden van k kenmerken voor n looptesten (n× k matrix) tc Voet-grond contacttijd

(10)
(11)

Hoofdstuk 1

Inleiding

1.1 Context

In duursporten zoals lopen en fietsen is er een grote interesse voor variabelen die een indicatie geven van de uithouding van een atleet. Aan de hand van verschillende uithoudingsindicatoren kunnen trainers en sportwetenschappers atleten onderling vergelijken en de vooruitgang van een atleet opvolgen. Drie belangrijke uithoudings- indicatoren zijn maximale zuurstofopname (VO2max), procentueel gebruik daarvan (lactaatdrempel) en bewegingsefficiëntie [13].

Maximale zuurstofopname bepaalt de bovengrens van iemands uithoudingsver- mogen [18]. Deze variabele is gedefiniëerd als de maximale hoeveelheid zuurstof die iemand kan opnemen en gebruiken per tijdseenheid. VO2max wordt gemeten aan de hand van een maximale incrementele inspanningstest waarin een maximale zuurstofopname bereikt wordt. Deze test heeft echter enkele beperkingen. Ener- zijds zijn er praktische beperkingen. Omdat de apparatuur om zuurstofverbruik te meten duur is, worden VO2max testen in een laboratoriumomgeving uitgevoerd.

De testen vragen ook veel tijd, waardoor ze voor recreatieve lopers vaak te duur zijn. Anderzijds zijn er fysieke beperkingen. Maximale inspanningstesten zijn fysiek belastend en kunnen daarom niet regelmatig uitgevoerd worden. Voor atleten met strikte trainingsschema’s is het bovendien moeilijk om de testen en de nodige rust- dagen in te plannen. Ook zijn maximale testen niet geschikt voor oudere mensen en hartpatiënten omdat er hoge hartslagwaarden in bereikt worden.

Omwille van de nadelen van maximale testen zijn verschillende modellen ontwik- keld om VO2max te voorspellen uit sub-maximale inspanning. Bestaande modellen zijn vaak gebaseerd op subjectieve variabelen zoals antwoorden op vragenlijsten en een zelfgekozen loopsnelheid [1]. Het is echter beter om de modellen alleen op objec- tieve variabelen te baseren om meer betrouwbare voorspellingen te kunnen maken.

Ook wordt in bestaande modellen niet vaak gebruik gemaakt van variabelen die de bewegingen van een persoon beschrijven. Gerelateerd werk gebruikt hiervoor sport- specifieke kennis. Bestaande methodes zijn gebaseerd op voet-grond contacttijd [37]

en gemiddelde versnelling [34], terwijl nog veel andere variabelen kunnen gebruikt worden.

(12)

In plaats van alleen domeinkennis te gebruiken, stelt deze masterthesis een data- gedreven methode voor om variabelen te vinden die bewegingen van lopers beschrij- ven en geschikt zijn om VO2max te voorspellen. Deze variabelen worden samen met hartslag en beschrijvende variabelen gebruikt om een model op te stellen.

1.2 Onderzoeksvragen

Het doel is om een model op te stellen voor de voorspelling van VO2max uit sub- maximale inspanning. Het model moet toepasbaar zijn voor recreatieve lopers die op regelmatige basis hun uithoudingsvermogen willen opvolgen. De volgende onder- zoeksvragen moeten hiervoor beantwoord worden:

1. Welke variabelen zijn geschikt om VO2max te voorspellen uit sub-maximale inspanning?

2. Hoe kunnen machine learning technieken gebruikt worden om op basis van deze variabelen een model op te stellen?

1.3 Werkwijze

Om de eerste onderzoeksvraag te beantwoorden, moet gezocht worden naar kenmer- ken (Eng. features) om VO2max te voorspellen. De verzamelde gegevens bevatten accelerometermetingen en hartslag gemeten tijdens sub-maximale inspanning op een loopband. Uit de metingen kunnen verschillende kenmerken worden berekend. Om- dat hiervoor veel mogelijkheden zijn, zal het nodig zijn om een kleine selectie van kenmerken te maken om de modellen zo eenvoudig mogelijk te houden.

Om een antwoord te vinden op de tweede onderzoeksvraag, worden verschil- lende regressietechnieken met elkaar vergeleken. Het doel is om een nauwkeurig model te vinden dat bovendien eenvoudig is. Voor sportwetenschappers is het inte- ressant om te begrijpen hoe de voorspellingen gemaakt worden. Daarom moet het model eenvoudig genoeg zijn om te weten op welke manier de kenmerken de voor- spelde VO2max-waarden beïnvloeden. Naast het voorspellen van VO2max-waarden is het voor atleten en trainers ook interessant om te weten hoe betrouwbaar deze voorspellingen zijn. Hiervoor zullen methodes gebruikt worden die betrouwbaar- heidsintervallen met een vooraf bepaald betrouwbaarheidsniveau voorspellen.

De belangrijkste bijdragen van dit onderzoek zijn:

• een datagedreven methode om kenmerken te vinden die loopbewegingen be- schrijven en relevant zijn om VO2max te voorspellen;

• een nieuw model dat accelerometerkenmerken, hartslagkenmerken en be- schrijvende kenmerken combineert voor de voorspelling van VO2maxuit sub- maximale inspanning.

(13)

1.4. Structuur van de tekst

1.4 Structuur van de tekst

Hoofdstuk 2 geeft eerst de nodige achtergrondinformatie. Dit hoofdstuk legt uit wat VO2max is en hoe deze variabele gemeten wordt, welke methodes reeds bestaan om uit sub-maximale inspanning VO2max te voorspellen en welke variabelen uit ac- celerometermetingen kunnen berekend worden om loopbewegingen te beschrijven.

Hoofdstuk 3 beschrijft vervolgens de gegevens die in dit werk gebruikt worden en hoe deze verzameld zijn. In hoofdstuk 4 worden uit deze gegevens verschillende kenmerken berekend. Dit hoofdstuk stelt ook een selectiemethode voor om een kleine verzameling van relevante kenmerken te bekomen. In hoofdstuk 5 worden verschillende regressiemethodes met elkaar vergeleken en wordt het uiteindelijk mo- del opgesteld. Om ook een indicatie van de betrouwbaarheid van de voorspellingen te geven, vergelijkt hoofdstuk 6 twee manieren om betrouwbaarheidsintervallen te voorspellen. Hoofdstuk 7 vat ten slotte de resultaten van deze masterthesis samen en bespreekt voor- en nadelen van het uiteindelijk model.

(14)
(15)

Hoofdstuk 2

Achtergrond

Dit hoofdstuk geeft de nodige achtergrondinformatie voor dit werk. Sectie2.1legt uit wat VO2max is en hoe deze variabele gemeten wordt. Gerelateerd werk om VO2max te voorspellen wordt besproken in sectie 2.2. Dit werk zal ideeën uit bestaande methodes uitbreiden door meer gebruik te maken accelerometrie. Sectie 2.3 geeft daarom een overzicht van variabelen die uit accelerometermetingen kunnen berekend worden om loopbewegingen te beschrijven.

2.1 Maximaal zuurstofverbruik

Maximale zuurstofopname of VO2max is gedefiniëerd als het maximaal volume aan zuurstof dat een persoon kan opnemen per tijdseenheid, relatief tot zijn of haar lichaamsgewicht. Deze variabele wordt uitgedrukt in ml/kg/min.

Er zijn verschillende factoren die VO2max beïnvloeden. De waarde is voor een groot deel genetisch bepaald. Geslacht, leeftijd, lichaamsbouw en omgeving hebben ook een grote impact. Daarnaast is trainingsachtergrond bepalend: iemands maxi- male zuurstofopname kan toenemen of afnemen door respectievelijk meer of minder training. Omwille van de laatste factor is het mogelijk om op basis van VO2max

zowel de fysieke fitheid van atleten onderling te vergelijken als van een individuele atleet op verschillende tijdstippen.

VO2max wordt gemeten met een maximale incrementele inspanningstest, meestal op een loopband of fietsergometer. Het protocol van zo’n test bestaat uit intervallen van 3-5 minuten waarbij de inspanningsintensiteit (snelheid, hellingsgraad of ver- mogen) toeneemt totdat de atleet de inspanning niet langer kan volhouden en de test moet beëindigen. Tijdens de test neemt zuurstofopname (VO2) normaal gezien lineair toe en bereikt na een zekere tijd een plateau. Figuur 2.1toont een voorbeeld van de zuurstofopname van een loper tijdens een maximale incrementele inspan- ningstest. Om VO2maxte berekenen, deelt men de hoogste VO2-waarde (uitgedrukt in ml/min) door het lichaamsgewicht van de atleet.

(16)

0 50 100 150 200 Tijd (×10s)

0 1000 2000 3000

VO2(ml/min)

Figuur 2.1: Zuurstofopname (VO2) van een loper tijdens een maximale incrementele inspanningstest.

2.2 Gerelateerd werk

Omwille van praktische en fysieke beperkingen van maximale inspanningstesten zijn verschillende modellen ontwikkeld om VO2max te voorspellen uit sub-maximale in- spanning. Daarnaast bestaan ook modellen die geen inspanning vereisen. Abut et al. [1] geven een uitgebreid overzicht van bestaande voorspellingsmethodes. Deze sectie bespreekt de variabelen waarvan bestaande modellen gebruik maken.

In alle modellen wordt een verzameling van beschrijvende variabelen gebruikt.

Geslacht en leeftijd zijn de meestvoorkomende variabelen en worden vaak uitgebreid met lichaamsgewicht, lengte en BMI. Deze variabelen zijn nodig om VO2max te voorspellen en zullen daarom ook hier gebruikt worden.

2.2.1 Modellen op basis van sub-maximale inspanning

Bestaande modellen gebaseerd op sub-maximale inspanning maken gebruik van een zelfgekozen loopsnelheid of de combinatie van hartslag en biomechanische variabelen (i.e. variabelen die bewegingen beschrijven). Deze sectie geeft een overzicht van bestaande methodes en vergelijkt enkele voor- en nadelen van de modellen.

Zelfgekozen loopsnelheid

Verschillende modellen gebruiken afstand, tijd en hartslag gemeten tijdens het lo- pen, waarbij de loper aan een zelfgekozen snelheid loopt [3,11,2]. Een zelfgekozen snelheid wordt ook rechtstreeks als invoer gebruikt [5]. Deze modellen hebben als voordeel dat ze niet beperkt zijn tot het lopen op een loopband en dus praktisch zijn voor lopers. Het nadeel is echter dat de modellen zich op een zelfgekozen loop- snelheid baseren die de voorspellingen kunnen beïnvloeden omdat ze een subjectieve inschatting van de loper vereisen: als hij of zij niet weet hoe een waarde te kiezen, zal de voorspelling van het model fout zijn.

(17)

2.2. Gerelateerd werk

Hartslag (slagen/min)

Activiteitsniveau (m/s) 4 km/u

5,5 km/u

Figuur 2.2: Grafiek gebruikt voor de intercept en richtingscoëfficiënt kenmerken in het model van Tönis et al. [34]. Deze figuur is geïnspireerd op een figuur in de paper.

Combinatie van hartslag en biomechanische variabelen

Er zijn ook modellen ontwikkeld die alleen objectieve variabelen gebruiken. Be- staande methodes maken gebruik van variabelen die hartslag en biomechanische variabelen combineren.

Weyand et al. [37] ontwikkelden een model gebaseerd op de verhouding van inverse voet-grond contacttijd tot hartslag (t−1c /HR) berekend uit een loopinspan- ning van enkele minuten. In hun experimenten maten Weyand et al. contacttijd en hartslag voor toenemende snelheden. Inverse contacttijd (t−1c ) en hartslag (HR) stegen beide lineair aan ongeveer hetzelfde tempo. De verhouding van de twee va- riabelen was daarom constant over verschillende snelheden. Deze verhouding werd in de paper van Weyand et al. ‘aerobe fitheidsindex’ (Eng. aerobic fitness index, AFI) genoemd en werd samen met geslacht gebruikt als invoer voor een kleinste kwadraten lineair regressiemodel.

Een andere methode werd ontwikkeld door Tönis et al. [34] en gebruikt hartslag en metingen van een accelerometer bevestigd op de heup tijdens wandelactiviteit aan twee vaste snelheden (4 km/u en 5,5 km/u). Uit de accelerometermetingen berekenden ze het ‘activiteitsniveau’ (Eng. level of activity) van de bewegingen, gedefiniëerd als de som

t2

t1

|x(t)|dt + t2

t1

|y(t)|dt + t2

t1

|z(t)|dt

met (x, y, z) een reeks metingen van de drie assen van de accelerometer in een tijds- interval [t1, t2]. De relatie tussen hartslag en activiteitsniveau werd gemeten door de twee variabelen te plotten op een grafiek, met activiteitsniveau op de horizontale as en hartslag op de verticale as. Figuur 2.2 toont een voorbeeld van deze grafiek.

Op de grafiek werden dan punten toegevoegd die per 10 seconden aan wandelac- tiviteit de gemiddelde hartslag en het gemiddeld activiteitsniveau voorstellen. De

(18)

punten werden voor de twee wandelsnelheden toegevoegd, zodat twee puntenwolken gevormd werden.

Uit de grafiek werden vervolgens het intercept en de richtingscoëfficiënt van een lineaire regressielijn door de twee puntenwolken berekend. Het uiteindelijk model gebruikte geslacht, intercept en richtingscoëfficiënt om VO2max te voorspellen.

2.2.2 Modellen die geen inspanning vereisen

Er bestaan ook verschillende modellen met variabelen die geen fysieke inspanning vereisen. De voorspellingen worden dan gemaakt aan de hand van vragenlijsten.

Een veelvoorkomende variabele in die modellen is een zelf ingeschatte bekwaamheid (Eng. perceived functional ability, PFA) om bepaalde afstanden te wandelen, joggen of lopen [16,6,4,31]. Het nadeel van deze modellen is dat sommige variabelen – net zoals zelfgekozen loopsnelheid bij sub-maximale modellen – subjectief zijn en dus foute voorspellingen kunnen veroorzaken als de testpersoon de vragenlijsten foutief beantwoordt.

2.3 Accelerometrie en biomechanische variabelen

In de vorige sectie werden verschillende modellen besproken om VO2maxte voorspel- len uit sub-maximale inspanning gebruik makende van de combinatie van hartslag en accelerometermetingen. Dit werk bouwt verder op het idee om hartslag en acce- lerometrie te combineren.

Vaak worden MEMS1accelerometers gebruikt om wandel- en loopbewegingen te beschrijven. Het gebruik van dit soort accelerometers heeft verschillende voordelen [19]. Ze zijn licht en compact en hebben daarom geen invloed op de bewegingen van een loper. Bovendien zijn ze relatief goedkoop en gemakkelijk te gebruiken buiten een laboratoriumomgeving. In gerelateerd werk wordt uit accelerometermetingen voet-grond contacttijd en activiteitsniveau berekend om VO2max te voorspellen. Er bestaan echter nog veel andere variabelen om loopbewegingen te beschrijven. De rest van deze sectie geeft een overzicht van verschillende biomechanische variabelen die uit accelerometermetingen kunnen berekend worden.

Variabelen die zoals voet-grond contacttijd en activiteitsniveau specifiek zijn aan loop- en wandelbewegingen, worden opgesomd in [32] en bevatten o.a.

• stapfrequentie, gemeten in stappen per seconde en berekend aan de hand van pieken in de versnelling;

• verticale oscillatie, gedefiniëerd als het grootste verschil in hoogte van een loper tijdens een stapcyclus;

• impactversnelling op het bovenlichaam, berekend uit de hoogte van de grootste piek per stap;

• enz.

1Eng. micro electro-mechanical systems

(19)

2.3. Accelerometrie en biomechanische variabelen

Deze variabelen kunnen gebruikt worden om veranderingen van loop- en wan- delbewegingen te meten die veroorzaakt worden door vermoeidheid. Sommige van de bovenstaande variabelen zijn echter niet gemakkelijk te berekenen. Om verticale oscillatie te berekenen moet bijvoorbeeld de positie van de loper bepaald worden.

Dat vereist een dubbele integratie van versnelling, die sterk beïnvloedbaar is door kwadratisch toenemende meetfouten van accelerometers [39].

Er bestaan ook statistische variabelen die eenvoudig te berekenen zijn en vaak al voldoende zijn om modellen op te stellen. In verschillende studies wordt het kwadra- tisch gemiddelde of RMS (Eng. root mean squared) van de versnelling gebruikt om loopbewegingen te analyseren. RMS is gerelateerd aan de variabiliteit van bewegin- gen en wordt gebruikt om compensatiebewegingen door vermoeidheid te detecteren [28], om zuurstofverbruik (VO2) te schatten [20] en om uit wandelbewegingen snel- heid te voorspellen [22]. Andere voorbeelden van statistische variabelen die berekend kunnen worden uit accelerometermetingen, zijn gemiddelde, standaardafwijking, va- riantie, energie, hoogte van pieken, afstand tussen pieken, enz. Die variabelen kan men berekenen voor verschillende assen (x, y, z) van een accelerometer, vergelijken over verschillende tijdstippen of combineren met elkaar of met variabelen van andere sensoren (zoals hartslag) om patronen te vinden in loop- en wandelbewegingen.

(20)
(21)

Hoofdstuk 3

Data

Om VO2maxte meten en voorspellen werden gegevens verzameld uit een inspannings- test op een loopband. Aan die test namen 31 recreatieve lopers deel. Het protocol van de inspanningstest wordt beschreven in sectie 3.1. Tijdens de test werden ver- schillende variabelen gemeten. Sectie 3.2geeft een overzicht van de metingen en de verwerking ervan. Sectie 3.3geeft vervolgens een beschrijving van de deelnemers.

3.1 Protocol

Het protocol dat de looptesten volgden, is een maximale incrementele inspannings- test op een gemotoriseerde loopband (Saturn h/p/cosmos, Nussdorf-Traunstein, Duitsland). Het protocol start met een opwarming van vier minuten aan een snel- heid van 8 km/u voor vrouwen en 9 km/u voor mannen. Na de opwarming volgen intervallen van vier minuten afgewisseld met telkens 1 minuut rust, waarbij aan het begin van elk interval de snelheid met 1,5 km/u verhoogd wordt. De test eindigt wanneer de loper de inspanning niet langer kan volhouden. Figuur 3.1 geeft een voorbeeld van het verloop van de looptest.

Cool-down

Interval 6

Interval 5

Opwarming Interval 1 Interval 2 Interval 3 Interval 4

0 4 8 9 13 14 18 19 23 24 28 29 31 32 36 Tijd

(min) 10,5

9

12 Snelheid

(km/u)

13,5

15

16,5

9

Figuur 3.1: Voorbeeld van het verloop van de looptest van een man (eerste interval aan 9 km/u) die in interval 6 na 2 minuten stopte.

(22)

Hoewel in sommige protocollen om VO2max te meten de hellingsgraad van de loopband verhoogd wordt, neemt hier alleen snelheid toe. De hellingsgraad was gedurende de volledige test 1% zodat het energieverbruik van de lopers gelijkaardig was aan wanneer de lopers buiten zouden lopen [17].

3.2 Metingen

Tijdens de looptest werden zowel fysiologische gegevens als accelerometermetingen verzameld. Deze sectie bespreekt welke variabelen gemeten zijn en hoe deze verwerkt worden.

3.2.1 Fysiologische gegevens

De fysiologische gegevens bevatten hartslag, zuurstofverbruik, lactaatconcentratie en vermoeidheidsgraad. Van deze variabelen zal echter alleen hartslag gebruikt worden om VO2max te voorspellen. Het doel is om een model te ontwikkelen dat praktisch is voor recreatieve lopers en alleen op objectieve variabelen gebaseerd is. Omdat het meten van zuurstofopname en lactaatconcentratie dure apparatuur vereist en vermoeidheidsgraad niet objectief is, zijn die variabelen niet geschikt om te gebruiken in de modellen.

Hartslag Tijdens de test werd hartslag (in slagen/min) gemeten per seconde en nadien uitgemiddeld per 10 seconden. Hoewel bij de meeste lopers hartslag steeg binnen elk interval, hadden de metingen voor sommige lopers toch enkele pieken en dalen. Hierdoor is het moeilijk om voor alle lopers op dezelfde manier kenmerken te berekenen uit de hartslagmetingen. Om dit probleem op te lossen, worden de metingen gefilterd met een mediaanfilter. Die filter vervangt in elk tijdsvenster van 10 seconden de waarde door de mediaan van de waarden in de drie voorgaande tijdsvensters, het tijdsvenster zelf en de drie volgende vensters. Figuur3.2toont een voorbeeld van het effect van de mediaanfilter op de hartslagmetingen.

Zuurstofverbruik (VO2) Gedurende de test werd een zuurstofmetingsapparaat (Cosmed 91 Quark CPET) gebruikt om de ingeademde en uitgeademde zuurstof te meten. Zuurstofverbruik wordt niet als invoer voor de voorspellingen gebruikt, maar deze variabele is wel nodig om VO2max te berekenen. Maximale zuurstofop- name wordt hier gedefiniëerd als het maximum van het bewegend gemiddelde (Eng.

moving average) van elke 30 seconden van de zuurstofopname, gedeeld door het li- chaamsgewicht van de loper. De VO2max wordt berekend voor elke looptest. Elke loper deed één of twee looptesten: een loper kan dus twee verschillende VO2max- waarden hebben. Figuur 3.3toont een voorbeeld van hoe VO2max berekend wordt uit de VO2-metingen. De voorspellingen van de modellen zullen geëvalueerd worden aan de hand van de VO2max-waarden berekend op deze manier.

(23)

3.2. Metingen

0 50 100 150 200 250

Tijd (×10s) 80

100 120 140 160 180 200 220

Hartslag(slagen/min)

(a) Gemeten hartslag

0 50 100 150 200 250

Tijd (×10s) 80

100 120 140 160 180 200 220

Hartslag(slagen/min)

(b) Gefilterde hartslag

Figuur 3.2: Voorbeeld van het effect van een mediaanfilter op de hartslagmetingen:

de piek in het begin van de test wordt afgevlakt door de filter.

0 50 100 150 200

Tijd (×10s) 0

10 20 30 40 50

VO2/gewicht(ml/kg/min)

Bewegend gemiddelde

VO2max

Figuur 3.3: Berekening van VO2max uit zuurstofopname relatief tot lichaamsgewicht.

(24)

3.2.2 Accelerometermetingen

Tijdens de test werd versnelling (in g = 9.81 m/s2) gemeten met vier draadloze accelerometers (Shimmer3, bereik van ± 16g). De accelerometers werden bevestigd op het linker- en rechterscheenbeen, de onderrug en de bovenrug van de lopers. Fi- guur 3.4 toont de posities van de accelerometers met voorbeelden van de gemeten signalen. Omdat bij sommige lopers de accelerometer van het linker- of rechter- scheenbeen loskwam tijdens de test, wordt slechts één van de twee scheenbeenacce- lerometers gebruikt. Voor lopers waarbij beide accelerometers niet loskwamen wordt die van het linkerscheenbeen gebruikt.

0 1 2 3

Tijd (s) 0.0

0.5 1.0 1.5 2.0 2.5 3.0 3.5

Versnelling(g)

0 1 2 3

Tijd (s) 0.0

0.5 1.0 1.5 2.0

Versnelling(g)

0 1 2 3

Tijd (s) 0

1 2 3 4 5 6 7

Versnelling(g)

0 1 2 3

Tijd (s) 0

1 2 3 4 5 6 7 8

Versnelling(g)

Figuur 3.4: Posities van de accelerometers, met voorbeelden van de gemeten totale versnelling.

Voordat de gemeten signalen gebruikt kunnen worden om er verschillende ken- merken uit te berekenen, gebeuren eerst drie stappen als voorbewerking (Eng. pre- processing). De signalen worden eerst gefilterd zodat ze minder ruis bevatten. Daar- naast is een methode nodig om het begin en einde van elk interval te detecteren om- dat de kenmerken berekend worden per interval van de looptest. Ook is de rotatie van de accelerometers niet exact dezelfde bij elke loper. Om ervoor te zorgen dat de assen voor elke loper in dezelfde richting liggen, wordt er een correctie op toegepast.

De drie stappen worden hieronder besproken.

Filteren De metingen van de accelerometers hebben een bemonsteringsfrequentie (Eng. sampling rate) van 1024 Hz. Om ruis te verwijderen worden de gemeten signalen gefilterd met een laagdoorlaatfilter (Eng. low-pass filter) met een afsnij- frequentie (Eng. cutoff frequency) van 50 Hz. De Python-code maakt gebruik van scipy.signal.firwin en scipy.signal.lfilter om de signalen te filteren.

(25)

3.2. Metingen

Figuur 3.5: Intervaldetectie voor de accelerometermetingen. Het begin en einde van elke interval wordt aangeduid met respectievelijk een groene en rode verticale lijn. (Er is geen rustperiode tussen de opwarming en het eerste interval, waardoor de rode lijn daar niet zichtbaar is.)

Intervaldetectie De test bestond uit een opeenvolging van intervallen afgewis- seld met korte rustperiodes. De start- en eindtijden van de intervallen zijn echter niet beschikbaar in de gegevens. Omdat het veel werk vraagt om deze manueel te vinden voor alle looptesten, wordt er een automatische methode voor gebruikt. De methode vindt eerst pieken in de totale versnelling en gebruikt die om de intervallen te detecteren. Omdat tijdens de rustperiodes soms bewegingen gemaakt worden met hoge pieken (omdat de loper bijvoorbeeld van de loopband wandelt) worden eerst de

‘eenzame pieken’ verwijderd: dat zijn pieken waarvoor weinig andere pieken in de buurt ervan voorkomen. Aan de hand van de overblijvende pieken wordt het begin van een interval gedetecteerd als een piek waarvoor in de voorgaande 5 seconden geen andere pieken voorkwamen. Het einde van een interval wordt op dezelfde ma- nier gedetecteerd, maar dan wordt naar volgende pieken gezocht in plaats van de voorgaande. Figuur 3.5 toont een voorbeeld van de gedetecteerde intervallen.

Correctie van de assen De assen van de accelerometers worden gecorrigeerd zo- dat de rotatie van de accelerometers dezelfde is in alle looptesten. Hiervoor wordt een methode van Moe-Nilssen [21] gebruikt, waarbij de assen gedraaid worden vol- gens de anterieur-posterieure (AP), mediolaterale (ML) en verticale (V) richting van de lopers (zie figuur 3.6). Die methode transformeert gemeten versnellingen (ax, ay, az) naar (aAP, aML, aV) waarbij verondersteld wordt dat ax in het sagittale vlak van de loper ligt (het vlak dat loodrecht staat op de mediolaterale richting).

Het nieuwe signaal (aAP, aML, aV) wordt berekend aan de hand van de hoeken θAP

(26)

Anterieur-posterieur

Verticaal

Figuur 3.6: Anterieur-posterieure, mediolaterale en verticale richting.

en θML, tussen het horizontale vlak en respectievelijk ax en ay: θAP = arcsin ax

θML= arcsin ay

Uit deze hoeken wordt (aAP, aM L, aV) als volgt berekend:

aAP= ax· sin θAP− az· cos θAP

aML= ay· cos θML− (ax· sin θAP+ az· cos θAP)· sin θML

aV= ay· sin θML+ (ax· sin θAP+ az· cos θAP)· cos θML− 1g

Merk op dat bij de berekening van aV op het einde van de vergelijking 1g wordt afgetrokken. Op deze manier wordt de zwaartekracht uit het signaal verwijderd.

3.3 Deelnemers

In totaal namen 31 recreatieve lopers van 19-26 jaar oud deel aan de test, waarvan 15 mannen en 16 vrouwen. Van deze lopers deden 16 een tweede test: in totaal wer- den dus 47 looptesten uitgevoerd. Daarvan worden echter zes testen niet gebruikt omwille van fouten in de metingen. Bij vier testen was het verloop van de hartslag- metingen sterk schommelend, waarschijnlijk veroorzaakt door een slecht verbonden

(27)

3.3. Deelnemers

Mannen Vrouwen Totaal

Deelnemers 12 16 28

Testen 16 25 41

Leeftijd(jaar) 22, 06± 2, 11 21, 56± 0, 70 21, 76± 1, 44 Gewicht(kg) 75, 34± 11, 23 61, 55± 7, 18 66, 93± 11, 22

Lengte (m) 1, 79± 0, 07 1, 68± 0, 06 1, 72± 0, 08 BMI (kg/m2) 23, 46± 2, 85 21, 84± 2, 38 22, 47± 2, 69 VO2max (ml/kg/min) 51, 55± 5, 74 43, 65± 4, 90 46, 73± 6, 51

Tabel 3.1: Karakteristieken van de deelnemers. (gem. ± SD)

hartslagsensor. In twee andere testen hadden de accelerometermetingen een foute bemonsteringsfrequentie. Van de testpersonen van deze zes testen deden wel 3 lo- pers een tweede test, die niet verwijderd wordt. Tabel 3.1 vat de karakteristieken samen voor de 28 deelnemers van de 41 overblijvende looptesten.

(28)
(29)

Hoofdstuk 4

Kenmerken om VO 2max te voorspellen

In dit hoofdstuk worden kenmerken (Eng. features) gezocht om VO2maxte voorspel- len uit sub-maximale inspanning. Sectie 4.1beschrijft eerst welke kenmerken bere- kend worden uit de gegevens van het vorige hoofdstuk. Vervolgens stelt sectie 4.2 methodes voor om van deze kenmerken een kleine verzameling relevante kenmerken te selecteren. De methodes worden vergeleken in sectie 4.3 aan de hand van enkele experimenten.

4.1 Kenmerken

Om VO2max te voorspellen, zullen zowel beschrijvende kenmerken, hartslagkenmer- ken als accelerometerkenmerken gebruikt worden. De laatste 2 soorten kenmerken worden berekend uit de metingen beschreven in het vorige hoofdstuk. Omdat het doel bestaat uit het ontwikkelen van een model op basis van sub-maximale inspan- ning, worden enkel de metingen van de opwarming en de eerste drie intervallen van de inspanningstest gebruikt. In het derde interval liepen mannen aan 12 km/u en vrouwen aan 11 km/u, wat beschouwd wordt als sub-maximale inspanning. De rest van deze sectie bespreekt de verschillende kenmerken. Tabel 4.1geeft een overzicht van de beschrijvende kenmerken, hartslagkenmerken en accelerometerkenmerken.

4.1.1 Beschrijvende kenmerken

In bestaande modellen om VO2max te voorspellen worden steeds beschrijvende ken- merken gebruikt. Geslacht en lichaamsgewicht zijn twee belangrijke kenmerken ge- relateerd aan maximale zuurstofopname. Hoewel leeftijd ook een belangrijke factor is, nemen we deze niet op als kenmerk. Per jaar neemt VO2max slechts 0.2-0.5 ml/kg/min af [10]. Omdat alle geteste lopers tussen 19 en 26 jaar oud zijn, zullen de verschillen in VO2max als gevolg van een verschil in leeftijd eerder klein zijn.

(30)

Type # Kenmerken

Beschrijvend 2 Geslacht (1 = man, 2 = vrouw) G

Lichaamsgewicht M

Hartslag 8 Gemiddelde hartslag HR(−1)i

Versnelling 772 Gemiddelde GEM(a,r,i−1)

Standaarddeviatie SD(a,r,i−1) Kwadratisch gemiddelde RMS(a,r,i−1)

Energie E(a,r,i−1)

Phase plot breedte PPW(a,r,i−1) Phase plot hoogte PPH(a,r,i−1) Phase plot ratio (breedte/hoogte) PPR(a,r,i−1) Tabel 4.1: Overzicht van beschrijvende kenmerken, hartslagkenmerken en accelero- meterkenmerken met afkortingen. Notatie: interval i = 0, 1, 2, 3 (interval 0 is de opwarming); accelerometerlocatie a = s, or, br (s = scheenbeen, or = onderrug, br = bovenrug); richting r = x, y, z, t (x = anterieur-posterieur, y = mediolateraal, z = verticaal, t = totaal); het superscript (−1) betekent dat zowel het kenmerk als de inverse ervan wordt toegevoegd.

4.1.2 Hartslagkenmerken

De kenmerken berekend uit hartslag zijn gemiddelde en inverse (1/gemiddelde) voor elk interval. Om de gemiddelde hartslag van een interval te berekenen, wordt telkens alleen de laatste minuut ervan gebruikt. Hartslag daalde tijdens de rustperiodes waardoor deze in het begin van elk interval opnieuw vanaf een lage waarde steeg.

In de laatste minuut waren de hartslagwaarden stabieler: het is daarom beter om enkel de metingen van die laatste minuut te gebruiken.

4.1.3 Accelerometerkenmerken

Uit de accelerometermetingen worden verschillende kenmerken berekend die de be- wegingen van de lopers beschrijven. Omdat iemand met een hoge VO2max een la- gere hartslag voor gelijke VO2-waarden heeft [27], kunnen variabelen gerelateerd aan zuurstofverbruik (VO2) samen met hartslag een indicatie van VO2max geven.

Daarom worden verschillende kenmerken gedefiniëerd die gerelateerd zijn aan zuur- stofverbruik. De accelerometerkenmerken bestaan uit twee soorten: statistische ken- merken en phase plot kenmerken. De rest van deze sectie bespreekt beide soorten en beschrijft hoe ze berekend worden.

(31)

4.1. Kenmerken

0 1 2 3

Tijd (s) 0

1 2

Versnelling(g)

(a) Gemeten signaal

0 1 2

Versnelling (g)

−0.10

−0.05 0.00 0.05

Jerk(g/s)

(b) Phase plot

Figuur 4.1: Voorbeeld van een phase plot van het signaal van een accelerometer op de onderrug.

Statistische kenmerken Een eerste soort kenmerken die uit de accelerometer- metingen berekend worden, zijn statistische kenmerken. Gemiddelde, standaardde- viatie, kwadratisch gemiddelde (RMS) en gemiddelde energie worden berekend uit de x-, y-, z- en totale versnelling van de drie accelerometers (scheenbeen, onderrug en bovenrug). RMS wordt gebruikt om VO2 te voorspellen [20] uit accelerometer- metingen tijdens het lopen. De andere variabelen worden ook vaak gebruikt om bewegingen te beschrijven met behulp van accelerometers.

Phase plot kenmerken Een tweede soort kenmerken wordt afgeleid uit de phase plot van de signalen van de verschillende accelerometers. Dat is een plot waarbij de afgeleide van de versnelling (jerk) wordt voorgesteld in functie van de overeen- komstige versnelling. In medische papers worden phase plots vaak gebruikt bij de analyse van ECG1 signalen. Op dezelfde manier kunnen deze ook toegepast worden op signalen van accelerometers. Figuur 4.1toont een voorbeeld van een phase plot van de onderrugversnelling. Uit deze plot worden drie variabelen berekend: breedte, hoogte en ratio (breedte/hoogte). Breedte en hoogte zijn gedefiniëerd als het ver- schil tussen het 90ste en 10depercentiel in respectievelijk de horizontale en verticale richting. Net zoals de statistische kenmerken worden ook deze kenmerken berekend voor de x-, y-, z- en totale versnelling van de drie accelerometers.

Berekening van de accelerometerkenmerken Zowel de statistische kenmerken als de phase plot kenmerken worden berekend per interval. Voor elke kenmerk wordt zoals bij gemiddelde hartslag ook de inverse ervan berekend. Dat geeft een totaal van 772 accelerometerkenmerken, wat een groot aantal is gezien er slechts 41 loop- testen zijn. Sectie 4.2 zal daarom methodes beschrijven om een kleine verzameling van relevante kenmerken te selecteren. Voor de berekening van de accelerometerken- merken wordt rekening gehouden met de versnelling en vertraging van de loopband aan het begin en einde van elk interval, die beide ongeveer 10 seconden duren. Om

1Elektrocardiogram

(32)

ervoor te zorgen dat dit de metingen niet beïnvloedt, worden in elk interval de eerste en laatste 10 seconden van de accelerometermetingen niet gebruikt.

4.1.4 Kenmerken die hartslag en accelerometervariabelen combineren

Bestaande methodes gebaseerd op hartslag en accelerometermetingen maken gebruik van variabelen die deze twee soorten gegevens combineren. De verhouding t−1c /HR in het model van Weyand et al. [37] zou ook hier als kenmerk kunnen gebruikt worden. Als uitbreiding hiervan kunnen we gelijkaardige kenmerken definiëren door andere accelerometervariabelen te gebruiken. Daarnaast kunnen we ook kenmerken gelijkaardig aan de variabelen voorgesteld door Tönis et al. [34] definiëren: die zijn hier dan gebaseerd op verschillen tussen loopsnelheden in plaats van wandelsnelhe- den.

Verhouding tussen hartslag en inverse voet-grond contacttijd

De modellen zouden ook t−1c /HR als kenmerk kunnen gebruiken. De moeilijkheid is echter om voet-grond contacttijd (tc) uit de beschikbare metingen te berekenen.

Weyand et al. gebruikten hiervoor een accelerometer bevestigd op de voet. Het is gemakkelijk om daaruit contacttijd te berekenen door de tijd te meten waarin de versnelling nul (of klein) is. Omdat de accelerometers tijdens de looptesten echter bevestigd zijn op de scheenbenen, onderrug en bovenrug van de lopers, kan contacttijd niet op dezelfde manier berekend worden.

Er bestaan wel methodes om voet-grond contacttijd te berekenen met accele- rometers bevestigd op andere locaties. Een accelerometer op het scheenbeen kan hiervoor gebruikt worden, hoewel het dan niet gemakkelijk is om te detecteren wan- neer de voet van de grond komt. Een andere methode maakt gebruik van versnelling gemeten in het zwaartepunt van het lichaam. Hiervoor kan een accelerometer op de onderrug gebruikt worden aangezien deze zich dicht bij het zwaartepunt bevindt.

In sectie4.3.3zullen de modellen vergeleken worden met het model van Weyand et al. Die sectie zal ook beide methodes om contacttijd te berekenen uit accelero- metermetingen in meer detail bespreken. Aan de hand van een extra validatietest worden de twee methodes vergeleken met elkaar.

Verhouding tussen hartslag en andere accelerometervariabelen

In plaats van contacttijd kunnen ook andere accelerometervariabelen op dezelfde manier met hartslag gecombineerd worden. Deze combinaties zullen verder in de tekst ‘ratio kenmerken’ genoemd worden. Het idee is om verschillende ratio kenmer- ken te definiëren en vervolgens een selectie te maken van combinaties die bruikbaar zijn om VO2max te voorspellen.

De hartslagkenmerken uit4.1.2en de accelerometerkenmerken uit 4.1.3 worden gecombineerd door deze met elkaar te vermenigvuldigen:

fHR· facc

(33)

4.2. Selectie van kenmerken

12 13 14 15 16 17 18 19 20

Activiteitsniveau (m/s) 100

120 140 160 180 200

Hartslag(slagen/min)

Opwarming Interval 1

Interval 2 Interval 3

12 13 14 15 16 17 18 19 20

Activiteitsniveau (m/s) 100

120 140 160 180 200

Hartslag(slagen/min)

Opwarming Interval 1

Interval 2 Interval 3

Figuur 4.2: Plot met hartslag en activiteitsniveau tijdens de looptest. Links:

voorbeeld van metingen waaruit intercept en richtingscoëfficiënt kan berekend worden. Rechts: voorbeeld waarin dit niet zinvol is. De punten komen overeen met gemiddeld activiteitsniveau en hartslag per 10 seconden van de laatste minuut van elk interval.

met fHR een hartslag kenmerk en facc een accelerometerkenmerk, beide van het- zelfde interval. De hartslagkenmerken en accelerometerkenmerken bevatten zowel statistische en phase plot kenmerken als inverse kenmerken, waardoor de producten verhoudingen voorstellen die gelijkaardig zijn aan t−1c /HR. In totaal geeft dit een verzameling van 1544 kenmerken. Daarom zal het net zoals bij de accelerometerken- merken noodzakelijk zijn om een kleine verzameling van kenmerken te selecteren.

Intercept en richtingscoëfficiënt

Zoals besproken in sectie 2.2ontwikkelden Tönis et al. [34] een model gebaseerd op intercept en richtingscoëfficiënt van een lineaire regressielijn op een plot met hartslag en ‘activiteitsniveau’ voor wandelbewegingen aan twee snelheden. Figuur2.2toonde een voorbeeld van die plot.

Gelijkaardige kenmerken kunnen gedefiniëerd worden voor de gegevens gemeten tijdens de looptesten. Voor de meeste lopers is er tussen de verschillende loop- snelheden een gelijkaardig patroon te zien als bij de studie van Tönis et al. waar wandelbewegingen gebruikt werden. Voor sommige lopers is dit echter niet het geval en is het dus niet zinvol om uit de puntenwolken intercept en richtingscoëfficient te berekenen. Figuur 4.2toont de plots van twee looptesten (van verschillende lopers) als voorbeeld. Voor de rechtse plot is het niet zinvol om intercept en richtingscoëffi- ciënt te berekenen. Omdat het niet mogelijk is om deze kenmerken voor alle lopers te berekenen, zullen deze niet worden gebruikt.

4.2 Selectie van kenmerken

Van de hartslagkenmerken en vooral van de accelerometerkenmerken zijn veel ken- merken aan elkaar gecorreleerd. Er zijn bijvoorbeeld correlaties tussen verschillende

(34)

intervallen, tussen accelerometer assen, enz. Zogenaamde multicollineariteit vormt een probleem voor kleinste kwadraten lineaire regressie, waarmee de modellen zullen opgesteld worden. Ook zijn niet alle kenmerken relevant om VO2max te voorspel- len. Daarom moet uit de verzameling van kenmerken een kleine deelverzameling van onderling onafhankelijke kenmerken geselecteerd worden.

Er bestaan verschillende technieken om kenmerken te selecteren. Twee methodes worden hieronder besproken: voorwaartse selectie en een methode gebaseerd op correlaties met VO2max in combinatie met principale componentenanalyse (PCA).

Sectie 4.3bespreekt experimenten om de methodes met elkaar te vergelijken.

Als alternatief voor de selectiemethodes zou ook lasso regressie kunnen gebruikt worden. Deze methode zoekt een lineaire regressiefunctie waarbij zoveel mogelijk gewichten op 0 worden gezet, wat ook zorgt voor een selectie van kenmerken. Het volgende hoofdstuk vergelijkt verschillende regressiemethodes, waaronder ook lasso.

Voorwaartse selectie

Voorwaartse selectie start met een lege of kleine verzameling kenmerken en voegt nieuwe kenmerken toe totdat een verzameling van goede kenmerken gevonden is.

Deze methode wordt vaak gebruikt wanneer het aantal kenmerken groot is. In dat geval zou achterwaartse eliminatie geen goede methode zijn: die methode start met alle kenmerken en verwijdert telkens kenmerken, wat veel tijd vraagt.

We gebruiken hier een gretige (Eng. greedy) variant van voorwaartse selectie.

Dat betekent dat telkens één kenmerk wordt toegevoegd. Om in elke stap het vol- gende kenmerk te kiezen, kan men verschillende criteria gebruiken. Een eenvoudige manier is om telkens de huidige verzameling kenmerken uit te breiden met één nieuw kenmerk en hiervoor een lineair regressiemodel te evalueren. Deze evaluatie ge- beurt best met cross-validatie: hiervoor wordt leave-one-subject-out cross-validatie gebruikt. Het kenmerk dat resulteert in de hoogste R2adj-waarde (gecorrigeerde ver- klaarde variantie, Eng. adjusted explained variance) wordt toegevoegd aan de gese- lecteerde kenmerken. Gecorrigeerde verklaarde variantie is gedefiniëerd als

1− (1 − R2)· n− 1 n− m − 1

met R2de verklaarde variantie van het model (zie4.3.1), n het aantal trainingsvoor- beelden en m het aantal kenmerken. R2adj zal lager zijn dan R2 als meer kenmerken toegevoegd worden. Door het aantal kenmerken in rekening te brengen, zullen de modellen eenvoudiger zijn en is er dus minder kans op overfitting. Er worden ken- merken toegevoegd tot een bepaald stopcriterium bereikt is: het toevoegen van ken- merken zal hier stoppen wanneer de R2adj-waarde niet veel meer toeneemt (minder dan 0,05).

Correlatie en PCA

Een andere methode om kenmerken te selecteren is om correlatie met VO2max te berekenen en op basis daarvan de beste kenmerken te kiezen. Daarbij is het be- langrijk om een robuuste maat voor correlatie te kiezen, zodat de geselecteerde

(35)

4.3. Experimenten

kenmerken niet afhankelijk zijn van welke looptesten de trainingsverzameling bevat.

Het is daarom niet genoeg om gewoon de Pearson of Spearman correlatiecoëfficiënt te berekenen tussen de waarden van een kenmerk en de VO2max-waarden. Deze correlatiecoëfficiënten kunnen wel op een robuustere manier berekend worden door cross-validatie te gebruiken en het gemiddelde van de correlatiecoëfficiënten van de deelverzamelingen te berekenen. Op basis van de gemiddelde correlatiecoëfficiënten kan vervolgens een ranking van de kenmerken gemaakt worden om zo de N beste kenmerken te selecteren. Die N moet groot genoeg zijn, zodat alle andere kenmer- ken aan de eerste N kenmerken gecorreleerd zijn. Voor de gebruikte verzameling kenmerken was N = 200 groot genoeg.

Omdat veel kenmerken sterk gecorreleerd zijn aan elkaar, zullen ook de N beste kenmerken gecorreleerd zijn. Van de geselecteerde kenmerken moet daarom nog een deelverzameling van onderling onafhankelijke kenmerken gekozen worden. Dit kan met principale componentenanalyse (PCA): deze methode voert een lineaire transformatie uit op de kenmerken zodat de getransformeerde kenmerken (compo- nenten) orthogonaal zijn en de eerste componenten de grootste variantie hebben.

De componenten worden voorgesteld als lineaire combinaties w1· x1+ ... + wN · xN

van de kenmerken x1, ..., xN met coëfficiënten w1, ..., wN. Omdat deze componenten orthogonaal zijn, zijn ze onafhankelijk van elkaar. Aan de hand van de componenten met de grootste variantie kunnen dan onafhankelijke kenmerken geselecteerd worden door van elk van deze componenten het kenmerk met de grootste coëfficiënt te kiezen.

4.3 Experimenten

Aan de hand van enkele experimenten zoekt deze sectie een verzameling van re- levante kenmerken. In de experimenten zullen lineaire modellen met verschillende kenmerken als invoer vergeleken worden. Sectie 4.3.1 legt daarom eerst uit hoe de evaluatie van de voorspellingen gebeurt. Het experiment in sectie4.3.2vergelijkt de twee selectiemethodes met elkaar. Het lineair model met de beste kenmerken wordt vervolgens in sectie4.3.3 vergeleken met het model van Weyand et al.

4.3.1 Evaluatiemethode

De evaluatie van de modellen zal gebeuren aan de hand van leave-one-subject-out cross-validation (LOSOCV). Deze evaluatiemethode gebruikt telkens de één of twee looptesten van een loper als testgegevens, zodat alle andere gegevens kunnen ge- bruikt worden om een model te leren. Op deze manier zijn er zoveel mogelijk gege- vens beschikbaar om te leren.

Om te meten hoe dicht de voorspelde VO2max-waarden bij de gemeten waarden liggen, worden twee evaluatiematen gebruikt: verklaarde variantie (R2) en gemid-

(36)

delde absolute fout (Eng. mean absolute error, MAE), gedefiniëerd als volgt:

R2 = 1

N

i=1yi− yi)2

N

i=1(yi− ¯y)2 MAE = 1

N ·

N i=1

|ˆyi− yi|

waarin ˆy de voorspelde waarden zijn, y de gemeten waarden, ¯y het gemiddelde van de gemeten waarden en N = 41 het aantal looptesten. R2 is een getal ≤ 1 dat weergeeft hoeveel variantie van de doelvariabele y wordt verklaard door het model.

Een R2-waarde van 1 betekent dat de voorspelde waarden exact overeenkomen de gemeten waarden.

4.3.2 Combinaties van verschillende soorten kenmerken

Zoals besproken in sectie 4.1worden in dit werk drie soorten kenmerken berekend:

beschrijvende kenmerken, hartslagkenmerken en accelerometerkenmerken. Beschrij- vende kenmerken (geslacht en gewicht) worden in gerelateerd werk in bijna elk model gebruikt en zullen daarom ook hier gebruikt worden. De beschrijvende kenmerken op zich zijn niet voldoende om goede voorspellingen te maken. Het idee is om naast de beschrijvende kenmerken ook gebruik te maken van de relatie tussen hartslag- kenmerken en accelerometerkenmerken, die bewegingen beschrijven en gerelateerd zijn aan VO2. Omdat hartslag en VO2 samen bepalend zijn voor VO2max, kan men veronderstellen dat door beide soorten kenmerken te gebruiken goede voorspellingen kunnen gemaakt worden. Het volgende experiment onderzoekt deze veronderstel- ling.

Experiment

In dit experiment worden vijf verzamelingen vergeleken die verschillende soorten kenmerken combineren:

• S1: alleen beschrijvende kenmerken;

• S2: beschrijvende kenmerken en hartslagkenmerken;

• S3: beschrijvende kenmerken en accelerometerkenmerken;

• S4a: beschrijvende kenmerken, hartslagkenmerken en accelerometerkenmerken;

• S4b: beschrijvende kenmerken, hartslagkenmerken en ratio kenmerken.

De selectiemethodes uit sectie4.2maken voor elke soort van kenmerken afzonderlijk een selectie van relevante kenmerken. Bij voorwaartse selectie worden wel de reeds geselecteerde kenmerken van de andere soorten kenmerken gebruikt: bij S2 en S3 voegt deze methode respectievelijk hartslagkenmerken en accelerometerkenmerken toe aan de beschrijvende kenmerken. De verzameling S2 wordt in S4a uitgebreid met

(37)

4.3. Experimenten

accelerometerkenmerken en in S4b met ratio kenmerken. Hoewel in S4b hartslagken- merken al in de ratio kenmerken voorkomen, worden ze toch nog apart toegevoegd omdat deze twee soorten kenmerken niet sterk gecorreleerd zijn aan elkaar en hart- slag een belangrijke variabele is om afzonderlijk in het model te gebruiken.

De verschillende soorten kenmerken worden vergeleken door de voorspellingen van lineaire regressiemodellen te vergelijken. Eerst worden de geselecteerde kenmer- ken geschaald zodat de waarden van elk kenmerk gemiddeld 0 zijn en standaard- afwijking 1 hebben. Vervolgens wordt een lineair regressiemodel geleerd met de kleinste kwadraten methode. (Het volgende hoofdstuk zal ook andere regressieme- thodes vergelijken.) De code gebruikt voor de methodes om kenmerken te schalen de klasse StandardScaler en om de modellen te leren de klasse LinearRegression van scikit-learn [25].

Resultaten

Figuren 4.3en4.4vergelijken voor beide selectiemethodes de voorspellingen met de gemeten VO2max-waarden voor de verschillende verzamelingen. Voorwaartse selecte van hartslagkenmerken en accelerometerkenmerken (S4a) geeft met een verklaarde variantie (R2) van 0,784 de beste resultaten. Een overzicht van de verklaarde varian- tie en de gemiddelde absolute fout voor S1, S2, S3, S4aen S4bmet zowel voorwaartse selectie (M1) als de methode met correlaties en PCA (M2) is samengevat in tabel4.3.

Uit de resultaten blijkt dat zowel M1 als M2 de beste kenmerken vinden door hartslagkenmerken en accelerometerkenmerken te combineren. Hierbij is het echter niet genoeg om de twee soorten kenmerken afzonderlijk te selecteren: bij S4a− M2

bijvoorbeeld worden accelerometerkenmerken toegevoegd zonder gebruik te maken van de relatie met hartslag. Door in S4b− M2 ratio kenmerken te selecteren, verbe- teren de resultaten wel ten opzichte van S2− M2 en S3− M2. Ook bij voorwaartse selectie (M1) maakt S4a gebruik van de relatie tussen hartslagkenmerken en accele- rometerkenmerken, omdat deze methode S2− M1 uitbreidt door telkens een lineair model te evalueren met zowel nieuwe accelerometerkenmerken als de kenmerken van S2 − M1. In tegenstelling tot M2 is voor M1 het verschil tussen S4a en S4b echter klein: hier levert het toevoegen van de ratio kenmerken dus niets op.

De kenmerken geselecteerd met de voorgestelde selectiemethodes zijn niet sterk aan elkaar gecorreleerd. Zoals eerder vermeld vormt multicollineariteit een pro- bleem voor kleinste kwadraten lineaire regressie. Deze selectiemethodes lossen dit probleem op. Tabel 4.2 toont als voorbeeld de onderlinge correlaties (Pearson cor- relatiecoëfficiënt) van de vier kenmerken met S4a− M1.

Tabel 4.4 toont de lineaire functies – geleerd met de kleinste kwadraten me- thode – voor de verschillende selectiemethodes. De selectiemethode met de beste resultaten (S4a−M1) resulteert in een model met vier kenmerken: geslacht, lichaams- gewicht, inverse van de gemiddelde hartslag en inverse van de standaarddeviatie van de totale scheenbeenversnelling. De laatste twee kenmerken worden berekend uit de opwarming van de looptest. Daarin liepen de deelnemers aan een snelheid van slechts 8 km/u (voor vrouwen) of 9 km/u (voor mannen). Gezien het doel van deze

Referenties

GERELATEERDE DOCUMENTEN

verzoekt de regering in gesprek met gemeenten en aanbieders te bewerkstelligen dat er alternatieven voor dagbesteding aangeboden worden,. en gaat over tot de orde

Probeer ook te achterhalen voor welke Operating Systems de filesystems geschikt zijn, de maximale schijfgrootte, de

De directie speelt een centrale rol bij het stimuleren van cultuureducatie, zeker als cultuur meer moet zijn dan leuke extra’s voor de leerling. Het ontwikkelen van visie op wat

De VVD-fractie steunt de stelselwijzi­ ging, waarbij gestreefd wordt naar meer horizontale en verticale samen­ werking. Omslag van een aanbod- naar een

Deze is immers afhankelijk van (inter- nationale) ekonomische ontwikkelin- gen, van de welvaartsgroei (elk pro- cent groei levert de publieke sektor 2 miljard per jaar op), van

9 Indien een kandidaat meer antwoorden (in de vorm van voorbeelden, redenen e.d.) geeft dan er expliciet gevraagd worden, dan komen alleen de eerstgegeven

De dagen zijn veel langer, omdat het ‛s morgens vroeg licht is en ‛s avonds laat donker wordt.. In de natuur is alles groen en we brengen dit warme seizoen met een ijsje bij het

[r]