Using survival data in gene mapping : using survival data in genetic linkage and family-based association analysis

(1)

Using survival data in gene mapping : using survival data in genetic linkage and family-based association analysis

Callegaro, A.

Citation

Callegaro, A. (2010, June 17). Using survival data in gene mapping : using survival data in genetic linkage and family-based association analysis. Retrieved from

https://hdl.handle.net/1887/15696

Version: Corrected Publisher’s Version

License: Licence agreement concerning inclusion of doctoral thesis in the Institutional Repository of the University of Leiden

Downloaded from: https://hdl.handle.net/1887/15696

Note: To cite this publication please use the final published version (if applicable).

(2)

H ^OOFDSTUK 9

Samenvatting

Het grootste deel van dit proefschrift (hoofdstuk 2-5) verkent statistische meth- oden voor het testen van genetische koppeling (linkage) voor overlevings- gegevens. We gebruikten frailty modellen. De frailties representeren afhankeli- jkheid tussen uitkomsten van familieleden als gevolg van het delen van marker allelen Identical by Descent (IBD). Scoretoetsen werden afgeleid van de ret- rospectieve likelihood van de marker gegevens conditioneel op de fenotypen van de familieleden. De toetsingsgrootheden blijken klassieke gewogen niet- parametrische likelihood (NPL) toetsen (Kruglyak et al., 1996) te zijn. De gewichten zijn functies van de leeftijd bij aanvang van ziekte van de familieleden of de huidige leeftijd in geval van gezonde familieleden. Deze toet- sen zijn gebaseerd op het delen van marker allelen door familieleden (allele- sharing). Ze kunnen worden toegepast op families geselecteerd op basis van de fenotypen en zij vereisen geen specificatie van het onderliggende genetische model of de penetrantie. Verder kunnen ze informatie van zowel zieke als gezonde familieleden meenemen. Tot slot, met betrekking tot de in de lit- eratuur voorgestelde likelihood-ratio toetsen (Commenges, 1994; Jonker et al., 2009; Li and Zhong, 2002; Pankratz et al., 2005) zijn de nieuwe scoretoetsen gemakkelijker uit te rekenen, hebben zij lokaal het meest onderscheidend ver- mogen en zijn ze robuust. Om al deze redenen bieden de voorgestelde gewogen NPL toetsen een praktische oplossing voor het in kaart brengen van genen voor complexe ziekten met variabele leeftijd bij aanvang van ziekte.

De voorgestelde scoretoetsen zijn gemplementeerd in een aantal C++ programmas (Arthur) die beschikbaar zijn op onze website (http://www.msbi.nl/Genetics). Arthur maakt gebruik van Merlin (Abecasis et al., 2002) om het aantal allelen dat IBD gedeeld wordt en de bijbehorende variantie te schatten. De variantie wordt door middel van simulaties geschat.

We pasten deze NPL methoden toe op gegevens met betrekking tot de vol- gende uitkomsten: borstkanker (hoofdstuk 2 en hoofdstuk 3), levensduur (hoofdstuk 3), de tijd tot n van de drie gebeurtenissen - coronaire hartziekten, diabetes, of dood door een andere oorzaak (hoofdstuk 4) en langlevendheid (hoofdstuk 5).

105

(3)

Hoofdstuk 9. Samenvatting

In het tweede deel van het proefschrift leidden we een nieuwe klasse van allele-sharing toetsen af die rekening houden met het fenotype van niet- gegenotypeerde familieleden (familiegeschiedenis). De familiegeschiedenis is gebruikt om het aantal allelen IBD gedeeld tussen familieleden met gemeten genotypen te wegen. Wij analyseerden symptomatische artrose in de GARP studie (Meulenbelt et al., 2008). Rekening houdend met de familiegeschiedenis steeg de LOD-score in de omgeving van het voor artrose predisponerende lo- cus (DIO2) van 3 tot 3,6. Door meenemen van familiegeschiedenis is de locatie waar de LOD-score zijn maximum bereikt dichter bij de locatie van DIO2.

In het derde en laatste deel van het proefschrift werd een nieuwe scoretoets voor genetische associatieanalyse van familiegegevens afgeleid. De scoretoets blijkt een klassieke Family-Based Association Test (FBAT) te zijn (Lake et al., 2000;

Rabinowitz and Laird, 2000). Een nieuwe, eenvoudige en flexibele gewicht- functie, die afhangt van het aantal allelen IBD gedeeld door de familieleden, werd afgeleid. Ook onderzochten we een toets die corrigeert voor de aan- wezigheid van interactie tussen de genetische marker en covariabelen. We il- lustreerden deze toets door gegevens van de NARAC studie en van GAW15 (Witte et al., 2007) te analyseren. Hierbij corrigeerden we voor mogelijke inter- acties met roken en met anti-CCP.

Verschillende methoden voor het omgaan met mogelijke heterogeniteit van gegevens bij niet-parametrische linkage-analyse en bij genetische associatieanalyse zijn in dit proefschrift onderzocht. Alle voorgestelde methoden proberen de heterogeniteit te verminderen door te wegen. We leidden nieuwe gewichten af om informatie over leeftijd bij aanvang van ziekte, de familiegeschiedenis en genetische en omgevingsfactoren mee te nemen. Om de voorgestelde methoden voor de wetenschappelijke gemeenschap beschikbaar te maken, ontwikkelden we vrij verkrijgbare en gebruikersvriendelijke software die wordt beschreven in het appendix van dit proefschrift.

106

Using survival data in gene mapping : using survival data in genetic linkage and family-based association analysis