• No results found

Random Forest för överlevnadsanalys med konkurrerande utfall: Prediktion av demens

N/A
N/A
Protected

Academic year: 2022

Share "Random Forest för överlevnadsanalys med konkurrerande utfall: Prediktion av demens"

Copied!
30
0
0

Loading.... (view fulltext now)

Full text

(1)

UMEÅ UNIVERSITET 7 juni 2021 Handelshögskolan, Statistik

Examensarbete (STC049)

Random Forest för överlevnadsanalys med

konkurrerande utfall

Prediktion av demens

Jan Elfving Sebastian Kalucza

(2)

Prediktion av demens 1 Populärvetenskaplig sammanfattning

1 Populärvetenskaplig sammanfattning

Demens är en samlingsdiagnos för en rad symptom relaterat till minnet som orsakas av hjärnskador och leder till att personen har svårt att klara sig på egen hand. Förutom att drabba individer och deras närmaste omgivning, så medför det stora samhällskostnader, varför studerandet av demensutveckling länge varit av intresse [1]. En sådan större studie är Betula-projektet i Umeå, som påbörjades 1988 och har fortlöpt under decennier. I projektet har en rad olika egenskaper med möjlig koppling till demensutveckling undersökts över tid hos totalt ca 4 000 individer.

I syfte att hitta eventuella statistiskt påvisbara egenskaper som kan kopplas till demensutveckling över tid kan olika statistiska metoder användas. En metod som används när det man vill undersöka är tiden fram till en händelse inträf- far är överlevnadsanalys. Med denna metod kan tiden till att en viss händelse (här demensinsjuknande) inträffar analyseras, samt hur olika förklaringsvari- abler påverkar denna eventuella händelse. Ofta förekommer i verkligheten s.k.

konkurrerande händelsersom inte är händelsen man undersöker för studien, men som likväl påverkar utfallet av händelsen av intresse (här att en individ avlider), och tar man hänsyn till dessa utfall kan man ofta få en bättre modell för att beskriva händelsen man undersöker.

En helt annan typ av statistisk metod är beslutsträd, som använder en trädlik- nande modell av beslut och beslutens möjliga konsekvenser. Detta är en väldigt flexibel modell som är bättre på att hantera komplicerade samband mellan va- riablerna än mer traditionella modeller. En mer datorintensiv variant (s.k. ma- skininlärning) av beslutsträd med förbättrad prestanda är Random Forest (RF) (läs: en hel skog med slumpmässiga beslutsträd). Här genereras många slump- mässiga modeller (beslutsträd), vars slutliga genomsnittsmodell ger en bättre skattning.

Under senare tid har RF-metoden utvecklats till att innefatta överlevnadsanalys med hänsyn till konkurrerande händelser. Det är denna metod som vi valt att använda i vår studie i syfte att undersöka olika förklaringsvariablers relativa viktighet vad gäller att utveckla demens.

Vår initiala analys visar att speciellt ett av studiens test som handlar om episo- diskt minne verkar vara en viktig demens-indikator. Testet går ut på att delta- gare memorerar kortare instruktioner samt utför dessa (t.ex. lyft på pennan").

Vidare stärker vår modell tidigare forskning som visar att en person som bär på på en viss variant av en gen (apoE4), löper större risk att drabbas av demens.

Även utbildning spelar en väsentlig roll enligt vår modell, men det är svårare att uttala sig om orsakssambandet då äldre personer ofta har en kortare utbildning, samtidigt som äldre personer löper större risk att utveckla demens.

(3)

Prediktion av demens 2 Sammanfattning

2 Sammanfattning

Statistik som ämnesområde är i ständig utveckling. I takt med att datorers be- räkningskapacitet stadigt förbättrats har mer beräkningsintensiva metoder som tidigare varit krångliga att tillämpa nu blivit lättillgängliga. Random Forest är ett exempel på en sådan metod som vuxit fram ur dessa premisser och visat sig fungera väl på en rad statistiska problem, prediktionsproblem inkluderat. En sådan problemtyp är s.k. överlevnadsanalys. Ett sätt att göra överlevnadsmo- dellen mer verklighetsnära är att utöka den till att även beakta konkurrerande händelser. Konkurrerande händelser är händelser som tävlar med den huvud- händelse som studeras. Genom att beakta dessa konkurrerande händelser kan mer korrekta överlevnadsskattningar göras.

I den här studien avser vi predikera demens med en Random Forest överlev- nadsmodell som tar hänsyn till konkurrerande händelser (RF-SRC). Det data som analysen bygger på är från Betula-studien, en studie över tid som syftar till att identifiera riskfaktorer för demens samt tidiga, signaler på demens. Datat innehåller en del bakgrundsvariabler samt resultat från ett antal minnestester som deltagarna ombetts utföra. Den huvudsakliga konkurrerande händelsen i det här fallet är att den studerade deltagaren dör.

Som ett resultat av demensprediktering får vi en skattning av respektive förkla- ringsvariabels relativa betydelse. Med undantag för den självskrivna variabeln ålder när individ påbörjar sitt deltagande i studien, så placerar sig ett prospek- tivt minnestest högst (prosp). Andra betydelsefulla förklaringsvariabler var två episodiska minnestest (sptb, sptcrc), genvarianten apoE4 samt ett visuospati- alt minnestest (block). Vid jämförelse med traditionell överlevnadsanalys i form av Cox-regression utan och med hänsyn till konkurrerande händelser ser vi att samtliga kontinuerliga variabler som rankas högt i RF-SRC- modellen är signi- fikanta i Cox-modellerna. Däremot skiljer sig styrkeförhållandet åt en del för de två kategoriska förklaringsvariablerna apoE4 och kön, där dessa generellt sett värderas högre i Cox-modellerna. Att beslutsträd med en mix av kategoriska och kontinuerliga förklaringsvariabler tenderar att underskatta kategoriska variabler stöds av tidigare forskning.

Gällande prediktionsförmåga så gjordes en jämförelse mellan RF-SRC-modellen och andra relevanta modeller med C-index som jämförelsesmått. Slutsatsen var att RF-SRC-modellen presterande aningen sämre än den traditionella predik- tionsmodellen för överlevnadsanalys (Cox-regression) på detta data. Aningen förvånande var att RF-SRC modellen även presterade aningen sämre än en enklare Random Forest-modell som inte tar hänsyn till konkurrerande händel- ser, även om denna skillnad var liten och kan tänkas bero på slumpen.

(4)

Prediktion av demens 3 Abstract

3 Abstract

Title: Random Forest for Survival with Competing Risks: Predicting dementia

The field of statistics is constantly evolving. As computing power has improved, more calculation intensive methods that used to be cumbersome to apply have now become easily accessible. Random Forest is an example of such a method that has evolved on these premises and has shown to perform well on many statistical problems, including prediction. One such field is survival analysis. A way to improve survival analysis is to take competing risks into consideration.

Competing risks are events that ”compete” with the main event you want to estimate. By taking these competing risks into consideration, one may produce more accurate survival estimates.

In this study, we try to predict dementia with a Random Forest Survival model that takes Competing risks into consideration (RF-SRC). The data analyzed is from the Betula-study, a longitudinal study that aims at identifying dementia risk factors and early pre-clinical signs of dementia. The data contains informa- tion on various background characteristics, as well as a range of results from different memory tests the participants were asked to perform. The main com- peting risk to develop dementia in this setting is that the studied individual dies first.

As a result of our dementia prediction, we get an estimate of the respective pre- dictor’s contribution. Except for the individual’s age when joining the study, the most influential predictor was a prospective memory test (prosp). Other impor- tant predictors were two episodic memory tests (sptb, sptcrc), the apoE4 gene variant and a visuospatial memory test (block). When comparing the RF-SRC model with traditional survival Cox regression models with and without com- peting risks, we found strong correlation when it comes to ranking continuous predictors. However, for the two categorical predictors apoE4 and gender, the Cox models generally ranked them higher than did the RF-SRC model. That decision trees have a tendency to underestimate the importance of categorical predictors in data sets with a mix of continuous and categorical predictors is known from previous research.

When it comes to prediction performance, a comparison was made with other relevant models by using C-index for measuring performance. The conclusion was that our RF-SRC model performed slightly worse than a traditional survival analysis model (Cox regression). Somewhat surprisingly, our RF-SRC model also performed slightly worse than a Random Forest Survival model without competing risk, although the difference was small and could be due to chance.

(5)

Prediktion av demens 4 Förord

4 Förord

Under en tid med pandemirestriktioner, där fysiska möten helt ersatts med digi- tala, kan vi två som skrivit tillsammans, Sebastian i Umeå och Jan i Örnsköldsvik, krasst konstatera att vi inte haft möjlighet att träffas fysiskt en enda gång un- der uppsatstiden. Förhoppningsvis är denna prövande tid snart ett minne blott, och våra liv återgår till det normala. Sommaren är i varje fall på väg, den biter som tur är ingen pandemi på.

Tack till

Vi vill rikta ett stort tack till vår handledare Anders Lundqvist, för värdefulla råd längs resans gång. Vi tackar även Betula-projektet för tillåtelse att använda deras data. Tack även till opponenter och andra uppsatskollegor för er feedback under våra seminarietillfällen.

Umeå och Örnsköldsvik, juni 2021

(6)

Prediktion av demens Innehåll

Innehåll

1 Populärvetenskaplig sammanfattning 1

2 Sammanfattning 2

3 Abstract 3

4 Förord 4

5 Inledning 6

5.1 Syfte . . . . 6

6 Datamaterial 6 6.1 Betula-projektet . . . . 6

6.2 Etik . . . . 7

6.3 Datainsamling . . . . 7

6.4 Dataurval och bortfall . . . . 7

6.5 Dataindelning . . . . 8

6.6 Variabler . . . . 8

7 Teori 10 7.1 Överlevnadsanalys . . . 10

7.2 Konkurrerande utfall . . . 11

7.3 Maskininlärning på svenska . . . 11

7.4 Beslutsträd . . . 12

7.5 Random Forest . . . 12

7.6 RF för överlevnadsanalys med konkurrerande utfall . . . 13

8 Resultat 16 8.1 Modelldesign . . . 16

8.2 Variabelselektering . . . 19

8.3 Variablers relativa styrka . . . 19

8.4 Konkurrerande händelser . . . 23

8.5 Random Forest utan konkurrerande händelser . . . 23

8.6 Cox-regression . . . 25

8.7 Prediktion - modelljämförelse . . . 25

8.8 Sammanfattning av resultat . . . 25

9 Diskussion 26

(7)

Prediktion av demens 6 Datamaterial

5 Inledning

Demens är en samlingsdiagnos för en rad symptom relaterat till minnet som orsakas av hjärnskador och leder till att personen har svårt att klara sig på egen hand. Förutom att drabba individer och deras närmaste omgivning, så medför det stora samhällskostnader, varför det är viktigt med forskning kring demensutveckling [1].

En sådan större studie är Betula-projektet i Umeå, som påbörjades 1988 och har fortlöpt under decennier. I projektet har en rad olika egenskaper med möjlig koppling till demensutveckling undersökts över tid hos totalt ca 4 000 individer.

Det är detta datat vi har fått tillgång till och använder oss av i denna studie.

I syfte att hitta eventuella statistiskt påvisbara egenskaper som kan kopplas till demensutveckling över tid har olika metoder använts. Ett sådant exempel är Ericsons och Widings uppsats [2], som belyser betydelsen av att beakta kon- kurrerande utfall vid överlevnadsanalys. Med konkurrerande utfall avses i detta sammanhang om en person avlidit under studiens gång, medan insjuknande i demens är den händelse vi avser studera.

Denna studie tar avstamp i resultatet från denna tidigare forskning. Vi avser att undersöka hur en mer datadriven, icke-parametrisk metod som Random Forest lämpar sig att kombinera med överlevnadsanalys där konkurrerande utfall föreligger, vilket leder fram till vårt syfte.

5.1 Syfte

Syftet med denna studie är att undersöka om Random Forest med konkurrerande utfall lämpar sig för att prediktera insjuknande i demens, och hur denna modell står sig gentemot mer traditionella modeller.

Våra frågeställningar är:

• Hur påverkas överlevnadsanalys av insjuknande i demens över tid när kon- kurrerande utfall beaktas vid användande av en mer datadriven metod som Random Forest?

• Vilka förklaringsvariabler är viktiga vid statistisk modellering av insjuk- nande i demens?

• Vilka likheter och skillnader finns med att använda Random Forest som statistisk metod, jämfört med klassisk Cox-regression?

6 Datamaterial

6.1 Betula-projektet

Betula-projektet är en longitudinell studie av omkring 4 000 slumpmässigt val- da personer bosatta i Umeå kommun. De individer som ingår i studien har följts i upp till 25 år och har resulterat i flertalet publicerade forskningsartiklar kopplat till demenssjukdomar. Betula ingår i det nationella NEAR (National E-infrastructure for Aging Research) projektet [3] vilket inkluderar åtta uni- versitet i Sverige, och är finansierat av Vetenskapsrådet [4]. Projektets syfte är att:

• Studera hur minne och hälsa utvecklas i vuxenliv och hög ålder.

(8)

Prediktion av demens 6 Datamaterial

• Kartlägga tidiga kognitiva tecken och biologiska markörer för demens.

• Bestämma vilka de kritiska faktorerna för det goda åldrandet är.

För mer information om Betula-studien se Nilsson et al. [5].

6.2 Etik

Betula-projektets datainsamling/hantering har godkänts av etikprövningsnämn- den. Vi har också skrivit under ett avtal där vi förbinder oss till att hantera datat på ett etiskt sätt. Det data vi har fått tillgång till är helt avidentifierat, och vi har tagit hänsyn till ”Svenska statistikfrämjandets etiska kod för statistiker och statistisk verksamhet” [6] i alla arbetssteg.

6.3 Datainsamling

Projektets datainsamling har skett vid sex testtillfällen benämnda T1-T6 ge- nomförda vart femte år (1988, 1993, 1998, 2003, 2008, 2013) med urvalsgrupper benämnda U1 - U6.

Det ursprungliga urvalet U1 bestod av 1000 slumpmässigt utvalda personer ur Umeås folkbokföringsregister och var uppdelat i tio ålderskategorier (35, 40, 45, ..., 80), med 100 deltagare i varje grupp. Vidare återspeglade könsfördelningen i dessa tio grupper fördelningen i populationen, där de yngre undergrupperna var jämt fördelade, men de äldre undergrupperna innehöll fler kvinnor än män.

Vid T2 återkom 86% av deltagarna från U1. Av de som inte var med igen hade 9% dött, 2% flyttat från Umeå och 3% avböjde fortsatt deltagande. Vid det- ta tillfälle togs ytterligare två urval, U2 och U3. Deltagarna i U2 hade samma åldersfördelning som U1 vid T1 (35, 40, ..., 80). Deltagarna i U3 däremot var lika gamla som U1 var vid T2 (40, 45, ..., 85). Vid T3 deltog U1, U2 och U3.

Vid T4 deltog U1 och U3. Vid båda dessa tillfällen var andelen återkommande deltagare ungefär samma, runt 85%. Vid T5 var denna siffra 80%. Detta var väntat då många av deltagarna nu var tjugo år äldre än vid studiens start var- för många deltagare hade avlidit eller fått andra medicinska komplikationer som omöjliggjorde fortsatt deltagande i studien. Ytterligare ett urval (U6) gjordes.

Åldersfördelningen på deltagarna var mellan 25-80. Vid T6 deltog totalt 576 per- soner, från U1, U3 och U6. Tabell 1 nedan ger en översikt över alla testtillfällen och urvalsgrupper.

Tillfälle År Urval Beskrivning

T1 1988 U1 10 x 100 per ålderskategori (35,40,..,80) T2 1993 U1,U2,U3 U1: 86% återkom. U2: 35,40,..,80, U3: 40,

45, ..., 85) T3 1998 U1, U2, U3 Ca 85% återkom

T4 2003 U1, U3 Ca 85% återkom

T5 2008 U5 Ca 80% återkom (högre andel avlidna) T6 2013 U1,U2,U3 576 individer

Tabell 1: Översikt över datainsamlingen för Betula-projektet

6.4 Dataurval och bortfall

Datamaterialet vi fick tillgång till består av sammanlagt 3 526 individer och 88 variabler. Av dessa 88 variabler rör merparten (60 st) deltagarnas testresultat i

(9)

Prediktion av demens 6 Datamaterial

de tolv test som ingår i studien, fördelat över 5 testtillfällen (T1-T5). Data för testtillfälle T6 fanns inte med i datamaterialet.

Tidigare forskning [7] har visat att huruvida en individ bär på apoE4-allelen eller inte är en stark indikator för risken att få Alzheimers. På grund av detta bestämde vi oss för att enbart behålla individer där vi har denna information, vilket resulterade i ett bortfall på 669 individer (ca. 19%). Vad gäller övriga variabler var det partiella bortfallet lågt (64 observationer, ca 2%). Även dessa individer valdes bort,vilket resulterade i ett totalt bortfall på ca 21%. Detta bortfall medför en viss risk för bias, i händelse av att bortfiltrerade individer skiljer sig från övriga individer i studien. Vi bedömer dock risken som relativt låg då den absoluta merparten av bortfallet i form av avsaknad av apoe4-data var kopplat till ett beslut att genomgående inte genomföra apoe4-tester vid ett av de sex testtillfällena (T4) dit deltagare blivit slumpmässigt urvalda enligt beskrivning ovan.

Vårt slutgiltiga data bestod således av 2 793 individer.

6.5 Dataindelning

För att jämföra prediktionsresultat hos vår modell med andra modeller delades datasetet in i ett träningsset och ett testset med 80/20-split (Tabell 2). [8]

Typ Antal

Träningsdata 2 234 Testdata 559

Tabell 2: Indelning av dataset i träningsdata och testdata

6.6 Variabler

I vårt data har vi tillgång till 5 av testtillfällena i Betula. Då vi i vår studie inte tar hänsyn till att variabler kan förändras över tid (tidsvarierande), använder vi oss enbart av data från varje deltagares första testtillfälle. Nedan följer en mer ingående beskrivning av centrala förklaringsvariabler grupperade efter till- hörighet. Kursiverade ord indikerar variabelnamnet. Minnestesterna utvärderas genom att deltagarna får ett poäng per korrekt återgivet ord/mening, testresul- tatet varierar från 0 till antalet ord med i testet. Mer information om testerna som ingår i studien finns att läsa i Nilsson et al. [5]

6.6.1 Ålder vid första deltagande i studien ageatinclusiony Deltagarens ålder (i år) vid sitt första deltagande i studien.

6.6.2 Utbildning edu

Totalt antal år av utbildning för varje deltagare vid första testtillfället.

6.6.3 Episodiskt minne (minne av vad som hänt)

Deltagarna ombads memorera två grupper med 16 korta meningar var. Varje mening visades på ett indexkort för deltagarna i 8 sekunder. För den ena gruppen med ord blev deltagaren även ombedd att utföra den uppgift som stod på kortet vilket resulterade i följande två testvariabler:

• Memorering av meningar med utförande (sptb)

(10)

Prediktion av demens 6 Datamaterial

• Memorering av meningar utan utförande (vtb).

Efter denna uppgift fick deltagarna utföra ett test med stödd återgivning av de substantiv som ingick i de två första testen, vilket resulterade i de två testvari- ablerna:

• Stödd återgivning för meningar som ursprungligen memorerades utan ut- förande (vtcrc)

• Stödd återgivning för meningar som memorerades med utförande (sptcrc) Det femte testet om episodiskt minne bestod i att deltagarna ombads att minnas 12 ord på en lista, och sedan återge dessa (wrk00 ).

6.6.4 Semantiskt minne (ordförråd)

Deltagarna gavs en lista med 30 stycken målord och bredvid varje målord stod 5 andra ord listade. Uppgiften bestod sedan av att utan tidskrav ange vilket av de fem orden som var målordets synonym (srb).

I nästa del genomfördes tre ytterligare test på tid.

• Komma på så många ord som möjligt som börjar på bokstaven A (flua)

• Komma på ord innehållandes fem bokstäver som börjar med bokstaven M (flu5m)

• Komma på så många yrken som möjligt som börjar med bokstaven B (flupb)

6.6.5 Prospektivt minne (minnet av vad vi ska göra)

Detta test (prosp) gavs för att undersöka om deltagarna kom ihåg att påmin- na testledaren om den givna uppgift som deltagaren fått information om då testet startades. Om deltagaren glömde att påminna testledaren om detta gavs subtila påminnelser i två omgångar i slutet av undersökningen. Deltagarna fick mellan 1-4 poäng, med maxpoäng om de kom ihåg att påminna testledaren utan påminnelse.

6.6.6 Visuospatialt minne (förmåga att urskilja form och struktur) I detta test (block) fick deltagarna röda och vita block som de blev ombedda att placera i ett mönster så att de matchade den bild som visades under testet.

Deltagarna fick ett poäng per korrekt placerat block.

6.6.7 Mini-Mental State Examination (kognitivt test)

Mini-Mental State Examination (mmse) är ett väletablerat test för skattning av en individs kognitiva status som ofta används vid misstanke om demens.

Testets poängskala går från 0-30 där ett resultat under 24 poäng anses vara en indikation för kognitiv nedsättning.

6.6.8 ApoE4 (genvariant)

ApoE4 som är en variant av apoE-genen. ApoE4 är en förkortning för apolipo- protein E allele av typ 4 och har visat sig ha ett starkt samband med demens [9].

Detta är en binär variabel, antingen har individen genvarianten eller inte.

(11)

Prediktion av demens 7 Teori

7 Teori

Avsnitt 7.1 - 7.5 ger en översiktsbild av teori relevant för vår metod, medan avsnitt 7.6 knyter samman och fördjupar tidigare presenterad teori.

7.1 Överlevnadsanalys

Den metod som vanligtvis används när det man vill undersöka är tiden tills en händelse inträffar kallas överlevnadsanalys. Centralt för överlevnadsanalys är kännedom om observationstid, vilket är tidsperioden då individen observeras. I dess renaste form startar observationstiden när individen inkluderas i studien och observationstiden slutar när händelsen inträffar eller när studiens uppfölj- ningsperiod är slut. Tidsperioden då individen observeras kallas survival time.

Ett centralt begrepp inom överlevnadsanalys är censurering. Alla individer i en population kommer vanligtvis inte att uppleva en händelse inom studieperioden.

Dessa individers överlevnadsperiod är alltså längre än den studerade perioden.

Censurering möjliggör mätande av överlevnad även för individer vars händelse inte har inträffat. Högercensuering, som är den vanligast förekommande censu- reringstypen, innebär att individen ansluter studien vid tidpunkten t = 0 och händelsen fortfarande inte inträffat vid studiens avslut, där man brukar anta att censureringen är oberoende av utfallet, dvs uppstår t.ex. genom att en del- tagare flyttar, inte vill vara med längre, eller att studien avslutas. [10]. Alla betuladeltagare har följts upp för demensutfall via patientjournaler, varför ris- ken att deltagare inte vill vara med längre på grund av att de utvecklat demens utan att det fångats upp av systemet bedöms som låg även om enstaka fall kan förekomma.

För att studera överlevnadsprocessen kan man använda deskriptiva metoder, varav den viktigaste är Kaplan-Meier-estimatorn. För att studera hur olika för- klaringsvariabler påverkar överlevnaden så krävs regressionsanalys. Idag domi- neras överlevnadsanalys av Cox-regression, som är en generalisering av en mul- tipel linjär regressionsmodell för vilket responsvariabeln ofta representerar tiden till en händelse. För någon individ kan detta värde (tid till händelse) censureras, d.v.s. för vissa individer som fortfarande inte upplevt händelsen är överlevnads- tiden endast känd att överstiga aktuellt slutdatum för studien. Cox-regression använder inte tiden till en händelse som responsvariabel direkt. Istället används hasardfunktionen som beräknar andelen för händelsen av intresse λ vid en viss tidpunkt t, givet att händelsen inte har inträffat vid tidpunkten t.

λ(t) = lim h → 0

P (t < T < t + h|T ≥ t) h

Cox-modellen lyder

λi(t; xi1, ..., xip) = λ0(t)exp[β1xi1+ ... + βpxip]

där xi1, . . . , xip är förklaringsvariabler för den i:te individen, β1. . . , βp är till- hörande koefficienter, och λ0(t) är hasarden när alla förklaringsvariabler har värden noll. Faktorn λ0(t)kallas baslinjehasarden och specificerar hur hasarden är en funktion av tiden, medan exponentialfaktorn specificerar hur hasarden är en funktion av förklaringsvariablerna.

(12)

Prediktion av demens 7 Teori

För Cox-modellen behöver ett antal modellantaganden uppfyllas, däribland pro- portionella hasardkvoter och linjärt samband mellan logaritmerad hasard och förklaringsvariabler. [11]

Med överlevnadsanalys skulle, givet att modellantaganden är uppfyllda, tiden till att ett demensinsjuknande eventuellt inträffar kunna analyseras, samt hur olika förklaringsvariabler påverkar denna eventuella händelse.

7.2 Konkurrerande utfall

Ofta förekommer s.k. konkurrerande händelser som inte avser primärhändelsen som undersöks vid en traditionell överlevnadsanalys men likväl påverkar utfallet av händelsen av intresse. Om hänsyn tas i modellen till dessa utfall kan man ofta få en modell som bättre beskriver den undersökta primärhändelsen.

Speciellt i kliniska studier uppstår det ofta problem när en individ avlider innan den hunnit få det utfall studien är intresserad av, exempelvis i situationer där utfallet oftast drabbar äldre människor [12]. Genom att ta hänsyn till den kon- kurrerande händelsen kan risken att få ett skevt riskset (set av observationer som fortfarande har risk att få demens) undvikas (individer som avlidit finns annars fortfarande kvar i setet, något som leder till att risken för att en individ ska drabbas av den primära händelsen överskattas). [13]

För vår studie kan alltså dödsfall betraktas som en konkurrerande händelse till primärhändelsen demensinsjuknande.

7.3 Maskininlärning på svenska

Vår Random Forest-metod räknas till kategorin maskininlärningsmetod. Ma- skininlärning kan definieras som vetenskapen (och konsten) att programmera datorer så de kan lära sig av data. [14]. Då maskininlärningsfältet är fyllt av engelska facktermer samtidigt som vi skriver på svenska har vi, för att under- lätta skrivandet, valt att göra en kort sammanfattning av centrala begrepp på det svenska språket.

7.3.1 Inlärningsmetoder

Ett sätt att dela in maskininlärningsmetoder är i övervakad inlärning respektive oövervakad inlärning. I övervakad inlärning matas metodens algoritm med facit, medan oövervakad inlärning saknar facit så att algoritmen får i uppgift att hitta ev. samband och struktur i data utan handledning. Ett relaterat begrepp är dimensionsreducing vars mål är att förenkla data utan att förlora värdefull information. Ett sätt att göra det är genom s.k. egenskapsutvinning (eng. feature extraction), där korrelerade egenskaper slås ihop till en.

7.3.2 Prestationsmått

För att kunna optimera en maskininlärningsmetod behövs ett prestationsmått att utvärdera. Det kan antingen vara ett positivt eller negativt mått. I praktiken används ofta ett negativt mått som ska minimeras, vanligen benämnt förlust- funktion eller kostnadsfunktion.

(13)

Prediktion av demens 7 Teori

7.3.3 Tränings-, validerings- och testdata

Syftet med en maskininlärd modell är att predikera väl på osedd data. Det enda sättet att veta hur en modell presterar på osedd data är att testa modellen på osedd data. I vårt fall har vi inte tillgång till sådant, varför vi behöver lägga un- dan en del av träningsdata till test. Träningsdata är det data vi tränar modellen på, valideringsdata det data vi utvärderar den tränade modellen på under opti- meringsfasen. Testdata är det osedda data som vi testar vår slutgiltiga modell på.

7.3.4 Överanpassad, underanpassad och relaterade parametrar Då syftet med en maskininlärd modell är att prediktera väl på osedd data är det av vikt att träna sin modell lagom länge på träningsdata. Ifall modellen tränas för länge finns risk för överanpassning, d.v.s. att modellen hittar mönster i träningsdatat som inte är generaliserbara på osedd data. Om modellen istället tränas för kort tid på träningsdatat, alternativt är för enkel för att hantera problemets komplexitet, är den underanpassad.

7.4 Beslutsträd

På 80-talet hade datorer blivit så pass snabba att icke-linjära metoder blev beräkningsmässigt genomförbara. På mitten av 80-talet introducerade Breiman [15] beslutsträd för att lösa såväl klassifierings- som regressionsproblem.

Beslutsträd (eng. Decision Trees) är en typ av statistisk metod som segmenterar en beslutsvariabels lösningsrum i områden med hjälp av delningsregler som kan visualiseras i en upp och nervänd binär trädliknande struktur, därav modell- namnet. Syftet är att identifiera delgrupper som är så homogena som möjligt med avseende på utfallet. I linje med trädanalogin beskrivs olika beslutspunkter i trädförgreningar, där nedersta förgreningens slutnoder kan beskrivas som löv- noder. En styrka hos beslutsträd är tolkningsbarheten, att de kan framställas visuellt på ett sätt som påminner om beslutsprocessen hos oss människor. En fördel är att kategoriska variabler kan hanteras utan att s.k. dummyvariabler behöver skapas, men å andra sidan är en nackdel att kontinuerliga variabler kategoriindelas.

Beslutsträd är vidare en parameterfri metod, som därmed inte begränsas av olika modellantaganden som är vanligt förekommande i traditionella statistiska metoder som exempelvis Cox-regression i traditionell överlevnadsanalys.

En svaghet hos beslutsträd är att de tenderar att bli väldigt komplexa (många nivåer av trädförgreningar) och därmed predikerar sämre på ny data, d v s har en tendens att övertränas. Ett sätt att hantera överträning är genom att beskära trädet (eng. tree pruning). Detta innebär att man till det ursprungliga delningskriteriet lägger till en begränsning att sluta förgrena beslutsträdet vid ett visst kriterium, exempelvis minst x antal observationer i varje återstående förgrening. [8]

7.5 Random Forest

Random Forest (RF) (läs: en hel skog av beslutsträd) är en s.k. ensamble-metod där ett flertal modeller (i detta fall beslutsträd) konstrueras och vägs samman till en genomsnittsmodell. Andra vanligt förekommande ensamblemetoder är Bagging och Boosting.

(14)

Prediktion av demens 7 Teori

I RF kombineras flertalet enskilda beslutsträd med målet att uppnå större vari- ans mellan trädens utseende och därmed svagare korrelation. Vid generering av varje enskilt träd beaktas endast en delmängd av alla observationer med hjälp av bootstrap samt endast en slumpmässig delmängd av alla förklaringsvariabler vid varje noddelning. Slutligen räknas ett genomsnittsträd fram. Tack vare ökad varians mellan olika träds utseende blir genomsnittsträdet mer roboust och pre- dikerar i genomsnitt bättre på osedd data än vad ett enskilt träd, som är känslig för överanpassning, gör.

Eftersom RF normalt baseras på bootstrapping (dragning med återläggning) av en delmängd (vanligtvis två tredjedelar) av befintligt träningsdata, så förblir en del av träningsdatat (vanligtvis en tredjedel) orört vid varje iteration. Detta orörda träningsdata används som valideringsdata, och uppskattar parallellt det s.k. Out of Bag (OOB)-felet, vilket är en tillförlitlig skattning av testfelet. [8] R- paketet som vi använder för våra modeller använder sig av en variant av detta, där modellen i stället tar ett separat slumpmässigt urval (utan återläggning) på 63,2% av träningsdatat för varje träd som skapas. Vi har valt att genomgående använda OOB som begrepp för detta, även om den mer generella benämningen OOS (Out of Sample) varit mer korrekt i detta sammanhang.

Ur det beräknade genomsnittsträdet kan den relativa variabelbetydelsen (eng.

variable importance) beräknas genom vid vilket genomsnittligt träddjup som variabeln återfinns.

[16]

7.6 RF för överlevnadsanalys med konkurrerande utfall

7.6.1 R-paketet randomForest-SRC

randomForestSRC är ett paket i programspråket R framtaget av Ishwaran och Kogalur [17] som utökar den traditionella Random Forest metoden och erbjuder funktionalitet bland annat för högercensurerad överlevnadsanalys med enskilda och multipla konkurrerande händelser.

7.6.2 Metodbeskrivning randomForest-SRC

Precis som RF i standardutförande itererar metoden över ett specificerat an- tal genererade träd ntree. Utifrån vilka premisser genereras då ett enskilt träd med RF-SRC? Ett första viktigt ställningstagande är antal variabelkandidater att beakta vid förgrening mtry, vilket fungerar som i traditionell RF. Rekom- mendationen för denna problemtyp är kvadratroten ur antal förklaringsvariabler p [17].

Efter att modellen valt ut delningskandidater är nästa steg att bestämma varia- belvärdet som ska användas för att dela på datat. Ett alternativ är att modellen undersöker varje möjlig delning för var och en av delningskandidaterna. Detta är dock väldigt beräkningsintensivt, och tenderar dessutom att premiera kontinu- erliga variabler före kategoriska variabler vid delning [17]. En lösning på detta är att använda ett antal slumpmässiga variabelvärden för delning. Detta regleras med nsplit, ju högre värde desto högre andel slumpmässiga delningar. Ett lågt värde på nsplit kan mildra bias utan att kompromissa prestandan. Dessutom tenderar träd att premiera kontinuerliga variabler framför kategoriska [17], så ifall en mix av variabeltyper finns bör denna hyperparameter kalibreras.

(15)

Prediktion av demens 7 Teori

Nästa viktiga ställningstagande rör själva delningsregeln. Generellt sett går op- timering ut på att på att maximera skillnaden i utfall av vald teststatistika.

Teststatistikan som rekommenderas för överlevnadsanalys med hänsyn för kon- kurrerande händelse är två varianter av logrank-test. Logrank-test är ett hy- potestest som används inom överlevnadsanalys för att jämföra två gruppers hasardfunktioner, där nollhypotesen som testas är att det inte är någon över- gripande skillnad mellan överlevnadskurvorna. Statistikan beräknas för vardera av de två grupperna genom att dela kvadraten av summan av observerat resul- tat O minus förväntat resultat E med variansen av summerat observerat minus förväntat resultat (exempel nedan för grupp 2, därav index 2). [18]

Logrankstatistic = (O2− E2)2 V ar(O2− E2)

RF-modellen lämpar sig väl för detta, då den för varje noddelning delar upp datat i två delar vars värden blir inparametrar till log-rank testet. Genom att maximera logrank-statistikans värde skapas en delning som maximerar skill- naden mellan de två gruppernas hasardfunktioner. De två varianter som finns är logrank-test samt logrank-test med viktning för primärhändelse. Den först- nämnda metoden är användbar när huvudsyftet är att upptäcka variabler som påverkar den orsaksspecifika hasarden. Den senare metoden, som väljer variabler utifrån deras direkta effekt på den aggregerade incidenten, kan generera bättre resultat om syftet är prediktion av aggregerade händelse-sannolikheter.

Djupet på ett träd kan begränsas antingen genom att ange maximalt träd- djup nodedepth (värde 0 vid trädroten) eller genomsnittlig nodsstorlek nodesize.

Grundinställning är att inte begränsa träddjupet. Nodesize-parametern är där- emot kritisk för modellprestandan. Grundinställningen för nodesize i R-paketet är 15 för överlevnadsanalys med konkurrerande händelser men bör kalibreras.

Delning kan dock upphöra långt innan detta villkor är uppfyllt ifall tillräcklig

”renhet” (eng. purity) vid noden uppnås vid försök till delning. Sammanfatt- ningsvis behöver följande tre kriterier vara uppfyllda för att en delning ska genomföras:

• Aktuellt noddjup mindre än maximalt noddjup

• Aktuell nodstorlek (eng. nodesize) minst två gånger så stor som specifice- rad nodstorlek

• Aktuell nod är oren (eng. impure)

När ett träd slutligen delats upp i ett antal slutnoder beräknas värdet på varje slutnod. För fallet överlevnadsanalys med konkurrerande händelser kan två olika metoder användas: orsaksspecifik aggregerad hasard cs-H respektive orsaksspe- cifik incidens cs-CIF. Det förstnämda (cs-H) beskriver den omedelbara risken för händelse j för individer som vid tillfället inte upplevt händelsen, medan det senare (cs-CIF) definieras som sannolikheten att uppleva en händelse av typen j vid tidpunkt t. Det beräknade värdet kan tolkas som en uppskatting av antal förlorade år och representerar ett mått av dödlighet.

(16)

Prediktion av demens 7 Teori

Parameter Beskrivning ntree Antal träd i skogen splitrule Delningregel

mtry Antal slumpmässigt valda variabler per delning

nodesize Minsta lövnodsstorlek nodedepth Maximalt noddjup

nsplit Antal slumpmässiga delningspunkter Tabell 3: Centrala modellparametrar

7.6.3 Exempelträd

Figur 1 nedan visar ett exempelträd för enbart 100 observationer. Vi ser att samma variabel (här ageinclusionary) kan förekomma flera gånger, då variabler slumpas på nytt vid varje noddelning.

Figur 1: Exempelträd (100 observationer)

7.6.4 Variabelutvärdering

För att utvärdera hur våra förklaringsvariabler påverkar risken att få demens predikteras expected number of life years lost (förväntat antal förlorade år) [19].

Med högercensurerat data är det svårt att få ett tillförlitligt estimat av det förväntade totala antalet år tills händelsen (i vårt fall demensinsjuknande). I stället beräknar modellen det förväntade antalet förlorade år innan tidpunkt t.

t sätts vanligtvis till den sista tidpunkten som undersökts om en observation råkat ut för händelsen, vilket i vårt fall är 22 år efter studiestart (2011).

7.6.5 Prediktionsmått

Vad gäller prediktion använder vi oss av Harrells C-index (Concordance index) med orsaksspecifika aggregerade hasarder [17]. För att ta fram detta index ska- par man par av alla observationer och behåller enbart observationer där minst

(17)

Prediktion av demens 8 Resultat

en eller båda har fått demens. Sedan jämförs om observationen som hade ett sämre utfall (fick demens eller fick demens snabbare än den andra observationer om båda fick demens) faktiskt också hade ett predikterat sämre utfall. Antalet korrekt predikterade observationer delas på totala antalet par, vilket ger ett index mellan 0 och 1. Ett värde på 0,5 betyder att modellen inte predikerar bättre än slumpen medan 1,0 betyder att modellen predikterar perfekt för alla par. [20].

7.6.6 Variabelselektering

Variabelselektion görs med funktionen vimp() utifrån minimalt träddjup (d v s på vilket djup som en viss förklaringsvariabel i genomsnitt återfinns, ju lägre desto viktigare). Minimalt träddjup utvärderar variablers relativa styrka genom att undersöka när en variabel för första gången används för att dela upp datat.

Ett lägre värde betyder en mer prediktiv variabel. Detta värde kan således även användas för att avgöra om en variabel ska vara med i modellen eller inte. Över- stiger värdet för en given variabel tröskelvärdet tas variabeln bort ur modellen.

Tröskelvärdet bestäms genom att beräkna medelvärdet för samtliga variablers minimala trädjup [21].

8 Resultat

8.1 Modelldesign

Vid design av modell valdes vissa hyperparametrar utifrån teoretiska rekom- mendationer för vår problemtyp medan andra så som trädstorlek och nodstor- lek kalibrerades var för sig genom minimering av OOB-felet. Nedan följer mer utförliga motiveringar av hyperparameterval.

8.1.1 Genomsnittlig nodsstorlek nodesize

Genomsnittlig nodstorlek kan påverka modellens prediktionsstyrka, där ett lägre värde resulterar i ett djupare träd med fler förgreningar. För att kalibrera denna parameter utvärderades modellen för ett brett intervall av minsta lövnodsstor- lekar (1 - 150). Figur 2 nedan visar OOB-felet för spannet 1-20 (efter 20 ökade OOB-felet markant). Testfelet var som lägst vid en genomsnittlig nodstorlek på nio, vilket vi använder oss av i vår slutgiltiga modell.

(18)

Prediktion av demens 8 Resultat

Figur 2: OOB-fel över minsta lövnodsstorlek i modellen

8.1.2 Antal slumpmässiga delningspunkter per delningskandidat nsplit

Då vi har en blandning av kontinuerliga och kategoriska förklaringsvariabler i vår modell, har vi valt att sätta nsplit parametern till två, baserat på exempel i Ishwaran et al. 2014 [17].

8.1.3 Antal träd ntree

Nästa viktiga parameter att optimera är antalet träd i modellen. En fördel med Random Forest är att fler träd inte leder till ökad risk för överanpassning [16], dock är prediktionsvinsten marginell efter en viss punkt. Detta syns tydligt i Figur 3 nedan, där förbättringen i OOB-fel går ner markant vid runt 50 träd.

(19)

Prediktion av demens 8 Resultat

Figur 3: OOB-felet för Demens respektive Avliden över antal träd Figur 3 ovan visar OOB-felet för både händelsen av intresse (observationen ”ut- vecklat demens”) i svart samt vår konkurrerande händelse (observationen ”avlidit innan demens eller högercensurerad”) i rött. Felet sjunker snabbt tills den når ungefär 200 träd, varefter det planar ut för båda händelserna. När vi under- sökte beräkningstiden för olika antal träd såg vi att skillnaden var försumbar.

Med anledning av detta bestämde vi oss för att använda 700 träd, då linjen för demens-utfallet ser ut att helt plana ut vid 700 träd. Hade beräkningstid varit en faktor hade 200 träd sannolikt gett ett likvärdigt resultat.

Vi kan även utläsa från Figur ?? att vår modell som väntat är klart bättre (lägre OOB-fel) på att prediktera för primärhändelsen jämfört med den konkurrerande händelsen.

8.1.4 Delningsregel splitrule

Om så önskas finns möjlighet till viktning av logrank-statistikan på så sätt att primärhändelsen (demens) viktas högre än konkurrenthändelsen, något vi bedömde som relevant att göra i vår studie.

8.1.5 Antal slumpmässiga variabelkandidater vid delning mtry Då vi har 16 förklaringsvariabler resulterar det med grundinställning i 4 varia- belkandidater

mtry = 16 = 4

Detta innebär alltså att det vid varje delningsnod i ett träd slumpmässigt väljs ut fyra av 16 variabler som ”delningskandidater”. Vi fann ingen anledning att ändra på denna rekommenderade grundinställning, då kvadratroten av antal variabler är rekommenderat värde för de flesta kategorier av RF-problem (för regressionsproblem rekommenderar [17] antal förklaringsvariabler delat på tre).

(20)

Prediktion av demens 8 Resultat

8.1.6 Noddjup nodedepth

Då vi använder nodesize för att reglera träddjup har vi lämnat nodjup därhän, d v s begränsar ej noddjupet specifikt.

8.1.7 Slutgiltig modell

I tabell 4 nedan sammanfattas hyperparameterinställningar för vår slutgiltiga modell.

Parameter Värde Beskrivning

ntree 700 Antal träd i skogen

splitrule log-rank weighted Delningregel

mtry

Antalvariabler Antal slumpmässigt valda variabler per delning

nodesize 9 Minsta lövnodsstorlek

nodedepth (obegränsad) Maximalt noddjup

nsplit 2 Antal slumpmässiga delningspunkter

Tabell 4: Hyperparameterinställningar för slutgiltig modell

8.2 Variabelselektering

Alla 16 förklaringsvariabler ingår i modellen (ett tröskelvärde skulle annars vi- sats med en streckad linje i Figur 4 under avsnitt 8.3 om variablers relativa styrka).

8.3 Variablers relativa styrka

Förklaringsvariablernas relativa styrka att förklara demensinsjuknande bedöms utifrån det genomsnittliga minimala träddjupet, där lägre djup betyder ökad styrka, då det betyder att modellen ofta valde variabeln i fråga för att dela upp en nod. Resultatet av detta sammanfattas i Figur 4 nedan, samt i efterföljande avsnitt.

(21)

Prediktion av demens 8 Resultat

Figur 4: Minimalt träddjup för förklaringsvariabler i RF-modellen

8.3.1 Ålder vid första deltagande i studien

Ageatonclusiony, deltagarens ålder vid första deltagandet i studien, var den va- riabeln som enligt minimal depth har högst predikterande styrka. De blå punk- terna i Figur 5 nedan representerar individer som har fått demens, och de svarta representerar individer som inte fått demens vid sista mätningen. Man kan se att det förväntade antalet förlorade år ökar märkbart runt 55 år, och har sedan samma lutning ändå upp till 85 år.

(22)

Prediktion av demens 8 Resultat

Figur 5: Förväntat antal förlorade år som funktion av ålder vid inkludering

8.3.2 Prospektivt minne

På andra plats, och som första variabel relaterad till en av minnestesterna, placerar sig det prospektiva minnestestet prosp, som går ut på att undersöka om deltagarna kommer ihåg att påminna testledaren om den givna uppgift som deltagaren fått information om då testet startades.

8.3.3 Episodiskt minne

Högt upp på listan (plats 3 och 4) utmärker sig även de två episodiska minnestest som går ut på att man fysiskt utför den mening fått i uppdrag att memorera (sptb & sptcrc). Motsvarande test där deltagaren enbart ombads att memorera meningarna (vtb & vtcrc) hamnar längre ner på listan (plats 8 & 12), likaså det femte episodiska minnestestet wrk00 (plats 11).

8.3.4 Apoe4

Högt upp på listan (plats 5) återfinns variabeln apoE4 som indikerar om delta- garen bär på genvarianten eller inte.

8.3.5 Visuospatialt minne

På plats 6 hittar vi det mönstertest som går ut på att urskilja form och struktur block.

(23)

Prediktion av demens 8 Resultat

8.3.6 Antal utbildingsår

Figur 6: Förväntat antal förlorade år som funktion av antal utbildingsår Antal utbildningsår educ finns på plats 7. Man ser att i Figur 6 ovan att kurvan planar ut markant vid runt 9-10, d.v.s. vid avslutad grundskola. Tabell 5 nedan visar åldersfördelningen för individer som har 9 år eller kortare utbildning, och individer med mer än 9 års utbildning.

Ålder/Utbildning (år) ≤ 9 + 10

+ 65 81% (941) 19% (220)

< 65 32% (528) 68% (1104) Tabell 5: Samband mellan ålder och antal utbildingsår 8.3.7 Kognitivt test: MMSE

På plats åtta återfinns ett väletablerat test för skattning av en individs kognitiva status [22].

8.3.8 Semantiskt minne

Samtliga tester som handlar om semantiskt minne hade låg prediktiv styrka.

Det semantiska test som hamnade högst på listan (plats 10) är flubp. Resterande tester (flua, srb & flu5m) hamnar alla i botten av listan.

8.3.9 Kön

Kön hamnade näst sist i listan, där enbart flu5m har lägre prediktionsstyrka.

(24)

Prediktion av demens 8 Resultat

8.4 Konkurrerande händelser

Undersöker man den orsaksspecifika incidensen ser man tydligt skillnaden i ris- ken att drabbas av demens (CIF 1, den svarta linjen) jämfört med risken att avlida (CIF 2, den röda linjen), där risken att avlida är högre än risken att få demens (Figur 7 nedan).

Figur 7: Orsaksspecifika incidensfunktioner för demens (röd kurva) respektive konkurrenshändelsen att avlida (svart kurva)

8.5 Random Forest utan konkurrerande händelser

När variablers relativa styrka i modellen med hänsyn till konkurrerande händel- ser jämförs med motsvarande modell utan hänsyn till konkurrerande händelser, är resultatet relativt lika vilket illustreras i Figur 8 & 9. Några variabler har bytt plats med varandra i listan, men där detta inträffat ligger dessa variablers rela- tiva styrka minimal depth för nära varann för att kunna prata om betydelsefulla skillnader i modellresultat.

(25)

Prediktion av demens 8 Resultat

Figur 8: Minimalt träddjup för förklaringsvariabler i RF-modellen utan konkur- rerande händelser

Figur 9: Minimalt träddjup för förklaringsvariabler i RF-modellen med konkur- rerande händelser

(26)

Prediktion av demens 8 Resultat

8.6 Cox-regression

Cox-regression är den vanligaste modellen för överlevnadsanalys. Av denna an- ledning undersöktes två Cox-modeller, en med konkurrerande händelser och en utan. Dessa kunde sedan jämföras med vår RF-SRC modell både med avseen- de på variabelstyrka (detta avsnitt) samt med avseende på prediktionsförmåga (nästa avsnitt).

När vi undersökte antaganden för Cox-modellen visade det sig att en av vari- ablerna (sptcrc) inte uppfyllde kravet på proportionell hasardkvot, varför vari- abelns koefficientvärde, och därmed samtliga ingående variablers p-värden, bör tolkas med försiktighet. Då vi endast använder Cox-modellen för att jämföra prediktionsförmåga valde vi ändå att behålla sptcrc i modellen. Efter bakåtelimi- nering med hjälp av p-värden, där vi tog bort variabler som inte var signifikanta på 5% nivån, innehöll de två Cox-modellerna följande fem statistiskt signifikanta förklaringsvariabler på 5% nivå (i fallande signifikansordning): ageatinclusiony, apoE4, sptcrc, prosp, gendernumber.

Den enda signifikanta variabel i Cox-modellerna som avvek kraftigt från vår RF-SRC-modells relativa variabelstyrka var den kategoriska variabeln kön (gen- dernumber), som hamnade långt ner i RF-SRC-modellen. Även om den andra kategoriska variabeln apoE4 relativa förklaringsstyrka värderas relativt högt i RF-SRC-modellen (plats 5), så värderas den inte så högt som i Cox-modellen (näst lägst p-värde).

8.7 Prediktion - modelljämförelse

En styrka hos RF-modeller anses vara prediktion [16]. För att utvärdera detta jämfördes vår RF-SRC modell med de två Cox-modellerna och den RF-SR- modell utan hänsyn till konkurrerande händelser som presenterats ovan genom prediktion på vårt testdata (20% av observationerna, n = 559). Prediktionsstyr- kan utvärderas med hjälp av C-index. 95%-iga konfidensintervall beräknades från 100 modeller som genererats med ett nytt slumpmässigt urval (80% av datat). Resultaten presenteras i Tabell 6:

Modell C-index Konfidensintervall 95%

RF med konkurrerande utfall 0,83 0,830 - 0,835 RF utan konkurrerande utfall 0,85 0,849 - 0,855 Cox med konkurrerande utfall 0,87 0,862 - 0,874 Cox utan konkurrerande utfall 0,85 0,844 - 0,851

Tabell 6: C-index prediktion med 95%-iga konfidensintervall

RF utan konkurrerande händelser (RF-SR) presterade något bättre än modellen med (RF-SRC). Cox-modellerna presterade snäppet bättre än RF-modellerna.

Bäst prediktionsförmåga hade Cox-modellen med hänsyn till konkurrerande ut- fall. Som synes i tabell 6 var skillnaden i prestation mellan modellerna signifikant på 0.05 nivå.

8.8 Sammanfattning av resultat

Ett syfte med denna studie var att undersöka hur Random Forest med hänsyn till konkurrerande händelser påverkar överlevnadsanalys vid studien av demens.

Avsnitt 8.3 visar att vad gäller förklaringsvariablers relativa förklaringstyrka så placerar sig variabeln ”ålder när individ påbörjar sitt deltagande i studien”

(27)

Prediktion av demens 9 Diskussion

högst upp, följt av ett prospektivt minnestest (prosp). Andra betydelsefulla förklaringsvariabler var två episodiska minnestest (sptb, sptcrc), genvarianten apoE4 samt ett visuospatialt minnestest (block).

Avsnitt 8.5 visar att konkurrerande händelser inte har någon större inverkan på vilka variabler som har störst prediktionsstyrka på detta data om man jämför med motsvarande Random Forest modell utan hänsyn till konkurrerande hän- delser. Vid jämförelse med traditionell Cox-regression såg vi att de kontinuerliga förklaringsvariabler som var signifikanta i Cox-modellerna alla befann sig högt även på RF-SRC modellens relativa variabelstyrkeranking. Däremot värderades de två kategoriska förklaringsvarablerna apoE4 och kön lägre i RF-modellerna.

Vidare visar avsnitt 8.7 att i det tillämpningsområde som anses vara RF- modellers styrka, prediktion, så ger konkurrerande händelser inte någon pre- stationsvinst på detta data. Snarare är fallet det motsatta, att modellen som tog hänsyn till konkurrerande händelser predikerade sämre. Även vid jämförel- se med traditionell överlevansanalysmodell i form av Cox-regression sågs ingen prestationsvinst för RF-modellerna på detta data.

9 Diskussion

Vår studie gav både väntade och mer oväntade resultat. Förklaringsvariabler som visat sig vara av betydelse för att prediktera demens i tidigare studier återfanns också högt upp i vår modells relativa styrkeranking. Att ålder var högst upp på listan är föga förvånande då i snitt var femte person över 80 beräknas ha någon form av demenssjukdom och risken att drabbas efter 65 fördubblas vart femte år [23].

Antal utbildningsår educ är en variabel som är högt korrelerad med ålder vid studiestart, och därmed svårbedömd. Figur 6 visar att förväntat antal förlorade åren går ner markant runt 9-10 utbildningsår, dvs att personen i frågat enbart gått ut grundskolan. I tabell 5 i sektion 8.3.6 ser man att en majoritet (81%) av deltagare som var 65 år eller äldre när dom deltog första gången har en utbildning på 9 år eller kortare. Detta är en markant skillnad mot gruppen som var yngre än 65, där enbart 32% har en 9-årig eller kortare utbildning.

För de variabler som är relaterade till minnestesterna placerar sig det prospek- tiva minnestestet prosp först, vilket går ut på att undersöka om deltagarna kommer ihåg att påminna testledaren om den givna uppgift som deltagaren fått information om då testet startades. Eftersom demens först drabbar förmågan att bilda nya minnen är det främst händelser från och med insjuknandet som den sjuke glömmer bort, vilket kan förklara att det prospektiva minnestestet hamnar före exempelvis de episodiska minnestesten [22]. Högt upp på listan utmärker sig även de två episodiska minnestest som går ut på att man fysiskt utför den mening fått i uppdrag att memorera (sptb & sptcrc). Motsvarande test där deltagaren enbart ombads att memorera meningarna (vtb & vtcrc) hamnar längre ner på listan, likaså det femte episodiska minnestestet wrk00. Att sptb visat sig vara en viktig indikator stöds av tidigare studier [2] & [24]).

Relativt högt upp på listan av betydelsefulla variabler återfinns även den kate- goriska variabeln genvariant apoE4 som tidigare forskning [7] visat vara en stark indikator för risken att få Alzheimers (och därmed även att utveckla demens).

Dock värderas den inte lika högt i RF-SRC modellen som i Cox-modellerna.

References

Related documents

Det första exemplet som presenteras är liknande de exempel som Johansson &amp; Pehrson samt Östberg presenterar i sina utredningar. 182 Bolaget A är en bank som har lämnat en

Sammantaget menade tingsrätten att det var visat att Skelleftebuss som offentlig aktör hade ekonomiska fördelar jämfört med privata aktörer och att detta i kombination med

Detta är en uppföljningsstudie av inryckande värnpliktiga med syfte att utifrån mönstringsresultat avseende styrka och fysisk kapacitet, samt svar på frågan om motivation

Utifrån det signifikanta negativa sambandet mellan problemfokuserad coping och ångestladdad anknytning och det signifikanta negativa sambandet mellan problemfokuserad

Resultatet för kontrollerna illustreras i tabellerna nedan då (tabell 1) visar resultaten för alla kontroller och patientprover som analyserades för IgG antikroppar medan tabell

Dessa verktyg har legat till grund för de praktiska momenten gällande uppsatsen, samt de slutsatser och resultat som sedan redovisas i slutet av uppsatsen... QBIM är ett konsultbolag

Exempel i detta arbete kan vara fabriksnedläggning eller ränteshock. , x m,ny ) som prediktionen ska göras för inte vara en extrapolation från regressionsmodellen, vilket i

Detta innebär att en musiker som söker efter en ol med en bra klang bör leta i många olika prisklasser för att hitta den som låter bäst eftersom ett högt pris inte