• No results found

Statistisk hypotesprövning för funktionella data: En analys av två gruppers rörelsemönster vid ett sidohopp på ett ben

N/A
N/A
Protected

Academic year: 2022

Share "Statistisk hypotesprövning för funktionella data: En analys av två gruppers rörelsemönster vid ett sidohopp på ett ben"

Copied!
25
0
0

Loading.... (view fulltext now)

Full text

(1)

Examensarbete, 15 hp Statistik C.

Vt 2018

STATISTISK

HYPOTESPRÖVNING FÖR FUNKTIONELLA

DATA

En analys av två gruppers

rörelsemönster vid ett sidohopp på ett ben

Jessica Edlund och Vilgot Österlund

(2)

Populärvetenskaplig sammanfattning

I Sverige beräknas att cirka 7200 personer per år drabbas av korsbandsskador. En skada på korsbandet är inte bara påfrestande för individen som drabbas, utan innebär också en kostnad för samhället i form av sjukhuskostnader och uteblivna skatteintäkter vid sjukskrivning. Att drabbas av korsbandsskada en andra gång på samma knä leder till ytterligare försämring i knäets förmåga och även till en minskad livskvalitet. För att undvika en andra korsbandsskada är det viktigt att den drabbade inte belastar knäet för fullt innan det är tillräckligt återställt. Det kan vara svårt för individen att själv avgöra när knäet har läkt och därför används styrke- och rörelsetester för att utvärdera knäets förmåga samt den kringliggande muskulaturen. Landningsmomentet efter ett sidohopp på ett ben är en sådan övning som på ett bra sätt motsvarar det rörelsemönster där belastningen på korsbandet är som störst, till exempel vid fotboll. Individer som utför hoppet har markörer på bröstkorg, bäcken, höft, knä och fot, vilket innebär att rörelsemönstret observeras för olika kroppsdelar.

Det datamaterial som används i uppsatsen kommer från en studie, Falcon 1, där en del av syftet är att förstå rehabiliteringsprocessen vid korsbandsskador.

Uppsatsen behandlar två frågeställningar, dels om det finns en skillnad mellan atlet- och kontrollgrupp i rörelsemönstret vid landningsmomentet i ett sidohopp, och dels om resultatet av den första frågeställningen förändras när analysen utförs på ett medel av olika antal hopp. Ibland ignoreras det faktum att det finns olika antal mätningar på det som jämförs, trots att detta ur ett teoretiskt perspektiv inte är helt korrekt. Studien undersöker om detta faktiskt har en praktisk betydelse för resultatet, förändras slutsatsen om hänsyn tas till antal mätningar?

I uppsatsen används en metod för att analysera data i form av kurvor.

Ett vanligt och välkänt användningsområde där metoden används är vid presentationer av medeltemperatur.

Ett enkelt exempel på hur data kan presenteras i form av kurvor, årsmedeltemperatur Umeå.

(Datat som figuren baseras på är hämtad från Climate data).

Resultatet visar att det finns vissa skillnader i rörelsemönster mellan idrottsaktiva och icke-

aktiva. Dessa skillnader observerades för kroppsdelarna bäcken, höft och knä. Samtidigt

visas att resultat och slutsatser förändras för knäet när olika antal hopp används. Det är

därmed möjligt att konstatera att resultatet i vissa fall beror på vilket antal hopp som väljs,

givet studiens datamaterial.

(3)

Sammanfattning

I Sverige drabbas cirka 7200 personer per år av korsbandsskador. En korsbandsskada innebär för individen lång tid av rehabilitering och eventuellt även en operation. Mot bakgrund av hur vanligt förekommande och hur allvarligt den skadade drabbas, innebär korsbandsskador ett problem även för samhället. Uppsatsen behandlar två frågeställningar, dels om det finns en skillnad mellan atlet- och kontrollgrupp i rörelsemönstret vid landningsmomentet i ett sidohopp, och dels om resultatet av den första frågeställningen förändras när analysen utförs på ett medel av olika antal repetitioner. För att besvara frågeställningarna har funktionell dataanalys (FDA) applicerats på ett datamaterial som kommer från studien Falcon 1, där en del av syftet är att förstå rehabiliteringsprocessen vid korsbandsskador. Uppsatsens resultat visar att det finns vissa skillnader i rörelsemönstret mellan atlet- och kontrollgrupp när det gäller landningsfasen av ett sidohopp på ett ben.

Uppsatsen kommer också fram till att resultatet i vissa fall varierar beroende på vilka

repetitioner medelkurvorna bygger på. För att säkerställa och finna orsaker till vad

skillnaderna beror på rekommenderas ytterligare studier. För att vidare studera orsaken

bakom de skillnader i resultat som beror på vilka repetitioner som används, rekommenderas

även ytterligare studier på samma datamaterial med vissa förändringar i metod.

(4)

Abstract

Title: Statistical hypothesis testing with functional data - A group comparison on movement pattern for a one leg side jump.

Every year, around 7200 people in Sweden suffer from an injury on the cruciate ligament.

When an injury occurs, it is necessary to rehabilitate the knee and in some cases surgery is

required. This kind of injury is not only difficult for the individual, it can also be a problem

for the society. This essay examines two main questions. First, if there is a difference in

how an athlete- and a control group perform a side jump on one leg. Second, if the result

from the first question differ when the analysis is performed on an average of different

number of repetitions. To do this, functional data analysis (FDA) have been applied to a

data material from the study Falcon 1, where a part of the aim is to understand the

rehabilitation process of cruciate ligament injuries. It is shown that there are certain

differences in movement pattern between the athlete- and the control group when the

landing of the side jump is examined. It is also shown that the results, in some cases, vary

depending on which number of repetitions the average curves are based on. Further studies

are recommended to investigate why the differences in movement pattern occur. In order to

examine the reason behind the differences in result depending on the number of used

repetitions, it is possible to study the same data material with some methodological changes.

(5)

Innehållsförteckning

1. Inledning ... 1

2. Syfte och frågeställning ... 2

3. Datamaterial och metod ... 2

3.1 Datamaterial ... 2

3.2 Metod ... 4

4. Teori ... 5

4.1 Introduktion till funktionell dataanalys ... 5

4.2 Transformera observationer till funktioner ... 6

4.3 Funktionsjustering ... 7

4.4 Hypotesprövning med funktionella data ... 8

4.5 Formell beskrivning av de två p-värdesfunktionerna ... 10

4.6 Permutationstest ... 11

5. Resultat ... 12

5.1 Skillnad mellan grupperna ... 12

5.2 Skillnad mellan antal repetitioner ... 14

6. Slutsatser och diskussion ... 15

6.1 Slutsatser ... 15

6.2 Diskussion ... 16

Referenslista ... 18

Bilagor ... 20

(6)

1

1. Inledning

Korsbandsskador drabbar ofta personer aktiva inom sporter med påfrestande belastning på knäna, så som fotboll, innebandy och basket. I Sverige beräknas att cirka 7200 personer per år drabbas av olika korsbandsskador, där en främre korsbandsskada står för en klar majoritet (Svenska korsbandsregistret 2009, 3). Just bland skador på främre korsbandet är kvinnor överrepresenterade och risken att drabbas är mellan fem till nio gånger högre än för män (Sernert 2010, 54). En av de vanligaste orsakerna till uppkommen korsbandsskada är vid vridning av knäet till följd av en önskad riktningsförändring vid löpning, där foten sitter fast i marken utan att kunna följa med i vridningen. Varje år opereras ungefär 3000 personer för korsbandsskador i Sverige (Svenska korsbandsregistret 2009, 3). Läktiden efter en korsbandsskada är lång, krävs en operation kan det dröja över ett år tills den drabbade är tillbaka till normal belastning igen, och då är inte väntetiden innan operationen inräknad (Fältström 2016). Under korsbandets läktid minskar muskulaturen runt knäet eftersom den drabbade inte får påfresta knäet som vanligt. Rehabiliteringsträning är därför mycket viktigt, samtidigt som korsbandet läker måste muskelmassan bibehållas. Studier visar att personer som drabbas av korsbandsskada en andra gång och tvingas till operation upplever en ytterligare försämring i knäet och även en minskad livskvalitet (Fältström 2016).

Mot denna bakgrund är det väldigt viktigt att korsbandet och muskulaturen kring knäet är tillräckligt återställt innan den drabbade börjar belasta knäet igen. Om personen återgår till normal ansträngning innan korsbandet är fullständigt rehabiliterat finns det stor risk för ytterligare skador. En svårighet för personer som drabbats av korsbandsskada är just att veta när korsbandet har läkt och återställts tillräckligt. För att avgöra när en person är rehabiliterad från skada görs flera olika styrke- och rörelsetester. Ett av dessa är ett sidohopp på ett ben, där landningsmomentet är speciellt intressant eftersom det motsvarar det rörelsemönster där belastningen på korsbandet är som störst. Vanligtvis görs upprepade försök och beroende på utförande kan ett hopp bli antingen godkänt eller underkänt. För att kunna använda sig av så mycket data som möjligt är det vanligt att basera analyser på medelvärdeskurvor. Beroende på hur många godkända hopp respektive individ har, varierar antalet repetitioner som dessa medelkurvor bygger på. I vissa fall ignoreras det faktum att individerna har olika antal repetitioner, vilket inte är helt korrekt ur ett teoretiskt perspektiv.

Ett alternativt tillvägagångssätt är att välja ut ett visst antal hopp, till exempel det maximala antalet som kan användas om alla individers medelkurvor ska baseras på lika många hopp.

Det är därför av intresse att undersöka om resultatet för sidohoppet påverkas i praktiken när olika antal repetitioner används. I uppsatsen kommer två grupper, en atlet- och en kontrollgrupp, att undersökas med avseende på rörelsemönster vid landningsmomentet. En skillnad mellan grupperna är att de belastar knäna i olika stor utsträckning i deras vardagliga liv, vilket gör det intressant att studera om de skiljer sig åt vid utförandet av sidohoppet. För att möjliggöra en jämförelse mellan grupperna används hypotestest för funktionella data.

Landningsmomentet efter ett sidohopp kommer i uppsatsen analyseras med hjälp av

funktionell dataanalys (FDA). Genom denna metod kan observerat data studeras som

funktioner, vilket möjliggör en detaljerad analys. FDA används inom ett flertal områden,

bland annat biomekanik, medicinsk vetenskap och analytisk kemi (Sørensen, Goldsmith och

Sangalli 2013, 5222).

(7)

2

2. Syfte och frågeställning

Syftet med uppsatsen är att studera en atlet- och en kontrollgrupp med avseende på deras rörelsemönster vid ett sidohopp. Till syftet följer två frågeställningar;

1. Finns det en skillnad mellan atlet- och kontrollgrupp i rörelsemönstret vid landningsmomentet i ett sidohopp?

2. Förändras resultatet av frågeställning 1 när analysen utförs på ett medel av olika antal repetitioner?

3. Datamaterial och metod 3.1 Datamaterial

Datamaterialet som ligger till grund för uppsatsen kommer från en korsbandsstudie som heter Falcon 1. Datat är insamlat vid U-motion lab; institutionen för samhällsmedicin och rehabilitering vid Umeå universitet. Datamaterialet består av knäfriska individer uppdelade i två grupper; 22 personer i atletgruppen och 24 personer i kontrollgruppen. Till atletgruppen räknas personer mellan 17-35 år som aktivt tävlar i den högsta eller näst högsta ligan i innebandy, fotboll, handboll eller basket. De tränar även specifikt för att förbättra sin knäkontroll och stärka knäleden, exempelvis genom styrketräning och hoppövningar. Till kontrollgruppen räknas personer i samma åldersintervall som tränar färre än fem gånger per vecka. De tränar inte styrka eller teknik för att stärka knäet två eller fler gånger under en vecka. I atletgruppen ingår 3 män och 19 kvinnor och i kontrollgruppen ingår 5 män och 19 kvinnor.

Individerna i datamaterialet har utfört ett sidohopp på ett ben. Hoppet genomförs barfota samtidigt som deltagarna håller ett rep bakom ryggen med båda händerna. På golvet finns två kraftplattor med tillhörande markeringar utlagda. Avståndet mellan dessa markeringar är normaliserat till 25 % av den aktuella deltagarens längd. Deltagarna står till en början på ett ben bredvid en markering innan de hoppar sidledes och landar på samma ben bortanför nästa markering. Därefter ska de så fort som möjligt hoppa tillbaka till startpositionen.

Hoppet illustreras i figur 1.

(8)

3

Figur 1. Sidohopp på ett ben. Utgångspositionen visas till vänster och den första respektive andra landningen visas av efterföljande bilder.

Varje individ gör sammanlagt 20 försök, 10 på höger ben och 10 på vänster ben, där testresultatet på alla godkända hopp sparas. Ett hopp blir exempelvis underkänt om deltagaren släpper repet eller sätter ner den andra foten i marken. Individerna i datamaterialet har mellan fem och tio godkända hopp för varje ben.

Med hjälp av markörer på utövarens kropp mäts vinklar och tryck (moment) på kroppssegmenten bröstkorg, bäcken, höft, knä och fot. Dessa mätningar sker 240 gånger per sekund. Kurvorna för vinklar och moment undersöks under landningsfasen, definierad från initial kontakt till maximal böjning i knäet. Kurvorna är landmärkesjusterade för att redogöra för skillnader i tid mellan olika individers landningar. Det betyder att alla kurvor börjar, vid initial kontakt, och slutar, vid maximal böjning av knäet, samtidigt. Valet av landmärken och efterföljande justering utfördes innan datamaterialet erhölls.

Landningsfasen är därefter diskretiserad till 51 punkter för att möjliggöra en jämförelse mellan grupper och personer.

Datamaterialet består av 21 stycken variabler. På de fem observerade kroppssegmenten har

vinklar och moment mätts på tre olika sätt; X, Y och Z. X är extension/flexion, Y är

adduktion/abduktion och Z är rotation. För varje variabel finns fyra datafiler, en med första

landningen på det dominanta benet, en med första landningen på det icke-dominanta benet,

en med andra landningen på det dominanta benet och en med andra landningen på det icke-

dominanta benet. Det finns därmed 168 tillgängliga datafiler, 84 för atletgruppen och 84 för

kontrollgruppen. För att avgränsa undersökningen valdes de datafiler som innehåller

information om första landningen med det dominanta benet. Efter denna avgränsning

återstod 42 tillgängliga datafiler, 21 för atletgruppen och 21 för kontrollgruppen. Efter en

genomgång av datamaterialet framkom att det inom variabeln Bröstkorg fanns en del

bortfall inom båda grupperna. Detta ledde till att denna kroppsdel uteslöts från

undersökningen och sammanlagt används 36 datafiler till analysen. Variablerna i

datamaterialet som studeras i uppsatsen presenteras i tabell 1.

(9)

4

Tabell 1. Variablerna i datamaterialet som studeras i uppsatsen.

Variabel Presenteras i resultatdelen

Bäcken vinkel X Ja

Bäcken vinkel Y Nej

Bäcken vinkel Z Nej

Höft moment X Nej

Höft moment Y Ja

Höft moment Z Nej

Höft vinkel X Ja

Höft vinkel Y Nej

Höft vinkel Z Nej

Fot vinkel X Nej

Fot vinkel Y Nej

Fot vinkel Z Nej

Knä moment X Ja

Knä moment Y Nej

Knä moment Z Ja

Knä vinkel X Nej

Knä vinkel Y Nej

Knä vinkel Z Nej

3.2 Metod

Varje individ har fem till tio godkända repetitioner, men för att göra analysen representeras de av en enskild kurva, i detta fall en medelkurva. För att besvara den första frågeställningen, om det finns en skillnad mellan atlet- och kontrollgrupp i rörelsemönstret vid landningsmomentet i ett sidohopp, används de medelkurvor som bygger på de fem första godkända hoppen. Fem repetitioner valdes eftersom det är det maximala antalet hopp som kan användas om individernas medelkurvor ska bygga på samma antal repetitioner.

Atletgruppen består alltså av 22 medelkurvor och kontrollgruppen av 24 medelkurvor.

Dessa kurvor jämförs med Pini och Vantinis (2017) metod för intervallvisa test, vilken ger både justerade och icke-justerade p-värden, där intresset ligger i de justerade p-värdena.

För att besvara den andra frågeställningen, om resultatet av frågeställning 1 förändras när analysen utförs på ett medel av olika antal repetitioner, används samma metod som till första frågeställningen. För varje individ finns nu fem olika medelkurvor, en bygger på de tre första hoppen, en på de fyra första, en på de fem första, en på tre slumpmässigt valda hopp och en på ett genomsnitt av alla individens godkända hopp. För de slumpmässiga hoppen valdes för varje variabel tre slumpmässiga hopp. Det betyder att det för en individ inte är samma repetitioner på alla variabler. Intervallvisa test görs sedan för varje antal repetitioner.

Skillnaden i metod mot tidigare frågeställning är alltså att det för varje variabel görs fem

tester, ett för varje medelkurva. De fem intervallvisa testen testar samma nollhypotes, men

bygger på olika observationer. Intresset ligger i att ta reda på om de fem testen uppvisar

(10)

5 stora skillnader i resultat, med särskilt intresse på variabler där nollhypotesen förkastas vid olika intervall.

Eftersom varje individ representeras av en medelkurva fås en stickprovsstorlek, uppdelat på atlet- och kontrollgrupp, på sammanlagt 46 kurvor. Antalet möjliga permutationer vid en sådan stickprovsstorlek är ofantligt många. Permutationstest ska dessutom göras för varje variabel, vid var och en av de 51 diskretiserade mätpunkterna. Mot den bakgrunden begränsas antalet permutationer till 10 000. Permutationerna dras med hjälp av Monte Carlo-simulering, vilket gör att samma permutation i praktiken kan förekomma mer än en gång.

Alla analyser sker med hjälp av programvaran R (R Core Team 2016). Förutom ordinarie utbud har även R-paketen Fda (Ramsay et al. 2017), Manipulate (Allaire 2014) och Plyr (Wickham 2011) använts.

För den första frågeställningen presenteras de variabler där signifikanta skillnader i rörelsemönstret observerats. I den andra frågeställningen studeras de variabler som presenterats i frågeställning ett.

4. Teori

Följande notation kommer användas i uppsatsen. Domän motsvarar hela det funktionsområde som analyseras och betecknas med T, där 𝑇 = [𝑎, 𝑏]. Tidpunkter i domänen betecknas med 𝑡

𝑖

, där 𝑖 = 1, . . . , 𝑛. Domänen kan delas upp i intervall i formen (𝑡

1

, 𝑡

2

), där 𝑎 ≤ 𝑡

1

< 𝑡

2

≤ 𝑏. Ett intervall betecknas med 𝐼. Funktionell dataanalys utgår vanligtvis från diskreta observationer som antas komma från en underliggande funktion, betecknad 𝑋(𝑡). Låt 𝑥

𝑖

, där 𝑖 = 1, … , 𝑛, vara observationer av funktionen vid tidpunkterna 𝑡

𝑖

∈ 𝑇. Vid hypotesprövning betecknas slumpfunktionerna i de två populationerna med 𝜉

𝑗𝑘

, där 𝑗 = 1, 2 och 𝑘 = 1, … , 𝑚

𝑗

. 𝜇

1

(𝑡) och 𝜇

2

(𝑡) betecknar medelfunktionen för respektive population. 𝑃

𝐼

är p-värdet för hypotesprövningen på intervall 𝐼. Den justerade p- värdesfunktionen betecknas 𝑝̃(𝑡) och den icke-justerade p-värdesfunktionen betecknas 𝑝(𝑡).

Ett antal statistiska metoder och begrepp har översatts från engelska till svenska i uppsatsen.

Dessa översättningar baseras på en ordlista med statistiska termer på olika språk (International Statistical Institute, 2011).

4.1 Introduktion till funktionell dataanalys

Statistiska metoder inom funktionell dataanalys (FDA) har utvecklats parallellt med

uppkomsten av funktionella data. Utvecklingen tog sin början under 1960- och 70-talet,

men det var under 80- och 90-talet, då funktionella data blev allt vanligare, som forskningen

inom analysmetoderna tilltog (Sørensen, Goldsmith och Sangalli 2013, 5222-5223). Syftet

med FDA är i huvudsak detsamma som för andra statistiska metoder. Det inkluderar bland

annat att presentera data visuellt för att upptäcka olika egenskaper, att studera mönster och

(11)

6 variation inom datat samt att jämföra två dataset med avseende på dess variation (Ramsay, Silverman 2005, 9-10).

FDA utgår vanligtvis från diskreta observationer, 𝑥

1

, . . . , 𝑥

𝑛

, som till exempel har observerats vid tidpunkterna 𝑡

1

, . . . , 𝑡

𝑛

(Sørensen, Goldsmith och Sangalli 2013, 5222). Data är oftast observerat över tid, men det kan även observeras över andra enheter, såsom frekvens och vikt (Ramsay, Silverman 2005, 38). Observationerna antas komma från en funktion 𝑋(𝑡), där 𝑥

𝑖

är en observation av 𝑋(𝑡

𝑖

). Det är denna funktion som analysen bygger på. FDA skiljer sig därmed från traditionell multivariat analys i och med att det är funktioner som är av intresse, inte enskilda observationer (Sørensen, Goldsmith och Sangalli 2013, 5222).

Det är möjligt att analysera data som exempelvis är observerat över tid med traditionella multivariata metoder, men de har tydliga nackdelar jämfört med funktionella motsvarigheter. De kan till exempel inte utnyttja information från den underliggande funktionen som data antas komma från, vilket metoder inom FDA kan (Levitin et al. 2007, 135). Strukturen på funktionella data innebär också utmaningar, det har till exempel en oändlig dimension och ett antagande om mjukhet, som multivariata metoder inte är anpassade för (Sørensen, Goldsmith och Sangalli 2013, 5223).

4.2 Transformera observationer till funktioner

Anta att det finns en funktion, 𝑋(𝑡), som är observerad i ett visst antal punkter, 𝑥

1

, . . . , 𝑥

𝑛

. Det är av intresse att försöka återskapa denna underliggande mjuka funktion med hjälp av observerat data. Detta kan göras med olika metoder. Under antagandet att observationerna inte har något fel används interpolation, men om det finns fel i observationerna kan processen involvera olika typer av utjämning (Ramsay, Silverman 2005, 11). Två exempel på sådana metoder är utjämning med minsta kvadratmetoden och utjämning med penaliserad minsta kvadrat-kriterium (Sørensen, Goldsmith och Sangalli 2013, 5225).

Utjämning med minsta kvadratmetoden går ut på att anpassa en modell till datat genom att minimera kvadratsumman av feltermerna (Ramsay, Silverman 2005, 59). En svårighet med detta är att den sanna funktionen inte är känd, vilket innebär att den måste estimeras med hjälp av observerat data. Ett sätt att göra det på är att använda sig av en linjärkombination av kända basfunktioner, så kallade basexpansioner. Två exempel på baser är fourierbaser och polynomiska splinebaser. Valet av bas beror på vilken typ av funktionella data som ska analyseras. Fourierbaser används ofta till periodiskt data medan splinebaser kan användas när det är av intresse att upptäcka lokala egenskaper i datat. Nästa steg är att välja antal basfunktioner, vilket i princip avgör hur mjuk funktionen blir (Sørensen, Goldsmith och Sangalli 2013, 5225-5226). Om antalet basfunktioner är få blir funktionen jämn och om antalet är fler anpassar sig funktionen mer till de observerade värdena (Ramsay, Silverman 2005, 67).

En utveckling av utjämning med minsta kvadratmetoden är att introducera ett straff för

ojämnhet, här betecknat med λ. Utjämning med penaliserad minsta kvadrat-kriterium leder

till en mer effektiv approximation av funktioner, vilket gör att den bland annat genererar

(12)

7 bättre resultat när det kommer till estimation av derivator (Ramsay, Silverman 2005, 81).

Vid utjämning med penaliserad minsta kvadrat-kriterium är det parametern λ som bestämmer hur jämn funktionen blir, inte antal basfunktioner. Om λ är stort är straffet för funktionens volatilitet också stort, vilket innebär att funktionen blir jämn. Den omvända principen gäller om λ är litet. För att välja värde på parametern λ är det bland annat möjligt att använda sig av Akaikes informationskriterium (AIC) eller generaliserad korsvalidering (Sørensen, Goldsmith och Sangalli 2013, 5227).

Ett av syftena med att omvandla diskreta observationer till kontinuerliga funktioner är att det möjliggör studier av kurvornas derivator. Det är bland annat informativt att undersöka förhållandet mellan olika derivator, till exempel genom att plotta högre derivator mot lägre.

Genom en sådan graf är det möjligt att upptäcka effekter i data som inte visas av de ursprungliga funktionerna (Ramsay, Silverman 2005, 13-14).

4.3 Funktionsjustering

Variation i mätvärden för en funktion kan delas upp i fasvariation och amplitudvariation.

Fasvariation är variation i tidpunkter för specifika egenskaper, till exempel min- och maxpunkter, oberoende av dess storlek, se figur 2A. Amplitudvariation avser storleken på olika egenskaper hos en funktion, oberoende av när i tid de inträffar. Detta illustreras i figur 2B. Vid jämförelse av två eller flera funktioner kan det vara av intresse att särskilja, och i vissa fall justera för, dessa typer av variation (Ramsay, Silverman 2005, 127-128).

Figur 2. Både diagram A och B visar tre kurvor. I A visas exempel på fasvariation och i B visas exempel på amplitudvariation. Funktionerna bygger på simulerat data och därmed har varken värdet på axlarna eller vilken enhet de mäts i någon betydelse.

Figur 2A illustrerar ett vanligt förekommande problem inom funktionell dataanalys. Vissa

funktioner ser nästan likadana ut, med enda skillnaden att förändringar i derivata, min- och

maxpunkter inträffar på olika punkter längs tidsaxeln. Kurvorna i figuren liknar varandra,

men det är svårt att jämföra dem eftersom de inte täcker över samma tidsintervall. Vid en

given punkt, låt säga 72, är värdet på funktionerna väldigt olika. Om funktionerna istället

justeras så att de utgår från en gemensam punkt är det enklare att se var de förändras mot

varandra. Det är alltså inte av intresse att undersöka när i tid händelser inträffar, utan fokus

ligger på att jämföra funktionerna i den domän då händelserna faktiskt inträffar. Denna

metod kallas för landmärkesjustering och beskrivs längre ned i detta avsnitt. I figur 2B

illustreras tre andra kurvor som istället varierar i mätvärde med amplitudvariation. De börjar

(13)

8 stiga ungefär samtidigt och når sina respektive maxpunkter samtidigt, skillnaden är värdet på funktionerna i maxpunkten. Det är tydligt att de skillnader som finns mellan kurvorna framförallt uppstår i intervallet 75-80.

En anledning till varför det är viktigt att tillämpa funktionsjustering är att fasvariation kan försvåra analysen av kurvorna, till exempel när en individ representeras av en medelkurva.

Om det finns fasvariation i datat kommer medelkurvan inte kunna visa specifika egenskaper lika tydligt som varje enskild kurva eftersom de inträffar vid olika tidpunkter. Syftet med justering är att skifta kurvorna för att få dem att likna varandra. För detta finns olika metoder, två av dessa är landmärkesjustering och kontinuerlig justering (Sørensen, Goldsmith och Sangalli 2013, 5230-5231).

Landmärkesjustering går ut på att först identifiera egenskaper (landmärken) hos kurvorna, exempelvis min- och maxpunkter, och sedan justera dem så att dessa egenskaper inträffar under samma tidpunkter. Valet av landmärken är subjektivt och resultatet kan påverkas av precisionen i valet. En begränsning med metoden är att den inte är användbar i de fall då kurvorna inte uppvisar några definierbara egenskaper (Sørensen, Goldsmith och Sangalli 2013, 5231).

Kontinuerlig justering är en alternativ metod som innefattar olika tillvägagångssätt. Ett av dessa går ut på att definiera ett mått för att mäta skillnader och likheter mellan kurvor. Målet är att minimera den slutgiltiga distansen, eller maximera likheten, mellan kurvorna. Det är möjligt att använda olika mått för att mäta avstånd och resultatet kan variera beroende på vilket mått som väljs (Sørensen, Goldsmith och Sangalli 2013, 5231).

4.4 Hypotesprövning med funktionella data

För att kunna dra slutsatser utifrån observerade funktionella data behövs metoder inom statistisk inferens anpassade för funktionella data. Flertalet forskare har på senare tid intresserat sig för just detta och bidragit med parametriska och icke-parametriska metoder som bland annat kan användas vid hypotesprövning. Parametriska metoder bygger på antaganden om fördelning eller asymptotiska egenskaper hos det funktionella datat medan de icke-parametriska motsvarigheterna förlitar sig på tekniker som bootstrap och permutationer (Pini, Vantini 2017, 407). I denna uppsats är det av intresse att genomföra ett hypotestest med fokus på två populationer, och för detta finns flera möjliga metoder.

Hall och Tajvidi (2002, 359-374) föreslår ett jämförande test med syfte att upptäcka om två populationer skiljer sig åt. Testet ger ett globalt p-värde som används för att antingen förkasta eller inte förkasta nollhypotesen att fördelningen för två populationer är lika. Om p-värdet är lågt kan nollhypotesen förkastas, vilket innebär att det finns en signifikant skillnad. Noterbart är att testet inte ger information om var skillnaden inträffar (Pini, Vantini 2017, 414). För att identifiera intervall i data där skillnader uppstår finns flera metoder.

Vsevolozhskaya et al. (2014, 905–925) presenterar exempelvis en metod som går ut på att

först fördefiniera intervall av den intressanta domänen och sedan genomföra ett test för varje

intervall (Pini, Vantini 2017, 407). Detta test kommer i denna uppsats hädanefter kallas för

(14)

9 VGH-test. En begränsning med denna metod är att den beror på vilken uppdelning av domänen som väljs (Pini, Vantini 2017, 407).

Pini och Vantini (2017, 407) presenterar ett tillvägagångssätt baserat på intervallvisa tester av det område som ges av datamaterialet. Metoden kringgår VGH-testets nackdelar med uppdelningen av domänen. Det huvudsakliga utfallet av metoden är en justerad funktion för p-värden som utgår från en punktvis beräknad p-värdesfunktion, benämnd icke-justerad p- värdesfunktion. Författarna visar att den justerade p-värdesfunktionen är intervallvis konsistent medan den icke-justerade p-värdesfunktionen är punktvis konsistent (Pini, Vantini 2017, 409). Genom att använda ett funktionellt t-test är det möjligt att jämföra två populationer med avseende på deras förväntade medelfunktioner. Målet med testet är att identifiera delar av domänen där de två medelfunktionerna är signifikant skilda från varandra. Detta tillvägagångssätt gör det möjligt att förkasta eller inte förkasta en nollhypotes för specifika intervall (Pini, Vantini 2017, 410).

För att illustrera skillnaderna mellan metoderna används ett exempel med data över den dagliga medeltemperaturen i Kanada. Temperaturen har uppmätts i över 30 år på väderstationer i två klimatzoner; Atlantic och Continental. Det är av intresse att göra ett parvis test mellan dessa zoner för att undersöka om medeltemperaturen under ett år skiljer sig åt (Pini, Vantini 2017, 414). Temperaturkurvorna för de två zonerna finns presenterade i den högra figuren i figur 3 och i tabell 2 visas utfallet för det globala testet.

Tabell 2. Det globala p-värdet. Nollhypotesen att μ1=μ2 testas mot alternativhypotesen att μ1≠μ2 över hela domänen (Pini, Vantini 2017, 415).

Parvis jämförelse Globalt p-värde

Atlantic - Continental 0,000

Ett p-värde på 0,000 indikerar att de två zonerna skiljer sig åt, men det går inte att utläsa om medeltemperaturen skiljer sig under hela året eller enbart under vissa perioder. I figur 3 visas utfallet av VGH-testet och det intervallvisa test som föreslås av Pini och Vantini.

Figur 3. Årets månader är utritade på x-axeln. Den vänstra figuren visar den justerade p-värdesfunktionen som en heldragen svart linje och den icke-justerade funktionen som en streckad svart linje. De röda linjerna visar p-värden från VGH-testet, där årets 12 månader är valda som fördefinierade intervall. Till höger visas observerat data över temperatur. De grå områdena representerar perioder där skillnaden mellan de två klimatzonerna är signifikant, på 5 % signifikansnivå. (Pini, Vantini 2017, 416)

Utifrån den justerade p-värdesfunktionen till vänster i figur 3 är det möjligt att utläsa att

skillnaderna inträffar under årets första och sista månader. Under sommarmånaderna är p-

värdet för funktionerna högt, vilket innebär att nollhypotesen, att medeltemperaturen i de

(15)

10 två klimatzonerna är lika, inte kan förkastas. Kurvorna som beskriver p-värdena beter sig som väntat, den justerade är jämnare än den ojusterade, och p-värdena för VGH-testet hoppar från intervall till intervall.

Med ett exempel är det enkelt att beskriva och förstå hur metoden som beskrivs i Pini och Vantinis (2017) för justerade p-värden fungerar. Delar av metodbeskrivningen finns också tydligt formulerad i Abramowicz et al. (2018, 9-10). Anta en domän där 𝑇 = (𝑎, 𝑏] och där 𝑎 = 𝑡

0

𝑜𝑐ℎ 𝑏 = 𝑡

3

. Anta vidare att data observerats vid 𝑛 = 3 tidpunkter, 𝑡

𝑖

, där 𝑖 = 1, … , 𝑛. Domänen delas upp i 𝑛 lika stora underintervall, betecknad 𝑈

𝑖

. Det ger 𝑈

𝑖

= (𝑡

𝑖−1

, 𝑡

𝑖

], för 𝑖 = 1, 2, 3. De tre observationerna täcks således av ett enskilt underintervall vardera. Låt sedan 𝑆 beteckna familjen av möjliga intervall som kan konstrueras på domänen med hjälp av underintervallen. Som restriktion finns att underintervallen inte får möbleras om längs domänen och att intervallen måste vara sammanhängande. Det finns totalt

𝑛(𝑛+1)

2

= 6 stycken möjliga intervall då 𝑛 = 3. Dessa möjliga intervall är, förutom 𝑈

1

, 𝑈

2

och 𝑈

3

, (𝑡

0

, 𝑡

2

], (𝑡

1

, 𝑡

3

] och (𝑡

0

, 𝑡

3

]. Beroende på vilket underintervall observationen ligger i, täcks varje observation av tre eller fyra intervall ∈ 𝑆. Metoden för justerade p- värden ska ge ett p-värde för varje observerad tidpunkt. Eftersom hypotesprövning utförs på alla intervall ∈ 𝑆 som täcker över 𝑡

𝑖

, fås i exemplet tre eller fyra p-värden för varje 𝑡

𝑖

. Det justerade p-värdet för respektive 𝑡

𝑖

ges av det högsta av dessa p-värden.

4.5 Formell beskrivning av de två p-värdesfunktionerna

Låt 𝐼

⊆ 𝑇

vara ett godtyckligt intervall i formen (𝑡

1

, 𝑡

2

) där 𝑎 ≤ 𝑡

1

< 𝑡

2

≤ 𝑏. T är hela domänen, i exemplet tillhörande figur 2 är T alltså hela året från januari till december.

Intervallet 𝐼 är antingen en delmängd av eller hela funktionsområdet, där 𝑡

1

och 𝑡

2

är tidpunkter i T, exempelvis 1 februari till 31 mars. Låt 𝜉

𝑗𝑘

, där 𝑗 = 1, 2 och 𝑘 = 1, … , 𝑚

𝑗

vara slumpfunktionerna i de två populationerna. Låt därefter 𝑃

𝐼

vara p-värdet för intervall 𝐼 i följande hypotesprövning:

𝐻

0

: 𝜇

1𝐼

= 𝜇

2𝐼

, mot alternativhypotesen;

𝐻

𝑎

: 𝜇

1𝐼

≠ 𝜇

2𝐼

,

där 𝜇

1𝐼

och 𝜇

2𝐼

är medelfunktionen för respektive population på intervall 𝐼.

Det finns flera metoder för att beräkna 𝑃

𝐼

, både parametriska och icke-parametriska. I uppsatsen används icke-parametriska permutationstest, dels för att det inte kräver antaganden om datats fördelning och dels för att det ger ett exakt test oavsett hur stor stickprovsstorleken är (Pini, Vantini 2017, 413). Metoden som Pini och Vantini (2017) presenterar använder det permutationstest som beskrivs i Hall och Tajvidi (2002). Testet använder en teststatistika, 𝑇

𝐼

, som bygger på avståndet mellan de två stickprovsmedelvärdena;

𝑇

𝐼

= 1

|𝐼| ∫

𝐼

(𝜉 ̅ (𝑡) − 𝜉̅

1 2

(𝑡))

2

𝑑𝑡

(16)

11 där 𝜉̅

𝑗

= (

1

𝑚𝑗

) ∑ 𝜉

𝑗𝑘

𝑚𝑗

𝑘=1

, 𝑗 = 1,2, och |𝐼| är längden på intervall 𝐼.

För varje 𝑡 ∈ 𝑇 definieras den ojusterade p-värdesfunktionen, 𝑝(𝑡), som den övre gränsen av p-värdet 𝑃

𝐼

när båda extremvärdena på intervall 𝐼 konvergerar mot 𝑡. För varje 𝑡 ∈ 𝑇, definieras den justerade p-värdesfunktionen, 𝑝̃(𝑡), som supremumvärdet över alla p-värden 𝑃

𝐼

, där supremum tas över alla 𝐼 där 𝑡 ∈ 𝐼. De två p-värdesfunktionerna formellt beskrivna;

𝑝(𝑡) = lim sup

𝐼→𝑡

𝑃

𝐼

∀𝑡 ∈ 𝑇,

𝑝̃(𝑡) = sup

𝐼∋𝑡

𝑃

𝐼

∀𝑡 ∈ 𝑇,

där 𝐼 → 𝑡 i den första definitionen indikerar att båda extremvärdena på intervall 𝐼 konvergerar mot 𝑡.

4.6 Permutationstest

Permutationstest är en icke-parametrisk återsamplingsmetod som har flera likheter med bootstrap; den är datorintensiv och förlitar sig på det tillgängliga datamaterialet (Good 1994, 7). Det finns flera olika typer av permutationstest, där vissa bygger på rangordning av observationer. Metoden som Pini och Vantini presenterar bygger på ett mer komplicerat permutationstest än det som presenteras i följande exempel, men exemplet tydliggör och förklarar på ett enkelt sätt skillnaden mellan ett parametriskt test och ett permutationstest som baseras på rangordning.

Anta två stickprov, det första stickprovet är patienter som har fått behandling och består av värdena 3, 5, 7, 6, och 81. Det andra stickprovet består av en kontrollgrupp och antar värdena 20, 21, 16, 22 och 23. Testen ska pröva nollhypotesen att dessa stickprov kommer från samma population mot alternativhypotesen att de kommer från olika populationer. Båda gruppernas medelvärde är 20,4. Ett test som baseras på gruppmedelvärden ger med en mycket hög sannolikhet slutsatsen att stickproven är dragna från samma population. När istället ett permutationstest baserat på rangordning genomförs, rangordnas observationerna från båda stickproven från det lägsta värdet till det högsta. Det innebär att det första stickprovet består av rangordningen 1, 2, 3, 4 och 10 medan det andra består av 5, 6, 7, 8 och 9. Rangsumman beräknas genom att summera rankingpoängen för gruppen. I detta fall får stickprovet från patientgruppen summan 20. Efter det undersöks om de två stickproven är dragna från två olika populationer. För att göra detta arrangeras observationerna om (permuteras) fram tills dess att alla möjliga kombinationer är utförda. I detta fall finns det (

105

) = 252 sätt att omarrangera observationerna. För varje möjlig kombination räknas rangsumman ut, och sedan undersöks hur många av dessa kombinationer som har en rangsumma mindre eller lika med originalstickprovet. I detta fall finns det 19 sådana kombinationer, vilket innebär att sannolikheten att två så pass olika stickprov ska vara slumpmässigt dragna från samma population är ungefär 0,075 (Good 1994, 30).

För större stickprov blir antalet möjliga permutationer väldigt många. Redan vid en

stickprovsstorlek på 10 observationer i respektive grupp blir antalet permutationer 184 756

(17)

12 ((

2010

)). Det är därför vanligt att för större stickprov begränsa antalet permutationer till ett visst antal. En dator får då slumpmässigt dra till exempel 10 000 permutationer och sedan jämförs rangsumman från stickprovet mot dessa permutationer.

5. Resultat

5.1 Skillnad mellan grupperna

Resultatet av den första frågeställningen presenteras i figur 4-8. Dessa figurer har alla samma upplägg. Grafen till vänster visar de individuella medelvärdeskurvorna tillsammans med kurvor för gruppmedelvärden. Grafen till höger visar de justerade och de ojusterade p- värdena tillsammans med signifikansnivån 5 %, representerad med en horisontell linje. I bilaga 1 finns exakta p-värden för de fem variabler som presenteras angivna.

Figur 4. Momentet i knäet i mätpunkt X.

Genom att studera den justerade p-värdesfunktionen kan utläsas att atlet- och kontrollgrupp generellt inte skiljer sig åt när det gäller momentet i mätpunkt X på knäet. Det finns dock en signifikant skillnad kring 85-90 % av landningsfasen, där p-värdet är lägre än 0,05. Där gruppernas medelvärdeskurvor skär varandra, kring 10 % och 50 %, är också p-värdena som högst.

Figur 5. Momentet i knäet i mätpunkt Z.

Den justerade p-värdesfunktionen i figur 5 visar att det för variabeln Knä moment Z finns

en signifikant skillnad mellan grupperna kring 80-95 % av landningsfasen. I början av

landningsfasen är p-värdet förhållandevis högt, vilket indikerar att de två grupperna liknar

(18)

13 varandra där. Detta visas också av den vänstra figuren, eftersom gruppernas medelvärdeskurvor till en början ligger nära varandra.

Figur 6. Vinkeln i bäckenet i mätpunkt X.

De justerade p-värdena i figur 6 ligger konstant under signifikansnivån 0,05. Det innebär att för vinkeln i bäckenet i mätpunkt X skiljer sig atlet- och kontrollgruppen åt under hela landningsfasen.

Figur 7. Vinkeln i höften i mätpunkt X.

Den justerade p-värdesfunktionen visar en signifikant skillnad mellan cirka 5-50 % av landningsfasen. Efter detta är p-värdet högre än 0,05, vilket innebär att atlet- och kontrollgruppen har ett liknande rörelsemönster i slutet av landningen. Denna likhet kan även utläsas från den vänstra figuren eftersom gruppernas medelvärdeskurvor närmar sig varandra vid senare delen av landningsfasen.

Figur 8. Momentet i höften i mätpunkt Y.

(19)

14 Den justerade p-värdesfunktionen har två toppar, omkring 5 % och 35 %, vilket indikerar att grupperna liknar varandra under dessa delar av landningsfasen. I den vänstra figuren syns att medelkurvorna skär varandra vid samma punkter. Efter cirka 57 % är p-värdet lägre än 0,05, vilket innebär att atlet- och kontrollgruppen är signifikant skilda vid den senare delen av landningen.

5.2 Skillnad mellan antal repetitioner

Resultatet av den andra frågeställningen presenteras i figur 9. Graferna visar fem justerade p-värden för medelvärden baserade på olika antal repetitioner, tillsammans med signifikansnivån.

Figur 9. Justerade p-värden för variablerna Knä moment Z, Knä moment X, Höft moment Y, Höft vinkel X och Bäcken vinkel X.

För variablerna Knä moment Z och Knä moment X hade nollhypotesen inte kunnat förkastas

om testen gjorts på tre slumpmässigt valda hopp eftersom p-värdet för dessa funktioner

aldrig är lägre än 0,05. Däremot kommer de fyra andra testen, som bygger på de tre, fyra

(20)

15 och fem första hoppen samt alla godkända repetitioner, i båda fallen under signifikansnivån.

Slutsatsen för dem blir att det finns områden av landningsfasen där nollhypotesen kan förkastas.

För de övriga variablerna hade slutsatserna inte påverkats nämnvärt av vilka repetitioner som medelkurvorna baseras på. Alla p-värdesfunktioner för Bäcken vinkel X följer samma mönster och är lägre än 0,05, vilket innebär att nollhypotesen kan förkastas för hela domänen oavsett vilket antal repetitioner som används. För Höft moment Y och Höft vinkel X kan nollhypotesen förkastas för i huvudsak samma andelar av landningsfasen för alla kurvor.

För variablerna Knä moment Z och Höft moment Y är skillnaden mellan kurvan som baseras på tre slumpmässiga hopp och övriga kurvor relativt stor. Medan övriga kurvor följer varandra förhållandevis väl uppvisar de gröna kurvorna till viss del ett annat mönster. Dessa skillnader illustreras exempelvis vid 5-30 % för Knä moment Z och vid 10-40 % av landningsfasen för Höft moment Y. För övriga variabler följer alla kurvor ungefär samma mönster, men för Knä moment X ser kurvorna som baseras på tre slumpmässiga hopp och ett medel av alla godkända hopp ut att vara förskjutna. Till en början liknar kurvorna varandra, men vid omkring 25 % av landningsfasen har de gula och gröna kurvorna ett lägre p-värde än de övriga. Alla kurvor når en maxpunkt vid omkring 45-60 %, men den gula och den gröna kurvan når den senare än de övriga. Mot slutet av landningsfasen ligger kurvorna relativt nära varandra igen, med skillnaden att den gröna aldrig har ett p-värde som är lägre än 5 %.

6. Slutsatser och diskussion 6.1 Slutsatser

Resultaten visar att det finns skillnader i landningsfasen mellan atlet- och kontrollgrupp för fem av de arton variablerna som studerats. För en variabel, Bäcken vinkel X, var skillnaden signifikant över hela domänen. För övriga variabler som uppvisade skillnader gäller att skillnaderna finns i vissa intervall av domänen. Just skillnaden i Bäcken vinkel X bör studeras vidare för att först säkerställa att det inte beror på mätfel eller misstag vid datahantering. Om skillnaderna kvarstår, bör det tillsammans med en fysioterapeut eller liknande genomföras fler studier med nya deltagare för att säkerställa att det finns en generell skillnad mellan atlet- och kontrollgrupp. Därefter är det upp till forskare inom fysioterapin att studera orsaken och effekten av denna skillnad. Givetvis är även de andra variablerna, de med intervallvisa skillnader, av intresse och resultatet från dessa test bör också utvärderas av forskare inom området.

Slutsatsen av den andra frågeställningen är att resultatet av hypotesprövningen för

variablerna Knä moment Z och Knä moment X beror på vilket antal repetitioner som

används i testet. Det är framförallt kurvorna som baseras på tre slumpmässiga hopp som

skiljer sig från de övriga, eftersom de ligger över signifikansnivån över hela domänen. De

slutsatser som kunde dras för dessa variabler i den första frågeställningen, att det finns vissa

intervall där grupperna är signifikant skilda, hade förändrats om medelkurvorna istället

(21)

16 baserats på tre slumpmässiga hopp. Noterbart är att det endast är två av de undersökta fem variablerna som uppvisar sådana skillnader. För övriga variabler varierar utseendet på kurvorna något, men resultatet av hypotesprövningen påverkas i praktiken inte av vilket antal repetitioner som väljs.

Det faktum att den justerade p-värdesfunktionen som baseras på tre slumpmässiga hopp skiljer sig så pass mycket från de övriga för Knä moment Z och Höft moment Y kan anses intressant. Skillnaden är exempelvis inte lika uppenbar för Höft vinkel Y. Det är dock inte möjligt att direkt jämföra dessa kurvor med varandra eftersom analysen för varje variabel bygger på tre olika slumpmässigt valda hopp. Det är möjligt att studera vidare hur medelkurvorna förändras beroende på vilka hopp som används för att bättre kunna uttala sig om dessa skillnader.

Eftersom detta är en statistisk analys och kompetens inom fysioterapi saknas, kan inte slutsatserna bli andra än att antingen förkasta eller behålla nollhypotesen. Det går inte att säga någonting om orsakerna till de skillnader som visats mellan atlet- och kontrollgrupp.

Det går inte heller att säga vad som är ett bra eller ett dåligt resultat på testerna. I de fall där skillnader finns, saknas kunskap för att dra några slutsatser om det är atletgruppen eller kontrollgruppen som presterar anmärkningsvärt bra. För detta datamaterial varierar resultat och slutsatser beroende på vilka repetitioner testen bygger på. Även här kan det vara viktigt att låta sakkunniga titta närmare på orsakerna till de varierande resultaten. Om det till exempel för varje person syns skillnader mellan de första och sista hoppen, beror det kanske på trötthet eller att personen lär sig att utföra hoppet bättre. Eftersom resultatet gäller för detta specifika datamaterial, går det inte att ge några generella rekommendationer för andra datamaterial annat än att studera vad som händer med resultatet när metoden för medelvärden förändras.

6.2 Diskussion

Fördelen med intervallvisa hypotestest är att det är möjligt att se när under landningsfasen som eventuella skillnader mellan atlet- och kontrollgrupp inträffar. Ett alternativt tillvägagångssätt hade varit att först tillämpa ett globalt test för varje variabel för att undersöka om det finns signifikanta skillnader mellan grupperna, och sedan ett intervallvist test för de variabler med ett p-värde lägre än 0,05. Detta hade möjligtvis gjort det enklare att identifiera de variabler som uppvisar skillnader i rörelsemönster.

Det datamaterial som uppsatsen utgår från lämpar sig väl för funktionell dataanalys. Dock bygger lämpligheten till viss del på de justeringar av tid som gjorts innan analysen.

Tidsaxeln har ändrats för att möjliggöra jämförelser mellan olika individers kurvor, trots att det mest troligt tog olika lång tid från initial kontakt till maximal böjning. På grund av denna justering är det inte möjligt att studera skillnader i landningstid, till exempel hur lång tid det tar innan maximal vinkel uppnåtts. Det är möjligt att det redan innan denna studie visats att detta inte är ett problem, om inte kan det finnas visst intresse i att studera effekterna av justeringen.

Vid presentationen av resultat och slutsatser bör läsaren ha i åtanke att endast 46 personer

ingår i studien, en enskild persons prestation väger därför förhållandevis tungt. En större

(22)

17 stickprovsstorlek hade givetvis varit att föredra, men det kräver också mer resurser. Effekten av att både män och kvinnor ingår i studien går inte att sia om, men det bör studeras närmare av en fysioterapeut för att säkerställa att detta inte har någon påverkan på slutsatserna från hypotesprövningen.

Uppsatsen är avgränsad till den första landningen och endast det dominanta benet

undersöks. Med mer tid hade det varit intressant att studera om samma skillnader

förekommer även på andra landningen och med det icke-dominanta benet. Uppsatsens andra

frågeställning var att ta reda på om resultatet av frågeställning 1 förändras när analysen

utförs på ett medel av olika antal repetitioner. När det gäller de repetitioner som

medelkurvorna bygger på hade det varit möjligt att göra vissa förändringar. Resultatet visar

att slutsatsen från hypotesprövningen förändras, för två av de fem variabler som uppvisade

skillnader i rörelsemönster, när analysen utförs på ett medel av olika antal repetitioner. Det

är naturligt att de tre medelkurvorna som bygger på de tre, fyra och fem första repetitionerna

är väldigt lika, eftersom de är nästade. Däremot är skillnaderna mellan kurvan som bygger

på tre slumpmässigt valda repetitioner och de övriga kurvorna i vissa fall relativt stora. I ett

tidigare skede hade det varit möjligt att lägga till en medelkurva som bygger på de tre sista

repetitionerna. Genom att göra detta hade det varit möjligt att undersöka om skillnader i

rörelsemönster förändras vid tidiga och avslutande repetitioner.

(23)

18

Referenslista

Abramowicz, K., Häger, C.K., Pini, A., Schelin, L., Sjöstedt de Luna, S. & Vantini, S.

(2018). Nonparametric inference for functional-on-scalar linear models applied to knee kinematic hop data after injury of the anterior cruciate ligament. Scandinavian Journal of Statistics. Online Version of Record before inclusion in an issue.

Allaire, J.J. (2014). Manipulate: Interactive plots for RStudio. R package version 1.0.1.

https://CRAN.R-project.org/package=manipulate

Climate Data. Klimat : Umeå. https://sv.climate-data.org/location/450/ (Hämtad 2018-04- 18).

Fältström, A. (2016) Hög motivation viktigt efter korsbandsoperation. Idrottsforskning. 17 oktober.

https://www.idrottsforskning.se/hog-motivation-viktigt-efter-korsbandsoperation/

(Hämtad 2018-05-07).

Good, P. (1994). Permutation tests : A practical guide to resampling methods for testing hypotheses (Springer series in statistics). New York ; Berlin: Springer-Vlg.

Hall, P. & Tajvidi, N. (2002). Permutation tests for equality of distributions in highdimensional settings. Biometrika, 89(2), 359-374.

ISI - International Statistical Institute. 2011. The ISI glossary of statistical terms in a number of languages some of which use special characters.

http://isi.cbs.nl/glossary/index.htm

(Hämtad 2018-05-03).

Levitin, D., Nuzzo, R., Vines, B., Ramsay, J. & Hunsley, J. (2007). Introduction to functional data analysis. Canadian Psychology/Psychologie Canadienne, 48(3), 135-155.

Pini, A. & Vantini, S. (2017). Interval-wise testing for functional data. Journal of Nonparametric Statistics, 29(2), 407-424.

Ramsay, J.O. & Silverman, B.W. (2005). Functional data analysis (Springer series in statistics). 2. uppl. New York: Springer.

Ramsay, J.O., Wickham

,

H., Graves, S. & Hooker, G. (2017). fda: Functional data analysis. R package version 2.4.7. https://CRAN.R-project.org/package=fda

R Core Team (2016). R: A language and environment for statistical computing. R foundation for statistical computing, Vienna, Austria. https://www.R-project.org/

Sernert, N. (2010). Könsaspekter på främre korsbandsskador. Svensk Idrottsforskning.

https://centrumforidrottsforskning.se/wp-content/uploads/2014/04/Konsaspekter-framre- korsbandsskador.pdf (Hämtad 2018-05-07).

Svenska korsbandsregistret. (2009). Årsrapport 2009.

https://aclregister.nu/info/rapport2009.pdf (Hämtad 2018-05-07).

Sørensen, H., Goldsmith, J. & Sangalli, L. (2013). An introduction with medical

applications to functional data analysis. Statistics in Medicine, 32(30), 5222-5240.

(24)

19 Vsevolozhskaya, O., Greenwood, M. & Holodov, D. (2014). Pairwise comparison of treatment levels in functional analysis of variance with application to erythrocyte hemolysis.

Annals of Applied Statistics, 8(2), 905-925.

Wickham, H. (2011). The split-apply-combine strategy for data analysis. Journal

of Statistical Software, 40(1), 1-29.

References

Related documents

invändningar ska göras utifrån en objektiv bedömning och länsstyrelserna ska genom ”samverkan sinsemellan bidra till att urvalet av områden blir likvärdigt runt om i

Det saknas dessutom en beskrivning av vilka konsekvenser det får för kommunerna i ett läge där länsstyrelsen inte godkänner kommunens förslag på områden och kommunen behöver

Förslagen i promemorian innebär att innan en kommun gör en anmälan till Migrationsverket ska kommunen inhämta ett yttrande från länsstyrelsen över den eller de delar av kommunen

Huddinge kommun anser att de kommuner som likt Huddinge motiverat sina områdesval utifrån socioekonomiska förutsättningar och redan haft den dialog med länsstyrelsen som föreslås

Jönköpings kommun har beretts möjlighet att lämna synpunkter på promemorian ” Ett ändrat fö rfa rande för att anmäla områd en som omfatt as av be gr änsni n gen av rätt en ti

Frågan som är utskickad för remiss handlar om förslag om att göra vissa ändringar i det anmälningsförfarande som gäller vilka områden som omfattas av en begränsning

Katrineholms kommun överlämnar följande yttrande över Justitiedepartementets promemoria &#34;Ett ändrat förfarande för att anmäla områden som omfattas av begränsningen av

Särskilt med beaktande av att regeringen i promemorian öppnar upp för att fler kommuner kan komma att få möjlighet att anmäla områden till Migrationsverket bedömer läns- styrelsen