TVE 16 050 JUNI
Examensarbete 15 hp Juni 2016
Trendanalys inom futurehandel
Tom Waern
Shad Mahmod
Teknisk- naturvetenskaplig fakultet UTH-enheten
Besöksadress:
Ångströmlaboratoriet Lägerhyddsvägen 1 Hus 4, Plan 0
Postadress:
Box 536 751 21 Uppsala
Telefon:
018 – 471 30 03
Telefax:
018 – 471 30 00
Hemsida:
http://www.teknat.uu.se/student
Abstract
Trendanalys inom futurehandel
Tom Waern, Shad Mahmod
Futurehandel är en investeringsform där trendanalys vanligen tillämpas. Målet med projektet är att prediktera marknadsförändringar genom att optimera modeller som använder sig av historiska marknadspriser. Resultaten från dessa metoder jämförs sedan med resultaten erhållna genom att endast ta en lång position. För att vidare jämföra resultaten hos de olika metoderna har deras sharpekvoter jämförts.
Resultatet av studien visar att överlag har linjära anpassningar genererat högst
sharpekvoter, främst ridge regression. Undantaget är vid handel av valutor då
medelvärdesbaserade metoder är de mest tillförlitliga.
Innehåll
1 Introduktion 3
2 Teori 4
2.1 Bias variance tradeoff 4
2.2 Moving Average Crossing (MACROSS) 4
2.3 Riskjustering 6
2.4 Ordinary Least Squares 6
2.5 Ridge regression 7
2.6 Sharpekvot 7
3 Metod 8
3.1 Data 8
3.2 Uppskattning av standardavvikelsen 8
3.3 Parametrar som ej ändras 9
3.4 Enbart lång position 9
3.5 Val av parametrar i MACROSS 9
3.6 MACROSS med positioner baserat på tidigare intervall 10
3.7 Val av data för OLS och ridge regression 10
3.8 Omskalning vid ridge regression 10
3.9 Val av ridge parameter λ 10
3.10 Avgränsningar 10
4 Resultat 11
4.1 Tillgångstypernas prisutveckling under perioden 11
4.2 Enbart lång position 14
4.3 MACROSS med olika vikt 14
4.4 MACROSS: Position baserat på tidigare intervall 19
4.5 Ordinary Least Squares 19
4.6 Ridge regression 20
5 Diskussion 22
5.1 Anpassning för aktier 22
5.2 Anpassning för räntepapper 22
5.3 Anpassning för råvaror 22
5.4 Anpassning för valutor 23
5.5 Andra aspekter att undersöka 24
5.6 Projektet som bas för investering 24
6 Slutsats 24
A Standard.m - Standardisering av priser 25
B correl.m 25 C kvoter.m - Beräkning av kvoter mellan E[X
2] och E[X]
226
D β koefficienter för olika λ 26
Populärvetenskaplig sammanfattning
Att det på nutidens aktiemarknader är allt fler robotar som handlar är ett ämne som snabbt blivit relevant i takt med att dessa blivit skickligare.[1] Självklart rör det sig inte om en människolik skapelse som sitter vid en dator utan istället bara skickligt skriven kod. Hur denna kod ser ut och vilka tekniker den använder sig av för att läsa av marknaden varierar mycket. Derivathandel och dagshandel hör till de mest kända, de går ut på att snabbt köpa och sälja tillgångar för att tjäna på plötsliga ändringar i marknaden. Ett annat tillväga- gångssätt är att använda metoder som struntar i de små dagliga händelserna och fokuserar på de långtgående trenderna, metoder som gör detta kallas för trendanalyserande. Genom att helt matematiskt analysera hur marknaden historiskt har betett sig så förutspås hur framtiden kommer bli. Prediktionerna om de upp- och nedgående trenderna i marknaden kan sedan användas för att investera dagar eller veckor in i framtiden. Denna typ av trenda- nalyserande robotar eller koder blir särskilt effektiva i hedgefonder eftersom dessa handlar i så kallade futures, en vadslagning om vad som kommer hända i framtiden på marknaden.
Precis som i en vanlig vadslagning kan parterna gissa att priset ska gå antingen upp eller
ned. Det är således möjligt att tjäna pengar både i uppgående och nedgående trender. Vi-
dare måste de trendanalyserande metoderna bara prediktera marknaden rätt till tecken på
ändringarna, ej till belopp. Projektets strävan är att använda och optimera olika metoder
för prediktion av marknader med syfte att maximera sharpekvoter.
1 Introduktion
Future-kontrakt, eller förenklat “futures”, är ett börshandlat kontrakt där två parter i nu- läget enas om en framtida leverans. Anledningen till att parterna vill göra detta är för att försäkra sig mot prisändringar av produkten. Den ena parten “satsar” på att priset på produkten kommer att öka och tar då en lång position medan andra parten tar en så kallad kort position, vilket innebär en försäkring mot prissänkningar. Om priset ökar en dag så kommer personen med den korta positionen att behöva betala mellanskillnaden.
Betalningar inom future-kontraktet sker löpande från dag till dag. En bonde som odlar en viss gröda kan behöva skydda sig mot prissänkningar som sker före skörden och tar därför en kort position. Detta betyder att om priset på grödan är lägre när det är dags för för- säljning kommer vinsten från future-kontraktet att täcka upp för förlusten. Om priset på grödan ökat så kommer bonden inte att tjäna något extra eftersom hen behöver betala den andra parten i futurehandlingen. Bonden vet långt innan försäljningen exakt hur mycket hen kommer att få för grödan. Med samma resonemang har köparen av varan den långa positionen för att försäkra sig om vilket pris hen kommer att betala för grödan.
Om man inte är en producent eller konsument av en viss produkt kan man fortfarande skriva på futures i denna för att försöka tjäna pengar på att spekulera i vilket håll mark- naden kommer att gå. Att gissa hur marknaden kommer ändras är en form av spekulering, en annan är att alltid ta långa positioner eftersom att över lång tid brukar marknader växa (undantag är till exempel valutor där värdet är baserat på andra valutor). För att göra spekuleringen mer vetenskaplig så analyseras trender inom de olika marknaderna och olika metoder och filter sätts upp för att kunna bestämma när en marknad är på uppgång respektive nedgång, sedan kan positionerna i future handlingen avgöras.
Projektet handlar om konstruktion och optimering av ett filter för future handling, detta
ska ske med utgångspunkt i 40 stycken olika tillgångar uppdelade inom de fyra tillgångsty-
perna aktieindex, råvaror, valutor och räntepapper. Trender hos dessa ska analyseras med
olika metoder inom trendanalys så som moving average crossing (MACROSS) och olika
typer av regressionsmetoder. Optimeringen kan ske genom ändringar i parametrar som till
exempel hur många dagar som används för inlärning, hur långt in i framtiden filtret försöker
prediktera och hur koefficienterna för olika dagar viktas och straffas.
2 Teori
2.1 Bias variance tradeoff
Medelkvadratfelet (eng. Mean Squared Error) kan skrivas som summan av variansen och metodfelet (eng. bias) av en prediktor. Variansen syftar på skillnaden som skulle uppstå om funktionen hade tränats på ett annat dataset. Metodfelet syftar på felet som uppstår i och med att man approximerar verkligheten. Generellt sett så har flexiblare metoder högre varians men lägre metodfel. När man minskar en metods flexibilitet så minskar initialt variansen snabbare än metodfelet ökar, men efter en viss punkt gäller det motsatta. Var denna punkt är varierar beroende på hur datamängden ser ut. För att få en så bra metod som möjligt så vill man ha en bra balans mellan varians och metodfel.[2] Denna avvägning kallas på engelska för bias-variance tradeoff. Avvägningens effekter torde gestalta sig främst i skillnaden mellan ordinary least squares (se avsnitt 2.4) och ridge regression (se avsnitt 2.5). Med ridge regression kan flexibiliteten och därmed variansen reguleras, vilket ger bättre prediktorer.
2.2 Moving Average Crossing (MACROSS)
Moving average crossing eller MACROSS är en metod för att analysera trender med ut- gångspunkt att trender kan approximeras med två medelvärden som jämförs med varandra.
De två medelvärderna som används är ett snabbt och ett långsamt medelvärde. Det snabba medelvärdet använder data från en närliggande tidsperiod vilket medför att medelvärdet snabbt anpassar sig till förändringar i marknaden. Det långsamma är som namnet antyder ett långsammare medelvärde över en längre tidsperiod, detta syftar till att följa de generella trenderna i marknaden. När det snabba medelvärdet är större än det långsamma är enligt MACROSS analysen trenden positiv varpå en lång position tas. När dessa sedan korsar varandra och det snabba medelvärdet är lägre än det långsamma så är det enligt modellen en negativ trend i priset och ett byte till kort position sker. En position hålls tills de olika medelvärdena korsar varandra varpå ett byte till den andra positionen sker.[3]
Antalet dagar som medelvärdena består är en av parametrarna som kan ändras i MACROSS.
Dagarna kan väljas valfritt så länge det finns tillräckligt med data samt att det långsamma medelvärdet definitionsmässigt måste bestå av fler dagar än det snabba medelvärdet. An- nars kommer de helt enkelt att byta plats med varandra och det snabba blir långsamt och vice versa.
En annan parameter som kan ändras är hur stor vikt som ska läggas på de olika dagarna
som ingår i medelvärdena. Ett enkelt medelvärde lägger lika stor vikt på alla dagar. Istället
för detta går det att använda andra typer av vikter som linjära och exponentiella. Dessa
kommer att lägga störst vikt på dagar som ligger nära i tiden och mindre på de avlägs-
na dagarna. Namnet anger hur snabbt vikten minskar med åldern, ett linjärt medelvärde
avtar linjärt och exponentiellt avtar exponentiellt. Ett medelvärde, speciellt ett långsamt,
kan bestå av data från flera hundra dagar och under denna tidsperiod kan marknaden ha
ändrats markant. Det är därför inte svårt att tänka sig att de senare dagarna kommer har
en större påverkan på hur priset i den närliggande framtiden kommer att arta sig. Metoder som tar större hänsyn till närliggande dagar skulle därför kunna tänkas vara mer effektiva på att prediktera framtiden. Det är detta som linjär och exponentiell viktning gör.
Antal tillbakablickande dagar
0 20 40 60 80 100 120
Vikt på föregående priser
0%
0.5%
1%
1.5%
2%
2.5%
3%
3.5%
4%
4.5%
5% Viktningens koefficienter för enkel MACROSS
(a) Viktfördelning för enkelt medelvärde
Antal tillbakablickande dagar
0 10 20 30 40 50 60 70 80 90 100
Vikt på föregående priser
0%
1%
2%
3%
4%
5%
6%
7%
8%
9%
10% Viktningens koefficienter för linjär MACROSS
(b) Viktfördelning för linjärt medelvärde
Antal tillbakablickande dagar
0 10 20 30 40 50 60 70 80 90 100
Vikt på föregående priser
0%
1%
2%
3%
4%
5%
6%
7% Viktningens koefficienter för exponentiell MACROSS
(c) Viktfördelning för exponentiellt medelvärde
Figur 1: Viktfördelningsgrafer för MACROSS med kort medelvärde på 20 dagar och långsamt på 100 dagar.
Ett viktigt samband som lätt utläses i figur 1 är hur tyngdpunkten för medelvärdet ändras
när en viktning läggs på. Tyngdpunkten är definierad som punkten då 50% av medelvärdets
vikt är på bägge sidor av punkten.[3] För det enkla medelvärdet i graf 1a betyder det
mittpunkten, i detta fall vid 10 och 50 dagar. När en vikt tillkommer som gör att nya dagar
blir viktigare än gamla så kommer tyngdpunkten att flyttas fram. I figuren så är antalet
dagar detsamma för alla grafer men i 1c, där viktningen är exponentiell, så är tyngdpunkt
på 8 respektive 36 dagar.
2.3 Riskjustering
Datamängden består av priser på 40 olika tillgångar. Priserna mellan tillgångarna är inte direkt jämförbara dels för att priserna inte är i samma skala, exempelvis motsvarar inte en enhet i SEK lika mycket som en enhet i JPY. Vidare så kan prisutvecklingen ge en felaktig bild av hur bra marknaden är att investera på. Om priset på en tillgång fluktuerar väldigt mycket och vid en tidpunkt landar på ett högt värde så ser det på pappret ut som att marknaden haft en stor positiv utveckling. För att ta med fluktuationer, även kallat volatiliteten, så riskjusteras stängningspriserna. Det görs genom normering av priserna med avseende på risken i de olika marknaderna, det som mäts blir avkastning per risk. Risken kan beräknas på olika sätt, bland annat med olika vikter precis som i fallet med medelvärderna.
2.4 Ordinary Least Squares
Ordinary Least Squares (OLS) är en regressionsmetod som tar avståndet från varje da- tapunkt till en linje, kvadrerar dessa och minimerar summan av kvadraterna.[4] Låt:
dp
t,irepresentera värdet på den ackumulerade prisdifferensen mellan dag t och t-1 för tillgången i.
dp ˆ
i,trepresentera det predikterade värdet av dp
t,ifrån regressionslinjen.ˆsymbolen betyder att variabeln har skattats.
ˆ
u
irepresentera skillnaden på det faktiska värdet och det predikterade värdet - i.e (dp
t,i- dp ˆ
t,i)
X ˆ
t,irepresentera prediktorerna som antas avgöra värdet på dp
t,ivid ett tillfälle. ˆ X
t,iär i vårat fall en vektor med föregående dagars ackumulerade prisdifferenser. Om vi antar att värdet en dag beror på föregående n dagars värden skulle ˆ X
t,iha storleken 1×n.
Då antas följande samband gälla mellan dp
t,ioch X
t,i.
dp
t,i= X
t,iβ + ǫ
t,i(2.1)
Där β är en n×1 vektor med s.k. regressionskoefficienter och ǫ
tär en term som fångar slumpmässiga fel i modellen. Dessa fel kan uppkomma på bland annat dessa sätt:
1. Den verkliga modellen är inte linjär och vår uppskattade modell, som är linjär, kommer därför aldrig att överensstämma med den verkliga. Även om linjära modeller alltid kommer att inbegripa ett fel så kan de ge en bra prediktion av verkligheten.
2. Vissa prediktorer som påverkar dp
t,ikan saknas i modellen. Exempelvis kanske priset för en dag t beror på priset de senaste 600 dagarna medan modellen endast tagit med data från de senaste 300 dagarna.
3. Det finns prediktorer som inte kan tas med i modellen. Politisk instabilitet eller en
miljökatastrof kan påverka priset på ett sådant sätt som inte kan fångas av en mate-
matisk modell.
Den erhållna modellen blir alltså.
dp ˆ
t,i= X
t,iβ ˆ
i(2.2)
Summan som ämnas minimeras, residual sum squares, är:
RSS =
T
X
t=s
ˆ u
2t,i=
T
X
t=s
(dp
t,i− dˆ p
t,i)
2=
T
X
t=s
(dp
t,i− X
t,iβ ˆ
i)
2(2.3)
där s är starttiden och T är sluttiden.
2.5 Ridge regression
I ridge regression är parametrarna ˆ β
iR
valda så att de minimerar
T
X
t=s
(dp
t,i− X
tβ ˆ
i)
2+ λ ˆ β
i· ˆ β
i(2.4)
där s är starttiden och T är sluttiden. Den andra termen, λ ˆ β
i· ˆ β
i, kallas för shrinkage penalty och straffar alltför stora ˆ β. Metoden kommer därför sträva efter att välja små ˆ β. λ > 0 är en s.k. tuning- eller ridge parameter och reglerar hur stor påverkan shrinkage penalty har.
Observera att om λ = 0 får vi samma ˆ β som för OLS.[2]
2.6 Sharpekvot
En tillgång som ger en högre avkastning är inte alltid det bästa valet. För att få en rättvis bild måste risken tas i beaktande. Sharpekvoten är ett mått som används för att mäta den riskjusterade avkastningen.[5] Anta först att vi varje dag för en marknad i har en riskjusterad avkastning r
t,isom beräknas enligt:
r
t,i= γ
std(∆P
i(t − 29 : t)) ∆P
i(t + 1) (2.5) Där γ är positionen som tas, ∆P
i(a : b) är en vektor med prisskillnaderna från dag a till b för tillgång i. std(∆P
i(t − 29 : t)) är standardavvikelsen av prisdifferenserna de senaste 30 dagarna. Sharpekvoten beräknas då enligt:
S
k= mean(~r
i)
std(~r
i) (2.6)
Där ~r
i= [r
s,ir
s+1,i... r
T,i] är avkastningarna från dag s till T för tillgång i. Sharpekvoten
har i regel egenskapen att om fler tillgångar används så blir sharpekvoten högre. Traditio-
nellt sett används en riskfri ränta i beräkningen av sharpekvoten för att jämföra en portfölj
med en riskfri investering. För ändamålet i denna studie behöver inte en riskfri investering
tas i beaktande.
3 Metod 3.1 Data
Datan har bestått av stängningspriset på 40 olika marknader och är indelad i fyra olika till- gångstyper, aktier (equities), räntepapper (fixed income), råvaror (commodities) och valutor (foreign exchange). Datan sträcker sig från 2009-2016. Tillgångarna i de fyra kategorierna har större korrelation till varandra (se Appendix B) och därför har resultatet presenterats som gemensamt för de fyra olika tillgångarna. Genom att dela upp data i dessa tillgångsty- per så blir resultatet mer överskådligt och mer lättanalyserat. I tabell 1 är alla de marknader som projektet grundar sig på listade. Förkortningarna är de vedertagna engelska namnen som används i branschen.
Tabell 1: Marknaderna och deras tillgångstyp
Aktier Räntepapper Råvaror Valutor
1. cac 14. 10ynote 23. aluminium 36. aud 2. canada60 15. 5ynote 24. brent 37. cad 3. dax 16. aus10y 25. copper 38. eur
4. dow 17. bobl 26. corn 39. gbp
5. estoxx 18. bund 27. crude 40. jpy 6. ftse 19. cgb10y 28. gold
7. hangseng 20. gilt 29. natgas 8. nasdaq 21. jgb 30. rbob 9. nikkei 22. tbond 31. silver
10. omx 32. soybeans
11. sp500 33. sugar
12. spi 34. wheat
13. taiwan 35. zinc
3.2 Uppskattning av standardavvikelsen Standardavvikelsen beräknas enligt [6]:
std(X) = p
E[X
2] − (E[X])
2(3.1)
där operatorn E betecknar väntevärdet och X de ackumulerade prisdifferanserna för en tillgång. I denna studie görs förenklingen att
std(X) ≈ p
E[X
2] (3.2)
Detta kan göras när E[X
2] ≫ E[X]
2vilket är fallet här, ty kvoten
E[XE[X]22]⊂ (332, 4768704)
(se Appendix C).
3.3 Parametrar som ej ändras
Antalet dagar som risken har beräknats på har varit konstant i alla metoder och sattes till 30 dagar. Vid val av antalet dagar vill man ha tillräckligt många dagar för att få ett statistiskt pålitligt värde men tillräckligt få för att risken ska kunna förändras över tiden.
Om antalet dagar skulle tillåtas att ändras så skulle detta påverka hur mycket risknormerad vinst de olika dagarna skulle bidra med men det skulle inte ändra positionerna som de olika metoderna tar.
3.4 Enbart lång position
Tillväxten över en lång tidsperiod för alla tillgångar brukar i regel vara positiv. Detta kom- mer såklart att påverka futurehandling. Över ett långt tidsspann borde det enligt denna teori vara fördelaktigt att ha en lång position snarare än en kort position, vilket ofta stäm- mer. Om det inte finns underlag för något annat beslut så är en lång position en bättre gissning än en kort i det generella fallet. Detta kan antas vara den simplaste av alla speku- lationsmetoder och kommer i denna rapport att användas som en standard. Om en metod inte lyckas vara bättre än enbart långa positioner på samma period så kan den inte ses som en lyckad metod även om den ger positiv avkastning.
3.5 Val av parametrar i MACROSS
Alla de trendanalysmetoder som har använts har en mängd olika parametrar som kan änd- ras. De olika kombinationerna av variabeländringar är så pass många att simulering av alla dessa skulle ta lång tid. Tillvägagångssättet har därför varit att välja ett fåtal parametrar som ändras och hålla resten konstanta. För MACROSS metoderna har två parametrar för- ändrats, kombinationen av långsamma/snabba medelvärden och typ av viktning. Genom att stega det långa medelvärdet från 100 till 300 dagar och det korta från 15 till 40 så har en matris skapats. Detta har gjorts tre gånger, en för varje typ av vikt på medelvärdena. De tre vikterna som används är enkelt, linjärt avtagande och exponentiellt avtagande medelvärde.
Det långsamma och snabba medelvärdet har alltid varit med samma typ av vikt vid en viss
simulation.
3.6 MACROSS med positioner baserat på tidigare intervall
En av metoderna så sekvenserar data i 300 dagars intervall. Längden på det snabba och långsamma medelvärdet på intervallet [i,i+300] är de längder på medelvärden som gav högst avkastning på föregående intervall, det vill säga [i-301,i-1]. Algoritmen för en tillgång ser ut som följande i pseudokod
for long = 100:5:300
for short = 15:2:30
Calculate the risk adjusted returns end
end
for i = 1:5
Sequence the returns in 5 pieces
Calculate the sharpe ratio of piece no. i and save the long/short ...
values
Save the returns of index i+1 with the previous short/long values end
I en modifierad variant görs denna sekvensering var 30:e dag så att man var 30:e dag väljer den kombination av långsamma och snabba medelvärden som gav högst sharpekvot de föregående 300 dagarna.
3.7 Val av data för OLS och ridge regression
För regressionsmetoderna bestod träningsdata av de ackumulerade prisdifferenserna från de första 1500 dagarna. De 300 sista dagarna utgjorde testdata.
3.8 Omskalning vid ridge regression
Om man vid ridge regression har ett |X
i| som är mindre än andra ||X|| så kommer följ- daktligen β
iatt få ett större värde som kompensation. Detta leder i sin tur till ett större straff av λ P
Tt=s
β ˆ
t2. Av denna anledning är det fördelaktigt att skala om alla X så att de får variansen 1, då straffas inte vissa kovariater mer än andra.
3.9 Val av ridge parameter λ
För ridge regression så gäller det att när λ blir mindre går β
ridgemot β
OLS. För att täcka ett brett spektrum av värden valdes 100 logaritmiskt placerade punkter från 10
−2till 10
2. Hur β
ridgekoefficienterna minskar ses i appendix D.
3.10 Avgränsningar
Datan som har studerats är stängningspriser från dagar mellan 2008-2016. Korrelationen
mellan marknaderna har inte tagits i beaktande vid analysen av vilken tillgångstyp som är
bäst. I verkligheten är det inte gratis att byta position men denna studie har bortsett från
den begränsningen.
4 Resultat
De bästa sharpekvoterna som erhölls från alla metoder är listade i tabell 2.
Tabell 2: Sharpekvoter för olika metoder och tillgångar.
Aktier Räntepapper Råvaror Valutor
Enbart lång position 0,66 1,10 -0,16 -0,37
MACROSS (enkelviktat) 0,48 0,97 0,46 0,51
MACROSS (linjärviktat) 0,6 1,02 0,4 0,64
MACROSS (exponentialviktat) 0,29 1,2 0,62 0,59
M ACROSS
300-0,16 0,76 -0,34 -0,11
M ACROSS
300,15 0,5 -0,39 0,3
OLS 0,99 0,37 2,12 0,6
Ridge regression 1,41 2,93 3,77 -0,09
4.1 Tillgångstypernas prisutveckling under perioden
Marknader inom samma tillgångstyp skulle enligt hypotes ha likartade trender. För att se
om detta stämmer plottas de olika tillgångstypernas prisutveckling under hela perioden som
undersöks. I syfte att göra det överskådligt så har de marknader med högst respektive lägst
värde valts ut tillsammans med medelvärdet för hela tillgångstypen. Eftersom flera olika
marknader ska jämföras så måste en riskjusterad prisändring användas i figurerna.
år
2009 2010 2011 2012 2013 2014 2015 2016 2017
risknormat värde
0 50 100 150 200 250 300
350 Risknormerat stängningspris på aktier
dow estoxx medelvärde
Figur 2: Prisförändring på aktier under perioden.
Som kan ses i figur 2 så stämmer många av trenderna i både aktiebörsen med lägst vär- de, estoxx, och den med högst, dow, överens med varandra. Bägge två följer medelvärdets förändring över tiden men med olika skala. Detta är ett gott tecken på att en trendana- lyserande metod som predikterar hur futurehandling bör ske ska kunna konstrueras för tillgångstypen.
år
2009 2010 2011 2012 2013 2014 2015 2016 2017
risknormat värde
0 500 1000 1500 2000
2500 Risknormerat stängningspris på räntepapper jgb tbond medelvärde
Figur 3: Prisförändring på räntepapper under perioden.
I figur 3 är det tillgångstypen räntepapper som plottas. Jgp har mycket större belopp
än tbond vilket kan skapa problem. Det mycket större beloppet kan ha en såpass stor
inverkan på medelvärdet att detta börjar efterlikna bara jgp och inte alla marknader inom
räntepapper. Om man jämför värdet på medelvärdet i början mot slutet så har detta ökat
från 160 till 500, en tredubbling. Räntepapper är en tillgångstyp med mycket tillväxt.
år
2009 2010 2011 2012 2013 2014 2015 2016 2017
risknormat värde
0 50 100 150 200
250 Risknormerat stängningspris på råvaror gold rbob medelvärde
Figur 4: Prisförändring på råvaror under perioden.
Guld utmärker sig med många höga toppar i början av dataserien i figur 4. Dessa samman- faller relativt väl med mycket lägre toppar i medelvärde samt rbob. Från och med mitten av 2013 och ett år framåt så verkar trenderna vara i princip samma. Därefter så avviker de från varandra, det betyder att metodanpassning skulle kunna försvåras mot slutet av dataserien. Att bara plotta den högst och lägst värdera marknaden kan i detta fall försvåra då rbob, en bensin marknad, har krashat på senare år. Detta är något som inte har drabbat alla råvaror.
år
2009 2010 2011 2012 2013 2014 2015 2016 2017
risknormat värde
0 100 200 300 400 500
600 Risknormerat stängningspris på valutor gbp aud medelvärde
Figur 5: Prisförändring på valutor under perioden.
I figur 5 ses att några trender finns även för valutor. Gbp och aus liknar varandra under
större delen av serien. Eftersom de även följer medelvärdet som innehåller många fler valutor
så borde en metod som kan appliceras på hela tillgångstypen vara effektiv.
4.2 Enbart lång position
Generellt för figur 2 till 5 är att medelvärdet för prisserierna inom alla tillgångstyper slutar med ett högre värde än de börjar med. Detta betyder att en lång position i snitt är bättre än en kort, precis som teorin pekade på. Att enbart hålla en lång position kommer ge positiv avkastning i slutändan. Sharpekvoten för detta kommer bli vår standard som andra metoder måste slå.
S
k= {0, 66, 1, 10, −0, 16, −0, 37} (4.1) Att enbart hålla en lång position är enligt sharpekvoten som ges vid de olika tillgångstyperna mest effektiv för räntepapper och minst för valutor. Valutor är som tidigare nämnt i teorin inte lika självklara att de växer över tid och därför är det inte konstigt att sharpekvoten blir sämre för dessa. Att sharpekvoten är negativ även fast det är en positiv avkastning kan förklaras med att risken då tillgångarna ökar är större än då de minskar.
4.3 MACROSS med olika vikt
De tre olika viktningstyperna som har använts är enkel, linjär och exponentiell. Den första är ett vanligt medelvärde där alla dagar har lika stor inverkan på resultatet. De andra är bägge medelvärden där den senaste dagen har störst betydelse och där betydelsen minskar med tiden, antingen linjärt eller exponentiellt.
När resultaten ska visas i figurer uppstår ett dilemma, antingen så kan antalet dagar som ingår i varje medelvärde plottas. Detta är bra för att få en intuitiv känsla av hur medel- värdet ser ut. Nackdelen är däremot att jämförelser mellan de olika graferna eventuellt blir svårare. Det andra alternativet är att plotta med samma tyngdpunkter, detta får
motsatta styrkor och nackdelar. Vilken vikt ett medelvärde använder sig av har, som nämnt i teoridelen, en stor betydelse för vart dess tyngdpunkt ligger. Även om antalet dagar som medelvärdena består av är detsamma så kommer tyngdpunkterna ligga på olika ställen.
Utgång i tyngdpunkter kan ses som ett ärligare sätt att uttala sig om vilken viktnings-
metod som är bäst på att prediktera en viss tillgång. Men nackdelen är att det blir svåravläst
och inte får samma starka verklighetsanknytning som medelvärdeslängd. Här är figurerna
plottade efter det första av alternativen.
40 35
Kort medelvärde [antal dagar]
30 Sharpekvot på aktier med enkel viktning
25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0.6 0.4 0.2 0
-0.2 300
Sharpekvot
(a) Enkelt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
30 Sharpekvot på aktier med linjär viktning
25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 -0.2
0 0.2 0.4 0.6
300
Sharpekvot
(b) Linjärt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
Sharpekvot på aktier md exponentiell viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0.4
0 0.2 0.6
-0.2 300
Sharpekvot
(c) Exponentiellt viktat medelvärde
Figur 6: Sharpekvotens beroende av medelvärdesparametrarna i MACROSS för aktiehan- del.
I figur 6 så syns det hur stor inverkan val av medelvärden har för MACROSS när det
kommer till aktiedelen av futurehandeln. Det första som är värt att notera är att det korta
medelvärdet i de flesta fall inte påverkar lika mycket som det långsamma. Det ser ut som
åsar utmed det korta medelvärdet i graferna. Undantaget är att i figur 6a samt 6b när
det långsamma medelvärdet är litet så ger en ändring av det snabba medelvärdet en tydlig
inverkan på sharpekvoten. En annan observation är att sharpekvoten för den exponentiella
viktningen, figur 6c, är väldigt konstant och inte påverkas mycket av ändringar i medel-
värdesparametrarna. Både den simpla och den linjära metoden verkar fungera bättre under
förutsättningar att de är rätt anpassade. Bäst resultat på dessa fås då då det långsamma
medelvärdet är litet och det korta är stort. Om man tar ut de högsta sharpekvoterna som
går att få på aktiehandeln med viktade MACROSS så fås 0,48, 0,6 och 0,29 för de respektive
vikterna enkel, linjär och exponentiell.
40 35
Kort medelvärde [antal dagar]
Sharpekvot på räntepapper med enkel viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0.2 1.2
0.8 0.6 0.4 1
300
Sharpekvot
(a) Enkelt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
Sharpekvot på räntepapper med linjär viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0.4 0.6 0.8 1.2 1
0.2 300
Sharpekvot
(b) Linjärt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
Sharpekvot på räntepapper med exponentiell viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 1.2
0.6 1 0.8
0.4
0.2 300
Sharpekvot
(c) Exponentiellt viktat medelvärde
Figur 7: Sharpekvotens beroende av medelvärdesparametrarna i MACROSS för räntepap- per.
För att en MACROSS-funktion som ska handla med räntepapper så är det en tydlig trend att en ökning av det långsamma medelvärdet ger en högre avkastning. Detta är något som syns i samtliga grafer. Det korta medelvärdet spelar inte lika stor roll som det långa då graferna i figur 7 till stor del är konstanta när detta ändras. Undantaget är den linjära viktningen i figur 7b som i större utsträckning påverkas av snabba medelvärdet. I detta fall så är MACROSS med exponentiell viktning mest effektiv då maximal sharpekvot blir 1,20.
För linjär viktning och enkelt medelvärde blir som bäst sharpekvoten 1,02 och 0,97.
40 35
Kort medelvärde [antal dagar]
Sharpekvot på råvaror med enkel viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 -0.4 -0.2 0 0.2 0.4 0.6
300
Sharpekvot
(a) Enkelt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
Sharpekvot på råvaror med linjär viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0.4
-0.4 0.2 0 -0.2 0.6
300
Sharpekvot
(b) Linjärt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
Sharpekvot på råvaror med exponentiell viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0 0.2 0.4 0.6
-0.4 -0.2
300
Sharpekvot
(c) Exponentiellt viktat medelvärde
Figur 8: Sharpekvotens beroende av medelvärdesparametrarna i MACROSS för råvaror.
I figur 8 så ses hur sharpekvoten för råvaruhandel påverkas av det långa och korta medel-
värdet i MACROSS. Mest effektiv är den exponentiella viktningen i figur 8c då den både
ger högst sharpekvot, 0,62, och även aldrig någon negativ sharpekvot. Respektive högsta
sharpekvot för enkelt och linjärt är 0,46 och 0,40. Generellt verkar det som att metoden
fungerar bäst då bägge medelvärdena är stora. Det långsamma medelvärdet har däremot
en större betydelse än det korta. Små värden på det långsamma medelvärdet ger negativ
sharpekvot i både figur 8a och 8b.
40 35
Kort medelvärde [antal dagar]
Sharpekvot på valutor med enkel viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 -0.2
0 0.2 0.4 0.6
300
Sharpekvot
(a) Enkelt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
Sharpekvot på valutor med linjär viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0 -0.2 0.2 0.4 0.6
300
Sharpekvot
(b) Linjärt viktat medelvärde
40 35
Kort medelvärde [antal dagar]
Sharpekvot på valutor med exponentiell viktning
30 25 20 15 Långsamt medelvärde [antal dagar]
100 150 200 250 0.2
-0.2 0 0.4 0.6
300
Sharpekvot
(c) Exponentiellt viktat medelvärde
Figur 9: Sharpekvotens beroende av medelvärdesparametrarna i MACROSS för valuta- handel.
Figur 9 visar hur de olika viktade MACROSS-metoderna påverkas av medelvärdesändringar
när de ska handla i valutor. Till skillnad från de tidigare figurerna så finns det ingen tydlig
trend i hur medelvärderna ska vara för att optimera valutahandel. Både den exponentiella
viktningen i figur 9c samt den enkla viktningen i 9a är relativt konstanta. Sharpekvoterna
från det linjärt viktade medelvärdet är mycket varierande och innehåller både dem högsta
och lägsta sharpekvoterna. Oavsett vikt så är sharpekvoten i stor sett alltid positiv. Detta
gäller dock inte när det långsamma medelvärdet är runt 200 och viktningen är linjär, då
blir den negativ som ses i figur 9b. Denna dipp i sharpekvoten när det långa medelvärdet
är runt 200-250 återkommer i alla grafer men inte lika kraftig i de två andra. Antingen ska
medelvärdet vara kortare eller längre än detta. Den optimala sharpekvoten som MACROSS
gav vid handel av valutor var 0,51 för enkla medelvärdet, 0,64 för det linjära och 0,59 för
exponentiella.
4.4 MACROSS: Position baserat på tidigare intervall
För metoden där längden på medelvärdena hölls i 300 dagar erhölls dessa sharpekvoter för de fyra tillgångstyperna:
S
k= {−0, 16, 0, 76, −0, 34, −0, 11} (4.2) När medelvärdena hölls i 30 dagar innan en ny evaluering gjordes så erhölls följande blir då:
S
k= {0, 15, 0, 5, −0, 39, 0, 3} (4.3) 4.5 Ordinary Least Squares
0 50 100 150 200 250 300
Dag 1000
1500 2000 2500 3000 3500 4000 4500
Värdet på tillgång
De faktiska och simulerade ackumulerade prisförändringarna för koppar Den ackumulerade summan av prisförändringar dag t Det predikterade av den ackumulerade summan om 21 dagar
Figur 10: Kurvorna visar de ackumulerade prisförändringarna för koppar. Den röda blå representerar det predikterade värdet och den röda det faktiska.
I figur 10 visas det faktiska värdet och det predikterade värdet av tillgången koppar som hade den högsta sharpekvoten på 1,95. En lång position tas om prediktionen visar att värdet om 21 dagar är högre än värdet idag, det vill säga så länge den röda kurvan är ovanför den blåa. De erhållna sharpekvoterna för de olika tillgångstyperna blir:
S
k= {0, 99, 0, 37, 2, 12, −0, 60} (4.4)
0 50 100 150 200 250 300 Dag
-60 -50 -40 -30 -20 -10 0 10
Värdet på tillgång
De faktiska och simulerade ackumulerade prisförändringarna för råolja Den ackumulerade summan av prisförändringar dag t Det predikterade av den ackumulerade summan om 21 dagar
Figur 11: Kurvorna visar de ackumulerade prisförändringarna för råolja. Den röda kurvan representerar det predikterade värdet och den blå det faktiska.
I figur 11 visas det faktiska och predikterade värdet av tillgången råolja, som hade den lägst erhållna sharpekvoten på -2,05.
4.6 Ridge regression
Med ridge regression erhölls följande sharpekvoter:
S
k= {1, 41, 2, 93, 3, 77, −0, 09} (4.5)
I figur 11 visas det faktiska och predikterade värdet av tillgången olja. Olja hade den
lägst erhållna sharpekvoten på -2,05. I figur 12 så visas den faktiska och den predikterade
ackumulerade summan av prisdifferanserna för samma dag. Tillgången i figur 12, 5ynote,
är den tillgång som hade högst sharpekvot, S
k= 2, 95. Figur 13 visar den tillgång, råolja,
som hade lägst sharpekvot, S
k= −2, 26. Här tar man hela tiden en lång position trots att
priset har en tydlig negativ trend.
0 50 100 150 200 250 300 Dag
16.5 17 17.5 18 18.5 19 19.5 20 20.5 21 21.5
Den ackumulerade summan av prisförändirngarna
De faktiska och simulerade ackumulerade prisförändringarna för "5ynote"
Den ackumulerade summan av prisförändringar dag t Det predikterade av den ackumulerade summan om 21 dagar
Figur 12: Den blå kurvan visar värdet av de ackumulerade prisförändringarna för "5ynote".
Den röda kurvan visar det predikterade värdet på samma dag. λ = 14,17
0 50 100 150 200 250 300
Dag -60
-50 -40 -30 -20 -10 0 10
Den ackumulerade summan av prisförändirngarna
De faktiska och simulerade ackumulerade prisförändringarna för råolja Den ackumulerade summan av prisförändringar dag t Det predikterade av den ackumulerade summan om 21 dagar
Figur 13: Den blå kurvan visar värdet av de ackumulerade prisförändringarna för råolja.
Den röda kurvan visar det predikterade värdet på samma dag. λ = 100
.
5 Diskussion
5.1 Anpassning för aktier
Den bästa metoden för att effektivt följa trenderna hos aktier är ridge regression. Denna metod erhöll en sharpekvot på 1,41, detta är att jämföra med den enbart långa positionens resultat på 0,66 eller den näst bästa metoden, Ordinary Least Square, vars sharpekvot är 0,99. Regressionsmetoderna är mer effektiva för att beskriva prisändringarna än MACROSS i denna tillgångstyp. Anledningen till detta kan bero på det som ses i figur 2, nämligen att det är tydligt att olika aktier följer samma trender. Att tillgångstypen har liknande trenderna är endast positivt om metoderna på ett effektivt sätt kan följa dessa. För metoder som inte lyckas följa trenderna kommer det istället att få en negativ inverkan. Det senare kan vara fallet för MACROSS-metoderna. Möjligtvis är det så att MACROSS-baserade metoder inte klarar de många fluktuationerna som sker i aktiemarknaden. Något som tyder på detta är att de ingen MACROSS-metod lyckades uppnå lika hög sharpekvot som endast lång position. Om så är fallet så skulle det kunna bero på att antalet dagar inte är helt optimerat. När antalet dagar som ingår i det snabba medelvärdet närmar sig antalet dagar i det långsamma medelvärdet så blir MACROSS i två av tre fall snabbt effektivare. Om denna skillnad skulle tillåtas vara ännu mindre så är det möjligt att MACROSS skulle vara bättre optimerad.
5.2 Anpassning för räntepapper
Räntepapper skiljer sig från de övriga tillgångstyperna då den har en stark tillväxt under hela tidsperioden. Ett bevis på detta är att sharpekvoten med enbart lång position blir hela 1,1 på räntepapper. Detta är bara marginellt lägre än den bästa anpassningen av viktade MACROSS-metoder och bättre än de två andra. Den erhållna sharpekvoten är också högre än den från MACROSS-metoderna som använde ett tidigare intervall. Den enda metod som är betydligt bättre än enbart lång position är ridge regressionen vars sharpekvot är över 2.
Det går att konstruera metoder som effektivt följer räntepappers förändring och utnyttjar detta för att tjäna pengar. Ett enkelt alternativ som fortfarande ger bra avkastning är att köpa värdepapper då de antagligen kommer öka i värde.
När tillgångstypen följer en tydlig trend betyder det att risken inom tillgångstypen blir liten, ett fall av detta kan ses på y-axeln i figur 3. Y-axeln är markant högre än den för dem andra prisfigurerna eftersom att risken för denna figur är låg. Varje dag priset stadigt ökar så minskar risken, detta medför en ännu större ökning i det risknormerade priset.
5.3 Anpassning för råvaror
Tillgångstypen råvaror är den tillgångstyp där vi har minst korrelation mellan marknaderna.
Som framgår ur figur 4 är det svårt att urskilja trender mellan råvarorna. Den metod som ger
högst sharpekvot för råvarorna är ridge regression med 3,77. En anmärkningsvärd detalj
är att prediktionen av priset för olja tenderar att överestimeras. Anledningen till varför
regressionsmetoderna är så dåliga på att prediktera värdet av denna är för att de har en
bias från tidigare intervall.
0 200 400 600 800 1000 1200 1400 1600 1800 2000 Dag
20 40 60 80 100 120 140
Pris på tillgång
Priset på råolja sedan 30 dec 2008
Figur 14: Kurvan visar priset på råolja från 2008.
I figur 14 så ser vi att priset från dag 1500 till 1821 inte alls följer trenden från de första 1500 dagarna. Regressionskoefficienterna ˆ β som erhålles med hjälp av metoderna är tränade på det förstnämnda intervallet och kommer därför fungera avsevärt sämre på det sista intervallet vilket framgår av figur 11 och 13.
5.4 Anpassning för valutor
Valutor är den tillgångstyp som visade sig vara svårast att prediktera. Anledningen är främst att de inte har samma tydliga trend som de andra tillgångstyperna. Detta eftersom att antagandet om att alla marknader är oberoende inte kan stämma i detta fall. Priset på en valuta mäts i proportion till andra valutor och de är därför automatiskt beroende av varandra. Det gör att valutor inte har samma växande trend över tid, om alla valutor växer så står kursen mellan dem stilla. En följd av detta blir att de i regel är mindre linjära och därför blir prediktionen med linjära modeller sämre. Detta kan vara en av anledningarna till att det endast var MACROSS-metoderna som hade en positiv sharpekvot på valutor med ett största värde på 0,64 för det linjärt viktade MACROSS. Med det sagt är det inte säkert att den linjära viktningen är bäst då den även gav negativa värden för vissa parametrar.
För en sharpekvot mer oberoende av valet av dagar så kan därför exponentiella viktningen
vara att föredra. Detta då den alltid gav positiva sharpekvoter, den högsta var 0,59. Detta
är bara lite lägre än den bäst anpassade linjära viktningen.
5.5 Andra aspekter att undersöka
En djupare analys skulle kunna undersöka valet av antal dagar som används för att beräkna risken. Det är mycket möjligt att 30 dagar är ett för kort intervall. Om risken skulle grunda sig på ett större intervall skulle kanske figur 3 inte få skalningsproblemen som uppstår när risken blir för låg.
5.6 Projektet som bas för investering
För att maximera den risknormerade avkastningen när det investeras i futures så bör an- tingen råvaror eller räntepapper vara förstahandsvalet. Inom den första tillgången så bör prediktionen ske med ridge regression då detta gav upphov till den högsta sharpekvoten i hela projektet. En varningsflagga bör dock höjas då denna sharpekvot är såpass hög att det kan vara en slump eller bero på en överanpassning för just denna dataserie. Ett säkrare kort är då investering i räntepapper, här har alla metoder varit effektiva och faktum är att även enbart lång position fungerar, bäst är däremot fortfarande ridge.
6 Slutsats
I projektet så har metoder som använder regression varit de bästa för att prediktera mark-
naden i inom alla tillgångstyper förutom valutor. Då är det istället MACROSS som gett
högst sharpekvot, främst med linjär viktning. För alla tillgångstyper fanns det metoder som
var bättre än den enbart långa positionen, detta var dock inte ett dålig sätt att investera
i räntepapper. För MACROSS metoderna så var det främst det långsamma medelvärdet
som hade störst inverkan på sharpekvoten vilket bland annat framgår ur figur 7 och 8. Den
generella trenden var att ett längre långsamt medelvärde gav en högre sharpekvot.
A Standard.m - Standardisering av priser
close all clear all
load('PriceData');
B = closingPrice;
z = ones(1, 40);
for k = 1:40 %Find index for when we have our first ...
value
if isnan(B(1,k)) n = 2;
while (isnan(B(n,k))) n = n+1;
end
z(1,k) = n;
B(1,k) = B(n,k); %Set the first value in the matrix to ...
that value end
end
I = find(isnan(B));
for n=1:max(size(I));
B(I(n)) = B(I(n)-1);
end
B correl.m
%Korrelationen mellan olika tillgangar dagarna 5383:9269 standard
l = max(z);
prices = B(l:end,:);
returns = tick2ret(prices);
korrelation = corrcoef(returns);
C kvoter.m - Beräkning av kvoter mellan E[X
2] och E[X]
2%Testar om E[X^2]>>E[X]^2 standard.m
P = B(5383:end,:);
dP = [zeros(1,size(P,2)); diff(P)];
E1 = mean(dP.^2);
E2 = mean(dP).^2;
kvot = E1./E2;
D β koefficienter för olika λ
0 10 20 30 40 50 60 70 80 90 100
Ridge Parameter -0.2
0 0.2 0.4 0.6 0.8 1 1.2
Standardized Coefficient
Ridge Trace
Figur 15: Kurvorna visar vilka värden på β som fås vid varje λ.
Referenser
[1] Eriksson, Hasse. Råd från roboar utmanar banker. DN. 2016-05-06, Hämtad 5 Juni 2016 från
http://www.dn.se/ekonomi/rad-fran-robotar-utmanar-banker/[2] James, Gareth, Witten, Daniela, Hastie, Trevor och Tibshirani, Robert An Introduction to Statistical Learning, 6.uppl., Springer Science+Business Media, New York, 2015
[3] Levine, Ari, och Pedersen, Heje, Which trend is your friend, Financial Analysts Journal 72, no. 3(2016).
[4] Brooks, Chris Introductory econometrics for finance, Cambridge University Press, Cambridge, 2002.
[5] Sharpe ratio, Hämtad 26 maj 2016 från
https://en.wikipedia.org/w/index.php?title=Sharpe_ratio&oldid=720845036
[6] Standardavvikelse, Hämtad 26 maj 2016 från
https://sv.wikipedia.org/w/index.php?title=Standardavvikelse&oldid=31637373