• No results found

Den huvudsakliga anledningen till att investerare börjar agera på aktiemarknaden är att skapa en positiv avkastning i sin aktieportfölj (Schreder, 1962) (Blaurock et al, 2018). HFT skapar både för- och nackdelar för investerare på aktiemarknaden vilket gör ämnet högst aktuellt att studera. Om man som investerare uppfattar att klimatet på aktiemarknaden är styrt av algoritmer som agerar på marknaden och att det möjligen missgynnar investerarna så kan det tänkas skapa en oro. Det kan resultera i att investerare avstår från en eventuell entré på aktiemarknaden då den kan uppfattas som abstrakt redan innan algoritmer adderas. (Hurd & Rohwedder, 2012) 1.3 Forskningsfråga

• Vilka samband finns det mellan användning av algoritmer för portföljsammansättning och högre avkastning på investeringar på Stockholmsbörsen?

12

1.4 Syfte

Syftet med studien är att undersöka huruvida en sammansatt portfölj baserad på en algoritm framtagen med K-betydelsemetoden genererar en högre avkastning jämfört med index OMX30 på Stockholmsbörsen under perioden 1 november 2017 till 2 november 2020.

1.5 Avgränsningar

Studien kommer att analysera effekten av användandet av algoritmer kopplat till OMX30 inom tidsintervallet 1 november 2017 till och med den 2 november 2020. Denna avgränsning görs då OMX Stockholm All-share (förkortas OMXS och är ett index som inkluderar samtliga noterade bolag på stockholmsbörsen) korrelerar väl med OMX30 men med en något förhöjd volatilitet på OMXS (nasdaqomxnordic,2020). Dessutom begränsas studien till OMX30 med hänsyn till den begränsade tid som finns för utförandet av denna studie. En ytterligare faktor till att använda OMX30 i studien är att insamling av datan blir enklare men även effektiv (Denscombe, 2014).

För att skapa en rättvis bild av den aktuella aktiemarknaden, som även passar in i dagens marknadsförhållanden, gjordes periodavgränsningen med syftet att få tillräckligt med aktuell data.

En sammanfattning av samtliga källor som använts i bakgrunden finns sammanfattade i tabell 1.

Tabell 1. Sammanställning av källor till bakgrundsinformation och relevans för studien

Författare År Land Urval Relation till uppsatsen

Schreder 1962 USA Dow-Jones

Period: 1949–1961

Syftet med aktieinvesteringar Finansinspektionen 2001 Sverige Svenska investerare Krav på aktiemarknaden Atack & Neals 2009 England Litteratur Grunden till notering på

aktiemarknaden Crezée & Swinkels 2010 Holland S&P 500,

period: 2000–2009

Diversifiering Kryzanowski 2010 Kanada TSX-börsen,

Period 1975–2003

Diversifiering Hurd,MD &

Rohwedder

2012 USA 31 observationer på den amerikanska aktiemarknaden

Kamal 2013 Turkiet Data från olika marknadsuppkomster Utvecklingen av aktiemarknaden Securities

Exchange act of 1934

2013 USA Knight Capital Group Period: 2012–2013

HFT:s negativa påverkan

Denscombe 2014 England Litteratur Forskningsurval

Brogaard et al. 2015 Sverige OMX30,

Period: 2012 – 2014

Investeringshorisont

Kaplanski 2016 Sharpe-kvot Tolkning av sharpe-kvot

Vindevåg 2016 Sverige Stockholmsbörsen Aktiemarknadens grundande

Bessler et al. 2017 England, Wales

Black-Litterman modellen Period: 1993–2011

Diversifiering Botshekan & Lucas 2017 England S&P 500,

Period: 1963–2012

Investeringshorisont

13

Blaurock et al. 2018 USA 9000 observationer

från Thomson Reuters Datastream

Syftet med entré på aktiemarknaden Brogaard, et al. 2018 Sverige Data från NASDAQ,

Period: 2008–2009

HFT:s påverkan

Brownlee 2018 Australien Litteratur Tillvägagångsätt inom handel

Malagon, et al. 2018 Colombia Data från CRSP (Chicago Research Stock Prices), NYSE, AMEX &

NASDAQ Period: 1963–2015

Likviditet & volatilitet

Sveriges rikes lag 2018 Sverige Aktiebolagslag (2005:551) Lagar och regler kring aktier Zhu, X. et al. 2018 Kina Feature Selection Using Similarity

(FSUS)

Krav och påverkan på marknaden

Hagströmer 2019 Sverige Intervju HFT:s grundande

Boxir 2020 Sverige OMXS Ägarfördelningen på OMXS

Corporate Finance 2020 USA Sharpe-kvot Tolkning av sharpe-kvot

Nasdaq 2020 Sverige OMXS Jämförelseindex

Nasdaqomxnordic 2020 Sverige OMXS & OMX30 Korrelation mellan OMXS &

OMX30

OMXS30 2020 Sverige OMX30 Jämförelseindex

Liu 2020 Litauen Shanghai & Shenzhen börsen, Period: 1997–2017

Risk och avkastning Verbraeken 2020 USA Oövervakadmaskinlärning,

Period: 2020

Maskinlärning

14

2 Teori

Detta kapitel presenterar teorier samt tidigare forskning vilket har legat till grund för studiens metoder, data och analyser vilket slutligen avslutas med hypotesen vilket är kopplat till studien.

2.1 Den effektiva marknadshypotesen

En hypotes som bör noteras vid analys av aktiemarknaden är den effektiva marknadshypotesen (EMH) vilket grundar sig i att det inte bör finnas någon vinst genom analys på aktiemarknadens data. Enligt EMH ska priset på en aktie alltid samt fullständigt återspegla all tillgänglig information om samtliga företag som inkluderas på aktiemarknaden. (Fama, 1970).

Däremot motbevisas hypotesen genom att avancerad datainsamling samt analyser av marknaden kan generera en högre avkastning. Man menar på att investerares reaktioner på marknaden men också ofullständig information skapar anomalier, men i allmänhet är marknaden fortfarande effektiv. (Lekovic,2018). Warren Buffet som är en av de mest kända investeraren i världen, hävdar att många investerare uppnår en högre avkastning på aktiemarknaden än vad indexfonder gör. Vilket också skulle tyda på att marknaden är ineffektiv till viss mån. (Business Insider, 2010).

Tidigare forskning antyder därför att det finns två uppenbara problem med den effektiva marknadshypotesen. Den första typen av problematik ligger i teoretiska paradoxer, det vill säga inkonsekvenser i teorin. En av de viktigaste paradoxerna är att om investerare på aktiemarknaden ansåg att marknaden var effektiv skulle marknaden upphöra. Detta eftersom eventuella avslöjanden av övervärderade/undervärderade aktier ej skulle existera. (Grossman

& Stiglitz, 1980) (Fama, 1970).

Den andra problematiken är om deltagarna på aktiemarknaden ansåg att aktiemarknaden var fullt ut ineffektiv vilket skulle resultera i att marknaden på sikt skulle bli allt mer effektiv.

Däremot skulle marknaden initialt vara mindre intressant att undersöka då informationsflödet skulle vara lågt. (Grossman & Stiglitz, 1980) (Fama, 1970). Utöver detta hävdar Grossman och Stiglitz att marknadsaktörer som arbetar för att skapa och stimulerar utvecklingen av den effektiva marknaden måste få en ersättning för sitt agerande vilket skulle vara direkt felaktigt då EMH förnekar all möjlighet till ekonomisk ersättning. (Grossman & Stiglitz, 1980)

2.2 Diversifiering

Anledningen till att flertalet personer väljer att avstå från att investera på aktiemarknaden är på grund av riskuppfattningen (Aragó & Fernández-Izquierdo, 2003) (Alltommarknaden, 2019).

15 Ett signifikant sätt att minska risken i sin portfölj är med hjälp av diversifiering, däremot finns det studier som antyder att ett större antal innehav i portföljen kan påverka avkastningen negativt (Alexeev & Dungey, 2015) (Sharma & Vipul, 2018). Detta eftersom en portfölj med ett stort antal olika tillgångar troligtvis medför stora driftkostnader samt avgifter (Alexeev &

Dungey, 2015) (Sharma & Vipul, 2018). Tidigare studier visar att man som investerare kan ha en mångsidig portfölj med hjälp av 6–15 olika tillgångsslag (exempelvis aktier, råvaror och obligationer) i portföljen (Alexeev & Dungey, 2015). Utöver detta skall investeraren ta hänsyn till hur portföljfördelningen skall se ut baserat på en procentuell fördelning eller substansvärdet som skall investeras. I denna studie kommer det göras ett försök att automatisera denna process enbart genom att inkluderas aktier vilket exkluderar övriga typer av tillgångar som innefattas inom diversifiering och allokering exempelvis: obligationer, råvaror, räntor, valutor och global exponering (ibid). Genom att generalisera allokering kan det kategoriseras till två grundläggande typer av allokering vilket är strategisk och taktisk tillgångsallokering.

2.2.1 Strategisk tillgångsallokering

Det är den traditionella metoden som i princip innebär att bibehålla en väl allokerad portfölj och inte ändra fördelningen baserat på tillgångsallokering. Det är helt i linje med investerarens mål och risk men tar heller inte hänsyn till några positiva eller negativa nyheter om tillgången. Vilket denna studies portfölj kommer att utgå ifrån. (Butler et al, 2016).

2.2.2 Taktisk tillgångsallokering

Taktisk tillgångsallokering är en mer modern jämfört med den strategiska. Denna strategi baseras övergripande på tre olika värdepapper; främst aktier, obligationer eller likvida medel.

Den grundas på relativa resultat av tillgångsslag och kortsiktiga justeringar i tillgångsallokering görs ofta. På så sätt kan portföljen prestera en högre avkastning och därmed prestera bättre än jämförelseindex. In- och utträde i tillgångar måste på så vis tidsoptimeras. (Butler et al, 2016) (Bellu &Conversano, 2020).

2.3 Principal component analysis

Många analytiker använder sig av en metod som kallas för principal component analysis (PCA metoden). Denna metod är väl testad inom flertalet områden, allt ifrån statistik till medicinsk forskning. PCA skapar artificiella variabler vilket i sin tur skall maximera variationen av variablerna i analysen. Detta görs för att identifiera korrelationen mellan aktier och med hjälp av detta kan investerare skapa sig en väl diversifierad portfölj genom att analysera två eller fler oberoende variabler, baserat på algoritmisk applikation av komponenter som märks utifrån en given heuristik. (Sharma & Vipul,2018).

16

2.4 Modern portföljteori

Ett alternativ till PCA-metoden är den så kallade Modern portföljteori (MPT) (Markowitz,1952). MPT försöker att maximera portföljens förväntade avkastning baserat på riskfaktorerna i investeringarna (Markowitz, 1952) (Esfahani, et al, 2016). Teorin bakom MPT är att inkludera olika tillgångar vilket inte fullständigt korrelerar med varandra och där med skapar en mindre risk i portföljen utan någon negativ påverkan gällande avkastning (tillgångsallokering). Detta tillvägagångssätt ignorerar den kortsiktiga finansmarknads-dynamiken som investerare exponeras för, som i allmänhet fokuserar på mål med en begränsad tidshorisont. Faktum är att den teoribaserade optimala portfördelningen är känsliga för avkastningsförväntningar, som vanligtvis är svåra att fastställa. Utöver detta kan historiska avkastningar resultera i missvisande utgångspunkter för framtida avkastning (Ni et al, 2011) Med denna typ av problematik i åtanke används liknande tillvägagångsätt som i MPT i denna studie, genom att använda sig av medelvariansen för att utvärdera hur stora riskfaktorerna är i portföljen (Markowitz, 1952) (Esfahani, et al, 2016) och därefter att jämföra den årliga avkastningen samt medelvariansen för bolagen som inkluderas i OMX30.

2.5 Maskininlärning

Maskininlärning är en undergrupp till artificiell intelligens (AI) som har på senare tid växt sig oerhört populär bland olika typer av dataanalys (Moreo, et al, 2019). Den huvudsakliga filosofin bakom AI är att skapa en ”smart” maskin med hjälp av olika typer av beräkningar samt algoritmer (Alloghani, et al, 2020). Steget efter detta är att inte bara skapa en ”smart” maskin utan en maskin som även kan lära sig själv baserat på tidigare utfall. Detta görs med hjälp av datakoder vilket genereras med hjälp av beräkningsanalyser och statistik som i sin tur ligger till grund för maskinens beslutsfattande/agerande. (Moreo, et al, 2019).

2.5.1 Övervakad & oövervakad maskininlärning

Övervakad maskininlärning innefattar alltid någon typ av data sedan tidigare som skall representera all typ av data. Den tidigare datan är oftast ett resultat som innefattar någon typ av

”rätt svar”. Vanligtvis krävs det någon eller några metoder för att skapa denna typ av sammanställning innan analytiker kan använda sig av en övervakad inlärningsmetod.

(Abhijit,2017)

Oövervakad maskininlärning innebär att man presenterar en funktion där utfallet inte är känt och där ”rätt svar” ej är angett. Exempel på detta kan vara historisk data. Om en analytiker skall använda sig av oövervakad maskininlärning krävs det en formel alternativt en beräkning vilket

17 kontinuerligt räknar ut vad händelseförloppet skall utmynna i. Dessa typer av mönster som beräknas måste analytikern bedöma om resultaten är rimliga för användning inom en oövervakad inlärningsmetod. Vi kan även se liknade inlärningsmetoder hos oss människor. Om ett litet barn exponeras mot en bild på en bil vid flertalet tillfällen och sedan ser en bil köra förbi vid ett promenadtillfälle kommer barnet att känna igen att det är en bil. Även om bilen skulle sakna visa delar kan vi väldigt snabbt avgöra vad vi ser framför oss. (demenscentrum,2020) Vad som är mycket svårare än att avgöra om det är en bil man ser framför sig är att se mönster eller göra beräkningar som skall ligga till grund för investeringar, exempelvis trender vilket ses i figur 1 (Miroslav, 2017).

a)

b)

Figur 1. Exempel på trender på aktiemarknaden. På y-axlarna anges pris per aktie i kronor och på x-axlarna anges antal handelsdagar på aktiemarknaden. I figur 1a ses exempel på en uppåtgående trend på aktiemarknaden. I figur 1b ses exempel på en nedåtgående trend på aktiemarknaden.

I denna studie kommer användningen av oövervakat lärande användas då målet är att utesluta den mänskliga interaktionen i så stor utsträckning som möjligt och även undersöka huruvida maskiner kan göra bättre bedömningar vid investeringar jämfört med mänskliga individer.

2.5.2 K-Betydelse kluster

När man använder sig av oövervakat lärande finns det flertalet metoder att använda beroende på vad forskaren söker för resultat eller hur datan presenteras för forskaren. En välanvänd metod vid analys av oövervakat lärande är K-betydelsen (Jha & Saha, 2019) (Kyan et al., 2014).

Genom denna metod skapas det kluster, vilket är ett sätt för forskaren att avslöja eventuella

0 5 10 15

0 2 4 6 8 10 12

0 5 10 15

0 2 4 6 8 10 12

18 grupper av observationer, trender, kraftigt avvikande data jämfört med medelvärdet (så kallade outliners) samt likheter mellan testerna (Eriksson et al., 2013) (Kyan et al., 2014).

Målet med K-betydelsen är att dela upp ett datarum i K-prototyper vilket betyder att forskaren bestämmer hur många datauppsättningar analysen skall innefatta (Antal kluster = K).

För att bestämma centrumpunkterna för K kan en slumpmässig process göras alternativt ett aktivt val. Denna process upprepas tills det inte finns någon större förbättring av antalet kluster, vilket kan ses som ett optimalt antal kluster. Denna procedur görs för att minska kvadratavståndet (SSE) mellan alla prover och deras representativa prototyper (Kyan et al., 2014), vilket innebär att man söker ett så lågt SSE värde som möjligt.

Slutligen kan resultatet analyseras med ett T-test om vi antar att den insamlade datan är normalfördelad, vilket denna studie har utgått ifrån. Om datan inte skulle betraktats som normalfördelad, kan man använda sig av Kruskal-Wallis-testet för att genomföra hypotesprövningen som krävs för studien. (Bargagliotti et al, 2015)

2.6 Tidigare forskning

En metod för att framställa algoritmer för att generera en portfölj som genererar en högre positiv avkastning är K-betydelsemetoden vilket vi har undersökt i vår studie. K-betydelsemetoden och dess användning på aktiemarknaden är ej särskilt väl studerad och mängden forskningsresultat är begränsad. Den forskning som däremot har gjorts på området har sammantaget talat för att K-betydelsemetoden kan användas för att generera en högre positiv avkastning på portföljen jämfört med jämförelseindex. K-betydelsemetoden har tidigare använts inom andra områden där kategorisering och klustersammansättning används. Inom dessa områden har

K-betydelsemetoden visat sig vara en effektiv metod.

Det har gjorts ett antal tidigare empiriska forskningar vilket angriper kunskapen och tillvägagångsättet med att använda sig av K-betydelsen inom diversifiering och portföljhantering. Chen och Xu (2014) utformade sin studie baserat på K-betydelsen vilket var den uteslutande metoden att analysera sex slumpmässigt utvalda aktier på Shanghaibörsen under perioden 2000 till 2012. Forskarna ville visa med sin studie att man kan skapa en väl presterande portfölj utan några komplicerade matematiska modeller och tidskrävande uppskattningar. För att visa potentialen av metoden antogs problematik gällande portföljval i flertalet perioder, utöver detta antas ett dynamiskt riskmått vilket är överlägset större än vad

19 tidigare litteratur antar. Slutligen gjordes en serie numerisk experiment på de aktier vilket inkluderades inom studiens avgränsningar. Resultatet i studien var signifikant och visade att användandet av K-betydelsemetoden ledde till en positiv riskjustering samt en positiv högre avkastning på portföljen. (Chen & Xu, 2014).

Korzeniewski (2017) såg en efterfråga födas när investerar använde sig av statistiska modeller för att skapa sig en väl diversifierad portfölj och därmed optimera sina positioner på aktiemarknaden. I studien som skulle möta investerarnas behov används K-betydelsemetoden i en kombination med Partitioning Around Medoids (PAM), vilket ska generera ett antal portföljpositioner samt välja olika klusterrepresentanter baserat på prestation. Studien visade att användandet av K-betydelsemetoden i kombination med PAM gav en högre positiv avkastning på investeringen baserat på de tjugo mest likvida aktierna på Warszawabörsen (WIG20) under perioden 2011 till 2014. Resultatet var signifikant. (Korzeniewski, 2017) 2008 genomförde Marney en studie där K-betydelsemetoden användes i kombination med self-organizing map (SOM). SOM är en metod som används inom neurala nätverkstekniker, dessa tekniker är ett samlingsnamn av beräkningar och algoritmer som möjliggör att artificiell intelligens att blir självlärande. Studien granskar de hundra största bolagen på Londonbörsen under perioden 1993–2003 och visar att det inte finns någon signifikans gällande användandet av dessa metoder och en högre positiv avkastning på aktiemarknaden. Forskaren gör antagandet att aktiemarknaden fortsätter att bli effektivare som ett resultat av ökad kollektiv förståelse i kombination med att allt mer kraftfulla dataanalystekniker används. (Marney, 2008).

Från artikeln av Elazouni (2006) kan vi se att klustersammansättningar med hjälp av K-betydelsemetoden kan användas även utanför aktiemarknaden, vilket i denna studie genererade en bild av olika entreprenörers kompetens att slutföra projektet i tid, inom budgeten och enligt förväntade kvalitetsstandarder. I denna typ av sammanhang används metoden för att skapa en hierarkisk sammanställning av de olika entreprenörerna, för att sedan urskilja den optimala entreprenören baserat på likviditet, aktivitet, lönsamhet och kvalité. Studien genomfördes 2012 i Saudiarabien och inkluderade 245 entreprenörer. Studiens resultat stödjer användandet av K-betydelsemetoden även utanför aktiemarknaden. (Elazouni, 2006).

Som företag försöker man optimera sin ekonomiska ställning kontinuerligt. I studien från Klotz och Lindermeir (2015) har K-betydelsemetoden använts för att förbättra beslutsfattandet i kreditportföljförvaltning. Metodens syfte skall bidra med att hitta likheter i datastrukturer vilket i sin tur skall användas för att urskilja kontraktspecifikationer med låg respektive hög

20 vinstpotential för finansiella institut och banker. Forskaren belyser att denna typ av strategiskt upplägg baseras på flera möjliga inställningar som måste justeras manuellt i modellen. Detta leder till flertalet olika utfall baserat på datainmatning och därmed kan inte fullständiga validitetsaspekter tillgodoses. (Klotz och Lindermeir, 2015).

Att prognostisera den potentiella avkastningen på investeringar kopplade till aktiemarknaden är en väldigt krävande process och aspekter kring detta tar Dias et al (2019) upp i sin studie för att skapa ett algoritmiskt upplägg som föreslår en unik beslutsmodell för day-traders. Med detta i åtanke utvecklades modellen med en fusionsmetod för att klassificera olika aktier med hjälp av maskininlärning. Med support vector machine (SVM) genereras de första datapunkterna och med hjälp av medelvarians (MV) görs sedan det slutgiltiga beslutet avseende investeringen.

Studien baseras på och jämförs med Sao Paulo Stock Exchange Index (Ibovespa) där forskarna får fram ett signifikant resultat gällande högre positiv avkastning genom att använda metoder för att avgöra portföljhantering och diversifierad. (Dias et al, 2019).

Forskningen som presenteras av Khedmati och Azin (2020) är en typ av portföljsammansättningsalgoritm vilket följer strukturen mönstermatchningsprincipen, algoritmerna fattar beslut om den optimala portföljen i varje beräkningsperiod och uppdaterar beräkningarna i början av nästföljande period. Inledningsvis användes K-betydelsen för att skapa klustersammansättningar. För att inkludera transaktionskostnaden i portföljoptimeringen användes fyra algoritmer: KMNLOG, KMDLOG, SPCLOG och HRCLOG baserat på studiens syfte. Denna metod i studien tillämpades på hela NASDAQ, NYSE och slumpmässiga aktier från index Nasdaq-100, Dow Jones och S&P 500 under olika tidsperioder. Resultatet i studien var signifikant och visade att metoden gav högre positiv avkastning jämfört med jämförelseindex. (Khedmati och Azin, 2020).

Cheong et al genomförde 2017 en studie för att undersöka användandet av ekvationer för att framställa en portfölj som genererar en högre positiv avkastning jämfört med jämförelseindex.

Studien genomfördes i två faser. Först utvecklades en sammansättning av aktier för att skapa en portfölj genom en klusteranalys av investerarinformation. Därefter användes algoritmer för att optimera fördelningen av aktierna för att generera en högre avkastning. Slutsatsen av studien visar att användandet av flerstegsportföljoptimeringsschemat för aktiv portföljförvaltning ger högre positiv avkastning på portföljen jämfört med tidigare föreslagna metoder för den koreanska aktiemarknaden. (Cheong et al, 2017).

21 En sammanställning av referenser för kapitel 2 ses i tabell 2 samt en separat sammanställning av artiklar vilka bidrog med relevanta inslag till studien (bilaga 1).

Tabell 2. Sammanställning av referenser för kapitel 2.

Författare År Land Urval Relation till uppsatsen

Markowitz 1952 USA Dow-Jones Modern portfolio theory (MPT)

Fama 1970 USA Dow-Jones

Period: 1957–1962

EMH

Grossman & Stiglitz 1980 USA Tidigare forskning EMH Aragó &

Fernández-Izquierdo

2003 Spanien IBEX-35 index Period: 1993–1999

Riskuppfattning kring aktiemarknaden Delgado-Rodriguez &

Llorca

2004 Spanien Tidigare litteratur och studier av ämnet

Aspekter kring bias inom forskning Atack & Neals 2009 England Litteratur Grunden till notering på aktiemarknaden

Business Insider 2010 USA Intervju Warren Buffets syn på aktiemarknaden

Ni et al 2011 Kina NYSE, AMEX & NASDAQ Missvisande uppskattningar baserat på historiskavkastning

Eriksson et al. 2013 Sverige Huvudkomponentanalys (PCA) och Projektioner till latenta strukturer (PLS)

Faktorer inom K-betydelsen

Kyan et al. 2014 Kanada Självorganiserad trädkarta (SOTM) och Självorganiserad hierarkisk varianskarta (SOHVM)

Faktorer inom K-betydelsen

Alexeev & Dungey 2015 England, Wales

S&P 500, Period:2003–2011

diversifiering och kostnader

Bargagliotti et al 2015 England Litteratur Kruskal-Wallis-testet

Butler et al 2016 USA Litteratur Tillgångsallokering

Esfahani et al 2016 Iran Modern portfolio theory (MPT) Investeringar baserat på varians

Esfahani et al 2016 Iran Modern portfolio theory (MPT) Investeringar baserat på varians

Related documents