Least Absolute Deviation - Teoretisk referensram

4. Teoretisk referensram

4.6. Least Absolute Deviation

Least Absolute Deviation (LAD) har många olika namn, bland annat Least Absolute Error (LAE), Least Absolute Value (LAV) och L1‐norm problemet. I fortsättningen kommer förkortningen på det förstnämnda, LAD att användas. LAD utgår ifrån samma linjära modell som OLS, men istället för att som i ekvation (26) minimera kvadraten av residualerna, så minimeras beloppet:

| | (32)

Detta problem går inte som i OLS fall att lösa analytiskt, utan en numerisk lösningsmetod krävs, med dagens datorkapacitet är detta inget stort problem. Fördelen med att LAD är att lösningen är mer robust. Detta innebär i detta sammanhang att lösningen inte påverkas lika mycket av avvikande värden. LAD har också egenskapen att lösningen är mer ostabil än OLS (Ellis 1998). Att

lösningen är ostabil innebär att en liten förändring i dataunderlaget kan ge ett stort utslag i resultatet. Fördelarna med robustheten väger dock ofta tyngre än problemen med stabilitet. LAD har inte heller alltid en entydig lösning till minimeringsproblemet. Fördelar och nackdelar mellan OLS och LAD kan sammanfattas enligt följande: Ordinary Least Squares (OLS) Least Absolute Deviation (LAD) Inte särskilt robust Robust Stabil lösning Mindre stabil lösning Alltid en lösning Flera lösningar är möjligt

I en studie utav Mishra och Dasgupta (2003) undersöktes i vilka fall OLS och LAD fungerade bäst. Studien kom fram till att beroende på hur fördelningen såg ut för residualtermen, var den ena att föredra över den andra. Av de undersökta fördelningarna som är intressant i detta examensarbete fanns normalfördelningen och Cauchyfördelningen, som kan ses illustrerade i figur 9.

Figur 9 Normal‐ & Cauchyfördelning (Mishra & Dasgupta 2003)

Cauchyfördelningen är väldigt lik normalfördelningen med den skillnaden att den har tyngre svansar, vilket innebär att utfall långt ifrån väntevärdet är sannolikare. Analys av historisk data för avkastningar visar på att stora kursrörelser är vanligare än vad normalfördelningsantagandet säger. Inom ekonomiska studier där finansiell data behandlas, är ett av de främsta argumenten till förbättring just att använda en modell där de osannolika händelserna, antas vara mer sannolika än i normalfördelningsantagandet En del av Mishra och Dasguptas undersökning var att se vilken av modellerna som bäst klarade av Cauchyfördelningen. En annan del i undersökningen var att se hur modellerna klarade av outliers.

Resultatet av studien var att för data med Cauchyfördelning för residualerna är LAD att föredra över OLS. Av de 60 tidsserierna som testades var LAD att föredra i 59 av dessa.

Vid test av outliers med normalfördelade residualer, så var LAD och OLS likvärdiga om bara en outlier fanns, vid tre respektive fem outliers, var LAD bättre än OSL i 42 respektive 48 av de 60 fallen.

Fördelningen för avkastningar på aktiemarknaden har i många studier visats ha så kallade tunga svansar, som sammanfattas i Mishra och Dasgupta (2003) av bland annat av Meyer och Glauber (1964), Fama (1965) och Mandlebroth (1967). Blume (1968) visade i sin doktorsavhandling att residualerna vid en betaskattning approximativt är fördelade likadant som avkastningarna för aktier. Studien pekar alltså mot att vid regression på historisk ekonomisk data, som har en fördelning med tjocka svansar och extrema utfall (outliers) så bör LAD användas istället för OLS. 4.7. Iteratively Reweighted Least Squares

En annan metod för att ta sig runt problemet att minimeringen sker på kvadraten av residualerna kallas Iteratively Reweighted Least Squares (IRLS). Denna metod bygger på OLS men har istället en omskalningsfaktor som iterativt adderas till problemet. Fördelen med denna metod är att den är mer implementeringsvänlig.

Denna metod har alltså precis som LAD ingen analytisk lösning, utan beräknas numeriskt.

IRLS konstrueras genom att multiplicera en viktmatris till ekvation (30). Lösningen till regressionen får då ett liknande utseende som ekvation (31), men nu med en viktmatris kopplad till uttrycket. Lösningen blir (Shizhong 1998):

0 0 0 0 0 0 (33) Dessa vikter , … , kan väljas valfritt, normalt väljs de som någon skalfaktor som beror på tidigare beräknade residualer. För att få samma egenskaper som vid LAD, nämligen att så kallade outliers betydelse minskar, kan man vikta om dessa värden med hjälp av viktmatrisen . Ett exempel på viktmatrisen och även den metod som kommer användas i detta examensarbete är följande vikter: 1 | | 0 0 0 1 | | 0 0 0 _| 1 _| (34)

För att lösa detta problem beräknas en iterativ process, som avslutas när residualerna ändras mindre än en egen vald gräns. Den iterativa processen ser ut enligt följande: Steg 1: Sätt upp ett startvärde för . Steg 2: Givet , konstruera matrisen . Steg 3: Givet V, estimera ett nytt med hjälp av ekvation (33) Steg 4: Gå till steg 2, detta avslutar ett varv av iterationen,

Ett lämpligt avslutskriterium (krav på förändring av residualer) måste sedan också väljas.

5. Problemanalys

I denna del kommer de olika delproblemen i predikteringen av betavärden tas upp. Analysen består av att identifiera och beskriva hur undersökningen ska göras.

5.1. Datainsamling

Insamling av fonder har skett genom användning av Morningstars databas över fonder. Ur databasen har fondtypen European Large Cap Blend sorterats ut. Detta betyder att fonderna innehåller aktier som har sin huvudverksamhet i Europa och är stora bolag. Exakt vad definitionen av Large Cap är varierar. Blend innebär att fonden kan investera både i värde‐ och tillväxtaktier (Value och Growth).

Anledningen att denna kategori valdes var för att lättare kunna tillse att fondernas innehav täcks av fondens index. Large Cap bolag finns nästan alltid med i index och man kan då lättare försäkra sig att fondens innehav är en delmängd av index, vilket är väldigt viktigt.

Kontroll gjordes även så att fonderna var rena aktiefonder, hade hela sitt innehav inom Europa och inte bara en stor del. Samt att fonden inte handlade med derivat, med andra fonder eller andra positioner.

Som redan diskuterades i avsnitt 3.2, så fungerar DMA produkten som så att beta ofta kan uppdateras. Prediktionsmodellen ska alltså gärna kunna stämma av mot ett ganska kortsiktigt referensbeta. Det är alltså av intresse att göra undersökningen på avkastningar med så kort periodicitet som möjligt, för att fånga förändringar i beta snabbt. Det kortaste tidsintervallet som det finns lång historik på är dagsavkastningar och därför kommer detta användas. Tidsserierna för fonder och index har sedan hämtats via Bloombergs databas. Alla fonder som är med i analysen har minst historisk data ifrån år 2000. Två olika index används till fonderna, det dominerande indexet är MSCI Europe Index (MXEU), som används till 41 av de totalt 51 fonderna i undersökningen. Resterande tio fonder använder Dow Jones Euro Stoxx 50 (DJST/SX5E). MSCI är mycket ett bredare index än Dow Jones, som bara innehåller 50 stycken aktier, jämfört med MSCI som har över 500 innehav.

För att få en uppfattning om hur lika MSCI Europe och Dow Jones Euro är, mättes deras korrelation. Korrelationen blev 0.94 för dagsavkastningar och 0.96 för vecko‐ och månadsavkastningar mätt över tidsperioden 1995‐2007. Detta får anses vara en väldigt hög korrelation och på grund av detta bör inte slutsatser dragna för det ena indexet skilja sig nämnvärt ifrån slutsatser för det andra indexet.

Alla tidserier är valutajusterade till Euro, så att inte valutaeffekter påverkar beta. Utdelningar för index är också medräknat.

Varje fond har kontrollerats att det av Bloomberg anses ha ett jämförelseindex och vad det är. Tyvärr har ett visst avkall på kontrollen av fondernas index fått göras, eftersom det skulle blivit allt för tidsödande att i detalj kontrollera varje fond. Det som förbisetts är om fonden bytt jämförelseindex långt tillbaka i tiden. Detta är information som inte alltid är lätt att hitta, utan att behöva kontakta fondförvaltaren. Även om jämförelseindex på tidigare historik alltså i värsta fall kan avvika något, så är det troligtvis inga stora avvikelser, på grund av typen av fonder som studien görs på (Large‐Cap fonder antas förändras mindre än fonder i genomsnitt). I analysen utreds hur väl LAD och IRLS fungerar för att prediktera beta, jämfört med OLS. Avkastningar som används är enkla dagliga, vecko‐ och månadsavkastningar, där utdelningar tas med.

Anledningen att avkastningar med längre periodicitet inte tas med är begränsningar i den tillgängliga historiken. För tidsserierna finns minst ungefär åtta år av historisk data. Eftersom modellerna utvärderas genom att dela denna tidsperiod i två delar, görs beta beräkningar på minst fyra års historik. Skulle till exempel tvåmånadersavkastningar användas skulle detta innebära enbart 24 mätpunkter för att skatta beta, vilket är på gränsen till för lite. Det hade varit önskvärt att kunna göra analysen på historik med 14 års tillgänglig historik, eftersom sju år av historik i tidigare undersökningar kommit upp som en lämplig avvägning. Tyvärr har dataunderlaget för fonder med 14 års historik (som uppfyller de övriga kraven) varit för litet.

In document Prediktion av beta för fonder (Page 38-44)