• No results found

4. Studiens metod och praktiska genomförande

4.7 Linjär regression

I studien används regressionsanalys för att estimera volatilitetsportföljernas betavärden i

förhållande till marknadsindexen, vilket görs genom enkel linjär regression. Genom detta hoppas vi bland annat skapa förståelse för hur stor del av volatilitetsportföljernas utveckling som påverkas och kan förklaras av marknadens utveckling. En del av studiens syfte är som bekant att studera om de faktorer som valts ut för portföljstrategin kan generera högre avkastning än den från

marknaden. Därmed ligger visst intresse i att även studera eventuella samband mellan de

konstruerade portföljerna och marknaden. Denna statistiska metod estimerar linjära relationer och samband mellan olika beroende och oberoende variabler. Metoden i sig kan kortfattat beskrivas som en skattning eller estimering av ett samband mellan två eller fler variabler, där fokus ligger på att studera i vilken omfattning en given variabel påverkas av att en av de andra parametrarna förändras eller manipuleras. Regressionsresultat ska tolkas som i vilken utsträckning en beroende variabel beror på eller betingas av en eller flera andra oberoende variabler. I enlighet med denna tolkning antas det eventuella sambandet mellan variablerna vara sådant att om en oberoende variabel i regressionen förändras med en enhet i någon riktning påverkar detta i sin tur den beroende variabeln som också förändras i någon riktning. Riktningen på hur den beroende

variabeln förändras avgör om det eventuella sambandet är positivt eller negativt (Stock & Watson, 2012).

Regressionsmodellen som används i denna studie är en enkel linjär regressionsmodell som bygger på funktionen för en rät linje för ett eventuellt samband mellan de studerade variablerna, och som grundar sig i de dataobservationer som insamlats. I denna uppsats ser funktionen för den räta linjen ut enligt följande:

"> = 2>+ (>∗ "+,-+ 3>

"> = Den beroende variabeln, avkastning för portföljen

2> = Konstanten för portföljen, den avkastning som inte förklaras av marknadens utveckling

(> = Betavärdet för portföljen

"+,- = Den oberoende variabeln, avkastning för marknaden

3> = Felterm, antar värdet noll (0) vid praktisk implementering

När regressionsanalys används leder det förhoppningsvis till någon form av resultat där förhållandet och relationen mellan beroende och oberoende variabler uttrycks som ett linjärt samband. På grund av att det rör sig om estimering av detta samband, grundat på datamaterialet som samlats in för studien, kan denna skattning heller inte antas vara helt exakt. Det estimerade sambandet innehåller därför en viss nivå av felosäkerhet (Stock & Watson, 2012).

Utifrån regressionsanalysen kan dataobservationerna för studien illustreras i ett spridningsdiagram vari det skattade linjära sambandet kan utläsas i form av en rät linje som anpassats till

observationerna. Den räta linjen anknyter så nära som möjligt till de i diagrammet plottade observationspunkterna, vilka utgörs av två tal eller variabler i de regressioner som görs i denna uppsats. En observationspunkt består i denna studie av den månadsvisa utvecklingen för en volatilitetsportfölj samt av den månadsvisa utvecklingen för det jämförelseindex som används. Genom att anpassa en trendlinje till de olika plottade observationerna i spridningsdiagrammet kan det även utläsas att det estimerade sambandet inte är helt perfekt. Detta då varje enskild

observationspunkt inte ligger exakt på trendlinjen utan avviker i någon mån från den trendlinje som anpassats till dessa. Syftet med regressionsanalysen och den räta linjens funktion är att minimera observationernas avvikelser och skatta det samband där linjen ansluter sig så nära som möjligt till de observationer som gjorts (Stock & Watson, 2012).

4.7.1 Regressionsresultatens signifikans

Det är intressant att studera i vilken utsträckning studiens resultat avseende de från regression genererade betavärdena och intercepten, kan anses vara signifikanta eller inte. För att göra det finns det olika tillvägagångssätt. Det vi har valt att använda oss av för detta är att främst genomföra så kallade t-test (students t-test), samt att beräkna koefficienternas P-värden.

Regressionerna ger, som tidigare nämnts, en bild av i vilken utsträckning volatilitetsportföljernas utveckling samvarierar med eller beror på marknadens utveckling. Genom dessa regressioner blir

det därmed möjligt att finna vissa samband med avseende på studieobjektens historiska utveckling och prestation. När regressionerna, som estimerats med hjälp av Microsoft Excel och programmet StatPlus, genomförts presenterar programmet i anslutning till de skattade parametervärdena även olika former av signifikansvärden för dessa. Dessa värden visar alltså på i vilken omfattning de skattade koefficienterna är signifikanta eller inte.

Vi väljer att utifrån de genererade regressionsanalyserna att sätta samman egna tabeller som grundar sig på de signifikansvärden och regressionsskattningar vi själva anser tillämpliga för denna studie. Skattningarnas signifikans redovisar vi genom t- och p-värden. Vi redovisar även konfidensintervall inom vilka de skattade parametrarnas sanna värde kan antas finnas. Tilläggas bör här att samtliga signifikansvärden och konfidensintervall gäller för en 5 procentig

signifikansnivå, alternativt en 95 procentig konfidensnivå. Vid regressionsanalys liknande den som används i denna studie finns det möjlighet till viss hypotesprövning avseende de skattade

parametrarnas signifikans och det är på grund av detta vi väljer att presentera vissa

signifikansvärden. Dessa hypoteser är två stycken till antalet. Nollhypotesen gör gällande att koefficienterna för de parametrar som estimeras inte är signifikant skilda från, eller lika med, noll (0). Alternativhypotesen innebär utifrån detta resonemang att de estimerade koefficienterna är signifikant skild från, eller inte lika med, noll (0) (Løvås & Karlsson, 2006; Stock & Watson, 2012).

T-test kan användas inom linjär regression för att avgöra om ovan nämnda hypoteser kan förkastas eller inte, för en regression av intresse. För denna studie innebär den beskrivna hypotesprövningen en slags jämförelse av de olikheter, eller likheter, som eventuellt existerar mellan de två grupperna av historisk aktiekursutveckling mellan respektive volatilitetsportfölj och dess tillhörande

marknadsindex. Den historiska kursutvecklingen antas vid denna form av regression och t-test ha en icke känd standardavvikelse samt vara normalfördelad. T-testet kan vara användbart i ett flertal olika situationer men just i denna studie används t-testen från regressionsanalysen som indikator för att fastställa om lutningen på regressionslinjens, eller det linjära sambandet mellan variablerna, är signifikant skild från noll (0) eller inte. Något som följer av hur hypoteserna i denna kontext ska tolkas. Då de genererade regressionerna i denna uppsats har en signifikansnivå om fem (5)

procent, blir följden att det kritiska värdet för denna signifikansnivå, enligt normalfördelning uppgår till 1,96. Tolkningen av detta blir då att om de genererade t-värdena för de estimerade parameterkoefficienterna överstiger 1,96 anses koefficienterna vara signifikant skilda från noll (0) och nollhypotesen kan då förkastas och alternativhypotesen behållas med 95 procents säkerhet (Løvås & Karlsson, 2006; Stock & Watson, 2012).

Ytterligare en indikator eller sannolikhetsvärde som ibland används vid olika slags

hypotesprövningar är p-värden. P-värdet kan sägas ange en typ av sannolikhetsnivå för risken för felbeslut kring vilken av de två hypoteserna som kan förkastas. P-värden kan alltså utnyttjas för att avgöra den risknivå som kan godtas eller anses acceptabel för att förkasta en sann och riktig nollhypotes utifrån de observationer som ligger till grund för regressionen. P-värdet är med andra ord ett sannolikhetsvärde vilket beskriver sannolikheten för signifikansfel och liknande vid hypotesprövning (Løvås & Karlsson, 2006). Om p-värdet visar sig vara litet tolkas detta som att risken för ett felbeslut gällande om nollhypotesen kan förkastas eller inte, är liten. Under normala omständigheter ska p-värdet vara lägre än 0,05, alltså lika med eller helst lägre än den valda signifikansnivån om fem (5) procent. Är p-värdet lägre än detta värde anses det tillräckligt säkert att förkasta nollhypotesen utan risk för ett felbeslut (Løvås & Karlsson, 2006).