• No results found

4. Praktisk metod

4.6 Felkällor

I statistiska analyser finns det flertalet faktorer som kan komma att påverka resultatet och som i sin tur kan leda till att felaktiga slutsatser dras och vilseledande rekommendationer ges. Därför har vi genom olika test och åtaganden beaktat de felkällor som kan uppstå vid utformandet och användandet av multipla regressionsanalyser. Om våra test visat att statistiska felkällor sannolikt förekommer har vi valt att justera den statistiska modellen för att öka validiteten och reliabiliteten och möjliggöra en korrekt regressionsanalys som sedan utmynnar i trovärdiga slutsatser.

4.6.1 Multikollinearitet

Multikollinearitet är en felkälla som kan påverka resultatet i regressionsanalysen och som visar i vilken grad en oberoende variabels effekt kan förklaras andra oberoende variabler i analysen (Hair et al., 2006, s. 24). För att undersöka om multikollinearitet förekommer i vår data har vi använt oss av Variance Inflation Factor (VIF). Det VIF gör är att det mäter till vilken grad en variabels effekt kan förklaras av andra variabler. Detta sker med hjälp av variansen i en variabel, eftersom den inte är ortogonal mot övriga regressioner (Baum, 2006, s. 85), där ortogonalitet mellan variabler innebär att de har ett vinkelrätt samband sinsemellan. När man använder sig av Variance Inflation Factor för att ta reda på om multikollineartiet föreligger så vill man ha ett så lågt VIF-värde som möjligt. Ju lägre VIF-värde, desto mindre är risken för att multikollineartitet skulle vara ett problem i modellen. Hair et al., (2006, s. 230) och Baum (2006, s. 85) menar att gränsvärdet för om multikollinearitet skulle föreligga är 10. Vi kommer även att komplettera Variance Inflation Factor med en korrelationsmatris för att vidare undersöka om multikollinearitet

föreligger. Till skillnad mot Variance Inflation Factor så möjliggör en korrelationsmatris att utläsa hur korrelation ser ut mellan de oberoende variablerna.

4.6.2 Heteroskedasticitet

Vi har även kontrollerat modellen för heteroskedasticitet, vilket enligt Hair et al. (2006, s. 207) är en av de vanligaste felkällorna i statistiska analyser och innebär att det förekommer ojämna avvikelser i feltermen. Om hetereoskedasticitet förekommer i modellen innebär det att resultaten från studiens regressionsanalyser kan bli missvisande.

Vi har i studien testat för heteroskedasticitet med hjälp av ett Breusch-Pagan-test vilket enligt Baum (2006, s. 146) är ett av de vanligaste testen för heteroskedasticitet och som ger en högre styrka än ett White-test med hänsyn till frihetsgraderna som en lång regression tar i anspråk. I Breusch-Pagan-testet är nollhypotesen att variansen i feltermen är konstant, det vill säga att heteroskedasticitet inte förkommer, och mothypotesen är att heteroskedasticitet finns i modellen. Då heteroskedasticitet förekommer är ett sätt att motverka det enligt Stock och Watson (2015, s. 375) att använda sig av robusta standardfel i modellen. Om heteroskedasticitet endast förekommer i en utav de tre regressionsanalyserna så kan robusta standardfel användas för de tre samtliga. Detta då Stock och Watson (2015, s. 413) menar att användandet av robusta standardfel i regressionsanalyser är lämpligt att använda sig av även om heteroskedasticitet inte förekommer.

4.6.3 Seriell korrelation

Då vi använts oss av paneldata så har vi även att kontrollerat för huruvida seriell korrelation finns i modellen vilket gjordes med hjälp av ett Wooldridge-test. Seriell korrelation enligt Baum (2006, s. 155) innebär att observationerna är korrelerade med sig själva, vilket Studenmund (2014, s. 36) vidareutvecklar och definierar som att slumptermen är beroende av en annan över olika tidsperioder som ingår i studien. Om seriell korrelation finns i den statistiska modellen kan det leda till att felaktiga slutsatser dras från regressionsanalyserna, något som skulle sänka studiens validitet och reliabilitet.

Wooldridge-testet hjälper oss att se om seriell korrelation förekommer, där nollhypotesen är att det inte existerar seriell korrelation och mothypotesen är att seriell korrelation existerar. Vid förekomsten av seriell korrelation kan detta enligt Stock och Watson (2015, s. 413) hanteras genom att använda sig av robusta standardfel i modellen.

4.6.4 Outliers

Outliers är värden som avviker från de övriga värdena i en population och är ett vanligt förekommande fenomen vid statistiska undersökningar. Moore et al. (2011, s. 21) menar att dessa bör diskuteras då de kan komma att påverka resultatet i den mån att felaktiga slutsatser dras. En observation vars värde ligger långt från de övriga är inflytelserik och bör hanteras om justerandet eller borttagandet av den ändrar resultatet av regressionsanalysen (Moore et al., 2011, s. 111). Vidare menar Barnett och Lewis (1994, s. 33) att dessa extrema observationer kan bero på flera saker, däribland mätfel och tillvägagångssätt men även till följd av variation mellan observationerna, där det inte alltid är lämpligt att exkludera dessa värden.

För att inte urvalet ska påverkas i lika stor utsträckning genom borttagandet av outliers så går det att delvis ta bort de. Detta kallas för Winsorization, vilket innebär att de outliers som finns ersätts av värdet från den mest närliggande observationen (Barnett & Lewis, 1994, s. 41). För att kontrollera om extrema värden finns i vårt data har vi använt oss av

låddiagram såsom exempel Jarman (2015) gjort och även residualplottar vilket Barnett och Lewis (1994, s. 17) förklarar ger en tydlig bild av förekomsten av eventuella outliers.

Då studien gäller perioden 2002-2019 inkluderar det även åren kring finanskrisen 2007-2008 där det skulle kunna förekomma ovanligt höga eller låga värden som påverkar studiens resultat och de slutsatser vi drar. Det är något som vi kontrollerat för med hjälp av linjediagram på medelvärdet för vardera variabel för att undersöka om finanskrisen lett till att dessa avviker märkvärt eller följer något särskilt mönster.

4.6.5 Kausalitet

Kausalitet är ett relevant problem för denna studie eftersom den bygger på beroende och oberoende variabler i syfte att identifiera vad som kan förklara de beroende variablerna som utgörs av total, långsiktig samt kortsiktig skuldsättningsgrad. Detta är något som går i linje med kvantitativ forskning där Bell et al. (2019, s. 117) menar att man är mer intresserad av att beskriva varför snarare än hur fenomenet man vill undersöka beter sig.

Med tanke på detta bör det vid användandet av variabler diskuteras om kausalitet föreligger och hur det påverkar resultatet. Kausalitet eller orsakssamband handlar om vad som påverkar vad och man bör här ställa sig frågan att om A påverkar B, kan vi då med säkerhet fastställa att det endast är A som påverkar B eller finns det någon annan variabel som är orsaken till detta samband? (Bell et al. 2019, s. 47). Dock är det inte helt enkelt att ta itu med problemet gällande kausalitet då det i de flesta fall inte går att visa kausalitet helt utan att man i stället bara kan diskutera och dra en slutsats kring det (Bell et al. 2019, s. 47). Detta är något som även visat sig i tidigare studier kring kapitalstruktur där exempelvis Alipour et al. (2015, s. 73) beskriver att sambandet mellan företagsskatt och långsiktig skuldsättningsgrad kan bero på omvänd kausalitet men där författaren inte visar på om det verkligen finns ett orsakssamband eller inte.

Viktigt att poängtera är att kausalitetssamband kan leda till mindre säkra och trovärdiga slutsatser då det inte med säkerhet går att säga vad som förklarar vad och hur det sambandet ser ut, vilket påverkar validiteten i studien, där kausalitet ofta benämns som intern validitet (Bell et al., 2019, s. 46). Det går att lösa problematiken kring kausalitet menar Studenmund (2014, s. 390) med hjälp av en modell med tidsförskjutning (se modell 2), där man undersöker om A påverkar B i en annan tidsperiod, vilket i vårt fall till exempel blir om andelen materiella tillgångar 2015 påverkar skuldsättningsgraden 2016, där principen även är applicerbar för de övriga variablerna. Merparten av tidigare studier om påverkansfaktorer för kapitalstruktur genomför dock huvudsakligen sina regressionsanalyser utan tidsförskjutning. För att få högsta möjliga jämförbarhet av resultatet med tidigare studier kommer vi att göra likadant. Däremot har vi även genomfört vi regressionsanalyserna med tidsförskjutning på en period för att behandla problematiken med kausalitet och resultatet av dessa analyser presenteras i Appendix 2.

Related documents