• No results found

Två av måtten som operationaliserats på variablerna kunde inte hämtas i affärsregistret direkt. Hämtad data har istället bearbetats för att beräkna dessa. Summa skulder kunde inte hämtas direkt utan beräknades istället utifrån hämtad data om summa tillgångar och summa eget kapital. Summa skulder beräknades för respektive år som summa tillgångar subtraherat med summa eget kapital. Från summa skulder beräknades i sin tur måttet på kapitalstruktur, skuldsättning (​TSK​) som summa skulder dividerat i summa tillgångar för respektive år och företag.

Företagens registreringsdatum bearbetades för att uttrycka företagens ålder i antal år mellan registreringsdatum och respektive undersökt år, 2015-2018. Vidare beräknades företagens ålder som medelvärdet av ålder för åren 2015-2018 avrundat uppåt till närmsta helår. På samma sätt beräknades samtliga variablers genomsnittliga värden, för respektive företag under åren 2015-2018. I nästa steg görs dataanalysen på de genomsnittliga värdena för varje variabel och företag.

3.6 Dataanalys

3.6.1 Analysmetod

Den metod som tillämpas för dataanalys i undersökningen är multivariat analys. Bryman & Bell (2013) beskriver multivariat analys som analys av minst tre variabler. Multivariat analys motiveras i den här undersökningen eftersom det kan finnas flera variabler än skuldsättning som påverkar företags lönsamhet. Närmare bestämt är det med säkerhet andra variabler som också påverkar ett företags lönsamhet, exempelvis företagsstorlek, ålder och SG, vilka operationaliserats som kontrollvariabler. Bryman & Cramer (2011) menar att multivariatanalys kan exkludera andra potentiella variabler som kan kontaminera det studerade sambandet. Företagsstorlek, ålder och SG är sådana variabler som exkluderas genom multivariat analys för att få en mer korrekt analys av samband mellan skuldsättning och lönsamhet. Syftet med multivariat analys är således att beakta fler oberoende variabler som kan tänkas påverka företags lönsamhet. Det finns flera sätt att genomföra multivariata dataanalyser. Bryman & Cramer (2011) diskuterar flera, varav en är den metod som tillämpas

i den här undersökningen. Vald metod för dataanalys är multipel regressionsanalys. Det är den mest använda metoden för multivariata analyser, speciellt vid analyser av mer än tre variabler (Bryman & Cramer, 2011), som i den här undersökningen. Det är också den metod som tillämpats i tidigare nämnda undersökningar av Abor (2005) och Gill, Birger & Mathur (2011). Både Abor (2005) och Gill, Birger & Mathur (2011) inkluderade även företagsstorlek och SG med andra som kontrollvariabler i dataanalysen. Utöver antalet variabler i aktuell undersökning samt metod i tidigare forskning motiveras multipel regressionsanalys av metodens möjlighet att analysera och bestämma de oberoende variablernas relativa betydelse för den beroende variabeln. Eftersom den här undersökningen även innefattar två mått på den beroende variabeln lönsamhet görs dataanalysen i två omgångar. Först görs multipel regressionsanalys på de oberoende variablerna och ROA, sedan görs ytterligare en multipel regressionsanalys på de oberoende variablerna och ROE. Dataanalysen görs i statistikprogrammet SPSS och följer den metod som tillämpats av Abor (2005) och Gill, Birger & Mathur (2011).

3.6.2 Regressionsmodell

För att analysera sambandet mellan skuldsättning och ROA respektive ROE används följande regressionsmodeller (Bryman & Cramer, 2011):

ROA​i, t = a + ​b​1TSK​i, t + ​b​2STO​i, t + ​b​3ÅR​i, t + ​b​4SG​i, t​+ ​e​i, t (1) ROE​i, t = a + ​b​1TSK​i, t​ + ​b​2STO​i, t + ​b​3ÅR​i, t​ + ​b​4SG​i, t+ ​e​i,t (2) där:

ROA​i​, t = resultat efter finansnetto + räntekostnader / totala tillgångar för företag ​i​,

tidsperiod ​t​;

ROE​i, t = resultat efter finansnetto / ((0,78 * obeskattade reserver) + eget kapital) för företag ​i​, tidsperiod ​t​;

TSK​i, t​= totala skulder / totala tillgångar för företag ​i​, tidsperiod ​t​; STO​i, t = antal anställda för företag ​i​, tidsperiod ​t​;

ÅR​i, t​ = registreringsdatum för företag ​i​, tidsperiod ​t​;

ei,t = error term, den del av den beroende variabeln som inte förklaras av de oberoende variablerna.

Det finns två typer av regressionskoefficienter; ​unstandardized coefficients​och ​standardized coefficients​, vilka översätts och vidare kommer benämnas som ostandardiserad koefficient respektive standardiserad koefficient. Den ostandardiserade koefficienten uttrycker förändringen i den beroende variabeln för varje en enhet förändring i den oberoende variabeln. På grund av att olika oberoende variabler mäts med olika mått är respektives ostandardiserade koefficient inte direkt jämförbara för att dra slutsatser om vilken oberoende som är viktigast för den beroende variabeln. För att kunna göra en sådan jämförelse mellan de oberoende variablerna används istället den standardiserade koefficienten, vilken matematiskt beräknas genom att kvoten av respektive oberoende variabels standardavvikelse och den beroende variabelns standardavvikelse multipliceras med den ostandardiserade koefficienten för respektive oberoende variabel. Vidare tolkas den standardiserade koefficienten på samma sätt (Bryman & Cramer, 2011). Båda koefficienterna beräknas i SPSS, men det är den standardiserade koefficienten som analyseras, eftersom aktuella oberoende variabler mäts olika.

3.6.3 Andra Koefficienter

Viktigt att tänka på vid multipel regressionsanalys är multikollinearitet - risken för ostabila koefficienter. Ett vanligt mått på multikollinearitet är den så kallade ​variance inflation factor (​VIF​) (Hair, 2014). Måttet beräknas i SPSS för båda regressionsanalyserna, följaktligen redogörs inte uträkningen av måttet. En riktlinje för vad som är för hög multikollinearitet är VIF värden som överstiger 10, men även lägre VIF värden på exempelvis 5 och 3 kan innebära problem (Hair, 2014).

Vidare beräknas även koefficienten som på engelska heter ​multiple coefficient of determination (​R​2), vilken syftar till att förklara hur väl de oberoende variablerna förklarar den beroende variabeln. R​2 uttrycker hur många procent av variansen i den beroende variabeln som förklaras av de oberoende variablerna i modellen. Det finns också en justerad version av koefficienten, ​adjusted ​R​2​. Justerad R​2 tar även hänsyn antal enheter och antal oberoende variabler men tolkas på samma sätt som R ​2 (Bryman & Cramer, 2011). Även R ​2

och adjusted R​2 ​behöver beräknas i två omgångar för att ta reda på hur väl de oberoende variablerna förklarar respektive mått på den beroende variabeln.

3.6.4 Statistisk Signifikans

Den statistiska signifikansen kan testas både för den multipla regressionen som helhet och för varje individuell oberoende variabel (Bryman & Cramer, 2011). Eftersom det primärt är en av de oberoende variablerna ( ​TSK​) som är av intresse i den här undersökningen - de andra används som kontrollvariabler, testas den statistiska signifikansen för varje enskild oberoende variabel. Även det här görs i SPSS genom beräkning av så kallat ​t värde för varje regressionskoefficient, ​t värdet används sedan i ett ​two-tailed signifikanstest (Bryman & Cramer, 2011). Variabler med ett ​t värde som motsvarar en signifikans på mindre än 0,05 är signifikanta på 95 % konfidensnivå.

3.6.5 Extremvärden

Extremvärden, eller på engelska kallat ​outliers exkluderas från analysen eftersom de är vad som också benämns som inflytelserika observationer eller ​influential observations​. Den huvudsakliga orsaken till att extremvärden tas bort är att de inte är representativa för populationen, vilket är essentiellt eftersom syftet är att kunna generalisera resultaten över populationen. Om de inte exkluderas riskerar de att påverka resultatet av analysen så mycket att några generella slutsatser inte kan dras (Hair, 2014).

Extremvärden har identifierats med multivariat metod. Först skapas måttet och variabeln Mahalanobis (​D​2​) som innefattar samtliga variabler i regressionsmodellen. Mahalanobis ( ​D​2​) divideras sedan med frihetsgraderna (​df​), vilka motsvarar antalet variabler i regressionsmodellen, för signifikanstest av extremvärdena. Observationer i det här fallet företag med ett ​D​2​/​df värde på mindre än 0,001 har exkluderats som extremvärden (Hair, 2014). Totalt 55 företag exkluderades med extremvärden.

Related documents