• No results found

Tillvägagångssätt

In document Blir företag bättre med tiden? (Page 25-37)

Metodologin för studien har utgått från en teoretisk problemformulering och utformning av studiens frågeställning, vilket utmynnat i hypoteser som testats empiriskt.

Efter en genomgång av tidigare teoretiska och empiriska bidrag samt en tydlig problembeskrivning samlades data in utifrån de variabler som bedömts vara relevanta för att

25 Översatt från engelskans ​economies of scale and scope

besvara studiens frågeställning. Datan samlades in från databasen Orbis och formaterades i Excel för att sedan behandlas och analyseras i EViews.

Den framtagna datan bestod av både tvärsnittsdata och tidsseriedata då variablerna analyseras för flera företag och för flera olika år. Då paneldata består av flertalet upprepade observationer av tvärsnittsdata är det en lämplig metod för att studera dynamiska förändringar (Baltagi, 2002). De sammanställda observationerna resulterade i en obalanserad paneldata, vilket innebär att det inte finns data för varje år och företag (Stock & Watson, 2014). Den främsta anledningen till att datan är obalanserad är att vissa företag i urvalet grundades under den tidsperiod som studerades. Hade ett balanserat dataset använts för vidare analys skulle det därmed finnas en systematisk anledning till detta bortfall. Denna problematik hade kunnat leda till​biased estimators26 ​(Wooldridge, 2016). För att inte förlora betydande observationer från nygrundade företag genomfördes studien med ett obalanserat dataset.

Syftet med studien är att undersöka sambandet mellan den oberoende variabeln företagsålder och den beroende variabeln EBITDA-marginal. För att minska risken för omitted variable ​bias inkluderades ett antal kontrollvariabler. Dessa är ​likviditet​, soliditet​, skuldsättningsgrad och ​storlek. Kontrollvariabeln ​storlek logaritmeras i regressionsanalysen då det minskar variansen på variabeln, samt att det från ett teoretiskt perspektiv är mer naturligt att tala om den procentuella skillnaden på företagsstorlek snarare än i absoluta termer (Stock & Watson, 2014).

Vid hantering av paneldata finns det olika metoder och modeller för att genomföra en regressionsanalys. En av metoderna är ​Ordinary Least Squares (OLS)​där en linjär trendlinje

26Inom statistiken innebär det en snedvridning av en estimators skillnad mellan dennes förväntade värde och det verkliga värdet på den parameter som uppskattats.

skattas utifrån de observerade datapunkterna. Vidare utförs detta genom att minimera residualernas kvadratsumma, vilket i sin tur minimerar värdenas avstånd till den skattade trendlinjen (Brooks, 2014). Vid paneldata resulterar denna metod i en ​pooled OLS estimation.

Nackdelen med metoden är att alla observationer hanteras som en unik enhet (Wooldridge, 2016). För denna studie innebär det att metoden inte tar hänsyn till att samma företag studeras under flera tidsperioder. Ett grundantagande i OLS är att variablerna är oberoende och identiskt distribuerade. Detta antagande bryts om det finns en korrelation mellan observationerna (Stock & Watson, 2014). Denna metod riskerar därmed att generera felaktiga resultat samt eliminera tidseffekten av paneldata.

Till följd av problematiken som beskrivits ovan kommer studien tillämpa en ​Fixed Effects Model. Modellen kontrollerar för variabler som är observerade, vilket sker genom att fixera tvärsnittseffekter, tidseffekter eller båda. När fixering för tvärsnittseffekter sker kontrollerar detta för icke observerade variabler som skiljer sig mellan enheter men som är konstanta över tid. I detta fall så fixeras skillnaderna mellan företagen som inte fångas upp av kontrollvariablerna. Att fixera för dess tvärsnittseffekter är ett huvudverktyg vid hantering av paneldata och kan ses som en utökning av en multivariabel regressionsanalys. En modell som fixerar för tvärsnittseffekter har ​N​olika intercept, ett för varje enhet. För denna studie skulle detta innebära 2 678 intercept, ett för varje företag. Dessa intercept kan ses som ett set med binära variabler som representerar den påverkan som icke observerade variabler har på respektive enhet. I generella termer ser en fixerad modell för tvärsnittseffekter ut på följande sätt:

Yit = ​β​1Xit + ​α​i + uit​där ​α​i = ​β​0 + Zi

αi=​β​0+Zi ​är regressionslinjen för populationen för respektive ​företag ​i ​där Z​ i​fångar de icke observerade variablerna som påverkar respektive företag och ​β​0 ​är interceptet för detta företag. Ekvationen Yit=​β​1Xit+​α​i+uit ​är en regressionsmodell för fixerade tvärsnittseffekter där αi behandlas som ett intercept för respektive företag. Lutningskoefficienten ​β​1 ​är således densamma för alla företag medan interceptet ​α​i varierar. Variationen i ​α​i ​representerar effekten av en specifik enhet och kommer från​ Z​i​(Stock & Watson, 2014).

Precis som det går att fixera för tvärsnittseffekter går det även fixera för tidseffekter.

Tidseffekter är de icke observerade effekter som varierar över tid men som påverkar alla enheter likadant. I generella termer ser en fixerad modell för tidseffekter ut på följande sätt:

Yit = ​β​1Xit + λt + uit ​där ​ λ​t = ​β​0 + St

λt=​β​0+St ​är regressionslinjen för populationen för respektive tidsperiod och fångar de icke observerade effekter som förändras över tid men som inte skiljer sig mellan de olika enheterna. Om ​S​t ​är korrelerat med ​X​it måste det tas hänsyn till dessa tidseffekter, annars kommer modellen att lida av omitted variable bias. Eftersom ​S​t ​ändras över tid men inte mellan enheter kommer en fixerad modell för tidseffekter ha ett intercept för respektive tidsperiod. Dessa intercept representeras med ​λ​t .

Det går även att använda en modell som fixerar för både tvärsnittseffekter och tidseffekter. I generella termer ser denna kombination av tvärsnittseffekter och tidseffekter för fixerade modeller ut på följande sätt:

Yit = ​β​1Xit + ​α​i + λt + uit

Här ​representerar ​α​ ienhetsfixeringen och​λ​ttidsfixeringen. Modellen kan redogöras genom att använda N ​ 1 enhetsbinära indikationer och T ​1 tidsbinära indikationer tillsammans med ett gemensamt intercept för modellen (Stock & Watson, 2014).

För att kunna använda sig av en modell med fixerade tidseffekter måste alla variabler ha en variation över tid. Om någon av variablerna är konstant över tid leder det till perfekt multikollinearitet, vilket bryter mot grundantagandena bakom en fixerad regressionsmodell (Wooldridge, 2016). För att möjliggöra valet att fixera för icke observerade tidseffekter är det inte möjligt att inkludera binära variabler som representerar landstillhörighet. Med bakgrund i detta valdes tre länder ut – Kina, USA och Frankrike, vilket motiverades i avsnittet ​Urval​.

För respektive marknad genomfördes först en analys över den deskriptiva statistiken och därefter olika regressionsanalyser.

Med utgångspunkt i en pooled OLS genomfördes sedan tester för att avgöra om det fanns icke observerade tvärsnitts- och/eller tidseffekter i datan. Därefter valdes den metod som bäst passade datan för en vidare analys. För att avgöra om det fanns icke observerade tvärsnitts- och/eller tidseffekter användes ​Redundant Fixed Effects Test som utfördes i EViews. Genom att fixera för både tvärsnittseffekter och tidseffekter kunde det sedan testas om någon av dessa fixeringar var överflödiga. Nollhypotesen var att effekterna var överflödiga – om p-värdet överstiger signifikansnivån ska nollhypotesen inte förkastas och dimensionen inte fixeras. Testet genomfördes för de två olika dimensionerna, tvärsnitt och tid. Detta testades för i alla regressioner och redovisas således integrerat i varje tabell för respektive regressionsanalys i avsnittet ​Resultat​.

I en paneldata kan residualerna i regressionslinjen vara korrelerade över tid för en enhet, vilket för denna studie innebär att observationer över tid för ett företag är korrelerade med varandra. Likt heteroskedasticitet genererar denna korrelation inte en snedvridning av resultatet i en fixerad modell, men den kommer att påverka variansen av estimeringen. Därför måste hänsyn tas till denna korrelation och standardavvikelser som är robusta för heteroskedasticitet användas (Stock & Watson, 2014). Efter att lämplig modell fastställs27 genomfördes ett antal olika regressioner, dels för att undersöka de olika kontrollvariablerna och deras signifikans, men även för att djupare undersöka sambandet mellan EBITDA-marginalen och företagsålder. Förutom linjära samband undersöktes även exponentiella och logaritmiska samband. En kvadratisk modell skulle innebära att en förändring i företagsålder har en större påverkan i början av företagets verksamhet och att effekten avtar med tiden. Det kan även vara av betydelse att undersöka om det finns ett logaritmiskt samband mellan de två variablerna. Genom att logaritmera variabeln omvandlas förändringar i den oberoende variabeln från absoluta tal till procentuella termer. En modell där den oberoende variabeln logaritmeras medan den beroende är linjär utgör en ​log-linear model. Tolkningen av koefficienten blir i detta fall att en förändring på 1% i ​x är associerad med en förändring i ​y på 0.01​β​1. Det hade även varit av intresse att logaritmera den beroende variabeln och på så sätt uppskatta elasticiteten mellan de två variablerna. Detta hade dock inneburit att den beroende variabeln ändrats från ​y till ln(​y​). Problematiken här är att den

27 För att avgöra om standardavvikelserna krävde korrektion genomfördes ett test för heteroskedasticitet i EViews. Nollhypotesen är att residualerna är homoskedastiska, vilket innebär att om p-värdet överstiger signifikansnivån på 5% ska nollhypotesen förkastas och standardavvikelserna därför korrigeras.

beroende variabeln ändras och värden såsom R ​2 inte längre går att jämföra mellan de olika regressionerna (Stock & Watson, 2014). På grund av detta valdes denna typ av analys bort.

Resultatet analyseras utifrån det teoretiska ramverket i enlighet med studiens deduktiva ansats. Slutligen fördes en avslutande diskussion kring det empiriska resultatet och dess koppling till studiens frågeställning samt i vilken mån den kan besvaras.

Dataanalys

Analysen av datan påbörjades när samtlig data var insamlad och överförd till EViews efter att ha sammanställts i Excel. Den modell som användes för att beskriva sambandet mellan EBITDA-marginalen och företagsålder bygger på olika grundantaganden och att det finns tekniska detaljer som måste tas med i beaktning. Nedan följer en beskrivning av de mest centrala teknikaliteter och dess implikationer för studien.

Multikollinearitet. Multikollinearitet uppkommer när observationer av de oberoende variablerna är korrelerade med varandra. Om multikollinearitet råder kan det uppstå brister i resultatets precision då det inte går att urskilja den enskilda oberoende variabelns inverkan på den beroende variabeln (Alwan, Craig, Duckworth, McCabe & Moore, 2016). Perfekt multikollinearitet uppkommer när två av variablerna är en perfekt linjär funktion av varandra.

Om två variabler är starkt korrelerade med varandra kallas det för imperfekt multikollinearitet (Stock & Watson, 2014). En modell anses lida av multikollinearitet om ett korrelationsvärde mellan två variabler ligger under -0.8 eller över 0.8 (Brooks, 2014). För att undersöka om multikollinearitet förelåg i denna studie användes en korrelationstabell som testade korrelationerna mellan variablerna. Tabellen presenteras i ​Tabell 4. Dock bör det uppmärksammas att i en paneldata blir observationerna för samma företag ofta beroende av

varandra över tid. Detta leder till att den uppmätta korrelationen kan bli missvisande då den behandlar varje observation som oberoende till övriga observationer (Wooldridge, 2016).

Heteroskedasticitet. ​Heteroskedasticitet innebär att variansen för feltermen inte är konstant för samtliga variabler, vilket leder till att variansen är beroende av X ​i. Konsekvensen av heteroskedasticitet är att standardfelen blir inkorrekta, vilket medför att studiens signifikans och konfidensintervall blir felaktiga. Därmed riskerar resultatet att bli missvisande (Wooldridge, 2016). Förekomsten av heteroskedasticitet testades i EViews ​.

Resultatet visade att heteroskedasticitet förelåg och detta korrigerades för med robusta standardavvikelser för regressionsanalyserna.

Autokorrelation. Autokorrelation uppstår när observationer för ett företag är korrelerade över tid. Detta innebär att korrelationen mellan två olika feltermer för samma observerade företag men för två separata år är skild från noll, det vill säga:

(​Corr ​(​ε​t, ​ε​s)​ ≠ 0 ​där​ t ≠ s​)

Konsekvenserna av att datan avger autokorrelation är desamma som diskuterades under avsnittet om heteroskedasticitet. Däremot avtar risken för autokorrelation med tid och då studien består av ett paneldataset där observationer av tvärsnittsdata har gjorts över nio års tid. Detta innebär att tester för autokorrelation inte uppfattades som nödvändiga då det inte ansågs vara ett bakomliggande problem för den här typen av studie (Brooks, 2014;

Wooldridge, 2016).

Metoddiskussion

I följande avsnitt diskuteras och analyseras den valda metoden och urvalet samt vilka implikationer dessa kan tänkas ha för studien.

Validitet. ​Då studien strävar efter att uppnå resultat som kan generaliseras på en population är det av betydelse att studien uppnår hög validitet. Studiens validitet innebär giltigheten i de resultat som studien har för avsikt att uppnå, det vill säga integriteten i slutsatserna som genereras.

Då studien mäter konkurrensfördelar i kvantitativa termer och det tidigare ifrågasatts huruvida detta är möjligt kan det tänkas uppstå brister i mätvaliditeten . Det innebär att 28 studiens definition av en konkurrensfördel i kvantitativa termer riskerar att inte förklara fenomenet på det vis som det ämnar att göra (Bryman & Bell, 2017). I denna studie har ett företags konkurrensfördelar mätts som finansiell prestation i termer av EBITDA-marginal.

Tillvägagångssättet grundar sig i tidigare forskning som talar för att konkurrensfödelar kan mätas i kvantitativa, monetära termer. Det finns därför stöd för att en sådan metod är användbar och meningsfull (Baldwin & Clark, 1991; Lev & Sougiannis, 1992; Reed &

DeFillippi, 1990; Rouse & Daellenbach, 1999).

I en longitudinell studie fångas konkurrensfördelarna och dess utveckling över tid. Att endast studera ett givet år hade medfört att konkurrensfördelar definierades och analyserades utifrån en specifik tidpunkt. Ett enskilt år skulle därmed kunna gynna vissa företag och missgynna andra till följd av icke-kontrollerade faktorer och inte på grund av skillnader i konkurrensfördelar. Över tid bör dock effekten av sådana omständigheter utjämnas, varför studiens validitet ökar när data samlas in för en längre tidsperiod.

Reliabilitet. ​Reliabilitet för studien innebär att den ska vara replikerbar utifrån den beskrivna metoden. Följaktligen ska ett identiskt resultat erhållas, vilket bevisar att slutsatserna inte har orsakats på grund av tillfälligheter och slump (Bryman & Bell, 2017).

För att uppnå en hög reliabilitet har studiens variabler tydligt definierats och urvalet

28 Översatt från engelskans ​measurement validity.

behandlats med transparens. Databehandlingen har genomförts med tydliga motiveringar i syfte att uppnå en hög reliabilitet. Då datan sammanställts från en databas och inte samlats in av författarna själva minimeras även slumpmässiga faktorers påverkan på resultatet. Det faktum att studien bygger på kvantitativ data stärker också reliabiliteten då det underlättar en eventuell replikering. Datan förblir konstant över tid och ger samma utfall även om studien skulle utföras vid ett senare tillfälle (Bryman & Bell, 2017).

Bortfallsanalys. ​Då studien har flertalet uppställda kriterier för urvalet av den informationsteknologiska branschen omfattades inte samtliga av branschens segment. Företag som exempelvis gick i konkurs under den studerade tidsperioden togs inte med i urvalet.

Därmed finns det en skevhet som består i att endast överlevande företag inkluderas, det vill säga endast företag som överlevt tidigare utmaningar som fått andra företag att gå under.

Analysen skulle också kunna bli förvrängd av det bortfall som utgörs av observationer med avsaknad av finansiell data för någon av variablerna. Det urval som uppfyllde alla urvalskriterier bestod av 2 783 företag, men på grund av ofullständig data föll 105 av dessa bort. Bortfallet ansågs dock inte vara av systematisk karaktär och således inte ha någon större påverkan på det slutliga resultatet. Det slutliga urvalet omfattade 2 678 bolag och ansågs vara tillfredsställande som empiriskt underlag för denna studie.

RESULTAT

Det slutgiltiga urvalet bestod av 2 678 unika företag baserade i 54 olika länder, vilket genererade 18 198 observationer. Den data som ligger till grund för vidare analys är en obalanserad paneldata för tidsperioden 2010–2018. ​Tabell 2 visar antalet observationer för respektive år.

Tabell 3 ger en överblick över de olika variablerna och anger värden såsom medelvärde och standardavvikelse för det slutgiltiga urvalet. Från tabellen går det bland annat att utläsa att företagsålder har en spridning på 168 år, samt att medelvärdet är 24.42 år. Det går även att utläsa att EBITDA-marginalen har ett medelvärde på 11.20%.

Tabell 4 anger korrelationen mellan de olika variablerna för att undersöka risken för multikollinearitet. Den starkaste korrelationen uppmättes mellan ​skuldsättningsgrad och soliditet​ där den uppgick till ett värde av -0.58.

Diagram 1 illustrerar observationernas geografiska fördelning och redovisar de 10 länder med flest antal observationer. Från diagrammet går det att utläsa att den största andelen observationer är från Kina med 42% följt av Japan med 17% och USA med 12%.

Frankrike är det europeiska land som har högst andel observationer med 4%.

In document Blir företag bättre med tiden? (Page 25-37)

Related documents