• No results found

3. Metod

3.4 Datainsamling och bearbetning

Datainsamling har skett med hjälp av Retriever Business vilket är en databas som insamlar data från den statliga myndigheten Bolagsverket. Genom denna databas hämtas företagens årsredovisningar och studien erhåller så kallad sekundärdata. Anledning till att detta görs är att det inte vore möjligt att sammanställa all data från företagens årsredovisning direkt på grund av den stora målpopulationen. Med hjälp av filtreringen som databasen erhåller är det möjligt att sortera vilken typ av data som ska erhållas från årsredovisningen. Filtreringen gjordes utefter följande kriterier: noterade företag, onoterade företag, minst 20 miljoner i omsättning, totala skulder, materiella anläggningstillgångar, totala tillgångar, nettoomsättning, rörelseresultat, eget kapital och skulder samt bransch. Anledningen till att dessa kriterier valdes var för att dessa nyckeltal används i genereringen av studiens valda variabler. Gränsen på 20 miljoner valdes eftersom företag med en omsättning under detta klassas enligt Europeiska kommissionen som ett mikroföretag (Europeiska kommissionen, 2020). Således kommer studien enbart innefatta SME och större företag eftersom detta är det vanligaste tillvägagångssättet i tidigare studier. Detta beror på att mikroföretag har svårare att erhålla extern finansiering vilket gör att POT och TOT inte är applicerbara teorier då de förutsätter att företagen kan erhålla externt kapital (López-Gracia & Sogorb-Mira, 2008).

Den insamlade data sammanställdes därefter i Microsoft Excel där den sorterades efter år och företag. I Excel producerades sedan de nyckeltal som studien använder sig av i regressionsmodellen. Därefter krävdes manuell hantering av data eftersom alla företag inte varit noterade alternativt onoterade under hela den valda tidsperioden. I förlängningen innebär detta att ett visst bortfallsfel kan uppstå, närmare bestämt variabelbortfall (Dahmström, 2011). Eftersom studien har för avsikt att observera skillnader mellan onoterade och noterade företag och de bestämmande faktorerna för kapitalstruktur är det relevant att alla företag faller under någon av kategorierna under tidsperioden. De företag som inte varit antingen noterade eller onoterade under hela tidsperioden rensades bort eftersom de inte anses ha fullständig information för att falla inom ramen för målpopulationen. Eftersom bearbetning i vissa steg har skett manuellt finns det en risk att vissa felaktigheter uppstår, men ett sätt att undvika detta enligt Dahmström (2011) är att inte ändra variablerna under studiens gång. Med det i beaktning har studien förhållit sig till samma variabler genomgående. Retriever Business filtreringsfunktion fungerar enbart på det senaste året som data tas fram på, eftersom vi tog fram data för tidsperioden 2010–2018 fanns det företag som inte uppnådde studiens krav. Dessa togs manuellt bort i Excel efter att data exporterats från Retriever Business. Vissa data fanns inte i databasen Retriever Business då kompletterades den data från företagens årsredovisningar, om den inte fanns där togs det aktuella företaget bort från studien.

Vid insamling av data kan ett så kallat täckningsfel uppstå. Ett täckningsfel kan antingen bestå i undertäckning eller övertäckning. Där det förstnämnda innebär att det finns objekt i studiens målpopulation som inte tagits med i urvalet eftersom objektet saknar anknytning till urvalsramen (Dahmström, 2011). Detta är något som denna studie måste ta i beaktning eftersom filtrering har skett efter en viss tidsperiod baserat på företag som registrerats i den aktuella databasen. Risken

finns att alla företag inte har hunnits registrerats och således inte dyker upp i undersökningen, för att minimera den risken valde författarna att inte undersöka året 2019 utan dra gränsen vid 2018. Övertäckning å andra sidan innebär att det finns objekt som sammankopplas till urvalsramen trots att de inte tillhör målpopulationen. Risken för övertäckning är inte lika överhängande då företag utanför den valda tidsperioden inte kommer med i och med att filtreringen utesluter detta. För att undvika övertäckning markerades "Visa enbart bokslutssiffror för företaget" när data exporterades från Retriever Business då flera av de börsnoterade koncernen företagen redovisar som en koncern och har onoterade dotterbolag. Detta hade inneburit att samma data inkluderats hos de noterade och onoterade bolagen. Funktionen ser även till så att data inte räknas dubbelt för onoterade koncernföretag med både moder- och dotterbolag i målpopulationen för onoterade företag (Dahmström, 2011).

Efter att data har sammanställts i Excel så importerades den till det statistiska verktyget STATA. Anledningen till att just det verktyget används beror på att det är vad som tillhandahålls på Örebro Universitet.

Urvalet för de onoterade företagen var efter export från Retriever Business 38 401. Den exporterade finansiella informationen hanterades sedan manuellt och alla företag som inte uppfyllde kraven, som inte Retriever Business redan sorterat bort, togs bort manuellt. Det kunde exempelvis vara att ett företag uppfyllde kravet på omsättning år 2018 men inte något annat år och dessa företag togs då bort. Det fanns även företag som helt saknade data av olika anledningar. Stickprov som gjordes på företag som saknade data visade att det kunde bero på att företaget antingen inte var grundat än, att det var något fel på årsredovisningen då följande felmeddelande visades “Informationen saknas eller är felaktig i bokslutet 20XX-XX: Nedräkning av resultaträkningen stämmer ej” eller att siffrorna inte registrerats korrekt i Retriever Business. När detta skedde lades rätt data in manuellt. Dock kunde inte alla företag som saknade data kontrolleras då det rörde sig om ett stort antal och dessa exkluderades istället från studien. I enighet med andra studier som exempelvis Frank och Goyal (2003) togs alla finansiella företag bort då dessa företag har en speciell kapitalstruktur eftersom deras in och utlåning varierar kraftigt och ofta. Efter bearbetningen av data återstod 15 060 företag noterade företag.

Efter export av de noterade företagens data innehöll filen inledningsvis 505 företag. Datan hanterades på samma sätt som de onoterade företagen men eftersom målpopulationen enbart var företag som hade varit noterade under hela perioden behövde information om vilket år alla företag börsnoterades samlas in, detta gjordes från Avanza och företagets hemsidor/årsredovisningar. Målpopulationen var efter databearbetning 114 företag.

När målpopulationen sammanställts importerades den till Stata där variablerna undersöktes för att identifiera outliers. Outliers är så kallade extremvärden som inte är relevanta för studien men påverkar resultatet så det kan bli missvisande (Studenmund, 2006). Exempelvis är inte -2 337 083 och 18 656,29 representativt för skuldsättningen för de onoterade företagen år 2017 när

medelvärdet ligger på 8.946696. För att hantera outliers användes Stats winsorization funktion vilken ersätter tal utanför en viss percentil med ett tal närmare medelvärdet. Två vanliga tillämpningar av funktionen är att tal under 5:e och över 95:onde percentilen ersätts med talet i den 5:e respektive 95:e percentilen alternativt att tal under 1:a och över 99: onde percentilen ersätts med den 1:a respektive 99:onde percentilen (Brownen-Trinh, 2019). Fördelen med funktionen menar Ghosh och Vogt (2012) är att extremvärdena inte tas bort utan istället blir mer lika de andra värdena vilket förbättrar modellens estimeringar. Nackdelen med winsorization menar författarna är att värden som är representativa kan ändras. Med detta i beaktning och efter att ha testat båda varianterna valdes den 1:a och 99: onde percentilen då författarna ville förändra datan så lite så möjligt och det räckte för att får bort de outliers som fanns. Efter att datan winsorizats sjönk medelvärdet från 8,946696 till 4,944656 år 2017 för de onoterade företagen. Detta indikerar att extremvärdena hade en enorm påverkan på medelvärdet då det nästan halverades genom att förändra 2 % av observationerna. Att ta bort outliers på skuldsättningen är även något som görs i liknande studier i ämnet se exempelvis Yazdanfar och Öhman (2014) eller Frank och Goyal (2002).

Related documents