Antaganden om multipel regression - Jämställdhet i bolagsstyrelser

3. Metod

3.9 Antaganden om multipel regression

Enligt Hair et al. (2014) finns det olika antaganden gällande multipla analyser. I avsnitten 3.8.1 till 3.8.5 kommer en förklaring till hur forskarna har testat data gällande antaganden om normalitet, homoskedasticitet, multikollinearitet, feltermernas oberoende samt linjäritet.

3.9.1 Normalitet

Antagandet om normalitet innebär att kvantitativ data och dess korrespondens är normalfördelad. Resultaten av de statistiska testen från data som har en stor eller liten variation från normalfördelningen antas vara ogiltig eftersom F och t statistik används vid antagandet av normalitet. Eftersom urvalet i studien innehaft över 200 observationer har effekten som normaliteten kan ha på urval som består av mindre än 50 observationer avtagit (Hair et al., 2014). I studien har forskarna även analyserat variablernas skewness och kurtosis för att undersöka om data inte följer en normalfördelning, vilket är ett tillvägagångssätt som Hair et al. (2014) rekommenderar för att undersöka normalitet i data. Skewness används för att undersöka fördelningen av data, där ett positivt värde ger ett utslag till höger om normalfördelningen och ett negativt värde ger ett utslag till vänster om normalfördelningen (Hair et al., 2014). Kurtosis beskriver datans normalfördelning gällande extremvärden, där värden över 3 indikerar på att extremvärden föreligger i data. Värden under 3 antyder på att extremvärden inte är lika förekommande (Hair et al., 2014). Vidare analys av skewness och kurtosis påvisade att några variabler inte uppfyllde kravet på normalitet. Kriteriet för att data ska antas vara normalfördelad är att värdet på skewness är 0 och värdet på kurtosis är mellan värdena 3 och -3. Variabler som inte uppfyllde dessa krav transformerades genom logaritmering vid positiva icke-normalfördelade värden och genom att kvadrera negativa icke-normalfördelade värden. Att logaritmera eller kvadrera för att förändra variablernas värden är enligt Hair et al. (2014) en åtgärd som kan utföras för att data ska kunna uppfylla kravet på normalitet i större utsträckning. Data gällande könsfördelning i företag kunde argumenteras för att behövas justeras för att uppfylla antagandet om normalitet. Men eftersom denna kodades om till en dummyvariabel för jämställda och icke-jämställda företag samt bevittnades visuellt som normalfördelad utfördes ingen transformering för denna variabel. I studien har även värdena på residualerna undersökts med hjälp av p-p diagram för att se om dessa är normalfördelade. Desto närmare värdena ligger vid den räta linjen desto mer normalfördelade är residualerna (Hair et al., 2014). Efter att ha undersökt för normalitet i modellen antogs kravet för normalitet vara uppfyllt.

oberoende variabelns värden. Den beroende variabelns värdespridning bör vara liten vid stora värden på den oberoende variabeln och vise versa. För att testa variablernas homoskedasticitet i studien har forskarna skapat spridningsdiagram. Enligt Hair et al. (2014) kan homoskedasticitet visuellt undersökas genom spridningsdiagram och med dessa kontrolleras det för att punkterna inte utgör en diamantformad eller triangelformad fördelning. Hair et al. (2014) menar att en diamantformad fördelning förekommer när mer variation finns i mitten av diagrammet än vid varje enskild sida av diagrammet. Analysen är fördelaktig att använda vid en multipel regressionsanalys där variablernas varians ska undersökas. Hair et al. (2014) menar att variabler som som inte uppnår homoskedasticitet kan transformeras för att göra variablerna mer tillmötesgående till dessa krav. Hair et al. (2014) fortsätter och skriver att ett tillvägagångssätt är att logaritmera eller kvadrera värden. Eftersom variabler som inte varit normalfördelade transformerades i denna studie förbättrades också deras homoskedasticitet varför antagandet om homoskedasticitet antogs vara uppfyllt.

3.9.3 Multikollinearitet

Multikollinearitet är enligt Hair et al. (2014) korrelationen mellan de oberoende variablerna. Vid multipel regressionsanalys måste forskaren ta hänsyn till multikollinearitet och kontrollera att korrelationen inte är för hög mellan de oberoende variablerna. Ett sätt att mäta multikollinearitet är genom Variance Inflation Factor (VIF) och VIF bör enligt Hair et al. (2014) inte överstiga 10. I denna studie hade samtliga variabler en VIF under 10 och antagandet om multikollinearitet antogs därför vara uppfyllt.

3.9.4 Linjäritet

Hair et al. (2014) påstår också att det finns ett linjärt antagande i multipla analyser. Korrelation kan enbart representera det linjära sambandet mellan variabler och av den anledningen ska korrelationsvärdet inte innehålla effekter från icke-linjära samband. Om dessa effekter bortses från resulterar det i en underskattning av sambandets faktiska styrka. Med linjäritet i åtanke är det enligt Hair et al. (2014) rimligt att alltid undersöka om korrelationen kan påverkas av eventuella avvikelser från linjäritet. När det gäller individuella variabler förknippas det linjära sambandet som sambandet mellan varje par av variabler och dess korrelationskoefficients förmåga att på ett användbart vis

representera förhållandet mellan variablerna. För att undersöka det linjära sambandet valde forskarna att analysera förhållandena visuellt för att avgöra om det fanns icke-linjära samband. En undersökning av linjäritet på variablernas residual utfördes också. Efter analys av variablerna antogs antagandet om linjäritet vara uppfyllt.

3.9.5 Feltermernas oberoende

Ett annat antagande för multipel regressionsanalys är enligt Hair et al. (2014) att feltermerna ska vara oberoende. Vid utförandet av multipel regressionsanalys är ett primärt fokus att försöka säkerställa att prediktionsfel inte korrelerar med varandra. Om alla andra error visar på ett mönster som är positivt samtidigt som ett alternativt error är negativt kan slutsatsen dras att det finns ett systematiskt samband som inte kan förklaras i den beroende variabeln (Hair et al., 2014). Detta innebär att forskare inte kan vara säkra på om deras prediktionsfel är oberoende av de nivåer som forskarna försöker förutsäga. Med andra ord består resultatet av analysen i dessa fall av andra effekter som analysen inte inkluderar. Ett sätt att testa om feltermerna är oberoende är att titta efter autokorrelation vilket görs genom ett Durbin Watson test. Testet resulterar i ett värde mellan 0 samt 4 och om värdet är 2 finns ingen autokorrelation och därmed är feltermerna oberoende. I denna studie var samtliga värden för Durbin Watson närliggande värdet 2 varför antagandet om oberoende feltermen möttes.

In document Jämställdhet i bolagsstyrelser (Page 33-36)