• No results found

Statistisk analys

2. Teori och tidigare forskning

3.10. Statistisk analys

I detta stycke vill jag passa på att beskriva de utgångspunkter jag använt när det gäller den statistiska analysen.

Ett generellt ideal för statistik är förstås att låta ”siffrorna tala för sig själ-va”, vilket jag uppfattar som att ju mindre forskaren behöver lägga siffrorna tillrätta desto bättre. Men i själva verket består arbetet med kvantitativa da-ta just av att lägga siffror tillrätda-ta. Successivt skalas mer och mer uppgifter bort från datamaterialet som i någon mening blir renare och renare, och man kallar också en av de första faserna i detta arbete för tvättning. Redan i kod-ningsfasen ingår en del tillrättalägganden som inbegriper tolkningar av vad

47

den som svarat egentligen menade och hur denna mening ska representeras i en standardiserad datamatris.

Till exempel kan uteblivna svar tolkas på olika sätt, beroende på om jag som kodar ser en systematik i de uteblivna svaren eller inte. Enkäten som använts är ovanligt omfattande, på ett uppslag i enkäten ryms 232 rutor där de som svarar på enkäten förväntas sätta 90 kryss (frågorna 23-25, på sidorna 8-9 i enkäten), och för samtliga frågor finns ett ”Nej” alternativt ”Aldrig” alternativ. Några av de som svarat på enkäten har systematiskt avstått från att svara i ”Nej” och ”Aldrig” rutorna utan har enbart satt kryss i några rutorna som innebär ett positivt svar (det vill säga att mannen har gjort det som frågats efter). I de fallen har jag inte tolkat ett uteblivet svar som en tvekan om vad svaret skulle vara, eller en ovilja att avge ett svar, utan istället tolkat mönstret som ett sätt för den svarande att spara tid och energi genom att hoppa över kryss som innebär ett nekande svar.

Ett annat exempel på hur mina tolkningar påverkar kodningsprocessen har varit svaren på frågan ”Hur många gånger har ni diskuterat att du vill se-parera?” (fråga 27 på sidan 9 i enkäten). De flesta har svarat med en siffra, men relativt många har svarat med en fras som ”många” eller ”några”. Någ-ra har svaNåg-rat ”1000”, eller ”tusen”, vilket i och för sig är en siffNåg-ra, men som jag ändå har tolkat som ett uttryck för att man talat om separation många gånger, snarare än just 1000 gånger. Efter att ha läst igenom många enkäter bestämde jag mig för att koda ”många” som ”20” gånger och ”några” som ”3” gånger, och att koda alla siffror större än 20 som 20. Genom att göra så

reducerade jag informationsinnehållet i svaren på den frågan, i datamatrisen

är skillnaden mellan de som svarat ”100”, ”20” och ”många” abstraherad. Att reducera informationsinnehållet är essensen i all statistisk analys, så man kan förstås inte generellt undvika datareduktion, men vad man kan undvika är att införa godtyckliga tröskelvärden i samband med datareduktion.

Många godtyckliga tröskelvärden, eller klassindelningar vilket är att annat ord för samma fenomen, uppstår redan vid konstruktion av enkäter när fors-karen utformar fasta svarsalternativ för kontinuerliga variabler. Att använda fasta svarsalternativ istället för att låta intervjupersonen skriva en siffra har vissa praktiska fördelar, de viktigaste att snabba upp ifyllandet av enkäten och att underlätta maskinell kodning underlättas. I enkäten finns många ex-empel på detta, fråga 68 och 69 om kvinnans och mannens inkomst före och efter separation, men även många av frågorna som rör hur många gånger något skett, till exempel frågorna 18-19, 20 samt 21-24 som har olika fasta svarsalternativ. De praktiska fördelar som fasta svarsalternativ innebär (även för kontinuerliga variabler) kompenserar i många fall nackdelen att forskaren infört godtyckliga tröskelvärden. Det jag aktivt försöker undvika är i första hand godtyckliga klassindelningar i efterhand.

Vad är då problemet med godtyckliga klassindelningar? Godtyckliga klass-indelningar kan göra samvariationer omöjliga att upptäcka eftersom infor-mationen om ordningen förvanskas. Korrelationskoefficienter som bygger på rangordning framstår som svagare än vad de egentligen är, och icke-linjära samband riskerar att döljas. För att presentera samvariationer mellan två el-ler fel-ler kontinuerliga variabel-ler har jag därför i första hand använt en grafisk metod där varje punkt motsvarar ett fall och i andra hand använt klassinde-lade korstabeller.

Korrespondensanalys

En annan analysmetod som inte förutsätter godtyckliga klassindelningar är korrespondensanalysen. Korrespondensanalysen är en generell statistisk me-tod för att beskriva strukturen i tabeller. Resultaten av en genomförd kor-respondensanalys är att varje kolumn och varje rad tillskrivs en koordinat i flerdimensionellt rum, så att kolumner och rader som liknar varandra hamnar på koordinater nära varandra i rummet. En rad liknar en kolumn genom att den cell i tabellen där de möts har ett relativt högt värde. Två rader liknar varandra i samma utsträckning som den inbördes storleksordningen på värde-na i deras celler likvärde-nar varandra. Två rader med olika stor radsumma (summan av värdena i respektive rads celler) kan alltså ändå vara identiska, tack vare att korrespondensanalysen innebär en normering samtliga rad- respektive ko-lumnsummor. En effekt av denna normering är att skillnaden mellan vanliga och ovanliga fenomen abstraheras bort, vilket ibland är önskvärt, men också innebär begränsningar för vad korrespondensanalysen kan användas till.

Jag använder korrespondensanalys för två analyser: analysen av vilka vålds-former som är förknippade med vilka perioder (kapitel 7) och i analysen av vad som utmärker förhandlingarna om barnen för mammorna från de olika urvalsgrupperna (kapitel 9). I det förra fallet har korrespondensanalysen, i jämförelse med korstabeller och diagram över frekvenser, fördelen att den kan hantera skillnaden i hur mycket våld, av olika typer av våld, som män använt under de respektive perioderna. I det senare fallet använder jag den för att sammanfatta ett antal korstabeller.

En analysmetod som har en framträdande roll i den här avhandlingen är faktoranalys, men beskrivningen av faktoranalysen har placerats i det sam-manhang där metoden används, kapitel 6.