Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2021

(1)

Kvantitativa metoder – en introduktion

Mikael Nygård, Åbo Akademi,

vt 2021

(2)

Vad är kvantitativ metod?

 Kvantitativa (siffermässiga) analyser av verkligheten:

beskrivning och förklaringar av fenomen i fokus!

 Intresserar sig för det gemensamma, representativa eller olika förklaringar

 Fokuserar på att beskriva fördelningar av variabler eller samband mellan olika variabler (t.ex. utbildning och hälsa)

 Jag-det-relation mellan forskare och det undersökta

 Används närmast när vi vill uttala oss om många människor, t.ex. finländare

(3)

Kvantifierbara data

 Data som kan uttryckas i siffror, t.ex. som

frekvenstabeller, korstabeller, medelvärden etc.

 Användbart om vi vill beskriva egenskaper hos en större grupp människor, t.ex. procenttal, medeltal eller

fördelningar

 Är nödvändiga ifall vi vill testa hypoteser med hjälp av statistiska metoder, t.ex. t-test eller χ2-test

(4)

Problemställningen

 Som i all forskning är utgångspunkten för kvantitativ forskning problemställningen, som vanligen uttrycks i form av ett syfte samt en (rad) frågeställning(ar)

och/eller hypotes(er) -> anger målet med forskningen, dvs. vad vill vi veta?

 Exempel på syfte: att studera arbetstrivseln och dess förklaringar

 Exempel på frågeställning/hypotes: trivs anställda som får vara med och bestämma på arbetsplatsen bättre än andra?

(5)

Problemställningen, forts.

 Vilka begrepp och teorier använder vi för att göra problemställningen meningsfull och forskningsbar?

 T.ex. hur definierar vi arbetstrivsel och vilka teorier och tidigare studier finns det om detta från tidigare?

 Litteratursökning och inläsning behövs!

(6)

Att göra problemställningen mätbar - operationalisering

 Att operationalisera innebär att man väljer variabler som beskriver de egenskaper man är intresserad av och

funderar hur man skall gå tillväga för att ”mäta” värdet på dessa variabler

 Två huvudtyper av variabler:

 Kategoriserade: enheterna är indelade i grupper, t.ex. kön eller blodgrupp, med ett visst antal givna variabelvärden

 Kontinuerliga: beskriver en kontinuerlig egenskap som har en glidande skala, t.ex. längd, antal utbildningsår, arbetstrivsel

(7)

Validitet

 Viktig sak att tänka på när vi väljer variabler

 Teoretiskt mått på mätmetodens och datamaterialets relevans (”lämplighet”, ”meningsfullhet”) för

undersökningens syfte och problemställningar, dvs. hur bra lyckas vi egentligen mäta det vi avser att mäta?

 För att få en valid operationalisering räcker det sålunda inte med att datainsamlingen och analysen är noggrant utförda

(8)

Exempel: hur ska vi mäta arbetstrivsel?

Den manifesta (”verkliga”) nivån Den latenta

(”teoretiska”) nivån Teoretisk variabel

Empirisk variabel (indikator)

”Graden av arbetstrivsel”

”Subjektiv skattning av trivsel (t.ex. ”hur bra trivs du på din nuvarande arbetsplats?”)

”Antal besök hos

arbetsplatshälsovården”

????

(9)

Reliabilitet

 Reliabilitet = teoretiskt mått på graden av tillförlitlighet och noggrannhet i själva mätprocessen

 Att ”mäta” = att tilldela något ett värde (tal) enligt vissa på förhand fastställda regler

 Hög reliabilitet föreligger om oberoende mätningar av samma fenomen ger i det närmaste identiska resultat

 Orsaker till låg reliabilitet:

 Slumpmässiga fel (skrivfel, missförstånd etc.)

 Systematiska fel (otydlig formulering etc.)

(10)

Förhållandet mellan validitet och reliabilitet

Teoretiskt definierad variabel

”Operationaliserad”

variabel

Tabulerade data (t.ex.

i en Excel- eller SPSS- datamatris)

Begreppsvaliditet

Mätreliabilitet

Validitet

(11)

Variablernas datanivåer

 Kategoriserade och kontinuerliga variabler ligger på olika s.k. datanivåer, dvs. de skiljer sig åt beträffande

mängden och kvaliteten av information

 Kategoriserade variabler:

 Nominaldata: variabelvärdena kan inte rangordnas, t.ex. kön

 Ordinaldata: värdena kan rangordnas, t.ex. befattningstyp

 Kontinuerliga variabler:

 Intervalldata: numeriska skillnader mellan variabelvärdena, dock utan nollpunkt, t.ex. blodtrycksvärden, anställningsår, lön

 Kvotdata: samma som ovan, men med en nollpunkt, t.ex. antal fortbildningskurser

(12)

Variabeltypens betydelse

 Avgör bl.a. vilka typer av analyser som kan utföras, t.ex.

deskriptiva statistiska mått:

 Nominaldata: frekvenser, typvärde

 Ordinaldata: samma som ovan + median

 Intervalldata: som ovan + medeltal och standardavvikelse

 Kvotdata: som ovan + procent

(13)

Ett exempel....

 Inom arbetslivsforskningen har man länge utgått från teorin om att medbestämmande har en positiv effekt på arbetstagarens välbefinnande. Ju mer man själv kan

påverka arbetstider m.m. desto mer trivs man

 Frågeställning: finns det ett samband mellan medbestämmande och arbetstrivsel?

 Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras av slumpen)

(14)

Saker som följaktligen blir av intresse för oss...

 Frågor om arbetstrivsel -> definiera och operationalisera variabeln ”arbetstrivsel”

 Frågor om medbestämmande -> definiera och operationalisera variabeln ”medbestämmande”

 I detta fall är ”upplevd arbetstrivsel” den beroende variabeln, det som ska förklaras, medan ”upplevt

medbestämmande” utgör den oberoende variabeln, det som vi tror förklarar

 Man bör även fundera över eventuella alternativa förklarande variabler och bakgrundsvariabler

(15)

• Upplevt

medbestämmande

Andra tänkbara oberoende variabler:

• Tillfredsställelse med lön ?

• Uppskattning av förman?

• Uppskattning av kolleger Bakgrundsvariabler:

• Kön, ålder, etc.

• Upplevd arbetstrivsel

Oberoende variabel Beroende variabel

Vilka samband vi testar, och vilka oberoende variabler vi prövar, styrs ofta av den ”förförståelse”

vi får från tidigare

forskning. Denna hjälper oss således att formulera hypoteser om samband, som vi sedan kan testa statistiskt

(16)

Data och urval

 Hur vi ska hitta lämpligt data som gör att vi meningsfullt kan undersöka vår problemställning?

 Här kommer vi in på frågor om urval (om vem vill vi uttala oss?) samt datafrågor (om vem och vilka

variabler innehåller datamaterialet information?)

 Datamaterialet avgör vilka analysmetoder som är möjliga att använda och urvalsmetoden hur

representativa våra resultat är

(17)

Totalundersökning eller urval?

 Vanligen baseras dylika undersökningar på stickprov, dvs. på ett urval inom den grupp (population) man är intresserad av

 Totalundersökningar ganska ovanliga pga. av de ofta blir för dyra, tidskrävande eller annars oändamålsenliga

 Stickprov bör vara representativa, dvs. de ska ge en bild av populationen i miniatyr (eller så bra bild som möjligt)

 Stora bortfall i t.ex. enkätundersökningar är

problematiska eftersom representativiteten blir lidande

 Ett lågt bortfall är dock i sig ingen garanti för hög representativitet (bortfallsanalyser viktiga)

(18)

Olika former av urval



Slumpmässiga urval



Icke-slumpmässiga urval

(19)

Slumpmässiga urval

 Ett urval där alla enheter har en lika stor chans att komma med

 T.ex. vi har en låda med 1000 svarta och vita glaskulor och vill veta hur stor andel kulor som är vita respektive svarta. Om vi slumpmässigt väljer ett tillräckligt stort antal kulor (t.ex. 100) kan vi få en tillförlitlig skattning av proportionen vita/svarta kulor i lådan

 Resultaten från urvalet blir med andra ord statistiskt representativa för populationen. Vi kan alltså lita på att våra resultat, med undantag av en viss accepterad

felmarginal, gäller för alla kulor i lådan

 Ju större stickprov, desto mindre risk för att slumpen resulterar i ett icke-representativt urval

(20)

Några vanliga typer av slumpmässiga urval

 Obundet slumpmässigt urval:

 Alla enheter i en given population har lika stor chans att komma med i stickprovet

 Stratifierat urval:

 Indelning av populationen i olika strata från vilka ett lika stort antal enheter väljs slumpmässigt

 Används när man vill säkerställa att vissa grupper har en viss representation i urvalet

 Klusterurval:

 Används för att dela in en stor population i mindre delar för att inom dessa göra slumpmässiga urval

(21)

Icke-slumpmässiga urval

 Är inte statistiskt representativa, men kan dock

användas för att påvisa systematiska skillnader mellan olika grupper, t.ex. i medicinska tester

 Några former av icke-slumpmässiga urval:

 Bekvämlighetsurval (väljer de som är lättast att få tag i)

 Urval genom självselektion (t.ex. söka svarande genom tidningsannons)

 Kvoturval (man väljer ett antal enheter med vissa egenskaper, t.ex. 50% kvinnor, 50% män)

 Subjektivt urval (val enligt eget tycke)

 Snöbollsurval (deltagare engagerar andra inom sina nätverk)

(22)

Statistisk inferens

 Handlar om att man drar slutsatser ur empiriska data under osäkerhet orsakad av slumpmässighet i data

 Det är t.ex. vanligt att man önskar dra slutsatser från ett slumpmässigt urval (sampel) till en viss population

 Grundförutsättningen är vanligen att urvalet är slumpmässigt och normalfördelat

 Går ut på att vi beräknar olika karakteristika

(egenskaper) för urvalet (t.ex. medelvärden) samt anger konfidensintervall (säkerhetsintervall) inom vilka urvalets karakteristika ligger

(23)

Datamaterial och datainsamling

 Vilket datamaterial ska vi välja?

 Påverkar vilka analyser som är möjliga att göra samt representativiteten för våra resultat

 Därtill avgör våra resurser (pengar, tid, personalresurser etc.) ofta vilket data som lönar sig att använda

 Idag finns det många färdigt insamlade kvantitativa

datamaterial (t.ex. ESS, GERDA, registerdata) - det lönar sig med andra ord inte alltid att samla eget data

(24)

Sammanfattning

 Grunden för kvantitativ metod ligger i

problemställningen, i frågor om operationalisering, data och urval

 Vi väljer kvantitativa metoder ifall vi vill använda

numeriska data för att beskriva ett fenomen eller söka förklaringar

 Handlar oftast om att kunna uttala sig om många människor