Kvantitativa metoder – en introduktion
Mikael Nygård, Åbo Akademi,
vt 2021
Vad är kvantitativ metod?
Kvantitativa (siffermässiga) analyser av verkligheten:
beskrivning och förklaringar av fenomen i fokus!
Intresserar sig för det gemensamma, representativa eller olika förklaringar
Fokuserar på att beskriva fördelningar av variabler eller samband mellan olika variabler (t.ex. utbildning och hälsa)
Jag-det-relation mellan forskare och det undersökta
Används närmast när vi vill uttala oss om många människor, t.ex. finländare
Kvantifierbara data
Data som kan uttryckas i siffror, t.ex. som
frekvenstabeller, korstabeller, medelvärden etc.
Användbart om vi vill beskriva egenskaper hos en större grupp människor, t.ex. procenttal, medeltal eller
fördelningar
Är nödvändiga ifall vi vill testa hypoteser med hjälp av statistiska metoder, t.ex. t-test eller χ2-test
Problemställningen
Som i all forskning är utgångspunkten för kvantitativ forskning problemställningen, som vanligen uttrycks i form av ett syfte samt en (rad) frågeställning(ar)
och/eller hypotes(er) -> anger målet med forskningen, dvs. vad vill vi veta?
Exempel på syfte: att studera arbetstrivseln och dess förklaringar
Exempel på frågeställning/hypotes: trivs anställda som får vara med och bestämma på arbetsplatsen bättre än andra?
Problemställningen, forts.
Vilka begrepp och teorier använder vi för att göra problemställningen meningsfull och forskningsbar?
T.ex. hur definierar vi arbetstrivsel och vilka teorier och tidigare studier finns det om detta från tidigare?
Litteratursökning och inläsning behövs!
Att göra problemställningen mätbar - operationalisering
Att operationalisera innebär att man väljer variabler som beskriver de egenskaper man är intresserad av och
funderar hur man skall gå tillväga för att ”mäta” värdet på dessa variabler
Två huvudtyper av variabler:
Kategoriserade: enheterna är indelade i grupper, t.ex. kön eller blodgrupp, med ett visst antal givna variabelvärden
Kontinuerliga: beskriver en kontinuerlig egenskap som har en glidande skala, t.ex. längd, antal utbildningsår, arbetstrivsel
Validitet
Viktig sak att tänka på när vi väljer variabler
Teoretiskt mått på mätmetodens och datamaterialets relevans (”lämplighet”, ”meningsfullhet”) för
undersökningens syfte och problemställningar, dvs. hur bra lyckas vi egentligen mäta det vi avser att mäta?
För att få en valid operationalisering räcker det sålunda inte med att datainsamlingen och analysen är noggrant utförda
Exempel: hur ska vi mäta arbetstrivsel?
Den manifesta (”verkliga”) nivån Den latenta
(”teoretiska”) nivån Teoretisk variabel
Empirisk variabel (indikator)
”Graden av arbetstrivsel”
”Subjektiv skattning av trivsel (t.ex. ”hur bra trivs du på din nuvarande arbetsplats?”)
”Antal besök hos
arbetsplatshälsovården”
????
Reliabilitet
Reliabilitet = teoretiskt mått på graden av tillförlitlighet och noggrannhet i själva mätprocessen
Att ”mäta” = att tilldela något ett värde (tal) enligt vissa på förhand fastställda regler
Hög reliabilitet föreligger om oberoende mätningar av samma fenomen ger i det närmaste identiska resultat
Orsaker till låg reliabilitet:
Slumpmässiga fel (skrivfel, missförstånd etc.)
Systematiska fel (otydlig formulering etc.)
Förhållandet mellan validitet och reliabilitet
Teoretiskt definierad variabel
”Operationaliserad”
variabel
Tabulerade data (t.ex.
i en Excel- eller SPSS- datamatris)
Begreppsvaliditet
Mätreliabilitet
Validitet
Variablernas datanivåer
Kategoriserade och kontinuerliga variabler ligger på olika s.k. datanivåer, dvs. de skiljer sig åt beträffande
mängden och kvaliteten av information
Kategoriserade variabler:
Nominaldata: variabelvärdena kan inte rangordnas, t.ex. kön
Ordinaldata: värdena kan rangordnas, t.ex. befattningstyp
Kontinuerliga variabler:
Intervalldata: numeriska skillnader mellan variabelvärdena, dock utan nollpunkt, t.ex. blodtrycksvärden, anställningsår, lön
Kvotdata: samma som ovan, men med en nollpunkt, t.ex. antal fortbildningskurser
Variabeltypens betydelse
Avgör bl.a. vilka typer av analyser som kan utföras, t.ex.
deskriptiva statistiska mått:
Nominaldata: frekvenser, typvärde
Ordinaldata: samma som ovan + median
Intervalldata: som ovan + medeltal och standardavvikelse
Kvotdata: som ovan + procent
Ett exempel....
Inom arbetslivsforskningen har man länge utgått från teorin om att medbestämmande har en positiv effekt på arbetstagarens välbefinnande. Ju mer man själv kan
påverka arbetstider m.m. desto mer trivs man
Frågeställning: finns det ett samband mellan medbestämmande och arbetstrivsel?
Forskningshypotes: personer med hög grad av upplevd medbestämmanderätt tenderar uppleva en högre grad av arbetstrivsel (på ett sätt som inte kan förklaras av slumpen)
Saker som följaktligen blir av intresse för oss...
Frågor om arbetstrivsel -> definiera och operationalisera variabeln ”arbetstrivsel”
Frågor om medbestämmande -> definiera och operationalisera variabeln ”medbestämmande”
I detta fall är ”upplevd arbetstrivsel” den beroende variabeln, det som ska förklaras, medan ”upplevt
medbestämmande” utgör den oberoende variabeln, det som vi tror förklarar
Man bör även fundera över eventuella alternativa förklarande variabler och bakgrundsvariabler
• Upplevt
medbestämmande
Andra tänkbara oberoende variabler:
• Tillfredsställelse med lön ?
• Uppskattning av förman?
• Uppskattning av kolleger Bakgrundsvariabler:
• Kön, ålder, etc.
• Upplevd arbetstrivsel
Oberoende variabel Beroende variabel
Vilka samband vi testar, och vilka oberoende variabler vi prövar, styrs ofta av den ”förförståelse”
vi får från tidigare
forskning. Denna hjälper oss således att formulera hypoteser om samband, som vi sedan kan testa statistiskt
Data och urval
Hur vi ska hitta lämpligt data som gör att vi meningsfullt kan undersöka vår problemställning?
Här kommer vi in på frågor om urval (om vem vill vi uttala oss?) samt datafrågor (om vem och vilka
variabler innehåller datamaterialet information?)
Datamaterialet avgör vilka analysmetoder som är möjliga att använda och urvalsmetoden hur
representativa våra resultat är
Totalundersökning eller urval?
Vanligen baseras dylika undersökningar på stickprov, dvs. på ett urval inom den grupp (population) man är intresserad av
Totalundersökningar ganska ovanliga pga. av de ofta blir för dyra, tidskrävande eller annars oändamålsenliga
Stickprov bör vara representativa, dvs. de ska ge en bild av populationen i miniatyr (eller så bra bild som möjligt)
Stora bortfall i t.ex. enkätundersökningar är
problematiska eftersom representativiteten blir lidande
Ett lågt bortfall är dock i sig ingen garanti för hög representativitet (bortfallsanalyser viktiga)
Olika former av urval
Slumpmässiga urval
Icke-slumpmässiga urval
Slumpmässiga urval
Ett urval där alla enheter har en lika stor chans att komma med
T.ex. vi har en låda med 1000 svarta och vita glaskulor och vill veta hur stor andel kulor som är vita respektive svarta. Om vi slumpmässigt väljer ett tillräckligt stort antal kulor (t.ex. 100) kan vi få en tillförlitlig skattning av proportionen vita/svarta kulor i lådan
Resultaten från urvalet blir med andra ord statistiskt representativa för populationen. Vi kan alltså lita på att våra resultat, med undantag av en viss accepterad
felmarginal, gäller för alla kulor i lådan
Ju större stickprov, desto mindre risk för att slumpen resulterar i ett icke-representativt urval
Några vanliga typer av slumpmässiga urval
Obundet slumpmässigt urval:
Alla enheter i en given population har lika stor chans att komma med i stickprovet
Stratifierat urval:
Indelning av populationen i olika strata från vilka ett lika stort antal enheter väljs slumpmässigt
Används när man vill säkerställa att vissa grupper har en viss representation i urvalet
Klusterurval:
Används för att dela in en stor population i mindre delar för att inom dessa göra slumpmässiga urval
Icke-slumpmässiga urval
Är inte statistiskt representativa, men kan dock
användas för att påvisa systematiska skillnader mellan olika grupper, t.ex. i medicinska tester
Några former av icke-slumpmässiga urval:
Bekvämlighetsurval (väljer de som är lättast att få tag i)
Urval genom självselektion (t.ex. söka svarande genom tidningsannons)
Kvoturval (man väljer ett antal enheter med vissa egenskaper, t.ex. 50% kvinnor, 50% män)
Subjektivt urval (val enligt eget tycke)
Snöbollsurval (deltagare engagerar andra inom sina nätverk)
Statistisk inferens
Handlar om att man drar slutsatser ur empiriska data under osäkerhet orsakad av slumpmässighet i data
Det är t.ex. vanligt att man önskar dra slutsatser från ett slumpmässigt urval (sampel) till en viss population
Grundförutsättningen är vanligen att urvalet är slumpmässigt och normalfördelat
Går ut på att vi beräknar olika karakteristika
(egenskaper) för urvalet (t.ex. medelvärden) samt anger konfidensintervall (säkerhetsintervall) inom vilka urvalets karakteristika ligger
Datamaterial och datainsamling
Vilket datamaterial ska vi välja?
Påverkar vilka analyser som är möjliga att göra samt representativiteten för våra resultat
Därtill avgör våra resurser (pengar, tid, personalresurser etc.) ofta vilket data som lönar sig att använda
Idag finns det många färdigt insamlade kvantitativa
datamaterial (t.ex. ESS, GERDA, registerdata) - det lönar sig med andra ord inte alltid att samla eget data
Sammanfattning
Grunden för kvantitativ metod ligger i
problemställningen, i frågor om operationalisering, data och urval
Vi väljer kvantitativa metoder ifall vi vill använda
numeriska data för att beskriva ett fenomen eller söka förklaringar
Handlar oftast om att kunna uttala sig om många människor