• No results found

I en enfaktors ANOVA studeras endast en oberoende variabel, och man undersöker om de olika grupperna (nivåerna) skiljer sig så mycket att stickproven inte kan anses vara dragna ur en och samma population. Antag en undersökning i vilken man studerar barns prestationer i enkla additionsuppgifter under fyra olika temperaturbetingelser. I detta exempel låter vi barnen arbeta i 30 minuter i ett klassrum med respektive 20o, 23o, 26o och 29o. Om vi nu slumpmässigt har tagit ut exempelvis 40 barn och slumpmässigt fördelat dem på de fyra betingelserna, har vi därmed en strikt experimentell undersökningsuppläggning. Eftersom det är olika barn i de olika grupperna är detta ett exempel på oberoende grupper. Skulle vi ha låtit samma barn få arbeta under alla de fyra betingelserna, skulle vi istället ha erhållit beroende grupper. Ett beroendeförhållande i mätvärdena uppstår, som tidigare nämnts, vid två tillfällen, nämligen vid repeterad mätning och vid matchning av individer i grupperna.

Den oberoende variabel som studeras är arbetstemperatur. Denna variabel har 4 nivåer (20o, 23o, 26o och 29o). Den beroende variabeln (effektvaria- beln, mätvariabeln) är prestationer i räkning och mäts med ett additions- test.

Eftersom man här har valt fyra bestämda temperaturbetingelser ur den kontinuerliga variabeln temperatur kallas detta för en fix modell. Om man från en oberoende variabel slumpmässig väljer ut ett antal nivåer, som sedan studeras kallas detta för en stokastisk modell. I flesta fall används fixa modeller, och vi drar slutsatser om de studerade nivåerna och endast om dessa utvalda. A faktor A= temperaturbetingelser a1 a2 a3 a4 a1= 20o a2= 23o G1 G2 G3 G4 a3= 26o a4= 29o Figur 3.6. Undersökningsdesign, enfaktors ANOVA

Om vi parvis skulle ha prövat medelvärdena mot varandra, skulle vi be- höva utföra sex t-test. Variansanalysen tillåter oss att samtidigt jämföra de fyra medelvärdena. De 40 barnen presterar olika bra på additionstestet. Med hjälp av olika varianskomponenter ska vi försöka tolka resultatet så bra som möjligt. Varför får de 40 eleverna olika resultat?

Den troligen största anledningen till resultatolikheter är att barn är olika bra på sådana här test. Barn har olika bakgrund, förmågor, kunskaper, atti- tyder m.m., och därför finns det individuella skillnader. En del av variat- ionen mellan de 40 barnen kan bero på behandlingen, dvs. de olika tempe- raturbetingelserna. En del av variationen kan sålunda vara betingad av olikheter i den oberoende variabeln. Det är denna effekt av den oberoende variabeln, som är den mest intressanta i den här undersökningen. Slutligen kan en del av resultaten också bero på mätfel, dvs. brister i mätinstrumen- tet. Ett sådant här test har dock troligen hög reliabilitet.

Om vi väljer ut två barn, exempelvis ett barn ur grupp 1 och ett barn ur grupp 3, varför skiljer sig deras resultat? Det kan bero på att de har fått olika behandlingar (20o mot 26o), det kan också bero på att dessa individer är olika oavsett temperaturbetingelser. Dessutom kan det bero på mätfel, dvs. slumpen. Om vi i stället väljer ut två barn ur samma grupp så kan en skillnad i resultaten dem emellan inte bero på olika behandlingar, men väl på individuella olikheter och mätfel. Den totala variationen i hela under- sökningsgruppen kan således delas upp i variation mellan grupper och variation inom grupper. Den sistnämnda variationen kan delas upp i indi- viduella skillnader och mätfel.1

SSM SSI

SST

SST = Total varians (SS kommer från engelskans term för kvadrat- summa, Sum of Squares)

SSM = Mellangruppsvarians SSI = Inomgruppsvarians SST = SSM + SSI

Figur 3.7. Varianskomponenter

Undersökningens frågeställning kan uttryckas på följande sätt: Hur mycket av den totala variationen beror på olika behandlingar? Ju större kvoten SSM/SST är desto mer beror på olikheter i behandlingen, dvs. temperatur- betingelser. Kvoten SSM/SST är således ett storleksmått på behandlingsef- fekten. Om vi nu statistiskt ska pröva skillnaderna mellan grupperna ställer vi upp följande nollhypotes:

H0: µ1=µ2=µ3=µ4 (=µ)

Nollhypotesen säger att de bakomliggande medelvärdena (populations- medelvärdena) för de olika grupperna är lika, dvs. ett och samma medel- värde µ.

Mothypotesen är att det finns en skillnad någonstans mellan grupperna, dvs. endera av nedanstående 26 fall föreligger:

H1: µ1<µ2=µ3=µ4 µ1=µ2>µ3=µ4 µ1=µ2>µ3>µ4

m fl andra mothypotesalternativ

Att förkasta H0 innebär således att åtminstone en av de 26 möjliga H1- fallen är sann.

När vi beräknat den genomsnittliga variansen mellan och inom grupper jämförs dessa båda variationsorsaker. Vi bildar en F-kvot, som kan beskri- vas på följande sätt:

behandlingseffekt + individuella skillnader + mätfel F = ____________________________________________ individuella skillnader + mätfel

Om H0 gäller finns ingen skillnad mellan grupperna, dvs. ingen behand- lingseffekt. Av formeln ovan inser vi, att F-kvoten då blir nära 1. Skulle det finnas en behandlingseffekt blir F-kvoten större än 1, eventuellt så stor att H0 måste förkastas. Liksom det finns t-fördelningar för olika frihets- grader så finns det en F-fördelning för olika frihetsgrader för den F-kvot som beräknas. De kritiska värdena för olika frihetsgrader i täljare respek- tive nämnare samt för olika signifikansnivåer finns tabellerade (Tabell C). Den genomsnittliga variansen mellan grupper erhålls genom att dividera SSM med antalet frihetsgrader (antalet grupper - 1), och den genomsnitt- liga variansen inom grupper erhålls genom att dividera SSI med dess antal

frihetsgrader ({antalet individer i gruppen -1} multiplicerat med antalet grupper).

I det tidigare presenterade exemplet har följande data erhållits (Tabell 3.6). Som synes har en elev i respektive grupp 3 och grupp 4 fallit bort på grund av frånvaro.

Tabell 3.6. Antal rätt på respektive barn i fyra temperaturgrupper

____________________________________________________________ Temperatur- Grupp 1 Grupp 2 Grupp 3 Grupp 4 grupper 20o 23o 26o 29o

46 72 53 52 75 64 37 48 67 58 54 66 59 46 28 38 51 51 53 44 47 57 47 44 56 42 49 40 63 45 32 25 54 55 41 42 35 50 -- -- Summa Kolumnssummor tk: 553 540 394 399 1886 Kvadratsummor x2:31767 29924 18002 18669 98362 Antal observationer nk: 10 10 9 9 38 Medelvärden M: 55,3 54,0 43,8 44,3 49,6 ____________________________________________________________ Förberedande beräkningar och beräkning av varianskomponenter: Beräkna följande summor:

T = samtliga barns resultat

X2 = kvadraterna på samtliga barns resultat N = antalet barn totalt

tk = barnens resultat i respektive grupp

x2 = kvadraterna på barnens resultat i respektive grupp nk = antalet barn i respektive grupp

Beräkning av varianskomponenter 1. Totalkvadratsumma (SST): SST = X2 - T2/N SST=∑X2 - T2/N X2 = 98362 T2/N = 18862/38 = 93605,16 SST= 98362 - 93605,16= 4756,84 2. Mellangruppskvadratsumma (SSM): SSM=tk2/nr - T2/N tk2/nk = 5532/10+ 5402/10+ 3942/9+ 3992/9 = 94678,34 T2/N = 93605,16 SSM= 94678,34 - 93605,16 = 1073,18 3. Inomgruppskvadratsumma: SSI=X2 - tk2/nr X2 = 98362 tk2/nk = 94678,34 SSI= 98362 - 94678,34 = 3683,66 4. Kontroll av beräkningar

Enligt Figur 3.7 är SST = SSM + SSI. Vi kan nu kontrollera genom att använda resultaten av punkterna 1, 2 och 3 ovan.

4756,84 = 1073,18 + 3683,66

Utifrån erhållna kvadratsummor kan medelkvadratsummor beräknas ge- nom att dividera med respektive antal frihetsgrader enligt Tabell 3.7. I exemplet ovan har kvadratsummor beräknats och medelkvadratsum- morna erhålls enligt följande:

SST = 4756,84 SSM = 1073,18 SSI = 3683,66

MSM = 1073,18/3 = 357,73 MSI = 3683,66/34 = 108,34

Den erhållna F-kvoten blir då:

F = 357,73/108,34 = 3,30 för fg 3/34

Tabell 3.7. Beräkning av medelkvadratsummor och varianskvot

____________________________________________________________ Variations- Kvadrat- Frihets- Medelkvadrat- Varianskvot

orsak summa grader summa

SS fg MS F

____________________________________________________________ Mellan grupper SSM k-1 MSM=SSM/k-1 F=MSM/MSI Inom grupper SSI N-k MSI=SSI/N-k

____________________________________________________________ Totalt SST N-1 ____________________________________________________________ Tabell 3.8. ANOVA-tabell ____________________________________________________________ Variationsorsak SS fg MS F p ____________________________________________________________ Mellan grupper 1073,18 3 357,73 3,30 < 0,05 Inom grupper 3683,66 34 108,34 ____________________________________________________________ Totalt 4756,84 37 ____________________________________________________________ Eftersom det kritiska värdet för =0,05 är 2,92 (fg 3/30) måste H0 förkas-

tas. Åtminstone en av de alternativa mothypoteserna är sann. Den signifi- kanta F-kvoten ger endast upplysning om att det finns en signifikant skill- nad, men inte mellan vilka grupper som skillnaden är säkerställd. När man i sin analys har mera än två grupper, kan man gå vidare och parvis pröva skillnader mellan gruppmedelvärden. För dessa s.k. kontrastanalyser (Post Hoc) finns olika metoder, t.ex. LSD, Scheffe och Bonferroni. Av resultat- tablåer erhåller man information mellan vilka grupper som det finns signi- fikant skillnad enligt det test man önskar använda. I dessa kontrastanalyser

skärps det kritiska värdet för den enskilda parjämförelsen, detta för att inte råka ut för det s.k. massignifikansproblemet. Om gör väldigt många jämfö- relser på t.ex. 5%-nivån kommer självfallet några att bli signifikanta. Av 100 jämförelser borde rimligen ungefär 5 % bli signifikanta.

3.11 Lämpliga index på relationen mellan