• No results found

Vi utgår ifrån ett exempel och tänker oss att en skolklass har genomgått ett standardprov i matematik för årskurs 9. För detta prov finns således nor- mer gällande för hela landet. I den aktuella klassen erhölls en betygsför- delning som visas nedan. Det framgår att klassen erhållit ett betygsgenom- snitt som något överstiger det teoretiska värdet 3,0.

Kan dessa elever vara dragna ur en population med medelvärdet 3,0, eller är skillnaden så stor att man knappast kan anta att detta är en slumpmässig avvikelse?

För att besvara denna fråga ställer vi upp följande nollhypotes och mothy- potes:

H0: Det föreligger ingen skillnad mellan medelvärdet för denna klass och riksgenomsnittet (µ=3,0).

H1: Det föreligger en skillnad mellan medelvärdet för denna klass och riksgenomsnittet (µ3,0).

Tabell 3.4. Betygsresultat i en skolklass

____________________________________________________________ Betyg Antal elever

(x) (f) f.x f.x2 ____________________________________________________________ 1 1 1 1 2 5 10 20 3 9 27 81 4 8 32 128 5 2 10 50 ____________________________________________________________ 25 80 280 ____________________________________________________________ fx 80 M = ______ = _____ = 3,2 N 25

(fx)2 fx2 - ______

n

s= _______________________ = 1,00

n-1

Nollhypotesen kan vi kalla för "ingen skillnad-hypotesen", eftersom man alltid prövar just detta förhållande. Den skillnad som faktiskt har observe- rats kan kanske ligga inom vad vi betraktar som slumpskillnad. Mothypo- tesen är oftast vår undersökningshypotes, dvs. vi önskar oftast förkasta H0 för att i stället tro att H1 gäller. Observera att vi alltid prövar om H0 kan förkastas eller ej på en viss vald signifikansnivå. Antingen kan vi förkasta H0, eller så har vi misslyckats med att förkasta H0.

Om vi nu erinrar oss samplingfördelningen (avsnitt 3.3), kan vi uttrycka den observerade differensen mellan vårt klassmedelvärde (M) och populat- ionens medelvärde (µ) i förhållande till medelfelet, dvs. till standardavvi- kelsen i felfördelningen. Finner vi det erhållna medelvärde 3,2 inom områ- det +/- M, vet vi att denna differens inträffar av en ren slump ungefär 2

gånger av 3 (ca 68 %). Hamnar medelvärdet just utanför vågar vi knappast förkasta H0. Detta inträffar ju ungefär 1 gång på 3 (ca 32 %). Väljer vi den vanliga signifikansnivån 5% (=0,05), måste vi i stället se om vårt medel- värde hamnar inom området +/- 2M. Om vårt medelvärde hamnar utanför

detta intervall, anser vi att H0 bör förkastas. Visserligen tar vi en viss risk att göra ett felaktigt beslut (5 %), men vi hoppas att slumpen inte skojade med oss just i vårt fall. Vi kan komplettera våra hypoteser ovan med att ange den signifikansnivå på vilken vi prövar H0.

Signifikansnivå: =0,05 (Vi erinrar oss att  är risken att felaktigt förkasta H0)

För att kunna pröva vår hypotes måste vi beräkna medelfelet M. Detta

medelfel kan vi skatta på följande sätt: s

M= ____ (formel 3.2) n

Medelfelet kan således skattas med hjälp av standardavvikelsen i stickpro- vet och antalet observationer i stickprovet.

Som tidigare nämnts ska vi nu jämföra den observerade differensen mellan stickprovets och populationens medelvärde i förhållande till medelfelet, dvs. den avvikelse som slumpen kan åstadkomma.

M - µ

t = _______ (formel 3.4) s / n

Detta ger oss ett värde med en känd fördelning, och denna fördelning är tabellerad. Vi kan nu ur tabell utläsa sannolikheten att erhålla detta värde av en ren slump. Den fördelning som man relaterar sina observationer till är t-fördelningen för gällande frihetsgrad. Vid stora stickprov närmar sig t- fördelningen z-fördelningen (=normalfördelningen). Vid prövning av ett stickprovs medelvärde blir antalet frihetsgrader fg=n-1.

I vårt exempel har vi 25 observationer och ska använda t-fördelningen. Innan vi gör våra beräkningar ska vi fastställa det kritiska värdet, det värde från och med H0 ska förkastas. Vid signifikansnivån 5% för fg=n-1, dvs. 24 blir det kritiska värdet +/- 2,06 (se Tabell A i Appendix). Vi använder i detta exempel och i de följande endast s.k. tvåsidig prövning, dvs. vår mothypotes säger inte något om differensens riktning. För att klargöra när man ska förkasta H0 eller ej inför vi följande belysande figur:

Om nu H0 gäller, dvs. ingen skillnad mellan medelvärdet i vår klass och populationsmedelvärdet blir enligt formel 2.4 t=0. Ju större differens desto mindre sannolikhet att slumpen kan tillskrivas den observerade skillnaden. Om |t|< 2,06 anser vi att H0 ej kan förkastas, eftersom en sådan differens inträffar av en ren slump mer än 5 gånger av 100. Vid |t|  2,06 tror vi inte att slumpen har orsakat differensen, även om så kan ha varit fallet (risken

Ruta 3.1. Prövning av hypotes med hjälp av t-testet

Population: årskurs 9 Stickprov: n=25

µ= 3,0 M= 3,2

(egentligen känner vi ej medelvärdet s= 1,00 för populationen men sätter det till

det teoretiska 3,0)

H0: Det föreligger ingen skillnad mellan medelvärdet för denna klass och riksgenomsnittet (µ=3,0).

H1: Det föreligger en skillnad mellan medelvärdet för denna klass och riksgenomsnittet (µ3,0). Signifikansnivå: =0,05 Kritiskt värde för fg=24 (n-1): +/- 2,06 M - µ 3,2 - 3,0 t = _______ fg = n - 1 (formel 3.4) ; t = _________ = 1,00 s / n 1,00/ 25 H0 kan ej förkastas (p > 0,05)

Slutsats: Det observerade klassmedelvärdet 3,2 är ej signifi- kant skilt från det teoretiska värdet 3,0.

Låt oss nu anta att vi erhållit samma medelvärde 3,2 och samma standard- avvikelse men på ett betydligt större antal observationer, exempelvis 100 elever. Skiljer sig nu detta medelvärde ifrån riksgenomsnittet 3,0? Hypo-

tesformuleringarna och beräkningssättet är nu desamma som i det föregå- ende exemplet.

Ruta 3.2. Prövning av hypotes angående ett stickprov med hjälp av t- testet

Population: µ= 3,0 Stickprov: n=100

M= 3,2; s= 1,00 H0: Det föreligger ingen skillnad mellan medelvärdet för dessa

elever och riksgenomsnittet (µ=3,0).

H1: Det föreligger en skillnad mellan medelvärdet för dessa elever och riksgenomsnittet (µ3,0).

Signifikansnivå: =0,05; Kritiskt värde för fg=60 (eg. 99): +/- 2,00

M - µ . 3,2 - 3,0 t = _______ fg = n - 1 (formel 3.4); t = __________ = 2,00* s / n 1,00/ 100

Eftersom vi har hamnat precis på det kritiska värdet kan vi förkasta H0 (p= 0,05).

Slutsats: Det observerade medelvärdet 3,2 är signifikant skilt från det teoretiska värdet 3,0.

I Tabell A finns inget kritiskt värde för just 99 frihetsgrader. Då får man ta det som ligger närmast (fg=120) eller om man s a s vill vara försiktig så tar man det som ligger närmast under (fg=60). Det kritiska värdet för t med fg=60 är +/- 2,00 (egentligen skulle det vara något lite lägre).

Om vi nu jämför slutsatserna i Ruta 3.1 och 3.2 finner vi att H0 acceptera- des i första fallet men förkastades i andra fallet, trots att vi hade samma medelvärde och samma standardavvikelse. Olikheten består i att vi i Ruta 3.2 har ett större stickprov. Medelfelet blir i det sistnämnda exemplet mycket mindre. En signifikant skillnad innebär en säkerställd skillnad, men det behöver ej betyda att skillnaden är stor. För att uttala sig om skill- nadens storlek behöver vi ett annat mått som presenteras senare.

3.7 Hypotesprövning av en medelvärdes-