• No results found

2.8 Reliabilitet

2.8.2 Ett numeriskt exempel

Låt oss ta ett enkelt exempel och med hjälp av varianser skatta mätsäker- heten. I exemplet kommer vi endast att visa data från 10 observationer. Normalt har man ju betydligt fler observationer, när man vill undersöka validitet och reliabilitet. Tio personer har genomfört två test, ett verbalt test och ett för att mäta logisk slutledningsförmåga. Det verbala testet består av endast fyra uppgifter (V1-V4). Svaren på dessa uppgifter har bedömts i en femgradig betygsskala. Testet på logisk slutledningsförmåga består av åtta uppgifter L1-L8. På dessa kan man endast få rätt eller fel på varje uppgift.

Tabell 2.6. Testresultat för de 10 individerna på det verbala testet ____________________________________________________________ Ind. V1 V2 V3 V4 V-totalsumma ____________________________________________________________ A 2 3 3 2 10 B 2 1 1 3 7 C 4 3 4 3 14 D 3 5 3 4 15 E 3 2 3 3 11 F 4 5 5 5 19 G 3 3 2 3 11 H 2 3 2 2 9 I 1 1 2 1 5 J 4 5 4 4 17 s 1,03 1,52 1,20 1,16 4,42 s2 1,07 2,32 1,43 1,33 = 6,15 19,51 ____________________________________________________________ Cronbach’s alpha på detta test ger:

n 2 4 6,15

alpha = _______ ( 1 - _________ ) ; _____ ( 1 - ________ ) = 0,91

n – 1 2

tot 3 19,51

Reliabiliteten på det verbala testet är således mycket god. De fyra uppgif- terna är mycket homogena, dvs. har mycket gemensam varians. Låt oss även analysera testet avseende logisk slutledningsförmåga, där varje upp- gift bedöms som rätt eller fel (Tabell 2.7).

Tabell 2.7. Testresultat för de 10 individerna på det logiska testet ____________________________________________________________ Ind. L1 L2 L3 L4 L5 L6 L7 L8 L-totalsumma ____________________________________________________________ A 1 1 1 1 0 1 0 0 5 B 1 1 0 1 0 0 0 0 3 C 1 1 1 1 1 0 1 0 6 D 1 1 1 1 1 0 0 1 6 E 1 1 1 0 1 1 0 0 5 F 1 1 1 1 1 1 1 1 8 G 1 1 1 1 1 0 0 0 5 H 1 1 1 0 0 1 0 0 4 I 1 0 0 0 0 0 0 0 1 J 1 1 1 1 1 1 1 0 7 p 1,00 0,90 0,80 0,70 0,60 0,50 0,30 0,20 q 0,00 0,10 0,20 0,30 0,40 0,50 0,70 0,80 p.q 0,00 0,09 0,16 0,21 0,24 0,25 0,21 0,16 = 1,32 4,00 ____________________________________________________________ Variansen vid en binär kodning (rätt eller fel) är p . q, där p = sannolikhet-

en att svara korrekt och q = 1 – p (dvs. sannolikheten att svara fel). Sum- man av de åtta varianserna är 1,32. För summavariabeln, dvs. det samman- lagda resultatet på testet, blir variansen 4,00.

Om vi nu beräknar reliabiliteten på testet av logisk slutledningsförmåga erhålls följande (enligt Kuder-Richarson’s formel, ofta benämnd KR20):

n p . q 8 1,32

alpha = _________ ( 1 - _________ ) ; _______ ( 1 - _________ ) = 0,77

n – 1 2

tot 7 4,00

Om man skulle beräkna en split-half koefficient på testet logisk slutled- ningsförmåga delar man lämpligen de åtta uppgifterna enligt nedan. Upp- gifter ligger redan efter lösningsfrekvens i tabellen och det går att direkt dela testet i två delar. Skulle man strikt ta alla udda uppgifter i den ena

gruppen och alla jämna i den andra gruppen skulle den sistnämnda grup- pen få något högre resultat. För att ungefärligen nå samma medelvärde på de två halvorna kan man dela upp testet enligt ”abba-sättet”. Detta innebär att uppgifterna L1, L4, L5 och L8 bildar den ena halvan och L2, L3, L6 och L7 den andra. De 10 respondenterna får då följande resultat på de två halvorna, benämnda del 1 och del 2:

Tabell 2.8. Testresultat för de 10 individerna på de två testhalvorna ____________________________________________________________ Ind. L1 L2 L3 L4 L5 L6 L7 L8 del 1 del 2 ____________________________________________________________ A 1 1 1 1 0 1 0 0 2 3 B 1 1 0 1 0 0 0 0 2 1 C 1 1 1 1 1 0 1 0 3 3 D 1 1 1 1 1 0 0 1 4 2 E 1 1 1 0 1 1 0 0 2 3 F 1 1 1 1 1 1 1 1 4 4 G 1 1 1 1 1 0 0 0 3 2 H 1 1 1 0 0 1 0 0 1 3 I 1 0 0 0 0 0 0 0 1 0 J 1 1 1 1 1 1 1 0 3 4

En produktmomentkorrelation på de två testhalvorna ger r = 0,446, vilket efter Spearman-Brown’s korrektion ger 0,62. Detta är en dålig mätsäkerhet och en åtgärd som kan rekommenderas är att förlänga testet, dvs. lägga till fler uppgifter. Det finns en formel för vad man kan förvänta att få för reli- abilitet, om man förlänger testet. En fördubbling av antalet uppgifter skulle kunna förväntas öka reliabiliteten till 0,77.

n . relgammal

Relny = ; där n = antalet gånger testet förlängs

3 Parametriska hypotespröv-

ningsmetoder

För de parametriska hypotesprövningsmetoderna gäller att vissa förutsätt- ningar bör vara uppfyllda. Sålunda förutsätts att observationerna i stick- provet kommer från en specificerad i regel normalfördelad observationsva- riabel, och att mätskalan är intervall- eller kvotskalerad. Vid analys av differenser mellan små stickprov förutsätts också, att mätvariabelns vari- ans är lika i de bakomliggande populationerna. Många gånger i beteende- vetenskapliga sammanhang har man dock data på endast ordinalskalenivå. Om stickprovet inte är alltför litet och data synes vara approximativt nor- malfördelade används ofta parametriska metoder. Man kan visa att dessa metoder i flesta fall är robusta mot avvikelser i ovan nämnda förutsätt- ningar.

Fysiska mätningar är ofta normalfördelade (längd, vikt). Däremot vet vi sällan något om mätningar av psykiska förmågor (kunskap, intelligens, färdighet). Vid den sistnämnda typen av mätningar har man ingen given skala, utan man konstruerar en skala och standardiserar den med normal- fördelningen som bas. Vi har sålunda sett till att det vi försöker mäta, ge- nom valet av uppgifter, ger värden som är approximativt normalfördelade. Det är i många forskningssammanhang lämpligt, bl.a. för den statistiska analysen, att normalstandardisera de variabler som studeras.

3.1 Urvalsmetoder

De vanligaste slumpmässiga urvalsmetoderna är obundet slumpmässigt urval (OSU), systematiskt urval, stratifierat urval och klusterurval. Det kanske mest vanliga urvalet, åtminstone i beteendevetenskapliga samman- hang, är dock det icke-slumpmässiga urvalet, det s.k. tillfälliga urvalet.

Om ett stickprov är slumpmässigt draget ur en viss definierad population innebär detta att stickprovet representerar populationen. Data från stick- provet kan således generaliseras till den definierade populationen. Vid statistisk inferens förutsätts i regel obundet slumpmässigt urval.

I undersökningar där man av olika skäl tvingats använda ett icke- slumpmässigt urval, måste man kunna argumentera för att undersöknings- gruppen är representativ för någon bakomliggande population, annars blir den statistiska hypotesprövningen meningslös.

1. Obundet slumpmässigt urval (OSU)

Obundet slumpmässigt urval är ett bra sätt att erhålla representativitet. Tillvägagångssättet är följande:

a) populationen definieras

b) populationens individer numreras 1, 2, 3, ..., N c) stickprovets storlek bestäms

d) urvalet görs med hjälp av en slumptalstabell, lotter eller dylikt 2. Systematiskt urval

Ett sätt att slippa lotta ut samtliga individer till stickprovet är att välja var k:te individ efter att slumpmässigt ha valt den första.

a) populationen definieras ( antag att N = 450) b) stickprovets storlek bestäms (exempelvis n = 30) c) kvoten N/n beräknas (r = N/n = 450/30 = 15)

d) slumpmässigt väljs ett tal mellan 1 och r (antag att vi erhåller 8) e) det systematiska stickprovet blir då individ nr 8, 8+r, 8+2r, .... 8+29r (dvs. individ nr 8, 23, 38, ..., 428, 443)

Det systematiska urvalet fungerar bra, såvida det inte föreligger någon periodicitet i populationen. Ett av de klassiska exemplen på ett misslyckat systematiskt urval är hämtad från en osann historia ur militärlivet.

kallt i barackerna. Plutonchefen, som ansåg sig statistiskt kunnig, utförde då en stickprovsundersökning. Han utnyttjade då ett systematiskt urval.

Barack A: S1 S2 S3 S4 S5 Kamin S6 S7 S8 S9 S10 Barack B: S1 S2 S3 S4 S5 Kamin S6 S7 S8 S9 S10 Barack C: S1 S2 S3 S4 S5 Kamin S6 S7 S8 S9 S10 ... Barack O: S1 S2 S3 S4 S5 Kamin S6 S7 S8 S9 S10 S= sängplats N= 150; n= 15 r=150/15 = 10

Figur 3.1. Sängarnas placering i förhållande till kaminen i barackerna Slumpmässigt drogs nummer 5, och urvalet kom således att bestå av indi- vid nr 5, 15, 25, ... 135 och 145. De som kom med i stickprovet fick be- svara en enkel enkät med huvudfrågan om de frös eller ej på nätterna. Sva- ren blev väldigt lika, nämligen att det var något för varmt i barackerna för att kunna sova gott (alla i stickprovet låg ju intill en kamin). Plutonchefen ansåg sig därmed ha visat, att det ingalunda var för kallt i barackerna och gav omedelbart order om att minska på eldningen i kaminerna.

3. Stratifierat urval

Om populationen kan delas in i ett antal homogena undergrupper, som sinsemellan är olika i sin sammansättning med hänsyn till undersöknings- variabeln, kan man använda stratifierat urval. Det kan vara ett bra sätt att garantera att alla undergrupperna blir representerade i stickprovet. Man kan ibland välja proportionellt stratifierat urval, vilket innebär att delgrup- perna blir representerade efter sin storlek.

a) populationen definieras,

b) de olika delgrupperna (strata) avgränsas genom en eller flera för undersökningen viktiga klassifikationer,

c) ur varje strata dras ett slumpmässigt urval av önskad storlek med hjälp av OSU eller systematiskt urval.

4. Klusterurval

Vid stora populationer kan det ibland vara praktiskt att använda kluster- urval. Populationen delas då in i ett antal heterogena enheter (kluster), som sinsemellan bör vara lika. Klusterurvalet sker ofta som ett tvåstegsurval.

a) populationen definieras,

b) urvalsenheterna (klusterna) bestäms, c) antalet kluster som ska ingå bestäms,

d) de i urvalet ingående klustren dras genom OSU, e) antalet individer som ska ingå ur varje kluster bestäms, f) individerna dras genom OSU ur respektive kluster.

I nedanstående tabell jämförs stratifierat urval och klusterurval. Tabellen tjänar också som riktlinje för när man bör välja den ena eller den andra urvalsmetoden.

Tabell 3.1. Jämförelse mellan stratifierat urval och klusterurval vad gäller hur mätobjekten ska vara

Strata Kluster

Mellan olika lika Inom homogena heterogena 5. Tillfälligt urval

Ofta tvingas man i praktiken använda ett icke-slumpmässigt urval. Det kan vara av tids- eller kostnadsmässiga skäl eller helt enkelt därför att det är det enda sättet som är praktiskt möjligt. Vi kan kalla detta för ett tillfälligt urval. Med goda kontrollmöjligheter kan vi kanske våga påstå, att urvalet är representativt för en viss population.

a) populationen definieras, b) stickprovets storlek bestäms,

c) individer väljs i enlighet med vad som är praktiskt möjligt, d) urvalsgrupperna kontrolleras ur representativitetssynpunkt på ett

3.2 Sannolikhetsbegreppet

Man hör ofta folk ironisera över den hjälp statistiken erbjuder. Vi har väl alla hört uttrycket att det finns tre slags lögner; lögn, förbannad lögn och statistik. Ibland försöker man bevisa saker och ting med statistik. Skulle förutsägelser ej slå in säger kritikerna att statistiken ljuger. Låt oss slå fast att man inte kan bevisa något med statistik, utan endast visa att något gäl- ler med en viss grad av sannolikhet. Eftersom man med hjälp av inferens- statistik drar slutsatser med en viss grad av sannolikhet, dvs. tar en viss risk för felslut, kan man ej påstå att statistiken ljuger. I det här samman- hanget är det två lagar, som man måste känna till för att kunna beräkna sannolikheter, nämligen additionssatsen (för varandra uteslutande händel- ser) och multiplikationssatsen (för oberoende händelser).

Antag att vi kastar ett mynt. Två händelser kan då inträffa. Antingen er- hålls ”krona” eller ”klave”. Vi utgår ifrån att myntet är symmetriskt, och att det ej kan ställa sig på kant. Om du håller på utfallet ”klave”, kallas detta utfall för ”ett gynnsamt fall”. Sannolikheten att erhålla klave (pklave) är då 0,5.

antalet gynnsamma fall 1 pklave = ____________________ = ___ antalet möjliga fall 2

Sannolikheten att erhålla ”krona” är givetvis också 0,5. Om man summerar sannolikheterna för varandra uteslutande händelser erhåller man p=1 (p=sannolikhet efter engelskans ”probability”).

Om vi kastar tärning, hur stor är chansen att erhålla en ”sexa”? Eftersom det finns 6 möjliga fall erhålls psexa=1/6. Sannolikheten att erhålla en ”etta” är lika stor (1/6), om nu tärningen inte är falsk.

1. Additionssatsen för varandra uteslutande händelser

Om reglerna för Fia-spel säger att man måste slå en sexa eller en etta för att få börja spelet, hur stor är då chansen att få endera av detta vid kast med tärning? Eftersom petta och psexa båda är 1/6, och man måste erhålla det

ena eller det andra, blir chansen en på tre att lyckas. petta + psexa = 1/6 + 1/6 = 2/6 = 1/3

2. Multiplikationssatsen för oberoende händelser

Hur stor är chansen att du vinner två gånger i rad vid myntkast? Låt oss säga att du håller på klave. Chansen att vinna första gången är 1/2 och andra gången lika stor. Du måste emellertid vinna båda gångerna. Det finns således endast ett gynnsamt fall, men hur många möjliga utfall finns det?

krona - krona krona - klave klave - krona klave - klave x

Kryssmarkeringen står för det gynnsamma fallet med vinst två gånger i rad. Eftersom det finns fyra möjliga händelser blir sannolikheten 1/4. Med hjälp av multiplikationssatsen erhåller du lätt sannolikheten för detta utfall: p= 1/2 .1/2 = 1/4

Antag att du spelar roulette, där chansen är lika stor för samtliga nummer att falla ut (0-36). Det finns således 1/37 chans att vinna om man sätter på nummer, dvs. man vinner i ungefär tre fall av hundra. Statistikern skulle ha gjort prognosen, att du vid ditt nästa spel kommer att förlora. Observera då att statistikern tar en viss risk i sin prognos. Risken är ungefär 3 %. Låt oss leka med tanken att du faktiskt vann, när du satte jetongen på ditt lycko- nummer. Ljuger statistiken?

3.3 Samplingfördelning

I ett föregående avsnitt redogjordes för några olika sätt att ta ut ett stick- prov ur en population. När vi väl har vårt stickprov, kan vi beskriva det genom beräkning av vissa index. Ofta ger medelvärdet och standardavvi- kelsen en god bild av hur stickprovet fördelningsmässigt ser ut. Låt oss fortsätta resonemanget med ett konkret exempel i tankarna. Antag att vi genomför ett begåvningstest på ett stickprov ur populationen ”elever i årskurs 6”. Vi transformerar erhållna råvärden till den kända IQ-skalan (µ=100; =15). Låt oss ta ett stickprov omfattande 25 elever. Vad får vi

för medelvärde i denna grupp? Ja, om det är ett slumpmässigt urval ur populationen, borde vi få ett värde i närheten av 100. Du inser säkert att vi slumpmässigt kan få ett något för högt eller något för lågt värde beroende på om slumpen har gett oss för många högpresterande eller för många lågpresterande elever i stickprovet. Låt oss nu välja ett nytt stickprov och beräkna medelvärdet för detta nya stickprov. Vid nya stickprovsdragningar kommer vi att få något varierande medelvärden. I Tabell 3.2 redovisas några tänkbara medelvärdesresultat i de olika stickproven.

Tabell 3.2. Tänkbara medelvärden i slumpmässiga stickprov ur en popu- lation med µ=100 och s=15

____________________________________________________________

Stickprov nr Medelvärde Stickprov nr Medelvärde

____________________________________________________________ 1 93,6 11 100,5 2 95,2 12 100,8 3 96,1 13 101,7 4 97,4 14 102,0 5 98,5 15 102,5 6 98,9 16 103,1 7 99,3 17 103,5 8 99,6 18 104,3 9 100,1 19 105,2 10 100,2 20 105,6 ____________________________________________________________ Om vi markerar resultaten på IQ-skalan, kan vi därefter rita ett diagram över hur utfallet av stickprovsmedelvärden blev.

x x x x x x x xxxxxxxx xx x x x x x x x ____________________________________________________________ 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 Figur 3.2. Några tänkbara medelvärden i slumpmässiga stickprov Om vi tänker oss ett mycket stort antal stickprovsmedelvärden (M), skulle dessa nästan alltid fördela sig symmetriskt kring populationsmedelvärdet

(µ). Du inser säkerligen att vi oftare finner att medelvärdena ligger nära populationsmedelvärdet (i detta fall µ=100) och mera sällan längre bort från populationsmedelvärdet. Ibland ger slumpen oss alldeles för bra ele- ver, ibland alldeles för dåliga elever, men oftast ger slumpen oss en normal och representativ elevgrupp. Om vi i stället skulle ha tagit ut större stick- prov, exempelvis 100 elever, inser du säkert att slumpavvikelser från me- delvärdet 100 blir mindre. Ju fler individer som finns med i stickprovet desto ”säkrare” urval. Enstaka, om än kraftigt avvikande individer, får mindre betydelse för gruppens medelvärde vid stora stickprov. Ritar vi upp fördelningen för ett stort antal stickprovsmedelvärden, egentligen ett oänd- ligt antal, erhålls följande fördelning:

Figur 3.3. Samplingfördelningen med +/- 1 medelfel

Denna fördelning, som i regel kan antas ha normalfördelningens egen- skaper, kallas för samplingfördelning. Medelvärdet i denna fördelning är, som framgår av figuren, lika med populationsmedelvärdet (µ). Medelvär- det i samplingfördelningen betecknas µM. Standardavvikelsen i denna fördelning är av central betydelse för inferensstatistiken. Denna standard- avvikelse kan användas som ett mått på felet, som slumpen ger oss vid stickprovsdragning. Ibland får vi ett medelvärde som är högre än populat- ionsmedelvärdet, ibland får vi ett värde som är lägre. Hur ofta, uttryckt i procent får vi ett medelvärde som ligger mellan -1M och +1M? Som du

kanske erinrar Dig ligger ungefär 68 % av samtliga observationer mellan -1 och +1 i normalfördelningen. Således får vi ett medelvärde i vårt

stickprov, som i ungefär 2 fall av 3 ligger mellan µ - M och µ + M. M kallas för medelfelet, dvs. det fel man får räkna med att erhålla vid

stickprovsdragning. Eftersom 2 fall av 3 får betraktas som något för osä- kert väljer vi i stället att ta två gånger medelfelet.

Medelfelet är kärnan i inferensstatistiken och går i regel lätt att ungefär beräkna för såväl ett som flera stickprov. För ett stickprov är medelfelet lika med standardavvikelsen dividerat med kvadratroten ur antalet obser- vationer.

M = ____ (formel 3.1)

n

Figur 3.4. Samplingfördelningen med +/- 2.medelfelet

Enligt normalfördelningen hamnar ungefär 95 % av samtliga observationer mellan µ-2 och µ+2.

3.4 Skattningar

Med skattning avser vi att antingen med kännedom om populationspara- metrarna göra en skattning av karaktäristika i stickprovet eller med känne- dom om stickprovskaraktäristika göra en skattning av populationspara- metrarna. Parameter används här i betydelsen egenskaper i populationen. µ och  är parametrar i populationen; M och s är karaktäristika i stickpro- vet.

Eftersom den sistnämnda skattningstypen ovan är det mest vanliga kom- mer vi i det följande att helt koncentrera oss på detta fall. Jämför med att vi oftast gör stickprovsundersökningar och önskar generalisera resultaten till den bakomliggande populationen. Låt oss ta ett exempel!

Antag att vi inom en större internationell undersökning önskar mäta svenska elevers matematikkunskaper vid grundskolans avslutning. Ett prov ges till ett slumpmässigt urval ur populationen omfattande 2500 ungdomar elever i årskurs 9. I detta stickprov erhåller vi M=24,0 och s=6,00. Hur många poäng har då svenska elever, dvs. vad blir populationsmedelvärdet? Eftersom vi av praktiska skäl inte kan undersöka mer än detta stickprov, måste vi med utgångspunkt i dessa data göra en skattning av populations- medelvärdet. Enligt tidigare resonemang kan vi, beroende på slumpen i urvalet av individer i stickprovet, ha erhållit ett medelvärde (M) som något avviker från populationsmedelvärdet (µ). Därför ger vi ett intervall kring det erhållna medelvärdet (M) och påstår att detta intervall täcker µ med en viss grad av säkerhet. Ju större intervall desto större sannolikhet att µ täcks av intervallets gränser. För att veta hur stort intervall vi ska ta kring M, dvs. hur mycket vi ska addera respektive subtrahera från M, måste vi dels bestämma säkerhetsnivån, dels ta hjälp av det tidigare beskrivna medel- felet. Eftersom vi nu inte vet standardavvikelsen i populationen (måste vi skatta denna med hjälp av den erhållna standardavvikelsen i stickprovet. Vi kan således beräkna medelfelet genom att dividera standardavvikelsen i stickprovet med antalet observationer i stickprovet.

s

M = ____ (formel 3.2)

n

Vi kan konstatera att M minskar vid ökning av stickprovsstorleken. Det

är lätt att förstå att så blir fallet. Vad kan slumpen ställa till med vid ett litet stickprov? Jo, en extremt bra individ kan råka komma med, och denne individ höjer då medelvärdet. Om vi har många observationer medför detta att enstaka extrema individer så att säga försvinner i mängden. Vi hade beräknat M=24.0 och s=6,00 i vårt stickprov. Medelfelet blir då 0,12.

M = 6,00/2500 =0,12

Om vi nöjer oss med att ta M +/- M, dvs. 24,0 +/- 0,12 är chansen 68 %

att µ ligger inom detta intervall. Om vi ökar intervallet till M +/- 2M,

dvs. två gånger medelfelet, ökar också sannolikheten att täcka in µ. Sanno- likheten blir nu ungefär 95 %. Det troliga är dock att µ ligger någonstans i närheten av M och inte i intervallets extremvärden. För att täcka in µ med en viss bestämd grad av säkerhet multipliceras medelfelet med ett värde, som kan erhållas ur en t-fördelningstabell (se Appendix, Tabell A). Denna t-fördelningen är en familj av t-fördelningar som är specificerade av anta-

let frihetsgrader, dvs. t-fördelningarna ser lite olika ut beroende på antalet observationer i stickprovet. Med antalet frihetsgrader menas antalet värden som är fria att variera, när man beräknat ett beskrivande mått, t.ex. när man vet medelvärdet (jfr avsnitt 4.1.1). Utifrån t-fördelningen kan man erhålla ett värde som medelfelet ska multipliceras med för att täcka in populat- ionsmedelvärdet med en viss grad av säkerhet. I stället för att ta 2 gånger medelfelet så kan vi ur t-fördelningen få reda på vad medelfelet ska multi- pliceras med för att ge ett intervall som med exakt 95 % sannolikhet täcker in populationsmedelvärdet. Ett sådant intervall kallas för konfidensinter- vall.

M - tp. M < µ < M + tp. M (formel 3.3)

tp = värde ur t-fördelningen på den valda sannolikhetsnivån p

I vårt exempel ovan erhålls värdet 1,96 ur t-tabellen (Tabell A i Appen- dix). Eftersom antalet observationer i stickprovet är 2500 och frihetsgra- derna således 2499 får man gå på det värdet som gäller för ”oändligt många” observationer. De s.k. kritiska värdena för stora stickprov på olika sannolikhetsnivåer i t-fördelningen är identiska med de kritiska värdena i z-fördelningen (Tabell B).

24,0 - 1,96 . 0,12 < µ < 24,0 + 1,96 . 0,12

Populationsmedelvärdet ligger således med 95 % säkerhet inom intervallet 24,0 +/- 0,2352.

Skulle vi vilja vara ännu säkrare på att täcka in populationsmedelvärdet kan vi i stället välja ett 99,9 % konfidensintervall, dvs. multiplicera medel- felet med 3,29. Vi erhåller då att populationsmedelvärdet avrundat ligger mellan 23,6 och 24,4.

Om vi vid en experimentell undersökning vill undersöka effekter av en ny medicin, kan vi arrangera undersökningen enligt någon kontrollgrupps- design. Vi tänker oss att vi slumpmässigt har valt ut en undersöknings- grupp (stickprov) och slumpmässigt fördelat individerna till respektive experiment- och kontrollgrupp. Under förutsättning att fördelningen till respektive åtgärdsgrupp skett slumpmässigt kan vi utgå ifrån att grupperna är lika från början (inom slumpens ram).

Design: Endast eftermätning med kontrollgrupp Grupp 1 (experimentgrupp): X1 O Grupp 2 (kontrollgrupp): X2 O

X1 = den nya medicinen

X2 = den tidigare använda medicinen

O = observation eller mätning av åtgärdseffekter

För att jämföra de båda metoderna är även här medelfelet av central bety- delse. I detta fall måste vi beräkna medelfelet för differensen mellan be- handlingsgrupperna (=stickproven). Analogt med fallet för ett stickprov blir differensen mellan stickprovsmedelvärdena här inte exakt lika för varje stickprovspar vid upprepade stickprovsdragningar. Medelfelet för differenser kan beräknas med hjälp av en formel, som presenteras senare. Även i detta fall kan vi erhålla en skattning av populationsdifferensen på en vald sannolikhetsnivå genom att multiplicera medelfelet med ett värde motsvarande den valda sannolikhetsnivån.

3.5 Hypotesprövning

Låt oss som en inledning till detta avsnitt leka ett slag för att visa att även du har ”en inbyggd hypotesprövningsmekanism” inom Dig. Du och jag spelar krona och klave med ett av mina mynt. För att göra det hela lite mer