Division of Pharmacokinetics and Drug Therapy Department of Pharmacy
Uppsala University
Parade test, Oparade test och χ
!-test
Andrew Hooker
P ARADE TEST
2
Exempel
Hypotesprövning: möjliga jämförelser
• Jämförelser mot ett visst värde
• Parvisa observationer
– ”Före och Efter” inom samma individ
• Gruppvisa jämförelser
– 2 oberoende grupper
• Mellan 3 eller fler observationstillfällen eller mellan 3 eller flera olika grupper
– ANOVA (variansanalys)
• Analys av frekvenser och proportioner
- χ2-test
• Mellan 2 eller fler variabler
– Regression 3
Parvisa observationer
• Det finns två typfall
- ”Före och efter” inom samma individ
- Matchande kontroller där varje individ i stickprovet har en ”tvilling”
• I hypotesprövningen undersöks differensen mellan de två beroende variablerna
- ”Före” - ”Efter”
- ”Stickprovs-individ” - ”tvilling”
4
Hypotesprövning:
Parvisa observationer
Parametrisk analys
• Parat Z-test: Används då n är stort, (centrala gränsvärdessatsen)
• Parat t-test: Används då n är litet men normalfördelning av data kan antas
Icke-parametrisk analys
• Wilcoxons tecken-rangtest: Används då n är litet och normalfördelning ej kan antas
5
OBS: n=antalet par
Hypotesprövning: Parade värden
Definiera och beräkna teststorhet
Parametrisk analys
6
Vi använder antingen ‘Z’ eller ‘t’:
𝑡
!"#= 𝑋 − 𝜇 𝑍 = 𝑋 − 𝜇 𝜎
𝜎
𝑋 → #∆ 𝜎 → 𝑠
𝑛 𝜇 → 𝛿
H0
𝑍 = (∆ − 𝛿 𝑠 +
𝑛
𝑡
!"#= (∆ − 𝛿 𝑠 +
𝑛
𝑠 = 1
𝑛 − 1 -
!
"
∆! − #∆ #
Medelvärdet av de parvisa skillnaderna
Genomsnittlig skillnad i hela populationen
𝑍 = (∆
𝑠 +
𝑛
𝑡
!"#= (∆
𝑠 +
𝑛
→ 0
Parvisa skillnader
Exempel
Hypotesprövning: Parade värden
Parametrisk analys
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
• Ett nytt antiviralt preparat ges till 7 patienter med Hepatit A
• Blodprover tas dag 1 och dag 5
• Viruskoncentrationen i proverna analyseras
• Viruskoncentrationerna kan antas vara normalfördelade
7
Parade värden, n litet men normalfördelning Parat 2-sidigt t-test!
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
H0: δ = 0, ingen genomsnittlig skillnad i populationen H1: δ ≠ 0
0 8
500 1000 1500 2000
Dag 1 Dag 2
Viru skon cent ratio n
Exempel
Hypotesprövning: Parade värden
Parametrisk analys
0 500 1000 1500 2000
Dag 1 Dag 5
Viruskoncentration
ID [Virus]D1 [Virus]D5
1 908 340
2 113 172
3 443 303
4 140 116
5 1057 724
6 1586 860
7 472 420
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
α=0.05
9
Exempel
Hypotesprövning: Parade värden
Parametrisk analys
0 500 1000 1500 2000
Dag 1 Dag 5
Viruskoncentration
ID [Virus]D1 [Virus]D5
1 908 340
2 113 172
3 443 303
4 140 116
5 1057 724
6 1586 860
7 472 420
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
10
𝑠 = 1
𝑛 − 1/
!
"
∆! − 1∆ # 𝑡"$% = #∆
𝑠0
𝑛
Vi behöver beräkna ∆!, #∆, och s för att beräkna t- värdet
Exempel
Hypotesprövning: Parade värden
Parametrisk analys
-
!&%
"
∆! − #∆ # = 532285
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
ID [Virus]D1 [Virus]D5 ∆𝒊
1 908 340 568
2 113 172 -59
3 443 303 140
4 140 116 24
5 1057 724 333
6 1586 860 726
7 472 420 52
#∆= 255
∆𝒊 − #∆ 𝟐
3132 (-314)2 (-115)2 (-231)2
782 4712 (-203)2
Exempel
Hypotesprövning: Parade värden
Parametrisk analys
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
#∆= 255 𝑛 = 7
𝑠 = 1
7 − 1 6 532285 = 298
𝑡"$% = 255
298⁄ 7 = 2.26
H0: δ = 0 H1: δ ≠ 0
Exempel
Hypotesprövning: Parade värden
Parametrisk analys
α=0.05
Kritiskt värde för 5% signifikansnivå (95% CI), n=7
𝑡)*!+;"$%&-;./% = ±2.45
13
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
𝑡"$% = 255
298⁄ 7 = 2.26
Kritiskt värde för 5% signifikansnivå (95% CI): 𝑡"$% = ±2.45
H0 kan inte förkastas!
H0: δ = 0 H1: δ ≠ 0
-2.45 2.45
2.26 ligger i intervallet!
Exempel
Hypotesprövning: Parade värden
Parametrisk analys
α=0.05
Wilcoxons tecken-rangtest
• Bygger på rangordning av differenserna (∆!)
• Förutsätter inte en viss fördelning
• Okänsligt för extremvärden
15
Hypotesprövning: Parade värden
Icke-parametrisk analys
Exempel
Hypotesprövning: Parade värden
Icke-parametrisk analys
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
Samma exempel som tidigare men…
• Viruskoncentrationerna kan INTE antas vara normalfördelade
16
Parade värden, n litet och normalfördelning kan INTE antas 2-sidigt Wilcoxons tecken-rangtest!
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
H0: Ingen skillnad i viruskoncentration H1: Det finns en skillnad (2-sidigt test) Tillvägagångssätt:
1. Rangordna differenserna (∆!) utan att ta hänsyn till differensernas tecken
2. Summera rangtalen för de positiva och de negativa differenserna var för sig
3. Bedöm sannolikheten att observera de erhållna (eller mer extrema) differenserna om H0 är sann
17
Exempel
Hypotesprövning: Parade värden
Icke-parametrisk analys
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
ID [Virus]D1 [Virus]D5 ∆𝒊
1 908 340 568
2 113 172 -59
3 443 303 140
4 140 116 24
5 1057 724 333
6 1586 860 726
7 472 420 52
Rangtal
Exempel
Hypotesprövning: Parade värden
Icke-parametrisk analys
1
2 3 4
5 6
7
𝑇1 = 6 + 4 + 1 + 5 + 7 + 2 = 25 𝑇$ = 3
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
Kontrollräkning:
Exempel
Hypotesprövning: Parade värden
Icke-parametrisk analys
𝑇1 = 25 𝑇$ = 3
𝑇1 + 𝑇$ = 𝑛 𝑛 + 1
2 = 7 7 + 1
2 = 28
Stämmer!
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
Det kritiska värdet vid ett 2-sidigt Wilkoxons tecken- rangtest bestäms utifrån en tabell och om den lägsta
rangsumman underskrider eller är lika med detta värde så förkastas H0!
T+: 28 27 … 15 14 13 … 1 0 T-: 0 1 … 13 14 15 … 27 28
Exempel
Hypotesprövning: Parade värden
Icke-parametrisk analys
𝑇3 #⁄ 𝑇3 #⁄ Signifikansnivån α
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
H0: Ingen skillnad i viruskoncentration H1: Det finns en skillnad (2-sidigt test)
Exempel
Hypotesprövning: Parade värden
Icke-parametrisk analys
α=0.05
𝑇1 = 25 𝑇$ = 3
Kritiskt värde för 5% signifikansnivå (n=7,p=0.05/2)
22
𝑇4.4#/ = 2
Är det någon skillnad mellan
viruskoncentrationerna dag 1 och dag 5?
H0: Ingen skillnad i viruskoncentration H1: Det finns en skillnad (2-sidigt test)
Kritiskt värde för 5% signifikansnivå (n=7):
𝑇6,4.4//# = 2
𝑇$ > 𝑇4.4#/ H0 kan inte förkastas!
Exempel
Hypotesprövning: Parade värden
Icke-parametrisk analys
Tabell 6!
Observera att tabell 6 ger de kritiska värdena för ensidiga test.
α=0.05
𝑇1 = 25 𝑇$ = 3
O PARADE TEST
24
Exempel
Hypotesprövning: möjliga jämförelser
• Jämförelser mot ett visst värde
• Parvisa observationer
– ”Före och Efter” inom samma individ
• Gruppvisa jämförelser
– 2 oberoende grupper
• Mellan 3 eller fler observationstillfällen eller mellan 3 eller flera olika grupper
– ANOVA (variansanalys)
• Analys av frekvenser och proportioner
- χ2-test
• Mellan 2 eller fler variabler
– Regression 25
Gruppvisa jämförelser
• När vi inte har parvisa observationer så kan vi istället jämföra medelvärdena från två oberoende stickprov
- Effekten av läkemedel jämfört med placebo
- Effekten av läkemedel x jämfört med läkemedel y
• I hypotesprövningen undersöks differensen i medelvärde mellan de två oberoende stickprov
26
Hypotesprövning:
Gruppvisa jämförelser / Oparade värden
Parametrisk analys
• Z-test (2 prov): Används då både 𝑛& och 𝑛' är stora (centrala gränsvärdessatsen)
• t-test (2 prov): Används då 𝑛& och/eller 𝑛' är små men normalfördelning kan antas
Icke-parametrisk analys
• Wilcoxons rangsummetest: Används då 𝑛& och/eller 𝑛' är små och normalfördelning ej kan antas
30
OBS: 𝑛& och 𝑛' måste
inte vara lika!
Hypotesprövning: Oparade värden
Parametrisk analys
Definiera och beräkna teststorhet
Vi använder antingen ‘Z’ eller ‘t’:
𝑡
!"#= 𝑋 − 𝜇 𝑍 = 𝑋 − 𝜇 𝜎
𝜎
𝑋 → ̅𝑥9 − ̅𝑥: 𝜇 → 𝜇9 − 𝜇:
𝜎 → 𝑠9#
𝑛9 + 𝑠:#
𝑛: 𝜎 → 𝑠;<<=# 1
𝑛9 + 1 𝑛:
Skillnaden i stickprovs- medelvärde för grupp a och grupp b
Skillnaden i populations- medelvärde för grupp a och grupp b
Hypotesprövning: Oparade värden
Parametrisk analys
Definiera och beräkna teststorhet
Vi använder antingen ‘Z’ eller ‘t’:
𝑡
!"#= 𝑋 − 𝜇 𝑍 = 𝑋 − 𝜇 𝜎
𝜎
𝑋 → ̅𝑥9 − ̅𝑥: 𝜇 → 𝜇9 − 𝜇:
H0
𝑍 = ̅𝑥9 − ̅𝑥: − 𝜇9 − 𝜇: 𝑠9#
𝑛9 + 𝑠:# 𝑛:
𝑡"!1""$# = ̅𝑥9 − ̅𝑥: − 𝜇9 − 𝜇: 𝑠;<<=# 1
𝑛9 + 1𝑛: 𝜎 → 𝑠9#
𝑛9 + 𝑠:# 𝑛: 𝑍 = ̅𝑥9 − ̅𝑥:
𝑠9#
𝑛9 + 𝑠:# 𝑛:
𝑡"!1""$# = ̅𝑥9 − ̅𝑥: 𝑠;<<=# 1
𝑛9 + 1 𝑛:
→ 0
𝜎 → 𝑠;<<=# 1
𝑛9 + 1 𝑛:
Hypotesprövning: Oparade värden
Definiera och beräkna teststorhet
Parametrisk analys
33
• Givet att H0 stämmer: de båda
stickprovsstandardavvikelserna (𝑠9 och 𝑠:) är olika noggranna skattningar av
populationsstandardavvikelsen (σ)
• Ju större stickprov desto säkrare skattning
• spool är ett vägt medelvärde av 𝑠9 och 𝑠: 𝑠;<<= = 𝑠9# 𝑛9 − 1 + 𝑠:# 𝑛: − 1
𝑛9 − 1 + 𝑛: − 1
Exempel
Hypotesprövning: Oparade värden
Parametrisk analys
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
• 16 patienter randomiseras till behandling med läkemedel A eller läkemedel B mot Hepatit A
• 2 patienter med läkemedel B drar tillbaka sin
medverkan i studien av anledningar som inte har med läkemedel B att göra
34
Exempel
Hypotesprövning: Oparade värden
Parametrisk analys
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
• Blodprover tas dag 1 och dag 5
• Viruskoncentrationen i proverna analyseras och skillnaden i koncentration mellan dag 1 och dag 5 beräknas
• Viruskoncentrationerna kan antas vara normalfördelade
Oparade värden, 𝑛9 och 𝑛: små, normal-fördelning kan antas Oparat 2-sidigt t-test!
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
Grupp A Grupp B
∆!!= 2066 virus/L ∆!"= 664 virus/L 𝑠! = 1180 virus/L 𝑠" = 297 virus/L
𝑛! = 8 𝑛" = 6
H0: 𝛿& = 𝛿', ingen skillnad mellan läkemedlen H1: 𝛿& ≠ 𝛿'
𝛼 = 0.05
Exempel
Hypotesprövning: Oparade värden
Parametrisk analys
1∆ används här som notation istället för ̅𝑥 eftersom vi jämför en sänkning av viruskoncentrationer i blodet. Dock används
formlerna på samma sätt som om ̅𝑥 hade använts!
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
37
Vi behöver beräkna 𝑠;<<=# för att kunna beräkna t- värdet
Exempel
Hypotesprövning: Oparade värden
Parametrisk analys
𝑡"!1""$# = #∆9 − #∆: 𝑠;<<=# 1
𝑛9 + 1 𝑛:
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
38
Exempel
Hypotesprövning: Oparade värden
Parametrisk analys
𝑠;<<=# = 𝑠9# 𝑛9 − 1 + 𝑠:# 𝑛: − 1 𝑛9 − 1 + 𝑛: − 1
𝑠;<<=# = 1180# 8 − 1 + 297# 6 − 1
8 − 1 + 6 − 1 = 848987
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
39
Exempel
Hypotesprövning: Oparade värden
Parametrisk analys
𝑡"!1""$# = #∆9 − #∆: 𝑠;<<=# 1
𝑛9 + 1𝑛:
𝑡>1-$# = 2066 − 664 848987 1
8 + 1 6
= 2.82
Kritiskt värde för 5% signifikansnivå (95% CI), 𝑛
"= 8, 𝑛
#= 6
𝑡)*!+;"!1""$#&%#;./% = ±2.18
40
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
𝑡%# = 2.82
Kritiskt värde för 5% signifikansnivå (95% CI): ±2.18
2.82 > 2.18
H0 kan förkastas!
Exempel
Hypotesprövning: Oparade värden
Parametrisk analys
Wilcoxons rangsummetest
• Bygger på rangordning av mätdata
• Förutsätter inte en viss fördelning
• Okänsligt för extremvärden
42
Hypotesprövning: Oparade värden
Icke-parametrisk analys
Wilcoxons rangsummetest kallas ibland även för Mann-Whitneys U-test!
Exempel
Hypotesprövning: Oparade värden
Icke-parametrisk analys
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
Samma exempel som tidigare men…
• Viruskoncentrationerna kan INTE antas vara normalfördelade
43
Oparade värden, 𝑛! och 𝑛" små, normalfördelning kan INTE antas 2-sidigt Wilcoxons rangsummetest!
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
H0: Ingen skillnad mellan grupperna (läkemedlen) H1: Det finns en skillnad (2-sidigt test)
Tillvägagångssätt:
1. Rangordna alla observerade värden, från det lägsta till det högsta
2. Summera rangtalen för de båda stickproven var för sig 3. Rangsumman för det mindre stickprovet jämförs med
motsvarande tabellvärden och om rangsumman är tillräckligt låg eller tillräckligt hög så förkastas H0
44
Exempel
Hypotesprövning: Oparade värden
Icke-parametrisk analys
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
ID ∆𝒊 A/B
1 3574 A
2 508 A
3 589 B
4 822 A
5 214 B
6 1071 B
7 3127 A
Rangtal
Exempel
Hypotesprövning: Oparade värden
Icke-parametrisk analys
6
13 2 4
1 14
9
ID ∆𝒊 A/B
8 555 B
9 1983 A
10 902 B
11 654 B
12 2645 A
13 934 A
14 2931 A
Rangtal
5
12 10 7
11 3
8
Rangsumman för den minsta gruppen (B):
𝑇? = 4 + 1 + 9 + 3 + 7 + 5 = 29
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
De kritiska värdena vid ett 2-sidigt Wilkoxons rangsummetest bestäms utifrån en tabell och om rangsumman för den minsta gruppen faller utanför
intervallet som bildas av de kritiska värdena (eller exakt på intervallgränserna) så förkastas H0!
Exempel
Hypotesprövning: Oparade värden
Icke-parametrisk analys
Kritiskt värde för 5% signifikansnivå (95% CI), 𝑛
"= 8, 𝑛
#= 6
47
…
𝑇)*!+;"!&>,""&-;4.4/ = (29, 61)
Är det någon skillnad i effekt mellan läkemedel A och läkemedel B?
H0: Ingen skillnad mellan grupperna (läkemedlen) H1: Det finns en skillnad (2-sidigt test)
Kritiska värden för 5% signifikansnivå (𝑛# = 8, 𝑛$ = 6): 𝑇)*!+;"!&>,""&-;4.4/ = (29, 61)
𝑇? = 29
H0 förkastas!
Exempel
Hypotesprövning: Oparade värden
Icke-parametrisk analys
Tabell 5!
Sammanfattning
Parametrisk vs. icke-parametrisk analys
Parametrisk analys
+ Kvantifierar skillnader och spridningar
- Ej robust vid små n (och ej normalfördelning)
Icke-parametrisk analys + Inga antaganden om
fördelningen (gäller lika bra för alla fördelningar)
+ Ordinaldata (ordningstal) - Kan missa små skillnader
(lägre teststyrka)
49
Sammanfattning
Parametrisk vs. icke-parametrisk analys
Parametrisk analys Små n:
Om normalfördelning kan antas
Stora n:
OK (om fördelningen ej är alltför skev - i så fall testa att transformera)
Icke-parametrisk analys Om fördelningen är okänd (exempelvis p.g.a. litet n) Om fördelningen är skev
Om många extrema värden (så kallade ”outliers”) finns
Aldrig om n<4
50
Sammanfattning
Hypotesprövning:
Parade och oparade testParvisa observationer Parametrisk analys
– Parat t-test – Parat Z-test Icke-parametrisk analys
– Wilcoxons tecken- rangtest
Oberoende grupper Parametrisk analys
– Oparat t-test – Oparat Z-test Icke-parametrisk analys
– Wilcoxons rang- summetest
51
V ARIANSANALYS
52
Exempel
Hypotesprövning: möjliga jämförelser
• Jämförelser mot ett visst värde
• Parvisa observationer
– ”Före och Efter” inom samma individ
• Gruppvisa jämförelser
– 2 oberoende grupper
• Mellan 3 eller fler observationstillfällen eller mellan 3 eller flera olika grupper
– ANOVA (variansanalys)
• Analys av frekvenser och proportioner
- χ2-test
• Mellan 2 eller fler variabler
– Regression 53
Hur gör vi om vi vill undersöka om det finns en
skillnad i effekt mellan behandling A, behandling B och placebo?
Gruppvisa jämförelser
54
𝜇;= 𝜇9 𝜇: Variabelvärde
Eller mellan dos A, dos B och dos C?
Gruppvisa jämförelser
Variansanalys (ANOVA)
Två Z-test eller två t-test?
Helst inte…
Kom ihåg att det alltid finns en risk att förkasta nollhypotesen trots att den är sann!
Vi måste använda oss av en så kallad variansanalys (ANOVA)!
Ni behöver inte kunna räkna med ANOVA i den här kursen men ni ska veta att om ni har fler grupper än 2 så kan ni inte använda vanliga Z-test eller t-test!
χ ! -TEST
A NALYS AV F REKVENSER
56
Exempel
Hypotesprövning: möjliga jämförelser
• Jämförelser mot ett visst värde
• Parvisa observationer
– ”Före och Efter” inom samma individ
• Gruppvisa jämförelser
– 2 oberoende grupper
• Mellan 3 eller fler observationstillfällen eller mellan 3 eller flera olika grupper
– ANOVA (variansanalys)
• Analys av frekvenser och proportioner
- χ2-test
• Mellan 2 eller fler variabler
– Regression 57
Analys av proportioner och frekvenser
Skillnader i proportioner:
• Andelen patienter som får en viss biverkan vid behandling med olika läkemedel
• Andelen patienter som avbryter behandlingen i olika dosgrupper
Skillnader i frekvenser:
• Hur många patienter som får en viss biverkan vid behandling med olika läkemedel
• Hur många patienter som avbryter behandlingen i olika dosgrupper
58
Analys av proportioner och frekvenser
I den här kursen ska ni bara lära er hypotesprövning för analys av frekvenser.
Proportioner kan göras om till frekvenser genom att multiplicera proportionen med totala antalet individer:
144 individer deltog i en studie och 25% fick en biverkan av läkemedlet.
0.25 6 144 = 36
36 individer fick en biverkan av läkemedlet!
59
Analys av frekvenser: χ
!-test
Oftast så är det kvalitativa variabler som analyseras med hjälp av χ#-test men även
kvantitativa variabler kan analyseras om de delas in i klasser.
60
χ
!-test
• Indelning i grupper eller klasser
(fler grupper/klasser än 2 är möjliga)
• Varje individ i stickprovet förs till någon av grupperna/klasserna
Hypotesprövningen undersöker om fördelningen (frekvensen) av individer på de olika grupperna/
klasserna avviker från det som vore förväntat om H0 är sann.
61
χ
!-test
χ# = -
!&%
) 𝑂! − 𝐸! # 𝐸!
𝑂: De observerade frekvenserna 𝐸: De förväntade frekvenserna 𝑘: Antalet klasser
62
χ
!-test
Fördelningen på grupper/klasser kan vara av två slag:
Analys av en indelning
• Antalet individer som behandlas med läkemedel A, B eller C
Analys av två samtida indelningar
• Antalet individer som behandlas med
läkemedel A, B eller C, samt antalet individer som anser att det läkemedel de tar hjälper
63
Exempel
Hypotesprövning: χ
"-test
En indelning
Vid en tvärsnittsstudie av patienter med migrän vid akademiska sjukhuset i Uppsala tillfrågades sammanlagt 75 individer om vilket läkemedel de använder mot sin migrän.
17 individer svarar att de tar läkemedel A, 32 individer svarar att de tar läkemedel B och resterande 26 individer svarar att de tar läkemedel C.
Finns det någon skillnad när det gäller förskrivningen av de olika läkemedlen?
64
Exempel
Hypotesprövning: χ
"-test
En indelning
Finns det någon skillnad när det gäller förskrivningen av de olika läkemedlen?
H0: Ingen skillnad, läkemedlen förskrivs lika mycket H1: Det finns en skillnad
𝛼 = 0.05
65
Läkemedel O E
A 17
B 32
C 26
Totalt: 75 75
75 3⁄ 75 3⁄ 75 3⁄
=25
=25
=25
Exempel
Hypotesprövning: χ
"-test
En indelning
Finns det någon skillnad när det gäller förskrivningen av de olika läkemedlen?
χ! = /
!(%
) 𝑂! − 𝐸! #
𝐸! =
Antal frihetsgrader: 𝑘 − 1 =
Kritiskt värde för 5% signifikansnivå:
Tolka resultat:
66
Exempel
Hypotesprövning: χ
"-test
En indelning
Finns det någon skillnad när det gäller förskrivningen av de olika läkemedlen?
χ# = 17 − 25 #
25 + 32 − 25 #
25 + 26 − 25 #
25 = 4.56
67
χ
!-fördelningen: kritiskt värde
χ# = -
!&%
) 𝑂! − 𝐸! # 𝐸!
När de observerade frekvenserna är långt ifrån de förväntade (både lägre och högre) så ger det höga värden på χ#.
Låga värden på χ# fås enbart då de observerade frekvenserna är nära de förväntade.
68
Jämför med beräkning av stickprovsvariansen 𝑠# = 1
𝑛 − 1/
!(%
"
𝑥! − ̅𝑥 #
χ
!-fördelningen: kritiskt värde
df=1 df=2 df=3 df=4 df=5
Nedre gränsen är noll oberoende av antal frihetsgrader!
Långa svansar åt höger. Ju fler frihetsgrader desto längre svansar!
Exempel
Hypotesprövning: χ
"-test
En indelning
Antal frihetsgrader: 𝑘 − 1 = 3 − 1 = 2 Kritiskt värde för 5% signifikansnivå: 5.99
70
Exempel
Hypotesprövning: χ
"-test
En indelning
Finns det någon skillnad när det gäller förskrivningen av de olika läkemedlen?
χ# = 17 − 25 #
25 + 32 − 25 #
25 + 26 − 25 #
25 = 4.56
Antal frihetsgrader: 𝑘 − 1 = 3 − 1 = 2 Kritiskt värde för 5% signifikansnivå: 5.99
4.56 < 5.99
H0 kan inte förkastas!
71
Exempel
Hypotesprövning: χ
"-test
Två samtida indelningar
De 75 individerna som deltog i studien av
förskrivningen av olika migränläkemedel tillfrågades även huruvida de upplever sig bli hjälpta av sitt
läkemedel.
Av de som behandlas med läkemedel A svarar 15 att de blir hjälpta, av de som behandlas med
läkemedel B svarar 25 att de blir hjälpta och av de som behandlas med läkemedel C svarar 26
individer att de blir hjälpta av sitt läkemedel.
Är det någon skillnad mellan
läkemedlen med avseende på effekt?
72
Exempel
Hypotesprövning: χ
"-test
Två samtida indelningar
Är det någon skillnad mellan läkemedlen med avseende på effekt?
H0: Ingen skillnad, läkemedlen är lika effektiva H1: Det finns en skillnad
Hjälpta Inte hjälpta Totalt:
Läkemedel A 15 2 17
Läkemedel B 25 7 32
Läkemedel C 26 0 26
Totalt: 66 9 75
De förväntade frekvenserna beräknas som:
𝐸 = 𝑟𝑎𝑑𝑠𝑢𝑚𝑚𝑎 H 𝑘𝑜𝑙𝑢𝑚𝑛𝑠𝑢𝑚𝑚𝑎 𝑡𝑜𝑡𝑎𝑙𝑠𝑢𝑚𝑚𝑎
𝑶𝒃𝒔𝒆𝒓𝒗𝒆𝒓𝒂𝒅𝒆
𝛼 = 0.05
Exempel
Hypotesprövning: χ
"-test
Två samtida indelningar
Är det någon skillnad mellan läkemedlen med avseende på effekt?
𝐸 = 𝑟𝑎𝑑𝑠𝑢𝑚𝑚𝑎 H 𝑘𝑜𝑙𝑢𝑚𝑛𝑠𝑢𝑚𝑚𝑎 𝑡𝑜𝑡𝑎𝑙𝑠𝑢𝑚𝑚𝑎
Hjälpta Inte hjälpta Totalt:
Läkemedel A 17
Läkemedel B 32
Läkemedel C 26
Totalt: 66 9 75
74
17 D 66 75⁄ 32 D 66 75⁄ 26 D 66 75⁄
17 D 9 75⁄ 32 D 9 75⁄ 26 D 9 75⁄ 𝑭ö𝒓𝒗ä𝒏𝒕𝒂𝒅𝒆
Den förväntade frekvensen är inte alltid ett heltal.
Ange värdet med 1-2 decimaler.
Exempel
Hypotesprövning: χ
"-test
Två samtida indelningar
Är det någon skillnad mellan läkemedlen med avseende på effekt?
𝑶𝒃𝒔𝒆𝒓𝒗𝒆𝒓𝒂𝒅𝒆 𝑭ö𝒓𝒗ä𝒏𝒕𝒂𝒅𝒆
Hjälpta Inte hjälpta Totalt:
Läkemedel A 15 (14.96) 2 (2.04) 17 Läkemedel B 25 (28.16) 7 (3.84) 32 Läkemedel C 26 (22.88) 0 (3.12) 26
Totalt: 66 9 75
χ# = 15 − 14.96 # 75
14.96 + 2 − 2.04 #
2.04 + ⋯ + 0 − 3.12 #
3.12 = 6.50
Exempel
Hypotesprövning: χ
"-test
En indelning
Antal frihetsgrader:
df = 𝑛# − 1 𝑛$ − 1
df = 3 − 1 2 − 1 = 2
Kritiskt värde för 5% signifikansnivå: 5.99
76
Exempel
Hypotesprövning: χ
"-test
Två samtida indelningar
Är det någon skillnad mellan läkemedlen med avseende på effekt?
χ# = 15 − 14.96 #
14.96 + 2 − 2.04 #
2.04 + ⋯ + 0 − 3.12 #
3.12 = 6.50
Antal frihetsgrader: df = 𝑛# − 1 𝑛$ − 1 df = 3 − 1 2 − 1 = 2
Kritiskt värde för 5% signifikansnivå: 5.99 6.50 > 5.99
H0 förkastas!
77
χ
!-fördelningen
χ#-fördelningen grundar sig ursprungligen på
kontinuerliga variabler. När vi använder χ#-test för att analysera frekvenser så är funktionsuttrycket enbart approximativt
χ#-fördelat! (Jämför t-test vs. Z-test)
𝝌𝟐-test ska bara användas då…
… stickprovsstorleken är ≥ 30
… ingen av de förväntade frekvenserna är < 1
Om inte dessa uppfylls ska Fishers exakta test användas istället!
78
Sammanfattning
Analys av frekvenser och proportioner
Proportioner måste göras om till frekvenser för att kunna analyseras med hjälp av c2-test
c2-test kan användas för att analysera kvalitativa variabler eller klassindelade kvantitativa variabler Fördelningen av individer på klasser kan vara av två slag:
• En indelning
• Två samtida indelningar
c2-test ger ett approximativt svar vid små n och ett exakt svar vid stora
79