F¨orel¨asningsanteckningar till kapitel 8, del 2
Kasper K. S. Andersen 4 oktober 2018
1 J¨ amf¨ orelse av tv˚ a v¨ antev¨ arden
Ofte vil man j¨amf¨ora tv˚a (eller fler) produkter, behandlingar, processer etc.
med varandra. Vi behandler de tv˚a fall ‘stickprov i par’ och ‘tv˚a oberoende stickprov’ d¨ar man utifr˚an vissa f¨oruts¨attningar kan uttala sig om eventuella skillnader. Vi g¨or bland annat antaganden om normalf¨ordelning: Delvis f¨or att normalf¨ordelningen ¨ar matematisk enkel att hantera och delvis f¨or att man (˚atminstone f¨or stora datamaterial) kan approximera med en normalf¨ordelning enligt centrala gr¨ansv¨ardesatsen.
L˚at oss illustrera de tv˚a situationer genom ett konkret exempel: Vi ¨onsker att unders¨oka effekten av en viss typ medicin p˚a blodtrycket. Vi kan organisera experimentet p˚a ett av f¨oljanda s¨att:
• Man tar n personer och m¨ater blodtrycket hos varje person f¨ore och efter behandling med medicinen. (‘Stickprov i par’)
• Man tar tv˚a grupper personer och behandler personerna i den ena grupp med medicinen. Man m¨ater d˚a blocktrycket p˚a personerna i de tv˚a grup- perna. (‘Tv˚a oberoende stickprov’)
Vi betraktar endast tv˚asidiga konfidensintervall, men ensidiga konfidensin- tervall konstrueras fr˚an dessa p˚a samma s¨att som tidigare.
1.1 Stickprov i par
Den statistiska modellen ¨ar som f¨oljer: Vi har n personer. Blodtrycket f¨ore och efter behandling hos person i kan ses som stokastiska variabler ξi∈ N (µi, σ1) re- spektiva ηi∈ N (µi+ ∆, σ2). Vi till˚ater allts˚a att v¨antev¨ardet beror p˚a personen.
Parametern ∆ anger den systematiska p˚averkning av medicinen p˚a blodtrycket
— vi antar att denna ¨ar ens f¨or alla (jfr Figur 8.8). F¨or att s¨aga att medici- nen p˚averkar blodtrycket skall vi kunna p˚ast˚a att ∆ 6= 0. Vi antar ocks˚a att standardavvikelsen σ1 f¨ore behandling ¨ar samma f¨or alla personer och ocks˚a att standardavvikelsen σ2 efter behandling ¨ar samma f¨or alla personer. De tv˚a standardavvikelser σ1och σ2 kan dock vara olika. Vi antar dessutom att paren (ξ1, η1), . . . , (ξn, ηn) ¨ar oberoende.
S¨att ζi= ηi− ξi. D˚a blir ζ1, . . . , ζn oberoende. Enligt Sats 6B g¨aller ζi∈ N
∆, q
σ12+ σ22
.
Allts˚a ¨ar ζ1, . . . , ζn ett stickprov fr˚an N
∆,pσ12+ σ22
. Denna situation ¨ar k¨and fr˚an tidigare, vi har tv˚a fall beroende p˚a om σ1 och σ2 ¨ar k¨anda eller ok¨anda.
Sats: L˚at ξi ∈ N (µi, σ1) och ηi ∈ N (µi + ∆, σ2) f¨or i = 1, . . . , n och anta att paren (ξ1, η1), . . . , (ξn, ηn) ¨ar oberoende. S¨att ζi = ηi − ξi och ζ =
1
n(ζ1+ . . . + ζn). En intervallskattning f¨or ∆ med konfidensgrad 1 − α ges av
• σ1 och σ2 k¨anda:
I∆=
ζ − λα/2· σ
√n, ζ + λα/2· σ
√n
d¨ar σ =pσ21+ σ22.
• σ1 och σ2 ok¨anda:
I∆=
ζ − tα/2(n − 1) · σ∗
√n, ζ + tα/2(n − 1) · σ∗
√n
d¨ar σ∗= q 1
n−1
Pn
i=1 ζi− ¯ζ2
¨ar punktskattningen av σ med s-metoden.
Exempel: Vi m¨ater blodtryck f¨ore och efter anv¨andning av n˚agon medi- cin p˚a 5 personer. Vi antar att blodtrycketp˚a person i f¨ore och efter ¨ar nor- malf¨ordelade: N (µi, σ1) respektiva N (µi+ ∆, σ2). Ange ett 95% konfidensinter- vall f¨or ∆.
Person 1 2 3 4 5
Blodtryck f¨ore, xi 75 70 75 65 95 Blodtryck efter, yi 85 75 80 80 100 L¨osning: Vi f˚ar med zi = yi− xi
i 1 2 3 4 5
zi 10 5 5 15 5 Vi har n = 5 ochP5
i=1zi= 40 varav ¯z = 405 = 8. D˚a σ1 och σ2 ¨ar ok¨anda ber¨aknes ocks˚a P5
i=1zi2= 400, vilket ger
s = v u u u t
1 n − 1
n
X
i=1
z2i
!
− 1 n·
n
X
i=1
zi
!2
= s
1 4
400 −402 5
=√ 20.
D˚a α = 0.05 ger tabell att tα/2(n − 1) = t0.025(4) ∼= 2.776445. Konfidensinter- vallet blir d˚a
I∆,obs=
"
8 − 2.776445 ·
√20
√5 , 8 + 2.776445 ·
√20
√5
#
= [2.4, 13.6].
D˚a I∆ inneh˚aller ∆ med 95% sannolikhet s˚a verkar medicinen ha blodtrycks- h¨ojande effekt.
1.2 Tv˚ a oberoende stickprov
Den statistiska modellen ¨ar som f¨oljer: Vi har tv˚a grupper med n1 respektiva n2 personer, d¨ar personerna i grupp 1 inte blir behandlad medan personerna i grupp 2 blir behandlad med n˚agon medicin. Blodtrycket hos personerne i grupp 1 ses som stokastiska variabler ξ1, . . . , ξn1 fr˚an N (µ1, σ1). Motsvarende ses blodtrycket hos personerne i grupp 2 ses som stokastiska variabler η1, . . . , ηn2
fr˚an N (µ2, σ2). F¨or att s¨aga att medicinen p˚averkar blodtrycket skall vi kunna p˚ast˚a att µ16= µ2. Allts˚a ¨ar parametern µ1− µ2ett m˚att f¨or den systematiske p˚averkning av medicinen p˚a blodtrycket. Vi antar (som i fallet ‘Stickprov i par’) att standardavvikelsen σ1utan behandling ¨ar samma f¨or alla personer i grupp 1 och ocks˚a att standardavvikelsen σ2med behandling ¨ar samma f¨or alla personer i grupp 2. De tv˚a standardavvikelser σ1 och σ2 kan dock vara olika om b˚ada
¨ar k¨anda. Om b˚ada ¨ar ok¨anda m˚aste vi anta att σ1= σ2! (Se mera nedan). Vi antar dessutom att alle de stokastiska variablernerna ξ1, . . . , ξn1, η1, . . . , ηn2 ¨ar oberoende.
Man vill j¨amf¨ora µ1och µ2genom att g¨ora en intervallskattning av µ1− µ2. Vi anv¨andar punktskattningerna
µ∗1= ξ = ξ1+ . . . + ξn1
n1 och µ∗2= η =η1+ . . . + ηn2
n2 av µ1 respektiva µ2. Enligt Sats 6D g¨aller
ξ ∈ N
µ1, σ1
√n1
och η ∈ N
µ2, σ2
√n2
.
Sats 6B ger d˚a
ξ − η ∈ N
µ1− µ2, s
σ12 n1
+σ22 n2
.
1.2.1 σ1 och σ2 k¨anda
Sats: L˚at ξ1, . . . , ξn1 ∈ N (µ1, σ1) och η1, . . . , ηn2 ∈ N (µ2, σ2) och anta att ξ1, . . . , ξn1, η1, . . . , ηn2 ¨ar oberoende. S¨att
ξ = ξ1+ . . . + ξn1
n1 och η =η1+ . . . + ηn2
n2 .
En intervallskattning av µ1− µ2 med konfidensgrad 1 − α ges av
Iµ1−µ2=
ξ − η − λα/2· s
σ12 n1
+σ22 n2
, ξ − η + λα/2· s
σ21 n1
+σ22 n2
.
1.2.2 σ1 och σ2 ok¨anda
I detta fall m˚aste σ1och σ2 skattas. L˚at
σ1∗= v u u t
1 n1− 1
n1
X
i=1
ξi− ¯ξ2
och σ∗2= v u u t
1 n2− 1
n2
X
i=1
(ηi− ¯η)2
vara punktskattningerna av σ1 respektiva σ2 med s-metoden. Tyv¨arr ¨ar f¨ordel- ningen av
ξ − η − (µ1− µ2) qσ21∗
n1 +σ22
∗
n2
komplicerad (‘Behrens-Fishers problem’) och en exakt l¨osning ¨ar inte k¨and!
Om man antar σ1= σ2 kan man dock visa att ξ − η − (µ1− µ2)
σ∗·q
1 n1 +n1
2
∈ t ((n1− 1) + (n2− 1))
d¨ar
σ∗= s
(n1− 1) · σ12∗+ (n2− 1) · σ21∗ (n1− 1) + (n2− 1)
¨ar en sammanv¨agd punktskattning av σ1= σ2. Man kan dessutom visa att σ2∗
¨ar en v¨antev¨ardesriktig punktskattning av σ12= σ22.
Sats: L˚at ξ1, . . . , ξn1 ∈ N (µ1, σ1) och η1, . . . , ηn2 ∈ N (µ2, σ2) och anta att ξ1, . . . , ξn1, η1, . . . , ηn2 ¨ar oberoende. S¨att
ξ = ξ1+ . . . + ξn1
n1 och η =η1+ . . . + ηn2
n2 .
Anta dessutom att σ1= σ2 ¨ar ok¨and. Ett konfidensintervall Iµ1−µ2 f¨or µ1− µ2
med konfidensgrad 1 − α ges av
Iµ1−µ2 =
ξ − η − tα/2(n1+ n2− 2) · σ∗·r 1 n1
+ 1 n2
, ξ − η + tα/2(n1+ n2− 2) · σ∗·r 1 n1
+ 1 n2
.
Exempel: Vi m¨ater blodtryck hos tv˚a grupper personer d¨ar grupp 2 be- handlas med n˚agon medicin. Vi f˚ar f¨oljande resultater
Grupp 1: n1= 6, x = 117.5, s1= 9.7 Grupp 2: n2= 4, y = 126.8, s2= 12.0
Observationerna anses komma fr˚an N (µ1, σ) respektiva N (µ2, σ). Best¨am ett 95% konfidensintervall f¨or µ1− µ2.
L¨osning: Den sammanv¨agda punktskattning av σ blir
σ∗obs= s
(n1− 1) · s21+ (n2− 1) · s22 (n1− 1) + (n2− 1)
= s
(6 − 1) · 9.72+ (4 − 1) · 12.02 (6 − 1) + (4 − 1)
=
r902.45 8
∼= 10.62103.
Vi har α = 0.05 varav tα/2((n1− 1) + (n2− 1)) = t0.025(8) ∼= 2.306004. Ins¨attning ger d˚a konfidensintervallet
Iµ1−µ2,obs=
"
117.5 − 126.8 ± 2.306004 · 10.62103 · r1
6 +1 4
#
= [−25.52, 6.92].
D˚a 0 ligger inom Iµ1−µ2,obsverkar medicinen inte p˚averka blodtrycket.
§8.4–8.5 ing˚ar inte