Matematisk statistik 9 hp, HT-16 F¨orel¨asning 13: Mer om hypotestest
Anna Lindgren
16+17 november, 2016
Repetition Metodval Exempel Konfidensintervall Metoder
Olika metoder f¨or att utf¨ora hypotestest
1. Direktmetoden eller P-v¨arde
I Antag attH0¨ar sann
I R¨akna utP-v¨ardet p = P(F˚a det vi f˚att eller v¨arre)
I Omp < αf¨orkastasH0
2. Konfidensmetoden. G¨or ett konfidensintervall med
konfidensgraden 1 − α och f¨orkasta H
0p˚a niv˚an α om intervallet ej t¨acker θ
0. Intervallen skall, beroende p˚a H
1, vara
Test H
1: θ < θ
0H
1: θ 6= θ
0H
1: θ > θ
0Intervall: upp˚at begr tv˚asidigt ned˚at begr 3. Testkvantitet T(X) och kritiskt omr˚ade C F¨orkasta H
0om
testskvantiteten hamnar i det kritiska omr˚adet.
C och T skall v¨aljas s˚a att
α = P(T (X) ∈ C) = P(”F¨ orkasta H
0om H
0¨ar sann”)
Hypotestest – Vilken metod?
I
(Approx.) Normalf¨ordelad skattning d¨ar D(θ
∗) inneh˚aller σ:
σ k¨ and: Vilken som helst.
σ ok¨ and: Direktmetoden kr¨aver t-f¨ordelningens f¨ordelningsfunktion.
I
Bin, Po, . . . d¨ar D(θ
∗) inneh˚aller θ.
Direktmetoden G˚ar alltid att anv¨anda, ibland med normalapproximation.
Testkvantitet Kr¨aver normalt normalapproximation.
Kritiskt omr˚adet Kan beh¨ova normalapproximation.
Konfidensmetoden Fungerar inte.
Vid styrkefunktion ¨ar det naturligt att utg˚a fr˚an testkvantitet eller
kritiskt omr˚ade.
Repetition Metodval Exempel Konfidensintervall Allm¨ant Teststorhet
Testkvantiteter
Antag att vi vill testa H
0: θ = θ
0.
Model Skattning T(X) D(θ∗)/d(θ∗) kvantil Xi∈N (μ, σ) σk¨and μ∗= ¯X μD(μ∗−μ∗)0
√σ
n λ
σok¨and μd(μ∗−μ∗)0
√s
n t(f )
X ∈ Bin(n, p) p∗=Xn pD∗−p0
0(p∗)
qp0(1−p0)
n λ
Xi∈Po(μ) μ∗= ¯X μD∗−μ0
0(μ∗)
pμ0
n λ
Notera:
1. Skattningarnas standardavvikelse/medelfel r¨aknas under H
0. 2. Bin och Po fallet kr¨aver normalapproximation.
3. α-kvantil om ensidigt, α/2-kvantil om tv˚asidigt.
Exempel 1: Sm¨altpunkt
Stickprov av mycket rent j¨arn berett med tv˚a olika metoder A och B hade f¨oljande sm¨altpunkter:
A (◦C)1493 1519 1518 1517 1512 1514 1489 1508 1494 B (◦C)1509 1494 1512 1483 1507 1491
Formulera en statistisk modell baserad p˚a normalf¨ordelning och lika varians.
a) Konstruera ett konfidensintervall f¨or skillnaden mellan de tv˚a medelsm¨altpunkterna. Konfidensgrad: 95%.
b) Testa hypotesen att de olika metoderna ger samma
medelsm¨altpunkter.
Repetition Metodval Exempel Konfidensintervall Sm¨altpunkt V˚ag Jordb¨avningar
Exempel 1
0 2 4 6 8 10
1480 1490 1500 1510 1520
Mätning nr
Temperatur [°C]
Smältpunkt. A: x,− B: o,− −
Ex.: 1. Modell och problemformulering
Tv˚a oberoende stickprov!
Vi har n
x= 9 observationer fr˚an
X
i= ”sm¨altpunkt vid metod A” ∈ N (μ
x, σ) och n
y= 6 observationer fr˚an
Y
i= ”sm¨altpunkt med metod B” ∈ N μ
y, σ .
Vi vill g¨ora ett 95 % konfidensintervall f¨or μ
x− μ
yoch testa
H
0: μ
x= μ
ymot H
i: μ
x6= μ
yp˚a signifikansniv˚an α = 5 %.
Repetition Metodval Exempel Konfidensintervall Sm¨altpunkt V˚ag Jordb¨avningar
2. Skattning
Vi skattar
μ
∗x= ¯ x = 1507.1, μ
∗y= ¯ y = 1499.3,
(μ
x− μ
y)
∗= μ
∗x− μ
∗y= ¯ x − ¯ y = 1507.1 − 1499.3 = 7.8.
Vi har ocks˚a σ
∗= s
x= 11.9 och σ
∗= s
y= 11.6 s˚a att den sammanv¨agda σ-skattningen blir
σ
∗= s
p=
s (n
x− 1)s
2x+ (n
y− 1)s
2yn
x− 1 + n
y− 1
= s
(9 − 1) · 11.9
2+ (6 − 1) · 11.6
29 − 1 + 6 − 1 = 11.8
som har f = n
x− 1 + n
y− 1 = 13 frihetsgrader.
3. Egenskaper
Eftersom alla X
ioch Y
i¨ar oberoende av varandra har vi att
μ
∗x= ¯ X ∈ N
μ
x, σ
√ n
x, μ
∗y= ¯ Y ∈ N
μ
y, σ
√ n
y,
μ
∗x− μ
∗y∈ N μ
x− μ
y, σ s 1
n
x+ 1 n
y!
= N μ
x− μ
y, σ r 1 9 + 1
6
! . Om H
0: μ
x= μ
y¨ar sann s˚a g¨aller att
μ
∗x− μ
∗y∈ N 0, σ r 1 9 + 1
6
! .
Eftersom σ ¨ar ok¨ant och skattas med s
p= 11.8 blir medelfelet d(μ
∗x− μ
∗y) = s
ps 1 n
x+ 1 n
y= 11.8 r 1 9 + 1
6 = 6.2
Repetition Metodval Exempel Konfidensintervall Sm¨altpunkt V˚ag Jordb¨avningar
4. L¨osning och 5. Slutsats
4(a) Konfidensintervall
Eftersom s
phar f = 13 frihetsgrader ges ett tv˚asidigt 95 % konfidensintervall f¨or μ
x− μ
yav
I
μx−μy= μ
∗x− μ
∗y± t
α/2(f ) · d(μ
∗x− μ
∗y)
= 7.8 ± t
0.025(13)
| {z }
2.16
·11.8 r 1 9 + 1
6 = (−5.6, 21.2).
4(b) Hypotestest
Eftersom H
0: μ
x− μ
y= 0 ligger i intervallet kan H
0inte f¨orkastas.
5. Slutsats
Vi kan inte p˚ast˚a att sm¨altpunkterna ¨ar olika.
Exempel 2: V˚ag
Man har tv˚a v˚agar, A och B, d¨ar man misst¨anker att v˚ag B har ett systematiskt fel s˚a att den ger f¨or h¨ogt utslag medan man vet att v˚ag A v¨ager r¨att i medeltal. Man v¨agde 6 f¨orem˚al p˚a b˚ada v˚agarna och fick nedanst˚aende resultat:
F¨orem˚al, i 1 2 3 4 5 6
v˚ag A, x
i1.0 7.7 9.6 21.0 32.3 22.6
v˚ag B, y
i3.1 8.8 12.0 19.5 35.5 32.5
S¨att upp en l¨amplig modell f¨or data, baserad p˚a normalf¨ordelning och
avg¨or om v˚ag B ger f¨or h¨ogt utslag i medeltal.
Repetition Metodval Exempel Konfidensintervall Sm¨altpunkt V˚ag Jordb¨avningar
Exempel 2
0 1 2 3 4 5 6 7
0 10 20 30 40
Föremål nr
Vikt
Vikt. A: x B: o
0 1 2 3 4 5 6 7
−5 0 5 10
Föremål nr
Viktdifferens
Ex.2 l¨osning
1. Modell och problem
Stickprov i par med n = 6 observationer av
X
i= ”v˚ag A f¨or f¨orem˚al nr. i” och Y
i= ”v˚ag B f¨or f¨orem˚al nr. i” d¨ar E(X
i) = μ
ioch E(Y
i) = μ
i+ Δ.
Bilda Z
i= Y
i− X
i= ”v˚ag B − v˚ag A f¨or f¨orem˚al nr. i” ∈ N (Δ, σ).
Testa H
0: Δ = 0 mot H
1: Δ > 0 p˚a signifikansniv˚a α = 5 %.
2. Skattning
Δ
∗= . . . , σ
∗= . . . , f = . . . 3. Egenskaper
Δ
∗∈ . . . , Om H
0¨ar sann s˚a . . . , d(Δ
∗) = . . . 4. L¨osning
(Ett l¨ampligt ensidigt test med t-f¨ordelning . . . ) Eftersom . . . kan H
0[f¨orkastas/inte f¨orkastas].
5. Slutsats: [Ja/Nej], vi [kan/kan inte] p˚ast˚a att v˚ag B ger f¨or h¨ogt utslag.
Repetition Metodval Exempel Konfidensintervall Sm¨altpunkt V˚ag Jordb¨avningar
Exempel 3: Jordb¨avningar
Antalet jordskalv under ett ˚ar i ett omr˚ade anses vara poissonf¨ordelat med parametern μ, dvs om
X = ”antal jordskalv under ett ˚ar”
g¨aller X ∈ Po(μ). Antalet jordskalv olika ˚ar anses vara oberoende.
Den seismologiska aktiviteten har under en l¨angre period varit ganska konstant med ett μ som anses vara 1.6.
Under perioden 1990 − 1999 uppm¨attes emellertid 25 jordskalv i omr˚adet. Tyder detta p˚a att omr˚adet blivit seismologiskt oroligt s˚a att μ
¨okat?
Ex.3: L¨osning
1. Modell och problem
Vi har egentligen n = 10 oberoende observationer av
X
i= ”antal jordskalv under ˚ar i” ∈ Po(μ) men vi har bara noterat observationen y = 25 av
Y = P
ni=1
X
i= ”antal jordskalv p˚a 10 ˚ar” ∈ Po(n · μ) = Po(10μ).
Vi vill testa H
0: μ = 1.6 mot H
1: μ > 1.6 p˚a signifikansniv˚a α = 5 %.
2. Skattning
μ
∗= ¯ x =
yn=
2510= 2.5.
3. Egenskaper
Om H
0¨ar sann s˚a ¨ar Y ∈ Po(nμ
0) = Po(10 · 1.6) = Po(16).
Eftersom 16 > 15 kan vi normalapproximera s˚a att Y ∈
∼N 16, √
16 och μ
∗=
10Y∈
∼
N (. . . , . . . ) med D
0(μ
∗) = . . . .
Repetition Metodval Exempel Konfidensintervall Sm¨altpunkt V˚ag Jordb¨avningar
4. L¨osning
(L¨ampligt ensidigt test som utnyttjar D
0(μ
∗) . . . .) Eftersom . . . kan H
0[f¨orkastas/inte f¨orkastas].
5. Slutsats:
[Ja/Nej], vi [kan/kan inte] p˚ast˚a att μ ¨okat.
Transformation av konfidensintervall
Har man ett konfidensintervall f¨or en parameter θ I
θ= [a
1, a
2]
kan detta transformeras till ett intervall f¨or g(θ) genom
I
g(θ)= [g(a
1), g(a
2)]
om g ¨ar monoton (str¨angt v¨axande eller str¨angt avtagande) i det omr˚ade d¨ar θ ¨ar definierad.
Ex. Ett intervall f¨or β =”¨okningen av j¨arnhalten per meter” i ett
vattendrag blev I
β= [−0.0372, −0.0153]. Transformera detta till ett
intervall f¨or minskningen av j¨arnhalten per 100 meter.
Repetition Metodval Exempel Konfidensintervall Transformation Konfidensintervall f¨or σ2
Konfidensintervall f¨or σ
2i N(μ, σ)
x
1, . . . , x
nobservationer av X
i∈ N(μ, σ) Ett 1 − α konfidensintervall f¨or σ
2ges av
I
σ2= (n − 1)s
2χ
2α/2(n − 1) , (n − 1)s
2χ
21−α/2(n − 1)
!
= Q
χ
2α/2(f ) , Q χ
21−α/2(f )
!
d¨ar
I
s
2= 1 n − 1
n
X
i=1
(x
i− ¯ x)
2= Q f
I