Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II
Matematisk statistik 9.5 hp, HT-16
F¨orel¨asning 11: Konfidensintervall
Anna Lindgren
7+8 november 2016
Stickprov & Skattning
Ettstickprov,x1,x2, . . . ,xn, ¨arobservationerav s.v.X1, . . . ,Xnfr˚an n˚agon f¨ordelningXi ∈ F(θ)d¨arθ¨ar en ok¨andparameter.
Enskattningavθ,θ∗(x1, . . . ,xn)¨ar en observation av den s.v.
θ∗(X1, . . . ,Xn). B˚ada betecknas oftast bara medθ∗.
Tal
S.V.
Xi∈ F(θ)
θ∗
θ∗
X2 θ∗(X)
X1
x1 x2 θ∗(x1, . . . ,xn)
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II
Minsta kvadrat-metoden, MK
OmE(Xi) = μi(θ)s˚a f˚asMK-skattningenavθgenom att minimera f¨orlustfunktionen
Q(θ) =
n
X
i=1
xi− μi(θ)
2
m.a.p.θ.
Maximum likelihood-metoden, ML
ML-skattningenavθf˚as genom att maximera likelihood-funktionen L(θ; x1, . . . ,xn)m.a.p.θ.
L(θ) = pX1(x1) · . . . ·pXn(xn) (diskr.) L(θ) = fX1(x1) · . . . ·fXn(xn) (kont.)
Konfidensintervall
Ettkonfidensintervallf¨or parameternθt¨acker det sanna v¨ardet p˚aθ med sannolikheten1 − α.
1 − αkallaskonfidensgrad. Vanliga v¨arden ¨ar0.95,0.99och0.999.
Etttv˚asidigtkonfidensintervall ¨ar allts˚atv˚askattningara∗1,a∗2s˚a att P
a∗1(X1, . . . ,Xn) < θ < a∗2(X1, . . . ,Xn)
=1 − α
Ettensidigtkonfidensintervall ¨arenskattninga∗1ellera∗2s˚a att P
a∗1(X1, . . . ,Xn) < θ < ∞
=1 − α eller
P
−∞ < θ < a∗2(X1, . . . ,Xn)
=1 − α
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II Repetition N(μ, σ)
Andelen 1 − α av intervallen t¨acker r¨att v¨arde i l˚anga loppet
0 0.5 1 1.5 2
0 10 20 30 40 50 60 70 80 90 100
Intervall nr
100 st 95% konfidensint. för µ i N(µ,2)
0 0.5 1 1.5 2
0 10 20 30 40 50 60 70 80 90 100
Intervall nr
100 st 95% konfidensint. för µ i N(µ,σ)
α-kvantil, xα
Enkvantil,xα, till en s.v.X ¨ar den gr¨ans som ¨overskrids med slhα. Den f˚as som l¨osning till n˚agon av f¨oljande ekvationer.
FX(xα) =1 − α ⇐⇒
Z xα
−∞
fX(x) dx = 1 − α ⇐⇒
Z ∞ xα
fX(x) dx = α
Sats 6.1 — Standardiserad normalf¨ordelning OmX ∈ N(μ, σ), E(X) = μ, V(X) = σ2s˚a ¨ar
X − μ
σ ∈ N(0, 1) med kvantiler λα
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II Repetition N(μ, σ)
Konfidensintervall f¨or μ d˚a X
i∈ N (μ, σ), σ k¨and
1. En skattning avμ¨ar:
μ∗ = 1 n
n
X
i=1
Xi
2. MedE(μ∗) = μochD(μ∗) = σ
√n. 3. Enligt Sats 6.1 ¨ar
μ∗− μ
D(μ∗) ∈N (0, 1) . 4. Vi s¨oker nu tal s˚a att:
P
? < μ∗− μ D(μ∗) < ?
=1 − α 5. Konfidensintervallet f¨orμ¨ar:Iμ= μ∗± λα/2·D(μ∗).
Konfidensintervall f¨or μ d˚a X
i∈ N (μ, σ), σ ok¨and
Omσ¨ar ok¨and ers¨attsD(μ∗)med medelfelet:
d(μ∗) = s
√n s =
v u u t
1 n − 1
n
X
i=1
(xi− ¯x)2
Men, nu ¨ar μ∗− μ
d(μ∗) inte N(0, 1).
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II χ2 t
χ
2-f¨ordelning (chi-tv˚a)
I Y ∈ χ2(f ).f kallas antal frihetsgrader.
I α-kvantil:χ2α(f ). Tabell 4.
Om X1, . . . ,Xn ∈ N(μ, σ) och oberoende s˚a g¨aller
1 σ2
n
X
i=1
(Xi− μ)2∈ χ2(n) 1
σ2
n
X
i=1
(Xi− ¯X)2∈ χ2(n − 1) 00 2 4 6 8 10 12
0.2 0.4 0.6
← f = 1
← f = 3
χ2 − fördelning med f = 1, 3, 5, 15
Student’s t-f¨ordelning
I X ∈ t(f ).f kallas antal frihetsgrader.
I α-kvantil:tα(f ). Tabell 3.
OmX ∈ N(0, 1)ochY ∈ χ2(f )¨ar oberoende g¨aller
X
pY/f ∈ t(f) och speciellt f¨orXi ∈ N(μ, σ)
X − μ¯ S/√
n ∈ t(n − 1)
−40 −2 0 2 4
0.2 0.4
f = 1 →
← f = ∞ t − fördelning med f = 1, 2, 4, 8, ∞
d¨ar
X =¯ 1 n
n
XXi och S2= 1 n − 1
n
X(Xi− ¯X)2
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II χ2 t
Student — William Sealy Gosset
Konfidensintervall f¨or μ i N(μ, σ) x1, . . . ,xnobservationer avXi ∈ N(μ, σ) σ k¨and:
Iμ= μ∗± λα/2· D(μ∗) = ¯x ± λα/2· σ
√n
σ ok¨and:
Iμ= μ∗± tα/2(f ) · d(μ∗) = ¯x ± tα/2(n − 1) · s
√n
Kvantilerna ges av:
I λα/2¨arN(0, 1)-f¨ordelningensα/2-kvantil (Tabell 2)
I tα/2(n − 1)¨art(n − 1)-f¨ordelningensα/2-kvantil (Tabell 3)
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall
Exempel: Sockerinneh˚all i betor
Sockerbetor har i regel ett sockerinneh˚all p˚a16 − 18 %(enligt Dansukkers hemsida). Anta att sockerinneh˚allet i en godtyckligt vald beta beskrivas avXi ∈N (μ, σ)medσok¨and. I ett visst betlass unders¨okte man sockerhalten hos25slumpm¨assigt utvalda betor.
1 25
25
X
i=1
xi =16.8
25
X
i=1
(xi− ¯x)2=4.8
G¨or ett95 %-konfidensintervall f¨or den f¨orv¨antade sockerhalten i betlasset.
Konfidensintervall baserade p˚a normal(approximation)
Omθ∗∈ N(θ, D(θ∗))ellerθ∗∈
∼N(θ, D(θ∗)):
D(θ∗)k¨and
Iθ= θ∗± λα/2·D(θ∗)
D(θ∗)ok¨and, skattas med d(θ∗)
Iθ= θ∗± tα/2(f ) · d(θ∗) om d(θ∗)inneh˚aller σ∗ =s = rQ
f Iθ= θ∗± λα/2· d(θ∗) annars
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall
Ex: Konfidensintervall f¨or p d˚a X ∈ Bin(n, p)
Vi vill uppskatta hur vanligt det ¨ar att det sn¨oar i april i M˚alilla och konstaterar att under de300aprildagarna under perioden1988–1997 s˚a sn¨oade det under71dagar. Antag att olika dagar ¨ar oberoende av varandra.
Ber¨akna ett approximativt95 %konfidensintervall f¨or sannolikheten att det sn¨oar en slumpm¨assigt vald aprildag i M˚alilla.
Sammanv¨agd variansskattning
Om vi har
x1, . . . ,xnx obs. avXi ∈N (μx, σ) y1, . . . ,yny obs. avYi ∈N μy, σ kan den gemensamma variansenσ2skattas med
s2p= (nx−1)s2x+ (ny−1)s2y nx−1 + ny−1 = Q
f , (Q
σ2 ∈ χ2(f )) Ett konfidensintervall f¨orμx− μy blir t.ex.
Iμx−μy = ¯x − ¯y ± tα/2(f ) · sp
s 1 nx
+ 1 ny
eftersom ∗− μ∗ = ¯X − ¯Y ∈ N(μ − μ , σq
1 + 1)
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall
Stickprov i par
Vid m˚anga m¨atsituationer ¨ar det vanligt att man m¨ater f¨ore och efter en behandling p˚aninb¨ordes olika f¨orem˚al.
Modell (observera att paretXiochYi inte¨ar oberoende!) F¨ore: x1, . . . ,xn obs. avXi ∈ N(μi, σx) Efter: y1, . . . ,yn obs. avYi ∈ N(μi+ Δ, σy)
Diff: z1, . . . ,zn obs. avZi =Yi− Xi ∈ N(Δ, σ) Vi vill nu skatta effekten av behandlingen (Δ). SkattaΔmed¯zoch g¨or konfidensintervall som vanligt f¨or ett stickprov, dvs
IΔ= ¯z ± tα/2(n − 1) · s
√n, d¨ar
s2= 1 n − 1
n
X
i=1
(zi− ¯z)2.
Stickprov i par?
I Blodtrycket hos ett antal patienter m¨ats f¨orre och efter behandling med blodtryckss¨ankande medicin; konfidensintervall f¨or
s¨ankningen?
I Luftkvaliteten m¨ats l¨angs Hornsgatan i Stockholm vintern2009 (dubbd¨ack fortfarande till˚atna) och2010(efter dubbd¨acksf¨orbud);
konfidensintervall f¨or skillnaden i luftkvalitet?
I pH-v¨ardet m¨ots varje dag i H¨oje˚a f¨orre och efter Lunds reningsverk; konfidensintervall f¨or skillnaden?
Repetition Konfidensintervall I F¨ordelningar Konfidensintervall II N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall
Ensidiga konfidensintervall
Konfidensintervall kan ¨aven vara upp˚at eller ned˚at begr¨ansade. De konstrueras allm¨ant genom att
1. Ta ena gr¨ansen i ett tv˚asidigt konfidensintervall 2. Byt utα/2 −→ αf¨or att f˚a r¨att konfidensgrad 3. L˚at den andra gr¨ansen bli s˚a stor/liten som m¨ojligt Ex.Om det tv˚asidiga intervallet ges av¯x ± λα/2· σ
√n f˚as f¨oljande ensidiga konfidensintervall
I Ned˚at begr¨ansat intervall: (¯x − λα· σ
√n, ∞)
I Upp˚at begr¨ansat intervall: (−∞, ¯x + λα· σ
√n)
Ensidiga konfidensintervall ¨ar framf¨orallt anv¨andbara vid ensidiga hypotestest.