Matematisk statistik 9 hp, HT-16
F¨orel¨asning 10: Punktskattningar
Anna Lindgren (Stanislav Volkov)
31 oktober + 1 november 2016
Matematisk statistik – slumpens matematik
Sannolikhetsteori: Hur beskriver man slumpen och slumpm¨assiga h¨andelser?
I Slh. f¨or3st1:or p˚a10t¨arningsslag?
I Givet f¨ordelningen f¨or v˚agor, hur h¨oga/stora kan de 5 %“v¨arsta” v˚agorna vara?
I Vi observerar ett radioaktivt material med k¨and halveringstid under10mintuer; vilken f¨ordelning kommer det observerade antalet s¨onderfall att f¨olja?
Statistikteori: Vilka slutsatser kan man dra av ett datamaterial?
I Givet3st1:or p˚a10t¨arningslag, ¨ar t¨arningen
“r¨attvis”?
I Givet10˚ars m¨atningar av v˚agor, vad kan vi s¨aga om f¨ordelningen?
I Under10minuter observerar vi5s¨onderfall, vad ¨ar halveringstiden?
Statistik Skattningar Oversikt Exempel Repetition Exempel
Statistik
Fr˚an m¨atningar (insamlad data) dra slutsatser om verkligheten.
Vi beh¨over d˚a en modell f¨or v˚ara m¨atingar!
Ofta inneh˚aller v˚ar modell ok¨anda parametrar samt ett antagande om f¨ordelning f¨or observationerna.
Exempel: Kvalitetskontroll
Vi kontrollerarnst slumpm¨assigt utvalda komponenter fr˚an ett stort parti och ser om de fungerar.
Modell:X =”antalet trasiga komponenter”
X ∈∼Bin(n, p), d¨arp¨ar andelen trasiga kommponenter.
Parameternp¨ar ok¨and.
M¨ojliga fr˚agest¨alllningar:
1. Vad ¨ar en bra uppskattning avp?
2. Hur stor ¨ar os¨akerheten i uppskattningen?
3. Vilket intervall tror vipligger inom?
4. Hur stort m˚astenvara f¨or att uppn˚a en “tillr¨ackligt liten”
os¨akerhet?
Statistik Skattningar Oversikt Exempel Repetition Exempel
Statistikteori — ¨oversikt
Punktskattning
Hur g¨or man en bra gissning av en ok¨and storhet? Hur vet man att den ¨ar bra?
Intervallskattning
Hitta ist¨allet ett intervall som t¨acker den ok¨anda storheten med en given (stor) sannolikhet.
Hypotestest
Om gissningen blev0.013, kan r¨att v¨arde p˚a den ok¨anda storheten ¨and˚a vara0.01?
Regression
Sambandsanalys, hur vet vi om tv˚a variabler p˚averkar varandra?
Statistikteori, grundl¨aggande begrepp
Stickprov
Ettstickprov,x1,x2, . . . ,xn, ¨arobservationerav s.v.X1, . . . ,Xnfr˚an n˚agon f¨ordelningXi ∈ F(θ)d¨arθ¨ar en ok¨andparameter.
Skattning
Enskattningavθ,θ∗(x1, . . . ,xn)¨ar en observation av den s.v.
θ∗(X1, . . . ,Xn). B˚ada betecknas oftast bara medθ∗. Bra egenskaper f¨or en skattning ¨ar
V¨antev¨ardesriktig: E(θ∗) = θ, inget systematiskt fel.
Effektiv: liten varians (os¨akerhet)V(θ∗).
Konsistent: P(|θ∗n− θ| > ε) → 0, n → ∞, dvs ”Blir b¨attre n¨ar vi f˚ar fler observationer”.
Statistik Skattningar Oversikt Exempel Repetition Exempel
En skattning θ
∗¨ar b˚ade ett tal, en s.v. och en funktion
Funktion Tal
S.V.
Xi∈ F(θ)
θ∗
θ∗
X2 θ∗(X)
X1
x1 x2 θ∗(x1, . . . ,xn)
Modell f¨or m¨atning med slumpm¨assigt m¨atfel
Antag att vi vill m¨ata en storhetμ. Om man g¨ornst m¨atv¨arden, x1, . . . ,xn¨ar dessa observationer av
Xi= μ + εi =”R¨att v¨arde” + ”M¨atfel”
d¨arεi ¨ar ett slumpm¨assigt m¨atfel.
Ofta antas attεi ¨ar oberoende och
εi ∈ N(0, σ)
Detta ger att v˚ara observationer blir Xi∈ N(μ, σ)
Vi ser att v¨antev¨ardet ¨ar den storhet vi f¨ors¨oker m¨ata upp.
Statistik Skattningar Oversikt Exempel Repetition Exempel
V¨antev¨arde och Varians
V¨antev¨ardet angertyngdpunktenf¨or f¨ordelningen
E(X) = (R∞
−∞x · fX(x) dx Kont.
P
kk · pX(k) Diskr.
Variansen anger hur utspriddX ¨ar kring sitt v¨antev¨arde.
V(X) = E
h
X − E(X)i2
=E(X2) −E(X)2≥0.
EX
aiXi+b
=X
aiE(Xi) +b
V X
i
aiXi+b
!
=X
i
a2iV(Xi) +2 X
i<j
aiajC(Xi,Xj)
| {z }
=0om okorrelerade
Variation i observationer ger variation i skattningen
μ∗n = 1 n
n
X
i=1
Xi E(μ∗n) = μ V(μ∗n) = σ2 n
m¨atomg˚ang, j Observationer, xjk μ∗= ¯xj
1 4.83 4.93 5.24 5.12 5.10 4.69 5.62 4.73 5.03 2 5.09 5.13 4.53 4.59 4.70 4.10 4.96 5.26 4.79 3 5.53 5.10 4.34 5.05 5.21 4.43 4.30 4.56 4.82 4 4.48 5.10 4.75 5.17 4.98 5.01 5.82 5.12 5.05 5 5.14 5.10 4.79 5.48 4.70 5.89 5.22 5.91 5.28 6 4.80 5.33 5.22 5.26 4.45 4.12 5.29 5.09 4.95 7 5.20 5.26 5.49 5.60 4.83 5.28 4.38 5.18 5.15 8 4.48 4.81 4.62 4.61 5.04 4.81 4.32 4.41 4.64
.. .
Statistik Skattningar Oversikt Exempel Repetition Exempel
3 3.5 4 4.5 5 5.5 6 6.5 7
0 0.2 0.4 0.6 0.8
Observationernas fördelning
3 3.5 4 4.5 5 5.5 6 6.5 7
0 0.5 1 1.5 2 2.5
Skattningarnas fördelning
Exempel: Radon
Radonkoncentrationen i inomhusluft kan m¨atas genom att h¨anga upp en α-k¨anslig film. Antalet h˚al i filmen beskrivs av en Poisson-process med
Xi ∈ Po(λKi)
d¨arλ¨ar den ok¨anda radonkoncentra- tionen ochKi ¨ar k¨anda konstanter som beror p˚a bl.a. filmens k¨anslighet, storlek och exponeringstiden.
Radon-data ˚aterkommer i lab 3.
Radon (forts.)
Vi har h¨angt upp tv˚a radonm¨atare i ett hus d¨ar den ena h¨angt uppe ett dygn och den andra en hel vecka. Hur ska vi kombinera de tv˚a
m¨atningarna f¨or att f˚a en s˚a bra gemensam skattning av radonhalten som m¨ojligt?
Modell: Oberoende observationerx1=11fr˚anX1∈ Po(λ)resp.
x2=73fr˚anX2∈ Po(7λ).
Skattningar:λ∗1=x1=11.0resp.λ∗2= x2 7 = 73
7 =10.43.
Medelv¨arde:λ∗ = 1
2(λ∗1+ λ∗2) = x1+x2/7
2 =10.71
Vikta med tiden:λ∗ = 1 · λ∗1+7 · λ∗2
1 + 7 = x1+x2
8 =10.5 Andra varianter? Vilken variant ¨ar b¨ast? Hur hittar man den?
Minsta kvadrat-metoden, MK
OmE(Xi) = μi(θ)s˚a f˚asMK-skattningenavθgenom attminimera f¨orlustfunktionen
Q(θ) =
n
X
i=1
xi− μi(θ)2
m.a.p.θ.
I Best¨am hur v¨antev¨ardet beror avθ,E(Xi) = μi(θ).
I S¨att uppQ(θ)
I Derivera, s¨att lika med noll och l¨os m.a.p.θ.
I Detθsom minimerarQ(θ)¨ar MK-skattningen,θ∗MK.
Maximum likelihood-metoden, ML
ML-skattningenavθf˚as genom attmaximera likelihood-funktionen L(θ; x1, . . . ,xn)m.a.p.θ.
L(θ) = pX(x1) · . . . ·pX(xn) (diskr.) L(θ) = fX(x1) · . . . ·fX(xn) (kont.)
I det diskreta fallet anger L-funktionen:
”Sannolikheten att f˚a det stickprov vi f˚att”.
I S¨att uppL(θ)
I Logaritmera —ln L(θ)maximeras av sammaθsomL(θ).
I Derivera, s¨att lika med noll och l¨os m.a.p.θ.
I Detθsom maximerarL(θ)¨ar ML-skattningenθ∗ML.
Medelfel
Om standardavvikelsen,D(θ∗), f¨or en skattning inneh˚aller ok¨anda parametrar kan man inte r¨akna ut ett numeriskt v¨arde p˚a den. Om vi stoppar in skattningar p˚a de ok¨anda parametrarna f˚asmedelfelet d(θ∗).
Exempel:
λ∗= X1+X2
8 , X1∈ Po(λ), X2∈ Po(7λ) V(λ∗) =V(X1+X2
8 ) = V(X1) +V(X2)
82 = λ + 7λ 82 = λ
8, D(λ∗) =
r λ
8, d(λ∗) = r
λ∗
8 =r 10.5
8 =1.15