• No results found

Matematisk statistik 9 hp, HT-16 F¨orel¨asning 10: Punktskattningar

N/A
N/A
Protected

Academic year: 2021

Share "Matematisk statistik 9 hp, HT-16 F¨orel¨asning 10: Punktskattningar"

Copied!
18
0
0

Loading.... (view fulltext now)

Full text

(1)

Matematisk statistik 9 hp, HT-16

F¨orel¨asning 10: Punktskattningar

Anna Lindgren (Stanislav Volkov)

31 oktober + 1 november 2016

(2)

Matematisk statistik – slumpens matematik

Sannolikhetsteori: Hur beskriver man slumpen och slumpm¨assiga h¨andelser?

I Slh. f¨or3st1:or p˚a10t¨arningsslag?

I Givet f¨ordelningen f¨or v˚agor, hur h¨oga/stora kan de 5 %“v¨arsta” v˚agorna vara?

I Vi observerar ett radioaktivt material med k¨and halveringstid under10mintuer; vilken f¨ordelning kommer det observerade antalet s¨onderfall att f¨olja?

Statistikteori: Vilka slutsatser kan man dra av ett datamaterial?

I Givet3st1:or p˚a10t¨arningslag, ¨ar t¨arningen

“r¨attvis”?

I Givet10˚ars m¨atningar av v˚agor, vad kan vi s¨aga om f¨ordelningen?

I Under10minuter observerar vi5s¨onderfall, vad ¨ar halveringstiden?

(3)

Statistik Skattningar Oversikt Exempel Repetition Exempel

Statistik

Fr˚an m¨atningar (insamlad data) dra slutsatser om verkligheten.

Vi beh¨over d˚a en modell f¨or v˚ara m¨atingar!

Ofta inneh˚aller v˚ar modell ok¨anda parametrar samt ett antagande om f¨ordelning f¨or observationerna.

(4)

Exempel: Kvalitetskontroll

Vi kontrollerarnst slumpm¨assigt utvalda komponenter fr˚an ett stort parti och ser om de fungerar.

Modell:X =”antalet trasiga komponenter”

X ∈Bin(n, p), d¨arp¨ar andelen trasiga kommponenter.

Parameternp¨ar ok¨and.

M¨ojliga fr˚agest¨alllningar:

1. Vad ¨ar en bra uppskattning avp?

2. Hur stor ¨ar os¨akerheten i uppskattningen?

3. Vilket intervall tror vipligger inom?

4. Hur stort m˚astenvara f¨or att uppn˚a en “tillr¨ackligt liten”

os¨akerhet?

(5)

Statistik Skattningar Oversikt Exempel Repetition Exempel

Statistikteori — ¨oversikt

Punktskattning

Hur g¨or man en bra gissning av en ok¨and storhet? Hur vet man att den ¨ar bra?

Intervallskattning

Hitta ist¨allet ett intervall som t¨acker den ok¨anda storheten med en given (stor) sannolikhet.

Hypotestest

Om gissningen blev0.013, kan r¨att v¨arde p˚a den ok¨anda storheten ¨and˚a vara0.01?

Regression

Sambandsanalys, hur vet vi om tv˚a variabler p˚averkar varandra?

(6)

Statistikteori, grundl¨aggande begrepp

Stickprov

Ettstickprov,x1,x2, . . . ,xn, ¨arobservationerav s.v.X1, . . . ,Xnfr˚an n˚agon f¨ordelningXi ∈ F(θ)d¨arθ¨ar en ok¨andparameter.

Skattning

Enskattningavθ,θ(x1, . . . ,xn)¨ar en observation av den s.v.

θ(X1, . . . ,Xn). B˚ada betecknas oftast bara medθ. Bra egenskaper f¨or en skattning ¨ar

V¨antev¨ardesriktig: E(θ) = θ, inget systematiskt fel.

Effektiv: liten varians (os¨akerhet)V(θ).

Konsistent: P(|θn− θ| > ε) → 0, n → ∞, dvs ”Blir b¨attre n¨ar vi f˚ar fler observationer”.

(7)

Statistik Skattningar Oversikt Exempel Repetition Exempel

En skattning θ

¨ar b˚ade ett tal, en s.v. och en funktion

Funktion Tal

S.V.

Xi∈ F(θ)

θ

θ

X2 θ(X)

X1

x1 x2 θ(x1, . . . ,xn)

(8)

Modell f¨or m¨atning med slumpm¨assigt m¨atfel

Antag att vi vill m¨ata en storhetμ. Om man g¨ornst m¨atv¨arden, x1, . . . ,xn¨ar dessa observationer av

Xi= μ + εi =”R¨att v¨arde” + ”M¨atfel”

d¨arεi ¨ar ett slumpm¨assigt m¨atfel.

Ofta antas attεi ¨ar oberoende och

εi ∈ N(0, σ)

Detta ger att v˚ara observationer blir Xi∈ N(μ, σ)

Vi ser att v¨antev¨ardet ¨ar den storhet vi f¨ors¨oker m¨ata upp.

(9)

Statistik Skattningar Oversikt Exempel Repetition Exempel

V¨antev¨arde och Varians

V¨antev¨ardet angertyngdpunktenf¨or f¨ordelningen

E(X) = (R

−∞x · fX(x) dx Kont.

P

kk · pX(k) Diskr.

Variansen anger hur utspriddX ¨ar kring sitt v¨antev¨arde.

V(X) = E

h

X − E(X)i2

=E(X2) −E(X)2≥0.

EX

aiXi+b

=X

aiE(Xi) +b

V X

i

aiXi+b

!

=X

i

a2iV(Xi) +2 X

i<j

aiajC(Xi,Xj)

| {z }

=0om okorrelerade

(10)

Variation i observationer ger variation i skattningen

μn = 1 n

n

X

i=1

Xi E(μn) = μ V(μn) = σ2 n

m¨atomg˚ang, j Observationer, xjk μ= ¯xj

1 4.83 4.93 5.24 5.12 5.10 4.69 5.62 4.73 5.03 2 5.09 5.13 4.53 4.59 4.70 4.10 4.96 5.26 4.79 3 5.53 5.10 4.34 5.05 5.21 4.43 4.30 4.56 4.82 4 4.48 5.10 4.75 5.17 4.98 5.01 5.82 5.12 5.05 5 5.14 5.10 4.79 5.48 4.70 5.89 5.22 5.91 5.28 6 4.80 5.33 5.22 5.26 4.45 4.12 5.29 5.09 4.95 7 5.20 5.26 5.49 5.60 4.83 5.28 4.38 5.18 5.15 8 4.48 4.81 4.62 4.61 5.04 4.81 4.32 4.41 4.64

.. .

(11)

Statistik Skattningar Oversikt Exempel Repetition Exempel

3 3.5 4 4.5 5 5.5 6 6.5 7

0 0.2 0.4 0.6 0.8

Observationernas fördelning

3 3.5 4 4.5 5 5.5 6 6.5 7

0 0.5 1 1.5 2 2.5

Skattningarnas fördelning

(12)

Exempel: Radon

Radonkoncentrationen i inomhusluft kan m¨atas genom att h¨anga upp en α-k¨anslig film. Antalet h˚al i filmen beskrivs av en Poisson-process med

Xi ∈ Po(λKi)

d¨arλ¨ar den ok¨anda radonkoncentra- tionen ochKi ¨ar k¨anda konstanter som beror p˚a bl.a. filmens k¨anslighet, storlek och exponeringstiden.

Radon-data ˚aterkommer i lab 3.

(13)

Radon (forts.)

Vi har h¨angt upp tv˚a radonm¨atare i ett hus d¨ar den ena h¨angt uppe ett dygn och den andra en hel vecka. Hur ska vi kombinera de tv˚a

m¨atningarna f¨or att f˚a en s˚a bra gemensam skattning av radonhalten som m¨ojligt?

Modell: Oberoende observationerx1=11fr˚anX1∈ Po(λ)resp.

x2=73fr˚anX2∈ Po(7λ).

Skattningar:λ1=x1=11.0resp.λ2= x2 7 = 73

7 =10.43.

Medelv¨arde:λ = 1

2(λ1+ λ2) = x1+x2/7

2 =10.71

Vikta med tiden:λ = 1 · λ1+7 · λ2

1 + 7 = x1+x2

8 =10.5 Andra varianter? Vilken variant ¨ar b¨ast? Hur hittar man den?

(14)
(15)

Minsta kvadrat-metoden, MK

OmE(Xi) = μi(θ)s˚a f˚asMK-skattningenavθgenom attminimera f¨orlustfunktionen

Q(θ) =

n

X

i=1



xi− μi(θ)2

m.a.p.θ.

I Best¨am hur v¨antev¨ardet beror avθ,E(Xi) = μi(θ).

I S¨att uppQ(θ)

I Derivera, s¨att lika med noll och l¨os m.a.p.θ.

I Detθsom minimerarQ(θ)¨ar MK-skattningen,θMK.

(16)

Maximum likelihood-metoden, ML

ML-skattningenavθf˚as genom attmaximera likelihood-funktionen L(θ; x1, . . . ,xn)m.a.p.θ.

L(θ) = pX(x1) · . . . ·pX(xn) (diskr.) L(θ) = fX(x1) · . . . ·fX(xn) (kont.)

I det diskreta fallet anger L-funktionen:

”Sannolikheten att f˚a det stickprov vi f˚att”.

I S¨att uppL(θ)

I Logaritmera —ln L(θ)maximeras av sammaθsomL(θ).

I Derivera, s¨att lika med noll och l¨os m.a.p.θ.

I Detθsom maximerarL(θ)¨ar ML-skattningenθML.

(17)

Medelfel

Om standardavvikelsen,D(θ), f¨or en skattning inneh˚aller ok¨anda parametrar kan man inte r¨akna ut ett numeriskt v¨arde p˚a den. Om vi stoppar in skattningar p˚a de ok¨anda parametrarna f˚asmedelfelet d(θ).

Exempel:

λ= X1+X2

8 , X1∈ Po(λ), X2∈ Po(7λ) V(λ) =V(X1+X2

8 ) = V(X1) +V(X2)

82 = λ + 7λ 82 = λ

8, D(λ) =

r λ

8, d(λ) = r

λ

8 =r 10.5

8 =1.15

(18)

Skattningens f¨ordelning: CGS?

References

Related documents

Resonemang, inf¨ orda beteck- ningar och utr¨ akningar f˚ ar inte vara s˚ a knapph¨ andigt presenterade att de blir sv˚ ara att f¨ olja.. ¨ Aven endast delvis l¨ osta problem kan

Utan att veta tidtabellen och med tiominutersintervall mellan bussturerna f˚ ar vi en F¨ ordelning som ¨ ar likformig i n˚ agon mening... Det betyder att rel¨ a inte blir s¨ amre

Nu ¨ar det inte alls n¨odv¨andigt att p ¨ar ett rationellt tal, utan vi kan allm¨annt betrakta ett f¨ors¨ok d¨ar en h¨andelse A med p = P (A) kan intr¨affa, och l˚ ata X

L˚ at y(t) vara andelen av populationen som ¨ar smittad efter tiden t dygn, r¨aknad fr˚ an uppt¨ack- ten... Observera att ¨amnets koncentration ¨ar samma som m¨angden av

Om varje anv¨andare p˚ a ett datorsystem ska anv¨anda 6, 7, eller 8 tecken i sitt l¨osenord, och det m˚ aste inneh˚ alla minst en siffra.. Hur m˚ anga m¨ojliga l¨osenord finns

Position (i, j) in the table shows the values of C l for each of the requirements to isolate fault f i from fault f j where the first value belongs to set one and the second

Analytiska metoder ¨ ar begr¨ ansade i olinj¨ ara fall och strukturella analyser kan d˚ a anv¨ andas f¨ or att analysera modellens detekter- och

(ej nu, vi har gjort det f¨ or linj¨ ara modeller och vi ˚ aterkommer till det i senare f¨ orel¨