Matematisk statistik 9 hp
F¨orel¨asning 8: Binomial- och Poissonf¨ordelning, Poissonprocess
Anna Lindgren
4+5 oktober 2016
N(μ, σ) — Sats 6.1
OmX ∈ N(μ, σ), E(X) = μ, V(X) = σ2s˚a ¨ar X − μ
σ ∈ N(0, 1)
OmXi ∈ N(μi, σi)ochY =
n
X
i=1
aiXig¨aller
Y ∈ N
n
X
i=1
aiμi, v u u t
n
X
i=1
a2iσ2i
om allaXi ¨ar oberoende av varandra
Centrala gr¨ansv¨ardessatsen CGS
L˚atX1,X2, . . . ,Xn vara oberoende stokastiska variabler med samma f¨ordelning ochE(Xi) = μ,V(Xi) = σ2(¨andliga).
D˚a g¨aller att:
P
Pn
i=1Xi− nμ σ
√n ≤ a
→ Φ(a) d˚a n → ∞ f¨or allaa
1. OmY =
n
X
i=1
Xig¨allerY ∈∼N(nμ, σ√ n)
2. OmX¯n = 1 n
n
X
i=1
Xig¨allerX¯n∈
∼N(μ, σ
√n)
Binomialf¨ordelning
Beteckning:X ∈ Bin(n, p)
F¨orekomst: Ett f¨ors¨ok med h¨andelseAmedP(A) = pupprepasn oberoende g˚anger.X =antalet g˚angerAintr¨affar.
Egenskaper:
pX(k) =n k
pkqn−k, k = 0, 1, . . . , n, q = 1 − p E(X) = np, V(X) = npq
I FX(x)finns i tabell 6 f¨or n˚agra v¨arden p˚anochp.
I OmX ∈ Bin(n1,p)ochY ∈ Bin(n2,p), ober. s˚a ¨ar X + Y ∈ Bin(n1+n2,p)
I Omnpq ≥ 10s˚a ¨arX ∈∼N(np, √ npq)
I Omn ≥ 10ochp ≤ 0.1s˚a ¨arX ∈∼Po(np).
Binomialf¨ordelning, X ∈ Bin(20, p)
0 10 20
0 0.1 0.2 0.3 0.4
p = 0.1
0 10 20
0 0.05 0.1 0.15 0.2
p = 0.3
0 10 20
0 0.05 0.1 0.15 0.2
p = 0.5
0 10 20
0 0.05 0.1 0.15 0.2
p = 0.7
0 10 20
0 0.1 0.2 0.3 0.4
p = 0.9
0 10 20
0 0.1 0.2 0.3 0.4
p = 0.95
Exempel — F¨oretagskonkurser enligt Moodys
F¨oretagskonkurser (forts)
I goda tider sker f¨oretagskonkurser relativt oberoende av varandra. Enligt Moodys s˚a ¨ar sannolikheten f¨or en konkurs inom fyra ˚ar f¨or ett B2 f¨oretag≈20%.
(a) Vad blir sannolikheten att inget f¨oretag i en pool p˚a10g˚att i konkurs inom fyra ˚ar?
(b) Vad blir sannolikheten att h¨ogst 1 f¨oretag i en pool p˚a10g˚att i konkurs inom fyra ˚ar?
(c) Vad blir sannolikheten att mer ¨an 1 f¨oretag i en pool p˚a10g˚att i konkurs inom fyra ˚ar?
Halvkorrektion vid N-approx av diskret s.v.
X ∈ Bin(10, 0.4),Y ∈ N(4,√ 2.4)
0 2 4 6 8 10
0 0.1 0.2 0.3 0.4
k Exakt
P(X ≤ 4) P(X ≥ 5)
0 2 4 6 8 10
0 0.1 0.2 0.3 0.4
y Normalapproximation
P(Y ≤ 4) P(Y ≥ 5)
Exakt:P(X ≤ 4) + P(X ≥ 5) = 1.
Normalapprox:P(Y ≤ 4) + P(Y ≥ 5) = 0.759 6= 1!?
Halvkorrektion:P(Y ≤ 4.5) + P(Y ≥ 4.5) = 1
F¨oretagskonkurser (Normalapprox)
Enligt Moodys s˚a ¨ar sannolikheten f¨or en konkurs inom fyra ˚ar f¨or ett Baa3 f¨oretag≈2.6%. Vad blir sannolikheten att20eller fler f¨oretag i en pool p˚a1000g˚att i konkurs inom fyra ˚ar?
P(X ≥ 20) ≈ 1 − Φ(20 − 26
√25.3 ) =0.8834
=1 − P(X ≤ 19) ≈ 1 − Φ(19 − 26
√25.3 ) =0.9179
Halvkorr.: = 1 − P(X ≤ 19.5) ≈ 1 − Φ(19.5 − 26
√25.3 ) =0.9018
Exakt: =
1000
X
k=20
1000 k
0.026k(1 − 0.026)1000−k=0.9061
Poissonf¨ordelning
Beteckning:X ∈ Po(μ) Egenskaper:
pX(k) = e−μ·μk
k!, k = 0, 1, . . . E(X) = μ, V(X) = μ
I FX(x)finns i tabell 5 f¨or n˚agra v¨arden p˚aμ.
I OmX ∈ Po(μ1)ochY ∈ Po(μ2), ober. s˚a ¨ar X + Y ∈ Po(μ1+ μ2)
I Omμ ≥ 15s˚a ¨arX ∈∼N(μ, √ μ).
Poissonf¨ordelning, X ∈ Po(μ)
0 20 40
0 0.1 0.2 0.3 0.4
µ = 1
0 20 40
0 0.05 0.1 0.15 0.2
µ = 2
0 20 40
0 0.01 0.02 0.03 0.04
µ = 5
0 20 40
0 0.005 0.01 0.015
µ = 10
0 20 40
0 1 2 3 4
5x 10−3 µ = 20
0 20 40
0 0.5 1 1.5 2
2.5x 10−3 µ = 30
F¨oretagskonkurser (Poissonapprox.)
I goda tider sker f¨oretagskonkurser relativt oberoende av varandra. Enligt Moodys s˚a ¨ar sannolikheten f¨or en konkurs inom fyra ˚ar f¨or ett Aaa f¨oretag 0.002 %, dvs0.00002. Vad blir sannolikheten att3eller fler f¨oretag i en pool p˚a10000g˚att i konkurs inom fyra ˚ar?
Stokastisk process
I Enstokastisk process {X(t), t ∈ T}¨ar en f¨oljd av stokastiska variabler, en ”slumpm¨assig funktion avt”.
I F¨or ett fixtt¨arX(t)en stokastisk variabel.
Diskreta processer: l¨as Markovprocesser (FMSF15)
Kontinuerliga processer: l¨as Station¨ara stokastiska processer (FMSF10)
tid (t)
0 5 10 15 20
X(t)
0 0.5 1 1.5 2 2.5
3 Diskret process i diskret tid
tid (t)
0 5 10 15 20
X(t)
0 0.5 1 1.5 2 2.5
3 Diskret process i kontinuerlig tid
tid (t)
0 5 10 15 20
X(t)
-6 -5 -4 -3 -2 -1
0 Kontinuerlig process i diskret tid
tid (t)
0 5 10 15 20
X(t)
-10 -5 0 5 10
15Kontinuerlig process i kontinuerlig tid
F¨ordelning f¨or ¨okningar
En stokastisk process{X(t); t ∈ T}har
I Oberoende ¨okningarom
X(t2) −X(t1), X(t3) −X(t2), . . . ,X(tn) −X(tn−1)
¨ar oberoende f¨or allat1<t2< · · · <tniT.
I Station¨ara ¨okningarom f¨ordelningen f¨orX(t + h) − X(t)inte beror avtutan bara avh.
Poissonprocess
Enpoissonprocessmed intensitetenλ¨ar en diskret s.p. med kontinuerlig tid{X(t), t ≥ 0}med f¨oljande egenskaper
I Antalet h¨andelser i icke ¨overlappande intervall ¨ar oberoende, dvs oberoende ¨okningar.
I X(t) ∈ Po(λ · t)
I X(t) − X(s) ∈ Po(λ(t − s)), 0 < s < t, dvs station¨ara
¨okningar.
I TidenY mellan ¨okningarna ¨arY ∈ Exp(λ).
Realisering av poissonprocess, X(t) ∈ Po(λt)
I Processen startar med v¨ardet0d˚at = 0, dvsX(0) = 0
I Tidsavst˚anden mellan processens ¨okningar ¨arExp(λ)-f¨ordelade.
0 2 4 6 8 10 12 14 16
0 2 4 6 8 10
t Xi(t)
3 tidsutvecklingar av en poissonprocess med λ = 1
Exempel — Dreamliner
NTSB Interim Factual Report (March 7, 2013)
Boeing also determined that the probability that a battery could vent wasonce in every 10 million flight hours. As of January 16, 2013, the in-service 787 fleet had accumulated less than 52 000 flight hours, and during this periodtwo events involving smoke emission from a 787 battery had occurred . . .
Antag att antalet fel kan modelleras som en poissonprocess:
I Vad ¨ar intensiteten,λ(tolkning)?
I Vad ¨ar sannolikheten f¨or2eller fler h¨andelser under52 000 flygtimmar?