Matematisk statistik 9 hp, HT-16 F¨orel¨asning 16: Markovkedjor
Joakim L¨ubeck + Anna Lindgren
5+6 december, 2016
Multipel regression Modellen
y
i= β
0+ β
1x
i1+ . . . + β
kx
ik+ ε
i, i = 1, . . . , n, ε
i∈ N (0, σ) kan skrivas p˚a matrisform som
y = Xβ + ε
d¨ar y och ε ¨ar n × 1-vektorer, β en 1 × (k + 1)-vektor och X en n × (k + 1)-matris
y =
y
1y
2.. . y
, X =
1 x
11· · · x
1k1 x
21· · · x
2k.. . .. . . .. .. . 1 x · · · x
, β =
β
0β
1.. . β
,ε =
ε
1.. . ε
n
Skattning av parametrarna
Skattning av β
ML- och MK-skattningar av β
0, . . . , β
k(elementen i β) blir β
∗= (X
TX)
−1X
Ty β
i∗∈ N (β
i, D(β
i∗)) .
D(β
i∗)
2ges av diagonalelementen i kovariansmatrisen
V(β
∗) = σ
2(X
TX)
−1=
V(β
0∗) C(β
0∗, β
1∗) · · · C(β
0∗, β
k∗) C(β
1∗, β
0∗) V(β
1∗) · · · C(β
1∗, β
k∗)
.. . .. . . .. .. . C(β
k∗, β
0∗) C(β
k∗, β
1∗) · · · V(β
k∗)
.
En v¨antev¨ardesriktig skattning av σ
2ges av (korrigerad ML) s
2= Q
0d¨ar Q = (y − Xβ
∗)
T(y − Xβ
∗)
Stokastisk process
I
En stokastisk process {X(t), t ∈ T} ¨ar en f¨oljd av stokastiska variabler, en ”slumpm¨assig funktion av t”.
I
F¨or ett fixt t ¨ar X(t) en stokastisk variabel.
I
Beroende p˚a vilka v¨arden X(t) och t kan anta har vi f¨oljande fyra kombinationer
Tid
Process Diskret Kontinuerlig Diskret
Kontinuerlig
tid (t)
0 5 10 15 20
X(t)
0 0.5 1 1.5 2 2.5
3 Diskret process i diskret tid
tid (t)
0 5 10 15 20
X(t)
0 0.5 1 1.5 2 2.5
3 Diskret process i kontinuerlig tid
0 5 10 15 20
X(t)
-6 -5 -4 -3 -2 -1
0 Kontinuerlig process i diskret tid
0 5 10 15 20
X(t)
-10 -5 0 5 10
15Kontinuerlig process i kontinuerlig tid
Markovkedjor
En markovkedja, {X
n, n = 0, 1, 2, . . .}, ¨ar en diskret stokastisk process med diskret tid. De v¨arden processen antar kallas tillst˚and och betecknas E
ieller bara i.
En markovkedja uppfyller markovvillkoret
P (X
n+1= i
n+1| X
n= i
n, X
n−1= i
n−1, . . . , X
0= i
0) =
= P (X
n+1= i
n+1| X
n= i
n)
dvs sannolikheten att n¨asta v¨arde skall vara i
n+1beror bara p˚a
nuvarande v¨arde.
0 20 40 60 80 100
−2
−1 0 1 2 3 4 5 6 7
tid, n
X(n)
Symmetrisk slumpvandring
0 20 40 60 80 100 0
2 4 6 8 10 12 14 16 18
tid, n
X(n)
Totala antalet sexor
Overg˚angssannolikheter ¨
Sannolikheterna
p
ij= P (X
n+1= j | X
n= i)
kallas ¨overg˚angssannolikheter och ¨ar slh att g˚a fr˚an tillst˚and i till j i ett steg. Man brukar samla dem i en ¨overg˚angsmatris
P =
p
11p
12· · · p
21p
22· · · .. . .. . . ..
d¨ar t.ex p
21¨ar slh att g˚a fr˚an tillst˚and 2 till 1. Eftersom processen alltid
m˚aste g˚a till n˚agot tillst˚and ¨ar radsummorna i P alltid 1.
Modellgraf
Tillst˚anden och ¨overg˚angssannolikheterna kan ritas i en modellgraf. F¨or en markovkedja med tre tillst˚and och nedanst˚aende ¨overg˚angsmatris blir grafen
P =
0.6 0.4 0 0.1 0.2 0.7 0.3 0 0.7
1 2 3
0.1
0.4 0.3
0.7
0.6 0.2 0.7
Overg˚angssannolikheter av h¨ogre ordning ¨
Overg˚angssannolikheterna av ordning ¨ m p
(m)ij= P(X
n+m= j | X
n= i)
¨ar slh att g˚a fr˚an i till j i m steg. Motsvarande ¨overg˚angsmatris av ordning m bet. P
(m)och r¨aknas ut som P
(m)= P
m. Sambandet
P
(m+n)= P
mP
nkallas ”Chapman-Kolmogorovs sats”.
Exempel — ¨ Overg˚angssannolikheter
Vad ¨ar P (X
2= 2 | X
0= 1) i Markovkedjan nedan?
P =
0.6 0.4 0 0.1 0.2 0.7 0.3 0 0.7
1 2 3
0.1
0.4 0.3
0.7
0.6 0.2 0.7
Absoluta sannolikheter
Sannolikheterna att kedjan ¨ar i tillst˚and i vid tiden n p
(n)i= P(X
n= i)
kan samlas i en sannolikhetsvektor (obs radvektor) p
(n)= (p
(n)1, p
(n)2, . . .)
Detta ¨ar allts˚a sannolikhetsfunktionen f¨or X
n. Speciellt kallas p
(0)f¨or initialf¨ordelning eller startvektor.
Satsen om total sannolikhet och ”Chapman-Kolmogorovs sats” ger p
(1)= p
(0)P
p
(2)= p
(1)P = p
(0)P
(2)p
(n)= p
(0)P
(n)= p
(n−1)P
Station¨ar f¨ordelning
L˚at π = (π
1, π
2, . . .) vara en sannolikhetsvektor. Om
p
(0)= π =⇒ p
(n)= π, n = 1, 2, . . . kallas π en station¨ar f¨ordelning.
Samtliga station¨ara f¨ordelningar till en markovkedja med
¨overg˚angsmatris P f˚as som l¨osningarna till ekvationssystemet π = πP
tillsammans med bivillkoret P
π
i= 1 och att 0 ≤ π
i≤ 1.
Observera att ekvationssystemet ¨ar omv¨ant mot att hitta egenvektorer till egenv¨arde 1. Transponering ger standardfallet.
P
Tπ
T= π
TAsymptotisk f¨ordelning
Om p
(n)→ π f¨or varje val av startvektor p
(0)¨ar π en asymptotisk f¨ordelning.
Om det existerar en asymptotisk f¨ordelning s˚a ¨ar den densamma som den enda station¨ara f¨ordelningen.
Sats: F¨or en markovkedja med ¨andligt antal tillst˚and g¨aller Det finns ett r > 0 s˚a att alla element i
n˚agon kolonn i matrisen P
(r)¨ar > 0
⇐⇒
Den asymptotiska f¨ordelningen existerar
Exempel — Asymptotisk f¨ordelning
1. I f¨oljande Markovkedjor, vad ¨ar de station¨ara f¨ordelningarna?
2. Har kedjorna en asymptotisk f¨ordelning?
P
1=
0.3 0 0.7
1 0 0
0.75 0.25 0
P
2=
0.5 0 0.5 0
0 0.2 0 0.8
0.7 0 0.3 0
0 0.8 0 0.2
Best¨andiga och obest¨andiga tillst˚and
L˚at
f
ii(n) = P
Aterv¨anda till tillst˚and ˚ i f¨or f¨orsta g˚angen efter n steg
D˚a blir sannolikheten att n˚agon g˚ang ˚aterv¨anda till tillst˚and i f
ii=
∞
X
j=1
f
ii(j)
Om
I
f
ii= 1 s¨ags tillst˚and i vara best¨andigt .
I
f
ii< 1 s¨ags tillst˚and i vara obest¨andigt.
Kommunicerande tillst˚and
I
Om p
(r)ij> 0 f¨or n˚agot r = 1, 2, . . . s¨ags tillst˚and i kommunicera med tillst˚and j.
I
Om dessutom tillst˚and j kommunicerar med i s˚a kommunicerar tillst˚anden tv˚asidigt.
I
Om tv˚a tillst˚and kommunicerar tv˚asidigt ¨ar antingen b˚ada tillst˚anden best¨andiga eller b˚ada obest¨andiga.
I
Om alla tillst˚and kommunicerar tv˚asidigt med varandra kallas
Markovkedjan irreducibel, annars kallas den reducibel.
Exempel — Kommunicerande tillst˚and
1. I f¨oljande Markovkedjor, vilka tillst˚and ¨ar best¨andiga/obest¨andiga?
2. Ar kedjorna reducibla/irreducibla? ¨
P
1=
0.3 0 0.7
1 0 0
0.75 0.25 0
P
2=
0.5 0 0.5 0
0 0.2 0 0.8
0.7 0 0.3 0
0 0.8 0 0.2
P
3=
0.5 0.2 0.3 0
0 0.2 0 0.8
0 0 1 0
0.5 0.5 0 0
12 038 studenters v¨ag genom LTH (1993-2006).
% 1 2 3 4 5 6 7 8 9 Ex Av ?? Ut Uh
1 0.29 89.8 0.01 0.02 0.00 0.00 0.00 0.00 0.00 0.00 3.87 2.70 0.00 3.32 2 0.00 5.34 78.9 0.04 0.00 0.00 0.00 0.00 0.00 0.00 2.83 5.15 0.01 7.72 3 0.00 0.01 9.16 83.7 0.30 0.00 0.00 0.00 0.00 0.00 0.81 2.94 0.00 3.06 4 0.00 0.01 0.02 8.69 76.4 0.22 0.01 0.00 0.00 0.02 0.98 2.86 0.32 10.5 5 0.00 0.00 0.00 0.00 12.2 79.6 0.44 0.02 0.00 0.05 0.27 2.12 0.73 4.55 6 0.00 0.00 0.00 0.00 0.01 17.7 63.6 0.42 0.05 0.53 0.27 3.41 6.64 7.43 7 0.00 0.00 0.00 0.00 0.01 0.03 21.9 68.3 0.26 3.30 0.01 3.24 1.28 1.64 8 0.00 0.00 0.00 0.00 0.03 0.00 0.03 19.7 50.6 16.2 0.02 9.72 1.50 2.19 9 0.00 0.00 0.00 0.00 0.00 0.05 0.02 0.02 42.2 38.7 0.03 18.2 0.14 0.67 Ex 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100 0.00 0.00 0.00 0.00 Av 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100 0.00 0.00 0.00
?? 0.10 0.26 0.28 0.29 0.43 0.49 0.56 0.84 1.60 1.99 1.75 90.9 0.03 0.47 Ut 0.00 0.00 0.00 0.00 0.14 1.44 5.91 14.8 23.2 5.23 0.07 4.33 43.3 1.58 Uh 0.64 1.96 3.56 2.92 9.15 4.58 5.23 1.50 1.05 0.34 5.81 13.6 0.48 49.2 1–9: Terminsregistrerad p˚a aktuell termin.
Ex: Examen, Av: Anm¨alt avbrott, ??: F¨orsvunnit, Ut: Utlandsstudier, Uh: Studieuppeh˚all
Utdrag ur Hamlet
ACT III
SCENE I. A room in the castle.
Enter KING CLAUDIUS, QUEEN GERTRUDE, POLONIUS, OPHELIA, ROSENCRANTZ, and GUILDENSTERN
KING CLAUDIUS
And can you, by no drift of circumstance, Get from him why he puts on this confusion, Grating so harshly all his days of quiet With turbulent and dangerous lunacy?
ROSENCRANTZ
He does confess he feels himself distracted; But from what cause he will by no means speak.
GUILDENSTERN
Nor do we find him forward to be sounded, But, with a crafty madness,
keeps aloof, When we would bring him on to some confession Of his
Overg˚angsmatris i ”The tragedy of Hamlet” av William ¨ Shakespeare
A F K P U Z a f k p u z