• No results found

Multipel regression Modellen

N/A
N/A
Protected

Academic year: 2021

Share "Multipel regression Modellen"

Copied!
24
0
0

Loading.... (view fulltext now)

Full text

(1)

Matematisk statistik 9 hp, HT-16 F¨orel¨asning 16: Markovkedjor

Joakim L¨ubeck + Anna Lindgren

5+6 december, 2016

(2)

Multipel regression Modellen

y

i

= β

0

+ β

1

x

i1

+ . . . + β

k

x

ik

+ ε

i

, i = 1, . . . , n, ε

i

∈ N (0, σ) kan skrivas p˚a matrisform som

y = Xβ + ε

d¨ar y och ε ¨ar n × 1-vektorer, β en 1 × (k + 1)-vektor och X en n × (k + 1)-matris

y =

y

1

y

2

.. . y

, X =

1 x

11

· · · x

1k

1 x

21

· · · x

2k

.. . .. . . .. .. . 1 x · · · x

 , β =

 β

0

β

1

.. . β

 ,ε =

 ε

1

.. . ε

n

(3)

Skattning av parametrarna

Skattning av β

ML- och MK-skattningar av β

0

, . . . , β

k

(elementen i β) blir β

= (X

T

X)

−1

X

T

y β

i

∈ N (β

i

, D(β

i

)) .

D(β

i

)

2

ges av diagonalelementen i kovariansmatrisen

V(β

) = σ

2

(X

T

X)

−1

=

V(β

0

) C(β

0

, β

1

) · · · C(β

0

, β

k

) C(β

1

, β

0

) V(β

1

) · · · C(β

1

, β

k

)

.. . .. . . .. .. . C(β

k

, β

0

) C(β

k

, β

1

) · · · V(β

k

)

 .

En v¨antev¨ardesriktig skattning av σ

2

ges av (korrigerad ML) s

2

= Q

0

d¨ar Q = (y − Xβ

)

T

(y − Xβ

)

(4)

Stokastisk process

I

En stokastisk process {X(t), t ∈ T} ¨ar en f¨oljd av stokastiska variabler, en ”slumpm¨assig funktion av t”.

I

F¨or ett fixt t ¨ar X(t) en stokastisk variabel.

I

Beroende p˚a vilka v¨arden X(t) och t kan anta har vi f¨oljande fyra kombinationer

Tid

Process Diskret Kontinuerlig Diskret

Kontinuerlig

(5)

tid (t)

0 5 10 15 20

X(t)

0 0.5 1 1.5 2 2.5

3 Diskret process i diskret tid

tid (t)

0 5 10 15 20

X(t)

0 0.5 1 1.5 2 2.5

3 Diskret process i kontinuerlig tid

0 5 10 15 20

X(t)

-6 -5 -4 -3 -2 -1

0 Kontinuerlig process i diskret tid

0 5 10 15 20

X(t)

-10 -5 0 5 10

15Kontinuerlig process i kontinuerlig tid

(6)

Markovkedjor

En markovkedja, {X

n

, n = 0, 1, 2, . . .}, ¨ar en diskret stokastisk process med diskret tid. De v¨arden processen antar kallas tillst˚and och betecknas E

i

eller bara i.

En markovkedja uppfyller markovvillkoret

P (X

n+1

= i

n+1

| X

n

= i

n

, X

n−1

= i

n−1

, . . . , X

0

= i

0

) =

= P (X

n+1

= i

n+1

| X

n

= i

n

)

dvs sannolikheten att n¨asta v¨arde skall vara i

n+1

beror bara p˚a

nuvarande v¨arde.

(7)

0 20 40 60 80 100

−2

−1 0 1 2 3 4 5 6 7

tid, n

X(n)

Symmetrisk slumpvandring

(8)

0 20 40 60 80 100 0

2 4 6 8 10 12 14 16 18

tid, n

X(n)

Totala antalet sexor

(9)

Overg˚angssannolikheter ¨

Sannolikheterna

p

ij

= P (X

n+1

= j | X

n

= i)

kallas ¨overg˚angssannolikheter och ¨ar slh att g˚a fr˚an tillst˚and i till j i ett steg. Man brukar samla dem i en ¨overg˚angsmatris

P =

p

11

p

12

· · · p

21

p

22

· · · .. . .. . . ..

d¨ar t.ex p

21

¨ar slh att g˚a fr˚an tillst˚and 2 till 1. Eftersom processen alltid

m˚aste g˚a till n˚agot tillst˚and ¨ar radsummorna i P alltid 1.

(10)

Modellgraf

Tillst˚anden och ¨overg˚angssannolikheterna kan ritas i en modellgraf. F¨or en markovkedja med tre tillst˚and och nedanst˚aende ¨overg˚angsmatris blir grafen

P =

0.6 0.4 0 0.1 0.2 0.7 0.3 0 0.7

1 2 3

0.1

0.4 0.3

0.7

0.6 0.2 0.7

(11)

Overg˚angssannolikheter av h¨ogre ordning ¨

Overg˚angssannolikheterna av ordning ¨ m p

(m)ij

= P(X

n+m

= j | X

n

= i)

¨ar slh att g˚a fr˚an i till j i m steg. Motsvarande ¨overg˚angsmatris av ordning m bet. P

(m)

och r¨aknas ut som P

(m)

= P

m

. Sambandet

P

(m+n)

= P

m

P

n

kallas ”Chapman-Kolmogorovs sats”.

(12)

Exempel — ¨ Overg˚angssannolikheter

Vad ¨ar P (X

2

= 2 | X

0

= 1) i Markovkedjan nedan?

P =

0.6 0.4 0 0.1 0.2 0.7 0.3 0 0.7

1 2 3

0.1

0.4 0.3

0.7

0.6 0.2 0.7

(13)

Absoluta sannolikheter

Sannolikheterna att kedjan ¨ar i tillst˚and i vid tiden n p

(n)i

= P(X

n

= i)

kan samlas i en sannolikhetsvektor (obs radvektor) p

(n)

= (p

(n)1

, p

(n)2

, . . .)

Detta ¨ar allts˚a sannolikhetsfunktionen f¨or X

n

. Speciellt kallas p

(0)

f¨or initialf¨ordelning eller startvektor.

Satsen om total sannolikhet och ”Chapman-Kolmogorovs sats” ger p

(1)

= p

(0)

P

p

(2)

= p

(1)

P = p

(0)

P

(2)

p

(n)

= p

(0)

P

(n)

= p

(n−1)

P

(14)

Station¨ar f¨ordelning

L˚at π = (π

1

, π

2

, . . .) vara en sannolikhetsvektor. Om

p

(0)

= π =⇒ p

(n)

= π, n = 1, 2, . . . kallas π en station¨ar f¨ordelning.

Samtliga station¨ara f¨ordelningar till en markovkedja med

¨overg˚angsmatris P f˚as som l¨osningarna till ekvationssystemet π = πP

tillsammans med bivillkoret P

π

i

= 1 och att 0 ≤ π

i

≤ 1.

Observera att ekvationssystemet ¨ar omv¨ant mot att hitta egenvektorer till egenv¨arde 1. Transponering ger standardfallet.

P

T

π

T

= π

T

(15)

Asymptotisk f¨ordelning

Om p

(n)

→ π f¨or varje val av startvektor p

(0)

¨ar π en asymptotisk f¨ordelning.

Om det existerar en asymptotisk f¨ordelning s˚a ¨ar den densamma som den enda station¨ara f¨ordelningen.

Sats: F¨or en markovkedja med ¨andligt antal tillst˚and g¨aller Det finns ett r > 0 s˚a att alla element i

n˚agon kolonn i matrisen P

(r)

¨ar > 0

⇐⇒

Den asymptotiska f¨ordelningen existerar

(16)

Exempel — Asymptotisk f¨ordelning

1. I f¨oljande Markovkedjor, vad ¨ar de station¨ara f¨ordelningarna?

2. Har kedjorna en asymptotisk f¨ordelning?

P

1

=

0.3 0 0.7

1 0 0

0.75 0.25 0

P

2

=

0.5 0 0.5 0

0 0.2 0 0.8

0.7 0 0.3 0

0 0.8 0 0.2

(17)

Best¨andiga och obest¨andiga tillst˚and

L˚at

f

ii

(n) = P

 Aterv¨anda till tillst˚and ˚ i f¨or f¨orsta g˚angen efter n steg



D˚a blir sannolikheten att n˚agon g˚ang ˚aterv¨anda till tillst˚and i f

ii

=

X

j=1

f

ii

(j)

Om

I

f

ii

= 1 s¨ags tillst˚and i vara best¨andigt .

I

f

ii

< 1 s¨ags tillst˚and i vara obest¨andigt.

(18)

Kommunicerande tillst˚and

I

Om p

(r)ij

> 0 f¨or n˚agot r = 1, 2, . . . s¨ags tillst˚and i kommunicera med tillst˚and j.

I

Om dessutom tillst˚and j kommunicerar med i s˚a kommunicerar tillst˚anden tv˚asidigt.

I

Om tv˚a tillst˚and kommunicerar tv˚asidigt ¨ar antingen b˚ada tillst˚anden best¨andiga eller b˚ada obest¨andiga.

I

Om alla tillst˚and kommunicerar tv˚asidigt med varandra kallas

Markovkedjan irreducibel, annars kallas den reducibel.

(19)

Exempel — Kommunicerande tillst˚and

1. I f¨oljande Markovkedjor, vilka tillst˚and ¨ar best¨andiga/obest¨andiga?

2. Ar kedjorna reducibla/irreducibla? ¨

P

1

=

0.3 0 0.7

1 0 0

0.75 0.25 0

P

2

=

0.5 0 0.5 0

0 0.2 0 0.8

0.7 0 0.3 0

0 0.8 0 0.2

P

3

=

0.5 0.2 0.3 0

0 0.2 0 0.8

0 0 1 0

0.5 0.5 0 0

(20)

12 038 studenters v¨ag genom LTH (1993-2006).

% 1 2 3 4 5 6 7 8 9 Ex Av ?? Ut Uh

1 0.29 89.8 0.01 0.02 0.00 0.00 0.00 0.00 0.00 0.00 3.87 2.70 0.00 3.32 2 0.00 5.34 78.9 0.04 0.00 0.00 0.00 0.00 0.00 0.00 2.83 5.15 0.01 7.72 3 0.00 0.01 9.16 83.7 0.30 0.00 0.00 0.00 0.00 0.00 0.81 2.94 0.00 3.06 4 0.00 0.01 0.02 8.69 76.4 0.22 0.01 0.00 0.00 0.02 0.98 2.86 0.32 10.5 5 0.00 0.00 0.00 0.00 12.2 79.6 0.44 0.02 0.00 0.05 0.27 2.12 0.73 4.55 6 0.00 0.00 0.00 0.00 0.01 17.7 63.6 0.42 0.05 0.53 0.27 3.41 6.64 7.43 7 0.00 0.00 0.00 0.00 0.01 0.03 21.9 68.3 0.26 3.30 0.01 3.24 1.28 1.64 8 0.00 0.00 0.00 0.00 0.03 0.00 0.03 19.7 50.6 16.2 0.02 9.72 1.50 2.19 9 0.00 0.00 0.00 0.00 0.00 0.05 0.02 0.02 42.2 38.7 0.03 18.2 0.14 0.67 Ex 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100 0.00 0.00 0.00 0.00 Av 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100 0.00 0.00 0.00

?? 0.10 0.26 0.28 0.29 0.43 0.49 0.56 0.84 1.60 1.99 1.75 90.9 0.03 0.47 Ut 0.00 0.00 0.00 0.00 0.14 1.44 5.91 14.8 23.2 5.23 0.07 4.33 43.3 1.58 Uh 0.64 1.96 3.56 2.92 9.15 4.58 5.23 1.50 1.05 0.34 5.81 13.6 0.48 49.2 1–9: Terminsregistrerad p˚a aktuell termin.

Ex: Examen, Av: Anm¨alt avbrott, ??: F¨orsvunnit, Ut: Utlandsstudier, Uh: Studieuppeh˚all

(21)

Utdrag ur Hamlet

ACT III

SCENE I. A room in the castle.

Enter KING CLAUDIUS, QUEEN GERTRUDE, POLONIUS, OPHELIA, ROSENCRANTZ, and GUILDENSTERN

KING CLAUDIUS

And can you, by no drift of circumstance, Get from him why he puts on this confusion, Grating so harshly all his days of quiet With turbulent and dangerous lunacy?

ROSENCRANTZ

He does confess he feels himself distracted; But from what cause he will by no means speak.

GUILDENSTERN

Nor do we find him forward to be sounded, But, with a crafty madness,

keeps aloof, When we would bring him on to some confession Of his

(22)

Overg˚angsmatris i ”The tragedy of Hamlet” av William ¨ Shakespeare

A F K P U Z a f k p u z

(23)

Simulering av skattad Markovkedja f¨or Hamlet en bokstav i taget

Thale cowe iscow-grin stho yo y ha ches ar

OS win alfos ckimare h by g On, peefeee. y, ewh pe d NGany Thindost t sof ofumy; g diseea asheerat:

heas s me thaly onf orsd, he’tmenptinde sink tealler h;

otho childosstal,

tade qu G pad l I y hant four t it my llit A foot wisar t

USCETishinapaind t; de T d! d hisoure G n, keste be en me n As te mbe

liayoowense. ck mathens at d dey ore h hblefan ht, lllvecllengal! f btrerd

gan MAMLI shaver, abe w

(24)

Simulering av skattad Markovkedja f¨or Hamlet tv˚a bokst¨aver i taget

HAMLET

LORD POLONIUS HORTIO

To paustle manderst prought, Nown If his.

QUEEN God fing ise faith ne in Partes lad! But fee.

Well thichoin liond pooh! now creal’d full blord, strasson ordoe I been.

Morse, if noth le, tiven

If there’s pox, I can all Ham now thy vispoorn of this?

Wels fairst

Alassir: food quical bell; befecstortuness, it: mamedischough Theye, Whatur be his to tend; Hyper you wit

HAMLET

I wits upon viord, upoor the such vill so, nown may low’s how lords,

References

Related documents

D¨ arf¨ or ska vi ber¨ akna den betingade sannolikheten att vi drar ask A, givet att vi har erh˚ allit ett 1-euro mynt. Antingen f˚ ar vi sexa eller inte vid varje

Hennes intresse för det gamla herresätet hade stegrats, ju längre hon vistats här — icke blott därför, att det nu var och skulle förbli hennes hem, ty såsom sådant skulle hon

sarna. Tidigt på morgonen skramlade en hyrvagn utför den ännu nästan folktomma Norrtullsgatan, der den endast mötte några omornade och okammade jungfrur och madamer, hvilka

Vi vet allts˚ a att Markovkedjan befinner sig i tillst˚ andet “soligt” och vill r¨ akna ut sannoliketen f¨ or de olika tillst˚ anden tv˚ a dagar senare.. Vi vill testa om

Enligt det föreslagna nya andra stycket skall föreskriven a nnonstid i TV-sändning få överskridas i viss utsträckning, om programföretaget gör sannolikt att

Gustaf Terning Vilken typ av avsändarinformation från de aktiva inom SMS- tjänsten finns tillgänglig för er (till exempel avsändare eller mobilnummer).. Jan Rizvi Mobilnumret

c) D˚ a Y 3+ -joner substitueras med Zr 4+ -joner i BaZrO 3 bildas det O-vakanser i struk- turen, som sedan kan fyllas med -OH grupper d˚ a man behandlar (annealar) provet i en varm

Jag kommer gå igenom processen för att se hur reportrar går till väga för att hitta ett inslag som ger höga tittarsiffror, samt hur redaktörerna arbetar för att de ska komma