TISDAGEN DEN 13:E MARS 2018 KL 08.00–13.00.
Examinator: Bj¨orn-Olof Skytt, 08 – 790 86 49.
Till˚atna hj¨alpmedel : Formel- och tabellsamling i Matematisk statistik (utdelas vid tentamen), Mathematics Handbook (Beta), minir¨aknare.
Inf¨orda beteckningar skall f¨orklaras och definieras. Resonemang och utr¨akningar skall vara s˚a utf¨orliga och v¨al motiverade att de ¨ar l¨atta att f¨olja. Numeriska svar skall anges med minst tv˚a siffrors noggrannhet. Tentamen best˚ar av 6 uppgifter. Varje korrekt l¨osning ger 10 po¨ang.
Gr¨ansen f¨or godk¨ant ¨ar prelimin¨art 24 po¨ang. M¨ojlighet att komplettera ges f¨or tentander med, prelimin¨art, 22–23 po¨ang. Tid och plats f¨or komplettering kommer att anges p˚a kursens hemsida.
Det ankommer p˚a dig sj¨alv att ta reda p˚a om du har r¨att att komplettera.
Tentamen kommer att vara r¨attad inom tre arbetsveckor fr˚an skrivningstillf¨allet och kommer att finnas tillg¨anglig p˚a studentexpeditionen minst sju veckor efter skrivningstillf¨allet.
Uppgift 1
En symmetrisk t¨arning kastas en g˚ang. L˚at X beteckna resultatet av t¨arningskastet.
Om X = i, i = 1, 2, . . . , 6, s˚a kastas ett symmetriskt mynt i g˚anger.
Ber¨akna den betingade sannolikheten att X antar ett udda resultat, givet att ˚atminstone en krona
upptr¨adde under kasten med myntet. (10 p)
Uppgift 2
Br¨unhilde kan kontakta sin bank med hj¨alp av sin mobil. Hon har en id´e om hur hon kan spara pengar. Varje dag sent p˚a kv¨allen g˚ar hon in p˚a sitt konto och ¨overf¨or det belopp som tiotalssiffran och entalssiffran utg¨or till ett sparkonto. Hon s¨atter de tv˚a talen l¨angst till h¨oger till noll, s k avhuggning. Om det t.ex. finns 21489:- p˚a kontot en kv¨all s˚a ¨overf¨ors 89:-, kvar blir 21400:-.
Antag att en m˚anad best˚ar av trettio dagar. Antag ¨aven att beloppet som f¨ors in p˚a sparkontot varje kv¨all ¨ar diskret likformigt f¨ordelat ¨over {0, 1, 2, . . . , 99}. Det betyder att varje avhugget belopp mellan noll kronor t.o.m. 99 kronor har lika stor sannolikhet att bli ¨overf¨ort till sparkontot.
L˚at W beteckna det belopp som en m˚anads sparande kan ge upphov till.
a) Ber¨akna E (W ). (2 p)
b) Ber¨akna V (W ). Ledning Pn
k=1k2 = 16 (2n3+ 3n2+ n). (3 p)
c) En biljett till en v¨alg¨orenhetsbal kostar 1645:-. Vad ¨ar den approximativa sannolikheten att den undansatta summan r¨acker till att betala biljetten till v¨alg¨orenhetsbalen? (5 p)
forts tentamen i i SF1920 och SF1921 2018-03-13 2
Uppgift 3
Tio studenter deltog i ett f¨ors¨ok f¨or att avg¨ora om en h¨ogskolekurs fungerade p˚a r¨att s¨att. Studen- terna gjorde ett test innan kursen startade och resultatet p˚a det registrerades. Dessutom gjorde de ett test ¨aven efter genomg˚angen kurs. Resultaten var f¨oljande:
1 2 3 4 5 6 7 8 9 10
Test innan kursen 77 56 64 60 57 53 72 62 65 66 Test efter kursen 88 74 83 68 58 50 67 64 74 60
Ange en l¨amplig statistik modell baserad p˚a normalf¨ordelningen som beskriver data och unders¨ok med hj¨alp av denna om det finns n˚agon systematisk f¨orb¨attring i studenternas resultat efter ge- nomg˚angen kurs. Anv¨and 5% signifikansniv˚a. Ange tydligt de uppst¨allda hypoteserna och motivera
tydligt vilken slutsats du drar. (10 p)
Uppgift 4
Tre grupper av sjuksk¨oterskor unders¨oktes ang˚aende deras s¨att att f¨ordela sin arbetstid ¨over tre kategorier av arbetsuppgifter. Sjuksk¨oterskorna observerades vid slumpm¨assiga tillf¨allen vilket gav upphov till f¨oljande observationer
1 2 3
Grupp 1 131 92 77 Grupp 2 79 61 60 Grupp 3 205 169 126
Unders¨ok om de tre grupperna f¨ordelar sin arbetstid p˚a samma s¨att ¨over arbetsdagen mellan de tre kategorierna av arbetsuppgifter. Anv¨and 5% signifikansniv˚a. Ange tydligt de uppst¨allda hypoteserna och motivera tydligt vilken slutsats du drar. (10 p)
Antag att antalet stormdagar under en decemberm˚anad beskrivs av en Poissonf¨ordelad stokastisk variabel med v¨antev¨arde µ och att antalet stormdagar olika ˚ar beskrivs av oberoende stokastiska variabler.
a) Antag att µ = 2. Best¨am (approximativt) sannolikheten att skillnaden i medelantalet storm- dagar i december under tv˚a olika (ej ¨overlappande) 10-˚arsperioder ¨overstiger 2 dagar. (5 p) b) Antag att man under en tio-˚arsperiod noterar f¨oljande antal stormdagar i december:
2 0 1 2 0 2 4 3 2 1
Tag fram ett (approximativt) 95% konfidensintervall f¨or µ och testa hypotesen µ = 2 mot µ 6= 2
p˚a niv˚a approximativt 5%. (5 p)
Uppgift 6
Antag att vi har ett stickprov x1, x2, . . . , xn d¨ar varje Xi ¨ar kontinuerligt likformigt f¨ordelad ¨over intervallet mellan 0 och den ok¨anda parametern θ. Vi brukar beteckna detta som att Xi ∈ U (0, θ).
a) Tag fram Minsta-kvadratskattningen θ∗MK,obs av θ. (2 p) b) Visa att Minsta-kvadratskattningen θMK,obs∗ ¨ar v¨antev¨ardesriktig. (2 p)
c) En annan skattning av θ ¨ar den korrigerade Maximum-likelihoodskattningen
θ∗ML korr,obs = n+1n max xi. Visa att θML korr,obs∗ ¨ar v¨antev¨ardesriktig. (3 p) d) Vilken av de tv˚a skattningarna θMK,obs∗ och θML korr,obs∗ av θ ¨ar effektivast? (3 p)
Lycka till!
Avd. Matematisk statistik
L ¨OSNINGSF ¨ORSLAG TENTAMEN I SF1920 och SF1921 SANNOLIKHETSTEORI OCH STA- TISTIK.
TISDAGEN DEN 13 mars 2018 KL 08.00–13.00 Uppgift 1
L˚at A = {˚atminstone en krona} och B = {X antar ett udda v¨arde}. D˚a kan fr˚agan formuleras som P (B | A). Men
P (B | A) = P (A ∩ B) P (A) . Nu ¨ar
P (A ∩ B) = X
i=1,3,5
P (X = i och vi erh¨oll ˚atminstone en krona med myntet)
= 1 6
1 2+ 1
6 7 8 +1
6 31 32
= 25 64
Om X = i s˚a ¨ar sannolikheten att erh˚alla ˚atminstone en krona under i kast 1 − 12i
(se f¨oljdsats 2.11.1 p˚a sidan 34 i Blom).
P˚a ungef¨ar samma s¨att
P (A) =
6
X
i=1
P (X = i och vi erh¨oll ˚atminstone en krona med myntet)
=
6
X
i=1
1
6 1 − 1 2
i!
= 1 6
1 2 +1
6 3 4 +1
6 7 8+ 1
6 15 16+ 1
6 31 32 +1
6 63 64
= 107 128
P (B | A) = P (A ∩ B) P (A) =
25 64 107 128
= 50
107 = 0.47
a) Om vi definierar den stokastiska variabeln Xi som beloppet som sparades dagen i under en m˚anad, s˚a kan vi skriva W som en summa av dessa Xi, d v s W =P30
i=1Xi. Vi har att E (W ) = P30
i=1E (Xi) Vi b¨orjar med att ber¨akna v¨antev¨ardet f¨or Xi, allts˚a det f¨orv¨antade beloppet som sparas under en dag. Enligt texten ¨ar Xi likformigt f¨ordelat ¨over {0, 1, 2, . . . , 99}. Det betyder att
E (Xi) =
99
X
k=0
kP (Xi = k)
=
99
X
k=0
k 100
= 1
100
99
X
k=0
k
= 1
100
99
X
k=1
k
= 1
100
99 · 100 2
= 1
100 · 4950
= 49.5
Vi anv¨ande formeln f¨or en aritmetisk summa ovan i l¨osningen. D¨armed har vi
E (W ) =
30
X
i=1
E (Xi) = 30 · 49.5 = 1485
forts tentamen i i SF1920 och SF1921 2018-03-13 3
b) Vi ber¨aknar variansen f¨or Xi genom ber¨akningsformeln:
V (Xi) = E Xi2 − (E (Xi))2
E Xi2
=
99
X
k=0
k2P (Xi = k)
=
99
X
k=0
k2 100
= 1
100
99
X
k=0
k2
= 1
100
99
X
k=1
k2
= 1
100
1
6 2 · 993+ 3 · 992+ 99
= 1
100 · 328350
= 3283.5
Vi anv¨ande ledtr˚aden, allts˚a formeln f¨or en kvadratsumma, ovan i l¨osningen.
V (Xi) = E Xi2 − (E (Xi))2
= 3283.5 − (49.5)2
= 833.25
Det ¨ar rimligt att uppfatta de sparade beloppen som oberoende, s˚a d¨arf¨or har vi
V (W ) =
30
X
i=1
V (Xi) = 30 · 833.25 = 24997.5
c) Eftersom n = 30 s˚a b¨or vi kunna till¨ampa centrala gr¨ansv¨ardessatsen p˚a W f¨or att ber¨akna den approximativa sannolikheten att det sparade beloppet ¨overstiger 1645:-.
P (W > 1645) = 1 − P (W ≤ 1645)
= 1 − P W − 1485
√24997.5 ≤ 1645 − 1485
√24997.5
= 1 − P (Z ≤ 1.01)
= 1 − Φ (1.01)
= 1 − 0.8438
= 0.1562
Uppgiften handlar om j¨amf¨orelse av v¨antev¨arden med stickprov i par.
Hypoteserna b¨or formuleras som H0 : ∆ = 0 mot H1 : ∆ > 0. De som genomf¨or studien tror ju p˚a att kursen fungerar som den ska, d v s i medeltal s˚a l¨ar sig studenterna n˚agot.
Vi bildar differenser zi = yi− xi. Vi betraktar zi, i = 1, . . . , 12, som utfall av oberoende N(∆, σ)- f¨ordelade stokastiska variabler. ∆ skattas med z = 5.4 (se nedan) som ¨ar ett utfall av en N(∆, σ/√
n)- f¨ordelad stokastisk variabel Z.
Testvariabel ¨ar
u = Z − ∆ S/√
n
som ¨ar t-f¨ordelad med (n − 1) frihetsgrader, om H0 ¨ar sann.
Antalet frihetsgrader ¨ar f = n − 1 = 9. Testet ¨ar ensidigt. D˚a signifikansniv˚an ¨ar α = 0.05, blir gr¨ansen f¨or det kritiska omr˚adet tα(n − 1) = t0.05(9) = 1.83. Allts˚a, f¨orkastar vi H0 om u > 1.83.
Vi ber¨aknar z och s fr˚an data:
1 2 3 4 5 6 7 8 9 10
Test innan kursen (xi) 77 56 64 60 57 53 72 62 65 66 Test efter kursen (yi) 88 74 83 68 58 50 67 64 74 60
zi = yi− xi 11 18 19 8 1 -3 -5 2 9 -6
zi2 121 324 361 64 1 9 25 4 81 36
Summan av differenserna blir Pn
i=1zi = 54. D˚a blir z = 1nPn
i=1zi = 101 54 = 5.4. Vidare blir Pn
i=1zi2 = 1026 och d¨armed har vi att s2 = 1
n − 1
n
X
i=1
zi2− 1 n
n
X
i=1
zi
!2
= 1 9
1026 − 1 10 542
= 81.6
Allts˚a blir s = 9.0333.
D¨armed blir testvariabeln
u = z s/√
n = 5.4
9.0333/√
10 = 1.89 > 1.83 Slutsatsen ¨ar att H0 f¨orkastas p˚a 5% signifikansniv˚a.
En alternativ l¨osning ¨ar att man p.g.a.H0 : ∆ = 0 och H1 : ∆ > 0 bildar ett ensidigt ned˚at begr¨ansat konfidensintervall
I∆= (z − sz
√n · tα(n − 1), ∞) Vilket ger
I∆= (5.4 − 9.0333
√10 · 1.83, ∞) = (0.1724, ∞)
Slutsats: 0 /∈ I∆ ⇒ H0 f¨orkastas p˚a signifikansniv˚an 5% .
forts tentamen i i SF1920 och SF1921 2018-03-13 5
Uppgift 4
Nollhypotesen som vi ska testa med ett s k homogenitetstest ¨ar
H0 : Sannolikheterna P (A1) , P (A2) , P (A3) ¨ar lika f¨or varje grupp.
Mothypotesen ¨ar helt enkelt att de inte ¨ar lika.
Vi kompletterar tabellen
1 2 3 Antal f¨ors¨ok
Grupp 1 131 92 77 300
Grupp 2 79 61 60 200
Grupp 3 205 169 126 500
Summa 415 322 263 1000
p∗j 0.415 0.322 0.263
Ut tabellen kan vi l¨asa att x·1 = 415, x·2 = 322 och x·3 = 263. Vi skattar den gemensamma sannolikheten f¨or kategori j med p∗j = x·j/n. Vidare har vi att n1 = 300, n2 = 200 och n3 = 500.
D˚a kan vi ber¨akna de f¨orv¨antade frekvenserna p˚a plats ij med nip∗j. Tabellen nedan inneh˚aller de f¨orv¨antade frekvenserna f¨or alla kombinationer av i och j:
1 2 3
n1p∗1 = 300 · 0.415 = 124.5 300 · 0.322 = 96.6 300 · 0.263 = 78.9 n1 = 300 n2p∗1 = 200 · 0.415 = 83 200 · 0.322 = 64.4 200 · 0.263 = 52.6 n2 = 200 n3p∗1 = 500 · 0.415 = 207.5 500 · 0.322 = 161 500 · 0.263 = 131.5 n3 = 500
p∗1 =0.415 p∗2 =0.322 p∗3 =0.263
Testvariabeln kan skrivas om som en differens mellan tv˚a enklare summor. Vi anv¨ander detta nedan (men man m˚aste inte anv¨anda denna ber¨akningsformel).
Qobs =
s
X
i=1 r
X
j=1
xij − nip∗j2
nip∗j =
s
X
i=1 r
X
j=1
x2ij nip∗j −
s
X
i=1
ni
s
X
i=1 r
X
j=1
x2ij
nip∗j = 1312
124.5 + 922
96.6 + 772 78.9 + 792
83 + 612
64.4 + 602 52.6 + 2052
207.5 +1692
161 + 1262 131.5
= 1002.675 Eftersom n1+ n2+ n3 = 1000 har vi att
Qobs =
s
X
i=1 r
X
j=1
xij − nip∗j2
nip∗j = 1002.675 − 1000 = 2.675
Antalet frihetsgrader d˚a s = 3 och r = 3 ¨ar fyra, eftersom (s − 1) (r − 1) = 2 · 2 = 4. Fempro- centkvantilen i en χ2-f¨ordelning med fyra frihetsgrader ¨ar 9.49, s˚a vi kan inte f¨orkasta H0. Som en allm¨an upplysning kan vi n¨amna att p-v¨ardet ¨ar 0.6136 (detta ¨ar inget som ni f¨orv¨antas r¨akna ut).
Det ¨ar m¨ojligt att sjuksk¨oterskorna f¨ordelar sin arbetstid p˚a samma s¨att f¨or de tre grupperna.
L˚at X1, . . . , Xn beskriva antalet stormar under n = 10 ˚ar. D˚a ¨ar X1, . . . , Xn oberoende Po(2)- f¨ordelade och P10
i=1Xi ¨ar Po(20) ≈ N(20,√
20)-f¨ordelad ty 20 ≥ 15. Allts˚a ¨ar X approximativt N(2,√
0.2). P˚a motsvarande s¨att ¨ar medelantalet stormar under en annan tidsperiod Y approxi- mativt N(2,√
0.2) oberoende av X.
a) Allts˚a ¨ar Y − X approximativt N(0,√
0.4) och P |Y − X| > 2
= P Y − X > 2 + P Y − X < −2 ≈
≈ (1 − Φ 2 − 0
√0.4
) + Φ −2 − 0
√0.4
= 1 − Φ (3.16) + Φ (−3.16) =
= 2(1 − Φ (3.16)) = 0.0015.
b) H¨ar ¨ar skattas µ med x = 1nPn
i xi = 1.7. EftersomPn
i=1xi¨ar ett utfall av den Po(nµ)-f¨ordelade stokastiska variabeln Pn
i=1Xi d¨ar nµ skattas med 17 ≥ 15 s˚a approximeras f¨ordelningen f¨or X av N(µ,pµ/n).
Ett konfidensintervall f¨or µ med konfidensgrad approximativt 1 − α = 95% ges av Iµ= x ± λα/2
rx
n = 1.7 ± 1.96 r1.7
10 = 1.7 ± 0.8 = (0.9, 2.5).
Eftersom 2 ∈ Iµ kan hypotesen µ = 2 ej f¨orkastas.
Uppgift 6
a) D˚a Xi ∈ U (0, θ) har vi att µi(θ) = E (Xi) = θ2. D¨armed blir
Q (θ) =
n
X
i=1
[xi− µi(θ)]2 =
n
X
i=1
xi− θ
2
2
Tag derivatan m a p θ och s¨att den lika med noll Q (θ)
dθ = 2
−1 2
n X
i=1
xi−θ
2
= 0 Om vi l¨oser ut θ har vi
n
X
i=1
xi = nθ
2 ⇔ θ∗MK,obs = 2 x.
b) E θMK,obs∗ = E 2 X = 2 E X = 2 E (Xi) = 2 θ2 = θ c) E θML korr,obs∗ = E n+1n max Xi = n+1n E (max Xi)
L˚at Y = max (X1, X2, . . . , Xn), s˚a vi ska finna E (Y ). F¨or att ber¨akna detta v¨antev¨arde b¨orjar vi med att finna f¨ordelningsfunktionen f¨or Y
FY (y) = P (Y ≤ y)
= P (max (X1, X2, . . . , Xn) ≤ y)
= P (X1 ≤ y) P (X2 ≤ y) · · · P (Xn≤ y)
= y θ
n
forts tentamen i i SF1920 och SF1921 2018-03-13 7
Om vi tar derivatan erh˚aller vi t¨athetsfunktionen dFY (y)
dy = d dy
y θ
n
= ny θ
n−1 1 θ = 1
θnnyn−1.
E (Y ) = Z θ
0
y 1
θnnyn−1dy
= n
θn Z θ
0
yndy
= n
θn
yn+1 n + 1
θ 0
= n
θn θn+1 n + 1
= n
n + 1θ
D˚a kan vi ˚aterv¨anda till v¨antev¨ardet
E θ∗ML korr,obs = n + 1
n E (max Xi) = n + 1 n
n
n + 1θ = θ d) Vi m˚aste ber¨akna varianserna f¨or de b¨agge skattningarna och j¨amf¨ora dem.
D˚a θ∗MK,obs = 2X har vi variansen som V θ∗MK,obs = V 2 X = 4 V X = 4 θ212n = 3nθ2. Vi vet att v¨antev¨ardet av θ∗ML korr,obs ¨ar θ. Variansen
V θ∗ML korr,obs
= Eh
θML korr,obs∗
2i
−E θML korr,obs∗
2
= E
"
n + 1
n max Xi
2#
− θ2
= n + 1 n
2
Emax Xi2 − θ2
Vi m˚aste ber¨akna E [max Xi2] eller E [Y2].
EY2
= Z θ
0
y2 1
θnnyn−1dy
= n
θn Z θ
0
yn+1dy
= n
θn
yn+2 n + 2
θ 0
= n
θn θn+2 n + 2
= n
n + 2θ2
n Emax Xi − θ =
n n + 2θ − θ
= n + 1 n
2
n n + 2− 1
! θ2
= (n + 1)2 n (n + 2) − 1
! θ2
= (n + 1)2− n (n + 2) n (n + 2)
! θ2
= n2+ 2n + 1 − n2− 2n n (n + 2)
θ2
=
1
n (n + 2)
θ2
Vi har allts˚a att
V θ∗ML korr,obs = θ2 n (n + 2), samt att
V θMK,obs∗ = θ2 3n.
F¨or n = 1 ¨ar varianserna lika. F¨or n ≥ 2 har vi str¨ang olikhet. Multiplicera med n p˚a b¨agge sidor, vilket ger n2 ≥ 2n. Slutligen l¨agger vi till 2n p˚a b¨agge sidor
n2+ 2n ≥ 4n > 3n ⇔ 1
n (n + 2) < 1
3n ⇔ V θ∗ML korr,obs < V θ∗MK,obs Allts˚a ¨ar punktskattningen θML korr,obs∗ effektivare ¨an punktskattningen θMK,obs∗ .