FREDAGEN DEN 8:E JUNI 2018 KL 14.00–19.00.
Examinator: Bj¨orn-Olof Skytt, 08 – 790 86 49.
Till˚atna hj¨alpmedel : Formel- och tabellsamling i Matematisk statistik (utdelas vid tentamen), Mathematics Handbook (Beta), minir¨aknare.
Inf¨orda beteckningar skall f¨orklaras och definieras. Resonemang och utr¨akningar skall vara s˚a utf¨orliga och v¨al motiverade att de ¨ar l¨atta att f¨olja. Numeriska svar skall anges med minst tv˚a siffrors noggrannhet. Tentamen best˚ar av 6 uppgifter. Varje korrekt l¨osning ger 10 po¨ang.
Gr¨ansen f¨or godk¨ant ¨ar prelimin¨art 24 po¨ang. M¨ojlighet att komplettera ges f¨or tentander med, prelimin¨art, 22–23 po¨ang. Tid och plats f¨or komplettering kommer att anges p˚a kursens hemsida.
Det ankommer p˚a dig sj¨alv att ta reda p˚a om du har r¨att att komplettera.
Tentamen kommer att vara r¨attad inom tre arbetsveckor fr˚an skrivningstillf¨allet och kommer att finnas tillg¨anglig p˚a studentexpeditionen minst sju veckor efter skrivningstillf¨allet.
Uppgift 1
I en kurs p˚a KTH g˚ar 212 elever, varav 101 ¨ar killar. Fyrtio av killarna ¨ar aktiva i studentf¨oreningar och fyrtionio av tjejerna. Ministern som bes¨oker KTH samma dag ¨onskar veta om studenterna ¨ar aktiva i studentf¨oreningar precis som p˚a den gamla goda tiden d˚a ministern sj¨alv l¨aste i Uppsala.
Rektorn v¨aljer slumpm¨assigt ut en elev ur klassen.
a) Vad ¨ar sannolikheten att eleven ¨ar aktiv i en eller flera studentf¨oreningar? (5 p) b) Om vi antar att eleven ¨ar aktiv i en eller flera studentf¨oreningar vad ¨ar sannolikheten att det
¨ar en kille? (5 p)
Uppgift 2
Ett hus skall uppf¨oras. Man kan dela upp uppf¨orandet i tre moment.
A Projektering (tr¨adr¨ojning, spr¨angning, bortschaktning etc.) B Gjutning av grunden, r¨ordragning f¨or el, vatten och avlopp etc.
C Byggande och inredande av sj¨alva huset.
Vi antar att ett moment m˚aste slutf¨oras innan n¨asta kan s¨attas ig˚ang och att man kan s¨atta ig˚ang med n¨asta moment omedelbart efter det att f¨oreg˚aende moment ¨ar avslutat. Vidare antar vi att tiderna (i enheten dagar) det tar f¨or varje moment ¨ar avslutat och N (150, 15) , N (130, 10) respektive N (270, 25).
Man startar 1 januari 2019 och vill utlova att huset skall vara f¨ardigt f¨or inflyttning ett visst datum. Hur m˚anga dagar ska det ta enligt modellen innan ¨ar huset klart med 95% sannolikhet?
Best¨am det minsta antalet dagar som uppfyller detta. (10 p)
forts tentamen i SF1920 och SF1921 2018-06-08 2
Uppgift 3
L˚at X vara antalet ensamma som checkar in p˚a ett stort hotell under tiden t och l˚at Y vara antalet par som checkar in p˚a samma hotell under tiden t. Tiden anges i minuter.
L˚at X ∈ P o (λ1t) och Y ∈ P o (λ2t) d¨ar λ1 = 2 och λ2 = 1. X och Y antas vara oberoende.
a) Ber¨akna sannolikheten att det under ett tidsintervall av l¨angd 1 minut anl¨ander precis fyra
personer. (5 p)
b) Ber¨akna med v¨almotiverad approximation sannolikheten att minst 250 personer anl¨ander under
en timme. (5 p)
Uppgift 4
Ett nytt l¨akemedel visade sig ge lindring f¨or 111 av de 300 personer (behandlingsgruppen) som deltog i ett f¨ors¨ok. I syfte att kunna j¨amf¨ora fick ¨aven 150 personer (kontrollgruppen) sockerpiller (som de trodde var det nya l¨akemedlet) och i den gruppen var det 39 personer som upplevde lindring.
Ber¨akna ett 95%-igt konfidensintervall f¨or skillnaden mellan andelarna i behandlingsgruppen re- spektive kontrollgruppen som upplever en lindring.
Kan vi p˚ast˚a att det finns en signifikant skillnad mellan de b¨agge grupperna. Anv¨and 5% signifi- kansniv˚a. Ange tydligt vilka de uppst¨allda hypoteserna ¨ar och vad slutsatsen ¨ar. (10 p)
Uppgift 5
Vid f¨ors¨ok att odla blommor av en viss typ erh¨olls 120 magentaf¨argade med gr¨ona stift(stigma), 48 magentaf¨argade med r¨oda stift, 36 r¨oda blommor med gr¨ona stift och 13 r¨oda blommor med r¨oda stift. Enligt botanisk teori b¨or blommor av dessa typer upptr¨ada i f¨orh˚allandet 9:3:3:1.
Ar detta experimentella resultat f¨¨ orenligt med den botaniska teorin? Genomf¨or ett l¨ampligt test som pr¨ovar p˚ast˚aendet. Anv¨and 5% signifikansniv˚a. (10 p)
Uppgift 6
L˚at x1 = 0.92, x2 = 0.79, x3 = 0.47, x4 = 0.90 och x5 = 0.86 vara utfall av oberoende stokastiska variabler X1, X2, X3, X4, X5, respektive, som har den gemensamma t¨athetsfunktionen fX(x) given av
fX(x) =
((θ + 1)xθ, 0 ≤ x ≤ 1,
0, annars,
d¨ar parametern θ ¨ar > −1. H¨arled maximum-likelihood-skattningen av parametern θ p˚a basis av
dessa data. (10 p)
Lycka till!
TISTIK.
FREDAGEN DEN 8:E JUNI 2018 KL 14.00–19.00 Uppgift 1
Definiera h¨andelserna A ={studenten ¨ar aktiv i en eller flera studentf¨oreningar}, K ={kille} och T ={tjej}.
a) Vi anv¨ander lagen om total sannolikhet;
P (A) = P (K) P (A | K) + P (T ) P (A | T )
= 101 212 · 40
101 +111 212 · 49
111
= 89 212
= 0.42
b) F¨or den andra fr˚agan kan vi anv¨anda Bayes sats.
P (K | A) = P (K) P (A | K)
P (K) P (A | K) + P (T ) P (A | T )
=
101 212 ·10140
89 212
= 40 89
= 0.45
forts tentamen i SF1920 och SF1921 2018-06-08 2
Uppgift 2
L˚at X vara en stokastisk variabel som beskriver antalet dagar till inflyttning. D˚a har vi E (X) = 150 + 130 + 270 = 550, V (X) = 152 + 102+ 252 = 950, D (X) =√
950.
Eftersom X ¨ar en linj¨arkombination av tre oberoende normalf¨ordelade stokastiska variabler s˚a ¨ar
¨aven X normalf¨ordelad, d v s X ∈ N 550,√ 950.
F¨or att besvara fr˚agan s¨oker vi det x som uppfyller P (X ≤ x) = 0.95. Vi standardiserar P X − 550
√950 ≤ x − 550
√950
= 0.95 Allts˚a m˚aste x uppfylla
x − 550
√950 = λ0.05= 1.6449 ⇔ x = 550 +√
950 · 1.6449 ⇔ x = 600.699223
Allts˚a ¨ar x = 601. Det minsta antalet dagar som huset ska kunna uppf¨oras p˚a enligt modellen ¨ar 601 dagar.
a) Fyra personer kan anl¨anda enligt tre olika m¨ojligheter: 4 ensamma personer men inget par, 2 ensamma personer och ett par samt 0 ensamma personer och 2 par. L˚at X vara antalet ensamma anl¨anda personer Y vara antalet par. Vi f˚ar d˚a att
P ({X = 4, Y = 0} ∪ {X = 2, Y = 1} ∪ {X = 0, Y = 2})
= P (X = 4, Y = 0) + P (X = 2, Y = 1) + P (X = 0, Y = 2)
= P (X = 4)P (Y = 0) + P (X = 2)P (Y = 1) + P (X = 0)P (Y = 2)
= e−224 4!e−110
0! + e−221 1!e−111
1! + e−220 0!e−112
2! = 19
6 e−3 ≈ 0.158
b) L˚at nu X vara antalet ensamma personer som kommer under en timme och Y antalet par. Totala antalet personer som kommer under timme ¨ar d˚a X + 2Y . B˚ade X och Y ¨ar Poissonf¨ordelade, X ∈Po(60 · 2) och Y ∈Po(60 · 1). Eftersom v¨antev¨ardena ¨ar st¨orre ¨an 15 ¨ar X ≈N(120,√
120) och Y ≈N(60,√
60) och s˚aledes X + 2Y ≈N(120 + 2 · 60,√
120 + 22· 60)= N(240,√
360). h¨arav f˚ar vi P (X + 2Y ≥ 250) ≈ 1 − Φ(250 − 240
√360 ) = 1 − Φ(0.527)≈ 0.30
forts tentamen i SF1920 och SF1921 2018-06-08 4
Uppgift 4
Vi uppfattar situationen som att vi har gjort binomialf¨ors¨ok i respektive grupp. x1 ¨ar en observa- tion p˚a X1 ∈ Bin (n1, p1) och x2 ¨ar en observation p˚a X2 ∈ Bin (n2, p2). Den sanna andelen i varje grupp ¨ar pi. Fr˚an texten har vi att n1 = 300 och x1 = 111, samt n2 = 150 och x2 = 39. Vi ska g¨ora konfidensintervall f¨or p1− p2. Vi punktskattar p1 med
(p1)∗obs = x1
n1 = 111
300 = 0.37 P˚a samma vis punktskattar vi p2 med
(p2)∗obs = x2
n2 = 39
150 = 0.26
Allts˚a blir punktskattningen av skillnaden p1− p2 lika med (p1)∗obs − (p2)∗obs = 0.11 Vi b¨or beakta att v˚art konfidensintervall har en approximativ konfidensgrad. Eftersom
n1(p1)∗obs(1 − (p1)∗obs) = 300 · 111 300
1 − 111 300
= 106.93 > 10 och
n2(p2)∗obs(1 − (p2)∗obs) = 150 · 39 150
1 − 39 150
= 28.86 > 10 Ett approximativt 95%-igt konfidensintervall f¨or p1− p2 f˚ar vi genom
(p1)∗obs− (p2)∗obs ± 1.96 d d¨ar
d = s
(p1)∗obs(1 − (p1)∗obs)
n1 +(p2)∗obs(1 − (p2)∗obs) n2
= s
111
300 1 − 111300
300 +
39
150 1 −15039 150
= 0.04538355
Konfidensintervallet erh˚aller vi utav 0.11 ± 1.96 × 0.04538355 eller 0.11 ± 0.09 eller med gr¨anserna utskrivna (0.02, 0.20). Konfidensintervallet f¨or p1 − p2 inneh˚aller inte talet noll, s˚a vi kan p˚a 5%
signifikansniv˚a f¨orkasta nollhypotesen om ingen skillnad mellan behandlingsgruppen och kontroll- gruppen.
Vi har n = 217 observationer p˚a multinomialf¨ordelningen med fyra celler.
Hypoteser:
H0 : P (A1) = 9
16, P (A2) = 3
16, P (A3) = 3
16, P (A4) = 1 16. H1 : H0 ej sann.
Signifikansniv˚a: α = 0.05.
Testvariabel: Testvariabeln
Qobs =
r
X
j=1
(xj− npj)2 npj
¨
ar approximativt χ2-f¨ordelad med (r − 1) frihetsgrader. Eftersom r = 4 har vi (r − 1) = 3 frihetsgrader. I formelsamlingen hittar vi χ20.05(3) = 7.81.
Beslutsregel: H0 f¨orkastas om Q > 7.81.
Resultat: χ2-metoden kan anv¨andas, ty f¨or np4 = 217 × 161 = 13.5627 > 5 och alla ¨ovriga npj
¨ar st¨orre. Ett s¨att att utv¨ardera nollhypotesen ¨ar att g¨ora en tabell ¨over de f¨orv¨antade frekvenserna och de observerade i varje cell:
Magenta/Gr¨on Magenta/R¨od R¨od/Gr¨on R¨od/R¨od npj 217169 = 122.1 217163 = 40.7 217163 = 40.7 217161 = 13.6
xi 120 48 36 13
Vi ser att de magentaf¨argade med r¨oda stift var fler ¨an f¨orv¨antat, s˚a att vi har en avvikelse i den cellen. I ¨ovriga celler ¨ar avvikelserna mycket sm˚a.
Testvariabeln blir Q =
r
X
j=1
(xj− npj)2 npj
= (120 − 122.1)2
122.1 +(48 − 40.7)2
40.7 +
+ (36 − 40.7)2
40.7 + (13 − 13.6)2
13.6 +
= 0.03611794 + 1.309337 + 0.5427518 + 0.02647059
= 1.914677 < 7.81
Slutsats: H0f¨orkastas ej p˚a 5% signifikansniv˚a. Det ¨ar m¨ojligt att den botaniska teorin ¨ar korrekt.
V˚art experiment har inte lyckats motbevisa teorin.
Uppgift 6 Likelihoodfunktionen f¨or θ med data x1, x2, x3, x4, x5 ¨ar
L (θ) = fX(x1) · fX(x2) · fX(x3) · fX(x4) · fX(x5),
forts tentamen i SF1920 och SF1921 2018-06-08 6
vilket ger
L(θ) = (θ + 1)5· (x1· x2· x3· x4· x5)θ. Tar man den naturliga logaritmen av detta f˚ar man
ln L (θ) = 5 ln (θ + 1) + θ
5
X
i=1
ln xi.
Logaritmen ¨ar en monotont v¨axande funktion, varf¨or vi s¨oker maximum f¨or L (θ) genom att best¨amma nollst¨allet f¨or f¨orsta derivatan av ln L (θ). Derivering ger
d
dθln L (θ) = 5 θ + 1 +
5
X
i=1
ln xi.
S˚aledes ¨ar dθd ln L (θ) = 0 f¨or
θ∗ = 5
P5
i=1ln(1/xi)− 1.
Ins¨attning av de gjorda observationerna ger θ∗ = 2.7585.
SVAR: Maximum likelihoodskattningen ¨ar θ∗ = 2.7585.