TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 25:E OKTOBER 2017 KL 08.00–13.00.
Examinator: Thomas ¨Onskog, 08 – 790 84 55.
Till˚atna hj¨alpmedel : Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), minir¨aknare.
Inf¨orda beteckningar skall f¨orklaras och definieras. Resonemang och utr¨akningar skall vara s˚a utf¨orliga och v¨al motiverade att de ¨ar l¨atta att f¨olja. Numeriska svar skall anges med minst tv˚a siffrors noggrannhet. Tentamen best˚ar av 6 uppgifter. Varje korrekt l¨osning ger 10 po¨ang.
Gr¨ansen f¨or godk¨ant ¨ar prelimin¨art 24 po¨ang. M¨ojlighet att komplettera ges f¨or tentander med, prelimin¨art, 22–23 po¨ang. Tid och plats f¨or komplettering kommer att anges p˚a kursens hemsida.
Det ankommer p˚a dig sj¨alv att ta reda p˚a om du har r¨att att komplettera.
Po¨ang fr˚an kontrollskrivning och laborationer under innevarande kursomg˚ang (period 4, VT2017) f˚ar tillgodor¨aknas under f¨oruts¨attning att tentanden erh˚allit minst 20 po¨ang p˚a denna tentamen.
Tentamen kommer att vara r¨attad inom tre arbetsveckor fr˚an skrivningstillf¨allet och kommer att finnas tillg¨anglig p˚a studentexpeditionen minst sju veckor efter skrivningstillf¨allet.
Uppgift 1
P˚a en viss sorts artiklar kan tre slags fel uppkomma: A, B respektive C. Fel av typ A uppkommer oberoende av fel av typ B och C. Vidare g¨aller att sannolikheterna att fel A, B respektive C uppkommer ¨ar 0.05, 0.02 respektive 0.03. En artikel som har fel av typ B har dessutom med sannolikhet 0.5 fel av typ C. En artikel klassas som felaktig om den har minst ett av felen. Vad
¨ar sannolikheten att en p˚a m˚af˚a vald artikel ¨ar felaktig? (10 p) Uppgift 2
Belysningssystemet i en stor v¨anthall best˚ar av en stor m¨angd belysningsenheter som g˚ar s¨onder oberoende av varandra. Tiden fr˚an att en belysningsenhet g˚ar s¨onder till dess att n¨asta belys- ningsenhet g˚ar s¨onder ¨ar exponentialf¨ordelad med v¨antev¨ardet 0.5 dagar.
a) Antag att 6 belysningsenheter har g˚att s¨onder. Best¨am sannolikheten f¨or att det dr¨ojer mer
¨
an en dag innan ytterligare en belysningsenhet har g˚att s¨onder, dvs tills det finns 7 trasiga
belysningsenheter i belysningssystemet. (2 p)
b) F¨oretaget som ansvarar f¨or belysningen i v¨anthallen byter trasiga belysningsenheter f¨orst n¨ar 100 belysningsenheter har g˚att s¨onder. Best¨am sannolikheten f¨or att det dr¨ojer minst 45 dagar innan byte av trasiga belysningsenheter sker. (8 p)
Var god v¨and!
forts tentamen i SF1901 2017-10-25 2
Uppgift 3
Overlevnadsfunktionen f¨¨ or en stokastisk variabel X definieras som SX(x) = 1 − P (X ≤ x). L˚at x1, . . . , xnvara utfall av de oberoende stokastiska variablerna X1, . . . , Xnsom alla har ¨overlevnads- funktionen SX(x) = 1 − xθ+1, d¨ar 0 ≤ x ≤ 1 och θ > −1. Best¨am minsta-kvadratskattningen av
den ok¨anda parametern θ. (10 p)
Uppgift 4
En forskare p˚a en lantbruksh¨ogskola vill unders¨oka om halten av quercetin, en antioxidant som anses motverka uppkomsten av bl. a. cancer, skiljer sig ˚at mellan tv˚a olika ¨appelsorter. Hen m¨ater d¨arf¨or upp halten quercetin (i mg/100 g) i 8 ¨applen av den f¨orsta sorten (x1, . . . , x8) och i 10 ¨applen av den andra sorten (y1, . . . , y10) och r¨aknar ut att x = 18 P8
i=1xi = 4.4723,P8
i=1(xi−x)2 = 0.1277, y = 101 P10
i=1yi = 4.6266, och P10
i=1(yi − y)2 = 0.1997. M¨atv¨ardena kan antas vara observationer av oberoende stokastiska variabler X1, . . . , X8 och Y1, . . . , Y10. Vidare antas att Xi ∈ N (µ1, σ), i = 1, ..., 8, samt att Yi ∈ N (µ2, σ), i = 1, ..., 10, d¨ar parametrarna µ1, µ2 och σ ¨ar ok¨anda.
a) Best¨am ett 95 % konfidensintervall f¨or µ1 − µ2 och testa p˚a signifikansniv˚an 5% hypotesen
H0: µ1 = µ2. Slutsatsen ska klart framg˚a. (5 p)
b) Antag nu, till skillnad fr˚an i (a)-delen, att det ¨ar k¨ant fr˚an tidigare studier att σ = 0.16.
Best¨am ett 95% konfidensintervall f¨or µ1− µ2, och testa p˚a signifikansniv˚an 5% hypotesen
H0: µ1 = µ2. Slutsatsen ska klart framg˚a. (5 p)
Uppgift 5
Sm˚att & gott ¨ar en chokladkonfektyr som best˚ar av mj¨olkchoklad med ett skal av f¨argad soc- kerkaramell. F¨oretaget som tillverkar dem h¨avdar att f¨orekomsten av de olika f¨argerna ges enligt tabellen nedan:
Brun Gul R¨od Orange Bl˚a Gr¨on
30% 20% 20% 10% 10% 10%
En stor p˚ase med Sm˚att & gott-konfektyrer valdes ut slumpm¨assigt och den visade sig inneh˚alla 58 bruna, 45 gula, 27 r¨oda, 14 orangea, 12 gr¨ona och 13 bl˚aa konfektyrer. Genomf¨or ett l¨ampligt test som pr¨ovar om detta resultat st¨oder f¨oretagets p˚ast˚aende. Var noga med att ange dina hypoteser och motivera dina slutsatser. Anv¨and 5% signifikansniv˚a. (10 p)
Uppgift 6
En astronom i Sverige ska m¨ata avst˚andet µ till en ljusstark stj¨arna. Hen utf¨or n1 m¨atningar, x1, . . . , xn1, som antas vara utfall av oberoende stokastiska variabler X1, . . . , Xn1. En kollega i Chile vill m¨ata samma avst˚and och utf¨or n2 m¨atningar, y1, . . . , yn2, som antas vara utfall av oberoende stokastiska variabler Y1, . . . , Yn2. M¨atresultatet f¨or det svenska instrumentet har standardavvikelse σ1 och m¨atresultatet f¨or det chilenska instrumentet har standardavvikelse σ2. Inget av de b˚ada instrumenten har n˚agra systematiska fel. Nu vill astronomerna kombinera sina b˚ada skattningar av avst˚andet, ¯x och ¯y, genom att bilda linj¨arkombinationen µ∗obs = c1· ¯x + c2· ¯y, d¨ar c1 och c2 ¨ar tv˚a konstanter. Ange det villkor p˚a konstanterna c1 och c2 som g¨or skattningen µ∗ v¨antev¨ardesriktig.
Antag vidare att n1 = n2 och att σ1 = 2 · σ2. Vilka v¨arden p˚a konstanterna c1 och c2 ger den mest effektiva skattningen µ∗obs = c1· ¯x + c2· ¯y? (10 p)
Lycka till!
L ¨OSNINGSF ¨ORSLAG TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK.
ONSDAGEN DEN 25 AUGUSTI 2017 KL 08.00–13.00 Uppgift 1
Det ¨ar givet att P (A) = 0.05, P (B) = 0.02 och P (C) = 0.03 samt att P (C | B) = 0.5. Vi f˚ar P (B ∩ C) = P (B)P (C | B) = 0.02 · 0.5 = 0.01.
Den s¨okta sannolikheten ¨ar
P (A ∪ B ∪ C) = P (A) + P (B ∪ C) − P (A ∩ (B ∪ C))
= P (A) + P (B ∪ C) − P (A)P (B ∪ C), ty A ¨ar oberoende av B och C. Vidare ¨ar
P (B ∪ C) = P (B) + P (C) − P (B ∩ C) = 0.02 + 0.03 − 0.01 = 0.04 och vi f˚ar allts˚a
P (A ∪ B ∪ C) = 0.05 + 0.04 − 0.05 · 0.04 = 0.088.
Svar: Sannolikheten att en godtyckligt vald artikel ¨ar defekt ¨ar 0.088.
Uppgift 2
L˚at Xi vara en stokastisk variabel som betecknar tid mellan att belysningsenhet i − 1 och att belysningsenhet i g˚ar s¨onder. Vi vet att Xi ∈ Exp(2) f¨or alla positiva heltal i, eftersom v¨antev¨ardet f¨or en Exp(λ)-f¨ordelat stokastisk variabel ¨ar 1/λ.
a) Vi s¨oker sannolikheten P (X7 > 1) och f˚ar med hj¨alp av t¨athetsfunktionen f¨or exponenti- alf¨ordelningen
P (X7 > 1) = Z ∞
1
pX7(x)dx = Z ∞
1
2e−2xdx = [−e−2x]∞1 = e−2.
Svar: Sannolikheten att det dr¨ojer mer ¨an en dag ¨ar 0.135.
b) L˚at Y = P100
i=1Xi vara en stokastisk variabel som betecknar tiden som det tar innan 100 belysningsenheter har g˚att s¨onder. Vi vill best¨amma sannolikheten P (Y ≥ 45). Eftersom Y ¨ar en summa av ett stort antal oberoende och likaf¨ordelade stokastiska variabler, s˚a ger Centrala Gr¨ansv¨ardessatsen att Y ¨ar approximativt normalf¨ordelad. Eftersom E(Xi) = 0.5 och D(Xi) = 0.5, s˚a g¨aller
Y ∼ N (100 · 0.5,√
100 · 0.5) = N (50, 5).
forts tentamen i SF1901 2017-10-25 2
F¨or att kunna anv¨anda kvantiler f¨or den standardiserade normalf¨ordelningen, s˚a g¨or vi om- skrivningen
P (Y ≥ 45) = P Y − 50
5 ≥ 45 − 50 5
= P (Z ≥ −1), d¨ar Z ∈ N (0, 1). P˚a grund av symmetri g¨aller det att
P (Z ≥ −1) = P (Z ≤ 1) = Φ(1) = 0.841.
Svar: Sannolikheten att det dr¨ojer minst 45 dagar ¨ar 0.841.
Uppgift 3
F¨or att kunna best¨amma minsta-kvadratskattningen beh¨over vi best¨amma v¨antev¨ardet av de stokastiska variablerna Xi. F¨ordelningsfunktionen f¨or Xi ges, enligt definitionen och den givna informationen i uppgiftsformuleringen, av
FXi(x) = P (Xi ≤ x) = 1 − SX(x) = 1 − (1 − xθ+1) = xθ+1.
Fr˚an sambandet mellan t¨athets- och f¨ordelningsfunktionen f¨or en kontinuerlig stokastisk variabel f˚as vidare
E(Xi) = Z 1
0
xpXi(x)dx = Z 1
0
xFX0
i(x)dx = Z 1
0
x(θ + 1)xθdx = Z 1
0
(θ + 1)xθ+1dx
= (θ + 1)xθ+2 θ + 2
1
0
= θ + 1 θ + 2.
Minsta-kvadratskattningen av den ok¨anda parametern θ minimerar kvadratsumman
Q(θ) =
n
X
i=1
(xi− E(Xi))2 =
n
X
i=1
xi− θ + 1 θ + 2
2
.
Derivering med avseende p˚a θ ger dQ
dθ = 2
n
X
i=1
xi− θ + 1 θ + 2
−1(θ + 2) − 1(θ + 1) (θ + 2)2
= − 2
(θ + 2)2
n
X
i=1
xi−n(θ + 1) θ + 2
! .
S¨atter vi derivatan till noll, s˚a f˚ar vi, med notationen ¯x = 1nPn
i=1xi, ekvationen dQ
dθ = 0 ⇒
n
X
i=1
xi− n(θ + 1)
θ + 2 = 0 ⇒ x =¯ θ + 1
θ + 2 ⇒ (θ + 2)¯x = θ + 1
⇒ θ(¯x − 1) = 1 − 2¯x ⇒ θ = 1 − 2¯x
¯ x − 1 . Svar: Minsta-kvadratskattningen av θ ¨ar θobs∗ = 2¯1−¯x−1x.
Uppgift 4
a) Vi har tv˚a normalf¨ordelade stickprov med samma ok¨anda varians. Vi best¨ammer f¨orst ett konfidensintervall f¨or differensen µ1 − µ2 av de b˚ada v¨antev¨ardena. Enligt avsnitt 11.2 i formelsamlingen g¨aller det att
X − Y − (µ1− µ2) Sq
1 n1 + n1
2
∼ t(n1+ n2− 2),
d¨ar
S2 = (n1− 1)S12+ (n2− 1)S22
n1+ n2− 2 = 1 n1+ n2 − 2
n1
X
i=1
(Xi− X)2+
n2
X
i=1
(Yi− Y )2.
Fr˚an definitionen av t-f¨ordelningens kvantiler och det faktum att n1 = 8 och n1 = 10 g¨aller det d¨armed att
P
−t0.025(16) ≤ X − Y − (µ1− µ2) S
q9 40
≤ t0.025(16)
= 0.95,
vilket efter omskrivningar av de b˚ada olikheterna ger P
X − Y − t0.025(16)S r 9
40 ≤ µ1− µ2 ≤ X − Y + t0.025(16)S r 9
40
= 0.95.
Ett konfidensintervall med konfidensgrad 95% f¨or µ1− µ2 ges d¨armed av
Iµ1−µ2 = x − y ± t0.025(16)s r 9
40 = −0.1543 ± 2.12
r0.1277 + 0.1997 16
r 9 40
= −0.1543 ± 0.1438 = (−0.2981, −0.0105).
Eftersom 0 /∈ Iµ1−µ2, s˚a avvisas H0 (p˚a signifikansniv˚an 5%).
Svar: P˚a signifikansniv˚an 5% finns det en skillnad mellan halterna av quercetin hos de b˚ada
¨appelsorterna.
b) Vi har tv˚a normalf¨ordelade stickprov med samma k¨anda varians σ = 0.16. Vi best¨ammer f¨orst ett konfidensintervall f¨or differensen µ1 − µ2 av de b˚ada v¨antev¨ardena. Enligt avsnitt 11.2 i formelsamlingen g¨aller det att
X − Y − (µ1 − µ2) σq
1 n1 +n1
2
∼ N (0, 1).
Fr˚an definitionen av normalf¨ordelningens kvantiler och det faktum att n1 = 8 och n1 = 10 g¨aller det d¨armed att
P
−λ0.025≤ X − Y − (µ1− µ2) σ
q9 40
≤ λ0.025
= 0.95,
forts tentamen i SF1901 2017-10-25 4
och genom omskrivning av de b˚ada olikheterna f˚as P
X − Y − λ0.025σ r 9
40 ≤ µ1− µ2 ≤ X − Y + λ0.025σ r 9
40
= 0.95, vilket ger konfidensintervallet
Iµ1−µ2 = x − y ± λ0.025σ r 9
40 = −0.1543 ± 1.96 · 0.16 r 9
40 = −0.1543 ± 0.1488
= (−0.3031, −0.0055).
Eftersom 0 /∈ Iµ1−µ2, s˚a avvisas H0 (p˚a signifikansniv˚an 5%).
Svar: P˚a signifikansniv˚an 5% finns det en skillnad mellan halterna av quercetin hos de b˚ada
¨appelsorterna.
Uppgift 5
Vi g¨or h¨ar ett test av given f¨ordelning (avsnitt 14.3 i formelsamlingen). Som nollhypotes H0 v¨aljer vi att f¨ordelningen av f¨argerna ¨ar s˚asom godistillverkaren p˚ast˚ar, dvs att
P (Brun) = p1 = 0.3, P (Gul) = p2 = 0.2, P (R¨od) = p3 = 0.2, P (Orange) = p4 = 0.1, P (Bl˚a) = p5 = 0.1, P (Gr¨on) = p6 = 0.1.
Mothypotesen H1 ¨ar att minst en av sannolikheterna ovan avviker fr˚an det givna v¨ardet pj. L˚at xj beteckna antalet konfektyrer av f¨arg j i den unders¨okta p˚asen och l˚at n = P6
j=1xj = 166.
Teststorheten blir Q =
6
X
j=1
(xj− npj)2
npj = (58 − 169 · 0.3)2
169 · 0.3 +(45 − 169 · 0.22
169 · 0.2 + (27 − 169 · 0.2)2 169 · 0.2 + (14 − 169 · 0.1)2
169 · 0.1 +(12 − 169 · 0.1)2
169 · 0.1 +(13 − 169 · 0.1)2
169 · 0.1 = 8.95.
Om H0 ¨ar sann och npj ≥ 5 s˚a ¨ar 8.95 ett utfall fr˚an en stokastisk variabel som approximativt har en χ2-f¨ordelning med 6 − 1 = 5 frihetsgrader. Eftersom npj ≥ 16.6 > 5 i detta fall s˚a ¨ar villkoret uppfyllt. Eftersom χ20.05(5) = 11.1 > 8.95, s˚a kan H0 inte f¨orkastas p˚a niv˚an 5%. Alternativt kan vi ber¨akna sannolikheten att en χ2(5)-variabel ¨ar st¨orre ¨an eller lika med 8.95 (X2cdf p˚a en TI-r¨aknare). Denna sannolikhet, dvs p-v¨ardet f¨or testet, ¨ar 0.111. Detta p-v¨arde ¨ar s˚a h¨ogt att vi inte kan f¨orkasta H0 p˚a riskniv˚an 5%. B˚ade teststorheten och p-v¨ardet f˚as direkt med funktionen X2-Test p˚a en TI-r¨aknare.
Svar: P˚a riskniv˚an 5% st¨ammer f¨oretagets p˚ast˚aende om f¨ordelningen av f¨argerna.
Uppgift 6
Skattningen µ∗ ¨ar v¨antev¨ardesriktig om E(µ∗) = µ. Eftersom µ∗ = c1X + c¯ 2Y , s˚¯ a g¨aller E(µ∗) = E(c1X + c¯ 2Y ) = c¯ 1E( ¯X) + c2E( ¯Y ) = c1
n1
n1
X
i=1
E(Xi) + c2 n2
n2
X
j=1
E(Yj)
= c1
n1n1µ + c2
n2n2µ = (c1+ c2)µ.
Skattningen ¨ar allts˚a v¨antev¨ardesriktig om c1+ c2 = 1. Den mest effektiva skattningen erh˚alls om c1 och c2 v¨aljs s˚a att variansen av skattningen minimeras. Variansen av skattningen ges av
V (µ∗) = V (c1X + c¯ 2Y ) = c¯ 12V ( ¯X) + c22V ( ¯Y ) = c21 n21
n1
X
i=1
V (Xi) + c22 n22
n2
X
j=1
V (Yj)
= c21
n1σ12+ c22 n2σ22.
Ins¨attning av antagandena n1 = n2 och σ1 = 2 · σ2 samt villkoret c1+ c2 = 1 ger vidare V (µ∗) = c21
n1(2σ2)2+ c22
n1σ22 = σ22
n1(4c21+ c22) = σ22
n1(4c21+ (1 − c1)2) = σ22
n1(5c21− 2c1+ 1).
F¨or att best¨amma minimum av variansen, s˚a deriverar vi detta uttryck med avseende p˚a c1 och s¨atter derivatan till noll.
0 = dV (µ∗) dc1 = σ22
n1(10c1− 2) ⇒ 10c1− 2 = 0 ⇒ c1 = 1 5.
Teckenstudium av andraderivatan visar att detta v¨arde p˚a c1 motsvarar ett minimum. Det opti- mala v¨ardet p˚a c2 blir vidare c2 = 1 − c1 = 1 − 15 = 45.
Svar: Den linj¨arkombination av m¨atningarna som ger den mest effektiva v¨antev¨ardesriktiga skattningen ¨ar µ∗obs = (¯x + 4¯y)/5.