Avd. Matematisk statistik
TENTAMEN I SF1922, SF1923 och SF1924 SANNOLIKHETSTEORI OCH STATISTIK, TISDAGEN DEN 29:E MAJ 2018 KL 08.00–13.00.
Examinator f¨or SF1922/SF1923: Tatjana Pavlenko, 08-790 84 66 Examinator f¨or SF1924: Bj¨orn-Olof Skytt, 08-790 86 49.
Till˚atna hj¨alpmedel : Formel- och tabellsamling i Matematisk statistik (utdelas vid tentamen), minir¨aknare.
Inf¨orda beteckningar skall f¨orklaras och definieras. Resonemang och utr¨akningar skall vara s˚a utf¨orliga och v¨al motiverade att de ¨ar l¨atta att f¨olja. Numeriska svar skall anges med minst tv˚a siffrors noggrannhet. Tentamen best˚ar av 6 uppgifter. Varje korrekt l¨osning ger 10 po¨ang.
Gr¨ansen f¨or godk¨ant ¨ar prelimin¨art 24 po¨ang. M¨ojlighet att komplettera ges f¨or tentander med, prelimin¨art, 22–23 po¨ang. Tid och plats f¨or komplettering kommer att anges p˚a kursens hemsida.
Det ankommer p˚a dig sj¨alv att ta reda p˚a om du har r¨att att komplettera.
Tentamen kommer att vara r¨attad inom tre arbetsveckor fr˚an skrivningstillf¨allet och kommer att finnas tillg¨anglig p˚a studentexpeditionen minst sju veckor efter skrivningstillf¨allet.
Uppgift 1
Tv˚a defekta enheter har av misstag hamnat tillsammans med tre felfria enheter. F¨or att finna de felfria plockar man i tur och ordning bort en enhet i taget och testar denna. Detta forts¨atter tills man antingen har funnit de b˚ada defekta eller de tre felfria.
a) Best¨am f¨ordelningen f¨or X, antalet testade enheter. (5 p) b) Best¨am det genomsnittliga antalet testade enheter, E (X), samt ¨aven D (X). (5 p)
Uppgift 2
En komplicerad utrustning f¨or automatisk styrning av en produktionsprocess inneh˚aller bland annat 200 elektroniska komponenter. Tiden tills en enskild komponent g˚ar s¨onder beskrivs av en exponentialf¨ordelad stokastisk variabel med v¨antev¨arde 10 ˚ar. Antag att olika komponenter g˚ar s¨onder oberoende av varandra.
F¨or en ny utrustning, best¨am, med l¨amplig och v¨almotiverad approximation, sannolikheten att mer ¨an 15% av de ursprungliga komponenterna har g˚att s¨onder (och d¨arf¨or blivit utbytta) inom
ett ˚ar. (10 p)
Uppgift 3
I en modell f¨or utnyttjandet av ett besprutningsflygplan antar man att flygplanet ¨ar tillg¨angligt 20 % av tiden, under transport 30 % av tiden och i arbete resten av tiden. Man g¨or m¨atningar vid n = 25 tidpunkter och ser att flygplanet ¨ar tillg¨angligt 28 % av g˚angerna, i transport 40 % av g˚angerna och i arbete resten av g˚angerna.
Testa p˚a niv˚an 5 % ifall andelen tid flygplanet ¨ar tillg¨angligt, i transport eller i arbete signifikant
skiljer sig fr˚an modellens antagande. (10 p)
Uppgift 4
Weibullf¨ordelningen ¨ar en vanlig f¨ordelning f¨or att beskriva livsl¨angder f¨or komponenter. En sto- kastisk variabel X s¨ags vara Weibullf¨ordelad om
P (X > x) = e−(λ·x)β, x > 0 d¨ar λ > 0 och β > 0 ¨ar f¨ordelningens parametrar.
a) H¨arled t¨athetsfunktionen till X. (3 p)
F¨or en viss sorts komponenter ¨ar β = 2, medan λ ¨ar ok¨and. Man g¨or d¨arf¨or observationer av livsl¨angderna p˚a 5 oberoende komponenter och erh˚aller v¨ardena (enhet: ˚ar)
0.26 0.30 0.34 0.74 0.95
b) Ber¨akna maximum-likelihoodskattningen av λ. (4 p)
c) Skatta p˚a l¨ampligt s¨att kvantilen L10, dvs det v¨arde som uppfyller P (X ≤ L10) = 10%. (3 p) Uppgift 5
En metallurg ¨onskar skatta skillnaden ∆ mellan halterna av ett visst ¨amne i tv˚a prov A och B. Hon g¨or sju best¨amningar p˚a prov A och elva best¨amningar p˚a prov B och f˚ar resultaten x1, x2, . . . , x7
resp. y1, y2, . . . , y11. Hon ber¨aknar medelv¨ardena av sina observationer och f˚ar x = 9.58, y = 8.35 och standardavvikelserna till sx = 2.25 respektive sy = 3.36.
De sju resp. elva observationerna antas vara oberoende och komma fr˚an N (µ+∆, σ)- resp. N (µ, σ)- f¨ordelningar.
a) Best¨am ett 95% konfidensintervall f¨or ∆. (5 p)
b) Ge ett 95% konfidensintervall f¨or den ok¨anda standardavvikelsen σ. (5 p) Uppgift 6
En vanlig fr˚agest¨allning i samband med planeringen av f¨ors¨ok ¨ar ”Hur m˚anga m¨atningar m˚aste jag g¨ora?” Denna uppgift handlar om denna fr˚agest¨allning.
Vi vill m¨ata en storhet θ och antar att m¨atningarna X1, . . . , Xn ¨ar oberoende och N (θ, σ0)- f¨ordelade d¨ar σ0 ¨ar k¨ant. Vi vill testa hypotesen
H0 : θ = 10 mot alternativet
H1 : θ > 10.
Data betecknas med x1, . . . , xn.
forts tentamen i SF1922/1923/1924 2018-05-29 3
a) Best¨am k = k(σ0, n), dvs uttryck k som en funktion av n och σ0, s˚a att beslutsregeln Om ¯x ≥ k f¨orkasta H0
Om ¯x < k f¨orkasta ej H0
blir ett test p˚a signifikansniv˚an 5%. (5 p)
Ledning: Best¨am f¨ordelningen f¨or ¯X och utnyttja definitionen av signifikansniv˚a.
b) Man vill att beslutsregeln i a)-delen skall ha styrka ≥ 90% f¨or alternativet θ = 10.5. Detta inneb¨ar att man vill ha P ( f¨orkasta H0 ) ≥ 0.9 d˚a θ = 10.5.
Best¨am det minsta n (som funktion av σ0) s˚a att detta blir uppfyllt. (5 p)
L ¨OSNINGAR TILL
TENTAMEN I SF1922/1923/1924 SANNOLIKHETSTEORI OCH STATISTIK I TISDAGEN DEN 29 MAJ 2018 KL 8.00–13.00.
Uppgift 1 a) M¨ojliga v¨arden p˚a X ¨ar ΩX = {2, 3, 4} och
P (X = 2) =
2 2
3
3
5 2
= 1 10
dvs sannolikheten att tv˚a av tv˚a p˚a m˚af˚a dragna enheter ¨ar defekta (hypergeometrisk f¨ordelning).
Vidare s˚a ¨ar
P (X = 3) =
2 0
3
3
5 3
+
2 1
3
1
5 2
· 1 3 = 1
10+ 2 10 = 3
10
dvs sannolikheten f¨or att antingen ¨ar tre av tre dragna hela, eller s˚a av tv˚a draga ¨ar en hel och en trasig och detta f¨oljs av en trasig. Slutligen,
P (X = 4) =
2 1 · 32
5 3
= 6
10 .
dvs sannolikheten att av tre dragna ¨ar en defekt och tv˚a hela. Notera att sannolikheterna summeras till 1, vilket naturligtvis kan anv¨andas f¨or att r¨akna ut t.ex. P (X = 3) ur de tv˚a andra.
b) V¨antev¨ardet ber¨aknas E (X) = X
k
kP (X = k) = 2 · 1
10 + 3 · 3
10+ 4 · 6 10 = 7
2 = 3.5 och
E X2 =X
k
k2P (X = k) = 22· 1
10 + 32· 3
10+ 42· 6
10 = 127 10 dvs V (X) = E (X2) − (E (X))2 = 12.7 − (3.5)2 = 0.45 s˚a D (X) =√
0.45 ≈ 0.67.
Uppgift 2
L˚at X beskriva livsl¨angden f¨or en komponent. D˚a X ¨ar exponentialf¨ordelad med E (X) = λ1 = 10 s˚a ¨ar parametern λ = 1/10. Sannolikheten att komponenten g˚ar s¨onder inom ett ˚ar ber¨aknas till
p = P (X ≤ 1) = Z 1
0
fX(x) dx = Z 1
0
λe−λxdx =−e−λx1
0 = 1 − e−λ1= 1 − e−0.10 ≈ 0.0952.
forts tentamen i SF1922/1923/1924 2018-05-29 2
L˚at Y beskriva antalet komponenter (av de ursprungliga n = 200) som g˚att s¨onder inom ett
˚ar. D˚a ¨ar Y en Bin(n, p) ≈ N(np,pnp(1 − p)) = N(19.03, 4.15)-f¨ordelad stokastisk variabel.
(Normalapproximationen motiveras av att np(1 − p) = 17 > 10.) Allts˚a ¨ar P (Y /n > 0.15) = P Y − np
pnp(1 − p) > 0.15n − np pnp(1 − p)
!
≈ 1 − Φ (2.64) = 1 − 0.9959 = 0.0041.
(Exakt r¨akning ger 0.00475.)
Uppgift 3
Detta ¨ar test av given f¨ordelning. L˚at x1, x2, x3 vara antalet g˚anger som flygplanet var tillg¨angligt, under transport eller i arbete av de n m¨attillf¨allena. Data sammanfattas av
Syssels¨attning
Tillg¨anglig Transport Arbete
Observerade frekvenser, xi 7 10 8 n = 25
Modell, pi 0.20 0.30 0.50 1
npi 5 7.5 12.5 25
Vi vill testa om
H0 : p1 = 0.2, p2 = 0.3, p3 = 0.5.
Eftersom np1 > 5 s˚a ¨ar npi > 5 f¨or varje i vilket medf¨or att χ2-test kan anv¨andas. Vi bildar Qobs och j¨amf¨or de observerade frekvenserna x1, x2, x3 och de f¨orv¨antade frekvenserna i modellen
Qobs =
3
X
i=1
(xi− npi)2
npi = 3.253.
Om modellen ¨ar korrekt (dvs under H0) ¨ar Qobsett utfall fr˚an en χ2(2)-f¨ordelad stokastisk variabel.
Vi f¨orkastar H0 f¨or stora v¨arden p˚a Qobs och ur tabell f˚ar vi att χ20.05 = 5.99. Eftersom Qobs = 3.253 < χ20.05(2) = 5.99 s˚a kan vi inte utesluta att modellen ¨ar korrekt.
Svar: H0 ska ej f¨orkastas, vi kan inte utesluta att modellen ¨ar korrekt.
Uppgift 4 a) F¨or x > 0 och med P (X > x) = e−(λx)β s˚a ¨ar
FX(x) = P (X ≤ x) = 1 − P (X > x) = 1 − e−(λx)β och
fX(x) = d
dxFX(x) = 0 − e−(λx)β(−λβ· βxβ−1) = λββxβ−1e−(λx)β, och fX(x) = 0 om x ≤ 0. (Not: β = 1 ger exponentialf¨ordelningen med intensitet λ.)
b) Baserat p˚a m¨atningar x1, . . . , xn, utfall av oberoende Weibull-f¨ordelade stokastiska variabler X1, . . . , Xn (med k¨ant v¨arde p˚a β) ¨ar ML-skattningen av λ det v¨arde som maximerar
ln(L(λ)) = ln(fX1(x1) · · · fXn(xn)) = {ober} =
n
X
i=1
ln(fXi(xi)) =
n
X
i=1
ln
λββxβ−1i e−(λxi)β
= nβ ln(λ) + n ln(β) + (β − 1)
n
X
i=1
ln(xi) − λβ
n
X
i=1
xβi.
Nu ¨ar
d
dλln(L(λ)) = nβ
λ − βλβ−1
n
X
i=1
xβi = β λ
"
n − λβ
n
X
i=1
xβi
#
= 0 om
λβ = n Pn
i=1xβi . Allts˚a, ML-skattningen av λ ¨ar
λ∗obs = β
s n
Pn
i=1xβi =
r n
Pn
i=1x2i =
r 5
1.7233 = 1.703.
(Notera att d˚a β = 1 skall λ skattas med 1/x.) c) Vi s¨oker L0.10 s˚a att
0.10 = P (X ≤ L0.10) = FX(L10) = 1 − e−(λL10)β dvs
L10= (− ln(0.90))1/β/λ som skattas med
L∗10,obs= (− ln(0.90))1/2/λ∗obs =p− ln(0.90)/1.703 = 0.19.
Uppgift 5 a) Den sammanv¨agda variansskattningen s2 ¨ar
s2 = 6s2x+ 10s2y
16 = 8.954 Konfidensintervallet ges av
I∆= x − y ± tα/2(nx+ ny − 2)s s
1 nx + 1
ny = (1)
= 9.58 − 8.35 ± t0.025(16)s r1
7+ 1
11 = 1.23 ± 2.12 · s
8.954 1 7+ 1
11
= 1.23 ± 3.07. (2)
b) Konfidensintervallet f¨or σ2 ges av Iσ2 =
16s2
χ20.025(16), 16s2 χ20.975(16)
= (4.97, 20.73)
eftersom kvantilerna χ20.025(16) och χ20.975(16) ¨ar 28.8 respektive 6.91. Drar vi roten ur gr¨anserna s˚a erh˚aller vi ett konfidensintervall f¨or σ, dvs Iσ = (2.23, 4.55).
Uppgift 6 a) ¯X ¨ar N (θ, σ0/√
n)-f¨ordelad. Om H0 ¨ar sann, dvs θ = 10, s˚a ska P ( ¯X > k) = 0.05. Vi f˚ar
forts tentamen i SF1922/1923/1924 2018-05-29 4
0.05 = P ( ¯X > k) = P
¯X − 10
σ0
√n
> k − 10
σ0
√n
!
= 1 − Φ k − 10
σ0
√n
!
dvs vi har k−10√σ0
n
= λ0.05 som ger k = 10 + λ0.05√σ0n = 10 + 1.64√σ0n. b) Om θ = 10.5 s˚a ¨ar ¯X N (10.5, σ0/√
n)-f¨ordelad, dvs 0.9 ≤ P ( f¨orkasta H0 ) = P ( ¯X > k) = P
X > 10 + 1.64¯ σ0
√n
=
P
¯X − 10.5
σ0
√n
> 10 + 1.64√σ0n− 10.5
σ0
√n
!
= P
¯X − 10.5
σ0
√n
> 1.64 −0.5√ n σ0
!
=
= 1 − Φ
1.64 − 0.5√ n σ0
. Detta ger (utnyttja λ0.9 = −λ0.10)
1.64 − 0.5√ n
σ0 ≤ −λ0.10 ⇒ n ≥ (1.64 + λ0.10)2
0.52 σ20 ≈ 34.1 · σ20.