• No results found

Varje korrekt l¨osning ger 10 po¨ang

N/A
N/A
Protected

Academic year: 2021

Share "Varje korrekt l¨osning ger 10 po¨ang"

Copied!
7
0
0

Loading.... (view fulltext now)

Full text

(1)

TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 25:E OKTOBER 2017 KL 08.00–13.00.

Examinator: Thomas ¨Onskog, 08 – 790 84 55.

Till˚atna hj¨alpmedel : Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), minir¨aknare.

Inf¨orda beteckningar skall f¨orklaras och definieras. Resonemang och utr¨akningar skall vara s˚a utf¨orliga och v¨al motiverade att de ¨ar l¨atta att f¨olja. Numeriska svar skall anges med minst tv˚a siffrors noggrannhet. Tentamen best˚ar av 6 uppgifter. Varje korrekt l¨osning ger 10 po¨ang.

Gr¨ansen f¨or godk¨ant ¨ar prelimin¨art 24 po¨ang. M¨ojlighet att komplettera ges f¨or tentander med, prelimin¨art, 22–23 po¨ang. Tid och plats f¨or komplettering kommer att anges p˚a kursens hemsida.

Det ankommer p˚a dig sj¨alv att ta reda p˚a om du har r¨att att komplettera.

Po¨ang fr˚an kontrollskrivning och laborationer under innevarande kursomg˚ang (period 4, VT2017) f˚ar tillgodor¨aknas under f¨oruts¨attning att tentanden erh˚allit minst 20 po¨ang p˚a denna tentamen.

Tentamen kommer att vara r¨attad inom tre arbetsveckor fr˚an skrivningstillf¨allet och kommer att finnas tillg¨anglig p˚a studentexpeditionen minst sju veckor efter skrivningstillf¨allet.

Uppgift 1

P˚a en viss sorts artiklar kan tre slags fel uppkomma: A, B respektive C. Fel av typ A uppkommer oberoende av fel av typ B och C. Vidare g¨aller att sannolikheterna att fel A, B respektive C uppkommer ¨ar 0.05, 0.02 respektive 0.03. En artikel som har fel av typ B har dessutom med sannolikhet 0.5 fel av typ C. En artikel klassas som felaktig om den har minst ett av felen. Vad

¨ar sannolikheten att en p˚a m˚af˚a vald artikel ¨ar felaktig? (10 p) Uppgift 2

Belysningssystemet i en stor v¨anthall best˚ar av en stor m¨angd belysningsenheter som g˚ar s¨onder oberoende av varandra. Tiden fr˚an att en belysningsenhet g˚ar s¨onder till dess att n¨asta belys- ningsenhet g˚ar s¨onder ¨ar exponentialf¨ordelad med v¨antev¨ardet 0.5 dagar.

a) Antag att 6 belysningsenheter har g˚att s¨onder. Best¨am sannolikheten f¨or att det dr¨ojer mer

¨

an en dag innan ytterligare en belysningsenhet har g˚att s¨onder, dvs tills det finns 7 trasiga

belysningsenheter i belysningssystemet. (2 p)

b) F¨oretaget som ansvarar f¨or belysningen i v¨anthallen byter trasiga belysningsenheter f¨orst n¨ar 100 belysningsenheter har g˚att s¨onder. Best¨am sannolikheten f¨or att det dr¨ojer minst 45 dagar innan byte av trasiga belysningsenheter sker. (8 p)

Var god v¨and!

(2)

forts tentamen i SF1901 2017-10-25 2

Uppgift 3

Overlevnadsfunktionen f¨¨ or en stokastisk variabel X definieras som SX(x) = 1 − P (X ≤ x). L˚at x1, . . . , xnvara utfall av de oberoende stokastiska variablerna X1, . . . , Xnsom alla har ¨overlevnads- funktionen SX(x) = 1 − xθ+1, d¨ar 0 ≤ x ≤ 1 och θ > −1. Best¨am minsta-kvadratskattningen av

den ok¨anda parametern θ. (10 p)

Uppgift 4

En forskare p˚a en lantbruksh¨ogskola vill unders¨oka om halten av quercetin, en antioxidant som anses motverka uppkomsten av bl. a. cancer, skiljer sig ˚at mellan tv˚a olika ¨appelsorter. Hen m¨ater d¨arf¨or upp halten quercetin (i mg/100 g) i 8 ¨applen av den f¨orsta sorten (x1, . . . , x8) och i 10 ¨applen av den andra sorten (y1, . . . , y10) och r¨aknar ut att x = 18 P8

i=1xi = 4.4723,P8

i=1(xi−x)2 = 0.1277, y = 101 P10

i=1yi = 4.6266, och P10

i=1(yi − y)2 = 0.1997. M¨atv¨ardena kan antas vara observationer av oberoende stokastiska variabler X1, . . . , X8 och Y1, . . . , Y10. Vidare antas att Xi ∈ N (µ1, σ), i = 1, ..., 8, samt att Yi ∈ N (µ2, σ), i = 1, ..., 10, d¨ar parametrarna µ1, µ2 och σ ¨ar ok¨anda.

a) Best¨am ett 95 % konfidensintervall f¨or µ1 − µ2 och testa p˚a signifikansniv˚an 5% hypotesen

H0: µ1 = µ2. Slutsatsen ska klart framg˚a. (5 p)

b) Antag nu, till skillnad fr˚an i (a)-delen, att det ¨ar k¨ant fr˚an tidigare studier att σ = 0.16.

Best¨am ett 95% konfidensintervall f¨or µ1− µ2, och testa p˚a signifikansniv˚an 5% hypotesen

H0: µ1 = µ2. Slutsatsen ska klart framg˚a. (5 p)

Uppgift 5

Sm˚att & gott ¨ar en chokladkonfektyr som best˚ar av mj¨olkchoklad med ett skal av f¨argad soc- kerkaramell. F¨oretaget som tillverkar dem h¨avdar att f¨orekomsten av de olika f¨argerna ges enligt tabellen nedan:

Brun Gul R¨od Orange Bl˚a Gr¨on

30% 20% 20% 10% 10% 10%

En stor p˚ase med Sm˚att & gott-konfektyrer valdes ut slumpm¨assigt och den visade sig inneh˚alla 58 bruna, 45 gula, 27 r¨oda, 14 orangea, 12 gr¨ona och 13 bl˚aa konfektyrer. Genomf¨or ett l¨ampligt test som pr¨ovar om detta resultat st¨oder f¨oretagets p˚ast˚aende. Var noga med att ange dina hypoteser och motivera dina slutsatser. Anv¨and 5% signifikansniv˚a. (10 p)

Uppgift 6

En astronom i Sverige ska m¨ata avst˚andet µ till en ljusstark stj¨arna. Hen utf¨or n1 m¨atningar, x1, . . . , xn1, som antas vara utfall av oberoende stokastiska variabler X1, . . . , Xn1. En kollega i Chile vill m¨ata samma avst˚and och utf¨or n2 m¨atningar, y1, . . . , yn2, som antas vara utfall av oberoende stokastiska variabler Y1, . . . , Yn2. M¨atresultatet f¨or det svenska instrumentet har standardavvikelse σ1 och m¨atresultatet f¨or det chilenska instrumentet har standardavvikelse σ2. Inget av de b˚ada instrumenten har n˚agra systematiska fel. Nu vill astronomerna kombinera sina b˚ada skattningar av avst˚andet, ¯x och ¯y, genom att bilda linj¨arkombinationen µobs = c1· ¯x + c2· ¯y, d¨ar c1 och c2 ¨ar tv˚a konstanter. Ange det villkor p˚a konstanterna c1 och c2 som g¨or skattningen µ v¨antev¨ardesriktig.

Antag vidare att n1 = n2 och att σ1 = 2 · σ2. Vilka v¨arden p˚a konstanterna c1 och c2 ger den mest effektiva skattningen µobs = c1· ¯x + c2· ¯y? (10 p)

Lycka till!

(3)

L ¨OSNINGSF ¨ORSLAG TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK.

ONSDAGEN DEN 25 AUGUSTI 2017 KL 08.00–13.00 Uppgift 1

Det ¨ar givet att P (A) = 0.05, P (B) = 0.02 och P (C) = 0.03 samt att P (C | B) = 0.5. Vi f˚ar P (B ∩ C) = P (B)P (C | B) = 0.02 · 0.5 = 0.01.

Den s¨okta sannolikheten ¨ar

P (A ∪ B ∪ C) = P (A) + P (B ∪ C) − P (A ∩ (B ∪ C))

= P (A) + P (B ∪ C) − P (A)P (B ∪ C), ty A ¨ar oberoende av B och C. Vidare ¨ar

P (B ∪ C) = P (B) + P (C) − P (B ∩ C) = 0.02 + 0.03 − 0.01 = 0.04 och vi f˚ar allts˚a

P (A ∪ B ∪ C) = 0.05 + 0.04 − 0.05 · 0.04 = 0.088.

Svar: Sannolikheten att en godtyckligt vald artikel ¨ar defekt ¨ar 0.088.

Uppgift 2

L˚at Xi vara en stokastisk variabel som betecknar tid mellan att belysningsenhet i − 1 och att belysningsenhet i g˚ar s¨onder. Vi vet att Xi ∈ Exp(2) f¨or alla positiva heltal i, eftersom v¨antev¨ardet f¨or en Exp(λ)-f¨ordelat stokastisk variabel ¨ar 1/λ.

a) Vi s¨oker sannolikheten P (X7 > 1) och f˚ar med hj¨alp av t¨athetsfunktionen f¨or exponenti- alf¨ordelningen

P (X7 > 1) = Z

1

pX7(x)dx = Z

1

2e−2xdx = [−e−2x]1 = e−2.

Svar: Sannolikheten att det dr¨ojer mer ¨an en dag ¨ar 0.135.

b) L˚at Y = P100

i=1Xi vara en stokastisk variabel som betecknar tiden som det tar innan 100 belysningsenheter har g˚att s¨onder. Vi vill best¨amma sannolikheten P (Y ≥ 45). Eftersom Y ¨ar en summa av ett stort antal oberoende och likaf¨ordelade stokastiska variabler, s˚a ger Centrala Gr¨ansv¨ardessatsen att Y ¨ar approximativt normalf¨ordelad. Eftersom E(Xi) = 0.5 och D(Xi) = 0.5, s˚a g¨aller

Y ∼ N (100 · 0.5,√

100 · 0.5) = N (50, 5).

(4)

forts tentamen i SF1901 2017-10-25 2

F¨or att kunna anv¨anda kvantiler f¨or den standardiserade normalf¨ordelningen, s˚a g¨or vi om- skrivningen

P (Y ≥ 45) = P Y − 50

5 ≥ 45 − 50 5



= P (Z ≥ −1), d¨ar Z ∈ N (0, 1). P˚a grund av symmetri g¨aller det att

P (Z ≥ −1) = P (Z ≤ 1) = Φ(1) = 0.841.

Svar: Sannolikheten att det dr¨ojer minst 45 dagar ¨ar 0.841.

Uppgift 3

F¨or att kunna best¨amma minsta-kvadratskattningen beh¨over vi best¨amma v¨antev¨ardet av de stokastiska variablerna Xi. F¨ordelningsfunktionen f¨or Xi ges, enligt definitionen och den givna informationen i uppgiftsformuleringen, av

FXi(x) = P (Xi ≤ x) = 1 − SX(x) = 1 − (1 − xθ+1) = xθ+1.

Fr˚an sambandet mellan t¨athets- och f¨ordelningsfunktionen f¨or en kontinuerlig stokastisk variabel f˚as vidare

E(Xi) = Z 1

0

xpXi(x)dx = Z 1

0

xFX0

i(x)dx = Z 1

0

x(θ + 1)xθdx = Z 1

0

(θ + 1)xθ+1dx

=  (θ + 1)xθ+2 θ + 2

1

0

= θ + 1 θ + 2.

Minsta-kvadratskattningen av den ok¨anda parametern θ minimerar kvadratsumman

Q(θ) =

n

X

i=1

(xi− E(Xi))2 =

n

X

i=1



xi− θ + 1 θ + 2

2

.

Derivering med avseende p˚a θ ger dQ

dθ = 2

n

X

i=1



xi− θ + 1 θ + 2

 

−1(θ + 2) − 1(θ + 1) (θ + 2)2



= − 2

(θ + 2)2

n

X

i=1

xi−n(θ + 1) θ + 2

! .

S¨atter vi derivatan till noll, s˚a f˚ar vi, med notationen ¯x = 1nPn

i=1xi, ekvationen dQ

dθ = 0 ⇒

n

X

i=1

xi− n(θ + 1)

θ + 2 = 0 ⇒ x =¯ θ + 1

θ + 2 ⇒ (θ + 2)¯x = θ + 1

⇒ θ(¯x − 1) = 1 − 2¯x ⇒ θ = 1 − 2¯x

¯ x − 1 . Svar: Minsta-kvadratskattningen av θ ¨ar θobs = 1−¯x−1x.

(5)

Uppgift 4

a) Vi har tv˚a normalf¨ordelade stickprov med samma ok¨anda varians. Vi best¨ammer f¨orst ett konfidensintervall f¨or differensen µ1 − µ2 av de b˚ada v¨antev¨ardena. Enligt avsnitt 11.2 i formelsamlingen g¨aller det att

X − Y − (µ1− µ2) Sq

1 n1 + n1

2

∼ t(n1+ n2− 2),

d¨ar

S2 = (n1− 1)S12+ (n2− 1)S22

n1+ n2− 2 = 1 n1+ n2 − 2

n1

X

i=1

(Xi− X)2+

n2

X

i=1

(Yi− Y )2.

Fr˚an definitionen av t-f¨ordelningens kvantiler och det faktum att n1 = 8 och n1 = 10 g¨aller det d¨armed att

P



−t0.025(16) ≤ X − Y − (µ1− µ2) S

q9 40

≤ t0.025(16)



= 0.95,

vilket efter omskrivningar av de b˚ada olikheterna ger P

X − Y − t0.025(16)S r 9

40 ≤ µ1− µ2 ≤ X − Y + t0.025(16)S r 9

40



= 0.95.

Ett konfidensintervall med konfidensgrad 95% f¨or µ1− µ2 ges d¨armed av

Iµ1−µ2 = x − y ± t0.025(16)s r 9

40 = −0.1543 ± 2.12

r0.1277 + 0.1997 16

r 9 40

= −0.1543 ± 0.1438 = (−0.2981, −0.0105).

Eftersom 0 /∈ Iµ1−µ2, s˚a avvisas H0 (p˚a signifikansniv˚an 5%).

Svar: P˚a signifikansniv˚an 5% finns det en skillnad mellan halterna av quercetin hos de b˚ada

¨appelsorterna.

b) Vi har tv˚a normalf¨ordelade stickprov med samma k¨anda varians σ = 0.16. Vi best¨ammer f¨orst ett konfidensintervall f¨or differensen µ1 − µ2 av de b˚ada v¨antev¨ardena. Enligt avsnitt 11.2 i formelsamlingen g¨aller det att

X − Y − (µ1 − µ2) σq

1 n1 +n1

2

∼ N (0, 1).

Fr˚an definitionen av normalf¨ordelningens kvantiler och det faktum att n1 = 8 och n1 = 10 g¨aller det d¨armed att

P

−λ0.025≤ X − Y − (µ1− µ2) σ

q9 40

≤ λ0.025

= 0.95,

(6)

forts tentamen i SF1901 2017-10-25 4

och genom omskrivning av de b˚ada olikheterna f˚as P

X − Y − λ0.025σ r 9

40 ≤ µ1− µ2 ≤ X − Y + λ0.025σ r 9

40



= 0.95, vilket ger konfidensintervallet

Iµ1−µ2 = x − y ± λ0.025σ r 9

40 = −0.1543 ± 1.96 · 0.16 r 9

40 = −0.1543 ± 0.1488

= (−0.3031, −0.0055).

Eftersom 0 /∈ Iµ1−µ2, s˚a avvisas H0 (p˚a signifikansniv˚an 5%).

Svar: P˚a signifikansniv˚an 5% finns det en skillnad mellan halterna av quercetin hos de b˚ada

¨appelsorterna.

Uppgift 5

Vi g¨or h¨ar ett test av given f¨ordelning (avsnitt 14.3 i formelsamlingen). Som nollhypotes H0 v¨aljer vi att f¨ordelningen av f¨argerna ¨ar s˚asom godistillverkaren p˚ast˚ar, dvs att

P (Brun) = p1 = 0.3, P (Gul) = p2 = 0.2, P (R¨od) = p3 = 0.2, P (Orange) = p4 = 0.1, P (Bl˚a) = p5 = 0.1, P (Gr¨on) = p6 = 0.1.

Mothypotesen H1 ¨ar att minst en av sannolikheterna ovan avviker fr˚an det givna v¨ardet pj. L˚at xj beteckna antalet konfektyrer av f¨arg j i den unders¨okta p˚asen och l˚at n = P6

j=1xj = 166.

Teststorheten blir Q =

6

X

j=1

(xj− npj)2

npj = (58 − 169 · 0.3)2

169 · 0.3 +(45 − 169 · 0.22

169 · 0.2 + (27 − 169 · 0.2)2 169 · 0.2 + (14 − 169 · 0.1)2

169 · 0.1 +(12 − 169 · 0.1)2

169 · 0.1 +(13 − 169 · 0.1)2

169 · 0.1 = 8.95.

Om H0 ¨ar sann och npj ≥ 5 s˚a ¨ar 8.95 ett utfall fr˚an en stokastisk variabel som approximativt har en χ2-f¨ordelning med 6 − 1 = 5 frihetsgrader. Eftersom npj ≥ 16.6 > 5 i detta fall s˚a ¨ar villkoret uppfyllt. Eftersom χ20.05(5) = 11.1 > 8.95, s˚a kan H0 inte f¨orkastas p˚a niv˚an 5%. Alternativt kan vi ber¨akna sannolikheten att en χ2(5)-variabel ¨ar st¨orre ¨an eller lika med 8.95 (X2cdf p˚a en TI-r¨aknare). Denna sannolikhet, dvs p-v¨ardet f¨or testet, ¨ar 0.111. Detta p-v¨arde ¨ar s˚a h¨ogt att vi inte kan f¨orkasta H0 p˚a riskniv˚an 5%. B˚ade teststorheten och p-v¨ardet f˚as direkt med funktionen X2-Test p˚a en TI-r¨aknare.

Svar: P˚a riskniv˚an 5% st¨ammer f¨oretagets p˚ast˚aende om f¨ordelningen av f¨argerna.

Uppgift 6

Skattningen µ ¨ar v¨antev¨ardesriktig om E(µ) = µ. Eftersom µ = c1X + c¯ 2Y , s˚¯ a g¨aller E(µ) = E(c1X + c¯ 2Y ) = c¯ 1E( ¯X) + c2E( ¯Y ) = c1

n1

n1

X

i=1

E(Xi) + c2 n2

n2

X

j=1

E(Yj)

= c1

n1n1µ + c2

n2n2µ = (c1+ c2)µ.

(7)

Skattningen ¨ar allts˚a v¨antev¨ardesriktig om c1+ c2 = 1. Den mest effektiva skattningen erh˚alls om c1 och c2 v¨aljs s˚a att variansen av skattningen minimeras. Variansen av skattningen ges av

V (µ) = V (c1X + c¯ 2Y ) = c¯ 12V ( ¯X) + c22V ( ¯Y ) = c21 n21

n1

X

i=1

V (Xi) + c22 n22

n2

X

j=1

V (Yj)

= c21

n1σ12+ c22 n2σ22.

Ins¨attning av antagandena n1 = n2 och σ1 = 2 · σ2 samt villkoret c1+ c2 = 1 ger vidare V (µ) = c21

n1(2σ2)2+ c22

n1σ22 = σ22

n1(4c21+ c22) = σ22

n1(4c21+ (1 − c1)2) = σ22

n1(5c21− 2c1+ 1).

F¨or att best¨amma minimum av variansen, s˚a deriverar vi detta uttryck med avseende p˚a c1 och s¨atter derivatan till noll.

0 = dV (µ) dc1 = σ22

n1(10c1− 2) ⇒ 10c1− 2 = 0 ⇒ c1 = 1 5.

Teckenstudium av andraderivatan visar att detta v¨arde p˚a c1 motsvarar ett minimum. Det opti- mala v¨ardet p˚a c2 blir vidare c2 = 1 − c1 = 1 − 15 = 45.

Svar: Den linj¨arkombination av m¨atningarna som ger den mest effektiva v¨antev¨ardesriktiga skattningen ¨ar µobs = (¯x + 4¯y)/5.

References

Related documents

¨ arver en slumpm¨ assigt vald X-kromosom av sin mor och en slumpm¨ assigt vald X- eller Y-kromosom av sin far. Barnets k¨ on avg¨ ors av vilken kromosom som barnet ¨ arver av sin

Tentamen kommer att vara r¨ attad inom tre arbetsveckor fr˚ an skrivningstillf¨ allet och kommer att finnas tillg¨ anglig p˚ a studentexpeditionen minst sju veckor

Som motivering kan vi anv¨ anda antagandet att sannolikheten f¨ or en fumble ¨ ar konstant i alla f¨ ors¨ ok - det leder till att antalet fumbles i en match kan ses som Bin(n,

Tv˚ a defekta enheter har av misstag hamnat tillsammans med tre felfria enheter. F¨ or att finna de felfria plockar man i tur och ordning bort en enhet i taget och testar denna.

dessa data.. Det minsta antalet dagar som huset ska kunna uppf¨ oras p˚ a enligt modellen ¨ ar 601 dagar... a) Fyra personer kan anl¨ anda enligt tre olika m¨ ojligheter: 4

L¨ararna tror att det diagnostiska provet ¨ar av s˚ adan sv˚ arighetsgrad att 40% av de nyantagna kommer att f˚ a underk¨ant p˚ a provet, 40% kommer att f˚ a n˚ agot av betygen E,

Ledningen f¨ or m¨ obelf¨ oretaget tvivlar dock p˚ a flygbolagets p˚ ast˚ aende om sin punktlighet och ber sina anst¨ allda att under en m˚ anads tid notera om deras flyg fr˚

Tid och plats f¨or komplettering kommer att anges p˚ a kursens hemsida. Under en tidsperiod ¨ar sannolikheten att larmet g˚ ar 3%. Man vet att 98% av alla larm ¨ar falsklarm,