• No results found

• Kursboken V¨annman: Matematisk statistik. I kursboken f˚ar anteckningar och post-it lappar finnas, men inte l¨ osta exempel.

N/A
N/A
Protected

Academic year: 2021

Share "• Kursboken V¨annman: Matematisk statistik. I kursboken f˚ar anteckningar och post-it lappar finnas, men inte l¨ osta exempel."

Copied!
9
0
0

Loading.... (view fulltext now)

Full text

(1)

Po¨ ang totalt f¨ or del 1: 25 (10 uppgifter) Tentamensdatum 2012-06-02 Po¨ ang totalt f¨ or del 2: 30 (3 uppgifter) Skrivtid 09.00 – 14.00 arare: Ove Edlund och Inge S¨ oderkvist

Jourhavande l¨ arare: Adam Jonsson Tel: 0920-491948

Till˚ atna hj¨ alpmedel: • R¨aknedosa,

• Kursboken V¨annman: Matematisk statistik. I kursboken f˚ar anteckningar och post-it lappar finnas, men inte l¨ osta exempel.

• Kompendium om regressionsanalys

• Formelblad

• Tabeller

Tentamen best˚ ar av tv˚ a delar. P˚ a den f¨ orsta delen, som ¨ ar obligatorisk f¨ or att kunna bli godk¨ and, ska enbart svar l¨ amnas in, men l¨ osningar f˚ ar bifogas. Observera dock att dessa ej kommer att bed¨ omas utan enbart anv¨ andas vid gr¨ ansfall f¨ or att avg¨ ora om n˚ agon uppgift kan ”r¨ attas upp” p˚ a grund av slarvfel. P˚ a del 1 ges inga delpo¨ ang p˚ a uppgifterna.

Svaren f¨ or del 1 ska fyllas i p˚ a det blad som bifogas tentamen. Detta blad m˚ aste l¨ amnas in. L¨ agg detta blad f¨ orst bland l¨ osningarna. Om inte det ifyllda svarsbladet har l¨ amnats in s˚ a bed¨ oms tentamen som underk¨ and. F¨ or godk¨ ant kr¨ avs minst 17 po¨ ang p˚ a del 1. Med 2 extrapo¨ ang fr˚ an laborationerna och KGB s˚ a r¨ acker det allts˚ a med 15 po¨ ang av de 25 m¨ ojliga f¨ or godk¨ ant.

P˚ a den andra delen, som g¨ aller tentamen f¨ or ¨ overbetyg, ska fullst¨ andiga l¨ osningar l¨ amnas in. T¨ ank p˚ a att redovisa dina l¨ osningar p˚ a ett klart och tydligt s¨ att och motivera resonemangen. Vid bed¨ omningen av l¨ osningarna l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. F¨ or betyg 4 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 13 po¨ ang fr˚ an den andra delen f¨ or ¨ overbetyg. F¨ or betyg 5 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 23 po¨ ang fr˚ an den andra delen f¨ or ¨ overbetyg.

OBS! Det g˚ ar inte att kompensera underk¨ ant p˚ a den f¨ orsta korta delen av tentamen med po¨ ang p˚ a den andra delen.

Ange p˚ a tentamensomslaget om du har l¨ amnat in l¨ osningar p˚ a del 2 genom att kryssa f¨ or de sista tre uppgifterna.

Om du plussar f¨ or ¨ overbetyg s˚ a skriv detta p˚ a tentamensomslaget.

LYCKA TILL!

(2)

1. Antag att 6 % av alla bilf¨ orare k¨ or berusat. Antag ocks˚ a att sanno- likheten att en berusad person somnar under bilk¨ orningen ¨ ar 0 .26 och att motsvarande sannolikhet f¨ or en nykter person ¨ ar 0 .01. En olycka intr¨ affar, och det konstateras att bilf¨ oraren somnat vid ratten. Vad ¨ ar

sannolikheten att f¨ oraren var berusad? (2p)

2. Antag att du har ett stickprov av storlek 8 fr˚ an en kontinuerlig f¨ ordelning och att medianen i f¨ ordelningen ¨ ar lika med 6 .5. Ber¨akna sannolikhe- ten att h¨ ogst 4 av stickprovsvariablerna antar ett v¨ arde som ¨ ar st¨ orre

¨ an 6 .5. (3p)

3. Betrakta funktionen f(x) =

 ax + b om 0 ≤ x ≤ 1,

0 annars,

d¨ ar a och b ¨ar konstanter. Det finns flera v¨arden p˚a a och b f¨or vilka f ¨ar en frekvensfunktion, men endast ett par av v¨arden som g¨or att v¨ antev¨ ardet i f¨ ordelningen ¨ ar lika med 1 /3. Vilka ¨ar dessa v¨arden? (2p)

4. Thomas tar sp˚ arvagnen till jobbet varje morgon. V¨ antetiden i minuter kan betrakas som en slumpvariabel med R(0, 10)-f¨ordelning. V¨al p˚a jobbet m˚ aste Thomas v¨ anta en Exp(1)-f¨ ordelad tid p˚ a att hans dator ska starta. Ber¨ akna v¨ antev¨ arde och varians f¨ or den totala tid som

Thomas v¨ antar varje morgon. (2p)

5. Man vill konstruera en varuhiss f¨ or transport av partier som skall best˚ a av tre olika sorters enheter. Vikten i kilo f¨ or enheter av de tre sorterna ¨ ar f¨ ordelad enligt N(120, 7), N(175, 12) respektive N(215, 18).

Vilken maxkapacitet m˚ aste hissen ha f¨ or att i det l˚ anga loppet kunna

transportera 99.9 % av partierna? (2p)

6. Livsl¨ angden (enhet: timmar) f¨ or en viss typ av elektronr¨ or ¨ ar expo- nentialf¨ ordelad med λ = 0.005. S˚adana r¨or ing˚ar i radarutrustningen p˚ a ett fartyg, d¨ ar man i ett lager under d¨ ack har 100 elektronr¨ or. N¨ ar ett elektronr¨ or g˚ ar s¨ onder byts det genast ut.

Ber¨ akna en tid T s˚adan att lagret r¨acker ˚atminstone T timmar med

sannolikhet 0 .9. (3p)

7. L¨ akaren Evrim ¨ ar skeptisk mot homeopatmediciner. Hon beslutar sig f¨ or att prova om ett nylanserat preparat s¨ anker kolesterolniv˚ an f¨ or 9 slumpm¨ assigt utvalda patienter. Resultatet, i kodade enheter, ˚ aterges nedan.

Patient 1 2 3 4 5 6 7 8 9

F¨ ore 4.29 4.25 3.81 5.02 3.57 3.16 3.98 4.37 3.86

Efter 4.69 4.80 2.47 5.17 3.31 3.36 4.46 3.99 3.84

(3)

Ber¨ akna ett 99%-igt konfidensintervall f¨ or preparatets genomsnittliga effekt under rimliga normalf¨ ordelningsantaganden. (Effekten ¨ ar positiv om preparatet i genomsnitt minskar kolesterolv¨ ardet.) Svara med den

¨ ovre gr¨ ansen. (2p)

8. Ett forskarteam intresserar sig f¨ or om ett l¨ akemedel som ges till gravi- da kvinnor minskar vikten hos deras barn vid f¨ odelseln. Man antar att vikterna ¨ ar normalf¨ ordelade, d¨ ar standardavvikelsen 0 .454 best¨amts fr˚ an ber¨ akningar p˚ a ett mycket stort antal f¨ odslar. F¨ or att se om man kan p˚ avisa att v¨ antev¨ ardet μ ¨ar mindre ¨an 3.715, vilket ¨ar den ge- nomsnittslika sp¨ adbarnsvikten i hela populationen, utf¨ ors ett test p˚ a 5 % signifikansniv˚ a. Testet baseras p˚ a 100 f¨ odslar, d¨ ar slutsatsen att μ < 3.715 dras om medelvikten ¨ar mindre ¨an 3.6403.

Medelvikten f¨ or de 100 barnen blev 3 .6920, s˚a forskarna kan inte dra n˚ agra slutsatser p˚ a 5 % signifikansniv˚ a. F¨ or att kunna anv¨ anda detta till sin f¨ ordel vill l¨ akemedelsf¨ oretaget som tillverkat preparatet ber¨ akna testets styrka. Ber¨ akna styrkan d˚ a μ = 3.6. (2p)

9. Man ¨ ar intresserad av den andel p av alla studenter p˚a ett visst uni- versitet som motitionerar minst tre g˚ anger i veckan. En omfattande tidigare unders¨ okning gav p = 0.35 och man vill nu se om andelen har

¨ okat. F¨ or att testa

H

0

: p = 0.35 mot H

1

: p > 0.35

tillfr˚ agas 15 slumpm¨ assigt utvalda studenter och H

0

f¨ orkastas om minst 9 av de 15 studenterna motitionerar minst tre g˚ anger i veckan.

Vilken signifikansniv˚ a har testet? (2p)

10. Tio filmer unders¨ oks f¨ or att finna samband mellan produktionskost- nader (X1, miljoner dollar), marknadsf¨ oringskonstnader (X2, miljoner dollar) och biljettintekter under f¨ orsta ˚ aret (Y, miljoner dollar). Da- tamaterialet unders¨ oks med regressionsanalys. Resultatet redovisas i tabell 1.

(a) Best¨ am f¨ orklaringsgraden R

2

. (1p)

(b) Best¨ am ett 95%-konfidensintervall f¨ or biljettintekterna under f¨ or- sta ˚ aret f¨ or en film vars produktionskostnad ¨ ar 5 miljoner dollar och marknadsf¨ oringskostnaderna 2 miljoner dollar. Tillh¨ orande skattad standardavvikelse f¨ or ˆ Y ¨ar s

Yˆ

= 4 .14. Svara med den

undre gr¨ ansen. (2p)

(c) Om produktionskostnaderna h˚ alls konstanta och marknadsf¨ orings- konstnaderna ¨ okar med 1 miljon dollar, best¨ am ett 90%-konfidens- intervall f¨ or hur biljettintekterna ¨ andras och redovisa den undre

gr¨ ansen. (2p)

Slut p˚ a del 1. Gl¨ om inte att bifoga svarsbladet med tentan!

(4)

Tabell 1: Regression Analysis: Y versus X1; X2

The regression equation is

Y = 11,8 + 4,23 X1 + 7,44 X2

Predictor Coef SE Coef T P

Constant 11,848 6,765 1,75 0,123

X1 4,228 1,153 3,67 0,008

X2 7,436 1,806 4,12 0,004

S = 8,24076 R-Sq = ? R-Sq(adj) = 94,1%

Analysis of Variance

Source DF SS MS F P

Regression 2 9798,3 Residual Error 7 475,4

Total 9 ?

Tabell f¨ or svar till del 1

Riv ut och l¨ agg svarsbladet f¨ orst i tentamen

Namn: . . . .

Personnummer: . . . .

(5)

Fr˚ aga Svar Po¨ang

1 Sannolikhet (tre decimaler) 0.624 2

2 Sannolikhet (tre decimaler) 0.637 3

3 a och b a = −2, b = 2 2

4 V¨ antev¨ arde och varians (tv˚ a decimaler) V¨ antev¨ ardet ¨ ar 6, Variansen 9.33

2

5 Maxkapacitet (tre decimaler) 580.264 2

6 tiden T (tre decimaler) 17436.8 3

7 Ovre gr¨ ¨ ans (tv˚ a decimaler) 0.68 2

8 Styrka (tre decimaler) Φ(0 .88) = 0.813 2

9 Signifikansniv˚ a (tre decimaler) 0.042 2

10 a F¨ orklaringsgrad (tre decimaler) 1

b undre gr¨ ans (fyra decimaler) 2

c undre gr¨ ans (fyra decimaler) 2

Totalt antal po¨ ang 25

(6)
(7)

Vid bed¨ omningen av l¨ osningarna av uppgifterna i del 2 l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. T¨ ank p˚ a att noga redovisa inf¨ orda beteckningar och eventuella antaganden.

11. Ett f¨ oretag som tillverkar batterier har produktionen f¨ orlagd till tre olika fabriker, som vi kallar a, b och c. Fabrik a st˚ar f¨or 50 % av tillverk- ningen, fabrik b f¨or 20% och fabrik c f¨or 30%. Man vet att livsl¨angderna f¨ or batterierna ¨ ar Exponentialf¨ ordelade, d¨ ar sannolikheten att ett bat- teri fr˚ an fabrik a, b och c r¨acker mer ¨an 100 driftstimmar ¨ar 95, 97 respektive 98 %. Man har blandat batterier fr˚ an de tre fabrikerna i ett stort centrallager. Vad ¨ ar sannolikheten att ett batteri som tas p˚ a m˚ afa fr˚ an centrallagret r¨ acker mer ¨ an 150 driftstimmar? (10p) osningsskiss L˚ at H vara h¨andelsen att batteriet som tas fr˚an central- lagret r¨ acker 150 timmar, l˚ at A, B, C vara h¨andelsen att batteriet kom- mer fr˚ an fabrik a, b respekive C. F¨orst best¨ams parametrarna λ

a

, λ

b

, λ

c

i exponentialf¨ ordelningarna med hj¨ alp av f¨ ordelningsfunktionen F (x) = 1 −e

−λx

och f¨ oruts¨ attningarna som ges i uppgiften. Sedan kan P (H|A), P (H|B) och P (H|A) best¨ammas. Till sist anv¨ands

P (H) = P (H|A)P (A) + P (H|B)P (B) + P (H|C)P (C).

12. Xie ¨ ar kvalitetsansvarig p˚ a ett kinesiskt f¨ oretag som tillverkar ¨ atpinnar.

Pinnarna m˚ aste vara tillr¨ ackligt raka, och f¨ oretagets m˚ al ¨ ar att minst 99.5 % av alla pinnar skall uppfylla ett v¨ aletablerat m˚ att p˚ a rakhet. F¨ or att uppt¨ acka om det finns systemfel skall du hj¨ alpa Xie st¨ alla upp ett test baserat p˚ a en unders¨ okning av 2000 slumpm¨ assigt utvalda pinnar.

F¨ or full po¨ ang kr¨ avs att du anv¨ ander v¨ almotiverade approximationer f¨ or att f¨ orenkla ber¨ akningar av testets egenskaper.

(a) St¨ all upp hypoteser och definiera en beslutsregel s˚ a att Xie f˚ ar ett test med en signifikansniv˚ a n¨ ara 5 %. (5p) (b) Ber¨ akna styrkan f¨ or testet i (a) om 99.25 % av pinnarna ¨ ar

tillr¨ ackligt raka. (5p)

osningsskiss L˚ at ξ vara antalet sneda pinnar. Vi har ξ ∈ Bin(2000, p), d¨ ar p ¨ar andelen sneda pinnar i det l˚anga loppet (dvs. sannolikheten att en pinne ¨ ar sned).

(a) Vi testar H

0

: p = 0.005 mot H

1

: p > 0.005 med beslutsregeln:

f¨ orkasta H

0

om ξ ≥ k. D˚a p = 0.005 har vi 2000p(1 − p) < 10 s˚a tumregeln f¨ or normalapproximation ¨ ar inte uppfylld. Men vi har approximativt ξ ∈ P o(10). Med hj¨alp av Poissontabellen f˚ar vi att k = 5 ger ett test med ca 4.87% signifikansniv˚a. (5p) (b) Poissontabellen ger att styrkan d˚ a p = 0.0075 ¨ar ca 44%. (5p)

13. Vi forts¨ atter att jobba med datamaterialet om filmer fr˚ an del 1, som

redovisas i sin helhet i tabell 2. I datamaterialet finns ocks˚ a uppgifter

om int¨ akter fr˚ an f¨ ors¨ aljningen av romanen som ligger till grund f¨ or

filmens manus (X3, miljoner dollar).

(8)

(a) I tabell 3 redovisas en multipel regressionsanalys, gjord i Mini- tab, d¨ ar alla f¨ orklarande variabler finns med. Redovisa dina steg, f¨ or att best¨ amma den justerade f¨ orklaringsgraden R

2a

, och resi- dualspridningen s. J¨amf¨or med resultatet i tabell 1. Vad var bra och/eller d˚ aligt med att inf¨ ora den nya f¨ orklarande variabeln. (4 p) (b) Ange fullst¨ andigt modellantagande f¨ or den skattade modellen i

tabell 3, och anv¨ and residualplottarna i figur 1 till att utreda

modellantagandets giltighet. Motivera! (2 p)

(c) Fr˚ an tabell 3 ¨ ar det uppenbart att X3 p˚ averkar Y i mindre ut-

str¨ ackning ¨ an X1 och X2. Om vi testar om β

3

¨ ar negativ, dvs

H

0

: β

3

= 0 och H

1

: β

3

< 0, best¨am d˚a P-v¨ardet f¨or den hypote-

spr¨ ovningen. Hur tolkar du ditt resultat. (4 p)

(9)

Tabell 2: Tabellen beskriver int¨ akter och utgifter vid 10 filmproduktioner, i ter- mer av produktionskostnader (X1, miljoner dollar), marknadsf¨ oringskonstnader (X2, miljoner dollar), int¨ akter fr˚ an bokf¨ ors¨ aljning (X3, miljoner dollar) och bil- jettintekter under f¨ orsta ˚ aret (Y, miljoner dollar).

Y X1 X2 X3

85.100 8.5000 5.10000 4.7000 106.300 12.9000 5.80000 8.8000 50.200 5.2000 2.10000 15.1000 130.600 10.7000 8.40000 12.2000 54.800 3.1000 2.90000 10.6000 30.300 3.5000 1.20000 3.5000 79.400 9.2000 3.70000 9.7000 91.000 9.0000 7.60000 5.9000 135.400 15.1000 7.70000 20.8000 89.300 10.2000 4.50000 7.9000

Tabell 3: Regression Analysis: Y versus X1; X2; X3

The regression equation is

Y = 7,68 + 3,66 X1 + 7,62 X2 + 0,828 X3

Predictor Coef SE Coef T P

Constant 7,676 6,760 1,14 0,299

X1 3,662 1,118 3,28 0,017

X2 7,621 1,657 4,60 0,004

X3 0,8285 0,5394 1,54 0,175

S = ? R-Sq = 96,7% R-Sq(adj) = ?

Analysis of Variance

Source DF SS MS F P

Regression ? 9932,5 3310,8 58,22 0,000 Residual Error ? 341,2 56,9

Total ? 10273,7

Figur 1: Residualplottar vid regressionanalysen i tabell 3. Residualplottarna

mot X1, X2 och X3 ¨ ar s˚ a liknande plotten mot ˆ Y , att de tagits bort f¨or att

spara plats.

References

Related documents

L˚ at y(t) vara andelen av populationen som ¨ar smittad efter tiden t dygn, r¨aknad fr˚ an uppt¨ack- ten... Observera att ¨amnets koncentration ¨ar samma som m¨angden av

L¨ angden (mm) av bultarna varierar p˚ a grund av ett slumpm¨ assigt fel som antas vara normalf¨ ordelat kring 0 med standardavvikelsen σ = 0.5 vilket motsvarar precisionen f¨

Datamaterialet i Tabell 2, som best˚ ar av 38 observationer, beskriver hur antal inkomna ordrar (ordrar ×1000) f¨ or postorderf¨ oretag beror av upplagan p˚ a katalogen (uppl ×1000)

(a) Ber¨ akna sannolikheten att ingen av dom uppt¨ acker defekten.. (1p) (b) Ber¨ akna sannolikheten att exakt en av dom uppt¨

För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg.. För betyg 5 krävs godkänt på den första obligatoriska

Avvikelsen mellan hans faktiska vikt och den vikt som v˚ agen visar ¨ ar normalf¨ ordelad med v¨ antev¨ arde noll och standardavvikelse σ = 0.05 kg.. Svara med den nedre

Vid bed¨ omningen av l¨ osningarna av uppgifterna i del 2 l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. T¨ ank p˚ a att noga redovisa inf¨ orda

I en simbass¨ang finns ett halvcirkelformat f¨onster D med radie R och vars medelpunkt befinner sig p˚a djupet h, d¨ar h &gt; R, en-