Po¨ ang totalt f¨ or del 1: 25 (9 uppgifter) Tentamensdatum 2012-03-23 Po¨ ang totalt f¨ or del 2: 30 (3 uppgifter) Skrivtid 09.00 – 14.00 L¨ arare: Adam Jonsson och Inge S¨ oderkvist
Jourhavande l¨ arare: Adam Jonsson Tel: 0920-491948
Till˚ atna hj¨ alpmedel: • R¨ aknedosa,
• Kursboken V¨ annman: Matematisk statistik. I kursboken f˚ ar anteckningar och post-it lappar finnas, men inte l¨ osta exempel.
• Kompendium i regressionsanalys
• Formelblad
• Tabeller
Tentamen best˚ ar av tv˚ a delar. P˚ a den f¨ orsta delen, som ¨ ar obligatorisk f¨ or att kunna bli godk¨ and, ska enbart svar l¨ amnas in, men l¨ osningar f˚ ar bifogas. Observera dock att dessa kommer ej att bed¨ omas utan enbart anv¨ andas vid gr¨ ansfall f¨ or att avg¨ ora om n˚ agon uppgift kan ”r¨ attas upp” p˚ a grund av slarvfel. P˚ a del 1 ges inga delpo¨ ang p˚ a uppgifterna.
Svaren f¨ or del 1 ska fyllas i p˚ a det blad som bifogas tentamen. Detta blad m˚ aste l¨ amnas in. L¨ agg detta blad f¨ orst bland l¨ osningarna. Om inte det ifyllda svarsbladet har l¨ amnats in s˚ a bed¨ oms tentamen som underk¨ and. F¨ or godk¨ ant kr¨ avs minst 17 po¨ ang p˚ a del 1. Med 2 extrapo¨ ang fr˚ an laborationerna och KGB s˚ a r¨ acker det allts˚ a med 15 po¨ ang av de 25 m¨ ojliga f¨ or godk¨ ant.
P˚ a den andra delen, som g¨ aller tentamen f¨ or ¨ overbetyg, ska fullst¨ andiga l¨ osningar l¨ amnas in. T¨ ank p˚ a att redovisa dina l¨ osningar p˚ a ett klart och tydligt s¨ att och motivera resonemangen. Vid bed¨ omningen av l¨ osningarna l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. F¨ or betyg 4 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 13 po¨ ang fr˚ an den andra delen f¨ or ¨ overbetyg. F¨ or betyg 5 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 23 po¨ ang fr˚ an den andra delen f¨ or ¨ overbetyg.
OBS! Det g˚ ar inte att kompensera underk¨ ant p˚ a den f¨ orsta korta delen av tentamen med po¨ ang p˚ a den andra delen.
Ange p˚ a tentamensomslaget om du har l¨ amnat in l¨ osningar p˚ a del 2 genom att kryssa f¨ or de sista tre uppgifterna.
Om du plussar f¨ or ¨ overbetyg s˚ a skriv detta p˚ a tentamensomslaget.
LYCKA TILL!
1. (a) Antag att A och B ¨ ar h¨ andelser som intr¨ affar med sannolikhet 30% respektive 40%. Sannolikheten att b˚ ade A och B intr¨ affar ¨ ar 15%. Ber¨ akna sannolikheten att varken A eller B intr¨ affar. (1p) (b) Vid tillverkning av detaljer till en maskin ¨ ar felfrekvensen 5%. F¨ or
att begr¨ ansa antalet reklamationer beslutar man att alla detal- jer ska passera en kontroll. Vid denna kontroll kasseras felaktiga detaljer med sannolikheten 92%, och felfria kasseras med sanno- likheten 2%. Du tar en detalj ur h¨ ogen med kasserade detaljer.
Hur stor ¨ ar sannolikheten att den detaljen ¨ ar defekt? (2p) 2. Antag att du slumpar fram v¨ arden fr˚ an en kontinuerlig f¨ ordelning d¨ ar
medianen ¨ ar lika med 16. L˚ at η vara antalet v¨ arden som man beh¨ over slumpa fram f¨ or att f˚ a ett v¨ arde som ¨ ar mindre ¨ an 16. Ber¨ akna san-
nolikheten P (η ≥ 3). (2p)
3. Havsguden Poseidon str¨ or ut sn¨ ackor p˚ a havsbotten s˚ a att antalet sn¨ ackor p˚ a en godtyckligt vald yta blir Poisson-f¨ ordelat. Om det i genomsnitt ligger 0.3 sn¨ ackor per kvadratmeter havsbotten, hur stor
¨
ar d˚ a sannolikheten att det finns h¨ ogst tv˚ a sn¨ ackor p˚ a en slumpm¨ assigt
utvald kvadratmeter? (2p)
4. Den kontinuerliga slumpvariablen ξ har f¨ ordelningsfunktionen
F (x) =
0 om x < 0,
4x 2 om 0 ≤ x ≤ 1/2, 1 om x > 1/2.
(a) Best¨ am sannolikheten P (ξ > 0.25). (1p)
(b) Best¨ am v¨ antev¨ ardet E(ξ). (2p)
5. Majas och Joels utgifter f¨ or kursmaterial (enhet: kr) under en m˚ anad kan ses som oberoende stokastiska variabler. Majas utgifter/m˚ anad kan antas vara normalf¨ ordelade med v¨ antev¨ arde 390 kr och standard- avvikelse 30 kr och Joels utgifter/m˚ anad kan antas vara normalf¨ ordelade med v¨ antev¨ arde 340 kr och standardavvikelse 25 kr.
(a) Vad ¨ ar sannolikheten att deras sammanlagda utgifter under en
m˚ anad ¨ overstiger 810 kr ? (2p)
(b) Vad ¨ ar sannolikheten att Joels utgifter ¨ overstiger Majas under minst tv˚ a av l¨ as˚ arets 8 m˚ anader? (2p) 6. F¨ or att se hur ledningsf¨ orm˚ agan hos en polymer p˚ averkas av tillsatser
av olika metaller g¨ ors en serie f¨ ors¨ ok. I ett visst f¨ ors¨ ok med 8 provbitar fick man f¨ oljande resistanser (enhet: ohm):
i 1 2 3 4 5 6 7 8
x i 56.44 55.91 55.89 56.86 56.57 56.19 56.93 56.42
Fr˚ an teoretiska ¨ overv¨ aganden b¨ or ledningsf¨ orm˚ agan med den aktuel- la metallen vara normalf¨ ordelad med v¨ antev¨ arde 56 ohm, men man misst¨ anker att ledningsf¨ orm˚ agan i genomsnitt blir h¨ ogre ¨ an 56 ohm.
F¨ or att se om det finns st¨ od f¨ or dessa misstankar ska ett hypotestest utf¨ oras d¨ ar man som testvariabel anv¨ ander
t = x − 56 ¯ s/ √
8 , d¨ ar s ¨ ar stickprovsstandardavvikelsen.
Vad blir den kritiska gr¨ ansen f¨ or den testvariabeln om signifikansniv˚ an s¨ atts till 1%? Kan man p˚ ast˚ a att ledningsf¨ orm˚ agan ¨ ar st¨ orre ¨ an 56 ohm p˚ a 1%? signifikansniv˚ a? (F¨ or 2p kr¨ avs r¨ att kritisk gr¨ ans och r¨ att
slutsats - “JA” eller “NEJ”.) (2p)
7. P˚ a ett sjukhus d¨ ar man skickar vissa av sina blodprover till tv˚ a olika laboratorier f¨ or analys ville man utf¨ ora en unders¨ okning f¨ or att testa om laboratorierna m¨ ater likv¨ ardigt. Vid unders¨ okningen tog man ett enda blodprov p˚ a 6 ml fr˚ an en patient och s¨ ande 3 ml var till de tv˚ a laboratorierna, som vart och ett fick g¨ ora 8 oberoende m¨ atningar p˚ a provet. Man antog att m¨ atningarna p˚ a proven kan beskrivas som ob- servationer p˚ a normalf¨ ordelade slumpvariabler. Resultatatet, i kodade enheter, ges nedan:
M¨ atning 1 2 3 4 5 6 7 8
Lab 1 41.42 42.20 41.33 41.19 41.42 41.09 41.22 40.89 Lab 2 41.07 42.09 41.12 41.00 41.95 41.51 42.12 42.39 F¨ or att ber¨ akna ett 95% konfidensintervall f¨ or 4, den genomsnittliga skillnaden mellan Lab 1 och Lab 2, valde man mellan (A): metoden f¨ or “stickprov i par”, (B): metoden f¨ or “tv˚ a stickprov” och (C) ett teckentest.
Vilket (v¨ alj ett) av f¨ oljande alternativ st¨ ammer? Man b¨ or v¨ alja . . .
(1) . . . (A) eftersom antalet m¨ atningar ¨ ar detsamma f¨ or Lab 1 och Lab 2.
(2) . . . (A) eftersom de 8 m¨ atningarna g¨ ors p˚ a samma prov.
(3) . . . (B) eftersom de 8 m¨ atningarna g¨ ors p˚ a samma prov.
(4) . . . (A) eftersom stickprovsstandardavvikelserna inte ¨ ar densamma f¨ or de tv˚ a stickproven.
(5) . . . (C) eftersom m¨ atv¨ ardena antas vara observationer fr˚ an kontinuerliga f¨ ordelningar.
(2p) 8. En Japansk forskare m¨ ater radioaktiv str˚ alning p˚ a en viss plats. An-
talet pulser som forskarens Geiger-Muller r¨ or registrerar under ett
dygn ¨ ar P o(λ)-f¨ ordelat. Konstanten λ, som ¨ ar ok¨ and, ger viktig infor-
mation om m¨ angden radioaktivt material. F¨ or att testa H 0 : λ = 10
mot H 1 : λ > 10 r¨ aknar forskaren antalet pulser under ett dygn och f¨ orkastar H 0 om minst 16 pulser registreras.
Ber¨ akna testets styrka d˚ a λ = 15. (2p)
9. Denna uppgift behandlar borrning av lodr¨ ata h˚ al i berggrunden. En unders¨ okning har gjorts av hur tiden det tar att borra 5 feet (TIME, minuter) varierar med hur djupt borren befinner sig (DEPTH, feet).
M¨ atningen har gjorts med tv˚ a typer av borrar (DRILL) som ¨ ar kodade med en dummyvariabel som ¨ ar 0 eller 1. En regressionsanalys f¨ or 28 observationer, d¨ ar DEPTH ligger i ett intervall mellan 16.01 och 64.31 feet, redovisas i tabell 1.
(a) Ber¨ akna f¨ orklaringsgraden. (1p)
(b) F¨ or att testa om djupet (DEPTH) p˚ averkar borrtiden (TIME) d˚ a borrtyp 1 anv¨ ands s˚ a kan man titta p˚ a en l¨ amplig t-kvot och j¨ amf¨ ora dess absolutbelopp med ett v¨ arde fr˚ an t-tabellen p˚ a sidan 311 i kursboken.
Kan man p˚ a 1% signifikansniv˚ a p˚ ast˚ a att djupet p˚ averkar bor- rtiden d˚ a borrtyp 1 anv¨ ands? Svara med (Ja/Nej) samt v¨ ardet
p˚ a t-kvoten. (2p)
(c) Best¨ am ett 98 %-igt konfidensintervall f¨ or den genomsnittliga f¨ or¨ andringen i borrtid (TIME) d˚ a djupet (DEPTH) ¨ okas fr˚ an 45 till 46 feet och borrtyp 0 anv¨ ands. Svara med den ¨ ovre gr¨ ansen. (2p)
Tabell 1: Regression Analysis: TIME versus DEPTH; DRILL The regression equation is
TIME = 3,07 + 0,122 DEPTH + 4,93 DRILL
Predictor Coef SE Coef T P
Constant 3,0676 0,5553 ? ?
DEPTH 0,12160 0,01349 ? ?
DRILL 4,9301 0,2809 ? ?
S = ? R-Sq = ? R-Sq(adj) = ?
Analysis of Variance
Source DF SS MS F P
Regression ? 237,06 118,53 218,14 0,000 Residual Error ? 13,58 0,54
Total ? ?
Slut p˚ a del 1. Gl¨ om inte att bifoga svarsbladet med tentan!
Tabell f¨ or svar till del 1
Riv ut och l¨ agg svarsbladet f¨ orst i tentamen
Namn: . . . . Personnummer: . . . .
Fr˚ aga Svar Po¨ ang
1 a Sannolikhet (procent, tv˚ a decimaler) 45.00 1 b Sannolikhet (procent, tv˚ a decimaler) 70.77 2
2 Sannolikhet (tv˚ a decimaler) 25.00 2
3 Sannolikhet (procent, tv˚ a decimaler) 99.64 2
4 a Sannolikhet (procent, tv˚ a decimaler) 75.00 1
b V¨ antev¨ arde (tv˚ a decimaler) 0.33 2
5 a Sannolikhet (procent, tv˚ a decimaler) 2.02 (1 − Φ(2.05)) 2 b Sannolikhet (procent, tv˚ a decimaler) 18.69 (P (ξ ≥ 2) d¨ ar
ξ ∈ Bin(8, 0.1). Svar som f˚ atts med exakt p i Bin(8, p) ocks˚ a OK)
2
6 Kritisk gr¨ ans (tre decimaler) 2.998
JA elle NEJ NEJ (ty t = 2.91) 2
7 1,2,3,4 eller 5 3 2
8 Styrka (procent, tv˚ a decimaler) 43.19 2
9 a F¨ orklaringsgrad (%, en decimal) 94.6 1
b t-kvot (tv˚ a decimaler) 9.01
JA eller NEJ JA 2
c Ovre gr¨ ¨ ans (fyra decimaler) 0.1551 2
Totalt antal po¨ ang 25
Vid bed¨ omningen av l¨ osningarna av uppgifterna i del 2 l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. T¨ ank p˚ a att noga redovisa inf¨ orda beteckningar och eventuella antaganden.
10. En fiskares v¨ antetider mellan napp (napp betyder att en fisk fastnar p˚ a kroken) antas vara oberoende och Exponentialf¨ ordelade v¨ antev¨ arde 10 minuter. Ber¨ akna sannolikheten att fiskaren lyckas f˚ a ˚ atminstone
40 napp p˚ a fem timmar. V¨ almotiverade approximationer godtas. (10p) L¨ osningsskiss: L˚ at ξ 1 , ξ 2 , . . . vara v¨ antetiderna (i minuter) mellan
napp. S¨ okt ¨ ar P (ξ ≤ 300), d¨ ar
ξ =
40
X
j=1
ξ j
¨ ar den tid det tar att f˚ a 40 napp. Enligt CGS har vi ξ ∈ N (40µ, √ 40σ) approximativt, d¨ ar µ = σ = 10. Det ger P (ξ ≤ 300) ' 0.06.
11. Maria och Helena ¨ ar b˚ ada pingisspelare. Maria tycker att hon ¨ ar b¨ attre
¨ an Helena, och funderar p˚ a hur hon skall visa sin tr¨ anare att sanno- likheten att hon vinner ¨ ar st¨ orre ¨ an sannolikheten att Helena vinner ett av deras inb¨ ordes m¨ oten.
F¨ oresl˚ a en l¨ amplig statistisk metod som Maria kan anv¨ anda. Metoden skall baseras p˚ a resultatet i de tr¨ aningsmatcher som Maria och Helena
kommer att spela och ha en signifikansniv˚ a p˚ a h¨ ogst 5 %. (12p) L¨ osningsskiss: L˚ at p vara sannolikheten att Maria vinner en match
mot Helena. Maria b¨ or st¨ alla upp ett hypotestest av H 0 : p = 0.5 mot H 1 : p > 0.5. Hon kan sedan utg˚ a fr˚ an resultatet i l˚ at oss s¨ aga 10 tr¨ aningsmatcher och f¨ orkasta H 0 om ξ ¨ ar stort, ξ ≥ k, d¨ ar ξ ¨ ar antalet vunna matcher. Eftersom ξ ∈ Bin(10, 0.5) d˚ a H 0 ¨ ar sann ger k = 8 ett test med 5.5 % signifikansniv˚ a och k = 9 ger ett test med 1% signifikansniv˚ a.
12. Vi forts¨ atter med problemet fr˚ an uppgift 9 p˚ a del 1. F¨ or att unders¨ oka
om djupets effekt p˚ a borrtiden skiljer sig mellan borrtyp 0 och 1 la man
till produkten av DEPTH och DRILL som ny f¨ orklarande variabel i
modellen. Resultatet av regressionsanalysen ges i tabell 2 nedan.
Tabell 2: Regression Analysis: TIME versus DEPTH; DRILL; DEPTH*DRIL The regression equation is
Y2 = 4,79 + 0,0768 DEPTH + 2,50 DRILL + 0,0621 DEPTH*DRILL
Predictor Coef SE Coef T P
Constant 4,7904 0,9330 5,13 0,000 DEPTH 0,07682 0,02378 3,23 0,004 DRILL 2,497 1,128 2,21 0,037 DEPTH*DRILL 0,06206 0,02799 2,22 0,036
S = 0,685423 R-Sq = 95,5% R-Sq(adj) = 94,9%
Source DF SS MS F P
Regression 3 239,370 79,790 169,84 0,000 Residual Error 24 11,275 0,470
Total 27 250,645
(a) Ange fullst¨ andigt modellantagande f¨ or modellen som analyserats i tabell 2. Baserat p˚ a (de standardiserade) residualplottarna nedan, anser du att modellantagandena ¨ ar rimliga? (2p) (b) Kan man p˚ a 5 % signifikansniv˚ a p˚ ast˚ a att effekten av djupet
p˚ a borrtiden i genomsnitt ¨ ar l¨ angre f¨ or borrtyp 1? Formulera ett l¨ ampligt hypotestest, d¨ ar hypoteser, testvariabel och slutsats framg˚ ar tydligt, samt best¨ am P-v¨ ardet f¨ or testet. (6p) Kommentar: Det skulle ha st˚ att “...djupet p˚ a borrtiden i genomsnitt
¨ ar st¨ orre f¨ or borrtyp 1?”
L¨ osningsskiss: (a) Modellantagandet ¨ ar
Y i = β 0 + β 1 X 1,i + β 2 X 2,i + β 3 X 3,i + i
f¨ or
16.01 ≤ X 1 ≤ 64.31, X 2 = 0, 1,
d¨ ar Y = TIME, X 1 = DEPTH, X 2 = DRILL, X 3 = X 1 · X 2 , och d¨ ar
1 , . . . , 28 ¨ ar oberoende och N (0, σ)-f¨ ordelade. Residualplottarna ser bra ut.
(b) Om X 2 = 0 har vi
E(Y ) = β 0 + β 1 X 1
medan
E(Y ) = β 0 + β 2 + (β 1 + β 3 )X 1
om X 2 = 1. Att effekten ¨ ar st¨ orre f¨ or borrtyp 1 ¨ ar d¨ arf¨ or samma
sak som att β 3 > 0. F¨ or att testa H 0 : β 3 = 0 mot den ensidiga
mothypotesen H 1 : β 3 > 0 anv¨ ands t-kvoten b 3 /s b3 och beslutsregeln
f¨ orkasta H 0 om t-kvoten (utan absolutbelopp) ¨ ar minst t 0.05 (24) =
1.711. Det oberverade v¨ ardet ¨ ar 2.11 s˚ a H 0 f¨ orkastas, effekten ¨ ar st¨ orre
2 1 0 -1 -2 99 90 50 10 1
Standardized Residual
Percent
16 14 12 10 8 2 1 0 -1 -2
Fitted Value
Standardized Residual
1 0 -1 -2 8 6 4 2 0
Standardized Residual
Frequency
28 26 24 22 20 18 16 14 12 10 8 6 4 2 2 1 0 -1 -2
Observation Order
Standardized Residual
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for TIME
70 60 50 40 30 20 10 2
1
0
-1
-2
-3
DEPTH
Standardized Residual
Residuals Versus DEPTH (response is TIME)
70 60 50 40 30 20 10 2
1
0
-1
-2
-3
DEPTH
Standardized Residual
Residuals Versus DEPTH (response is TIME)