• No results found

Tentamen i Matematisk statistik Ämneskod-linje S0001M Poäng totalt för del 1 Poäng totalt för del 2 25 (8 uppgifter) 30 (3 uppgifter) Tentamensdatum 2010-03-26 Lärare:

N/A
N/A
Protected

Academic year: 2021

Share "Tentamen i Matematisk statistik Ämneskod-linje S0001M Poäng totalt för del 1 Poäng totalt för del 2 25 (8 uppgifter) 30 (3 uppgifter) Tentamensdatum 2010-03-26 Lärare:"

Copied!
13
0
0

Loading.... (view fulltext now)

Full text

(1)

Poäng totalt för del 2 30 (3 uppgifter) Lärare:

Erland Gadde Adam Jonsson Lennart Karlberg Mikael Stenlund Kerstin Vännman

Skrivtid 09.00-14.00

Jourhavande lärare: Adam Jonsson Tel: ankn 1948, mobil 076-6317460

Tillåtna hjälpmedel:

• Räknedosa

• Kursboken Vännman: Matematisk statistik

• Kursmaterialet Vännman: Regressionsanalys

• Kursmaterialet ”Några ofta förekommande fördelningar”

• Tabeller

Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, ska enbart svar lämnas in, men lösningar får bifogas. Observera dock att dessa kommer ej att bedömas utan enbart användas vid gränsfall för att avgöra om någon upp- gift kan ”rättas upp” på grund av slarvfel. På del 1 ges inga delpoäng på uppgifterna.

Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Detta blad måste lämnas in. Lägg detta blad först bland lösningarna. Om inte det ifyllda svarsbladet har lämnats in så bedöms tentamen som underkänd. För godkänt krävs minst 19 poäng på del 1. Med 4 extrapoäng från laborationerna och KGB så räcker det med 15 poäng av de 25 möjliga för godkänt.

På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resone- mangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motive- rade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den för- sta obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg.

OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen.

Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för uppgifterna 9, 10 eller 11.

Om du plussar för överbetyg så skriv detta på tentamensomslaget.

LYCKA TILL!

(2)
(3)

1. Lars skriver tre tentor på fyra dagar. Han räknar med att händelserna att klara de olika tentorna är oberoende av varandra och uppskattar sannolikheten att klara tentorna till 0.40, 0.60 respektive 0.85.

a) Beräkna sannolikheten att Lars klarar åtminstone en av de tre tentorna.

Ange ditt svar i procent med en decimal. (1p) b) Beräkna sannolikheten att Lars klarar exakt två av de tre tentorna. Ange

ditt svar i procent med en decimal. (2p)

2. Skidskytten Björn träffar 95% av alla skott han skjuter. Anta, även om det kan- ske är orealistiskt, att händelserna för träff vid varje skott är oberoende av var- andra. Vad är sannolikheten att Björn träffar med minst fyra skott i en skjutom- gång på fem skott? Ange ditt svar i procent med två decimaler. (2p)

3. Antalet kunder som kommer till Lisas närbutik mellan klockan 14 och 15 på vardagseftermiddagar antas vara en Poissonfördelad stokastisk variabel ξ. Erfa- renheten har visat att väntevärdet för ξ är 11.0.

a) Vad är standardavvikelsen för ξ? Ange ditt svar med en decimal. (1p) b) Vad är sannolikheten för att det kommer minst sex kunder till Lisas närbu-

tik nästa måndag mellan klockan 14 och 15? Ange ditt svar i procent med

två decimaler. (2p)

4. I en paketeringsmaskin avdelas margarinpaket så att vikten kan beskrivas med en normalfördelning med väntevärdet 500 g och standardavvikelsen 3 g.

a) Hur stor är sannolikheten att ett margarinpaket väger minst 495 g? Ange

ditt svar i procent med en decimal. (2p)

b) Bestäm d så att i det långa loppet 80 % av alla margarinpaket har en vikt mellan 500 – d och 500 + d. Ange ditt svar med två decimaler. (2p)

5. Vissa tillverkade byggnadselement kan antas ha en längd, i cm, som är (25, 0.65)

N -fördelad. Man lägger 20 slumpmässigt valda element intill var- andra utan fogar. Hur stor är sannolikheten att den sammanlagda längden över- stiger 505 cm? Ange ditt svar i procent med en decimal. (2p)

6. Familjen Bohnsack på Skurholmen i Luleå har mätt temperaturen kl 8.00 varje morgon och kommit fram till att februaris medeltemperatur i grader Celsius un- der de sex senaste åren 2005-2010 är enligt följande temperaturserie.

–7.5, –9.9, –13.4, –4.7, –12.5, –15.4

Anta att medeltemperaturen är normalfördelad och att observationsvärdena är oberoende. Beräkna ett 90% konfidensintervall för den förväntade februaritem- peraturen. Ange den övre gränsen med två decimaler. (2p)

(4)

7. Utsläppet av koldioxid (CO2) per km från bilar är viktigt att ha kontroll på.

a) En biltillverkare påstår att bilar av modell A släpper ut ett förväntat värde av 100 g CO2 per km. Man gör ett stickprov på 6 bilar av modell A och mäter CO2 per km med följande resultat (enhet: g)

98.0, 97.0, 99.0, 100.0, 101.0, 99.0.

Anta att mätvärdena kommer från en normalfördelning N( , )  , där både

 och  är okända. För att undersöka om biltillverkaren kan ha fel vill man konstruera ett hypotestest med dubbelsidig mothypotes baserat på testvariabeln

100 / 6 t x

s

 

på 1% signifikansnivå. Bestäm de kritiska gränserna som denna testvariabel ska jämföras med för att man ska kunna besluta om nollhypotesen kan för- kastas. Ange den nedre av de två gränserna i svaret. Ange ditt svar med tre

decimaler. (1p) b) Biltillverkaren påstår även att bilmodell B släpper ut 100 g CO2 per km.

Man misstänker dock att modell B släpper ut mer än denna mängd. För att undersöka om misstanken kan påvisas, konstruerar man ett test på 1% sig- nifikansnivå, där testvariabeln är medelvärdet av CO2-värden från 10 bilar. Mätvärdena för CO2 per km från bilmodell B antas vara ( , 2)N  - fördelad. Ange nollhypotesen H0 och mothypotesen H1 för testet. (1p) c) Vad är styrkan i testet i b) om det sanna väntevärdet  är 102.5 g CO2 per

km? Ange ditt svar i procent med en decimal. (2p)

8. Vid en undersökning studerades hur livslängden, Y, hos borrmaskiner kunde relateras till maskinens maxhastighet, X1, och typ, X2. Två olika maskintyper, A och B, förekommer där X2 för maskintyp A och 0 X2 för maskintyp B. 1 Man gjorde 20 observationer på livslängden, maxhastigheten samt maskintyp.

Man gjorde sedan en multipel regressionsanalys med X och 1 X2 som förkla- rande variabler och fick följande resultat.

Regression Analysis: Y versus X1; X2

The regression equation is Y2 = 19,3 - 2,66 X1 + 7,50 X2

Predictor Coef SE Coef T P Constant 19,263 1,755 10,97 0,000 X1 -2,6607 0,4520 -5,89 0,000 X2 7,5021 0,6798 11,04 0,000 Analysis of Variance

Source DF SS MS F P Regression 2 354,51 177,25 76,75 0,000 Residual Error 17 39,26 2,31

Total 19 393,77

(5)

a) Beräkna residualspridningen för den skattade modellen. Ange ditt svar

med tre decimaler. (1p)

b) Beräkna ett dubbelsidigt 99 % konfidensintervall för den förväntade skillnaden mellan livslängden för en maskin av typ B och livslängden för en maskin av typ A. Ange den övre gränsen i intervallet med två decima-

ler. (2p)

c) Man valde att utöka modellen ovan genom att föra in samspelstermen

3 1 2

XX X. Analysen ges i MINITAB utskriften nedan. Ett hypotestest ska genomföras för att avgöra om man på 1% signifikansnivå kan påstå att maxhastighetens effekt på livslängden är olika för de två olika maskin- typerna. Beräkna värdet på den testvariabel som ska användas för detta

test. Ange ditt svar med två decimaler. (2p)

Regression Analysis: Y versus X1; X2; X3

Predictor Coef SE Coef Constant 17,157 2,317 X1 -2,0970 0,6074 X2 11,985 3,384 X3 -1,1944 0,8842 Analysis of Variance

Source DF SS MS F P Regression 3 358,53 119,51 54,25 0,000 Residual Error 16 35,24 2,20

Total 19 393,77

Slut på del 1. Glöm inte att bifoga svarsbladet med tentan!

(6)
(7)

Tabell för svar till del 1.

Riv ut och lägg svarsbladet först i tentamen!

Namn...

Personnummer ...

Fråga Svar Poäng

1 a Sannolikhet 96,4 % 1

b Sannolikhet 47,8 % 2

2 Sannolikhet 97,74 % 2

3 a Standardavvikelse 3,3 1

b Sannolikhet 96,25 2

4 a Sannolikhet 95,2 % 2

b d 3,84 2

5 Sannolikhet 4,3 % 2

6 Övre gräns -7,29 2

7 a Nedre gräns -4,032 1

b Hypoteser H0: μ=100 H1: μ>100 Anm: (H0: μ≤100 godtas.)

1

c Styrka 94,8 2

8 a Residualspridning 1,520 1

b Övre gräns 9,47 2

c Testvariabel -1,35

Anm: 1,35 godtas.

2

Totalt antal poäng 25

Lycka till!

(8)
(9)

Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden.

9. Ledningsgruppen på ett mobiltelefonföretag överväger att öppna en butik i ett samhälle med 10 000 personer. Av stor betydelse för deras beslut är det totala antalet mobiltelefoner om tre månader, vilket är den tid det skulle dröja innan butiken öppnar. Som beslutsunderlag används b.la. det värde, säg T, för vilket gäller att det totala antalet mobiltelefoner överstiger T med 90% sannolikhet.

Vid beräkningarna kan man utgå ifrån att antalet mobiltelefoner i hushållen är oberoende av varandra samt följande sannolikhetsfördelning för antalet mobil- telefoner om tre månader i ett godtyckligt valt hushåll:.

Antal mobiltelefoner 0 1 2 3

Sannolikhet 0.1 0.3 0.5 0.1

Hjälp mobiltelefonföretaget att bestämma T. (8p)

Anm. Det skulle ha stått ”i ett samhälle med 10 000 hushåll”.

Lösning: Låt ξ vara det totala antalet mobiltelefoner i samhället om tre månader. T är det tal som uppfyller P(  T)0.9. För att kunna beräkna T behöver vi veta fördelningen för ξ. Fördelningen kan approximeras med hjälp av centrala gränsvärdessatsen (CGS): låt ξ1,…, ξn vara antalet mobiltelefoner i de olika hushållen om tre månader, där n=10000. Vi tolkar den givna informationen som att ξ1,…, ξn är oberoende och var för sig har den diskreta fördelning som ges i tabellen, vars väntevärde och varians beräknas till μ=1,6 och σ2=0,64. Enligt gäller att ( , 2) (16000,80)

1

N n

n N

n i

i   

eftersom vi summerar ett stort antal oberoende slumpvariabler med samma fördelning. Der betyder att T skall uppfylla

80 ) 16000 (

80 ) 16000 80

16000 (

) ( 9 .

0        T

T P P

T

P    , där

) 1 , 0 (

N

 . Vi måste alltså ha 80 16000

T =-1.282. Då vi löser ekvationen ovan får vi T =15897,6. Svar: T =15897.

10. En grupp trafiksäkerhetsexperter studerar förbipasserande bilars hastigheter vid ett farligt ställe på en viss väg. Av särskild betydelse för arbetet med trafik- säkerhet är den hastighet som 75% av bilarna förväntas understiga, d v s den tredje kvartilen, q3, i hastighetsfördelningen. Man vill uppskatta den tredje kvartilen q3 genom att bilda ett lämpligt konfidensintervall för q3. Experterna anser sig inte kunna göra några andra antaganden om hastighetsfördelningen än att den är kontinuerlig. Man beslutar sig därför för att använda ett teckeninter- vall, som är baserat på ordningsvärden, och resonerar på följande sätt för att be- stämma intervallet. Man kommer att observera hastigheten hos 20 slumpmäs- sigt utvalda bilar. Eftersom det är den tredje kvartilen man är intresserad av så tänker man använda intervall vars gränser består av någon av de 10 största observationsvärdena. Man bestämmer sig för att använda något av de tre inter-

(10)

vallen Ik [ (11xk x), (20k)],k0,1, 2, där x(1)x(2) ... x(20) är det ordnade observerade stickprovet.

a) Beräkna konfidensgraden för intervallet I . (9p) 0

b) Experterna enas om att en konfidensgrad på 90 % är lämplig. Vilket av konfidensintervallen I I0, och 1 I bör de använda, d v s vilket intervall har 2

konfidensgrad närmast 90 %? (3p)

Lösning: Låt η vara antalet mätningar som ger en lägre hastighet än q3. Enligt avsnitt 3.2.3 har vi Bin(20,0.75). (Ett ”lyckat försök” är händelsen att hastigheten understiger q3.)

a) Konfidensgraden för I0 är sannolikheten att intervallet täcker q3. Vi behöver lista ut för vilka värden på η som I0 täcker q3. Vi resonerar enligt följande: Den undre gränsen för intervallet I0, dvs. x(11), kommer att ligga till vänster om q3

om och endast om η≥11. Den övre gränsen för intervallet I0, dvs. x(20), kommer att ligga till höger om q3 om och endast om η≤19. Således täcker intervallet q3 precis då 11≤η≤19. För att beräkna P(11≤η≤19) så kan vi använda att ξ= 20-η är Bin(20,0,25)-fördelad. (Se sidan 302 i kursboken.) Konfidensgraden för I0 blir P(11≤η≤19)=P(1≤ ξ ≤9)=0,9861-0,0032=0,9829.

Anmärkning: Metoden togs upp på Lektion 11 för teckenintervall för medianen.

b) Samma resonemang som ovan ger att intervallet Ik täcker q3 precis då 11+k≤η≤19-k. Konfidensgraden Ck för Ik är därför P(11k19k)= P(1+k≤ ξ ≤9-k). Binomialfördelningstabellen på sid. 306 ger C1=0,9348, C2=0,8069. Det intervall som är mest lämpligt, dvs. vars konfidensgrad ligger närmast 90 %, är därför I1.

(11)

11. I en artikel i Electronic Packaging and Production (2002) undersöktes effekten av röntgeninspektion av IC-kretsar. Stråldosen (i enheten 10 mGy) studerades som en funktion av ström (i enheten milliampere) och exponeringstid (i enheten sekunder). Datamaterialet presenteras i tabell 1.

a) Det ansågs att exponeringstiden borde ha stor påverkan på stråldosen så först gjordes en enkel regressionsanalys med enbart exponeringstiden som förklarande variabel. Resultatet framgår av tabell 2. Ange det modellanta- gande som ligger till grund för analysen i tabell 2. Uppskatta effekten av exponeringstiden på stråldosen genom att beräkna ett lämpligt 95% konfi- densintervall och också tolka resultatet i ord. (4p) b) Sedan infördes även strömmen som förklarande variabel genom en multi-

pel regressionsanalys. Resultatet framgår av tabell 3. Var det värt att ta med även strömmen i modellen? Besvara frågan genom att jämföra två lämpliga storheter och även göra ett lämpligt test på 1% signifikansnivå. I testet ska hypoteser, testvariabel, beslutsregel samt slutsats tydligt framgå. (4p) c) Ange modellantagandet som gäller för analysen i uppgift b). Residualana-

lys är ett viktigt instrument för att undersöka giltigheten i de antaganden som gjorts om modellen. I figur 1 ges en plot över de studentiserade resi- dualerna mot variabeln ström från analysen i b). Vilken del av modellan- tagandena kan undersökas med denna plott? Finns det något problem med plotten som tyder på ett felaktigt modellantagande? I så fall, vad är det

som kan misstänkas vara fel? (2p)

Tabell 1. Stråldos (10 mGy), ström (milliampere) och exponeringstid (sekunder) för studien.

stråldos ström exp tid stråldos ström exp tid

7.4 10 0.25 177.6 20 3.00

14.8 10 0.50 592.0 20 10.00 29.6 10 1.00 888.0 20 15.00 59.2 10 2.00 1184.0 20 20.00 88.8 10 3.00 22.2 30 0.25 296.0 10 10.00 44.4 30 0.50 444.0 10 15.00 88.8 30 1.00 592.0 10 20.00 177.6 30 2.00

11.1 15 0.25 266.4 30 3.00

22.2 15 0.50 888.0 30 10.00 44.4 15 1.00 1332.0 30 15.00 88.8 15 2.00 1776.0 30 20.00 133.2 15 3.00 29.6 40 0.25 444.0 15 10.00 59.2 40 0.50 666.0 15 15.00 118.4 40 1.00 888.0 15 20.00 236.8 40 2.00

14.8 20 0.25 355.2 40 3.00

29.6 20 0.50 1184.0 40 10.00 59.2 20 1.00 1776.0 40 15.00 118.4 20 2.00 2368.0 40 20.00

(12)

Tabell 2

Regression Analysis: stråldos versus exp tid

The regression equation is stråldos = 0.0 + 68.1 exp tid

Predictor Coef SE Coef T P Constant 0.00 67.21 0.00 1.000 exp tid 68.080 6.991 9.74 0.000

S = 314.433 R-Sq = 71.4% R-Sq(adj) = 70.6%

Analysis of Variance

Source DF SS MS F P Regression 1 9375325 9375325 94.83 0.000 Residual Error 38 3756985 98868

Total 39 13132310

Tabell 3

Regression Analysis: stråldos versus exp tid; ström

The regression equation is

stråldos = - 440 + 68.1 exp tid + 19.1 ström

Predictor Coef SE Coef T P Constant -440.39 94.20 -4.68 0.000 exp tid 68.080 5.241 12.99 0.000 ström 19.147 3.460 5.53 0.000 S = 235.718 R-Sq = 84.3% R-Sq(adj) = 83.5%

Analysis of Variance

Source DF SS MS F P Regression 2 11076473 5538237 99.67 0.000 Residual Error 37 2055837 55563

Total 39 13132310

ström

Standardized Residual

40 35

30 25

20 15

10 3 2 1 0 -1 -2 -3

Residuals Versus ström (response is stråldos)

Figur 1. Residualerna från den skattade modellen i tabell 2 plottade mot den förklarande variabeln ström.

(13)

Lösning: Lösning till uppgift 11 kommer inom kort.

References

Related documents

Ekonomin är i långsiktig jämvikt, en ny regering har just tillträtt, och den nya finansministern anser att regeringen ska ha en offensiv politik för att uppnå högre tillväxt

Det är inte alltid att du uppmanas i frågan att förklara dina svar, dock är en verbal förklaring, oftast med hjälp av diagram, nödvändig i de allra flesta fall för att kunna

Visar säkerhet i problemlösning och beräkningar visa stor säkerhet i sitt problemlösningsarbete och beräkningar även med matematiska symboler Formulerar och utvecklar

Visar säkerhet i problemlösning och beräkningar Formulerar och utvecklar problem, använder generella strategier vid problemlösning. Tolkar och analyserar resultat, jämför

Där framgår även vilka kunskapsnivåer (E, C och A) du har möjlighet att visa. Till uppgifter där Endast svar krävs behöver du endast ge ett kort svar. Till övriga uppgifter

F¨ or betyg 5 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 23 po¨ ang fr˚ an den andra delen f¨ or ¨

(c) Ett l¨ampligt s¨att att ˚ask˚adligg¨ora sambandet mellan dessa variabler ¨ar att g¨ora ett diagram med tv˚a boxplottar: en boxplot f¨or gruppen som inte f˚att p˚aminnelser

( Vi anser att systemet fungerar om det finns minst en fungerande väg mellan punkterna A och