LULE ˚ A TEKNISKA UNIVERSITET Amneskod ¨ S0002M Institutionen f¨or matematik Datum 2009-06-05
Skrivtid 0900–1400
Tentamen i: Statistik AI 15 hp
Antal uppgifter: 6
Krav f¨or G: 12
L¨arare: Robert Lundqvist, tel 49 24 04
Jour: Robert Lundqvist, tel 49 24 04
Resultatet ansl˚as senast: 26/6 2009
Till˚atna hj¨alpmedel:
• En statistikbok. Undantag: kombinationen Praktisk statistik/R¨akna med slumpen
• Minir¨aknare
T¨ank p˚a att redovisa dina l¨osningar p˚a ett klart och tydligt s¨att. Endast det nume- riska svaret r¨acker inte f¨or full po¨ang. Korrekt l¨osning ger det po¨angantal som st˚ar angivet efter uppgiftstexten.
LYCKA TILL!
Tentamen i Statistik AI, S0002M, 2009-06-05
Tentamen i Statistik AI, S0002M, 2009-06-05
1. N¨ar st˚albalkar tillverkas ska balkarna sk¨aras av till en best¨amd l¨angd. Det
¨ar viktigt att h˚alla avvikelserna s˚a sm˚a som m¨ojligt. En kort balk kan g¨ora att kundens anv¨andning f¨orsv˚aras och en l˚ang balk inneb¨ar att kunden f˚ar material utan kostnad. D¨arf¨or m¨ats avvikelserna fr˚an best¨alld l¨angd, och f¨or en viss dagsproduktion s˚ag avvikelserna ut p˚a f¨oljande s¨att (enhet: cm):
0.032 0.027 0.015 0.037 0.037 0.021 0.014 0.015 0.028 0.013 0.015 0.031 0.036 0.010 0.044 0.022 (a) Beskriv materialet i ett l¨ampligt stambladdiagram.
(b) Beskriv materialet med en boxplot. Ber¨akna ocks˚a gr¨anserna f¨or ute- liggare med g¨angse q
1−1.5(q
3−q
1), q
3+1.5(q
3−q
1). Om uteliggare finns ska boxplotten visa dessa p˚a sedvanligt s¨att.
(c) Best¨am ett 90% konfidensintervall f¨or genomsnittlig avvikelse. Ange tydligt vilka f¨ordelningsantaganden detta intervall grundar sig p˚a.
(d) Om du antar att det under en f¨oljd av 5 dagar g¨ors ber¨akningar av s˚adana 90% konfidensintervall, hur stor ¨ar d˚a sannolikheten att minst ett av intervallen inte tr¨affar den genomsnittliga avvikelsen? Ange tyd- ligt de f¨ordelningsantaganden dina ber¨akningar grundar sig p˚a. (8p) 2. I samma tillverkningsprocess har det visat sig att tiden f¨or att kapa balkarna
¨ar l˚ang och att det kan finnas m¨ojligheter att tj¨ana in en hel del om den tiden g˚ar att korta. Du ska delta i utredningen om m¨ojliga f¨orb¨attringar, och din f¨orsta uppgift blir att ta fram n˚agra viktiga m˚att f¨or processen.
(a) Det har visat sig rimligt att beskriva tiden f¨or kapning med en nor- malf¨ordelning d¨ar genomsnittet ¨ar 1.2 minuter och standardavvikel- sen ¨ar 0.06 minuter. Hur stor andel av tiderna kommer under dessa f¨oruts¨attningar att bli l¨angre ¨an 1.3 minuter?
(b) Vad ska det vara f¨or genomsnittstid om 5% av tiderna ska vara l¨angre
¨an 1.25 minuter? Utg˚a fr˚an att standardavvikelsen ¨ar lika stor som i f¨oruts¨attningarna till de f¨oreg˚aende uppgifterna.
I dina l¨osningar ska det givetvis vara s˚a att inf¨orda beteckningar ska f¨or-
klaras tydligt. (4p)
3. I en branschtidning har man testat ett antal ¨overvakningskameror. H¨alften
har en viss typ av filformat, den andra h¨alften ett annat format. Bildkvalite-
ten har granskats med en standardiserad m¨atmetod d¨ar resultaten uttrycks i
procent. Enhet f¨or priset var i dollar. I nedanst˚aende tabell ges resultaten f¨or
de 30 testade kamerorna:
Tentamen i Statistik AI, S0002M, 2009-06-05
Kamera Bild- Pris Fil- Kamera Bild- Pris Fil-
kvalitet format kvalitet format
1 94 350 A 16 88 410 B
2 91 280 A 17 83 285 B
3 88 285 A 18 82 460 B
4 88 260 A 19 80 280 B
5 87 360 A 20 80 280 B
6 86 360 A 21 80 280 B
7 86 375 A 22 79 375 B
8 85 200 A 23 78 520 B
9 83 395 A 24 78 210 B
10 82 300 A 25 77 370 B
11 82 240 A 26 77 250 B
12 80 350 A 27 76 330 B
13 80 275 A 28 74 270 B
14 79 400 A 29 71 250 B
15 79 379 A 30 71 300 B
(a) Om bildkvalitet ¨ar den beroende variabeln och pris den f¨orklarande f˚ar man f¨oljande resultat med regressionsanalys:
ˆ
y = 79.6 + 0.0056 · x
Kan koefficienterna i denna modell ges meningsfulla skattningar? Om s˚a ¨ar fallet, ge s˚adana skattningar. Om det inte g˚ar, motivera d˚a detta.
(b) Vad blir genomsnittlig bildkvalitet f¨or kameror som kostar 400 dollar?
(c) Om man i modellen ¨aven tar med filformat f˚as f¨oljande resultat i reg- ressionsanalysen:
ˆ
y = 81.8 + 0.0089 · x
1− 6.495 · x
2d¨ar y ¨ar bildkvalitet, x
1¨ar pris och x
2¨ar formatet (s¨atts till 0 om det
¨ar en kamera som ger format av typ A och 1 om formatet ¨ar av typ B). Kan koefficienten f¨or format ges meningsfull tolkning? Om s˚a ¨ar fallet, ge s˚adan tolkning. Om det inte g˚ar, motivera d˚a detta. (4p) 4. I en unders¨okning av hush˚allens f¨orv¨antningar om den framtida ekonomin
ingick fr˚agor om bland annat f¨oljande:
• ˚Alder
• K¨on
Tentamen i Statistik AI, S0002M, 2009-06-05
• Har du t¨ankt r¨osta i EU-valet? Svarsalternativ: Ja, Nej eller Vet ej.
• Vad tror du om din egen ekonomi under det kommande ˚aret? Svars- alternativ: Min ekonomi kommer att bli b¨attre, Min ekonomi kommer att vara of¨or¨andrad, Min ekonomi kommer att vara s¨amre eller Vet ej.
(a) Ge f¨orslag p˚a hur resultaten fr˚an fr˚agan om EU-valet ska beskrivas grafiskt.
(b) Ge f¨orslag p˚a hur sambandet mellan k¨on och fr˚agan om den egna eko- nomin ska beskrivas grafiskt.
(c) Ge f¨orslag p˚a hur sambandet mellan ˚alder och k¨on kan beskrivas gra-
fiskt. (3p)
I dessa uppgifter ska du utg˚a fr˚an att ”r˚adata” ska kunna anv¨andas, dvs ing- en bearbetning i form av grupperingar eller ber¨akningar ska beh¨ova g¨oras annat ¨an m¨ojligen att r¨akna fram l¨ages- eller spridningsm˚att baserade p˚a ordningsv¨arden.
5. (a) I en unders¨okning av vad medborgarna i en viss kommun tycker om privatiseringar av kommunal verksamhet ska ett slumpm¨assigt urval g¨oras. T¨ank dig att du med ”medborgare” menar r¨ostber¨attigad person som bott stadigvarande i kommunen de senaste tv˚a ˚aren, en population som best˚ar av 45 000 personer i den aktuella kommunen. Du ska g¨ora ett slumpm¨assigt urval p˚a 200 personer bland dessa. Till din hj¨alp har du en slumptalstabell. Vad mer beh¨ovs f¨or att g¨ora urvalet? G¨or en kortfattad beskrivning av hur du g˚ar till v¨aga. (2p) 6. Du har f˚att i uppdrag av en upphandlingsavdelningen inom f¨oretaget att se om det finns skillnader mellan tv˚a tryckeriers pris p˚a en viss typ av stan- dardtj¨anster. F¨or att f˚a en r¨attvis j¨amf¨orelse tas 8 olika underlag ut, varefter de skickas till tryckerierna f¨or att f˚a en kostnadsber¨akning. I nedanst˚aende tabell ges pris per enhet (i kronor) f¨or de olika underlagen:
Underlag 1 2 3 4 5 6 7 8
Tryckeri 1 17.7 19.4 16.5 17.3 15.6 16.1 19.7 18.6 Tryckeri 2 18.9 20.3 18.2 16.8 17.1 16.8 20.6 18.9
Finns det n˚agon signifikant genomsnittlig skillnad mellan tryckeriernas pri- ser per enhet? Besvara fr˚agan genom att best¨amma ett l¨ampligt 95% konfi- densintervall. I dina svar ska det ocks˚a framg˚a l¨ampliga hypoteser. Resulta-
tet ska f¨orklaras tydligt i ord. (4p)
Svar till tentamen i Statistik 1, S0002M, 2009-06-05
1. (a) Materialet best˚ar av uppm¨atta avvikelser fr˚an best¨amd l¨angd f¨or totalt 16 st˚albalkar. Ett stambladdiagram f¨or dessa avvikelser kan se ut p˚a f¨oljande s¨att:
The decimal point is 2 digit(s) to the left of the | 1 | 034555
2 | 1278 3 | 12677 4 | 4
H¨ar ska som det anges i diagrammet v¨arden tolkas som att 1|0 st˚ar f¨or v¨ardet 0.010.
(b) Med 16 v¨arden ges medianen av medelv¨ardet av 8:e och 9:e v¨ardet i storleksordning, dvs (0.022 + 0.027)/2 = 0.0245. Med 8 v¨arden i respektive halva ges undre och ¨ovre kvartil av medelv¨ardena av 4:e och 5:e v¨ardena uppifr˚an och nedifr˚an, dvs q
1= 0.015 och q
3= 0.034.
(c) Med q
1− 1.5(q
3− q
1), q
3+ 1.5(q
3− q
1) som gr¨anser f¨or uteligga- re ska v¨arden l¨agre ¨an −0.0135 eller h¨ogre ¨an 0.0625 markeras som uteliggare. N˚agra s˚adana finns inte. En boxplot kan d¨arf¨or se ut p˚a f¨oljande s¨att:
0.0100.0150.0200.0250.0300.0350.0400.045
(d) Om X st˚ar f¨or avvikelsen g¨aller att X ska vara normalf¨ordelad med genomsnittet µ och standardavvikelsen σ , b˚ada ok¨anda. Ett 90% kon- fidensintervall f¨or genomsnittlig avvikelse, dvs f¨or µ , ges av uttrycket
¯ x ± t
∗s
√ n
d¨ar t
∗= 1.753 ¨ar det v¨arde som f¨or en variabel t som f¨oljer t-f¨ordelning
Svar till tentamen i Statistik 1, S0002M, 2009-06-05
med 15 frihetsgrader g¨or att P (t > t
∗) = 0.05. Medelv¨ardet ¯x = 0.0248, s = 0.0106 och n = 16. Detta ger tillsammans intervallet
[0.020171, 0.029454]
Med 90% s¨akerhet kan du allts˚a s¨aga att den genomsnittliga avvikelsen t¨acks av intervallet ovan.
(e) L˚at Y st˚a f¨or antalet intervall som inte tr¨affar den genomsnittliga av- vikelsen Det ¨ar 10% sannolikhet att ett intervall inte tr¨affar, och an- talet intervall som missar kan beskrivas med en binomialf¨ordelning d¨ar n = 5 och p = 0.10. Den fr˚aga som ¨ar st¨alld kan d˚a skrivas som P (Y ≥ 1). Ett s¨att att ber¨akna denna sannolikhet ¨ar att ber¨akna
P (Y ≥ 1) = P(Y = 1) + ··· + P(Y = 10) men det ¨ar mycket mer kr¨avande ¨an att ber¨akna motsatsen:
P (Y ≥ 1) = 1 − P(Y < 1) = 1 − P(Y = 0) Den senare sannolikheten f˚as genom
P (Y = 0) = 10 0
0.10
0· 0.90
10≈ 0.3487 Den s¨okta sannolikheten ¨ar allts˚a 65.1%.
2. L˚at X st˚a f¨or tiden det tar att kapa en balk.
(a) Tiden X s¨ags vara normalf¨ordelad med genomsnittet µ = 1.2 och stan- dardavvikelsen σ = 0.06 minuter. Det som s¨oks ¨ar andelen tider som
¨ar l¨angre ¨an 1.3 minuter, dvs andelen X > 1.3.
1.05 1.10 1.15 1.20 1.25 1.30 1.35
0123456
Svar till tentamen i Statistik 1, S0002M, 2009-06-05
Med sedvanlig standardisering, dvs med transformationen Z = (X − µ )/ σ f˚as att andelen X > 1.3 ¨ar lika stor som andelen Z > (1.3 − 1.2)/0.06, dvs andelen Z > 1.67:
−3 −2 −1 0 1 2 3
0.00.10.20.30.4