Skrivtid 0900–1400
Tentamen i: Statistik A1, 15 hp
Antal uppgifter: 6
Krav f¨or G: 13
L¨arare: Robert Lundqvist, tel 49 24 04
Jour: Robert Lundqvist, tel 49 24 04
Resultatet ansl˚as senast: 22/12 2009
Till˚atna hj¨alpmedel:
• En statistikbok, g¨arna Introduction to the Practice of Statistics av Moore &
McCabe. Undantag: kombinationen Praktisk statistik/R¨akna med slumpen
• Minir¨aknare
T¨ank p˚a att redovisa dina l¨osningar p˚a ett klart och tydligt s¨att. Endast det nume- riska svaret r¨acker inte f¨or full po¨ang. Korrekt l¨osning ger det po¨angantal som st˚ar angivet efter uppgiftstexten.
LYCKA TILL!
Tentamen i Statistik A1, S0002M, 2009-12-17
I alla l¨osningar f¨oruts¨atts du ge tydliga beskrivningar av s˚av¨al f¨oruts¨attningar som fr˚agest¨allning. Det inneb¨ar att h¨andelser, slumpvariabler och f¨ordelningar/slump- modeller ska beskrivas tydligt.
1. I fastighetsenheten inom en st¨orre organisation vill man se hur lokaler man ansvarar f¨or utnyttjas. Det finns totalt 14 hus, och i vart och ett av des- sa finns en typ av sammantr¨adesrum. F¨or en given m˚anad sammanst¨alls bel¨aggningen, dvs andel av tillg¨anglig tid som lokalerna utnyttjas, f¨or alla dessa 14 rum. Resultatet ges i nedanst˚aende tabell:
0.264 0.277 0.284 0.239 0.219 0.261 0.250 0.254 0.233 0.270 0.268 0.261 0.243 0.246 (a) Beskriv bel¨aggningen i ett stambladdiagram.
(b) Ber¨akna median, undre och ¨ovre kvartil f¨or bel¨aggningen. Du ska tyd- ligt ange hur du definierat dessa.
(c) Beskriv bel¨aggningen i en boxplot. (6p)
2. I en unders¨okning av konsumtion av mj¨olkprodukter ingick fr˚agor om vilket m¨arke p˚a laktosfri mj¨olk som personerna i unders¨okningen hade provat. Det visade sig att m¨arke N hade k¨opts av 15% av personerna i unders¨okningen och m¨arke V hade k¨opts av 12%. Dessutom visade det sig att 8% hade provat b˚ada.
(a) Hur stor ¨ar sannolikheten att en slumpm¨assigt utvald person i gruppen har k¨opt minst en av de aktuella produkterna?
(b) Hur stor ¨ar sannolikheten att en slumpm¨assigt utvald person i gruppen inte har k¨opt n˚agon av de aktuella produkterna?
(c) En slumpm¨assigt utvald person visade sig ha k¨opt en produkt av m¨arke N. Hur stor ¨ar d˚a sannolikheten att den personen ocks˚a hade k¨opt en
produkt av m¨arke V? (4p)
3. P˚a ett visst universitet erbjuder man i en kurs studenterna tr¨affar med en personlig handledare. Handledaren har tagit f¨or vana att se hur m˚anga stu- denter som anm¨aler intresse f¨or s˚adana tr¨affar, och med den historiken har det visat sig rimligt att s¨aga att det ¨ar 70% chans att h¨ogst 1 student per dag anm¨aler sig f¨or handledning.
Tentamen i Statistik A1, S0002M, 2009-12-17
4. Efterfr˚agan p˚a blyfri bensin, 95 oktan, p˚a en viss mack en vanlig m˚andag har visat sig kunna beskrivas med en normalf¨ordelning d¨ar genomsnittet ¨ar 27 000 liter och standardavvikelsen ¨ar 2 000 liter.
(a) Hur stor ¨ar sannolikheten att efterfr˚agan ¨overstiger 30 000 liter?
(b) Hur m˚anga liter bensin m˚aste finnas i tanken en m˚andag f¨or att det ska vara h¨ogst 5% sannolikhet att bensinen tar slut, dvs att efterfr˚agan ¨ar
st¨orre ¨an den tillg¨angliga volymen? (4p)
5. I en st¨orre organisation har man sett att andelen fakturor med felaktiga de- taljer ¨ar 8%. Den andelen m¨ats regelbundet och redovisas f¨or b˚ade hela organisationen och enheter inom densamma. Andelen skattas genom stick- provsunders¨okningar som g¨ors genom att ett antal av det f¨oreg˚aende ˚arets fakturor v¨aljs ut slumpm¨assigt och de utvalda fakturorna granskas sedan noggrant. Med fel menas h¨ar allt fr˚an fel datum och kontaktuppgifter till felaktiga summor.
I en enhet har man tagit ut 200 fakturor. Antalet fakturor med fel bland dessa var 12. Om 8% antas vara den sanna andelen i hela organisationen, kan man med detta resultat i enheten p˚avisa att andelen d¨ar ¨ar l¨agre ¨an vad den ¨ar i organisationen? Besvara fr˚agan genom att g¨ora ett l¨ampligt hypotestest.
D¨ar ska det tydligt framg˚a vilka hypoteser du anv¨ander, vad du grundar dina slutsatser p˚a och f¨orst˚as ¨aven vad dina slutsatser ¨ar. (5p) 6. Monteringstid f¨or en st¨orre del i en s k personlyft som anv¨ands f¨or patien- ter som ligger till s¨angs ska s¨attas under luppen. Monteringen ¨ar inte helt enkel, och f¨or att f˚a ett underlag f¨or f¨orb¨attring har monteringstiden m¨atts f¨or en grupp mont¨orer, se nedanst˚aende tider (enhet: minuter). Vad ¨ar den genomsnittliga monteringstiden? Besvara fr˚agan genom att best¨amma ett l¨ampligt konfidensintervall med konfidensgraden 90%. Du kan utg˚a fr˚an att tiden kan beskrivas med en normalf¨ordelning. I din l¨osning ska det f¨orst˚as framg˚a tydligt hur inf¨orda variabler ¨ar definierade, likas˚a ska antaganden om f¨ordelning/slumpmodell vara tydligt beskrivna.
28 31 29 30 29
(4p)
1. (a) Ett stambladdiagram f¨or andelen av tiden som rummen anv¨ands kan se ut p˚a f¨oljande s¨att:
The decimal point is 2 digit(s) to the left of the | 20 | 9
22 | 39 24 | 3604 26 | 114807 28 | 4
(b) Medianen blir det mittersta v¨ardet, dvs v¨arde nr 7.5 eller medelv¨ardet av 6:e och 7:e v¨ardet. H¨ar blir det 0.2575. Undre kvartil(q1) blir mitten i undre halvan, dvs v¨arde nr 4 som h¨ar r˚akar vara 0.243. ¨Ovre kvartil (q3) blir p˚a motsvarande s¨att 0.268.
(c)
0.22 0.23 0.24 0.25 0.26 0.27 0.28
2. L˚at N st˚a f¨or h¨andelsen att en person har k¨opt produkt av m¨arke N, och V f¨or motsvarande h¨andelse f¨or m¨arke V. D˚a g¨aller att P(N) = 0.15, P (V ) = 0.12 och P(N och V ) = 0.08.
(a)
Svar till tentamen i Statistik A1, S0002M, 2009-12-17
(b)
P(en person har inte k¨opt n˚agon av produkterna) =
= 1 − P(minst en av produkterna) = 1 − 0.19 = 0.81 (c)
P(V |N) = P(V och N)
P(N) =0.08
0.15≈ 0.533
3. L˚at X st˚ar f¨or antalet anm¨alningar under en dag. D˚a g¨aller att X b¨or kunna beskrivas med en binomialf¨ordelning d¨ar n= 5 och p = 0.70.
Det som s¨oks ¨ar
P(X ≤ 1) = P(X = 0) + P(X = 1) = 0.00243 + 0.02835 = 0.03078 H¨ar beh¨aver man anv¨anda sannolikhetsfunktionen f¨or X , dvs
P(X = k) =5 k
0.7k· 0.35−k, k = 0, 1, 2, 3, 4, 5
Ett annat s¨att ¨ar att utg˚a fr˚an att det ¨ar h¨andelsen att det inte blir h¨ogst 1 anm¨alan per dag. Den h¨andelsen har sannolikheten 0.30. Om Y st˚ar f¨or antalet dagar d˚a det inte kommer h¨ogst 1 anm¨alan per dag ¨ar Y binomial- f¨ordelad med n= 5 och p = 0.3. Det som ska ber¨aknas ¨ar P (X ≤ 1), men det m˚aste vara detsamma som P(Y ≥ 4). Den sannolikheten kan hittas i tabell f¨or binomialf¨ordelningen:
P(Y ≥ 4) = P(Y = 4) + P(Y = 5)) = = 0.02835 + 0.00243 = 0.03078 4. L˚at E st˚a f¨or efterfr˚agan p˚a blyfri bensin. Den variabeln s¨ags kunna beskri-
vas med en normalf¨ordelning d¨ar genomsnittet ¨ar 27 000 liter och standard- avvikelsen ¨ar 2 000 liter.
(a)
P(efterfr˚agan ¨overstiger 30 000) =
= P (E ≥ 30000) = P E − 27000
2000 ≥ 30000− 27000 2000
=
= P (Z ≥ 1.5) = 1 − P(Z < 1.5) = 1 − 0.9332 = 0.0668
(b) Det som s¨oks ¨ar det v¨arde c som g¨or att P(E ≥ c) = 0.05.
P(E ≥ c) = P E − 27000
2000 ≥ c− 27000 2000
= P (Z ≥ c) = 0.05 Enligt tabell ¨ar P(Z > 1.645) = 0.05, vilket betyder att
c− 27000
2000 = 1.645 vilket i sin tur betyder att c= 30290 liter.
5. Det som ska g¨oras ¨ar ett hypotestest med hypoteserna H0: p= 0.08 mot Ha: p < 0.08
d¨ar p betecknar andelen felaktiga fakturor i hela populationen av fakturor i organisationen. Ett stickprov har tagits ut om 200 fakturor, och stickprovs- andelen d¨ar blev ˆp= 12/200 = 0.06.
F¨orsta steget ¨ar ber¨akna textvariabeln:
z= pˆ− p0
rp0(1 − p0) n
= 0.06 − 0.08 r0.08(1 − 0.08)
200
= −1.0426
N¨asta steg ¨ar att ber¨akna p-v¨ardet, dvs att se vad P(Z ≤ 1.0426) blir. I ta- bellen kan man utl¨asa att detta ¨ar ungef¨ar 14.9%. Detta kan inte betraktas som n˚agot s¨arskilt starkt st¨od f¨or mothypotesen, dvs en rimlig slutsats ¨ar att nollhypotesen accepteras. Annorlunda uttryckt: vi kan inte visa att andelen felaktiga fakturor ¨ar l¨agre ¨an den som g¨aller i hela organisationen.
6. Om X st˚ar f¨or monteringstid g¨aller att vi ska kunna beskriva den variabeln med en normalf¨ordelning. Det som s¨oks ¨ar ett konfidensintervall f¨orµ, och ett s˚adant ges av uttrycket
¯ x± t∗ s
√n
H¨ar ¨ar ¯x= 29.4, s = 1.140175 och n = 5. F¨or att f˚a fram v¨ardet p˚a t∗ tas tabellen f¨or t-f¨ordelningen med 4 frihetsgrader: t∗ ¨ar det v¨arde som g¨or att (4)-f¨ordelad variabel T uppfyller P (T > t∗) = 0.05. Tabellen ger att