• No results found

Tentamen i: Statistik AI, 15 hp Antal uppgifter: 6

N/A
N/A
Protected

Academic year: 2021

Share "Tentamen i: Statistik AI, 15 hp Antal uppgifter: 6"

Copied!
7
0
0

Loading.... (view fulltext now)

Full text

(1)

IEK309 Institutionen f¨or matematik Datum 2008-12-22

Skrivtid 0900–1400

Tentamen i: Statistik AI, 15 hp Antal uppgifter: 6

Krav f¨or G: 12 L¨arare:

Jour: Robert Lundqvist, tel 49 24 04/076-839 30 56

Till˚atna hj¨alpmedel:

• En statistikbok, g¨arna Introduction to the Practice of Statistics av Moore &

McCabe. Undantag: kombinationen Praktisk statistik/R¨akna med slumpen

• Minir¨aknare (dator ¨ar inte till˚aten)

T¨ank p˚a att redovisa dina l¨osningar p˚a ett klart och tydligt s¨att. Endast det nume- riska svaret r¨acker inte f¨or full po¨ang. Korrekt l¨osning ger det po¨angantal som st˚ar angivet efter uppgiftstexten.

LYCKA TILL!

(2)

Tentamen i Statistik AI, S0002M, 2008-12-22

1. V¨antetider f¨or svar fr˚an datasupporten m¨attes. I f¨oljande tabell ges tiderna f¨or n˚agra samtal till supporten:

12.3 13.2 9.1 8.5 13.9 7.5 12.2 11.2 9.5 10.0 14.3 14.6 7.2 14.6 13.3 9.7 12.7 12.1 9.5 14.0 6.1 9.8 (a) Beskriv materialet i en boxplot. Best¨am ocks˚a om det finns n˚agra ute-

liggare d¨ar kriteriet ¨ar sedvanliga

q

1

− 1.5(q

3

− q

1

), q

3

+ 1.5(q

3

− q

1

)

(b) Om du antar att v¨antetiden kan beskrivas med en normalf¨ordelning, vad blir d˚a ett 95% konfidensintervall f¨or den genomsnittliga v¨ante- tiden? I ditt svar ska det tydligt framg˚a hur du definierar ing˚aende variabler, likas˚a ska det framg˚a vilka antaganden om slumpmodell du

anv¨ander. (4p)

2. F¨or att se om anv¨andningen av ett tr¨aningsredskap kallat Cardio Glide f¨or-

¨andras med tiden g¨ors en mindre unders¨okning av kunder. S¨aljaren vet hur l¨ange man haft redskapet (Antal) och man fr˚agar efter hur m˚anga timmar redskapet anv¨ants den senaste veckan (Tid). Resultatet ges i nedanst˚aende tabell:

Person Antal Tid Person Antal Tid

1 12 4 6 2 8

2 2 10 7 8 3

3 6 8 8 4 8

4 9 5 9 10 2

5 7 5 10 5 5

(a) En regressionsanpassning med m˚anader som f¨orklarande variabel och tid som svarsvariabel f˚as f¨oljande resultat:

ˆ

y = 9.94 − 0.64 · x

Kan koefficienterna i det sambandet ges meningsfulla tolkningar? Om s˚a ¨ar fallet, ge s˚adana tolkningar. Om det inte g˚ar att tolka p˚a ett me- ningsfullt s¨att, motivera d˚a detta.

(b) Vad blir genomsnittlig anv¨andningstid f¨or personer som haft redskapet

i 6 m˚anader? (3p)

(3)

3. Det visade sig i en unders¨okning av hur studenter sk¨oter betalningen av r¨akningar att andelen som det senaste ˚aret f˚att f¨orseningsavgifter pga sena inbetalningar var 25%. I unders¨okningen ingick ocks˚a fr˚agor om andra f¨or- seningar, och en s˚adan g¨allde om man f˚att p˚aminnelse fr˚an biblioteket om att l˚anetid g˚att ut p˚a l˚anade b¨ocker. Andelen som f˚att s˚adana p˚aminnelser var 80%.

(a) Utg˚aende fr˚an att de ovan beskrivna h¨andelserna ¨ar oberoende av var- andra, hur stor ¨ar sannolikheten att en slumpm¨assigt utvald student inte har f˚att f¨orseningsavgift eller p˚aminnelse om f¨orsenad bokinl¨amning?

(b) Antag att h¨andelserna inte ¨ar oberoende av varandra. Antag ocks˚a att det visat sig att andelen som har f˚att b˚ade f¨orseningsavgift och biblio- teksp˚aminnelse ¨ar 0.20. Du tr¨affar en student som ber¨attar att han f˚att f¨orseningsavgift. Hur stor ¨ar d˚a sannolikheten att studenten ocks˚a har

f˚att p˚aminnelse om bok? (4p)

I b˚ada deluppgifterna ¨ar det viktigt att du tydligt beskriver inf¨orda beteck- ningar f¨or de ing˚aende h¨andelserna.

4. Vid revision i en viss typ av mindre f¨oretag har revisorn uppt¨ackt att det finns ett m¨onster: bara 5% av f¨oretagen har en s˚a kallad internkontrollplan.

Tjugo f¨oretag ska revideras under en given period. Antag att det inte finns n˚agot beroende mellan f¨oretagen med avseende p˚a om de har interkontroll- plan eller inte.

(a) Beskriv antalet f¨oretag med kontrollplan med en l¨ampligt formulerad slumpvariabel. Ange variabelns f¨ordelning.

(b) Hur stor ¨ar sannolikheten att det bland de tjugo finns minst tv˚a f¨oretag

som har interkontrollplan? (4p)

5. Temperaturen i kallvattnet in i fastigheterna i ett omr˚ade har visat sig kunna beskrivas med en normalf¨ordelning med genomsnittet 8 grader och stan- dardavvikelsen 1.5 grader.

(a) Hur stor ¨ar sannolikheten att temperaturen p˚a vattnet ¨overstiger 12 gra- der?

(b) Ett annat s¨att att beskriva hur stor variation det ¨ar i temperaturen ¨ar att ange l¨agsta temperatur bland de 10% h¨ogsta vattentemperaturerna.

Vad blir denna? (4p)

I denna uppgift ¨ar det f¨orst˚as viktigt att det framg˚ar hur du definierat variabel

(4)

Tentamen i Statistik AI, S0002M, 2008-12-22

6. Hur stor andel av patienterna drabbas av infektion i samband med v˚ard

och/eller operation? Finns det skillnader inom landstinget? F¨or att besva-

ra dessa fr˚agor har man i ett visst landsting gjort slumpm¨assiga urval av

150 journaler f¨or patienter fr˚an ett sjukhus vid kusten (K) och 150 journaler

fr˚an ett sjukhus i inlandet (I). Journalerna granskas f¨or att se om fallen upp-

visar v˚ardrelaterade infektioner. Vid sjukhus K var andelen v˚ardrelaterade

infektioner 6% och vid sjukhus I var motsvarande andel 9%. Kan man ut-

ifr˚an detta material p˚avisa en signifikant skillnad mellan populationsande-

larna av patienter vid de tv˚a sjukhusen som drabbas av v˚ardrelaterade in-

fektioner? Besvara fr˚agan genom att g¨ora ett hypotestest d¨ar du anv¨ander

5% signifikansniv˚a. I dina svar ska det tydligt framg˚a hypoteser och test-

variabel. Dina slutsatser ska uttryckas tydligt i ord. Likas˚a ska du ange

f¨ordelningsantaganden och kontrollera om dessa antaganden ¨ar rimliga.(6p)

(5)

1. (a) +----+---+----+----+----+---+----+----+----+

| |

| |

| |

| +---+---+ |

|+---| | |---+|

| +---+---+ |

| |

| |

+----+---+----+----+----+---+----+----+----+

6 7 8 9 10 11 12 13 14

Gr¨anser f¨or uteliggare ges av

q

1

− 1.5(q

3

− q

1

), q

3

+ 1.5(q

3

− q

1

)

d¨ar q

1

¨ar femte v¨arde i storleksordning, dvs 9.1 och q

3

, ¨ovre kvartil ¨ar femte v¨ardet uppifr˚an, dvs 13.9. Detta ger gr¨anserna 1.9 och 21.1. Inga v¨arden ¨overskrider dessa gr¨anser, s˚a det finns med de givna gr¨anserna inga uteliggare.

(b) L˚at X beteckna v¨antetiden, en variabel som kan beskrivas med en nor- malf¨ordelning d¨ar genomsnittet ¨ar µ och standardavvikelsen σ , b˚ada lika ok¨anda. Ett konfidensintervall f¨or µ ges av

¯ x ± t

s

n

d¨ar ¯ x = 11.15, t

= 2.0796, s = 2.5849 och n = 22 vilket ger intervallet [10.004, 12.296]

2. (a) Med y som antal timmar som redskapet anv¨ants senaste veckan och x som antalet m˚anader anv¨andaren haft redskapet f˚as allts˚a

ˆ

y = 9.94 − 0.64 · x

H¨ar kan sk¨arningspunkten med y-axeln, dvs 9.94, inte ges n˚agon me-

ningsfull tolkning eftersom det inte ges n˚agra v¨arden p˚a y-variabeln

n¨ar x-variabeln ¨ar n¨ara 0. Riktningskoefficienten −0.64 kan d¨aremot

tolkas p˚a f¨oljande s¨att: f¨or varje ytterligare m˚anad som redskapet finns

hos anv¨andaren minskar anv¨andningstiden med i genomsnitt 0.64 tim-

(6)

L¨osningar till tentamen i Statistik AI, S0002M, 2008-12-22

(b) Genomsnittlig anv¨andningstid f¨or personer som haft redskapet i 6 m˚a- nader blir 9.94 − 0.64 · 6 = 6.1 timmar.

3. Om I f˚ar st˚a f¨or h¨andelsen att en student f˚att p˚aminnelse f¨or sen inbetalning och B f¨or en p˚aminnelse om sent inl¨amnad biblioteksbok s˚a g¨aller att

P (I) = 0.25 och P (B) = 0.80

(a) P (inte I eller B) = 1 − P(minst en av I och B) = 0.15.

(b) P (B|I) = 0.20

0.25 = 0.80

4. Vid revision i en viss typ av mindre f¨oretag har revisorn uppt¨ackt att det finns ett m¨onster: bara 5% av f¨oretagen har en s˚a kallad internkontrollplan.

Tjugo f¨oretag ska revideras under en given period. Antag att det inte finns n˚agot beroende mellan f¨oretagen med avseende p˚a om de har interkontroll- plan eller inte.

(a) L˚at X beteckna antalet f¨oretag bland tjugo som har internkontrollplan.

Den variabeln ska enligt f¨oruts¨attningarna kunna beskrivas med en bi- nomialf¨ordelning d¨ar n = 20 och p = 0.05.

(b) P (X ≥ 2) = 1 − P(X ≤ 1) = 1 − 0.7358 = 0.2642

5. L˚at X beteckna temperaturen i kallvattnet in i fastigheterna i ett omr˚ade har visat sig kunna beskrivas med en normalf¨ordelning med genomsnittet 8 grader och standardavvikelsen 1.5 grader.

(a)

P (X > 12) = P



Z > 12 − 8 1.5



= P (z > 2.67) =

= 1 − P(z ≤ 2.67) = 1 − 0.9962 = 0.0038 (b) Det som s¨oks ¨ar temperaturen c i P (X > c) = 0.10. Det v¨ardet ¨ar

10.07767.

6. L˚at p

I

beteckna andelen v˚ardrelaterade infektioner vid inlandsssjukhuset och p

K

f¨or motsvarande andel vid kustsjukhuset. H¨ar g¨aller det att ˆ p

I

= 0.09 och ˆ p

K

= 0.06 och att n

I

= n

K

= 150. Ett hypotestest av hypoteserna H

0

: ˆ p

I

− ˆp

K

= 0 mot alternativhypotesen H

a

: ˆ p

I

− ˆp

K

= 0 ska g¨oras.

L¨amplig grund h¨ar ¨ar ber¨akning av

(7)

z = p ˆ

I

− ˆp

K

SE

Dp

d¨ar

SE

Dp

= s

ˆ

p (1 − ˆp)  1 n

I

+ 1

n

K



och

ˆ

p = X

I

+ X

k

n

I

+ n

K

H¨ar ¨ar X

I

= 13.5 (uppenbarligen ett resultat av att stickprovsandelen ˆp

I

= 0.09 borde haft n˚agra fler decimaler) och X

K

= 9 personer, vilket ger ˆp = 0.075. Detta ger i sin tur SE

Dp

= 0.0304 och z = 0.9864. F¨or att slutf¨ora testet ska p-v¨ardet ber¨aknas, dvs 2P(z > 0.9864) = 0.3239. Detta ¨ar l˚angt

¨over den valda signifikansniv˚an p˚a 5%, vilket betyder att vi inte kan f¨orkasta

hypotesen att det ¨ar samma populationsandel v˚ardrelaterade infektioner vid

de tv˚a sjukhusen.

References

Related documents

L˚ at y(t) vara andelen av populationen som ¨ar smittad efter tiden t dygn, r¨aknad fr˚ an uppt¨ack- ten... Observera att ¨amnets koncentration ¨ar samma som m¨angden av

Antalet kunder som bes¨ oker de tv˚ a aff¨ arerna en timme kan beskrivas med Poissonf¨ ordelningar.. Det genomsnittliga antalet kunder som bes¨ oker de tv˚ a aff¨ arerna ¨ ar

(c) Sambandet mellan ˚alder och k¨on kan beskrivas grafiskt med hj¨alp av ett diagram best˚aende av tv˚a boxplottar, en f¨or gruppen av m¨an och en f¨or gruppen av kvinnor..

(b) Ett annat s¨att att g¨ora j¨amf¨orelsen mellan tv˚a serier av detta slag ¨ar att titta p˚a ”tecknet” i j¨amf¨orelsen, dvs antalet positiva skillnader n¨ar man tar

(c) Ett l¨ampligt s¨att att ˚ask˚adligg¨ora sambandet mellan dessa variabler ¨ar att g¨ora ett diagram med tv˚a boxplottar: en boxplot f¨or gruppen som inte f˚att p˚aminnelser

Vid bed¨ omningen av l¨ osningarna av uppgifterna i del 2 l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. T¨ ank p˚ a att noga redovisa inf¨ orda

Du f˚ ar utg˚ a fr˚ an att denna multiplikationsegenskap f¨ or determinanter ¨ ar k¨ and d˚ a en av matriserna ¨ ar elemen-..

¨ar en kompakt m¨angd och funktionen f ¨ar kontinuerlig p˚a denna, s˚a d¨arf¨or kan vi p˚a f¨orhand veta att f har ett minsta v¨arde p˚a denna m¨angd, vilket d˚a ocks˚a,