Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M
Tentamensdatum 2013-05-18 Totala antalet uppgifter:
Totala antalet poäng
5 25
Skrivtid 09.00-14.00
Lärare: Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip
Jourhavande lärare: Mykola Shykula Tel: 0920-49 30 56
Resultatet meddelas i studentportalen senast:
Betygsgränser:
15 arbetsdagar efter tentamensdagen U:0-11, G: 12-25
Tillåtna hjälpmedel: Kursbok, miniräknare och egna handskrivna anteckningar.
Läs noggrant informationen nedan innan du börjar skriva tentamen
Svara kort och koncis.
Till alla uppgifterna ska fullständiga lösningar lämnas.
Lösningen till varje ny uppgift skall börjas på en ny sida.
Använd bara en sida av varje A4-ark.
Numrera alla lösningsblad.
Resonemang, ekvationslösningar och uträkningar skall vara lätta att följa.
Efter varje uppgift anges maximala antalet poäng som ges.
Även delvis lösta problem kan ge poäng.
Tabell för normalfördelningen finns bifogad längst bak.
Uppgift 1
Nedan följer fem flervalsuppgifter (multiple choice). För var och en av uppgifterna är det alltid ett, och endast ett, alternativ som är korrekt. Rätt svar ger en poäng, medan fel svar eller uteblivet svar ger noll poäng. Om Du svarar med fler än ett alternativ så betraktas det som ett felaktigt svar.
1.1 I diagrammet nedan visas fördelning för bensinförbrukningen hos 807 dieselbilar av 2010 års modell
Vad anger strecket inom den grå lådan (se a i diagrammet)?
a) medelvärde.
b) standardavvikelse.
c) median.
d) typvärde.
e) går ej att avgöra utifrån den information som ges.
1.2 I figuren nedan avbildas en normalfördelning med väntevärde 0 och standardavvikelse 1. Värdet på z, som är markerat i figuren nedan, är:
0,4
0,3
0,2
0,1
0,0
X
Density
0,05 0
Distribution Plot Normal; Mean=0; StDev=1
12 11 10 9 8 7 6 5 4 3
Bränsleförbrukning blandad
Boxplot of Bränsleförbrukning blandad
a
z
c) z är ca 0.52 d) z är ca 1.65 e) z är ca 0.95
1.3 I figuren nedan avbildas en normalfördelning med väntevärde 0 och
standardavvikelse 1. Bestäm värdet på sannolikheten som är gråmarkerad:
0,4
0,3
0,2
0,1
0,0
X
Density
-1,2 0
Distribution Plot Normal; Mean=0; StDev=1
a) 0.1151 b) 0.1511 c) 0.4849 d) 0.8849 e) 0.9549
1.4 Vilket av följande påståenden om korrelation är korrekt?
a) Korrelationen är lika med +1 endast då alla observationspunkter ligger perfekt på en horisontell rät linje.
b) Korrelationen är andel av observationspunkterna som kan anses vara outliers.
c) Korrelationen är ett enhetslöst värde som alltid ligger i intervallet ‐1 till +1.
1.5 Medelåldern för fem personer i ett rum är 37 år. Om en av dessa fem, en som är 26 år gammal, lämnar rummet så kommer medelåldern för de återstående fyra att
a) öka.
b) minska.
c) förbli oförändrad.
d) går ej att avgöra utifrån den information som ges.
Uppgift 2
I statistisk årsbok 2008 anges följande konsumentpriser för 1 kg blodpudding:
År 2001 2002 2003 2004 2005 2006
Pris 24,00 24,70 23,70 22,70 21,00 20,20
Konsumentprisindex (KPI) med 1980=100
267,1 272,8 278,1 279,2 280,4 284,22
a) Räkna om blodpuddingspriset till en indexserie med 2003 som basår (utan hänsyn till KPI).
(1p)
Svar: 101 104 100 96 89 85
b) Bestäm genomsnittliga årliga prisförändringen mellan år 2001 och 2006 (utan hänsyn till KPI). (1p)
Svar: priset har sjunkit med ca 3.4% i genomsnitt per år.
c) Vad är blodpuddingpriset år 2005 med 2001 års penningvärde? Vad är blodpuddingpriset år 2006 med 2002 års penningvärde? Jämför på ett rimligt sätt prisförändringen under de två tidsperioderna 2001‐2005 respektive 2002‐2006. (3p)
Svar: blodpuddingspriset år 2005 med 2001 års penningvärde är 21(267.1/280.4)=20, blodpuddingspriset år 2006 med 2002 års penningvärde är
20.2(272.8/284.22)=19.4;
jämförelse: 20/24 = 0.83 (ca 17% relativ prissänkning från 2001 till 2005) och 19.4/24.7 = 0.785 (ca 22% relativ prissänknig från 2002 till 2006). Alltså har prisen sjunkit ca 5% mera under 5 års period 2002‐2006 jmf med 5 års period 2001‐2005.
Uppgift 3
En student har funnit att tiden det tar att gå till universitet är normalfördelad, med genomsnittlig gångtid 10 min och standardavvikelse 2 min.
a) Bestäm sannolikheten att studenten behöver mer än 11 min för att gå till universitetet.
Skissa föredelningen och markera den efterfrågade sannolikheten. (3p) Svar: ca 0.31
b) Vilken är den längsta av de 10 % kortaste gångtiderna? (2p) Svar: ca 7.5 min
Uppgift 4
Resultaten på en tentamen med nio skrivande anges nedan (enhet: poäng):
10 8 12 17 7 7 6 3 11
a) Beräkna medelvärde, och standardavvikelse för resultaten (2p) Svar: medelvärde = 9, st.avvikelse = 4.06
b) Rita en boxplot (dvs. låddiagram) som illustrerar resultaten. Ange nedre och övre kvartil samt median. (2p)
Svar: min = 3, max = 17, median = 8, nedre kv. = 6.5, övre kv. = 11.5
c) Finns det uteliggare bland resultaten? Motivera ditt svar. Om ja, ange dessa. (Uteliggare definieras här genom ”1.5 x kvartilavstånds regeln”) (1p)
Svar: inga uteliggare finns i datamaterialet, ty nedre‐outliers‐staket = ‐1, övre‐outliers‐
staket = 19
Uppgift 5
Uppgiften är baserad på följande Minitab‐utskrift:
The regression equation is y = - 0,339 + 1,03 x
Predictor Coef SE Coef T P Constant -0,3386 0,6048 -0,56 0,579 x 1,03429 0,06084 17,00 0,000 S = 0,277853 R-Sq = 89,8% R-Sq(adj) = 89,4%
Den enkla linjära regressionsmodell som ligger till grund för utskriften kan skrivas som för 1,2, … , , där slumpfelen antas ha en (gemensam) standardavvikelse .
a) Ange modellens förklaringsgrad, och förklara i ord vad detta mått betyder. (2p) Svar: förklaringsgrad är lika med 89.8%
Detta betyder att givet den här modellen förklaras variationen i y‐variabel till ca 90%
av variationen i x‐variabeln.
b) Tolka, så konkret som möjligt, den parameter som har skattats till 1,03. (2p) Svar: Om x ökar med 1 enhet så ökar y med ca 1.03 enheter i genomsnitt.
c) Ett av de fyra nedanstående spridningsdiagrammen visar samma data som analysen är baserad på. Vilket är det? (1p)
Svar: A
11,5 11,0 10,5 10,0 9,5 9,0 8,5 8,0 12
11
10
9
8
x
y
Spridningsdiagram A
13 12 11
10 9
8 14 13 12 11 10 9 8 7
x
y
Spridningsdiagram B
12 11
10 9
8 -5 -6 -7 -8 -9 -10 -11 -12 -13 -14
x
y
Spridningsdiagram C
11,5 11,0 10,5 10,0 9,5 9,0 8,5 8,0 -4,0
-4,5
-5,0
-5,5
-6,0
x
y
Spridningsdiagtram D