Institutionen för teknikvetenskap och matematik
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M
Tentamensdatum 2013-03-27 Totala antalet uppgifter:
Totala antalet poäng
5 25
Skrivtid 09.00-14.00
Lärare: Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip
Jourhavande lärare: Mykola Shykula Tel: 0920-49 30 56
Resultatet meddelas i studentportalen senast:
Betygsgränser:
15 arbetsdagar efter tentamensdagen U:0-11, G: 12-25
Tillåtna hjälpmedel: Kursbok, miniräknare och egna handskrivna anteckningar.
Läs noggrant informationen nedan innan du börjar skriva tentamen
Svara kort och koncis.
Till alla uppgifterna ska fullständiga lösningar lämnas.
Lösningen till varje ny uppgift skall börjas på en ny sida.
Använd bara en sida av varje A4-ark.
Numrera alla lösningsblad.
Resonemang, ekvationslösningar och uträkningar skall vara lätta att följa.
Efter varje uppgift anges maximala antalet poäng som ges.
Även delvis lösta problem kan ge poäng.
Tabell för normalfördelningen finns bifogad längst bak.
Uppgift 1
a) Bestäm medelvärde och standardavvikelse för följande sju mätvärden:
5, 3, 7, 9, 9, 100, 6.
Finns det några uteliggare i materialet? Motivera. (3p)
Lösning
Medelvärde: ̅
⋯19.86
St. avvikelse:
5 19.86 3 19.86 ⋯ 100 19.86 6 19.86 35.4
Finns det uteliggare?
Vi sorterar datamaterialet först: 3, 5, 6, 7, 9, 9, 100 Det är 7 observationer.
Därför är medianen lika med 7, under kvartil: 5 och övre kvartil: 9.
1.5 1.5 5 1.5 9 5 1
1.5 1.5 5 1.5 9 5 11
Alltså finns det en observation i datamaterialet som är uteliggare, 100, ty den är större än det övre staketet, 11.
b) En studie om anställdas månadslöner på ett stort svenskt företag genomfördes. Svaren ligger mellan 19800 och 26300 SEK och presenteras i ett stam‐och‐blad diagram nedan (angivna i hundratals kronor):
19 8 9 9 20 0 1 3 6 8 9 21 2 3 5 5 7 22 6 8 9 9 23 3 4 4 7 24 1 5 9 25 4 5 8 26 2 3
Bestäm (uttryckt i SEK) medianen och kvartilavståndet. (2p)
Lösning
Det är 30 observationer.
Därför är medianen lika med 22700 (SEK).
Under kvartil: 20800 Övre kvarti: 24100
Kvartilavstånd: 24100 20800 3300 (SEK)
Uppgift 2
Som modell för att beskriva variationen av poäng på antagningsprovet till en viss utbildning kan man använda en normalfördelning med medelvärdet 500 och standardavvikelse 100.
a) Det krävs minst 600 poäng för att komma in på utbildningen. Uppskatta, enligt modellen, hur stor andel av studenterna som uppnår den gränsen? (2p)
b) Vilken antagningsgräns ska man sätta om man vill att ungefär de 10% bästa ska komma in? (2p)
c) Vilken antagningsgräns ska man sätta om man vill att ca hälften ska komma in? (1p)
Lösning
Model: Låt vara en slumpvariabel som anger antal poäng på antagningsprovet för en slumpmässigt vald student. Då vet vi att ~ , , 500, 100.
a) 600 , ~ 0,1 1 1 1
| | 1 0.84 0.16
Svar: ca 16% studenter uppnår 600 poäng.
b) 0.1 → 0.9 → | | → 1.28
‐transformationen, , ger oss nu: 1.28 → 500 1.28 100 628 Svar: antagningsgräns skall vara ca 628 poäng.
c) 0.5 → 0.5 → | | → 0.00
Alltså, kommer antagningsgränsen vara i detta fall lika med 0 500 Svar: antagningsgräns skall vara 500 poäng.
Uppgift 3
Företaget AF Company producerar de mycket populära byggmaskinerna. Nu är man intresserad av huruvida försäljarnas säljerfarenheter (i år) påverkar hur många byggmaskiner de lyckas sälja.
Data nedan beskriver försäljningen år 2010 för tio slumpmässigt valda försäljare.
Ekvationen för en linjär regressionslinje (med Försäljning som responsvariabel) anges i följande Minitabutskrift:
Regression Analysis: Försäljning versus Erfarenhet
The regression equation is
Försäljning = 94,0 + 1,63 Erfarenhet
Predictor Coef SE Coef T P Constant 93,963 6,525 14,40 0,000 Erfarenhet 1,6338 0,8208 1,99 0,082
S = 9,78109 R-Sq = 33,1% R-Sq(adj) = 24,8%
a) Ange och tolka den skattade lutningen (i ord utifrån datamaterialet). (1p)
b) Företaget funderar på att anställa en nybörjare, Sam, som inte har någon tidigare
erfarenhet. Prediktera hur många byggmaskiner Sam förväntas att sälja. Finns det någon risk med att göra denna prediktion? Vilken i så fall? (2p)
c) Bestäm korrelationen för de uppmätta variablerna Erfarenhet och Försäljning. (2p) Lösning
a) 1.63
Tolkning: om erfarenheten ökar ett år så ökar den förväntade försäljningen med 1.63 byggmaskiner.
14 12 10 8 6 4 2 0 125 120 115 110 105 100 95 90
Erfarenhet
Försäljning
Försäljning av byggmaskiner för tio försäljare år 2010 Erfarenhet Försäljning
1 95
3 97
4 92
4 102
6 103
8 111
10 119
10 123
11 117
13 95
Risker: detta är en extrapolation, ingen av de 10 försäljarna i stickprovet är utan erfarenhet, så man kan kanske inte lite på skattningen.
c) Enligt Minitabutskriften är förklaringsgraden för denna modell lika med 0.331 För en enkel linjär regression är korrelationen för de två uppmätta variablerna lika med
√ √0.331 0.58
Svar: korrelationen är 0.58, vilket inte är så hög korrelation.
Uppgift 4
Nedan följer fem flervalsuppgifter (multiple choice). För var och en av uppgifterna är det alltid ett, och endast ett, alternativ som är korrekt. Rätt svar ger en poäng, medan fel svar eller uteblivet svar ger noll poäng. Om Du svarar med fler än ett alternativ så betraktas det som ett felaktigt svar.
4.1 I figuren nedan finns två olika normalfördelningar, A (heldragen linje) och B (streckad linje).
Vilket av nedanstående påståenden är korrekt?
a) Standardavvikelse för A är större än standardavvikelse för B.
b) Standardavvikelse för B är större än standardavvikelse för A.
c) Standardavvikelse för A och B är likadana.
Svar: b)
4.2 Medelåldern för fem personer i ett rum är 30 år. Om en av dessa fem, en som är 50 år gammal, lämnar rummet så kommer medelåldern för de återstående fyra att
a) öka b) minska
c) förbli oförändrad (dvs. 30 år)
d) går ej att avgöra utifrån den information som ges
Svar: b)
20 15
10 5
0 0,4
0,3
0,2
0,1
0,0
X
Density
Distribution Plot Normal; Mean=10
a) nominalskalevariabel b) ordinalskalevariabel c) intervallskalevariabel d) kvotskalevariabel e) inget av ovanstående
Svar: b)
4.4 Ett täckningsfel är:
a) ett systematiskt fel som beror på att urvalet ej är slumpmässigt.
b) ett fel som uppstår när man undersöker ett urval och inte hela populationen.
c) ett fel som uppstår när ett antal av de som ingår i urvalet vägrar att svara på vissa frågor.
d) inget av ovanstående.
Svar: d), ett täckningsfel är ett fel som uppstår när urvalsramen inte stämmer överens med målpopulationen, t ex övertäckning eller undertäckning.
4.5 Vid mätning av ”intelligens” används ibland ett Stanford‐Binet IQ‐test. En
normalfördelning med väntevärdet 100 och standardavvikelsen 15 har ofta visat sig vara en bra modell över hur resultaten från detta test varierar i en population. Detta innebär då att ungefär 95 % av populationen har IQ‐värden mellan
a) 85 och 115 b) 70 och 130 c) 55 och 145
d) inget av ovanstående
Svar: b), 2 ‐regel.
Uppgift 5
Genomsnittligt försäljningspris vid pump av bensin i Sverige. Utvecklingen för försäljningspris och konsumentprisindex ges i tabellen nedan. Försäljningspriset är uppdelat i moms, skatt, produktionskostnad och bruttomarginal (Källa: www.spbi.se)
a) Bestäm och jämför de genomsnittliga årliga procentuella förändringarna i försäljningspris under två perioder: mellan 2000 och 2006, samt mellan 2006 och 2012. Ta ej hänsyn till konsumentprisindex. (3p)
b) Vad kostade bensin år 2012 utryckt i 2000 års penningvärde? Tolka det erhållna resultatet. (2p)
Lösning
a) Genomsnittliga årliga procentuella förändringen i försäljningspris mellan 2000 och 2006:
9.56 1 11.55 → 1 11.55
9.56 1.032
Priset ökar med ca 3.2% per år (i genomsnitt) mellan 2000 och 2006.
Genomsnittliga årliga procentuella förändringen i försäljningspris mellan 2006 och 2012:
11.55 1 14.98 → 1 14.98
11.55 1.044
Priset ökar med ca 4.4% per år (i genomsnitt) mellan 2006 och 2012.
Svar: priset ökar snabbare, med ca 1.2%‐enheter per år (i genomsnitt), under 2006‐2012 jmf med 2000‐2006.
b) Svar: 14.98 12.45 (kr/l); bensinpris ökade mer än konsumentprisindex under period mellan 2000 och 2012.
År Bruttomarginal Produk tk ostnad Sk att Moms Försäljningspris (kr/l) Konsumentprisindex (1980=100)
1988 0,88 0,82 2,58 0 4,28 177
1995 1,06 0,96 4,04 1,51 7,57 255
2000 1,07 2,11 4,47 1,91 9,56 261
2004 1,00 2,25 4,79 2,01 10,05 279
2006 0,82 3,68 4,74 2,31 11,55 284
2008 0,81 4,20 5,03 2,51 12,54 301
2010 1,04 4,11 5,23 2,59 12,97 303
2011 1,15 4,89 5,23 2,82 14,09 311
2012 1,28 5,34 5,37 3,00 14,98 314