STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen
Linda Wänström
Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 26 mars 2008, kl 16.00 – 18.00. Resultatet anslås senast 4 april på anslagstavlan, plan 3.
Skrivtid: 2 timmar.
Hjälpmedel: godkänd miniräknare utan lagrade formler eller text.
Tentamen består av 18 uppgifter som kan ge totalt 25 poäng, således sju stycken
tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller:
Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14
F 0-11
Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Svaren kan vara avrundade. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Observera att endast den särskilda svarsbilagan skall lämnas in. Beräkningar beaktas ej. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen.
LYCKA TILL!
1. Vad menas med att en variabel A korrelerar med en variabel B?
a. Förklaringsgraden är minst 90 procent b. A och B samvarierar
c. A orsakar B d. B orsakar A
2. Vi har ett statistiskt material om fyra stycken observationspar (xi, yi) som är (1, 3), (2, 3), (3, 2) och (4, 1). Om vi med hjälp av minsta-kvadratmetoden skattar en regressionsekvation till detta material får den vilken form? (2 poäng)
a. y = 4 - 0,7x b. y = 1 + 0,8x c. y = 2,5 + 0,1x d. y = 9 - 3,2x
3. För en grupp personer studerades sambandet mellan ålder (i år) och inkomst (före skatt i tusen kronor per månad). Grafiskt ser sambandet ut enligt följande:
40 38
36 34
32 30
28 26
24 22
27 26 25 24 23 22 21
Ålder
Inkomst
En Minitabkörning gav följande resultat:
Regression Analysis: inkomst versus ålder
The regression equation is inkomst = 17,5 + 0,228 ålder
Predictor Coef SE Coef T P Constant 17,452 3,105 5,62 0,001 ålder 0,2279 0,1055 2,16 0,074
S = 1,50662 R-Sq = 43,8% R-Sq(adj) = 34,4%
Hur tolkas regressionskoefficienten (lutningskoefficienten / riktningskoefficienten / b)?
a. För varje år äldre en person är ökar inkomsten med i genomsnitt 228 kronor i månaden b. För varje år äldre en person är ökar inkomsten med i genomsnitt 175 kronor i månaden c. I genomsnitt tjänar de anställda 22,800 kronor i månaden
d. För varje år äldre en person är ökar inkomsten med i genomsnitt 22,8 procent i månaden
4. Vad är residualvariansen för materialet i fråga 3?
a. Cirka 17,45 b. Cirka 1,51 c. Cirka 2,27 d. Cirka 43,80
5. Bestäm för materialet i fråga 3 residualen för den observation som avser en månadslön på 21,000. (2 poäng)
a. Cirka -256 b. Cirka -1744 c. Cirka 1990 d. Cirka -1290
6. Gör en uppskattning av vad korrelationskoefficienten blir om vi tar bort 40-åringen?
(2 poäng)
a. Cirka 0,63 b. Cirka -0,63 c. Cirka 0,89 d. Cirka -0,89
7. Följande indexserie visar prisutvecklingen för två varor A och B
År 2002 2003 2004 2005 2006
Pris (A) 100 105 109 111 116
Pris (B) 100 108 119 130 135
Vilket av följande påståenden är sant?
a. Vara A har ökat med 5,5 procent mellan 2005 och 2006
b. Vara A har procentuellt sett ökat mer än vara B mellan 2005 och 2006
c. Vara A har ökat exakt lika mycket procentuellt sett mellan 2005 och 2006 som mellan 2002 och 2003
d. Vara B har ökat med 11,3 procent mellan 2003 och 2004
8. Betrakta nedanstående uppgifter om pris och kvantitet för två varor (ett specifikt schampo och en specifik tvål)
Pris schampo år 2000: 30 kronor Pris tvål år 2000: 23 kronor Pris schampo år 2005: 35 kronor Pris tvål år 2005: 31 kronor
Försäljning schampo år 2000: 710 st Försäljning tvål år 2000: 500 st Försäljning schampo år 2005: 1080 st Försäljning tvål år 2005: 550 st
Beräkna ett Paasches fastbasindex för de två varorna sammantaget (2000 = 100)? (2 poäng) a. 118,9
b. 120,5 c. 121,8 d. 123,0
9. Om vi istället beräknar ett Laspeyres fastbasindex för materialet i fråga 8 blir det:
a. lägre, eftersom den vara som haft den största prisökningen därmed får större vikt b. lägre, eftersom den vara som haft den största prisökningen därmed får mindre vikt c. högre, eftersom den vara som haft den största prisökningen därmed får större vikt d. högre, eftersom den vara som haft den största prisökningen därmed får mindre vikt
10. Vilket av följande påståenden är inte sant om KPI?
a. KPI bygger på stickprovsundersökningar.
b. KPI är en kedjeindex.
c. Det kan uppstå fel vid beräkningar av KPI eftersom alkoholhaltiga drycker och tobak ej ingår i urvalet av varor och tjänster.
d. Det kan uppstå fel i beräkningar av KPI eftersom det inte alltid är möjligt att få fram tillförlitliga och aktuella uppgifter om konsumtionen av olika varor.
11. För en viss djurpopulation gäller att man under en 100-årsperiod haft en
populationsökning (djurökning) på 130 procent. Hur stor har den årliga genomsnittliga populationsökningen varit?
a. Cirka 0,21%
b. Cirka 0,84%
c. Cirka 0,98%
d. Cirka 1,30%
12. Vilken är den lägsta datanivå vid vilken rangkorrelationskoefficienten kan beräknas?
a. Nominal b. Ordinal c. Intervall d. Kvot
13. För att studera sambandet mellan kön och inkomst erhölls följande värden insatta i en korstabell:
Man Kvinna
0 - 20,000 kr 25 23
20,001 – 30,000 kr 35 20
30,001 kr + 50 30
Vad är det förväntade värdet för cell 1 (dvs Man, 0-20,000 kr) om det inte finns något samband mellan kön och månadslön? (2 poäng)
a. 0,83 b. 0,52 c. 26,73 d. 28,85
14. Ett visst företag vill skatta vinstutvecklingen. De antar att den följer en linjär utveckling och de vill därför anpassa en linjär trendmodell. Gör en lämplig transformation av
tidsvariabeln (där en enhets förändring av t = ett år) och skatta med hjälp av minsta kvadratmetoden en linjär trendmodell för materialet nedan:
År Vinst (milj. kronor) 2004 120
2005 135 2006 146 2007 160
Vilken form får denna modell? (2 poäng) a. ŷ = 140,25 + 13,1t
b. ŷ = 140,25 + 13,3t c. ŷ = 140,25 + 13,5t d. ŷ = 140,25 + 13,7t
15. Gör med hjälp av den i fråga 14 skattade modellen en prognos av vinsten i miljoner kronor år 2008?
a. 173,0 b. 173,5 c. 174,0 d. 174,5
16. Antag att vi för ett annat material använder en prognosmodell enligt ŷ = 230 · 1,17t där t
= 1 betyder år 2003 och t = – 1 betyder år 2002. Vilket av nedanstående beskriver bäst denna modell?
a. En exponentiell trend med 8 procents årlig ökningstakt b. En exponentiell trend med 17 procents årlig ökningstakt c. En exponentiell trend med 34 procents årlig ökningstakt d. En exponentiell trend med 37 procents årlig ökningstakt
17. Vi har på kvartalsdata anpassat en trend med hjälp av glidande medelvärden (5 termer) på en viss tidsserie. Vi vill nu också säsongrensa materialet och skattar därför
säsongkoefficienter i en multiplikativ modell. Nedan följer en förteckning över de faktiska värdena dividerade med de skattade trendvärdena:
År Kvartal1 Kvartal2 Kvartal3 Kvartal4
2004 1,45
2005 1,17 0,49 0,77 1,67 2006 0,96 0,63 0,79 1,53 2007 1,06 0,67
Beräkna en justerad (korrigerad) säsongkoefficient för kvartal 4? (2 poäng) a. 1,498
b. 1,554 c. 1,571 d. 1,603
18. Hur många observationer innehåller den ursprungliga tidsserien på vilken trend och säsongkoefficienter skattats?
a. 13 b. 14 c. 15 d. 16