Statistik 2
7,5 högskolepoäng
Provmoment: TentamenLadokkod: SST021
Tentamen ges för: ACEKO16h, ACIVE16h TentamensKod: Tentamensdatum: 2018-05-31 Tid: 14.00-19.00 Hjälpmedel: • Valfri miniräknare • Linjal
• Tabeller från Doane/Seward (z, t, Chi-2, F, Tukeys och Hurtleys). Kan innehålla markeringar men inga anteckningar.
• Kursens formelsamling.
Totalt antal poäng på tentamen: 50 poäng För att få respektive betyg krävs:
• U: 0-24 • G: 25-36 • VG: 37-50 Allmänna anvisningar:
• Alla svar ska motiveras om inte annat anges. • Beräkningar ska redovisas i sin helhet. • Använd i ämnet etablerade beteckningar. • Skriv tydligt och läsligt.
• Skriv endast på ena sidan av svarsbladet.
• I varje svar måste det framgå tydligt vilken fråga eller delfråga du besvarar.
Nästkommande tentamenstillfälle: 2018-08-28
Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller: Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.
Lycka till! Ansvarig lärare: Telefonnummer:
DEL 1 – Räkneuppgifter (35 poäng)
Uppgift 1 (Max 4 poäng)En forskare vill undersöka om den genomsnittliga tiden (antal timmar) som patienterna som kommer till Akut 1 i en stad måste vänta innan de träffar en läkare är längre än den
genomsnittliga tiden som patienterna som kommer till Akut 2 måste vänta. För att
undersöka detta väljer forskaren ett slumpmässigt urval bestående av 25 olika patienter som kommer till akut 1 och 20 som kommer till akut 2 och får följande information.
Akut 1 Akut 2
n 25 20
x 5,0 3,9
s 2,2 1,4
Anta att grupperna har samma varians och genomför en hypotesprövning med 5 % signifikansnivå. Förklara utförligt vad du gör.
Uppgift 2 (Max 5 poäng)
Ett företag vet sedan tidigare att annonser i morgontidningar har samma genomslag som annonser i TV. Företaget vill nu satsa på en stor reklamkampanj för sin viktigaste produkt och vill undersöka om detta fortfarande gäller. För att undersöka om reklam i TV har samma genomslag som reklam i morgontidningar låter företaget annonsera produkten i en stads största morgontidning. Sedan låter företaget annonsera produkten i en annan stads mest populära lokala TV-kanal. Efter flera månader väljer företaget ett slumpmässigt urval bestående av 150 individer som såg reklamen i morgontidningen och frågar dem om de hade köpt produkten. 45 svarade ja på den frågan. Sedan frågade man ett slumpmässigt urval bestående av 175 individer som såg reklamen på TV och frågade dem om de hade köpt produkten. 37 svarade ja. Genomför ett dubbelsidigt test med 1 % signifikansnivå. Använd p-värdet för att dra dina slutsatser.
Uppgift 3 (Max 6 poäng)
Följande datamaterial visar antal miljoner kronor som ett slumpmässigt urval av 8 företag satsar på forskning och utveckling (FoU) under ett år och vinsten, i miljoner kronor, under samma år.
FoU 11 8 4 10 6 5 3 2
Vinst 45 42 41 55 29 35 25 22
a) Redovisa datamaterialet i ett punktdiagram med all nödvändig information för att förstå figuren och beräkna Pearsons korrelationskoefficient och tolka ditt resultat. (Max 3 poäng)
b) Genomför en hypotesprövning med 10 % signifikansnivå där nollhypotesen är att korrelationskoefficienten i populationen är lika med noll. (Max 3 poäng)
Uppgift 4 (Max 6 poäng)
Ett slumpmässigt urval av 500 bilbatterier hade en livslängd (antal år) som redovisas i frekvenstabellen här nedan. Livslängd Frekvens 0 - 0,99 12 1 - 1,99 94 2 - 2,99 170 3 - 3,99 188 4 - 4,99 28 5 - 5,99 8
Medelvärdet är 2,8 och standardavvikelsen 0,97. Vid en 5 % signifikansnivå, följer bilbatteriernas livslängd en normalfördelning?
Uppgift 5 (Max 8 poäng)
Ett företag vill göra en modell av huspriserna i ett område. Datamaterialet som företaget har till sitt förfogande innehåller information om 244 hus som såldes i området under de senaste åren. Datamaterialet innehåller de variablerna som redovisas i tabellen här nedan.
Variable Förklaring
SQFT Boendearea - kvadratfot
LOT Tomtstorlek - kvadratfot
AGE Husets ålder, antal år GAR Garagestorlek - kvadratfot
BATH Antal toaletter
BED Antal sovrum
BASE 1 om huset har ett förråd, 0 annars SALEYR Variabel som anger vilket år huset såldes
VIEW 1 om huset har utsikt mot en kyrkogård, 0 annars DISTANCE Avståndet till närmast kyrkogård
En analytiker på företaget kör en regression där den beroende variabeln är priset (i US dollar) som huset såldes för. Analytikern fick följande resultat.
Variable Coefficient Standard Error t-value P-value
Intercept -10 728,989 633,894 -16,93 0,0000 SQFT 33,59 2,40 14,01 0,0000 LOT 1,58 0,42 3,75 0,0002 AGE -1 153,96 337,23 -3,42 0,0007 BATH -3 104,85 2 765,77 -1,12 0,2628 BED 1 540,71 1 780,12 0,87 0,3877 GAR 19,70 13,75 BASE 8 072,82 2 640,34 3,06 0,0025 SALEYR 5 397,34 316,09 17,08 0,0000 VIEW 1 229,34 2 446,68 0,50 0,6158
a) Tolka determinationskoefficienten. (Max 1 poäng)
b) Hur tolkar man koefficienterna för variablerna SQFT, AGE och VIEW? (Max 1 poäng)
c) Använd informationen som redovisas och genomför ett F-test för att se om hela regressionen är signifikant. Använd 5 % signifikansnivå. (Max 2 poäng)
d) Genomför en hypotesprövning för variabeln GAR för att se om den är signifikant. Förklara utförligt. (Max 2 poäng)
e) Tidigare studier i samma område har visat att ett förråd påverkar huspriset med 6 000 dollar i genomsnitt. Testa med informationen som finns i tabellen om detta fortfarande gäller. (Max 2 poäng)
Uppgift 6 (Max 6 poäng)
Följande tabell redovisar antal anställda, tusentals, som är sysselsatta inom turistnäringen i ett land under perioden 2012-2015. Använd informationen som redovisas i tabellen och beräkna ett säsongsindex, tolka dina resultat och säsongrensa datamaterialet. Anta att serien är
multiplikativ. År Kvartal Anställda 2012 2 117,6 2012 3 132,2 2012 4 109,6 2013 1 123,5 2013 2 154,4 2013 3 175,2 2013 4 133,5 2014 1 156,4 2014 2 178,9 2014 3 223,8 2014 4 158,4 2015 1 174,7 2015 2 210,8
DEL 2 – Frågor (15 poäng)
Besvara på följande frågor med ord, inga figurer, i det angivna utrymmet. Fråga 1 (Max 3 poäng)
Förklara var och ett av antagandena som variansanalys (ANOVA) bygger på vid jämförelse av flera medelvärden. Diskutera kortfattat också hur alvarligt det är att dessa antaganden inte uppfylls. _______________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ _______________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________
Fråga 2 (Max 3 poäng)
Förklara följande begrepp med ord, inga figurer: a) Mulikollinearitet b) Heteroskedasticitet c) Autokorrelation _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________
Fråga 3 (Max 3 poäng)
Anta att du undersöker ett datamaterial som visar P/E talet för ett slumpmässigt urval av 8 olika företag från tre olika branscher, totalt 24 observationer. Vad skulle du kunna använda Tukeys test till? Vilka hypoteser skulle du använda? Vad skulle det kritiska värdet bli?
________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________
Fråga 4 (Max 3 poäng)
Fyll i ordet/orden som saknas i följande meningar.
Om p-värdet i en hypotesprövning är 0,028 innebär att vi förkastar nollhypotesen vid en signifikansnivå på _______________ procent.
En tidserie som följer en ______________ trend har ungefär samma absoluta ökning per period.
I regressionsanalys används Laverage statistkan för att undersöka om det finns ______________ ______________ i ett datamaterial.
I analysen av tidsserier utan någon tydlig trend kan man använda _________________ ______________________ när man vill ge olika observationer olika vikter i beräkningen av prognoserna.
Att ett test är högersidigt innebär att __________________________ ligger på vänstersidan.
Fråga 5 (Max 3 poäng)
Anta att du analyserar en tidsserie som visar antal nyregistrerade elbilar per månad i ett land. Dina resultat visar att MAPE (Mean Absolute Percent Error) är 5,7; MAD (Mean Absolute Deviation) är 29 och MSD (Mean Squared Deviation) är 41. Hur ska dessa siffror tolkas? _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________