• No results found

Statistik 2, 180531

N/A
N/A
Protected

Academic year: 2021

Share "Statistik 2, 180531"

Copied!
9
0
0

Loading.... (view fulltext now)

Full text

(1)

Statistik 2

7,5 högskolepoäng

Provmoment: Tentamen

Ladokkod: SST021

Tentamen ges för: ACEKO16h, ACIVE16h TentamensKod: Tentamensdatum: 2018-05-31 Tid: 14.00-19.00 Hjälpmedel: • Valfri miniräknare • Linjal

• Tabeller från Doane/Seward (z, t, Chi-2, F, Tukeys och Hurtleys). Kan innehålla markeringar men inga anteckningar.

• Kursens formelsamling.

Totalt antal poäng på tentamen: 50 poäng För att få respektive betyg krävs:

• U: 0-24 • G: 25-36 • VG: 37-50 Allmänna anvisningar:

• Alla svar ska motiveras om inte annat anges. • Beräkningar ska redovisas i sin helhet. • Använd i ämnet etablerade beteckningar. • Skriv tydligt och läsligt.

• Skriv endast på ena sidan av svarsbladet.

• I varje svar måste det framgå tydligt vilken fråga eller delfråga du besvarar.

Nästkommande tentamenstillfälle: 2018-08-28

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller: Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Lycka till! Ansvarig lärare: Telefonnummer:

(2)

DEL 1 – Räkneuppgifter (35 poäng)

Uppgift 1 (Max 4 poäng)

En forskare vill undersöka om den genomsnittliga tiden (antal timmar) som patienterna som kommer till Akut 1 i en stad måste vänta innan de träffar en läkare är längre än den

genomsnittliga tiden som patienterna som kommer till Akut 2 måste vänta. För att

undersöka detta väljer forskaren ett slumpmässigt urval bestående av 25 olika patienter som kommer till akut 1 och 20 som kommer till akut 2 och får följande information.

Akut 1 Akut 2

n 25 20

x 5,0 3,9

s 2,2 1,4

Anta att grupperna har samma varians och genomför en hypotesprövning med 5 % signifikansnivå. Förklara utförligt vad du gör.

Uppgift 2 (Max 5 poäng)

Ett företag vet sedan tidigare att annonser i morgontidningar har samma genomslag som annonser i TV. Företaget vill nu satsa på en stor reklamkampanj för sin viktigaste produkt och vill undersöka om detta fortfarande gäller. För att undersöka om reklam i TV har samma genomslag som reklam i morgontidningar låter företaget annonsera produkten i en stads största morgontidning. Sedan låter företaget annonsera produkten i en annan stads mest populära lokala TV-kanal. Efter flera månader väljer företaget ett slumpmässigt urval bestående av 150 individer som såg reklamen i morgontidningen och frågar dem om de hade köpt produkten. 45 svarade ja på den frågan. Sedan frågade man ett slumpmässigt urval bestående av 175 individer som såg reklamen på TV och frågade dem om de hade köpt produkten. 37 svarade ja. Genomför ett dubbelsidigt test med 1 % signifikansnivå. Använd p-värdet för att dra dina slutsatser.

(3)

Uppgift 3 (Max 6 poäng)

Följande datamaterial visar antal miljoner kronor som ett slumpmässigt urval av 8 företag satsar på forskning och utveckling (FoU) under ett år och vinsten, i miljoner kronor, under samma år.

FoU 11 8 4 10 6 5 3 2

Vinst 45 42 41 55 29 35 25 22

a) Redovisa datamaterialet i ett punktdiagram med all nödvändig information för att förstå figuren och beräkna Pearsons korrelationskoefficient och tolka ditt resultat. (Max 3 poäng)

b) Genomför en hypotesprövning med 10 % signifikansnivå där nollhypotesen är att korrelationskoefficienten i populationen är lika med noll. (Max 3 poäng)

Uppgift 4 (Max 6 poäng)

Ett slumpmässigt urval av 500 bilbatterier hade en livslängd (antal år) som redovisas i frekvenstabellen här nedan. Livslängd Frekvens 0 - 0,99 12 1 - 1,99 94 2 - 2,99 170 3 - 3,99 188 4 - 4,99 28 5 - 5,99 8

Medelvärdet är 2,8 och standardavvikelsen 0,97. Vid en 5 % signifikansnivå, följer bilbatteriernas livslängd en normalfördelning?

(4)

Uppgift 5 (Max 8 poäng)

Ett företag vill göra en modell av huspriserna i ett område. Datamaterialet som företaget har till sitt förfogande innehåller information om 244 hus som såldes i området under de senaste åren. Datamaterialet innehåller de variablerna som redovisas i tabellen här nedan.

Variable Förklaring

SQFT Boendearea - kvadratfot

LOT Tomtstorlek - kvadratfot

AGE Husets ålder, antal år GAR Garagestorlek - kvadratfot

BATH Antal toaletter

BED Antal sovrum

BASE 1 om huset har ett förråd, 0 annars SALEYR Variabel som anger vilket år huset såldes

VIEW 1 om huset har utsikt mot en kyrkogård, 0 annars DISTANCE Avståndet till närmast kyrkogård

En analytiker på företaget kör en regression där den beroende variabeln är priset (i US dollar) som huset såldes för. Analytikern fick följande resultat.

Variable Coefficient Standard Error t-value P-value

Intercept -10 728,989 633,894 -16,93 0,0000 SQFT 33,59 2,40 14,01 0,0000 LOT 1,58 0,42 3,75 0,0002 AGE -1 153,96 337,23 -3,42 0,0007 BATH -3 104,85 2 765,77 -1,12 0,2628 BED 1 540,71 1 780,12 0,87 0,3877 GAR 19,70 13,75 BASE 8 072,82 2 640,34 3,06 0,0025 SALEYR 5 397,34 316,09 17,08 0,0000 VIEW 1 229,34 2 446,68 0,50 0,6158

(5)

a) Tolka determinationskoefficienten. (Max 1 poäng)

b) Hur tolkar man koefficienterna för variablerna SQFT, AGE och VIEW? (Max 1 poäng)

c) Använd informationen som redovisas och genomför ett F-test för att se om hela regressionen är signifikant. Använd 5 % signifikansnivå. (Max 2 poäng)

d) Genomför en hypotesprövning för variabeln GAR för att se om den är signifikant. Förklara utförligt. (Max 2 poäng)

e) Tidigare studier i samma område har visat att ett förråd påverkar huspriset med 6 000 dollar i genomsnitt. Testa med informationen som finns i tabellen om detta fortfarande gäller. (Max 2 poäng)

Uppgift 6 (Max 6 poäng)

Följande tabell redovisar antal anställda, tusentals, som är sysselsatta inom turistnäringen i ett land under perioden 2012-2015. Använd informationen som redovisas i tabellen och beräkna ett säsongsindex, tolka dina resultat och säsongrensa datamaterialet. Anta att serien är

multiplikativ. År Kvartal Anställda 2012 2 117,6 2012 3 132,2 2012 4 109,6 2013 1 123,5 2013 2 154,4 2013 3 175,2 2013 4 133,5 2014 1 156,4 2014 2 178,9 2014 3 223,8 2014 4 158,4 2015 1 174,7 2015 2 210,8

(6)

DEL 2 – Frågor (15 poäng)

Besvara på följande frågor med ord, inga figurer, i det angivna utrymmet. Fråga 1 (Max 3 poäng)

Förklara var och ett av antagandena som variansanalys (ANOVA) bygger på vid jämförelse av flera medelvärden. Diskutera kortfattat också hur alvarligt det är att dessa antaganden inte uppfylls. _______________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ _______________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________

(7)

Fråga 2 (Max 3 poäng)

Förklara följande begrepp med ord, inga figurer: a) Mulikollinearitet b) Heteroskedasticitet c) Autokorrelation _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________

(8)

Fråga 3 (Max 3 poäng)

Anta att du undersöker ett datamaterial som visar P/E talet för ett slumpmässigt urval av 8 olika företag från tre olika branscher, totalt 24 observationer. Vad skulle du kunna använda Tukeys test till? Vilka hypoteser skulle du använda? Vad skulle det kritiska värdet bli?

________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________

Fråga 4 (Max 3 poäng)

Fyll i ordet/orden som saknas i följande meningar.

 Om p-värdet i en hypotesprövning är 0,028 innebär att vi förkastar nollhypotesen vid en signifikansnivå på _______________ procent.

 En tidserie som följer en ______________ trend har ungefär samma absoluta ökning per period.

 I regressionsanalys används Laverage statistkan för att undersöka om det finns ______________ ______________ i ett datamaterial.

 I analysen av tidsserier utan någon tydlig trend kan man använda _________________ ______________________ när man vill ge olika observationer olika vikter i beräkningen av prognoserna.

(9)

 Att ett test är högersidigt innebär att __________________________ ligger på vänstersidan.

Fråga 5 (Max 3 poäng)

Anta att du analyserar en tidsserie som visar antal nyregistrerade elbilar per månad i ett land. Dina resultat visar att MAPE (Mean Absolute Percent Error) är 5,7; MAD (Mean Absolute Deviation) är 29 och MSD (Mean Squared Deviation) är 41. Hur ska dessa siffror tolkas? _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________ _______________________________________________________________________

References

Related documents

Akutmottagningen anses inte, ur medicinsk synpunkt, vara rätt vårdnivå för dessa patienter då inget akut vårdbehov föreligger, men samtidigt finns en mellanmänsklig relation

Projekt Mälarbanan kommer att bygga ut järnvägen mellan Tomteboda och Kallhäll från två till fyra spår.. Projektet har delats in

För att komma vidare i arbetet med projektet har två delsträckor i det tidigare arbetet prioriterats, dels denna vägplan som innebär en ny gång- och cykelväg mellan Hällbybrunn

Inom projektet planeras även för byggnation av ny gång- och cykelväg från Hovmantorps östra infart till strax öster om Bergdalavägen samt på en kortare sträcka öster

Den färdigställda granskningshandlingen kungörs och görs tillgänglig för allmänheten och de som berörs av projektet under hösten 2021, i samband med detta ges möjligheter

För att komma vidare i arbetet med projektet har två delsträckor i det tidigare arbetet prioriterats, dels denna vägplan som innebär en ny gång- och cykelväg mellan Hällbybrunn

En litteraturstudie medför ofta inga etiska dilemman, men de etiska värderingar förfat- tarna reagerade över var att de studierna som utgör underlag för resultatet är på patienter

När patienten kommer till akutmottagningen och tillståndet inte bedöms vara akut, upplever patienten att ansvaret osammanhängande fördelas mellan olika ansikten.. Patienten