• No results found

ÖVNINGSUPPGIFTER KAPITEL 2

N/A
N/A
Protected

Academic year: 2021

Share "ÖVNINGSUPPGIFTER KAPITEL 2"

Copied!
8
0
0

Loading.... (view fulltext now)

Full text

(1)

ÖVNINGSUPPGIFTER KAPITEL 2

DATAMATRISEN

1. Datamatrisen nedan visar ett utdrag av ett datamaterial för USA:s 50 stater.

Stat Befolkningsmängd

(miljoner) Procent män Inkomst

per person Marijuana lagligt?

1. Kalifornien 38,8 49,7 43 104 0

2. Texas 27,0 49,6 39 493 0

3. Florida 19,9 48,9 39 272 0

4. New York 19,7 48,4 48 821 0

5. Illinois 12,9 49,0 43 159 0

6. Alaska 0,7 52,0 44 174 1

... ... ... ... ...

50. Wyoming 0,6 51,0 47 851 0

a. Vad är observationsenheten?

b. Hur stort är antalet observationer?

c. Hur många kvantitativa variabler finns det och vilka är de?

d. Hur många kvalitativa variabler finns det och vilka är de?

FÖRDELNINGEN FÖR EN VARIABEL

2. Nedan visas ett sampel för 22 barn. För varje barn har vi mätt åldern då de lärde sig gå. Åldern är uttryckt i månader:

17, 17, 15, 15, 16, 14, 14, 16, 16, 13, 15, 16, 14, 18, 13, 15, 11, 13, 15, 15, 15, 16

a. Beskriv åldersfördelningen genom att fylla i frekvenstabellen:

Ålder Frekvens

11 13 14 15 16 17 18

(2)

b. Illustrera åldersfördelningen med hjälp av ett frekvensdiagram.

3. I en kommun gick 800 elever ut nian förra våren. Här är en frekvenstabell över elevernas slutbetyg i modersmål. Fyll i den kumulativa och relativa frekvensen.

Betyg Frekvens Kumulativ

frekvens Relativ frekvens

4 26

5 40

6 86

7 232

8 238

9 130

10 48

4. 300 pensionärer får genomgå ett test där man mäter deras reaktionsförmåga i trafiken. Histogrammet nedan visar fördelningen för pensionärernas loggade reaktionstider. Agnes (A) fick en reaktionstid som var hälften av Bosses (B).

a. Calle hade dubbelt längre reaktionstid än Bosse. Märk ut Calles loggade reaktionstid i histogrammet. Skriv också ut värdet för Calles loggade reaktionsförmåga på x-axeln.

b. Dan hade 10 procent längre reaktionstid än Bosse. Vad är Dans reaktionstid mätt på den naturliga logaritm-skalan?

c. Mätt på den naturliga logaritm-skalan så ligger Evas reaktionstid 0,05 enheter under Bosses. Hur mycket snabbare är Eva än Bosse uttryckt i procent?

010203040

Frekvens

A B

-.5 0 .5 .69 1 1.5

Ln(reaktionsförmåga)

(3)

SUMMATECKNET

5. Vi gör fyra mätningar på en variabel X: 1, 2, 3, 6. Beräkna följande summor:

a. ∑ 𝑥𝑖 b. ∑ 𝑥𝑖− 3 c. ∑(𝑥𝑖− 3) d. ∑(𝑥𝑖− 3)2 e. ∑ 2𝑥𝑖 f. 2 ∑ 𝑥𝑖

6. Vi gör 4 mätningsar på en variabel X: -1, 0, 4, 5. Beräkna följande summor:

a. ∑ 𝑥𝑖2 b. (∑ 𝑥𝑖)2

7. Vi gör 500 mätningsar på en variabel X. Summan av dessa är 2636. Beräkna:

a. ∑ 2𝑥𝑖 b. ∑(𝑥𝑖+ 1) c. ∑(𝑥𝑖− 2)

LÄGESMÅTT

8. Ett antal studier har visat att det är svårt att bibehålla en viktnedgång i långa loppet. En anledning kan vara att kroppens kaloribehov minskar då man går ner i vikt. Nedan visas data för tio personer, hämtat ur artikeln Effects of Dietary Composition on Energy Expenditure During Weight-Loss Maintenance. Här har man mätt skillnaden mellan en persons kaloribehov före en viktnedgång och efter. Exempelvis ser vi att den första personens energibehov minskade med 335 kalorier. (Kuriosa: Personerna gick ner 12,5 procent av sin vikt. Alla dessa personer åt en lågfettkost. I den egentliga studien ingick 21 personer i lågfettsgruppen.)

-335, -800, 37, -977, -447, -698, 177, -223, -84, -623 a. Hur mycket förändrades kaloribehovet i snitt?

b. Hur stor är medianen?

(4)

9. I en undersökning frågar man 750 personer om de anser att det var bättre förr.

Resultatet visas i frekvenstabellen nedan (variabeln bättre antar värdet 1 för personer som ansåg att det var bättre förr och värdet 0 för övriga). Hur stort är medelvärdet för variabeln bättre? Förklara också vad medelvärdet betyder i detta fall; beakta då att variabeln är binär.

bättre frekvens

0 405

1 345

10. Du kör längs med motorvägen Åbo-Helsingfors och får se fyra skyltar som visar temperaturen. Den första skylten visar 10 grader; den andra 11 grader; den tredje 10 grader och den fjärde 36 grader. För att uppskatta temperaturen längs med motorvägen så skulle då medelvärdet av de olika mätningarna vara ett lämpligt mått. Eller? Förklara varför medianen ger en bättre uppskattning i detta exempel. Hur stor är medianen?

11. Ange om följande variabler är kvantitativa eller kvalitativa. Om kvalitativa; ange också om de har data på ordinal- eller nominalnivå.

a. Kvinna (antar värdet 1 för kvinnor och 0 för män)

b. Trivsel på jobbet (antar värdena 1, 2, ..., 5 där 1 är ”usel” och 5 är ”utmärkt”) c. Lön (mäts i euro per månad)

d. Blodtyp (A, B, AB och O)

e. Parti (variabeln visar vilket parti personen röstar på)

f. Lycka (antar värdena 1, 2, ..., 10 där 1 är maximalt olyckligt och 10 är maximalt lycklig)

g. Kursbetyg (Underkänd, 1, 2, ..., 5) h. Postnummer (t.ex. 20500)

12. Se histogrammet nedan. De tre utritade sträcken i rött representerar medelvärdet, medianen och typvärdet (men inte nödvändigtvis i den ordningen). Skriv in rätt lägesmått vid respektive sträck. Ange också om den här fördelningen är skev åt vänster, skev åt höger eller symmetrisk.

(5)

13. Låddiagrammet nedan visar fördelningen för alkoholkonsumtionen i världens länder. Alkoholkonsumtionen mäts som liter per vuxen invånare.

a. Hur stor är den första kvartilen? Ge också en tolkning av detta värde.

b. Hur stor är den andra kvartilen? Ge också en tolkning av detta värde.

c. Hur stor är den tredje kvartilen? Ge också en tolkning av detta värde.

d. Hur mycket dricks det i det land som har högst alkoholkonsumtion?

14. I en tidsanvändningsstudie låter man 300 personer anteckna hur många minuter de använder till att surfa på nätet. I genomsnitt använder personerna 350 minuter per vecka och den 75:e percentilen är 630 minuter. Vilket eller vilka av följande påståenden är sanna:

a. 75 procent av personerna surfar på nätet 630 minuter per vecka.

050100150200

Frekvens

0 50 100 150 200

Y

(6)

b. 25 procent av personerna surfar på nätet mer än 630 minuter per vecka.

c. 75 procent av personerna surfar på nätet mindre än 630 minuter per vecka.

d. Den fjärde kvartilen är 630 minuter.

15. Vi har samplat 1000 personer och mätt deras inkomster i euro per månad. Vi har delat in personerna i tio decilgrupper, betecknade D1, D2, ..., D10.

Frekvensdiagrammet nedan visar hur många personer som ingår i respektive decilgrupp. Eller? Förklara vad som inte stämmer med detta frekvensdiagram.

SPRIDNINGSMÅTT

16. I uppgift 8 tittade du på förändringen i kaloribehov efter viktnedgång bland 10 personer:

-335, -800, 37, -977, -447, -698, 177, -223, -84, -623

Ett faktum som sticker ut är att det finns en enorm variation från en person till en annan; om du har tur så ökar energibehovet och om du har otur så minskar det med närmare 1000 kalorier. Beräkna variansen och standardavvikelsen för förändringen i kaloribehovet. I snitt minskade energibehovet med 397,3 kalorier.

17. Nedan ser du den procentuella dagliga avkastningen på två aktier, Walmart och Amazon, under de första tio handelsdagarna år 2015. Walmart har i snitt gett en daglig avkastning på 0,72 procent; Amazon har i snitt gett en daglig avkastning på -0,60 procent. Kolumnen ”Portfölj” visar din dagliga procentuella avkastning om du investerat hälften av dina pengar i Walmart och hälften i Amazon.

Portföljen har i snitt gett en daglig avkastning på 0,07 procent.

0 50 100 150 200 250 300

D1 D2 D3 D4 D5 D6 D7 D8 D9 D10

Frekvens

(7)

Handelsdag Walmart Amazon Portfölj

1 -0,3 -2,1 -1,2

2 0,8 -2,3 -0,7

3 2,7 1,1 1,9

4 2,1 0,7 1,4

5 -1,2 -1,2 -1,2

6 0,7 -1,9 -0,5

7 -0,8 1,1 0,1

8 3,0 -0,5 1,3

9 0,9 -2,2 -0,6

10 -0,7 1,3 0,2

a. Beräkna volatiliteten för Walmarts aktiekurs. Volatiliteten är standard- avvikelsen för aktiens dagliga procentuella avkastning.

b. Beräkna volatiliteten för Amazons aktiekurs.

c. Beräkna volatiliteten för portföljen.

Kommentar: Det här exemplet demonstrerar principen om att ”inte lägga alla ägg i samma korg”. Notera att portföljens volatilitet är lägre än volatiliteten för Walmart eller Amazon. Det här är ingen tillfällighet, utan en matematisk nödvändighet: Om du investerar i två aktier med samma volatilitet så kommer aktieportföljen att ha lägre volatilitet än de enskilda aktierna (med ett undantag: Om de två aktierna är exakta kopior av varandra så kommer portföljen ha samma volatilitet som de enskilda aktierna).

18. Vilket eller vilka av följande tre påståenden är korrekta?

a. Variansen kan vara negativ i sampel med negativa värden.

b. Standardavvikelsen är lika stor i samplet (4, 5, 9, 10) som i samplet (14, 15, 19, 20).

c. I en löpartävling springer deltagarna 2 kilometer. Löptiden för tävlingsdeltagarna är normalfördelad med medelvärdet 8 minuter och standardavvikelsen 1 minut. Påstående: Ungefär 95 procent av deltagarna har en löptid någonstans mellan 6 och 10 minuter.

19. I fråga 17 tittade vi på aktiekursen för Walmart. Vi använde då tio handelsdagar.

Histogrammet nedan visar fördelningen för den dagliga avkastningen under de senaste 1167 handelsdagarna. I snitt ligger avkastningen på 0,018 procent med en standardavvikelse på 0,960 procent. Den sista dagen var stängningspriset 63,95 dollar. Utifrån detta kan vi prognostisera att Walmart-aktien kommer kosta 63,96 dollar dagen därpå (dvs. en ökning med 0,018 procent). Den här prognosen är förstås osäker. Gör nu upp ett prognosintervall för detta pris, dvs.

ett intervall som ringar in var priset kommer landa med 95-procentig sannolikhet.

(8)

Kommentar: Walmart-aktien visade sig kosta 63,10 dollar nästa dag (som var den 25 augusti 2015).

References

Related documents

Ju större sampel desto lägre standardfel (allt annat lika). Standardfelet är ett slags mått på osäkerheten i uppskattningen av den sanna andelen studerande som jobbar

I regressionen nedan är svart en dummy för svarta och övrig en dummy som antar värdet 1 för personer som varken är vita eller svarta och värdet 0 för dem som är vita eller

Tabellen nedan visar denna procent från det första kvartalet 2012 till det tredje kvartalet 2014.. Beräkna ett säsongsutjämnat glidande medelvärde för det tredje kvartalet

Resultatet visas i frekvenstabellen nedan (variabeln bättre antar värdet 1 för personer som ansåg att det var bättre förr och värdet 0 för övriga).. Hur stort är

För att mäta sambandet mellan lycka och religiositet så är det lämpligt att använda Spearmans rangkorrelation istället för Pearsons?. Förklara kortfattat

Figuren nedan visar procenten kvinnor som jobbar på tillfälliga kontrakt mellan första kvartalet år 1997 till tredje kvartalet år 2014.. Vi anpassar nu en rät trendlinje till

Du väljer slumpmässigt ut två personer ur Finlands befolkning och mäter den ena personens vikt (X 1 ) och den andra personens längd (X 2 ).. I en högstadieklass går

Du samplar slumpmässigt 400 finska pappor och mäter hur stor andel av dessa som stannade hemma minst tre