• No results found

ÖVNINGSUPPGIFTER KAPITEL 3

N/A
N/A
Protected

Academic year: 2021

Share "ÖVNINGSUPPGIFTER KAPITEL 3"

Copied!
8
0
0

Loading.... (view fulltext now)

Full text

(1)

ÖVNINGSUPPGIFTER KAPITEL 3

SAMBAND

1. Nedan ges beskrivningar av tre olika datamaterial.

a. I kyrkbänkarna har snittåldern stigit betänkligt under de senaste decennierna, men är unga människor verkligen mindre religiösa än äldre, eller är det bara formatet som ogillas? I World Values Survey samlar man in data gällande personers värderingar i olika delar av världen. I figuren nedan har vi använt data för Finland år 2005, n = 1010. Finns det ett samband mellan ålder och religiositet? Motivera kortfattat.

b. Du samplar ett hundratal äkta makar och mäter hustruns och mannens åldrar. Förväntar du dig att se ett samband mellan makarnas åldrar? Hur ser sambandet i så fall ut (positivt eller negativt)? Motivera kortfattat.

c. Du samplar ett hundratal unga män och mäter antalet timmar de går på gymmet per vecka och antalet timmar de spelar dataspel per vecka. Hur förväntar du dig att sambandet mellan variablerna ser ut (inget samband/positivt/negativt)? Motivera kortfattat.

PEARSONS KORRELATIONSKOEFFICIENT

2. Vilket eller vilka av följande påståenden är korrekta:

a. En korrelation på 0,6 betyder att sambandet mellan variablerna är starkare än om korrelationen var -0,6.

b. Det är inte möjligt att få en korrelation på 1,4.

9 12

16 18 21 24

37

17-26 27-36 37-46 47-56 57-66 67-76 77-87 Åldersgrupp

Andel som anser sig vara mycket religiösa (%)

(2)

c. Vi mäter sambandet mellan x och y. Korrelationen blir 0,2. Påstående: Om vi istället mätte det omvända sambandet (dvs. det mellan y och x) så skulle vi få en korrelation på -0,2.

3. Se spridningsdiagrammen nedan (A, B, C och D). I ett diagram är korrelationen 0,4; i ett annat 0; i ett tredje -0,5 och i ett fjärde 0,7. Para ihop rätt korrelationskoefficient med rätt spridningsdiagram.

4. Tabellen nedan visar arbetserfarenhet och lön för åtta personer.

Arbetserfarenheten mäts i antal år och lönen i euro per månad. Den genomsnittliga arbetserfarenheten är 5 år; den genomsnittliga lönen är 2720 euro; variansen för arbetserfarenheten är 30,6 och lönevariansen är 792 486.

id Arbetserfarenhet Lön

1 0 3100

2 1 2000

3 1 2500

4 2 1750

5 4 3000

6 6 2200

7 10 2610

8 16 4600

a. Beräkna korrelationen mellan arbetserfarenhet och lön.

b. Hur stor hade korrelationen blivit om lönen istället mättes i tusentals euro?

(3)

5. I tabellen nedan visas data för tre variabler: kön, x och y.

id kön x y

1 Man 0 5

2 Man 1 4

3 Man 1 7

4 Man 2 6

5 Man 2 8

6 kvinna 3 0

7 kvinna 3 2

8 kvinna 4 2

9 kvinna 4 4

10 kvinna 5 3

a. Beräkna korrelationen mellan x och y för männen. Bland männen är kovariansen mellan x och y 0,75; variansen för x är 0,7 och variansen för y är 2,5.

b. Beräkna korrelationen mellan x och y för kvinnorna. Bland kvinnorna är kovariansen mellan x och y 0,8; variansen för x är 0,7 och variansen för y är 2,2.

c. Beräkna nu korrelationen mellan x och y i hela samplet. I hela samplet är kovariansen mellan x och y är -2,056; variansen för x är 2,5 och variansen för y är 6,1.

d. Jämför svaren på a-c: Det här fenomenet kallas för Simpson’s paradox.

Paradoxen består i att korrelationen för både männen och kvinnorna är positiv, medan korrelationen för hela samplet är negativ. Hur kan det komma sig? För att se lösningen – rita upp observationerna i ett spridningsdiagram:

0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6

(4)

6. Gapminder.com har sammanställt data för världens länder. På deras sida kan man rita upp spridningsdiagram för sambandet mellan olika variabler, samt välja vilken skala man vill använda på x- och y-axlarna (linjär eller loggad).

Länkarna funkar inte än, kommer upp snart.

a. Här ser du sambandet mellan antal barn per kvinna och genomsnittligt antal utbildningsår per kvinna. Testa dig fram: Vilken skala (linjär/loggad) passar bäst för respektive axel? Du kan ändra mellan linjärt och loggat på ikonen

”lin”.

b. Här ser du sambandet mellan rökning och lungcancer bland män. Vilken skala (linjär/loggad) passar bäst för respektive axel? (En parentes: Här ges motsvarande samband för kvinnor.)

c. Här ser du sambandet mellan kalorimängd per person och andelen underviktiga barn (%). Vilken skala (linjär/loggad) passar bäst för respektive axel?

d. Här ser du sambandet mellan inkomst per person och barnadödlighet. Vilken skala (linjär/loggad) passar bäst för respektive axel?

7. Nedan ser du sex spridningsdiagram (A, B, C, D, E och F). Para ihop ett spridningsdiagram i den vänstra kolumnen (A, B och C) med motsvarande spridningsdiagram i den högra kolumnen (D, E och F). I den vänstra kolumnen beskrivs sambandet mellan x och y då bägge mäts på den vanliga skalan. I den högra kolumnen visas motsvarande samband men då x eller y logaritmerats.

0 0

y

x

A

0 0

ln(y)

x

D

(5)

BINÄRA DATA

8. Är kvinnor mer skeptiska till sexhandel? Enligt jämställdhetsbarometern för år 2008 så anser 59 procent av de utfrågade finska männen och 32 procent av kvinnorna att sexköp är acceptabelt.

a. Hur stort är oddset för att en kvinna anser att sexköp är acceptabelt?

b. Hur stort är oddset för att en man anser att sexköp är acceptabelt?

c. Beräkna oddskvoten: Hur stort är oddset för att kvinna anser att sexköp är acceptabelt i förhållande till oddset för en man?

9. Du mäter sambandet mellan kön (man/kvinna) och ögonfärg (brun/blå).

Korrelationen blir noll. Hur stor är då oddskvoten? Välj ett av alternativen:

a. Oddskvoten är 1.

b. Oddskvoten är 0.

c. Vi har inte tillräckligt med information för att avgöra oddskvotens storlek.

0 0

y

x

B

0 0

ln(y)

x

E

0 0

y

x

C

0 0

y

ln(x)

F

(6)

10. På nästa sida hittar du en sammanfattning av en artikel (”Correlation between maternal weight and insulin resistence in second half of pregnancy”). Ge en tolkning av det som är understruket i rött: Vad anger oddskvoten i detta fall?

SPEARMANS RANGKORRELATION

11. Se spridningsdiagrammen nedan (A, B, C, D och E).

a. I tre av diagrammen har Spearmans rangkorrelation värdet 1. Vilka tre?

b. I två av diagrammen är Spearmans rangkorrelation större än Pearsons.

Vilka två?

c. I två av diagrammen är Spearmans och Pearsons korrelationskoefficienter lika stora. Vilka två?

d. I ett av diagrammen är Pearsons korrelationskoefficient större än Spearmans. Vilket?

(7)
(8)

12. Finns det ett samband mellan religiositet och lycka? I en enkät har vi låtit personer besvara följande frågor: Hur lycklig är du på en skala mellan 1 och 10?

(där 1 är maximalt olycklig och 10 är maximalt lycklig). Och: Hur religiös anser du dig vara? (1: Inte alls. 2: Jag tror på en högre makt, men prioriterar inte dessa frågor i mitt liv. 3: Jag tror på en högre makt, och prioriterar dessa frågor i mitt liv.)

a. För att mäta sambandet mellan lycka och religiositet så är det lämpligt att använda Spearmans rangkorrelation istället för Pearsons. Förklara kortfattat varför.

b. Nämn ett annat korrelationsmått som också kunde användas i detta fall.

13. Vilket eller vilka av följande tre påståenden är sanna:

a. Spearmans rangkorrelation blir alltid större än Pearsons.

b. Du vill ta reda på om det finns ett samband mellan längd och lön. Du samlar in ett datamaterial för ett hundratal personer och mäter sambandet med Spearmans rangkorrelation. Det visar sig att sambadet är positivt. Påstående:

Spearmans rangkorrelation blir högre om längden mäts i centimeter istället för i meter.

c. Spearmans rangkorrelation beräknas som Pearsons, bara att man använder rankingen av variablernas värden istället för rådata.

FINNS ENBART I FÖRELÄSNINGSANTECKNINGARNA:

14. I en undersökning tillfrågas ett antal personer i tre olika områden vilken av två produkter de föredrar. Resultat:

Produkt Region

Syd Mellan Nord

Typ A 124 75 120

Typ B 76 75 80

Finns det något samband mellan region och vilken produkt som föredras?

References

Related documents

75 procent av personerna surfar på nätet mindre än 630 minuter per vecka.. Den fjärde kvartilen är

Vilken skala (linjär/loggad) passar bäst för respektive axelc. I den vänstra kolumnen beskrivs sambandet mellan x och y då bägge mäts på den

Då risken för att åka fast ökar med en procent så minskar antalet brott per invånare i snitt med 0,5 procenta. Då risken för att åka fast ökar med en procentenhet så

En forskare har en hypotes om att immunförsvaret kan påverka, inte enbart en persons fysiska hälsa, men också den mentala.. Forskaren samlar in data för ett hundratal personer och

Ju större sampel desto lägre standardfel (allt annat lika). Standardfelet är ett slags mått på osäkerheten i uppskattningen av den sanna andelen studerande som jobbar

I regressionen nedan är svart en dummy för svarta och övrig en dummy som antar värdet 1 för personer som varken är vita eller svarta och värdet 0 för dem som är vita eller

Tabellen nedan visar denna procent från det första kvartalet 2012 till det tredje kvartalet 2014.. Beräkna ett säsongsutjämnat glidande medelvärde för det tredje kvartalet

Resultatet visas i frekvenstabellen nedan (variabeln bättre antar värdet 1 för personer som ansåg att det var bättre förr och värdet 0 för övriga).. Hur stort är