• No results found

ÖVNINGSUPPGIFTER KAPITEL 4

N/A
N/A
Protected

Academic year: 2021

Share "ÖVNINGSUPPGIFTER KAPITEL 4"

Copied!
8
0
0

Loading.... (view fulltext now)

Full text

(1)

ÖVNINGSUPPGIFTER KAPITEL 4

REGRESSIONSLINJEN: NIVÅ OCH LUTNING

1. En av regressionslinjerna nedan beskrivs av ekvationen 𝑦̂ = 20 + 2𝑥; en annan av ekvationen 𝑦̂ = 80 − 𝑥; en tredje av ekvationen 𝑦̂ = −20 + 3𝑥 och en fjärde av ekvationen 𝑦̂ = 20 + 0𝑥. Para ihop rätt regressionslinje med rätt diagram (A, B, C och D).

2. Nedan beskrivs fyra olika samband. Vilken variabel är beroende och vilken är oberoende i respektive fall?

a. Är erfarna lärare bättre? Vi samplar slumpmässigt ett hundratal skolklasser i årskurs nio. Vi mäter mattelärarens erfarenhet i antal år (variabeln erfarenhet) och skolklassens genomsnittliga resultat på ett nationellt matteprov (variabeln matteprov).

b. Har långa basketspelare högre lön är korta? För att besvara denna fråga samlar vi in data för ett hundratal professionella basketspelare, deras längd (variabeln längd) och lön (variabeln lön).

(2)

c. Ledde Tjernobylkatastrofen år 1986 till fler cancerpatienter? Vi samlar in data över radioaktivt nedfall (variabeln nedfall) för ~50 städer i Ukraina år 1986, där vissa städer drabbades hårdare än andra. För varje stad mäter vi andelen cancerpatienter (variabeln cancer) bland ungdomar som var i fosterstadiet år 1986.

d. Du samlar in ett datamaterial för ett hundratal barn i syfte att mäta sambandet mellan barnets längd (variabeln längd) och föräldrarnas genomsnittliga längd (variabeln förlängd).

3. Arbetslösheten i Europa har länge legat på en högre nivå än den i USA. Många skyller detta på en tungrodd offentlig sektor och högt skattetryck. Kan det ligga någonting i detta? Spridningsdiagrammet nedan visar sambandet mellan skatteprocent och arbetslöshet i olika länder. Variabeln skatteprocent mäter skatteintäkterna som en procent av hela ekonomin; arbetslöheten mäter arbetslöshetsgraden i procent. Kovariansen mellan variablerna är 8,9061;

genomsnittlig arbetslöshet är 8,4733 procent och den genomsnittliga skatteprocenten är 16,4505; standardavvikelsen för skatteprocenten är 6,1648 och standardavvikelsen för arbetslöshetsgraden är 5,5243.

a. Beskriv regressionslinjen med en regressionsekvation. Ge också en tolkning av koefficienten b i den här regressionen.

b. Se fråga a: I Finland ligger skatten på 19,83 procent. Hur stor predikteras arbetslösheten vara i Finland?

4. Är resultaten sämre i stora skolklasser än i små? För att ta reda på detta har vi samplat 80 skolklasser och mätt antalet elever på klassen (variabeln elevantal) och klassens genomsnittliga betyg (variabeln betyg). Du vill nu mäta sambandet med hjälp av en regressionslinje: 𝑏𝑒𝑡𝑦𝑔̂ = 𝑎 + 𝑏 ∙ 𝑒𝑙𝑒𝑣𝑎𝑛𝑡𝑎𝑙. Korrelationen mellan variablerna är -0,25; i snitt går det 20 elever i en klass och genomsnittligt

(3)

betyg är 7,5; standardavvikelsen för antalet elever i klassen är 2,5 och standard- avvikelsen för betyget är 0,3.

a. Beskriv regressionslinjens ekvation.

b. Tolka koefficienten för elevantal.

c. Rita upp regressionslinjen i diagrammet nedan. (Notera att axlarna inte börjar vid origo.) Skriv också ut variablernas namn på y- och x-axeln.

5. Hur stiger VD:ns lön med antalet år på posten? För att besvara denna fråga använder vi ett sampel för 177 amerikanska företag år 1990. Regressionen nedan beskriver sambandet mellan erfarenhet (hur många år VD:n suttit på posten) och lön (VD:ns lön i tusentals dollar).

𝑙ö𝑛̂ = 772,43 + 11,75𝑒𝑟𝑓𝑎𝑟𝑒𝑛ℎ𝑒𝑡

a. Hur mycket högre predikteras lönen vara för en VD med 20 års erfarenhet i jämförelse med en purfärsk VD (dvs. 0 års erfarenhet)?

b. Tolka koefficienten för erfarenhet.

7 7.2 7.4 7.6 7.8 8

10 12 14 16 18 20 22 24 26 28 30

(4)

c. Hur mycket ökar lönen i snitt då erfarenheten ökar med tio år? Femton år?

d. Hur mycket ska arbetserfarenheten öka för att lönen ska stiga med hundratusen dollar?

e. Som du ser från spridningsdiagrammet ovan så finns det en VD med en extra hög lön (5 299 000 dollar). Den här personen har 13 års erfarenhet. Hur stor är residualen för denna VD?

f. En annan VD i samplet har två års erfarenhet och en lön på 471 000 dollar.

Hur stor är residualen för denna VD?

REGRESSIONER MED DUMMYVARIABLER

6. Tar man ut mindre sjukledigt inom privat sektor? För enkelhetens skull tänker vi oss här att vi samplat 13 sjuksköterskor varav 6 jobbar inom offentlig sektor och 7 inom privat. För varje person har vi mätt hur många dagar denna sjukskrivit sig under det senaste året. Data visas i datamatrisen nedan, där privat är en dummy som antar värdet 1 för personer som är anställda inom det privata och 0 annars; variabeln sjukdagar mäter antalet sjukskrivningsdagar.

id privat sjukdagar

1 0 15

2 0 5

3 0 24

4 0 0

5 0 5

6 0 2

7 1 0

8 1 5

9 1 10

10 1 3

11 1 0

12 1 20

13 1 11

Vilka värden har a och b i regressionen: 𝑠𝑗𝑢𝑘𝑑𝑎𝑔𝑎𝑟̂ = 𝑎 + 𝑏 ∙ 𝑝𝑟𝑖𝑣𝑎𝑡

7. I en amerikansk studie jämförde man löner bland 534 arbetare varav 96 tillhörde facket. Data är för år 1985. Regressionslinjen ges av:

𝑙ö𝑛̂ = 8,64 + 2,16 ∙ 𝑓𝑎𝑐𝑘𝑒𝑡

där variabeln lön mäter arbetarens timlön; facket är en dummy som antar värdet 1 för fackanslutna och 0 för övriga. Hur stor är den genomsnittliga timlönen

(5)

bland de fackanslutna? Bland dem som inte tillhör facket? Vad mäter koefficienten för facket?

8. På nästa sida hittar du en sammanfattning av en artikel. Läs sammanfattningen och ge en tolkning av det som är understruket i rött:

a. Vad anger koefficienterna för x i dessa fall? (I artikeln betecknar man koefficienten för x med β.)

b. Vilken eller vilka av de tre x-variablerna är dummy-variabler?

(”Hypertension” heter ”högt blodtryck” på svenska.)

FÖRKLARINGSGRADEN

9. Se uppgift 4: Hur stor är förklaringsgraden? Beskriv också vad förklaringsgraden anger i det här sammanhanget.

10. Se uppgift 5: Här blir förklaringsgraden 0,020. Vilket eller vilka av följande påståenden är sanna?

a. Korrelationen mellan VD:ns lön och antalet år på posten är ~0,14.

b. 2 procent av observationerna ligger på regressionslinjen.

c. 2 procent av variationen i VD-löner kan förklaras av antalet år på posten.

(6)
(7)

LOGARITMERING

11. Det föds allt färre barn. En möjlig orsak är att kvinnor skjuter upp äktenskap och barnafödande och satsar på utbildning och karriär. Spridningsdiagrammet nedan visar sambandet mellan åldern då kvinnor gifter sig och antalet barn per kvinna för 175 länder. Variabeln ålder mäter den genomsnittliga åldern då kvinnor i landet gifter sig; antal barn mäter genomsnittligt antal barn per kvinna. Regressionslinjen ges av: ln⁡(𝑎𝑛𝑡𝑎𝑙⁡𝑏𝑎𝑟𝑛)̂ = 2,97 − 0,082 ∙ å𝑙𝑑𝑒𝑟. Tolka koefficienten för ålder.

12. Vi har mätt risken för att åka fast samt brottsligheten i 89 amerikanska orter.

Brottsligheten mäts som antalet brott per invånare; risken för att åka fast är andelen av alla brott som leder till ett arresterande. Sambandet kan beskrivas genom regressionen:

ln(𝑏𝑟𝑜𝑡𝑡𝑠𝑙𝑖𝑔ℎ𝑒𝑡) = −4,18 − 0,50 ∙ 𝑙𝑛⁡(𝑟𝑖𝑠𝑘⁡𝑎𝑡𝑡⁡å𝑘𝑎⁡𝑓𝑎𝑠𝑡).

Vilken eller vilka av följande tre tolkningar är korrekt?

a. Då risken för att åka fast ökar med en procent så minskar antalet brott per invånare i snitt med 0,5 procent.

b. Då risken för att åka fast ökar med en procentenhet så minskar antalet brott per invånare i snitt med 0,5 procent.

c. Då risken för att åka fast ökar med 10 procent så minskar antalet brott per invånare med 0,5 procent.

d. Då risken för att åka fast ökar med 1 procent så minskar antalet brott per invånare med 5 procent.

(8)

13. Spridningsdiagrammet nedan visar sambandet mellan genomsnittlig BMI och inkomst per person i olika länder. (BMI mäter relationen mellan vikt och längd.

Högre värden betyder att man väger mer relativt sin längd. BMI-värden på 18,5- 25 räknas som ”normalviktig”; lägre värden som underviktig och högre som överviktig.) x-variabeln är inkomst per person i landet. En regressionslinje som beskriver sambandet ges av:

𝐵𝑀𝐼̂ = 12,55 + 1,43 ∙ 𝑙𝑛⁡(𝑖𝑛𝑘𝑜𝑚𝑠𝑡)

a. Den 10:e inkomstpercentilen är 1078 dollar per person. Prediktera BMI för ett land med denna inkomstnivå.

b. Den 90:e inkomstpercentilen är 35 247 dollar per person. Prediktera BMI för ett land med denna inkomstnivå.

c. I Finland är inkomsten 33 162 dollar per person. Hur hög predikteras genomsnittlig BMI vara i Finland?

d. Se fråga c: Genomsnittlig BMI i Finland är 26,73. Hur stor är Finlands residual?

e. Tolka koefficienten för ln(inkomst).

15 20 25 30 35

0 20000 40000 60000 80000

BMI

Inkomst per person

References

Related documents

Det stora bakslaget för stabilitets- pakten inträffade för ett par år sedan när man avstod från att implementera de regler man tidigare kommit överens om.. För att

Arbeten som överskrider bullervärdena på kvällar, nätter och helger utförs i huvudsak i de fall arbetena kräver av- stängningar av järnvägstrafik, eller av annan anledning

Nu visar det sig att det inte är så enkelt och jag hoppas att detta blir ett viktigt budskap för de många förebyggande program som finns i afrikanska länder.. NU TITTAR foRSKARNA

En möjlig orsak till att inget samband hittades kan bero på att Länsstyrelsen i Värmland har använt kalk för att göra vattenområdena mer trivsamma för musslorna, vilket

Zink: För personer med tillräckliga nivåer av zink i cellerna visade analysen att risken för att insjukna i COVID-19 minskade med 91 procent.. Brist på zink innebar istället

Tidigare har man trott att 90 procent av vårt D-vitamin kommer från produktionen i huden när den utsätts för solljus och att resten tas upp ur maten vi äter.. Men enligt ny

F¨or personer med s˚ adana problem i tidig ˚ alder ¨ar risken f¨or kluster A–st¨orningar minst 1.77 g˚ anger s˚ a stor ¨an f¨or dem som inte har haft detta.. D¨aremot ¨ar

Alla företag inom turismbranschen i Hemavan behöver inte vara en året runt verksamhet även om majoriteten i denna studie är öppna året runt..