• No results found

ÖVNINGSUPPGIFTER KAPITEL 6

N/A
N/A
Protected

Academic year: 2021

Share "ÖVNINGSUPPGIFTER KAPITEL 6"

Copied!
7
0
0

Loading.... (view fulltext now)

Full text

(1)

ÖVNINGSUPPGIFTER KAPITEL 6

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet gäller 753 amerikanska kvinnor år 1975. Variabeln timmar mäter antalet timmar som kvinnan jobbade under året; småbarn är en dummy som antar värdet 1 om hon hade barn i åldrarna 0-5 år och annars värdet 0:

𝑡𝑖𝑚𝑚𝑎𝑟̂ = 836 − 488𝑠𝑚å𝑏𝑎𝑟𝑛

a. Hur många timmar jobbade i genomsnitt en kvinna utan småbarn? En kvinna med småbarn?

Vi kontrollerar nu också för kvinnans ålder och får följande resultat:

𝑡𝑖𝑚𝑚𝑎𝑟̂ = 1629 − 651𝑠𝑚å𝑏𝑎𝑟𝑛 − 18å𝑙𝑑𝑒𝑟 b. Tolka koefficienten för småbarn.

c. Prediktera antalet arbetstimmar för en 30-årig kvinna utan småbarn.

d. Tolka koefficienten för ålder.

2. Vi mäter skillnaden i lön mellan män och kvinnor år 2010. Regressionen nedan visar att männen i samplet i genomsnitt tjänade 3000 euro, och att kvinnorna i snitt tjänade 500 euro mindre:

𝑙ö𝑛̂ = 3000 − 500𝑘𝑣𝑖𝑛𝑛𝑎 2010 Vi kontrollerar nu för personernas löner år 2009:

𝑙ö𝑛̂ = 50 + 𝑏2010 1𝑘𝑣𝑖𝑛𝑛𝑎 + 1 ∙ 𝑙ö𝑛2009

Vilket av följande alternativ beskriver bäst vad som händer med koefficienten för kvinna:

a. b1 kommer fortfarande att ha värdet -500 eftersom kvinnorna i snitt tjänar 500 euro mindre än männen oavsett vad vi kontrollerar för.

b. b1 mäter nu löneskillnaden mellan kvinnor och män år 2009.

c. b1 kommer antagligen att ha ett värde ganska nära noll.

(2)

3. Studenter som går på många föreläsningar har i snitt bättre tentresultat. Men hjälper verkligen föreläsningarna eller är det istället de duktigaste studenterna som går på flest föreläsningar? Du vill nu undersöka detta. Du har tillgång till ett datamaterial som innehåller följande variabler: Studentens poäng på kurstenten (variabeln poäng), antalet föreläsningar som studenten deltog i (variabeln deltagande) och studentens poäng på inträdesförhöret till universitetet (variabeln inträde). Data samlas in för 100 studenter på deras första grundkurs vid ÅA.

a. Hur skulle du mäta om föreläsningarna hjälper? Ställ upp en regressionsekvation som visar vilken variabel som är beroende, och vilken eller vilka variabler som är oberoende.

b. Se fråga a: Vilket resultat kan du förvänta dig att se om det är så att föreläsningarna hjälper? Använd här din regressionsekvation från uppgift a:

Vilket tecken (positivt/negativt/noll) skulle den relevanta koefficienten anta?

4. Det finns ett klart samband mellan hur länge föräldrar har gått i skolan och hur länge deras barn går i skolan. Spridningsdiagrammet nedan visar sambandet för 30-åriga amerikaner år 1976. På y-axeln har vi individens utbildning mätt i antal år (utb); på x-axeln har vi föräldrarnas genomsnittliga utbildningsmängd (forutb). Vi har också ritat in regressionslinjen i diagrammet, där

𝑢𝑡𝑏̂ = 10,11 + 0,40𝑓𝑜𝑟𝑢𝑡𝑏

a. Anta att hela sambandet kan förklaras av att barn till högutbildade i genomsnitt är smartare än barn till lågutbildade, och att högintelligenta personer i sin tur utbildar sig längre. Vi kontrollerar nu för iq och kör regressionen:

𝑢𝑡𝑏̂ = 𝑎 + 𝑏1𝑓𝑜𝑟𝑢𝑡𝑏 + 𝑏2𝑖𝑞

(3)

Ungefär vilket värde antar koefficienten b1? b. Här är det egentliga resultatet:

𝑢𝑡𝑏̂ = 3,58 + 0,28𝑓𝑜𝑟𝑢𝑡𝑏 + 0,08𝑖𝑞

Prediktera antalet utbildningsår för en person vars föräldrar har 10 års utbildning och där personen själv har en iq på 100.

c. Se uppgift b: Tolka koefficienten för forutb.

d. Vi kontrollerar nu också för om personen bodde nära ett universitet i tonåren (variabeln nära som antar värdet 1 för de som bodde nära ett universitet och 0 för övriga):

𝑢𝑡𝑏̂ = 3,55 + 0,27𝑓𝑜𝑟𝑢𝑡𝑏 + 0,07𝑖𝑞 + 0,22𝑛ä𝑟𝑎

En av personerna i data har 12 års utbildning. Personen har en iq på 103 poäng, föräldrarnas utbildning är 13 år och personen bodde inte nära ett universitet i tonåren. Hur stor är residualen för den här personen?

5. Vi kör en regression som beskriver hur utfallsvariabeln varierar beroende på kön och en annan oberoende variabel: 𝑦̂ = 𝑎 + 𝑏1𝑘𝑣𝑖𝑛𝑛𝑎 + 𝑏2𝑥, där kvinna är en dummy som antar värdet 1 för kvinnor och 0 för män. Spridningsdiagrammet nedan illustrerar data grafiskt. Vilket av följande fyra påståenden är sanna:

a. b1 har ett negativt värde och b2 har ett negativt värde b. b1 har ett negativt värde och b2 har ett positivt värde c. b1 har positivt värde och b2 har ett negativt värde d. b1 har ett positivt värde och b2 har ett positivt värde

6. Hur stiger VD:ns lön med antalet år på posten? För att besvara denna fråga använder vi ett sampel för 177 amerikanska företag år 1990. I regressionen

(4)

nedan mäter variabeln lön VD:ns lön i tusentals dollar; erfarenhet mäter antalet år på posten och vinst mäter företagets vinst i miljoner dollar:

𝑙ö𝑛̂ = 646,43 + 12,45𝑒𝑟𝑓𝑎𝑟𝑒𝑛ℎ𝑒𝑡 + 0,588𝑣𝑖𝑛𝑠𝑡 𝑅2= 0,178

a. Hur mycket ökar lönen i snitt då vinsten ökar med 5 miljoner dollar och då vi kontrollerar för VD:ns erfarenhet?

b. Förklaringsgraden är 0,178. Tolka!

7. Tabellen på nästa sida är klippt ur artikeln Stature and Status: Health, Ability and Labor Market Outcomes. Utfallsvariabeln är loggad lön (den naturliga logaritmen).

a. Se samplet “British Cohort Study (1970)” och “MEN age 30”. Tolka koefficienten för height at age 30, där längden mäts i tum. Använd då resultatet från regressionen där man inte kontrollerat för testresultat i ung ålder eller övriga kontrollvariabler (extended controls).

b. Abstraktet nedan är klippt ur samma artikel. Läs och ta fasta på det som är understruket i rött. Förklara hur resultaten i tabellen stödjer detta uttalande.

(Använd då samplet ”British Cohort Study (1970)”.)

(5)
(6)

REGRESSIONER MED FAKTORVARIABLER

8. Tabellen nedan beskriver genomsnittligt antal sjukdagar per år i tre olika yrkesgrupper.

Yrke Medelvärde # obs.

Lärare 15 563

Kassabiträde 20 368

Bibliotekarie 10 247

Vilken eller vilka regressionsekvationer beskriver dessa skillnader?

a. 𝑠𝑗𝑢𝑘𝑑𝑎𝑔𝑎𝑟̂ = 10 + 15𝑙ä𝑟𝑎𝑟𝑒 + 20𝑘𝑎𝑠𝑠𝑎𝑏𝑖𝑡𝑟ä𝑑𝑒 + 10𝑏𝑖𝑏𝑙𝑖𝑜𝑡𝑒𝑘𝑎𝑟𝑖𝑒 b. 𝑠𝑗𝑢𝑘𝑑𝑎𝑔𝑎𝑟̂ = 10 + 5𝑙ä𝑟𝑎𝑟𝑒 + 10𝑘𝑎𝑠𝑠𝑎𝑏𝑖𝑡𝑟ä𝑑𝑒 − 5𝑏𝑖𝑏𝑙𝑖𝑜𝑡𝑒𝑘𝑎𝑟𝑖𝑒 c. 𝑠𝑗𝑢𝑘𝑑𝑎𝑔𝑎𝑟̂ = 15 + 20𝑘𝑎𝑠𝑠𝑎𝑏𝑖𝑡𝑟ä𝑑𝑒 + 10𝑏𝑖𝑏𝑙𝑖𝑜𝑡𝑒𝑘𝑎𝑟𝑒

d. 𝑠𝑗𝑢𝑘𝑑𝑎𝑔𝑎𝑟̂ = 15 + 5𝑘𝑎𝑠𝑠𝑎𝑏𝑖𝑡𝑟ä𝑑𝑒 − 5𝑏𝑖𝑏𝑙𝑖𝑜𝑡𝑒𝑘𝑎𝑟𝑒 e. 𝑠𝑗𝑢𝑘𝑑𝑎𝑔𝑎𝑟̂ = 10 + 5𝑙ä𝑟𝑎𝑟𝑒 + 10𝑘𝑎𝑠𝑠𝑎𝑏𝑖𝑡𝑟ä𝑑𝑒

(I alla regressioner ovan är lärare en dummy som antar värdet 1 för lärare och 0 för övriga; kassabiträde är en dummy som antar värdet 1 för kassabiträden och 0 för övriga; bibliotekarie är en dummy som antar värdet 1 för bibliotekarier och 0 för övriga.)

9. Du vill ta reda på om studeranden med rika pappor tar mindre studielån än sådana med fattigare pappor. För ett sampel finlandssvenska studerande har du tillgång till data för mängden studielån de tog under senaste läsår (variabeln studielån, mätt i euro) och pappans inkomst (variabeln farsinkomst, mätt i euro).

Du kör följande regression:

𝑠𝑡𝑢𝑑𝑖𝑒𝑙å𝑛̂ = 𝑎 + 𝑏 ∙ 𝑓𝑎𝑟𝑠𝑖𝑛𝑘𝑜𝑚𝑠𝑡

Du vill nu ännu kontrollera för studieort. Anta att alla personer i data studerar i antingen Åbo, Vasa eller Helsingfors. Formulera en regressionsekvation som kontrollerar för studieort. (Använd regressionsekvationen ovan och utvidga med lämpliga oberoende variabler. Namnge dessa själv och beskriv också hur variablerna är kodade.)

10. Regressionen nedan visar hur bmi varierar beroende på etnicitet och ålder. Bmi är ett mått som antar högre värden ju mer man väger i förhållande till sin längd;

ett bmi på mindre än 18,5 räknas som underviktig och ett bmi på 25 eller högre räknas som överviktig. Etnicitet mäts genom tre kategorier (vit, svart och

(7)

övriga). I regressionen nedan är svart en dummy för svarta och övrig en dummy som antar värdet 1 för personer som varken är vita eller svarta och värdet 0 för övriga. Referensgruppen är vita personer. Ålder mäter personernas åldrar i antal år. Data kommer från en amerikansk enkätstudie med 10 351 respondenter.

𝑏𝑚𝑖̂ = 23,1 + 1,4svart − 1,2övrig + 0,05ålder a. Prediktera bmi för en vit person som är 30 år gammal.

b. Vilken etnisk grupp väger i snitt som mest då vi kontrollerat för ålder?

Vilken etnisk grupp väger i snitt som minst (då vi kontrollerat för ålder)?

c. Förklaringsgraden är 0,038. Tolka!

d. Visa hur man kan illustrera sambandet mellan bmi och etncitet genom ett profildiagram (använd mallen nedan). Diagrammet ska visa hur genomsnittlig bmi varierar beroende på etnicitet för en genomsnittlig person som är 48 år gammal.

22 23 24 25 26 27 28 29

vita svarta övriga

References

Related documents

Dummy- variabeln för bolag med en eller flera kvinnor i ledningen antar värdet ett (=1) och noll (=0) om man inte har någon. Effekten av den könsuppdelade arbetsmarknaden mäts med

Här kan man utmana sig ytterligare genom att reflektera över hur det blir med tre färger, vita, svarta och gråa, n C 3 stycken brickor i

Genom att positionera sig som representanter för hela det svarta Amerika reducerar de den svarta amerikanska befolkningen (och då speciellt svarta amerikanska män) till

Elsa vill inte vara the feminist killjoy, vilket kan ses som en strategi för att kunna orientera sig i de vita rummen som en ‘seriös’ person.. Här belyses främst individuella

Resultatet visas i frekvenstabellen nedan (variabeln bättre antar värdet 1 för personer som ansåg att det var bättre förr och värdet 0 för övriga).. Hur stort är

[1] Svararen uppdaterade det här värdet.. [2] Svararen uppdaterade det

4 Inom grundskolan, likt högstadiet, ligger fokus generellt vid hur olika medier kan användas som pedagogiska verktyg istället för hur eleverna kan tillämpa dem själva?.

De här pengarna som finns på mitt konto … när det gäller pension … på de här olika … Det är inte alls säkert att det finns kvar då … Det är ju så hysteriskt många