• No results found

Föreläsning 8 och 9: Regressionsanalys

N/A
N/A
Protected

Academic year: 2021

Share "Föreläsning 8 och 9: Regressionsanalys"

Copied!
191
0
0

Loading.... (view fulltext now)

Full text

(1)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Föreläsning 8 och 9: Regressionsanalys

Pär Nyman par.nyman@statsvet.uu.se

14 september 2015

- 1 -

(2)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Regressionsanalys

Vårt viktigaste verktyg för kvantitativa studier.

Kan användas till det mesta, men svarar oftast på frågor om kausala samband.

På kursen lär vi ut de viktigaste grunderna.

Viktigt även för dem som inte själva vill använda det!

- 2 -

(3)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Disposition för hela dagen

1

Repetition och passningsmått

2

Statistisk signifikans

3

Att läsa regressionstabeller

4

Multivariat regression

5

Kombinationsstudier

6

Avancerat

- 3 -

(4)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Regressionsekvationen (bivariat)

y = a + bx + e y = Beroende variabel

a = Konstant eller intercept b = Regressionskoefficient x = Oberoende variabel e = Felterm eller residual

- 4 -

(5)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Regressionsekvation med indexsiffror

y

i

= a + bx

i

+ e

i

y = Beroende variabel a = Konstant eller intercept b = Regressionskoefficient x = Oberoende variabel e = Felterm eller residual

i = Indexsiffra från observation 1 till observation n

- 4 -

(6)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Regressionsekvation för förväntade värden ˆ

y = a + bx ˆ

y = Förväntat värde på den beroende variabel a = Konstant eller intercept

b = Regressionskoefficient x = Oberoende variabel

- 4 -

(7)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Multivariat regressionsekvation 1

y = a + b

1

x + b

2

z + e y = Beroende variabel

a = Konstant eller intercept b

1

= Regressionskoefficient 1 b

2

= Regressionskoefficient 2 x = Oberoende variabel 1 z = Oberoende variabel 2 e = Felterm eller residual

- 4 -

(8)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Multivariat regressionsekvation 2

y = a + b

1

x

1

+ b

2

x

2

+ e y = Beroende variabel

a = Konstant eller intercept b

1

= Regressionskoefficient 1 b

2

= Regressionskoefficient 2 x

1

= Oberoende variabel 1 x

2

= Oberoende variabel 2 e = Felterm eller residual

- 4 -

(9)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Multivariat regressionsekvation 3

Inkomst = a + b

1

× Utbildning + b

2

× Kvinna + e y = Beroende variabel

a = Konstant eller intercept b

1

= Regressionskoefficient 1 b

2

= Regressionskoefficient 2 Utbildning = Oberoende variabel 1 Kvinna = Oberoende variabel 2 e = Felterm eller residual

- 4 -

(10)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Exempel från British Journal of Medicine: Vad förklarar variationen i länders vetenskapliga framgångar?

Rimligtvis beror vetenskaplig framgång i någon mån på kognitiv förmåga.

Kognitiv förmåga kan eventuellt förbättras genom kost rik på flavonoler.

Det finns mycket flavonoler i choklad.

Alltså bör andelen Nobelpristagare vara större i länder där man äter mycket choklad?

- 5 -

(11)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(12)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(13)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(14)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(15)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(16)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(17)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(18)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(19)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

y = a + bx + e

- 6 -

(20)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Passningsmått beskriver hur väl vår modell beskriver den data vi har observerat.

De två viktigaste är regressionens standardfel och R

2

. Båda passningsmåtten utgår ifrån storleken på

residualerna, men sätter den i relation till olika saker.

- 7 -

(21)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Regressionens standardfel

~Den genomsnittliga avvikelsen från regressionslinjen. Uttrycks i samma enheter som den beroende variabeln. Exempel: De observerade värdena avviker i genomsnitt från modellens prediktioner med 6,6 Nobelpristagare per 10 milj. invånare.

Överkurs

Standardfel =

s

RSS n − 1 − k =

s

P

(e

i2

) n − 1 − k =

sP

(y

i

− ˆ y

i

)

2

n − 1 − k

RSS = Summan av de kvadrerade feltermerna (Residual Sum of Squares)

k = Antalet oberoende variabler

- 8 -

(22)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Regressionens standardfel

~Den genomsnittliga avvikelsen från regressionslinjen. Uttrycks i samma enheter som den beroende variabeln. Exempel: De observerade värdena avviker i genomsnitt från modellens prediktioner med 6,6 Nobelpristagare per 10 milj. invånare.

Överkurs

Standardfel =

s

RSS n − 1 − k =

s

P

(e

i2

) n − 1 − k =

sP

(y

i

− ˆ y

i

)

2

n − 1 − k

RSS = Summan av de kvadrerade feltermerna (Residual Sum of Squares)

k = Antalet oberoende variabler

- 8 -

(23)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

R

2

Andelen förklarad variation i den beroende variabeln. Antar värden mellan 0 (vår modell förklarar ingenting) och 1 (vår modell förklarar 100 procent av variationen i den beroende variabeln). Exempel: Skillnader i chokladkonsumtion kan

”förklara” 60 procent av variationen mellan länder i antalet Nobelpristagare.

Överkurs

R

2

= 1 − RSS TSS = 1 −

P

(y

i

− ˆ y

i

)

2 P

(y

i

− ¯ y

i

)

2

RSS = Summan av de kvadrerade feltermerna (Residual Sum of Squares)

TSS = Summan av avvikelserna från medelvärdet (Total Sum of Squares)

- 9 -

(24)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

R

2

Andelen förklarad variation i den beroende variabeln. Antar värden mellan 0 (vår modell förklarar ingenting) och 1 (vår modell förklarar 100 procent av variationen i den beroende variabeln). Exempel: Skillnader i chokladkonsumtion kan

”förklara” 60 procent av variationen mellan länder i antalet Nobelpristagare.

Överkurs

R

2

= 1 − RSS TSS = 1 −

P

(y

i

− ˆ y

i

)

2 P

(y

i

− ¯ y

i

)

2

RSS = Summan av de kvadrerade feltermerna (Residual Sum of Squares)

TSS = Summan av avvikelserna från medelvärdet (Total Sum of Squares)

- 9 -

(25)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

I grunden mäter båda måtten samma sak. Givet en viss variation i den beroende variabeln, så ökar R

2

när standardfelet sjunker, och vice versa.

Om variationen i den beroende variabeln är stor, kan standardfelet vara stort trots högt R

2

, och vice versa.

- 10 -

(26)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Litet standardfel, lågt R2 Stort standardfel, högt R2

- 11 -

(27)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Justerat R

2

När man adderar en variabel till en regressionsmodell kommer R

2

alltid att öka, även om den inte har något med den beroende variabeln att göra.

För att korrigera för detta bör man i regel använda ett mått som kallas för justerat R

2

.

Det är vanligt (och ok för er) att även justerat R

2

uttrycks som andel av variationen i den beroende variabeln som modellen förklarar.

Mer korrekt: ”justerat för antalet frihetsgrader”.

- 12 -

(28)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Repetition och passningsmått

Allmänt om passningsmått

Vad som är högt och lågt beror som alltid på vad vi har att jämföra med. Studenter har ofta orimligt höga förväntningar på vad våra modeller kan åstadkomma.

Stirra er inte blinda på passningsmåtten. Vårt mål är sällan att göra de bästa prediktionerna. Vanligare att vi är intresserade av ett kausalt samband.

Då är det viktigare hur stor effekten är samt huruvida den är statistiskt signifikant, alltså om samvariationen i vårt urval kan bero på slumpen.

- 12 -

(29)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Korrelation är inte kausalitet

I grunden finns det fyra olika skäl till att observera en samvariation mellan två variabler x och y.

1

Sambandet är kausalt, så att x har en effekt på y .

2

Det observerade sambandet beror på en tillfällighet.

3

Omvänd orsaksriktning: det är y som påverkar x .

4

Sambandet är spuriöst och beror på att en tredje variabel påverkar både x och y .

- 13 -

(30)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Korrelation är inte kausalitet

I grunden finns det fyra olika skäl till att observera en samvariation mellan två variabler x och y.

1

Sambandet är kausalt, så att x har en effekt på y .

2

Det observerade sambandet beror på en tillfällighet.

3

Omvänd orsaksriktning: det är y som påverkar x .

4

Sambandet är spuriöst och beror på att en tredje variabel påverkar både x och y .

- 13 -

(31)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Korrelation är inte kausalitet

I grunden finns det fyra olika skäl till att observera en samvariation mellan två variabler x och y.

1

Sambandet är kausalt, så att x har en effekt på y .

2

Det observerade sambandet beror på en tillfällighet.

3

Omvänd orsaksriktning: det är y som påverkar x .

4

Sambandet är spuriöst och beror på att en tredje variabel påverkar både x och y .

- 13 -

(32)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Korrelation är inte kausalitet

I grunden finns det fyra olika skäl till att observera en samvariation mellan två variabler x och y.

1

Sambandet är kausalt, så att x har en effekt på y .

2

Det observerade sambandet beror på en tillfällighet.

3

Omvänd orsaksriktning: det är y som påverkar x .

4

Sambandet är spuriöst och beror på att en tredje variabel påverkar både x och y .

- 13 -

(33)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Korrelation är inte kausalitet

I grunden finns det fyra olika skäl till att observera en samvariation mellan två variabler x och y.

1

Sambandet är kausalt, så att x har en effekt på y .

2

Det observerade sambandet beror på en tillfällighet.

3

Omvänd orsaksriktning: det är y som påverkar x .

4

Sambandet är spuriöst och beror på att en tredje variabel påverkar både x och y .

- 13 -

(34)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Kortversionen

För att svara på om ett samband är statistiskt signifikant beräknar vi först ett t-värde:

t = b se

b

Om (det absoluta värdet av) t-värdet är större än det kritiska t-värdet för vår säkerhetsnivå säger vi att sambandet är statistiskt signifikant.

Vi vet då att det finns ett samband i populationen och att den observerade samvariationen inte var en tillfällighet.

- 14 -

(35)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Exempel på slumpmässiga skillnader: tärningsslag Anta att vi slår två tärningar och räknar antalet prickar.

Eftersom vi spelar mot en notorisk fuskare misstänker vi att hen har manipulerat tärningarna.

Vi kan använda regressionsanalys för att studera om tärningarna i genomsnitt visar lika många prickar.

Prickar = a + b ∗ tarning + e

Variabeln tärning antar värdet 1 för den ena tärningen och 2 för den andra.

Om det inte är fusktärningar är det ”sanna” b-värdet noll.

Men de enskilda urvalen kommer ge andra b-värden.

- 15 -

(36)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Lutningen varierar från urval till urval (n=2, β = 0)

1 2

1 2 3 4 5 6

- 16 -

(37)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Lutningen varierar från urval till urval (n=2, β = 0)

1 2

1 2 3 4 5 6

b=1

- 16 -

(38)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Lutningen varierar från urval till urval (n=2, β = 0)

1 2

1 2 3 4 5 6

b=−5

- 16 -

(39)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Lutningen varierar från urval till urval (n=2, β = 0)

1 2

1 2 3 4 5 6

b=0

- 16 -

(40)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Ju större urval, desto mindre avvikelser (n=30, β = 0)

1 2

1 2 3 4 5 6

b=−0.8

- 16 -

(41)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Ju större urval, desto mindre avvikelser (n=30, β = 0)

1 2

1 2 3 4 5 6

b=−0.47

- 16 -

(42)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Ju större urval, desto mindre avvikelser (n=30, β = 0)

1 2

1 2 3 4 5 6

b=1.13

- 16 -

(43)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Vi är i regel mer intresserade av den underliggande processen än skillnaderna i urvalet

Är någon av tärningarna en fusktärning?

Tjänar männen i urvalet mer än kvinnorna på grund av sitt kön?

Påverkar demokratisering risken för väpnad konflikt?

= Vet vi att det finns en effekt eller kan skillnaden mellan tärningarna/könen/länderna bero på slumpen?

- 17 -

(44)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Vi är i regel mer intresserade av den underliggande processen än skillnaderna i urvalet

Är någon av tärningarna en fusktärning?

Tjänar männen i urvalet mer än kvinnorna på grund av sitt kön?

Påverkar demokratisering risken för väpnad konflikt?

= Vet vi att det finns en effekt eller kan skillnaden mellan tärningarna/könen/länderna bero på slumpen?

- 17 -

(45)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

T&S använder β för populationens regressionskoefficient för att skilja den från urvalskoefficienten b (vår gissning om β). Om β är 0 finns det inget samband i populationen.

Jag föredrar att prata om β som den ”sanna” effekten och b som den uppskattade effekten.

Om vi förkastar möjligheten att β = 0 så säger vi att sambandet är statistiskt signifikant.

Vi kan aldrig observera β, men vi har en uppskattning (b) och kan beräkna hur osäker den uppskattningen är.

- 18 -

(46)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

T&S använder β för populationens regressionskoefficient för att skilja den från urvalskoefficienten b (vår gissning om β). Om β är 0 finns det inget samband i populationen.

Jag föredrar att prata om β som den ”sanna” effekten och b som den uppskattade effekten.

Om vi förkastar möjligheten att β = 0 så säger vi att sambandet är statistiskt signifikant.

Vi kan aldrig observera β, men vi har en uppskattning (b) och kan beräkna hur osäker den uppskattningen är.

- 18 -

(47)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

T&S använder β för populationens regressionskoefficient för att skilja den från urvalskoefficienten b (vår gissning om β). Om β är 0 finns det inget samband i populationen.

Jag föredrar att prata om β som den ”sanna” effekten och b som den uppskattade effekten.

Om vi förkastar möjligheten att β = 0 så säger vi att sambandet är statistiskt signifikant.

Vi kan aldrig observera β, men vi har en uppskattning (b) och kan beräkna hur osäker den uppskattningen är.

- 18 -

(48)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

T&S använder β för populationens regressionskoefficient för att skilja den från urvalskoefficienten b (vår gissning om β). Om β är 0 finns det inget samband i populationen.

Jag föredrar att prata om β som den ”sanna” effekten och b som den uppskattade effekten.

Om vi förkastar möjligheten att β = 0 så säger vi att sambandet är statistiskt signifikant.

Vi kan aldrig observera β, men vi har en uppskattning (b) och kan beräkna hur osäker den uppskattningen är.

- 18 -

(49)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Urvalens b-värden är ”normalfördelade” (t-fördelade) De flesta urval har b-värden nära β.

Den uppskattade standardavvikelsen för populationen av b-värden kallas för koefficienternas standardfel.

Dessa beräknar datorn åt oss (alt. T&S s. 210–211). Ju fler standardfel b är från 0, desto säkrare är vi på att β 6= 0.

-3 -2 -1 0 1 2 3

Antal standardavvikelser från medelvärdet

B-värdets avvikelse från β (standardavvikelser)

- 19 -

(50)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Urvalens b-värden är ”normalfördelade” (t-fördelade) De flesta urval har b-värden nära β.

Den uppskattade standardavvikelsen för populationen av b-värden kallas för koefficienternas standardfel.

Dessa beräknar datorn åt oss (alt. T&S s. 210–211). Ju fler standardfel b är från 0, desto säkrare är vi på att β 6= 0.

-3 -2 -1 0 1 2 3

Antal standardavvikelser från medelvärdet

B-värdets avvikelse från β (standardavvikelser)

- 19 -

(51)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Urvalens b-värden är ”normalfördelade” (t-fördelade) De flesta urval har b-värden nära β.

Den uppskattade standardavvikelsen för populationen av b-värden kallas för koefficienternas standardfel.

Dessa beräknar datorn åt oss (alt. T&S s. 210–211).

Ju fler standardfel b är från 0, desto säkrare är vi på att β 6= 0.

-3 -2 -1 0 1 2 3

Antal standardavvikelser från medelvärdet

B-värdets avvikelse från β (standardavvikelser)

- 19 -

(52)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Urvalens b-värden är ”normalfördelade” (t-fördelade) De flesta urval har b-värden nära β.

Den uppskattade standardavvikelsen för populationen av b-värden kallas för koefficienternas standardfel.

Dessa beräknar datorn åt oss (alt. T&S s. 210–211).

Ju fler standardfel b är från 0, desto säkrare är vi på att β 6= 0.

-3 -2 -1 0 1 2 3

Antal standardavvikelser från medelvärdet

B-värdets avvikelse från β (standardavvikelser)

- 19 -

(53)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Urvalens b-värden är ”normalfördelade” (t-fördelade) De flesta urval har b-värden nära β.

Den uppskattade standardavvikelsen för populationen av b-värden kallas för koefficienternas standardfel.

Dessa beräknar datorn åt oss (alt. T&S s. 210–211).

Ju fler standardfel b är från 0, desto säkrare är vi på att β 6= 0.

-3 -2 -1 0 1 2 3

Antal standardavvikelser från medelvärdet

B-värdets avvikelse från β (standardavvikelser)

- 19 -

(54)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Genom att dela b-värdet med dess standardfel erhålls ett mått på hur många standardfel som b-värdet är från 0.

Detta mått kallas t-värde.

t = b se

b

Om (det absoluta värdet av) t-värdet än större än det kritiska t-värdet kan vi – givet vår säkerhetsnivå – utesluta möjligheten att β = 0.

Vid stora urval är de kritiska värdena t

90

, t

95

och t

99

1,65, 1,96 och 2,58.

- 20 -

(55)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

t

kv

närmar sig z

kv

vid stora urval

- 21 -

(56)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Det spelar ingen roll om t-värdet är positivt eller negativt Ett absolut värde innebär att man stryker alla minustecken.

Sambandet är statistiskt signifikant om det absoluta värdet av t-värdet är större än det kritiska värdet.

Kan också uttryckas som att sambandet är signifikant om testvärdet ligger utanför intervallet mellan −t

kv

och t

kv

.

- 22 -

(57)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Kortversionen igen

För att svara på om ett samband är statistiskt signifikant beräknar vi först ett t-värde:

t = b se

b

Om (det absoluta värdet av) t-värdet är större än det kritiska t-värdet för vår säkerhetsnivå säger vi att sambandet är statistiskt signifikant.

Vi vet då att det finns ett samband i populationen och att den observerade samvariationen inte var en tillfällighet.

- 23 -

(58)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Vi ska titta på tre exempel från Marcus föreläsning

1

Sambandet mellan kön och placering på vänster–höger-skalan.

2

Sambandet mellan religiositet och korruption.

3

Sambandet mellan tilltro till regeringen och benägenhet att ge till tiggare.

- 24 -

(59)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Variabel Kodning

Höger 1 (klart till vänster) till 5 (klart till höger) Kvinna 0 (man) eller 1 (kvinna)

Månadsinkomst (brutto) 1 (<10 000 kr) till 12 (>60 000 kr)

Korruption 0 (ingen korruption) - 10 (mycket korruption) Religiositet 1 (inte alls viktigt) till 4 (mycket viktigt) BNP per capita Tusentals dollar

Skänker till tiggare 1 (< 1 gång/vecka) till 4 (varje dag) Förtroende för regeringen 1 (inget förtroende) till 4 (fullt förtroende) Borgerlig Skulle rösta på ett borgerligt parti

Tips: Döp gärna dikotoma variabler efter hur de är kodade.

Kvinna och höger har en underförstådd tolkning och går därför snabbare att tolka än kön och ideologisk position.

- 25 -

(60)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Exempel 1: Kön och placering på vänster–höger-skalan

När vi genomför den bivariata regressionsanalysen erhåller vi följande värden:

b = -0,125 se(b) = 0,027

t = -4,63 (-0,125/0,027)

Det kritiska t-värdet på 99 procents säkerhetsnivå är här 2,58 (n=7329). Eftersom 4,63 är större än 2,58 (-4,63 ligger utanför det kritiska intervallet från -2,58 till 2,58) kan vi konstatera att effekten av kön på den ideologiska positionen är statistiskt signifikant vid 99 procents säkerhetsnivå.

- 26 -

(61)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Exempel 1: Kön och placering på vänster–höger-skalan

När vi genomför den bivariata regressionsanalysen erhåller vi följande värden:

b = -0,125 se(b) = 0,027

t = -4,63 (-0,125/0,027)

Det kritiska t-värdet på 99 procents säkerhetsnivå är här 2,58 (n=7329). Eftersom 4,63 är större än 2,58 (-4,63 ligger utanför det kritiska intervallet från -2,58 till 2,58) kan vi konstatera att effekten av kön på den ideologiska positionen är statistiskt signifikant vid 99 procents säkerhetsnivå.

- 26 -

(62)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Exempel 2: Religiositet och korruption

När vi genomför den bivariata regressionsanalysen erhåller vi följande värden:

b = 1,808 se(b) = 0,313

t = 5,78 (1,808/0,313)

Det kritiska t-värdet på 99 procents säkerhetsnivå är här 2,64 (n=78). Då 5,78 är större än 2,64 (5,78 ligger utanför det kritiska intervallet från -2,64 till 2,64) kan vi slå fast att sambandet är statistiskt signifikant på 99 procents säkerhetsnivå.

- 26 -

(63)

Regressions- analys

Regressionsekvationen Passningsmått

Statistisk signifikans

Tillämpning Kommentarer

Regressions- tabeller

Mjukvara

Multivariat regression

Exempel 1 Exempel 2 Exempel 3

Kombinations- studier Övrigt

Statistisk signifikans

Exempel 2: Religiositet och korruption

När vi genomför den bivariata regressionsanalysen erhåller vi följande värden:

b = 1,808 se(b) = 0,313

t = 5,78 (1,808/0,313)

Det kritiska t-värdet på 99 procents säkerhetsnivå är här 2,64 (n=78). Då 5,78 är större än 2,64 (5,78 ligger utanför det kritiska intervallet från -2,64 till 2,64) kan vi slå fast att sambandet är statistiskt signifikant på 99 procents säkerhetsnivå.

- 26 -

References

Related documents

Inom marknadsföring kan den co-creation som sker mellan konsumenter och företag (Robert et al., 2005 &amp; Roser et al., 2013; Vargo &amp; Lusch, 2006) ur företagets synvinkel vara en

Eftersom att diskursanalys till stor del intresserar sig för maktrelationer så vill jag här också ta reda på om den diskursiva praktiken förstärker eventuella ojämlika

Ronström menar även att mångkulturell och kulturell mångfald redan har en för stor betydelse, och att man segregerar in individer som invandrare eller svenskar

I den mediala diskursen finns aktörer i både Saudiarabien och Sverige som försöker upprätthålla diskursen genom att förstärka vi- och demkänslan men också aktörer som vill

Givet att vi funnit en (bivariat) kontrafaktisk skillnad och även kan ge argument för den antagna orsaksriktningen blir nästa steg att försöka isolera vårt samband från

Även om vi kände till och kunde mäta alla bakomliggande variabler, vet vi inte hur vi ska kontrollera för dem. Den linjära och additiva regressionsekvationen är bara

Svaret är att den bivariata effekten av ideologisk placering på inställningen till jämställdhet var spuriös (icke-kausal), vi lurades alltså att tro att individer som stod

Vi vågar då dra slutsatsen att det finns ett samband även i populationen och vi kallar detta för att sambandet är statistiskt signifikant....