För att förenkla framställningen utelämnas konstanttermen och ingen skillnad görs mellan tids beroende och tidsoberoende exogena variabler.

SYSSELSÄTTNING ANALYS

Fall 1 utan bortfall i den beroende variabeln och med slumpmässig fördelning av deltagare respektive icke-deltagare är den ideala experimentsituationen Dessa

6 För att förenkla framställningen utelämnas konstanttermen och ingen skillnad görs mellan tids beroende och tidsoberoende exogena variabler.

- 169-

Kapitel 8

hela populationcn behöver detta nödvändigtvis inte vara fall et för den delmängd för vilken vi har observationer på årsarbetstiden. Det förväntade värdet för y.2

givet Xp, samt att årsarbetstiden observeras (D = 1) är

E(y,2|X 2 , Zi2 , U-, > -Zi2fj) = Xi2ß + E(6.2|X.2 ,Zi2 , u.2 > -Zi2rj) (8.4)

Låt os s antaga att u.^ och e.2 är bivariat nor malfördelade med medelvärden noll,

varianser o2 och a2 samt korrelation o . Den andra termen i (8.4) kan då ut-

u e uc v 7

vecklas enligt följande:

E(e.21X.2 , Z.2 , u.2 > - Z.2r?) = (8.5) 1 1 - F(-Z.2r,) oo oo / £,2 / ((ei2>üi2>düi2d£i2 = -oo -Zi2r) OO = / -Z;2r\ OO = /

-z

v

= J

-Zi2V f(U2) 1 - F(-Zi?ry) f(u,2> 1 - F (-Z.2r,) f(u2) 1 - F (-Zi2r,) / e,2 f(£,2'"i2) f(ul7) de/2du/2 =

f/i + p _{i r}_* _r_{u F .} _{_ v / 2 ^ w}(u- ß )1 du., = _{/ J} _{i 2}

du/2 Pu U,2 =

u,7 f(u,2)

Kapitel 8

- 170-

där f(») och Fl(«) är normalfördelningens frekvens- respektive fördelningsfunktion samt 1 - F(-Z.fl) är sannolikheten att årsarbetstiden observeras, dvs y.^ > 0. Efter

normalisering (Z/ou - ci2 och = v/2^ ^an ^ s^r^va E(U.2|U.2 > -Z.jj) = au E(v.2|v2 > - c.,) = (8.6) OO

=

J

(2

<V

(V,2 > *

ci2

) =

~Ci2 = ° J v2 <K\2) dv.2/[l-$(-c.2)]

"S'2

där ^(*) och $(•) är normalfördelningens standardiserade frekvens- respektive fördelningsfunktion.

Genom att utnyttja att derivatan av normalfördelningens standardiserade frek- vensfunktion är <f>'(vj2) = -v/2 <f>(ya), att 4>{-va) = <KV,2) o ch 1 - $ (c.2) = $ (c(2)

samt att 0 (oo) = 0 kan vi skriva (8.6) som

o oo

E(V/2lVi2 > - C/2> = ^ (vi2> ] = (8-?)

* (C,2) - C,2

<t> (ct-2) _ ^l2r,/ou)

~ % (c.2) ~a" *(Z.2r,/ou)

Definiera A = $(•) / $(•) varefter vi nu slutligen kan skriva om (8.4) som

- 171 -

Kapitel 8

Den andra termen i (8.8) är lika med noll endast om A eller pu£ är lika med noll

eftersom o alltid är positiv i en stokastisk modell. Heckman (1979) visar att A närmar sig noll när urvalssannolikheten $(•) går mot ett. Detta är intuitivt rimligt; det finns inget bortfall att korrigera för när vi inte har något bortfall.

Om p # 0, dvs korrelation mellan slumptermen i se lektionsekvationen (u.^) och

slumptermen i årsarbetstidsekvationen (e/2), och utan korrektion för bortfallet

kommer alltså minsta-kvadrat-skattningar av ^-vektorn att ge icke förväntnings riktiga estimât. I litteraturen anges två principiella sätt att lösa detta problem. Det första sättet har föreslagits av Heckman (1976). Tillvägagångssättet är att först

estimera parametervektorn n/au m^d en probitmodell, där variabeln D är en

funktion av de observerade Z-variablerna. Därefter beräknas A-termen explicit och separat för varje observation genom att utgå från det estimerade uttrycket Zpfj/oru . Slutligen adderas den senare termen till regressionsekvationen yi2 som

en funktion av X-variablerna, dvs en minsta-kvadrat-skattning med y/2 som be

roende variabel och X.~ och A som o beroende variabler. _i2

Det andra sättet är att med maximum-likelihood-metoden utnyttja hel a samplet för att e stimera ß, rj, pue och a£ (i detta slags modeller går det inte i allm änhet att

identifiera o varför den rutinmässigt sätts till ett). Vi har dock inte, med de olika mått på arbets- och arbetslöshetstider vi använt, lyckats få log-likelihood-funk- tionen att konvergera.

Vi kan alltså endast presentera regressionsresultat enligt Heckmans metod. Först skattas en probitmodell för en "icke-bortfalls-ekvation", med oberoende variabler för ålder (ALD80), åldern i kvadrat (S QALD80), kön (DKOEN), medborgarskap (DMEDB) samt förekomst av arbetshandikapp (DHAND). Resultatet av probit- skattningen framgår av tabell 8.2.

- 1 72 -

Tabell 8.2 Probitestimation av "icke-bortfalls-ekvation".

Variabel Koefficient Asymp

t-värde KONSTANT -1.177 -5.53 ALD80 0.530E-01 4.03 SQALD80 -0.731E-03 -3.95 DKOEN -0.102 -2.36 DMEDB -0.416 -5.16 DHAND -0.423 -4.80 n = 2 700 Log-Likelihood = -1 691.6

Det A (L B) som har beräknats med hjälp av probitskattningen adderas som en separat variabel till ekvation (8.1) som sedan estimeras med minsta-kvadrat metoden. Resultatet av denna estimation framgår av tabell 8.3.

Tabell 8.3 kommer utförligare att kommenteras senare. Vi skall endast konstatera att bortfallskorrektionen inte har ändrat effekten av arbetsmarknadsutbildning på årsarbetstiden för år 1982. Den skattade koefficienten 8 uppgår även här till cirka 25 timmar och är fortfarande inte signifikant skild ifrån noll.

- 1 7 3 -

Kapitcl 8

Tabell 8.3 Vägd minsta-kvadrat-skattning av årsarbetstiden år 1982 med

korrektion för bortfall..

Variabel Koefficient t-värde

KONSTANT 3 710.0 0.28 I 24.7 0.44 ALD80 -25.8 -0.08 SQALD80 0.4 0.08 DKOEN -251.7 -0.42 DMEDB 473.5 0.19 DHAND 555.6 0.22 DYRKUTB 17.2 0.42 DALLUTB 125.9 2.69 DYO 19.7 0.28 DY13 99.7 1.60 DY46 -30.1 -0.42 DY9 -10.9 -0.15 DYX -112.5 -1.24 LB -1 544.9 -0.19 n 858 R2 0.1066 F 7.18 8.2.3 Korrektion för självselektion

Vi skall nu övergå till att behandla fall 3 i figur 8.1, dvs vi antar till att börja med att vi inte har något bortfallsproblem men att dummyvariabeln för programdel tagandet nu är endogen. Innebörden av de tta är allts å att individerna inte längre antas vara slumpmässigt fördelade på deltagar- respektive icke-deltagargrupp. Huruvida en individ kommer att de ltaga i utbildning eller ej är i ställe t resultat av någon form av selektionsprocess. Denna selektion är ber oende av antingen indivi den själv eller någon programadministratör.

- 174-

Problemet kan illustreras med följande enkla modell:

y,?

= x

«/

+ 6li+ ei2 (8.9)

I * _t = Z T) + u. ₁ _l (8.10)

I. = 1 om I*. > 0

(8.11) I . _i = 0 o m I * . < 0 _{i —}

där yi2 är årsarbetstiden vid tidpunkt 2 (år 1982) för individ /, X.2 är en radvektor

av o beroende variabler för individ i vid tidpunkt 2 och ß är en kolumnvektor av koefficienter. L är som tidigare en dummyvariabel för programdeltagande som antar värdet ett om en individ har genomgått utbildning under tidsperiod 1 och noll i övrigt. Z. är en radvektor av variabler som påverkar sannolikheten att indi vid i har genomgått utbildning och rç är dess koefficientvektor. Utbildningens effekt på årsarbetstiden är 8. Om det vore så att vi s kulle ha tillgång till alla de variabler som bestämmer hur mycket arbetstid en individ bjuder ut skulle vi kunna erhålla förväntningsriktiga skattningar av koefficienterna i (8.9). En del av dessa variabler är dock i stor t sett omöjliga att s amla in och kvantifiera på ett menings fullt sätt. Det kan gälla variabler som t ex motivation och attityder. Antag att det förhåller sig så som illustreras i figur 8. 2.

Individer m ed positiv attityd till utbildning kan antas ha större sannolikhet att ut bilda sig än andra individer. Har man positiv attityd till utbildning bör man rim ligtvis även ha positiv attityd till marknadsarbete. Individer med positiv attityd till utbildning/arbete har alltså dels hög sannolikhet att utbilda sig och dels hög ar betstid oavsett utbildning.

Kapitel 8 - 1 7 5 -

Figur 8.2 Illustration av attityd- r espektive utbildningseffektens inverkan på

årsarbetstiden. Attityden till utbildning

och marknadsarbete

+ Beslut att utbilda sig

(Attityd effekt)

+ (Utbildnings effekt)

Arbetstid

När vi vill uppskatta om det föreligger några skillnader i årsarbetstid (eller in komster) mellan program- respektive icke programdeltagare har vi alltså dels en attityd- o ch dels en utbildningseffekt att ta hänsyn till. För att komma åt utbild ningseffekten är det önskvärt att ta hänsyn till självse lektionen.

Självselektionen medför att en minsta-kvadrat-skattning av (8.9) kommer att ge ett icke förväntningsriktigt estimât för 8 om dummyvariabeln L är korrelerad med

slumptermen Det betyder att de som genomgått arbetsmarknadsutbildning

skulle ha haft, även i frånvaro av utbildning, olika årsarbetstider jämfört med de som inte genomgick utbildning.

Vi har alltså icke observerbara variabler i slumptermen som är korrelerade

med L . Slumptermen e.2 kan uppdelas i två termer; v.2 som är de utelämnade

variabler som direkt påverkar I. oc h e*i2 som är övriga u telämnade variabler vilka

är okorrelerade med L. Ekvation (8.9) kan nu skrivas som

y«2 - X«/ + 5I, + vi2 + e*i2 (8.12)

- 1 7 6 -

Med de tankegångar som illustrerades i figur 8.2 så blir sammanfattningsvis re sultatet följande om ingen hänsyn tas till s jälvselektionen: Vid positiv korrelation mellan I. och v. kommer 6 (den skattade effekten av arbetsmarknadsutbildning på årsarbetstiden) att överskattas.

Barnow (1987) sammanfattar, efter en genomgång av åtskilliga amerikanska ut värderingsstudier av arbetsmarknadsutbildning, att följande sätt att korrigera för självselektion har kommit till användning:

(i) inkludera variabler som använts för att utvälja deltagare: Om man vet vilka

variabler s om används för att välja ut programdeltagare kan man kontrol lera för dessa i analysen. Barnow menar att eftersom de faktorer som på verkar urvalet till programmet troligtvis i stor utsträckning överlappar de variabler s om bestämmer utfallet (sysselsättning, inkomst) så kan alla stu dier sägas ha använt denna metod även om de inte explicit har noterat det.

(ii) konstruera matchade urval av deltagare respektive icke deltagare: Jäm

förelsegruppen väljs så att de liknar deltagargru ppen i så stor utsträckning som möjligt. Utfallet kan därefter beräknas som skillnaden mellan de två gruppernas medelvärden avseende t ex årsarbetstid.

(iii) specificera antaganden om de icke observerbara variablerna: Det vanligaste antagandet i de nna typ av studier är att d e icke observerbara variablerna är konstanta över tiden så att differensskattningar kan utföras.

(iv) vikta observationerna: Genom att vikta obser vationerna i en regression får

man medelvärdena för de förklarande variablerna m er lika i deltagar- re spektive icke deltagargrupp. Denna metod har använts för att utveckla bättre matchade urval.

(v) modellera selektionsförfarandet: När selektionsvariabeln inte är observerbar

har Heckman (1979) utvecklat metoder att korrigera för selektions-bias genom att göra antaganden om hur det icke observerbara selektionsindexet ser ut.

- 1 7 7 -

Kapitel 8

Vi skall här tillämpa den sistnämnda metoden att korrigera för selektions-bias. Tillvägagångssättet är analogt med det som tillämpades när d et gäller korrektion för bortfall, dvs ett två-stegs-estimationsförfarande.

Första steget består av att med hjälp av en probitfunktion skatta sannolikheten att delta i arbetsmarknadsutbildning. Den probitfunktion som skall estimeras har följande utseende:

I = a + 77 ALD80 + 7KSQALD80 + tkDMEDB + rç DHAND +

1 2 3 4 (813)

^DYRKUTB +

rj

6 KAS + rç-A KASSA

där förutom tidigare definierade variabler

KAS = kontant arbetsmarknadsstöd år 1980 i kronor

AKASSA = erhållen ersättning från arbetslöshetsförsäkringen under år 1980

Eftersom vi inte har uppgifter om antal arbetslöshetsdagar för år 1 980 använder vi kontant stöd vid arbetslöshet som proxyvariabler för arbetslöshetstidens längd detta år. Vi har uppde lat stödet i två separata variabler; kontant arbetsmarknads stöd respektive ersättning från arbetslöshetsförsäkringen. Anledningen till denna uppdelning är att ersättningarna har olika regler och olika ersättningsbelopp. Resultatet av den utförda probitskattningen återfinns i tabell 8.4.

- 178-

Tabell 8.4 Probitskattning av sannolikheten att d eltaga i arbetsm arknadsut

bildning.

Variabel Koefficient Asymp

t-värde KONSTANT -1.766 -7.08 ALD80 0.672E-01 4.34 SQALD80 -0.109E-02 -4.93 DMEDB 0.415 5.30 DHAND 0.677 8.13 DYRKUTB -0.490 -9.33 KAS -0.116E-04 -0.63 AKASSA 0.905E-05 2.11 n = 2 700 Log-Likelihood = -1183.1

Med utgångspunkt från probitskattningen beräknar vi därefter i det andra steget för varje individ en ny variabel (LA) enligt följande:7

L A = o m 1 = 1 , d v s o m i n d i v i d i

$(Zi2fj) har genomgått arbetsmarknads

utbildning

7 Härledningen av variabeln LA är analog med härledningen av variabeln LB (jfr föregående av

In document Svensk arbetsmarknadsutbildning: en kvantitativ analys av dess effekter (Page 186-196)

För att förenkla framställningen utelämnas konstanttermen och ingen skillnad görs mellan tids­ beroende och tidsoberoende exogena variabler.

SYSSELSÄTTNING ANALYS

Fall 1 utan bortfall i den beroende variabeln och med slumpmässig fördelning av deltagare respektive icke-deltagare är den ideala experimentsituationen Dessa

6 För att förenkla framställningen utelämnas konstanttermen och ingen skillnad görs mellan tids­ beroende och tidsoberoende exogena variabler.

-z

v

= J

=

J

(2

<V

(V,2 > *

) =

"S'2

y,?

«/

rj

För att förenkla framställningen utelämnas konstanttermen och ingen skillnad görs mellan tids beroende och tidsoberoende exogena variabler.

6 För att förenkla framställningen utelämnas konstanttermen och ingen skillnad görs mellan tids beroende och tidsoberoende exogena variabler.