SYSSELSÄTTNING ANALYS
Fall 1 utan bortfall i den beroende variabeln och med slumpmässig fördelning av deltagare respektive icke-deltagare är den ideala experimentsituationen Dessa
6 För att förenkla framställningen utelämnas konstanttermen och ingen skillnad görs mellan tids beroende och tidsoberoende exogena variabler.
- 169-
Kapitel 8
hela populationcn behöver detta nödvändigtvis inte vara fall et för den delmängd för vilken vi har observationer på årsarbetstiden. Det förväntade värdet för y.2
givet Xp, samt att årsarbetstiden observeras (D = 1) är
E(y,2|X 2 , Zi2 , U-, > -Zi2fj) = Xi2ß + E(6.2|X.2 ,Zi2 , u.2 > -Zi2rj) (8.4)
Låt os s antaga att u.^ och e.2 är bivariat nor malfördelade med medelvärden noll,
varianser o2 och a2 samt korrelation o . Den andra termen i (8.4) kan då ut-
u e uc v 7
vecklas enligt följande:
E(e.21X.2 , Z.2 , u.2 > - Z.2r?) = (8.5) 1 1 - F(-Z.2r,) oo oo / £,2 / ((ei2>üi2>düi2d£i2 = -oo -Zi2r) OO = / -Z;2r\ OO = /
-z
i2v
oo= J
-Zi2V f(U2) 1 - F(-Zi?ry) f(u,2> 1 - F (-Z.2r,) f(u2) 1 - F (-Zi2r,) / e,2 f(£,2'"i2) f(ul7) de/2du/2 =f/i + p i r* ru F . _ v / 2 ^ w(u- ß )1 du., = / J i 2
du/2 Pu U,2 =
u,7 f(u,2)
Kapitel 8
- 170-
där f(») och Fl(«) är normalfördelningens frekvens- respektive fördelningsfunktion samt 1 - F(-Z.fl) är sannolikheten att årsarbetstiden observeras, dvs y.^ > 0. Efter
normalisering (Z/ou - ci2 och = v/2^ ^an ^ s^r^va E(U.2|U.2 > -Z.jj) = au E(v.2|v2 > - c.,) = (8.6) OO
=
aJ
V(2
<V
Pr(V,2 > *
ci2) =
~Ci2 = ° J v2 <K\2) dv.2/[l-$(-c.2)]"S'2
där ^(*) och $(•) är normalfördelningens standardiserade frekvens- respektive fördelningsfunktion.
Genom att utnyttja att derivatan av normalfördelningens standardiserade frek- vensfunktion är <f>'(vj2) = -v/2 <f>(ya), att 4>{-va) = <KV,2) o ch 1 - $ (c.2) = $ (c(2)
samt att 0 (oo) = 0 kan vi skriva (8.6) som
o oo
E(V/2lVi2 > - C/2> = ^ (vi2> ] = (8-?)
* (C,2) - C,2
<t> (ct-2) _ ^l2r,/ou)
~ % (c.2) ~a" *(Z.2r,/ou)
Definiera A = $(•) / $(•) varefter vi nu slutligen kan skriva om (8.4) som
- 171 -
Kapitel 8
Den andra termen i (8.8) är lika med noll endast om A eller pu£ är lika med noll
eftersom o alltid är positiv i en stokastisk modell. Heckman (1979) visar att A närmar sig noll när urvalssannolikheten $(•) går mot ett. Detta är intuitivt rimligt; det finns inget bortfall att korrigera för när vi inte har något bortfall.
Om p # 0, dvs korrelation mellan slumptermen i se lektionsekvationen (u.^) och
slumptermen i årsarbetstidsekvationen (e/2), och utan korrektion för bortfallet
kommer alltså minsta-kvadrat-skattningar av ^-vektorn att ge icke förväntnings riktiga estimât. I litteraturen anges två principiella sätt att lösa detta problem. Det första sättet har föreslagits av Heckman (1976). Tillvägagångssättet är att först
estimera parametervektorn n/au m^d en probitmodell, där variabeln D är en
funktion av de observerade Z-variablerna. Därefter beräknas A-termen explicit och separat för varje observation genom att utgå från det estimerade uttrycket Zpfj/oru . Slutligen adderas den senare termen till regressionsekvationen yi2 som
en funktion av X-variablerna, dvs en minsta-kvadrat-skattning med y/2 som be
roende variabel och X.~ och A som o beroende variabler. i2
Det andra sättet är att med maximum-likelihood-metoden utnyttja hel a samplet för att e stimera ß, rj, pue och a£ (i detta slags modeller går det inte i allm änhet att
identifiera o varför den rutinmässigt sätts till ett). Vi har dock inte, med de olika mått på arbets- och arbetslöshetstider vi använt, lyckats få log-likelihood-funk- tionen att konvergera.
Vi kan alltså endast presentera regressionsresultat enligt Heckmans metod. Först skattas en probitmodell för en "icke-bortfalls-ekvation", med oberoende variabler för ålder (ALD80), åldern i kvadrat (S QALD80), kön (DKOEN), medborgarskap (DMEDB) samt förekomst av arbetshandikapp (DHAND). Resultatet av probit- skattningen framgår av tabell 8.2.
- 1 72 -
Tabell 8.2 Probitestimation av "icke-bortfalls-ekvation".
Variabel Koefficient Asymp
t-värde KONSTANT -1.177 -5.53 ALD80 0.530E-01 4.03 SQALD80 -0.731E-03 -3.95 DKOEN -0.102 -2.36 DMEDB -0.416 -5.16 DHAND -0.423 -4.80 n = 2 700 Log-Likelihood = -1 691.6
Det A (L B) som har beräknats med hjälp av probitskattningen adderas som en separat variabel till ekvation (8.1) som sedan estimeras med minsta-kvadrat metoden. Resultatet av denna estimation framgår av tabell 8.3.
Tabell 8.3 kommer utförligare att kommenteras senare. Vi skall endast konstatera att bortfallskorrektionen inte har ändrat effekten av arbetsmarknadsutbildning på årsarbetstiden för år 1982. Den skattade koefficienten 8 uppgår även här till cirka 25 timmar och är fortfarande inte signifikant skild ifrån noll.
- 1 7 3 -
Kapitcl 8
Tabell 8.3 Vägd minsta-kvadrat-skattning av årsarbetstiden år 1982 med
korrektion för bortfall..
Variabel Koefficient t-värde
KONSTANT 3 710.0 0.28 I 24.7 0.44 ALD80 -25.8 -0.08 SQALD80 0.4 0.08 DKOEN -251.7 -0.42 DMEDB 473.5 0.19 DHAND 555.6 0.22 DYRKUTB 17.2 0.42 DALLUTB 125.9 2.69 DYO 19.7 0.28 DY13 99.7 1.60 DY46 -30.1 -0.42 DY9 -10.9 -0.15 DYX -112.5 -1.24 LB -1 544.9 -0.19 n 858 R2 0.1066 F 7.18 8.2.3 Korrektion för självselektion
Vi skall nu övergå till att behandla fall 3 i figur 8.1, dvs vi antar till att börja med att vi inte har något bortfallsproblem men att dummyvariabeln för programdel tagandet nu är endogen. Innebörden av de tta är allts å att individerna inte längre antas vara slumpmässigt fördelade på deltagar- respektive icke-deltagargrupp. Huruvida en individ kommer att de ltaga i utbildning eller ej är i ställe t resultat av någon form av selektionsprocess. Denna selektion är ber oende av antingen indivi den själv eller någon programadministratör.
- 174-
Problemet kan illustreras med följande enkla modell:
y,?
= x«/
+ 6li+ ei2 (8.9)I * t = Z T) + u. 1 l (8.10)
I. = 1 om I*. > 0
(8.11) I . i = 0 o m I * . < 0 i —
där yi2 är årsarbetstiden vid tidpunkt 2 (år 1982) för individ /, X.2 är en radvektor
av o beroende variabler för individ i vid tidpunkt 2 och ß är en kolumnvektor av koefficienter. L är som tidigare en dummyvariabel för programdeltagande som antar värdet ett om en individ har genomgått utbildning under tidsperiod 1 och noll i övrigt. Z. är en radvektor av variabler som påverkar sannolikheten att indi vid i har genomgått utbildning och rç är dess koefficientvektor. Utbildningens effekt på årsarbetstiden är 8. Om det vore så att vi s kulle ha tillgång till alla de variabler som bestämmer hur mycket arbetstid en individ bjuder ut skulle vi kunna erhålla förväntningsriktiga skattningar av koefficienterna i (8.9). En del av dessa variabler är dock i stor t sett omöjliga att s amla in och kvantifiera på ett menings fullt sätt. Det kan gälla variabler som t ex motivation och attityder. Antag att det förhåller sig så som illustreras i figur 8. 2.
Individer m ed positiv attityd till utbildning kan antas ha större sannolikhet att ut bilda sig än andra individer. Har man positiv attityd till utbildning bör man rim ligtvis även ha positiv attityd till marknadsarbete. Individer med positiv attityd till utbildning/arbete har alltså dels hög sannolikhet att utbilda sig och dels hög ar betstid oavsett utbildning.
Kapitel 8 - 1 7 5 -
Figur 8.2 Illustration av attityd- r espektive utbildningseffektens inverkan på
årsarbetstiden. Attityden till utbildning
och marknadsarbete
+ Beslut att utbilda sig
(Attityd effekt)
+ (Utbildnings effekt)
Arbetstid
När vi vill uppskatta om det föreligger några skillnader i årsarbetstid (eller in komster) mellan program- respektive icke programdeltagare har vi alltså dels en attityd- o ch dels en utbildningseffekt att ta hänsyn till. För att komma åt utbild ningseffekten är det önskvärt att ta hänsyn till självse lektionen.
Självselektionen medför att en minsta-kvadrat-skattning av (8.9) kommer att ge ett icke förväntningsriktigt estimât för 8 om dummyvariabeln L är korrelerad med
slumptermen Det betyder att de som genomgått arbetsmarknadsutbildning
skulle ha haft, även i frånvaro av utbildning, olika årsarbetstider jämfört med de som inte genomgick utbildning.
Vi har alltså icke observerbara variabler i slumptermen som är korrelerade
med L . Slumptermen e.2 kan uppdelas i två termer; v.2 som är de utelämnade
variabler som direkt påverkar I. oc h e*i2 som är övriga u telämnade variabler vilka
är okorrelerade med L. Ekvation (8.9) kan nu skrivas som
y«2 - X«/ + 5I, + vi2 + e*i2 (8.12)
- 1 7 6 -
Med de tankegångar som illustrerades i figur 8.2 så blir sammanfattningsvis re sultatet följande om ingen hänsyn tas till s jälvselektionen: Vid positiv korrelation mellan I. och v. kommer 6 (den skattade effekten av arbetsmarknadsutbildning på årsarbetstiden) att överskattas.
Barnow (1987) sammanfattar, efter en genomgång av åtskilliga amerikanska ut värderingsstudier av arbetsmarknadsutbildning, att följande sätt att korrigera för självselektion har kommit till användning:
(i) inkludera variabler som använts för att utvälja deltagare: Om man vet vilka
variabler s om används för att välja ut programdeltagare kan man kontrol lera för dessa i analysen. Barnow menar att eftersom de faktorer som på verkar urvalet till programmet troligtvis i stor utsträckning överlappar de variabler s om bestämmer utfallet (sysselsättning, inkomst) så kan alla stu dier sägas ha använt denna metod även om de inte explicit har noterat det.
(ii) konstruera matchade urval av deltagare respektive icke deltagare: Jäm
förelsegruppen väljs så att de liknar deltagargru ppen i så stor utsträckning som möjligt. Utfallet kan därefter beräknas som skillnaden mellan de två gruppernas medelvärden avseende t ex årsarbetstid.
(iii) specificera antaganden om de icke observerbara variablerna: Det vanligaste antagandet i de nna typ av studier är att d e icke observerbara variablerna är konstanta över tiden så att differensskattningar kan utföras.
(iv) vikta observationerna: Genom att vikta obser vationerna i en regression får
man medelvärdena för de förklarande variablerna m er lika i deltagar- re spektive icke deltagargrupp. Denna metod har använts för att utveckla bättre matchade urval.
(v) modellera selektionsförfarandet: När selektionsvariabeln inte är observerbar
har Heckman (1979) utvecklat metoder att korrigera för selektions-bias genom att göra antaganden om hur det icke observerbara selektionsindexet ser ut.
- 1 7 7 -
Kapitel 8
Vi skall här tillämpa den sistnämnda metoden att korrigera för selektions-bias. Tillvägagångssättet är analogt med det som tillämpades när d et gäller korrektion för bortfall, dvs ett två-stegs-estimationsförfarande.
Första steget består av att med hjälp av en probitfunktion skatta sannolikheten att delta i arbetsmarknadsutbildning. Den probitfunktion som skall estimeras har följande utseende:
I = a + 77 ALD80 + 7KSQALD80 + tkDMEDB + rç DHAND +
1 2 3 4 (813)
^DYRKUTB +
rj
6 KAS + rç-A KASSAdär förutom tidigare definierade variabler
KAS = kontant arbetsmarknadsstöd år 1980 i kronor
AKASSA = erhållen ersättning från arbetslöshetsförsäkringen under år 1980
Eftersom vi inte har uppgifter om antal arbetslöshetsdagar för år 1 980 använder vi kontant stöd vid arbetslöshet som proxyvariabler för arbetslöshetstidens längd detta år. Vi har uppde lat stödet i två separata variabler; kontant arbetsmarknads stöd respektive ersättning från arbetslöshetsförsäkringen. Anledningen till denna uppdelning är att ersättningarna har olika regler och olika ersättningsbelopp. Resultatet av den utförda probitskattningen återfinns i tabell 8.4.
- 178-
Tabell 8.4 Probitskattning av sannolikheten att d eltaga i arbetsm arknadsut
bildning.
Variabel Koefficient Asymp
t-värde KONSTANT -1.766 -7.08 ALD80 0.672E-01 4.34 SQALD80 -0.109E-02 -4.93 DMEDB 0.415 5.30 DHAND 0.677 8.13 DYRKUTB -0.490 -9.33 KAS -0.116E-04 -0.63 AKASSA 0.905E-05 2.11 n = 2 700 Log-Likelihood = -1183.1
Med utgångspunkt från probitskattningen beräknar vi därefter i det andra steget för varje individ en ny variabel (LA) enligt följande:7
L A = o m 1 = 1 , d v s o m i n d i v i d i
$(Zi2fj) har genomgått arbetsmarknads
utbildning
7 Härledningen av variabeln LA är analog med härledningen av variabeln LB (jfr föregående av