• No results found

Vad påverkar en kommuns totala kostnad?: En multipel regressionsanalys av faktorer som korrelerar med kommuners kostnader

N/A
N/A
Protected

Academic year: 2021

Share "Vad påverkar en kommuns totala kostnad?: En multipel regressionsanalys av faktorer som korrelerar med kommuners kostnader"

Copied!
21
0
0

Loading.... (view fulltext now)

Full text

(1)

Vad påverkar en kommuns totala kostnad?

En multipel regressionsanalys av faktorer som korrelerar med kommuners kostnader

MARKUS BERG OCH MALTE KROON

Stockholm 2015

Kandidatexamensarbete i Teknisk Fysik

Institutionen för Matematisk Statistik, KTH

(2)

Sammanfattning

Denna uppsats undersöker hur olika faktorer påverkar den totala verk-samhetskostnaden per capita i Sveriges kommuner. Detta görs genom en multipel linjär regressionsanalys. Datan som används är från 2013 och de oberoende variablerna är valda så att modellen dels får god prediktiv för-måga och dels kan tolkas strukturellt. Den slutgiltiga modellen har god prediktiv förmåga (R2 = 0.692) och några av de faktorer som korrele-rar med kostnaderna är politiskt styre, kommunal skattesats, kommunala tillgångar, medelålder och folktäthet.

(3)

Abstract

This paper examines how different factors affect the overall operation costs per capita in Swedish municipalities. This is done by a multiple lin-ear regression analysis. The data used are from 2013, and the independent variables are chosen such that the model has both good predictive ability and can be interpreted structurally. The final model has good predictive ability (R2= 0.692) and some of the factors that correlate with the costs are political governance, municipal tax, municipal assets, average age and population density.

(4)

Innehåll

1 Inledning 4 1.1 Bakgrund . . . 4 1.2 Syfte . . . 4 2 Teori 5 2.1 Multipel regression . . . 5

2.2 Ordinary Least Squares . . . 5

2.3 F-test . . . 6

2.4 R2 . . . 7

2.5 η2 . . . 7

2.5.1 Cohen’s rule of thumb . . . 7

2.6 Fel i modellen . . . 8

2.6.1 Endogenitet . . . 8

2.6.2 Heteroskedasticitet . . . 8

2.6.3 Multikollinearitet . . . 9

2.7 Akaike information criterion . . . 9

3 Metod 10 3.1 Regressionsförfarande . . . 10

3.2 Kovariat i den ursprungliga modellen . . . 11

3.3 Kovariat i den reducerade modellen . . . 11

4 Resultat 13 5 Diskussion 14 5.1 Data . . . 14 5.2 Resultat . . . 14 5.3 Svårigheter . . . 15 5.4 Förbättringar . . . 16 6 Slutsats 16 A Appendix 19

(5)

1

Inledning

1.1

Bakgrund

Ett demokratiskt samhälle bygger på att folkvalda politiker får förtroendet att bestämma hur samhället ska styras och hur skattepengarna förvaltas. Det ligger i medborgarnas intresse att de folkvalda arbetar i linje med vad som har utlovats och att pengarna används på bästa sätt. Således är det viktigt att kunna granska den offentliga sektorns arbete.

Det kan emellertid vara svårt för den enskilda medborgaren att bilda sig en uppfattning om hur mycket olika verksamheter kostar i snitt och huruvida skattepengarna används effektivt, varför det är viktigt med verktyg som hjäl-per till och förenklar granskningen. Den offentliga sektorn granskas ständigt av till exempel medier, där det ibland hävdas att skattepengar slösas bort.[1] Det saknas dock systematiska metoder för att på ett objektivt sätt jämföra vilka kostnader en kommun bör ha i snitt, givet vissa inneboende egenskaper.

1.2

Syfte

Modellen som tas fram i denna uppsats ger möjlighet att se vilka faktorer, ex-empelvis politiskt styre, kommunal skattesats,kommunala tillgångar, medelålder och folktäthet, som påverkar en kommuns totala kostnad per capita. Modellen kan sedan användas för att jämföra kommuners totalkostnad per capita i för-hållande till skattningen. Resultaten kan dels användas av kommuner för att effektivisera verksamheten och dels av privatpersoner och media för att granska kommuners arbete.

(6)

2

Teori

2.1

Multipel regression

En multipel linjär regression är en metod för att modellera ett linjärt beroende mellan en beroende variabel Y och oberoende kovariat X enligt:

Y = Xβ +  (1) där Y =      y1 y2 .. . yn      , X =      xT 1 xT 2 .. . xT n      =      1 x11 · · · x1p 1 x21 · · · x2p .. . ... . .. ... 1 xn1 · · · xnp      , β =      β0 β1 .. . βp      och ε =      ε1 ε2 .. . εn     

Detta skrivs med tensornotation som:

yi = β0+ β1xi1+ ... + βpxip+ i= xTiβ + i (2)

βi är en okänd parameter som förklarar hur starkt yi beror på xi enligt:

βi=

∂yi

∂xi

(3)

 är residualerna, vilka är oberoende stokastiska variabler med egenskaperna:

E[i] = 0 och E[2i] = σ

2 (4)

Dessa egenskaper beskrivs under rubrikerna Ordinary Least Squares samt He-teroskedasticitet.

Effekter som endast kan vara aktiva eller ej kan beskrivas med dummy-variabler {xi} som definieras enligt:

xi=

(

1, om effekten är aktiv.

0, annars. (5)

2.2

Ordinary Least Squares

Ordinary Least Squares (OLS) är en metod som skattar βigenom att minimera

kvadratsumman av residualerna. Kvadratsumman skrivs som:

n X i=1 ˆ e2i = n X i=1 (yi− ˆyi)2= (Y − Xβ)T(Y − X bβ) = (6) = YTY − 2YTX bβ + bβTXTX bβ

Skattningen bβ som minimerar residualerna söks, varför uttrycket deriveras och sätts till noll:

(7)

∂Pn i=1eˆ2i ∂ bβ = −2X TY + 2XTX bβ = 0 ⇒ ⇒ 2XTY = 2XTX bβ ⇒ ⇒ bβ = (XTX)−1XTY (7)

Antaganden för att OLS-estimatorn ska vara konsistent är:

• Exogena variabler

• Ingen perfekt kollinearitet

OLS är även den optimala linjärna estimatorn, Best Linear Unbiased ESti-mator (BLUES), om felen är:

• Homoskedastiska

• Saknar autokorrelation

Detta tillsammans med att väntevärdet av residualerna är noll kallas Gauss-Markov-antaganden.

Kovariansmatrisen för ˆβ beräknas enligt:

Cov( ˆβ) = E[( ˆβ − β)( ˆβ − β)T] = (8) = (XTX)−1XT(σ2I)X(XTX)−1= (XTX)−1σ2 En estimator för σ är: s2= 1 n − k − 1|ˆe| 2 (9)

Således kan kovariansmatrisen estimeras som:

\

Cov( ˆβ) = (XTX)−1s2 (10)

För att detta skall gälla måste modellen vara homoskedastisk. Annars kan kovariansmatrisen skattas medelst White’s konsistenta variansmatris, se Hete-roskedasticitet nedan.

2.3

F-test

F-test används för att avgöra huruvida en eller flera skattade parametrar är lika med noll och således kan uteslutas ur modellen. Testet bygger på att två regressioner genomförs: en för den fulla modellen med samtliga variabler och en för den reducerade modellen där ett antal testvariabler utelämnas. F-variabeln är ett mått på hur mycket residualerna skiljer sig åt mellan dessa modeller

(8)

och testar huruvida de utelämnade variablerna bidrar till att förklara datan. F-värdet beräknas enligt nedan:

F = n − k − 1 r  |ˆe∗|2 |ˆe|2 − 1  (11) ˆ

e är residualerna från den fulla regressionen med k variabler, ˆe∗ är residualerna

för den reducerade regressionen där r variabler har avlägsnats och n är det totala antalet observationer. F-värdet kommer att ha en F-fördelning, F ∈ F (r, n − k − 1), vilket ger sannolikheten för ett visst F-värde. Om F-värdet är stort är sannolikheten för nollhypotesen att de utelämnade variablerna inte påverkar den beroende variabeln liten, varför den kan förkastas.

2.4

R

2

R2 är en skalär som beskriver hur väl data och modell stämmer överens, där

R2= 1 betyder att regressionen passar datan perfekt. R2beräknas som andelen

av den totala variationen i datan som förklaras av modellen enligt:

R2= 1 − Pn i=1(yi− ˆyi)2 Pn i=1(yi− ¯y)2 (12) ˆ

yiär det av modellen skattade värdet, ¯y är medelvärdet och yiär en observation

av y.

2.5

η

2

R2beskriver hur väl alla kovariat tillsammans beskriver datan. På liknande sätt kan man vilja undersöka hur mycket en enskild variabel bidrar till att förklara datan. Detta kallas effektstorleken för en variabel.

Ett mått på effektstorlek är η2 vilket bestäms genom att två regressioner genomförs, en med samtliga kovariat i modellen och en där en variabel har avlägsnats. Sedan beräknas η2 som följer:

η2= |ˆe∗| 2− |ˆe|2 |ˆe∗|2 =R 2− R2 ∗ 1 − R2 ∗ (13)

Nedsänkt * betyder att värdet har beräknats för en reducerad modell.

2.5.1 Cohen’s rule of thumb

Det är vanligt att inkludera η2-värden i en regressionsutskrift. För att tolka dessa

så kan Cohen’s rule of thumb [2] användas, vilken kategoriserar effektstorlekarna enligt:

Tabell 1: Cohen’s rule of thumb. Effektstorlek Liten Mellan Stor

(9)

2.6

Fel i modellen

Om antagandena för OLS inte är uppfyllda riskerar estimaten och dess standar-davvikelser att bli inkonsistenta.

2.6.1 Endogenitet

Då feltermen korrelerar med en eller flera av kovariaten föreligger endogenitet, varpå väntevärdet av feltermerna blir nollskillt och skattningen inkonsistent. Endogenitet kan uppstå då den beroende variabeln influerar de oberoende vari-ablerna eller om relevanta variabler saknas i modellen. Det kan även uppstå vid urvalsbias eller på grund av mätfel. En lösning på detta är att lägga till relevan-ta variabler i modellen eller försöka hitrelevan-ta instrumentvariabler (IV), vilket är ett slags ersättningsvariabler som förklarar samma fenomen men som ej korrelerar med feltermen.

2.6.2 Heteroskedasticitet

Heteroskedasticitet innebär att inte alla residualer har samma standardavvikel-se; motsatsen är homoskedasticitet. Om modellen felaktigt antas vara homos-kedastisk kan punktskattningar göras men variansskattningarna blir felaktiga. För att avhjälpa heteroskedasticitet kan modellen försöka omformuleras eller så används White’s konsistenta variansmatris, vilken skrivs:

Cov( ˆβ) = (XTX)−1XTD(ˆe2)X(XTX)−1= (14) = (XTX)−1 n X i=1 ˆ e2ixTixi ! (XTX)−1

D(ˆe2) är en diagonal n × n-matris vars i:te diagonalelement är ˆe i2.

En metod för att upptäcka heteroskedasticitet är Breusch-Pagan-testet, vil-ket kollar om den skattade variansen av residualerna i kvadrat går att uttrycka som en linjärkombination av kovariaten enligt:

ˆe2= γ1+ p

X

i=2

γiXi+ ηi (15)

Sedan görs ett F-test för denna modell. Om p-värdet understiger en bestämd gräns så förkastas nollhypotesen, γ2 = ... = γp = 0, varför modellen är

hete-roskedastisk.

Om White’s variansmatris används är F-testet ej tillämpbart när flera β skattas. Istället används ett Wald-test. De β som antas vara noll under nollhy-potesen samlas i en vektor β2 så att modellen blir:

Y = X1β1+ X2β2+ e (16)

Waldfaktorn beräknas sedan som:

W = bβ2TVˆ2−1βb2 (17)

ˆ

V2är den skattade kovariansmatrisen för ˆβ2och r är antalet element i β2. r−1W

är fördelad som r−1W ∈ F (r, n − k − 1) varvid det beräknade värdet på W kan användas för att testa nollhypotesen. [3]

(10)

2.6.3 Multikollinearitet

Multikollinearitet är när kovariat korrelerar med varandra. Vid perfekt multikol-linearitet kan en variabel bestämmas exakt som en linjärkombination av andra variabler, varpå matrisen X inte får full rang och kan därmed inte inverteras, vilket krävs för genomförandet av OLS.

Parvisa korrelationer kan studeras i en korrelationsmatris för att undersöka om det finns multikollinearitet i modellen. Om ett par har hög korrelation så tas den ena bort ur modellen. Studeras kovariat för parvis korrelation upptäcks inte korrelation med flera variabler samtidigt. Detta kan upptäckas med VIF-testet, vilket ger ett värde på hur starkt olika kovariat i en modell korrelerar med övriga kovariat. Testet utförs på följande vis:

Först körs en regression för varje oberoende variabel,

Xj = c +

X

i6=j

αiXi+ e (18)

c är en konstant och e är feltermen. Sedan beräknas VIF-faktorn för varje ko-variat som VIF = 1

1−R2 i

. Som tumregel avlägsnas en kovariat om den har ett värde på VIF > 10. [4]

2.7

Akaike information criterion

För att avgöra vilka kovariat som skall ingå i den slutgiltiga modellen används Akaike Information Criterion (AIC), vilket är ett mått för att jämföra modellers relativa styrka. AIC bygger på informationsteori och hanterar utbytet mellan hur väl modellen beskriver observerad data (goodness of fit) och risken att modellen beskriver slumpmässiga fel (overfitting). AIC-värdet beräknas som:

AIC = n ln(|ˆe|2) + 2k (19)

där n är antalet observationer, e är residualerna och k är antalet kovariat. AIC beräknas för möjliga modeller och sedan väljs den modell som minimerar värdet. Som alternativ till AIC kan Bayesian Information Criterion (BIC) använ-das, men inom litteraturen tycks det inte råda konsensus om vilken som bör användas.

(11)

3

Metod

Kommundata som misstänks korrelera med kommunens kostnader hämtas från i huvudsak Statistiska centralbyrån (SCB) och Sveriges Kommuner och Landsting (SKL).

3.1

Regressionsförfarande

Datan importeras till Matlab och en fullständig modell med alla kovariat skapas. Sedan betraktas beskrivande statistik i form av kostnad plottad mot respektive kovariat. De variabler som inte ser linjära ut logaritmeras, varefter variabler som ter sig tydligt olinjära avlägsnas från modellen. Beskrivande statistik för de kovariat som är med i den slutgiltiga modellen visas i Appendix. Sedan testas kovariaten för multikorrelation medelst ett VIF-test. De kovariat som har ett för högt VIF-värde kommer att tas bort en i taget - i fallande ordning - tills inget värde ligger över gränsen på 10. Sedan testas modellen för heteroskedasticitet med ett Breusch-Pagan-test. Om kraftig heteroskedasticitet föreligger omformu-leras modellen genom att ta bort eller transformera heteroskedastiska kovariat. Måttlig heteroskedasticitet kommer att försummas ty det inte innebär några problem då White’s robusta estimator används.

Modellen reduceras sedan för att minska dess komplexitet och därmed risk för överanpassning. Huruvida en variabel skall ingå i modellen avgörs med AIC. Först beräknas den fullständiga modellens AIC-värde. Sedan utelämnas det minst signifikanta kovariatet och AIC beräknas igen. Om den reducerade mo-dellen har lägre AIC utelämnas kovariatet. Denna procedur upprepas till den slutgiltiga modellen får ett minimerat AIC-värde.

Sedan testas modellen med Breusch-Pagan igen för att se huruvida hete-roskedasticitet föreligger. Modellen testas även för endogenitet genom att plotta residualerna mot respektive kovariat för att se om linjära samband föreligger. Dessa plottar finns i Appendix för kovariat i den slutgiltiga modellen.

(12)

3.2

Kovariat i den ursprungliga modellen

Den ursprungliga modellen innehåller följande kovariat:

Tabell 2: Kovariat i fulla modellen.

Arbetslöshet Area

Folkmängd Andel med studentexamen

Medelålder Andel med eftergymnasial utbildning

Skatteintäkter per capita Alliansstyre

Blandat styre Andel med utländsk bakgrund

Andel gifta Andel skilda

Folktäthet Medellängd äktenskap

Hushållsstorlek Andel singelhushåll

Antal grundskoleelever per capita Andel kommunanställda

Gymnasiedensitet Andel som bor på äldreboende

Andel som får hemhjälp Elever per lärare

Andel med hjälp för funktionsnedsättning Huspris

Kommunal skattesats Inkomst kommunalanställda

Tätortsgrad Andel vägarea

Kommunala tillgångar

3.3

Kovariat i den reducerade modellen

Modellens beroende variabel är:

Verksamhetens kostnader

Verksamhetens kostnader är kommunens löpande externa kostnader mätt i svens-ka kronor (SEK) i form av löner, arbetsgivaravgifter, hyror, bidrag, förändrad pensionsavsättning, utbetalda pensioner, inköp av varor och tjänster etc. per invånare år 2013.[5]

Efter att multikorrelerande variabler tagits bort och modellen reducerats en-ligt AIC så återstår följande kovariat:

Medelålder

Medelålder beräknas för kommunens alla invånare den 31 december 2013. [6]

Politiskt styre

Datan för det politiska styret avser mandatperioden mellan åren 2010-2014 i kommunfullmäktige. Det politiska styret delas in i tre kategorier: alliansstyre, vänsterstyre samt blandat styre. Med Alliansstyre avses ett styre som består av Moderaterna, Centerpartiet, Folkpartiet och Kristdemokraterna samt eventu-ellt Miljöpartiet och andra lokala småpartier. Med vänsterstyre avses ett styre som består av Socialdemokraterna och/eller Vänsterpartiet samt eventuellt Mil-jöpartiet och andra lokala småpartier. Med Blandat styre avses ett styre som består av en koalition med minst ett av allianspartierna samt Socialdemokra-terna och/eller Vänsterpartiet samt eventuellt Miljöpartiet och andra lokala småpartier.

(13)

I modellen kommer Alliansstyre och Blandat styre att utgöras av två dum-myvariabler och vänsterstyre kommer att vara benchmark. Detta innebär att estimaten för dummyvariablerna kommer att utgöra skillnaden i förhållande till vänsterstyre.[7]

Andel gifta

Variabeln Andel gifta anger andelen av invånarna som den 31 december 2013 var gifta eller registrerade partners.[8]

Folktäthet

Folktätheten beräknas som antalet invånare i kommunen dividerat med kommu-nens landareal. Folkmängden avser antalet invånare den 31 december 2013 och landarealen är mätt i kvadratkilometer år 2013.[9][10]

Andel kommunanställda

Andel kommunanställda anger den andel av kommunens invånare som år 2013 var anställda och månadsavlönade av kommunen.[11]

Gymnasiedensitet

Gymnasiedensitet beräknas som kvoten mellan antalet elever som är folkbok-förda i kommunen och går i gymnasiet dividerat med kommunens totala antal invånare.[12]

Elever per lärare

Elever per lärare anger antalet elever per heltidsanställd lärare i grundskolan år 2013.[12]

Huspris

Huspris anger medelpriset på småhus för permanentboende år 2013. Detta antas spegla den generella prisnivån på kommunens fastighetsmarknad.[13]

Kommunal skattesats

Kommunal skattesats avser skattesatsen i kommunen år 2013.[14]

Kommunala tillgångar

Kommunala tillgångar avser kommunens totala tillgångar enligt balansräkning-en per invånare, mätt i kronor år 2013.[15]

(14)

4

Resultat

Beskrivande statistik för de kovariat som ingår i den slutgiltiga modellen finns bifogat i Appendix A. De variabler som logaritmerades var Folktäthet, Huspris, Kommunal skattesats samt Kommunala tillgångar. De som föreföll icke-linjära efter logaritmering var Tätortsgrad och Andel hjälp. Följande variabler hade VIF-värden över 10 och togs bort: Andel med eftergymnasial utbildning, Hus-hållsstorlek och Andel singelhushåll. Medelålder hade initialt ett värde över 10, vilket dock hamnade under gränsen när de andra togs bort.

Sedan testades den VIF-reducerade modellen för heteroskedasticitet medelst Breusch-Pagan. Detta resulterade i ett p-värde på 0.4515, varför nollhypotesen att modellen är homoskedastisk inte kunde förkastas.

De kovariat som uteslöts enligt AIC var:

Tabell 3: Uteslutna kovariat enligt AIC.

Arbetslöshet Area

Andel med studentexamen Andel med eftergymnasial utbildning Skatteintäkter per capita Andel med utländsk bakgrund

Andel skilda Medellängd äktenskap

Hushållsstorlek Andel singelhushåll

Anta grundskoleelever per capita Inkomst kommunalanställda Andel som bor på äldreboende Andel som får hemhjälp

Andel vägarea Folkmängd

Den AIC-reducerade modellen gav följande regressionsresultat:

Tabell 4: Regressionsresultat för den reducerade modellen.

Estimate Std.Error Eta.sq p.value

Intercept 46250.074038 2899.629537 0.49768 0.0000 Medelålder 86.260503 23.357315 0.05859 0.0003 Alliansstyre -1198.464047 685.266966 0.00941 0.0814 Blandat styre -2685.158906 840.336705 0.03658 0.0016 Andel gifta -82.856063 12.797761 0.12714 0.0000 log(Folktathet) -7.338814 7.003420 0.00369 0.2956 Andel kommunanställda 40.076086 4.944408 0.21514 0.0000 Gymnasiedensitet 15.542200 4.433017 0.05780 0.0005

Elever per lärare 102.654706 26.131017 0.07867 0.0001

log(Huspris) 16.277862 8.027114 0.01667 0.0435

log(Kommunal skattesats) 19.534131 8.318424 0.01878 0.0196 log(Kommunala tillgångar) 14.792134 5.753426 0.03056 0.0107

Modellen har Breusch-Pagan-värdet p = 0.0169. Detta p-värde är betydligt lägre än för den fulla modellen. Enligt den deskriptiva statistiken syns ingen tydlig heteroskedasticitet. White’s konsistenta variansmatris används för alla beräkningar, varför heteroskedasticitet inte innebär några större problem. Wald-värdet dividerat med antalet kovariat ärWr = 4886, vilket svarar mot ett p-värde väldigt nära 1. Modellen har ett R2= 0.692.

(15)

5

Diskussion

5.1

Data

Icke-slumpmässighet, antal observationer, saknade observationer och urvalsbias kommer inte att innebära några problem då vi tittar på hela populationen av kommuner.

Datainsamlingen gick obehindrat då SCB sammanställer mycket kommunal da-ta. Därför testades många variabler i den fulla modellen. Även variabler som inte har ett uppenbart samband med kommunens kostnader togs med, exempelvis Alliansstyre, Blandat styre, Andel gifta och Medelålder. Att antalet anställda på-verkar kommunens kostnader är apparent, men variabeln är med dels för att öka modellens prediktionsförmåga och dels för att ta hänsyn till antalet anställda då effekten av andra kovariat bestäms.

5.2

Resultat

I stort har estimaten bra p-värden, men blandade η2-värden. Således är det

osannolikt att estimaten uppkommit på grund av slumpmässighet. Överlag är effektstorleken liten till mellanstor enligt Cohen’s tumregel.

Ett intressant resultat är att det politiska styret i en kommun korrelerar med dess kostnader, men detta är inte signifikant för Alliansstyre varvidlag resulta-tet är osäkert. Sambandet är förmodligen inte kausalt ty det politiska styret i sig inte ger upphov till kostnader, utan snarare hur politiker beslutar att sköta verksamheten. Hade alla kausala variabler varit med i modellen hade alltså inte politiskt styre haft någon inverkan. Detta kallas att politiskt styre inte har nå-gon inverkan ceteris paribus. Resultatet är likväl intressant, då det säger något om korrelationen mellan politiskt styre och kommunkostnader.

En intressant observation är att Blandat styre har lägre kostnader än Allians-styre. Ser man till den politiska ideologin bör alliansstyrda kommuner ha lägst kostnader, då de strävar efter en mindre offentlig sektor än ett vänsterstyre. Orsakerna till detta kan bara spekuleras om, vilket överlåts till andra. Denna uppsats kan dock ge bra underlag för en sådan undersökning.

Regressionsutskriften ger vidare att Medelålder korrelerar med kostnaderna. Detta är förmodligen inte ett kausalt samband, varför effekten ändras om man tillför förklarande variabler. Att ha med alla förklarande variabler är inte möjligt då data inte är tillgängligt och dessutom gör modellen för komplex. Således kan Medelålder ses som en samlingsvariabel". Vid val av kovariat görs en avvägning mellan att ha en enkel modell och att minska multikorrelationen.

Även Andel gifta har sannolikt ett icke-kausalt samband. Enligt våra resultat hänger större andel gifta samman med lägre expenser för kommunen. En an-ledning kan vara att vissa kostnader för kommunen beror av antalet hushåll snarare än antalet invånare. I den ursprungliga modellen fanns snittstorleken för hushåll med, men denna variabel led av stark multikorrelation, eventuellt med andel gifta.

(16)

Elever per lärare och Andel kommunanställda bör ha kausala samband med kostnader. Detta då utbetalda löner dyker upp explicit i resultaträkningen som en kostnadspost. Ett märkligt resultat är att fler elever per lärare hänger sam-man med högre kostnader. Intuitivt bör det omvända gälla, vilket talar för ett icke-kausalt samband. Många Elever per lärare ger lägre Andel kommunan-ställda, något som kan tyckas vara ett korrelationsproblem. VIF gav dock inga sådana indikationer, vilket kan bero på att lärarna bara utgör en liten del av alla anställda. Estimaten är positiva och signifikanta.

Om log(Folktäthet) ökar så minskar Verksamhetens kostnader, troligtvis på grund av att fler personer delar på den offentliga verksamheten, såsom gatustädning och parkskötsel. Detta resultat är dock inte signifikant.

Hög Gymnasiedensitet bidrar till högre kostnader. Detta är rimligt ty elev-mängden renderar utgifter i form av lokalkostnader och dylikt. Likaså leder högt log(Huspris) till höga kostnader. Under antagandet att huspriserna speg-lar det generella kvadratmeterpriset för lokaler är detta rimligt, då skolor och äldreomsorg kräver lokaler.

log(Kommunal skattesats) korrelerar med högre kostnader. Här skulle det dock kunna föreligga omvänd kausalitet, då högre kostnader kan leda till att skatten höjs. Annars kan det vara så att Parkinsons andra lag har verifierats, vilken säger att: "Utgifterna stiger för att motsvara inkomsterna"[16].

Ett intressant resultat är att hög log(Kommunala tillgångar), det vill säga en större balansräkning, tycks hänga samman med högre kostnader. Detta skulle kunna indikera att kommuner bör köpa in tjänster snarare än att försöka dri-va verksamhet själdri-va. Detta ligger i linje med samlingen managementidéer som ryms inom begreppet New Public Management [17], där man strävar efter att outsourca och marknadsanpassa offentliga verksamheter.

5.3

Svårigheter

En av de stora svårigheterna var att avgränsa modellen. Det kommer alltid att föreligga en viss multikorrelation, varför de enskilda estimaten - och såle-des modellens strukturella tolkning - beror av övriga inkluderade kovariat. Det är således viktigt vilka kovariat som ingår i modellen. Det blir även svårt att tolka estimaten för icke-kausala samband, vilket är ett besläktat problem. Att bara hitta kausala samband hade inte varit intressant, ty det i sådana fall hade varit lättare att titta i resultaträkningen direkt. Ett mål med studien var att dels titta på inneboende egenskaper hos kommunen, exempelvis Folktäthet och Gymnasiedensitet och dels faktorer som går att påverka, exempelvis Elever per lärare. För att välja variabler till modellen samlades först mycket data in för faktorer som antogs korrelera med kostnaderna. Sedan tilläts metodiken under Regressionsförfarande avgöra vilka variabler som skulle ingå i den slutgiltiga modellen.

(17)

5.4

Förbättringar

I brist på liknande arbeten saknades vägledning vid formulering av frågeställ-ning och val av modell. I efterhand kan det spekuleras om huruvida en mer specificerad frågeställning hade gett mer lättolkade resultat. Något som liknan-de arbeten kan beakta i framtiliknan-den är att specificera kostnaliknan-derna för en viss verksamhet och undersöka den i större detalj, exempelvis skolkostnader. Då finns större möjlighet att ta med samtliga korrelerande variabler och således få en starkare tolkning av modellen.

6

Slutsats

Valda kovariat predikterar kommuners kostnader väl, med R2= 0.692. Model-len ger en bra bild av några faktorer som starkt korrelerar med kostnaderna. De resultat som författarna anser intressantast är att alliansstyre och blandat styre tenderar att hänga samman med lägre kostnader samt att en större balansräk-ning korrelerar med högre kostnader, varför kommuner kanske bör outsourca mer.

(18)

Referenser

[1] Rebecca Weidmo Uvell. Lagstifta mot slarvet med skattepengarna. url: http : / / www . expressen . se / debatt / lagstifta mot slarvet med -skattepengarna/.

[2] Peter Watson. Rules of thumb on magnitudes of effect sizes. url: http: //imaging.mrc-cbu.cam.ac.uk/statswiki/FAQ/effectSize.

[3] Harald Lang. Elements of Regression Analysis. 2014.

[4] J. Neter M. H. Kutner C. J. Nachtsheim. Applied Linear Regression Models (4th ed.) McGraw-Hill Irwin, 2004. isbn: 978-0073014661.

[5] Statistiska centralbyrån. Resultaträkning 2013. url: http://www.scb. se/sv_/Hitta-statistik/Statistik-efter-amne/Offentlig-ekonomi/ Finanser-for-den-kommunala-sektorn/Rakenskapssammandrag-for-kommuner-och-landsting/11897/11904/.

[6] Statistiska centralbyrån. Sveriges befolkning, kommunala jämförelsetal, 31 december 2013. url: http : / / www . scb . se / sv _ /Hitta - statistik / Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/ Befolkningsstatistik/25788/25795/.

[7] Sveriges Kommuner och Landsting. Styren i kommuner. url: http : / /

skl.se/demokratiledningstyrning/valmaktfordelning/valresultatmaktfordelning2014. 4696.html.

[8] Statistiska centralbyrån. Sveriges befolkning, kommunala jämförelsetal, 31 december 2013. url: http : / / www . scb . se / sv _ /Hitta - statistik / Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/ Befolkningsstatistik/25788/25795/.

[9] Statistiska centralbyrån. Sveriges befolkning, kommunala jämförelsetal, 31 december 2013. url: http : / / www . scb . se / sv _ /Hitta - statistik / Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/ Befolkningsstatistik/25788/25795/.

[10] Statistiska centralbyrån. Land- och vattenareal per den 1 januari efter region och arealtyp. url: http://www.scb.se/sv_/Hitta-statistik/ Statistik-efter-amne/Miljo/Markanvandning/Land--och-vattenarealer/ #c_undefined.

[11] Statistiska centralbyrån. Antal anställda efter ålder, kön och kommun.

url: http://skl.se/ekonomijuridikstatistik/statistiknyckeltaljamforelser/ personalstatistik/personalenidiagramochsiffror/tabellerkommunalpersonal2014/ kommunalpersonal2013.872.html.

[12] Skolverket. url: http://www.jmftal.artisan.se/.

[13] Statistiska centralbyrån. Köpeskilling för småhus. url: http://www.scb. se/sv_/Hitta-statistik/Statistik-efter-amne/Boende-byggande- och-bebyggelse/Fastighetspriser-och-lagfarter/Fastighetspriser-och-lagfarter/10957/10964/Kommunstatistik/53969/.

[14] Statistiska centralbyrån. Kommunalskatteuppgifter efter region. År 2000 - 2015. url: http://www.statistikdatabasen.scb.se/pxweb/sv/ssd/ START _ _OE _ _OE0101 / Kommunalskatter2000 / ?rxid = dd572b7e fb4b -4cca-b456-6ba998411f6c.

(19)

[15] Statistiska centralbyrån. Balansräkning för kommuner efter region och ba-lansräkningsposter. År 1998 - 2014. url: http://www.statistikdatabasen. scb . se / pxweb / sv / ssd / START _ _OE _ _OE0107 _ _OE0107A / BalansKn / ?rxid=16f959a4-810e-4651-8144-c777a6800980.

[16] C. N. Parkinson. Parkinson’s Law. Buccaneer Books, 1996. isbn: 978-1568490151.

[17] Roland Almqvist. New Public Management - om konkurrensutsättning, kontrakt och kontroll. Liber, 2006. isbn: 9789147077205.

(20)

A

Appendix

Deskriptiv statistik

Medelålder 35 40 45 50 Kostnader ×104 4 6 8 10 Alliansstyre 0 0.5 1 Kostnader ×104 4 6 8 10 Blandat styre 0 0.5 1 Kostnader ×104 4 6 8 10 Andel gifta 20 30 40 50 Kostnader ×104 4 6 8 10 log(Folktäthet) -5 0 5 10 Kostnader ×104 4 6 8 10 Andel kommunanställda 0 0.1 0.2 Kostnader ×104 4 6 8 10 Gymnasiedensitet 0 0.02 0.04 0.06 Kostnader ×104 4 6 8 10

Elever per lärare

5 10 15 20 Kostnader ×104 4 6 8 10 log(Huspris) 4 6 8 10 Kostnader ×104 4 6 8 10 log(Kommunal skattesats) 2.8 3 3.2 Kostnader ×104 4 6 8 10 log(Kommunala tillgångar)-2 0 2 4 Kostnader ×104 4 6 8 10

(21)

Residualer

Medelålder 35 40 45 50 Residualer ×104 -2 0 2 4 Alliansstyre 0 0.5 1 Residualer ×104 -2 0 2 4 Blandat styre 0 0.5 1 Residualer ×104 -2 0 2 4 Andel gifta 20 30 40 50 Residualer ×104 -2 0 2 4 log(Folktäthet) -5 0 5 10 Residualer ×104 -2 0 2 4 Andel kommunanställda 0 0.05 0.1 0.15 Residualer ×104 -2 0 2 4 Gymnasiedensitet 0 0.02 0.04 0.06 Residualer ×104 -2 0 2 4

Elever per lärare

5 10 15 20 Residualer ×104 -2 0 2 4 log(Huspris) 4 6 8 10 Residualer ×104 -2 0 2 4 log(Kommunal skattesats) 2.8 3 3.2 Residualer ×104 -2 0 2 4 log(Kommunala tillgångar)-2 0 2 4 Residualer ×104 -2 0 2 4

References

Related documents

De variabler som bidrog mest till den totala stopptiden var F aktisk st¨ alltid, Sm˚ astopp samt M aterialbyte.. F aktisk st¨ alltid kan eventuellt minskas till under 10 minuter

Den negativa påverkan är att variansen på ˆ ökar eftersom det inte finns tillräckligt med variation i kovariaten för att veta vad den har för påverkan på den beroende

Läs noggrant informationen nedan innan du börjar skriva tentamen..  Svara kort

Läs noggrant informationen nedan innan du börjar skriva tentamen..  Svara kort

Läs noggrant informationen nedan innan du börjar skriva tentamen..  Svara kort

 Svara kort och koncist.  Till alla uppgifterna ska fullständiga lösningar lämnas.  Lösningen till varje ny uppgift skall börjas på en ny sida.  Använd bara en sida

Läs noggrant informationen nedan innan du börjar skriva tentamen..  Svara kort

 Efter varje uppgift anges maximala antalet poäng som ges.  Även delvis lösta problem kan