Befolkningsprognos för kommunerna i Stockholms län under perioden 2003-2012

(1)

Befolkningsprognos för kommunerna i Stockholms län under perioden 2003-2012

Martin Elfsberg

U.U.D.M. Project Report 2004:10

Examensarbete i matematisk statistik, 20 poäng

Handledare: Silvelyn Zwanzig, Uppsala universitet och Johan Bring, Statisticon Examinator: Silvelyn Zwanzig

Juni 2004

(2)

Befolkningsprognos f ¨or kommunerna i Stockholms l¨an under perioden 2003-2012

Martin Elfsberg

9 juni 2004

(3)

Tack!

Jag vill b örja med att tacka Johan Bring (chef Statisticon) f ör att du gav mig denna m öjlighet och Tomas Pettersson (handledare vid Statisticon).

Silvelyn Zwanzig (handledare/examinator vid Uppsala Universitet) f ¨or

all tid och kunskap du bidragit med, du har varit ett stort st ¨od under ar-

betets g˚ang. Till sist vill jag tacka John Brandel och Johan Eriksson f ¨or att

ni alltid st¨allt upp och besvarat mina stundtals kn¨appa fr˚agor under min

studietid.

(4)

Sammanfattning

F ¨or kommunerna i Stockholms l¨an har en befolkningsprognos gjorts

f ¨or perioden 2003-2012. Arbetet presenterar flera olika modeller f ¨or

hur en s˚adan prognos kan g ¨oras antingen genom att anv¨anda regres-

sionsanalys, tidsserieanalys eller multivariat tidsserieanalys. Regres-

sionsmodellen användes f ör att g öra prognoser f ör alla kommuner

under tidsperioden medan tidssseriemodellerna och multivariat mod-

ellen anv¨andes p˚a tv˚a kommuner. Det ¨ar stora skillnader i resultaten

med varierande trender mellan prognoserna och stora variationer i

standardavvikelserna. Ser man till den historiska utvecklingen hos

kommunerna ¨ar det regressionsmodellen som ger den mest trov¨ardiga

prognosen.

(5)

Inneh˚all

1 Inledning 6

1.1 Syftet med denna studie . . . . 6

1.2 Kompletterande syfte . . . . 7

2 Data 8 2.1 Datamaterial . . . . 8

3 Multivariat tidsserieanalys 10 3.1 Andra ordningens egenskaper . . . 10

3.2 Estimering av v¨antev¨ardesvektorn och kovariansmatrisen . 11 3.3 Multivariata ARMA processer . . . 11

3.4 Prognos av multivariata autoregressiva processer . . . 12

4 Analys 12 4.1 Kontroll av data . . . 12

4.2 Tidsserieanalys . . . 13

4.3 Multivariat tidsserieanalys . . . 14

4.4 Regressionsanalys . . . 14

5 Resultat 15 5.1 Kontroll av data . . . 15

5.2 Tidsserieprognos . . . 15

5.3 Multivariat tidsserieprognos . . . 17

5.4 Regressionsprognos . . . 17

6 Diskussion 20

7 Referenser 23

8 Bilaga 1: F ¨orklaring av nyckeltal och kommunkoder 24 9 Bilaga 2: Resultat fr˚an kontrollen av datamaterialet 26 10 Bilaga 3: ARMA(p,q)-modeller f ¨or kommunerna med och utan

trend 30

11 Bilaga 4: Resultat fr˚an tidsserieprognoser med modell 1 och 2, dvs Prognos med trend respektive Prognos utan trend, f ¨or kommun

114 och 115 34

(6)

12 Bilaga 5: Resultat fr˚an multivariat tidsserieanalys p˚a kommun

114 och 115 36

13 Bilaga 6: Regressionsmodeller 37

14 Bilaga 7: Resultat av regressionsprognoser med linj¨ar och kvadratisk

extrapolation 39

15 Appendix 46

(7)

1 Inledning

1.1 Syftet med denna studie

Landstingsstyrelsen fattade f˚ar n˚agra ˚ar sedan ett beslut om att det skulle g öras en befolkningsprognos p˚a kommunniv˚a f ör Stockholms län. Land- stinget beslutade att Regionplane- och trafikkontoret (RTK) inom Stock- holms läns landsting (SLL) skall ansvara f ör upphandlingen. Statisticon har p˚a uppdrag av RTK f˚att i uppgift att g öra en befolkningsprognos f ör länets kommuner mellan ˚aren 2003-2012. Figur 1 visar hur befolkningsmängden

¨okat i Stockholms l¨an under perioden 1968-2002.

Befolkningsmängd Stockholms län 1968−2002

År

Befolkningsmängd

1970 1975 1980 1985 1990 1995 2000

1500000160000017000001800000

Figur 1: Befolkningsm¨angden i Stockholms l¨an mellan ˚aren 1968-2002.

Varf ¨or kan det vara av intresse f ¨or SLL att f˚a veta hur kommunernas be-

folkningsutveckling ser ut inom en kommande tio˚arsperiod? En prognos

av befolkningsmängden kan ligga till grund f ör planeringen inom länet

och d˚a fr¨amst inom sjukv˚ardsplaneringen. Prognosen g ¨ors p˚a kommunniv˚a

s˚a att den kan aggregeras till olika indelningar inom sjukv˚arden tex f ¨or de

ca. 250 v˚ardcentraler som länet är indelat i. Prognosen skall där användas

tex f ¨or f ¨orlossningsplanering och diagnosprognoser, d˚a man tex multi-

plicerar antalet kvinnor respektive m¨an i olika ˚aldrar med risken att f˚a

(8)

av infarkter

¹

.

Arbetet är inte bara av intresse f ör SLL utan även intressant f ör Statisti- con men deras intresse är av en lite annorlunda karaktär. De har ett behov av att f˚a fram automatiserade processer f ör att kunna detektera avvikelser fr˚an ursprungliga prognoser. Genom att g öra konfidensintervall f ör prog- nosen kan man lätt se om det blir n˚agon avvikelse under ˚aren. Det är tänkt att man ska f˚a en varning om en eller flera prognoser hamnar utanf ör in- tervallet.

I detta arbete begränsar jag mig till att bara studera befolkningsmängdens utveckling f ör länets kommuner under perioden 2003-2012. Studien kom- mer att g öras genom att använda b˚ade tidsserie- och regressionsanalys. Jag har använt mig av programmet R i detta arbete.

²

Jag kommer att studera varje kommun var f ör sig men ger teorin bakom multivariat tidsserieanalys samt utf ör ett enkelt exempel f ör tv˚a av kommunerna. Anledning till varf ör jag inte unders öker det multivariata sambandet f ör alla kommuner och g ör min prognos utifr˚an den är att metoden inte är färdigutvecklad i R och inte returnerar n˚agra standardavvikelser vilka beh övs f ör beräkningen av konfidensintervallet.

³

1.2 Kompletterande syfte

Detta arbete ska även kunna användas som ett hjälpmedel f ör andra stu- denter eller personer med ett intresse av att lära sig använda programmet R. I Appendix i slutet av detta arbete presenterar jag hur man kan g˚a till väga när man vill g öra tidsserie- och regressionsanalyser samt prognoser i R. Det ska däremot f örtydligas att det kan g öras p˚a flera olika sätt och att de metoder jag redovisar kanske inte är de bästa men syftet är att ge läsaren och den intresserade lite tips och idéer som han sedan själv kan utveckla vidare.

1Ulla Moberg, statistikansvarig SLL, e-mail f˚att den 15/3-04

2Kan laddas ner fr˚an www.r-project.org

3I version 1.8.1 av R fungerar inte detta men det kommer att fungera i senare versioner.

(9)

2 Data

2.1 Datamaterial

I datamaterialet f ¨or en kommun beskrivs tretton demografiska nyckeltal.

Kort kan man säga att ett nyckeltal är en variabel som beskriver kom- munens uppbyggnad vad gäller antal inv˚anare, medel˚alder, antal d öda osv. Vilka dessa nyckeltal är och en kort beskrivning av dem kan ses i Bi- laga 1. Varje nyckeltal är en tidsserie med ett värde f ör varje ˚ar mellan 1968-2002. Som redan nämnts s˚a begränsar jag mig till att bara studera ny- ckeltalet bef, dvs befolkningsmängden den 31/12 det aktuella ˚aret.

Stockholms l¨an best˚ar av 25 kommuner mellan ˚aren 1968-1997 men from

˚ar 1998 best˚ar länet av 26 kommuner. Det som hände 1998 var att S ödertäljes kommun delades upp i S ödertälje och Nykvarns kommun. Det innebär att Nykvarns kommun bara har existerat i fem ˚ar och har lite f ör f˚a observa- tioner f ör att man ska kunna g öra tillf örlitliga modeller. Därf ör valde jag att inte studera dessa kommuner var f ör sig utan lägga ihop dess värden och studera de som en kommun som i detta arbete f˚att kommunkoden 140181. Vilka kommuner som ing˚ar i Stockholms län samt deras kom- munkod kan ses i Bilaga 1. I fortsättningen kommer jag att hänvisa till en kommun genom dess kod istället f ör att använda kommunens fullständiga namn.

I de sex figurerna nedan visas befolkningsutvecklingen f ör varje kommun i länet under perioden 1968-2002. Anledningen till indelningen är att det

är stora variationer i befolkningsmängden mellan kommunerna vilket g ör

att det kan bli otydliga figurer.

(10)

Befolkningsmängd 1968−2002

År

Befolkningsmängd

1970 1975 1980 1985 1990 1995 2000

500010000150002000025000

115 125 128 139 187 192

Figur 2: Befolkningsm¨angd 1968-2002

År

Befolkningsmängd

1970 1975 1980 1985 1990 1995 2000

150002000025000300003500040000

114 117 120 138

Figur 3: Befolkningsm¨angd 1968-2002

År

Befolkningsmängd

1970 1975 1980 1985 1990 1995 2000

25000300003500040000

162 183 186 191

Figur 4: Befolkningsm¨angd 1968-2002

År

Befolkningsmängd

1970 1975 1980 1985 1990 1995 2000

2000030000400005000060000700008000090000

123 126 127 136 140181

Figur 5: Befolkningsm¨angd 1968-2002

(11)

År

Befolkningsmängd

1970 1975 1980 1985 1990 1995 2000

40000500006000070000

160 163 182 184 188

Figur 6: Befolkningsm¨angd 1968-2002

År

Befolkningsmängd

1970 1975 1980 1985 1990 1995 2000

660000680000700000720000740000760000 180

Figur 7: Befolkningsm¨angd 1968-2002

3 Multivariat tidsserieanalys

Man kan studera tidsserier oberoende och var f ör sig som univariata tidsserier men denna metod är dock inte att f öredra när man handskas med tv˚a eller flera tidsserier eftersom den inte tar hänsyn till m öjliga beroenden mellan tidsserierna. Dessa korsvisa beroenden är av stor vikt framf ör allt när man ska prediktera framtida värden

⁴

.

3.1 Andra ordningens egenskaper

Vi har n stycken tidsserier X

t1

...X

tn

d¨ar n=1...25 observerade vid ˚aren t=1968...2002.

Varje tidsserie motsvarar nyckeltalet bef f ¨or en av kommunerna. Vi skapar en vektor X

_t

= (X

11

, ..., X

tn

) och definierar v¨antev¨ardesvektorn

µ

t

= EX

_t

= [µ

_t1

...µ

tn

]

(1) och kovariansmatrisen

4Brockwell & Davis, Introduction to Time Series and Forecasting,2002

(12)

Γ(t + h, t) =

⎡

⎢ ⎣

γ

11

(t + h, t) . . . γ

_1m

(t + h, t) ...

γ

m1

(t + h, t) . . . γ

_mm

(t + h, t)

⎤

⎥ ⎦ (2)

d¨ar γ

ij

(t + h, t) = Cov(X

t+h,i

, X

t,j

).

3.2 Estimering av v¨antev¨ardesvektorn och kovariansmatrisen

En naturlig väntevärdesriktig estimator av väntevärdesvektorn µ baserad p˚a observationerna X

₁

...X

n

¨ar medelv¨ardesvektorn

⁵

¯X

_n

= 1 n

n t=1

X

_t

(3)

Kovariansmatrisen estimeras enligt ˆΓ(h) =

₁

n

_n−h

t=1

X

_t+h

− ¯X

_n

X

_t

− ¯X

_n

d˚a 0 ≤ h ≤ n − 1

ˆΓ(−h)

d˚a −n + 1 ≤ h < 0 (4)

Om vi kallar den (i,j)-komponenten av ˆ Γ(h) d¨ar i, j = 1, 2, ... f¨or ˆγ

ij

(h) s˚a

¨ar estimatet av korskorrelationen

ˆρ

ij

(h) = ˆγ

ij

(h) [ˆγ

ii

(0)ˆγ

jj

(0)]

⁻¹²

(5)

Detta ger korrelationen mellan alla tidsserierna i datamaterialet och n¨ar i = j s˚a blir ˆ ρ

ij

autokorrelations funktionen f ¨or den i’te tidsserien.

3.3 Multivariata ARMA processer

En multivariat ARMA(p,q) process kan skrivas

X

_t

− Φ

1

X

_t−1

− . . . − Φ

p

X

_t−p

= Z

t

+ Θ

1

Z

_t−1

+ . . . + Θ

q

Z

_t−q

(6)

d¨ar Z

_t

∼ W N(0, ).

5Brockwell & Davis, Introduction to Time Series and Forecasting,2002

(13)

3.4 Prognos av multivariata autoregressiva processer

Om vi antar att X

_t

¨ar en AR(p) process med koefficientmatrisen Φ = Φ

1

, . . . , Φ

p

kan vi skriva denna

X

_t

= Φ

₁

X

_t−1

+ . . . + Φ

_p

X

_t−p

+ Z

_t

, Z

_t

∼ W N(0,

) (7)

F ör att beräkna den bästa h-steg linjära prediktorn P

_n

X

_n+h

baserad p˚a komponenterna X

₁

, ..., X

n

s˚a applicerar vi den linj¨ara prediktorn P

_n

p˚a ek- vation 7 f ¨or att utf ¨ora recursionen

⁶

P

n

X

_n+h

= Φ

1

P

n

X

_n+h−1

+ . . . + Φ

p

P

n

X

_n+h−p

(8)

Kovariansmatrisen ber¨aknas enligt E

(X

_n+h

− P

_n

X

_n+h

) (X

_n+h

− P

_n

X

_n+h

)

n ≥ p (9)

4 Analys

I detta avsnitt presenterar jag hur kontrollen av datamaterialet gjordes och vilka modeller som användes f ör att g öra prognoser.

4.1 Kontroll av data

När man ställs inf ör en uppgift där det är stora datamängder som ska hanteras är det viktigt att man b örjar med att kontrollera sina data innan man g ör sina analyser. Eftersom detta arbete g˚ar ut p˚a att g öra befolkn- ingsprognoser är det mest intressant att analysera dessa data. Kan man tänka sig att befolkningen vid en viss tidpunkt i en kommun är beroende av andra nyckeltal? Det är intuitivt att befolkningen vid slutet av innest˚aende

˚ar beror av kommunens befolkning ˚aret innan samt d ¨ods-, f ¨odelse-, inflyttnings- och utflyttningstalet innest˚aende ˚ar. Nedan visas hur modellen ser ut som testar detta p˚ast˚aende och i Bilaga 2 visas resultaten.

bef (t) αbef (t − 1) + βdoda(t) + γf odda(t) + λinf l(t) + ρutf l(t) − 1

6Brockwell & Davis, Introduction to Time Series and Forecasting, 2002

(14)

4.2 Tidsserieanalys

Det finns m˚anga olika sätt att anpassa en ARMA(p,q) modell till sin tidsserie och i Appendix ges f örslag p˚a hur det kan g˚a till. I detta arbete valde jag att g öra p˚a tv˚a olika sätt.

1. Med trend: Jag valde att behandla trenden genom att anpassa en kur- va till tidsserien med en regressionsmodell. Vilken typ av kurva som anpassades beror av tidsseriens utseende mellan ˚aren 1968-2002 och jag ans˚ag att det antingen är en linjär eller en andragrads ekvation som bäst kan f örklara trenden. Ett annat antagande jag g ör är att det f ör varje tidsserie inte är n˚agra säsongseffekter och d˚a blir residualer- na lika med tidsserien minus trenden. Till residualerna anpassades sedan en ARMA(p,q) modell.

2. Utan trend: Om man antar att tidsserien ¨ar station¨ar s˚a kan man an- passa en ARMA(p,q) modell direkt p˚a den.

I Bilaga 3 kan man se vilka ARMA(p,q) modeller som anpassades till tidsserier- na n¨ar de ovan beskrivna metoderna anv¨andes.

Jag presenterar här tv˚a olika modeller f ör hur en prognos kan g˚a till väga.

1. Prognos med trend: Man b örjar med att använda sig av en kortare del av tidsserien tex 1968-1996. Till denna anpassar man en modell f ör trenden och g ör en prognos, pred.trend, f ör 1997 och en ARMA(p,q) modell anpassas till residualerna och en prognos, pred.arima, g örs f ör 1997. F ör ˚ar 1998 används sedan tidsserien mellan 1968-1997. Detta upprepas tom ˚ar 2002 och d˚a kan kovariansen mellan pred.trend och pred.arima beräknas. Sedan fortsätter man f ör ˚ar 2003 och d˚a kan man beräkna prognosen f ör befolkningsmängden enligt

pred(2003) = pred.trend + pred.arima (10) och konfidensintervallet enligt

pred(2003) ± λ

1−α/2

×

se.trend

²

+ se.arima

²

+ 2 × Cov(pred.trend, pred.arima) där se.trend och se.arima är standardavvikelsen f ör pred.trend respek-

tive pred.arima. Detta upprepas f ¨or varje ˚ar som ska prognosticeras.

(15)

2. Prognos utan trend: Här används hela tidsseriens längd, dvs 1968- 2002, och om man antar att den är stationär kan en ARMA(p,q) mod- ell anpassas direkt p˚a den. En prognos g örs f ör alla ˚ar samtidigt i pe- rioden 2003-2012.

Dessa tv˚a modeller har jag applicerat p˚a tv˚a till utseendet olika kommuner, nämligen 114 och 115. Valet av kommuner har jag gjort eftersom trenden anpassas med en andragrads- respektive linjär ekvation och d˚a kan man se om n˚agon av modellerna är att f öredra framf ör den andra. Resultaten kan ses i Bilaga 4.

4.3 Multivariat tidsserieanalys

Som nämnts tidigare s˚a saknas den viktiga funktionen i R som beräknar standardavvikelsen vid en prognos av multivariata tidsserier och därf ör kan inte konfidensintervallet beräknas. Men jag gjorde änd˚a en prognos, dock bara f ör ett ˚ar där kommunerna 114 och 115 behandlades som multi- variata tidsserier. När man ska g öra prognoser är det av stor betydelse att man studerar det multivariata sambandet mellan kommunerna och hur detta kan g öras kan ses i Appendix. Tv˚a prognoser gjordes, den ena när en ARMA(p,q) modell hade anpassats enligt metoden Med trend och den andra med metoden Utan trend och resultaten kan ses i Bilaga 5.

4.4 Regressionsanalys

Som jag nämnde tidigare s˚a är det vissa skillnader i utseendet hos tidsserier- na. M˚anga tidsserier har en ganska stor variation under de f örsta 10-20

˚aren vilket g ör det sv˚art att anpassa en bra modell till hela serien. Där det har varit m öjligt att anpassa en bra modell till hela tidsserien har det gjorts men f ör de flesta av kommunerna har jag använt mig av lokal linjär eller kvadratisk extrapolation p˚a en kortare del av tidsserien. Hur detta har g˚att till kan man se i Appendix och i Bilaga 6 kan man se vilka regressionsmod- eller som anpassats och i kolumnen Kod om jag använt mig av hela eller bara en del av tidsserien.

Dessa regressionsmodeller har sedan använts f ör att g öra en prognos f ör

hela tidsperioden 2003-2012 p˚a en g˚ang. I Appendix kan man se hur denna

prognos kan g ¨oras i R och i Bilaga 7 hur prognoserna ser ut.

(16)

5 Resultat

H¨ar presenteras vilka resultat som f ¨oljer av kontrollen av datamaterialet och prognoserna.

5.1 Kontroll av data

I Bilaga 2 visas resultaten fr˚an kontrollen av datamaterialet. Som man kan se av dessa resultat s˚a är det f ör samtliga kommuner väldigt bra modellan- passningar (l˚aga p-värden f ör F-stat) och bra relationer mellan de ing˚aende variablerna (h öga R

²

) men det ¨ar dock vissa oklarheter. F ¨or kommun 187

är det bara bef(t-1) och infl(t) som är signifikanta och f ör kommun 117 är det fodda(t) som inte är signifikant även om doda(t) bara är signifikant p˚a 10%-niv˚an. N˚agon bra f örklaring till varf ör dessa kommuner avviker fr˚an de övriga kan jag inte ge men en sak som de har gemensamt är att de är kustkommuner.

5.2 Tidsserieprognos

I de tv˚a figurerna nedan kan man se resultatet fr˚an prognoserna med mod- ell 1 och 2, dvs Prognos med trend och Prognos utan trend.

Prognos 2003−2012 för kommun 114 med modell 1 och 2

År

Befolkningsmängd

1970 1980 1990 2000 2010

20000250003000035000

Prognos med trend Prognos utan trend

Figur 8: Prognos 2003-2012 f¨or kommun 114 med modell 1 och 2

Prognos 2003−2012 för kommun 115 med modell 1 och 2

År

Befolkningsmängd

1970 1980 1990 2000 2010

15000200002500030000

Prognos med trend Prognos utan trend

Figur 9: Prognos 2003-2012 f¨or kommun

115 med modell 1 och 2

(17)

Om man f örst studerar Figur 8 s˚a är det stora skillnader i prognosen mel- lan modellerna. Den stora nedg˚angen f ör modell 1 kan f örklaras av att det till trenden anpassades en andragradsekvation och när sedan prognosen beräknades enligt ekvation 10 s˚a är det prognosen f ör trenden (pred.trend) som dominerar. Detta f˚ar till f öljd att prognosen f ör modell 1 f öljer an- dragradsekvationen. Prognosen f ör modell 2 f öljer den avtagande tren- den som tidsserien uppvisar under ˚aren 2000-2002. Om man sedan ser p˚a resultaten f ör kommun 114 i Bilaga 4 s˚a är det stora skillnader vad gäller konfidensintervallet mellan modellerna pga stora skillnader i stan- dardavvikelsen. F ör modell 1 är det h öga standardavvikelser som ökar med prognos˚aret men än h ögre är det f ör modell 2 vilket f˚ar till f öljd att konfidensintervallen blir stora f ör b˚ada modellerna. Den lägre standard- avvikelsen f ör modell 1 har att g öra med att prognosen g örs f ör ett ˚ar i taget medan den betydligt h ögre standardavvikelsen f ör modell 2 beror av att prognosen g örs f ör alla ˚ar samtidigt och d˚a blir osäkerheten st örre f ör varje ˚ar.

I Figur 9 ser man hur prognoserna blev f ör kommun 115. Modell 1 f öljer prognosen f ör trendmodellen som i detta fall är en linjär ekvation medan modell 2 f öljer trenden som tidsserien uppvisar under ˚aren 2000-2002. I Bilaga 4 ser man att även här ger modellerna h öga standardavvikelser som ökar med prognos˚aret och stora konfidensintervall. Dock är det inte en lika stor ökning av standardavvikelsen f ör modell 1 som det är f ör motsvarande modell f ör kommun 114. ¨ Aven här g örs prognosen f ör mod- ell 2 f ör alla ˚ar samtidigt och d˚a ökar standardavvikelsen med prognos˚aret.

Kan man säga n˚agot om vilken modell som är bäst eller som passar vid ett

givet tillf¨alle? N¨ar man har en kommun med ett utseende som liknar det

f ör kommun 114, dvs där trenden bäst anpassas av en andragradsekva-

tion, s˚a ¨ar inte modell 1 att rekommendera. Den ger icke trov¨ardiga prog-

noser därf ör att de avtar väldigt snabbt. Modell 2 däremot, ger en prognos

med liknande trend som tidsserien har under ˚aren 2000-2002. Den avtar

inte lika mycket och jag anser därf ör att den är mera trovärdig. F ör kom-

muner vars historiska utveckling varit n¨astan linj¨ar kan b˚ada modellerna

användas även om modell 1 verkar mest trovärdig om man ser till den

historiska utvecklingen.

(18)

5.3 Multivariat tidsserieprognos

När man använder sig av multivariat tidsserieanalys s˚a kan man bara anpassa en AR(p) modell, det fungerar allts˚a inte med en ARMA(p,q) modell. AR(p) modellen anpassades med b˚ada metoderna Med trend och Utan trend. Av resultaten i Bilaga 5 ser man att det blir en AR(2) modell f ör tidsserierna Med trend och en AR(1) Utan trend. Man ser även ko- rrelationen mellan kommunerna som koefficienterna bef114&bef115 och bef115&bef114. Eftersom dessa koefficienter är sm˚a s˚a innebär det att det bara är en liten korrelationer mellan kommunerna.

I Bilaga 5 kan man även se hur prognosen blev f ör ˚ar 2003. Prognosen blir h ögre f ör b˚ada kommunerna i fallet d˚a data behandlades med metoden Med trend än Utan trend.

5.4 Regressionsprognos

F ör att konfidensintervallets längd ska kunna beräknas p˚a ett korrekt sätt s˚a ska residualerna vara oberoende men s˚a är inte fallet f ör alla kom- muner i detta arbete. Detta är n˚agot jag har varit medveten om men jag använder änd˚a metoden även om konfidensintervallens längd inte kom- mer att stämma exakt. Figurerna 10 och 11 visar residualerna f ör kommun 120 och 115 som är respektive inte är white noise.

I de sex figurerna, Figur 12-17, presenteras prognoserna som gjordes med

linj¨ar och kvadratisk extrapolation av tidsserien. Indelningen av kommuner-

na i figurerna beror p˚a variationen i befolkningsm¨angden och f ¨or att fig-

urerna ska vara s˚a tydliga som m ¨ojligt.

(19)

0.0 0.1 0.2 0.3 0.4 0.5

0.00.20.40.60.81.0

frequency Series: Residual.120

Figur 10: Residualer kommun 120, white noise

0.0 0.1 0.2 0.3 0.4 0.5

0.00.20.40.60.81.0

frequency Series: Residual.115

Figur 11: Residualer kommun 115, inte white noise

Prognos 2003−2012

År

Befolkningsmängd

1970 1980 1990 2000 2010

50001000015000200002500030000 115

125 128 139 187 192

Figur 12: Prognos 2003-2012 med linj¨ar/

kvadratisk extrapolation

Prognos 2003−2012

År

Befolkningsmängd

1970 1980 1990 2000 2010

1000015000200002500030000350004000045000

114 117 120 138

Figur 13: Prognos 2003-2012 med linj¨ar/

kvadratisk extrapolation

(20)

Prognos 2003−2012

År

Befolkningsmängd

1970 1980 1990 2000 2010

2500030000350004000045000

162 183 186 191

Figur 14: Prognos 2003-2012 med linj¨ar/

kvadratisk extrapolation

Prognos 2003−2012

År

Befolkningsmängd

1970 1980 1990 2000 2010

2 e+044 e+046 e+048 e+041 e+05

123 126 127 136 140181

Figur 15: Prognos 2003-2012 med linj¨ar/

kvadratisk extrapolation

Prognos 2003−2012

År

Befolkningsmängd

1970 1980 1990 2000 2010

4000050000600007000080000

160 163 182 184 188

Figur 16: Prognos 2003-2012 med linj¨ar/

kvadratisk extrapolation

Prognos 2003−2012

År

Befolkningsmängd

1970 1980 1990 2000 2010

650000700000750000800000

180

Figur 17: Prognos 2003-2012 med linj¨ar/

kvadratisk extrapolation

(21)

I Bilaga 6 kan man se vilka modeller som ligger till grund f ör prognoser- na och i kolumnen Kod kan ses fr˚an vilken tid som modellen gäller, bara i tre fall användes hela tidsseriens längd. Man ser även att det användes linjär extrapolation överallt f örutom p˚a kommunerna 127, 160 och 180 där det användes kvadratisk. F ör de flesta av kommunerna är det väldigt bra relation mellan de ing˚aende variablerna i modellen (h öga R

²

värden) med värden klart över 0.9, det är bara kommun 162 som inte n˚ar upp till det värdet med 0.8899. P-värdet f ör koefficienterna är klart signifikanta f ör alla kommuner även om det f ör kommun 127 bara är signifikant p˚a 5%- niv˚an. Det är även bra anpassade modeller med l˚aga p-värden f ör F-stat. I Bilaga 7 ser man att det f ör alla kommuner är monotont växande befolkn- ingsprognoser. ¨ Aven standardavvikelserna ökar med prognos˚aret, detta har sin f örklaring i att prognosen g örs f ör alla ˚ar samtidigt och d˚a blir osäkerheten st örre f ör prognoser längre fram i tiden. Man kan även se att med vissa undantag s˚a är merparten av kommunernas standardavvikelser p˚a nästan samma niv˚a.

6 Diskussion

När jag gjorde mina prognoser med tidsserieanalys jämf örde jag tv˚a oli- ka modeller (modell 1: Prognos med trend, modell 2: Prognos utan trend) p˚a kommunerna 114 och 115. F ör kommun 114 gav modell 1 en kraftigt avtagande prognos samt h öga standardavvikelser som ökar med tiden.

De h öga standardavvikelserna ger i sin tur att konfidensintervallet blir stort. Den avtagande prognosen beror p˚a att det till trenden anpassades en andragradsekvation och när prognosen sedan beräknas enligt ekva- tion 10 s˚a är det (pred.trend) som dominerar varf ör detta medf ör att prog- nosen f ör modell 1 f öljer andragradsekvationen. Modell 2 ger även den en avtagande prognos som i detta fall f öljer tidsseriens trend f ör ˚aren 2000-2002. ¨ Aven här blev standardavvikelserna h öga och h ögre f ör var- je prognos ˚ar med ökande konfidensintervall som f öljd. De växande stan- dardavvikelserna beror av att f ör denna modell g örs prognosen f ör alla

˚ar samtidigt vilket ger st örre osäkerhet desto längre fram i tiden som ska prognosticeras.

F ör kommun 115 ger modell 1 en växande prognos som även här f öljer

prognosen f ör trenden som f ör denna kommun är linjär. Modellen ger

h öga standardavvikelser som ökar med tiden även om ökningen är bety-

(22)

Aven här blev standardavvikelserna h öga och h ögre f ör varje prognos˚ar ¨ med ökande konfidensintervall.

Om man jämf ör resultatet fr˚an multivariata tidsserieprognosen med resul- taten fr˚an modellerna 1 och 2 s˚a är prognosen f ör kommun 114 lite lägre i b˚ada fallen (Med trend och Utan trend). F ör kommun 115 är däremot prog- nosen endast lägre i fallet Utan trend jämf ört med modell 2.

Jag presenterar mina prognoser fr˚an regressionsmodellerna som de slut- giltiga. Här har jag anpassat en modell till min tidsserie utifr˚an dess ut- seende och i de fall det var sv˚art att anpassa en bra modell till hela tidsse- rien använde jag mig av lokal linjär eller kvadratisk extrapolation p˚a en kortare del av serien. Prognoserna gjordes f ör alla ˚ar samtidigt och är f ör alla kommuner monotont växande med växande standardavvikelser men de är, med vissa undantag, p˚a en l˚ag niv˚a, därmed blir konfidensinterval- lets längd kort.

Vid en jämf örelse mellan alla olika sätt att g öra en prognos p˚a s˚a är det stora skillnader metoderna emellan. Jämf ör man resultaten f ör kommun 114 s˚a ger modell 1 och 2 prognoser där befolkningsmängden kommer att minska medan den kommer att öka med regressionsmetoden. Vilken metod som är sann kan jag s˚a klart inte avg öra men det verkar lite under- ligt att befolkningsmängden kommer att minska s˚a drastiskt med modell 1. ¨ Aven modell 2 ger en prognos där det kommer att ske en minskning men den är betydligt mindre. Om man tittar p˚a den historiska utvecklin- gen f ör kommunen i Figur 3 s˚a verkar det minst troligt att resultaten fr˚an modell 1 skulle inträffa medan resultaten fr˚an modell 2 och regressions- metoden (se Figur 8 resp Figur 13) mera troligt skulle kunna inträffa. När man sedan tittar p˚a standardavvikelsen s˚a blir de h öga f ör b˚ade modell 1 och 2 medan de i sammanhanget blir relativt sm˚a f ör regressionsmetoden.

F ör kommun 115 är det modell 1 och regressionsmetoden som ger en pos- itiv ökning av befolkningsmängden medan modell 2 ger en liten minskn- ing. ¨ Aven här är det modell 1 och 2 som har de h ögsta standardavvikelser- na och de längsta konfidensintervallen. F ör denna kommun verkar det som om modell 1 (se Figur 9) och regressionsmetoden (se Figur 12) är de som bäst skulle svara mot den verkliga befolkningsutvecklingen om man ser till hur den sett ut under perioden 1968-2002 enligt Figur 2.

Kan man säga n˚agot om vilken modell som är bäst eller är att f öredra

vid en prognos? Det ¨ar stora skillnader mellan modellerna som presenter-

(23)

ats i detta arbete främst vad gäller prognosens trend f ör perioden 2003- 2012 men även standardavvikelserna varierar kraftigt. Regressionsmeto- den ger f ör alla kommuner växande prognoser och, med vissa undantag, l˚aga standardavvikelser. Som man kan se i Figur 12-17 s˚a verkar prog- noserna vara trovärdiga om ser till hur befolkningsmängden utvecklats under ˚aren 1968-2002. Däremot s˚a är det lite sv˚arare att dra n˚agra bra slut- satser fr˚an prognoserna fr˚an modell 1 och 2 eftersom de bara användes p˚a tv˚a kommuner, men när en tidsseries trend anpassas med en andragrad- sekvation s˚a är modell 2 att f öredra. När trenden anpassas med en linjär ekvation är det däremot modell 1 som ger det mest trovärdiga resultatet.

H¨ar presenterar jag n˚agra f ¨orslag p˚a hur man kan utveckla detta arbete vidare.

• Det finns flera s¨att att behandla en tidsseries trend- och s¨asongseffekter

¨an de som gjorts i detta arbete (se Appendix f ¨or olika metoder).

Det vore intressant att se om man f˚ar liknande resultat eller om de avviker fr˚an de som framkommit i detta arbete.

• När en nyare version av R utges kan man testa det multivariata sam- bandet mellan kommunerna f ör att se om vissa kommuner samverkar och om en ökning av befolkningen i en kommun h ör samman med en minskning i en annan eller tvärtom. Sedan kan man g öra prog- noser och jämf öra med de som framkommit i detta arbete.

• Som det n¨amndes tidigare s˚a best˚ar datamaterialet av flera sk nyck-

eltal, det kan finnas ett intresse att ¨aven unders ¨oka dessa.

(24)

7 Referenser

1. Brockwell. Peter J. and Davis. Richard A. Time Series: Theory and Meth- ods, Springer, Second edition, 1991.

2. Brockwell. Peter J. and Davis. Richard A. Introduction to Time Series

and Forecasting, Springer, Second edition, 2002.

(25)

8 Bilaga 1: F ¨orklaring av nyckeltal och kommunkoder

Bef: befolkningsm¨angd den 31/12 respektive ˚ar.

Doda: antal avlidna under det aktuella ˚aret.

Fodda: antal levande f ¨odda under det aktuella ˚aret.

Infl: antal inflyttade under det aktuella ˚aret.

Utfl: antal utflyttade under det aktuella ˚aret.

Mbef: ˚arsmedelbefolkning (genomsnittet av befolkningen den 31/12.

innevarande ˚ar och befolkningen den 31/12 f ¨oreg˚aende ˚ar).

Dtal: det allmänna d ödstalet (antal d öda/medelbefolkningen).

Ftal: det allmänna f ödelsetalet (antal levande f ödda/medelbefolkningen).

Intal: det allm¨anna inflyttningstalet (antal inflyttade/medelbefolkningen).

Uttal: det allm¨anna utflyttningstalet (antal utflyttade/medelbefolkningen).

Folkokn: ˚arets folk ¨okning (absoluta tal).

Konskvot: k ¨onskvot (antal m¨an/totalbefolkningen).

M.alder: medel˚alder.

(26)

Kod Kommun Upplands V¨asby 114

Vallentuna 115

Oster˚aker ¨ 117

V¨armd ¨o 120

J¨arf¨alla 123

Eker ¨o 125

Huddinge 126

Botkyrka 127

Salem 128

Haninge 136

Tyres ¨o 138

Upplands-Bro 139

Nykvarn 140

T¨aby 160

Danderyd 162

Sollentuna 163

Stockholm 180

S ¨odert¨alje 181

Nacka 182

Sundbyberg 183

Solna 184

Liding ¨o 186

Vaxholm 187

Norrt¨alje 188

Sigtuna 191

Nyn¨ashamn 192

Tabell 1: Stockholms l¨ans kommuner och motsvarande kommunkoder

(27)

9 Bilaga 2: Resultat fr˚an kontrollen av datamate- rialet

Kod Coef Est s.e p R

²

F-stat

114 bef (t − 1) 1.0008795 0.0008736 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.9351931 0.084088 5.93e

⁻¹¹

∗ ∗∗

f odda(t) 0.9528176 0.0280109 2e

⁻¹⁶

∗ ∗∗

inf l(t) 1.0093891 0.0048149 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0157659 0.0126654 2e

⁻¹⁶

∗ ∗∗

115 bef (t − 1) 0.9999754 0.0007593 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.0447632 0.0903178 2.6e

⁻¹¹

∗ ∗∗

f odda(t) 1.0102011 0.0237737 2e

⁻¹⁶

∗ ∗∗

inf l(t) 1.0027265 0.0057002 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0001095 0.0097336 2e

⁻¹⁶

∗ ∗∗

117 bef (t − 1) 0.9977 0.013 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) 1.1839 0.6461 0.078813

inf l(t) 1.0925 0.1417 4.59e

⁻⁸

∗ ∗∗

utf l(t) −1.2251 0.3019 0.000427 ∗ ∗∗

120 bef (t − 1) 1.002074 0.002444 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.208724 0.256703 8.71e

⁻⁵

∗ ∗∗

f odda(t) 0.935601 0.077566 1.12e

⁻¹¹

∗ ∗∗

inf l(t) 1.017983 0.017805 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.014933 0.030468 2e

⁻¹⁶

∗ ∗∗

123 bef (t − 1) 1.000754 0.002039 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.010506 0.150004 5.74e

⁻⁷

∗ ∗∗

f odda(t) 0.833277 0.099747 1.45e

⁻⁸

∗ ∗∗

inf l(t) 0.988467 0.024218 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.965261 0.021481 2e

⁻¹⁶

∗ ∗∗

Tabell 2: Resultat fr˚an kontrollen av datamaterialet. Signifikanskoder en-

ligt: 0’’ , 0.001’’ , 0.01’’ , 0.05’.’

(28)

Kod Coef Est s.e p R

²

F-stat 125 bef (t − 1) 1.00089 0.001056 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.247879 0.14757 1.17e

⁻⁸

∗ ∗∗

f odda(t) 0.971536 0.036188 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.994042 0.010324 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.977018 0.016492 2e

⁻¹⁶

∗ ∗∗

126 bef (t − 1) 0.99972 0.003035 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.958464 0.348699 0.0112∗

f odda(t) 0.947314 0.06952 8.62e

⁻¹³

∗ ∗∗

inf l(t) 0.995747 0.017145 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.985483 0.023432 2e

⁻¹⁶

∗ ∗∗

127 bef (t − 1) 0.9999374 0.0006213 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.975656 0.0729326 1.28e

⁻¹²

∗ ∗∗

f odda(t) 0.9937089 0.0151623 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9949948 0.0028215 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.9934003 0.0049049 2e

⁻¹⁶

∗ ∗∗

128 bef (t − 1) 1.0005459 0.0007313 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.0720574 0.1001207 1.27e

⁻¹⁰

∗ ∗∗

f odda(t) 0.9824446 0.0336404 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9978481 0.006291 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.9977611 0.0066504 2e

⁻¹⁶

∗ ∗∗

136 bef (t − 1) 0.999911 0.002165 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.90727 0.231268 0.00064 ∗ ∗∗

f odda(t) 0.998611 0.06706 1.27e

⁻¹³

∗ ∗∗

inf l(t) 0.99765 0.011059 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.000452 0.017186 2e

⁻¹⁶

∗ ∗∗

138 bef (t − 1) 1.0007924 0.0005167 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.0671447 0.0528704 2e

⁻¹⁶

∗ ∗∗

f odda(t) 1.0015733 0.0165739 2e

⁻¹⁶

∗ ∗∗

inf l(t) 1.0007447 0.0045174 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0082368 0.0052892 2e

⁻¹⁶

∗ ∗∗

139 bef (t − 1) 1.000013 0.001406 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.895654 0.143291 1.85e

⁻⁶

∗ ∗∗

f odda(t) 1.072328 0.059606 1.95e

⁻¹⁵

∗ ∗∗

inf l(t) 1.000916 0.005475 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.022022 0.01818 2e

⁻¹⁶

∗ ∗∗

Tabell 3: Resultat fr˚an kontrollen av datamaterialet. Signifikanskoder en-

ligt: 0’’ , 0.001’’ , 0.01’’ , 0.05’.’

(29)

Kod Coef Est s.e p R

²

F-stat 140181 bef(t − 1) 1.0005524 0.0004952 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.9720567 0.0482082 2e

⁻¹⁶

∗ ∗∗

f odda(t) 0.9699968 0.020926 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9958037 0.005906 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0022267 0.0075999 2e

⁻¹⁶

∗ ∗∗

160 bef (t − 1) 1.0002072 0.0004576 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.0183212 0.0483821 2e

⁻¹⁶

∗ ∗∗

f odda(t) 1.047954 0.0189176 2e

⁻¹⁶

∗ ∗∗

inf l(t) 1.0032118 0.0021556 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0152475 0.0034266 2e

⁻¹⁶

∗ ∗∗

162 bef (t − 1) 0.9999102 0.0005868 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.052195 0.0558033 6.79e

⁻¹⁶

∗ ∗∗

f odda(t) 1.0633767 0.0382678 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9948989 0.0045052 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.9967756 0.0062731 2e

⁻¹⁶

∗ ∗∗

163 bef (t − 1) 1.0001752 0.0008445 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.9834674 0.0939221 1.99e

⁻¹⁰

∗ ∗∗

f odda(t) 1.0075482 0.0315124 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9979608 0.0060143 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0029394 0.0087107 2e

⁻¹⁶

∗ ∗∗

180 bef (t − 1) 1.0000165 0.0005907 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.9691208 0.0213725 2e

⁻¹⁶

∗ ∗∗

f odda(t) 0.9965041 0.0101594 2e

⁻¹⁶

∗ ∗∗

inf l(t) 1.00395 0.0042674 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0103216 0.0039792 2e

⁻¹⁶

∗ ∗∗

182 bef (t − 1) 1.000873 0.0005786 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.09069 0.0625227 3.89e

⁻¹⁵

∗ ∗∗

f odda(t) 1.0071841 0.0137245 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9986856 0.0040331 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.003003 0.0055974 2e

⁻¹⁶

∗ ∗∗

183 bef (t − 1) 0.998422 0.001055 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.876522 0.059666 1.71e

⁻¹³

∗ ∗∗

f odda(t) 1.014978 0.015675 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.999075 0.003184 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.998283 0.004383 2e

⁻¹⁶

∗ ∗∗

Tabell 4: Resultat fr˚an kontrollen av datamaterialet. Signifikanskoder en-

ligt: 0’’ , 0.001’’ , 0.01’’ , 0.05’.’

(30)

Kod Coef Est s.e p R

²

F-stat 184 bef (t − 1) 0.9999197 0.0007391 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.9639111 0.05254 1.26e

⁻¹⁵

∗ ∗∗

f odda(t) 1.0135313 0.0172346 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9901512 0.0049446 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.9945177 0.0055815 2e

⁻¹⁶

∗ ∗∗

186 bef (t − 1) 1.0007121 0.0003738 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.0065958 0.0204981 2e

⁻¹⁶

∗ ∗∗

f odda(t) 0.9594692 0.0286276 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.9976927 0.0029871 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.9991364 0.0049406 2e

⁻¹⁶

∗ ∗∗

187 bef (t − 1) 0.97092 0.02299 2e

⁻¹⁶

∗ ∗∗ 0.9992 2.2e

⁻¹⁶

inf l(t) 0.76693 0.31932 0.0235

188 bef (t − 1) 1.0010633 0.0003749 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −1.0411792 0.0225474 2e

⁻¹⁶

∗ ∗∗

f odda(t) 0.9864515 0.0133676 2e

⁻¹⁶

∗ ∗∗

inf l(t) 1.0002188 0.0043311 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.0126212 0.0066721 2e

⁻¹⁶

∗ ∗∗

191 bef (t − 1) 0.9975 0.001819 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.600977 0.171839 0.00185 ∗ ∗

f odda(t) 0.956883 0.035131 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.999015 0.0103 2e

⁻¹⁶

∗ ∗∗

utf l(t) −0.985222 0.011614 2e

⁻¹⁶

∗ ∗∗

192 bef (t − 1) 0.9999572 0.0006414 2e

⁻¹⁶

∗ ∗∗ 1 2.2e

⁻¹⁶

doda(t) −0.924532 0.0702784 1.82e

⁻¹²

∗ ∗∗

f odda(t) 0.9771507 0.0248474 2e

⁻¹⁶

∗ ∗∗

inf l(t) 0.994923 0.008884 2e

⁻¹⁶

∗ ∗∗

utf l(t) −1.000194 0.011482 2e

⁻¹⁶

∗ ∗∗

Tabell 5: Resultat fr˚an kontrollen av datamaterialet. Signifikanskoder en-

ligt: 0’’ , 0.001’’ , 0.01’’ , 0.05’.’

(31)

10 Bilaga 3: ARMA(p,q)-modeller f ¨or kommuner- na med och utan trend

Kod Med trend Koeff. Utan trend Koeff.

114 (2, 2) ar1 : 1.8694 (1, 3) ar1 : 0.9903

ar2 : −0.9545 ma1 : 1.1870

ma1 : −0.6081 ma2 : 0.9856

ma2 : −0.3917 ma3 : 0.3678

115 (1, 2) ar1 : 0.7802 (1, 6) ar1 : 0.9927

ma1 : 0.618 ma1 : 0.7759

ma2 : 0.4255 ma2 : 0.9366

ma3 : 0.4496 ma4 : 0.9284 ma5 : 0.9708 ma6 : 0.646 117 (1, 2) ar1 : 0.8982 (1, 5) ar1 : 0.989

ma1 : 0.7228 ma1 : 0.9322

ma2 : 0.6176 ma2 : 1.2887

ma3 : 0.7973 ma4 : 0.8945 ma5 : 0.4919 120 (2, 2) ar1 : 1.2693 (1, 4) ar1 : 1

ar2 : −0.3549 ma1 : 1.3109

ma1 : 0.5954 ma2 : 1.6905

ma2 : 0.7087 ma3 : 0.9947

ma4 : 0.4728 123 (2, 1) ar1 : 1.5531 (1, 4) ar1 : 0.9762

ar2 : −0.8261 ma1 : 1.2469

ma2 : 0.5155 ma2 : 0.971

ma3 : 0.9112

ma4 : 0.4942

(32)

Kod Med trend Koeff. Utan trend Koeff.

125 (2, 2) ar1 : 1.8524 (1, 5) ar1 : 0.9861

ar2 : −0.9677 ma1 : 1.0485

ma2 : −0.6344 ma2 : 1.089

ma2 : −0.3656 ma3 : 1.2074

ma4 : 0.5406 ma5 : 0.3737 126 (4, 1) ar1 : 2.0697 (1, 6) ar1 : 0.9887

ar2 : −1.8477 ma1 : 1.0937

ar3 : 1.2368 ma2 : 0.3128

ar4 : −0.5545 ma3 : 0.3279

ma1 : −1 ma4 : 0.7031

ma5 : 0.6669 ma6 : 0.4814 127 (2, 2) ar1 : 1.6887 (1, 3) ar1 : 0.9861

ar2 : −0.7553 ma1 : 1.3743

ma1 : 0.3637 ma2 : 1.1354

ma2 : 0.1258 ma3 : 0.2956

128 (1, 2) ar1 : 0.2765 (1, 2) ar1 : 0.6291

ma1 : 1.1852 ma1 : 1.1447

ma2 : 0.8275 ma2 : 0.8057

136 (2, 1) ar1 : 1.4503 (1, 4) ar1 : 0.9856

ar2 : −0.5263 ma1 : 1.1345

ma1 : 0.666 ma2 : 0.8952

ma3 : 1.246 ma4 : 0.7923 138 (1, 3) ar1 : 0.8598 (1, 3) ar1 : 0.9909

ma1 : 1.2978 ma1 : 1.3725

ma2 : 1.0388 ma2 : 1.236

ma3 : 0.6019 ma3 : 0.7435

139 (1, 1) ar1 : 0.8403 (1, 2) ar1 : 0.9872

ma1 : 0.7814 ma1 : 1.1342

ma2 : 0.5324

(33)

Kod Med trend Koeff. Utan trend Koeff.

140181 (1, 1) ar1 : 0.9078 (1, 3) ar1 : 0.8801

ma1 : 0.9998 ma1 : 1.3222

ma2 : 1.3417 ma3 : 0.9699 160 (2, 2) ar1 : 1.83 (1, 5) ar1 : 0.9893

ar2 : −0.9191 ma1 : 0.9164

ma1 : −0.5101 ma2 : 0.8188

ma2 : −0.4899 ma3 : 0.9235

ma4 : 1.0535 ma5 : 0.5589 162 (2, 1) ar1 : 1.7016 (1, 1) ar1 : 0.9211

ar2 : −0.847 ma1 : 0.4832

ma1 : −1

163 (2, 1) ar1 : 1.8696 (1, 6) ar1 : 0.9965

ar2 : −0.9565 ma1 : 0.7886

ma1 : −1 ma2 : 1.1027

ma3 : 0.9806 ma4 : 1.0325 ma5 : 0.9016 ma6 : 0.7282 180 (2, 1) ar1 : 1.5309 (1, 3) ar1 : 0.9646

ar2 : −0.7046 ma1 : 1.7259

ma1 : 0.8046 ma2 : 1.2254

ma3 : 0.4394 182 (2, 2) ar1 : 1.881 (1, 6) ar1 : 0.9914

ar2 : −0.975 ma1 : 0.7978

ma1 : −0.6244 ma2 : 0.9332

ma2 : −0.3755 ma3 : 0.7685

ma4 : 0.6972

ma5 : 0.8623

ma6 : 0.6552

(34)

Kod Med trend Koeff. Utan trend Koeff.

183 (3, 1) ar1 : 0.667 (1, 3) ar1 : 0.92

ar2 : 0.7578 ma1 : 0.4837

ar3 : −0.7029 ma2 : 0.8774

ma1 : 0.6124 ma3 : 0.4722

184 (3, 3) ar1 : 0.6967 (1, 2) ar1 : 0.9541

ar2 : 0.8649 ma1 : 0.357

ar3 : −0.7762 ma2 : 0.4294

ma1 : 0.6744 ma2 : −0.77 ma3 : −0.9043

186 (2, 3) ar1 : 0.3263 (1, 3) ar1 : 0.9478

ar2 : −0.0853 ma1 : 0.934

ma1 : 1.0758 ma2 : 1.0462

ma2 : 1.2189 ma3 : 0.6401

ma3 : 0.8033

187 (1, 1) ar1 : 0.508 (1, 3) ar1 : 0.9999

ma1 : 0.227 ma1 : 0.2654

ma2 : 0.2419 ma3 : 0.1681 188 (1, 4) ar1 : 0.9162 (1, 4) ar1 : 0.9984

ma1 : 0.8111 ma1 : 1.0868

ma2 : 0.946 ma2 : 1.3454

ma3 : 0.8111 ma3 : 1.0821

ma4 : 1 ma4 : 0.9787

191 (2, 1) ar1 : 1.4577 (1, 4) ar1 : 0.9704

ar2 : −0.9061 ma1 : 1.3582

ma1 : 0.3994 ma2 : 1.301

ma3 : 1.3573 ma4 : 0.9994 192 (1, 1) ar1 : 0.703 (1, 4) ar1 : 0.9871

ma1 : 0.3316 ma1 : 0.7597

ma2 : 0.7098

ma3 : 0.4666

ma4 : 0.8031

(35)

11 Bilaga 4: Resultat fr˚an tidsserieprognoser med modell 1 och 2, dvs Prognos med trend re- spektive Prognos utan trend, f ¨or kommun 114 och 115

Kod : Modell Ar ˚ Prognos Konfidensintervall (95%) s.e

114 : 1 2003 37127 (35965, 38288) 592.857

2004 36660 (35696, 37623) 491.837

2005 36057 (35124, 36990) 476.02

2006 35361 (33882, 36840) 754.592

2007 34611 (32559, 36663) 1046.939

2008 33829 (31325, 36333) 1277.551

2009 33029 (30086, 35972) 1501.531

2010 32218 (29052, 35384) 1615.306

2011 31397 (28092, 34702) 1686.224

2012 30564 (27172, 33957) 1730.612

114 : 2 2003 37394 (36534, 38259) 438.7301

2004 37364 (35304, 39424) 1051.1944

2005 37315 (33917, 40713) 1733.5311

2006 37210 (32683, 41737) 2309.8329

2007 37105 (31694, 42516) 2760.5572

2008 37002 (30847, 43157) 3140.3882

2009 36900 (30093, 43707) 3472.7885

2010 36799 (29409, 44189) 3770.4339

2011 36699 (28778, 44620) 4041.1124

2012 36599 (28191, 45007) 4290.0244

(36)