Befolkningsprognos för kommunerna i Stockholms län under perioden 2003-2012
Martin Elfsberg
U.U.D.M. Project Report 2004:10
Examensarbete i matematisk statistik, 20 poäng
Handledare: Silvelyn Zwanzig, Uppsala universitet och Johan Bring, Statisticon Examinator: Silvelyn Zwanzig
Juni 2004
Befolkningsprognos f ¨or kommunerna i Stockholms l¨an under perioden 2003-2012
Martin Elfsberg
9 juni 2004
Tack!
Jag vill b ¨orja med att tacka Johan Bring (chef Statisticon) f ¨or att du gav mig denna m ¨ojlighet och Tomas Pettersson (handledare vid Statisticon).
Silvelyn Zwanzig (handledare/examinator vid Uppsala Universitet) f ¨or
all tid och kunskap du bidragit med, du har varit ett stort st ¨od under ar-
betets g˚ang. Till sist vill jag tacka John Brandel och Johan Eriksson f ¨or att
ni alltid st¨allt upp och besvarat mina stundtals kn¨appa fr˚agor under min
studietid.
Sammanfattning
F ¨or kommunerna i Stockholms l¨an har en befolkningsprognos gjorts
f ¨or perioden 2003-2012. Arbetet presenterar flera olika modeller f ¨or
hur en s˚adan prognos kan g ¨oras antingen genom att anv¨anda regres-
sionsanalys, tidsserieanalys eller multivariat tidsserieanalys. Regres-
sionsmodellen anv¨andes f ¨or att g ¨ora prognoser f ¨or alla kommuner
under tidsperioden medan tidssseriemodellerna och multivariat mod-
ellen anv¨andes p˚a tv˚a kommuner. Det ¨ar stora skillnader i resultaten
med varierande trender mellan prognoserna och stora variationer i
standardavvikelserna. Ser man till den historiska utvecklingen hos
kommunerna ¨ar det regressionsmodellen som ger den mest trov¨ardiga
prognosen.
Inneh˚all
1 Inledning 6
1.1 Syftet med denna studie . . . . 6
1.2 Kompletterande syfte . . . . 7
2 Data 8 2.1 Datamaterial . . . . 8
3 Multivariat tidsserieanalys 10 3.1 Andra ordningens egenskaper . . . 10
3.2 Estimering av v¨antev¨ardesvektorn och kovariansmatrisen . 11 3.3 Multivariata ARMA processer . . . 11
3.4 Prognos av multivariata autoregressiva processer . . . 12
4 Analys 12 4.1 Kontroll av data . . . 12
4.2 Tidsserieanalys . . . 13
4.3 Multivariat tidsserieanalys . . . 14
4.4 Regressionsanalys . . . 14
5 Resultat 15 5.1 Kontroll av data . . . 15
5.2 Tidsserieprognos . . . 15
5.3 Multivariat tidsserieprognos . . . 17
5.4 Regressionsprognos . . . 17
6 Diskussion 20
7 Referenser 23
8 Bilaga 1: F ¨orklaring av nyckeltal och kommunkoder 24 9 Bilaga 2: Resultat fr˚an kontrollen av datamaterialet 26 10 Bilaga 3: ARMA(p,q)-modeller f ¨or kommunerna med och utan
trend 30
11 Bilaga 4: Resultat fr˚an tidsserieprognoser med modell 1 och 2, dvs Prognos med trend respektive Prognos utan trend, f ¨or kommun
114 och 115 34
12 Bilaga 5: Resultat fr˚an multivariat tidsserieanalys p˚a kommun
114 och 115 36
13 Bilaga 6: Regressionsmodeller 37
14 Bilaga 7: Resultat av regressionsprognoser med linj¨ar och kvadratisk
extrapolation 39
15 Appendix 46
1 Inledning
1.1 Syftet med denna studie
Landstingsstyrelsen fattade f˚ar n˚agra ˚ar sedan ett beslut om att det skulle g ¨oras en befolkningsprognos p˚a kommunniv˚a f ¨or Stockholms l¨an. Land- stinget beslutade att Regionplane- och trafikkontoret (RTK) inom Stock- holms l¨ans landsting (SLL) skall ansvara f ¨or upphandlingen. Statisticon har p˚a uppdrag av RTK f˚att i uppgift att g ¨ora en befolkningsprognos f ¨or l¨anets kommuner mellan ˚aren 2003-2012. Figur 1 visar hur befolkningsm¨angden
¨okat i Stockholms l¨an under perioden 1968-2002.
Befolkningsmängd Stockholms län 1968−2002
År
Befolkningsmängd
1970 1975 1980 1985 1990 1995 2000
1500000160000017000001800000
Figur 1: Befolkningsm¨angden i Stockholms l¨an mellan ˚aren 1968-2002.
Varf ¨or kan det vara av intresse f ¨or SLL att f˚a veta hur kommunernas be-
folkningsutveckling ser ut inom en kommande tio˚arsperiod? En prognos
av befolkningsm¨angden kan ligga till grund f ¨or planeringen inom l¨anet
och d˚a fr¨amst inom sjukv˚ardsplaneringen. Prognosen g ¨ors p˚a kommunniv˚a
s˚a att den kan aggregeras till olika indelningar inom sjukv˚arden tex f ¨or de
ca. 250 v˚ardcentraler som l¨anet ¨ar indelat i. Prognosen skall d¨ar anv¨andas
tex f ¨or f ¨orlossningsplanering och diagnosprognoser, d˚a man tex multi-
plicerar antalet kvinnor respektive m¨an i olika ˚aldrar med risken att f˚a
av infarkter
1.
Arbetet ¨ar inte bara av intresse f ¨or SLL utan ¨aven intressant f ¨or Statisti- con men deras intresse ¨ar av en lite annorlunda karakt¨ar. De har ett behov av att f˚a fram automatiserade processer f ¨or att kunna detektera avvikelser fr˚an ursprungliga prognoser. Genom att g ¨ora konfidensintervall f ¨or prog- nosen kan man l¨att se om det blir n˚agon avvikelse under ˚aren. Det ¨ar t¨ankt att man ska f˚a en varning om en eller flera prognoser hamnar utanf ¨or in- tervallet.
I detta arbete begr¨ansar jag mig till att bara studera befolkningsm¨angdens utveckling f ¨or l¨anets kommuner under perioden 2003-2012. Studien kom- mer att g ¨oras genom att anv¨anda b˚ade tidsserie- och regressionsanalys. Jag har anv¨ant mig av programmet R i detta arbete.
2Jag kommer att studera varje kommun var f ¨or sig men ger teorin bakom multivariat tidsserieanalys samt utf ¨or ett enkelt exempel f ¨or tv˚a av kommunerna. Anledning till varf ¨or jag inte unders ¨oker det multivariata sambandet f ¨or alla kommuner och g ¨or min prognos utifr˚an den ¨ar att metoden inte ¨ar f¨ardigutvecklad i R och inte returnerar n˚agra standardavvikelser vilka beh ¨ovs f ¨or ber¨akningen av konfidensintervallet.
31.2 Kompletterande syfte
Detta arbete ska ¨aven kunna anv¨andas som ett hj¨alpmedel f ¨or andra stu- denter eller personer med ett intresse av att l¨ara sig anv¨anda programmet R. I Appendix i slutet av detta arbete presenterar jag hur man kan g˚a till v¨aga n¨ar man vill g ¨ora tidsserie- och regressionsanalyser samt prognoser i R. Det ska d¨aremot f ¨ortydligas att det kan g ¨oras p˚a flera olika s¨att och att de metoder jag redovisar kanske inte ¨ar de b¨asta men syftet ¨ar att ge l¨asaren och den intresserade lite tips och id´eer som han sedan sj¨alv kan utveckla vidare.
1Ulla Moberg, statistikansvarig SLL, e-mail f˚att den 15/3-04
2Kan laddas ner fr˚an www.r-project.org
3I version 1.8.1 av R fungerar inte detta men det kommer att fungera i senare versioner.
2 Data
2.1 Datamaterial
I datamaterialet f ¨or en kommun beskrivs tretton demografiska nyckeltal.
Kort kan man s¨aga att ett nyckeltal ¨ar en variabel som beskriver kom- munens uppbyggnad vad g¨aller antal inv˚anare, medel˚alder, antal d ¨oda osv. Vilka dessa nyckeltal ¨ar och en kort beskrivning av dem kan ses i Bi- laga 1. Varje nyckeltal ¨ar en tidsserie med ett v¨arde f ¨or varje ˚ar mellan 1968-2002. Som redan n¨amnts s˚a begr¨ansar jag mig till att bara studera ny- ckeltalet bef, dvs befolkningsm¨angden den 31/12 det aktuella ˚aret.
Stockholms l¨an best˚ar av 25 kommuner mellan ˚aren 1968-1997 men from
˚ar 1998 best˚ar l¨anet av 26 kommuner. Det som h¨ande 1998 var att S ¨odert¨aljes kommun delades upp i S ¨odert¨alje och Nykvarns kommun. Det inneb¨ar att Nykvarns kommun bara har existerat i fem ˚ar och har lite f ¨or f˚a observa- tioner f ¨or att man ska kunna g ¨ora tillf ¨orlitliga modeller. D¨arf ¨or valde jag att inte studera dessa kommuner var f ¨or sig utan l¨agga ihop dess v¨arden och studera de som en kommun som i detta arbete f˚att kommunkoden 140181. Vilka kommuner som ing˚ar i Stockholms l¨an samt deras kom- munkod kan ses i Bilaga 1. I forts¨attningen kommer jag att h¨anvisa till en kommun genom dess kod ist¨allet f ¨or att anv¨anda kommunens fullst¨andiga namn.
I de sex figurerna nedan visas befolkningsutvecklingen f ¨or varje kommun i l¨anet under perioden 1968-2002. Anledningen till indelningen ¨ar att det
¨ar stora variationer i befolkningsm¨angden mellan kommunerna vilket g ¨or
att det kan bli otydliga figurer.
Befolkningsmängd 1968−2002
År
Befolkningsmängd
1970 1975 1980 1985 1990 1995 2000
500010000150002000025000
115 125 128 139 187 192
Figur 2: Befolkningsm¨angd 1968-2002
Befolkningsmängd 1968−2002
År
Befolkningsmängd
1970 1975 1980 1985 1990 1995 2000
150002000025000300003500040000
114 117 120 138
Figur 3: Befolkningsm¨angd 1968-2002
Befolkningsmängd 1968−2002
År
Befolkningsmängd
1970 1975 1980 1985 1990 1995 2000
25000300003500040000
162 183 186 191
Figur 4: Befolkningsm¨angd 1968-2002
Befolkningsmängd 1968−2002
År
Befolkningsmängd
1970 1975 1980 1985 1990 1995 2000
2000030000400005000060000700008000090000
123 126 127 136 140181
Figur 5: Befolkningsm¨angd 1968-2002
Befolkningsmängd 1968−2002
År
Befolkningsmängd
1970 1975 1980 1985 1990 1995 2000
40000500006000070000
160 163 182 184 188
Figur 6: Befolkningsm¨angd 1968-2002
Befolkningsmängd 1968−2002
År
Befolkningsmängd
1970 1975 1980 1985 1990 1995 2000
660000680000700000720000740000760000 180
Figur 7: Befolkningsm¨angd 1968-2002
3 Multivariat tidsserieanalys
Man kan studera tidsserier oberoende och var f ¨or sig som univariata tidsserier men denna metod ¨ar dock inte att f ¨oredra n¨ar man handskas med tv˚a eller flera tidsserier eftersom den inte tar h¨ansyn till m ¨ojliga beroenden mellan tidsserierna. Dessa korsvisa beroenden ¨ar av stor vikt framf ¨or allt n¨ar man ska prediktera framtida v¨arden
4.
3.1 Andra ordningens egenskaper
Vi har n stycken tidsserier X
t1...X
tnd¨ar n=1...25 observerade vid ˚aren t=1968...2002.
Varje tidsserie motsvarar nyckeltalet bef f ¨or en av kommunerna. Vi skapar en vektor X
t= (X
11, ..., X
tn) och definierar v¨antev¨ardesvektorn
µ
t= EX
t= [µ
t1...µ
tn]
(1) och kovariansmatrisen
4Brockwell & Davis, Introduction to Time Series and Forecasting,2002
Γ(t + h, t) =
⎡
⎢ ⎣
γ
11(t + h, t) . . . γ
1m(t + h, t) ...
γ
m1(t + h, t) . . . γ
mm(t + h, t)
⎤
⎥ ⎦ (2)
d¨ar γ
ij(t + h, t) = Cov(X
t+h,i, X
t,j).
3.2 Estimering av v¨antev¨ardesvektorn och kovariansmatrisen
En naturlig v¨antev¨ardesriktig estimator av v¨antev¨ardesvektorn µ baserad p˚a observationerna X
1...X
n¨ar medelv¨ardesvektorn
5¯X
n= 1 n
n t=1X
t(3)
Kovariansmatrisen estimeras enligt ˆΓ(h) =
1n
n−h
t=1
X
t+h− ¯X
nX
t− ¯X
nd˚a 0 ≤ h ≤ n − 1
ˆΓ(−h)
d˚a −n + 1 ≤ h < 0 (4)
Om vi kallar den (i,j)-komponenten av ˆ Γ(h) d¨ar i, j = 1, 2, ... f¨or ˆγ
ij(h) s˚a
¨ar estimatet av korskorrelationen
ˆρ
ij(h) = ˆγ
ij(h) [ˆγ
ii(0)ˆγ
jj(0)]
−12(5)
Detta ger korrelationen mellan alla tidsserierna i datamaterialet och n¨ar i = j s˚a blir ˆ ρ
ijautokorrelations funktionen f ¨or den i’te tidsserien.
3.3 Multivariata ARMA processer
En multivariat ARMA(p,q) process kan skrivas
X
t− Φ
1X
t−1− . . . − Φ
pX
t−p= Z
t+ Θ
1Z
t−1+ . . . + Θ
qZ
t−q(6)
d¨ar Z
t∼ W N(0, ).
5Brockwell & Davis, Introduction to Time Series and Forecasting,2002
3.4 Prognos av multivariata autoregressiva processer
Om vi antar att X
t¨ar en AR(p) process med koefficientmatrisen Φ = Φ
1, . . . , Φ
pkan vi skriva denna
X
t= Φ
1X
t−1+ . . . + Φ
pX
t−p+ Z
t, Z
t∼ W N(0,
) (7)
F ¨or att ber¨akna den b¨asta h-steg linj¨ara prediktorn P
nX
n+hbaserad p˚a komponenterna X
1, ..., X
ns˚a applicerar vi den linj¨ara prediktorn P
np˚a ek- vation 7 f ¨or att utf ¨ora recursionen
6P
nX
n+h= Φ
1P
nX
n+h−1+ . . . + Φ
pP
nX
n+h−p(8)
Kovariansmatrisen ber¨aknas enligt E
(X
n+h− P
nX
n+h) (X
n+h− P
nX
n+h)
n ≥ p (9)
4 Analys
I detta avsnitt presenterar jag hur kontrollen av datamaterialet gjordes och vilka modeller som anv¨andes f ¨or att g ¨ora prognoser.
4.1 Kontroll av data
N¨ar man st¨alls inf ¨or en uppgift d¨ar det ¨ar stora datam¨angder som ska hanteras ¨ar det viktigt att man b ¨orjar med att kontrollera sina data innan man g ¨or sina analyser. Eftersom detta arbete g˚ar ut p˚a att g ¨ora befolkn- ingsprognoser ¨ar det mest intressant att analysera dessa data. Kan man t¨anka sig att befolkningen vid en viss tidpunkt i en kommun ¨ar beroende av andra nyckeltal? Det ¨ar intuitivt att befolkningen vid slutet av innest˚aende
˚ar beror av kommunens befolkning ˚aret innan samt d ¨ods-, f ¨odelse-, inflyttnings- och utflyttningstalet innest˚aende ˚ar. Nedan visas hur modellen ser ut som testar detta p˚ast˚aende och i Bilaga 2 visas resultaten.
bef (t) αbef (t − 1) + βdoda(t) + γf odda(t) + λinf l(t) + ρutf l(t) − 1
6Brockwell & Davis, Introduction to Time Series and Forecasting, 2002
4.2 Tidsserieanalys
Det finns m˚anga olika s¨att att anpassa en ARMA(p,q) modell till sin tidsserie och i Appendix ges f ¨orslag p˚a hur det kan g˚a till. I detta arbete valde jag att g ¨ora p˚a tv˚a olika s¨att.
1. Med trend: Jag valde att behandla trenden genom att anpassa en kur- va till tidsserien med en regressionsmodell. Vilken typ av kurva som anpassades beror av tidsseriens utseende mellan ˚aren 1968-2002 och jag ans˚ag att det antingen ¨ar en linj¨ar eller en andragrads ekvation som b¨ast kan f ¨orklara trenden. Ett annat antagande jag g ¨or ¨ar att det f ¨or varje tidsserie inte ¨ar n˚agra s¨asongseffekter och d˚a blir residualer- na lika med tidsserien minus trenden. Till residualerna anpassades sedan en ARMA(p,q) modell.
2. Utan trend: Om man antar att tidsserien ¨ar station¨ar s˚a kan man an- passa en ARMA(p,q) modell direkt p˚a den.
I Bilaga 3 kan man se vilka ARMA(p,q) modeller som anpassades till tidsserier- na n¨ar de ovan beskrivna metoderna anv¨andes.
Jag presenterar h¨ar tv˚a olika modeller f ¨or hur en prognos kan g˚a till v¨aga.
1. Prognos med trend: Man b ¨orjar med att anv¨anda sig av en kortare del av tidsserien tex 1968-1996. Till denna anpassar man en modell f ¨or trenden och g ¨or en prognos, pred.trend, f ¨or 1997 och en ARMA(p,q) modell anpassas till residualerna och en prognos, pred.arima, g ¨ors f ¨or 1997. F ¨or ˚ar 1998 anv¨ands sedan tidsserien mellan 1968-1997. Detta upprepas tom ˚ar 2002 och d˚a kan kovariansen mellan pred.trend och pred.arima ber¨aknas. Sedan forts¨atter man f ¨or ˚ar 2003 och d˚a kan man ber¨akna prognosen f ¨or befolkningsm¨angden enligt
pred(2003) = pred.trend + pred.arima (10) och konfidensintervallet enligt
pred(2003) ± λ
1−α/2×
se.trend
2+ se.arima
2+ 2 × Cov(pred.trend, pred.arima) d¨ar se.trend och se.arima ¨ar standardavvikelsen f ¨or pred.trend respek-
tive pred.arima. Detta upprepas f ¨or varje ˚ar som ska prognosticeras.
2. Prognos utan trend: H¨ar anv¨ands hela tidsseriens l¨angd, dvs 1968- 2002, och om man antar att den ¨ar station¨ar kan en ARMA(p,q) mod- ell anpassas direkt p˚a den. En prognos g ¨ors f ¨or alla ˚ar samtidigt i pe- rioden 2003-2012.
Dessa tv˚a modeller har jag applicerat p˚a tv˚a till utseendet olika kommuner, n¨amligen 114 och 115. Valet av kommuner har jag gjort eftersom trenden anpassas med en andragrads- respektive linj¨ar ekvation och d˚a kan man se om n˚agon av modellerna ¨ar att f ¨oredra framf ¨or den andra. Resultaten kan ses i Bilaga 4.
4.3 Multivariat tidsserieanalys
Som n¨amnts tidigare s˚a saknas den viktiga funktionen i R som ber¨aknar standardavvikelsen vid en prognos av multivariata tidsserier och d¨arf ¨or kan inte konfidensintervallet ber¨aknas. Men jag gjorde ¨and˚a en prognos, dock bara f ¨or ett ˚ar d¨ar kommunerna 114 och 115 behandlades som multi- variata tidsserier. N¨ar man ska g ¨ora prognoser ¨ar det av stor betydelse att man studerar det multivariata sambandet mellan kommunerna och hur detta kan g ¨oras kan ses i Appendix. Tv˚a prognoser gjordes, den ena n¨ar en ARMA(p,q) modell hade anpassats enligt metoden Med trend och den andra med metoden Utan trend och resultaten kan ses i Bilaga 5.
4.4 Regressionsanalys
Som jag n¨amnde tidigare s˚a ¨ar det vissa skillnader i utseendet hos tidsserier- na. M˚anga tidsserier har en ganska stor variation under de f ¨orsta 10-20
˚aren vilket g ¨or det sv˚art att anpassa en bra modell till hela serien. D¨ar det har varit m ¨ojligt att anpassa en bra modell till hela tidsserien har det gjorts men f ¨or de flesta av kommunerna har jag anv¨ant mig av lokal linj¨ar eller kvadratisk extrapolation p˚a en kortare del av tidsserien. Hur detta har g˚att till kan man se i Appendix och i Bilaga 6 kan man se vilka regressionsmod- eller som anpassats och i kolumnen Kod om jag anv¨ant mig av hela eller bara en del av tidsserien.
Dessa regressionsmodeller har sedan anv¨ants f ¨or att g ¨ora en prognos f ¨or
hela tidsperioden 2003-2012 p˚a en g˚ang. I Appendix kan man se hur denna
prognos kan g ¨oras i R och i Bilaga 7 hur prognoserna ser ut.
5 Resultat
H¨ar presenteras vilka resultat som f ¨oljer av kontrollen av datamaterialet och prognoserna.
5.1 Kontroll av data
I Bilaga 2 visas resultaten fr˚an kontrollen av datamaterialet. Som man kan se av dessa resultat s˚a ¨ar det f ¨or samtliga kommuner v¨aldigt bra modellan- passningar (l˚aga p-v¨arden f ¨or F-stat) och bra relationer mellan de ing˚aende variablerna (h ¨oga R
2) men det ¨ar dock vissa oklarheter. F ¨or kommun 187
¨ar det bara bef(t-1) och infl(t) som ¨ar signifikanta och f ¨or kommun 117 ¨ar det fodda(t) som inte ¨ar signifikant ¨aven om doda(t) bara ¨ar signifikant p˚a 10%-niv˚an. N˚agon bra f ¨orklaring till varf ¨or dessa kommuner avviker fr˚an de ¨ovriga kan jag inte ge men en sak som de har gemensamt ¨ar att de ¨ar kustkommuner.
5.2 Tidsserieprognos
I de tv˚a figurerna nedan kan man se resultatet fr˚an prognoserna med mod- ell 1 och 2, dvs Prognos med trend och Prognos utan trend.
Prognos 2003−2012 för kommun 114 med modell 1 och 2
År
Befolkningsmängd
1970 1980 1990 2000 2010
20000250003000035000
Prognos med trend Prognos utan trend
Figur 8: Prognos 2003-2012 f¨or kommun 114 med modell 1 och 2
Prognos 2003−2012 för kommun 115 med modell 1 och 2
År
Befolkningsmängd
1970 1980 1990 2000 2010
15000200002500030000
Prognos med trend Prognos utan trend
Figur 9: Prognos 2003-2012 f¨or kommun
115 med modell 1 och 2
Om man f ¨orst studerar Figur 8 s˚a ¨ar det stora skillnader i prognosen mel- lan modellerna. Den stora nedg˚angen f ¨or modell 1 kan f ¨orklaras av att det till trenden anpassades en andragradsekvation och n¨ar sedan prognosen ber¨aknades enligt ekvation 10 s˚a ¨ar det prognosen f ¨or trenden (pred.trend) som dominerar. Detta f˚ar till f ¨oljd att prognosen f ¨or modell 1 f ¨oljer an- dragradsekvationen. Prognosen f ¨or modell 2 f ¨oljer den avtagande tren- den som tidsserien uppvisar under ˚aren 2000-2002. Om man sedan ser p˚a resultaten f ¨or kommun 114 i Bilaga 4 s˚a ¨ar det stora skillnader vad g¨aller konfidensintervallet mellan modellerna pga stora skillnader i stan- dardavvikelsen. F ¨or modell 1 ¨ar det h ¨oga standardavvikelser som ¨okar med prognos˚aret men ¨an h ¨ogre ¨ar det f ¨or modell 2 vilket f˚ar till f ¨oljd att konfidensintervallen blir stora f ¨or b˚ada modellerna. Den l¨agre standard- avvikelsen f ¨or modell 1 har att g ¨ora med att prognosen g ¨ors f ¨or ett ˚ar i taget medan den betydligt h ¨ogre standardavvikelsen f ¨or modell 2 beror av att prognosen g ¨ors f ¨or alla ˚ar samtidigt och d˚a blir os¨akerheten st ¨orre f ¨or varje ˚ar.
I Figur 9 ser man hur prognoserna blev f ¨or kommun 115. Modell 1 f ¨oljer prognosen f ¨or trendmodellen som i detta fall ¨ar en linj¨ar ekvation medan modell 2 f ¨oljer trenden som tidsserien uppvisar under ˚aren 2000-2002. I Bilaga 4 ser man att ¨aven h¨ar ger modellerna h ¨oga standardavvikelser som ¨okar med prognos˚aret och stora konfidensintervall. Dock ¨ar det inte en lika stor ¨okning av standardavvikelsen f ¨or modell 1 som det ¨ar f ¨or motsvarande modell f ¨or kommun 114. ¨ Aven h¨ar g ¨ors prognosen f ¨or mod- ell 2 f ¨or alla ˚ar samtidigt och d˚a ¨okar standardavvikelsen med prognos˚aret.
Kan man s¨aga n˚agot om vilken modell som ¨ar b¨ast eller som passar vid ett
givet tillf¨alle? N¨ar man har en kommun med ett utseende som liknar det
f ¨or kommun 114, dvs d¨ar trenden b¨ast anpassas av en andragradsekva-
tion, s˚a ¨ar inte modell 1 att rekommendera. Den ger icke trov¨ardiga prog-
noser d¨arf ¨or att de avtar v¨aldigt snabbt. Modell 2 d¨aremot, ger en prognos
med liknande trend som tidsserien har under ˚aren 2000-2002. Den avtar
inte lika mycket och jag anser d¨arf ¨or att den ¨ar mera trov¨ardig. F ¨or kom-
muner vars historiska utveckling varit n¨astan linj¨ar kan b˚ada modellerna
anv¨andas ¨aven om modell 1 verkar mest trov¨ardig om man ser till den
historiska utvecklingen.
5.3 Multivariat tidsserieprognos
N¨ar man anv¨ander sig av multivariat tidsserieanalys s˚a kan man bara anpassa en AR(p) modell, det fungerar allts˚a inte med en ARMA(p,q) modell. AR(p) modellen anpassades med b˚ada metoderna Med trend och Utan trend. Av resultaten i Bilaga 5 ser man att det blir en AR(2) modell f ¨or tidsserierna Med trend och en AR(1) Utan trend. Man ser ¨aven ko- rrelationen mellan kommunerna som koefficienterna bef114&bef115 och bef115&bef114. Eftersom dessa koefficienter ¨ar sm˚a s˚a inneb¨ar det att det bara ¨ar en liten korrelationer mellan kommunerna.
I Bilaga 5 kan man ¨aven se hur prognosen blev f ¨or ˚ar 2003. Prognosen blir h ¨ogre f ¨or b˚ada kommunerna i fallet d˚a data behandlades med metoden Med trend ¨an Utan trend.
5.4 Regressionsprognos
F ¨or att konfidensintervallets l¨angd ska kunna ber¨aknas p˚a ett korrekt s¨att s˚a ska residualerna vara oberoende men s˚a ¨ar inte fallet f ¨or alla kom- muner i detta arbete. Detta ¨ar n˚agot jag har varit medveten om men jag anv¨ander ¨and˚a metoden ¨aven om konfidensintervallens l¨angd inte kom- mer att st¨amma exakt. Figurerna 10 och 11 visar residualerna f ¨or kommun 120 och 115 som ¨ar respektive inte ¨ar white noise.
I de sex figurerna, Figur 12-17, presenteras prognoserna som gjordes med
linj¨ar och kvadratisk extrapolation av tidsserien. Indelningen av kommuner-
na i figurerna beror p˚a variationen i befolkningsm¨angden och f ¨or att fig-
urerna ska vara s˚a tydliga som m ¨ojligt.
0.0 0.1 0.2 0.3 0.4 0.5
0.00.20.40.60.81.0
frequency Series: Residual.120
Figur 10: Residualer kommun 120, white noise
0.0 0.1 0.2 0.3 0.4 0.5
0.00.20.40.60.81.0
frequency Series: Residual.115
Figur 11: Residualer kommun 115, inte white noise
Prognos 2003−2012
År
Befolkningsmängd
1970 1980 1990 2000 2010
50001000015000200002500030000 115
125 128 139 187 192
Figur 12: Prognos 2003-2012 med linj¨ar/
kvadratisk extrapolation
Prognos 2003−2012
År
Befolkningsmängd
1970 1980 1990 2000 2010
1000015000200002500030000350004000045000
114 117 120 138
Figur 13: Prognos 2003-2012 med linj¨ar/
kvadratisk extrapolation
Prognos 2003−2012
År
Befolkningsmängd
1970 1980 1990 2000 2010
2500030000350004000045000
162 183 186 191
Figur 14: Prognos 2003-2012 med linj¨ar/
kvadratisk extrapolation
Prognos 2003−2012
År
Befolkningsmängd
1970 1980 1990 2000 2010
2 e+044 e+046 e+048 e+041 e+05
123 126 127 136 140181
Figur 15: Prognos 2003-2012 med linj¨ar/
kvadratisk extrapolation
Prognos 2003−2012
År
Befolkningsmängd
1970 1980 1990 2000 2010
4000050000600007000080000
160 163 182 184 188
Figur 16: Prognos 2003-2012 med linj¨ar/
kvadratisk extrapolation
Prognos 2003−2012
År
Befolkningsmängd
1970 1980 1990 2000 2010
650000700000750000800000
180