• No results found

Prognosmodeller för antal dödade i vägtrafiken : en utvärdering av Poissonregression med seriellt korrelerade residualer

N/A
N/A
Protected

Academic year: 2021

Share "Prognosmodeller för antal dödade i vägtrafiken : en utvärdering av Poissonregression med seriellt korrelerade residualer"

Copied!
62
0
0

Loading.... (view fulltext now)

Full text

(1)

VTI rapport 607 Utgivningsår 2008

www.vti.se/publikationer

Prognosmodeller för antal dödade i vägtrafiken

En utvärdering av Poissonregression med seriellt

korrelerade residualer

Åsa Forsman

(2)
(3)

Utgivare: Publikation: VTI rapport 607 Utgivningsår: 2008 Projektnummer: 50507 Dnr: 2004/0546-22 581 95 Linköping Projektnamn:

Utveckling av analysverktyg för uppföljning av trafikolycksutvecklingen

Författare: Uppdragsgivare:

Åsa Forsman Vägverket

Titel:

Prognosmodeller för antal dödade i vägtrafiken. En utvärdering av Poissonregression med seriellt korrelerade residualer

Referat (bakgrund, syfte, metod, resultat) max 200 ord:

När det gäller att analysera och prediktera utvecklingen av antal dödade personer i vägtrafiken spelar sannolikhetsmodeller en viktig roll. I den här rapporten studeras en metod för analys av tidsserier av diskreta data som också kan hantera seriell korrelation. Metoden är en vidareutveckling av traditionell Poissonregression där överspridning och seriell korrelation modelleras genom en latent process. Syftet är dels att testa hur metoden fungerar i praktiken, dels att studera vikten av att ta hänsyn till eventuell seriell korrelation i data.

Metoden testades dels för totalt antal dödade, dels för antal dödade uppdelat på följande sex trafikant-kategorier: bilister (förare och passagerare i personbil, lastbil och buss), motorcyklister, mopedister, cyklister, gångtrafikanter och övriga.

Resultaten visar att man i flera fall förbättrar anpassningen av modellerna om man tar hänsyn till att det finns seriell korrelation i serierna. Speciellt tydlig är förbättringen när det gäller totalt antal dödade och bilister, men anpassningen förbättras också för motorcyklister, cyklister och gångtrafikanter. Det tyder dels på att det fattas viktiga förklaringsvariabler i modellerna som ger upphov till korrelation, dels att detta till viss del kan kompenseras för med den föreslagna metoden.

Nyckelord:

prognosmodell, Poissonregression, seriell korrelation, dödade, vägtrafikolyckor

ISSN: Språk: Antal sidor:

(4)

Publisher: Publication: VTI rapport 607 Published: 2008 Project code: 50507 Dnr: 2004/0546-22

SE-581 95 Linköping Sweden Project:

Development of tools for analysing time series of traffic safety

Author: Sponsor:

Åsa Forsman Swedish Road Administration

Title:

Forecasting models of the number of fatalities in road traffic. An evaluation of a Poisson regression model with serially correlated residuals

Abstract (background, aim, method, result) max 200 words:

Probability models play an important role when analysing and forecasting time series of the number of fatalities in road traffic accidents. This report presents a study of a method of analysing time series of count data that also can account for serial correlation. The method is a development of traditional Poisson regression where overdispersion and serial correlation is modelled by a latent process. The aim of the study was partly to test how the method worked in practice, partly to study the importance of considering possible serial correlation in the data.

The method was tested both for the total number of killed road users and the number of killed road users divided in the following six categories: car occupants (drivers and passengers in passenger cars, lorries, and busses), motor-cyclists, mopedists, cyclists, pedestrians, and others.

The results show that the fit was improved for several of the models when serial correlation was

considered. The improvement was most evident for the total number of road users and for car occupants, but the fit was also improved for motor-cyclists, cyclists and pedestrians. This indicates that important explanatory variables were missing, which gave rise to the correlation, and that this partly could be compensated for by the studied method.

Keywords:

forecasting model, Poisson regression, serial correlation, fatalities, road traffic accidents

ISSN: Language: No. of pages:

(5)

F ¨orord

N¨ar det g¨aller att analysera utvecklingen av antal d¨odade i v¨agtrafiken spelar sannolikhets-modeller en viktig roll eftersom de ofta utg¨or grunden f¨or analyserna. I det h¨ar projektet har vi tittat p˚a vilka modeller som anv¨ands inom andra discipliner f¨or data med liknande egenskaper. Efter en litteraturgenomg˚ang valde vi ut en modell som verkade lovande och testade hur v¨al den fungerade f¨or trafikolycksdata. I den h¨ar rapporten presenteras modellen och dess anpassning till data samt prognoser f¨or framtiden.

Projektet har genomf¨orts p˚a uppdrag av V¨agverket. ¨Osten Johansson har varit kontakt-person och han har utifr˚an sin l˚anga erfarenhet av att arbeta med prognosmodeller f¨or trafikolycksdata bidragit med v¨ardefulla id´eer till projektet.

Arbetet har genomf¨orts tillsammans med Stig Danielsson, Avdelningen f¨or statistik vid Institutionen f¨or datavetenskap, Link¨opings universitet. Fr˚an VTI har, f¨orutom projekt-ledaren, ¨aven Mohammad-Reza Yahya och Ulf Br¨ude deltagit.

Inom projektet har ocks˚a tv˚a examensarbeten genomf¨orts och jag vill tacka f¨orfattarna till dessa arbeten: Astrid Karlsson och Kristian Willer¨o samt Rikard Nyquist och Emil Westblad, studerande vid Matematiska institutionen, Link¨opings universitet. Deras ar-beten har bidragit till att ¨oka f¨orst˚aelsen f¨or data och modeller som anv¨ants i projektet. Link¨oping november 2007

˚

Asa Forsman projektledare

(6)

Kvalitetsgranskning

Intern peer review har genomf¨orts av Mattias Haraldsson, 11 december 2007. ˚Asa Fors-man har genomf¨ort justeringar av slutligt rapportFors-manus. Projektledarens n¨armaste chef Astrid Linder har d¨arefter granskat och godk¨ant publikationen f¨or publicering 23 januari 2008.

Quality review

Internal peer review was performed on December 11, 2007 by Mattias Haraldsson. ˚Asa Forsman has made alterations to the final manuscript of the report. The research director of the project manager Astrid Linder examined and approved the report for publication on January 23, 2008.

(7)

Inneh ˚allsf ¨orteckning

Sammanfattning . . . 5 Summary . . . 7 1 Inledning . . . 9 1.1 Bakgrund . . . 9 2 Modeller . . . 11 2.1 Poissonregression . . . 11 2.2 Seriell Poissonregression . . . 11 2.3 Prognoser . . . 13

3 Datamaterial och anpassning av modeller . . . 15

3.1 Anpassning av modeller till data . . . 17

3.2 Prognoser . . . 18 4 Resultat . . . 19 4.1 Anpassning av modellen . . . 19 4.2 Prognoser . . . 33 5 Diskussion . . . 38 Referenser . . . 40 Bilagor Bilaga 1 Skattningsformler

Bilaga 2 Antal omkomna i v ¨agtrafiken, ˚arsdata 1970–2006 Bilaga 3 Trafikarbete, ˚arsdata 1970–2006

Bilaga 4 Befolkningens storlek i olika grupper, ˚arsdata 1970–2006 Bilaga 5 Bruttonationalprodukt (BNP) per kapita, ˚arsdata 1970–2006 Bilaga 6 Arlig tillkomst av antal personbilar i trafik, 1970–2006˚

(8)
(9)

Prognosmodeller f¨or antal d¨odade i v¨agtrafiken

– En utv¨ardering av Poissonregression med seriellt korrelerade residualer av ˚Asa Forsman

VTI

581 95 Link¨oping

Sammanfattning

N¨ar man analyserar utvecklingen av antal d¨odade i v¨agtrafiken ¨ar val av modell viktigt, b˚ade med avseende p˚a vilken typ av modell som anv¨ands och vilka f¨orklaringsvariabler man v¨aljer att ha med. Detta p˚averkar b˚ade hur bra anpassningen blir och eventuella prognoser. Eftersom det p˚ag˚ar en st¨andig utveckling av modeller och nya tillkommer ¨ar det viktigt att ibland ompr¨ova de modeller som tidigare anv¨ants.

En typ av modell som har utvecklats relativt sent och endast i liten utstr¨ackning anv¨ants inom trafiks¨akerhetsforskningen ¨ar modeller f¨or diskreta data som ocks˚a tar h¨ansyn till korrelation mellan v¨arden vid olika tidpunkter, s˚a kallad seriell korrelation eller auto-korrelation. En specifik s˚adan modell, h¨ar kallad seriell Poissonrgression, har under-s¨okts i den h¨ar studien. Seriell Poissonregression kan beskrivas som en vidareutveckling av traditionell Poissonregression d¨ar ¨overspridning och seriell korrelation modelleras genom en latent process. Syftet med studien har dels varit att testa hur metoden fungerar i praktiken, dels att studera vikten av att ta h¨ansyn till eventuell seriell korrelation i data. Sju olika tidsserier har anv¨ants f¨or att studera modellen. Dessa ¨ar totalt antal d¨odade trafikanter och antal d¨odade uppdelat p˚a sex olika trafikantkategorier: bilister (f¨orare och passagerare i personbil, lastbil och buss), motorcyklister, mopedister, cyklister, g˚angtrafikanter och ¨ovriga. Olika f¨orklaringsvariabler har valts till de olika kategorier-na och f¨oljande typ av data har anv¨ants: trend, exponering, tillskott av antal bilar i trafik, befolkningsstorlek, bruttonationalprodukt (BNP) och str¨acka m¨otesfri v¨ag. Genomg˚aende anv¨andes ˚arsdata fr˚an 1970 till 2005 eller 2006, beroende p˚a vad som var tillg¨angligt n¨ar ber¨akningarna gjordes.

Resultaten visar att man i flera fall f¨orb¨attrar anpassningen av modellerna om man tar h¨ansyn till att det finns seriell korrelation i serierna. Speciellt tydlig ¨ar f¨orb¨attringen n¨ar det g¨aller totalt antal d¨odade och bilister, men anpassningen f¨orb¨attras ocks˚a f¨or motorcyklister, cyklister och g˚angtrafikanter. Det tyder dels p˚a att det fattas viktiga f¨orklaringsvariabler i modellerna som ger upphov till korrelation, dels att detta i viss m˚an kan kompenseras f¨or med den f¨oreslagna metoden. F¨or totalt antal d¨odade var den b¨asta modellen enligt de anv¨anda prediktionsm˚atten den med f¨orklaringsvariablerna trend, totalt trafikarbete, tillskott av antal bilar i trafik och BNP. Det ¨ar dock viktigt att p˚apeka att sambandet mellan f¨orklaringsvariablerna och antal d¨odade endast p˚avisar att variablerna samvarierar vilket inte beh¨over betyda att det finns kausala samband.

Sammantaget visade studien p˚a bra resultat med den f¨oreslagna metoden, men innan den anv¨ands i st¨orre skala b¨or f¨oljande aspekter studeras mer ing˚aende:

• Tidigare studier har visat att skattningar av enskilda parametrar i modellen ¨ar rel-ativt os¨akra. Resultaten fr˚an den h¨ar studien tyder dock p˚a att modellen fungerar bra n¨ar det g¨aller att g¨ora prognoser i de fall d¨ar det finns seriell korrelation att ta h¨ansyn till. Man b¨or d¨arf¨or n¨armare studera om det ¨ar s˚a att tillg¨angliga skatt-ningsmetoder, ¨aven om de ger enskilda skattningar med relativt stor os¨akerhet, ¨ar tillf¨orlitliga n¨ar det g¨aller att ber¨akna prognoser.

(10)

• De modeller som presenteras i den h¨ar rapporten bygger p˚a de potentiella f¨orklarings-variabler som har valts ut. F¨orklaringsf¨orklarings-variablerna har ocks˚a anv¨ants i sin ursprung-liga form, men det ¨ar inte s¨akert att det ger det b¨asta sambandet mellan respektive variabel och antal d¨odade. Man b¨or d¨arf¨or dels unders¨oka om det finns flera poten-tiella f¨orklaringsvariabler som b¨or tas med, dels ocks˚a testa om det samband som anv¨ants ¨ar det b¨asta eller om man till exempel b¨or logaritmera vissa variabler. • F¨or att anv¨anda modellen till att g¨ora prognoser f¨or framtiden beh¨over man g¨ora

antaganden om framtida utveckling av f¨orklaringsvariablerna. I den h¨ar rapporten har endast tv˚a relativt enkla framskrivningar anv¨ants. F¨or att f¨orb¨attra prognoser-na b¨or man g¨ora mer realistiska bed¨omningar av de olika f¨orklaringsvariablerprognoser-nas utveckling, eventuellt med hj¨alp av modeller.

(11)

Forecasting models of the number of fatalities in road traffic

– An evaluation of a Poisson regression model with serially correlated residuals by ˚Asa Forsman

VTI (Swedish National Road and Transport Research Institute) SE-581 95 Link¨oping Sweden

Summary

The choice of model is important when analysing the number of fatalities in road traffic, both with respect to type of model and selected explanatory variables. This choice in-fluences both the accuracy of the model fit and possible forecasts. Since existing models are continuously improved and new models are developed, the models that are currently used should occasionally be reconsidered.

A type of model that have been developed relatively late are models for count data that also consider correlation between values at different points in time, so called serial cor-relation or autocorcor-relation. A specific model of this type, here called serially correlated error model, have been tested in this study. Serially correlated error models can be de-scribed as a development of traditional Poisson regression where overdispersion and serial correlation is modelled as a latent process. The aim of the study was partly to test how the method works in practice and partly to investigate the importance of consider-ing possible serial correlation in the data.

Seven different time series have been used to study the model. These are total number of fatalities and the number of fatalities divided in six different road user categories: car occupants (drivers and passengers in passenger cars, lorries, and busses), motor-cyclists, mopedists, cyclists, pedestrians, and others. Different explanatory variables have been chosen for the different categories, and the following type of data have been used: trend, exposure, annual contribution of the number of registered cars, population, gross nation-al product (GNP), and totnation-al distance of roads with separated meeting lanes. Annunation-al data from 1970 to 2005 or 2006 was used.

The results show that the fit was improved for several of the models when serial corre-lation was considered. The improvement was most evident for the total number of road users and for car occupants, but the fit was also improved for motor-cyclists, cyclists and pedestrians. This indicates that important explanatory variables were missing, which gave rise to the correlation, and that this could partly be compensated for by the studied method. The best model for total number of fatalities, according to the used prediction measurements, included the following explanatory variables: trend, vehicle mileage, annual contribution of the number of registered cars, and GNP. It should, however, be noticed that the relationship between the explanatory variables and number of fatalities only demonstrate a correlation, which do not necessarily means that there exists a causal relationship.

In summary, the study shows good results for the suggested method. However, the fol-lowing aspects should be further studied before the method is used more widely.

• Previous studies have shown that estimates of separate parameters in the model are relatively uncertain. On the other hand, the model seems to work well for mak-ing forecasts when there is serial correlation in the errors to consider. It should therefore be studied if the estimation method is reliable when it comes to calculat-ing forecasts.

(12)

• The presented models in this report are based on the selected potential explanatory variables. The explanatory variables are also used in their original form, but we do not know if this represents the best relationship between each variable and the number of fatalities. An inventory of other potential explanatory variables should therefore be conducted, as well as a test to see if other possible relationships could improve the model.

• Assumptions about future development of the explanatory variables are needed in order to make forecasts. Only two relatively simple assumptions have been used in this report. More realistic estimates of the development of the different explanato-ry variables are needed in order to improve the forecasts.

(13)

1

Inledning

Att analysera tidsserier av antal d¨odade personer i v¨agtrafiken ¨ar en viktig del i arbetet med att f¨olja upp trafiks¨akerhetsutvecklingen. B˚ade att kunna f¨orklara utvecklingen och att prediktera framtida v¨arden ¨ar av intresse. Andra m˚att anv¨ands ocks˚a men just antal d¨odade personer ¨ar vanligt f¨orekommande dels eftersom det ¨ar ett m˚att med h¨og kvalitet och dels eftersom det ¨ar ett viktigt m˚att n¨ar det g¨aller att f¨olja upp arbetet med nollvisio-nen. Tidigare uppf¨oljningar av antal d¨odade i Sverige finns i bland annat Br¨ude (2001); Br¨ude m.fl. (2003).

Eftersom faktiskt antal omkomna f¨orutom att spegla trafiks¨akerheten ocks˚a inneh˚aller slumpm¨assiga effekter baseras ofta analyserna p˚a sannolikhetsmodeller. Det finns dock m˚anga typer av modeller med olika egenskaper och det ¨ar inte sj¨alvklart vilken man ska anv¨anda. Eftersom det ocks˚a p˚ag˚ar en st¨andig utveckling av modellerna och nya tillkom-mer ¨ar det viktigt att ibland ompr¨ova de modeller som anv¨ands och att prova nya vari-anter.

En typ av modell som har utvecklats relativt sent och endast i liten utstr¨ackning anv¨ants inom trafiks¨akerhetsforskning ¨ar modeller f¨or diskreta data som ocks˚a tar h¨ansyn till korrelation mellan v¨arden vid olika tidpunkter, s˚a kallad seriell korrelation eller auto-korrelation. I den h¨ar rapporten studeras en specifik modell med dessa egenskaper med syfte att unders¨oka hur v¨al modellen fungerar n¨ar det g¨aller att prediktera utvecklingen av antal d¨odade i v¨agtrafiken.

1.1 Bakgrund

N¨ar man v¨aljer modell f¨or att analysera data utg˚ar man ifr˚an dessa datas egenskaper. F¨or tidsserier ¨ar det viktigt att titta p˚a vilken f¨ordelning data har och om det f¨orekommer seriell korrelation i tidsserien.

N¨ar det g¨aller trafikolyckor kan man med teoretiska resonemang g¨ora g¨allande att antal olyckor i ett visst geografiskt omr˚ade under en viss tidsperiod b¨or f¨olja en Poissonf¨ordel-ning (se t.ex. Danielsson, 1999). En grundl¨aggande egenskap hos Poissonf¨ordelPoissonf¨ordel-ningen ¨ar att variansen ¨ar lika stor som v¨antev¨ardet. Om man ist¨allet f¨or antal olyckor tittar p˚a antalet d¨odade personer ¨okar den totala variansen eftersom antalet d¨odade kan vari-era fr˚an olycka till olycka. Detta kallas ofta ¨overspridning och det brukar man hantvari-era antingen genom att anta en f¨ordelning med mer flexibel varians, till exempel negativ bi-nomial, eller genom att till˚ata en ¨okad varians i modeller med Poissonf¨ordelning som grund. H¨ar kan p˚apekas att ¨aven f¨ordelningen av antal olyckor i praktiken ibland avviker fr˚an Poissonf¨ordelningen, d¨arf¨or anv¨ands ofta samma metoder ¨aven n¨ar man tittar p˚a antalet olyckor.

I tidsserier f¨orekommer ofta seriell korrelation som antingen beror p˚a att ett utfall en viss period direkt p˚averkar ett senare utfall eller att utfallen beror av andra, underlig-gande, variabler som i sin tur ¨ar seriellt korrelerade. Om man i en modell kan ta h¨ansyn till dessa underliggande variabler blir residualerna oberoende. Ofta ¨ar det dock s˚a att man inte k¨anner till eller inte har data fr˚an alla viktiga variabler, varf¨or det kvarst˚ar en korrelation i residualerna som man m˚aste hantera.

Antal personer som d¨odas i trafiken p˚averkas av en rad faktorer: m¨angden trafik, inf¨orandet av trafiks¨akerhets˚atg¨arder, sammans¨attningen av trafikanter, etc. N¨ar man tittar p˚a l¨angre tidsserier ¨ar det ofta bara ett f˚atal variabler man kan ta h¨ansyn till och det ¨ar d¨arf¨or stor risk att det finns seriell korrelation kvar i residualerna efter att man har anpassat modellen. En indikation p˚a att det finns s˚adan korrelation f˚as i Karlsson och Willer¨o (2005) som anv¨ande s˚a kallade ARIMA och transerfunktionsmodeller f¨or att analysera antal d¨odade

(14)

och d¨odsrisk i trafiken. I Reurings och Commandeur (2007) presenteras en ¨oversikt ¨over modeller som har anv¨ants i n˚agra olika l¨ander och d¨ar p˚apekas ocks˚a vikten av att ta h¨ansyn till seriell korrelation. I den h¨ar typen av data b¨or dock korrelationen fr¨amst bero p˚a att viktiga variabler som i sig ¨ar korrelerade saknas, snarare ¨an att det finns ett kausalt samband i tiden. Att ett visst antal personer d¨odas under ett ˚ar p˚averkar ju inte direkt hur m˚anga som d¨odas n¨asta ˚ar.

Om det finns en positiv seriell korrelation som man inte tar h¨ansyn till underskattas variansen f¨or skattningarna av regressionskoefficienter. Om man testar hypotesen att en koefficient ¨ar lika med noll kommer den egentliga riskniv˚an att vara h¨ogre ¨an den avsedda. Det ¨ar allts˚a f¨or h¨og sannolikhet, j¨amf¨ort med den t¨ankta, att man f¨orkastar hypotesen fast den ¨ar sann.

Inom trafiks¨akerhetsomr˚adet anv¨ands m˚anga olika typer av modeller f¨or att analysera tidsserier av olycksdata. Det finns dock tv˚a typer av modeller som ¨ar dominerande: ARIMA-modeller (Voas m.fl., 2002; Abdelwahab och Abdel-Aty, 2004; Masten och Hagge, 2004; Miller m.fl., 2004; Raeside och White, 2004; Vernon m.fl., 2004) och Poissonregression (Fridstrøm m.fl., 1993; Br¨ude, 1995; Hoareau m.fl., 2002; Ossian-der och Cummings, 2002; Amoros m.fl., 2003; Lord m.fl., 2005). Beroende p˚a vilken typ man anv¨ander tar man antingen h¨ansyn till att data ¨ar f¨ordelade enligt en f¨ordelning av Poisson-typ eller till att det kan finnas seriell korrelation. I modeller av ARIMA-typ modelleras tidsberoendet men man antar att data ¨ar normalf¨ordelade med konstant vari-ans. En nackdel med ARIMA-modeller ¨ar ocks˚a att det ¨ar relativt kr˚angligt att inkludera f¨orklaringsvariabler. Om man ist¨allet anv¨ander Poissonregression utg˚ar man ifr˚an att ob-servationerna ¨ar oberoende.

Modeller f¨or tidsserier av diskreta data d¨ar man tar h¨ansyn till seriell korrelation b¨orjade utvecklas i slutet p˚a 70-talet (se Cameron och Trivedi, 1998, kap. 7, f¨or en ¨oversikt). Det finns en rad olika ansatser till modeller men omr˚adet ¨ar fortfarande under utveckling. Den modell som verkar vara mest utbredd kallas INARMA (se t.ex. Br¨ann¨as och Hall, 2001, f¨or en beskrivning). Det ¨ar en variant av ARMA som ¨ar anpassad f¨or heltalsvari-abler. Den enklaste formen ¨ar INAR av ordning ett, d¨ar ett utfall p˚a responsvariabeln beror p˚a v¨ardet perioden innan och en slumpprocess. Modellen ¨ar relativt enkel att f¨orst˚a och d¨arf¨or tilltalande, men det ¨ar sv˚art att f¨ora in f¨orklaringsvariabler p˚a ett naturligt s¨att. INARMA har, vad vi k¨anner till, inte anv¨ants i trafiktill¨ampningar.

Den modell vi har valt att studera n¨armare ¨ar en vidareutveckling av Poissonregression d¨ar ¨overspridning och seriell korrelation modelleras genom en latent process. Modellen kallas h¨ar seriell Poissonregression. Modellen formulerades f¨orst av Zeger (1988) och har senare vidareutvecklats av bland andra Br¨ann¨as och Johansson (1994); Davis m.fl. (1999, 2000). En f¨ordel med den h¨ar modellen ¨ar att den bygger p˚a principerna bakom traditionell Poissonregression som anv¨ants l¨ange inom trafiks¨akerhetsomr˚adet. Seriell Poissonregression har tidigare till¨ampats p˚a motorv¨agsolyckor i Sverige (Johansson, 1996). Modellen beskrivs i kapitel 2.2.

(15)

2

Modeller

I den h¨ar rapporten anv¨ands tv˚a typer av modeller. Dels Poissonregression d¨ar obser-vationerna antas vara oberoende i tiden, men d¨ar man kan ta h¨ansyn till eventuell ¨over-spridning, dels seriell Poissonregression d¨ar man genom en latent process tar h¨ansyn till b˚ade ¨overspridning och seriell korreleration.

2.1 Poissonregression

L˚at {Yt, t = 1, . . . , n} vara en serie av slumpvariabler och antag att varje enskild

slump-variabel, Yt, f¨oljer en Poissonf¨ordelning med v¨antev¨arde µt. D˚a f¨oljer att variansen ¨ar

lika stor som v¨antev¨ardet, E(Yt) = V (Yt) = µt. V¨antev¨ardet modelleras sedan som

µt= eβ0+β1xt1+...+βpxtp (2.1)

d¨ar p ¨ar antal f¨orklaringsvariabler, xt1, xt2, . . . , xtp ¨ar observerade f¨orklaringsvariabler

vid tid t och β0, β1, . . . , βp ¨ar regressionskoefficienter. Man kan ¨aven anv¨anda andra

typer av regressionssamband f¨or att modellerna v¨antev¨ardet, men det h¨ar ¨ar f¨ormodligen det vanligast f¨orekommande.

Som beskrivs i bakgrunden st¨ammer inte alltid antagandet att variansen ¨ar lika stor som v¨antev¨ardet. I princip har man d˚a inte en Poissonf¨ordelad variabel, men ofta anv¨ander man ¨and˚a en modifierad typ av Poissonregression. Den variant som anv¨ands h¨ar ¨ar att variansen multipliceras med en skalparameter, δ, som till˚ats vara b˚ade st¨orre och mindre ¨an 1, variansen kan d˚a skrivas som

V (Yt) = µtδ (2.2)

Modellen anpassas till en viss upps¨attning av data genom att man med hj¨alp av dessa data skattar modellens parametrar. I det h¨ar fallet ¨ar det βi, i = 0, 1, . . . , p och δ som

beh¨over skattas. Fr˚an dessa grundparametrar kan man sedan ber¨akna andra intressanta m˚att som konfidensintervall f¨or skattningarna av regressionskoefficienterna.

F¨or att skatta βioch δ anv¨ander man en teknik som kallas quasi-likelihood, QL. Tekniken

¨ar beskriven i bland annat McCullagh och Nelder (1989) och finns implementerad i flera av de vanliga statistikprogrammen.

Ibland vill man tolka de olika regressionsparametrarnas storlek f¨or att se vilken bety-delse en viss f¨or¨andring en f¨orklaringsvariabels v¨arde har f¨or det skattade v¨antev¨ardet, ˆ

µt. Det kan man g¨ora p˚a f¨oljande s¨att. Antag att man vill veta vad en relativ ¨okning av

xt1med c procent ger f¨or relativ f¨or¨andring av ˆµt, givet att ¨ovriga f¨orklaringsvariabler

¨ar of¨or¨andrade. Det ber¨aknas som exp( ˆβ1x0c/100), d¨ar x0 ¨ar den niv˚a p˚a

f¨orklarings-variabeln som man vill m¨ata f¨or¨andringen fr˚an. En absolut f¨or¨andring med d enheter ger ist¨allet en relativ f¨or¨andring av v¨antev¨ardet med exp( ˆβ1d), den f¨or¨andringen ¨ar allts˚a

oberoende av niv˚an p˚a f¨orklaringsvariabeln. 2.2 Seriell Poissonregression

F¨or att kunna anv¨anda Poissonregression ¨aven vid analys av tidsserier med seriell kor-relation f¨oreslog Zeger (1988) att en latent process, t, skulle inf¨oras p˚a f¨oljande s¨att.

F¨or ett visst v¨arde p˚a den latenta processen vid tidpunkt t s¨atts v¨antev¨arde och varians f¨or Yttill

E(Yt | t) = µtt (2.3)

(16)

d¨ar µtdefinieras p˚a samma s¨att som ovan, enligt 2.1. Antag nu att {t} ¨ar en icke-negativ

station¨ar tidsserie med E(t) = 1, V (t) = σ2, och Cov(t, t+k) = γ(k) = σ2ρ(k) f¨or

k = 0, 1, .... Man antar allts˚a en tidsberoende i den latenta serien d¨ar ρ(k) betecknar

ko-rrelationen mellan v¨arden p˚a tidsavst˚and k. Om man inte betingar p˚a t, blir momenten

f¨or Yt

E(Yt) = µt (2.5)

V (Yt) = µt+ σ2µ 2

t (2.6)

V¨antev¨ardet ¨ar allts˚a detsamma som om Ytf¨oljde en Poissonf¨ordelning men variansen

¨overstiger v¨antev¨ardet p˚a grund av den latenta processen. Variansen ¨overensst¨ammer med variansen f¨or en slumpvariabel som f¨oljer en Negativ Binomialf¨ordelning med v¨antev¨arde µtoch spridningsparameter σ2. Relationen mellan

autokorrelationsfunktio-nen f¨or {t} och {Yt} ¨ar

ρYt(k) = ρ(k) r (1 + σ21 µ2t)(1 + 1 σ2 µ2t+k ) , k = 1, 2, . . . (2.7)

Det f¨oljer fr˚an 2.7 att autokorrelationen f¨or {Yt} alltid ¨ar mindre ¨an eller lika med

auto-korrelationen f¨or den latenta processen, likhet g¨aller endast n¨ar ρ(k) = ρYt(k) = 0. Det kan d¨arf¨or vara sv˚art att uppt¨acka en underliggande, seriellt beroende, process om man endast studerar serien {Yt}.

De ok¨anda parametrarna som m˚aste skattas fr˚an data ¨ar βi, σ2 och γ(k).

Regressions-koefficienterna βi skattas med samma teknik som traditionell Poissonregression medan

de andra parametrarna m˚aste skattas p˚a annat s¨att. Det finns inget vedertaget s¨att att skatta dessa variabler, metodiken ¨ar fortfarande under utveckling. Den skattningsmetod som vi anv¨ant beskrivs i Bilaga 1 och kallas h¨ar Davis metod.

2.2.1 Skattningarnas egenskaper

Skattningarnas egenskaper har unders¨okts i en tidigare studie d¨ar tre olika metoder j¨amf¨or-des i en simuleringsstudie (Forsman, 2008). De tre metoderna var: en momentskattning som f¨oreslogs av Zeger (1988), Davis metod (Davis m.fl., 2000) samt QL-metoden som anv¨ands vid Poissonregression med oberoende residualer.

Tre modeller med olika f¨orklaringsvariabler testades: en med linj¨ar trend, xt = t/n,

d¨ar t = 1, 2, . . . , n, en med autoregressiv process av f¨orsta ordningen, xt = 0,2525 +

0,5xt−1 + ξt, d¨ar ξt ∼ N (0; 0,0626), och en kombination av de tv˚a, xt = 0,0740 +

t/(√2n) + 0,5xt−1+ ηt, ηt ∼ N (0; 0,0313). Endast en f¨orklaringsvariabel per modell

anv¨andes s˚a att µt = exp(β0 + β1xt). Den latenta processen, t, formulerades som en

lognormal autoregressiv modell d¨ar t= exp(0t) och  0

t= α + φ 0

t+ at, at∼ N (0, σa2).

I simuleringsstudien unders¨oktes dels skattningen av standardavvikelsen f¨or den skat-tade regressionskoefficienten, ˆsd( ˆβ1), dels faktisk riskniv˚a och styrka f¨or test av

hypote-sen H0 : β1 = 0. Den teststatistika som anv¨andes var ˆβ1/ ˆsd( ˆβ1), vilken, under H0,

antogs f¨olja en t-f¨ordelning med (n − 2) frihetsgrader.

Resultaten visade att faktisk riskniv˚a ofta var st¨orre ¨an den ¨onskade p˚a 0,05 f¨or b˚ade momentmetoden och Davis metod oavsett om det fanns seriell korrelation eller inte i den latenta processen, se Tabell 2.1. Det beror, ˚atminstone delvis, p˚a att standard-avvikelsen underskattades. Den faktiska riskniv˚an var relativt lika oavsett om det fanns korrelation eller inte men varierade mellan modeller med olika f¨orklaringsvariabler. I de genomf¨orda simuleringarna varierade riskniv˚an mellan 0,05 och 0,22. Genomg˚aende var

(17)

Davis metod b¨attre ¨an momentmetoden p˚a s˚a s¨att att den faktiska riskniv˚an l˚ag n¨armare den ¨onskade och att underskattningen av standardavvikelsen var mindre. D¨aremot upp-visade Davis metod st¨orre variation mellan enskilda skattningar.

QL-metoden fungerade bra n¨ar de simulerade observationerna var oberoende, vilket var v¨antat eftersom det ¨ar det fallet som metoden ¨ar utvecklad f¨or. N¨ar det fanns positiv kor-relation underkattades dock standardavvikelsen relativt kraftigt och negativ korkor-relation ledde till viss ¨overskattning. Vid positiv korrelation var underskattningen av standard-avvikelsen st¨orre f¨or QL-metoden ¨an f¨or de tv˚a andra metoderna. Dock ger QL-metoden mindre variation mellan skattningarna. Med de andra tv˚a metoderna kan man allts˚a g¨ora stora fel i enstaka skattningar och variationen ¨ar allra st¨orst f¨or Davis metod.

Tabell 2.1 Simulerad riskniv˚a f¨or test av hypotesen H0 : β1 = 0. Den latenta

pro-cessens autokorrelation av ordning 1,ρ(1), antar v¨ardena 0,5, 0 och -0,5. ¨Onskad

riskniv˚a ¨ar 0,05. Metod Moment Davis QL ρ(1) xt= t/n 0,5 0,22 0,16 0,18 0 0,21 0,15 0,05 -0,5 0,22 0,16 0,03 ρ(1) xt= 0,2525 + 0,5xt−1+ ξt 0,5 0,06 0,05 0,10 0 0,06 0,05 0,05 -0,5 0,06 0,05 0,03 ρ(1) xt= 0,0740 + t/( √ 2n) + 0,5xt−1+ ηt 0,5 0,12 0,09 0,15 0 0,09 0,07 0,04 -0,5 0,09 0,07 0,03

Skattningarnas egenskaper har ocks˚a studerats av Nyquist och Westblad (2007). De utgick fr˚an observerade m˚anadsdata av antal d¨odade i trafiken och det totala trafikar-betet. Utifr˚an dessa tidsserier byggde de en modell som kunde simulera nya tidsserier med liknande egenskaper. Slutligen anpassade de en modell med antal d¨odade per m˚anad som responsvariabel och trafikarbete, tidstrend och indikatorvariabler f¨or olika m˚anader som f¨orklaringsvariabler. P˚a s˚a s¨att kunde de studera skattningarna f¨or en realistisk mod-ell. Resultaten fr˚an simuleringarna visade att skattningar med Davis metod underskat-tade standardavvikelsen f¨or regressionskoefficienterna, vilket st¨ammer ¨overens med resultaten i den ovan beskrivna simuleringsstudien. Underskattningen var ca 9 procent f¨or standardavvikelsen av koefficienten f¨or trafikarbetet och ca 13 procent f¨or trenden. Detta ledde i sin tur till f¨or l˚ag faktisk konfidensgrad i motsvarande konfidensintervall. 2.3 Prognoser

Med hj¨alp av modellerna kan man g¨ora prognoser av framtida v¨arden. F¨or Poissonreg-ression utan tidsberoende beror prognoserna endast av f¨orklaringsvariablernas v¨arden vid de aktuella tidpunkterna

yT(h) = µT +h = eβ0+β1x(T +h),1+...+βpx(T +h),p (2.8)

d¨ar yT(h) ¨ar prediktorn h steg fram˚at fr˚an tidpunkt T . Man beh¨over allts˚a framtida v¨arden

¨aven f¨or f¨orklaringsvariablerna. Antingen g¨or man separata prognoser f¨or dessa varia-bler med hj¨alp av modeller eller s˚a ans¨atter man sj¨alv v¨arden. Dessa v¨arden kan man

(18)

antingen s¨atta efter vad man tror ¨ar mest rimligt eller s˚a kan man testa olika scenarier (t.ex. vad h¨ander om f¨orklaringsvariablernas v¨arden ¨okar med 3 procent vardera per ˚ar under den n¨armaste fem˚arsperioden.)

Eftersom den seriella Poissonregressionen inneh˚aller b˚ade en regressionsdel och en latent process med seriell korrelation baseras prediktionerna f¨or den h¨ar modellen b˚ade p˚a f¨orklaringsvariablernas v¨arden och tidigare v¨arden p˚a den unders¨okta tidsserien. Prediktorn f¨or ett steg fram˚at ber¨aknas som

yT(1) = µT +1+ Cov(yT +1, yT)VT−1(yT− µT) (2.9)

d¨ar yT = (yT −τ yT −τ +1 . . . yT), τ ¨ar h¨ar satt till 10 och anger antal nollskilda v¨arden

i autokorrelationsfunktionen. Om tidsavst˚andet mellan tv˚a observationer ¨ar st¨orre ¨an 10 s¨atts korrelationen mellan dessa observationer till 0. V¨antev¨ardesvektorn µT definieras

p˚a motsvarande s¨att. VT ¨ar kovariansmatrisen f¨or yT (se formel 5.1 i Bilaga 1 f¨or

defini-tion) och Cov(yT +h, yT) ¨ar element (T − τ ) till T i den sista raden i VT +h.

Prediktions-formeln baseras p˚a formel 2 i Br¨ann¨as (1995), den har dock modifierats n˚agot eftersom vi h¨ar s¨atter autokorrelationen till noll om tidsavst˚andet ¨overstiger τ .

Prediktioner f¨or 2 och fler steg fram˚at ber¨aknas rekursivt. F¨or 2 steg fram˚at blir formeln yT(2) = yT +1(1) = µT +2+ Cov(yT +2, yT+1)VT +1−1 (yT+1− µT+1) (2.10)

(19)

3

Datamaterial och anpassning av modeller

Antal d¨odade personer i v¨agtrafikolyckor ¨ar den variabel som studeras och som man ¨onskar att g¨ora prognoser f¨or. F¨orutom att titta p˚a totalt antal d¨odade har materialet ocks˚a delats upp p˚a f¨oljande trafikantkategorier: bilister (f¨orare och passagerare i person-bil, lastbil och buss), motorcyklister, mopedister, cyklister, g˚angtrafikanter och ¨ovriga (data finns i Bilaga 2). Sk¨alet till att dela upp materialet ¨ar att olika modeller d˚a kan an-passas till de olika kategorierna. Detta ¨ar ¨onskv¨art eftersom antal d¨odade i de olika kate-gorierna dels kan p˚averkas av olika faktorer och dels kan p˚averkas p˚a olika s¨att av sam-ma faktorer. Som start˚ar f¨or datasam-materialet valdes 1970, valet ¨ar en kompromiss mellan att f˚a med s˚a m˚anga ˚ar som m¨ojligt och att trafiksituationen i stort inte ska ha f¨or¨andrats alltf¨or mycket under perioden. ˚Ar 1970 hade ett aktivt trafiks¨akerhetsarbete p˚ab¨orjats i och med h¨ogertrafikoml¨aggningen 1967 och bildandet av Trafiks¨akerhetsverket 1968. Slut˚ar f¨or tidsserierna ¨ar antingen 2005 eller 2006, beroende p˚a vilka data som fanns tillg¨angliga n¨ar analyserna gjordes. Endast tidsserier med ˚arsdata har behandlats.

F¨or varje trafikantkategori har ett antal potentiella f¨orklaringsvariabler valts ut. Det finns naturligvis ett stort antal variabler som man vet eller tror p˚averkar trafiks¨akerheten f¨or olika trafikanter. M˚anga av dessa finns det dock inga eller endast ett f˚atal m¨atningar av. H¨ar har endast variabler d¨ar m¨atdata finns tillg¨angliga f¨or varje ˚ar fr˚an 1970 och fram˚at tagits med. I Tabell 3.1 listas de utvalda f¨orklaringsvariablerna. Eftersom den generella trenden ¨ar att trafiken successivt har blivit s¨akrare sedan 1970 ¨ar en trendvariabel med i varje trafikantkategori. Trendvariabeln ¨ar p˚a formen eβt/n, d¨ar t = 1, . . . , n och n ¨ar

antal ˚ar, och ben¨amns d¨arf¨or exponentiell trend (den skapas genom att en linj¨ar funk-tion s¨atts in i uttrycket 2.1). F¨or alla kategorier av motorfordon har trafikarbete m¨att i fordonskilometer tagits med som data p˚a exponering. Eftersom olika ˚aldersgrupper har olika risk att d¨odas i en trafikolycka ¨ar ˚aldersf¨ordelningen ocks˚a intressant. Tyv¨arr finns inte trafikarbete uppdelat p˚a ˚alderskategori med tillr¨acklig noggrannhet. Som en indikator p˚a detta har ist¨allet ˚aldersf¨ordelningen i hela befolkningen anv¨ants. F¨or varje trafikantslag har vi valt ut de ˚aldersgrupper som bed¨omts ha st¨orst risk och ber¨aknat andelen personer i de grupperna. I flera fall har gruppen ocks˚a begr¨anstas till manliga trafikanter eftersom de i dessa fall har klart h¨ogre risk ¨an vad kvinnor har.

Det ˚arliga tillskottet av antal bilar i trafik ¨ar ett s¨att att indirekt m¨ata hur m˚anga ovana f¨orare som finns i trafiken. Denna variabel anv¨andes med bra resultat av Hallberg (2006) och har d¨arf¨or tagits med h¨ar. En annan variabel av intresse ¨ar konjunkturen. Vid h¨og-konjunktur tenderar det totala antalet d¨odade att ¨oka. Till stor del beror detta p˚a att trafik-arbetet ¨okar vid h¨ogkonjunktur men det finns resultat fr˚an andra studier som pekar p˚a att konjunkturen ¨aven p˚averkar antal olyckor p˚a andra s¨att, se Hakim m.fl. (1991) f¨or en sammanst¨allning. En f¨orklaring till detta kan vara att olika typer av resor som ¨ar olika riskfyllda ocks˚a ¨ar olika k¨ansliga f¨or konjunktursv¨angningar. Till exempel ¨ar arbetsre-sor relativt ok¨ansliga och rearbetsre-sor som g¨ors av unga f¨orare relativt k¨ansliga f¨or ekonomiska faktorer. Beroende p˚a konjunkturen kan allts˚a sammans¨attningen av olika sorts resor ¨andras och d¨armed p˚averka trafiks¨akerheten (Hakim m.fl., 1991). Som m˚att p˚a konjunk-tur har bruttonationalprodukt (BNP) per kapita valts.

F¨or att i n˚agon m˚an ta h¨ansyn till att olika typer av v¨agar har olika olycksrisk har vari-abeln total str¨acka m¨otesfri v¨ag tagits med. Som m¨otesfri v¨ag r¨aknas h¨ar motorv¨ag, 2+1-v¨ag och fyrf¨altsv¨ag. I Bilaga 3–7 finns data och k¨allh¨anvisningar f¨or alla potentiella f¨orklaringsvariabler.

(20)

Tabell 3.1 Potentiella f¨orklaringsvariabler efter trafikantkategori.

Trafikantkategori F ¨orklaringsvariabler F ¨orv ¨antad p ˚averkan p ˚a

antal d ¨odade vid en ¨okning av variabelns v ¨arde

Alla Exponentiell trend Minskning

Exponering (Totalt trafikarbete f ¨or

lastbil, personbil, buss och MC) Okning¨

˚

Arligt tillskott av antal bilar i trafik Okning¨

Andel m ¨an i ˚aldern 18 till 24 av den

totala befolkningen Okning¨

Bruttonationalprodukt (BNP) Okning¨

Total str ¨acka m ¨otesfri v ¨ag Minskning

Bilister Exponentiell trend Minskning

Exponering (totalt trafikarbete f ¨or

lastbil, personbil och buss) Okning¨

˚

Arligt tillskott av antal bilar i trafik Okning¨

Andel m ¨an i ˚aldern 18 till 24 av den

totala befolkningen Okning¨

BNP Okning¨

Total str ¨acka m ¨otesfri v ¨ag Minskning

Motorcyklister Exponentiell trend Os ¨akert

Exponering (Trafikarbete MC) Okning¨

Andel m ¨an i ˚aldern 16 till 24 av den

totala befolkningen Okning¨

BNP Os ¨akert

Total str ¨acka m ¨otesfri v ¨ag Minskning

Mopedister Exponentiell trend Minskning

Exponering (Trafikarbete moped) Okning¨

Andel m ¨an i ˚alder 15 till 17 av den

totala befolkningen Okning¨

BNP Os ¨akert

Cyklister Exponentiell trend Minskning

Andel personer ¨over 65 ˚ar av den

totala befolkningen Okning¨

BNP Os ¨akert

G ˚angtrafikanter Exponentiell trend Minskning

Andel personer ¨over 65 ˚ar av den

totala befolkningen Okning¨

BNP Os ¨akert

¨

Ovriga Exponentiell trend Minskning

(21)

3.1 Anpassning av modeller till data

Om det inte finns n˚agon seriell korrelation i residualerna har det visat sig att skattningar-na i den seriella Poissonregressionen kan ge orimliga resultat som till exempel korre-lationer st¨orre ¨an 1. Vi har d¨arf¨or valt att f¨orst anpassa traditionella Poissonregressions-modeller till data och utifr˚an dessa resultat v¨alja den b¨asta modellen. D¨arefter har residu-aler och skalparameter studerats och n¨ar det funnits tecken p˚a autokorrelation har vi g˚att vidare och anpassat en seriell Poissonregressionsmodell. Denna procedur har upprepats f¨or varje trafikantkategori.

Den modell som gav b¨ast prediktion och samtidigt hade f¨orv¨antat tecken p˚a regressions-koefficienterna valdes (se Tabell 3.1 f¨or f¨orv¨antade tecken). Modellerna begr¨ansades ocks˚a s˚a att endast f¨orklaringsvariabler med motsvarande P-v¨arden mindre ¨an 0,05 togs med. Observera dock att signifikanstest utf¨ordes p˚a skattningar med traditionell Poisson-regression vilket betyder att vi inte tagit h¨ansyn till seriell korrelation. D¨armed kan n˚agot f¨or m˚anga variabler ha tagits med.

F¨or varje trafikantkategori anpassades modeller till alla m¨ojliga kombinationer av de po-tentiella f¨orklaringsvariablerna. De modeller d¨ar dels alla ing˚aende f¨orklaringsvariabler hade koefficienter signifikant skilda fr˚an noll och dels alla regressionskoefficienter hade f¨orv¨antat tecken valdes sedan. De kvarvarande modellerna j¨amf¨ordes med avseende p˚a dess prediktionsegenskaper.

F¨or att bed¨oma prediktionsegenskaperna ber¨aknades tre prediktionsm˚att: MAPE (mean average percentage error), MAD (mean average deviation) och MSD (mean squared de-viation). De definieras enligt

M AP E = 1 n n X t=1 | yt− ˆyt yt | (3.1) M AD = 1 n n X t=1 | yt− ˆyt | (3.2) M SD = 1 n n X t=1 (yt− ˆyt)2 (3.3)

d¨ar ˆyt¨ar det skattade v¨ardet f¨or yt. F¨or Poissonregression ¨ar ˆyt = ˆµtoch f¨or seriell

Poissonregression ¨ar ˆyt = yt−1(1) enligt definition i kapitel 2.3.

Anpassningen av modeller gjordes dels till hela tidsserier fr˚an 1970 till 2006 (2005), dels till en f¨orkortad serie fr˚an 1980 till 2006 (2005). Anpassningen till den kortare tidsserien gjordes f¨or att bed¨oma stabiliteten i skattningarna. I b˚ada fallen ber¨aknades dock prediktionsm˚atten f¨or hela tidsserien. I f¨orsta hand j¨amf¨ordes prediktionsm˚atten som var ber¨aknade utifr˚an att modellen hade anpassats till hela tidsserien. Ibland var inte de tre m˚atten samst¨ammiga, d˚a gjordes specifika bed¨omningar som redovisas i resultat-avsnittet.

N¨ar en modell hade valts ut gjordes en bed¨omning om det fanns seriell korrelation i residualerna. En f¨orsta indikation var v¨ardet p˚a skalparametern. Om skalparametern inte ¨overstiger 1 s˚a finns ingen ¨overspridning i Poissonprocessen och d¨armed ingen se-riell korrelation. Om skalfaktorn ¨overstiger 1 kan det finnas sese-riell korrelation men det kan ocks˚a vara en ¨okad variation med oberoende residualer. D¨arf¨or studerades tidsserie-diagram med residualer f¨or att se om det fanns tecken p˚a seriell korrelation. Residualer-na definierades som yt/ˆµt. Under f¨oruts¨attning att Poissonregression ¨ar en l¨amplig modell

b¨or residualerna vara oberoende och slumpm¨assiga. Om det fanns m¨onster i residualerna anpassades en seriell Poissonregressionsmodell. I det h¨ar l¨aget var vi gener¨osa och ¨aven

(22)

vid vaga m¨onster testades den seriella modellen. Residualerna f¨or den seriella modellen kallar vi h¨ar prediktionsfel och dessa ber¨aknades som yt/yt−1(1).

3.2 Prognoser

Prognoser f¨or fem ˚ar fram˚at ber¨aknades med den b¨asta modellen f¨or varje trafikantslag. F¨or att g¨ora dessa prognoser m˚aste man ¨aven ans¨atta v¨arden p˚a f¨orklaringsvariablerna fem ˚ar fram˚at. Detta gjordes p˚a tv˚a olika s¨att. Det f¨orsta s¨attet var att ber¨akna den genom-snittliga relativa ˚arliga ¨okningen fem ˚ar bak˚at i tiden och sedan anta att den ¨okningen g¨aller ytterligare fem ˚ar fram˚at. Det andra s¨attet var att l˚ata f¨orklaringsvariablernas v¨arden ¨oka med 1 procent per ˚ar.

Syftet med att g¨ora prognoserna var att j¨amf¨ora utfallet f¨or tv˚a olika scenarier, f¨or att f¨orst˚a hur modellerna fungerar. Vi har inte f¨ors¨okt ta fram realistiska prognoser f¨or f¨orklaringsvariablerna.

(23)

4

Resultat

4.1 Anpassning av modellen

Resultat visas f¨or den b¨asta modellen enligt de kriterier som beskrivs i kapitel 3.1. Re-sultat f¨or Poissonregression visas alltid och i f¨orekommande fall ocks˚a reRe-sultat f¨or seriell Poissonregression.

4.1.1 Totalt antal d ¨odade

Den valda modellen f¨or totalt antal d¨odade inneh˚aller f¨orklaringsvariablerna trend, trafik-arbete, tillskott av antal nya bilar och BNP. Denna modell var b¨ast enligt de tre predik-tionsm˚atten. I Figur 4.1 visas residualerna efter anpassning av Poissonregression (v¨anstra diagrammet) och prediktionsfel efter anpassning av seriell Poissonregression (h¨ogra dia-grammet).

I Tabell 4.1 och 4.3 j¨amf¨ors de tv˚a modellerna med avseende p˚a parameterskattningar och prediktionsegenskaper. Regressionskoefficienterna skattas p˚a samma s¨att i de tv˚a modellerna och kommer allts˚a alltid att ha samma v¨arden. D¨aremot skiljer sig skattning-arna av standardavvikelsen och d¨armed P-v¨ardet. Ett negativt v¨arde p˚a regressionskoef-ficienten betyder att en ¨okning av motsvarande variabels v¨arde leder till en minskning av antal d¨odade och tv¨artom. I Tabell 4.2 visas skattningar av varians och autokorrelation i den latenta processen i seriell Poissonregression.

F¨or att j¨amf¨ora regressionskoefficienternas betydelse ber¨aknades den relativa ¨okning av f¨orv¨antat antal d¨odade (se kapitel 2.1). F¨or variablerna trafikarbete, BNP och tillskott av bilar ger en ¨okning med 1 procent fr˚an 2005 ˚ars niv˚a en ¨okning med 2,0, 1,4 respektive 0,03 procent av f¨orv¨antat antal d¨oda. F¨or trenden resulterar en ¨okning med ett ˚ar i en minskning av antal d¨odade med 6,9 procent. Alla resultat bygger p˚a en ¨andring av en variabel i taget n¨ar resterande variabler ¨ar of¨or¨andrade.

B˚ade v¨ardet p˚a skalparametern, 1,809, och m¨onstret i residualerna tyder p˚a seriell kor-relation och resultaten i Tabell 4.3 visar att den seriella modellen har klart b¨attre predik-tionsegenskaper ¨an grundmodellen. Det syns ocks˚a i Figur 4.2 som visar observerat antal d¨odade samt predikterat antal d¨odade f¨or de tv˚a modellerna. Den streckade linjen visar prediktioner med Poissonregression och linjen med r¨oda markeringar visar predik-tioner med seriell Poissonregression. F¨orb¨attringen syns tydligast under perioden fr˚an slutet av 70-talet till mitten av 80-talet. F¨or de senaste ˚aren ¨ar anpassningen ungef¨ar lika bra med de tv˚a modellerna.

I Tabell 4.1 ser man att standardavvikelsen ¨okar n¨ar man tar h¨ansyn till seriell korrela-tion, vilket ¨ar v¨antat. Man kan till exempel se att koefficienten f¨or tillskott av nya bilar inte l¨angre ¨ar signifikant n¨ar man tar h¨ansyn till beroendet i residualerna. Vi vet dock att det ¨ar relativt stor os¨akerhet i dessa skattningar s˚a resultaten ska tolkas f¨orsiktigt. Detsamma g¨aller skattningarna av autokorrelationerna, korrelationen p˚a tidsavst˚and 1 skattas h¨ar till 0,81 vilket ¨ar v¨aldigt h¨ogt.

Som j¨amf¨orelse visas resultat f¨or modellen d¨ar endast trend och trafikarbete har tagits med (Figur 4.3). Dessa tv˚a variabler anv¨ands ofta f¨or att beskriva utvecklingen av antalet d¨odade och modellen ger ocks˚a relativt bra anpassning, ˚atminstone f¨or seriell Poisson-regression (Tabell 4.4). I Figur 4.3 syns en tydlig skillnad mellan prediktionerna de sista 10 ˚aren. Om man tar h¨ansyn till seriell korrelation f¨oljer modellen observerade data mycket b¨attre ¨an om detta inte g¨ors. Det h¨ar kan ses som ett s¨att att kompensera f¨or vari-abler som p˚averkar antal d¨odade men som inte ¨ar med i modellen.

(24)

1970 1975 1980 1985 1990 1995 2000 2005 0.8 0.85 0.9 0.95 1 1.05 1.1 1.15 Residualer 1970 1975 1980 1985 1990 1995 2000 2005 0.8 0.85 0.9 0.95 1 1.05 1.1 1.15 Prediktionsfel

Figur 4.1 Residualer och prediktionsfel f¨or modeller av totalt antal d¨odade person-er. Det v¨anstra diagrammet visar residualerna efter anpassning av Poissonregression och det h¨ogra diagrammet visar prediktionsfelen efter anpassning av seriell Poisson-regression.

Tabell 4.1 Parameterskattningar f¨or modeller av totalt antal d¨odade personer.

Poissonregression Seriell

Poissonregression

Skattning Standard- P-v ¨arde Standard- P-v ¨arde

avvikelse avvikelse

Intercept 5,429 0,312 <0,001 0,444 <0,001

Trend -2,584 0,286 <0,001 0,405 <0,001

Totalt trafikarbete (miljarder fkm) 0,026 0,006 <0,001 0,009 0,007

Tillskott av bilar (tiotusental) 0,008 0,003 0,023 0,004 0,089

BNP (tiotusen kr) 0,049 0,018 0,010 0,021 0,028

Skalparameter 1,809 - - -

-Tabell 4.2 Varians- och korrelationsskattningar i den latenta processen i seriell Pois-sonregression.

ˆ

σ2

 ρˆ(1) ρˆ(2) ρˆ(3) ρˆ(4) ρˆ(5) ρˆ(6) ρˆ(7) ρˆ(8) ρˆ(9) ρˆ(10)

0,003 0,81 0,20 -0,05 -0,29 -0,41 -0,17 0,06 0,15 -0,21 -0,37

Tabell 4.3 Prediktionsm˚att f¨or modeller av totalt antal d¨odade f¨orare. Modell med trend, trafikarbete, tillskott av bilar och BNP.

MAPE MAD MSD

Poissonregression 0,051 37,5 2040

Seriell Poissonregression 0,034 24,1 1030

Tabell 4.4 Prediktionsm˚att f¨or modeller av totalt antal d¨odade f¨orare. Modell med trend och trafikarbete.

MAPE MAD MSD

Poissonregression 0,070 52,4 4130

(25)

19700 1975 1980 1985 1990 1995 2000 2005 200 400 600 800 1000 1200 Antal dödade Observerat antal Prediktion (utan korr.) Prediktion (med korr.)

Figur 4.2 Observerat och predikterat antal d¨odade personer i v¨agtrafikolyckor. Mod-ell med trend, totalt trafikarbete, tillskott av bilar och BNP. Den streckade linjen visar prediktioner med Poissonregression och linjen med r¨oda markeringar visar prediktioner med seriell Poissonregression. Linjen med svarta cirklar visar observerat antal d¨odade personer.

(26)

19700 1975 1980 1985 1990 1995 2000 2005 200 400 600 800 1000 1200 Antal dödade Observerat antal Prediktion (utan korr.) Prediktion (med korr.)

Figur 4.3 Observerat och predikterat antal d¨odade personer i v¨agtrafikolyckor. Modell med trend och trafikarbete.

(27)

4.1.2 Antal d ¨odade bilister

Den b¨asta modellen f¨or antal d¨odade bilister ¨ar den med f¨orklaringsvariablerna trend, trafikarbete, BNP och str¨acka m¨otesfri v¨ag. De tre f¨orsta variablerna ¨ar samma som f¨or totalt antal d¨odade, det ¨ar naturligt att ungef¨ar samma variabler ing˚ar eftersom en stor del av de d¨odade ¨ar just bilister. Att str¨ackan f¨or det m¨otesfria v¨agn¨atet kommer med ¨ar ocks˚a rimligt eftersom detta fr¨amst ¨ar relevant f¨or biltrafiken. Resultaten visas i Figur 4.4 och 4.5 och Tabell 4.5–4.7. ¨Aven h¨ar blir anpassningen b¨attre om man tar h¨ansyn till seriell korrelation, men f¨orb¨attringen ¨ar inte lika tydlig som f¨or totalt antal d¨odade. 1970 1975 1980 1985 1990 1995 2000 2005 0.8 0.85 0.9 0.95 1 1.05 1.1 1.15 Residualer 1970 1975 1980 1985 1990 1995 2000 2005 0.8 0.85 0.9 0.95 1 1.05 1.1 1.15 Prediktionsfel

Figur 4.4 Residualer och prediktionsfel f¨or modeller av antal d¨odade bilister. Mod-eller med trend, trafikarbete, BNP och str¨acka m¨otesfri v¨ag.

Tabell 4.5 Parameterskattningar f¨or modeller av antal d¨odade bilister.

Poissonregression Seriell

Poissonregression

Skattning Standard- P-v ¨arde Standard- P-v ¨arde

avvikelse avvikelse

Intercept 4,052 0,388 <0,001 0,619 <0,001

Trend -2,753 0,337 <0,001 0,518 <0,001

Trafikarbete f ¨or personbil,

lastbil och buss (miljarder fkm) 0,027 0,007 <0,001 0,011 0,019

BNP (tiotusen kr) 0,103 0,025 <0,001 0,039 0,013

M ¨otesfri v ¨ag (tusen km) -0,164 0,060 0,010 0,088 0,071

Skalparameter 1,675 - - -

-Tabell 4.6 Varians- och korrelationsskattningar i den latenta processen i seriell Pois-sonregression.

ˆ

σ2

 ρˆ(1) ρˆ(2) ρˆ(3) ρˆ(4) ρˆ(5) ρˆ(6) ρˆ(7) ρˆ(8) ρˆ(9) ρˆ(10)

(28)

Tabell 4.7 Prediktionsm˚att f¨or modeller av antal d¨odade bilister. Modeller med trend, trafikarbete, BNP och str¨acka m¨otesfri v¨ag.

MAPE MAD MSD Poissonregression 0,065 29,1 1120 Seriell Poissonregression 0,048 22,0 737 19700 1975 1980 1985 1990 1995 2000 2005 100 200 300 400 500 600 700 Antal dödade Observerat antal Prediktion (utan korr.) Prediktion (med korr.)

Figur 4.5 Observerat och predikterat antal d¨odade bilister. Modeller med trend, trafikarbete, BNP och str¨acka m¨otesfri v¨ag.

(29)

4.1.3 Antal d ¨odade motorcyklister

F¨or motorcyklister var tv˚a modeller i stort sett lika bra med avseende p˚a de tre predik-tionsm˚atten. De tv˚a modellerna inneh¨oll variablerna trafikarbete och andel m¨an i ˚aldern 16–24, respektive trend, trafikarbete och str¨acka m¨otesfri v¨ag. De tre prediktionsm˚atten gav inte samst¨ammiga resultat s˚a vi tittade p˚a anpassningen till den f¨orkortade tidsse-rien (1980–2005). Den f¨orsta modellen med tv˚a f¨orklaringsvariabler var b¨attre i detta avseende och valdes d¨arf¨or. Det fanns ett svagt m¨onster i residualerna (Figur 4.6) och eftersom skalparametern var st¨orre ¨an 1 s˚a testades seriell Poissonregression. Detta f¨orb¨attrade prediktionen en del, speciellt f¨or m˚attet MSD (Tabell 4.10).

1970 1975 1980 1985 1990 1995 2000 2005 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 Residualer 1970 1975 1980 1985 1990 1995 2000 2005 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 Prediktionsfel

Figur 4.6 Residualer och prediktionsfel f¨or modeller av antal d¨odade motorcyklister. Modeller med trafikarbete och andel m¨an 16–24 ˚ar.

Tabell 4.8 Parameterskattningar f¨or modeller av antal d¨odade motorcyklister.

Poissonregression Seriell

Poissonregression

Skattning Standard- P-v ¨arde Standard- P-v ¨arde

avvikelse avvikelse

Intercept 0,133 0,750 0,860 1,157 0,909

Trafikarbete f ¨or mc (miljarder fkm) 0,539 0,164 0,002 0,244 0,034

Andel m ¨an 16–24 ˚ar 56,681 11,313 <0,001 17,286 0,002

Skalparameter 1,521 - - -

-Tabell 4.9 Varians- och korrelationsskattningar i den latenta processen i seriell Pois-sonregression.

ˆ

σ2

 ρˆ(1) ρˆ(2) ρˆ(3) ρˆ(4) ρˆ(5) ρˆ(6) ρˆ(7) ρˆ(8) ρˆ(9) ρˆ(10)

(30)

Tabell 4.10 Prediktionsm˚att f¨or modeller av antal d¨odade motorcyklister. Modeller med trafikarbete och andel m¨an 16–24 ˚ar.

MAPE MAD MSD Poissonregression 0,160 7,44 102 Seriell Poissonregression 0,147 6,61 74 19700 1975 1980 1985 1990 1995 2000 2005 10 20 30 40 50 60 70 80 90 100 Antal dödade Observerat antal Prediktion (utan korr.) Prediktion (med korr.)

Figur 4.7 Observerat och predikterat antal d¨odade motorcyklister. Modeller med trafikarbete och andel m¨an 16–24 ˚ar.

(31)

4.1.4 Antal d ¨odade mopedister

Den valda modellen f¨or antal d¨odade mopedister ¨ar den med trend och trafikarbete som f¨orklaringsvariabler. Resultaten visas i Figur 4.8 och 4.9 samt i Tabell 4.11. Eftersom spridningsparametern ¨ar mycket n¨ara 1 s˚a finns ingen ¨overspridning i modellen och d¨armed heller ingen seriell korrelation. Man kan inte heller se n˚agot speciellt m¨onster i residualerna i Figur 4.8. 1970 1975 1980 1985 1990 1995 2000 2005 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 Residualer

Figur 4.8 Residualer f¨or modell av antal d¨odade mopedister. Modell med trend och trafikarbete.

Tabell 4.11 Parameterskattningar f¨or modell av antal d¨odade mopedister.

Poissonregression

Skattning Standard- P-v ¨arde

avvikelse

Intercept 4,079 0,123 <0,001

Trend -2,512 0,123 <0,001

Trafikarbete f ¨or moped (miljarder fkm) 1,798 0,300 <0,001

(32)

-19700 1975 1980 1985 1990 1995 2000 2005 20 40 60 80 100 120 140 Antal dödade Observerat antal Prediktion (utan korr.)

Figur 4.9 Observerat och predikterat antal d¨odade mopedister. Modell med trend och trafikarbete.

(33)

1970 1975 1980 1985 1990 1995 2000 2005 0.4 0.6 0.8 1 1.2 1.4 1.6 Residualer 1970 1975 1980 1985 1990 1995 2000 2005 0.4 0.6 0.8 1 1.2 1.4 1.6 Prediktionsfel

Figur 4.10 Residualer och prediktionsfel f¨or modeller av antal d¨odade cyklister. Modeller med trend som f¨orklaringsvariabel.

Tabell 4.12 Parameterskattningar f¨or modeller av antal d¨odade cyklister.

Poissonregression Seriell

Poissonregression

Skattning Standard- P-v ¨arde Standard- P-v ¨arde

avvikelse avvikelse

Intercept 5,086 0,042 <0,001 0,041 <0,001

Trend (miljarder fkm) -1,567 0,081 <0,001 0,086 <0,001

Skalparameter 1,268 - - -

-4.1.5 Antal d ¨odade cyklister

Den b¨asta modellen f¨or cyklister ¨ar den som enbart inneh˚aller trend. Det finns en ten-dens till autokorrelation i residualerna och eftersom skalparametern ¨ar 1,268 s˚a testades ¨aven seriell Poissonregression. Det gav en n˚agot f¨orb¨attrad prediktionsf¨orm˚aga.

Tabell 4.13 Varians- och korrelationsskattningar i den latenta processen i seriell Pois-sonregression.

ˆ

σ2

 ρˆ(1) ρˆ(2) ρˆ(3) ρˆ(4) ρˆ(5) ρˆ(6) ρˆ(7) ρˆ(8) ρˆ(9) ρˆ(10)

(34)

Tabell 4.14 Prediktionsm˚att f¨or modeller av antal d¨odade cyklister. Modeller med trend som f¨orklaringsvariabel.

MAPE MAD MSD Poissonregression 0,125 8,95 131 Seriell Poissonregression 0,114 7,73 106 19700 1975 1980 1985 1990 1995 2000 2005 20 40 60 80 100 120 140 160 Antal dödade Observerat antal Prediktion (utan korr.) Prediktion (med korr.)

Figur 4.11 Observerat och predikterat antal d¨odade cyklister. Modeller med trend som f¨orklaringsvariabel.

(35)

1970 1975 1980 1985 1990 1995 2000 2005 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 Residualer 1970 1975 1980 1985 1990 1995 2000 2005 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 Prediktionsfel

Figur 4.12 Residualer och prediktionsfel f¨or modeller av antal d¨odade g˚angtrafikanter. Modeller med trend som f¨orklaringsvariabel.

Tabell 4.15 Parameterskattningar f¨or modeller av antal d¨odade g˚angtrafikanter.

Poissonregression Seriell

Poissonregression

Skattning Standard- P-v ¨arde Standard- P-v ¨arde

avvikelse avvikelse

Intercept 5,655 0,041 <0,001 0,028 <0,001

Trend (miljarder fkm) -1,631 0,087 <0,001 0,067 <0,001

Skalparameter 1,682 - - -

-4.1.6 Antal d ¨odade g ˚angtrafikanter ¨

Aven n¨ar det g¨aller g˚angtrafikanter ¨ar den b¨asta modellen den med enbart trend. H¨ar finns det dock ett n˚agot tydligare m¨onster i residualerna (Figur 4.12) och prediktionerna blev ocks˚a b¨attre med seriell Poissonregression (Tabell 4.17). Detta syns i Figur 4.13 d¨ar man ser att prediktionerna med h¨ansyn till korrelation f¨oljer de observerade v¨ardena b¨attre, speciellt fr˚an mitten av 80-talet fram till ˚ar 2000.

Tabell 4.16 Varians- och korrelationsskattningar i den latenta processen i seriell Pois-sonregression.

ˆ

σ2

 ρˆ(1) ρˆ(2) ρˆ(3) ρˆ(4) ρˆ(5) ρˆ(6) ρˆ(7) ρˆ(8) ρˆ(9) ρˆ(10)

(36)

Tabell 4.17 Prediktionsm˚att f¨or modeller av antal d¨odade g˚angtrafikanter. Modeller med trend som f¨orklaringsvariabel.

MAPE MAD MSD Poissonregression 0,127 15,7 363 Seriell Poissonregression 0,105 13,1 283 19700 1975 1980 1985 1990 1995 2000 2005 50 100 150 200 250 300 Antal dödade Observerat antal Prediktion (utan korr.) Prediktion (med korr.)

Figur 4.13 Observerat och predikterat antal d¨odade g˚angtrafikanter. Modeller med trend som f¨orklaringsvariabel.

(37)

1970 1975 1980 1985 1990 1995 2000 2005 0 0.5 1 1.5 2 Residualer

Figur 4.14 Residualer f¨or modeller av antal d¨odade trafikanter i kategorin ¨ovrigt. Modeller med trend som f¨orklaringsvariabel.

Tabell 4.18 Parameterskattningar f¨or modeller av antal d¨odade trafikanter i kategorin ¨ovrigt.

Poissonregression

Skattning Standard- P-v ¨arde

avvikelse

Intercept 3,267 0,167 <0,001

Trend -1,788 0,324 <0,001

Skalparameter 1,506 -

-4.1.7 Antal d ¨odade personer i kategorin ¨ovrigt

Kategorin ¨ovrigt best˚ar dels av personer som d¨odats i fordon som inte t¨acks av kategori-erna ovan, till exempel traktorer, dels av fall d¨ar det ¨ar ok¨ant i vilken trafikantgrupp per-sonen ska h¨ora hemma. Det ¨ar d¨arf¨or sv˚art att hitta variabler som kan f¨orklara utveck-lingen av d¨odade i den h¨ar kategorin. Den b¨asta modellen ¨ar den som enbart inneh˚aller trend. N¨ar seriell Poissonregression anpassades f¨ors¨amrades prediktionsegenskaperna v¨asentligt. Det kan bero p˚a att det inte finns n˚agot tidsberoende vilket kan leda till insta-bila skattningar, eller att beroendet inte kan hanteras av den h¨ar modellen. Om man tittar p˚a residualerna finns en antydan till beroende, men m¨onstret ¨ar sv˚artytt.

Eftersom separata modeller har anpassats f¨or olika trafikantkategorier kan man j¨amf¨ora tv˚a s¨att att f¨orklara totalt antal d¨odade: antingen genom att summera resultaten fr˚an delmodellerna eller att anv¨anda modellen f¨or totalt antal d¨odade direkt. Det visar sig h¨ar att anpassningen blir i stort sett lika bra med de tv˚a metoderna, modellen f¨or totalt antal d¨odade ger dock n˚agot b¨attre v¨arden p˚a prediktionsm˚atten ¨an om man summerar delmodellerna.

4.2 Prognoser

I det h¨ar kapitlet presenteras prognoser f¨or fem ˚ar fram˚at i tiden, 2007–20111. I Figur 4.16 visas prognoser f¨or antal d¨odade d˚a samtliga f¨orklaringsvariabler antas forts¨atta f¨olja samma utveckling som de senaste fem ˚aren. I figuren visas dels prognoser som gjorts utifr˚an modellen med totalt antal d¨odade och dels summan av prognoserna f¨or alla enskilda trafikantslag, prognoserna ¨ar i stort sett lika i de tv˚a fallen. Prognoser f¨or alla modeller visas i Tabell 4.19. Prognoserna f¨or antalet d¨odade visar p˚a en ¨okning de tre n¨armaste ˚aren f¨oljt av en svag minskning.

1N¨ar prognoserna ber¨aknades fanns data f¨or 2006 tillg¨angliga f¨or alla f¨orklaringsvariabler. Samtliga

(38)

19700 1975 1980 1985 1990 1995 2000 2005 5 10 15 20 25 30 35 40 Antal dödade Observerat antal Prediktion (utan korr.)

Figur 4.15 Observerat och predikterat antal d¨odade trafikanter i kategorin ¨ovrigt. Modeller med trend som f¨orklaringsvariabel.

N¨ar man delar upp prognoserna f¨or de enskilda trafikantkategorierna ser man att det ¨ar antal d¨odade motorcyklister och mopedister som f¨orv¨antas ¨oka (Tabell 4.19). Det beror p˚a en stor ¨okning av trafikarbetet f¨or dessa fordonsslag under de senaste ˚aren och dess-utom har andelen m¨an i ˚aldern 16–24 ˚ar ¨okat vilket p˚averkar prognosen f¨or d¨odade mo-torcyklister. Antal d¨odade cykeltrafikanter f¨orv¨antas i stort sett vara konstant och ¨ovriga fordonsslag f¨orv¨antas minska under den kommande fem˚arsperioden, utifr˚an det valda scenariet vad g¨aller utvecklingen f¨or f¨orklaringsvariablerna. N¨ar det g¨aller bilister bidrar ¨okningen av str¨acka m¨otesfri v¨ag till minskningen av antal d¨odade. De senaste ˚aren har det skett en kraftig utbyggnad av fr¨amst 2+1-v¨ag, det ¨ar dock inte ett rimligt antagande att denna utbyggnad kommer att forts¨atta i samma takt fram¨over.

I Figur 4.17 och Tabell 4.20 visas prognoser under antagandet att f¨orklaringsvariablernas v¨arde ¨okar med 1 procent per ˚ar under de kommande fem ˚aren. Trenderna antas dock forts¨atta som tidigare. F¨or cykel-, g˚ang- och ¨ovriga trafikanter p˚averkas inte prognosen eftersom endast trend ing˚ar i dessa modeller. I det h¨ar fallet blir det lite st¨orre skillnad i resultat mellan de tv˚a s¨atten att g¨ora prognoser, i alla fall f¨or ˚aren 2009–2011. Generellt visar prognoserna p˚a en mer gynnsam utveckling av antal d¨odade ¨an vid ovanst˚aende scenario. Det beror p˚a att ¨okningen av de variabler som missgynnar trafiks¨akerheten inte antas ske i lika snabb takt.

(39)

1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 0 100 200 300 400 500 600 700 800 900 Antal dödade Observerat antal

Prediktion (summa av delmodeller) Prediktion (modell för total)

Figur 4.16 Observerat och predikterat antal d¨odade. Prediktionerna ¨ar ber¨aknade dels f¨or modellen av totalt antal d¨odade, dels som summan av prediktionerna fr˚an de enskilda trafikantmodellerna. F¨orklaringsvariablernas utveckling ˚ar 2007–2011 har antagits f¨olja samma utveckling som ˚ar 2001–2006.

(40)

1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 0 100 200 300 400 500 600 700 800 900 Antal dödade Observerat antal

Prediktion (summa av delmodeller) Prediktion (modell för total)

Figur 4.17 Observerat och predikterat antal d¨odade. Prediktionerna ¨ar ber¨aknade dels f¨or modellen av totalt antal d¨odade, dels som summan av prediktionerna fr˚an de enskilda trafikantmodellerna. Alla f¨orklaringsvariabler utom trend har antagits ¨oka 1 procent per ˚ar.

(41)

Tabell 4.19 Observerade v¨arden f¨or ˚ar 1990–2006 och prediktioner f¨or ˚ar 2007–2011. Modellerna baseras p˚a data fr˚an 1970 till 2006. Utvecklingen f¨or

f¨orklaringsvariablerna ˚ar 2007–2011 har antagits f¨olja samma utveckling som ˚ar 2001– 2006.

˚

Ar Alla Bilister Motor- Moped- Cykel- G ˚ang- Ovriga¨ Summa av

cyklister ister trafikanter trafikanter enskilda

kategorier 1990 772 496 46 22 68 134 6 772 1991 745 490 37 12 68 125 13 745 1992 759 485 33 17 76 138 10 759 1993 632 408 42 14 70 94 4 632 1994 545 371 31 10 46 86 2 546 1995 531 360 32 9 54 70 8 533 1996 508 327 41 14 48 75 4 509 1997 507 339 36 12 41 72 7 507 1998 492 309 40 12 55 69 7 492 1999 536 353 36 12 41 86 8 536 2000 564 391 39 10 47 73 5 565 2001 551 372 38 8 42 87 7 554 2002 532 382 37 12 37 58 6 532 2003 529 378 47 9 35 55 5 529 2004 480 302 56 18 27 67 10 480 2005 440 291 46 8 38 50 7 440 2006 445 287 55 15 26 55 7 445 2007 456 286 65 14 34 56 4 459 2008 468 277 70 15 31 51 4 448 2009 482 277 89 17 31 52 4 470 2010 478 263 107 20 29 47 4 470 2011 474 247 116 24 27 43 3 460

Tabell 4.20 Predikterade v¨arden f¨or ˚ar 2007–2011. Modellerna baseras p˚a data fr˚an 1970 till 2006. Alla f¨orklaringsvariabler utom trend har antagits ¨oka 1 procent per ˚ar.

˚

Ar Alla Bilister Motor- Moped- Cykel- G ˚ang- Ovriga¨ Summa av

cyklister ister trafikanter trafikanter enskilda

kategorier 2007 440 287 60 12 34 56 4 453 2008 436 281 59 12 31 51 4 437 2009 431 285 68 11 31 52 4 451 2010 409 277 73 10 29 47 4 440 2011 387 268 71 10 27 43 3 422

(42)

5

Diskussion

Resultaten visar att man i flera fall f¨orb¨attrar anpassningen av modellerna om man tar h¨ansyn till att det finns seriell korrelation i serierna. Speciellt tydligt ¨ar f¨orb¨attringen n¨ar det g¨aller totalt antal d¨odade och bilister, men anpassningen f¨orb¨attras ocks˚a f¨or motorcyklister, cyklister och g˚angtrafikanter. Det tyder dels p˚a att det fattas viktiga f¨orklaringsvariabler i modellerna som ger upphov till korrelation, dels att detta i viss m˚an kan kompenseras f¨or med den f¨oreslagna metoden.

Ett problem med den seriella Poissonregressionen ¨ar att de skattningsmetoder som finns inte ¨ar tillr¨ackligt bra. I en tidigare simuleringsstudie (Forsman, 2008) har vi bland annat sett att standardavvikelsen f¨or de skattade regressionskoefficienterna underskattas och att man d¨armed alltf¨or ofta f¨orkastar hypotesen att koefficienterna ¨ar lika med noll. Det kan i sin tur leda till en ¨overanpassning av modellerna f¨or att man tar med f¨or m˚anga f¨orklaringsvariabler. Det ¨ar ocks˚a stor variation i skattningarna vilket inneb¨ar att felet i enskilda skattningar kan bli stort. Det ¨ar d¨arf¨or viktigt att hitta b¨attre skattningsmetoder. Totalt sett verkar metoden ¨and˚a fungera bra som prognosmodell om den anv¨ands som komplement till traditionell Poissonregression som i den h¨ar rapporten. Innan metoden anv¨ands i st¨orre skala b¨or man studera om det kan vara s˚a att fel i skattningar av enskilda parametrar inte har s˚a stor betydelse f¨or ber¨aknade prognoser.

Variabeln totalt antal d¨odade delades upp i olika trafikantkategorier och separata mod-eller anpassades till varje kategori. Detta gjordes eftersom olika kategorier ber¨ors av olika f¨orklaringsvariabler och individuellt anpassade modeller skulle d¨arf¨or kunna ge b¨attre resultat totalt. Sedan fanns ocks˚a ett intresse av att f¨olja de olika kategorierna var f¨or sig. Det visade sig dock att anpassningen av totalt antal d¨odade inte blev b¨attre om man f¨orst delade in dessa i trafikantkategorier, utan metoderna var likv¨ardiga. Prog-noserna blev ocks˚a relativt lika oavsett om man f¨orst delade upp materialet eller anv¨ande totalmodellen. Detta beror dock p˚a vilka antaganden man g¨or om framtida v¨arden p˚a f¨orklaringsvariablerna och det kan d¨armed se annorlunda ut med andra antaganden. Det ¨ar ocks˚a en f¨ordel att kunna f¨olja en trafikantkategori i taget. D˚a kan man uppt¨acka om en viss kategori ¨okar eller minskar mer ¨an andra och d¨armed anpassa vilka ˚atg¨arder som s¨atts in.

Det ¨ar viktigt att p˚apeka att sambandet mellan f¨orklaringsvariablerna och antal d¨odade endast p˚avisar att variablerna samvarierar vilket inte beh¨over betyda att det finns kausala samband. Modellernas slutliga utseende beror ju bland annat p˚a vilka potentiella f¨orklarings-variabler som valts ut. Saknas viktiga f¨orklaringsf¨orklarings-variabler kan andra f¨orklarings-variabler som sam-varierar med dessa komma med i modellen fast inget kausalt samband finns. Till exem-pel ing˚ar inga direkta trafiks¨akerhets˚atg¨ader f¨orutom str¨acka m¨otesfri v¨ag. Resten av ˚atg¨arderna finns med indirekt i trendvariabeln. En variabel man kan t¨anka sig att l¨agga till i samtliga kategorier ¨ar totalt trafikarbete. N¨ar det g¨aller till exempel motorcyklister har endast dess trafikarbete tagits med, men antal d¨odade motorcyklister b¨or ju ocks˚a p˚averkas av det totala trafikarbetet. Det ¨ar n˚agot man kan testa f¨or att se om modeller-na kan f¨orb¨attras ytterligare. Dock har BNP, som ¨ar relativt starkt korrelerad med det totala trafikarbetet, tagits med som potentiell f¨orklaringsvariabel i samtliga kategorier. Om denna variabel kommit med i modellen eller inte kan ses som en indikation p˚a om det totala trafikarbetet ¨ar viktigt.

F¨orklaringsvariablerna har sattas in i modellerna i sin ursprungliga form, men det ¨ar inte s¨akert att det ¨ar det b¨asta sambandet mellan variabeln och antal d¨odade. Man kan ocks˚a testa att till exempel logaritmera variablerna och se om det ger b¨attre resultat.

Figure

Tabell 2.1 Simulerad riskniv˚a f¨or test av hypotesen H 0 : β 1 = 0. Den latenta pro- pro-cessens autokorrelation av ordning 1, ρ  (1), antar v¨ardena 0,5, 0 och -0,5
Tabell 3.1 Potentiella f¨orklaringsvariabler efter trafikantkategori.
Tabell 4.1 Parameterskattningar f¨or modeller av totalt antal d¨odade personer.
Figur 4.2 Observerat och predikterat antal d¨odade personer i v¨agtrafikolyckor. Mod- Mod-ell med trend, totalt trafikarbete, tillskott av bilar och BNP
+7

References

Related documents

L˚ at y(t) vara andelen av populationen som ¨ar smittad efter tiden t dygn, r¨aknad fr˚ an uppt¨ack- ten... Observera att ¨amnets koncentration ¨ar samma som m¨angden av

Rutinen som anv¨ands f¨ or att definiera operatorn, kan ha antingen ett eller tv˚ a argument, men eftersom funktionen normalt definieras i samma modul som inneh˚

Det ¨ar denna typ av f¨ordelningskonvergens som dyker upp i Centrala Gr¨ans- v¨ardessatsen2. Karakt¨aristiska funktioner kan ocks˚ a anv¨andas f¨or att

Man kan ibland l¨ asa att h¨ alften av alla som drunknat till sj¨ oss har druckit alkohol. L˚ at oss anta att det

Till exempel fick jag inte med n˚ agot Ljus- och Optikland i f¨ orsta f¨ ors¨ oket, och pilen mot Kosmologi, som ligger utanf¨ or den h¨ ar kartan, borde peka mer upp˚ at,

Material i grupp II och III har ocks˚ a h¨ og kompressibilitet f¨ or att de har dels kovalent bindning, dels metallisk bindning, vilket leder till kovalenta kristaller som har ¨

Det enklaste t¨ ankbara s¨ attet att h¨ arleda hela kapaciteten skulle vara att anta att alla N atomer i en kristall har samma vibrationsfrekvens, och sedan helt enkelt

Resonemang, inf¨ orda beteck- ningar och utr¨ akningar f˚ ar inte vara s˚ a knapph¨ andigt presenterade att de blir sv˚ ara att f¨ olja.. ¨ Aven endast delvis l¨ osta problem kan