• No results found

Modellering av färdsättsval för anslutningsresor i regioner med flera flygplatser

N/A
N/A
Protected

Academic year: 2022

Share "Modellering av färdsättsval för anslutningsresor i regioner med flera flygplatser"

Copied!
60
0
0

Loading.... (view fulltext now)

Full text

(1)

INOM

EXAMENSARBETE SAMHÄLLSBYGGNAD,

AVANCERAD NIVÅ, 30 HP STOCKHOLM SVERIGE 2020,

Modellering av färdsättsval för anslutningsresor i regioner med flera flygplatser

AXEL ERICSSON

KTH

SKOLAN FÖR ARKITEKTUR OCH SAMHÄLLSBYGGNAD

rot

ARN_Bil_par k

ARN_Bil_skjuts ARN_T

axi ARN_

SL

ARN_

SL_e xkl_pendel ARN_

Flygbussar na

ARN_

Arlanda_Expr ess BMA_Bil_par

k

BMA_Bil_skjutsBM A_Taxi

BMA_SL BMA_Flygbussar

na

(2)
(3)

i

Förord

Examensarbetet du har framför dig har varit det avslutande momentet av min

civilingenjörsutbildning inom samhällsbyggnad, inriktad mot trafik- och transportplanering. Arbetet har utförts vid Kungliga Tekniska högskolan och motsvarar 30 högskolepoäng.

Här vill jag först och främst rikta ett varmt tack till min externa handledare Svante Berglund på WSP.

Svante har guidat mig under arbetet och varit till stor hjälp med problemformulering, erfarenhet och tillhandahållning av data. Jag vill tacka min handledare tillika examinator, Albania ”Bibbi” Nissan.

Bibbi har varit generös med sina kontakter under hela studietiden och hon engagerar sig alltid för studenternas bästa. Jag vill även tacka min opponent Signe Eresund och avslutningsvis mina nära och kära. Ingen nämnd, ingen glömd!

Stockholm, 2 juni 2020 Axel Ericsson

(4)

ii

Sammanfattning

En svaghet med Trafikverkets modell för modellering av långväga resor är att den endast tillåter ett färdsätt per resa. En långväga resa innehåller i regel fler än ett färdsätt, men den nuvarande modellen möjliggör inte modellering av exempelvis en flygresa med anslutande bil-, buss- eller tågresa. Det är problematiskt då en betydande del av reseuppoffringen kan härledas till en anslutande resa.

Examensarbetet har ägnats åt att studera hur en modell för val av anslutande färdsätt samt

avreseflygplats kan utformas. Arbetet har avgränsats till att endast studera och modellera resor som påbörjas i Stockholms län, genomförda av folkbokförda inom länet. Flygplatsvalet har avgränsats till Arlanda och Bromma flygplats.

I en litteraturstudie presenteras den matematiska teori som har använts vid modellering. Teorin härstammar från Daniel McFaddens arbete med modellering av diskreta val, vilket senare har sammanfattats och vidareutvecklats av Kenneth Train. Genom att studera tidigare forskning som behandlar modellering av anslutande färdsätt dras slutsatsen att det inte finns något uppenbart angreppsätt gällande modellutformning, utöver att använda någon variant av en logitmodell.

De observationer som modellen är skattad på är resvaneundersökningsdata från 2011–2016. En kostnadsuppskattning för färdsätten som är inkluderade i modellen har gjorts manuellt. Restider har genererats med Trafikverkets regionala basmodell för Stockholms län från 2014 i

makrosimuleringsmjukvaran Emme.

Av samtliga skattade modeller presenteras en modell som den bästa och slutgiltiga. Det är en multinomial logitmodell uppdelad i två segment, ett för tjänsteresenärer och ett för privatresenärer.

Modellen analyseras genom att beräkna restidsvärden, pris- och tidselasticitet för de valbara alternativen i modellen. För några av alternativen är restidsvärdena förhållandevis höga, vilket adresseras i den avslutande diskussionen.

Nyckelord: anslutningsresa, långväga resa, flygplatsval.

(5)

iii

Abstract

A weakness with the Swedish Transport Administration’s model for long-distance trips is that it only allows for one mode of transportation per trip. A long-distance trip usually consists of several modes of transportation, while the current model does not allow modelling of, for example, a flight with a connecting car, bus or train transfer. This is problematic as a significant part of the generalized cost of travel can be derived from an access trip.

The master thesis has been devoted to studying how a model for choice of access mode and

departure airport can be designed. The work has been limited to study long-distance trips starting in Stockholm county, carried out by residents of the county. The airport choice has been limited to Arlanda and Bromma Airport.

In a literature review, the underlying mathematical theories which the project is based on are presented. The theory originates from the work on discrete choice models by Daniel McFadden, which later was further developed and summarized by Kenneth Train. By studying previous research dealing with modelling of access mode and airport choice, it can be concluded that there is no obvious approach to model design, apart from the fact that the model should be based on the logit theory.

The observations on which the model is estimated are retrieved from travel surveys conducted during 2011-2016. A cost estimate for the modes of travel included in the model has been done manually. Travel times for all modes have been generated using the Swedish Transport

Administration’s regional base model for Stockholm County dated 2014, using the macro simulation software Emme.

Out of all the estimated models, one model is presented as the best and final one. It is a multinomial logit model divided into two segments, one for business travelers and one for private travelers. The model is analyzed by calculating value of time, cost- and time elasticity for each of the alternatives in the choice set. For some of the alternatives, the value of time is relatively high, which is addressed in the concluding discussion.

Keywords: access trip, long-distance trip, airport choice.

(6)

iv

Innehållsförteckning

1 Inledning ... 2

1.1 Bakgrund ... 2

1.2 Mål ... 3

1.3 Avgränsningar ... 3

1.4 Disposition ... 3

2 Litteraturstudie ... 4

2.1 Teori ... 4

2.1.1 Egenskaper för modeller för diskreta val ... 4

2.1.2 Multinomial logit ... 6

2.1.3 Nestad logit ... 8

2.1.4 Skattning ... 10

2.1.5 Tolkning av resultat ... 10

2.2 Tidigare forskning ... 11

2.2.1 Sammanställande studie över tidigare modellansatser ... 11

2.2.2 Modellering av flygplats-, flygbolags- och anslutningsreseval ... 12

2.2.3 Sammanslagen modellering av efterfrågan, färdsätt och anslutningsresa ... 12

2.2.4 Den nederländska modellen... 14

2.2.5 Kombinerat flygplats- och anslutningsfärdsättsval i New York ... 16

2.3 Slutsatser från litteraturstudie ... 17

3 Metod ... 18

3.1 Forskningsstrategi ... 18

3.2 Datainsamling ... 18

3.3 Metodval för databearbetning ... 18

3.3.1 Resvaneundersökningar ... 19

3.3.2 Restidsgenerering ... 19

4 Deskriptiv analys ... 20

4.1 Introduktion... 20

4.1.1 Resornas struktur ... 20

4.2 Beskrivning av data ... 20

4.2.1 Generell beskrivning ... 20

4.2.2 Antaganden ... 20

4.2.3 Lägesbeskrivning ... 21

5 Modell ... 25

5.1 Valbara alternativ ... 25

5.2 Modellstruktur ... 25

5.3 Variabler ... 26

(7)

v

5.4 Segmentering ... 28

5.5 Indata ... 28

5.5.1 Restidsgenerering personbil ... 28

5.5.2 Restidsgenerering kollektivtrafik ... 29

5.5.3 Kostnadsuppskattning ... 31

5.6 Skattningsprocess ... 33

5.6.1 Tidsparametrar ... 33

5.6.2 Kostnadsparametrar ... 33

5.6.3 Kontrollvärden ... 33

5.6.4 Elasticitet ... 34

5.6.5 Borttagen avstigningsavgift ... 34

6 Resultat ... 35

6.1 Slutgiltig modell ... 35

6.1.1 Tjänsteresemodell ... 35

6.1.2 Privatresemodell ... 37

6.1.3 Priselasticitet ... 39

6.1.4 Tidselasticitet ... 40

6.1.5 Borttagen avstigningsavgift ... 41

6.2 Beprövade men icke-gynnsamma alternativ ... 41

6.2.1 Nestning... 41

6.2.2 Inkomstsegmentering ... 42

6.2.3 Bortavarosegmentering ... 42

6.2.4 Kostnadsparametrar beroende på inkomstgrupp ... 42

7 Analys ... 43

7.1 Insignifikans ... 43

7.2 Restidsvärden ... 43

7.3 Parameterjämförelse ... 44

7.4 Likelihood-ratio-index ... 44

7.5 Priselasticitet ... 44

7.6 Tidselasticitet... 44

7.7 Borttagen avstigningsavgift ... 44

8 Diskussion ... 46

9 Litteraturförteckning ... 47

Bilaga A ... 49

(8)

2

1 Inledning

1.1 Bakgrund

I syfte att kunna förutspå framtidens transportbehov arbetar Trafikverket regelbundet med att ta fram trafikprognoser för kommande år. Detta görs genom att använda Samperssystemet,

hädanefter Sampers. Sampers är ett system som enkelt kan förklaras genom att beskriva

uppbygganden som består av tre huvudsakliga delar. En efterfrågemodell som beräknar efterfrågan på olika typer av resor, en nätverksutläggning som görs med hjälp av mjukvaran Emme samt en effektbedömning som beräknar de samhällsekonomiska effekterna av prognosen.

Sampers är det system som den statliga myndigheten Trafikverket använder för att modellera långväga nationella och regionala resor. I Sampers modelleras endast personresor, godsresor modelleras på annat ställe men tas givetvis med i helhetsbedömningar.

Efterfrågemodellen baseras på resvaneundersökningar där ett större urval tillfrågas om deras resmönster och deras svar sammanställs därefter till en databas. Databasen används som underlag för en modellskattning. Slutprodukten av modellskattningen är en färdig efterfrågemodell som beskriver befolkningens resande, uppdelat på start- och slutpunkt samt färdsätt, baserat på ett givet utbud av resmöjligheter.

En svaghet med modellen är att modellen är uppbyggd på ett sådant sätt det inte är möjligt att modellera långväga resor som genomförs mer fler än ett färdsätt. I praktiken är det inte möjligt att modellera en flygresa med anslutande bil-, buss- eller tågresa. Trafikverket har valt att hantera detta genom att utanför Sampers generera trafik motsvarande de uteblivna anslutningsresorna. Dessa resor läggs sedan till som extra efterfrågan till och från exempelvis flygplatser för att

nätverksutläggningen ska vara så nära verkliga förhållanden som möjligt (Trafikverket, 2015).

Bakgrunden till att Sampers idag bara modellerar långväga resor med ett färdsätt är flera. Att

modellera en bil-, gång- eller cykelresa är oproblematiskt då den totala tids- och kostnadsåtgången är förhållandevis enkel att beräkna. Anslutningsresor involverar ett ytterligare färdsätt utöver

huvudfärdsättet, vilket medför komplexitet då en anslutningsresa har separata tidsparametrar jämfört med huvudfärdsättet.

Regionala resor som sker med kollektivtrafik är lättare att modellera, trots att dessa ofta involverar flera färdsätt. Till exempel, en pendeltågsresa med anslutande buss. Skillnaden mellan de regionala kollektivtrafikresorna och de långväga resorna med anslutande färdsätt är att de förstnämnda i regel utgörs inom samma taxesystem, vilket förenklar modelleringen.

Konsekvenserna av att långväga resor endast modelleras med ett färdsätt är huvudsakligen att den reseuppoffring som resenären gör inte är resans totala, då uppoffringen för anslutningsresan inte ingår. Resenären i modellen som väljer att genomföra en resa som kräver anslutning behöver inte göra en lika stor uppoffring som resenären i verkligheten. Detta är problematiskt då en betydande del av den totala reseuppoffringen kan härledas till anslutningsresan (Kristoffersson & Berglund, 2020).

Det är önskvärt att studera hur anslutningsresor kan modelleras i Sampers då den totala

reseuppoffringen är nödvändig att inkludera i modellen för att nå en så korrekt representation av verkligheten som möjligt. En samhällstrend som förstärker problemet är att priset på långväga resor har blivit lägre. Lågprisflygets entré och slutet på det statliga järnvägsmonopolet är de två

huvudsakliga anledningarna till att priset på långväga resor har gått ned medan kostnaden för

(9)

3

anslutningsresor inte har fallit på samma sätt, vilket följaktligen bidrar till att reseuppoffringen för en anslutningsresa utgör en större andel av den totala reseuppoffringen idag än vad den har gjort de senaste årtiondena (Kristoffersson & Berglund, 2020).

1.2 Mål

Syftet och målet med examensarbetet är att ta fram en modell som ska kunna användas för att modellera val av avreseflygplats samt anslutande färdsätt för långväga personresor där

huvudfärdsättet är flyg.

1.3 Avgränsningar

Arbetet har avgränsats till att endast studera resor som påbörjas inom Stockholms län, genomförda av folkbokförda inom länet. Flygplatsvalet har avgränsats till Arlanda och Bromma flygplats.

Avgränsningen är satt med hänsyn till vad som är rimligt i omfattning för ett examensarbete.

1.4 Disposition

Rapportens huvuddel inleds med en litteraturstudie som består av två delar. Den första delen innehåller en beskrivning av den underliggande matematiska teorin och den andra delen en sammanställning av tidigare forskning och erfarenheter som kan vara till nytta. En läsare med erfarenhet av logitmodellering kan med fördel avstå att läsa den förstnämnda delen av

litteraturstudien, 2.1 Teori. Efter litteraturstudien följer en metod-del där arbetssättet presenteras.

Erhållna data har sammanställts för att beskriva nuläget, vilket görs i en deskriptiv analys. Vidare följer ett kapitel som kompletterar metoden med ingående information om hur själva modellen är uppbyggd. Avslutningsvis följer resultat, analys och diskussion.

(10)

4

2 Litteraturstudie

I den här delen av rapporten studeras tidigare forskning relevant för examensarbetet. Under rubrik 2.1 Teori är avsikten att beskriva de matematiska teorier som projektet baseras på. Under

2.2 Tidigare forskning är målet att studera hur valet av flygplats och anslutande färdsätt har

modellerats utomlands i syfte att få en känsla för vad som har gjorts tidigare och om det finns något lämpligt angreppssätt för modelluppbyggnad.

2.1 Teori

De matematiska modeller som kommer att användas för att modellera efterfrågan på anslutningsresor bygger på arbetet av Daniel McFadden (McFadden, 1974). Arbetet har sammanfattats väl och vidareutvecklats i boken ”Discrete Choice Methods with Simulation” av Kenneth Train (Train, 2009). I den här delen av litteraturstudien kommer de delar av McFaddens och Trains arbete som utnyttjats att presenteras.

2.1.1 Egenskaper för modeller för diskreta val

Modellering av diskreta val är en generell metod som är tillämpbar i många olika sammanhang när ambitionen är att förutse hur individer kan tänkas agera i specifika situationer. De metoder som beskrivs i boken av Train kräver vissa förutsättningar för att vara tillämpbara. En av de mest centrala delarna av en modell är dess ”choice set”, enkelt översatt till ”urval av valbara alternativ”.

De valbara alternativen behöver uppfylla tre grundläggande kriterier. Till att börja med så får bara ett av alternativen bli valt. Det går inte att välja fler alternativ, och det går inte heller att avstå från att välja ett av alternativen. I vissa fall kan en tillfrågad ha svårt att välja mellan två alternativ. I dessa fall går det att kringgå begränsningen genom att justera de valbara alternativen. Om frågeställningen är

”Hur vill du krydda din mat?” och alternativen är ”salt” och ”peppar” men en kombination av dessa två kryddor önskas alternativt ingen så kan alternativen justeras till ”bara salt”, ”bara peppar”, ”både salt och peppar” och ”varken salt eller peppar”. Genom att ställa upp alternativen på detta sätt är det första kriteriet fortfarande uppfyllt.

Det andra kriteriet är att urvalet av valbara alternativ måste vara uttömmande. Detta innebär att samtliga valbara alternativ ska finnas inkluderade i urvalet. I fall där det reella antalet val är fler till antalet än vad som önskas ha inkluderat i modellen är det möjligt att kringgå detta. Exempelvis kan valet av favoritfärg förenklas genom att avgränsa antalet möjliga val från alla tänkbara färger till

”röd”, ”blå”, ”gul” samt ”övriga färger”. På ett sådant sätt är kraven nu uppfyllda.

Avslutningsvis så är det sista kriteriet att antalet val måste vara ändligt. Train menar att detta är något som är karakteristiskt för just modellering av diskreta val och att det är en av de saker som skiljer typen av modeller från andra modeller. Kriteriet är relativt enkelt att uppnå. I boken tas ett exempel upp där frågan är hur många fordon som finns i ett hushåll. I ett sådant fall är det enkelt att uppfylla kriteriet genom att använda exempelvis ”0”, ”1”, ”2” och ”fler än 2” som alternativ.

Sannolikheten att ett specifikt val görs enligt en modell för diskreta val kan härledas till ett

grundläggande antagande som Train presenterar tidigt i sin bok (Train s. 14). Antagandet är att varje individ strävar efter att maximera sin nytta – alltså att göra det val som är så fördelaktigt för

individen som möjligt. Modeller som bygger på detta antagande hänvisas i regel till som ”random utility models”. De bygger på att en beslutsfattare har ett urval av valbara alternativ framför sig. Till varje möjligt alternativ associerar beslutsfattaren en nytta. Enligt antagandet kommer

beslutsfattaren välja det alternativ som associeras med den högsta nyttan. Nyttan betecknas 𝑈 efter engelskans ”utility” och bestäms av den nytta som individ 𝑛 associerar med valet 𝑗. Nyttan som

(11)

5

individ 𝑛 associerar med valet 𝑗 betecknas således som 𝑈𝑛𝑗, 𝑗 = 1, … , 𝐽, där 𝐽 är det sista valbara alternativet.

Enligt teorin är den totala nyttan känd av individen, men inte av modellskaparen. Dock känner forskaren till några attribut till associerade med respektive möjligt alternativ. Dessa betecknas med 𝑥𝑛𝑗 ∀𝑗 och kan användas till att ställa upp en funktion som beskriver den delen av nyttan som observerades av modellskaparen och därmed kan förklaras. Till skillnad från den totala nyttan 𝑈, är den observerade nyttan känd som 𝑉. Funktionen som beskriver nyttan kan skrivas som 𝑉𝑛𝑗 = 𝑉(𝑥𝑛𝑗, 𝑠𝑛) ∀𝑗 och representerar den beräknade nyttan. Vidare så finns det komponenter som inte kan observeras. Dessa aggregeras till en slumpterm, eller ”icke observerbar del av nyttan”, och betecknas med 𝜀𝑛𝑗. Den totala nyttan 𝑈 kan således beskrivas som 𝑈𝑛𝑗= 𝑉𝑛𝑗+ 𝜀𝑛𝑗.

Sannolikheten att en beslutsfattare väljer alternativet 𝑖 före ett annat alternativ 𝑗 kan enligt teorin beskrivas enligt

𝑃𝑛𝑖 = 𝑃𝑟𝑜𝑏(𝑈𝑛𝑖> 𝑈𝑛𝑗 ∀𝑗 ≠ 𝑖)

= 𝑃𝑟𝑜𝑏(𝑉𝑛𝑖+ 𝜀𝑛𝑖 > 𝑉𝑛𝑗+ 𝜀𝑛𝑗 ∀𝑗 ≠ 𝑖)

= 𝑃𝑟𝑜𝑏(𝜀𝑛𝑗− 𝜀𝑛𝑖< 𝑉𝑛𝑖− 𝑉𝑛𝑗 ∀𝑗 ≠ 𝑖)

I praktiken innebär detta att sannolikheten för alternativ 𝑖 är den samma som sannolikheten att skillnaden mellan de observerbara faktorerna är större än skillnaden mellan de icke-observerbara, med villkoret att det är nyttan för alternativ 𝑖 som är den större av de två. Då sannolikheten representeras av en kumulativ fördelningsfunktion kan 𝑃𝑛𝑖 omskrivas till integralen

𝑃𝑛𝑖= ∫ 𝐼(𝜀𝑛𝑗− 𝜀𝑛𝑖 < 𝑉𝑛𝑖− 𝑉𝑛𝑗 ∀𝑗 ≠ 𝑖)

𝜀

𝑓(𝜀𝑛)𝑑𝜀𝑛

där 𝐼 är en indikatorfunktion som blir 1 när uttrycket i parentesen är uppfyllt och 0 när det inte är uppfyllt. För modellerna ”multinomial logit” respektive ”nestad logit”, som kommer att presenteras under rubrikerna 2.1.2 respektive 2.1.3, görs antaganden för fördelningen för 𝑓(𝜀𝑛). De båda modellerna har slutna uttryck för integralen. För multinomial logit antas det att den icke-

observerbara slumptermen är oberoende likafördelad och för nestad logit antas det att funktionen följer den generella extremvärdesfördelningen (GEV). Hur stor del av den totala nyttan som utgörs av icke-observerbara komponenter beror på hur väl specificerad modellen är. En bra modell som har lyckats fånga in en stor del av den totala nyttan genom observerbara variabler har hög tillförlitlighet och kan förutsäga individers val på ett tillfredställande sätt.

En sak som de olika typerna av modeller har gemensamt är att det är skillnaden på de beräknade nyttorna som spelar någon roll, inte värdet på nyttorna i sig. Att addera en konstant till respektive alternativ i urvalet av valbara alternativ har således ingen effekt på sannolikheten att respektive alternativ väljs, det är bara skillnaden i nytta som påverkar.

Nyttofunktionerna som används vid modellering är vanligtvis linjära funktioner. För varje valbart alternativ finns det i regel variabler med en parameter, samt en konstant som är specifik för

respektive alternativ. Konstanten brukar kallas för alternativspecifik konstant (ASC) och syftet är att den ska fånga upp snittnytta för ett specifikt alternativ som inte är inkluderat i de övriga

parametrarna. På detta sätt påminner konstanten om konstanten i en linjär regressionsmodell.

Vidare så är värdet på konstanten sådant att medelvärdet av den icke-observerbara delen är noll.

(12)

6

När konstanter väl är inkluderade för samtliga nyttofunktioner är det praxis att normalisera dessa så att en av dem blir noll. Som tidigare nämnt är det endast skillnaden i nytta mellan de valbara

alternativen som påverkas och inte det absoluta värdet. Konstanten ska tolkas som en representation av den relativa skillnaden mellan två alternativ. I praktiken innebär detta att ett alternativ inte kommer att ha någon konstant (Train, 2009).

2.1.2 Multinomial logit

Den första modellen Train presenterar i sin bok är den klassiska logitmodellen, som enligt honom själv är det enklaste och mest använda verktyget för att modellera diskreta val. I examensarbetet kommer den vanliga logitmodellen att hänvisas till som den ”multinomial logitmodellen”, vilket är en korrekt benämning, i syfte att särskilja modellen från den nestade logitmodellen. Det som är unikt för den multinomiala logitmodellen, och som också är ett krav för att den ska vara godtagbar som modell, är hur fördelningen för slumptermerna antas vara. För den multinomiala logitmodellen gäller att de är oberoende och likafördelade. Fördelningen följer en Gumbel-fördelning med variansen 𝜋2/6. Täthetsfunktionen för respektive slumpterm är

𝑓(𝜀𝑛𝑗) = 𝑒−𝜀𝑛𝑗𝑒−𝑒−𝜀𝑛𝑗 och den kumulativa fördelningsfunktionen är

𝐹(𝜀𝑛𝑗) = 𝑒−𝑒−𝜀𝑛𝑗

Train lyfter fram att medelvärdet för slumptermerna är inte noll, men att det inte påverkar modellen då det är skillnaden mellan slumptermer som är intressant att studera, och medelvärdet för

skillnaderna är noll per definition.

Under rubrik 2.1.1 nämndes det att sannolikheten för att alternativ 𝑖 väljs beror på om den observerbara nyttan är stor nog relativt andra alternativ, samt att de observerbara faktorerna inte utgör en för stor relativ skillnad, se formel nedan.

𝑃𝑛𝑖 = 𝑃𝑟𝑜𝑏(𝜀𝑛𝑗− 𝜀𝑛𝑖 < 𝑉𝑛𝑖− 𝑉𝑛𝑗 ∀𝑗 ≠ 𝑖)

Vidare kan det matematiska uttrycket utvecklas, givet att slumptermen 𝜀 är oberoende. Train härleder följande slutna uttryck som beskriver sannolikheten att individ 𝑛 väljer alternativ 𝑖 givet det totala antalet val 𝑗

𝑃𝑛𝑖 = 𝑒𝑉𝑛𝑖

∑ 𝑒𝑗 𝑉𝑛𝑗

𝑃𝑛𝑖 är per definition ett värde mellan 0 och 1, likt en normal sannolikhet. Om den observerbara nyttan 𝑉𝑛𝑖 för ett alternativ 𝑖 ökar kraftigt kommer sannolikheten att det alternativet väljs

konvergera mot ett, allt annat lika. Ett liknande scenario uppstår om nyttan sjunker och alternativets sannolikhet konvergerar mot 0. 𝑃𝑛𝑖 har dock ingen möjlighet att någonsin nå hela vägen till 1 eller 0.

Train lyfter fram att om sannolikheten för att ett alternativ är 0 och det därmed aldrig blir valt, ska detta alternativ inte inkluderas i urvalet av valbara alternativ. Förändringen i sannolikhet givet en förändring är som störst när sannolikheten för det alternativet är 0,5 då logit-kurvan är som brantast vid den punkten. Följaktligen är effekten av att förbättra ett dåligt- respektive bra alternativ relativt liten, då kurvan är förhållandevis flack se Figur 1.

(13)

7

Figur 1: Logit-kurvan (Train, 2009).

Syftet med kommande stycken är att belysa styrkor och svagheter med den multinomiala

logitmodellen. En styrka med den multinomiala logitmodellen är att den kan hantera individuella preferenser, givet att de går att relatera till den observerade delen av nyttan och därmed går att förklara. Ett exempel kan vara att en kostnad värderas olika av olika individer beroende på deras månadsinkomst. Ett sätt att inkludera preferenser likt denna är att justera kostnadsparametern från ett konstant värde till en konstant dividerat med, exempelvis, månadsinkomst. I exemplet skapas ett linjärt samband mellan månadsinkomst och känslighet för kostnad, men det går även att skapa ett kvadratiskt samband med exempelvis en avtagande kurva genom att använda en kvadratisk funktion.

Slumpmässig variation går inte att inkludera i modellen då den inte är observerbar och därmed räknas till slumptermen.

Ytterligare en egenskap som kännetecknar den multinomiala logitmodellen är dess ”IIA”

(independence of irrelevant alternatives), vilket betyder att ett urval av alternativ är oberoende från irrelevanta alternativ. I praktiken innebär det här att förhållandet mellan två beräknade

sannolikheter alltid kommer att vara det samma oavsett vilka andra möjliga val som finns tillgängliga.

Train lyfter fram att IIA är en realistisk egenskap i viss bemärkelse men orealistisk i andra. Ett känt problem med IIA illustreras tydligt av det scenario som kallas för ”röd buss-blå buss-problemet”, som nedan följer i korthet.

Till en början består urvalet av valbara alternativ av två olika sätt att resa. Alternativen är att resa med personbil eller röd buss. Sannolikheten är 0,5 för de båda alternativen. I ett nytt scenario introduceras ett tredje alternativ, blå buss. Den röda bussen har exakt samma egenskaper som den blå, bortsett från färgen. Restid, kostnad, etc. är samma för de båda bussarna. Enligt IIA måste sannolikheten att personbil och röd buss väljs vara lika stor, eftersom förhållandet i sannolikhet måste vara det samma oberoende antalet alternativ. Eftersom den röda bussen och den blå bussen är identiska alternativ måste även dessa ha exakt samma sannolikhet. Detta innebär i praktiken att 𝑃𝑝𝑏= 𝑃𝑟𝑏= 𝑃𝑏𝑏 =1

3. I verkliga livet är det osannolikt att andelen personbilsresenärer skulle minska till förmån för ett buss-alternativ givet nämnt scenario, men enligt IIA är så fallet. Detta är det vanligaste exemplet på en nackdel med IIA.

Dock är inte IIA enbart något negativt. Det finns en styrka i att förhållandet mellan ett antal alternativ alltid är det samma, oavsett vilket urval som görs. I en situation där en modellskapare arbetar med ett stort urval av valbara alternativ men bara är intresserad av ett fåtal av dem går det att skatta en modell utifrån ett önskat antal. Ett exempel skulle kunna vara antalet sätt att köra bil från A till B, vilket skulle kunna vara i princip oändligt många. I en sådan situation skulle det vara praktiskt att kunna välja ut de mest frekvent använda rutterna och studera förhållandet mellan deras nyttor och sannolikheter att bli valda (Train, 2009).

(14)

8 2.1.3 Nestad logit

I situationer när det inte går att specificera parametrar som fångar upp all korrelation mellan alternativ som finns i den icke-observerbara nyttan håller inte IIA-principen mellan de olika

alternativen och det är inte längre möjligt att tillämpa en multinomial logitmodell. Ett alternativ är då att tillämpa någon form av modell som utgår från att den icke-observerbara nyttan följer en generell extremvärdesfördelning (GEV). Modeller som uppfyller detta krav kallas för GEV-modeller och det finns ett relativt stort antal modeller inom kategorin. Den stora fördelen med modeller inom GEV- kategorin är att de tillåter korrelationer i den icke-observerbara delen av nyttan. Train belyser det faktum att det är endast en liten andel av möjliga GEV-modeller som någonsin har tillämpats, vilket innebär att det kan finnas stor potential i att forska i hur olika varianter av GEV-modeller skulle kunna tillämpas. Nestad logit är den modell som är den mest frekvent använda GEV-modellen, och i den här delen av litteraturstudien kommer Trains sammanställning av den nestade logitmodellen att

presenteras.

Grundtanken med en nestad logit-modell är att dela upp det möjliga urvalet av alternativ i två eller fler kategorier, med syftet att gruppera de alternativ som korrelerar med varandra. Då den nestade logitmodellen tillåter viss korrelation så innebär detta att modellen som helhet inte måste uppfylla IIA-principen, dock krävs det att principen är uppfylld inom respektive neste.

Sannolikheten att ett alternativ väljs beräknas med en ansats likt den som används i den

multinomiala logitmodellen. Även här antas det att individer strävar efter att maximera sin nytta.

Train lyfter fram tre studier av Daly och Zachary (1978), McFadden (1978) och Williams (1977) som oberoende av varandra har undersökt om den nestade logitmodellen är kompatibel med antagandet om nyttomaximering och de har alla kommit till slutsatsen att den är kompatibel, givet vissa

förutsättningar.

Nyttofunktionen ser ut som tidigare, 𝑈𝑛𝑗= 𝑉𝑛𝑗+ 𝜀𝑛𝑗, med skillnaden att 𝜀𝑛𝑗 har en annan innebörd än tidigare. I det här fallet antas 𝜀𝑛𝑗 följa den kumulativa GEV-fördelningen där 𝐾 är antalet nesten sådant att

𝐹(𝜀𝑛𝑗) = 𝑒𝑥𝑝 (− ∑ ( ∑ 𝑒−𝜀𝑛𝑗/𝜆𝑘

𝑗∈𝐵𝑘

)

𝜆𝑘 𝐾

𝑘=1

)

I uttrycket är 𝜆𝑘 en parameter som beskriver till vilken grad de icke-observerbara nyttorna är

oberoende inom neste 𝑘. Ett högre värde på 𝜆𝑘 indikerar mindre korrelation. Ett mått på korrelation inom ett neste är måttet 1 − 𝜆𝑘. Om värdet på 𝜆𝑘 = 1 innebär det att det inte finns någon

korrelation inom neste 𝑘. Om 𝜆𝑘 = 1, ∀𝑘 innebär det att modellen är en multinomial logitmodell, då ingen korrelation mellan nesten finns. Det kan härledas genom formeln för sannolikheten att individ 𝑛 väljer alternativ 𝑖 inom neste 𝑘 som Daly och Zachary (1978), McFadden (1978) och Williams (1977) härledde.

𝑃𝑛𝑖 =𝑒𝑉𝑛𝑖/𝜆𝑘(∑𝑗∈𝐵𝑘𝑒𝑉𝑛𝑗/𝜆𝑘)𝜆𝑘−1

𝐾𝑙=1(∑𝑗∈𝐵𝑙𝑒𝑉𝑛𝑗/𝜆𝑙)𝜆𝑙

Parametern 𝜆𝑘 kan ha olika värden för olika nesten, beroende på hur korrelationerna mellan icke- observerbara nyttor ser ut för alternativen inom respektive neste. Train lyfter fram att värdet på 𝜆𝑘 måste vara mellan 0 och 1 för att modellen ska fungera som en modell vilken bygger på antagandet att individer strävar efter nyttomaximering. Om 𝜆𝑘 > 1 fungerar modellen för vissa av

förklaringsvariablerna men inte för alla. Om 𝜆𝑘< 0 är modellen helt inkompatibel med teorin om

(15)

9

strävan efter nyttomaximering. Det är således eftersträvansvärt att 0 < 𝜆𝑘 < 1. 𝜆𝑘 hänvisas ofta till som ”logsummeparametern” för ett specifikt neste.

För att förtydliga uppbyggnaden av nyttofunktionen kan den delas upp i flera komponenter. I sin bok presenterar Train följande uppdelning

𝑈𝑛𝑗 = 𝑊𝑛𝑘+ 𝑌𝑛𝑗+ 𝜀𝑛𝑗 för 𝑗 ∈ 𝐵𝑘.

Här representerar 𝑊𝑛𝑘 nyttan för att välja neste 𝑘, och beror därmed endast på variabler som beskriver neste 𝑘. 𝑌𝑛𝑗 representerar de variabler som påverkar valet av alternativ 𝑗, och därmed inte valet av neste. Train lyfter fram att skrivsättet är generellt och gäller alltid, vilket innebär att för alla 𝑊𝑛𝑘 så kan 𝑌𝑛𝑗 definieras som 𝑉𝑛𝑗− 𝑊𝑛𝑘. Fördelen med detta skrivsätt är att sannolikhetsuttrycket kan förenklas. Sannolikheten att alternativ 𝑖 väljs inom ett specifikt neste 𝐵𝑘 kan uttryckas som produkten av två sannolikheter. Sannolikheten att neste 𝐵𝑘 väljs och därefter att alternativ 𝑖 väljs, givet att neste 𝐵𝑘 valdes i det tidigare steget uttrycks på följande vis

𝑃𝑛𝑖= 𝑃𝑛𝑖|𝐵𝑘𝑃𝑛𝐵𝑘.

De båda sannolikheterna kan delas upp i något som efterliknar två olika logitmodeller. Sannolikheten att ett specifikt neste 𝐵𝑘 väljs ges av uttrycket

𝑃𝑛𝐵𝑘 = 𝑒𝑊𝑛𝑘+𝜆𝑘𝐼𝑛𝑘

𝐾𝑙=1𝑒𝑊𝑛𝑙+𝜆𝑙𝐼𝑛𝑙,

vilket efterliknar sannolikheten för en multinomial logitmodell. Samma gäller för sannolikheten att ett alternativ väljs givet ett neste, som ges av uttrycket

𝑃𝑛𝑖|𝐵𝑘= 𝑒𝑌𝑛𝑖/𝜆𝑘

𝑗∈𝐵𝑘𝑒𝑌𝑛𝑗/𝜆𝑘 där

𝐼𝑛𝑘= 𝑙𝑛 ∑𝑗∈𝐵𝑘𝑒𝑌𝑛𝑗/𝜆𝑘.

En nestad struktur illustreras ofta genom ett träddiagram med ett antal nivåer. I ett grundläggande exempel är nivåerna till antalet två, en övre och en undre nivå. Den övre nivån utgörs av valet av neste och den undre nivån utgörs av valet av ett alternativ ur det möjliga urvalet, givet ett specifikt neste. Parametern 𝐼𝑛𝑘 som presenteras i formeln ovan fungerar som en länk mellan valet av

alternativ och valet av neste. 𝐼𝑛𝑘 hänvisas till som ”logsumma”, då det helt enkelt är logaritmen av en summa. Följaktligen brukar 𝜆𝑘 hänvisas till som ”logsummeparameter” och är precis som tidigare nämnt ett mått på hur oberoende den icke-observerbara nyttan är mellan de olika alternativen.

Uttrycket 𝜆𝑘𝐼𝑛𝑘 kan beskrivas som den förväntade nyttan av att välja något alternativ inom neste 𝐵𝑘, och genom att inkludera 𝐼𝑛𝑘 på den övre nivån i den nestade strukturen kan den användas som förklaringsvariabel. Train lyfter fram att det är logiskt att inkludera 𝐼𝑛𝑘 då sannolikheten att välja ett neste beror på den förväntande nyttan som associeras med det nestet. Nyttan för alla alternativ inom ett neste är alltså den samma på den här nivån, oavsett vilket alternativ som sedan väljs inom nestet.

Sammanfattningsvis så är de stora fördelarna med GEV-modeller (i detta fall nestad logit) att några av de valbara alternativen kan korrelera med varandra och att sannolikheten för respektive val fortfarande kan uttryckas på sluten form (Train, 2009).

(16)

10 2.1.4 Skattning

När önskad modellstruktur är specificerad är det lämpligt att skatta modellens parametrar utifrån de observationer eller data som finns tillgängligt. Normalfallet är att inkludera samtliga alternativ ur det möjliga urvalet och i sådant fall är skattningen genomförbar utan större problem. Däremot ser processen lite krångligare ut om det är en del av urvalet av de möjliga alternativen som skattningen ska baseras på. Processen ser i princip lika ut för både den multinomiala logitmodellen och den nestade logitmodellen, då sannolikhetsfunktionerna för att ett alternativ väljs är konstruerade på sluten form i båda modellansatserna. De slutna funktionerna ger möjligheten att använda en maximum-likelihood-metod för skattningen.

Givet ett urval av 𝑁 observationer så kan sannolikheten att individ 𝑛 i modellen gör samma val som observerat beräknas genom

∏(𝑃𝑛𝑖)𝑦𝑛𝑖

𝑖

där 𝑦𝑛𝑖 = 1 om person 𝑛 väljer 𝑖 och 𝑦𝑛𝑖 = 0 om så inte är fallet. Konsekvenserna av potensen blir att termen beskriver sannolikheten för att alternativ 𝑖 väljs. I nästa steg görs ett antagande. Metoden bygger på att varje individs val är oberoende av vad andra väljer. Detta antagande gör det möjligt att använda ovanstående formel för samtliga individer i urvalet, se nedan.

𝐿(𝛽) = ∏ ∏(𝑃𝑛𝑖)𝑦𝑛𝑖

𝑖 𝑁

𝑛=1

Här är 𝛽 en vektor med parametrar som modellen är tänkt att inkludera och 𝐿(𝛽), där 𝐿 står för likelihood, en funktion som beskriver sannolikheten att de val som har observerat görs. Målet är att anpassa 𝛽 så att sannolikheten blir så stor som möjligt. Det görs enklast genom att derivera hela uttrycket och beräkna derivatans nollställen, men det är svårt att göra så som uttrycket ser ut för tillfället. För att möjliggöra derivering logaritmeras uttrycket till 𝐿𝐿(𝛽).

𝐿𝐿(𝛽) = ∑ ∑ 𝑦𝑛𝑖 ln(𝑃𝑛𝑖)

𝑖 𝑁

𝑛=1

Train påpekar här att loglikelihoodfunktionen, 𝐿𝐿(𝛽), är konkav så länge nyttofunktionerna är linjära och därmed finns det många mjukvaror att tillämpa för att skatta parametrarna. Om det skulle visa sig att parametrarna är svåra att skatta kan speciella metoder behöva tillämpas. Dessa metoder presenteras av Train senare i boken, men är inte relevanta för examensarbetet. Nästa steg är att derivera funktionen enligt nedanstående uttryck

𝑑𝐿𝐿(𝛽) 𝑑𝛽 = 0

varpå de parametrar som maximerar sannolikheten att förutspå de val som har gjorts kan beräknas.

2.1.5 Tolkning av resultat

I litteraturen lyfter Train fram några olika sätt som kan användas för att analysera och tolka en skattad modell. Det mest frekvent använda måttet kallas ”likelihood-ratio-index”. Det är ett mått som beskriver hur väl modellen presterar jämfört med en modell där samtliga parametrar är satta till noll, vilket kan jämföras med att inte ha någon modell över huvud taget. Ett likelihood-ratio-index beräknas enligt

(17)

11 𝜌2 = 1 −𝐿𝐿(𝛽)

𝐿𝐿(0)

där 𝐿𝐿(𝛽) är log-likelihoodvärdet för de skattade parametrarna och 𝐿𝐿(0) är log-likelihoodvärdet om samtliga parametrar hade varit noll. Då kvoten kommer att variera mellan 0 och 1 kommer således även 𝜌 att anta ett värde i det intervallet. Ett högre värde indikerar en bättre modell. Train lyfter fram vikten av att inte blanda ihop log-likelihoodvärdet med 𝑅2-måttet som kan användas vid linjär regression. 𝑅2 används för att för att påvisa hur variationen i en beroende variabel kan förklaras av den linjära regressionsmodellen, medan likelihood-ratio-indexet förklarar hur en skattad modell presterar jämfört med en modell där samtliga koefficienter är noll. En modell där 𝜌 = 0 är lika bra som en modell där samtliga parametrar är skattade till noll.

Likelihood-ratio-indexet kan justeras efter antalet parametrar i modellen. Det är nödvändigt att justera indexet för att kunna jämföra modeller med olika antal parametrar med varandra. Det justerade indexet beräknas enligt

𝜌𝑎𝑑𝑗.2 = 1 −𝐿𝐿(𝛽) − 𝑘 𝐿𝐿(0) där 𝑘 är antalet skattade parametrar i modellen (Train, 2009).

2.2 Tidigare forskning

I den här delen av rapporten kommer en utvald del av de studerade forskningsrapporterna att sammanfattas. Syftet är att presentera ett antal exempel på hur anslutningsresor har modellerats i olika sammanhang, för att till sist kunna dra slutsatser om det finns någon rimlig modellansats för svenska förhållanden.

2.2.1 Sammanställande studie över tidigare modellansatser

Young & Blainey (2018) har sammanställt forskning som har gjorts inom modellering av val av järnvägsstation och i vissa fall anslutningsfärdsätt. Young & Blainey menar att mycket forskning har skett inom området i separata sammanhang, men att trots detta har få framsteg har gjorts för att fastställa konsensus om vad som klassas som en bra respektive mindre bra metod för att framställa en modell. I deras arbete har 22 modeller för val av järnvägsstation undersökts varav åtta av dem även innehåller modeller för val av anslutande färdsätt. Samtliga studerade modeller baseras på någon typ av modell som modellerar individers diskreta val. Artikeln innehåller beskrivningar av de varianter av modeller som har använts, varav detaljerade beskrivningar är inkluderade för

multinomiala logitmodeller samt logitmodeller med en nestad struktur.

Något som författarna lyfter fram är problematiken med att tillämpa en multinomial logitmodell för val av järnvägsstation eller flygplats i ett sammanhang där det finns rumslig korrelation mellan några av alternativen. I Figur 2 visas ett exempel med stationerna A, B och C samt deras rumsliga position i förhållande till utgångspunkten O. I parenteserna visas sannolikheten att respektive station blir vald.

A och B är näst intill identiska stationer med samma avstånd från utgångspunkten. I utgångsläget (a) är sannolikheten att A och B väljs lika stor. Om möjligheten att välja station B försvinner bör samtliga resenärer från B istället välja A då de är lika och ligger lika långt ifrån utgångspunkten, se scenario (b).

Detta är dock inte fallet vid användandet av en multinomial logitmodell, då modellen fördelar sannolikheten proportionerligt med avseende på avstånd mellan station A och C, se scenario (c).

(18)

12

Figur 2: Rumslig korrelation mellan stationer (Young & Blainey, 2018).

I sina studier har författarna märkt att denna problematik är något som sällan tas hänsyn till vid stationsmodellering. Av de 22 studierna som diskuteras i artikeln är det endast en av modellerna som är byggd för att hantera problematiken, som kan lösas relativt enkelt genom att tillämpa en nestad struktur där stationer med liknande attribut grupperas inom ett neste.

Slutsatserna som dras är att en multinomial logitmodell är lämplig att använda när endast val av järnvägsstation ska modelleras, men i de fall där val av järnvägsstation ska modelleras i kombination med val av anslutande färdsätt bör valet av modell falla på nestad logit (Young & Blainey, 2018).

2.2.2 Modellering av flygplats-, flygbolags- och anslutningsreseval

Hess & Polak (2006) presenterar i en artikel resultaten och slutsatserna från en studie där de har modellerat parallella val av flygplats, flygbolag samt anslutande färdsätt i området som omsluter San Francisco-bukten i Kalifornien. Den underliggande data som modellen baseras på är insamlad genom intervjuer genomförda på de tre flygplatserna i regionen. Hess & Polak modellerar först valet med en multinomial logitmodell, därefter med en nestad logitmodell för att avslutningsvis jämföra de två modellvalen och dra slutsatser utifrån skillnaderna (Hess & Polak, 2006). I en tidigare rapport av författarna lyfter de fram att det finns signifikanta skillnader mellan olika typer av resenärer i två olika dimensioner. Först pekar de på skillnader mellan de som är boende i området och besökare, för att sedan peka på skillnaderna mellan tre olika typer av resenärer vars syfte med resan skiljer sig åt (Hess & Polak, 2005). I den här studien är resenärerna uppdelade i tre kategorier. Tjänsteresenärer, semesterresenärer samt resenärer vars syfte är att hälsa på släkt och vänner. Med nämnd

uppdelning i åtanke bildas sex möjliga kombinationer, härefter hänvisade till som segment, som modelleras separat då deras karakteristika skiljer sig nämnvärt. I modellansatsen tar författarna med ett antal variabler som kan tänkas påverkade de tre valen. Specifikt för anslutningsresor har de valt att ta med fyra variabler vilka antas påverka valet av anslutningsresefärdsätt. Variablerna är restid ombord på fordon, väntetid vid hållplats, resekostnad samt hur lång tid det tar att gå till det anslutande färdsättet.

Av de genomförda intervjuerna användes 90% av svaren till att skatta modellen och resterande 10%

till att validera modellen. Resultaten är bra och relativt lika för både den multinomiala och den nestade logitmodellen, dock pekar resultaten på att en nestad logitmodell lyckas förutspå valen bättre, dock med liten skillnad. Parametrarna för boende i området och besökare skiljer sig nämnvärt oavsett modellansats och till följd av detta trycker författarna i slutsatsen på vikten av att separera dessa två grupper från varandra. Vidare belyser även författarna nyttan av att dela upp enkätsvaren med hänsyn till val av resa. Avslutningsvis lyfter författarna fram fördelarna med att modellera valen av flygplats, flygbolag och anslutningsresefärdsätt separerat från varandra (Hess & Polak, 2006).

2.2.3 Sammanslagen modellering av efterfrågan, färdsätt och anslutningsresa

Konsultföretaget Cambridge Systematics har på uppdrag av California High-Speed Rail Authority, CHSRA, tagit fram en rapport där intäkterna samt antalet resenärer som beräknas nyttja en planerad

(19)

13

höghastighetslinje med tåg i Kalifornien har modellerats. Antalet beräknade resenärer har

modellerats genom en logitmodell med en nestad struktur på flera nivåer. Modellen skiljer sig från andra modeller för val av färdsätt i det att den har en integrerad efterfrågemodell i modellen som beräknar vilka resor som ska göras, sedan förutser val av färdsätt och slutligen gör en nätutläggning, där anslutningsresor modelleras inbyggt som en del i modellen. Långväga resor (>50 miles) genereras parallellt med regionala resor (<50 miles) och därefter läggs de ut på nätet tillsammans. Författarna beskriver modellen för de långväga resorna som en större modell uppbyggd av mindre

modellkomponenter. Sammanfattningsvis består modellen för långväga resor av tre komponenter.

En frekvensmodell, som beräknar hur många resor varje hushåll gör per dag inom tre kategorier.

Alternativen är ingen resa, ensamresa eller resa tillsammans. Nästa komponent utgörs av en modell för val av destination och avslutningsvis en modellkomponent för val av färdsätt. I modellen för val av färdsätt är huvudfärdsättet inkluderat men även anslutningsresefärdsätt.

Vidare har modellen för val av anslutningsresefärdsätt studeras i detalj. I Cambridge Systematics modell skattas parametrarna för huvudfärdsättet och anslutningsfärdsättet parallellt genom en ”Full Information Maximum Likelihood”-metod, vilken är en metod som kan användas när man arbetar med modeller på flera nivåer, som exempelvis nestad logit (Collins, et al., 2001). Till skillnad från andra studerade modeller för anslutningsresor har Cambridge Systematics formulerat en extra parameter som multipliceras med den total anslutningsresetiden (både i resans början och slut) utöver parametern för ”in vehicle time”. De menar att onyttan av långa anslutningsresor bättre representeras på detta sätt. Initialt testade Cambridge Systematics att tillämpa en nestad struktur i modellen för val av anslutningsresefärdsätt, se Figur 3.

Figur 3: Initialt föreslagen neststruktur av Cambridge Systematics för anslutningsresa (Cambridge Systematics, 2016).

Vid skattning av parametrar för variablerna i nyttofunktionerna visade det sig att de nestade

parametrarna inte korrelerade speciellt mycket med varandra, varpå en enklare modellstruktur utan nesten för just val av anslutningsfärdsätt föreslogs, se Figur 4.

Figur 4: Slutgiltig neststruktur av Cambridge Systematics för anslutningsresa (Cambridge Systematics, 2016).

(20)

14

Dock är själva valet av anslutningsresesätt i sig ett neste som beror på val av huvudfärdsätt. I den slutgiltiga modellen för val av färdsätt har Cambridge Systematics valt att modellera val av

anslutningsfärdsätt för flyg, höghastighetståg samt regionaltåg, se Figur 5. Cambridge Systematics menar att det kan se konstigt ut att valet av ”egress mode” ligger under valet av ”access mode”, men då de två modellerna delar nyttofunktioner och ser identiska ut har strukturen ingen påverkan på resultatet (Cambridge Systemathics, 2016).

Figur 5: Slutgiltig neststruktur av Cambridge Systematics för huvudresa och anslutningsresa (Cambridge Systematics, 2016).

2.2.4 Den nederländska modellen

Debrezion, Pels & Rietveld (2009) beskriver i en artikel hur de gick tillväga för att ta fram en modell för ett kombinerat val av anslutningsfärdsätt och järnvägsstation för resor med tåg i Nederländerna.

Modellen inkluderar ingen form av efterfrågemodellering utan tar vid när valet av destination och huvudfärdsätt (tåg) redan är bestämt. Artikeln ämnar till att ta fram en modell som besvarar följande två frågor:

(1) Vilken station används för avresa?

(2) Vilket anslutningsfärdsätt används för att ta sig till stationen?

Författarna lyfter fram revealed preference-statistik som visar att i 47% av alla påbörjade tågresor väljer resenärerna i Nederländerna att resa från en järnvägsstation som inte är deras närmaste. Då andelen är relativt stor pekar statistiken på att endast använda avståndet till järnvägsstation som förklaringsparameter för val av station inte är tillräckligt, utan att ytterligare variabler också spelar in.

I den här studien har författarna tagit fram ett mått, Rail Service Quality Index, RSQI, som kom att användas som förklaringsparameter. Måttet beskriver fyra attribut vid en järnvägsstation som kan tänkas påverka den totala restiden. Kortfattat rör det sig om avgångsfrekvensen från stationen, hur bra kommunikationerna är till stationen jämfört med andra stationer, hur väl placerad stationen är i förhållande till järnvägsnätet (här ingår restid till olika stationer) samt vad den monetära kostnaden

(21)

15

att resa från stationen är. Dessa fyra attribut används för att räkna ut räkna ut den generaliserade resekostnaden. Dock är biljettpriset uteslutet ur modellen för RSQI då forskarna menar att det finns en stark korrelation mellan biljettpris och resans längd. Vidare kan RSQI-måttet användas för att ta fram ett tillgänglighetsindex för zoner i det område som ska analyseras.

Modellen beräknar det kombinerade valet av anslutningsfärdsätt och järnvägsstation genom en nestad logitmodell. Det är viktigt att komma ihåg att ansatsen till modellen bygger på att resenären redan har valt att göra en resa med tåg som färdsätt. När valet av huvudfärdsätt är gjort ställs resenären inför två val som är relaterade till varandra, vilket anslutningsfärdsätt ska användas och vilken järnvägsstation resan utgår ifrån? Här antar författarna att båda valen görs samtidigt – resenären väljer alltså en kombination av de två valen.

Initialt i skapandet av modellen testade författarna att använda en multinomial logitmodellstruktur.

Resultaten pekade på att det fanns korrelation mellan alternativen, vilket ledde dem in på en logitmodell med nestad struktur. Här stod författarna inför valet mellan två olika nestade strukturer.

En som placerar valet av anslutningsfärdsätt på den högre nivån och valet av station på den nedre nivån, samt vice-versa. De valde att använda den förstnämnda strukturen då parametrarna i den initiala modellen framförallt pekade på korrelation mellan stationerna i stationsvalet, givet ett valt anslutningsfärdsätt, se Figur 6 för trädstruktur.

Figur 6: Neststruktur för logitmodell (Debrezion, et al., 2009).

De data som använts för modellskattning var aggregerad på postkods-nivå. För modellskattningen innebar detta att det inte fanns några data som beskrev huruvida ett hushåll hade tillgång till privat bil eller inte. Detta hanterades genom att formulera nyttofunktionerna som sådana att de tittade på bilinnehavet i det aktuella området istället för individens tillgång till bil. I beräkningen för

anslutningsfärdsättets nytta användes endast bilinnehav som förklaringsvariabel, med en konstant och en parameter för respektive färdsätt bortsett från alternativet ”gång”, vilken normaliserades och kom att användas som referenspunkt för de andra nyttorna. På det andra steget av modellen väljs avresestation. Här beräknas nyttorna för respektive station givet valet av ett specifikt

anslutningsfärdsätt. Som variabler i nyttofunktionen används avstånd, det tidigare nämnda RSQI- måttet och några alternativspecifika variabler. För bil används parkeringsmöjlighet, för kollektivtrafik används restid samt avgångsfrekvens och avslutningsvis används cykelställ som dummyvariabel för cykel.

Det bestämdes att antalet valbara stationer skulle vara tre till antalet. De stationer som är tillgängliga att välja mellan är de tre stationer som ligger närmast respektive zons centroid. Ett antagande som har gjorts i detta skedet är att samtliga fyra anslutningsfärdsätt finns tillgängliga för respektive zon.

Varje zon har därmed 12 möjliga kombinationer av anslutningsfärdsätt- och stationsval. Resultaten pekar på att cykel är det populäraste anslutningsvalet, tätt följt av kollektivtrafik och gång. Relativt långt bakom finner vi privat bil, som används av dryg en tiondel av resenärerna. Angående valet av station så är de rangordnade från 1–3 beroende på hur den verkliga fördelningen av resenärer ser ut.

References

Related documents

Užiji-li bakalářskou práci nebo poskytnu-li licenci k jejímu využití, jsem si vědoma povinnosti informovat o této skutečnosti TUL; v tomto případě má TUL právo ode

1) přílišná velikost baterie, která narušuje fyziologický aspekt oděvu, zvětšuje váhu a narušuje vzhled. 2) Další z problému jsou ostré hrany některých

31 – Protahování bedrokyčlostehenního svalu, (zdroj vlastní) .... Jak je již patrné z názvu, má práce se zabývá jednotlivými odchylkami v oblasti páteře. Toto téma je

8 KYBALOVÁ, Ludmila. jiny odívání: St edov k.. vycpávat ramena, hru a šosy. Sou ástí kabátce je úzký stojatý límec. Tvar rukáv je pytlovitý nebo trychtý ovitý. Nosili

Porovnáním této kapitoly s kapitolou 2.4.3, která se věnuje stejnému tématu, avšak v době středověku, je zřejmé, že v devatenáctém století bylo dětství již

Katedra základov a vyučovania informatiky (KZVI) se v první řadě věnuje přípravě uči- telů informatiky, dále zabezpečuje na Fakultě matematiky, fyziky a informatiky kurzy

Přiklad budeme řešit tak, že nejdříve nebudeme počítat s přestupným rokem a zjistíme, kolik dní uběhlo od začátku roku. Ověřování, zda se jedná

Využijeme toho, že řídicí proměnná se po každém projití cyklu zvýší o jedna a tudíž nám poslouží jako hodnoty které máme sčítat. zadaná hodnota po kterou