• No results found

Prognostisering av kapacitet inom sjukvården: En tidsserieanalys

N/A
N/A
Protected

Academic year: 2022

Share "Prognostisering av kapacitet inom sjukvården: En tidsserieanalys"

Copied!
54
0
0

Loading.... (view fulltext now)

Full text

(1)

Examensarbete, 30 hp

Civilingenjörsprogrammet industriell ekonomi, Inriktning Industriell Statistik, 300 hp

PROGNOSTISERING AV KAPACITET INOM

SJUKVÅRDEN

En tidsserieanalys

Elin Eriksson

(2)

Sammanfattning

Detta arbete har unders¨ okt vilken av tv˚ a metoder som var b¨ attre f¨ or att pro- gnostisera kapaciteten inom sjukv˚ arden hos Region V¨ asterbotten. Det ena al- ternativet var att prognostisera n˚ agra olika komponenter f¨ or att sedan, med en kapacitetsformel (se Ekvation 1), ber¨ akna kapaciteten. Det andra alternativet var att prognostisera kapaciteten baserat p˚ a historisk data av kapaciteten. Ifall det andra alternativet visade sig b¨ attre unders¨ oktes ¨ aven b¨ asta s¨ att att f˚ a en prognos f¨ or de komponenter som ¨ ar en del av kapacitetsformeln.

Vid granskning av komponenterna i kapacitetsformeln, drogs slutsatsen att det f¨ orsta alternativet inte kunde anv¨ andas. Under de f¨ oruts¨ attningar som pro- gnosen skapades skulle inte kapacitetsformeln representera kapaciteten. Den andra metoden valdes som den b¨ attre. F¨ or att ta fram prognosen f¨ or ¨ ovriga komponenter skapades enskilda prognoser ¨ aven f¨ or dessa.

F¨ or att skapa prognoser anv¨ andes ett par enklare metoder samt tidsseri-

eanalys. Tv˚ a avdelningar unders¨ oktes, varav den ena visade sig ha ett starkt

s¨ asongsberoende p˚ a sju dagar och modeller som utnyttjade den informationen

gav b¨ ast resultat. Medelprocesstiden var sv˚ ar att prognostisera f¨ or b˚ ada avdel-

ningarna. Att ber¨ akna och modellera denna p˚ a ett annat s¨ att kan eventuellt

f¨ orb¨ attra prognoserna.

(3)

Abstract

This thesis has investigated which of two methods was better for forecasting the capacity within the healthcare sector at Region V¨ asterbotten. One option was to forecast a few different components and then, using a capacity formula (see Equation 1), calculate the capacity. The second option was to forecast the capacity based on historical data of the capacity. If the second alternative proved to be better, the best way to get a forecast of the components that are a part of the capacity formula was also investigated.

When examining the components of the capacity formula, it was concluded that the first alternative could not be used. Under the conditions which the forecast was made, the capacity formula would not represent the capacity. The second method was chosen as the better one. To produce forecasts for the other components, individual forecasts were also created for these.

To create forecasts, a couple of simpler methods and time series analysis were used. Two departments were investigated, one of which was found to have strong weekly seasonality and models that utilized that information yielded the best results. The average process time was difficult to forecast for both departments.

Calculating and modeling this in a different way could possibly improve the forecasts.

Title: Forecasting capacity in Healtcare - A time series analysis

(4)

F¨ orord

Jag vill uttrycka min tacksamhet till alla som har hj¨ alp mig p˚ a v¨ agen. Ett stort tack till min handledare, H˚ akan Lindkvist, f¨ or givande diskussioner och v¨ agledning genom arbetet.

Ett stort tack g˚ ar ocks˚ a till teamet p˚ a Region V¨ asterbotten, John Domen- stam, Kerstin Edberg, David M¨ aki och Ritva Rosenb¨ ack, f¨ or m¨ ojligheten att g¨ ora mitt arbete hos er samt er expertis och hj¨ alpsamhet.

Till sist vill jag tacka hela institutionen f¨ or matematik och matematisk sta- tistik f¨ or allt h˚ art arbete som ligger bakom v˚ ar utbildning.

Elin Eriksson

Ume˚ a, 2020-05-29

(5)

Inneh˚ all

1 Introduktion 1

1.1 Bakgrund . . . . 1

1.2 Region V¨ asterbotten . . . . 1

1.3 Problembakgrund . . . . 1

1.4 Syfte . . . . 2

1.5 Fr˚ agest¨ allning . . . . 2

1.6 Avgr¨ ansningar . . . . 2

2 Teori 3 2.1 Stokastisk process . . . . 3

2.2 Utv¨ arderingsmetoder . . . . 3

2.3 Enklare prognosmetoder . . . . 4

2.4 Tidsseriemodel . . . . 5

2.5 Parameterskattning . . . . 6

2.6 Informationskriterier . . . . 7

2.7 Residualer . . . . 7

2.8 Prediktionsintervall . . . . 8

2.9 Hyndman-Khandakar algoritmen . . . . 8

3 Material och metod 11 3.1 R . . . . 11

3.2 Dataarbete . . . . 11

3.3 Tidsseriemodellering . . . . 16

4 Resultat 18 4.1 Val av metod . . . . 18

4.2 Onkologi avdelning Ume˚ a . . . . 18

4.3 Psykiatrisk avdelning 4 Ume˚ a . . . . 25

5 Analys och slutsats 31 5.1 Val av metod . . . . 31

5.2 Onkologi avdelning Ume˚ a . . . . 31

5.3 Psykiatrisk avdelning 4 Ume˚ a . . . . 32

6 Diskussion 33 6.1 Modeller . . . . 33

6.2 Alternativa metoder . . . . 33

6.3 Felk¨ allor . . . . 34

6.4 Utvecklingsm¨ ojligheter . . . . 34

7 Referenser 36

A Bilagor 37

(6)

Figurer

3.1 Overblick av onkologiavdelningen . . . . ¨ 14 3.2 Overblick av Psykiatrisk avdelning . . . . ¨ 15 4.1 S¨ asongsgrafer f¨ or kapaciteten p˚ a onkologiavdelningen . . . . 19 4.2 Residualer av SARIMA-modellen p˚ a kapaciteten p˚ a onkologiav-

delningen . . . . 20 4.3 Residualer av den s¨ asongsnaiva metoden p˚ a kapaciteten p˚ a onko-

logiavdelningen . . . . 20 4.4 S¨ asongsgrafer f¨ or den planerbara kapaciteten p˚ a onkologiavdel-

ningen . . . . 21 4.5 Residualer av SARIMA-modellen p˚ a den planerbara kapaciteten

p˚ a onkologiavdelningen . . . . 22 4.6 Residualer av den s¨ asongsnaiva metoden p˚ a den planerbara ka-

paciteten p˚ a onkologiavdelningen . . . . 22 4.7 Residualer av den naiva metoden p˚ a medelprocesstiden p˚ a onko-

logiavdelningen . . . . 23 4.8 S¨ asongsgrafer f¨ or medelprocesstiden p˚ a onkologiavdelningen . . . 24 4.9 Residualer av medelv¨ ardesmetoden p˚ a kapaciteten p˚ a den psyki-

atriska avdelningen . . . . 25 4.10 S¨ asongsgrafer f¨ or kapaciteten p˚ a den psykiatriska avdelningen . . 26 4.11 S¨ asongsgrafer f¨ or den planerbara kapaciteten p˚ a den psykiatriska

avdelningen . . . . 27 4.12 Residualer av den naiva metoden p˚ a den planerbara kapaciteten

p˚ a den psykiatriska avdelningen . . . . 28 4.13 Residualer av ARIMA-modellen p˚ a den planerbara kapaciteten

p˚ a den psykiatriska avdelningen . . . . 28 4.14 Residualer av medelv¨ ardesmetoden p˚ a medelprocesstiden p˚ a den

psykiatriska avdelningen . . . . 29 4.15 S¨ asongsgrafer f¨ or medelprocesstiden p˚ a den psykiatriska avdel-

ningen . . . . 30 A.1 Prognos f¨ or kapaciteten p˚ a onkologiavdelningen med hj¨ alp av me-

delv¨ ardesmetoden . . . . 37 A.2 Prognos f¨ or kapaciteten p˚ a onkologiavdelningen med hj¨ alp av den

naiva metoden . . . . 37 A.3 Prognos f¨ or kapaciteten p˚ a onkologiavdelningen med hj¨ alp av den

s¨ asongsnaiva metoden . . . . 38 A.4 Prognos f¨ or kapaciteten p˚ a onkologiavdelningen med hj¨ alp av

trendmetoden . . . . 38 A.5 Prognos f¨ or kapaciteten p˚ a onkologiavdelningen fr˚ an en ARIMA-

modell . . . . 38 A.6 Prognos f¨ or kapaciteten p˚ a onkologiavdelningen fr˚ an en

SARIMA-modell . . . . 39 A.7 Prognos f¨ or den planerbara kapaciteten p˚ a onkologiavdelningen

med hj¨ alp av medelv¨ ardesmetoden . . . . 39

(7)

A.8 Prognos f¨ or den planerbara kapaciteten p˚ a onkologiavdelningen med hj¨ alp av den naiva metoden . . . . 39 A.9 Prognos f¨ or den planerbara kapaciteten p˚ a onkologiavdelningen

med hj¨ alp av den s¨ asongsnaiva metoden . . . . 40 A.10 Prognos f¨ or den planerbara kapaciteten p˚ a onkologiavdelningen

med hj¨ alp av trendmetoden . . . . 40 A.11 Prognos f¨ or den planerbara kapaciteten p˚ a onkologiavdelningen

fr˚ an en ARIMA-modell . . . . 40 A.12 Prognos f¨ or den planerbara kapaciteten p˚ a onkologiavdelningen

fr˚ an en SARIMA-modell . . . . 41 A.13 Prognos f¨ or medelprocesstiden p˚ a onkologiavdelningen med hj¨ alp

av medelv¨ ardesmetoden . . . . 41 A.14 Prognos f¨ or medelprocesstiden p˚ a onkologiavdelningen med hj¨ alp

av den naiva metoden . . . . 41 A.15 Prognos f¨ or medelprocesstiden p˚ a onkologiavdelningen med hj¨ alp

av trendmetoden . . . . 42 A.16 Prognos f¨ or medelprocesstiden p˚ a onkologiavdelningen fr˚ an en

ARIMA-modell . . . . 42 A.17 Prognos f¨ or kapaciteten p˚ a den psykiatriska avdelningen med

hj¨ alp av medelv¨ ardesmetoden . . . . 42 A.18 Prognos f¨ or kapaciteten p˚ a den psykiatriska avdelningen med

hj¨ alp av den naiva metoden . . . . 43 A.19 Prognos f¨ or kapaciteten p˚ a den psykiatriska avdelningen med

hj¨ alp av trendmetoden . . . . 43 A.20 Prognos f¨ or kapaciteten p˚ a den psykiatriska avdelningen fr˚ an en

ARIMA-modell . . . . 43 A.21 Prognos f¨ or den planerbara kapaciteten p˚ a den psykiatriska av-

delningen med hj¨ alp av medelv¨ ardesmetoden . . . . 44 A.22 Prognos f¨ or den planerbara kapaciteten p˚ a den psykiatriska av-

delningen med hj¨ alp av den naiva metoden . . . . 44 A.23 Prognos f¨ or den planerbara kapaciteten p˚ a den psykiatriska av-

delningen med hj¨ alp av trendmetoden . . . . 44 A.24 Prognos f¨ or den planerbara kapaciteten p˚ a den psykiatriska av-

delningen fr˚ an en ARIMA-modell . . . . 45 A.25 Prognos f¨ or medelprocesstiden p˚ a den psykiatriska avdelningen

med hj¨ alp av medelv¨ ardesmetoden . . . . 45 A.26 Prognos f¨ or medelprocesstiden p˚ a den psykiatriska avdelningen

med hj¨ alp av den naiva metoden . . . . 45 A.27 Prognos f¨ or medelprocesstiden p˚ a den psykiatriska avdelningen

med hj¨ alp av trendmetoden . . . . 46 A.28 Prognos f¨ or medelprocesstiden p˚ a den psykiatriska avdelningen

fr˚ an en ARIMA-modell . . . . 46

(8)

Tabeller

3.1 Exempeltabell f¨ or de variabler som skulle sammanst¨ allas utifr˚ an det data som fanns tillg¨ angligt. . . . 13 4.1 RMSE och MAE f¨ or kapacitetsprognos p˚ a onkologiavdelningen . 18 4.2 RMSE och MAE f¨ or prognos ¨ over planerbara kapaciteter p˚ a onko-

logiavdelningen . . . . 22 4.3 RMSE och MAE f¨ or prognos ¨ over medelprocesstiden p˚ a onkolo-

giavdelningen . . . . 23 4.4 RMSE och MAE f¨ or kapacitetsprognos p˚ a den psykiatriska av-

delningen . . . . 25 4.5 RMSE och MAE f¨ or prognos av planerbara kapaciteter p˚ a den

psykiatriska avdelningen . . . . 27 4.6 RMSE och MAE f¨ or prognos av medelprocesstid p˚ a den psykia-

triska avdelningen . . . . 29

(9)

1 Introduktion

H¨ ar introduceras bakgrunden till och syftet med arbetet s˚ av¨ al som fr˚ agest¨ allningen som ska besvaras och vilka avgr¨ ansningar som gjorts.

1.1 Bakgrund

F¨ or att kunna anv¨ anda sina resurser p˚ a b¨ asta s¨ att ¨ ar det viktigt att ha en bild av utvecklingen som f¨ orv¨ antas ske i framtiden. Om man har det, kan man planera b¨ attre och effektivisera processen. Inom sjukv˚ arden vill man veta hur stor kapacitet man har eller klarar av. Detta kan till exempel handla om hur m˚ anga patienter man har m¨ ojlighet att behandla eller operera per dag.

1.2 Region V¨ asterbotten

Region V¨ asterbotten arbetar i huvudsak med h¨ also- och sjukv˚ ard inom l¨ anet, men ¨ aven annat s˚ asom regional utveckling, kollektivtrafik och forskning [13].

Inom h¨ also- och sjukv˚ ard finns det i regionen tre sjukhus samt h¨ alsocentraler i alla kommuner.

1.3 Problembakgrund

F¨ or att f˚ a en bild av nul¨ aget genomf¨ orde Region V¨ asterbotten 2017 en f¨ orstudie om produktions- och kapacitetsstyrning och f¨ or fortsatt arbete f¨ or f¨ orb¨ attring inom detta omr˚ ade beslutades det att inf¨ ora en samlad produktions- och kapacitetsstyrning i regionen. Ett inf¨ orandeprojekt f¨ or detta startades, kallat produktions- och kapacitetsstyrning (PKS).

En del av detta projekt ¨ ar ber¨ akning och prognostisering av kapaciteter inom sjukv˚ arden. Kapaciteten ber¨ aknas enligt

K = P kap ∗ t kap ∗ N t med

, (1)

d¨ ar K st˚ ar f¨ or kapaciteten, vilket ¨ ar den m¨ angd v˚ ardaktiviteter som kan utf¨ oras med befintliga f¨ oruts¨ attningar. Till exempel antal operationer eller antal slu- tenv˚ ardtillf¨ allen.

P kap ¨ ar antalet planerbara kapaciteter, det vill s¨ aga de resurser som kr¨ avs f¨ or att genomf¨ ora v˚ ardaktiviteten, exempelvis bemannad v˚ ardplats. F¨ or att kunna skriva in en patient r¨ acker det inte att en s¨ ang finns att tillg˚ a, utan det ska ¨ aven finnas personal och utrustning f¨ or att ta hand om patienten.

t kap ¨ ar tillg¨ anglig tid f¨ or planerbara kapaciteter. ¨ Oppettider skiljer sig ˚ at mellan olika avdelningar. Det sker till exempel inte operationer i en operationssal konstant. Om den tillg¨ angliga tiden anges som antalet timmar per m˚ anad, blir kapaciteten antalet v˚ ardaktiviteter som kan utf¨ oras per m˚ anad.

N ¨ ar nyttjandegraden, allts˚ a hur mycket av den tillg¨ angliga tiden som anv¨ ands till v˚ ardaktiviteter. P˚ a vissa avdelningar kan det till exempel vara

¨ onskv¨ art att inte utnyttja alla tillg¨ angliga platser, f¨ or att ha m¨ ojligheten att

(10)

ta in akuta fall. Ett annat exempel varf¨ or denna faktor varierar ¨ ar att infl¨ odet inte matchar kapaciteten, det vill s¨ aga det finns inte patienter som tar upp alla tillg¨ angliga platser.

t med ¨ ar medelprocesstiden f¨ or en v˚ ardaktivitet.

Denna formel ¨ ar en anpassning av Capacity Evaluation Method (CEM) till svensk h¨ also- och sjukv˚ ard. CEM ¨ ar en metod f¨ or att prognostisera produktions- kapacitet n¨ ar det saknas tillr¨ ackliga data f¨ or att ta fram detaljerade simuleringar [1].

1.4 Syfte

Syftet med detta projekt ¨ ar att unders¨ oka b¨ asta s¨ att att prognostisera kapaci- teten inom sjukv˚ arden.

1.5 Fr˚ agest¨ allning

Utifr˚ an problembakgrunden och formeln f¨ or kapacitetsber¨ akning ¨ ar fr˚ agest¨ alln- ingen given av Region V¨ asterbotten f¨ oljande

• Kan man prognostisera respektive komponent i kapacitetsformeln (Se Ek- vation 1) f¨ or att sedan ber¨ akna kapaciteten (Metod 1) eller m˚ aste man prognostisera den totala kapaciteten (Metod 2) f¨ or att det ska bli s˚ a sant som m¨ ojligt?

• Om man inte kan prognostisera respektive komponent, hur tar man d˚ a fram respektive komponents prognos ¨ over tid?

1.6 Avgr¨ ansningar

Arbetet kommer att begr¨ ansas till att unders¨ oka ett visst antal avdelningar inom slutenv˚ arden.

Det finns en distinktion mellan normala v˚ ardplatser och tekniska v˚ ardplatser

f¨ or de planerbara kapaciteterna, P kap . Tekniska v˚ ardplatser ¨ ar v˚ ardplatser d¨ ar

patienten inte g˚ ar att l¨ agga p˚ a en normal plats p˚ a grund av s¨ arskilda resurser

som finns p˚ a dessa platser. En intensivv˚ ardplats ¨ ar ett exempel p˚ a en teknisk

v˚ ardplats. Tekniska v˚ ardplatser finns inte p˚ a alla avdelningar. Arbetet avgr¨ ansas

till att endast betrakta normala v˚ ardplatser.

(11)

2 Teori

H¨ ar kommer de matematiska teorier och modeller som anv¨ ands i arbetet att presenteras.

2.1 Stokastisk process

En stokastisk process ¨ ar en samling av tidsindexerade slumpvariabler Z(ω, t), d¨ ar ω tillh¨ or ett utfallsrum och t en indexm¨ angd. F¨ or ett givet t ¨ ar Z(ω, t) en slumpvariabel. F¨ or ett givet ω kallas Z(ω, t), som en funktion av t, f¨ or en stickprovsfunktion eller ett utfall [12, s. 6].

Ofta ben¨ amns Z(ω, t) som Z(t) eller Z t , d˚ a det ¨ ar underf¨ orst˚ att att den stokastiska processen ¨ ar en m¨ angd tidsindexerade slumpvariabler definierade p˚ a ett utfallsrum.

Stokastiska processer brukar delas upp i fyra typer efter om de har diskret eller kontinuerlig tid samt diskret eller kontinuerlig v¨ ardem¨ angd [2, s. 186]. Ex- empel p˚ a processer tillh¨ orande varje typ ¨ ar

• Slumpvandring - Diskret tid och v¨ ardem¨ angd,

• Tidsserier - Diskret tid och kontinuerlig v¨ ardem¨ angd,

• Poisson-process - Kontinuerlig tid och diskret v¨ ardem¨ angd,

• Brownsk r¨ orelse - Kontinuerlig tid och v¨ ardem¨ angd.

2.2 Utv¨ arderingsmetoder

F¨ or att utv¨ ardera en prognos noggrannhet kan man spara en del av den tillg¨ angliga datan till detta. Detta kallas att dela upp data i tr¨ anings- och testdata. N¨ ar modellen skapas anv¨ ands d˚ a endast tr¨ aningsdatan och efter˚ at anv¨ ands testdatan f¨ or att utv¨ ardera modellen. Vanligtvis brukar runt 20 % anv¨ andas som testdata [6, kap. 3.4].

Utv¨ arderingen gjord p˚ a testdatan kan sedan anv¨ andas f¨ or att j¨ amf¨ ora olika sorters modeller.

F¨ or tidsserier ska testdata ligga i slutet av serien. Det b¨ or ocks˚ a helst vara minst lika l˚ ang som den tidshorisont du ¨ onskar prognostisera.

N¨ ar modellerna ¨ ar skapade anv¨ ands olika utv¨ arderingsmetoder f¨ or att

j¨ amf¨ ora deras exakthet i f¨ orh˚ allande till varandra. Detta g¨ ors genom att skapa

prognoser med hj¨ alp av modellen och j¨ amf¨ ora de predikterade v¨ ardena mot

testdata. Dessa metoder kan inte anv¨ andas f¨ or att j¨ amf¨ ora modeller skapade

fr˚ an olika datamaterial. H¨ ar presenteras tre utv¨ arderingsmetoder, men det

finns fler metoder ¨ an dessa.

(12)

2.2.1 MSE

Medelkvadratavvikelse (MSE), engelska mean squared error, definieras som

M SE = 1 n

n

X

i=1

(y i − ˆ y i ) 2 ,

d¨ ar n ¨ ar antalet prediktioner, y i ¨ ar de observerade v¨ ardena och ˆ y i ¨ ar de mot- svarande predikterade v¨ ardena, i = 1, 2, ..., n [12, s. 181].

2.2.2 RMSE

RMSE, engelska root mean squared error, definieras som RM SE =

√ M SE.

2.2.3 MAE

Medelabsolutfelet (MAE), engelska mean absolute error, definieras som

M AE = 1 n

n

X

i=1

|y i − ˆ y i |,

[12, s. 182].

2.3 Enklare prognosmetoder

H¨ ar definieras n˚ agra enkla prognosmetoder. Dessa anv¨ ands som utg˚ angsl¨ age och j¨ amf¨ orelse mot andra metoder.

2.3.1 Medelv¨ ardesmetoden

Medelv¨ ardesmetoden tar ut medelv¨ ardet f¨ or hela tidsperioden fr˚ an tr¨ aningsdata och prognostiserar medelv¨ ardet f¨ or alla framtida tidpunkter. Detta definieras som

ˆ

y T +h = 1 T

T

X

t=1

y t ,

d¨ ar T ¨ ar antalet observationer f¨ or tidsperioden och h ∈ {1, ..., ∞} ¨ ar prognosho- risonten [6, kap. 3.1].

2.3.2 Naiva metoden

Den naiva metoden tar det senaste v¨ ardet i tr¨ aningsdata och prognostiserar det senaste v¨ ardet f¨ or alla framtida tidpunkter. Detta definieras som

ˆ

y T +h = y T

[6, kap. 3.1].

(13)

2.3.3 S¨ asongsnaiva metoden

Den s¨ asongsnaiva metoden prognostiserar det senaste v¨ ardet f¨ or samma dag i den senaste s¨ asongen. Om en s¨ asong ¨ ar en vecka kommer denna metod d˚ a pro- gnostisera en m˚ andag som samma v¨ arde som den sista m˚ andagen i tr¨ aningsdata, en tisdag som den sista tisdagen och s˚ a vidare. Detta definieras som

ˆ

y T +h = y T +h−m(k−1) ,

d¨ ar m ¨ ar s¨ asongsperioden och k ¨ ar antalet hela s¨ asonger mellan tiden T och prognoshorisonten h [6, kap. 3.1].

2.3.4 Trendmetoden

Trendmetoden ber¨ aknar lutningen fr˚ an f¨ orsta observerade v¨ ardet i tidsserien till den sista, och prognostiserar att denna trend kommer forts¨ atta fr˚ an det sista observerade v¨ ardet. Detta definieras som

ˆ

y T +h = y T + h y T − y 1 T − 1

 [6, kap. 3.1].

2.4 Tidsseriemodel

En tidsseriemodell f¨ or det observerade utfallet x t ¨ ar en specifikation av de f¨ ordelningar, eller endast v¨ antev¨ arde och kovarians, f¨ or den sekvens av slumpm¨ assiga variabler X t av vilka x t ¨ ar utfall [4, s. 6].

2.4.1 Station¨ ar tidsserie

X t ¨ ar svagt station¨ ar om v¨ antev¨ ardet, µ X (t), ¨ ar oberoende av t och om kovari- ansfunktionen, γ X (t + h, t), ¨ ar oberoende av t f¨ or varje h [4, s. 13].

Om X t inte ¨ ar station¨ ar kan det hj¨ alpa att utf¨ ora transformationer p˚ a datan.

F¨ or ¨ okande fluktuationer n¨ ar t ¨ okar, kan logaritmen av X t anv¨ andas, som {Y t = log(X t )}. Om v¨ antev¨ ardet ¨ ar beroende av t p˚ a grund av trender eller s¨ asonger, kan datan differentieras som {Y t = X t − X t−d }, d¨ ar d ¨ ar ett positivt heltal.

2.4.2 Vitt brus

En f¨ oljd av oberoende likaf¨ ordelade slumpvariabler, i diskret tid, som alla har v¨ antev¨ arde 0 och varians σ 2 kallas vitt brus [2, s. 206].

2.4.3 AR-modellen

En process {X t , t ≥ 0} kallas f¨ or en autoregressiv process av ordning p, eller en AR(p)-process, om

X t = c + φ 1 X t−1 + ... + φ p X t−p + ε t ,

(14)

d¨ ar ε t ¨ ar vitt brus i diskret tid, d¨ ar φ 1 , ..., φ p ¨ ar parametrarna av modellen och c ¨ ar en konstant [2, s. 209][6, kap. 8.3].

2.4.4 MA-modellen

En process {X t , t ≥ 0} kallas f¨ or en glidande medelv¨ ardesprocess av ordningen q, eller en M A(q)-process, om

X t = c + ε t + θ 1 ε t−1 + ... + θ q ε t−q

och θ q 6= 0, d¨ ar ε t ¨ ar vitt brus i diskret tid, θ 1 , ..., θ q ¨ ar parametrarna av modellen och c ¨ ar en konstant [2, s. 207][6, kap. 8.4].

2.4.5 ARIMA-modellen

Genom att kombinera AR-modellen, MA-modellen och differentiering, f˚ ar vi en s˚ a kallad ARIM A(p, d, q)-modell. Med differentiering menas att data ers¨ atts med f¨ orsta ordningens differentiering som ¨ ar {Y t = X t − X t−1 }. Denna typ av differentiering kan ske flera g˚ anger och best¨ ams av parametern d. p representerar ordningen av AR-modellen och q ordningen av MA-modellen [6, kap. 8.5].

Denna modell kan skrivas som

Y t = c + φ 1 Y t−1 + ... + φ p Y t−p + θ 1 ε t−1 + ... + θ q ε t−q + ε t .

En ARIMA modell d¨ ar ingen differentiering skett, d = 0, kan ocks˚ a kallas f¨ or en ARMA-modell.

2.4.6 SARIMA-modellen

Om det finns ett s¨ asongsberoende i tidsserien kan ARIMA-modellen utvidgas till en SARIM A(p, d, q)(P, D, Q)[m]-modell, d¨ ar P st˚ ar f¨ or s¨ asongsordningen av AR-processen, D f¨ or antalet f¨ orsta ordningens s¨ asongsm¨ assiga differen- tieringar, Q f¨ or s¨ asongsordningen av MA-processen och m f¨ or l¨ angden av en s¨ asong. S¨ asongstermerna multipliceras sedan med icke-s¨ asongstermerna i ARIMA-modellen [6, kap. 8.9].

F¨ orsta ordningens s¨ asongsm¨ assig differentiering inneb¨ ar att data ers¨ atts med {Y t = X t − X t−m }.

2.5 Parameterskattning

F¨ or att skatta parametrarna c, φ 1 , ..., φ p och θ 1 , ..., θ q i ARIMA-modellen,

anv¨ ands maximum likelihood-metoden (MLE). Genom att testa olika v¨ arden

p˚ a parametrarna v¨ aljs den kombination som med st¨ orst sannolikhet ger det

utfall som har observerats [6, kap. 8.6].

(15)

2.6 Informationskriterier

F¨ or att best¨ amma ordningen av en ARIMA-modell, det vill s¨ aga vilka v¨ arden av p, d och q som ger b¨ ast modell, anv¨ ands olika informationskriterier. Dessa kriterier best¨ ammer sannolikheten att modellen representerar datan och bestraf- far ett h¨ ogre antal parametrar. Skillnaden mellan de olika informationskriterier som definieras nedan ligger i hur de bestraffar antalet parametrar. M˚ alet ¨ ar att minimera informationskriteriet genom att f¨ or¨ andra p, d och q.

2.6.1 AIC

Akaike’s informationskriterie (AIC) f¨ or ARIMA-modeller definieras som AIC = −2log(L) + 2(p + q + k + 1),

d¨ ar L ¨ ar likelihoodfunktionen av datan, k = 1 om konstanten c 6= 0, och k = 0 om c = 0. p och q ¨ ar antalet parametrar f¨ or ARIMA-modellen [6, kap. 5.5].

2.6.2 AICc

AICc ¨ ar en korrigering av AIC som straffar h¨ ogre antal prediktorer n¨ ar antalet observationen ¨ ar litet. Detta f¨ or att undvika ¨ overanpassning till data. AICc definieras som

AICc = AIC + 2(p + q + k + 1)(p + q + k + 2) n − p − q − k − 2 , d¨ ar n ¨ ar antalet observationer [6, kap. 5.5].

2.6.3 BIC

Bayesian informationskriterie (BIC) definieras som

BIC = AIC + (log(n) − 2)(p + q + k + 1),

och v¨ aljer samma modell eller en med f¨ arre termer ¨ an AIC. BIC anv¨ ands ofta n¨ ar det finns en sann underliggande modell [6, kap. 5.5].

2.7 Residualer

Residualer definieras som

e i = y i − ˆ y i ,

d¨ ar y i ¨ ar de observerade v¨ ardena och ˆ y i ¨ ar de motsvarande predikterade v¨ ardena, i = 1, 2, ..., n [2, s. 426]. Dessa kan anv¨ andas f¨ or att unders¨ oka ifall modellen som gett de predikterade v¨ ardena har f˚ angat upp informationen fr˚ an datam¨ angden.

F¨ or en bra modell ska residualerna vara okorrelerade och ha ett v¨ antev¨ arde p˚ a

0 [6, kap. 3.3]

(16)

2.8 Prediktionsintervall

Ett prediktionsintervall ¨ ar en uppskattning av det intervall framtida v¨ arden kommer ligga inom. Intervallet definieras som

I = ˆ y T +h|T ± λˆ σ h ,

d¨ ar ˆ σ h ¨ ar en uppskattning av standardavvikelsen f¨ or steg h i prognosen och λ ¨ ar v¨ ardet motsvarande den kvantil som intervallet representerar, under antagandet att prognosfelen ¨ ar normalf¨ ordelade. F¨ or ett 95 % prognosintervall ¨ ar λ = 1.96 och f¨ or 80 % ¨ ar λ = 1.28.

2.9 Hyndman-Khandakar algoritmen

Denna algoritm anv¨ ands f¨ or att best¨ amma ordningen av ARIMA- och SARIMA- modeller. F¨ orst definieras de tester som anv¨ ands i algoritmen.

2.9.1 KPSS-test

KPSS (Kwiatkowski–Phillips–Schmidt–Shin) ¨ ar ett statistiskt test f¨ or att un- ders¨ oka station¨ aritet i en tidsserie. Nollhypotesen ¨ ar att serien ¨ ar station¨ ar kring en deterministisk trend. Serien kan uttryckas som summan av en deterministisk trend, slumpvandring och station¨ ar felterm. Testet ¨ ar ett test av hypotesen att slumpvandringen har noll varians [8]. Det minsta antalet differentieringar som kr¨ avs returneras.

2.9.2 S¨ asongsstyrka

En tidsserie kan formuleras om till en summa av dess komponenter. Detta kallas en dekomposition och kan skrivas som

y t = S t + T t + R t ,

d¨ ar S t ¨ ar s¨ asongskomponenten, T t ¨ ar trendkomponenten och R t ¨ ar resttermen [6, kap. 6.1].

F¨ or att best¨ amma om en s¨ asongsdifferentiering ska anv¨ andas eller inte, anv¨ ands ett m˚ att av s¨ asongsstyrka. S¨ asongsstyrka definieras som

F S = max 0; 1 − Var(R t ) Var(S t + R t )



d¨ ar S t och R t kommer fr˚ an en dekomposition av tidsserien [11]. Om detta m˚ att

¨ overstiger 0,64 anv¨ ands D = 1, annars D = 0 [5].

2.9.3 ARIMA-modell

F¨ or en ARIMA-modell best¨ ams dess ordning med hj¨ alp av Hyndman-Khandakar

algoritmen. H¨ ar anv¨ ands AICc som informationskriterie, men kan bytas ut mot

AIC eller BIC.

(17)

1. Antalet differentieringar, d, mellan 0 och 2 best¨ ams av upprepade KPSS test. D¨ arefter differentieras data d antal g˚ anger.

2. Variablerna p och q ska best¨ ammas. Ist¨ allet f¨ or att testa varje m¨ ojlig kom- bination av dessa anv¨ ander algoritmen en stegvis s¨ okning. Initialt testas fyra modeller:

• ARIM A(0, d, 0)

• ARIM A(2, d, 2)

• ARIM A(1, d, 0)

• ARIM A(0, d, 1)

En konstant ¨ ar inkluderad om inte d = 2. Om d ≤ 1, testas ¨ aven ytterligare en modell:

• ARIM A(0, d, 0) utan en konstant.

Sedan v¨ aljs den modellen med minst AICc-v¨ arde.

3. Variationer av den valda modellen testas

• p och q ¨ andras, separat, med ±1 fr˚ an den valda modellen.

• Det testas att inkludera eller exkludera en konstant fr˚ an den nuva- rande modellen.

V¨ alj modellen med minst AICc-v¨ arde.

4. Upprepa steg 3 tills inget l¨ agre AICc-v¨ arde hittas.

[6, kap. 8.7].

2.9.4 SARIMA-modell

F¨ or en s¨ asongsberoende modell beh¨ over ¨ aven ordningen av s¨ asongsparametrarna best¨ ammas. I steg 1 anv¨ ands ett test av s¨ asongsstyrka f¨ or att best¨ amma antalet s¨ asongsm¨ assiga differentieringar. I steg 2 ¨ ar modellerna som testas:

• SARIM A(0, d, 0)(0, D, 0)[m]

• SARIM A(2, d, 2)(1, D, 1)[m]

• SARIM A(1, d, 0)(1, D, 0)[m]

• SARIM A(0, d, 1)(0, D, 1)[m]

Om d + D ≤ 1 ¨ ar en konstant inkluderad. I steg 3 testas dessa variationer av den valda modellen:

• p, q, P och Q ¨ andras, separat, med ±1 fr˚ an den valda modellen.

• B˚ ade p och q ¨ andras med ±1 fr˚ an den valda modellen.

(18)

• B˚ ade P och Q ¨ andras med ±1 fr˚ an den valda modellen.

• Det testas att inkludera eller exkludera en konstant fr˚ an den nuvarande modellen.

[7].

(19)

3 Material och metod

H¨ ar introduceras det material som fanns tillg¨ angligt och hur det har sam- mast¨ allts samt hur teorin har applicerats f¨ or att skapa och utv¨ ardera prognoser.

3.1 R

Till detta arbete har programmeringsspr˚ aket R anv¨ ants, vilket ¨ ar ett spr˚ ak ska- pat f¨ or statistisk databehandling och grafik som ¨ ar gratis att anv¨ anda [9]. F¨ or att implementera modeller har paketet forecast anv¨ ants [7].

3.2 Dataarbete

Den f¨ orsta delen av arbetet bestod av att unders¨ oka, f¨ orst˚ a och bearbeta den data som fanns tillg¨ anglig.

3.2.1 Tillg¨ anglig data

Den data som har anv¨ ants i detta arbete samlades in under ˚ aren 2017 till 2019.

Den best˚ ar av tre delar.

En del ¨ ar data d¨ ar varje observation ¨ ar ett v˚ ardtillf¨ alle. Samma person kan h¨ ar finnas med flera g˚ anger om de s¨ oker v˚ ard f¨ or olika anledningar. H¨ ar finns en stor m¨ angd information om varje observation, som vilket omr˚ ade och avdelning den tillh¨ or, personuppgifter s˚ a som ˚ alder och k¨ on, orsak f¨ or v˚ ardkontakt, dia- gnosgrupp, och in- och utskrivningstid, tillsammans med ett unikt v˚ ardkontakt- id. Det som inte f˚ angas upp ¨ ar f¨ orflyttningar som g¨ ors mellan olika avdelningar under samma v˚ ardtillf¨ alle. Den ansvariga avdelningen s¨ atts normalt som den avdelningen som skriver ut patienten.

En annan del ¨ ar data ¨ over v˚ ardtillf¨ allena inklusive alla f¨ orflyttningar. H¨ ar

¨

ar varje observation en inskrivning p˚ a en avdelning, s˚ a kallade perioder. Det kan finnas flera observationer per v˚ ardkontakt-id. H¨ ar finns vilket omr˚ ade och avdelning perioden tillh¨ or, om patienten ¨ ar p˚ a permission och in- och utskriv- ningstid, tillsammans med ett unikt period-id. Det kan ¨ aven finnas f¨ orflyttningar inom samma avdelning. Det finns olika anledningar till detta. En anledning ¨ ar att patienten ¨ ar p˚ a permission, d¨ ar tidsperioden en patient ¨ ar p˚ a permission ger en ny observation och n¨ ar denne kommer tillbaka blir det ytterligare en ny observation.

Den sista delen ¨ ar disponibla v˚ ardplatser, det vill s¨ aga hur m˚ anga patienter det finns s¨ angar, personal och utrustning till, timme f¨ or timme. Detta ¨ ar n˚ agot som avdelningarna sj¨ alva rapporterar in i f¨ orv¨ ag. Vanligtvis ¨ andras inte detta s¨ arskilt ofta, men vissa avdelningar minskar antalet platser varje helg. Ofta kan antalet platser g˚ a ned ¨ over sommaren.

3.2.2 Val av metod

N¨ asta steg var att fundera ¨ over vilken av de tv˚ a metoder som framst¨ alls i

fr˚ agest¨ allningen som skulle v¨ aljas, och vilket data som beh¨ ovs f¨ or dem.

(20)

Metod 1 var att prognostisera komponenterna i kapacitetsformeln (Se Ek- vation 1) f¨ or att sedan ber¨ akna kapaciteten. F¨ or att g¨ ora detta granskades f¨ orst komponenterna f¨ or att avg¨ ora vilka som kan antas vara konstanta och vilka som varierar med tiden. Den tillg¨ angliga tiden, t kap , ans˚ ags konstant in- om slutenv˚ arden och ¨ ar alltid 24 timmar per dygn. Medelprocesstiden, t med , varierar dels p˚ a grund av skillnaden mellan olika patienter, dels p˚ a eventuel- la f¨ or¨ andringar p˚ a avdelningen, kring hur personalen jobbar, nya behandlingar eller rutiner. Den planerbara kapaciteten, P kap , varierar ¨ over tid, vilket exem- pelvis kan kopplas till helgdagar. Det kan ocks˚ a finnas en f¨ or¨ andring ¨ over tid p˚ a grund av f¨ or¨ andrat behov hos befolkningen. Nyttjandegraden, N , varierar ¨ over tid beroende p˚ a ett flertal olika anledningar. Denna komponent fanns det ingen data kring och f¨ or att arbeta med N skulle den beh¨ ova uppskattas till ett fixt v¨ arde.

Sedan analyserades formeln f¨ or att s¨ akerst¨ alla att den korrekt representerar den kapacitet som efterfr˚ agas. F¨ or en kapacitet per dygn skulle den tillg¨ angliga tiden, t kap , vara 24 timmar. Om medelprocesstiden, t med , var ¨ over 24 timmar st¨ amde dock inte formeln l¨ angre. D˚ a r¨ aknas det som att en patient m˚ aste bli utskriven inom 24 timmar och tar d¨ armed upp mer ¨ an en av de tillg¨ angliga platserna. Om avdelningarna som unders¨ oks har en l¨ angre medelprocesstid ¨ an 24 timmar skulle allts˚ a prognosen beh¨ ova g¨ oras exempelvis per vecka eller m˚ anad ist¨ allet. Om detta skulle vara fallet bed¨ omdes det som en mindre exakt och anv¨ andbar prognos, och kommer i s˚ a fall inte utf¨ oras.

Metod 2 var att prognostisera kapaciteten utan att anv¨ anda kapacitetsfor- meln (Se Ekvation 1). F¨ oljdfr˚ agan var d˚ a hur man ¨ aven f˚ ar fram prognosen f¨ or komponenterna i formeln. Beslutet blev att anv¨ anda sig av tidssereiemodellering f¨ or att prognostisera kapaciteten. Komponenterna som var intressanta att pro- gnostisera var den planerbara kapaciteten P kap och medelprocesstiden t med . Det beslutades att ¨ aven anv¨ anda sig av tidsseriemodellering f¨ or dessa. Tre separata prognoser skulle allts˚ a utf¨ oras per avdelning.

3.2.3 Sammanst¨ allning av data

F¨ or att utf¨ ora en tidsserieanalys beh¨ over datan vara p˚ a en form med j¨ amna tidsintervall, som skapas fr˚ an den tidigare beskrivna datan. Den ¨ onskade formen

¨ ar en rad f¨ or varje datum fr˚ an f¨ orsta januari 2017 och sista december 2019, och information g¨ allande just det datumet om variablerna kapacitet, planerbara kapaciteter och medelprocesstid, definierade i Ekvation 1. Visualisering av hur denna tabell ska se ut finns i Tabell 3.1.

Kapaciteten, K, ber¨ aknas utifr˚ an in- och utskrivningstid i det data d¨ ar f¨ orflyttningar ¨ ar inkluderade. F¨ orst sl˚ as sammanh¨ angande tidsperioder p˚ a sam- ma avdelning samman. Det vill s¨ aga om utskrivningstiden ¨ ar densamma som inskrivningstiden, p˚ a en eller flera observationer, f¨ or en och samma patient, sparas endast den tidigaste inskrivningen och den senaste utskrivningen. En patient r¨ aknas som inskriven under de heltimmar d˚ a in- och utskrivningen sker.

Exempelvis s˚ a kommer en patient som blir inskriven 13.50 och utskriven 14.30

r¨ aknas till b˚ ade timmen 13.00 och 14.00. F¨ or att f˚ a detta till dygnsbasis ist¨ allet

(21)

Tabell 3.1: Exempeltabell f¨ or de variabler som skulle sammanst¨ allas utifr˚ an det data som fanns tillg¨ angligt.

Datum Avdelning Kapacitet Planerbara kapaciteter Medelprocesstid

(K) (P kap ) (t med )

2017-01-01 Avdelning 1 21 25 7,21

2017-01-02 Avdelning 1 23 25 7,27

2017-01-03 Avdelning 1 22 25 7,35

. . .

. . .

. . .

. . .

. . .

2019-12-31 Avdelning 1 19 25 6,92

f¨ or per timme, tas medelv¨ ardet ut. F¨ or de som inte ¨ ar utskrivna ¨ an s¨ atts deras utskrivningstid utanf¨ or tidsperioden, s˚ a att de r¨ aknas med varje timme fr˚ an inskrivning. En patient tar upp en plats ¨ aven n¨ ar denna ¨ ar p˚ a permission. Ob- servationer med en total inskriven tid p˚ a mindre ¨ an eller lika med 5 minuter sorteras bort d˚ a de antas vara felregistreringar.

Den planerbara kapaciteten, P kap , ¨ ar angiven som antal platser per timme.

F¨ or att omvandla detta till dygn tas medelv¨ ardet ut.

Medelprocesstiden, t med , ber¨ aknas utifr˚ an det data som inkluderade f¨ orflyttningar, efter att f¨ orflyttningar inom samma avdelning lagts ihop. Den totala inlagda tiden ber¨ aknas f¨ or varje observation som utskrivningstiden minus inskrivningstiden. Eftersom detta ¨ ar ur ett patientperspektiv beh¨ ovde de defi- nieras om till dygnsperspektiv. Detta gjorde genom att f¨ or varje dygn ber¨ aknas medelv¨ ardet av de patienter som blivit utskrivna under de senaste 30 dagarna innan detta dygn. P˚ a grund av detta s¨ att att ber¨ akna medelprocesstiden finns ingen data f¨ or de f¨ orsta 30 dagarna av tidsserien.

3.2.4 Val av avdelningar

Vilka avdelningar som skulle unders¨ okas valdes baserat p˚ a att det fanns data

¨ over hela tidsperioden. Till en b¨ orjan valdes avdelningar som saknade kontinu- erligt data bort. Detta kan bero p˚ a att avdelningen bytt namn, slagits ihop med en annan avdelning eller st¨ angts ned, ibland bara under en tempor¨ ar period som exempelvis p˚ a sommaren. Det var ocks˚ a ¨ onskv¨ art att de tv˚ a avdelningar som valdes inte var allt f¨ or lika.

De tv˚ a avdelningar som valdes var ’Onkologi avdelning Ume˚ a’ och ’Psykia-

trisk avdelning 4 Ume˚ a’. Dessa kommer att ben¨ amnas som onkologiavdelningen

respektive den psykiatriska avdelningen. En ¨ overblick av dessa avdelningar g˚ ar

att se i Figur 3.1 och 3.2. Onkologiavdelningen behandlar tum¨ orsjukdomar och

jobbar med bland annat str˚ alning och cellgifter. V˚ ardfl¨ odet ¨ ar akut men g˚ ar att

planera p˚ a kort sikt. Den psykiatriska avdelningen v˚ ardar patienter med dubbel-

diagnos, det vill s¨ aga en patient med en psykiatrisk diagnos samt ett missbruk

av alkohol eller andra substanser, samt patienter i behov av avgiftning inf¨ or

vistelse p˚ a behandlingshem.

(22)

Figur 3.1: ¨ Overblick av onkologiavdelningen. H¨ ogst upp ses kapaciteten, sedan

den planerbara kapaciteten och till sist medelprocesstiden under ˚ aren 2017 till

2019.

(23)

Figur 3.2: ¨ Overblick av Psykiatrisk avdelning. H¨ ogst upp ses kapaciteten, sedan

den planerbara kapaciteten och till sist medelprocesstiden under ˚ aren 2017 till

2019.

(24)

3.2.5 Granskning av avdelningar

N¨ ar avdelningar var valda unders¨ oktes dessa f¨ or eventuella problem i datama- terialet. Det uppt¨ acktes att antalet inlagda patienter gick ned kraftigt under de sista dagarna av 2019 f¨ or b˚ ada avdelningarna. Detta var ¨ aven ˚ aterkommande p˚ a andra avdelningar och nedg˚ angen var st¨ orre ¨ an den nedg˚ ang som s˚ ags under slutet av 2017 och 2018. Det misst¨ anktes d¨ arf¨ or att en del patientregistreringar saknades. Nedg˚ angen ¨ ar tydlig de sista cirka 15 dagarna av 2019. ¨ Aven om det inte tydligt syntes finns en risk att det saknades fler registreringar, och d¨ arf¨ or avrundades det upp˚ at till 20. Dessa 20 dagar exkluderas fr˚ an tidsserien vid modellering av kapaciteten, K, samt medelprocesstiden, t med .

3.3 Tidsseriemodellering

Efter att dataarbetet var f¨ ardigt och tv˚ a avdelningar valts ut, var n¨ asta del av arbetet att skapa modeller f¨ or att prognostisera framtiden. D˚ a b˚ ada avdelning- arna hade en medelprocesstid p˚ a ¨ over 24 timmar, skulle prognostiseringen ske enligt Metod 2. Enligt Metod 2 ska prognostisering utf¨ oras p˚ a kapaciteten, den planerbara kapaciteten samt medelprocesstiden.

3.3.1 Tr¨ anings- och testdata

F¨ orsta steget i tidsseriemodelleringen var att dela upp datan i tr¨ anings- och testdata. 20 % kommer att anv¨ ands som testdata, vilket ¨ over en tre˚ arstid ¨ ar cirka sju m˚ anader. F¨ or kapaciteten, K, har 20 dagar exkluderats i slutet av tidsserien.

Det kvarstod 1075 dagar (cirka 153 veckor) i tidsserien och 215 av dessa dagar anv¨ andes som testdata (cirka 30 veckor). F¨ or den planerbara kapaciteten har inga dagar exkluderats och 219 av dessa dagar anv¨ andes som testdata. F¨ or medelprocesstiden har ocks˚ a 20 dagar exkluderats i slutet av tidsserien, samt 30 dagar i b¨ orjan av tidsserien. Det kvarstod 1045 dagar och 209 av dessa dagar anv¨ andes som testdata.

3.3.2 S¨ asong

Som n¨ asta steg unders¨ oktes ifall det fanns n˚ agon s¨ asongsvariation i tidsserien.

Detta gjordes visuellt med hj¨ alp av s¨ asongsgrafer. Dessa grafer visar hur data

¨ overlappar varandra vid en given s¨ asong. Det vill s¨ aga att om en s¨ asong p˚ a en vecka v¨ aljs, kommer den ˚ attonde datapunkten ligga p˚ a samma x-koordinat som den f¨ orsta datapunkten, och s˚ a vidare. Dessa skapades med hj¨ alp av funktionen seasonplot i R.

De s¨ asonger som valdes att unders¨ oka var de som k¨ andes naturliga f¨ or tidspe-

rioden, vilket var en vecka, en m˚ anad (30 dagar) och ett ˚ ar. Om ingen s¨ asong hit-

tades anv¨ andes inte den s¨ asongsnaiva metoden och det skapades ingen SARIMA-

modell.

(25)

3.3.3 Modeller

F¨ orst togs ett par enklare modeller fram. Dessa var medelv¨ ardesmetoden, den naiva metoden, den s¨ asongsnaiva metoden och trendmetoden. Dessa modeller anv¨ andes som j¨ amf¨ orelse mot senare modeller.

Sedan togs ett par mer avancerade modeller fram. Dessa anv¨ ande sig av Hyndman-Khandakar algoritmen f¨ or att hitta ing˚ aende parametrar.

B˚ ade ARIMA- och SARIMA-modellen togs fram med hj¨ alp av funktionen auto.arima i R. F¨ or b˚ ada valdes AICc som informationskriterie f¨ or att v¨ alja modell. BIC valdes bort eftersom det inte finns en sann underliggande modell.

3.3.4 J¨ amf¨ orelse och analys av modeller

N¨ ar modellerna tagits fram anv¨ andes dessa f¨ or att ta fram en prognos f¨ or li-

ka m˚ anga dagar som antalet dagar i testdatan. Det prognostiserade v¨ ardet

j¨ amf¨ ordes mot det riktiga v¨ ardet med hj¨ alp av RMSE och MAE. Den b¨ asta

modellen v¨ aljs och f¨ or denna unders¨ oks residualerna. Om flera modeller anses

likv¨ ardiga analyseras alla. Residualerna unders¨ oks grafiskt ifall de ¨ ar okorrele-

rade samt att medelv¨ ardet av residualerna ber¨ aknas.

(26)

4 Resultat

H¨ ar kommer resultatet av arbetet att presenteras. F¨ orst besvaras fr˚ agest¨ allningen sedan presenteras resultaten av prognostisering med vald metod p˚ a de tv˚ a avdel- ningarna separat.

4.1 Val av metod

Vid granskning av kapacitetesformeln drogs slutsatsen att Metod 1 inte kunde anv¨ andas. Anledningen var att kapacitetsformeln inte korrekt skulle representera kapaciteten ifall medelprocesstiden, t med , var l¨ angre ¨ an den tillg¨ angliga tiden, t kap . F¨ or en prognos p˚ a dygnsbasis beh¨ over medelprocesstiden vara under 24 timmar. P˚ a de avdelningar som granskats var detta ej fallet.

Ist¨ allet anv¨ andes Metod 2 och f¨ or att f˚ a fram prognoser p˚ a komponenterna i kapacitetsformeln skapades de p˚ a samma s¨ att som f¨ or kapaciteten. Progno- ser utf¨ ordes allts˚ a separat p˚ a kapaciteten, den planerbara kapaciteten och p˚ a medelprocesstiden.

4.2 Onkologi avdelning Ume˚ a

4.2.1 Kapacitet

Till en b¨ orjan unders¨ oktes ifall det fanns ett s¨ asongberoende i tidsserien f¨ or kapaciteten med hj¨ alp av s¨ asongsgrafer, se Figur 4.1. En s¨ asong p˚ a sju dagar anv¨ ands i modelleringen. Prognoserna fr˚ an de sex modeller som skapades f¨ or kapaciteten kan ses i Figur A.1, A.2, A.3, A.4, A.5 och A.6 i Bilaga A. Hur dessa modeller presterade mot testdata kan ses i Tabell 4.1. L¨ agst v¨ arde f¨ or b˚ ade RMSE och MAE gavs av SARIMA-modellen, f¨ oljt av den s¨ asongsnaiva metoden, medan h¨ ogst v¨ arde gavs av den naiva metoden. Residualerna f¨ or SARIMA- och den s¨ asongsnaiva modellen ses i Figur 4.2 och 4.3.

Tabell 4.1: RMSE och MAE f¨ or kapacitetsprognos p˚ a onkologiavdelningen vid utv¨ ardering mot testdata.

Modell RMSE MAE

Medelv¨ ardesmetoden 5,62 4,65

Naiv metod 6,41 5,15

S¨ asongsnaiv metod 4,45 3,73

Trendmetod 6,22 4,99

ARIMA-modell 5,29 4,35

SARIMA-modell 4,18 3,47

(27)

Figur 4.1: S¨ asongsgrafer f¨ or kapaciteten p˚ a onkologiavdelningen, med s¨ asong 7

dagar, 30 dagar och 365 dagar.

(28)

Figur 4.2: Residualer av SARIMA-modellen p˚ a kapaciteten p˚ a onkologiavdel- ningen. Medelv¨ ardet av residualerna ¨ ar -0,002.

Figur 4.3: Residualer av den s¨ asongsnaiva metoden p˚ a kapaciteten p˚ a onkologi- avdelningen. Medelv¨ ardet av residualerna ¨ ar 0,006.

4.2.2 Planerbara kapaciteter

S¨ asongberoende i tidsserien f¨ or den planerbara kapaciteten unders¨ oktes med hj¨ alp av s¨ asongsgrafer, se Figur 4.4. En s¨ asong p˚ a sju dagar anv¨ ands i model- leringen. Prognoserna fr˚ an de sex modeller som skapades f¨ or den planerbara kapacitetern kan ses i Figur A.7, A.8, A.9, A.10, A.11 och A.12 i Bilaga A.

Hur dessa modeller presterade mot testdata kan ses i Tabell 4.2. L¨ agst v¨ arde

f¨ or RMSE gavs av SARIMA-modellen och f¨ or MAE av den s¨ asongsnaiva meto-

den, medan h¨ ogst v¨ arde gavs av den naiva metoden f¨ or b˚ ada. Residualerna f¨ or

SARIMA- och den s¨ asongsnaiva modellen ses i Figur 4.5 och 4.6.

(29)

Figur 4.4: S¨ asongsgrafer f¨ or den planerbara kapaciteten p˚ a onkologiavdelningen,

med s¨ asong 7 dagar, 30 dagar och 365 dagar.

(30)

Tabell 4.2: RMSE och MAE f¨ or prognos ¨ over planerbara kapaciteter p˚ a onkolo- giavdelningen vid utv¨ ardering mot testdata.

Modell RMSE MAE

Medelv¨ ardesmetoden 4,97 3,91

Naiv metod 5,99 5,02

S¨ asongsnaiv metod 4,53 2,32

Trendmetod 5,71 4,88

ARIMA-modell 5,00 3,97

SARIMA-modell 4,24 2,39

Figur 4.5: Residualer av SARIMA-modellen p˚ a den planerbara kapaciteten p˚ a onkologiavdelningen. Medelv¨ ardet av residualerna ¨ ar 0,018.

Figur 4.6: Residualer av den s¨ asongsnaiva metoden p˚ a den planerbara kapaci-

teten p˚ a onkologiavdelningen. Medelv¨ ardet av residualerna ¨ ar 0,050.

(31)

4.2.3 Medelprocesstid

S¨ asongberoende i tidsserien f¨ or medelprocesstiden unders¨ oktes med hj¨ alp av s¨ asongsgrafer, se Figur 4.8. Ingen s¨ asong anv¨ ands i modelleringen. Prognoserna fr˚ an de fyra modeller som skapades f¨ or medelprocesstiden kan ses i Figur A.13, A.14, A.15 och A.16 i Bilaga A. Hur dessa modeller presterade mot testdata kan ses i Tabell 4.3. L¨ agst v¨ arde f¨ or b˚ ade RMSE och MAE gavs av den naiva metoden, medan h¨ ogst v¨ arde gavs av medelv¨ ardesmetoden. Residualerna f¨ or den naiva modellen ses i Figur 4.7.

Tabell 4.3: RMSE och MAE f¨ or prognos ¨ over medelprocesstiden p˚ a onkologiav- delningen vid utv¨ ardering mot testdata.

Modell RMSE MAE

Medelv¨ ardesmetoden 28,24 26,10

Naiv metod 12,68 10,18

Trendmetod 13,44 11,00

ARIMA-modell 27,00 24,39

Figur 4.7: Residualer av den naiva metoden p˚ a medelprocesstiden p˚ a onkologi-

avdelningen. Medelv¨ ardet av residualerna ¨ ar -0,088.

(32)

Figur 4.8: S¨ asongsgrafer f¨ or medelprocesstiden p˚ a onkologiavdelningen, med

s¨ asong 7 dagar, 30 dagar och 365 dagar.

(33)

4.3 Psykiatrisk avdelning 4 Ume˚ a

4.3.1 Kapacitet

Till en b¨ orjan unders¨ oktes ifall det fanns ett s¨ asongberoende i tidsserien f¨ or kapaciteten med hj¨ alp av s¨ asongsgrafer, se Figur 4.10. Ingen s¨ asong anv¨ ands i modelleringen. D¨ arf¨ or skapas ingen prognos med hj¨ alp av den s¨ asongsnaiva metoden eller SARIMA-modell. Prognoserna fr˚ an de fyra modeller som skapades f¨ or kapacitetern kan ses i Figur A.17, A.18, A.19 och A.20 i Bilaga A. Hur dessa modeller presterade mot testdata kan ses i Tabell 4.4. L¨ agst v¨ arde f¨ or b˚ ade RMSE och MAE gavs av medelv¨ ardesmetoden, medan h¨ ogst v¨ arde gavs av trendmetoden. Residualerna f¨ or medelv¨ ardesmetoden ses i Figur 4.9.

Tabell 4.4: RMSE och MAE f¨ or kapacitetsprognos p˚ a den psykiatriska avdel- ningen vid utv¨ ardering mot testdata.

Modell RMSE MAE

Medelv¨ ardesmetoden 2,36 1,92

Naiv metod 3,55 3,00

Trendmetod 4,37 3,80

ARIMA-modell 3,31 2,76

Figur 4.9: Residualer av medelv¨ ardesmetoden p˚ a kapaciteten p˚ a den psykiatriska avdelningen. Medelv¨ ardet av residualerna ¨ ar 9,689 ∗10 −17 .

4.3.2 Planerbara kapaciteter

S¨ asongberoende i tidsserien f¨ or den planerbara kapaciteten unders¨ oktes med hj¨ alp av s¨ asongsgrafer, se Figur 4.11. Ingen s¨ asong anv¨ ands i modelleringen.

Prognoserna fr˚ an de sex modeller som skapades f¨ or den planerbara kapacitetern

kan ses i Figur A.21, A.22, A.23 och A.24 i Bilaga A. Den naiva metoden och

trendmetoden gav exakt samma modell d˚ a det inte var n˚ agon lutning mellan

(34)

Figur 4.10: S¨ asongsgrafer f¨ or kapaciteten p˚ a den psykiatriska avdelningen, med

s¨ asong 7 dagar, 30 dagar och 365 dagar.

(35)

Figur 4.11: S¨ asongsgrafer f¨ or den planerbara kapaciteten p˚ a den psykiatriska avdelningen, med s¨ asong 7 dagar, 30 dagar och 365 dagar.

f¨ orsta och sista observationen. ARIMA-modellen som valdes hade parametrarna (0,1,1) och gav samma prognos som de tv˚ a tidigare n¨ amnda metoderna, fast inte samma modell. Hur dessa modeller presterade mot testdata kan ses i Tabell 4.5.

De tre modeller som gav samma prognos gav l¨ agst v¨ arde f¨ or RMSE och MAE i j¨ amf¨ orelse mot testdata, medan medelv¨ ardesmetoden gav ett h¨ ogre v¨ arde.

Residualerna f¨ or den naiva metoden och ARIMA-modellen ses i Figur 4.12 och 4.13.

Tabell 4.5: RMSE och MAE f¨ or prognos av planerbara kapaciteter p˚ a den psy- kiatriska avdelningen vid utv¨ ardering mot testdata.

Modell RMSE MAE

Medelv¨ ardesmetoden 0,44 0,39

Naiv metod 0,35 0,06

Trendmetod 0,35 0,06

ARIMA-modell 0,35 0,06

(36)

Figur 4.12: Residualer av den naiva metoden p˚ a den planerbara kapaciteten p˚ a den psykiatriska avdelningen. Medelv¨ ardet av residualerna ¨ ar 0.

Figur 4.13: Residualer av ARIMA-modellen p˚ a den planerbara kapaciteten p˚ a den psykiatriska avdelningen. Medelv¨ ardet av residualerna ¨ ar 1,483 ∗10 −5 .

4.3.3 Medelprocesstid

S¨ asongberoende i tidsserien f¨ or medelprocesstiden unders¨ oktes med hj¨ alp av s¨ asongsgrafer, se Figur 4.15. Ingen s¨ asong anv¨ ands i modelleringen. Prognoserna fr˚ an de fyra modeller som skapades f¨ or medelprocesstiden kan ses i Figur A.25, A.26, A.27 och A.28 i Bilaga A. ARIMA-modellen som valdes hade parametrar- na (0,1,0) och gav samma prognos som den naiva metoden. Hur dessa modeller presterade mot testdata kan ses i Tabell 4.6. L¨ agst v¨ arde f¨ or b˚ ade RMSE och MAE gavs av medelv¨ ardesmetoden, medan h¨ ogst v¨ arde gavs av trendmetoden.

Residualerna f¨ or medelv¨ ardesmetoden ses i Figur 4.14.

(37)

Tabell 4.6: RMSE och MAE f¨ or prognos av medelprocesstid p˚ a den psykiatriska avdelningen vid utv¨ ardering mot testdata.

Modell RMSE MAE

Medelv¨ ardesmetoden 44,35 33,53

Naiv metod 97,31 88,90

Trendmetod 114,65 105,39

ARIMA-modell 97,31 88,90

Figur 4.14: Residualer av medelv¨ ardesmetoden p˚ a medelprocesstiden p˚ a den

psykiatriska avdelningen. Medelv¨ ardet av residualerna ¨ ar 1,009 ∗10 −14 .

(38)

Figur 4.15: S¨ asongsgrafer f¨ or medelprocesstiden p˚ a den psykiatriska avdelning-

en, med s¨ asong 7 dagar, 30 dagar och 365 dagar.

(39)

5 Analys och slutsats

H¨ ar kommer det resultat som presenterats att analyseras och att en del slutsatser kommer att dras.

5.1 Val av metod

Vid valet mellan de tv˚ a metoderna, f¨ oll valet p˚ a Metod 2 f¨ or att Metod 1 inte skulle ge en korrekt prognos p˚ a dygnsbasis. Denna slutsats drogs under vissa f¨ oruts¨ attningar. Mer specifikt att prognosen skulle skapas p˚ a dygnsbasis, det vill s¨ aga att den tillg¨ angliga tiden var 24 timmar samt att medelprocesstiden var l¨ angre ¨ an 24 timmar. Om en prognos p˚ a exempelvis vecko- eller m˚ anadsbasis var ¨ onskv¨ ard, vilket kanske ¨ ar mer rimligt f¨ or en l¨ angre prognoshorisont, skulle inte slutsatsen h˚ alla. P˚ a samma s¨ att kan det finnas avdelningar med kortare medelprocesstid, exempelvis inom ¨ oppenv˚ arden.

Under andra f¨ oruts¨ attningar kan Metod 1 vara m¨ ojlig att anv¨ anda. Dock skulle ett problem kvarst˚ a, n¨ amligen os¨ akerheten kring nyttjandegraden, N . Den innefattar m˚ anga faktorer samtidigt som det inte finns n˚ agon data kring dessa faktorer. Att uppskatta nyttjandegraden ¨ ar allts˚ a inte en enkel uppgift och det troliga ¨ ar att det skulle resultera i en mer os¨ aker prognos.

5.2 Onkologi avdelning Ume˚ a

F¨ or b˚ ade kapaciteten och den planerbara kapaciteten syns en tydlig uppg˚ ang i mitten av veckan f¨ or en s¨ asong p˚ a sju dagar. D¨ arf¨ or dras slutsatsen att det finns en korrelation mellan kapaciteten och de planerbara kapaciteterna mot vilken veckodag det ¨ ar. Detta k¨ anns som en naturlig koppling att samma s¨ asong finns i b˚ ade kapaciteten och de planerbara kapaciteterna. Om antalet planerbara kapaciteter minskar p˚ a helger, f¨ or att man till exempel minskar p˚ a personal,

¨ ar det inte f¨ orv˚ anande att ¨ aven antalet patienter som behandlas minskar. Det omv¨ anda skulle ¨ aven kunna vara fallet, att om f¨ arre patienter s¨ oker v˚ ard p˚ a helger, ¨ ar det inte f¨ orv˚ anande om man drar ned p˚ a personalen. F¨ or s¨ asongerna om 30 och 365 dagar syns inte ett tydligt m¨ onster, och det antas inte finnas ett starkt s¨ asongberoende f¨ or dessa tidsperioder.

Av de modeller som skapades f¨ or kapaciteten presterade SARIMA-modellen b¨ ast mot testdata. Den s¨ asongsnaiva metoden gav ett resultat som ocks˚ a var mycket bra. Mellan SARIMA-modellen och den s¨ asongsnaiva metoden skiljde sig RMSE och MAE med cirka 0,3. Detta kan j¨ amf¨ oras med att mellan SARIMA- modellen och den tredje b¨ asta modellen, ARIMA, skiljde sig RMSE och MAE med ungef¨ ar 1. D˚ a den s¨ asongsnaiva metoden ¨ ar mycket enklare ¨ ar detta ett imponerande resultat och tyder p˚ a att s¨ asongsberoendet ¨ ar mycket starkt p˚ a avdelningen. Hur v¨ al den s¨ asongsnaiva metod kan prediktera kan dock vara mer op˚ alitligt d˚ a den ¨ ar beroende av att sista veckan i tidsserien ¨ ar representabel f¨ or

¨ ovriga veckor. Vid val av annan procentuell f¨ ordelning av tr¨ anings- och testdata

hade kanske denna metod presterat s¨ amre. F¨ or SARIMA-modellen b¨ or det ha

(40)

en mindre p˚ averkan, d˚ a denna modell tar h¨ ansyn till flera veckor bak˚ at i tiden.

Detta reflekteras i att SARIMA-modellen har ett smalare prediktionsintervall.

F¨ or SARIMA-modellen ser residualerna ut som vitt brus, medan f¨ or den s¨ asongsnaiva metoden ¨ ar de korrelerade. Detta tyder p˚ a, precis som f¨ or RMSE och MAE, att SARIMA-modellen b¨ attre f˚ angat upp egenskaperna av tidsserien och kan ge mer exakta prognoser.

F¨ or den planerbara kapaciteten liknar resultaten dem f¨ or kapaciteten.

SARIMA-modellen var igen den som presterade b¨ ast mot testdata, med den s¨ asongsnaiva metoden som tv˚ aa. ¨ Aven h¨ ar kan slutsatsen dras att s¨ asongsberoendet ¨ ar mycket starkt. Igen s˚ a ser residualerna ut som vitt brus f¨ or SARIMA-modellen, medan f¨ or den s¨ asongsnaiva metoden ¨ ar de korrelerade.

F¨ or b˚ ada ¨ ar ¨ ar residualerna exakt noll oftare ¨ ar de var f¨ or modellerna f¨ or kapaciteten.

F¨ or medelprocesstiden kunde inte en s¨ asong identifieras och d¨ arf¨ or kunde tv˚ a av modellerna inte anv¨ andas. Av de fyra modeller som skapade presterade den naiva metoden b¨ ast, f¨ oljt av trendmetoden. F¨ or den naiva metoden ser residualerna ut som vitt brus. De tv˚ a andra modellerna presterade betydligt s¨ amre, d˚ a RMSE och MAE var mer ¨ an det dubbla mot de f¨ orsta. Att ARIMA- modellen presterade s˚ a pass mycket s¨ amre tyder p˚ a att tidsserien var instabil och utan tydliga m¨ onster.

5.3 Psykiatrisk avdelning 4 Ume˚ a

P˚ a denna avdelning kunde inte en s¨ asong identifieras f¨ or kapaciteten, de pla- nerbara kapaciteterna eller medelprocesstiden. Att ett s¨ asongsberoende kunde hittas p˚ a onkologiavdelningen men inte p˚ a den psykiatriska avdelningen beror nog p˚ a skillnaderna mellan hur verksamheten ¨ ar upplagd. P˚ a onkologiavdelning- en har man m¨ ojlighet att planerera sin verksamhet, om ¨ an endast p˚ a kortsikt.

Det g¨ or att kapaciteten och den planerbara kapaciteten g˚ ar ned p˚ a helger.

F¨ or alla tre komponenterna gav ocks˚ a n˚ agon av de enklare prognosmetoderna ett b¨ attre eller samma resultat som ARIMA-modellen.

F¨ or den planerbara kapaciteten kan vi se att den n¨ astan aldrig f¨ or¨ andras och det ¨ ar tydligt att den b¨ asta prognosen ¨ ar att f¨ oruts¨ atta att den kommer forts¨ atta vara of¨ or¨ andrad. Residualerna f¨ or de tv˚ a b¨ asta modellerna ¨ ar f¨ or det mesta noll.

F¨ or b˚ ade kapaciteten och medelprocesstiden var det medelv¨ ardesmetoden

som gav det b¨ asta resultatet. Residualerna var korrelerade f¨ or b˚ ada tv˚ a och

modellen anses allts˚ a inte ha f˚ angat upp egenskaperna av tidssereien. B˚ ada dessa

visade sig allts˚ a sv˚ ara att prognostisera, d˚ a ingen modell gav ett bra resultat

med okorrelerade residualer.

(41)

6 Diskussion

H¨ ar kommer kommer arbetet i sin helhet att diskuteras, inklusive den metod och de modeller som anv¨ ants, felk¨ allor och utvecklingsm¨ ojligheter.

6.1 Modeller

N˚ agon av de fyra enklare modellerna visade sig ge den b¨ asta prognosen i fyra av de sex fallen som modellerats, och i de tv˚ a andra fallen var ocks˚ a en av de enklare modellerna n¨ astan likv¨ ardig den b¨ asta modellen. Detta p˚ avisar hur vik- tigt det ¨ ar att j¨ amf¨ ora med ett par enklare modeller och tyder p˚ a att avancerade modeller inte alltid beh¨ ovs. V¨ art att notera ¨ ar ocks˚ a att antalet parametrar i de avancerade modellerna valde ut av en stegvis algoritm, och det kan finnas andra kombinationer av parametrar som ger ett b¨ attre resultat.

F¨ or de tv˚ a avdelningar som analyserats kunde endast ett s¨ asongsberoende hittas f¨ or en av dem, och det var p˚ a sju dagar. Det ¨ ar m¨ ojligt att andra s¨ asongsberoenden finns, men f¨ or l¨ angre perioder, som ett ˚ ar, hade nog ett st¨ orre datamaterial beh¨ ovts.

F¨ or b˚ ada avdelningarna var medelprocesstiden sv˚ ar att prognostisera, vilket kanske beror p˚ a s¨ attet medelprocesstiden ber¨ aknades och modellerades. Som den ber¨ aknades nu ¨ ar den v¨ aldigt instabil fr˚ an dag till dag. Att g¨ ora en prognos p˚ a dygnsbasis ¨ ar kanske inte n¨ odv¨ andigt, utan vecko- eller m˚ anadsbasis kan vara mer l¨ ampligt. P˚ a m˚ anadsbasis kan medelprocesstiden ber¨ aknas som medelv¨ ardet av alla patienter utskrivna den m˚ anaden. D˚ a skulle en utskriven patient inte inkluderas flera g˚ anger som de g¨ or nu, d˚ a en patient p˚ averkar medelprocesstiden 30 dagar fram˚ at. Ett annat s¨ att att motverka instabiliteten ¨ ar att unders¨ oka hur stor inverkan extremv¨ arden har p˚ a medelv¨ ardet, och eventuellt exkludera dem.

6.2 Alternativa metoder

I en artikel av N. Bouckaert, K. Van den Heede och C. Van de Voorde diskuterar de hur prognostisering av sjukv˚ ardstj¨ anster kan f¨ orb¨ attras [3]. De unders¨ oker en tidigare prognos av antalet slutenv˚ ardspatienter och hur den har presterat nu n¨ ar tidshorisonten f¨ or prognosen har passerat. Prognosen skapades ˚ ar 2005 och prognostiserade till och med ˚ ar 2015. De fyra punkter de anser kan f¨ orb¨ attra en prognos ¨ ar regelbunden uppdatering, inte fixera variabler till n˚ agot konstant om en bra prognos f¨ or variabeln finns (i detta fall hade de fixerat v˚ ardtiden till ett medelv¨ arde av ˚ aren 2000-2002), ta h¨ ansyn till information kring demografiska uppgifter hos befolkningen och patienter samt att utf¨ ora en k¨ anslighetsanalys p˚ a prognosen. De drar slutsatsen att kapaciteten ¨ ar beroende av m˚ anga f¨ or¨ anderliga och of¨ oruts¨ agbara faktorer. I deras fall handlar det om en tidshorisont p˚ a tio

˚ ar, vilket ¨ ar betydligt l¨ angre ¨ an det som unders¨ okts i detta arbete. Ju l¨ angre

tidshorisont man vill prognostisera desto os¨ akrare kommer prognoserna att va-

ra. N˚ agra exempel p˚ a faktorer som har st¨ orre p˚ averkan n¨ ar det handlar om

l¨ angre tidshorisoner, som inte diskuterats i detta arbete, ¨ ar effekterna av en

(42)

¨ okande/minskande befolkningsm¨ angd, ˚ aldrande befolkning, politisk inverkan, ekonomiska kriser, strejker eller andra of¨ oruts¨ agbara h¨ andelser.

I en studie gjord p˚ a Norrlands universitetssjukhus av R. Sk¨ arby, E. Chorell och P. Karling s˚ ag man att av alla patienter som lades in p˚ a medicinklini- ken s˚ a upptog de patienter med en v˚ ardtid under 3 dygn 14 % av de belagda sjukhuss¨ angarna [10]. Detta trots att dessa patienter var h¨ alften av det totala antalet patienter. I motsats tog de 24 % av patienterna med en v˚ ardtid l¨ angre ¨ an 5 dygn, upp 65 % av sjukhuss¨ angarna. Patienter med kort v˚ ardtid har allts˚ a en liten inverkan p˚ a bel¨ aggningen. Att ta h¨ ansyn till detta kan m¨ ojligen f¨ orb¨ attra modelleringen. Detta kan g¨ oras genom att modellera olika diagnosgrupper se- parat, ifall det finns en skillnad mellan dessa diagnosgruppers v˚ ardtider.

6.3 Felk¨ allor

En eventuell felk¨ alla i detta arbete ¨ ar det data som anv¨ ants. Det finns alltid en risk f¨ or felregistreringar, inte minst n¨ ar de registreras manuellt. Eftersom en del observationer tillsynes saknas i slutet av sista ˚ aret, finns en risk att detta var fallet under en l¨ angre period ¨ an den som valdes att exkluderas. ¨ Aven annan data kan vara felregistrerad utan att ha blivit uppt¨ ackt.

6.4 Utvecklingsm¨ ojligheter

En direkt utveckling av detta arbete ¨ ar att anv¨ anda tester f¨ or att hitta eventuella s¨ asongsberoenden samt avg¨ ora ifall residualerna fr˚ an en modell ¨ ar vitt brus.

Nu har dessa tv˚ a endast analyserats grafiskt, och tester skulle kunna ge andra resultat eller ge mer trov¨ ardighet till de slutsatser som dras.

En ¨ onskv¨ ard utveckling av arbetet ¨ ar att faktiskt skapa prognoser f¨ or framtiden. De ska anv¨ andas f¨ or ett f¨ orb¨ attrat planeringsarbete som i sin tur f¨ orhoppningsvis leder till att sjukv˚ ardens resurser anv¨ ands s˚ a effektivt som m¨ ojligt. Nu skapas endast prognoser som j¨ amf¨ ors mot testdata och resultatet av detta ¨ ar att slutsatser kring vilka modeller som passar f¨ or olika tillf¨ allen kan dras, men inga prognoser f¨ or framtiden har skapats. I det h¨ ar arbetet har prognoser f¨ or en tidshorisont p˚ a cirka sju m˚ anader skapats, men det

¨ ar m¨ ojligtvis inte den mest intressanta tidshorisonten. Ett f¨ orsta steg i att skapa prognoser kan vara att best¨ amma vilken eller vilka tidshorisoner som ¨ ar mest intressanta i detta planeringsarbete, samt hur ofta dessa prognoser ska uppdateras. Dessa beslut b¨ or tas i samr˚ ad med dem som ska anv¨ anda sig av prognoserna.

I det h¨ ar arbetet begr¨ ansades tidshorisonten f¨ or prognostiseringen av det

tillg¨ angliga datamaterialet. Exaktheten av prognoserna har j¨ amf¨ orts mot test-

data, men kan inte s¨ akerst¨ allas f¨ or l¨ angre tidshorisonter. Att unders¨ oka alter-

nativ f¨ or att prognostisera en l¨ angre tidshorisont ¨ ar en intressant utveckling av

projektet som kan vara anv¨ andbar f¨ or f¨ orb¨ attrad planering. Exempel p˚ a hur

detta kan g¨ oras ¨ ar att unders¨ oka m¨ ojligheten att sammanf¨ ora eventuellt ¨ aldre

datamaterial med det som har anv¨ ants h¨ ar eller att extrapolera det tillg¨ angliga

datamaterialet med exempelvis bootstrapping.

(43)

En annan potentiell utvecklingsm¨ ojlighet f¨ or detta projekt ¨ ar att utveckla modellerna, exempelvis genom att ta h¨ ansyn till andra variabler ¨ an den som ska prognostiseras. Detta kan g¨ oras med till exempel multivariat tidsserieana- lys. F¨ or en kapacitetsprognos kan d˚ a ¨ aven den planerbara kapaciteten anv¨ andas i modelleringen. Andra variabler som eventuellt ¨ ar intressanta ¨ ar ifall det ¨ ar en helgdag och demografiska uppgifter om befolkningen eller patienterna. Att unders¨ oka v¨ ardet av att modellera olika diagnosgrupper separat, som n¨ amndes tidigare, ¨ ar en annan utvecklingsm¨ ojlighet. Ett annat s¨ att att utveckla model- lerna ¨ ar genom att utf¨ ora korsvalidering f¨ or s¨ akrare prognoser.

Det ¨ ar ocks˚ a intressant att vidare unders¨ oka medelprocesstiden och hur den

b¨ or ber¨ aknas och modelleras f¨ or ett b¨ attre resultat.

(44)

7 Referenser

[1] P. Hanson A. Fredriksson. Ber¨ akning av tillverkningskapacitet i ett produktionsavsnitt. Chalmers tekniska h¨ ogskola, 2013. url: http : / / publications . lib . chalmers . se / records / fulltext / 178614 / 178614.pdf.

[2] S. Alm och T. Britton. Stokastik: Sannolikhetsteori och statistikte- ori med till¨ ampningar. Stockholm, Sweden: Liber AB, 2008. isbn:

978-91-47-05351-3.

[3] N. Bouckaert, K. Van den Heede och C. Van de Voorde. ”Improving the forecasting of hospital services: A comparison between projections and ac- tual utilization of hospital services”. I: Health Policy 122.7 (2018), s. 728–

736. doi: https://doi.org/10.1016/j.healthpol.2018.05.010.

[4] P. Brockwell och R. Davis. Introduction to Time Series and Forecasting.

3. utg. Switzerland: Springer, 2016. isbn: 9783319298528.

[5] R.J. Hyndman. forecast v8.3 now on CRAN. 14 april 2018. url: https:

//robjhyndman.com/hyndsight/forecast83/. (H¨ amtad: 2020-05-27).

[6] R.J. Hyndman och G. Athanasopoulos. Forecasting: principles and practice. 2. utg. Melbourne, Australia: OTexts, 2018. url: OTexts.com/

fpp2. (H¨ amtad: 2020-04-17).

[7] R.J. Hyndman och Y. Khandakar. ”Automatic Time Series Forecasting:

The forecast Package for R”. I: Journal of Statistical Software 27.3 (2008).

url: https://doaj.org/article/9b35f41cb88047e78e3d8edab6cd8d99.

[8] D. Kwiatkowski m. fl. ”Testing the null hypothesis of stationarity against the alternative of a unit root”. I: Journal of Econometrics 54.1-3 (1992), s. 159–178. doi: https://doi.org/10.1016/0304-4076(92)90104-Y.

[9] R Core Team. R: A Language and Environment for Statistical Compu- ting. R Foundation for Statistical Computing. Vienna, Austria, 2019. url:

https://www.R-project.org/.

[10] R. Sk¨ arby, E. Chorell och P. Karling. ” ¨ Okat omv˚ ardnadsbehov fr¨ amsta orsak till l˚ ang v˚ ardtid p˚ a medicinklinik: Retrospektiv journalstudie styrker att tidig v˚ ardplanering skulle kunna ge b¨ attre platstillg˚ ang”. I:

L¨ akartidningen 111.6 (2014), s. 219–222. url: http : / / urn . kb . se / resolve?urn=urn:nbn:se:umu:diva-128595.

[11] X. Wang, K.A. Smith och R.J. Hyndman. ”Characteristic-based cluste- ring for time series data”. I: Data Mining and Knowledge Discovery 13.3 (2006), s. 335–364. doi: https://doi.org/10.1007/s10618-005-0039- x.

[12] W. Wei. Time Series Analysis: Univariate and Multivariate Methods.

2. utg. USA: Pearson Education, 2006. isbn: 0-321-32216-9.

[13] Region V¨ asterbotten. Det h¨ ar g¨ or regionen. 12 dec. 2019. url: https:

//regionvasterbotten.se/det-har-gor-regionen. (H¨ amtad: 2020-02-

04).

(45)

A Bilagor

Figur A.1: Prognos f¨ or kapaciteten p˚ a onkologiavdelningen med hj¨ alp av me- delv¨ ardesmetoden med 80 % och 95 % prognosintervall.

Figur A.2: Prognos f¨ or kapaciteten p˚ a onkologiavdelningen med hj¨ alp av den

naiva metoden med 80 % och 95 % prognosintervall.

References

Related documents

[r]

Element¨ ar gruppteori, hemuppgifter till torsdag vecka 401. Vilka element kan v¨aljas som generator f¨ or

[r]

(b) Ber¨ akna den betingade sannolikheten att komponent C inte funkar givet att str¨ om kan passera genom systemet fr˚ an v¨ anster till h¨ oger..

Man kan faktiskt g¨ora ett konfidensintervall f¨or medianen med konfidensgrad minst lika med 1 − α helt utan n˚ agra som helst antaganden om den bakom- liggande f¨ordelningen

Po¨ angen p˚ a godk¨ anda duggor summeras och avg¨ or slutbetyget.. L¨ osningarna skall vara v¨ almotiverade och

[Tips: Faktorisera polyno-

Endast definitioner och trigonometriska r¨ aknelagar f˚ ar anv¨ andas utan att de f¨ orst bevisas. Sida 2