• No results found

Prognostisering av fjärrvärmekunders effektförbrukning

N/A
N/A
Protected

Academic year: 2021

Share "Prognostisering av fjärrvärmekunders effektförbrukning"

Copied!
77
0
0

Loading.... (view fulltext now)

Full text

(1)

UPTEC ES 18 033

Examensarbete 30 hp

Juli 2018

Prognostisering av fjärrvärmekunders

effektförbrukning

Metod för hur Stockholm Exergi kan öka kvaliteten

i simuleringsmodeller av fjärrvärmenätet

Joakim Stålnacke

(2)

Teknisk- naturvetenskaplig fakultet UTH-enheten

Besöksadress:

Ångströmlaboratoriet Lägerhyddsvägen 1 Hus 4, Plan 0

Postadress:

Box 536 751 21 Uppsala

Telefon:

018 – 471 30 03

Telefax:

018 – 471 30 00

Hemsida:

http://www.teknat.uu.se/student

Abstract

Predictions of power consumption of district heating

consumers

Joakim Stålnacke

A method for predicting consumer heat power usage was examined, for the purpose of implementing such a method in simulation models of the district heating

distribution network at Stockholm Exergi. This was to enhance the results of such simulations and aid the company’s work with distribution optimization. A method based on power signatures, which are models currently used in many applications, was examined. The method aspired to describe the consumption patterns of consumers over time and temperature, categorize consumers according to these patterns and then implement the results in the simulation models.

The addition of a time parameter to the signatures resulted in an improved and more consistent prediction quality. Categorizing the consumers mathematically caused only a minor decrease in the prediction quality and resulted in better prediction quality than the categorization system currently used. Stockholm Exergi is adviced to keep examining mathematical categorization of consumers as such a categorization has several advantages to the one currently used. It is also recommended to examine options to Termis for performing individual consumer predictions as the program is not well suited for it. Such options could be other software or add-ons to Termis which make such predictions more viable.

ISSN: 1650-8300, UPTEC ES** ***

Examinator: Petra Jönsson Ämnesgranskare: Mikael Höök Handledare: Catharina Solén

(3)

Sammanfattning

På Stockholm Exergi används mjukvaran Termis för att utföra simuleringar på modeller av fjärrvärmenätet. En brist i dessa modeller är att de i dagsläget inte inkluderar prediktioner av värmekundernas förbrukning. För majoriteten av användningar är avsaknaden av prediktioner inte ett problem då det finns en funktion i programmet som kompenserar för avsaknaden av prediktioner. På de delar av fjärrvärmenätet som ligger närmare kunderna klarar dock inte funktionen att kompensera i lika hög grad och resultaten där blir lidande. Examensarbetet har syftat till att hitta en metod för att prognostisera kunders effektförbrukning och applicera prognostiseringen i Termis simuleringsmodeller. Målsättningen var att utforma en metod, hitta ett sätt att implementera den i modellerna och att undersöka vilken effekt en sådan implementering får på simuleringsresultaten.

Metoden som valdes utgick från effektsignaturer, som är en prediktionsmodell för enskilda kunders effektförbrukning och används på företaget idag. Effektsignaturerna tar endast hänsyn till utomhustemperatur i sina prediktioner vilket betyder att de inte anpassar sig till tid. Dock varierar kunders förbrukningsmönster med tid, dels över dygnet och dels mellan veckodagar och helger, och därför valdes att införa en tidsparameter i effektsignaturerna för att förbättra modellen.

Tidsvariationen representerades av tre tidsserier för varje kund, en för var och en av de tre parametrar som beskriver signaturerna. Tillsammans utgör de tre tidsserierna en viss kunds förbrukningsmönster.

Efter att förbrukningsmönster tagits fram för varje kund utfördes en matematisk kategorisering utifrån dem. På så sätt kunde den senare implementeringen av metoden i simuleringsmodellerna underlättas. För att genomföra kategoriseringen användes en kategoriseringsalgoritm som heter k- means clustering. Kategoriseringen utfördes på var och en av signaturernas tre parametrar. Den tillät, förutom en enklare implementering av metoden, en jämförelse med den kategoriseringsmetod som används på företaget idag. Den befintliga kategoriseringen utgår från byggnaders ålder och typ snarare än deras faktiska förbrukningsmönster, och antagandet var att en matematiskt beräknad kategorisering skulle ge upphov till kategorier sorterar kunderna på ett bättre sätt.

Implementeringen av metoden i Termis simuleringsmodeller utgick från det standardförfarande för prediktioner av kunders effektförbrukning som finns inbyggt i programmet. Dock visade sig standardförfarandet ge utrymme för mycket begränsade prediktioner som inte kunde utgå från både temperatur och tid för individuella kunder. Därför undersöktes en annan metod där simuleringsmodellerna utvidgades på ett sådant sätt att prediktionerna blev möjliga, på bekostnad av mer krävande beräkningar.

Då en tidsvariation infördes för effektsignaturerna erhölls en markant förbättrad prediktionskvalitet för de flesta kunder, jämfört med den ursprungliga signaturen. Då tidsvariation mellan veckodag och helg infördes syntes förbättringen hos ett mindre antal kunder, medan majoriteten av kunderna förblev opåverkade. När tidsvariation över dygnet infördes syntes en kraftig förbättring hos nästan alla kunder. Utöver att prediktionskvaliteten ökade blev den också mer jämn över tid, så att felet för en given kund kan väntas vara lika stort oavsett tid på dygnet. Efter att kunderna kategoriserats, och därför behövt anpassa sina modeller efter andra kunder, sänktes som väntat

(4)

prediktionskvaliteten, dock erhölls fortfarande förbättrade prediktioner för i princip alla kunder.

Prediktionerna var också bättre än de som gjordes med den befintliga kategoriseringen, som baseras på byggnadstyp och –år.

Resultaten av simuleringarna baserades på en faktor vars värde beror av hur mycket den tidigare nämnda funktionen i programmet behövde kompensera för avsaknad av prediktioner av kunders effektförbrukning. Värdet på faktorn förbättrades endast blygsamt efter att metoden med tidsuppdelade signaturer införts. Vidare syntes inte en markant skillnad mot det fall där kunderna kategoriserats enligt befintliga kategorier.

På grund av de problem med programmets standardmetod som uppstod vid implementeringen var underlaget från simuleringsresultaten begränsat till en specifik vecka och till ett specifikt antal kategorier. Hade ett större underlag kunnat samlas in vore det lättare att undersöka var orsaken till den begränsade förbättringen var, och vilka åtgärder som skulle kunna ge bättre resultat. Trots att resultaten med avseende på den uppmätta faktorn var något av en besvikelse, var det positivt att en metod för prediktion av kunders effektförbrukning kunde implementeras i Termis modeller. Det ger underlag för att framöver kunna utveckla en än bättre modell.

Att genomföra en matematisk kategorisering av värmekunder baserat på deras förbrukningsmönster anses vara en bra idé och det har bevisats att en kategorisering inte påverkar prediktionskvaliteten negativt i någon större utsträckning. Att kategorisera kunder matematiskt ger dessutom upphov till flexibla kategorier där kunder kan flyttas från en kategori till en annan ifall deras förbrukningsmönster skulle förändras, vilket ger bättre underlag för prediktionsmodeller. Det rekommenderas att ett system för sådan kategorisering undersöks och på sikt implementeras i företagets arbete med exempelvis simuleringsmodeller.

Termis har visat sig vara olämpligt för att införa en metod för prediktion av enskilda kunders effektförbrukning. Trots att den granskade metoden kunde implementeras var det uppenbart att det gick mot Termis standardmetod och en alternativ lösning behövde hittas. Därför rekommenderas företaget att undersöka möjliga alternativ till att göra sådana prediktioner i Termis. Det skulle exempelvis kunna bestå av att genomföra prediktionerna i en annan mjukvara eller undersöka möjligheter till en utvidgning av Termis funktionalitet.

(5)

Exekutiv sammanfattning

En metod för att prognostisera kunders effektförbrukning och implementera dessa prognoser i simuleringsmodeller i mjukvaran Termis undersöktes. Syftet med arbetet var att förbättra resultaten från simuleringsmodellerna för arbetet inom distributionsoptimering. En metod som utgick från de existerande effektsignaturmodellerna togs fram, där kunder kategoriserades baserat på förbrukningsmönster över tid och temperatur. Slutligen implementerades modellen och kategoriseringen i Termis simuleringsmodeller.

Arbetet visade att ett införande av en tidsvariation i effektsignaturerna kan ge upphov till kraftigt förbättrade prediktioner för de flesta kunder, och att prediktionskvaliteten blir jämnare över dygnet.

Prediktionskvaliteten sjunker något då kundernas förbrukningsmönster kategoriseras, dock är de fortsatt bättre än för signaturer som inte delats upp över tid. Med denna matematiska kategorisering är resultaten också bättre än för det befintliga kategoriseringssystemet. Resultaten av de simuleringar i Termis där metoden implementerats visade dock på en mycket liten förbättring efter att tidsparametern och kategoriseringen införts.

En implementering av metoden i Termis-modellerna visade att Termis är dåligt anpassat för att hantera kundspecifika prediktioner och det rekommenderas att alternativ undersöks, antingen i form av annan mjukvara där prediktioner kan utföras, eller i form av tillägg till Termis. Det rekommenderas också att företaget fortsätter granska matematisk kategorisering då det ger flera fördelar och endast offrar lite prediktionskvalitet.

(6)

Förord

Det här examensarbetet avslutar min civilingenjörsutbildning inom energisystem vid Uppsala universitet och Sveriges lantbruksuniversitet. Arbetet är gjort via Uppsala universitet och har genomförts på Stockholm Exergi från januari till juni år 2018.

Ett tack riktas till alla medarbetare på Stockholm Exergi med DO-gruppen i spetsen, som har varit mer än välkomnande hela våren. Ett särskilt stort tack till min handledare Catharina Solén för dina ovärderliga råd, ständiga stöd, engagemang och uppmuntran. Särskilt tack även till Johan Dalgren som förutom att vara hjärnan bakom arbetet har bistått med sin tid, kunskap och glada humör. Ett extra tack riktas också till Thomas Wells och Axel Nord för all hjälp jag fått i början av projektet.

Tack också till min ämnesgranskare och akademiska bollplank Mikael Höök, och till Magnus Åberg för att du funnits tillgänglig som extra experthjälp.

Slutligen ett tack till alla övriga examensarbetare jag delat mycket stress, skratt och kaffe med under våren, i synnerhet min ständige pendlarkompanjon Jesper.

Uppsala, Juni 2018 Joakim Stålnacke

(7)

Förklaringar

Värmelast – Den värmeeffekt som tas ut från fjärrvärmenätet. Består av kunders värmeförbrukning och värmeförluster i nätet.

Social last – Den del av värmelasten som beror på människors beteende.

Fysikalisk last – Den del av värmelasten som beror på klimatet och byggnadens egenskaper.

Undercentral – Kundens fjärrvärmecentral, där värmebärare från fjärrvärmenätet avger värme till kundens egna kretsar.

DUT – Dimensionerande utomhustemperatur. Den kallaste utomhustemperatur som väntas under ett år. Systemet är dimensionerat för att klara av värmeleveranser vid DUT.

Effektsignatur – Kundspecifik, styckvis linjär funktion som beskriver effektförbrukning som funktion av utomhustemperatur.

Termis – Mjukvara för modellering och simulering av distributionssystem inom fjärrvärme.

Residualer – Skillnader mellan det predikterade värdet och det faktiska mätvärdet.

Autokorrelation – Mått på huruvida en residuals värde beror av värdet på residualer i tidigare tidssteg.

R – Programspråk främst använt för statistiska beräkningar och visualisering.

SQL – Programspråk främst använt för arbete med databaser.

Klusteranalys – Metod för kategorisering av stora datamängder, som finns i många olika utföranden.

(8)

Innehållsförteckning

1 Inledning ... 1

1.1 Syfte och frågeställningar ... 1

1.2 Problemformulering ... 2

1.2.1 Signaturer ... 4

1.2.2 Termis ... 6

1.3 Avgränsningar ... 7

2 Teoretisk bakgrund ... 9

2.1 Fjärrvärmesystemet ... 9

2.1.1 Undercentraler ... 10

2.2 Värmelaster ... 11

2.2.1 Typer av värmelast ... 12

2.2.2 Värmelaster i tid ... 13

2.2.3 Värmelasten i Termis ... 14

2.3 Statistisk analys ... 15

2.3.1 Programmeringsverktyg ... 15

2.3.2 Grundläggande statistisk teori ... 15

2.3.3 K-means clustering ... 18

2.3.4 Korsvalidering ... 21

3 Metod ... 22

3.1 Databehandling ... 22

3.2 Analys av nätet ... 22

3.3 Signaturer ... 23

3.3.1 Beräkning av signaturer ... 23

3.3.2 Tidsuppdelning av signaturer ... 23

3.4 Kategorisering av kunder ... 25

3.4.1 Kategorisering med k-means ... 26

3.4.2 Kategorisering med befintliga kategorier ... 27

3.4.3 Förenklat kategoriseringsfall ... 27

3.5 Utvärdering ... 29

3.6 Implementering i Termis ... 30

4 Resultat ... 32

4.1 Analys av nätet ... 32

(9)

4.2 Signaturer ... 32

4.3 Residualanalys ... 33

4.3.1 Residualer över tid ... 37

4.3.2 Residualer över utomhustemperatur ... 40

4.3.3 Autokorrelation ... 42

4.4 Kategorisering ... 43

4.4.1 Kategoriantal ... 44

4.4.2 Befintliga kategorier ... 48

4.5 Termis ... 50

4.6 Sammanfattning av resultat ... 53

5 Diskussion ... 55

5.1 Metodval ... 55

5.2 Signaturer ... 55

5.2.1 Resultat av tidsuppdelade signaturer ... 56

5.3 Kategorisering ... 57

5.3.1 Resultat av kategorisering ... 58

5.4 Termis ... 59

5.4.1 Resultat av implementering i Termis ... 59

6 Slutsatser ... 61

6.1 Rekommendationer ... 61

7 Referenser ... 63

Appendix ... 66

(10)

1

1 Inledning

Sverige är ett av världens kallaste länder och en pålitlig tillförsel av värme är en nödvändighet för att ett modernt samhälle ska fungera här. Från och med mitten av 1900-talet har Sverige förlitat sig mer och mer på fjärrvärme för att tillgodose behovet av uppvärmning, och idag står fjärrvärmen för mer än 50 % av landets värmeförsörjning (Svensk Fjärvärme, 2009). Fjärrvärmen har även spelat en viktig roll i det svenska energisystemets omställning från fossila till förnybara bränslen.

Utbyggnaden av fjärrvärmenäten har inneburit en utfasning av oljepannor som uppvärmningskälla vilket är den största bidragande faktorn till Sveriges minskade utsläpp sedan 1990 (Naturvårdsverket, 2017). Stockholm Exergis fjärrvärmesystem bedöms i en rapport från Europeiska kommissionen (Fernández et al. 2016) vara ett av de bästa fjärrvärmesystemen i världen, då både finansiella och miljömässiga faktorer sammanvägs med kvaliteten på tjänsterna som levereras. Fjärrvärmen är en av Sveriges och Stockholms essentiella samhällsfunktioner och kommer med största säkerhet också att fortsätta vara det i framtiden.

I Stockholm finns över 16 000 anslutningar till Stockholm Exergis fjärrvärme- och fjärrkylanät.

Kunderna är såväl bostadsrättsföreningar och enskilda bostäder som industrier och offentliga lokaler, och år 2016 levererades mer än 7 000 GWh fjärrvärme till dessa kunder. Totalt försörjs ungefär 80 % av Stockholms invånare med värme från Stockholm Exergi (Stockholm Exergi, 2018). För att på ett bra sätt kunna leverera så stora mängder energi till så många människor som Stockholm Exergi gör krävs kontinuerligt arbete med att planera och optimera distributionen av värmen.

För att kunna bibehålla en önskad effektleverans måste rätt flöden, tryck och temperaturer råda på distributionsnätet samtidigt som produktionen är i balans med kundernas konsumtion. Bra modeller av distributionsnätet krävs för att kunna säkerställa att nätets olika parametrar befinner sig inom acceptabla värden och för att kunna förutse variationer i dem, i olika scenarion. Sådana modeller kräver pålitliga prediktioner av kunders värmeförbrukning. I de modeller som idag används finns inte en bra metod för att prediktera kunders värmeförbrukning enskilt. Det innebär att resultat på de mer kundnära nivåerna på nätet inte är nog detaljrika. Att implementera en metod för enskild prediktion av kunders värmeförbrukning i simuleringsmodellerna har potential att ge mer detaljerade resultat på denna nivå och kan på så sätt hjälpa arbetet med distributionsoptimering.

1.1 Syfte och frågeställningar

Examensarbetets syfte är att utreda möjligheten för Stockholm Exergi att förbättra sina prediktioner av kunders effektförbrukning i den mjukvara som används inom distributionsoptimering, Termis.

Förhoppningen är att en metod för prediktering på kundnivå som tar hänsyn till mer än bara utomhustemperatur ska kunna leda till resultat som underlättar distributionsoptimeringen av nätet.

Samtidigt ska de möjligheter som finns att genomföra en sådan metod i Termis klargöras.

Examensarbetet skulle också visa huruvida en implementering av metoden faktiskt ger upphov till så mycket bättre simuleringar att eventuellt extra arbete är rättfärdigat.

De frågeställningar arbetet ämnar besvara är följande:

(11)

2

 Hur kan prognostisering av kunders effektförbrukning förbättras från de metoder som används idag?

 Hur kan en sådan metod implementeras i Termis?

 Hur påverkar implementeringen av en sådan metod simuleringsresultaten i Termis?

1.2 Problemformulering

Varje timme samlar Stockholm Exergi in mätvärden för effektförbrukning från sina kunder. I en intern databas lagras såväl dessa timvisa medelvärden som dygnsmedelvärden för effektförbrukningen. Denna data används i många olika tillämpningar, bland annat till att beräkna så kallade effektsignaturer. Signaturerna är segmenterade, linjära funktioner som beskriver hur effektförbrukningen varierar med utomhustemperatur. Signaturerna är vanligt förekommande modeller inom fjärrvärmebranschen och används ofta som underlag för debiteringsmodeller.

Exempel på andra fjärrvärmebolag som använder sig av effektsignaturer är Sandviken Energi (2013) och Tekniska verken (2015). I Figur 1 syns en typisk effektsignatur.

(12)

3

Figur 1: Exempel på signatur (svart linje) för en kunds effektförbrukning, plottad tillsammans med kundens genomsnittliga förbrukning under alla dygn år 2016 (röda punkter).

Tre parametrar visas i Figur 1: lutningen k, bryttemperaturen Tb och bryteffekten Pb. Parametrarna används för att beskriva signaturen matematiskt, med Ekvation 1.

𝑃 = {𝑘 ∗ (𝑇 − 𝑇𝑏) + 𝑃𝑏, 𝑇 < 𝑇𝑏 𝑃𝑏, 𝑇 ≥ 𝑇𝑏

Ekvation 1 P – Effektförbrukning (kW)

T – Utomhustemperatur (˚C)

(13)

4

Brytpunkten mellan signaturens plana och lutande segment inträffar vid temperaturen Tb där den väntade effektförbrukningen är Pb. Denna effektförbrukning antas sedan vara konstant vid högre temperaturer. Den väntade effektförbrukningen ökar med takten -k vid lägre temperaturer.

Signaturerna används även till att utifrån temperaturprognoser kunna förutse hur effektförbrukning kommer att se ut hos enskilda kunder och på fjärrvärmenätet i stort. På Stockholm Exergi används signaturerna bland annat i arbetet med distributionsoptimering i mjukvaran Termis. Där genomförs simuleringar i modeller av fjärrvärmenätet som sedan ligger till grund för arbetet med distributionsoptimering, där tanken är att signaturerna ska fungera som predikterande modeller för kundernas förbrukning.

Problemformuleringen i det här examensarbetet har utgått från två huvudsakliga delproblem. Det första är att de kundsignaturer som idag används i modeller av fjärrvärmenätet inte konstrueras på ett optimalt sätt för att användas inom distributionsoptimering. Signaturerna, i den form de används idag, utgår ifrån att kundernas beteende som funktion av utomhustemperatur alltid följer samma mönster. Detta innebär att tidsdynamiken i kunders värmeförbrukning blir mycket dåligt representerad i simuleringsmodellerna. Det andra problemet är att signaturerna implementeras i mjukvaran Termis på ett sätt som inte är optimalt.

I det här examensarbetet ska det undersökas huruvida införandet av en tidsparameter i effektsignaturerna kan ge en betydande effekt på prediktionerna av kunders effektförbrukning.

Tidsvariationen ska införas genom att signaturernas variation över tid med avseende på dess tre beskrivande parametrar översätts till en tidsserie av justeringsfaktorer. Dessa beskriver då hela signaturens tidsvariation. Det ska sedan undersökas huruvida det finns ett bra sätt att implementera signaturens tidsparameter i simuleringsmodeller i Termis. Nedan följer en mer ingående beskrivning av problemställningen.

1.2.1 Signaturer

Kundsignaturerna är för många tillämpningar tillräckligt bra på att förutse kundernas beteende idag, men det finns också de tillämpningar där det vore värdefullt att ha mer exakta signaturer. Vill man exempelvis planera anslutningen av nya kunder till nätet är det värdefullt att veta hur dessa kommer att förbruka värme, inte bara i genomsnitt varje dag utan en specifik tid på dygnet. Figur 2 illustrerar hur värmeförbrukningen hos en typisk fjärrvärmekund ser ut med dygns- respektive timupplöst data.

(14)

5

Figur 2: Dygns- och timuuplöst förbrukningsdata under en vecka för en kund på Stockholm Exergis nät.

Som Figur 2 visar är det svårt att på ett bra sätt prediktera effektförbrukning med en modell som baseras på dygnsmedelvärden.

Används en normal effektsignatur baseras prediktionen endast på utomhustemperatur. Denna parameter är en god indikator på hur mycket värme som förbrukas, vilket är en intuitiv slutsats. Då skillnaden mellan den önskade inomhustemperaturen och den omgivande utomhustemperaturen ökar kommer mer värme att läcka ut ur en byggnads väggar, fönster och tak, enligt termodynamikens principer. Alltså ökar behovet av extra uppvärmning i byggnaden, och värmeförbrukningen hos kunden ökar. Det finns dock egenskaper i kunders förbrukningsmönster som inte korrelerar med utomhustemperaturen, framförallt mönster som beror på människors beteende. Denna del av kundens värmelast kallas för social last. Ett exempel illustreras i Figur 3.

Där syns hur en skolbyggnads förbrukningsmönster kan skilja sig mellan veckodagar och helger.

(15)

6

Figur 3: Effektförbrukning i en skolbyggnad på Stockholm Exergis nät, uppdelad på veckodag (svart) och helg (röd). De olika trender som framstår visar att denna byggnads förbrukningsmönster inte förklaras enbart av utomhustemperaturen.

I Figur 3 syns tydligt att byggnadens förbrukning tenderar att vara högre under veckodagar än under helger, och att förbrukningen också ökar i olika takt då utomhustemperaturen sjunker. Det beror förstås på att byggnadens normala användande upphör under helgerna och samma inomhusklimat behövs då inte. Ventilering kan stängas av och temperaturen inomhus kan hålla en lägre nivå. I detta fall verkar det som att prediktioner av den här kundens effektförbrukning skulle bli bättre ifall signaturens parametrar varierade mellan helg och vecka.

På samma sätt kan värmelasten också skilja sig över olika tider på dygnet för vissa kunder. För att kunna ta hänsyn till sådana variationer räcker det dock inte att bara dela upp signaturen över tid.

Det krävs också att tidsupplösningen är tillräckligt hög för att fånga upp mönstret. Idag beräknas kundsignaturerna med hjälp av dygnsmedelvärden för returtemperatur eller effektförbrukning.

Genom att använda dygnsmedelvärden istället för timmedelvärden krävs betydligt färre datapunkter för att genomföra beräkningarna vilket gör dem mindre tidskrävande, men detaljer i förbrukningsmönster på dygnsnivå blir omöjliga att upptäcka.

1.2.2 Termis

Termis är en mjukvara för modellering av fjärrvärme- och fjärrkylanät, utvecklad av Schneider Electric (2018). Termis används, bland annat på Stockholm Exergi, för att bygga modeller av distributionsnätet och sedan genomföra simuleringar i dessa modeller. Via en intern databas importeras kundernas signaturer till Termis i form av de tre ovan beskrivna parametrarna. Tid på

(16)

7

dygnet, dag på året och veckodag finns som data i varje modellsimulering och även utomhustemperaturer kan importeras till Termis i form av tidsserier med prognoser. Tidsserier innehållande valfri annan data kan också hämtas till modeller i programmet.

Grundförutsättningarna i form av data finns alltså tillgängliga för att utföra tidsuppdelningen av signaturer i modellerna.

Beräkningar i Termis kan för stora modeller bli mycket tidskrävande ifall varje kund behandlas enskilt. Detta innebär att förenklingar är önskvärda. För att minska den beräkningskraft som behövs för simuleringarna aggregeras grupper av kunder till så kallade noder. Det reducerar antalet ledningar och beräkningspunkter som behöver inkluderas i simuleringsberäkningarna. Noderna är punkter som finns på utvalda positioner på nätet, och kunder allokeras till den nod de ligger närmast. Det innebär att vissa noder kan vara tomma, eller innehålla endast en kund, medan andra noder kan innehålla tiotals kunder. Trots den ökade beräkningskraft som krävs är det möjligt att använda oförenklade modeller i Termis, där varje nod endast innehåller en kund. Det är dock önskvärt att hitta ett sätt att implementera metoden på ett sätt som tillåter att flera kunder kan tilldelas enskilda noder.

I dagsläget inkluderas inte dynamiken från signaturerna i simuleringar. Inför varje simulering uppdateras alla noder och de individuella kundernas effektförbrukning vid rådande utomhustemperatur summeras ihop för varje nod. Denna beräkning genomförs för den utomhustemperatur som råder då simuleringen startas och uppdateras inte under pågående simulering, vilket innebär att förbrukningens tids- och temperaturdynamik går förlorad och prediktioner på individuell kundnivå är i regel felaktiga. Problemet avhjälps med hjälp av en anpassningsfunktion, adaption, i Termis som bidrar till att minska effekten av problemet genom att anpassa nätets flöden och returtemperaturer till data från produktionsanläggningarna. Funktionen kompenserar dels för bristande prediktionskvalitet av kundlaster och dels andra felfaktorer så som distributionsförluster. Dock blir effekten av adaptionsfunktionens kompensation mindre ju längre ut på fjärrvärmenätet man kommer, och i mindre fördelningsledningar nära kunderna klarar den inte att kompensera för bristande prediktionskvalitet på ett bra sätt.

Termis tillåter att tidsdynamiska egenskaper inkluderas i noder så problemet beror mer på hur kundförbrukningen modelleras i dagsläget än på begränsningar i mjukvaran. För att representera tidsdynamik kan tidsserier skapas direkt i programmet eller importeras från en extern källa. De kan exempelvis innehålla temperaturprognoser eller faktorer, som vid simulering varierar beroende på tid. Tidsupplösningen kan vara på sekundnivå och olika värden kan definieras upp till dygnsnivå.

Det går exempelvis att skapa en tidsserie med 168 element som innehåller unika värden för varje timme på veckan. Möjligheten att använda tidsserier och det faktum att effektsignaturens parametrar används i modellerna idag gjorde att konceptet med tidsuppdelade effektsignaturer ansågs vara en lovande metod för att förbättra prediktionerna i modellerna. Genom att införa tidsserier kan signaturens enskilda parametrar varieras över tid och signaturen kan på så sätt varieras över både tid och temperatur.

1.3 Avgränsningar

Stockholm Exergis fjärrvärmenät inkluderar drygt 16 000 kunder (Stockholm Exergi, 2018). Att utföra beräkningar med timvis data över årsperioder innebär många datapunkter för varje kund,

(17)

8

och beräkningstiderna ökar fort med antalet kunder som inkluderas i beräkningarna. Att beräkna, analysera och validera den typ av modeller som behandlas i projektet kräver data över helår och därför ansågs det praktiskt att begränsa antalet kunder i analysen. Bromma valdes som det område projektet skulle fokusera på. Området innehåller cirka 700 kunder vilket bedömdes vara en god avvägning mellan många mätpunkter och hanterbara datamängder. Samtidigt har området ett relativt representativt byggnadsbestånd och hög tillförlitlighet i sin mätdata. Dessutom är fjärrvärmenätet i Bromma uppbyggt på ett relativt enkelt sätt vilket gör simuleringar mer praktiska.

Hur de förbättrade modellerna skulle utvärderas begränsades till en specifik parameter i mjukvaran Termis, adaptionsfaktorn. Denna parameter anger i princip hur mycket Termis adaptionsfunktion behöver kompensera för skillnader mellan värmelasten beräknad vid produktionsanläggning och värmelasten beräknad på nätet. Faktorn ligger optimalt nära 1. Genom att granska hur den valda parametern i mjukvaran varierar i simuleringar med och utan de nya modellerna kan sedan slutsatser dras om de nya modellernas kvalitet.

(18)

9

2 Teoretisk bakgrund

I detta avsnitt förklaras den teori som varit viktig under arbetets gång. Först förklaras fjärrvärmesystemet i stort, med fokus på kunders undercentraler. Värmelaster förklaras med fokus på deras variationer över tid, och slutligen beskrivs de viktigaste statistiska koncept som använts i arbetet.

2.1 Fjärrvärmesystemet

Fjärrvärme är ett system för centraliserad distribution av värme och började användas i sin moderna form i USA i slutet av 1800-talet. Tekniken spred sig till Europa via Tyskland under 1920-talet och senare till Sovjetunionen och Kina under 30- respektive 50-talet. Idag står EU, Kina och Ryssland för cirka 85 % av den totala fjärrvärmeanvändningen (Gadd & Werner, 2017). I Sverige dröjde det till 1948 innan det första storskaliga fjärrvärmesystemet togs i bruk i Karlstad (Werner, 1984), men sedan dess har fjärrvärmen i Sverige växt till drygt 50 % av marknaden, och förekommer idag i 270 av 290 svenska kommuner (Svensk Fjärvärme, 2009).

Fjärrvärmesystemet bygger på den grundläggande filosofin att en stor anläggning producerar värme på ett mer fördelaktigt sätt än många enskilda anläggningar, och att det därför är bra att centralisera produktionen. Genom att samla värmeproduktionen hos en stor aktör blir det praktiskt att ta tillvara energikällor som annars inte kunnat utnyttjas på ett bra sätt, så som spillvärme från större industrier och annan energiproduktion (Svensk Fjärvärme, 2009). Dessutom möjliggörs större investeringar i utrustning för exempelvis rökgasrening och effektiviserande åtgärder vilket bidrar till att minska ekonomiska och miljömässiga kostnader för samhället såväl som enskilda kunder. Främst lämpar sig fjärrvärme för användning i tätbefolkade områden, där det är möjligt att inkludera många kunder på distributionsnätet, och där risken för dålig luftkvalitet ofta är stor.

De tre grundläggande komponenterna i fjärrvärmesystemet är produktionsanläggningen, distributionsnätet och kunden. En energibärare, vilken i moderna system vanligtvis är vatten, värms upp i en produktionsanläggning under förbränning av något bränsle, som är systemets energikälla.

Vattnet pumpas sedan ut till kunder via distributionsnätet. Fjärrvärmesystemets distributionsnät består av två ledningar där den ena ledningen leder vattnet ut till kunder, medan den andra leder vattnet tillbaka från kunder till produktionsanläggningen. Hos kunden leds det varma vattnet in i en undercentral där värmen överförs till kundens interna kretsar och leds vidare till varmvattenkranar, element och ventilationssystem, alternativt industriella processer. I Figur 4 syns en principiell illustration av hur fjärrvärmesystemet fungerar.

(19)

10

Figur 4: Principiell illustration av fjärrvärmesystemet inkluderande en produktionsanläggning (grön), två kunder och ett distributionsnät med framledning (röd) och returledning (blå). Kundens undercentral representeras av en radiatorkrets och en

krets för tappvarmvatten. Bilden är skapad med Tinkercad.

Hur mycket vatten ventilen vid kundens undercentral släpper igenom regleras dels av utomhustemperaturen och dels av TF och TR. Det avkylda vattnet leds tillbaka ut på distributionsnätet och sedan tillbaka till produktionsanläggningen via den så kallade returledningen. Temperaturen på det vatten som leds fram till kunder kallas framtemperaturen, TF, och det vatten som kommer tillbaka från kunden kallas för returtemperaturen, TR. Utöver kunders faktiska förbrukning går även en del av energin från produktionsanläggningen förlorad vid distributionen.

2.1.1 Undercentraler

Den data som används i examensarbetet kommer ursprungligen från mätningar av temperaturer och flöden vid kundernas undercentraler. Undercentraler kan se ut på olika sätt och krav på deras tekniska specifikationer har fastställts i en rapport av Energiföretagen, tidigare Svensk Fjärrvärme (Svensk Fjärrvärme, 2014). I Figur 5 syns, från denna rapport, en illustration av de vanligaste typerna av undercentraler.

(20)

11

Figur 5: Illustration av hur vattnet flödar i de två vanligaste typerna av undercentraler: parallellkopplade och tvåstegskopplade undercentraler. Bild återgiven med tillstånd från Energiföretagen (Svensk Fjärrvärme, 2014).

Parallellkopplade undercentraler är de allra vanligaste och tar in vatten från nätets framledning till två separata värmeväxlare, en för ventilationsluft och radiatorer, samt en för tappvarmvatten. Hur stort flöde som släpps in till värmeväxlarna regleras av ventiler, som styr flödet baserat på olika faktorer. I huvudsak styrs effektuttaget i radiatorkretsens värmeväxlare av utomhustemperatur, medan varmvattenkretsens effektuttag beror på huruvida kunden öppnar en varmvattenkran.

Kallvatten till kranarna kommer in separat och blandas med det varma vattnet från värmeväxlaren.

I en tvåstegskopplad undercentral finns tre värmeväxlare, en för radiatorkretsen och en för varmvattenkretsen precis som i en parallellkopplad undercentral. I den tredje växlaren utnyttjas kvarvarande värme i det vatten som passerat genom radiatorkretsen för att förvärma kallvattnet som strömmar in i tappvarmvattenväxlaren.

2.2 Värmelaster

Värmelasten är den effekt en kund tar ut från fjärrvärmenätet för att täcka sitt behov av uppvärmning (Werner & Frederiksen, 2013). I denna rapport avser värmelast en genomsnittlig värmeeffekt över tid, oftast över en timme. Värmelasterna som används i rapporten är alltså på grundenheten kilowattimme per timme (kWhh ), men anges här förenklat som effekten i kilowatt (kW). Den värmelast som tas ut hos en fjärrvärmekund kan beskrivas med Ekvation 2.

𝑃 = 𝑚̇𝑐𝑝(𝑇𝐹− 𝑇𝑅)

Ekvation 2

P – Värmelast ( sJ )

ṁ – Värmebärarens massflöde ( kgs ) cp – Värmebärarens värmekapacitet ( kgKJ )

(21)

12

TF – Framtemperatur (K) TR – Returtemperatur (K)

Vattens värmekapacitet kan anses vara konstant (cp≈ 4,19 kJ/kgK) så en kunds värmelast kan beräknas ifall fram- och returtemperaturerna samt massflödet genom undercentralen är kända. För att höja värmeeffekten krävs att temperaturdifferensen eller massflödet ökar. Vilket av dessa som inträffar påverkar i sin tur producentens förutsättningar att upptäcka den ökade värmelasten. Ökar temperaturdifferensen mellan fram- och returledning sprids det ökade värmebehovet på nätet med vattnets flödeshastighet, vanligtvis under 3 m/s. Ökar istället flödet genom kundens undercentral uppstår ett tryckfall i denna punkt på nätet, vilket ger upphov till en tryckvåg. Denna våg sprids på nätet med cirka 1000 m/s (Werner & Frederiksen, 2013), en hastighet som beror på ljudets hastighet i vatten och materialegenskaper hos rören. Sådana vågor kan här bortses från på grund av den höga utbredningshastigheten. Ifall värmelast uppmäts vid en fix punkt någonstans på nätet innebär fortplantningshastigheten av temperatur att variationer hos kunder långt bort från mätpunkten upptäcks senare än variationer från kunder i närheten, även om värmelasterna förändras samtidigt.

I detta examensarbete används mätdata som tagits från kundernas egna undercentraler, vilket innebär att timingen av variationerna inte påverkas av deras geografiska position.

2.2.1 Typer av värmelast

En fjärrvärmekunds effektförbrukning beror dels av kundens eget beteende, dels av klimatet och dels av byggnadens eller anläggningens inneboende egenskaper. Den förstnämnda faktorn brukar kallas för social last och de andra två utgör tillsammans den fysikaliska lasten (Werner &

Frederiksen, 2013). Kundens beteende innefattar exempelvis vilken tid kunden förbrukar tappvarmvatten eller huruvida ventilation stängs av nattetid.

Klimat innebär främst skillnaden mellan utomhustemperatur och inomhustemperatur, men kan också vara solinstrålning eller vindhastighet. Byggnadens inneboende egenskaper har att göra med vilket värmebehov ett visst klimat ger upphov till. Är byggnaden exempelvis dåligt isolerad krävs även mer energi vid kalla temperaturer än om byggnaden är väl isolerad eftersom att kunden då får en högre balanstemperatur. Balanstemperatur är den utomhustemperatur där ett jämviktsläge råder mellan värmeförluster från byggnad till utomhusluft och byggnadens interna värmetillskott. Med andra ord är det den temperatur då ingen värmetillförsel krävs för att bibehålla önskad inomhustemperatur (Werner & Frederiksen, 2013). Balanstemperaturen varierar över året, exempelvis blir den högre under vintern då solinstrålningen ger ett relativt litet bidrag till uppvärmning av byggnader. Ifall utomhustemperaturen befinner sig under balanstemperaturen krävs värmetillförsel från fjärrvärmenätet till kunden.

Baserat på de sociala och fysikaliska variablerna får en specifik kund ett visst förbrukningsmönster som ofta är snarlikt för en viss typ av kunder i ett område. När man vill förutse hur effektförbrukningen på fjärrvärmenätet kommer att se ut kan dessa förbrukningsmönster, och andelen av olika kundgrupper på nätet, användas. Effektsignaturer förutsäger framförallt den fysikaliska lasten, då denna last framförallt varierar med utomhustemperatur. Den sociala lasten är vanligtvis mindre förutsägbar än den fysikaliska, men är närmare knuten till tid än till temperatur.

Metoden med tidsvariation av signaturer avser med andra ord att fånga upp den sociala lasten och inte bara den fysikaliska.

(22)

13 2.2.2 Värmelaster i tid

Hur värmelaster påverkas av de olika faktorerna varierar dels över olika typer av kunder, men även över olika tider på året, veckan och dygnet. Gadd & Werner (2013b) studerade hur dygns- och veckovariationer i värmelast på ett svenskt fjärrvärmenät varierar över året och fann fyra primära utmärkande tidsintervall under året. De fyra intervallen var 1) december, januari och februari, 2) mars, april, oktober och november, 3) maj och september samt 4) juni, juli och augusti.

Genomsnittliga värmelaster under de fyra tidsintervallen skiljer sig dels i magnitud och dels i tidsvariation. I Figur 6 syns en liknande illustration av den genomsnittliga värmelasten för det valda nätområdet i Bromma uppdelad i de fyra tidsintervallen.

Figur 6: Genomsnittlig värmelast på nätet i Bromma åren 2016 och 2017.

En viktig skillnad mellan Gadd & Werners (2013b) resultat och resultaten i Figur 6 är att de förstnämnda uppmätte värmelasten från en specifik punkt på nätet, och ser den totala lasten från producentens perspektiv. I Figur 6 syns resultat sammanslagna från individuella kundmätningar, vilket innebär att kundernas geografiska placering på nätet inte är en faktor. Det ger upphov till mindre utjämnade mönster i Figur 6 då värmelasten från olika kunder inte tar olika tid på sig att nå mätpunkten. Gadd & Werner undersökte dessutom ett annat, opreciserat, fjärrvärmenät vilket också ger upphov till skillnader. Främst består skillnaderna av att förbrukningsmönstren i Figur 6 framgår tydligare, då de inte slätas ut av skillnader i kundernas placering på nätet.

(23)

14

Den mest påtagliga skillnaden mellan de fyra graferna är värmelastens magnitud, som särskiljer dem uppenbart. Denna skillnad kan främst förklaras med olika temperaturer årstiderna emellan, vilket antyds av att medellasterna under de fyra perioderna hänger samman närmast linjärt med deras medeltemperaturer. Det finns också skillnader i förbrukningsmönstren över dygnen och veckorna mellan de olika årstiderna. En tydlig skillnad är variationerna över veckodygnen. Den tydligaste avvikelsen som noteras är de relativt små dygnsvariationerna under sommarsäsongen.

Under övriga årstider syns en tydlig topp kring klockan 7:00 och en aningen mindre topp kring 18:00. Dessa toppar kan ha både sociala och fysikaliska faktorer bakom sig. Dels är de en effekt av naturliga variationer i temperatur och solinstrålning under dygnet, som gör att värmebehovet sjunker dagtid. Dels beror de på att kunder i bostadshus använder mer tappvarmvatten under dessa perioder, strax efter att ha vaknat samt när man kommit hem från arbetet (Gadd & Werner, 2013b).

Därför syns även en tendens att dessa toppar är mindre framstående under helger, samt att morgontoppen då inträffar senare.

I Bromma sjunker den genomsnittliga effektförbrukningen mitt på dagen och mitt på natten under samtliga säsonger, men till olika grad. Under sommarsäsongen är skillnaden av marginell storlek, medan övriga säsonger karaktäriseras av tydligt reducerad värmelast under dessa tider. Under vintersäsongen sjunker lasten främst under natten. Den här effekten beskrivs av Gadd & Werner (2013b) och antas bero på att många offentliga byggnader och arbetsplatser begränsar uppvärmning och ventilation under dessa tider, då de inte används. I samma rapport dras även slutsatser kring de stora reduktionerna i värmelast dagtid under hösten och våren. Teorin är att solinstrålning ger upphov till ett minskat uppvärmningsbehov under dessa tider. Detta förklarar de relativt stora dygnsvariationerna under maj och september, som till stor del liknar variationerna vintertid, men med en betydligt större reduktion i effektförbrukning mitt på dagen. Under kalla perioder på året är stadsvattnet som värms upp till varmvatten relativt kallt och därför kräver varmvattenförbrukning mer energi under dessa tider, vilket också bidrar till de tydligare topparna under dessa tider. Mellan veckodagar och helger syns skillnader bland annat genom tidigare nämnda utslätning och förskjutning av toppar.

2.2.3 Värmelasten i Termis

I Termis föreslås en metod för prediktering av kunders laster. Metoden beskrivs kortfattat av Ekvation 3.

𝑃 = 𝑃𝐻+ 𝑃𝑊

Ekvation 3

Där PH är andelen av värmelasten som går åt till uppvärmning av ytor och ventilationsluft och PW

är andelen värmelast som går åt till uppvärmning av varmvatten. I Termis antas det att PH är den del av lasten som varierar med utomhustemperaturen och PW är den del av lasten som varierar med tid. De två komponenterna av värmelasten är i hög grad kopplade till de fysikaliska och sociala laster som beskrevs i avsnittet ovan. Lasterna beräknas i varje nod med Ekvation 4 och Ekvation 5.

𝑃𝐻 = 𝐺 ∗ 𝐹𝐻∗ 𝑇𝑆𝐷𝐷∗ ∑ 𝑃𝑖

(24)

15

Ekvation 4

𝑃𝑊= 𝐺 ∗ (1 − 𝐹𝐻) ∗ ∑ 𝑃𝑖𝑇𝑆𝑖

Ekvation 5 P – Värmelast ( 𝑊 )

G – Global lastfaktor

TSDD – Graddagsfaktor (tidsserie) FH – Uppvärmningsfaktor

Pi – Värmelast för kategori i

TSi – Tidsserie med förbrukningsfaktorer för kategori i

Den globala lastfaktorn, G, är en globalt gällande variabel som kan anges fritt som en faktor eller tidsserie. Att den är global innebär att den appliceras på modellen generellt och inte är kundspecifik.

Graddagsfaktorn, TSDD, är global tidsserie som ska representera utomhusklimatet. I tidsserien sammanvägs utomhustemperatur, vindhastighet och solinstrålning för att skapa numeriska viktfaktorer som ska spegla det rådande klimatet. Alla ingående faktorer behöver inte användas, exempelvis kan tidsserien begränsas till att bara representeras av utomhustemperatur.

Uppvärmningsfaktorn, FH, är ett mått på hur stor del av den totala effektförbrukningen som används för uppvärmning av byggnaden. Det antas att andelen (1- FH) av effektförbrukningen går till uppvärmning av tappvarmvatten. Termis standardmetod är med andra ord en där denna uppdelning av effektförbrukning kan beskrivas så noggrant som möjligt.

2.3 Statistisk analys

Nedan följer kortfattade definitioner av statistiska verktyg som dyker upp i analysdelen av examensarbetet.

2.3.1 Programmeringsverktyg R och RStudio

R är ett programmeringsspråk för statistiska beräkningar och illustrationer (R-Project, 2018).

Språket lämpar sig väl för arbete med statistisk behandling av stora mängder data och är tillgängligt under öppen källkod, varför det bedömdes passa bra till den analys som genomförts i det här examensarbetet. Därför har R använts i majoriteten av all analys och framställning av figurer.

Arbetet i R har gjorts i RStudio, som är en utvecklingsmiljö för R. Även RStudio finns öppet tillgänglig (RStudio, 2018).

SQL

Structured query language (SQL) är ett programspråk som används för att hämta och lagra information i databaser (Wilton & Colby, 2005). I det här arbetet har språket använts vid implementering av metoden i Termis, där SQL används för att etablera kopplingar mellan kunders attribut och data som importerats från externa källor, så som tidsserier.

2.3.2 Grundläggande statistisk teori Minstakvadratmetoden

Minstakvadratmetoden är en metod för att anpassa en funktion till datapunkter. I skapandet av signaturerna används denna metod. Metoden går, som namnet antyder, ut på att minimera

(25)

16

kvadraten av felet en modell får när den anpassas till data. Matematiskt innebär detta att minimera summan i Ekvation 6.

𝑆 = ∑(𝑦𝑖 − 𝑦̂)𝑖 2

𝑛

𝑖=1 Ekvation 6 y – Det sanna värdet på utdata

ŷ – Det predikterade värdet på utdata

Ett polynom som ska anpassas till datapunkterna (𝑥1, 𝑦1), (𝑥2, 𝑦2), … , (𝑥𝑛, 𝑦𝑛), där 𝑥 är indata och 𝑦 är utdata, skrivs enligt Ekvation 7:

𝑦 =𝑎0+ 𝑎1𝑥 + 𝑎2𝑥2+ ⋯ + 𝑎𝑚𝑥𝑚

Ekvation 7 a1. . am – Koefficienter

m – Polynomets grad

Dataserien kan representeras med matrisekvationen Ekvation 8.

𝑌 = 𝑋𝑎

Ekvation 8 𝑌 = [𝑦1 … 𝑦𝑛]𝑇

X = [

1 x11 ⋯ x1m

1 x12 ⋯ x2m

1 xn1 ⋯ xnm]

a = [𝑎0 … 𝑎𝑚]𝑇

Matrisekvationen löses med Ekvation 9.

𝑎 = [𝑋𝑇𝑋]−1𝑋𝑇𝑌

Ekvation 9

Det ger koefficienterna 𝑎0...𝑚 till polynomet. För skattning av en rät linje, som exempelvis i effektsignaturerna, är 𝑚 = 1.

Varians

Variansen och standardavvikelsen har använts för att analysera modellernas prediktionskvalitet.

Varians är ett mått på hur mycket punkterna i ett dataset avviker från sitt medelvärde och definieras som väntevärdet av kvadraten på skillnaden mellan en variabel och dess medelvärde. Variansen beräknas med Ekvation 10.

𝑉 =1

𝑛∑𝑛 (𝑦𝑖 − 𝑦̅)2

𝑖=1

(26)

17

Ekvation 10 n – Antal mätpunkter

Att variansen baseras på kvadraten av variationen är det ofta praktiskt att titta på standardavvikelsen, som är √𝑉, som har samma dimension som variabeln i fråga (Jogréus, 2009).

Generellt innebär en stor standardavvikelse att felet i en modell blir större, eftersom att datapunkterna ofta avviker från sitt förväntade värde. Som Ekvation 10 visar blir standardavvikelsen mindre då antalet mätpunkter ökar.

Mean absolute error

För att utvärdera prediktionsmodellers kvalitet har mean absolute error (MAE) använts. Värdet är ett mått på det genomsnittliga fel som uppstår i utdata, då indata matas in i modellen, och beräknas enligt Ekvation 11.

𝑀𝐴𝐸 = 1

𝑁∑|𝑦𝑖 − 𝑦̂𝑖|

𝑁

𝑖=1 Ekvation 11 y – Det sanna värdet på utdata

ŷ – Det predikterade värdet på utdata

Absolutvärdet av felet används för att för stora och för små prediktioner båda ska bidra till summan och inte ta ut varandra. För att jämföra modeller med varandra via MAE användes en felfaktor FMAE, som beräknas enligt Ekvation 12.

𝐹𝑀𝐴𝐸 =𝑀𝐴𝐸1− 𝑀𝐴𝐸2 𝑀𝐴𝐸1

Ekvation 12 MAE1 – MAE-värdet för den gamla modellen

MAE2 – MAE-värdet för den nya modellen

Felfaktorn beskriver hur mycket bättre eller sämre den andra modellens prediktioner är i jämförelse med den första modellens. Är FMAE = 1 innebär detta att den nya modellen helt eliminerar felet, och alltså predikterar det faktiska systemet felfritt.

Två närliggande alternativ till MAE som också utvärderades som verktyg är root mean squared error (RMSE) och mean average percentage error (MAPE). RMSE beräknas på ett motsvarande sätt som MAE med skillnaderna att felens kvadratvärden summeras och kvadratroten ur summan sedan dras. Den huvudsakliga skillnaden gentemot MAE-värdet är att RMSE-värdet amplifierar inverkan av stora fel. MAPE-värdet beräknas även det på ett sätt som är mycket likt MAE, med den enda skillnaden att det absoluta felet i summan divideras med absolutbeloppet av det sanna värdet. Värdet representerar hur stort felet är i förhållande till det sanna värdet, vilket gör att det påminner om FMAE-värdet.

Valet föll på MAE- och FMAE-värdena som utvärderingsverktyg. Det första skälet till att RMSE valdes bort var att det inte ansågs finnas en anledning att straffa få stora fel i relation till många

(27)

18

mindre fel. Det andra var att MAE-värdets enkelhet gör resultatet mindre abstrakt och därmed lättare att tolka intuitivt än RMSE. Denna värdering av MAE mot RMSE stöds av Willmott &

Masuura (2005) som konstaterar att MAE lämpar sig bättre för att jämföra variationer i modellers prediktionskvalitet eftersom att det faller sig mer naturligt som utvärdering av genomsnittligt fel.

MAPE-värdet valdes bort på grund av att den data som behandlas, kunders effektförbrukning, inte sällan innehåller nollvärden. Detta blir ett stort problem då MAPE-värdet inte är definierat för sådana värden.

Durbin-Watsons test

När en modell utvärderas vill man att residualerna, alltså skillnaden mellan observerade och faktiska värden, är slumpmässigt fördelade. Ifall residualerna uppvisar ett mönster som går att förutsäga, tyder det på att regressionsmodellen saknar någon prediktor och att den kan förbättras.

Ett exempel på oönskade mönster hos residualer är autokorrelation. Det innebär att en residual kan förutsägas baserat på vad residualen i föregående tidssteg var. För att upptäcka autokorrelation kan Durbin-Watsons test genomföras.

Durbin-Watsons test kan användas till att söka efter positiv eller negativ autokorrelation, där positiv autokorrelation innebär att en positiv residual vid tid t antyder att residualen vid tid t+1 också är positiv. Vid negativ autokorrelation byter residualerna tecken mellan tidsstegen. När en tidsserie med residualer analyseras med Durbin-Watsons test erhålls ett värde, d, mellan 0 och 4, där 2 antyder att ingen autokorrelation finns, 0 antyder maximal positiv autokorrelation och 4 antyder maximal negativ autokorrelation. Värdet beräknas med Ekvation 13.

𝑑 = ∑𝑛𝑡=2(𝑒̂𝑡− 𝑒̂𝑡−1)2

𝑛𝑡=1𝑒̂𝑡2

Ekvation 13

2.3.3 K-means clustering

För att dela in kunder i kategorier baserat på de förbrukningsmönster som framträtt vid uppdelning av signaturer användes k-means clustering, vilket är en metod för att upptäcka grupperingar i dataset. För att genomföra kategoriseringen användes funktionen kmeans i R, där varianten Hartigan-Wongs algoritm används.

K-means clustering utgår från två matriser, en innehållande indata och en innehållande kluster.

Indatamatrisen består av N rader och M kolumner, där varje kolumn representerar en indatavektor och N representerar antalet dimensioner i vektorerna. Indatavektorerna benämns här objekt, och är godtyckligt numrerade från 1 till M. Det totala antalet kluster definieras som K där 1 ≤ 𝐾 < 𝑀.

Då kategoriseringen är slutförd kommer något antal objekt ha tilldelats varje kluster. Varje kluster kan representeras med en viktvektor av längd N som definieras enligt Ekvation 14.

𝑉𝑘 = [ 𝜇̅1

𝜇̅𝑛] där 𝜇̅𝑖 = 1

𝐴∑𝐴 𝑥𝑖,𝑗

𝑗=1 Ekvation 14

(28)

19

A – Antal objekt som tillhör klustret k n – Antal dimensioner i objekt och viktvektor i = {1,2,…,n}

Med andra ord är varje element i viktvektorn medelvärdet av motsvarande element i de objekt som tillhör klustret. K-means clustering beskrevs av Hartigan (1975) i de fyra stegen nedan. Det bör noteras att k-means clustering inte garanterar en globalt optimal uppdelning av indata, utan ett lokalt optimum. Att jämföra samtliga kombinationer av objekt i kluster är endast möjligt då N, M och K är små tal vilket i regel inte är fallet. Istället sätts en startpunkt någonstans i rummet av möjliga uppdelningar och en lokalt optimal lösning hittas därifrån, vilket innebär att olika körningar med metoden kan ge något olika slutresultat. För att minska risken för dåliga resultat på grund av dålig initiering tar R-funktionen kmeans antal omstarter av algoritmen som inparameter. Vid varje omstart slumpas en ny initiering fram, resultaten av samtliga omstarter jämförs och det bästa resultatet returneras.

Steg 1

I det första steget tilldelas varje kluster en viktvektor, som väljs från objekten. Viktvektorerna kan antingen tilldelas slumpmässigt eller väljas medvetet. I detta stadie är initieringsobjektet klustrets viktvektor, då detta är den enda data som tillhör klustret.

Efter detta jämförs varje objekt med samtliga kluster, och läggs till i det kluster som ligger närmast.

Hur nära indata och kluster ligger bestäms genom beräkning av det euklidiska avståndet mellan dem, se Ekvation 15.

𝑑𝑗,𝑘 = √∑𝑛 (𝑥𝑗,𝑖− 𝜇̅𝑘,𝑖)2

𝑖=1

Ekvation 15 j – Aktuellt objekt

k – Aktuellt kluster

En uppdelning av de M objekten i K kluster noteras 𝑈(𝑀, 𝐾). Varje sådan uppdelning har ett fel 𝜀, som nu beräknas för rådande U. Felet definieras enligt Ekvation 16.

𝜀(𝑈(𝑀, 𝐾)) = ∑𝑀 𝑑𝑗,𝑘2

𝑗=1 Ekvation 16 j – Aktuellt objekt

k – Kluster innehållande j

Steg 2

Nu har en första uppdelning av indata gjorts och felet beräknats för denna uppdelning. För det första objektet beräknas sedan förändringen i fel vid byte av kluster. Detta värde beräknas för samtliga kluster som vektorn inte tillhör, och det minsta värdet noteras. Se Ekvation 17.

(29)

20 𝛥𝜀1 = min (𝐴𝑘𝜀1,𝑘

𝐴𝑘+ 1−𝐴𝑘(1)𝜀1,𝑘(1)

𝐴𝑘(1)− 1 ){∀𝑘≠𝑘(1)}

Ekvation 17

k – Aktuellt kluster

k(1) – Kluster innehållande det första objektet Ak – Antalet objekt i k

Ifall värdet av 𝛥𝜀1 är negativt flyttas den första indatavektorn till det kluster som resulterade i det lägsta värdet. Händer detta fortsätter steget med att viktvektorerna i kluster k(1) och kluster k uppdateras enligt Ekvation 14. Till slut uppdateras även uppdelningens fel enligt Ekvation 16. Då uppdateringen föregås av en negativ förändring i fel för objekt 1 är det givet att uppdelningens totala fel också minskar, uppdelningen har blivit bättre.

Steg 3

I steg 3 upprepas steg 2 för objekt 2 till M.

Steg 4

Ifall inget objekt förflyttats under steg 2 och 3 avslutas processen och uppdelningen är färdig. Om något objekt har flyttats återgår processen till steg 2.

Hartigan Wongs algoritm

År 1979 presenterade J.A. Hartigan och M.A. Wong vid Yale University en modifierad algoritm för k-means clustering (Hartigan & Wong, 1979). Metoden bygger på den som beskrivits ovan men är enligt författarna en effektivare version av algoritmen. Hartigan Wongs algoritm är den som används i funktionen kmeans i R och är därmed den variant som använts i kategoriseringen av kunder i det här examensarbetet. Nedan beskrivs algoritmens steg.

Steg 1-3

Det första steget i Hartigan Wongs algoritm går ut på att för varje objekt j finna de närmast och näst närmast liggande klustren. Dessa kluster benämns nu K1j respektive K2j. Objektet tillhör nu K1j. Påföljande steg är att i vanlig ordning uppdatera viktvektorerna hos de kluster som påverkats av flyttade objekt. Då detta är gjort definieras en aktiv grupp (live-set) av kluster, vilket alla kluster initialt tillhör.

Steg 4-5

I steg 4 initieras en fas som kallas för optimal-transfer stage (OPTRA). Nu granskas varje objekt i tur och ordning, och det kontrolleras ifall K1j tillhör den aktiva gruppen. Ifall K1j tillhör den aktiva gruppen görs en jämförelse med alla andra kluster enligt Ekvation 17. Ifall ett mer passande kluster hittas blir detta kluster nya K1j och det som tidigare var K1j blir nu K2j. Båda dessa kluster tillhör nu den aktiva gruppen. Ifall K1j inte tillhör den aktiva gruppen jämförs det bara med de kluster som gör det. Vid steg 5 avslutas processen ifall den aktiva gruppen är tom. Annars fortsätter processen med steg 6.

(30)

21 Steg 6-7

I detta steg initieras en ny fas, quick-transfer stage (QTRAN). Återigen granskas alla objekt, förutsatt att minst ett av objekten K1j och K2j har uppdaterats under de senaste M stegen. Nu beräknas Ekvation 17 för K1j och K2j. Ifall K2j ”vinner” flyttas objektet mellan dem. I steg 7 kontrolleras ifall något byte ägde rum under de senaste M stegen. Ifall detta är fallet börjar processen om vid steg 4, annars vid steg 6.

Utvärdering

För att utvärdera det optimala antalet kategorier vid k-means clustering utvärderades det genomsnittliga värdet av kategoriernas inre kvadratsummor, within sum of squares (WSS). Detta är en vanlig metod för att utvärdera kvaliteten på datakluster och motsvarar i princip kvardatsumman av avstånd från viktvektorns element till de objekt som ingår i klustret (Brusco & Stenley, 2007).

Ekvation 18 definierar WSS

𝑊𝑆𝑆 = ∑ ∑ ∑(𝑥𝑎,𝑖 − 𝑥̅𝑘,𝑖)2

𝑁

𝑖=1 𝐴

𝑎=1 𝐾

𝑘=1

Ekvation 18 K – Totalt antal kategorier, k = {1,2,…,K}

A – Antal objekt i k, a = {1,2,…,A}

N – Antal dimensioner i A, i = {1,2,…,N}

När WSS plottas för olika antal kategorier söker man efter ”armbågen” i kurvan, alltså den punkt där WSS-kurvans lutning kraftigt minskar. Där antas det optimala antalet kategorier vara, då WSS ökar fort med färre antal kategorier och minskar långsamt mer fler kategorier.

2.3.4 Korsvalidering

Korsvalidering har använts för att utvärdera signaturmodellerna. Metoden innebär att en prediktionsmodell utvärderas med hjälp av ett dataset som är oberoende från det som användes för att skapa modellen. I detta fall skapades modellerna med data från år 2016, men data existerar även från år 2017. Eftersom att praxis på Stockholm Exergi är att uppdatera kundsignaturer ungefär en gång per år är det mest relevanta sättet att korsvalidera att skapa modellen med hjälp av data från ett år och validera med hjälp av data från nästkommande år, i detta fall 2017.

Att validera en prediktionsmodell är viktigt då det säger något om hur modellen faktiskt presterar när den presenteras med tidigare okända datapunkter. Prediktionsmodeller används till att förutse framtida utfall från det system de anpassas för och en korsvalidering ger en inblick i huruvida modellen klarar sitt uppdrag.

(31)

22

3 Metod

Det inledande projektarbetet bestod av en inläsningsfas där problemet studerades noggrannare för att öka förståelsen för vilka åtgärder som kunde vara viktiga. Inläsningen bestod dels av att läsa igenom litteratur om liknande problem och dels av en mer detaljerad inläsning på fjärrvärmesystemet i allmänhet och på relevanta statistika metoder. Inläsningsfasen inkluderade även att studera det system som används för databehandling på Stockholm Exergi i modelleringsprogrammet Termis. Slutligen studerades utvecklingsmiljön R som sedan också användes i dataanalysen. Projektet bestod sedan av tre huvuddelar, framtagning av tidsserier med justeringsfaktorer för signaturernas parametrar, kategorisering av kunder utifrån dessa parametrar samt implementering av metoden i Termis.

3.1 Databehandling

Projektets datainsamling gick ut på att importera data från Stockholm Exergis interna databas för kunddata till format som sedan kunde behandlas i R. Både tim- och dygnsmedelvärden samlades in för de 700 kunder som skulle behandlas, för en period täckande år 2016 och 2017. Insamlad data innefattade både effektförbrukning och utomhustemperatur samt tid och datum.

Ett normalt tidsintervall mellan uppdatering av signaturer på företaget är cirka ett år, vilket låg som grund till att data från 2016 användes till att bygga modellerna, medan data från år 2017 användes till validering av modellerna. År 2016 lämpade sig också väl som underlag för modellerna eftersom att året innehöll relativt många timmar med låga temperaturer. Under 2016 låg utomhustemperaturen under -5 grader vid 412 tillfällen, medan samma antal för 2017 var 85. Det innebär att modeller baserade på data från 2016 har mindre osäkerhet i detta temperaturintervall som är ett viktigt intervall att ha goda prediktioner i.

För att resultaten av dataanalysen ska vara pålitliga behövde data granskas och eventuella onormala avvikelser rensas bort. Data som behövde kontrolleras var temperaturdata samt effektförbrukningsdata för de mätpunkter som inkluderats i analysen. I temperaturdata från de aktuella åren noterades inga onormala avvikelser. I förbrukningsdata återfanns dock ett antal problem. Inledningsvis upptäcktes en grupp av tio kunder som anslutits efter eller sent under år 2016. Eftersom att dessa kunder inte hade nog många mätpunkter under året kunde inte bra effektsignaturer skapas och dessa kunder togs därför bort från analysen helt och hållet. Utöver dessa kunder rensades även uppenbart felaktiga kundmätvärden bort. En övergripande jakt efter felaktiga värden i en stor mängd kunder och många mätpunkter, då det inte är tidseffektivt att söka igenom alla dataserier individuellt, är svårt. Särskilt svårt är det då kunder kan ha vitt skilda förbrukningsmönster och mätvärden som verkar onormala för en kund kan vara fullt normala för en annan.

3.2 Analys av nätet

Fjärrvärmenätet i Bromma granskades med avseende på de kunder som är anslutna till det.

Sammansättningen av kunder avgör till stor del hur värmelasten på nätet kommer att variera och en förståelse för förutsättningarna hjälper slutsatser om resultaten av dataanalysen. Kundbeståndet i Bromma sattes i relation till kundbestånden i resten av landet samt i resten av Stockholm Exergis fjärrvärmenät. Jämförelsen med resten av landet gjordes genom att de kategorier som idag används

References

Related documents

Tillfällen som skulle kunna räknas som kritiska för ett företag som Trolltyg kan handla om när en kund vill göra ett återköp samt när kunden kommer in

Vissa av de Personuppgifter som NFS AB Behandlar används för att kunna uppfylla rättsliga förpliktelser enligt krav i lagar, domar eller myndighetsbeslut. NFS AB kan även i

 Att jag genom undertecknandet av denna anmälningssedel befullmäktigar Sedermera att för undertecknads räkning verkställa teckning av aktier enligt de villkor som framgår

I motiveringen för priset Årets lokala livsmedelsproducent i Skaraborg 2017 står det bland annat ”… Med sin närvaro i sociala medier visar hon på ett personligt och

processen kan säljaren förstå kundens behov och utifrån det ta fram ett erbjudande som passar kunden. Detta kan i slutändan leda fram till en relation mellan företaget och kunden som

personnummer, 12 siffror /organisationsnummer utan bindestreck, tabba och ett nytt fönster öppnas om kunden inte finns upplagd. Spara på disketten, gå ur med krysset och tryck

Vi föredrar elektroniska fakturor, men det går i undantagsfall även bra att skicka traditionella pappersfakturor till ovanstående fakturaadress.. Vi har ingen möjlighet att ta

Vintertid när det kan vara kallt i bilen är det bra att lägga en rumstempererad gelpåse ovanpå Pk-rören så att de inte riskerar att bli för kalla..  Sätt rör som tål kyla i